Text
                    

А.А.НИКИТИН ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОБРАБОТКИ ГЕОФИЗИЧЕСКОЙ ИНФОРМАЦИИ Допущено Министерством высшего и среднего специального образования СССР в качестве учебника для студентов вузов, обучающихся по специальности «Геофизические методы поисков и разведки месторождений полезных ископаемых». МОСКВА „НЕДРА" 1986
УДК 550.83 : 519.2 Никитин А. А. Теоретические основы обработки геофизической информации: Учебник для вузов.— М.: Недра, 1986.— 342 с. Даны понятия об информации и ее обработке, сведения о квантовании сигналов по времени. На базе современного математического аппарата (статистический, спек- тральный, корреляционный, факторный анализы) рассмотрено решение наи- более типичных Задач обработки геофизической информации (сглаживание и интерполяция данных, выделение сигналов на фоне помех, изучение свойств физических полей, классификация геологических объектов и др.). Для студентов вузов по специальности «Геофизические методы поисков и разведки месторождений полезных ископаемых». Табл. 25, ил.— 72 список лит.— 19 назв. Рецензенты: Кафедра геофизических методов разведки (Иркутского политехнического ии-та); В. И. Аронов, д-р физ.-мат. наук (Всесоюзный научно-исследовательский геологоразведочный нефтяной ии-т) и», ГОРЬКОГО БИБЛИОТЕКА м. г. У. 1903010000—287 ” 043(01)—86 34—86 © Издательство «Недра», 1986
ВВЕДЕНИЕ Обработка геофизической информации — важнейший этап ана‘ лиза экспериментальных данных всех методов разведочной геофи- зики. Основой получения геофизической информации (геофизиче- ских данных) являются измерения. Измерение — это нахождение значения физической величины опытным путем с помощью специ- альных технических средств. В разведочной геофизике предметом измерения являются физические свойства горных пород и физиче* ские поля, создаваемые горными породами. Техническими средст- вами их измерения служат аналоговые и цифровые приборы. Ре- зультат измерения представляет собой число, выраженное в соот- ветствующих физических единицах измерения. Это число — эле- мент измерительной информации. Иначе говоря, геофизическая ин- формация — это измерительная информация, доставляющая ко- личественные сведения о каком-либо физическом свойстве, физиче- ском поле или явлении геологической среды, геологического объекта. Объем геофизической информации непрерывно растет, что опре- деляется как увеличением объемов геофизических работ, так и повсеместным переходом на цифровую регистрацию физических полей. Этот переход обусловлен преимуществами цифровой аппа- ратуры по сравнению с аналоговой, основные из которых: 1) высо- кая точность и быстродействие; 2) возможность выдачи результа- тов измерений непосредственно в ЭВМ; 3) безошибочный перенос дискретных сигналов из одних запоминающих устройств в другие и передача информации на большие расстояния; 4) многократное усиление и воспроизведение дискретных сигналов без потери ин- формации; 5) способность работать в системах автоматического контроля и управления. Цель обработки геофизических данных — извлечение полезной информации из результатов измерений (наблюдений) отдельных геофизических методов и их комплексов. В отличие от первичной обработки исходных данных, включающей определение координат точек наблюдений, введение различных поправок (в частности, уравнивание опорной сети в гравиразведке), увязку наблюдений по площади съемки, обработка исправленных данных (перед про- ведением количественной интерпретации) решает задачи преобра- зования, фильтрации и анализа с целью подавления помех, выде- ления и разделения полезных сигналов (аномалий). Количествен- ная интерпретация выделенных путем обработки сигналов сводится к количественной оценке геометрических и физических параметров источников аномалий. Если методика и методы количественной интерпретации геофизических аномалий существенно зависят от регистрируемого физического поля, то теоретические основы мё- 3
•годов обработки, направленных на извлечение полезной инфорг мации, являются едиными для всех геофизических методов, мето- дика их применения также не зависит от типа анализируемого фи- зического поля. Это обстоятельство и позволяет рассматривать обработку информации для всех геофизических методов в едином курсе. Создание подобного курса по интерпретации пока прежде- временно, хотя вопросы интерпретации гравитационных и магнит- ных аномалий читаются совместно. Следует также отметить, что с развитием методов обработки грани между обработкой данных и количественной интерпретацией постепенно стираются. Существуют два подхода к обработке и интерпретации резуль- татов геофизических наблюдений: детерминированный и вероят- ностно -статистический. Основой детерминированного подхода, исполь- зуемого главным образом при интерпретации, является примене- ние аналитических методов теории потенциала (в грави-, магнито-, терморазведке, электроразведке постоянным током и естественного поля), уравнений Максвелла (в электроразведке переменным то- ком) и теории упругости (в сейсморазведке). Решение обратных задач при этом находится в форме единственно возможного реше- ния, т. е. либо в виде определенной функциональной зависимости, либо в виде числа как частного значения функции для искомого значения ее аргумента. Применение детерминированного подхода (аналитических ме- тодов) при обработке и интерпретации можно считать оправдан- ным, если производятся преобразования и анализ интенсивных аномалий от геологических объектов с заметной дифференциацией физических свойств, благоприятными для решения поставленных задач размерами, формой и глубиной залегания. В настоящее время при обработке и интерпретации геофизиче- ских данных все большее значение приобретает в е р о я т - „ ностно-статистический подход. Это связано с ха- рактерной особенностью геофизических наблюдений, заключаю- щейся в том, что полученные в отдельных точках данные следует рассматривать как случайные события. Случайно также располо- жение разнообразных геологических объектов, точек и даже пло- щадей исследования, поскольку при съемке другими исполните- лями и в другое время могут изменяться контуры площади и по- ложение точек сети наблюдений. Наконец, и пожалуй самое глав- ное, из-за наложения помех, вызванных погрешностями измерений, геологическими неоднородностями, неучтенными вариациями по- лей и другими причинами, само физическое поле реализуется слу- чайным образом. Следовательно, в практике обработки и интерпретации иссле- дователь имеет дело с данными, которые с большим основанием описываются случайными величинами и процессами, чем анали- тическими функциями. Изучение этих величин и процессов требует привлечения аппарата теории вероятностей и ее различных прило- жений. При вероятностно-статистическом подходе результатом 4
решения является уже не число и не функция, а распределение вероятностей, заданное для возможных значений искомого пара- метра. Подавляющее большинство методов обработки базируется на использовании вероятностно-статистического подхода. В соответст- вии с указанными подходами в развитии методов обработки геофи- зической информации можно выделить два этапа. Первый этап — 1930—1960 гг.— характеризуется исключи- тельно детерминированным подходом к обработке данных, начиная с простых приемов интерпретации (усреднение, методы характер- ных точек, касательных и т. д.) и кончая развитием методов ана- литического продолжения гравимагнитных полей (Б. А. Андреев, А. Н. Тихонов, В. Н. Страхов и др.). Интенсивно развиваются ме- тоды частотного анализа (Л. А. Рябинкин, Ф. М. Гольцман, И. И. Гурвич, А. К. Урупов, К. В. Гладкий, С. А. Серкеров, В. Н. Страхов и др.). На рубеже 50- и 60-х годов работы А. Г. Тархова, Л. А. Халфина, Ф. М. Гольцмана, И. Г. Клушина явились нача- лом принципиально нового вероятностно-статистического подхода к обработке геофизических данных. Этот подход получил широкое развитие прежде всего в сейсморазведке (Ф. М. Гольцман, С. А. На- хамкин, Е. А. Козлов, С. В. Гольдин, А. К. Яновский, Е. А. Ро- бинсон и др.), затем в других методах структурной и рудной гео- физики (А. Г. Тархов, А. А. Никитин, Г. Й. Каратаев, И. Г. Клу- шин, С. А. Серкеров, Н. Н. Боровко, В. И. Аронов, Т. Б. Кали- нина, В. И. Шрайбман, К. В. Хортон и др.) и каротаже (Ш. А. Гу- берман, М. М. Элланский, Г. Н. Зверев и др.). Второй этап — 1960—1980 гг.— наряду с вероятностно-ста- тистическим подходом характеризуется дальнейшим углублением и расширением функционально-аналитических методов интерпре- тации, а также широким развитием цифровой обработки данных на ЭВМ. С 1970 г. происходят отмирание аналоговой техники и од- новременно интенсивное внедрение ЭВМ в производственных и на- учных организациях страны. Для этого этапа характерно также взаимное обогащение методов и методик обработки информации, разработанных в разных методах разведочной геофизики. Так, на- пример, приемы оптимальной фильтрации сигналов, созданные в сейсморазведке, используются при обработке данных рудной геофизики, приемы распознавания образов, развитые сначала для обработки данных комплекса методов в промысловой геофизике, получили распространение в рудной геофизике и сейсморазведке, методы аналитического продолжения гравимагнитных полей при- обретают значение при анализе волновых полей в сейсморазведке и т. п. В последнее время все большее число исследователей понимают необходимость слияния детерминированного и вероятностно-ста- тистического подходов. Этому в значительной мере способствует развитая А. Н. Тихоновым теория регуляризации. Параметр ре- гуляризации, используемый при решении системы линейных урав- 5
нений, к которым сводится большинство задач обработки и интер- претации, выполняет ту же роль, что и дисперсия помех при ве- роятностно-статистическом подходе. Применение современных методов обработки геофизической ин- формации невозможно без использования ЭВМ, парк которых не- прерывно растет. Наряду с созданием региональных вычислительных центров, начиная с 1980 г., геофизические экспедиции оснащаются специа- лизированными вычислительными комплексами ГВК на базе ЭВМ СМ-2 или СМ-4 и спецпроцессоров ПС-2000 и ПС-3000. Необходимость использования ЭВМ при обработке геофизиче- ских данных вызывается следующими причинами: 1) все возрастающим объемом цифровой информации, получае- мым при измерениях на земле и под землей, на море, в воздухе и космосе. Так, например, в одной 24-канальной сейсмограмме с длитель- ностью записи до 6 с при дискретности измерений 0,002 с (это со- ответствует 500 числам в 1 с) содержится 500-24-6 = 72-103 чисел (или машинных слов), что при 15-разрядном машинном слове дает 72-103-15 = 10е бит информации. В Казахстане еще в конце 60-х гг. ежегодно по результатам геохимических съемок получали 107 чи- сел, а по результатам электро- и гравимагниторазведочных работ — 10е чисел. Увеличение информации в настоящее время происходит за счет появления новых систем наблюдений, например в электро разведке— это переход на пространственные и временные измерения поля; 2) более полным использованием исходной информации при ее цифровой регистрации. Так, при ручной корреляции волн на сей- смограмме информация о разрезе обеспечивается десятками, в луч- шем случае первыми сотнями чисел. Например, для корреляции отражений от трех горизонтов на 24-канальной сейсмограмме ис- пользуют 72 числа, т. е. 72 отсчета времени, для корреляции от- ражений от пяти горизонтов — 120 чисел. Возможность получения динамических характеристик записи при этом практически исклю- чается. Применение ЭВМ и современных методов обработки сущест- венно повышает информативность геофизических измерений и, в частности, каждой сейсмограммы. Изучение динамических и ки- нематических особенностей сейсмической записи и совместная их обработка приводят к решению принципиально новых геологиче- ских задач, направленных на оценку вещественного состава пород, прогноз нефтегазоносности; 3) увеличением глубинности и повышением разрешающей спо- собности геофизических методов. Достигнутая глубинность сейсморазведки к началу 70-х годов составляла в среднем по СССР 2,5 км. Внедрение методики общей глубинной точки и современных методов фильтрации сейсмических полей позволили за 10 лет увеличить глубинность сейсмических методов в основных нефтегазоносных провинциях страны до 5—6 км. Глубинность методов рудной геофизики к началу 80-х годов 6
составляла в среднем по стране 230 м при колебании от первых де- сятков метров до 500 м. В ближайшее десятилетие необходимо ее увеличение до 1000—2000 м, что невозможно достичь без самого широкого использования приемов выделения слабых сигналов и об- работки данных комплекса геофизических полей. Требование повышения разрешающей способности геофизиче- ских методов обусловлено прежде всего усложнением решаемых с их помощью геологических задач. На XII пятилетку перед оте- чественной геологической службой поставлена задача освоения районов Восточной Сибири. В то же время большая часть террито- рии Восточной Сибири перекрыта трапповыми покровами и много- летней мерзлотой. Как траппы, так и мерзлые породы представ- ляют собой помехи, по существу, для всех методов разведочной геофизики. В области нефтегазовой геофизики следует подчеркнуть, что фонд антиклинальных структур с мощностью залежей более 100 м практически исчерпан и необходим поиск малоамплитудных поднятий, а также залежей, связанных с литолого-фациальными замещениями пород. Кроме того, уменьшился и средний размер структур, перспективных на нефтегазоносность. Если до 70-х го- дов средний размер ловушек углеводородов оценивался в 100 км2, то к началу 80-х годов он снижается до 50—60 км2. Таков далеко не полный перечень проблем, стоящих перед обработкой геофизи- ческих данных. Подчеркнем, что при решении все усложняющихся геологиче- ских задач с помощью современных методов обработки существен- ным является правильное задание физико-геологической модели объекта исследования [3, 15], поскольку эти модели принципиально влияют, а нередко определяют последовательность и выбор спосо- бов обработки. Для обработки геофизической информации в настоящее время применяются практически все разделы современной математики, которые, естественно, нельзя охватить в одном курсе. Поэтому ос- новная цель новой дисциплины «Теоретические основы обработки геофизической информации», введенной в учебные планы подго- товки специалистов-геофизиков, выделить главные направления в развитии современных методов обработки геофизической инфор- мации и дать основы математического аппарата тех разделов ана? лиза физических полей, которые получают наибольшее применение в практике производственных и научных организаций. При написании учебника автор опирался на десятилетний опыт преподавания курса «Теоретические основы регистрации и обра- ботки геофизических данных» в Московском геологоразведочном институте им. С. Орджоникидзе.
ГЛАВА 1 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ЗАДАЧАХ ОБРАБОТКИ ГЕОФИЗИЧЕСКИХ ДАННЫХ § 1. СОБЫТИЕ И ВЕРОЯТНОСТЬ Теория вероятностей изучает закономерности случайных событий во времени и пространстве и приемы их количественного описания. Наблюдаемые при проведении экспериментов события делятся на достоверные, невозможные и случайные. Каждый эксперимент, состоящий из серии любых геофизических измерений, сопровож- дается соблюдением определенного комплекса условий. Этот комп- лекс условий, включающий регистрирующую аппаратуру и мето- дику измерений, должен оставаться неизменным иа протяжении всего эксперимента. Если при этом событие может как произойти, так и не произойти, оно называется случайным. В качестве события при геофизических измерениях выступают: появление кон- кретного значения физического параметра (при измерениях физи- ческих свойств) или физического поля (например, при регистрации силы тяжести), появление аномалии какого-либо поля, факт соот- ветствия определенных значений поля конкретному типу горных пород и т. д. Характерная особенность геофизических наблюдений состоит в том, что полученные в отдельных точках данные целесообразно рассматривать именно как случайные события ввиду случайности расположения геологических объектов, обусловливающих появ- ление конкретных значений поля, случайности расположения са- мих точек наблюдений по площади исследований и наложения по- мех, вызванных разнообразными причинами. В отличие от случайного события, достоверным назы- вается событие, которое при том же комплексе условий экспери- мента обязательно происходит, а невозможным — то, ко- торое заведомо не может произойти при этом комплексе условий. Например, факт измерения значения полного вектора магнит- ного поля в диапазоне от 0,33 до 0,66 Э является достоверным со- бытием, а, наоборот, измерение значения поля свыше 0,66 Э (или ниже 0,33 Э) будет невозможным событием, поскольку такой ве- личины полного вектора магнитного поля на Земле не существует. Два события называются несовместными, если появление одного из них исключает появление другого при одном и том же эксперименте; например, наличие и отсутствие аномалии какого-либо физического поля в одной и той же точке наблюдения— несовместные события. Суммой событий называется событие, состоящее в по- явлении хотя бы одного из этих событий. 8
Допустим, диапазон измеренных значений поля разбит на п градаций. Событие, состоящее в появлении значения поля из пер- вых двух градаций будет суммой двух событий, первое из которых— появление значений из первой градации, второе — появление зна- чений из второй градации. Соответствующее утверждение можно высказать о сумме трех, четырех, . . . , п событий. Произведением событий называется событие, со- стоящее в совместном появлении всех этих событий. Пусть событие А состоит в том, что значения магнитного поля Z от 0 до 100 иТл соответствуют гранитам, а событие В — значения поля Z от 50 до 200 нТл соответствуют измененным породам, тогда произведением событий АВ является событие, включающее значе- ния магнитного поля, соответствующие измененным разновидно- стям гранитов, т. е. от 50 до 100 нТл. При этом сумме событий, А + В (Д U В) будут соответствовать или значения поля Z грани- тов, или значения поля Z измененных пород, или значения поля Z измененных разновидностей гранитов. События А и В, в отличие от приведенного выше примера с градациями значений поля, в дан- ном случае являются совместными. События Др Д2.....Ап образуют полную группу событий, если они попарно несовместны, а в сумме образуют достоверное событие, т. е. какое-либо из них обязательно происхо- дит, причем только одно. Примером полной группы событий являются п градаций, на ко» торые разбит весь диапазон измеренных значений поля. Противоположными событиями называются два несовместных события, образующих полную группу, напри- мер наличие и отсутствие аномалии какого-либо поля являются противоположными событиями. Противоположными событиями бу- дут значения поля из первой градации и значения поля из всех остальных градаций, на которые разбит диапазон значений поля. Количественной мерой степени объективной возможности того или иного события А служит вероятность события Р (Д), которая измеряется отношением числа т благоприятствую- щих событию А исходов к общему числу п всех равновозможных исходов экспериментов, т. е. Р (Д) = т/п. Это — классическое определение вероятности. Оно сводит понятие вероятности к по- нятию равновозможных событий и исходит из соображений сим- метрии, как, например, в тривиальных примерах с бросанием мо- неты или игральной кости. Однако задачи, связанные с симметрией эксперимента, на практике встречаются весьма редко. Так, вероят- ность распада атома радиоактивного вещества за конечный отрезок времени на основании симметрии определить нельзя. Поэтому на практике чаще всего используют статистиче- ское определение вероятности, при котором ве- роятностью события называют относительную частоту его появле- ния при многократном воспроизведении комплекса условий экспе- римента. При большом числе опытов частота события А стремится к вероятности Р (Д) в ее классическом определении. Следовательно, 9
при статистическом определении вероятность события находится лишь при достаточно многочисленных опытах, что является недо- статком этой статистической вероятности. Вероятность события А, вычисленная при условии, что прои- зошло событие В, называется условной вероятностью Р (А/В) события А. Допустим, событие А состоит в наличии гранитов на некоторой площади исследований и вероятность их встречи равна Р (Л). По- сле проведения геофизических измерений (эксперимента), фикси- рующих аномальными значениями поля распространение гранитов, в чем состоит событие В, вероятность встречи гранитов Р (Л) пе- реоценивается и становится равной Р (А/В). Два события называются независимыми, если по- явление одного из них не изменяет вероятности появления другого, т. е. для независимых событий Р (А/В) = Р (Л), а для зависимых Р (А/В) ^=Р (Л). Виды различных событий, соответствующие им вероятности и свойства этих вероятностей сведены в табл. 1. Следствием этих свойств вероятностей является формула полной вероятности, на основе которой определяется вероятность события Л, происходя- щего вместе с одним из событий Н2, .... Нп, образующих полную группу. События Hit Н2, . . . , Нп часто называют гипоте- зами. Согласно формуле полной вероятности П P(A)=^P(Hl)P(A/Hi). (1.1) Следствием свойств умножения вероятностей (см. табл. 1, п. 5) и формулы (1.1) является формула Бейеса, или теорема гипотез, или формула обратных вероятностей. На основе формулы Бейеса решается задача о нахождении ве- роятности Р (Ht/Л) гипотезы Ht при условиях, что в результате проведенного эксперимента произошло событие Л, а гипотезы Нх, Н2, . . . , Нп образуют полную группу, причем их вероятности до опыта известны и равны соответственно Р (HJ, Р (Н2), . . . , Р (Нп). Согласно формуле Бейеса п P(Hi/A)— Р(Н()Р(А/Н{)/ &P(Ht)P(A/Ht). (1.2) С помощью этой формулы переоцениваются вероятности гипотез Р (Hi), называемые априорными, т. е. известными (или за- данными) до опыта. После проведенного эксперимента, в результате которого появилось событие Л, вероятностей Р (Н{) изменяются. Новые вероятности Р (Нс/А) называют апостериорными, т. е. полученными после эксперимента. Пример. На площади исследований фундамент кристаллических пород представлен гипербазитами, гранитами и гнейсами. По данным сейсмиче- ских измерений известен нижний предел а для Значений скорости продоль- ных волн ор, используемый для выделения по этим скоростям гипербазитов. Из опыта предшествующих работ иа аналогичных по геологическому строе- 10
Таблица 1 п/п Событие Вероятность события Свойства вероятности 1 Достоверное U P(U) Р (U) = 1 2 Невозможное V P(V) . р (V) = о 3 Случайное А Р(Л) О Р (Л) 5= 1 4 Противоположное А Р(А) Р (Л) = 1-Р (Л) 5 Произведение двух событий (пересече- ние) АВ (А Л В) Р (АВ) Независимые события Р (АВ) = Р (А)Р (В) Зависимые события Р (АВ) = Р(А/В)Р (В) = Р (В/А) (Л) Произведение п со- п бытий JJ Ai чн Независимые события р(п ^=]W) \Z=I / i=l 6 Сумма двух событий (объединение) А + Р (А + В) Несовместные события Р (А + В) = (Р (Л) + Р (В) Совместные события Р (Л + В) = Р (Л) + Р (В)-Р (АВ) Сумма п-событнй '(?, 4') Полная группа п HI р( Е лч = Е ри«)= 1 \1=1 / (=1 Любая группа / n \ п р А J = Ер - - ^P(AtAl)+^J(AiAlAk) + + . . . + (-1) р"-1 (Л,Л, . . .Л„) иию участках значения vp^a наблюдались: на гипербазитах в 80, на гра. нитах в 10, а на гнейсах в 5 % случаев. На одной из "точек площади прове. денные измерения показали, что vp выше порогового значения а. Требуется найти вероятность того, что фундамент участка в этой точке сложен гипер- базитами [7]. Решение. Введем полную группу событий: Ht— фундамент, представ- лен гипербазитами; Я2 — гранитами; Hs — гнейсами; событие А — изме- ренное значение vp превышает порог а. Очевидно, что Р (А/Hi) — 0,8;, Р (A/Ht) = 0,10; Р (A/Ht) = 0,05. Поскольку до проведения сейсмических работ никакому типу пород не отдается предпочтения, то Р (Hi) = Р (Ht) = = Р (Яз) = 0,33. По формуле Бейеса (1.2) переоцениваем априорную веро- ятность Р (Hi) — 0,33, вычисляя апостериорную вероятность Р (А/Hi): Р (AlHi) = 0,33 0,8: (0,33-0,8 + 0,33-0,10 + 0,33-0,05) = 0,84. И
Формула Бейеса играет чрезвычайно важную роль. На ее ос- нове решаются задачи выделения сигналов на фоне помех (см. § 40), обработки данных комплекса геофизических полей (см. § 46), определения параметров источников аномалий при количествен- ной интерпретации и др. [5]. Понятие вероятности события допускает также простую геомет- рическую трактовку. Геометрическая вероятность обобщает классическое определение на бесконечное множество экспериментов. К понятию геометрической вероятности приводит задача о бросании точки в некоторую ограниченную область G, содержащую меньшую по размерам область g, причем все положе- ния падения точки в область G считаются равновозможными. Если событие А состоит в попадании точки в область g, то Р (Л) = мера g/мера G, где под мерами областей g и G можно понимать длины отрезков, размеры площадей или объемов. Понятие геометрической вероятности используется при решении задачи Бюффона, заключающейся в определении вероятности пе- ресечения наугад брошенной иглы длиной 21 одной из параллель- ных прямых, отстоящих друг от друга на плоскости на расстоянии 2а, причем /<а. Эта вероятность равна Р = 21/па. Важность этой задачи по определению вероятности пересечения рудной жилы длиной 21 одним из профилей площадной геофизической или гео- логической съемки совершенно очевидна. На основе задачи Бюф- фона И. Д. Савинским (1964 г.) были рассчитаны «Таблицы вероят- ностей пересечения эллиптических объектов прямоугольной сетью наблюдений», а также решены и другие задачи выбора оптималь- ных сетей геофизических наблюдений. Расчет сетей при таком подходе ориентируется лишь на геомет- рию объектов и основывается на предположении, что объекты четко фиксируются аномалиями в физических полях. В то .же время при слабой дифференциации по физическим свойствам вмещающих по- род и искомых объектов последние даже при значительных разме- рах могут не выделяться аномальными значениями поля. Для уверенного выделения аномалий от таких объектов обычно тре- буется накопление аномального эффекта по большому числу точек наблюдений. Таким образом, в общем случае расчет сетей геофи- зических наблюдений следует проводить с учетом необходимости накопления аномального эффекта. } 2. СЛУЧАЙНАЯ ВЕЛИЧИНА Расширением понятия случайных событий, состоящих в появле- нии числовых значений, является случайная величина X. Случайной называют величину, принимающую в резуль- тате эксперимента одно, и только одно возможное значение, заранее неизвестно какое именно и зависящее от случайных причин, ко- торые не могут быть учтены. Случайная величина является обосно- ванной моделью для описания данных геофизических измерений в силу целого ряда случайных факторов, влияющих на показания 12
геофизического поля. Как и для результата отдельного экспери- мента, для случайной величины можно установить статистические закономерности, т. е. определить вероятности ее значений. Случайные величины бывают непрерывные и дискретные. Пер- вые из них принимают значения на числовой оси в рабочем диапа- зоне прибора. Примером непрерывных случайных величин является запись полного вектора магнитного поля в аэромагнитной станции или сейсмическая запись в аналоговых станциях. Дискретная случайная величина принимает вполне определенные значения хи х2, . . . , хп с вероятностями plt р2...рп. Все возможные п значений случайной величины при этом образуют полную группу п событий, т. е. pt = 1. где п конечно (или бесконечно). Примером дискретных случайных величин являются данные Измерений физических свойств горных пород, значения физических полей, разбитых на п градаций. В связи с обработкой на ЭВМ непрерывные случайные величины обычно преобразуются в дискретные. Универсальной характеристикой случайной величины является функция распределения F (х), определяющая для каждого значения х на числовой оси вероятность того, что случай- ная величина X примет значение меньше х, т. е. F (х) = Р (Х<х). Эта функция существует как для непрерывных, так и для дискрет- ных величин. Она обладает следующими свойствами: F (х) непре- рывна справа; limF(x) = l; limF(x) = 0; Х-+-00 Х-+ОО F (х2) > F (xj при x2>xf, F(*2<X<x2) = F(x2)-F(x1). • (1.3) Значение случайной величины, для которого функция распреде- ления принимает конкретно заданное значение, называется кван- тилью распределения. Иначе, квантиль — есть аргу- мент функции распределения. Другая важная характеристика случайной величины — плот- ность распределения f (х). В силу (1.3) Р (х<Х<х+ Дх) = Г(х+ Дх)—F(x). Отсюда lim [F(x + Дх)—F(x)]/bx = F'(х), Функция f (х) = д*—о = F' (х) характеризует плотность, с которой распределены зна- чения случайной величины в данной точке. Плотность распределе- ния обладает следующими свойствами: f (х) определена при тех же значениях, что и F (х), за исключением тех точек, где F' (х) не су- ществует; f (х) > 0; lim f(x) = O; J f(x)dx = 1; —СО 13
Р (*1<Х<х2) =f f (x)dx. (1.4) *1 Функцию распределения можно выразить через плотность по- редством интеграла с переменным верхним пределом, т. е. Л*1) = f f(x)dx. (1.5) —00 В табл. 2 приведены основные числовые характеристики слу- Таблица 2 Характеристика (параметр) случайной величины Формула для нахождения характеристики случайной величины 7-квантнль (квантиль поряд- ка у) £ = F (М = т; tv = F~r Су)> г«е г-1 (?)—функция, обратная функции рас- пределения F (х) Математическое ожидание MX (или среднее значение х) Мода Мо МХ = 'х= £ XiPt l=i Мо — такое значение X, при котором плот- ность распределения f (х) максимальна Медиана Me (или квантиль по- рядка 0,5) Р (X < Me) = Р (X > Me) = F (Me) = 0,5 Дисперсия DX DX = М (X—MX)2 = (xt - MX)*pi (=1 Среднее квадратическое откло- нение (стандарт) а a=±V5x Коэффициент вариации V V = а/MX = '\I~DXIMX Центрированное и иормирован- на отклонение xi = (Xi — MX)/^DX Начальный момент k-ro по- рядка а& n i-=l Центральный момент k-ro по- рядка Цк Асимметрия распределения А Эксцесс распределения Е ИЛ = M (X-MX)k = (Xi-MX)kPl /=1 A = p.,/03 F. = u4/or« — 3 чайной; величины, широко используемые при обработке экспери- ментальных данных. Если результат эксперимента описывается двумя случайными величинами и больше, то говорят о системе случайных величин, включающей, например, измерения различных фи- 14
зических свойств горных пород, данные измерений разных полей, различные параметры аномалиеобразующих объектов и т. д. Случайные величины X и Y называются независимыми, если плотность их совместного распределения f (х, у) = f (х) f (у), в противном случае X и Y зависимы. Характеристикой связи (зависимости) двух случайных величин X и Y служит корреляционный момент (или момент связи): КХу = М (ЛЬ, где Л = X—MX, t = Y—MY — цен- трированные случайные величины. Для дискретных величин X и Y КХу = Ц (xt-MX) (У!-MY) p(j, (1.6) где Ру = Р (X — Xt\ Y ~ yj] — вероятность того, что система (X, Y) примет значения xty}. Для характеристики связи между X и Y часто используют безразмерную величину — коэффициент корреляции ГхУ = ХХу/ахОу (1-7) Коэффициент корреляции характеризует степень линейной связи (зависимости) между X и Y. Его величина гХУ изменяется от — 1 до + 1. При гху">0 имеет место положительная корреляция (при гХу = 1 — положительная функциональная зависимость), при Гху<0 — отрицательная. Случайные величины, для которых гХУ (или Хху) равен нулю, называют некоррелированными. Система п случайных величин Xj.Хп (в случае двух слу- чайных величин Хх = X, Х2 = Y) имеет п2 корреляционных мо- ментов, или ковариаций Кц — М (XtXj), которые принято располагать в виде Кп матрицы К12 . . . Кт К = КЧ = К 21 Хм ... Кт (1-8) Кп1 кпг ... Кпп Матрица (1.8) называется ковариационной, причем из (1.6) легко видеть, что Kq — Кр и Кр— D(. Матрица, составлен- ная из коэффициентов корреляции rtj = р называется кор- реляционной 1 Tig ... Гщ Гп1 Гпг ... 1 Две основные характеристики случайной величины — среднее и дисперсия — обладают следующими важными для применения 1В
свойствами: 1) если а — постоянное число, то Ma = a, Da — 0; 2) если случайная величина Y — аХ, то MY = аМХ, DY = a2DX; п п 3) если Y = Х то МУ = У, MXi; для зависимых случайных i=i i=i величий DY=t DXi+2% Kif, (1.10) 1=1 i<i для независимых случайных величин ОУ = £о(; (1.10') 1 4)еслиУ = Пх<) то MY = Ц MXlt п п ДУ = ПОХ< + 2 (MXt)*DXt, (1.11) 1=1 1=1 где Х{ — попарно-независимы; 5) если У = У а(Х {+ ад— i=i линейная функция, то MY^pa/MXi + ao, DY = У dtDXi 4- 2 Y WiKii = X Д <Wi/0i<i/. (1.12) Для различных случайных величин существуют разные соот- ношения или законы, устанавливающие связь между возможными значениями случайной величины и соответствующими им вероят- ностями. Для описания распределения геофизических показателей (фи- зических свойств горных пород, физических полей и т. д.) наи- большее применение получили: 1) нормальный закон распределения с плот- ностью распределения f (х) = — -ехр [—(х—х)’/2о2] л/ 2 л <з и функцией распределения F (х) = - L- J exp [ — (/—х)2^2] dt, V 2Л О —оо 16
где х и ст — параметры распределения. При х = 0 и ст = 1 W = 7=^ ехр (—х*/2), (1-13) д/2л Г(х) = Ф(х) = —Jexp(—W2)dt (1.14) 'у 2 л —оо Причем Ф (— х) = 1—Ф (х). Так, Ф (0) = 0,5, Ф (— 1) = 0,1587; Ф (1) = 0,8413. Нормальный закон имеет широкое распространение в природе; в частности, плотность и скорость упругих волн для образцов пород обычно распределены нормально. Для нормально распределенной величины практически все рас- сеяние, т. е. отклонение от среднего х, укладывается в интервале х ± Зст. Это следует из формулы, определяющей вероятность по- падания случайной величины на заданный интервал (хт, х2), Р (xi<X<x2) = Ф[(х2—х)/ст]—Ф[(хх—х)/ст]. (Ы5) Согласно формуле (1.15), вероятности попадания случайной нормально распределенной величины в интервалы х ± ст, х ± 2ст и х ± Зст будут равны соответственно: Рх — Ф [(х + ст—х)/ст]—Ф[(х—ст—х)/ст] = Ф (1) — Ф ( — 1) — = 0,682; Р2 = Ф(2)—Ф(—2)= 0,955 (95,5 %); Р8 = Ф(3)—Ф( — 3) = 0,997 (99,7 %). Поскольку все значения случайной величины, а именно 99,7 %, укладываются в интервал Зст, способ оценки диапазона возможных значений случайной величины носит название «правило трех сигма». Из этого правила следует приближенный способ опре- деления: ст = (хтах—х)/3. Асимметрия и эксцесс нормального закона равны нулю. Случайная величина, логарифмы значений которой распреде- лены нормально, имеет логнормальный закон рас- пределения. По этому закону обычно распределены значе- ния кажущегося сопротивления пород, магнитной восприимчи- вости сильно магнитных разностей пород, концентраций химиче- ских элементов в горных породах; 2) равномерный закон распределения с плот- ностью I 0, х<а, x>ft, ж—" 17 Им. ГОРЬКОГО БИБЛИОТЕКА м. г. у.
и функцией распределения F(x) = (х—а)/(Ь—а), О, 1, a<Zx<Zb, х<.а, х~>Ь, (1-17) используется при априорном задании распределений параметров аномалиеобразующих объектов (глубины залегания, мощности и т. д.) или параметров аномалии (амплитуды, протяженности). Среднее значение и дисперсия случайной величины, распреде- ленной по равномерному закону, равны соответственно MX — = (а + Ь)/2 и DX = (Ь—а)г/\2. Вероятность попадания случай- ной величины в интервал (xlt х2) Р (xt < X < х2) = (х2—*i)/(b—а). Асимметрия, ввиду симметрии плотности, равна нулю, а эксцесс равен — 1,2; 3) закон Пуассона для дискретной случайной величины, принимающей последовательно значения X — 0, 1, 2, . . . , т . . . с вероятностью Рт = атехр (— а)/т! и дискретной функцией рас- пределения Лп= Z [amexp(—a)}lm\ (1.18) m=0 Для закона Пуассона х — D = а, а — параметр распределе- ния, т. е. этот закон является однопараметрическим, в отличие от нормального закона, определяемого двумя параметрами х и D = о3. Закон Пуассона используется при анализе результатов изме- рений, в процессе которых проводится расчет суммы импульсов, фиксирующих радиоактивный распад какого-либо элемента за время t. При этом параметром распределения является величина а — kt, где к — постоянная распада для данного элемента. ____ Закон Пуассона асимметричен и его асимметрия А = 1/V а, а эксцесс Е — 1/а, т, е. распределение правоасимметрично и имеет положительный эксцесс. Распределение суммы двух независимых случайных величин Хг и Х2, распределенных по закону Пуассона с параметрами аг и а2, также подчиняется закону Пуассона с параметром 0 = 0!+ а2. При решении задач математической статистики важную роль играют три распределения %4 (или Пирсона). Стьюдента и Фишера, используемые при изучении систем случайных величин, каждая из которых имеет нормальное распределение. Распределе- нию х2 подчиняется сумма конечного числа квадратов независи- мых нормально распределенных величин с МХ{ = 0 и DXi = 1, т. е. х?=£х< или х?=Е [(У;-МУг)/7ОУ]2, (1.19) 1=1 1=1 где Yi — произвольные независимые и нормально распределенные 18
величины с М%? = г и Dx? = 2г, число г называется числом сте- пеней свободы. Распределение Стьюдента (или /-распределе- ние) с г степенями свободы имеет случайная величина вида i = Х/^(£ Х^!г = Х/д/%^ (1-20) Независимые случайные величины Х( распределены нормально с MXt = 0 и DXt = 1, Mt = 0 (при г>1) и Dt = r/(r—2) (при />2). Если Xi — произвольные независимые нормально распределен- ные случайные величины, то величина Х-МХ / /_1_ у» (Xi — AlXf)8 д/ЬГ / V r U Dx‘ (1.21) также является распределением Стьюдента. При увеличении г распределение Стьюдента приближается к нормальному. Распределение Фишера (или ^-распределение) имеют случайные величины вида т п (1.22) т i=i п Д где Xt и Y{ — независимые нормально распределенные величины с МХ{ = MYt = 0; т и п — число степеней свободы Е-распреде- ления. Математическое ожидание и дисперсия этого распределения MFmn=n/(n~2) при п>2; rip ____ (W -|- и — 2) тп~ m(n — 2)s(n—4) при п>4. Обоснованием возможности использования на практике число- вых характеристик случайных величин и их распределений при проведении массовых экспериментов являются закон больших чи- сел и центральные предельные теоремы. Закон больших чисел устанавливает сходимость по вероятности среднего арифметического, вычисленного по независи- мым наблюдениям одной и той же величины, к математическому ожиданию, т. е. среднее арифметическое случайной величины с уве- личением числа наблюдений становится все более близким к ее математическому ожиданию. Для среднего арифметического, рав- ного Y ——У Xi, согласно свойствам математического ожидания, П i=l получаем МУ=МХ и DY = — X DXi = -^— • Таким образом, n2 1=1 п среднее арифметическое есть случайная величина со сколь угодно малой дисперсией и при большом числе экспериментов ведет себя почти как неслучайная. Закон больших чисел устанавливает в точ- 2* 19
ной количественной форме это свойство устойчивости среднего ариф- метического. Другие формы закона больших чисел устанавливают сходимость частоты события к его вероятности. Так называемые центральные предельные тео- ремы теории вероятностей устанавливают сходимость суммы случайных величин к нормальному закону распределения. По- скольку на геофизические измерения влияет большое число неза- висимо действующих факторов, свойство нормальности сумм слу- чайных величин приобретает большое значение. Это свойство имеет место для неодинаково распределенных слагаемых при условии конечности их дисперсий. Опыт показывает, что центральными предельными теоремами можно пользоваться для суммы сравни- тельно малого числа случайных величин, порядка десяти, и даже меньше. Для анализа ошибок измерения и фильтрации геофизических полей особое значение имеют два положения: 1) если Хх, . . . , Хп взаимно независимые нормально распределенные величины, то их п п сумма Y =YtXl имеет нормальное распределение с MY 1=УМХ{, f=l 1 п DY =Y,DXt 2) если случайные величины XL...Хп не всегда 1 независимые нормально распределенные величины, то линейная их комбинация Y = axXi +агХг + . . . апХп имеет нормальное рас- пределение со средним и дисперсией, определяемой по (1.12). § 3. СТАТИСТИЧЕСКИЕ ОЦЕНКИ При количественном анализе результатов измерений используют выборки случайных велияин. При этом важно организовать экспе- римент таким образом, чтобы вероятность быть выбранным была бы одинакова для любого элемента выборки — так называемая репрезентативная выборка. Множество всех возможных значений случайной величины, в котором распределение изучаемого параметра совпадает с ее рас- пределением, называют генеральнойсовокупностью. Выборка, извлекаемая из генеральной совокупности,— лишь один из возможных вариантов наблюденных значений изучаемой слу- чайной величины. Если представить, что весь массив горной породы разбит на элементарные образцы, подобные тем, которые отбирают для опре- деления физических свойств, то совокупность таких образцов можно считать генеральной совокупностью, а извлекаемые из гор- ного массива несколько десятков образцов с целью определения по ним физических свойств всей горной породы, представляют выборку из этой совокупности. Важно обеспечить отбор образцов таким образом, чтобы вы- борка была бы репрезентативной (представительной), т. е. надо поставить эксперимент так, чтобы образцы отбирались равномерно 20
Генеральная совокупность является математической моделью соответствующего действительного множества, и цель экспери- мента — сделать заключения- ло имеющейся выборке о всей сово- купности, из которой она взята. Выборками являются результаты наблюдений физических по- лей по точкам площади, типам пород, методам измерений и т. д. При таком подходе точная информация о распределении изучаемых величин отсутствует, поэтому одной из основных задач математи- ческой статистики является оценка числовых характеристик (па- раметров), плотности и функции распределения по отдельным вы- боркам наблюдений. Оценкой неизвестного параметра 9 назы- вают случайную величину 0rt = f (хь . . . , хп), являющуюся функцией наблюденных значений xlt . . . , хп. Часто используется также термин «статистика». Под статистикой понимают любую функцию от наблю- денных данных. Оценка — это построенная по определенному пра- вилу статистика. Закон распределения оценки зависит от закона распределе- ния и от числа элементов в выборке п. Представление о точности и надежности оценки связано с понятиями доверительного ин- тервала и доверительной вероятности. Доверительным интервалом (0П—е, Ъп + е) для параметра 9 называется такой интервал, в пределах которого не- известное значение параметра 9 находится с вероятностью у, не меиыпей заданной. Величина у называется доверительной вероятностью (уровнем доверия) и обычно полагается рав- ной 0,9; 0,95; 0,99. Равенство Р (9n—e?<0<0n + ev) = у озна- чает, что с вероятностью у неизвестное истйнное значение параметра попадает в интервал (0„—е7, 0„ + ev). Практическое применение нашли опенки, которые характери. зуются следующими свойствами: 1) несмещенностью, состоящей в том, что математиче- ское ожидание оценки 9„ равно истинному значению, т. е. М 0П = 9. Несмещенность важна лишь для малых выборок п = 10-j-20; 2) состоятельностью, имеющей место при условии, что с увеличением числа наблюдений п оценка приближается (по вероятности) к истинному значению параметра, т. е. Р {I 9„—91 <е} —► 0 при п —► оо; 3) эффективностью, заключающейся в том, что наи- лучшей из всех возможных оценок является оценка с минимальной дисперсией, т. е. D ($п) = min. Такими свойствами обладают обычно несмещенные оценки. Если несмещенная оценка 0° имеет дисперсию М (0°—9)2 = D§°n = <р„, величина <p„/Af (бп—9)2 ко- личественно характеризует эффективность оценки Фп; 21
4) асимптотической нормальностью, т. е. с увеличением числа независимых наблюдений в выборке распреде- ление оценки должно приближаться к нормальному, иначе F — ______—<х } ->Ф(х) при п->оо, где Ф (х) — функция (0, 1)-нормального распределения; (0, 1) — означает нулевое среднее и единичную дисперсию. Среди различных методов нахождения оценок параметров рас- пределений, построенных по выборочным данным и обладающих перечисленными выше свойствами, наибольшее применение имеют методы моментов и максимального правдоподобия. Суть метода моментов состоит в том, что в силу за- кона больших чисел все выборочные моменты при п -> сю сходятся по вероятности к соответствующим моментам исходного распреде- ления. Это позволяет для вычисления оценок параметров исполь- зовать формулы, приведенные в табл. 2. Оценками наибольшего правдоподобия параметров 0Х, . . . , 9т являются такие их значения, при которых достигает максимума функция Р(хъ . . . , xn/0i......0т) = п = £ Inf (Х1......хп/91, , 0J- t=i где f (*1, . . . , хп/9) — условная плотность распределения, на- зываемая функцией правдоподобия. Согласно методу максимального правдопо- добия оценки находятся из системы уравнений дР/д9/ = 0, /=1, . . . , т. (1.23) По сравнению с методом моментов эти оценки определяются по более сложным выражениям, к которым приводит решение си- стемы (1.23), но зато они являются более эффективными. Например, используем метод максимального правдоподобия для нахож- дения параметров нормального распределения (среднего х и дисперсии а2) по п наблюдениям . . . , хп. Функция правдоподобия примет вид п Р (xi, . . . , хп/х, а2) = у* In |—ехр[—(хг—х)2/2о21 = 2_j ( д/2л а I ?=i п =—— 1п(2л)—-In а2—-V 2 2 2 / , 2а2 1=1 _ Соответствующая система уравнений (1.23) для нахождения х и а2 будет п дР _ Xj—~x _q. дР _ п . дх ~ , а2 “ ’ да2 “ 2а2 1=1 22

п +т£^=°. 1=1 из которой имеем х~ — £ X/; а2 = — 2} (х{— х)2. П i=l П i=l При статистическом анализе геофизических данных широко используются числовые характеристики (параметры распределе- ний), приведенные в табл. 3. Эти характеристики, определяемые по выборкам, являются случайными величинами. Следовательно, не- обходимо указать их оценки и соответствующие этим оценкам до- верительные интервалы (см. табл. 3). Имея выражения для диспер- сий оценок и их доверительных интервалов, можно рассчитать количество п независимых наблю- дений для оценки числовой харак- теристики с заданной точностью ev (см. табл. 3). Статистическими оценками фун- кции F (х) и плотности f (х) рас- пределения являются соответствен- но статистическая функция рас- пределения (называемая также выборочной функцией распределе- Рис. 1. Графики плотности нормаль- ного распределения и гистограммы (а), функции нормального распределения и статистические функции распределения в обычном масштабе (б) и на вероятно- стном бланке (в). Распределение: 1 — экспериментальное. 2— теоретичеокое, 3 — области, соответствую- щие доверительной вероятности 95 %. х — среднее значение случайной величины; о —ее среднеквадратическое отклонение; D — макси- мальное отклонение теоретического распреде- ления от экспериментального ния, функцией накопленных частот, кумулятивной кривой) и гис* тограмма. Цод статистической функцией распреде- ления случайной величины понимается частота события, что Х<х, т. е. Р (X < х) = Fn (х) = п (х)/п. 24
Для нахождения этой функции при фиксированном х следует найти число значений X, меньших фиксированного х, а затем по- лученный результат разделить на общее число значений случайной величины п. Функция Fn (х) представляет дискретную ступенча- тую функцию, скачки которой соответствуют значениям X и равны частотам этих значений. Г истограмма описывает распределение частот pi = определяемых для каждого значения Xi случайной величины X. Для построения гистограммы весь диапазон значений X разби- вается на некоторое число градаций (разрядов) и подсчитывается число значений случайной величины mit приходящееся на каждую i-ю градацию, которое затем нормируется по общему числу значе- ний п. По оси абсцисс откладываются градации (разряды), а по оси ординат — соответствующие этим разрядам частоты pi (рис. 1, а) называемые иногда частостями. На основе гистограммы обычно строят статистическую функцию распределения (рис. 1,6). Если границы (или середины) разрядов на гистограмме обозначить че- рез х1( . . . , хг, то Л.(*1) = 0; К{хг) = рй Fn(xs) = p1 + p2; . . K(Xr) = £pi- (1-24> z=i При построении гистограмм не существует строго обоснованных методов определения числа разрядов г. Обычно пользуются одним из трех эмпирических правил: 1) определяют г « aJ п; 2) г нахо- дят по интервалу группирования исходных данных Дх, равного погрешности (двойной или тройной ее величине) измерения пара- метра); 3) г определяют по величине Дх, вычисляемой по формуле Стерджеса Дх = (Хтах—Xmin)/(1 4" 3,321g п)- (1-25) При этом в каждом разряде гистограммы не должно быть менее пяти значений, в противном случае проводится объединение не- скольких разрядов. Общее число разрядов также должно быть не менее пяти. Для изображения статистической функции распределения часто используют вероятностный бланк (рис. 1, а), на котором функ- ция нормального распределения всегда представлена прямой ли- нией. Построение гистограмм и статистических функций распределе- ния является основой обработки данных физических свойств гор- ных пород и различных количественных признаков геофизических полей при оценке их информативности (см. § 5). 25
§ 4. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ПРОСТЫХ ГИПОТЕЗ Для проверки предположения о характере закона распределения изучаемого признака, а также для сравнения отдельных числовых характеристик различных выборок между собой используют по- нятие гипотезы и критерия значимости. Любое предположение относительно распределения случайной величины X называют статистической гипотезой, а правило, по которому на основании имеющихся данных принимают или отвергают гипотезу, называют критерием ее проверки. Для выработки критерия надо указать интервал, в пределах ко- торого возможные значения параметра встречаются наиболее часто. Если теоретическое значение параметра 0 укладывается в этот ин- тервал, то гипотеза не противоречит исходным данным. Область, в которой вероятность наблюдения статистической величины —0 достаточно велика, называется областью принятия™- п о т е з ы. Область с малой вероятностью определения —9 называется областью непринятия гипотезы или критической областью. Для проверки гипотезы задают уровень значимо- сти, т. е. некоторое малое число 8. Если гипотеза верна, т. е. 0П =9, критерий приводит к неверному решению в 100 8 % случаев и к вер- ному решению в 100 (1—г) % случаев. Выделяют односторонние и двусторонние критерии. Односторонний критерий устанавливает область гипотезы как 0n< 0i-e, а двусторон- ний критерий определяет эту область как 9ei2<:9n<9i-ei2- В последнем случае область принятия гипотезы определяется доверительным интервалом. При малом числе данных симметрич- ная оценка приводит к неоправданно большим доверительным ин- тервалам ввиду резкой асимметрии распределения выборочной дисперсии. Поэтому при малом числе данных применяют асиммет- ричные доверительные оценки, рассчитываемые таким образом, чтобы вероятности на концах кривой распределения были бы равны между собой. Гипотеза называется простой, если требуется прове- рить одну единственную гипотезу, например о виде распределения или о равенстве числовых характеристик, и сложной, если проверяется не одна, а две гипотезы и больше, например, когда требуется установить наличие нескольких типов пород по данным одного или комплекса геофизических методов. Для проверки ги- потезы соответствия статистической функции распределения ?п (х) теоретической функции F (х) (например, функции распределения нормального закона) в практике обработки геофизических данных получили распространение критерии Колмогорова и Пирсона. Согласно критерию Колмогорова вычисляется ве- личина l = DVn, ~ (1.26) где D = max) F (х) — F (х) | — максимум модуля отклонения ста- 26
тистической и теоретической функций распределения. По величине Л в соответствии с ее распределением Р(Х)=1 — £ (—1)*ехр(—2W) (1.27) k=*—00 находится вероятность Р (1). Если Р (1) мала (обычно меньше 0,5), гипотеза о соответствии статистической Fn (х) и теоретической F (х) отвергается. Например, для X, равной 0,3, 0,7, 1,1, значения Р (К) равны соответственно 1,00, 0,71, 0,18. Согласно критерию Пирсона X2 = Z (mi — npiYInpi, (1.28) 1==1 где mi — число значений случайной величины в i-м разряде гисто- граммы; pt — вероятности сравниваемого с экспериментальным теоретического распределения. По значению х2 и числу степеней свободы k = г—s (s — число наложенных связей) с помощью таблиц вероятностей Р (%2) опре- деляется вероятность того, что величина, имеющая распределение X2 с k степенями свободы, превысит данное значение %2. Если эта вероятность мала, гипотеза о соответствии экспериментального распределения теоретическому отвергается. Например, для k = 5 и х2 = 1>5, 4,35, 15,1 значения Р (х2) соответственно 0,9, 0,5, 0,01. Число степеней свободы определяется разностью между числом разрядов г и числом наложенных связей s. При сопоставлении статистической функции с нормальным за- коном распределения s = 3, поскольку для вычисления теорети- ческих значений pi используются оценки среднего и дисперсии, полученные по выборке (это дает две связи), а задание конкрет- ного вида распределения—нормального, добавляет еще одну связь. Теоретические частоты определяют следующим образом. На- ходят оценки среднего и дисперсии х и а2. Полученные эксперимен- тальные данные, т. е. значения случайной величины, центрируют и нормируют, переходя к значениям X — (X—х)/ст, вычисляют концы разрядов гистограммы: Xi=(xi — х)/а; Xf+i = (xt+1—х)/а. Далее определяют теоретические вероятности pt попадания зна- чений X в интервале (xj; xi+1), например для нормального закона по формуле pt = Ф (х,+ 1)—Ф (х/), и, наконец, находят теорети- ческие частоты mi = npi. Следует отметить, что при использовании критерия х2> в от- личие от использования критерия Колмогорова, необходимость вычисления оценок среднего и дисперсии по выборочным данным учитывается путем уменьшения числа степеней свободы. На изме- нение числа степеней свободы влияет и изменение числа разрядов 27 '
гистограммы, т. е. способ группировки данных. Критерий Колмо- горова такого согласования не предусматривает, поэтому он может приводить к завышенным значениям вероятности Р (1). Н. В. Смирновым предложены критерии для проверки гипотезы о принадлежности двух выборок к одной и той же генеральной со- вокупности (иначе, о том, что распределения какого-либо признака в двух генеральных совокупностях, из которых мы взяли выборки, одинаковы). Мерой расхождения двух статистических функций распределе- ния Fni (х) и Fni (у) для первого критерия является Dnin2 = max\Fni(x)—Fn2(y)\. (1.29) Определяется параметр 1 + «а и по таб’ лице для распределения критерия Колмогорова находится вероят- ность Р (1<17) = у. При гипотеза об одинаковом распре- делении двух выборок X и Y отвергается с вероятностью у. Для проверки однородности двух выборочных распределений используется также критерий %2 в виде (1.30) где rn't и т \ — соответственно частоты сравниваемых выборок X и Y. Этот критерий при больших их и п2 распределен по закону %2 с г—1 степенями свободы. Особое значение имеют непараметрические кри- терии, применение которых не требует заранее устанавливать законы распределения сравниваемых совокупностей, т. е. когда неизвестны семейства функций распределений, к которым принад- лежат плотности распределения. Согласно критерию Вил- кок с о н а независимые наблюдения двух выборок xt (i = 1. ni) И «//(/= 1....п2) располагаются в общую последователь- ность в порядке их возрастания, и для этой последовательности рассчитывают число инверсий U, равное сумме количества всех у/, стоящих впереди каждого xt. Например, в последовательности У1, хъ х2, у 2, ys, yit ха, уъ, ув, xlt ... Xt и х2 дают по одной ин- версии с у-с, ха дает четыре инверсии с у1У у2, у2, у2 и х2 — шесть инверсий. Гипотеза о принадлежности выборок одной и той же совокуп- ности отвергается, если общее число инверсий превосходит выб- ранную с учетом уровня значимости границу. Эта граница опреде- ляется из условия нормального распределения для общего числа инверсий U со средним U = пуг212 и дисперсией DU = пхп2 (пх 4- + лг + 1)/12, т. е. критическая область определяется с помощью значений функций (0, 1)-нормального распределения. 28
Для двустороннего критерия нижняя и верхняя границы со- ответственно: Uy = и—; Ut^U + ta+W2^DU, (1-31) где у — 1—е; 8 — уровень значимости; t^+^/2 — квантиль (0, 1)- нормального распределения порядка (1 +?)/2. При условии, U>U^, либо U < ЦТ гипотеза о принадлежности выборок одной и той же совокупности отвергается. Указанные критические границы Uy и Uy являются прибли- женными, так как основаны на асимпотически нормальном рас- пределении U. Однако это приближение вполне удовлетворительно при п1>10, п2>1 0. При nx<10 и п2<10 критические значения для U определяются по специальным таблицам [2]. Пример. По образцам гранодиоритов двух массивов измерена плот- ность, результаты Х( и у; (в г/см8) приведены в табл. 4. Проверить по крите- Таблица 4 Образцы I массива Плотность, г/см’ Образцы II массива Плотность, г/см’ Образцы I массива Плотность, г/см’ Образцы 11 массива Плотность, г/см3 *1 2,96 У1 2,98 х7 3,05 Уа 3,14 *3 2,96 Уа 2,98 Xg 3,05 У» 3,15 Xg 3,00 Уч 3,02 X, 3,08 У» 3,16 *4 3,03 «4 3,07 *10 3,11 Ут 3,16 *S 3,03 Уа 3,10 *11 3,14 Ун 3,16 х» 3,04 Уч 3,12 *и 3,14 Ун 3,16 рию Вилкоксона гипотезу о равенстве средних значений плотности по двум массивам при уровне значимости е = 0,05. Решение. Составим общую последовательность наблюдений по возраста- нию: хь х2, уъ у2, х3, уз, х4, х5, хв, х„ х8, у4, хв, Уз, Хю, у», Хп, у,, х12, Уа, Уа< Уи>, Ун. У12- Число инверсий у на х равно сумме произведений riki, где Г( — номера тех у], которые сменяются в последовательности наблюдениями х*.; kt — число наблюдений в серии наблюдений х*. следующих за yrf. U = 2 + 3-5 + 4 + 5 + 6 + 7 + 12 = 51; U = П1-ла/2= 12-12/2 = 72. Среднее квадратическое отклонение для числа инверсий ou = ^JdU = V12-12/12(12+ 12+ 1) = 12^/2* = 16,92; 5 = 72— 1..96-17 « 38,7; (7+95 = 72 + 1,96-17 = 105,3. Так как 38,7<U — 51 < 105,3, результат применения критерия Вилкоксона не противоречит гипотезе о равенстве средних. 29
Часто вместо сравнения самих распределений, когда выбороч- ное распределение построить трудно, ограничиваются проверкой гипотезы о равенстве числовых характеристик: среднего, дисперсии и других моментов распределения. Для сравнения средних двух выборок X и У можно использо- вать расчет доверительных интервалов (см. табл. 3): X ± ; у ± th- Если эти интервалы пересекаются, то с вероятностью у можно ут- верждать равенство средних х и у. Учитывая асимптотическую нормальность распределений х и у (согласно центральной предельной теореме), можно говорить об их равенстве с вероятностью у при выполнении условия I х—у | tv (fyn-i + Су/пъ, (1.32) где tv—у-квантиль (0, 1)-нормального распределения. Критерий (1.32) удовлетворительно работает при пх>»30 и п2>30. По пересечению доверительных интервалов можно прове- рить гипотезу о равенстве любых других числовых характеристик двух выборок. Более точный метод сравнения двух выборок базируется на критерии Стьюдента. Если распределения выборок предполагаются нормальными, то равенство х = у с вероятностью у удовлетворяется при выполнении условия | где X — У пхпа (П1 + па — 2) /11 + па (1.33) а —у-квантиль распределения Стьюдента с k = (пх + п2—2) — степенями свободы. Например, при у = 95 % и k = 10, 20, 40 критическое значение равно соответственно 2,23, 2,09, 2,02. Для приведенного выше примера по проверке гипотезы о равенстве средних значений плотности двух массивов х = 3,05; ох — 0,06; у = 3,10; ау = 0,07. Согласно критерию (1.33) t = 0.05 / 12-12-22 0,05-11,6 ~ . g V0,043 + 0,059 V 24 “ 0,32 ’ Таким образом, t = 1,8 меньше табличного значения, равного tv = 2,07 (для k = 22), и гипотеза о равенстве средних этих вы- борок выполняется. Метод сравнения дисперсий в предположении о нормальности распределения обеих выборок основан на критерии Фи- шера Е= аМ 1 (1.34) где о? и о| — выборочные дисперсии, причем О1>Ог. 30
Величина F подчиняется распределению Фишера с («1—1) и (п2—1) степенями свободы. Гипотеза о равенстве дисперсий принимается с вероятностью 7 при F<zFv, где А —у-квантиль распределения Фишера. На- пример, для у = 95 то и rtj—1 = n2—1 — 10, 20, 30 критические значения Fv равны соответственно 2,98, 2,12, 1,84. Нетрудно видеть, что гипотеза о равенстве дисперсий плотности двух гранитных массивов согласно критерию Фишера F = а2/а2 = = 0,072/0,062 — 1,37 выполняется с вероятностью не менее 95 %. § 5. ОБРАБОТКА ДАННЫХ ИЗМЕРЕНИЙ ФИЗИЧЕСКИХ СВОЙСТВ ГОРНЫХ ПОРОД Применение основных понятий теории вероятностей и математиче- ской статистики, статистической проверки гипотез проиллюстри- руем на примере обработки данных измерений физических свойств горных пород. Эта обработка включает: построение статистических оценок плотности и функции распределения с целью компактного представления данных о физических свойствах; вычисление оценок числовых характеристик (см. табл. 2); определение точности оце- нок (доверительных интервалов) согласно табл. 3; проверку гипо- тезы о законе распределения изучаемых данных в соответствии с § 4; оценку формы и силы корреляционных связей между различ- ными физическими свойствами, анализ множественных связей, рассматриваемых в гл. II. Допустим, что в результате п = 100 измерений плотности горной по- роды на денситометре с погрешностью 6 = ± 0,01 г/см8 получены данные, приведенные в табл. 5. Таблица 5 Плотность, г/см3 Частость, mi Плотность, г/см’ Частость, mi Плотность, г/см' Ч астость, mi 2,00 5 2,06 7 2,12 3 2,01 3 2,07 6 2,13 5 2,02 5 2,08 6 2,14 6 2,03 4 2,09 8 2,15 4 2,04 3 2,10 6 2,16 4 2,05 10 2,11 10 2,17 3 2,18 2 Для построения оценки плотности распределения — гистограммы не- обходимо провести группирование данных согласно эмпирическим правилам. По формуле Стерджеса (1.25) имеем Дх = J^max^ymin. = 2'18-2,00 = Q г/см8 14-3,321gn 1 + 3,32-2 Такой же интервал группирования получаем, исходя из равенства ин- тервала двойной погрешности измерений: Дх = 26 = 0,02 г/см8. Проведем группирование данных, начиная с больших значений плотности, учитывая, что в каждом разряде гистограммы не должно быть менее пяти значений. 31
В результате объединения значений плотности по разрядам получим гистограмму, значения которой даны в табл. 6, а ее график — на рис. 1, а. Таблица 6 | Разряд | Границы интервала (разряда), г/см® Частота в интервале Границы интервала в долях относительно х + ё" It* % ‘001 [(»)ф— —(— -du = -ш сГ с 1 г 'w- сГ е xi xi+i |Н L н“ О IX 1 II ± г о 1 4-2,00 5 —1,77 0,0384 0 3,84 0,35 2 2,00 2,02 8 -1,77 —1,36 0,0869 0,0384 4,85 2,06 3 2,02 2,04 7 —1,36 —0,94 0,1736 0,0869 8,67 0,32 4 2,04 2,06 17 —0,94 —0,52 0,3015 0,1736 12,79 1,32 5 2,06 2,08 12 —0,52 —0,1 0,4602 0,3015 15,87 0,94 6 2,08 2,10 14 —0,1 0,31 0,6217 0,4602 16,15 0,29 7 2,10 2,12 13 0,31 0,73 0,7673 0,6217 14,56 0,17 8 2,12 2,14 11 0,73 1,15 0,0849 0,7673 10,76 0,01 9 2,14 2,16 8 1,15 1,56 0,9406 0,8749 6,57 0,31 10 2,16 оо 5 1,56 ОО 1 0,9406 5,94 0,15 По данным табл. 6 находим оценки среднего значения и сраднеквадра- тического отклонения (в г/см8): х = TjiWlln = 2,085; о = л/Е (*£ — x)2miln = 0,048. Оценки асимметрии и эксцесса: А = 2 (xi — *)3 пц/па2 = — 0,08; Е = У, (mt — х)1 mj/na* — 3 = — 1,2. Исходя из этих оценок, можно считать, что распределение близко к нор- мальному. Для проверки гипотезы о соответствии полученного распределения плотности нормальному закону по критерию х2 (1.28) необходимо провести вычисление теоретических частот. С этой целью определяют границы интер- валов (разрядов) в долях а относительно х — графы 5 и 6 табл. 6, после чего вычисляются вероятности попадания случайной величины в эти нормиро- ванные интервалы. Так, для первого интервала, пользуясь таблицей значе- ний нормального распределения [2], находим: Ф(31) = Ф(— °о) = 0; Ф(г,) = Ф (— 1,77)= 0,0384. Отсюда Pi = Ф (г2) — Ф (3j) = 0,0384. Поскольку общее число измерений плотности п = 100, теоретическая частота для первого интервала равна гп( = npi — 3,84. Для нахождения величины х2 требуется найти отношения (mi—npi)2/npi по каждому интер- валу и затем их просуммировать. В нашем примере х2 = 5,92. Поскольку по данным исходной выборки оценивалось два параметра (х и о) нормаль- ного закона, число степеней свободы k — г—s = 10—2—1 = 7, где г — число интервалов (разрядов гистограммы), получившихся после группиро- вания данных. По таблице значений х2 [2J при k = 7 и 50 %-ном уровне 32
значимости получаем у? = 6,35, которое больше рассчитанного для нашего примера х2 = 5,92. Иначе, вероятность получить такие же или еще большие значения х2 при нашей гипотезе о нормальности распределения более 0,5. Таким образом, гипотеза о нормальном законе распределения генеральной совокупности горной породы, из которой получена наша выборка, не противоречит результатам из- мерений. Аналогичный вывод полу- чается при проверке гипотезы о нормальности распределения данной выборки по критерию Колмогорова. На рис. 1 приве- дены экспериментальные и теоре- тические кривые функций рас- пределения в обычном масштабе (6) и на вероятностном бланке (в). Согласно формуле (1.26)_ве- личина Х= D-у/ и ~ 0,05^ 100= = 0,5, что позволяет принять гипотезу о нормальном законе распределения генеральной сово- купности с вероятностью Р (Х) = = 0,964. Использование вероятност- ного бланка (вероятностной бу- маги) позволяет аппроксимиро- вать экспериментальную кривую распределения прямой линией, соответствующей нормальному за- кону. При этом оперативно опре- деляются оценки х и а. Так, по рис. 1, в находим, что х = =2,08 г/см8, а о = 0,05 г/см8. Результаты изучения фи- зических свойств представ- ляются в виде гистограмм и статистических функций распределения для соответ- ствующих типов пород (рис. 2). В том случае, когда гис- тограммы пород разных типов перекрываются, возникает Рис. 2. Гистограммы (а) и статистиче- ские функции распределения в обычном масштабе (б) и на вероятностном блан- ке (в) для двух типов пород (I и II). задача оценки вероятности их разделения. Такой оцен- кой служит величина q — 1 — области, соответствующие вероятности разделения пород (х(| — координата точки пересечения гистограмм); 2 — величина дове- рительного интервала для частоты площадь пересечения гисто- грамм: q = Snep/GSr + S2), где и S2 — площади под гистограм- мами сравниваемых типов пород. Поскольку площади под гисто- граммами составляют 100 %, Snep определяется полусуммой зна- чений частостей, снятых с обеих'гистограмм. Для примера, приве- денного на рис. 2, a, q = 0,5 Snep-100 = 12 %. Эта же вероятность аналогичным образом может быть найдена по статистическим функ- 2 А. А. Ннкнтнн 33
циям распределения (графикам накопленных частот) (рис. 2, б) и особенно просто на вероятностном бланке (рис. 2, в). Для значений частот, соответствующих разрядам гистограммы, следует оценивать их точность а(р) = д/р(1—рУп (см. табл. 3) и построение гистограмм дополнять доверительными интервалами (см. рис. 2, а). Перекрытие доверительных интервалов гистограмм двух типов пород свидетельствует о невозможности разделения этих пород по физическому параметру. Вероятность разделения пород двух типов у = 1—q. При ве- роятности у = 50 % гистограммы полностью перекрываются и, следовательно, породы по физическому параметру не различаются. Обычно при у, меньшей 75 % (q > 25 %), разделение пород по физическому параметру практически невозможно. В том случае, когда исходные выборки имеют нормальное рас- пределение, вероятность разделения у = ф(*° ф( *о у (1.35) где х0 — точка пересечения гистограмм; xlt хг и olt а2 — соответст- венно оценки средних и среднеквадратических отклонений двух выборок. Эту вероятность удобно определять графически по расстоянию между кривыми накопленных частостей по линии, проходящей через точку х0. Например, для случая, приведенного на рис. 2, имеем х0 = 9, xt — 6, xt = 11, ах = 3, а2 = 2 и соответственно у = 87 %. Важным моментом при обработке данных измерений физиче- ских свойств пород является разделение гистограмм сложной формы, в частности с двумя и большим числом экстремумов, отражающих смесь некоторого числа разнотипных пород. Эта задача решается путем фильтрации гистограммы оптимальным фильтром сжатия (обратный фильтр), рассмотренной в § 34. С использованием табл. 3 возможно оценить необходимое число измерений при заданной точности n = tyD/e%. Например, пусть при измерении плотности By = 0,01 г/см8; а оценка дисперсии D = [0,03 г/см0]а. При доверительной вероятности у= 0,95 ве- личина ty = 1,65. Следовательно, для нашего примера п = 1,65*Х Х0,038/0,012 « 25. Все приведенные приемы обработки данных измерений физиче- ских свойств горных пород аналогичным образом используются при обработке наблюдений геофизических полей, в частности при решении задач распознавания образов (см. § 44). При этом гисто- граммы наблюденных значений физических полей строятся над объектами с известной геологической природой, служащими эта- лонами при распознавании неизвестных объектов. Вероятность разделения гистограмм является мерой информативности измеряе- мых признаков.
ГЛАВА II КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ, ИНТЕРПОЛЯЦИЯ И АППРОКСИМАЦИЯ ГЕОФИЗИЧЕСКИХ ДАННЫХ Решение задач сглаживания, интерполяции и аппроксимации гео- физических данных проводится на основе вероятностно-статистиче- ского и детерминированного подходов. В рамках первого подхода наибольшее применение получили методы корреляционно-регрес- сионного анализа (см. § 6—10), а в рамках второго — методы ин- терполяции с помощью полиномов Ньютона, Лагранжа, сплайн- функций (см. § 11) и системы гармонических функций (см. § 12). § в. КОРРЕЛЯЦИЯ И РЕГРЕССИЯ Важной задачей обработки геофизических данных является изу- чение зависимостей между изучаемыми признаками (например, между различными физическими свойствами горных пород), между показаниями различных методов (например, между глубиной за- легания сейсмического горизонта и аномальными значениями силы тяжести в гравиразведке) и т. д. Другой распространенной задачей обработки геофизических данных является их аппроксимация не- которой зависимостью, в частности полиномом заданной степени. Изучение и построение указанных зависимостей предусматривают оценку тесноты связи и формы проявления этой связи. Тогда за- дачи обработки решаются на основе корреляционно-регрессионного анализа. Зависимость, при которой изменение одной величины вызывает изменение распределения другой, называется статистиче- ской (стохастической). При статистической зависимости разли- чают корреляцию, когда устанавливают существование взаимосвязи между двумя (или более) случайными величинами и оценивают силу (тесноту) этой связи, и регрессию, когда выясняют характер (форму) зависимости между величинами X и У и возможность оценки У по X (или X по У), причем либо X, либо У, либо X и У являются случайными величинами. Оценка тесноты связи производится путем расчета коэффици- ента корреляции, определяющего и степень взаимосвязи между случайными величинами. На основании регрессионного анализа наблюдаемое «облако» точек (рис. 3) аппроксимируется уравнением регрессии. Под рег- рессией понимают сглаживание экспериментальной зависимости по методу наименьших квадратов. Согласно этому методу сумма квад- 2* 35
ратов отклонений экспериментальных данных yt от сглаживающей функции обращается в минимум, т. е. п S [*/» —ф (я?)]2 => min. (2.1) i=l Для оценки формы зависимости необходимо задать конкретный вид функции ф (х). Если ф (х) представить в виде функции от аргумента х и не- известных коэффициентов а0, аг, о2, . , . , т. е. ф (х, а), для на- Рис. 3. Статистическая зависимость у от х при положительной (а и б), отри- цательной (в) корреляции, отсутствие корреляции (е). а — регрессия У на X; б—регрессия X на У; а/ — отклонение регрессий от эксперимен- тальных данных хождения коэффициентов а0, alt а2, . . . следует продифференци- ровать (2.1) по этим коэффициентам, а производные приравнять к нулю: ф(Х{, о0, аь а2, • • . )](дф/до0)( = 0; —ф(х<, «о, «1> «2, • • . Ждф/дах^О; (2-2) где (d^/da^t = фа( (xj, а0, аъ а2, . . .) —значение частной произ- водной ф по коэффициенту а,- в точке хь 36
Система уравнений (2.2) называется системой нормаль- ных уравнений. К этой же системе уравнений приводит математическая модель данных более общего вида. Пусть экспериментальные данные опи- сываются зависимостью ф (х, а). Однако в результате действия по- мех и погрешностей измерения в точке Xi наблюдается величина уг = ф(х, а)+е{. (2.3) Предположим, что ошибки ei в отдельных точках наблюдения в (2.3) имеют нормальное распределение с нулевым математиче- ским ожиданием и одинаковой дисперсией а2, не коррелированы между собой и не зависят от ф. При этих допущениях результаты наблюдений yt являются независимыми, нормально распределен- ными величинами с математическим ожиданием ф (xi) и одинаковой для всех наблюдений а2. Задача состоит в нахождении оценок at неизвестных коэффици- ентов регрессионной зависимости ф. Если ф линейна относительно неизвестных коэффициентов, то -> k ~ Ф (x)=^a/fj(x), (2.4) где а/ — искомые коэффициенты регрессии; (k + 1) — число чле- нов уравнения регрессии; х = (х1( х2, ... , хп) — вектор входных переменных; f] (х) — известные по форме функции, в частности полином некоторой степени от xlt х2, . , хп. Задача нахождения оценок а/ чаще всего решается методом наи- меньших квадратов, т. е. оценки О/ получаются из условий мини- мума суммы квадратов отклонений yt от их математических ожи- даний: п п Г k -1» 2^1 = 2 [.У/ — wj =>min- (2.1') О " 5 ( V 2^ л Значения а, находятся из условия-х-I >. ei I = 0, эквивалент- на/ / ного (2.2). Дифференцируя (2.1) и перенося в правую часть члены, не содержащие «/, получим систему нормальных уравнений S аоА) + £01ЛоЛ1+ • • • + S akfloflk = X fioUi> S + • • • +^Okfnfik = Xfi^ (2-5) X aoftofik 4- S alf ilf ik + +S aJ2ktky i-. 37
Приняв обозначения для коэффициентов системы (2.5) cji = S f ijf ч и для свободных членов =*= Д f чУь (2.6) (2.7) систему нормальных уравнений можно записать в виде СыАо 4" coiQi + Cioao + cuai + (2.8) СмАо + CkAi + • • • + = bk. В настоящее время наиболее распространенным является пред- ставление системы нормальных уравнений в матричной форме F'FA = F'Y, (2.9) где ’ F — прямоугольная матрица размерности h х (k +1), за- дающая значения функции при проведении п наблюдений, f ю fn fao fai F = _ fno fnl fik fzk ~r~ r; (2.10) + CfaAk = Ьо\ + ft — вектор, определяющий значения функций fj в i-й точке на- блюдений, (2.П) fik 38
A — вектор искомых оценок неизвестных коэффициентов уравне- ния регрессии, (2.12) «л . Y—n-мерный вектор наблюдений, У1 У2 (2.13) /А. Знак «штрих» означает транспонирование. Матрица F'F = M (2.14) называется информационной матрицей Фишера. Эта матрица — квадратная, положительно определенная и невы- рожденная при n > fe + 1 и если хотя бы (k + 1)-наблюдение про- ведено в разных точках пространства входных переменных. Сле- довательно, для нее существует обратная матрица C = (F'F)-1 = M-1. (2.15) Тогда решением системы нормальных уравнений (2.9) является вектор неизвестных коэффициентов A = (F'F)-1F'Y = M-1F/Y = CF'Y. (2.16) Учитывая (2.16) и то, что истинные значения коэффициентов регрессии А = CF'Y, можно получить выражение для ковариацион- ной матрицы оценок неизвестных коэффициентов: К = М[(А—А) (А—А)']=а®С, (2.17) где М — знак математического ожидания. Отсюда следует, что ковариация двух любых оценок aj и at klt = a*c]b (2.18) где Сц — соответствующий элемент обратной матрицы С. 39
Мерой отклонения оценки регрессии от истинной зависимости является дисперсия предсказания по уравнению регрессии значений (дисперсия аппроксимации). Эту диспер- сию предсказания как функцию входных переменных можно за- писать в виде Г Й k “12 f k “j 2 d(x) = M £ — Z fj (x)at = M Z fj = L/=o /=o J L/=o J = Z £ fl (x)fj (x)M[(al—ai)(aj—aj)] = a2f' (x) (F'F)-1/(x) = J=o /=0 = a*T'(x)Cf(x). (2.19) Фундаментальную роль в анализе уравнения регрессии играет матрица С = в структуре которой содержится вся информа- ция о статистических свойствах исследуемой модели (2.3). Примеры нахождения оценок неизвестных коэффициентов и изу- чения информационной матрицы М и матрицы С даны в следующих разделах. § 7. ОЦЕНКА ТЕСНОТЫ КОРРЕЛЯЦИОННОЙ СВЯЗИ Характеристикой связи между двумя случайными величинами X и Y, представленными физическими параметрами или геофизиче- скими полями, служит коэффициент корреляции (1.7). Поскольку средние значения и дисперсии X и У в (1.7) неизвестны, исполь- зуется оценка (состоятельная и несмещенная) коэффициента кор- реляции, называемая выборочным коэффициентом корреляции: л ! п rXY = " ^Xi “Х) —У"> = ПОхаУ 1=1 . п - =—^ (xtyt—пху), (2.20) ЛОХ°У i=l где х, у, ах, ау — оценки средних значений и среднеквадратиче- ских отклонений X и Y. Свойства выборочного коэффициента корреляции гху состоят в следующем: 1) абсолютная величина гху не превосходит еди- ницы, — 1 < rxy < 1; 2) если гху — 0, величины X и У не свя- заны линейной корреляционной связью, такие величины называют некоррелированными, в случае нормального распре- деления X и У из равенства гху = 0 следует назависимость X и Y, т. е. некоррелированность и нормальное распределение слу- чайных величин приводит к их независимости; 3) с возрастанием 40 'Г 1.
абсолютной величины гху линейная корреляционная зависимость становится все более тесной и при | гХУ | = 1 переходит в функцио- нальную. При оценке корреляционной связи различают: коэффициент корреляции, коэффициент ранговой корреляции, частный коэффи- циент корреляции, множественный коэффициент корреляции, кор- реляционное отношение. Коэффициент корреляции гху оценивает тесноту лишь линей- ной связи между X и Y. Доверительный интервал для гху в пред- положении нормальности распределения X и Y (при доверитель- ной вероятности у) будет гХу zfc ^<v-t-i)/2 (1—гху)/д/й, (2-21) где А?-Н)/2—у-квантиль (0,1)-нормального распределения; (1—?xy)/Vn—среднеквадратическое отклонение для гху. Поскольку величина гХУ оценивает тесноту линейной связи, то при значениях гху, выходящих за пределы доверительного интер- вала (2.21), гипотеза об отсутствии линейной связи отвергается с вероятностью у. При отсутствии линейной связи коэффициент корреляции ра- вен нулю, однако при этом выборочный коэффициент не обяза- тельно будет равен нулю. Его колебания вокруг нуля можно учесть, указав пределы, в которых при справедливости гипотезы об отсутст- вии связи должен находиться с близкой к единице вероятностью у выборочный коэффициент корреляции. Эти пределы с учетом (2.21) равны ± f(i+V)/2 Vl/n. Пример [71. Проверить гипотезу о наличии связи между величинами кажущихся сопротивлений (КС) рв,55 и pli05, р0>55 и pi(7B, измеренных в неф- тенасыщенных пластах терригенных отложений зондами различной длины — 0,55, 1,05 и 2,75 м, если выборочные коэффициенты корреляции по 20 пластам составили: г13 = 0,91 (для зондов 0,55 и 1,05 м), ri3 = 0,15 (для зондов 0,55 и 2,75 м). Решение. Пределы, в которых с вероятностью у = 0,95 должен нахо- диться коэффициент корреляции при гипотезе об отсутствии связи, состав- ляют: 0,91 ± /o.»7sW2O = 0,91±1,96-0,22 = 0,91 ±0,44. Так как гХУ >0,44, гипотеза о наличии связи между ро)33 и р i,05 принимается с доверительной вероятностью 0,95. Для р0,55 и р2175 эта гипотеза отвергается, так как каждый односторон- ний доверительный интервал по величине больше ri3. Полученные резуль- таты можно объяснить особенностями залегания изучаемых пластов. Так, малая мощность и невыдержанность пластов по площади приводит к усред- нению величии КС при увеличении длины зонда и к ослаблению связи с КС при малой длине зонда. Более точный критерий некоррелированности величин X и Y основан на том, что при отсутствии связи величина t = г х у it—2 / 1—7Ху (2.22) распределена по закону Стьюдента с (п—2) степенями ’свободы. 41
Гипотеза об отсутствии связи отвергается, если |Л>Лт+1)/2> где — (1 +?)/2 — квантиль распределения Стьюдента с (п—2) степенями свободы. Если коэффициент корреляции имеет значимое отличие от нуля, то его распределение тем сильнее отличается от нормального, чем меньше число наблюдений п и чем больше его абсолютное значение. Распределение гху может быть приближенно приведено к нор- мальному с помощью так называемого z-преобразования Фишера: z = 0,51n[(l+гху)/(1 —гху)]; az = |l/V^Z3. (2.23) Это преобразование можно применять уже при п > 10. В том случае, когда определяется взаимосвязь между случай- ными величинами X, Y (физическими параметрами), распределен- ными не по нормальному закону, а произвольно, зависимость ме- жду X и Y следует оценивать с помощью коэффициента ранговой корреляции Спирмена р. Для вычис- ления р каждая наблюденная величина преобразуется с помощью рангов (табл. 7), образуются разности D для п пар рангов, которые Таблица 7 п Плотность ап, г/см’ Магнитная восприимчивость х-1(А ед. СИ Ранги Разность рангов D О! °п X 1 2,58 6 5,5 1 4,5 22,25 2 2,65 10 10 5,5 4,5 22,25 3 2,52 8 3 3 0 0 4 2,68 42 12 16 4 16 5 2,70 12 14 7 7 49 6 2,73 НО 17 18,5 1,5 2,25 7 2,71 ПО 15 18,5 3,5 12,25 8 2,58 8 5,5 3 2,5 • 6,25 9 2,49 20 1 10 9 81 10 2,50 25 2 12 10 100 И 2,73 206 17 20 3 9 12 2,68 61 12 17 5 25 13 2,64 20 9 10 1 1 14 2,68 20 12 10 2 4 15 2,73 33 17 14,5 2,5 6,25 16 2,78 10 19,5 5,5 14 196 17 2,78 33 19,5 14,5 5 25 18 2,59 30 7,5 13 5,5 30,25 19 2,53 8 4 3 1 1 20 2,59 13 7,5 8 0,5 0,25 2D2 = 605 возводятся в квадрат и суммируются, т. е. р = 1—6SD*/(n8—п). (2.24> Если два ряда рангов равны, разности D равны нулю и р = 1. Если ряды рангов обратны, то р = — 1. 42
Этот критерий позволяет ответить на вопрос о знаке имеющейся корреляции. Для проверки гипотезы об отсутствии связи между X и Y следует сравнить коэффициент р с его доверительным интервалом, равным в предположении о нормальности распределения р± /(1+у)/2д/1/(п— О» Указанным интервалом можно пользоваться при п > 10. В случае одинаковых значений X и Y вместо (2.24) вычисляется р=1 —6SD*/[n(n8—1)—6(T+(/)L (2.25) где Т = 1/12 S (t2—1) t, t— количество одинаковых значений X’, U = 1/12 S (и2—1) и, и — количество одинаковых значений Y. Для примера, приведенного в табл. 7, в соответствии с (2.25) р = 1—6-605; (20-399 — 6.11) = 0>54. Доверительный интервал ^(y+i)/2 —0 ПРИ V — 0>95 равен + 0,45. Поскольку 0,54 >0,45, гипотеза о наличии корреляцион- ной связи между оп и х выполняется. Расчет коэффициента ранговой корреляции был использован для изучения связи между х и стп, определяемыми по керну корен- ных пород в картировочных скважинах. При этом р находится в пределах скользящей палетки, включающей 15—20 скважин. Значение р‘ относится к центру каждой палетки. После вычисления р в пределах всей площади исследования строится карта изолиний р (рис. 4). Анализ карт изолиний р, по- лученных по различным рудным районам, позволил установить, что неизмененные эндогенными процессами горные породы незави- симо от их состава и генезиса характеризуются положительной корреляционной связью между х и оп. В зонах проявления гидро- термально-метасоматических процессов происходит нарушение этой связи между плотностью и магнитной восприимчивостью вплоть до появления обратной связи между ними. Таким образом, построение карт изолиний коэффициентов ран- говой корреляции позволяет использовать результаты петрофизи- ческих измерений (х и оп) Для выделения площадей гидротермально- измененных пород, к которым обычно приурочены месторождения полезных ископаемых. Промышленные месторождения, как уста- новил В. И. Пахомов, располагаются в пределах областей наруше- ния положительной корреляции между х и стп, тяготея к наиболее градиентным изменениям величины р. Если случайная величина Y линейно зависит от системы слу- чайных величин . . . , Xk, то теснота линейной связи характе- ризуется множественным коэффициентом кор- реляции Vk Е bir(Y , (2.26) f=i 43
0 5001000 tSOO» |^|z !'• |j E3P E±3J I 4- P X/ X/ 7 / X /* f 10 Рис. 4. Карта изолиний коэффициента ранговой корреляции (по В. И. Па- хомову). 1 и 2 — метасоматиты разных формаций; 3 — месторождения; 4 — изолинии коэффици- ента ранговой корреляции; 5 — граниты среднезериистые; 6 — граниты рапакиви; 7—9 — гиейсы разного состава; 10 — тектонические нарушения где Пу— выборочный коэффициент корреляции величины с У; bi — решение системы линейных уравнений вида Rb = r; (2.27) г = (г1У.....г*у); R — корреляционная матрица, составленная из выборочных коэффициентов парной корреляции rtj. Допустим, что Y линейно зависит от двух переменных и Х2, тогда система (2.27) примет вид 1 г12 г12 1 Ip! J L ь2 Г r1Y 1 L I'iY J 44
или by 4- 6ar12 = г1У, отсюда by = (г1У—r12rzY)/(l— rf2); ЬуГ12 + + b2 = г2У; b2 = (г2У—г 12г 1У)/(1—Г|2). Множественный (выборочный) коэффициент корреляции с уче- том (2.26) будет = / Ь1у — Г12Г2у) Г1У (г2у — Г12Гуу) Г2у _ V 1 — Л12 1 ~~ Л12 Vr12 ~ 2г12г1Уг2У "Ь г2У 1-^2 Степень влияния одной из величин, например Xj на Y (при по- стоянном значении Х2) оценивается частным (парциальным) коэффициентом, корреляции величин Ху и Y по отношению к Х2 ЛУ/2 = (^1У — fnfгу)/ д/(1 —Лг) (1 —Лу) • Аналогично определяются частные коэффициенты корреляции Г12/У И Г2У/1- Частный коэффициент корреляции определяется на значимость так же, как и обычный коэффициент корреляции. Однако при этом число степеней свободы при исключении каждой величины умень- шается на единицу. Если исключается одна величина, как в рас- смотренном примере для г1У/2, то число степеней свободы равно п—2—1 = п—3. Вычисление частных коэффициентов корреляции обычно дает возможность оценивать искажающее влияние тех факторов, ко- торые при эксперименте плохо контролируются или вообще не контролируются. Гипотеза, согласно которой множественный коэффициент кор- реляции равен нулю (против 7?*+1>»0), проверяется на основании Лкритерия: F = (n-k-l)Rl+i/k(l-R2k+i). (2.28) Если FcFy (п—k—1, k), где —у-квантиль распределения Фи- шера с (п—k—1) и k степенями свободы, гипотеза о наличии ли- нейной связи между Y и Ху, . . . , Xk отвергается с вероятностью у. В качестве меры связи нескольких ^-параметров (признаков), допускающих ранжирование, используется коэффициент согласованности Кендалла и Смита 1F: r=12Sw/^(n8—п), (2.29) где!| w п г k I2 = Е [2/0-*(»+ 1)/2] . где rtj — элементы матрицы результатов ранжирования R — {г<у), i = 1, . . . , /г; j — 1, . . . , п; i-я строка матрицы содержит резуль- таты ранжирования по i-значениям (объектам), следующим в од- 46
ном и том же порядке. В случае отсутствия связи M.W — \lk, при- чем 0 < W С 1. С помощью корреляционного отношения производится оценка тесноты нелинейной корреляционной связи. Корреляцион- ное отношение т) представляет собой отношение межгруп- повой дисперсии DM к общей дисперсии данных D: t] = VDm7D, (2.30) где DM — дисперсия групповых средних относительно общей сред- ней, (N{ — объем /-й группы), . р _ £>м=— S (2.31) 1 П( у =—£ niyi—общее среднее величины У (п{ — частота значе- п £=2 ния yt); у,- — среднее значение У в /-й группе (групповое среднее, р соответствующее /-му значению аргумента X);n=£ Nj—объем /”1 всей совокупности значений; D = — £ nt(yi_yf. (2.32) п i=l Если величина У связана с X функциональной зависимостью, отношение D^JD = 1, если У связана с X корреляционной зави- симостью, DM/D<1. Корреляционное отношение я обладает свойствами: 1) 0^т]< 1 (с ростом т] корреляционная связь становится более тесной); 2) если т] = 0, корреляция между X и У отсутствует; 3) если г) = 1, ве- личины X и У связаны функциональной зависимостью; 4) т) > | rXy I 5) если т] = | гху |, имеет место линейная корреляционная зави- симость. В отличие от коэффициента корреляции отношение я оценивает тесноту связи любой формы, однако не позволяет суд ть о раз- бросе вокруг кривой определенного вида. § 8. ВИДЫ РЕГРЕССИЙ И ИХ ПРИМЕНЕНИЕ ЛИНЕЙНАЯ РЕГРЕССИЯ Линейной регрессией между величинами X и У называется корре- ляционная зависимость вида У=а0 + а1Х. - (2.33) Согласно (2.2) для линейной регрессии получаем (dy/da^i = х«; (дц>/да0){ = 1 и Е [yi—(а0 + OiXi)]Х( =0; Elz/i — (ао + ад)]1 = О. 46
Система нормальных уравнений запишется в виде IS *21 ai + IE х] ао = Е ху; [Е х] tti + па0 = Е У, (2-34) где Sx = Sx/; Sy = Sy/; Sx2 — Sxf; Sxy — 2xiyi, если Y — случайная величина, а значения X заданы точно. Коэффициенты регрессии из этой системы соответственно „ —„ п%ху — £х£у Используя представление системы нормальных уравнений в мат- ричной форме (2.9) для модели (2.33), т. е. yt = а0 + aixi, имеем X'XA^X'Y, (2.36) где матрица ~ 1 хг ~ 1 х2 1 х„ Соответственно матрица Xi Хг 1 хп _ (2.37) а матрица 1 1 х8 ёу ] (2-38> -Уп _ Выражение (2.36) для нахождения коэффициентов а0 и at с уче- том (2.37) и (2.38) примет вид п Ех Е* 1Г ао ] = Г Т.У ] Е*2 JI ai J L Zxy 1 (2.39) 47
или л«0 + IE*] Д1 = £у, . <Е*] «о+IE*2] «1 = Е ху . что совпадает с (2.34). Величина ах определяет угловой коэффициент прямой линии регрессии Y на X и называется выборочным коэффи- циентом регрессии. Обозначим его через рух. Сравни- вая величину а! в (2.35) и rXY в (2.20), а также учитывая, что ^=-£(*<-*)2=*2-(;)2 и п _ пЯху — SxSy _ Sxy — пху Рух“ nSx2 — (Sx)2 ~ па2х * получаем связь между коэффициентами корреляции и регрессии в виде ах _ Sxy—nxy Pvx-^----------------гху- (^-40) Здесь и далее знак оценки «Д» опущен. Из второго уравнения системы (2.34) имеем Оо = У— Рухх- (2-41) Подставив это выражение в уравнение линейной регрессии У = Рух% +ао> получим Ух—У = РуХ(Х—x)=rXy(aY/ax)(X—х). (2.42) Аналогично можно выразить уравнение регрессии X на У в виде Ху —x = rXY (gx/gy) (Y —у} = Рху —у)- (2.43) Выражения (2.41) и (2.42) описывают уравнение двух различ- ных прямых линий и их совпадение достигается лишь для функ- циональной зависимости. В том случае, когда и X и У являются случайными величинами, каждое значение которых может наблю- даться неоднократно, данные наблюдений группируют, подсчиты- вая частоты пх и пи и записывая их в виде таблицы, которую на- зывают корреляционной (табл. 8). Для облегчения расчетов обычно удобно использовать не сами значения случайных величин X и У, а ввести для них условные обозначения, расположив нуль для значения с наибольшей часто- той так, как это сделано в табл. 8. Все частоты помещаются в прямоугольнике корреляционной таблицы, который в данном примере обведен жирной линией. В уг- лах каждой клетки таблицы записывается число, равное пху ху. Нахождение коэффициентов прямой линии регрессии по таким 48
Таблица 8 Х-плотность, г/см1 Xi У~ скорость, кы/с 2,5 2,4< 2.3 2,2 2.1 2,0 -2 -/ 0 / 2 3 пЧ ПцУ "цУг ОхуХу 2 2 И 4 |7У Ч Р? Ю 20 40 44 / 1 [о 4 [7 5 р2 5 р5 /в /в /6 31 0 5 [У 10 8 рг / Г* 24 0 0 0 -/ 1 [Т 4 И 9 [7 5 [7 2 нп 21 -21 2/ -з -2 3 рУ 6 [7F 6 |7 2 F /7 -34 68 20 -3 3 /8 5 4 12 -36 Ю8 33 "х 7 75 25 23 20 /0 *100' = 55 6nxyi =253 ХПхУХУ =125 пхх -14 -/5 0 23 40 30 =БЧ . 28 /5 0 23 80 90 ^xxZ •236 <ху 32 31 0 -/ 24 59 •125 сгруппированным данным производится путем решения уравнений вида (л?) рук + (лх) о0 = £ пхуху, (х)рух + «о = !/, где пх = £ «хх, «х2 = £ «х^2- Для рассмотренного в табл. 8 примера получаем следующие линии регрессии: Y х + 0,55 = 0,8 (X—0,64); Ху—0,64 = 0,72 (У + 0,55). Оценка тесноты линейной регрессии производится по значению выборочного коэффициента корреляции гХУ. Линейная регрессия широко используется при определении значений одного физического параметра по известным значениям другого. В частности, плотность горных пород ап, необходимую для интерпретации результатов гравиметрических наблюдений, можно определить по пластовой скорости продольных волн, если для района исследований составлена корреляционная зависимость между оп и цпл. Впервые оценка взаимосвязи скорости и плотности была полу- чена Н. Н. Пузыревым в виде v = 6оп—Н. Б. М. Уразаевым для 49
эффузивных и метаморфических пород были найдены зависимости v = 3,64 стп — 4,73 и v = 2,47 ац — 1,55. Эти связи обычно ме- няются в зависимости от возраста горных пород и района иссле- дований. Так, для восточного борта Прикаспийской впадины уста- новлено стп = 0,2 цпл 1,6 (при ипл<2,8 км/с), стп = 0,13 опл 4- + 1,98 (при 1>пл > 2,8 км/с). Оценка глубины залегания фундамента Н (или другой геологи- ческой границы) по данным гравиразведки (или магниторазведки) Н = fliAg 4- а0 может служить еще одним примером использова- ния линейной регрессии. Для определения коэффициентов а0 и необходимо иметь ряд скважин с известными значениями Н или значения глубин, опреде- ленные другим методом. Пример [7]. На участке проведены измерения приращения силы тяжести Agi в пунктах бурения скважин. По скважинам определены глубины Hi за- легания фундамента. По этим данным найдены: выборочный коэффициент корреляции Ag и Н, равный г = — 0,9, средние значения Н = 175 м и Ag = = 50 мГал, среднеквадратические отклонения Оц = 15 м; од4 = 9 мГал. 1. Построить уравнение регрессии для расчета Н по Ag и оценить ошибку такого прогноза при доверительной вероятности у = 0,9. 2. Можно ли использовать полученное уравнение на участке, на кото- ром контрольная скважина показала Н = 250 м при Ag = 2,5 мГал. Решение. 1. По формулам (2.40) и (2.41) находим коэффициенты регрес- сии Н — а0 4- OiAg : ах = — 0,9 (15/9) = — 1,5; а0 = Н—а^в = 175 4- 4- 1,5-50 = 250. Уравнение регрессии Н — — 1,5 Ag 4- 250. Ошибка прогноза Н по Ag: ± /(i-|-y)/2 —г* <Ун~ ± 1,645 л/1 —0,9s -15 = 4- 10,8 2. При Ag = 25 мГал Н должно находиться с вероятностью у = 0,9 в пре- делах (Н—10,8; Н + 10,8), где прогнозное значение Н= — 1,5-25 4- 4- 250 = 212,5 м. Так как это условие не выполняется, использовать уравнение регрессии для расчета Н на другом участке нельзя. Нелинейная регрессия Нелинейной (криволинейной) регрессией называется любая за- висимость, отличающаяся от линейной. Примером является пара- болическая регрессия второго порядка ^x=ao + aiX + aaXs. (2.44) Система нормальных уравнений в матричной форме (2.36) при этом запишется в виде 1 1 х? 4 *1 4 а0 2 %2 ^1 50
1 1 Х1 хг 2 2 Xt X2 Хп У1 Уъ -Уп _ После перемножения матриц получаем ' п Ех Ех Ех2 . Ех2 Е*8 Ех2 Ех3 Ех1 а0 ~ ai . а2 . Г Zy 1 Е*0 . LE^J или лао4-(Е*) 01+(Е*2) fl2=Е//; (Ех) По + (Ex2) Oi + (Ех3) а2 = £ху; (Ех2) Оо++ (Ех4) аг=Ех21/. (2.45) Параболическая регрессия используется при определении сред* ней плотности пластов с помощью акустического каротажа (по ско- рости), по результатам которого найдена скорость продольных волн ор: I I 2 Оп = во + OlVp 4* в20р. Для терригенных пород платформенного типа, например, а0 = = 1,75, вх = 0,266, в2 = — 0,015 (оп в г/см8, а ир в км/с). Среднеквадратическая ошибка одного определения оп по этому способу составляет 3—5 %. Широкое применение находят и другие виды нелинейной рег- рессии. Так, экспоненциальная зависимость плотности от пласто- вой скорости установлена для пород Южного Сахалина в виде ип = 2,6—0,95 ехр (—0,4 опл)> Для палеозойских отклонений По- волжья связь между опл и рпл надежно аппроксимируется регрес- сией вида опл = а 4- 5 In рпл. Экспоненциальные виды регрессии нашли применение в гео- химии. Так, в первичном ореоле рассеяния зависимость содержа- ния элемента от расстояния х до границы рудного тела описываются кривой <р (х) = а exp [ —-X (х—т)а] 4- Ь$, где йф — уровень фоновых содержаний химического элемента; X — обратная величина показателя миграционной способности элемента; т — координата центра ореола. А. П. Соловов использовал эту зависимость для описания рас- пределения содержаний элементов во вторичных элювиальных орео- лах рассеяния от маломощных рудных тел жильной формы. Нормальные уравнения для нахождения коэффициентов а, X, т — нелинейны. Поэтому для их решения применяют итерацион- ные методы, причем первое приближение при оценке коэффициентов 51
задают, исходя из физических предпосылок. Например, для при- веденного выше уравнения первое приближение получают по наи- большему участку опробования, где In bt (i = 1, п) соответствует параболической зависимости otxj. Такое приближение определяется условием минимизации суммы S = у1. (in Ь( — In и Х/п , 1 которая дает линейную относительно величин (In а—1ктг), — X и 2Х/п систему уравнений. Следует отметить также тесную корреляционную связь времен регистрации в сейсморазведке t0 и электроразведке /ЗСБ, установ- ленную по данным сейсмокаротажа и кривым электромагнитных зондирований становлением поля в ближней зоне (ЗСБ). Эта связь при совпадении глубин отражающего сейсмического и опорного геоэлектрического горизонтов описывается уравнением t0 = = 2а^^зсв> на ее основе можно прогнозировать среднюю скорость по данным ЗСБ: оСр = Н/а Коэффициент а определяется опытным путем по данным сейсмо- каротажа и кривым ЗСБ. Совместное использование скорости, определяемой по ЗСБ, с данными ОГТ обеспечивает более надеж- ные и точные оценки скоростного разреза. В электроразведке получение регрессии между глубиной зале- гания опорного горизонта и кажущимся сопротивлением Н = = а0 + П1 In рк позволяет заменить наблюдения дорогостоящим методом ВЭЗ измерениями более производительным методом сим- метричного профилирования с целью картирования горизонта. Множественная регрессия Эта регрессия получается при исследовании связи между несколь- кими (три или более) величинами. Так, линейная множественная регрессия Y на Хх и Х2 имеет вид Y = а0 -|- Я1Х1 (2.46) Система нормальных уравнений для нахождения коэффициентов а0, ai, аг в матричной форме (2.36) при этом записывается следую- щим образом: " 1 *11 1 *12 • • • • • • 1 - *lrt - 1 1 *11 *12 *21 *22 а0 ai _ *21 *22 • *2л _ 1 *1л *2п _ _ Ch _ 52
(2.47) па0 + Yixiai Н- — Sz/i (S*i) ao + (S*l) Qi + (Лх1хг) аг — Yixiy< (Hxi) ao “H ai + (S-^) a2 ~ ^хгУ- Для (2.46) удобно искать уравнение связи в виде У —у — ах (Xi—Xi) + <*2 (Х2 —*2), (2.48) где ГХ1У — ГХ2У'’Х1Х2 0у ai =---------й------- • --; 1—гх,х2 ах, ГХ2У — ГХ1УХ1Х2 Оу а2 —---------5-------*-----> I — Гу V Оу Л 1 Л 2 Л 2 гхху> гх2у и гххх2— выборочные коэффициенты корреляции ме- жду Хх и У, Х2 и У, Хх и Х2. Теснота связи оценивается множественным коэффициентом кор- реляции (2.26). Множественная линейная регрессия успешно применялась Г. И. Каратаевым для определения глубины залегания складча- того фундамента на территории Западно-Сибирской плиты по дан- ным гравиразведки (Ag) и аэромагниторазведки (АТ) в виде Н—Н = = а0 + axAg + а2АТ, где Я —среднее значение глубины в за- данном окне. Множественный нелинейный регрессионный анализ используется для построения петрофизических моделей (М. М. Элланский) про- дуктивных нефтегазовых пластов по данным геофизических иссле- дований скважин (ГИС), в частности зависимости величины пори- стости пласта от показаний стандартного комплекса ГИС, вклю- чающего для разведочных скважин КС, ПС, ИК, ДС, ГК, НК, АК. При этом уравнения регрессии ограничиваются квадратич- ными членами показаний соответствующих зондов. 53
Аналогичные регрессионные модели строятся для других фи- зических параметров. Так, для глин месторождений Узень, Жеты- <5ай (Южный Мангышлак) использование данных о кажущемся сопротивлении рк, интенсивности нейтронного гамма-каротажа /Нгк и скорости продольных волн иР по акустическому каротажу лриводит к уравнению регрессии <Тп = 2,28 0,28 In Рк -j- 0,36/ нгк—0,017ир при коэффициенте множественной корреляции = 0,75. Важными вопросами при построении множественных регрессий являются задание степени используемых полиномов и возможность исключения членов регрессии с малыми значениями коэффициен- тов. Эти вопросы решаются на основе дисперсионного анализа в § 14. § 9. КОРРЕЛЯЦИОННЫЕ МЕТОДЫ ПРЕОБРАЗОВАНИЯ ГРАВИТАЦИОННЫХ И МАГНИТНЫХ АНОМАЛИЙ Корреляционные методы преобразования гравитационных и маг- нитных аномалий, развитые в работах Г. И. Каратаева, В. И. Шрай- <5мана, М. С. Жданова и других, основываются на реализации двух процедур: 1) установления статистической зависимости между изучаемой теологической характеристикой, чаще всего глубиной залегания некоторого горизонта, заданной по геологическим данным (апри- орная информация по данным бурения или сейсморазведки), и гео- физическим полем или совокупностью полей на этом эталонном геологическом пространстве Н3 = АХ3, где Н3 — геологическая характеристика; А — оператор статистической связи, которым обычно является полином заданной степени; Xs = (Xf, . . . , Хп ) — вектор геофизических полей (или параметров); 2) последующего применения этого оператора с целью прогно- зирования искомой геологической характеристики по геофизиче- ским полям Япр = Хпр, где Япр — прогнозируемое значение гео- логической характеристики; Хпр = (Х"р, . . . , Х"₽) — вектор гео- физических полей, измеренных на прогнозируемой области. Для получения более эффективного решения задачи прогноза геологической характеристики Предлагается на основе использо- вания эталонных данных выделять из суммарного наблюденного поля такую компоненту, которая наилучшим образом связана с изучаемым геологическим объектом (характеристикой). Идея создания метода выделения компоненты геофизического поля, наилучшим образом связанной с изучаемым геологическим объектом, т. е. такого метода, который мало зависит от ненадежно определяемых физических свойств горных пород и в то же время использует априорную, информацию об изучаемом объекте, реали- зуется в так называемых корреляционных методах преобразования геофизических аномалий [18]. 54
Таким образом, корреляционные методы пре- образования аномалий заключаются в выделении иа наблюденного геофизического поля F остаточной аномалии F0CT, наилучшим образом (в смысле корреляционной зависимости) свя- занной с изучаемой геологической характеристикой Н. Остаточ- ную аномалию ищут в виде разности наблюденного поля и неко- торого полинома Lk по системе функций ft, ... , fk, т. е. Fост — F — Lk (х, у), где k Lk(x, y)='^iajfl(x, у). При этом полином Lk (х, у) называют трансформационным мно- гочленом (иначе, Lk — регрессионная зависимость); Яу (/ = 1.. k) — коэффициент трансформационного многочлена; fi, ... , fk~ базисные функции; k — размерность трансформационного много- члена; (х, у) — координаты точек плоскости наблюдений. Трансформационный многочлен должен наилучшим образом описывать составляющую геофизического поля, обусловленную влиянием геологических факторов, являющихся помехами при выделении искомой остаточной аномалии. В роли такой составляю- щей, в частности, выступает региональный фон. Система базисных функций выбирается с учетом структуры ком- поненты поля, обусловленной влиянием помех. Этот выбор основан на априорных сведениях о помехах. Задание той или иной системы базисных функций приводит к различным методам преобразования геофизических аномалий. После выбора системы базисных функций преобразование гео- физических аномалий сводится к определению коэффициентов трансформационного многочлена яу, которое осуществляется в рам- ках двух подходов. При первом подходе (подход А) оператором связи изучаемой геологической характеристики с геофизическими параметрами (по- лями) является уравнение линейной регрессии, т. е. k Fост k — ga/Zy + flo, (2.49> где F^k — полезная остаточная составляющая геофизического- поля F\ k — общее число геофизических параметров fk-i = H„ fk = F. При втором подходе к определению полезной остаточной состав- ляющей (подход Б) оператор связи позволяет непосредственно осу- ществлять прогноз значений изучаемой геологической характери- стики Н: £—2 = ak-iFост k 4- Gyfy+Оо» (2 • 50> где Яу — коэффициенты уравнения прямой регрессии; — рас- 55
четные значения геологической характеристики Н; F"cTk — про- гнозная остаточная составляющая геофизического поля F; k — об- щее число параметров fk^1 = F, fk = Н. При решении прогнозных геологических задач, когда искомой величиной является геологическая характеристика, преобразова- ние геофизического поля целесообразно проводить на основе под- хода Б. Когда же цель обработки — выделение из суммарного на- блюденного поля составляющей, связанной с геологической харак- теристикой, более эффективен подход А. Коэффициенты af, определяемые на базе подхода А, формируют простой трансформационный многочлен, а в рамках подхода Б — прогнозный трансформационный многочлен. Корреляционный метод трансформации геофизических аномалий Этот метод основан на задании базисных функций: fps = F(x + pAx, y+s&y), р, s = 0, ±1........±п; |pl + |s|>0. Трансформационный многочлен при этом £(2л+1>»- 1 = S apsF(x-f-pAx, y+s&y) (2.51) р. s=—п IР 1+1 S|>0 Аналогичным образом записываются все аналитические транс- формации геофизических полей, поэтому множественная регрессия указанного вида названа трансформационным многочленом. Число п является максимальным смещением по х (пДх) и по у (пЛу) исход- ного поля и называется порядком трансформаци- онного многочлена. Размерность трансформационного многочлена, определяемая по числу его коэффициентов, равна k = (2п + I)2 — 1. Остаточная составляющая геофизического поля FoctH*. y) = F(x> У)~ X ар/(х + рДх, у + зДг/), р. s=—п |Pl+ls|>0 или F0CTk(x, у) = % cpsF(x + pAx, y+sby), р, s=—n где Cqo = 1; cps = — aps; p, s = 0, ± 1, . . . , ± n, | p | +1 s|>0- Обычно на коэффициенты cps накладывается дополнительное ограничение, связанное с их нормировкой на заданное число Q. Тогда функцию Fn, получаемую в результате всех указанных пре- образований, называют корреляционной трансфор- 56
мантой геофизического поля F, п — порядком этой транс- форманты: Fn(x, y) = '^cspF(x-\-p\x, y + sby), где Coo ~ QJ (1 iZj ftps); Cps= QflpJ (1 iZj ftps I \ p,S=—n z \ p, s=—n z I p Ж s\>0 Корреляционная трансформанта аналогична по виду выра- жениям для аналитических трансформаций поля, однако ее отличие состоит в том, что она вычисляется из условий, обеспечивающих наилучшую ее корреляцию с изучаемой геологической характери- стикой (по эталонным профилям). В качестве примера описанного метода трансформации рассмотрим вы- деление прогнозной корреляционной трансформанты гравитационного поля [18]. На рис. 5, а представлены графики изменения аномалии Буге Ag и глубины залегания границы Н вдоль профиля наблюдений. Из графика за- висимости Ag от Н (рис. 5, б) видно, что между Ag и Н корреляция весьма слабая. Кроме того, локальные максимумы на кривой Ag смещены относи- тельно соответствующих поднятий структуры Н. Задача решалась на основе подбора коэффициентов трансформации вида 1 AgJ'P (х) = £ CppAg (х 4-рАх), Дх=50 м, р=—1 при этом минимизировалась ошибка приближения Н по Ag"₽. Были получены следующие коэффициенты: с_х = 0,5; с0 = 1, сх = — 1 (при расчетах Q = 0,5). Результат выполненной трансформации с этими коэффициентами приведен на рис. 5, а. Коэффициент корреляции гдв я бли- зок к единице. Для сравнения на том же рисунке дан график трансформации по методу Андреева—Гриффина: 6Ag (х) = &g (х) — [Ag (х + Ах) + + Ag(x—Ах)]/2. Полученная йчомалия практически не коррелируется с глубиной за- легания геологической границы Н (рис. 5, г), и в этом существенное отличие корреляционной трансформанты от аналитического продолжения полей. Корреляционный метод разделения геофизических аномалий (КОМР) Если влияние геофизических факторов-помех описывается полино- мом некоторой степени от координат точек площади исследований, то система базисных функций задается в виде fps — xpys, р, 8 = 0, 1, . . . , п, 0<рЧ-8<п, где х, у — координаты точек площади исследования. Тогда трансформационный многочлен, называемый геофизи- ческим фоном п L — F^n(x, у) = £ apixpys, (2.52} р» s==0 0<р-Н<п где п — порядок фона. 57
Этот вид преобразования называется также тренд-анали- зо м геофизического поля. В качестве примера применения тренд-анализа приведем аппрок- симацию наблюденного поля (рис. 6, а) полиномом второй степени L2 (х, у) = 17,76 + 1,436x4- 0,703г/—0,098х2—0,024/— 0,072хг/. Рис. 5. Выделение прогнозной корреляционной трансформанты поля Ag [18]. а — графики изменения аномалий Ag и глубины залегания границы Н; 1 — аномалий Буге; 2 — глубины, залегания границы Н, 3 — прогнозная корреляционная трансфор- манта AgyP, 4 — трансформированная аномалия Д£тр по методу Андреева—Гриффина; корреляционные графики зависимости; б — Ag от Н; в — Ag JP от Н, i — Agrp от Н Остаточную составляющую n-го порядка вычисляют по фор- муле ^ост (X, у) = F (х, y)—Z apsxpys- р» 8=0 0<p4-s<n Корреляционный метод разделения геофизических аномалий •отличается от тренд-анализа тем, что коэффициенты полинома, описывающие влияние помех, находят на основе априорной инфор- 58
мации об изучаемой геологической структуре таким образом,, чтобы выделяемая остаточная составляющая поля коррелировалась с этой структурой наилучшим образом. В том случае, когда нужно учесть изменение геолого-геофизических характеристик в преде- лах площади исследований, используют уравнение регрессии с пе- ременными по площади коэффициентами (см. кусочно-полиноми- альную аппроксимацию, § 10): k-i Foct (х, у) = ^а{(х, y)fj+a0, Рис. 6. Наблюденное поле Ag одного из районов Польши (а) и его региональ- ная составляющая в виде полинома второй степени (б) (по 3. Файклевичу) где а/ (х, у) — переменные коэффициенты регрессии, которые ап- проксимируются многочленами от координат: а{(х, у) = а$+ i <$х?у\ р, s=>0 0<p4-s<n/ k— 1. /=1, 2, . . Как и при постоянных коэффициентах регрессии, полезную оста- точную составляющую (называемую структурной составляющей} представляют в виде разности исходного поля и помехи: ^‘сДх, y) = F(x, у)—С(х, у), где По L*(x, у} — £ с$х?у*. р, s=0 0<p+s<»4 5»
Полином L* называют структурным трансформационным мно- гочленом; п0 — его порядком. Коэффициенты а/ и aps ищут методом наименьших квадратов, т. е. из условия Г k~1 I2 2 F (х, у)— L* (х, у)— £ а}(х, у) fj—a0 => min. L /=1 J Рис. 7. Результаты использования корреляционного метода разделения аномалий &g. л — карта изогипс в м; б — изоаиомалы модельного поля Ag в мГал; я — карта прогноз- ной остаточной составляющей поля Ag второго порядка в мГал. На картах Приведены эталонные профили (по В. И. Шрайбмаиу и М. С. Жданову) Выбор порядка и размерности трансформационного многочлена проводится на основе критериев: 1) минимума дисперсии остаточ- ной составляющей разделяемого геофизического поля; 2) минимума модуля коэффициента корреляции между трансформационным мно- гочленом и изучаемой геологической характеристикой; 3) мини- мума погрешности эталонного оператора на независимой контроль- ной выборке. Эффективность корреляционного метода разделения аномалий показана на рис. 7. В гравитационном поле геологическая струк- тура, изображенная в виде изогипс глубины залегания (рис. 7, а), отображается локальными аномалиями, осложненными помехами в виде других локальных аномалий (рис. 7, б). В связи с этим ко- эффициент корреляции между глубинами, по которым построена геологическая структура, и аномалией Ag, вычисленной по дан- ным трех эталонных профилей, равен лишь 0,018. На основе корреляционного метода разделения аномалий ре- шение базировалось на априорных данных о глубине залегания геологической границы по эталонным профилям. Эффективность решения задачи по описанной методике В. И. Шрайбмана и М. С. Жданова иллюстрируется табл. 9. Выделение корреляционным методом фоновой составляющей пер- вого порядка приводит к увеличению по модулю коэффициента корреляции остаточной составляющей с глубиной залегания гео- логической границы до —0,88. 60
Таблица 9 Порядок прогнозных остаточных составляющих Коэффициент корреляции Погрешность приближения глубины е, м Среднеквадрати- ческое отклонение составляющих Ag, мГал Дйпр и Н *ост п и 11 Ag"p и Н 0 0,018 143 2,2 1 —0,88 0,46 68 1,3 2 —0,90 0,36 63 0,9 3 —0,97 0,50 33 1,3 4 —0,99 —0,63 22 1,9 Прогнозная остаточная составляющая второго порядка выде- ляется на базе двух критериев: минимума дисперсии остаточной составляющей и минимума модуля коэффициента корреляции фона и геологической границы. Эта составляющая характеризуется ко- эффициентом корреляции с границей г = 0,9 при погрешности « = 0,63 м. На карте прогнозной остаточной составляющей Ag (рис. 7, в) хорошо отображаются особенности изучаемой геологи- ческой структуры. Рассмотренный пример указывает на возмож- ность замены дорогостоящих сейсморазведочных работ на грави- разведку и проведения сейсмических исследований лишь с целью получения эталонных данных. Корреляционные методы приобре- тают особое значение в районах Восточной Сибири, где значитель- ные территории покрыты трапповыми покровами и выполнение •сейсморазведочных работ затруднено. В этих условиях сейсмораз- ведкой отрабатывают участки с отсутствием траппов, которые яв- ляются эталонными для построения трансформационных много- членов. Затем, используя полученные корреляционные зависимо- сти, по данным гравиразведки определяют геологические характе- ристики (в частности, глубины залегания исследуемых горизон- тов) на площадях с развитием траппов. При другой методике корреляционных преобразований в гра- вимагниторазведке, реализованной в автоматизированной системе комплексной интерпретации АСКИНТ (В. С. Славкин, П. А. Бес- прозванный и др.), по эталонным участкам с известной глубиной залегания исследуемого горизонта (например, фундамента) опре- деляется информативность остаточной составляющей (или струк- турной составляющей) гравитационного поля: AgCTp = Ag—Agj, = = ah, где h = H—H; Н — глубина до поверхности фундамента; Н — ее среднее значение в скользящем окне, размеры которого зависят от масштаба исследований; Agj,— региональная состав- ляющая (от фундамента); а — статистический показатель грави- активности, измеряемый в мГал/км, На эталонных участках определяются значения a, AgcTV, Agj>. Затем поле Ag$ интерполируется в межэталонную область путем 61
его аппроксимации полиномом. Прогнозная глубина исследуемого горизонта (поверхности фундамента) находится из выражения ЯПР = (Ag-Ag3P)/a + Н. § 10. КУСОЧНО-ПОЛИНОМИАЛЬНАЯ АППРОКСИМАЦИЯ СЕЙСМИЧЕСКОЙ ИНФОРМАЦИИ В тех случаях, когда исходная информация характеризуется об- ластями существенно различной степени гладкости, при сглажи- вании экспериментальных данных полиномами не получают удов- летворительных результатов. С целью повышения эффективности сглаживания такого материала разработаны алгоритмы поинтер- вальной аппроксимации с автоматической стыковкой (В. Н. Троян, Б. А. Окунев), используемые при сглаживании значений эффек- тивных скоростей, времени t0 вдоль профилей, глубин сейсмиче- ских горизонтов. Рассмотрим алгоритм аппроксимации одномерной кривой, пред- ложенный В. Н. Трояном [17]. На основании априорных представлений (или на эталонных участках) о степени гладкости исходных данных выбирают эле- ментарный интервал обработки (окно сглаживания), содержащий k точек. Величина такого интервала (размер окна) обычно равна половине минимального периода геофизической аномалии, обус- ловленной искомым объектом. В пределах этого интервала проводят сглаживание полиномом до четвертой степени, т. е. модель экспе- риментальных данных в окне имеет вид Y = XA + n, где А = (а0, alt а2, а3> а«) — вектор коэффициентов полинома; X — структурная матрица, п — случайная компонента (помехи, погрешности измерений) с ну- левым средним и дисперсией ст®. Дисперсия оценок коэффициентов полинома D(A) = a®(X'X)-1, дисперсия аппроксимации а®=(1/(*—5))(Y—ХА)' (Y—ХА). Начиная со второго интервала, содержащего k точек, коэффи- циенты ai определяются по исходным данным уже этого интервала, но с учетом коэффициентов, найденных на первом интервале. Так как точность аппроксимации будет максимальной в центре интер- вала, переход со старого интервала на новый следует осуществлять с перекрытием, обычно составляющим половину интервала, т. е. 62
k/2 точек. При этом линейные связи между найденными оценками Ал_ т предыдущего интервала и искомыми коэффициентами Ал но- вого интервала можно представить в виде системы уравнений CA = W, где матрица С определяет характер связей: 1 xi х] х? xi с_ 0 1 2х/ Зх? 4х? 0 0 2 6х/ 12х? _ 0 0 0 6 24xz _ Тогда Сто, л-1 + Ях, n-iXi + а?, л-хЛ/ + о®. n-iX3[ + а4, n-iX/ W ®i, п~1 “I- л—1Х/ 4- 3dg_ n—iXi 4* 4а$, л—хх; 2<Хг, л-x + баз, л-i-^i 4* 12а4, Л_1Х? _ баз, л—14- 24а4, л_iXz _ Число линейных связей должно быть всегда меньше числа ко- эффициентов. Индекс I определяется формулой I = (и—1) (k—г), где г — число точек перекрытия. Число строк в матрице С равно числу линейных связей. Если матрица С состоит лишь из первой строки, стыковку интервалов аппроксимации проводят только по значению функции (число ус- ловий стыковки NB — 1). Если матрица включает первые две строки, стыковку выполняют по функции и первой производной (NB — 2), когда три строки — по функции первой и второй произ- водных (NB — 3) и т. д. Компоненты вектора W представляют со- бой значения функции аппроксимации, ее первой, второй и третьей производных, вычисленные по коэффициентам Ал_х интервала п—1 в точке с координатами X/. Далее вычисляются оценки А коэффи- циентов аппроксимации n-го участка, ковариационная матрица оценок D (А) и дисперсия аппроксимации ст2. . Для равноточных наблюдений с учетом формулы (2.16) при по- лучении оценок параметров любого участка с номером п, начиная со второго, осуществляют расчеты: An = (X'X)-1X/Y„; a;=a'+w;q-a’s-, D(A) = ct2R, где Q = [C(X'X)-1C']-1C; S = C'Q; R = (X'X)-1—(X'X)-1 С' [С (X'X)-1 С']-1 C (X'X)-1. В качестве примера описанного алгоритма кусочно-линейной аппроксимации рассмотрим использование этого алгоритма для 63
Рис. 8. Графики кусочно-полино- миального сглаживания эффектив- ной скорости вдоль профиля в зави- симости от размера окна. 1 — исходные данные; 2 — сглаженные значения [17] сглаживания значений эффективной скорости вдоль профиля. На рис. 8 исходные значения аЭф соединены отрезками прямых. Ин- тервал (окно) ^-аппроксимации составляет 10, 20 и 30 точек, ин- тервал перекрытия 50 %, т. е. г = fe/2. При сравнении кривых сглаживания с разными интервалами видно, что алгоритм обладает хорошими фильтрующими свой- ствами (см. гл. VI) по отно- шению к высокочастотной по- мехе и к тем аномалиям, период которых меньше интервала ап- проксимации. Как показывает опыт, опти- мальными в смысле результатов и затрат машинного времени при окне аппроксимации k — = 10-5-30 точек являются сте- пень полинома NP = 3, число условий стыковки NB = 2. Описанный алгоритм можно с успехом использовать для сглаживания данных любой физической природы, в частно- сти он применялся для сгла- живания глубин сейсмического горизонта, при определении статических поправок. Прове- дение подобного сглаживания играет роль регуляризующего фактора. Для кусочно-полиномиаль- ного сглаживания двумерных массивов данных с автоматической стыковкой элементарных обла- стей осуществляют сглаживание в пределах окна с длинами сторон в k точках (по оси X) и по V профилям (по оси Y). —► Вектор коэффициентов А при аппроксимации такой области двумерным полиномом третьей степени имеет десять компонент: Подробное описание алгоритма двумерной аппроксимации дано в [17]. § 11. ПОЛИНОМИАЛЬНЫЕ ИНТЕРПОЛЯЦИЯ И СГЛАЖИВАНИЕ Задача приближения функции ft заданной дискретно с некоторой Погрешностью, помимо методов аппроксимации, рассмотренных выше на основе корреляционно-регрессионного анализа, решается также путем интерполяции. 64
Метод интерполяции заключается в том, что зна- чения коэффициентов а0, .ап находят из равенств, являю- щихся условиями интерполяции, ф(%ь A) = f(x/), i = 0, 1, . . . , п, где точки xlt принадлежащие некоторому интервалу, образуют сеть узлов, называемых узлами интерполирования. Если в качестве <р используем полином <р (х) = а0 + агх + . . . + алх", получаем полиномиальную (или алгебраическую) интерполяцию. Это наиболее часто встречающийся на практике вид интерполяции Интерполяционные полиномы Лагранжа и Ньютона Пусть сеть Х[ не обязательно упорядочена, но узлы интерполяции различны, Х{ Ф Xj при i Ф j, тогда полином л Рис. 9. Пример локализации гравитационного поля с помощью параболиче- ской интерполяции методом Лагранжа (по Е. А. Мудрецовой). 1 — суммарное гравитационное поле Ag (х); 2 — региональный фон АЯф полученный интерполяцией; 3 — локальная аномалия Д2ЛОК; 4 — остаточная аномалия Авост: 5 — узлы интерполяции К[, 6 — интерполяционные точки удовлетворяет условиям интерполяции Ln (xt) = f (х() = ft. Его называют интерполяционным полиномом Лаг- ранжа при неравноотстоящих узлах х{. Если шаг съемки рав- номерный, т. е. х—xQ = kh, п Lnr(x) = L„(xo+^) = (-l)n • -(fe~n) У (-1/-^-. n! 4_j к—I 1=0 3 А. А. Никитин 65
Пример интерполяции полиномом Лагранжа гравитационного поля рассмотрен на рис. 9.. Полином Лагранжа приближает не случайную величину, а гладкую функцию f (х) с погрешностью | f (x)—Ln (х) | < I (х—х0) (х—xi) . . . (х—хп) I, (П + 1)1 где Мп+1 = шах | /(”+1) (х) |. Интерполяционный полином Лагранжа можно представить в форме Ln(x) = f(x0) + (x—x0)f(x0, xi) + (x—х0)(х—xi)f(xo, *i> х2) + + . . . + (х—х0)(х—х1). . . (х—хл_1)/(х0, хъ .... хп), (2.54) которая более удобна для вычислений при последовательном до- бавлении одного или нескольких узлов. Выражение (2.54) назы- вают интерполяционным полиномом Ньютона. В формуле (2.54) выражения вида /(Хь Х;)=[/ (X/)— f (хг)]/(Х/ — Х{) определяют разделенные разности первого порядка, выражения вида f(xt, х/, xk) = [f(xt, Xk)—f(Xh Xj^Xit—Xi) определяют разделенные разности второго порядка, и т. д. Соот- ветственно разности k-ro порядка f (xlt х2, . . . , xk+1) находят через разности (k—1)-го порядка: /(*1, х2......хк+1) = [f (х2......**+1) — —/4*1. *2......**)]/(**+! —*1)- Интерполяционные полиномы (2.53) и (2.54) используют при решении задачи прогноза значений некоторого параметра (или поля) в области, где либо измерение параметра невозможно из-за наличия мешающих природных факторов, либо эти факторы носят иной характер, чем тот, который наблюдался бы при отсутствии в этой области аномального эффекта, например, от нефтегазовой залежи. В практике обработки в последнее время широкое развитие с целью интерполяции получили сплайн-функции. Сплайн-интерполирование Этот способ приближения сочетает хорошие аппроксимационные качества на всем интервале обработки (х0, хл) с локальным харак- тером сплайна. Простейший линейный сплайн — кусочно-линейная функция фх (х), «натянутая» на точки (х(, ft), как на «частокол». Здесь и далее полагают сеть узлов х< строго возрастающей, т. е. *o<*i< • • хп, что обычно имеет место на практике. €6
полагая фз' (х£) = Mt, по- Оценка погрешности при неравномерной сети xt IФ1 (*)—f(х)|< М#, для равномерной IФ1W—f (х) К MJPIS, где М2 = шахЦ" (|)|; |<(х0, хп)-, h — шаг по профилю, при неравномерной сети h — величина максимального расстояния ме- жду точками наблюдения. Можно построить и параболические (квадратичные) сплайны ф2 (х), однако их мало используют, а выражения для них громоздки. Кубические сплайны <р 8 (х) представляют собой на каждом шаге (х£, х£+1) кубический полином. Они удовлетворяют условиям интерполяции ф3 (хг) = ft, а также дополнительному условию гладкости: требуется, чтобы производные <рз (х) и фз' (х) были непрерывны на всем интервале обработки (х0, хл). Поскольку Фз (х) — кусочно-линейная функция, лучим Фз (х) = — (X—Xl) + Mt, Xi+l — Xi Интегрируя это выражение 2 раза стоянные интегрирования из условий интерполирования, получим представление сплайна ф3 (х) на интервале х£, х£+1 в виде Фз (х) = Мt (xi+1~x)-- + М(+1. Х{)3--)- 7 6(х1+1-х{) t+1 6(Xi+1 —Х£) । Г___ М i (Xj-l-1 Xj)* *1 / Xj-j-i X \ L 6 J\ Xi+l—Xi / , n Mi+Hxe+1 — Xi)2 1/ x —Xi +l/<«-----------5-------J - Значения Mt определяются из условий непрерывности, которые приводят к системе уравнений Xi-Xi-1 М , Xi+j- Xj-1 6 от Xi до х и определяя по- (2.55) 3 =_l£±l—fl-----fi—fbl_, i=l, 2..........n— 1. Xi+l — Xi Xt — Xt-! Эту систему представим в виде Дх(_1ф" (xi—i) + 2 (Axi-i + Дхг) ф" (xt) + Дх£ф" (Xi+1) = = 6(ДА/Дх(—Afi-i/Axi.O, 1 = 2, .... п— 1, (2.56) где Дх( = х{+1—х(; ДА = ft+i—ft; ф" (х() = М£. Система (2.56) состоит из (п—2) линейных уравнений и служит для определения неизвестных значений вторых производных ф" (хг), по которым совместно с заданными значениями ft находят коэффициенты кубического полинома (2.55). Перед расчетом сле- дует задать значения ф” (х) в точках хх и хп, которые для куби- 3* 67
ческих сплайн-функций обычно полагают равными нулю: <р" (х2) = = <р" (хл) = 0. Формулу (2.56) можно представить в матричной форме: A<p" = Y, (2.57) где 2 (Д х,-|-Д х2) Дх2 0 0 • . . Дх2 2 ( Ах2-|-Ах3) Дх3 0 . . . О Длгз 2 (Дхз+Дх,) Дх, . . . О О О 0 0 0 0 . . . Дх„_2 2 (Д«„_2+Дхя_1) J ф"=[ф"(^), ф"(*з). • • • - ф"(*п-1)]; Y = [6f-^-----£M-W'(xi), 6f^------- L \ Дх2 Д*1 / \ Д*з Д*2 / — Дх2ф" (х2), \ Д*п-1 ^-2-)_Дхп_1Ф"(х„)]. Матрица А является трехдиагональной, симметричной и имеет положительные диагональные элементы. Следовательно, ее можно считать положительно определенной. Ввиду этого обеспечивается существование и единственность решения системы (2.57), которое можно получить обычным методом исключения Гаусса. До сих пор рассматривалось применение кубических сплайн- функций для интерполяции. Однако они используются и для сгла- живания экспериментальных данных. Пусть вновь на оси абсцисс в точках Xi<x2< . . . <хл заданы значения функции наблюдений fu f2, . . . , fn. Краевые условия задаются в точках хг и хп значениями первой либо второй произ- водной искомой функции ф (х) : ф' (хх) и ф' (хл) или ф" (хх) и ф" (хл). Для расчета сглаживающей функции ф (х) примем условие пропорциональности разности ft—ф (хг) скачку третьей производ- ной в точках 1 = 2,..., п—1: gilfi — ф(хг)] = аг,' gi>0; i = l, . . . , п, где — — ах = Li (хх); а{ = L,' (х,)—Ц-\ (xt); an = —Ln-i (x„); Lc (*z) — полиномы, определяемые формулой кубического сплайна, Lt (х) = ai (x—Xi)3 + bt (x—xif + (x—x{) + d{, t = l, 2.......n— 1; (2.58) a.i — коэффициенты пропорциональности, которые должны быть положительными; gi — весовые множители. 68
Искомыми параметрами являются коэффициенты alt bt, Ct, dt, число которых равно 4 (п—1). Сплайн-функции на границах ин- тервала xt, х<+1 удовлетворяют условиям: qj(xi) = Li(xi)=dt; Ф (xl+1) = Lt (х,+1) = аДх^ + b{kx2 + cihxi +df; Ф (xi)= i(xi) = ci\ (% 59) ф (Xi+i) = Li (xi+1) = 3ai^x2i + 2bi^Xi + c{-t ф" (xi) = L"i(xi)=2bi-, Ф (xf+]) — L\ (*t+i) = + %bi- Значения искомых коэффициентов находят, используя условия (2.59) для функции и второй производной, а также учитывая, что Ф М = fi- После несложных преобразований, имеем: а‘= to" <**+»)— f" Ml; 6Дх/ bt— — ф"(х/); 2 т ih (2.60) * = —V-1*”" (*+i) + Ф" Ml; Дх/ 6 di = fi', &fi = fi+i—ft- Используя условия (2.59) и уравнения (2.60), получим систему из (п—2) уравнений с (п—2) неизвестными ф" (xt) (для i = 2, 3, . . . , п—1) и с п неизвестными ф (xi) (i = 1, . . . , п) в виде - -у— 1ф" (*i)—ф" (*2)1 = gi [fi—Ф (*i)L —— 1ф" (xi-i)~ф" (х,)]-----г- 1ф" (х<)-ф" (^+1)1 = Axi-i Axj (2.61) = gilfi—Ф (x,)L » = 2, .... n— 1, —! [ф" (xn_i)—ф" (x„)] = gn [fn — ф (xn)] • Axn_i Помимо этого имеем еще (n—2) уравнения относительно тех же неизвестных, которые получаются из условий (2.56) путем замены fi на ф (xi). Полагая краевые условия для второй производной в виде ф'7 (*i) = ф" (хп) = 0, запишем системы уравнений (2.56) и (2.61) в матричной форме: — В'ф"+ 6ф= Gf; AxJ"4-bJ = 0 (2.62) 69
где ~gi 0 ... О О g2 ... О _ О О ... gn _ —— Г-^+-Ч —Ь о Д«1 \ ДХ1 Дх2 / Дх2 о ----1— (-!-+-!-')-— Дх2 \ Дх2 Дх3 J Дх3 О О О О ООО ООО ф" = [ф"(х8). ф"(*э).......Ф" (*»-!)]; Ф = [ф(Х1), ф(х2)........ф (хл)]; f = fz< • • • » /nJ- Матрица Ах получается из матрицы А системы (2.57) путем умножения всех ее элементов на 1/6. Так как матрица А является положительно определенной, а для положительных весовых множи- телей gi и диагональная матрица G положительно определенная, система (2.62) имеет решение для всех значений gi, удовлетворяю- щих неравенству 0<gt<co. Рассмотрим влияние значений gt на результаты сглаживания. Для этого умножим первую систему уравнений (2.62) на матрицу G-1 : — С-1В'ф'' + /ф = If, где I — единичная матрица. При gi—>оо первый член полученного матричного уравнения будет стремиться к нулю и ф (х<) -» ft. В этом случае вторая си- стема (2.62) переходит в систему (2.57) и получается, задача интер- поляции кубическими сплайн-функциями. При gt -> 0 значения ф (х<) удаляются от наблюденных вели- чин fi и аппроксимация сплайн-функциями соответствует аппрок- симации прямой линией регрессии по методу наименьших квадра- тов. Выбирая значения весовых множителей gi между этими пре- делами, можно добиться требуемой степени сглаживания экспери- ментальных данных. 70
Теперь вернемся к решению системы (2.62). Из первой системы легко определяется вектор <р, поскольку G — диагональная мат- рица и она легко обращается: <р = G-1 (В'ф" + Gf). Подставляя это выражение во вторую о- систему (2.62), получим v^iw/c оценку для вектора вто- рой производной S’2 (2.63) Первая матрица в пра- вой части (2.63) является пятидиагональной и по- W ложительно определенной; для ее обращения можно 3>в использовать метод Га- усса. 3>г Сглаживание с помо- g щью кубических сплай- h_h нов было реализовано ’ ьитен В.Н. Трояном в программе щ «Аппроксимация кубиче- скими сплайнами» и 9,9 использовано для сгла- живания эффективной 9,0 скорости вдоль профиля. На рис. 10 приведены ис- SJ5 ходные и сглаженные дан- ные при разных значениях весовых множителей gi, которые принимаются для в всех точек одинаковыми: gi = g. Анализ рис. 10 по- казывает, как с уменыпе- нием весового множителя ' g = 10-14-10~5 проис- ходит переход от сглажи- *’ вания высокочастотных Jg составляющих к сглажива- нию низкочастотной со- ставляющей. Описанный алгоритм hj# указанная программа мо- ’ Рис. 10. Графики сглаживания эффектив- ной скорости вдоль профиля с помощью кубических сплайн-функций при различ- ных значениях коэффициентов g: а 10”*, ь — 10-’;. в — Ю-5; 1 — исходные даннае; 1 — сглаженные значения [17] гут быть использованы для сглаживания пластовых скоростей вдоль горизонта и времен с целью определе- ния статических поправок, 71
а также и для сглаживания полей в различных геофизических мето- дах. Степень сглаживания регулируется весовыми множителями, которые выбираются либо путем визуального анализа результатов на экране дисплея (при интерактивной системе обработки), либо по характеристике сглаживания, рассчитанной В. Н. Трояном [17]. Следует подчеркнуть, что в отличие от рассмотренного в § 10 алгоритма кусочно-полиномиальной аппроксимации, в котором априорная информация задается размером окна и степенью поли- нома, весовые множители gt при сплайн- интерполяции не имеют конкретного физического смысла. В то же время они выполняют роль регуляризующего фактора и можно считать, что обратная величина g{ пропорциональна погрешности (дисперсии) отклоне- ния наблюденных значений от сглаживающей кривой. В целом сплайн-интерполяция не всегда дает удовлетворитель- ные результаты, особенно при обработке двумерных массивов дан- ных. Тригонометрическое или кусочно-полиномиальное интерполи- рование обеспечивают более устойчивые результаты. §|12. ИНТЕРПОЛЯЦИЯ СИСТЕМОЙ ГАРМОНИЧЕСКИХ ФУНКЦИЙ Практическое применение при интерполяции потенциальных гео- физических полей и полей различных геологических параметров в условиях неоднородности сети наблюдений, особенно при нали- чии пересеченного рельефа местности, наличия существенных оши- бок наблюдений, получила система гармонических функций, пред- ложенная В. И. Ароновым [1]. Интерполяция значений f (xtyt) исходного поля по площади съемки основана на аппроксимации системой гармонических функций ф(х, «/) = LaA(x—хь у—Hi, Zj), (2.64) где G( = —!------------г-1----------; (2.65) 2л [(x-x^ + ^-^W2 at — коэффициенты, определяемые таким образом, чтобы выпол- нялось неравенство max | f (xh (x{, yi) | < e0; {x,, yt}£P\ (2.66) P — множество пунктов наблюдений в исследуемой области; е0 — величина, выбираемая равной среднеквадратическому значению помехи; z± — параметр, принимаемый большим шага наблюдений Ax (z^Ax). При z^ —> со ф —ф, где ф — целая функция, т. е. этот метод интерполяции является асимптотически оптимальным. Значения at определяются из решения системы уравнений AX=F, (2.67) 72
где X — вектор-столбец значений а{; F— матрица исходного поля / (xi, yi)', А = [atil — матрица, элементы которой ao=Zi/[(x;—Х/)2 + (у{—г//)2 + z2]3/2. i, j = l, . . . , п; п — число исходных значений f (xi, у с). Система линейных уравнений (2.67) решается методом итера- ций. При значительной неравномерности сети наблюдений (шаг наблюдений меняется в несколько раз) скорость итерационного процесса падает при гг > Дхтах. Последнее условие необходимо для получения высокой точности приближения. В связи с этим более целесообразным становится использование аппроксимации ф(*, y) = miairGir(.x—xl, y—yi, zr), r=l, 2, . . . (2.68) r i При каждом фиксированном значении г ведется сортировка исходных значений поля f (х<, yi) таким образом, чтобы минималь- ное расстояние между ними было не менее zr/2. Максимальное зна- чение zr выбирается равным размеру максимального «белого» пятна (пропуска в наблюдениях) в исходных данных. При аппроксимации системой (2.68) последовательно выде- ляются компоненты интерполируемого признака <р, соответствую- щие различным значениям шага наблюдений Ах, в результате чего интерполяция становится возможной практически при любой неоднородности исходной сети и восстанавливает одновременно локальные и региональные составляющие поля. Как указывалось, величина е0 в (2.66) выбирается равной среднеквадратическому значению помехи и является, по существу, всей той априорной информацией, которая необходима при исполь- зовании этого алгоритма интерполяции. Описанный метод интерполяции может быть использован и для нахождения тренда. С этой целью нужно соответствующим обра- зом изменить параметр z функции Gir при вычислении <р (х, у) по уже полученным значениям а(г. Например, если требуется понизить уровень влияния локальной составляющей с интерва- лом корреляции гл. значения ztr должны быть увеличены на число г0 = гл. Значения тренда <р (х, у, г0) вычисляются по выражению, аналогичному (2.68): ф(х, У, го)~ ZZa<rGo-(x—xlt у—УС, zr + zn). г I Подобный прием интерполяции рассмотрен И. Д. Савинским.
ГЛАВА III ДИСПЕРСИОННЫЙ И ФАКТОРНЫЙ АНАЛИЗЫ ГЕОФИЗИЧЕСКИХ ДАННЫХ Основой дисперсионного и факторного анализов являются изуче- ние и сравнение дисперсий наблюденных данных и их линейных комбинаций, при этом измеренные значения геофизических полей полагаются случайными величинами. § 13. ОСНОВЫ ДИСПЕРСИОННОГО АНАЛИЗА Задача дисперсионного анализа — оценка влияния того или иного фактора Y или комбинации таких факторов на распределение из- меряемых величин Хъ . . . , Хр, проявляющееся в изменении ма- тематического ожидания при неизменной дисперсии. Одно из основных требований, которому должны удовлетворять результаты геофизических измерений, состоит в том, чтобы они не содержали систематических ошибок. Факторами, вызывающими систематические ошибки, являются погрешности аппаратуры, ме- тодики измерений, оператора, а также неучтенные изменения фи- зических условий наблюдения. Рассмотренные в § 4 критерии относились к проверке гипотезы о равенстве средних двух случайных величин (выборок). В то же время, когда решается задача, например, о систематической ошибке гравиметра как фактора, влияющего на показания силы тяжести, измерение на двух приборах (гравиметрах) может оказаться не- достаточным. Для получения обоснованного вывода следует провести изме- рения при нескольких состояниях фактора, т. е. на нескольких приборах, и убедиться в отсутствии или наличии систематической ошибки в полученных результатах. Совершенно аналогично мы мо- жем рассматривать аномалию того или иного геофизического поля как фактор, для надежного установления которого необходимо вы- полнить измерения поля на нескольких профилях, т. е. при раз- личных состояниях фактора. При комплексной интерпретации гео- физических полей различными состояниями фактора (комплексного параметра) будут данные измерений различных геофизических по- лей. В общем случае дисперсионный анализ применяют для того, чтобы установить, оказывает ли существенное влияние некоторый фактор Y, имеющий ряд состояний Ylt . . . , Yp, на изучаемую величину. Попарное сравнение средних значений при этом исклю- чается, поскольку с возрастанием числа средних увеличивается и наибольшее различие между ними: среднее новой выборки может 74
оказаться больше наибольшего или меньше наименьшего из сред- них, полученных до нового эксперимента. Идея дисперсионного анализа состоит в сравнении фактор- ной -дисперсии, обусловленной воздействием фактора, и остаточной дисперсии, вызванной случайными при- чинами. Если различие между этими дисперсиями значимо, фактор Y оказывает существенное влияние на систему величин Xlt ... , Хп. В этом случае средние при каждом состоянии фактора (груп- повые средние) также будут иметь значимое различие. Однофакторный дисперсионный анализ Пусть на нормально распределенную случайную величину X (гео- физическое поле) воздействует фактор Y (систематическая ошибка прибора, аномалия и т. д.), имеющий р состояний (р — число при- боров, профилей и т. д.), т. е. имеем: *и. *12. • • • . *ш при состоянии Vi (xi); *Р1, *Р2. . . . , *рЛ при состоянии Ур(*р). Измеренные значения поля можнб представить в виде табл. 10. Таблица 10 Номер измерения Состояние фактора У1 У2 ур 1 *11 *12 Х1Р 2 *21 *22 *ар п *л1 *Л2 *лр Групповая средняя *1 *2 . . . ХР Групповая дисперсия с? ‘1 • • • °р Еще раз подчеркнем, что в качестве состояний фактора Yit ... , Yp можно рассматривать измерения поля разными приборами, на разных профилях или измерения р полей на одном и том же профиле. Пользуясь этими- статистическими данными, необходимо про- верить нулевую гипотезу, согласно которой групповые средние рас- пределений равны между собой. Если проверяемая гипотеза верна, при сопоставлении средних значений по каждому состоянию фак- тора не должно быть значимого расхождения между ними, если 75
такое расхождение обнаружено, нулевую гипотезу следует отбро- сить. Обозначим: хг — среднее значение из п измерений, выполненных по первому состоянию фактора (т. е. первым гравиметром или по первому профилю и т. д.); х2 — среднее из измерений по второму состоянию фактора и т. д,, так что - 1 " 1 п х1 =-----2 х{1; . . хр =-----2 х(р; п 1 = 1 П i=l о?, ... , Пр —дисперсия по состояниям фактора. Обозначим через х общее среднее всех измерений, т. е. х=----£ Ё хч< или х= — Ё xi- ptl j=l 1 = 1 р 1=1 Тогда величина Р л s=E£(x(/-%)2 (3.1) /=1 i=i является общей суммой квадратов отклонений измеряемых сначений от общей средней х, а р _ _ S4) = nSi(x/—х)2 (3.2) называется факторной суммой квадратов отклонений групповых средних (средних по состояниям фактора) от общей средней. Величина Зф характеризует разброс между различными состояниями фактора Y. Наконец, величина Зост = S (хп—xi)2 + • • • + S (xip—xpf (3.3) i=i i=i называется остаточной суммой квадратов отклонений наблюденных значений внутри групп (или состояний фактора), она характеризует остаточное рассеяние случайных погрешностей результатов измерений. Очевидно, что Зост = 3 — Зф. (3-4) Для расчетов S и Зф часто бывают более удобными формулы р п / р п \2 -----IZEd; /=1 1=1 рп \j=i 1=1 . Р / л \2 , / р л \2 Зф=—-Г(Ё—(ЁЁ*о)« п j=i \;=1 J рп \/=i i=i / Для сумм (3.1) — (3.3) получаем соответствующие выражения общей, факторной и остаточной дисперсий: D — S/(pn— 1); Рф = 5ф/(р —1); Don = S0CT/p (п— 1). (3.5) 76
Чтобы проверить нулевую гипотезу о равенстве средних для различных состояний фактора, достаточно применить критерий Фишера, сравнивая факторную и остаточную дисперсию, т. е. Г = Рф/Р0СТ = S*/(p ~ — (3.6) Sqct/P (П — О Если F<zFv, где Fy —у-квантиль распределения Фишера с (р—1) и р (п—1) степенями свободы (числителя и знаменателя), гипотеза о равенстве средних выполняется, т. е. х± = . . . = хр. При этом отсутствует систематическая ошибка, вызванная влия- нием гравиметра как фактора, если Yи . , Yp— различные приборы, или можно говорить об отсутствии аномалии при на- блюдениях по р профилям съемки и т. д. Если имеет место влияние фактора на измеряемую ве- личину. С помощью корреляционного отношения ц = Пф/ст можно количественно оценить это влияние. Чем ближе отношение л к еди- нице, тем сильнее влияние фактора. В том случае, когда число измерений при различных состоя- ниях фактора разное и равно nt, для определения дисперсий а2 (по состояниям фактора), факторной и остаточной дисперсий вы- числения проводят по формулам: где D* = —!— £ п, (х/—х)2, (3.8) !р -1 /=» где . р п1 . р _ ;=—S2/"=— Ро<Я = у ] S 1^ (*</-------(3.9) р где N = П]— общее число измерений. Пример. На исследуемом объекте предполагается функциональное из- менение намагниченности насыщения, проявляющееся на фоне случайных ошибок измерений. Для проверки этой гипотезы отобрано по 12 образцов с 10 различных участков, равномерно расположенных по площади. Для каждого образца измерена намагничеииость насыщения Js и результаты прологарифмированы, т. е. хц = 1g J${/ с учетом близости распределения данных измерений к логарифмическому закону распределения. По каждому 77
из участков, являющихся состояниями фактора, вычислены средние xj и дисперсии а2 (табл. 11). .у Требуется проверить гипотезу об отсутствии функционального измене- ния J$ на уровне значимости 0,05. Решение. По формулам (3.8) и (3.9) имеем: 1 10 - 110_ Дф =——Е 12 (х/— х)2 « 6,06; х = —У Xi« 2,37; 9 1=1 10 М 10 а2 Рост = У 11 —= —— • 3,05 = 0,305. >1 110 10 Таблица 11 Номер участка Х1 Номер участка Х1 1 2,51 0,25 6 3,55 0,60 2 3,09 0,37 7 3,01 0,49 3 2,68 0,40 8 2,19 0,20 4 1,16 0,23 9 2,08 0,12 5 2,00 0,21 10 1.41 0,18 По таблице значений распределения Фишера [2] находим критическую границу критерия Фишера F0,»5 (9, ПО) = 1,96. Поскольку Юф/Эост = 19,9 >1,96, гипотеза о наличии функциональ- ного изменения намагниченности насыщения принимается с вероятностью 0,95. Решающее правило дисперсионного анализа применяется при условии равенства дисперсий при всех состояниях фактора. Когда число измерений по всем состояниям одинаково, т. е. п} — п, ис- пользуется критерий Кочрена: р G = Отах/Е О^гпах = ГПЭХ О/» .' (3.10) /=1 Гипотеза о равенстве дисперсий принимается с вероятностью у, если G меньше критической границы Gv (р, п—1), определяемой из таблицы значений распределения Фишера [2]. При неравных числах измерений при каждом состоянии фак- тора применяют критерий Бартлетта. Двухфакторный дисперсионный анализ В случае одновременного действия двух факторов, наприйер, когда измерения проводятся различными приборами несколькими на- блюдателями, требуется оценить, обусловлен ли разброс получен- ных значений и средних его значений в группах различием между приборами или различием между наблюдателями.' Аналогичная задача возникает при оценке влияния двух разных геологических факторов на показания того или иного геофизического поля. 78
Основная идея дисперсионного анализа в данном случае заклю- чается в разложении суммы квадратов отклонений от общего сред- него на компоненты, отвечающие предполагаемым факторам из- менчивости. Допустим, имеются два фактора (признака) А и В, по которым можно расклассифицировать данные наблюдения. Пусть по фак- тору А все наблюдения делятся на г групп (состояний) А г, Аг, а по фактору В — на о групп (состояний). Таким образом, все на- блюдения разбиваются на rv групп. Для простоты положим, что в каждой группе имеется лишь одно наблюдение, т. е. общее число наблюдений Af = rv. Обозначим хц наблюдение, попавшее в группу Ai по фактору Лив группу В} по фактору В. Соответствующие средние значения будут: X/ — у Xi/', Xj — - 2^ Xjj, 1 ° г Результаты наблюдений для факторов А и В можно представить в виде табл. 12. Таблица 12 Состояние фактора А1 Состояния фактора В] В1 вг BV . Аг *11 *12 *10 *1 Аг *21 *22 *20 *2- * мнж Аг *Г1 Кг 2 *Г0 Хг- xi *1 х.г х.о где Х(.—средние по строкам; x.j— средние по столбцам. Для вычисления сумм квадратов 5фЛ, ЗфВ и 50Ст при двух- факторном анализе используются формулы: 79
Величины 5ф А и ЗфВ являются суммами квадратов разностей между строками и между столбцами. Для проверки степени значимости расхождений, обнаруженных в средних по строкам и столбцам, вычисляются критерии $Ф а/(г — О $ост/(г — 1) (о — 1) 5фВ/(о-1) $ост/(г-1) (и — 1) — Д^ост, (3.11) (3.12) При ГдС^утабл принимается гипотеза об отсутствии расхож- дений в средних значениях по строкам, при FB<Z/\>табл — гипо- теза об отсутствии расхождений в средних значениях по столбцам. Если гипотеза о равенстве средних по строкам и столбцам не- верна, величина eft = (г—1) (£>фЛ — DOcr)/rv и eft = (и— 1) (£>ф в— —D0CT)/rv являются мерами систематического изменения (тренда) средних значений соответственно по строкам и столбцам. Двухфакторный дисперсионный анализ рангов Рассмотренные выше задачи дисперсионного анализа решались в предположении о нормальном характере случайных отклонений. Если закон распределения случайных отклонений неизвестен, для сравнения нескольких, в общем случае зависимых выборок измеренных значений (например, для сравнения данных по нескольким профилям съемки) относительно их средних значений можно использовать ранговый метод, известный как двухфакто- рный дисперсионный анализ рангов, или критерий Фрид- мана. Предполагается, что имеется п выборочных групп (п измерений по каждому профилю) при р вариантах условий (р — число про- филей или методов). При этом критерий Фридмана фактически применяется в рамках модели однофакторного дисперсионного ана- лиза,. в котором второй фактор В представляет собой однородные группы или повторные измерения, связанные с одним и тем же со- бытием, например наличием аномального эффекта (первый фак- тор А). С помощью критерия Фридмана проверяется нулевая гипотеза о том, что различные условия, т. е. наблюдения по разным профи- лям или разными методами не оказывают влияния на распределе- ние измеренных значений, иными словами, ранги п измерений распределены случайным образом по р условиям. 80
Если в предположении справедливости нулевой гипотезы сфор- мировать суммы рангов для каждого из р условий, они либо не бу- дут отличаться друг от друга, либо их отличия будут носить слу- чайный характер. Если отдельные условия вызывают систематиче- ское изменение (в частности, аномальный эффект), р столбцов бу- дут иметь различные ранговые суммы. Проверка нулевой гипотезы состоит из упорядочения (ранжирования) измеренных значений в каждой строке, суммирования полученных рангов по каждому из столбцов и вычисления статистики Фридмана р / « \2 Хя =----73-JT- Щ ~3«(p+1), (3.13) где п — число строк (число наблюдений по каждому профилю); р — число столбцов (число профилей); ЯКц — сумма рангов для Р j __ Ч. i-го условия; S(W— указывает на необходимость суммирова- ния рангов по каждому условию, возведения в квадрат полученных сумм и последующего суммирования этих квадратов по всем р условиям. Статистика (3.13) при не слишком малых выборках (р = 4, п>4, р = 3, п>9) распределена как %2 с (р—1) степенями сво- боды, и решение принимается на основании %2-критерия. Критерий Фридмана, по существу, аналогичен F-критерию Фишера на однородность выборок. Пример. Допустим, что иа участке из трех профилей съемки по трем пикетам каждого профиля имеются измерения поля Za (в нТл) (табл. 13). Таблица 13 ПР пк 1 2 3 I 78 92 84 11 63 71 69 III 52 57 65 Таблица 14 пк ПР 1 2 3 I 1 3 2 II 1 3 2 III 1 2 3 = = 3 = 8 = 7 Требуется установить наличие или отсутствие аномального эффекта в этих наблюдениях (предполагается, что предварительно проведено исклю- чение региональной составляющей). Решение. В соответствии с формулой (3.13) прораижируем по порядку значения AZ на каждом профиле в направлении от наименьших к наиболь- шим, т. е. наименьшее значение получает ранг 1, следующее по величине — ранг 2 и т. д. Проранжированные данные приведены в табл. 14. Далее суммируем ранги в каждом столбце и полученные суммы возво- дим в квадрат, т. е. 2/?^ = 3, (ХТ?^)2 = 9; 2/?;а = 8, (2/?;а)2 = 64; 2/?Zs = 7, (2/?,3)2 = 49. 81
Подставим полученные значения в (3.13): %2 = 12 (9 + 64 + 49)/(3-3- • 4) _ 3.3.4 = и. Поскольку найденная величина превышает критическое, равное 9,24, принимается решение о наличии аномального эффекта в данной выборке. Использование статистики Фридмана при обработке геофизи- ческих данных началось в самые последние годы, однако на ее ос- нове уже построены эффективные алгоритмы выделения слабых аномалий на фоне произвольно распределенных помех (см. § 43). § 14. ДИСПЕРСИОННЫЙ АНАЛИЗ ПРИ ИЗУЧЕНИИ ТРЕНДА Дисперсионный анализ — основа решения многих важных задач обработки геофизических данных: анализа распределения характе- ристик физических свойств пород в различных направлениях на поверхности земли и по глубине; сопоставления различных физи- ческих параметров по «контрастности» их как признаков тех или , иных особенностей, например по степени изменчивости, обуслов- ленной некоторой аномалией, с помощью корреляционного отно- шения и т. д. Широкое применение дисперсионный анализ нашел при изучении регрессионной зависимости и тренда (регрессионной поверхности). При этом с помощью дисперсионного анализа ре- шаются задачи: 1) согласования регрессионной зависимости (или тренда) и исходных данных; 2) эффективности увеличения степени полинома в уравнении регрессии; 3) оценки значимости постоянных коэффициентов в уравнении регрессии. Согласованность регрессионной зависимости (или поверхности тренда) с исходными данными оценивается путем разделения об- щей изменчивости величины на регрессию (или тренд), принимае- мую за искомый'фактор, и остаток (отклонение от регрессии, тренда). При этом регрессию для модели однофакторного дисперсного ана- лиза можно представить в виде табл. 10, в которой состояниям фак- тора соответствуют значения Y при фиксированных X, т. е. со- стояниями фактора будут xlt . . . , хр, а исходными данными Ун.......Утр • • • > Ур1....УрПр, В частных случаях П1 = . . . = = Пр = П, = п2 = . . . = пр — 1. Число степеней свободы, соответствующее общей изменчивости в регрессионной зависимости (в тренде), равно v = N—1, где N — р = 2 п,-—число наблюдений. Число степеней свободы, соответст- /=> вующее уравнению регрессии vper, равно числу членов полинома т, используемого для построения регрессии (тренда). Число степеней свободы для отклонений от регрессии vOtk = N—щ—1. Тогда об- щую схему дисперсионного анализа для проверки согласованности уравнения регрессии (тренда) с исходными данными по критерию Фишера можно представить в виде табл. 15. Если регрессия (тренд) играет существенную роль, дисперсия отклонения от регрессионной зависимости будет мала по сравнению 82
Таблица 15 Фактор (источник дисперсии) Тип дисперсии Число степеней свободы Регрессия Отклонение от регрес- сии Общая изменчивость (общая дисперсия) Oper = — Ehl-У/)2 т /=1 1 р " о0гк=—---------Е Е (уи-ш)2 N — т — 1 /=1 (=1 D ™ „ 1 . Е Е (уц — у)2 N — 1 /=1 i=l Р/—значения поверхности ре- грессии. Критерий Фишера - D^/D^ < F? табл. с дисперсией самого уравнения регрессии. При проверке гипотезы о наличии или отсутствии тренда рассматривается частное от де- ления оценки дисперсии уравнения регрессии на оценку дисперсии отклонений Пррг/Потк исходных данных от регрессии. Сравнение этих дисперсий по критерию Фишера позволяет ответить на вопрос, можно ли рассматривать эти дисперсии как несущественно отли- чающиеся одна от другой, т. е. существенна ли роль регрессии по сравнению с влиянием случайных ошибок измерений. Если разли- чия нет, математическая модель для описания регрессионной за- висимости (тренда) выбрана неверно (или тренд отсутствует). Часто согласованность уравнения регрессии с эксперименталь- ной зависимостью проверяют путем сравнения гипотезы Нг о зна- чимости коэффициентов, т. е. аг, ... , ат^ 0, с гипотезой Но, когда ах = . . . = ат — 0 (регрессии нет). Если значение F-кри- терия превысит допустимое, соответствующее заданному уровню значимости и числу степеней свободы, гипотеза HQ отвергается. Эффективность увеличения степени в уравнении регрессии оце- нивается в том случае, когда при использовании полиномов в тренд- анализе последовательно увеличивают их степень. Это приводит к постепенному увеличению числа слагаемых. Тогда дисперсион- ный анализ применяют для изучения вклада добавляемых компо- нентов регрессии в общую изменчивость. Критерий эффективности увеличения порядка регрессии строится как разность между дисперсиями регрессий последующего и пред- шествующего порядков. Частное от деления полученной дисперсии на дисперсию регрессионной зависимости (тренда) последующего порядка имеет F-распределение, если дальнейшее увеличение сте- 83
Таблица 16 Фактор (источник дисперсии) Тип дисперсии Число степеней свободы Критерий Фишера Уравнение регрес- сии степени k + 1 т /=1 m £>(*—!> per Отклонение от урав- нения регрессии сте- пени k + 1 n(*+D 1 v °™ - N-m-\ Х ₽ П) N—m—\ ^OTK < Fy табл Уравнение регрессии степени k S /=1 s p(A) per ^OTK < Fy Табл Отклонение от урав- нения регрессии сте- пени k х £ хм* 7 Xml? Г । 1 1 <е> X N—s—\ Увеличение степени уравнения регрессии от k до k + 1 р(М-1)_р№) = р per per ^раэм m—s Рразн < D <F у табЛ Общая изменчивость (общая дисперсия) II 1 - Хм* Хм~= «с" "i «= । №9 N—l пени полинома не дает эффект. Схема оценки эффективности уве- личения степени полинома приведена в табл. 16. Когда требуется оценить эффект, обусловленный лишь одним коэффициентом регрессии в уравнении поверхности тренда, такая оценка проводится путем исключения данного члена полинома с по- следующим повторным вычислением сумм квадратов для регрессии и отклонения. Вклад исключенного члена является разностью двух дисперсий. Значимость этого члена проверяется с помощью отно- шения дисперсии для уравнения с исключенным членом Орег.н к дис- персии для полного уравнения регрессии Dper.n. Для критерия Фи- шера число степеней свободы равно соответственно 1 (для числи- теля) и N—m—1 (для знаменателя). Схема оценки значимости исключенного коэффициента приве- дена в табл. 17. Решение рассмотренных в этом параграфе задач также может быть проведено на основе дисперсионного анализа рангов. 84
Таблица 17 Фактор Тип дисперсии Число степеней свободы Критерий Фишера Регрессия всех чле- нов 1 Р Орег. п — ({// — 1//)2 т /=1 tn Орег п < Dotk табл Отклонение от регрес- сии Dotk — ,, , X Af — m— 1 N—m—\ Регрессия после ис- ключения k-ro члена 1 p Орег.н — , Zfe 1//) m — 17=1 m—1 V ч И S g С й ₽- 8. S О Q V Отклонение с учетом исключения k-ro чле- на ^отк. H X N — m — 2 P П/ N—m—2 Регрессия только k-ro члена Dper k — t)per. n — ^рег. и 1 Ррег. k < D < Fy табл Общая изменчивость (общая дисперсия) W — 1 /=1 (=1 M— 1 § 15. ФАКТОРНЫЙ АНАЛИЗ Задачей факторного анализа является изучение внутренней струк- туры ковариационной (или корреляционной) матрицы, полученной в результате измерений нескольких случайных величин Х1..... XN. В качестве таких величин, как и при дисперсионном анализе, могут быть использованы данные измерений того или иного геофи- зического поля по различным профилям, данные измерений раз- ными методами по одному и тому же профилю, значения различных параметров (глубина залегания, геометрические размеры и т. д.) искомого геологического объекта, полученные в разных точках наблюдений. Результаты измерений запишем в виде матрицы Хц Хц . . . Хщ Y _ *21 *22 • • • *2л /о *N1 *W2 • • • xNn 85
для которой различные строки могут означать: измерения по N профилям съемки, в каждом из которых содержится п пикетов; измерения по N — разными методами по одному и тому же про- филю с п пикетами и т. д. Различные случайные величины или признаки Х3, ... , XN обычно связаны между собой статистической зависимостью, причем влияние одних признаков может оказаться превалирующим, т. е. остальные признаки не несут какой-либо существенной информа- ции, в частности о геологическом объекте исследования. Например, если значения одного из признаков могут быть вос- становлены по значениям остальных при наличии его сильной кор- реляционной зависимости от последних, прямые измерения такого признака не несут дополнительной информации по сравнению с той, которую дают все остальные признаки. Это обстоятельство можно объяснить поведением некоторой небольшой группы т (т N) независимых, но непосредственно не измеряемых факторов, которые определяют поведение всех исходных N признаков. Поэтому же- лательно полученную при измерениях информацию выразить через эти непосредственно не наблюдаемые факторы. Для перехода к та- ким новым факторам используется внутренняя структура информа- ционной матрицы Х'Х-М, которая при условии нормального рас- пределения и центрирования Х1У . . . , XN выражается как 2X1 2ХхХ2 ... ZXiXN В = Х'Х= ‘ ’ SX*X" . . . 2Хдг Диагональные члены этой матрицы являются дисперсиями слу- чайных величин (признаков) Хх, . . . , XN, а внедиагональные члены — их ковариациями. После нормировки ковариаций на соответствующие произве- дения среднеквадратических отклонений матрица (3.17) преобра- зуется в корреляционную матрицу R: 1 Г12 ... r1N г> _ r21 1 ... r2N (3.18) rNl rN2 • • • 1 В факторном анализе стараются выбрать небольшое число фак- торов, способных объяснить ковариационную (или корреляцион- ную) матрицы. При этом важно найти минимальное число таких новых случайных величин (или факторов) flt . . . , fm, которые превращали бы матрицы (3.17) и (3.18) в диагональные. Другими словами, после учета действия т факторов все связи (корреляции) между величинами Xt должны стать незначимыми, а сами факторы fi, . . . , fm — независимыми. S6
Основная математическая модель факторного анализа записы- вается в виде системы равенств + i = l, . . . , N-, tn<N, (3.19) где fj — j-й простой фактор; величины fj независимы друг от друга и от погрешностей измерений ег, N — заданное число простых (начальных) факторов; ei — случайные величины, описывающие ошибки измерений, статистически независимые друг от друга с ну- левым средним, их дисперсии принимаются одинаковыми и рав- ными о5, если это не так, т. е. Det = of, преобразование Х{ = = aXilat приводит к случаю Det = о2; at/ — коэффициенты пе- рехода от системы случайных величин ft к системе случайных ве- личин Хг, они называются нагрузками i-й случайной величины на /-й фактор (факторные нагрузки). Матричная запись равенств (3.19) X = Af + e. (3.20) При записи модели факторного анализа (3.19) и (3.20) предпо- лагается, что величины Х{ центрированы. Максимально возможное число факторов т при заданном числе случайных величин опреде- ляется неравенством (N —т)г, которое учитывает тре- бование о том, чтобы задача не вырождалась в тривиальную. Факторный анализ базируется на основной теореме, сводящейся к следующему. Пусть исходные величины Xj и Х2 обусловлены одним фактором ft, тогда их ковариацию, а при соответствующей нормировке коэффициент корреляции, можно записать в виде ri2 = ^ijChi’ В общем случае, когда N случайных величин выражаются че- рез т факторов, коэффициент корреляции т г12 = ЙЦЙ21 + #12^22 + • • • +fllma2m = aVa2/- Следовательно, коэффициент корреляции любых двух незави- симых величин Xi и Xj можно выразить суммой произведений ко- эффициентов (нагрузок) некоррелированных между собой факто- ров. Построив матрицу F размерностью N х т из строк, элемен- тами которых являются коэффициенты ац, например t-я строка имеет вид ац, а12, .... а1т, получим основную теорему фактор- ного анализа в виде R = FFZ (3.21) Таким образом, задача факторного анализа сводится к линей- ному преобразованию W-мерного пространства в /n-мерное путем представления корреляционной матрицы факторами. Эта задача не решается однозначно. Представление корреляционной матрицы R факторами, или факторизацию матрицы R, можно 87
произвести разными способами. Например, если удалось осущест- вить факторизацию с помощью некоторой матрицы F, любое ее линейное ортогональное преобразование (или ортогональ- но,е вращение) приведет к такой же факторизации. Цель процедуры вращения факторов — представление каждой исходной случайной величины Xi одним или небольшим числом факторов. Нагрузки остальных факторов при этом близки к нулю. Может оказаться, что первая факторизация будет неблагоприятной, т. е. трудно поддающейся физической или геологической интерпрета- ции. Тогда следует начать вращать факторы, т. е. подбирать но- вые матрицы F, причем это следует делать до тех пор, пока не по- лучим результаты, легко поддающиеся либо физическому, либо геологическому истолкованию. Следовательно, в факторном анализе переход к новым случай- ным величинам выполняют, ориентируясь на поведение взаимных корреляций (или ковариаций) Х{. В аналитических методах обработки и интерпретации к анало- гичным задачам приводит анализ положительно определенных сим- метричных матриц, которой, в частности, является и корреляцион- ная (ковариационная) матрица. При этом для изучения простых структур факторных нагрузок (структура факторных нагрузок считается простой, когда большинство из не намного отличаются от нуля и лишь некоторые из них имеют относительные большие значения) минимизируется так называемая целевая функ- ция, зависящая от ац, и для ортогонального вращения исполь- зуется выражение т т г N / W \ / N \ "1 °-’.?, £<£“»)] где параметр у меняется от 0 до 1. При у = 1 метод вращения носит название варимакс и яв- ляется наиболее распространенным. В этом случае минимизация G эквивалентна максимизации , т N 4 Е Е (4-4)2, N /=1 i=i где 1 N а/ = — Е 4/1 / = 1, • • • , т, N f=i т. е. варимакс максимизирует разброс квадратов нагрузок для каж- дого фактора, что приводит к увеличению больших и уменьшению малых значений факторных нагрузок. При у = 0 вращение, получаемое в результате минимизации функции G, называется квартимакс. Минимизация G в этом случае эквивалентна максимизации , т N у “i (-=1 88
где , т N ?-J-EE4,. Wm /=1 i=i т. е. квартимакс максимизирует дисперсию квадратов факторных нагрузок, иначе, выбираются факторные нагрузки с достаточно большим диапазоном их значений. Использование факторного анализа при обработке геофизиче- ских данных связывается с разложением наблюденного поля на аномальные составляющие, обусловленные основными источни- ками, создающими суммарное поле. Эти аномальные составляющие и являются искомыми факторами. Обработка данных комплекса геофизических (геохимических) признаков с помощью факторного анализа позволяет осуществлять классификацию полей признаков по комплексным параметрам, каждый из которых выступает в ка- честве фактора. Существенную роль в факторном анализе играет физическое или геологическое истолкование выделяемых факторов. К сожа- лению, далеко не всегда удается дать интерпретацию факторам. Поэтому факторный анализ чаще всего применяется в модификации метода главных компонент (или компонентного анализа), в кото- ром первые главные компоненты имеют более прозрачный физи- ческий смысл. § 16. МЕТОД ГЛАВНЫХ КОМПОНЕНТ К новым случайным величинам для той же модели (3.19) можно перейти, ориентируясь преимущественно на поведение дисперсий. Главная компонента определяется как линейная комбинация ис- ходных случайных величин Y/ = ^a(iXl- / = 1..........N, (3.22} при этом первая главная компонента Ух= £ааХ, = а1Х (3.23} i=i обладает максимальной дисперсией среди всех возможных линей- ных комбинаций вида (3.23). Дисперсии линейных комбинаций Yt располагаются в убы- вающем порядке, т. е. стг(У1) > ст2 (Yг) > . . ; > ст2 (УN), при. следующей нормировке коэффициентов N причем л -*,-» У а2ц = а 1а, (3.24} где I — единичная матрица. 89-
Пусть В — ковариационная матрица X (3.17), Л1Х — матема- тическое ожидание X, тогда дисперсия Yt‘. DY! = М (Уу—MY,)« = Л4 (У у—МУ у)' (У у—МУ,) = . =m(Jx— а'/Мх) (aiX—ajMx) = 0^. (3.25) С учетом нормировки коэффициентов atj (3.24) для (3.25) полу- чаем отношение двух квадратичных форм в виде Ху = ауВ ау/ау lay. (3.26) Для получения—максимума (3.26), т. е. максимума дисперсии У у, необходимо продифференцировать (3.26) по а) и производную при- равнять к нулю, т. е. —(a/Bay—Xyajlay) =0. да После дифференцирования получаем Вау—Ху lay = 0, или (В—Ху1)ау = 0. (3.27) Из (3.27) следует, что Ху является собственным значением ко- вариационной матрицы исходных данных В, а вектор а{ (а{1, . .г. , °In) — собственным вектором этой же матрицы для Ху. При соответствующей нормировке исходных величин X на их среднеквадратические значения вместо ковариационной матрицы В в (3.27) можно записать корреляционную матрицу R, т. е. (R—XyI)ay = O. (3.28) Дисперсия главной компоненты DY у = ayRay = ayXyay = XyayOy = Х^. (3.29) Практически нахождение собственных значений и собственных векторов корреляционной (или ковариационной) матрицы сводится к следующему: 1) вычислению коэффициентов корреляции для случайных величин Х{ и Ху и составлению из них корреляционной матрицы 1 ... I"1N ~ R __ Г21 1 • • • r2N - rNl r№ • • • 1 - 2) составлению матрицы R—XI и приравниванию ее определи- теля |R—XI | к нулю, т. е. 1—X г12 ... rlN id__it I— Г2) 1 • • • Ггы rN1 rN2 90 1 - X
3) раскрытию определителя | R—II | и нахождению его корней, или, иначе, собственных значений Хх, . . . , kN матрицы R. Напри- мер, для %i и Х2 имеем: 1 — X Г12 1 — X = 0; (1—Х)^—Г?2 = 0; 1—X = zb Г12^ Х1=1-]-Г12» Хг=1—Г12- Очевидно, что для матрицы R размерности N получим N собст- венных ее значений; 4) нахождению собственных векторов af матрицы R путем ре- шения системы линейных уравнений вида - 1—Ху Г21 г12 1 —Ху . rlN r2N 01/ ' Й2/ = - 0 - 0 ; (3.30) rNl Cv2 . 1 —Ху _ - aNj - . 6 J (1—\)а1/-|-г:12а2/+ • • - = Г21Я1/ + (1—Ху)а2/ + • • • = rN lall + r + • • • +(1—X/)aJvy = 0, N при этом В результате решения системы (3.30) для каждого Ху получаем набор (систему) собственных векторов: аг = (а1Х, а1В, .... a1N); —> а2 = («21> «22> • • • , a2jv)> Un ~ (flWl> aN2< ' • • > 0Nn)- Система собственных векторов является ортогональной, а из ортогональности следует некоррелированность векторов, отсюда справедливость выражения (3.29). Таким образом, корреляцион- ная матрица оказывается расщепленной на N ортогональных ком- понент. Некоррелированные, нормированные с учетом (3.24) линейные комбинации (3.22) Yf = и называются главными компонентами. Линейная комбинация (3.23) для собст- венного вектора, соответствующего максимальному собственному значению Х^, называется первой главной компо- нентой. Соответственно для следующего по величине собствен- ного значения X линейная комбинация (3.22) дает вторую главную компоненту и т. д. Метод построения и изучения комбинаций вида (3.22) получил название компонентного анализа или метода главных компонент. Собственные значения X, являются дисперсиями соответствующих им главных компонент (3.22). Геометрически нахождение главных компонент приводит к пе- реходу к новой ортогональной системе координат; первая коорди- 91
натная ось находится таким образом, чтобы соответствующая ей линейная комбинация случайных величин (3.22) обладала бы наи- большей дисперсией, т. е. эта комбинация извлекала бы возможно большую дисперсию из наблюденных данных. Далее находится ортогональная этой линейной комбинации ось, которая делает то же самое с оставшейся дисперсией и т. д. Иначе, в JV-мерном про- странстве величин . . . , XN ось наибольшей протяженности W-мерного эллипсоида рассеяния X определяется направляющими косинусами, равными компонентам вектора аг (при Проекция вектора наблюдений X на это направление ах имеет наи- большую дисперсию по сравнению с проекциями на другие направ- ления. Каждый собственный вектор а, определяет ось эллипсоида рассеяния. От новых координат, учитывая ортогональность преобразова- ния, можно вернуться к старым: N х, = Z ацУ1, (3.31) /=1 где Yj — j-я главная компонента, а ац — вес /-й компоненты в t-й случайной величине. Соотношение (3.31) является основным в методе главных ком- понент и отличается от (3.19) тем, что число факторов здесь т = N. Оно не содержит остаточных составляющих, так как все N глав- ных компонент исчерпывают всю дисперсию исходных данных. В методе главных компонент нет необходимости делать какие- либо предположения о величинах X, даже не обязательно считать их случайными (это могут быть и аналитические функции), хотя чаще всего их рассматривают как выборку из генеральной нормаль- ной совокупности (о нормальном характере распределений Xt здесь следует говорить лишь потому, что элементами корреляционной матрицы служат вторые центральные моменты, которыми задается многомерное распределение). Однако главные компоненты не инва- риантны относительно изменения масштаба тех шкал, по которым отсчитываются разные величины Xt. Анализ методом главных компонент целесообразно использо- вать тогда, когда все величины Xt измерены в одних и тех же еди- ницах и для нахождения главных компонент берется ковариацион- ная матрица. Заметим, что используемый обычно прием представ- ления данных в нормализованной форме (X;—xi)l<3t не имеет стро- гого обоснования при произвольном уравнивании величин, несу- щих разную информацию, как это обычно допускается в методе главных компонент. Физическая интерпретация собственных значений и главных компонент не всегда оказывается возможной и существенным об- разом зависит от специфики решаемой задачи. Хотя факторный анализ чаще всего использует главные компоненты, вычисление собственных значений и собственных векторов при этом разли- 92
чается тем, что собственный вектор приводится к такому виду, при котором его длина равняется величине" собственного значения. Полученный вектор и называется фактором, а его вес пропорцио- нален вкладу в общую дисперсию. Как в факторном, так и в компонентном анализе важное зна- чение имеет оценка числа основных факторов. Собственные значе- ния характеризуют относительный вклад каждого собственного вектора в суммарную дисперсию. Длины векторов, представляющих факторы, равны квадратным корням из собственных значений, поэтому факторы оценивают также соответствующие дисперсии, точнее, среднеквадратические отклонения. Для оценки основных факторов располагают собственные значения X/ матрицы R в по- рядке их убывания, а затем отбрасывают те из них, которые мало отличаются от нуля. Чаще всего оставляют несколько первых зна- чений %/, которые в сумме составляют 70—90 % от общей диспер- N сии К/. Количество оставшихся собственных значений и дает оценку числа основных независимых между собой факторов. На практике оказывается полезным сохранять столько факторов, сколько имеется собственных чисел, больших или равных единице, т. е. вновь со- храняются все те факторы, которые дают наибольший вклад в дис- персию. Однако, если исходные величины Xi слабо коррелированы или не коррелированы,. половина или более факторов может иметь собственные значения, большие единицы. В результате получается не только очень большое число факторов, но и вероятность того, что ни один из них не допускает никакой физической интерпрета- ции. § 17. ОБЛАСТИ ПРИМЕНЕНИЯ ФАКТОРНОГО И КОМПОНЕНТНОГО АНАЛИЗОВ Как факторный, так и компонентный анализы базируются на изу- чении внутренней структуры ковариационной матрицы исходных данных. Это изучение включает: 1) нахождение собственных зна- чений и собственных векторов матрицы; 2) вычисление линейных комбинаций исходных величин с собственными векторами вида (3.22); 3) оценку числа основных, независимых векторов т\ 4) фи- зическое или геологическое истолкование факторов и главных компонент. В настоящее время факторный и компонентный анализы наи- большее применение получили при решении следующих задач. Разделение поля на ортогональные составляющие Пусть система случайных величин Xt, ... , Хы представляет дву- мерный массив измеренных значений того или иного наблюденного поля по N профилям в виде (3.16). По этим данным вычисляются 93
ковариации для различных пар профилей, т. е. btj = —— Ё хмх{1, Я /г=1 i, / = 1, . . . , N, где п — число пикетов по профилю; N — число профилей; Xki = xki—Xi; Xi =---xftl- — измеренное значе- Л Л=1 ние поля на /г-м пикете i-ro профиля. По полученным ковариациям составляется ковариационная матрица Ьц ^12 &21 ^22 - bNi bNi blN biN • bxN - для которой находятся максимальное собственное значение Amax из уравнения |В—%maxI| = 0 и соответствующий этому значению собственный вектор матрицы В из системы линейных уравнений (В—%maxI) аг = 0, т. е,- (Ьц—Атах) йц + Ьцйц + . • . -\-bxfjaifj =0; ^21^11 + (&22— Ащах) 012• • • +^2^1№=0 ^Ма11 + ^№#12 + • • • — Атах) = О- Вектор определяется с учетом нормировки = 1. Физи- ческий смысл этой нормировки состоит в том, чтобы преобразован- ные данные не отличались по масштабу от исходных (т. е. чтобы не происходило усиления исходных данных). Затем вычисляется значение первой главной компоненты Yx = aJX, или Хц *12 Yife = (0u, Он, • • • » а™) х23. Хц - XN1 XNi Xln Хгп Хцп- Физический смысл величин: Уц (k — 1, . . . , п) — определяют весовые коэффициенты для значений поля по каждому пикету исходной съемки: ах< (i = 1, . . . , N) — определяют весовые ко- эффициенты для значений поля каждого профиля. При этом оценка составляющей наблюденного поля, характеризующаяся наиболь- шей дисперсией (такой составляющей обычно является фоновая, или региональная, составляющая), равна произведению вектора- столбца Уц на вектор-строку ац с добавлением к каждому эле- 94
менту образующейся матрицы среднего значения поля по про- филю xi, т. е. • • » alN) 4“ xi — Кцйц + Xi Yпаи + х2 . . . Y12ЙЦ + xi Y12012 + х2 . . . YllalN ~^xn Y lifllN + XN - У1п0ц + Х1 УщОи + Хг . . . Ущ01М-|-хм Рис. 11. Результаты оценки региональной составляющей поля A# путем выделения первой главной компоненты (по А. Н. Кленчину). а — исходное поле Ag; бив — соответственно региональная (первая главная компо- нента) и локальная составляющие; пунктир—контур месторождения Поскольку х?й чаще всего является оценкой региональной со- ставляющей, разность х°" = xlk—x^k оценивает поле локальных аномалий. Эффективность описанной процедуры обработки с по- мощью метода главных компонент иллюстрируется рис. 11. Как было отмечено, к недостаткам компонентного анализа от- носится неинвариантность его решения к изменению масштаба исходных данных, именно поэтому при оценке региональной со- ставляющей целесообразно использовать ковариационную мат- рицу, а не корреляционную матрицу исходных данных. При рас- чете корреляционной матрицы R можно получить искаженный масштаб искомого поля. Применение метода главных компонент для выделения регио- нальной составляющей при обработке наблюденных геофизических полей свидетельствует о ее надежной оценке этой составляющей в случае существенного преобладания ее энергии (дисперсии) над 95
энергией (дисперсией) локальных аномалий. Как показали спе- циальные исследования, форма локальных аномалий практически не искажается. Существенное преобладание энергии региональ- ной (фоновой) составляющей прежде всего сказывается на Лтах, величина которого должна составлять не менее 70—90 % суммы собственных значений £Х,-. Таким образом, первая главная компонента при обработке гео- физического поля получает четкое физическое истолкование как региональная (или фоновая) его составляющая. Аналогичную обработку можно было бы провести для второго по величине собственного значения Х2 ковариационной матрицы наблюденного поля, и новая полученная составляющая, являясь ортогональной к региональной, давала бы поле локальных анома- лий, обладающих наибольшей дисперсией по сравнению с остав- шимися невыявленными локальными аномалиями. Однако физиче- ское истолкование второй, третьей и т. д. главных компонент при этом было бы затруднено тем обстоятельством, что при выделении локальных аномалий существенное значение имеет не только их дисперсия, но и форма. В целом метод главных компонент — эффективный способ оценки региональной составляющей при минимуме априорной ин- формации. Для ее выделения достаточно лишь выполнения пред- положения о существенном преобладании дисперсии этой состав- ляющей над дисперсией локальных аномалий. Интерполяция наблюденных полей Одна из основных задач интерполяции, решаемых на базе компо- нентного анализа,— сведение информации всех методов исследо- ваний в данном районе в узлы регулярной (прямоугольной или квадратной) сети. Двумерная интерполяция по регулярной сети может быть про- ведена путем разложения исходного поля f (xt, у,) на составляющие, зависящие лишь от одной координаты Xk (xi) и (у<). Для ди- скретных наблюдений по прямоугольной сети (n х JV, где п — число точек по профилю, AZ—число профилей) задача формулируется следующим образом: требуется найти такие функции Xk (х) и Yk (у), k = 1......п, которые удовлетворяли бы минимуму выражения N п П2 Е Е р(*. Уд~Y>^k(Xi)yk(ni)\ =>min. /=1 £=1 L k J Эта задача сводится к решению системы уравнений N XtaisXi = ^xs, s=l,2, . . .,N, по определению собственных значений и собственных векторов симметричной матрицы А = (а^}. 96
Пусть f = — среднее значение поля. Элементы мат- рицы А вычисляют по формуле ач=а,ч = — £ fjs/; fls = fts—f; fsi = fSl—f. nN S=1 /= 1, 2, . . . , N, i = l, . . . , n. Если в качестве ортонормированной системы выбрать векторы, то коэффициентами искомого разложения будут векторы Хк (х<), которые связаны с векторами Yk (у}) соотношением к К Таким образом, заданная функция f (xi, y.j) в каждой точке ока- жется представленной суммой k Если требуется получить аналитическое выражение функции, интерполирующий заданную таблицу значений ,поля, тогда в полу- ченном разложении f (xi, yj) каждый вектор следует рассматривать как значения функции одного аргумента (X и У) в заданных точ- ках. При наличии подходящих методов одномерной интерполяции можно в аналитическом виде получить функции Xk (х), Yk (у) и искомую функцию F (х, у) = Т +%Xk(x)Yk(y). Следовательно, описанный прием позволяет свести задачу ин- терполяции функции двух переменных к интерполяции функций, зависящих от одного аргумента. Решение задачи двумерной интерполяции по нерегулярной сети М. Н. Смирновой сведено к решению задачи, описанной выше. При этом для сети с произвольным расположением точек наблюде- ний строится вспомогательная прямоугольная сеть, шаг по осям которой выбирается так, чтобы в каждый Z-й прямоугольник по- пало хотя бы одно наблюденное значение поля. К центру каждого прямоугольника относят среднее значение заданной функции, вы- численное по значениям, попаЬшим в i-й прямоугольник. На ос- новании решения для интерполяции в случае регулярной сети строится поверхность, наилучшим образом интерполирующая ука- занные средние значения заданного поля. Обозначим ее Fc (х, у), т. е. Fc{x, y) = FcY£XCk(x)YCk(y). В разложении обычно ограничиваются одним, двумя слагае- мыми, соответствующими наибольшим собственным числам. Допу- стим, в соответствии с требуемой точностью надо оставить k слагае- 4 А. А. Никитин 97
мых. Введем неопределенные постоянные коэффициенты Ск, С2.. Ck и искомую функцию запишем в виде F(x, y) = Fc + LClXCl(x)YCl(y). Коэффициенты Ci определим из условия минимума выражения N г _ ft I2 Л = Z f (xt, yi)—Fc— £ CiXC[ (xt) YCl (yi) , i=l L /=1 где f (xi, yi) — заданное значение поля в i-й точке. Дифференцируя А по Сг, получим систему линейных уравне- ний относительно Сг: Z [f(xt, yi)-EC/XCz(xi)yCz(yI)]xCr(x()VzCe(^)=O, r= 1, . . . , k или k g Ci %XCl (Xi) xce (Xi) YCl (yi) YC[(yi) = Zf (xtyi) XCr (xt) YCr (y{); f(xt, yi)=f(x{, yi)—Fc. Если величина k мала, можно повысить точность интерполяции, рассматривая коэффициенты Ct как функции координат х и у, например Ci — сцх + tyy +d[. Постоянные а/, bi, di вновь определяем из условия минимума Ах = Е U (хь yi)—Z( ЯМ + btyt +di)Xi (xz) Yz (xz)]2. Дифференцируя Дх no ar, br, dr,\ получим систему линейных уравнений относительно этих коэффициентов. В качестве примера рассмотрим табл. 18 значений некоторого поля. Таблица 18 X У 1 2 3 4 Б 6 1 4 8 14 22* 32 44 2 15 20 27* 36 47* 60 3 40 46 54 64* 76 90 4 85* 92 101* 112 125 140* 5 156 164 174 186 200 216 Значения, отмеченные «»»были отброшены, а остальные 23 зна- чения образовали неравномерную сеть, по которой была построена вспомогательная правильная сеть (табл. 19). 98
Таблица 19 X У 1.5 2.5 3.5 4,5 5,5 1,5 13 14 25 34 45 2,5 30 40 45 56 75 3,5 59 64 83 104 97 4,5 137 143 157 156 180 Вначале по этим данным, расположенным по равномерной сети, находится функция, интерполирующая вспомогательную табл. 19: 5 Fi (х, у) = FC{+^ Xk (х) Yk (у); — 1 В полученном разложении достаточно оставить два слагаемых, отвечающих наибольшим собственным значениям: Х2(х) = 12,047х® +80,281х2 +225,07х—-312,79; Х2 (х) = 1,008х3+ 5,842х2—5,026х+ 25,97; Л (у) = 0,003у + 0,435; У2 (у) = —0,061z/3 + 0,19z/2 + 0,363z/—0,403; FCi = 77,85. Будем считать функцию (х, у) некоторым приближением исходного поля. Введем коэффициенты Сх и С2: F. (х, у) = FCl + СхХх (х) Ух (у) + СвХ8 (х) У2 (у); определим их из условия минимума А 23 А= Z yi)—F2(Xi, у{)]2. 1=1 Решая полученную систему, находим Cj = 0,782; С2 = 1,41. Для уменьшения среднеквадратической ошибки интерполяции возьмем в качестве коэффициентов линейные функции от коорди- нат хну: Fs(x, y) = 77,85 + (aix+biy + c1) X1(x)Y1(y) + + {flzX + tty)+c2) X2 (x) Y 2 (y). Решая соответствующую систему линейных уравнений, найдем значения коэффициентов: ах = 0,0203; Ьх = 0,0582; сх = 0,664; а2 = 0,291; Ь2 — 0,0674; с2 = 2,204. 4* 99
Среднеквадратическая ошибка интерполяции в первом случае oj = 37,6/23, во втором — Ог = 25/23. Ошибку интерполяции можно уменьшить, если воспользоваться методом итераций. При этом за начальное приближение неизвест- ных значений функции в узлах таблицы принимается среднее, вы- численное по всем известным значениям функции в остальных узлах. На каждом шаге итерации описанным методом разложения определяется интерполирующая функция. Значения этой функции вычисляются только в тех узлах таблицы, в которых они были заданы. В остальных точках используются исходные значения поля. На каждом шаге итерации в дискретном представлении функции оставлялись только два основных слагаемых. В результате послед- него, шестого приближения о! = 0,63. Полученная интерполя- ционная функция приведена в табл. 20. Таблица 20 У X 1 2 3 4 5 6 1 3,72 7,95 14,6 23 32,8 43,4 2 15 20,1 27,7 37,4 46,8 60,7 3 40,1 45,8 54,1 64,5 76,4 89,3 4' 85 91,6 100,6 111,6 124,2 138 5 155,8 163,9 174,1 186,3 200,2 215,6 Фильтрация наблюденных полей Эта фильтрация с использованием метода главных компонентов бу дет рассмотрена в § 35. Забегая вперед, отметим, что в задачах линейной фильтрации можно использовать не ковариационную, а корреляционную матрицу, поскольку при линейной фильтрации весовые коэффициенты фильтра последовательно перемещаются со смещением на один пикет по исходным значениям поля и для принятой их нормировки масштаб профильтрованного, т. е. полу- ченного в результате обработки, сигнала не изменяется по срав- нению с масштабом исходных данных (входным сигналом). Классификация геологических объектов по комплексу геофизических признаков Эта классификация на базе метода главных компонент будет рас- смотрена в § 47. При решении задачи классификации производится обработка данных комплекса признаков. Поскольку размерности признаков обычно совершенно разные, необходима предваритель- ная их нормировка на среднеквадратические значения и перевод признаков в безразмерные величины. Следовательно, в дальнейшем используется корреляционная матрица признаков, порядок ко- торой определяется числом признаков. 100
Первая главная компонента при обработке данных комплекса является комплексным параметром, которому можно дать физиче- ское истолкование как составляющей в пространстве N признаков, обладающей в нем наибольшей энергией (или дисперсией). Планирование физического эксперимента В настоящее время внимание исследователей обращено главным образом на совершенствование методов обработки при заданном способе проведения эксперимента. Выбор же условий самого экс- перимента, т. е. как, где, когда проводить измерения, определяется в значительной степени интуицией и опытом исследователей. Про- блема извлечения максимума полезной информации об изучае- мых геологических объектах и явлениях при минимальных затра- тах времени и средств остается одной из важнейших задач разве- дочной геофизики. Следовательно, необходимо использовать не только способы рациональной обработки данных, но и способы оптимального пла- нирования физического эксперимента для получения максимума информации при минимуме затрат времени и средств. Эксперимент, который проводится при соблюдении требования оптимизации, называется экстремальным (или оптимальным). Пла- нировать можно экстремальные и регрессионные эксперименты. Экстремальные эксперименты встречаются в тех случаях, когда исследователя интересуют условия, при которых изучаемый процесс (явление) удовлетворяет тому или иному кри- терию оптимальности наблюдений. Такие эксперименты характерны для задач по выбору числа и условий проведения опытов, необхо- димых для достижения заданной точности или надежности, как, например, это было сделано при оценку числа измерений плотно- сти горных пород в § 5. Расчет необходимого числа независимых наблюдений по методу максимума правдоподобия с целью обнару- жения сигнала с заданной надежностью (см. § 38) является еще одним примером указанного типа эксперимента. Регрессионные эксперименты проводятся в тех случаях, когда модель искомого объекта или явления можно вы- разить с помощью регрессионной зависимости. Построение мате- матической модели геологического объекта, в частности одного его физического параметра, например пористости нефтегазонос- ного пласта, по данным комплекса геофизических признаков яв- ляется типичным примером регрессионного эксперимента. В этом случае важность применения факторного анализа для оптимизации проведения эксперимента несомненна, хотя планирование экспе- римента сочетает в себе методы регрессионного анализа и решения экстремальных задач на базе линейного,. нелинейного и динамиче- сого программирования. Планирование регрессионных экспериментов начинается с вы- яснения факторов Хх, . . . , XN, определяющих особенности иско- мого объекта или явления. Совокупность этих факторов X = 101
= (Xr......XN) образует пространство размерности N, называе- мое факторным пространством или пространством контролируемых (управляемых) величин. Факторы могут быть ко- личественными и качественными. Так, мы можем контролировать число и виды используемых геолого-геофизических методов иссле- дований. Каждый фактор в эксперименте может принимать одно или несколько значений, называемых уровнями. Перед планированием эксперимента оцениваются границы областей определения факто- ров и выбираются интервалы их изменения. Эксперимент, в котором реализуются все возможные сочетания уровней факторов, называется полным факторным экспериментом. Если число уровней каждого фактора равно двум (например, наличие и отсутствие фактора), а число факторов — N, имеем полный факторный эксперимент типа 2N = п, где п — число опытов. Сам план эксперимента представляет собой матрицу планирования, в которой строки соответствуют различным опытам, а столбцы — различным факторам. Задачей факторного (регрессионного) эксперимента является установление связей между факторами и реакцией (откликом) мо- дели искомого объекта, записываемой в общем виде как yi — —► —► = yi (X, a), j — 1, ..., L, в предположении, что при этой записи У/ зависят также от совокупности ряда неизвестных параметров а (а0, .... aL). Оптимальный эксперимент надо будет ставить таким образом, чтобы при минимальном числе опытов (результа- тов измерений), варьируя значениями Хг, ... , XN по специ- ально сформулированному критерию, построить оптимальную ма- тематическую модель объекта. В зависимости от степени информа- тивности относительно вида функции У] (X, а) эксперименты ста- вятся либо для определения и (или) для уточнения значений пара- метров О(, либо для оценки вида функции у/. Обычно оптимизи- руется лишь одна функция yjt наиболее важная для исследования, поскольку одновременная оптимизация нескольких функций прак- тически невозможна. > Располагая минимальными сведениями относительно Y (X, а), можно принять регрессионную модель ы Y = a0 + aiXi + . . . +ад/Х# = ^а<Х(=а,Х, j=o где а = (а0, . . . , aN). При проведении и наблюдений образуется прямоугольная мат- рица размерности п (N + 1): *10 *ц ... Хщ Y *го Х21 . . . х^н ХпО ХП1 ... %nN 102
Матрица Х'Х = М является информационной матрицей с об- ратной матрицей С = (Х'Х)-1 = М-1, или матрицей ковариаций. В зависимости от того, какие требования предъявляются к мо- дели, приходят к той или иной формулировке требований к мат- рице плана X, т. е. к выбору числа и последовательности заполне- ния строк матрицы X. Формализация этих требований связана с критериями оптималь- ности, которые обычно формулируются в терминах свойств мат- рицы М или матрицы М-1. Именно эти матрицы непосредственно связаны с оценками модели и функционально зависят от матрицы X. Смысл наиболее распространенного критерия D-оптимальности состоит в минимизации дисперсии всех коэффициентов регрессии, рассматриваемых как вектор а0, . . . , aN. Этот критерий гарантирует, что в области планирования не —* —► окажется точек/в которых точность оценки поверхности Y (X, а) будет слишком низкая. Дисперсия вектора коэффициентов, назы- ваемая обобщенной, задается определителем ковариационной мат- рицы С = М-1, и ее минимизация соответствует максимизации определителя информационной матрицы М. Геометрически этот критерий обеспечивает минимум объема эллипсоида рассеяния оце- нок коэффициентов at. При другом важном критерии .Е-оптималь- ности минимизируется максимальное собственное значение мат- рицы М-1. Если эллипсоид рассеяния очень вытянут в одном на- правлении, часть коэффициентов at попадает в неблагоприятные условия и этот критерий позволяет уменьшить такую опасность. После построения модели выясняется, в какой мере каждый фак- тор влияет на критерий оптимальности. Количественной мерой этого влияния является величина коэффициента регрессии, т. е., чем больше коэффициент at, тем сильнее влияние фактора Xt. Вопросам планирования физического эксперимента в разведоч- ной геофизике в настоящее время уделяется сравнительно мало внимания, решена лишь задача оптимизации параметров линейного фильтра в случае задания двух уровней как по нижней, так и по верхней частотам среза частотной характеристики.
ГЛАВА IV КОРРЕЛЯЦИОННЫЕ ХАРАКТЕРИСТИКИ ГЕОФИЗИЧЕСКИХ ПОЛЕЙ В рассмотренных выше методах обработки и анализа геофизических данных в качестве модели измеренных значений использовались понятия случайного события, случайной величины и системы слу- чайных величин. В то же время в практике обработки широкое распространение получили методы, связанные с представлением результатов геофизических измерений в качестве случайных про- цессов. Применение модели случайного процесса для описания геофи- зических данных, полученных по профилям, по трассам сейсмо- граммы в вертикальной плоскости, скважинам и т. д., существенно расширяет круг решаемых при обработке задач. Особую роль при этом играют корреляционные функции случайных процессов, имеющие и большое самостоятельное значение. § 18. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ СЛУЧАЙНЫХ ПРОЦЕССОВ Случайным процессом, или случайной функ- цией F (/) называется непрерывная или дискретно заданная функция, которая в результате эксперимента может принимать тот или иной конкретный, но априори неизвестный вид. Эта функ- ция может изменяться либо по времени t (например, при записи упругих колебаний на сейсмограмме), либо по глубине h (каротаж- ная диаграмма), либо по горизонтали х, т. е. вдоль профиля наблю- дений при наземных, морских и воздушных съемках. Для большей определенности в этом параграфе будем считать, что случайный процесс изменяется по времени. Конкретный вид случайного процесса, устанавливаемый в ре- зультате эксперимента, называется его реализацией. Та- ким образом, случайный процесс описывается семейством реализа- ций, которое в каждый фиксированный момент времени ti превра- щается в обычную случайную величину, называемую сечением случайного процесса. Понятие случайного процесса при этом является обобщением понятия системы случайных вели- чин X (G), X (<2).....X(ti), . . . , X(tn). На рис. 12 показаны случайные процессы двух типов. Если рас- смотреть случайную величину X (ti) как сечение случайного про- цесса в момент ti, то эта случайная величина имеет закон распре- деления, который зависит от ti, и плотность распределения можно обозначить f (хк, ti). Такая плотность распределения не является 104
исчерпывающей характеристикой случайного процесса X (t), по- скольку описывает только закон распределения X (/) для данного, хотя и произвольного значения времени tr, она не может служить оценкой зависимости случайных величин X (t{) при разных t. Бо- лее полной характеристикой является многомерный закон распре- деления с плотностью f (xlt х2, . • • , хт, tlt t2, ... , tn). Однако даже для двух случайных величин не всегда удается найти сов- местную плотность и функцию распределения, поэтому для прак- тических задач обработки ограничиваются рассмотрением и изу- чением простых числовых характеристик случайного процесса: математического ожидания, дисперсии и корреляционной функции. Рис. 12. Случайные процессы: а — некоррелированный, б — коррелированный Под математическим ожиданием (средним зна- чением) случайного процесса понимают неслучайную функцию М [X (t) ], которая при .каждом фиксированном значе- нии времени tt равна математическому ожиданию соответствую- щего сечения случайного процесса тх (t) ~ М [X (01- Под дисперсией случайного процесса по- нимают неслучайную функцию Dx (0> значение которой для фик- сированного 0 равно дисперсии соответствующего сечения про- цесса Dx (0 = D [X (0 ]. Из рис. 12 видно, что для различных пр своей внутренней струк- туре случайных процессов их математические ожидания и диспер- сии (разброс вокруг математического ожидания) практически оди- наковы и, следовательно, для описания основных особенностей случайного процесса этих двух характеристик явно недостаточно. Для случайного процесса, представленного на рис. 12, а, харак- терно незакономерное, скачкообразное для различных значений tt изменение, быстро затухающее по мере увеличения расстояния между ti. Наоборот, для случайного процесса Х2 (f) (рис. 12, б) имеет место плавное закономерное изменение исходных данных между значениями ti. Хотя внутренняя структура обоих процессов различна, это различие не отмечается ни по математическому ожи- Д 105
данию, ни по дисперсии, для его описания требуется введение но- вой характеристики, называемой корреляционной или автокорре- ляционной функцией. Эта функция оценивает степень зависимости между различными сечениями случайного процесса по величине корреляционного момента, являющегося функцией двух аргумен- тов и i2 и уменьшающегося с увеличением расстояния между ними. Таким образом, автокорреляционной (корреля- ционной) функцией называют неслучайную функцию Rx (tit}) двух аргументов ti и tj, которая для каждых двух значений tt и tf равна корреляционному моменту соответствующих сечений слу- чайного процесса: Rx (t{, tt) = М [X (tt) X (tj) ], где X(t{) и X (tj) — центрированные случайные величины, т. е. X (t{) = = X (ti) — MX (ti)-, X(tj) = X (tj) — MX (tj). Для случайных процессов Xr (t) и X2 (t) (см. рис. 12) при близ- ких их математических ожиданиях и дисперсиях получаются со- вершенно различные автокорреляционные функции: для Хх (t) эта функция быстро убывает с увеличением расстояния между tt и tj, а для Х2 (t) — медленно убывает. Основные свойства автокорреляционной функции (АКФ) сле- дующие: 1) (ti, tj) = Rx (tj, t^, т. e. АКФ симметрична отно- сительно своих аргументов, поскольку корреляционный момент двух случайных величин X (tt) и X (tj) не зависит от последова- тельности, в которой эти величины рассматриваются; 2) при = tj Rx (й, fy) = (О, т- е- АКФ при tt = tj обращается в диспер- сию случайного процесса и необходимость в дисперсии как само- стоятельной характеристики процесса отпадает, для его описания достаточно ограничиться математическим ожиданием и АКФ; 3) при сложении неслучайной функции ср (t) и случайного процесса АКФ процесса не меняется; 4) при умножении случайного процесса на неслучайную функцию ср (t) АКФ процесса умножается на про- изведение <p (t{) <p (tj), В частности, когда <р (t) = С — постоянная величина, АКФ умножается на С2. Практические приложения теории случайных процессов с целью обработки экспериментальных данных связаны с понятиями ста- ционарности и эргодичности случайного процесса. Стационарным случайным процессом на- зывается такой случайный процесс, для которого все числовые ха- рактеристики не изменяются при сдвиге аргумента t. Это означает, что MX (t) = const, DX (t) = const, Rx(ti,1tj) = Rx(ti, ti + ty, tj = ti+x. (4.1) Иначе говоря, для стационарного случайного процесса матема- тическое ожидание и дисперсия не зависят от расположения интер- вала (t{, tj) по оси t, для которого они определяются, а автокорре- ляционная функция зависит только от расстояния между t{ и tj и является, таким образом, функцией лишь одного аргумента т. Поскольку АКФ, с одной стороны, определяется через матема- 106
тическое ожидание, а с другой — при /t- = tj — t совпадает с дис- персией процесса, условие (4.1) является основным для выполне- ния стационарности. Примером стационарного процесса может служить сейсмическая запись с автоматической регулировкой ее амплитуд на любом интервале длительностью 0,7 с (иногда до 1 с). За счет увеличения низкочастотных составляющих от начала записи к ее концу сейсмическая запись для больших интервалов времени (> 1,5 с) уже не удовлетворяет условию стационарности главным образом из-за увеличения видимого периода АКФ (рис. 13). 7} 7z Рис. 13. Реализации нестационарных случайных процессов. Нестационарный: а — по математическому ожиданию, б — по дисперсии, в — по АКФ Случайный процесс обладает свойством эргодичности, если средние значения его числовых характеристик, определенные на достаточно большом временном интервале, равны средним зна- чениям тех же характеристик по множеству реализаций, т. е. когда усреднение по множеству реализаций эквивалентно усреднению по времени для любой достаточно «длительной» реализации. В этом случае одна единственная реализация дает представление о свойст- вах случайного процесса в целом, являясь как бы его «полномоч- ным представителем». Свойство эргодичности для стационарного случайного процесса обычно выполняется при стремлении к нулю его автокорреляцион- ной функции при т -> со. На практике свойство эргодичности служит основанием доста- точности использования лишь одной реализации для определения числовых характеристик случайного процесса. 107
На рис. 13 приведены примеры эргодических процессов, для которых стационарность соблюдается отдельно по интервалам Тг и Т2, а на общем интервале Т измерения являются нестационар- ными соответственно по математическому ожиданию, дисперсии и АКФ- Для стационарного эргодического процесса, описываемого реа- лизацией наблюденного геофизического поля F по профилю (по трассе) с текущими значениями /2, . . . , fn, соответствующие оценки математического ожидания, дисперсии и автокорреляцион- ной функции следующие: f = —ЕА, —Е(Л-Г)2; (4.2> п i=l п 1=1 п— Жт)=—S (Л-7)(Л+г-7)- (4.3) П —|TJ i=l где т — разность аргументов, т = ti—tf, принимающая последо- вательно значения 0; ± А; ± 2А; . . . , выраженные в дискретных величинах расстояний А между значениями поля f{ и fi+x. Для описания нестационарного эргодического процесса может быть использована структурная ф у н к ц и я: С(т)=тЛтг Д (4-4> Взаимно корреляционная функция (ВКФ) является оценкой корреляционной связи двух случайных стационарных эргодиче- ских процессов Fi и F2: 1 п~'х' в(т)=Т^7Г £ <4-5> Ввиду ограниченности по времени реализаций эксперименталь- ных данных все приведенные выше выражения являются оценками соответствующих характеристик случайных процессов. При этом существенную роль играет свойство эргодичности, благодаря ко- торому все характеристики случайного процесса вычисляются лишь по одной реализации. Для получения оценок математического ожи- дания и автокорреляционной функции случайного процесса необ- ходимо было бы наблюдать один и тот же профиль не менее несколь- ких десятков раз, что, конечно, практически невозможно. В то же время рассмотрение одной лишь реализации случайного процесса возвращает нас к математической модели экспериментальных дан- ных в качестве случайной величины; Однако для случайной вели- чины не имеется числовых характеристик вида (4.3) — (4.5), т. е. характеристик, зависящих от интервала т между наблюденными значениями ft и ft+x и в этом состоит принципиальное отличие модели случайного процесса от модели случайной величины. 108
§ 19. АВТОКОРРЕЛЯЦИОННАЯ ФУНКЦИЯ И ЕЕ ПРИМЕНЕНИЕ Автокорреляционная функция, или функция автокорреляции, оп- ределяется выражением (4.3). Без ограничения общности можно положить среднее значение f — 0 (поскольку среднее значение по профилю или по трассе всегда можно вычесть из наблюденных дан- ных), тогда, обозначив т через т, имеем п-\т\ R(rri) =--!— У (4.6) n —|m| 1ST Рис. 14. Реализация стационарных случайных процессов и их АКФ: а — некоррелированного, б —• коррелированного * где А — значение.поля р i-й точке профиля (трассы, скважины), i = 1, . . . , и; п — число точек (пикетов) профиля; т — интервал, принимающий последовательно значения 0; ± А; ± 2А; . . . , ± Л4А (Л4 п), которые выражают расстояние (в пикетах) между ft и fl+m. Ввиду свойства симметрии АКФ — четная функция, т. е. Я (m) = R (— т), поэтому для её вычисления достаточно огра- ничиться нахождением R (т) лишь при т > 0. Нетрудно видеть, что при т = 0 АКФ равна дисперсии . п R(0) = —= n 1 109
при т — 1 АКФ выражает корреляционную связь значений поля для соседних пикетов Я(1)=—“г(/1/2fafз“Ь • • • + fn-ifn); п — 1 при т = 2 АКФ выражает корреляционную связь значений поля, полученных через пикет, К (2) — - (Л/з+^Ч- • • • -\-fn-Jn)- и т. д. Наряду с выражением (4.6) используется нормированная АКФ, определяемая как Ян (т) = К (т)/Я (0) = R (m)ID. (4.7) Нормированная АКФ при различных значениях т совпадает с коэффициентом корреляции для двух случайных величин, одна из которых представляет значения наблюденного поля по профилю (трассе), а другая — те же значения поля, но смещенные относи- тельно предыдущих на т пикетов. Отсюда же следует, что ненор- мированная АКФ оценивает ковариацию этих случайных величин. Для приведенного на рис. 14, а случайного процесса корреля- ционная связь между значениями поля отсутстует и АКФ близка к нулю для всех т >0 (при т — 0; R Это будет некорре- лированный процесс. Для процесса, представленного на рис. 14, б, корреляционная зависимость значений поля от расстояния т уменьшается медленно — это коррелированный случайный про- цесс. Поскольку АКФ при каждом значении смещения т оценивает ковариацию двух случайных величин, а нормированная АКФ — коэффициент корреляции, по АКФ легко построить ковариацион- ную матрицу, а по нормированной АКФ — корреляционную мат- рицу в виде - 1 Яи(1) • . . RB(M) - Ru(m-k}~ ' 1 . ; ; ; . _ RK(M) RK(M — 1) ... 1 (4.8) Здесь k = 0, . . . , M. В практике обработки геофизических данных нашли применение следующие типы АКФ (рис. 15). 1. Единичный импульс Кронекера (рис. 15, а): f 1, tn — 1, ^н(/п) = | 0( т_£0> 110
a. г a . 5(Ы) Рис. 15. Основные типы АКФ и их спектры: а — единичного импульса Кроиекера, б — треугольного типа, »— марковского типа, « — гауссового типа, [д — затухающей по экс- поненте косинусоиды
его ненормированная АКФ описывается единичным^импульсом, называемым дельта-функцие и,] (со, /71 = 0, °? 6(m) = < J 6 (m)dm = 1.' v ’ I 0, m^=0; (4.9) Дельта-функция 6 (m) — математическая модель предельно ко- роткого однополярного импульса единичной площади, которая используется для характеристики белого (некоррелированного) аппаратурного шума. Ее также часто применяют для описания АКФ погрешностей измерений. 2. АКФ треугольного типа (рис. 15, б) Ян(/П = 1 —т/г0, 0, m < г0; т>г0 ;Г(4.10) описывает корреляционные свойства погрешностей, возникающих при определении эффективных скоростей способом встречных го- дографов в сейсморазведке, а также аппроксимационные свойства контактной поверхности в гравиразведке. 3. АКФ марковского типа (рис. 15, в) Ян (т) = ехр (—а | т |) (4.11) с экспоненциальным затуханием корреляционных свойств измере- ний по профилю. Корреляционная матрица для АКФ вида (4.11) при ехр (— а) = г имеет вид (4-12) а соответствующая ей обратная матрица - 1 —г — Г 1+г R-1= Ц_ 1 — г2 0 —г 0 0 . . . 0 ~ —г 0 . . . 0 1+г —г . . . 0 0 0 0 0 . . . 1 _ (4-13) Поскольку только для АКФ марковского типа при наличии корреляции можно выразить обратную корреляционную матрицу аналитически, выражение (4.11) часто используется в теоретиче- ских исследованиях для оценки влияния корреляции при анализе тех или иных алгоритмов обработки геофизических данных. 4. АКФ гауссового типа (рис. 15, г) RH (ттг) = ехр (—тЧг*). (4.14) 113
Применение АКФ этого типа оказывается эффективным при описании корреляционных свойств аномалий гравитационного поля, представленных моделью случайного процесса, причем при г < Д это будет некоррелированный процесс, при г>Д — корре- лированный процесс. 5. АКФ затухающей по экспоненте косинусоиды (рис. 15, д) R„(/n) = exp(—а | т |) cos fyn, (4.15) где а — коэффициент затухания; 0 — видимый период колебаний. Выражение (4.15) используется для описания формы корреля- ционной функции сейсмических колебаний, представленных мо- делью случайного процесса, а также для описания АКФ погреш- ностей в гравиразведке. По АКФ определяется интервал, или радиус, кор- реляции исходных данных — гД, т. е. такое расстояние, на- чиная с которого значения поля f( и fi+r можно считать некорре- лированными, а при нормальном законе распределения ft и неза- висимыми друг от друга. Для некоррелированного случайного процесса ковариационная матрица В и корреляционная матрица R становятся диагональными, впервой из них по диагонали располо- жены значения дисперсии, во второй — единицы, т. е. для некор- релированного процесса корреляционная матрица является еди- ничной. Для определения интервала корреляции гД используют раз- личные оценки. Наиболее распространено оценивание гД по за- данному значению в = 0,14-0,3 R (0). При этом будет таким значением аргумента АКФ, начиная с которого выполняется со- отношение | RB (m)|«<e для всех т>г. Часто г определяется как 00 00 г2 = [ | Rh (т) | dm или rs=? f Rl(m)dm. (4-16) о о • . Все эти оценки г дают разные по величине интервалы корреля- ции, поэтому при обработке данных надо использовать лишь одно из определений. В частности, для оценки ширины гравитационных и магнитных аномалий более подходящей является величина г2, для сейсмических сигналов — г3. При нормальном распределении ft для быстрой приближенной оценки можно воспользоваться соотношением r4 == l/2v, где v — число пересечений среднего значения поля по профилю, приходя- щееся на один пикет (на один дискрет Д). Величиной интервала корреляции обычно ограничивают дли- тельность АКФ при расчете весовых коэффициентов фильтра (см. гл. VI и VII) и ширину аномалии по профилю (или длительность сигнала по трассе). Форма АКФ и интервал корреляции нашли применение при решении следующих задач обработки геофизических данных: 1) оценка корреляционных свойств сигналов (аномалий) и по- мех. Поскольку наблюденные значения геофизического поля в об- 113
щем случае равны сумме сигнала и помех, ft = s{ + п{, при отсутст- вии корреляции между сигналом и помехами (чаще всего при об- работке данных исходят из предположения о том, что появление сигнала не зависит от появления помех и наоборот) АКФ поля можно представить в виде четырех АКФ: R (т)=------------------------j-(ZsA+m + En>ni+m + + Zs/ni+m + Snisi+m)- (4.17) Последние две суммы этого выражения ввиду указанного пред- положения равны нулю. Отсюда следует, что при слабом влиянии помех на сигнал (малой их интенсивности по сравнению с интен- сивностью сигнала) АКФ является оценкой корреляционных свойств сигнала и, наоборот, на интервале отсутствия сигнала АКФ наблюденного поля представляет собой оценку свойств по- мех. Опыт показывает, что сигналы, соизмеримые по интенсивности с уровнем некоррелированных помех, не влияют на оценку свойств помех при интервале оценивания п, в 4—5 раз превышающем дли- тельность сигнала (ширину аномалии); 2) расчеты весовой функции и частотной характеристики оп- тимальных фильтров (см. § 34—36) базируются на знании АКФ сигнала и помех. Отметим также, что совпадение формы неслу- чайного сигнала с формой АКФ помех, как показано А. К. Янов- ским, свидетельствует о невозможности разделения сигнала и по- мех, поскольку при этом спектры сигнала и помех совпадают. На- оборот, различие формы сигнала и АКФ помех говорит о необхо- димости дополнительной обработки с целью отфильтровывания частотных составляющих помех; 3) трансформация наблюденного поля. Расчет АКФ равносилен применению способа трансформации с частотной характеристикой Н (— со), обладающего тем преимуществом, что характер преобра- зования определяется особенностями самого исходного поля и ре- зультаты такого преобразования можно непосредственно интерпре- тировать. Кроме того, в ряде случаев пересчет поля в нижнее по- лупространство в магнито- и гравиразведке целесообразно прово- дить не по наблюденному полю, а непосредственно по его АКФ, поскольку АКФ мало чувствительна к ошибкам измерения. Бли- жайшая особая точка при этом, как показано В. Н. Страховым, залегает в 2 раза глубже, чем в случае исходной аномалии. Малая чувствительность АКФ к ошибкам измерения определяется интег- ральным эффектом нахождения каждого значения АКФ (при вы- числении каждого значения АКФ участвуют наблюденные значе- ния по всему профилю); 4) разделение наблюденного поля на однородные по статисти- ческим характеристикам участки. Такое разделение проводится с целью геологического картирования по геофизическим полям. В качестве статистических характеристик чаще всего используются 114
среднее значение, дисперсия и интервал корреляции, вычисляемые в окне заданного размера. Так, например, И. Г. Берлянд, исполь- зуя расчет указанных характеристик по данным региональной гра- витационной съемки в Предуралье, провела картирование основных типов пород по изменению интервала корреляции, дисперсии и среднего значения, которые рассчитывались по отрезкам профиля длиной 10 км со смещением этих отрезков на 1 км; 5) оценка глубины залегания источников аномалий в магнито- и гравиразведке по интервалам корреляции. Как показано С. А. Сер- керовым, для положительных аномалий силы тяжести глубина залегания й<г/л, г=----------f | RAtri) | dm. (4-18) л о Для знакопеременных аномалий выполняется соотношение 1,3 h < г < 2 л/г. Шаг съемки по профилю с интервалом корреляции связан со- отношением Дх 1,36 h = 0,43 г. 6) проверка стационарности наблюденного поля (по С. А. Кап- лану и А. К. Яновскому) может быть осуществлена по отношению двух оценок дисперсии АКФ: mmax 2 У #н (т) U _ q‘ = (n + 2"h + 1) т,__________. (4.19) (mmax — ttli) "И 2 0 Если Я<1, исходная реализация наблюденного поля стацио- нарна, если Н>1—нестационарна; 7) оценка разрешающей способности сейсмической записи. От- ношение wii mmax P = £R£(m)/ £ Ян(т), (4.20) где тг = 14-2 Т; /Птах=—5-j- 10 Т (Т — видимый период сигнала), предложенное А. А. Зеновым, позволяет количественно оценить разрешающую способность. Очевидно, что если Р « 1, то запись имеет хорошее разрешение (вся энергия сигналов сосредоточена на малом интервале времени), если Р<0,5, то запись плохо раз- решена, т. е. можно считать, что многофазное исходное колебание связано с положением нескольких волн. Часто для оценки АКФ приходится использовать короткие от- резки профилей, поэтому вопросы точности определения АКФ при- обретают большое практическое значение. Если закон распределения измеренных значений fi нормаль- ный и для каждого смещения /пД величина R„ (m) представляет собой эмпирический коэффициент корреляции, погрешность оценки АКФ можно найти как оЛн= ±[1 —7?$(m)]/Vn—/п. (4.21) 115
Надежным значением 7?н (w) для 95 %-ной доверительной ве- роятности является такая величина, для которой 17?н (/п) |> 1,96стЛн. В общем случае дисперсия оценки АКФ определяется выраже- нием м f^K = 2YlR2B(m)/n. (4.22) Оценка (4.21), в частности, показывает, что надежным значе- нием АКФ при интервале оценивания п > 50 являются величины Rn (т) > 0,25. Соотношение (4.22) может быть положено в основу расчета не- обходимой длительности реализации (длины профиля) для надеж- ного оценивания АКФ. Из (4.22) следует, что Одн = 4гКоР/п, от- сюда п>4гкор/стлн. Допустим, что АКФ выражается функцией 7?н (т) = = ехр (— а| т |) х cos 0т. Для п = 2л/г/0, k = 1, 2, . . . , имеем (2 + р,)2 [1 — exp (— 4nfe/|i)] ' кор —----------------------------------------- р. = 0/а. 4а (1 + Ц2) Следовательно, 2 а2 (2 + р,2) [ 1 — ехр (— 4nfe/ц)] 4^(ц+1/р) (4,23) По (4.23) с учетом того, что п = 4гКорА*2. можно рассчитать необходимую длительность реализации сейсмической записи с ап- риорным значением р. В заключение заметим, что, хотя АКФ была введена как харак- теристика случайного процесса, формально построение АКФ ис- пользуется и для детерминированных, аналитически заданных сиг- налов (аномалий), однако при этом в формуле (4.6) уже не следует проводить усреднение по числу участвующих в определении АКФ точек. - Таким образом, АКФ детерминированного сигнала st R (т) = Hsfsi+/n Для непрерывных сигналов и реализаций случайных процес- сов суммирование во всех приведенных выше выражениях заме- няется интегрированием. § 20. ВЗАИМНО КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ И ЕЕ ПРИМЕНЕНИЕ Взаимно корреляционная функция (ВКФ) представляет собой оценку корреляционных свойств двух случайных процессов. Для эргодических случайных процессов ВКФ вычисляется по данным отдельных реализаций fu и В качестве таких реализаций мо- 116
гут быть взяты данные по двум профилям, скважинам, трассам и т. д. При этом вычисление ВКФ производится по формуле п—\т 1 В(т)=-----(4.24) п — | т | i=i где т = 0, ± А; ± 2Д; . . . ; ± МА; п — число точек для каждой реализации. Допустим, что по реализации найдены их. средние значения: fi = %/« и f2 = Sf2t/n. Тогда без ограничения общности можно считать, что /х = /2 — О и выражение (4.24) запишется в виде п—\т\ В(т)=-----!— £ fiihi+m- (4.25) п — | т | ;=1 При пг = О В (0)= —£fl i/г Z = fllf21+ /12/22 + • • • + /ln/2n, п т. е. при вычислении В (0) перемножаются значения поля для одно- именных пикетов профилей (дискретов времени по трассе и т. д.). При т = ± А: В(1) =----~~ Z/i cfz i+i = /11/22 + /12/28+ • • • +/ln-1/2,1! п — 1 B(—1) = ----^—E/lz/2Z-l =/12/21 +/13/22+ • • • +/ln/2n-l, т. е. при вычислении В (± А) перемножатюся значения поля, сме- щенные на один пикет (дискрет времени). При этом будем считать, что смещение А соответствует смещению последующего профиля (например, второго) на один пикет влево относительно предыду- щего (например, первого). Наоборот, смещение — А соответствует смещению предыдущего профиля на один пикет вправо относительно последующего при расположении профилей. Положительное смещение последующего профиля относительно предыдущего для коррелированного от профиля к профилю полез- ного сигнала дает положительной экстремум ВКФ при А, отрица- тельное же смещение профилей для аналогичного сигнала дает по- ложительный экстремум ВКФ при — А. В том случае, когда обработке подвергаются не исходные дан- ные, а их ранги (ранг определяется как порядковый номер элемента в возрастающем ряду значений), по аналогии с введением коэффи- циента ранговой корреляции вводится ранговая взаимно корреляционная функция n£”{[J?z-(n-m+l)/2][<>z-(n-m+l)/2]} BRQ (m) = -------—-------------:-------------. (4.26) £ [Z_(n_m+l)/2p i=l 1'7
где Ri — ранг i-ro значения поля на первом профиле; Qi — ранг г-го значения поля на втором профиле. В практике обработки геофизических данных взаимно корреля- ционные функции используются так же широко, как АКФ. Ука- жем на следующие аспекты их применения. 1. Оценка корреляционных свойств сигналов. При условии некоррелированного характера помех между профилями и при этом незначительного изменения формы полезного сигнала ВКФ пред- ставляет собой оценку корреляционных свойств сигнала. Поскольку /l<==Sl<+^l<K/:2i = S2<4_,I2i>TO В (т) = -------- 2 (S1 i + «1 i) (Sa i+m + n2 i+m) ~ n — I m I =----"--Г (Ssl <S2 i-f-m + S5! i°2 i+m + is2f+m + i^al+m) = n — | m | = 7ТГ £S1 iSa i+m « 7—- 81 iSl i+m- n — I tn I n — I m I Остальные корреляционные суммы в этом выражении равны нулю ввиду независимости появления сигнала и помехи и некорре- лированности помехи от профиля к профилю. Совпадение форм полезного сигнала По профилям приводит к его автокорреляции. Таким образом, ВКФ наряду с АКФ может быть использована для расчета весовых функций и частотных характеристик оптимальных фильтров (см. § 34 и 35). 2. Оценка простирания сигналов. Для выделения полезных сигналов особый интерес представляют экстремальные значения ВКФ. Положительные экстремумы ВКФ указывают на наличие корреляции сигнала между профилями. Такие экстремумы ВКФ соответствуют значениям аргумента, т. е. величинам смещения в пи- кетах от профиля к профилю (от трассы к трассе) тех сигналов, для которых наблюдается наиболее сильная корреляционная связь поля. Отсюда следует вывод о практическом использовании поло- жительных экстремумов ВКФ Для оценки простирания сигналов по площади. На рис. 16 приведены наблюденные значения некоторого фи- зического поля и соответствующие этим значениям ВКФ. На рис. 16, а смещение аномалий, равное 2Ах, четко фиксируется положительным экстремумом ВКФ при т = 2Д. В случае анома- лий различного простйрания ВКФ имеют два экстремума или бо- лее (рис. 16, б). Наконец, резкое смещение экстремумов ВКФ для какой-либо пары профилей относительно экстремумов соседних ВКФ позволяет использовать построение ВКФ для выделения на- рушений в распределении поля, как это показано на рис. 16, в. Например, по такому смещению картируются разломы с простира- нием, близким к простиранию профилей геофизической съемки. Следует подчеркнуть, что форма ВКФ и величина экстремумов зависят от характера распределения аномального поля по площади. 118
Рис. 16. Графики исходных значений поля и ВКФ в случае аномалий одного простирания (а), различного простирания (б), при смещении аномалий (в). >- оси аномалий; 2 в тектоническое нарушение
При наличии аномалии одного и того же простирания ВКФ имеют один экстремум (см. рис. 16, а), причем его величина тем больше, чем больше аномальных значений поля участвует при вычислении ВКФ. В случае аномалии различного простирания ВКФ имеют, как правило, несколько экстремумов, абсциссы которых указывают на смещение аномалий от профиля к профилю. Чем больше ано- малий одного и того же простирания наблюдается на площади, тем больше величина соответствующего экстремума ВКФ. В то же время для интенсивных аномалий (практически не искаженных помехами) различного простирания при небольших смещениях их относительно друг друга ВКФ могут иметь лишь один экстремум вместо двух. При обработке сейсмических записей построение ВКФ между трассами обеспечивает оценку суммарной (кинематической и ста- тической) поправки, определяемую абсциссой максимального зна- чения ВКФ. Зная закон распределения скоростей, а следовательно, и величину кинематической поправки от трассы к трассе, опреде- ляют статическую поправку для пункта взрыва как разницу между абсциссой максимума ВКФ и величиной кинематической поправки. Определение кинематической и статической поправок в сейсмо- разведке позволяет перейти на автоматическую корреляцию отра- женных волн, в основе которой лежит использование ВКФ. Однако при этом существенное значение приобретают вопросы надежности вычисления экстремумов ВКФ и точности определяемых по ним величин смещений. Надежность значений ВКФ может быть оценена исходя из того, что для каждого смещения mA величина В (т) представляет собой коэффициент корреляции. Поэтому погрешность оценки определе- ния значений нормированной ВКФ Вн (tri) в предположении о нормальном характере распределения значений поля находится как °вн (т) = [1—Вн (т)]/д/п—т, Ви (т) = 'В (m)/afiaf2, (4.27) Надежными значениями Вн (т) для 95 % -го уровня доверия яв- ляются значения Вн (т)>1,96 оВн(т). Дисперсия величины смещения тэ для экстремума ВКФ мо- жет быть оценена по формуле Яновского Отэ = 2 [1—Вн (^а)] гкор А/пАсо Вн (тэ), (4.28) где Гкор — интервал корреляции полезного сигнала, определяемый 00 как гкор— £ R.H(tri)dm-, т9 — абсцисса экстремума ВКФ; Вн (тэ) — значение ВКФ в точке экстремума; со — соо Асо, соо — видимая частота спектра сигнала, Асо — среднеквадратический разброс частот по спектру; nA — интервал оценки ВКФ, т. е. об- щее число дискретов при определении ВКФ. 120
По величине (4.28) определяется доверительный интервал Для смещения тэА, в пределах которого выделяются оси синфазности или аномалий. При оценке о„э для потенциальных полей в формуле (4.28) можно принять со0 = 2jiv0, причем для знакопеременной аномалии v0 = 1/mA, а для знакопостоянной аномалии v0 — 1/2 mA, где т — ширина аномалии. 3. Оценка отношения сигнал/помеха. Указанная оценка может быть получена по экспериментальным данным без привлечения особых априорных сведений о сигнале и помехе. Если сигнал, за- данный в виде случайного процесса вдоль профиля (трассы), пред- ' т ставить в виде А (х) — 51a<s(x—xi) (s (х) — форма сигнала; а/ — 1 его амплитудные значения), то математическое ожидание величины А (х) (согласно теореме Кэмбелла) равно МА (х) = nas (х) (п — среднее число аномальных значений на единице длины профиля; а — среднеквадратическая амплитуда сигнала). Отсюда в предпо- ложении об'отсутствии корреляции помехи вдоль профиля, получим значение автокорреляционной функции R (0) = па2 + т — 0, R(m) = na2R:(m), т=/=0. Аналогичное выражение для взаимно корреляционной функции данных двух профилей и /2 при отсутствии корреляции помехи между профилями и неизменности формы сигнала от профиля к профилю будет В (т) ~ na2Bs (m). Приведенные выражения АКФ и ВКФ показывают, какие основ- ные величины влияют на их оценку. Если учесть, что в результате вычисления АКФ по профилю получаем оценку суммы АКФ сиг- нала и АКФ помехи, то разность между значениями АКФ при т = 0 и ВКФ для положительного экстремума (в частности, для максимума) даст оценку дисперсии помехи RH (т) — В„ (ms) = = 1—Вн (/«э) — о2. При расчете ВКФ принимается a1fi = af2 — а2, В то же время, учитывая выражение (4.26) и некоррелированный характер помех, можно считать, что Вн (тэ) — а2. Следовательно, выражение ____В (nts) _ Дн (тэ) _ °* 29) /?(0)-В(тэ) 1-ВнИэ) ’ обеспечивает оценку величины отношения сигнал/помеха. Нетрудно показать, что оценка (4.29) справедлива не только для модели сигнала в виде случайного процесса, но и для модели детерминированных сигналов (аномалий). 121
§ 21. ДВУМЕРНЫЕ КОРРЕЛЯЦИОННЫЕ ФУНКЦИИ Для описания корреляционных свойств двумерных геофизических полей используют двумерную автокорреляционную функцию (ДАКФ), которая при центрированных значениях, поля на каждом профиле, т. е. при . = fN — 0, определяется выражением N — | р I га — \т\ R(p, т)=—•—!— Е Е fkifk+pk+m, (4.30) N — | р | п — | т | fe=i f=i где fkt — значение поля на /г-м профиле в t-й точке; р — опреде- ляет смещение между профилями съемки (р = 0; ± Ар; ± 2Ар, ...); т — смещение между точками по профилю (т — 0; ± Ах; ± 2Ах, . . . ); п — общее число точек по профилю (трассе); JV— общее число профилей (трасс). С целью изучения структуры ДАКФ выпишем выражение (4.30) для различных фиксированных значений р. При р = 0 К(0, m) = 4"T~M ZZWfei+m== “ЧгСп + „ Ll /V \ Л —| tn | П ““ | tn | / т. е. при р = 0 ДАКФ равна сумме всех одномерных функций ав- токорреляций, вычисленных для каждого профиля и усредненных по их общему числу N. При р = 1 R (!, щ) = —££ fk (fk+1 l+m = ZZ1^2<+m+ • • • т. e. при p = 1 ДАКФ равна усредненной сумме одномерных функ- ций взаимной корреляции, вычисленных для значений поля по каждой паре соседних профилей (трасс). Аналогично при р — 2 получаем сумму функций взаимной корреляции, вычисленных для значений поля, расположенных через один профиль, при р = 3 — через два профиля и т. д. Для выражения ДАКФ (4.30) справедливо соотношение R (р, т) — R (— р, — т), поэтому при расчетах ДАКФ можно огра- ничиться вычислением значений либо R (р, ± т), либо R (± р, т). Двумерную автокорреляционную функцию следует строить на плоскости смещений /иАх и рАр, где для различных значений рДр откладываются сумма автокорреляционных (при р = 0) и взаимно корреляционных (при р > 1) функций. Такое представление дву- мерной АКФ в изолиниях ее рельефа на плоскости (т, р) позволяет наглядно отобразить корреляционные свойства геофизических по- лей по площади, а для сейсмической информации — по времени и в пространстве (рис. 17). 122
Точность оценки ДАКФ обычно значительно выше точности оценки одномерных АКФ из-за большого числа значений поля,, используемых для ее определения. Нормированная ДАКФ рассчитывается как RH(p, ni) = R(p, m)/R(Q, 0). Описанное построение ДАКФ по формуле (4.30) справедлива для регулярной сети. Значения ДАКФ как для регулярной, так и для произвольной сети наблюдений на площади съемки находятся по выражению Л(р)=ЕАА+р. (4-31> а Рис. 17. Графики исходного поля Za (а) и их нормированнаи двумерная ав- токорреляционная функция (б) в котором производится усреднение значений поля по заданным интервалам группирования с радиусом-вектором р. В частности,. р = V /и2 Ах + р*Ьу< Из (4.31) следует, что алгоритм вычисления R (р) сводится к определению, группированию и усреднению произведений зна- чений поля для всех пар точек, попадающих в пределы круга ра- диуса р. Количество таких пар произведений равно п (п—1)/2 (где п — число точек в круге) и обычно вполне достаточно для надежного определения величины R (р). При графическом по- строении ДАКФ по формуле (4.31) она аналогична одномерной АКФ, а в случае изотропности поля — совпадает с последней. По- этому выражение (4.31) целесообразно использовать для изотроп- 123
ных полей и при расчете основных статистических характеристик (среднего, дисперсии, интервала нулевой корреляции, на котором значения корреляционных функций равны нулю) в пределах окна, выбранного с целью районирования поля. Оценку интервала корреляции по ДАКФ можно провести по любому направлению с использованием выражений, приведенных в § 19. Для оценки точности определения ДАКФ погрешности вычис- ляются по различным направлениям раздельно, что позволяет по- строить их рельеф на плоскости. Использование ДАКФ в практике обработки геофизических дан- ных во многом аналогично применению одномерных АКФ. 1. При отсутствии корреляции помех как вдоль профиля, так и между профилями ДАКФ представляет собой оценку корреля- ционных свойств аномального поля. Подобно тому, как вычисление одномерной АКФ является основой для расчета весовых функций и частотных характеристик оптимальных фильтров, так и вычисле- ние ДАКФ следует рассматривать как начальную процедуру при построении двумерных фильтров, в частности алгоритмов прост- ранственно-временной фильтрации в сейсморазведке (см. гл. VII). Построение ДАКФ на аномальном участке при проведении маг- нитных и гравиметрических съемок позволяет существенно сни- зить влияние помех в случае оценки формы аномалии. ДАКФ мо- жет быть с большим успехом, чем само наблюденное поле, исполь- зована для пересчетов потенциальных полей. В задачах фильтрации геофизических полей возникает необхо- димость построения корреляционной матрицы по ДАКФ. Эта мат- рица будет определяться по аналогии с (4.8) как R (р—k, т—I). При р = т — 0; ± 1; ± 2 получаем значения матрицы, при- веденные в табл. 21. В силу симметрии ДАКФ R (р, т) = R (— р, — т), корреля- ционная матрица симметрична относительно главной диагонали. 2. Двумерная автокорреляционная функция дает возможность определять основные простирания аномалий. На рис. 17, б приве- ден пример определения простирания аномалий по ДАКФ, вычис- ленной для магнитного поля Za в одном из районов Северного Криворожья. Графическое изображение ДАКФ в изолиниях позво- ляет установить два направления простираний: меридиональное, которое выделяется визуально по графикам исходного поля, и се- веро-западное, не проявляемое достаточно четко на графиках Za. ДАКФ в общем случае аналогична розе-диаграмме изолиний поля, применяемой, в частности, для выявления микроструктур полей при микромагнитных съемках. Если изолинию интервала корреля- ции, определенного абсциссой R (0,0)/3, аппроксимировать эл- липсом, азимут направления большой оси эллипса будет оценивать основное простирание аномалий по площади, а коэффициент сжа- тия эллипса, численно равный отношению малой полуоси эллипса к большой,— количественно характеризовать степень анизотро- пии поля. и ц а 21 сч 1 (-2, 2) £ (-2, 0) (г ‘I—) C4 (0 ‘I—) см о О о. Ч 50 ас ас ас ас ac ac ас ас ас сз 7 g (i ‘г—) (о ‘г—) ! сч 7 О 7 1 7 О o' _о. 7 о ас ас ас ас ac ac ас ас ас о II g (о ‘г—) if (I— ‘г—) а 1 см’ 1 й; (0 ‘I—) if (I- ‘I—) if fe— ‘I—) if R (0, 0) R (0, -1) R (0, -2) ? (г ‘i- (I ‘I- (0 ‘I- О СМ О g 1 * ft? 1 о? 0) if 0) if 0) if 1) и 1)а I) и 1 т (I ‘I- (0 ‘I- (I- ‘1- о г— о 7 ас ас г. ас 0) if 0) if О ft? I) и 1)И I) и о ц (0 ‘Г 1 1 о 7 оГ 1 о 7 сТ 1 1 Of ас ас R (0, o’ ft? о ft? ас ‘I) и ас сч сТ ^^4 S' oT S' СЧ О о <О. CJ см сч. ас ас ас ac ac ас ас ас ас о II О’ 1 S' 1 S' л g R (0, 0) if 0) if ac ‘I) if ас R (2, R (2, R (2, 1 о II g S' 1 о? o' 7 О? 1 S' 1 сТ 1 о О? R (0, о ft? R (1, R (1, ас R (2, R (2, R (2, 1 о см О см О ei о. о сч 124
ДАКФ позволяет учесть изменение корреляционных свойств исходных данных по различным направлениям при оценке эффек- тивности их преобразования различными приемами обработки, в частности разными интерференционными системами в сейсмораз- ведке. В рудной геофизике на основе ДАКФ можно осуществить вы- бор оптимального простирания задаваемых профилей. Направление профилей должно быть нормальным к некоторому средневзвешен- ному, определенному с учетом относительного веса аномалий раз- личного простирания, проявленных на ДАКФ. 3. Двумерная АКФ используется при районировании геофизи- ческих полей, когда съемки проведены на большой территории и имеется возможность расчета ДАКФ в скользящем окне. При этом вся исследуемая территория разбивается на равные по вели- чине участки, для каждого из которых вычисляется ДАКФ. Райо- нирование поля осуществляется либо непосредственно по форме двумерных ДАКФ, либо чаще всего по основным статистическим характеристикам ДАКФ, значения которых затем преобразуются, в единый комплексный параметр на базе метода главных компо- нент. К таким характеристикам относят: а) среднее значение поля по участку (в окне); б) дисперсию оценивающую изменчивость поля (аномалий); в) интервал корреляции гкор при /? (0,0)/3, ха- рактеризующий статистическую зависимость значения поля в дан- ной точке от его значений в других пунктах наблюдений, а также среднестатистический размер аномалий; г) азимут основного про- стирания аномалий на участке. Вычисление указанных характеристик можно организовать в скользящем окне, однако это требует значительных затрат ма- шинного времени. Следует отметить возможность применения в практике разве- дочной геофизики двумерных ВКФ В (р, т) = —±—---------1— ZZ fl {$+р {+т. (4.32) ЛГ — I р | п — I т |Д где fh и — значения поля, полученные на разных участках съемки, на разных глубинах (высотах) исследования либо разными методами. Двумерная ВКФ характеризует взаимные корреляцион- ные свойства полей, устанавливаемые на изучаемой площади по наблюдениям на двух участках съемки или на двух глубинах, или при использовании двух методов. В последнем случае двумерную ВКФ можно рассматривать как результат комплексной интерпре- тации данных площадной съемки двумя методами. Одно из практических приложений двумерной ВКФ при раз- ведке нефтяных месторождений связано с оценкой в пространстве смещений сводов структурных планов, получейных по данным сейсморазведки на разных глубинах. Величина этого смещения устанавливается по экстремуму функции. 126
§ 22. СТРУКТУРНАЯ ФУНКЦИЯ Результаты геофизических наблюдений часто являются нестацио- нарными по математическому ожиданию, что не позволяет приме- нять АКФ для оценки их статистических свойств без предваритель- Рис. 18. Материалы обнаружения кимберлитовой трубки путем вычисления структурных функций аэрогеофизических данных (по Ф. М. Персицу). а — наблюденные данные; б — структурные автоковарнацин (J?K, -ftTh) н ковариация ЯТЬ—К’ * ~ наблюденное поле ДГЛОК и его структурная автокорреляция; а—геологи- ческий разрез: I — известняки, 2 — кимберлитовое тело, 3 — автохтонный ландшафт. 4 — направление сноса материала в аллохтонном ландшафте ного исключения фона. Для изучения нестационарности исполь- зуется структурная функция (4.4). Нередко исключение региональной составляющей вызывает оп- ределенные трудности, в частности при спектрометрической аэро- геофизической съемке. В таких случаях для выявления нестацио- нарных, как правило, аномальных участков оказывается целесо- образным использование структурной автокорре- ляции 127
. mmax _ /?стр(т)= ----1---- 1 КН-АС/Ятах)]2. (4.33) п — ттах т=1 I т fi (т) =--£ fi~mt ТП —т где т и ттг1Х — переменный и максимальный интервалы усредне - ния исходного поля fa т = 1, 2, . . . , [f{ (т) — ft (rnmax) ] — ордината структурной функции i-й точки профиля. Для стационарного процесса при т„,ах -> со структурная функ- ция совпадает с дисперсией процесса. Преимущество структурной функции (4.33) по сравнению с АКФ состоит в ее относительно большей устойчивости к нестационарное™ процесса по математи- ческому ожиданию. При изучении зависимости двух различных полей ft и f2 исполь- зуют построение структурной ковариации В^р (т) =-----1---- X 171 i i (^max)] X П — fnmax — m X [fa <(/«)— МИтах)]- (4.34) На рис. 18, а приведены данные аэрогеофизической съемки по регистрации содержания Th, К, отношения Th/K, а на рис. 18, в— магнитного поля (АТ')лок над кимберлитовой трубкой, на рис. 18, б, в их структурные автокорреляции и структурная ковариация Th и К. Дальнейшее преобразование значений этих функций в единый комплексный параметр приводит к однозначной локализации ким- берлитовой трубки.
ГЛАВА V СПЕКТРАЛЬНЫЙ АНАЛИЗ ГЕОФИЗИЧЕСКИХ СИГНАЛОВ Спектральный анализ занимает центральное место при обработке геофизических данных. Разложение наблюденного поля на различ- ные частотные составляющие, что и представляет сущность спек- трального анализа, уже само по себе дает много информации о структуре поля. При этом важно подчеркнуть применимость спек- трального анализа для описания свойств геофизических полей, заданных как детерминированными, так и случайными функциями. Необычайно широки и разнообразны возможности спектрального анализа при фильтрации исходных данных, оценке погрешностей и сравнении эффективности обработки данных различными прие- мами. В настоящее время спектральный анализ объединяет методы анализа Фурье и статистического анализа временных, в том числе любых дискретных последовательностей наблюденных значений геофизических полей. Отметим, что при обработке данных конеч- ной длительности, к которым относятся все геофизические наблю- дения, спектральный анализ оказывается более предпочтительным, чем автокорреляционный анализ. § 23. СПЕКТРЫ ДИСКРЕТНО ЗАДАННОГО СИГНАЛА В связи с использованием ЭВМ практические приложения ана- лиза Фурье при обработке геофизических полей обусловлены пред- ставлением исходных данных как сигналов, заданных в дискрет- ные моменты наблюдения, т. е. Si = s (х = iAx = iA) данных по профилю (трассе). Кроме того, в большинстве методов, регистри- рующих потенциальные поля, наблюдения проводятся дискретно. Вначале рассмотрим основные понятия спектрального анализа для детерминированных сигналов. При расчете таких сигналов сущест- венным является их модельное представление. Различают перио- дические и непериодические сигналы. Сигнал s(х), для которого справедливо соотношение s (х + Т) = s(x), где Т — некоторая постоянная, называется периодическим. Величину Т на- зывают периодом сигнала. Для непериодического сигнала такого Т не существует, например для s (х) = е~х, а для так называемого апериодического сигнала полагают величину Т стремящейся к бесконечности. Рассмотрим разложение дискретно заданного сигнала по перио- дическим функциям синусов и косинусов. Такой сигнал можно рассматривать как полученный из непрерывного сигнала s (х) дли- тельностью Т при отсчете значений сигнала через интервалы А, 5 А. А. Никитин 129
что дает п = 77 Д дискретных значений s<. Для удобства вычисле- ний полагаем, что п четцое и равно 2г, а начало отсчета значений сигнала помещено в его центр, так что текущий индекс i для абс- циссы сигнала s{ изменяется по целым числам от — г до г—1: — г, — г + 1, . . . , — 1,0, 1......г — 2, г — 1. Известно, что практически любую периодическую функцию 1 можно представить в виде конечного ряда Фурье Г—1 8~(Х) = ЛО + 2 X (Amcos2nrnf1x+Bmsin2nffif1x)-|-.4ncos2nn/:1x, m=l (5.1) содержащего г констант Ат и Вт, которые можно определить так, чтобы дискретные и непрерывные значения сигнала совпали в точках х = /Д, т. е. s (х) = st. Функция s (х) является приближе- нием к исходной непрерывной функции s (х) в интервале — T/2<zx<zT/2. Заменяя х на 1'Д в (5.1) и полагая s (/Д) = s<, получаем систему п уравнений для п неизвестных констант: Г “1 s( = Ло 2 У, Amcos 2nmfiiД + Вт sin 2nmf1iA) + + Ап cos 2nnfiiA, (5.2) i — — r, —r+1, .... —1, 0, 1, ... , r—1. Для величины = 1/пД решение системы (5.2) упрощается, поскольку синусы и косинусы образуют ортогональную систему, удовлетворяющую соотношениям: г-1 У sin i=s— г 2nki 2л mi =с k, m—целые; п п о, k=£ tn, Г—1 У sin- /——Г 2n£i п sin- 2nmi п __ , n/2, k = m = 0, 0, k — m = 0-, 0, k=£tn, г—1 У cos <=— г 2яМ -cos 2nmi n/2, k = my=0, п n, k = m = 0- Приведенные соотношения ортогональности используются для нахождения коэффициентов Ат и Вт в (5.2). При этом обе части (5.2) умножаются на cos (2nmi/n) или sin (2лт11п) и ведется сумми- 1 Согласно условиям Дирихле функция в пределах периода Т ограни- чена и может иметь лишь конечное число разрывов. 130
рование по i. С учетом их ортогональности получаем выражение для коэффициентов Ат и Вт: Ат = (]./п) У si cos(2nmi/n); Г_Г"Г (5.3) Вт(\/п) У s{ sin(2nmi/n). i г где т = 0, 1, . . . , п/2. Коэффициенты Ат и Вт называются коэффициентами Фурье, а их вычисление — анализом Фурье (гармоническим анализом). Величина ft = 1/пА называется основной частотой сигнала, она соответствует периоду, равному длине интервала об- работки, в частности длине профиля. Величина измеряется либо в периодах на метр (километр), если А измерено в метрах (кило- метрах), либо в периодах в секунду или герцах, если А измерено в секундах. Исходный сигнал s< в результате разложения (5.1) представляется суммой синусоидальных и косинусоидальных функций вида sin 2nmf1i и cos 2nmf1t, частоты которых кратны основной частоте fm = mfi, иначе они называются гармониками основ- ной частоты, их периоды Тт = Т/т, а амплитуды Ат и Вт. Наивысшей из частот является частота fr = г/nA = 1/2Д. Эта частота соответствует периоду, равному двум интервалам отсчета, и называется частотой Найквиста. Коэффициент Ао в разложении (5.2), как нетрудно видеть из (5.3), является средним значением сигнала на интервале его периода. Выражения, аналогичные (5.3), можно получить, если начало отсчета помещено в первую точку сигнала, а отсчет ведется слева направо, тогда п п Ат = (1/п) У st cos (2nmi/n), Вт = (1/n) J] st sin (2nmt7n). (5-3') z=i j=i Широко используется тригонометрическая форма ряда Фурье, для которой вводятся амплитуда Rm ифаза <рт т-й гар- моники, связанные с коэффициентами Фурье соотношениями Rm = л/ Ат + Вт, <рж = arctg (— Вт/Ат). (5.4) Тригонометрическая форма ряда Фурье г—1 s~(x) = /?o Н- 2 }* ж cos (2л/п/1Х | фж) I Rn cos 2sitifiX, m=l Распределение амплитуд гармонических составляющих сигнала Rm в зависимости от частоты (номера гармоники) называется ам- плитудным спектром (или амплитудно-частотным), рас- пределение фаз этих составлякйцих фт от частоты — фазовым спектром (или частотно-фазовым). 5* , 131
Амплитудный и фазовый спектры периодического сигнала яв- ляются линейчатыми, дискретными, они состоят из отдельных «ли- ний», соответствующих дискретным частотам: 0; fi, 2/\ — и т. д. (рис. 19). Значения амплитудного /?т и фазового <pm спектров рассчиты- ваются относительно принятого начала отсчета. Если изменить начало отсчета, которое для (5.3) было взято в центральной точке сигнала, амплитуда гармоник останется прежней, а фаза соответст- венно изменится. Фаза хар актер изует'"смещение т-й гармоники с амплитудой Rm относительно выбранного начала отсчета. Рис. 19. Наблюденное поле &g (а} и его спектры (б). 1 — спектр Фурье; 2 — спектр, построенный по методу-максимума энтропии Если просуммировать все значения гармонических составляю- щих, полученных в точках задания сигнала, с учетом величины их амплитуды и фазового сдвига относительно начала отсчета, ре- зультат суммирования приведет к амплитудным значениям сигнала. Пример. Проиллюстрируем технику вычисления амплитудного и фазо- вого спектров для сигнала, заданного следующими значениями: V-1, — 3, 1, 3, 2, 1. Решение. Начало отсчета примем в центральной точке сигнала, т. е. абсцисса сигнала i изменяется от — г до г—1, где г = 3: si = — 1, — 3, 1 3, 2, 1; i= — 3, — 2, — 1,0, 1,2. Общее число дискретов п = 2г=6. Коэффициент Alt например, получается следующим образом, если его рассчитывать по формуле (5.3): Ai = — Г(- 1) cos 2л+(—3)cos + 6 L 6 6 , , 2л-1-(—I) . _ 2л-0 , о 2л-1-1 , 4- 1 • cos------- 4- 3 cos------Р 2 cos-------Р 6 6 6 + bcos 1 =—(1 + 1,54-0,5 + 3 + 1-0,5)=- 6 J 6 = — -6,5= 1,083. 6 В табл. 22 приведены значения амплитудного и фазового спектров этого сигнала. 132
Таблица 22 Номер гармоники Ат т вт ч>т 0 0,5 0 0,5 0 1 1,083 0,722 1,3 —33°40' 2 0,25 —0,433 0,5 60° 3 —0,167 0 0,167 0 При изучении спектров сигнал удобно выражать через комплекс- ные амплитуды, образующие комплексный спектр: ^m = Rm^P( 1'фт)^Ат ]Вт~ 1 Г-1 =----- У, stexp(—j2nmf1i), (5.5) П i=—r где / = V —1 • С учетом (5.5) дискретный ряд Фурье (5.2) запишется в виде г—1 s<= У Smexp(j2nmfii), (5.6) me—г где S-m — S*m образуют комплексно сопряженный спектр сигнала. Величины I Sm |2 = SX = Rm (5-7) определяют энергетический спектр сигнала. При этом сумма амплитуд энергетического спектра позволяет получить среднюю мощность сигнала , Г—1 Л—1 г—1 — T.s^Ro+2 XRm + R2n^ у |Sm|2. (5.8) п i=—r m=l m=—г Вклад в среднюю мощность, вносимый членом 27?™ в выражение /?о + 2 27?™ + 7?2, разделяется в сумме 2|S™|2 на две ча- сти, каждая из которых равна | Sm j2 = 7?™: одна соответствует частоте mf lt другая частоте — mf1. Таким образом, практически любой Дискретно заданный геофи- зический сигнал можно представить в виде амплитудного и фазо- вого спектров, образованных гармониками основной частоты 1/лД, полагая интервал задания сигнала его периодом. Максимальной из этих частот является частота 1/2А, поэтому сигнал st имеет ог- раниченную полосу частот. Выражения (5.3), (5.5), (5.7) представляют собой различные виды обратного дискретного преобразования Фурье, а (5.2), (5.6) — прямого преобразования Фурье. 133
Для восстановления сигнала по заданным его спектрам (ампли- тудному и фазовому) удобно использовать тригонометрическую формулу Si = Ko + 2 £ tfmcosp^+9J+tf„cos-^. (5.9) m=l \ П / П Пример. Необходимо рассчитать значение сигнала в точке i = — 2 при его заданных амплитудном Rm (Ro — 0,5, Rt = 1,13, R2 = 0,25, Rs = = 0,167) и фазовым <pm (0, —30°, 60°, 0°) спектрах (табл. 22). Решение. Для того чтобы воспользоваться формулой (5.9), требуется знание помимо Rm и <рт величины п. Отношение последней гармоники сиг- нала к его первой гармонике’^ = 1/пД): frp/fi = пД/2Д = п/2. Следовательно, величина п равна удвоенному значению номера послед- ней гармоники, т. е. п = 2г. Для нашего примера п = 2'3 = 6. Отсюда sZ=-2 = 0,5 + 2 cos (+ + Ri cos ( 2jl2(6 2) + + 0,167 cos 2Tt3(6 2) = — 2,96. В тех случаях, когда спектральный анализ проводится для дискретно полученных наблюдений, интервал, выбранный для об- работки, определяет нижнюю частотную границу спектра = = l/TA, а шаг наблюдений Л — верхнюю частотную границу fTp — 1/2А. Величиной 1/ТА характеризуется также спектральная разрешающая способность, т. е. разность между последовательно разделившимися частотами А/ = 1/ТА. При анализе спектров сигналов, полученных путем дискрети- зации непрерывных наблюдений (аналоговых сейсмических запи- сей, аэрогеофизических наблюдений, данных каротажа КС, ПС и т. д.) возникает явление наложения частот, рассмотренное при анализе спектров непрерывных периодических сигналов (см. § 24). С дискретизацией непрерывных сигналов тесно связан вопрос вы- бора оптимального шага геофизической съемки. Однако прежде, чем переходить к этим вопросам, приведем выражение для спект- ров’ двумерных дискретных сигналов. Разложение дискретно заданного сигнала в двумерный ряд Фурье имеет вид п ы . „ V* V* 2лт/Дх 2лрЛДр . sik = ) ) атв cos----------cos —z—— + Li Lt P nbx N&y i=l fe=l n N , V* V1 о 2лп»'Дх . 2лрЛДи Г > > Ртр COS---------SIH у + La l—i п&х N&y 1-1 fe=l n N , V* V1 • 2лт/Дх 2лрЛДи , + > > Утр «И-----------COS ; У + Z_j Ди н пДх N&y M fe=l 134
n N + ^^8тР 8’П i=l fe=l 2л mi Ax пДх s}n 2npfeAy ЛГДр ’. (5.10) где тир — номера гармоник в направлениях х и у. Рис. 20. Двумерный амплитудный спектр в пространстве (а) и на плоскости в изолиниях (б) Коэффициенты гармоник вычисляются по формулам: n N к ХП V'' 2nmi&x 2npkAy атв =----- > > st* cos--------cos —-——; тр nN LL nAx NAy ’ 1=1 Л=1 n N a x V4 V4 2лпг/Дх . 2лр/гДу pmp = —гг > > s«cos ——sin -zr—; nN La L-i nkx NAy ы n N (5.11) x V* V* •_ 2лт/Дх 2 л р/г Ду Ymp = —T7-) ) s^sin-----------COS ; *; nN La La nAx NAy i=l fe=l n N я x W1 • 2лпг/Дх 2лрйДу Smp=—) S<feSin----------------Sin \ , F nN La La n^x N&y где x = 1, если m = 0 и p = 0; x = 2, если m = 0 или p = 0; x = 4, если m>0 и p>0. Начало гармонического ряда при вычислениях по (5.10) и (5.11) помещено в начало координат системы X и У. Гармоники могут быть рассчитаны вплоть до значений т = п/2 и р = N/2. По ко- эффициентам Фурье (5.11) соответствующим образом находят ам- плитудный спектр: Rmp — &тр 4" Ртр ~Ь Утр + 5тр> О характере двумерного спектра можно судить по рис. 20. 135
При изучении геофизических полей Земли широко используется разложение по сферическим функциям, поскольку с их помощью выражаются распределения сигналов (наблюденных данных) по сферической поверхности. Сферические функции являются комбинациями синусо-косинус- ных функций и функций Лежандра, причем зависимость сфериче- ской функции от долготы определяется рядом Фурье, а от широты— функциями Лежандра: N п s(X, ф)= У, У (Л<„m) cos пгк + В^ sin тк)Р{п} (cos <р), (5.12) п=0 /п=0 где А, — долгота; <р — дополнение широты до 90°, а функция Рп"1’ (cos ф) — соответствующий полином Лежандра первого рода степени п и порядка т. Замечание о быстром преобразовании Фурье Рассматривая процесс вычисления амплитудного и фазового спект- ров, нетрудно видеть, что синусы и косинусы встречаются с одними и теми же аргументами. Алгоритм (Маркус Бат, 1974 г.), позволяю- щий объединить их и тем самым ускорить процесс вычисления спект- ра, получил название алгоритма (способа) быстрого пре- образования Фурье, сокращенно БПФ. Принцип этого алгоритма заключается в следующем. Обозначим дискретно задан- ный сигнал через s{, где i = 1, 2...п, причем п — четное число. Этот ряд значений сигнала разделяется на две части: первая со- стоит из дискретов с нечетными индексами, а вторая — с четными, причем i = 1, 2, . . . , п/2, т. е. Xi = Sa/-i = Si, s8, ...» sn_j, yt= Sm = $2, 84, . . . , sn. Используя эти выражения, можно записать дискретные преоб- разования (ДПФ) трех рядов (суммарного и двух частичных и t/О как =-----У s< ехр (—j2nmiln)’, п ,=1 „ "/2 ; Х%,2) = — xi ехр (—/4л/ш7п); о "/2 у(Л/2) = - £ у{ ехр ^j4ntni/n), п i=\ Число Членов в равно и, а в Х^/2) и У^/2) равно п12. Дан- ные три ряда связаны между собой, и их преобразования также связаны, что следует из разложения п/2 —£ {х,ехр[—/(2шп/п)(2/—1)]+ п i—1 136
। n/2 + ut exp [—j (2nmi/n) 2i]} = exp (j2nm/n)-£ xt x n (=1 Л/2 X exp [ — j (4ntn/N) i] 4-У yt exp [—j (4лт/п) i] = n i=l =-^- exp (j2nm/n) Xm2) + -у- Ут2>< Заменяя m на m 4- n/2, находим v(n/2) y(n,2). y(n/2) y(»/2) Am-|-n/2 — Am > I m+n/2 — ‘m • поскольку 4nmi/n -> (4n/n) (m 4- n/2) i — (4nmi/n) + 2ni, что в случае целого i составляет показательную функцию без из- менений. Отсюда получаем 5(Дп;2 = (1/2) ехр [/ (2л/п) (т + п/2)] Х^„/2 + (1/2) У^/2 = = -(1/2) ехр (]2пт/п) х£/2) + (1/2) У £/2). Формулы для т = 0, 1,2,..., (п/2) — 1 5<тл) = ехр(/2лт/п) Х(”/2> + -±- У("'2>; для т + п/2 = п/2; п/2 4- 1, , п—1 S^n 2 = - -у-ехр /(2лт/п) ХЙ/2) + У<£/2). Эти формулы позволяют вычислять преобразование заданного ряда по преобразованиям двух частных рядов xt и yt. Если же п/2 — четное число, процесс можно продолжить, т. е. каждый ряд Х( и у( можно снова разделить на два частных ряда и найти преобра- зование каждого из них и так далее, пока число членов в частных рядах четное. Последнее условие выполняется при n = 2к, k — целое число. При этом описанный процесс продолжается до тех пор, пока в каждом из частных рядов не останется по одному члену. Преобразования Фурье этого члена совпадают, что видно из выра. жения для Основное преимущество БПФ по сравнению с обычным преоб- разованием Фурье — увеличение скорости вычислений благодаря меньшему числу операций. Число арифметических операций в ал- горитме БПФ 2kn = 2n logs п, а при обычном преобразовании Фурье п2. При п = 4096 и k = 12 выигрыш во времени состав- ляет 171 раз. 137
§ 24. СПЕКТРЫ НЕПРЕРЫВНЫХ СИГНАЛОВ И ИХ ДИСКРЕТНЫХ АНАЛОГОВ Спектры непрерывных сигналов Любой непрерывный периодический сигнал (более точно, сигнал, удовлетворяющий условиям Дирихле) может быть представлен в виде ряда Фурье оо s(0=Ao + 2 У, (Amcos2nrnfit + Bmsin2nmfit), (5.13) т=\ где = 1/7 — основная частота; Т — период сигнала. Коэффициенты Фурье Ап и Вт находятся путем умножения (5.13) на cos 2nmf1t и sin 2nmfit и интегрирования по t на отрезке [— 7/2, 7/2] с использованием свойств ортогональности функций синуса и косинуса: ! 7/2 Ат—------- f s(t)cos2nmfitdt-, Т — Т/2 1 г'2 Вт=------- J s(0sin2nmfitdt. Т —Т/2 (5.14) Амплитудный, фазовый, комплексный, комплексно-сопряженный и энергетический спектры непрерывных периодических сигналов определяются по тем же формулам (5.4), (5.5), (5.7), что и спектры дискретно заданных сигналов: Rm— Am-\-Bm> фщ — arctg ( Bm/Am); 7/2 Sn= — I s(0exp(—/2nmfi0d0 (5.15) T —7/2 I $т I = SmSm — Rm> Все эти спектры, как и спектры дискретно заданного сигнала, являются линейчатыми, однако не имеют ограничения по частоте, так как /гр = 1/2А -> оо при А -> 0. Формула для восстановления (синтеза) непрерывного периоди- ческого сигнала по его спектру в комплексной форме (обратное преобразование Фурье) принимает вид s(0 = У Smexp(/2nmf10. (5.16) т=—оо Далеко не всегда геофизические сигналы можно считать перио- дическими, поэтому практическое значение имеет рассмотрение спектров апериодических непрерывных сигналов. Апериодический сигнал можно считать периодическим с неограниченно увеличи- вающимся периодом. По мере того как 7 стремится к бесконечно- сти, частотный интервал между соседними гармониками в спектре становится бесконечно малым, что приводит к непрерывному рас- пределению амплитуд по частоте, 138
Запишем уравнение (5.16) в виде s(/) = X (TSm)exp(j2nmt/T)/T. (5.17) В пределе, когда Т -> оо; m/T -+ f-, 1/Т -+ df, (TSm) ->S (f), выражение (5.17) стремится к интегралу s(/) = У S (f) ехр (/2л//) df. (5.18) —00 Аналогично выражение (5.15) можно переписать в виде T/2 TSm= f s(/)exp(—j2nmtlT)dt. —T/2 В пределе, когда Т -> оо, получаем 00 S(/) = У s(/)exp( —j2nft)dt. —00 (5.19) Уравнения (5.18) и (5.19) являются уравнениями прямого и об- ратного преобразования Фурье для апериодического непрерывного сигнала, их называют Инте- £(t) тралами Фурье. Ампли- а _ тудный и фазовый спектры апе- \. риодического сигнала ---:-------------------*- /?(/)= д/Аа(/) +В2 (/); (5.20) <p(/) = arctg[ —В(/)/А (/)], где коэффициенты Фурье А (/) = У s (/) cos 2nftdt, —00 В (f) — f s(t) sin 2nftdt. s(t) Рис. 21. Непрерывный сигнал (5-21) в Ф°Рме убывающей экспоненты ' 7 с периодом Tt (а) и его ампли- представляют собой непрерывные спектры (б)^ И *аз0ВЬ1и ф функции частоты и являются сплошными. Амплитудный и фазовый спектры для сигнала вида ( ехр(—at), />0, S(*)=l 0, /<0 приведены на рис. 21. Произведение комплексного S (/) и комплексно-сопряженного S* (/) спектров образует спектр мощности апериодиче- ского сигнала F(/) = S(/)S*(/) (5.22) 139
Другая форма преобразования Фурье апериодических сигна- лов связана с введением круговой частоты со = 2nf, при этом урав- нения (5.18), (5.19), (5.22) принимают вид: s (0 = —L. f S (со) exp {jcnt) dco; —оо S(®) = f s(Oexp(—jat)dt; (5.24) W (co) = S(®) S* (co). (5.25) Соответствующие выражения для двухмерного преобразования Фурье: (5.23) Рис. 22. Система коорди- нат для случая двумерной круговой симметрии. у = г sin 0; = Р ®1пф Ханкеля. Прямое с учетом системы координат, приведенной на рис. 22, имеют вид: s (х, у) = —— (2л)’ (йу) ехр [/ (<ох • X + а>у • у)] daxd<ay-, (5-26) у) ехр [—/ (шж • X+,соу • у)] dxdy, (5.27) а — х = г cos 0, б — е>х = р cos ф. где сох, (£>у — пространственные часто- ты (волновые числа) по направлениям осей х и у. Особый интерес представляет дву- мерное пространство с круговой сим- метрией. В этом случае преобразова- ния Фурье эквивалентны преобразо- ваниям Ханкеля, или спектрам и обратное преобразования Ханкеля S (р) = 2л j г S (г) Jo (pr) dr; {5.28) s(r)= j pS {р) J0 {pr) dp, где г = V*2 + “2 : (5.29) p = д/®2 + tt»2 ; Jo{/pr) — функции Бесселя нулевого порядка. Свойства преобразований Фурье При спектральном анализе геофизических данных широко исполь- зуются основные свойства преобразований Фурье, которые приве- дем для апериодических сигналов, но которые справедливы как для дискретных, так и для непрерывных сигналов: 140
1) свойство линейности, состоящее в Том, ЧТо если Sj (0 имеет спектр Sj (со), т. е. Sj (t) ♦+ Sx (со), a s2 (t) — спектр S2 (со), т. е. s2 (0 ** S2 (со), то (0 ± a2s2 (0 «-» (со) ± a2S2 (со), где ах и а2 — постоянные числа. Это свойство распространяется на любое конечное число сигналов и соответствующих им спектров; 2) свойство симметрии прямого и обратного преобразо- ваний Фурье заключается в отличии только в знаке экспоненты. Для четных сигналов исчезает и это различие, т. е. S (®) = 2 J s (0 cos (0 &td i** s (0 = 2 f S (®) cos cofdco. о 0 Отсюда следует вывод о том, что фазовый спектр для четных сигналов тождественно равен нулю; 3) свойство подобия, состоящее в том, что сжатие (растя- жение) сигнала приводит соответственно к растяжению (сжатию) спектра. Вследствие обратной размерности времени и частоты спектр во столько раз растягивается (сжимается), во сколько раз сжи- мается (растягивается) сигнал при сохранении их формы. Если s (0 ♦+ S (со) и а — постоянное число, то s (a0-w(l/a)S (co/a). От- сюда следует важный практический вывод о том, что, чем сигнал короче, тем спектр шире; 4) свойство запаздывания сигнала на время т, при- водящее к изменению фазового сдвига каждой гармоники на сот без изменения амплитудного спектра, т. е. если s (0 ++ S (со), то s (t ±т) «->• ехр (± /сот) S (со); 5)_свойство смещения спектра на величину со0, ко- торое приводит к умножению сигнала на комплексную величину, т. е. если S (со) ++ s (0, то S ( со ±<о0) <-<• ехр (± /соо0 s (0. Таким образом, временная функция оказывается комплексной. Вещественный характер сигнала сохраняется при смещении спектра, если выполняется условие S (— со) = S* (со). Разлагая выражение еХр (zp /соо0 с помощью формулы Эйлера и используя свойство линейности, получаем два важных соотношения: s (0 cos coq/ ++ (1/2) (S (со + со0) -Ь S' (со — о>о)]> s (0 sin соо/ ** (1/2) [S (со + соо)—S (со—соо)]. Это означает, что спектр раздваивается на одинаковые части, которые смещаются относительно друг друга по частоте на ± соо. Приведенные соотношения используются для объяснения рас- щепления частоты как явления, вызываемого амплитудной моду- ляцией; 6) свойство дифференцирования сигнала, со- стоящее в том, что если s (0 ++ S (со), то s' (0 ++ /coS (со) и S' (со) ~ - jtf (0. Таким образом, дифференцирование сигнала приводит к обога- щению спектра высокочастотными составляющими и уничтожает составляющие с нулевой частотой. Дополнительно появляется сдвиг фаз на л/2 для всех гармоник. Приведенные результаты распро- 141
ограняются на любую производную высшего порядка п, т. е. s<"> (/) ** (j®)nS (со); S<<*> (со) +* (— jt)ns (0; 7) свойство интегрирования сигнала, заключаю- оо щееся в том, что если s (/)<->• S (со), то f s(t)dt «-> (l//co)S(co). —ОО Последние два свойства применяют в тех случаях, когда запись одного сигнала является производной или интегралом другой. Например, скорость v (t) = s'(t) ** i(oS (co) = coS (co) exp I/ (n/2) ] и ускорение a (t) = s" (/) «+ — <o2S (co) = a>2S (co) exp (/л); 8) свойство свертки двух сигналов. Сверткой сиг- налов (функций) называется выражение 00 J Si^Sa^—T)dT = s1(0*sa(/). —оо Спектр свертки сигналов равен произведению спектров этих сигналов, т. е. ОО f Si(0sa(/—Si (со) S2 (со); —00 В частном случае свертки с функцией обратного времени, т. е. когда s2 (i) = Sj (— t), s (/)* s (—0 ~ S (®) S* (co) = I S (co) Is; 9) свойство свертки двух спектров аналогично предыдущему, т. е. свертка двух спектров равна произведению функций: j Si (со) S8 (со—v) dv = Si (со)* S8 (со) ++ Si (f) s8 (t). —oo Используя это свойство, легко получить выражение для энергии апериодического сигнала, выраженной через спектральную плот- ность: J &(t)dt = J s(/)[-^— J S(co)exp(/cof)dcold/== = J S(co)dco f s(/)exp(j<i>t)dt= —J— f S(co)S*(®)dco = —OO —00 2л —oo = “ |S(co)|adco. (5.30) 2Л — 90 Спектры некоторых непрерывных сигналов На основе приведенных выше свойств преобразований Фурье рассчитываются спектры сигналов, использование которых имеет важное значение для изложения дальнейшего материала. 142
1. Дельта-функция Дирака, определяющая импульс единичной площади в виде 6(0 = 0, /=/=0; f &(t)dt=\, / = 0, —00 имеет спектр, равный единице, т. е. 6 (0 «->• 1. Это следует из свой- ства свертки сигналов, поскольку свертка с единичным импульсом не меняет сигнала. 2. Функция единичного скачка (Хевисайда), или- ступенчатая функция, ( 1, t >0, Г е , “«“{о. ко, »(0= т. е. -^-«(0=6(0; jcoSB(®) = l. at Это справедливо и для суммы единичной функции с постоянным числом. Мнимый спектр имеет только нечетная функция, равная и (0 — 1/2; и (0 — 1/2 ~ 1//<о. Учитывая спектр постоянного числа, получаем и (0 ** яб (со) — //со. 3. Прямоугольная функция (прямоугольный импульс) единич- ной высоты и длительностью т (1, |*|<т/2, S(°“l0, |*|>т/2 имеет спектр, равный 5(со) = J ехр (—/®0 dt = т [sin (сот/2)/ (сот/2)]. Отсюда следует, что прямоугольный спектр в полосе частот — со0/2 < со < со02 имеет функция s (0 = sin лсоо//ясоо0 называе- мая функцией отсчета. 4. Треугольная функция (треугольный импульс) s(0 = { 111 С т/2, |0>т/2, рассматриваемая как свертка двух прямоугольных функций, имеет спектр S (со) = sin® (<вт/4)/(<вт/4)® = [ 1 — cos® (сот/4)/(<вт/4)®]. 5. Знаковая функция , I -1, />0 «““I-1, КО, имеет спектр S (со) = — 2//со, 143
6. Косинусоида cos <ooZ имеет спектр л [6 (cd + ®0)+ 6 (©—соо)]. Для отрезка косинусоиды ( cos at, т/2 < t < т/2, 0, |<|>т/2, который можно рассматривать как произведение косинусоиды и прямоугольного импульса (что приводит к раздвоению спектра прямоугольника) имеем спектр з (со) = т Г Sin [(<Р — <о0) т/2] 2 I (со — Оо) т/2 sin [(о 4- о0) т/2] (о + Ор) т/2 Форма спектра определяется числом периодов косинусоиды п = соот. Для полупериода косинусоиды, когда п = 1/2 с дли- тельностью х = 1/2со0, т Г sin (от/2 — л/2) , sin (<от/2 + я/2) 2 L ©т/2 — л/2 ют/2 + л/2 __ 2т cos (ют/2) л 1 — (оЧ’/п1 7. Затухающая экспонента (функция Лапласа) ехр (—а|/|), .используемая для оценки АКФ некоторых типов помех, имеет спектр S (со) = 2а/(а2 + со2). 8. Колоколообразная функция (функция Гаусса) ехр (—а/2), применяемая для аппроксимации АКФ аномалий Ag над анти- клинальными структурами, имеет спектр S (со) = л/п!а ехр (—со2/4а). 9. Функция Бергале, применяемая для описания сейсмических импульсов t ехр (— a/) sin соо/ имеет спектр S (со) = 2сОо(а + /<в)/[(а + /со)2 + со2]2. 10. Для гравитационных и магнитных аномалий от тел простей- ших форм С. А. Серкеровым рассчитаны спектры, приведенные в табл. 23. Дискретизация непрерывных сигналов. Теорема Котельникова Как уже отмечалось, в практике обработки геофизических данных используются в основном дискретно заданные сигналы. Поэтому зарегистрированные аналоговые записи необходимо подвергнуть дискретизации таким образом, чтобы информация о физическом поле была бы минимально искажена. Интервал дискретизации непрерывного сигнала определяется на основе теоремы (прямой) Котельникова. Любой сигнал s (/), описываемый функцией с ограниченным спектром, определяется однозначно своими значениями, расположенными че- рез интервал А/ = л/согр = 1/2 /гр. Заметим, что любой сигнал, 144
Таблица 23 Характеристика объекта Выражение для поля (аномалии) Выражение для спектра Бесконечная линия по- люсов (т-магнитная масса) Z = 2m х2 + Л2 S(®) = "|/2л m | w | e—। 'h Бесконечный горизон- тальный круговой ци- линдр, бесконечная ли- ния полюсов или одно- полюсная линия Ag = 2vA, - хг + Л2 S(<n) = V2nvA,e-l‘olh Бесконечная дипольная линия или намагничен- ный бесконечный гори- зонтальный круговой цилиндр й2 —X2 Z = 2т — -— (х2 + Л2)2 S(co) ~ l/2n m |co | e— 1 “1 A Бесконечная горизон- тальная полоса шириной 21 S(to) = 2Д/2зт vp S'n—- x (0 X e— 1W1 tl \ Л sretg л ) Бесконечная горизон- тально заряженная по- лоса шириной 2/ или пря- моугольная призма бес- конечной длины шириной 2Z, расположенная так, что верхняя грань парал- лельна поверхности зем- ли при вертикальном на- магничении Z = 2m ^arctg х _ »dg н ) 5((о) = 2У2я m^5-^ X CO Xe-lal* Бесконечная вертикаль- ная материальная пло- скость Бесконечная вертикаль- но заряженная полоса х2 + S (и) = У2 л vp —— x l“l x (e-lе-|ш|Лг) S (co) = У2л m —— X |co| x (e-l«>|h._ e~ x2 + hl х2-|- Z = m In x2 + hf Бесконечная горизон- тальная материальная полуплоскость Ag = 2vp(-y + + arctg — h / S(<B) = vp —e-l(0'h_ /co — У2л vp e~'“' h Бесконечная горизон- тальная дипольная пла- стинка шириной 21 , 4m/(ft2-H2-x2) S(ш) = 2У2л m sin co I X X е-1®1Л1®1 G) “ (х»+л*— 145
Окончание табл. 23 Характеристика объекта Выражение для поля (аномалии) Выражение для спектра Шар (точечная масса) Ag = vM S (p) = V M e“pft Точечная магнитная мае- , tnh S (p) = me~₽fc са Шар массы М ЛЛ 2Л» —x’-y2 ад == v M — S(p) = vMpe" ph Вертикальный диполь или вертикально намаг- ниченный шар „ m(2ft2-x2-y2) S (p) = m p e~pft (х2 + у2 + Л2)3/2 Горизонтальный прямо- угольный параллелепи- пед Ла AS=VOIUX x hd^di\dZ S(ox<b#) = X P X (e“ph‘ — e_phl) X [(*-E)2+(i/-n)2+E2]3/2 X e~/(“*E+V’) x dgdr] То же, при длине 2а и ширине 2Ь S (<в*Шу) = X P X (e_p*‘ — e_ph’) X X —-— X sin<B*asin УГ Примечание, v — гравитационная постоянная; а, ц. X — соответственно объемная, поверхностная н линейная плотность; h, Л„ Л, — глубины залегания соответственно центра тел, верхних и нижних границ этих тел. передаваемый по какой-либо системе, имеет ограниченный спектр, поэтому теорема Котельникова применима ко всем геофизическим полям. Функцию s (t), преобразование Фурье которой ограничено по- лосой частот—а>гр, (огр, можно представить в виде 1 ®Гр s(t)=—— j S(a>)exp(/®i)d®. —“гр Пусть t = iSt = in/©гр, i — любое целое число, тогда 1 ®гр s(iAi)=------- £ S (ш) ехр (/ni«>/(»rp) d®. —ш ГР (5.31) U6
В свою очередь, функцию S (со) можно представить рядом Фурье на интервале (— ©гр, согр) с периодом 2©гр как S (со) = — £ Ct ехр (/ш©/®гр), (5.32) где Ci — комплексные амплитуды вида 2л гр Ci — —-- J S(®)exp(—/nt©/©rp)d®. (5.33) 2шгр _Шгр Из сравнения (5.31) и (5.33) следует, что Ct = -?-s(-i). мгр шгр \ мгр / Рис. 23. График восстановления непрерывной функции (в) по ди- скретным отсчетам (а) при ап- проксимации рядом Котельни- кова (б) Таким образом, коэффициенты Фурье С{ в разложении (5.32) пропорциональны значениям фун- кции s (0 в дискретные моменты времени iAt = ni/©rp. Разложение (5.32) полностью определяет функцию S (со) на интеграле (—со гр, согр), но по- скольку S (со) является спектром s (/), то сигнал s (/) также пол- ностью определен. Следовательно, знание значе- ний s (?) в моменты времени t = = п1/шгр = i/2frp достаточно для полного восстановления исходной функции, так как t = iAt = = i/2frp, Д/= 1/2/Гр. Иначе, для точного восстановления непрерыв- ного сигнала по его дискретным значениям частота дискре- тизации сод = 2л/Д/ должна по меньшей мере вдвое превосхо- дить граничную (максимальную) частоту спектра сигнала. С использованием приведен- ных выше выражений доказывается и обратная теорема Котельникова: любую функцию s (0. состоящую из частот от 0 до ®гр, можно представить в виде ” / ni \ sin (согр/ — nt) s (0 — 2j s \ шгр ) шгр/ — nt £~~ -oo r r (5.34) Ось симметрии этой функции приходится на момент времени t = nil&rp, в которой она равна единице. В моменты же времени t = nk/a>rp, k Ф i, она равна нулю. Следовательно, сумма (5.34), называемая также рядом Котельникова, в момент вре- мени t — nt/corp дает значение функции s (ш7©гр), так как все ос- 147
тальные члены суммы в этот момент равны нулю. На рис. 23 про- иллюстрировано образование сигнала s (t) из функций, стоящих под знаком суммы в (5.34). Влияние величины интервала А/ на форму спектра S (<о) может быть показано на следующем примере [6]. Предположим, что не- которая непрерывная, вещественная и четная функция s (t) имеет Рис. 24. Графики, характеризующие влияние шага дискретизации иа форму спектра дискретного сигнала [8]. -2л/«гр о гх/шгр а — непрерывный сигнал; дискретный сигнал: б — Д/<л/<ог , в — Af = л/со , Д* >Л(1)гр Р Р ограниченный спектр S (<о) (рис. 24, а). Амплитуда спектра S (со) отличается от нуля только в интервале (— согр, <огр). Четность функ- ции введена лишь для получения вещественного спектра, упро- щающего его графическое представление. Пусть функция s (t) ди- скретизирована с частотой ®гр = 2л/А/ при условии согр/2>®гр (рис. 24, б). Тогда с учетом нормирующего множителя, равного 1/Af, основной и побочные спектры являются точными копиями спектра входного сигнала и полностью разрешены между собой. Следовательно, имеется возможность полного восстановления сиг- нала по его спектру. С возрастанием периода дискретизации Ai до величины, при которой <огр/2 =согр, картина меняется (рис. 24, в). При дальнейшем увеличении А/ начинается взаимное наложение основного и побочных спектров (рис. 24, г). Это наложение назы- вается элайсинг-эффект. Восстановление сигнала ста- новится невозможным из-за наложения его спектров. Явление наложения частот возникает при обработке данных. Предположим, что требуется вычислить длину записи Т и интер- 148
вал отсчета Д, причем известно, что изучаемый сигнал содержит две синусоидальные составляющие на частотах 50 и 49 Гц. Чтобы различить эти частоты в спектре, построенном на конечном интер- вале, надо взять МТ = 50 — 49=1 Гц, т. е. величина периода Т должна быть порядка 1 с. При оценке частоты порядка 50 Гц ве- личина 1/2Д должна быть по меньшей мере 50 Гц и, следовательно, Л <10 мс. Таким образом, нужно взять по крайней мере 100 точек. Если бы потребовалось различать две частоты 99 и 100 Гц, необ- ходимая запись была бы также 1 с, однако интервал отсчета 5 мс, так что потребовалось бы 200 точек. Итак, длина записи Т определяет степень различимости пиков, а интервал отсчета Д — максимальную частоту, которую можно различить. В сейсморазведке при регистрации среднечастотных колебаний в методе отраженных волн шаг дискретизации Д/ принят равным 0,002 с, т. е. frP = 250 Гц, тем не менее из-за наличия уровня мик- росейсм, спектр которых достигает 400 Гц, высокочастотных со- ставляющих сигнала, аппаратурного шума, из-за эффекта нало- жения спектров возникает усиление нежелательных частотных со- ставляющих. С этим явлением обычно борются путем фильтрации записи перед ее анализом с использованием фильтров низкой ча- стоты большой крутизной. При регистрации каротажных диаграмм в нефтегазовой геофи- зике шаг дискретизации принят Д/i = 0,2 м, в рудной геофизике Д/г = 0,025 и 0,05 м. Регистрация полей цифровой электроразве- дочной станцией (ЦЭС-3) осуществляется с интервалом Д / = 0,05 с и менее. В полевых методах магнито-, грави- и электроразведки дискрет- ность наблюдений определяется шагом съемки. Оптимальная его величина может быть получена путем расчета спектров для наи- более узких ожидаемых аномалий и ограничения спектров на ча- стоте (оГр при уровне в 5—10 % от максимума, при этом Дх = л/(Орр • § 25. СПЕКТРЫ СЛУЧАЙНОГО ПРОЦЕССА Для случайных процессов, основной характеристикой которых является автокорреляционная функция (во временной области), также можно рассмотреть частотные представления. Поскольку существует непосредственная связь между характе- ром АКФ и внутренней структурой соответствующего случайного процесса в зависимости от того, какие частоты и в каких соотно- шениях преобладают в составе случайного процесса, его АКФ имеет тот или иной вид. Эти соображения и лежат в основе спектрального анализа случайной функции (процесса). Спектр показывает, какого рода колебания (гармоники) преоб- ладают в данном процессе, какова его внутренняя структура. Спектральное описание можно дать и стационарному случайному процессу. 149
Отличие спектров стационарного случайного процесса от спект- ров детерминированных сигналов состоит в том, что для случай- ного процесса амплитуды гармоник будут случайными величинами. Спектр стационарной случайной функции описывает распределе- ние дисперсий по различным частотам. Если для стационарного случайного процесса построена АКФ, его спектр вычисляется по автокорреляционной функции. При этом получаем различные выражения для спектров случайного процесса в зависимости от того, как задана его автокорреляционная функ- ция: в виде дискретно заданного сигнала с периодом Т, в виде непрерывного периодического или апериодического сигнала. По- скольку АКФ — четная функция, при разложении в ряд Фурье учитываются только четные (косинусные) гармоники. Тогда для АКФ (i) как дискретного сигнала имеем Sm = У. К(/)ехр(— j2amr/n) = -^— £ R(i) cos 2nmi.. • (5.35) П i=—r П i=—r П для АКФ в виде непрерывного периодического сигнала R (т) с пе- риодом Т Т/2 Т/2 sm = у- R (т) cos — с/т = ~ R (т) cos соттс/т; (5.36) о и для АКФ, заданной в виде апериодической функции, S (со) = J К(т)ехр(—/сот)с/т = 2[ К (т) cos сотс/т. (5.37) —оо О Поскольку нечетные гармоники для спектра АКФ отсутствуют, выражение (5.37) совпадает с энергетическим спектром. Чаще всего функция S (со) в (5.37) называется спектральной плот- ностью случайного процесса. По аналогии с разложением в ряд Фурье, случайная функция (процесс) может быть представлена в виде так называемого кано- нического разложения 0 “ Х(/)= 2 (Amcoscom/ + Bmsina>mO, (5.38) m=0 где Am и Bm — некоррелированные случайные величины с нуле- вым математическим ожиданием и дисперсиями, одинаковыми для каждой пары случайных величин D (Am) = D (Bm) = Dm, опреде- ляемых по (5.36) при разных т. Спектральное разложение (5.38) представляет стационарную случайную функцию, разложенную на гармонические колебания с частотами ©х, . . . , ©m, . . причем амплитуды этих колебаний являются случайными величинами. 150
По свойству о дисперсии линейной функции некоррелированных случайных величин (см. табл. 2) находим дисперсию случайного процесса Dx=D[X (01 = S (cos2 &mt + sin2 &mt) Dm = fll=0 oo = 2Ж 0 Таким образом, дисперсия стационарной случайной функции равна сумме дисперсий всех гармоник ее спектрального разложе- ния. Спектр стационарного случайного процесса изображается в виде спектра дисперсий для (5.35) и (5.36), а сумма всех ординат этого спектра равна дисперсии случайного процесса. Спектр стационар- ного случайного процесса в виде спектральной плотности представ- ляет собой сплошную линию, однако площадь, ограниченная этой линией (кривой) S (®) по-прежнему должна быть равна дисперсии оо случайного процесса: Dx = f S(co)<i®. о Очевидно, что через спектральную плотность случайного про- цесса можно выразить его АКФ: Я(т) = 1 2л ОО 00 f S (со) ехр (/сот) da =----------J S (со) cos ardr. —оо Л О (5.39) Выражение (5.37) использовано для расчета энергетических спектров распространенных в геофизике моделей АКФ (см. рис. 15). На рис. 15 приведены спектры наиболее распространенных АКФ. Спектр АКФ единичного импульса (спектр белого шума) является сплошным (см. рис. 15, а). Спектр АКФ треугольного типа (см. рис. 15, б) выражается зависимостью IT (со) = 2 (1—cos сог)/лг®2 (г — интервал корреляции) и представлен затухающими по ве- личине экстремумами, расположенными через интервал 2л/г0. Спектр АКФ марковского типа [затухающей экспоненты ехр (— ат) ] приведен на рис. 15, в и описывается выражением IT (со) — al [л (а2 + со2)]. Спектр АКФ гауссова типа IT (©) = = гд/я"ехр(—®8г2/2) имеет такую же, как АКФ, колоколооб- разную форму (см. рис. 15, г). Спектр АКФ затухающей по экспо- ненте косинусоиды выражается формулой а W (со) = —— (------------------------------1-------------------- ' ’ 2л V а’ + (о + Р)2 а2 + (<о — Р)2 и представлен на рис. 15, г. Приведем энергетические спектры и АКФ некоторых распро- страненных моделей случайных процессов, используемых в гравиразведке и других геофизических методах: 151
1) для случайного процесса с равномерным энергетическим спектром I А, 0 =£ ®<®гр> Г(®)= Л ( 0, ®>®гР, описывающего белый шум с ограниченной полосой, 9 7 2Л V R (т) =---f W (®) cos aid® =---- f cos ©id® = 2л о 2л о __ Л coгр sin согрт л согрт ’ 2) для случайного процесса, описывающего ошибки наблюдений при работе с гравиметрами (по С. А. Серкерову), АКФ имеет вид R (т) = R (0) ехр (—ат) cos 0т, а энергетический спектр U7 (®) = -АВ. Г----5------1-----2------1. 2л L а’ + (о + Р)2 а2 4- (со — р)2 J 3) для случайного процесса, описывающего аномалии от беско- нечного горизонтального слоя со случайным расположением беско- нечных горизонтальных контактов (по В. Н. Глазневу), R(t) = 21nf V н. , 4Я| + т2 In--------, 4/^ + т2 где Hi и Н2 — глубины залегания верхней и нижней границ го- ризонтального слоя. Соответствующий энергетический спектр W (®) = R (0) f 2 In — [ехр (-гоН^-ехр (—2®Н2)]; \ Л1 / со 4) для контактной поверхности, заданной в виде случайного процесса величинами z, характеризующими отклонение границы раздела от Н, где Н — глубина залегания контактной поверхности, причем | z \/Н < 1, получаем следующие типы АКФ и их спектров. При избыточной плотности Аоп = const гравитационный эффект двухслойной среды на уровне Н, как известно, равен Ag (?) = = 2nGA<rnz (?), где G—гравитационная постоянная, и R (т)х = = (2nGAcrn)2R (т)2, где R (т)х и R (т)г — АКФ аномалий границы раздела и самой границы, т. е. контактной поверхности. Энергети- ческий спектр при этом будет ^(®)1 = (2лОАоп)а^(®)г. Тогда энергетический спектр аномалии на оси х, с которой сов- падает начало координат, на высоте Н от средней линии контактной поверхности W (®) = (2л0АОп)4 * * * 8 ехр (—2®//) W (®)г. 152
Если распределение z полагать белым шумом, то ( (2лОДоп)2 А ехр (—2аН), О С со С ©гр, U7(®) — I qj ©>югр. Тогда при (огр —> оо (достаточно считать согр > (3-4-4)///) АКФ имеет вид R (т) = —— J W (®) ехр (/ют) d© = = —— (2лОДоп)2 A J ехр (—2©Н) cos ©rd© = 2л о = —(2лСДоп)2А-----—------ 2л ' ’ 4Я« + т® Если U7(©)= ехр (—©720), д/2л при R (т) = R (0) ехр (— 0т2) имеем W (®) = (2лОДоп)2-ехр (—2©Н — ©а/40). V20 Если контактную поверхность аппроксимировать последова- тельностью взаимно независимых функций вида f (х) = ЬгЦх* + г2), где z — глубина залегания эквивалентного цилиндра, радиус кор- реляции элемента контактной поверхности гг = лг, то U7 (©) = д/я /2 л ft2 ехр (—2©Гг/л); W (®) = у/л/2 пЬг (2nfAan)z ехр [—2© (Н + гг/л)]. При определении энергетических спектров (спектральной плот- ности) по АКФ, полученных по экспериментальным данным, сле- дует иметь в виду, что длина АКФ сказывается на разрешающей способности спектра. На рис. 25 приведена АКФ сейсмической за- писи длительностью 180 мс и ее спектры, которые рассчитаны для различных интервалов АКФ. Из рассмотрения этих спектров сле- дует, что они становятся все менее разрешенными при уменьшении интервала АКФ. Для спектрального анализа нестационарных случайных про- цессов используется понятие текущего спектра. При этом применяются преобразования Фурье с той лишь разницей, что пределы интегрирования изменены таким образом, чтобы учесть нестационарность изменения процесса по времени. Учет неста- ционарности производится либо интегрированием от — оо до не- которого момента времени t0 и дальнейшего дифференцирования результата, либо интегрированием от т0 до т0 + бт0 на небольшом интервале. 163
В случае первого приема обработки определяется текущий спектр Фурье У» 5(т0, (!))== I s(/)exp (—jatjdt. (5.40) —00 в предположении, что s (f) = 0 для />т0. Рис. 25. Автокорреляцион- ная функция (а) и оценки ее спектров (б) при различ- ной длительности АКФ (1-3) [Н] О 20 40 60 80 100 f,Гц Текущий спектр является функцией двух переменных <в и т0. Он характеризует процесс формирования спектра, причем S (®) = lim S (со, т) Т->оо Подставив (5.40) в (5.30), находим -J- ” |S(T, ®)|«d®= I1 |5(П|‘Л, ZJl —00 —ОО а продифференцировав это выражение по верхнему пределу интег- рала, получаем *00 ®)lad® = ls(To)l8- хЛ —оо uCq Правая часть последнего выражения — мгновенная мощность сигнала, т. е. мощность (энергия) в момент времени т0, а d'/difJS (то,со)а — мгновенная спектральная плотность мощности (энергии). 154
Согласно второму приему оценки спектров нестационарных со- бытий определяется текущий спектр в виде /0+Дт„/2 s(t0, га, Ат0) = f s(f)exp(—(5.41) to— Дт0/2 где t0 — центральная точка в окне длительностью Ат0. Этот спектр принято изображать с помощью изолиний на гра- фике с осями т0 и ®, его построение использовалось при анализе дисперсии сейсмических поверхностных волн и при обработке ко- роткопериодных геомагнитных вариаций. Следует отметить, что аналогичный подход используется при построении автокорреляционных функций, когда вычисляется те- кущая АКФ, например при изучении распределения силы тяжести или вектора АТ с целью районирования гравитационного и маг- нитного полей. § 26. г-ПРЕОБРАЗОВАНИЕ И РАЗЛОЖЕНИЕ СИГНАЛОВ ПО ДРУГИМ СИСТЕМАМ ОРТОГОНАЛЬНЫХ ФУНКЦИЙ При построении линейных фильтров и их анализе широко исполь- зуется z-п реобразование последовательности дискретных значений, которым является полином п—1 ^(г)—fo + fiz 2 + • • • +fn-iz ' ,)== 2 ft2 1- (5.42) Если сигнал описывается последовательностью —1, —3, О, 1, 3, 2, его z-преобразование в соответствии с (5.42) будет F (?) = (— 1) г° + (3) г-1 + 0 • z~2 + г~8 + Зг-1 + 2z"8 = = — 1 —Зг-1 + г-8+Зг-1 + 2г"5. По заданному z-преобразованию однозначно восстанавливается исходная последовательность значений. Например, если / (г) = = 1—г-2, исходная последовательность /7 = 1,0, — 1. Если сравнить z-преобразование с преобразованием Фурье ди- скретно заданного сигнала . п-1 ___ Sm = — У. ft ехр (—jai/n), j = V— 1, п (=0 это выражение, отбросив нормирующий множитель 1/п, можно представить следующим образом: Sm = fo + fiexp(—/a>) + f2exp(—2/a>) + f8exp(—3/®)+ ... (5.43) При сравнении (5.43) с (5.42) видно, что под символом единич- ного сдвига z понимается комплексная величина ехр (/®А). Таким образом, z-преобразование — особая запись. комплексного спектра дискретной последовательности значений. С помощью z-преобра- 155
зования очень удобно представить операцию свертки двух сигна- лов: Pl (z) = f 10 + /llz 1 + /12z 2+ • • • +/1Л-1Z ''i Fz (z) = /20 + f21Z 1 + fzz^ 2 + . . . + m_iZ (m ’’ Перемножив оба z-преобразования, получим /^(z) f'l(z) =/20/10+ /WllZ-1 + f2o/12Z-2+ • . . +/Wln-lZ—(n—1,+ + f21floZ_1 + f21fllZ-2+ • • . +f21fln-lz—<n—1) + + /22floZ~2+ • • • +/22/1 n-lz—!) + • . + + fz m-lfl n-iZ_(n+m—2) = /20/10 + (/20/11 +/21/ 10) Z-1 + + (f20А2+ fllf21 +/22/10) Z~2 + . . . +/2 m-1/1 n-lZ~(n+"’~I). (5.44) При сопоставлении выражения (5.44) с (5.42) видно, что пер- вый член правой части (5.44) представляет собой начальный (нуле- вой) элемент полученной свертки. Коэффициент при г1 — первый ее элемент, коэффициент при г-2 — второй элемент и т. д., а вся правая часть (5.44) есть z-преобразование полученного нового сигнала, т. е. r(z) = F2(z)/?i(z), что совпадает со свойством ппеобразований. Фурье свертки двух сигналов. Выражения (5.42) и (5.43) описывают одностороннее z-преобра- зование, когда последовательность дискретных значений задается только для положительных значений I. В более общем случае z-пре- образование определяется через спектр вида S(co) = £ /гехр(—j®«) i=—00 и называется двусторонним z-п реобразованием F(z)= f /fz-‘. (5.45) /=—ОО Уравнение (5.45) определяет z-преобразование при условии, что независимая переменная z лежит на единичной окружности. В случае изменения со от — оо до оо комплексная переменная z вращается по единичной окружности в плоскости г, так как г = = ехр (ico) = cos соА/ + / sin coAf, делая при этом один оборот в направлении против часовой стрелки. При любом изменении со на величину ± 2л/Д в плоскости г происходит циклическое повто- рение, ‘которое является следствием процесса дискретизации сиг- нала, а абсолютная величина | z | = 1. Допустим, что а возрастает скачками, равными л/2Д, в интер- вале от 0 до 2л/Д. Тогда соответствующие значения г с учетом, что г = ехр (/ соА), равны 1; /; — 1; — /; 1 соответственно при со = 0; л/2Д; л/Д; Зл/2Д и 2л/Д. 156
При дальнейшем увеличении со от ®гр до 2согр значения z повто- ряются. Для некоторых функций z-преобразование можно выразить ана- литически. 1. Дельта-функция. Пусть дискретный эквивалент единичного импульса представляет собой последовательность fi = (..., О, О, 1, 0, 0, . . .), где точка над цифрой указывает на начало координат по оси времени, т. е. t = 0. Тогда 1=—оо т. е. спектр 6-функции — постоянная величина. Между последовательностью значений Д — (1, 0, 0, . . .) и еди- ничным импульсом 6 (/) существует четкая аналогия. Если еди- ничный импульс задержан на два интервала дискретизации, т. е. /,= (..., 0, 0, 0, 0, 1, 0, .. .) z-преобразование будет F (z) — z~2. 2. Единичная (ступенчатая) функция. Она описывается после- довательностью fi = (. . . , 0, 0, 1, 1, 1, . . .) и ее z-преобразование будет F1(z)=l + z-1 + z-2+ . . . =(l-z-1)-1= —L-Г- I^Kl. Если эта последовательность сдвинута на два интервала дискре- тизации, т. е. fi = (. . . , 0, 0, 1, 1, 1, 1, . . .), ее z-преобразование Fa(z) = z2 + z+l + z-1 + z-2+ . . . -г2Ег(г), |г-х |<1. Fi (z) и F2 (г) сходятся при | z |>1 или | г"11< 1, так как имеют единственную особую точку z = 1. 3. Затухающая экспонента. Зададим ее дискретами fi = = А ехр (—aiA), i > 0. Тогда ее z-преобразование F{z) = A (1+ехр(—aA/)z-1 + exp( — 2aAi)z~2 + • • •) = = Л/( 1—ехр (—aA/) г-1); | ехр (—aA£)z-11 < 1. Наряду с преобразованием (5.45) иногда используется преобра- зование Лапласа, выражаемое соотношением F(z) = Е (5-46) («в—-00 Переход от z-преобразования к преобразованию Лапласа осу- ществляется заменой г на г-1, при этом амплитудный спектр не из- меняется, а фазовый — меняет знак на противоположный. Отметим, что одностороннее z-преобразование (5.42) по форме совпадает с двусторонним (5.45), за исключением нижнего предела. Двустороннее z-преобразование можно записать в виде t=o 1=0 157
Первая сумма здесь представляет собой одностороннее z-преобразо- вание, которое сходится для | z !>/?!, где — верхний предел последовательности (ft)*'1- Вторая сумма сходится для |z|<R2« где R g — верхний предел последовательности (fi)~*ft. Обратное z-преобразование может быть записано через контур- ный интеграл Л= V-f F(z)zl~'dz, /=0, 1, 2, . . . 2л/ с Контур интегрирования С включает все точки F (z), а интегри- рование ведется против часовой стрелки. Контур С выбирается так, чтобы он лежал внутри области сходимости ряда (5.42) и вклю- чал в себя начало координат: z = 0. Величина контурного интег- рала определяется особыми точками подынтегрального выражения. Применяя теорему Коши, имеем Л = Zres[F(z)z‘-1], i = 0, 1, 2, . . . , причем суммируются все особые точки, заключенные в контуре С. Поскольку особые точки F (z) могут быть как внутри, так и вне контура интегрирования, теорема Коши обеспечивает две возмож- ности при нахождении ft, а именно ft — Sres [F (z) г1-1], т. e. все полюсы находятся внутри единичной окружности, и fi = = — Sres [F (z) z1-1], т. e. все полюсы расположены вне единич- ной окружности. На основе (5.42) z-преобразование позволяет вычислить ком- плексный спектр как функцию вещественной переменной. Запишем (5.42) в виде ^(z) = fo + fiexp(—/©Д) + /гехр(—/а>2Д)4- .... (5.47) В соответствии с (5.47) для данной частоты © = ©0 комплексный спектр находится как сумма векторного ряда. В качестве примера найдем комплексный спектр F (г) последовательно- сти чисел ft'= (. . . , 0, 0, 0, 1,2, 3, 4, 0, 0, . . . л) для частот, равных 0, л/2Д, 2л/2Д, Зл/2Д [8]. Из выражения (5.47) следует, что значение спектра для со = 0 можно найти простым суммированием F (1) = 1 + 2 + 3 + 4 = 10, так как все экспоненциальные множители ехр (— /цнД) в (5.47) становятся веществен- ными и равными единице. Для более высоких частот получаем: <о = л/2Д; Д(г)= 1+2е_/я/2—3 + 4е_,3я/2 = — 2 + 2/; со = л/Д; F (г) = 1 + 2е“/я + 3 + 4е_/я = — 2; со = Зл/Д; F (г) = 1 + 2е_/3я/2 — 3 + 4е“/я/2 = -2 — 2/. Отсюда значения амплитудного и фазового спектров для заданных частот со: Rm фт 0 10 0 л/2Д 2^2 Зл/4 л/Д д/2 — л Зл/2Д 2 VF — Зл/4. 158
Значения амплитудного и фазового спектров для частоты о = 2л/Д будут такими же, как и для частоты со = 0, в силу свойства периодичности спектра, так как 2л/Д = согр. Помимо преобразования Фурье, z-преобразования и преобра- зования Лапласа в обработке геофизических данных находит при- менение разложение полей по другим системам ортогональных функций. Часто рассматривают эти системы на отрезке Т [— 1, 1 ], т. е. с периодом, равным 2. На отрезке Т [— 1, 1] получают систему полиномов Лежандра: Фо (t) = —L_; ф1 (t) = д/3/F t- <р2 (0 = д/5/2 (3/а/2 — 1/2); уг фз(0 = л/7/2 (5£а/2—3t/2); . . . ; ф„ (£) = д/(2п+ 1)/2 Рп (t), где Рп (/) = —----------1)» ' ’ 2"л1 dtn к ' — общий вид полинома Лежандра. На этом же отрезке Т [— 1,1] рассматривается система поли- номовЧебышева фл(/) = 2п(2л)—1/2Тл (/), где Тп (0 — полиномы Чебышева: T0(t), . . ., Tn(f) = -^~ cos (п arccost). Из полиномов Чебышева путем замены % = 1—2 ехр (— 2pf) получаем функции Чебышева р„(0 =2п(р/я),/2Тл(1-2ехр(-2рО). В последнее время все большее внимание уделяется функ- циям Уолша, представляющим собой ортонормированную систему функций типа прямоугольных волн (рис. 26). Эти функции принимают значение только 1 или — 1 и обозначаются символами IT (k, i), где k — частота следования, i — текущий дискрет сиг- нала. Для дискретного сигнала Д, заданного на интервале (0, п)’, т. е. О < i п—1, п — 2Г, где г — целое положительное число, рассматривают систему функций Уолша как заданную либо на интервале (0, 1), либо на интервале (0, л), состоящую из п дискрет- ных базисных функций W (k, i), по которым и проводится разло- жение дискретного сигнала. Такая система образует квадратную матрицу размерности п, номера строк которой k, а каждая строка обозначает функцию Уолша с номером i, причем 0 < k < п—1. Спектр Уолша определяется соотношением S{k)=^-YftW{k, I), (5.48) п 159
а обратное преобразование Уолша Я— 1 ft= 2 S(k)W(k, 0. i=0 С увеличением k растет частота следования, что аналогично росту частоты в преобразовании Фурье. На рис. 26 приведено восемь функций Уолша на интервале (0, 1), при этом функции задаются системой уравнений: W(k, 0 = 0; /<0, />1; а №(0,0=1; 0 <=/<!; W (2k, t) = W(k, 2t) + + (— 1)*№[Л, 2 (/—1/2)]; Рис. 27. Спектральные характери- стики белого шума (а) и импульса, возбужденного электроискровым ис- точником (б), полученные иа основе дискретного преобразования Фурье (/) и преобразования Уолша (2) (по Б. Л. Пивоварову) Рис. 26. Графики восьми функций Уолша Г(2Л+1, t) = W(k, 204- + (— l)*+1№[fc, 2а—1/2)], k = 0, 1, 2, . . . Каждая последующая функ- ------------------------------- ция Уолша, как видно из рис. 26, образуется из предыдущей путем ее сжатия на первой половине интервала и повторения этого сигнала на второй половине интер- вала с тем же или обратным знаком. Приведенные на рис. 27 спектры Фурье и Уолша получены по реализации белого шума, заданного 64 дискретами. Их сравнение позволяет говорить о возможности применения функций Уолша для частотного анализа сигналов. Спектральные кривые близки по форме, совпадают их положения экстремумов, хотя соотношение интенсивностей несколько различается. Функции Уолша образуют ортонормированную систему функ- ций, что делает их удобными для использования в преобразованиях и при вычислении спектров, но основное их достоинство состоит в быстроте вычислений. Преобразование Уолша можно выполнить 160
быстрее, чем БПФ, поскольку используются только операции сло- жения и вычитания. При преобразовании Уолша отсутствует так называемое явление Гиббса (см. § 30), однако при вычислении корреляционных функций и сверток, например в сейсморазведке, возникают трудности, обусловленные коррекцией записей за влия- ние функций отклика регистрирующей аппаратуры. § 27. ОСНОВНЫЕ ПРИЛОЖЕНИЯ СПЕКТРАЛЬНОГО АНАЛИЗА ПРИ ОБРАБОТКЕ ГЕОФИЗИЧЕСКИХ ДАННЫХ Использование спектрального анализа в геофизике чрезвычайно широко и разнообразно. 1. Оценка спектрального состава изучаемых полезных сигна- лов и помех. Это центральная проблема, возникающая при разра- ботке регистрирующей аппаратуры и алгоритмов обработки во всех без исключения геофизических методах. Так, например, по спектраль- ному составу волн, возбуждаемых поверхностными источниками, мак- симум спектров полезных отра- женных сигналов приходится на диапазон от 20 до 40 Гц (рис. 28), для низкочастотных поверхност- ных волн (они же и низкоскорост- ные v = 0,2 ч- I км/с) —на диапа- зон 5—10 Гц и, наконец, частот- ный спектр микросейсм, весьма широк и достаточно постоянен. Поэтому при разработке сей- сморегистрирующей аппаратуры с целью выделения полезных си- гналов необходимо учесть подавле- ние как низкочастотных, так и высокочастотных составляющих общего спектра регистрируемых сигналов. Если при регистрации не удалось осуществить оптимальное их подавление, это дости- гается при дальнейшей обработке записей на ЭВМ. При регистрации потенциальных полей в магнито-, грави-, терморазведке и ряде методов электроразведки нельзя отделить низкочастотные составляющие, к которым относятся региональный фон, аномалии от крупных объектов, а также полезные сигналы от высокочастотных составляющих, обусловленных погрешностями измерений (рис. 29). 2. Исследование возможностей тех или иных преобразований (методов обработки) геофизических полей. В качестве примера при- ведем спектры основных преобразований, используемых в магнито- и гравиразведке (по К. В. Гладкому). Анализ спектров этих преоб- разований (рис. 30), называемых частотными характеристиками 6 А. А. Никитин 161 Рис. 28. Спектры возбуждаемых поверхностными источниками волн: 1 — поверхностных, 2 — отраженно- преломленных, 3 н 4 — отраженных, 5 — микросейсм, 6 — аппаратурного шума (по М. Б. Шнеерсону)
трансформаций гравитационных и магнитных аномалий, показы- вает, что операции усреднения поля и перерасчета поля в верхнее полупространство подчеркивают низкочастотные составляющие и подавляют высокочастотные. Пересчет поля в нижнее полупрост- ранство и вычисление высших производных, наоборот, подчерки- вают высокочастотные составляющие и не подавляют низкочастот- ные, т. е. аномалии, протяженные по профилю. Вычисление высших производных после предварительного пересчета поля в верхнее полупространство обеспечивает выделение частотных составляющих в пределах некоторого интервала, ограниченного как со стороны низких, так и со сторон'ы высоких частот, и представляет собой полосовой фильтр (см. § 30). Приведенные на рис. 30 частотные характеристики являются идеальными. На практике преобразование поля ведется дискретно Рис. 29. Спектры региональной (/), локальной (2) аномалий и погреш- ностей наблюдений (3) в гравираз- ведке Рис. 30. Спектры основных преобра- зований в грави- и магниторазведке. / — усреднение; 2 — аналитическое про- должение в верхнее полупространство; 3— аналитическое продолжение в нижнее по- лупространство; 4 и 5 — вычисление выс- ших производных; 6 — вычисление про- изводных на высоте в пределах некоторого заданного окна, т. е. сигнал, для которого рассчитывается спектр, считается периодическим. С учетом этого С. А. Серкеровым были построены частотные характеристики ряда наиболее распространенных приемов вычисления высших (вторых) вертикальных производных силы тяжести и пересчета поля в ниж- нее полупространство, из которых следует, что все используемые схемы вычисления высших производных идентичны между собой и подвержены влиянию высокочастотных составляющих. Из срав- нения спектров идеальных и применяемых на практике характе- ристик следует, что до некоторой частоты они совпадают, а далее либо стремятся к нулю, либо осциллируют около некоторой по- стоянной величины (сравни рис. 30 и рис. 38). Таким образом, после некоторой частоты происходит искажение результатов пре- образования поля. Однако по отношению к погрешностям наблю- дений спад частотной характеристики благоприятен, поскольку при этом гасятся высокочастотные составляющие, преобладающие 162
г в спектре погрешностей наблюдений. Следовательно, чем резче происходит спад частотной характеристики, тем вычислительная схема менее чувствительна к погрешностям в исходных данных. 3. Синтез (восстановление) сигналов по спектрам. С этой целью используется построение спектров исходного геофизического поля и вычисление по формулам обратного преобразования Фурье зна- чений сигнала в заданном из определенных априорных соображе- ний интервале частот. В частности, для оценки региональной со- ставляющей f обычно достаточно взять лишь несколько первых гар- моник 3 fi = Ro + 2 Е Rm cos (Ф„ + 2nmiln) т=1 и тем самым осуществить один из приемов низкочастотного сглажи- вания. 4. Построение линейных, в том числе оптимальных, фильтров и оценка погрешностей линейной фильтрации. Это весьма важная и разнообразная область применения спектрального анализа (см. гл. VI и VII). 5. Совместный анализ наблюдений напряженности магнитного поля Земли и силы тяжести. Значения магнитного ДТ и гравита- ционного Ag тюлей заданы в дискретных точках по площади i — О, 1, . . . , п—1; р = 0, 1, . . . , N—1. Объединение полей в каждой точке производится на основе выражения f Pi = ^Tpl + jbgpi. Дискретное преобразование Фурье примет вид п-1 N-1 . 5 (сох, (ои) = — У Е fpi ехр [—2л/ + -^-)1 > nN i=o р— о L \ я Д' /J где kx = 0, 1, . . . , п/2, и ky = 0, 1, . . . , N/2 — волновые числа; сох = 2лkx, <оу = 2nky — пространственные частоты (см. §32). Подобный анализ выполняется с целью нахождения намагни- ченности и плотности пород для случая, когда оба вида аномалий (ДТ и Ag) вызываются одним и тем же телом. По характеру изменения формы двумерных спектров, построен- ных в ячейках заданного размера, производится районирование наблюденного поля так же, как это делается по изменению формы двумерных АКФ. 6*
ГЛАВА VI ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ ГЕОФИЗИЧЕСКИХ ПОЛЕЙ Одной из основных задач обработки геофизических полей является выделение сигналов (аномалий) на фоне помех. С этой целью ис- пользуются разнообразные приемы преобразования исходного поля, которые в конечном итоге описываются с позиции линейной или не- линейной фильтрации. В настоящее время в разведочной геофизике наиболее широко применяются линейные фильтры. Преобразование записей упругих волн по времени (временные фильтры), по времени и по скорости в пространственно-временной области (интерференционные системы) в сейсморазведке, различные способы усреднения и пересчетов полей в верхнее, нижнее, боковое полупространства в магнито- и гравиразведке — это приемы линейной фильтрации. Предварительная оценка спектральных или корреляционных свойств полезных сигналов и помех позволяет обоснованно реали- зовать нужное преобразование, т. е. провести фильтрацию исход- ных данных с целью выделения полезного сигнала и подавления помех. Прежде чем перейти непосредственно к понятию о линейной фильтрации, рассмотрению различных типов линейных фильтров, необходимо выяснить, в рамках каких моделей сигналов и помех ведется построения этих фильтров. Подчеркнем, что построение любого преобразования поля, т. е. любого фильтра, проводится в рамках вполне определенной мате- матической модели наблюденного поля. § 28. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ПОЛЯ. ПОНЯТИЯ СИГНАЛА (АНОМАЛИИ) И ПОМЕХИ I Обоснованный [выбор (или задание) математической модели поля и соответствующая ей постановка задачи преобразования поля яв- ляются исходным положением (принципом) в обработке геофизи- ческих данных. Общепринятой моделью геофизического поля является адди- тивная модель, т. е. такая модель, в которой результаты измерения поля fj представляют собой сумму полезной составляю- щей сигнала (аномалии) S/ и осложняющей ее помехи (или помех) /i;-: f/=S/ + «/. (6.1) Для некоторых типов сейсмических вол'н рассматривают муль- типликативную модель, когда fj=Sjnj, 164
однако эта модель несложным преобразованием всегда может быть приведена к виду (6.1), поскольку In fj = In st + In n,. Понятия сигнала (аномалии) и помехи в разведочной геофизике носят не абсолютный, а относительный характер. Поэтому в каж- дом конкретном случае следует выяснить, что принимать за сигнал (аномалии) и что считать помехой. Под сигналом понимается форма проявления поля, в ко- торую облечена полезная информация. Такое определение чаще всего используется при описании сейсмических и электромагнит- ных волн. При регистрации естественных потенциальных полей обычно применяют термин «геофизическая аномалия», под которой понимается отклонение физического поля от его нор- мальных значений. Нормальное поле — геофизическое поле, обусловленное однородными по конкретному физическому параметру горными породами. Однородность зависит от масштаба исследований. Понятие нормального поля различно для искусст- венно возбуждаемых (электрические и магнитные поля постоян- ных токов, переменные электромагнитные поля) и естественных (магнитного, гравитационного, электромагнитного и теплового) по- лей. В первом случае нормальное поле определяется полем заданного источника в однородной среде, которая обычно отождествляется с полупространством. Во втором либо нормальное поле рассчиты- вается аналитически, либо данные наблюдений пересчитывают в величины, которые для однородного полупространства равны нулю или константе, как, например, в методе кажущихся сопро- тивлений электроразведки. При рассмотрении естественных полей нормальные поля Земли также описываются некоторыми аналити- ческими выражениями, коэффициенты разложений которых опре- деляются по данным наземных или спутниковых наблюдений на всей поверхности Земли или в околоземном пространстве. Напри- мер, нормальное магнитное поле Земли определяется как сумма первых десяти гармоник разложения этого поля в ряд по сфери- ческим функциям (международное аналитическое поле — МАП). Оно изменяется во времени в связи с западным дрейфером магнит- ного полюса, поэтому периодически рассчитывается для опреде- ленного года (эпох), в промежуточные годы для него вводятся со- ответствующие поправки. Для естественных полей различают материковые, региональные аномалии и локальные аномалии различных порядков. Региональ- ные аномалии охватывают площади в тысячи и десятки тысяч квад- ратных километров, локальные — от тысяч квадратных километ- ров до десятых и сотых долей квадратного километра. Такое пред- ставление позволяет выделить несколько условных нормальных уровней поля в зависимости от класса аномалий. За локальную аномалию можно принять такую составляющую наблюденного поля, которая по линейным разме- рам (площади) значительно (в 5 раз и более) меньше изучаемых профилей (площадей) наблюдений, т. е. число характеризующих 165
локальную аномалию’ точек в несколько раз меньше общего числа наблюдений. При решении разведочной геофизики используют главным образом региональные и локальные аномалии. При изучении локальных аномалий за нормальное поле прини- мается сумма нормального поля Земли, материковых и региональ- ных аномалий, причем действие первых двух составляющих можно считать постоянным в пределах изучаемых профилей и площадей наблюдений. Выделение региональных и локальных аномалий из суммарного поля носит условный характер. Так, при выполнении детальных съемок крупного масштаба для небольших площадей региональную аномалию, являющуюся отражением, как правило, крупных струк- турных единиц подземного рельефа, можно принять за постоянную. Однако при этом крупные локальные аномалии начинают высту- пать в роли региональных для более мелких аномалий. Например, при проведении гравиразведки с целью прямых поисков нефти и газа аномалия, обусловленная структурой, будет региональной для аномалии, созданной залежью углеводородов. Такие «регио- нальные» аномалии называют фоновыми. За фоновую ано- малию принимаются составляющие поля, которые по линей- ным размерам (площади) значительно (в 5 раз и более) превышают локальные аномалии. Под помехой следует понимать всякие возмущающие поля, препятствующие выделению сигнала, аномалии. Различают помехи геологического происхождения, вызванные влиянием перекрываю- щих и подстилающих пород, неоднородностью верхней части раз- реза, рельефом местности и т. д., и помехи негеологического проис- хождения — временные вариации полей, блуждающие токи и т. д. Кроме того, помехи делят на случайные, обусловленные большим числом неконтролируемых факторов, действие каждого из которых незначительно (например, случайные погрешности измерений), и неслучайные (например, фоновая составляющая при выделении локальной аномалии). Поскольку любое наблюденное геофизическое поле представ- ляет собой суперпозицию различных аномалий (сигналов) и помех, основная задача при его изучении состоит в выделении аномалий (сигналов), обусловленных изучаемыми геологическими объектами на фоне помех, а также в разделении поля на составляющие различ- ной природы. После разделения полей и выделения аномалий (сиг- налов) проводится физико-геологическая интерпретация послед- них, включающая установление геологической природы аномалий и количественное описание их источников. Геологическая природа аномалий (сигналов) наиболее надежно определяется путем ком- плексной интерпретации геофизических данных (см. гл. IX); фи- зические и геометрические параметры источников аномалий — путем количественной интерпретации. В математической модели геофизического поля (6.1) сигнал (аномалия) может быть представлен либо детерминированной, т. е. аналитически заданной по форме и своим параметрам, функцией, 166
либо случайным процессом с известными (заданными) или неиз- вестными корреляционными (спектральными) свойствами. Для модели (6.1) помеха чаще всего описывается случайной функцией, для которой могут быть известны (заданы) или не известны корре- ляционные (спектральные) свойства. Относительный характер понятий сигнала и помехи нетрудно проиллюстрировать математической моделью вида fl = $рег / + $лок / + (6-2) для которой наблюденное поле представлено суммой региональной и локальной аномалий и некоррелированной помехой, обуслов- ленной, например, методическими и аппаратурными погрешно- стями. Очевидно, для задачи выделения региональной составляющей локальная аномалия является помехой и, наоборот, при выделе- нии локальной аномалии региональная составляющая выступает в качестве помехи. Наложение некоррелированной случайной помехи на полезный сигнал позволяет рассматривать наблюденное поле fa как случай- ный процесс. Причем, учитывая неизбежное изменение физических свойств горных пород и геометрических характеристик исследуе- мых объектов по площади наблюдений, наиболее обоснованным следует считать задание статистической модели наблюдённого поля. В то же время целый ряд задач эффективно решается в рам- ках детерминированной модели поля, при которой fa полагается аналитически заданной функцией, например при аналитическом продолжении гравитационных и магнитных полей в верхнее и ниж- нее полупространство. При этом влияние погрешностей сводится к нулю путем предварительного сглаживания исходных данных. Отметим, что при решении задач выделения сигналов в рамках регрессионного и факторного (компонентного) анализов модель наблюденного поля описывалась системой случайных величин. В конечном счете выбор той или иной модели исходного поля определяется полнотой априорной информации, а точнее, совер- шенством физико-геологической модели исследуемого объекта. При малой изученности объектов исследований физико-геологическая модель груба и, соответственно, априорная информация о форме, параметрах сигналов и свойствах помех практически отсутствует. В ходе дальнейших исследований с увеличением объема информа- ции об объектах изучения, используя механизм обратных связей, уточняют физико-геологическую модель. Это, в свою очередь, по- зволяет осуществить выбор более совершенной модели исходного поля. Важно подчеркнуть возможность уточнения модели поля в про- цессе самой обработки. Так, изучение спектрального состава (см. гл. V) и корреляционных характеристик поля (см. гл. IV) позво- ляет получить достаточно определенную априорную информацию о свойствах сигналов и помех. Наличие априорной информации о сигналах и помехах дает возможность применять оптимальные 167
процедуры обработки данных (см. гл. VII и VIII) для их [разделе- ния. Большое значение для выделения сигналов имеет их коррели- рованность (прослеживаемость) от профиля к профилю (от трассы к трассе в сейсморазведке). Поэтому площадные наблюдения спо- собствуют более успешному решению задачи выделения сигналов на фоне помех. Рассмотрим на нескольких примерах конкретизацию статисти- ческой модели (6.1) — (6.2). 1. Построение модели сейсмограммы начнем с введения пред- ставления об элементарной [волне как основном элементе сейсмиче- ской записи: f(t) = as(t—r) + n(t), s(t—x) = Q при t—т<0, (6.3) где а — амплитуда, характеризующая интенсивность волны; s (0 — форма волны по времени; т — время регистрации вступления волны; п (t) — нерегулярная помеха, связанная с микросейсмами и с на- ложением тех волн, которые при существующей методике наблюде- ний и обработке не выделяются раздельно. Для совокупности К сигналов, например однократных отраже- ний, модель запишется в виде к f (0 = Z akSk (i—tk) + П (О- (6.4) fe=i Волновые параметры ak, Sk, tj, полностью предопределены глу- бинными факторами, воздействие которых в явном виде в модели (6.4) не рассматривается. Модель, описывающую совокупность регулярных и квазирегу- лярных помех, можно представить аналогично (6.4) L М f(O=E Z ад»>(Мл)+л(0. (6.5) /=1 т—1 где I = 1, . . . , L — число классов, включающих tn = 1, . . . , М различных типов волн. Наконец, для модели многоканальной сейсмограммы, в кото- рой отображена система наблюдений, путем введения индексации по пунктам взрыва i = 1, . . . , 1 и пикетам приема /=!,...,/ с учетом (6.4) и (6.5) имеем к L м f (0 = EiakijSkil (^ Tfti/)"b Zj almiishnij 4" ПЦ (O' k=l I =1 m=l Эта модель носит общий характер, поскольку она не привязана к особенностям того или иного сейсмического метода. В каждом же методе по-своему определяются классы полезных волн и волн- помех. В качестве аналитического представления формы сигнала пред- ложен ряд формул. Так, нередко сигнал описывают с помощью функции s (0 = а ехр (— 02£2) sin (соо/ + <р), t > 0, для которой 168
параметры 0 и <р позволяют получать колебания с разным характе- ром изменения огибающей. Часто в качестве формы сигнала используют непосредственно форму АКФ или ВКФ, построенных по наблюденным данным. При статистической модели времена прихода волн xk принимают распределенными по закону Пуассона, а амплитуду сигналов — либо по закону Гаусса (для тонкослоистых толщ), либо по закону Джефриса (для толстослоистых толщ). Для закона Джефриса среди коэффициентов отражения, среднее значение которых близко к нулю, встречаются и довольно большие, причем они фиксируются чаще, чем этого следовало бы ожидать при нормальном законе. Первоочередная задача обработки состоит в обнаружении по- лезных волн на фоне некоррелированных помех, а затем их отде- ление от коррелированных волн-помех. При этом обычно опреде- ляются параметры как полезных волн, так и волн-помех. Для ре- шения задач по обнаружению и разделению сигналов используются линейные и нелинейные фильтры различных типов. 2. Модели экспериментального материала в гравиразведке для площадных наблюдений можно свести к виду fki = ®рег hi W + V 5лок kl (Ю + (6-6) 1=1 где 0О и 0/ — векторы неизвестных значений параметров аномалий. При количественной интерпретации эти векторы включают в себя и значения параметров искомого геологического объекта. Для ре- гиональной составляющей, заданной в виде регрессии (тренда) первого порядка sper kf (а0, аъ а2) = a0 + a1xi + a2yk, вектор 0 включает три неизвестных параметра а0, аъ а2. Форма локальных аномалий может быть задана аналитически, т. е. рассчитана для определенной модели объекта, либо автокор- реляционной функцией. . В практике обработки данных гравиразведки для описания кор- реляционных свойств аномалий и помех при поисках антиклиналь- ных ловушек нефти и газа получила распространение автокорре- ляционная функция гауссового типа R (т) = А2 ехр (—m2/r2), где А2 — средний квадрат амплитуды аномалии (или помех); г— интервал корреляции. Обычно полагают, что интервал корреля- ции аномалии в 5 раз и более больше интервала корреляции помех. Пример выделения аномалии с'такой формой АКФ рассмотрен в § 34. Процесс обработки начинается с выделения региональной составляющей. С этой целью можно использовать уже рассмотрен- ные выше приемы регрессионного, компонентного и спектрального анализов. В то же время выделение региональной аномалии — это процесс низкочастотной фильтрации, выделение локальной 169
аномалии на фоне региональной и некоррелированных помех — процесс полосовой фильтрации. Таким образом, при обработке геофизических полей с целью выделения различных составляющих особое место занимает филь- трация наблюденных данных, в частности линейная фильтрация. § 29. ПОНЯТИЕ О ЛИНЕЙНОЙ ФИЛЬТРАЦИИ. СВЕРТКА Под фильтрацией понимается преобразование эксперимен- тальных данных для выделения полезной информации, создавае- мой сигналом (аномалией), на фоне различного типа помех, накла- дывающихся на сигнал и тем самым затрудняющих его выделение. Такое выделение можно осуществить по частоте (частотная филь- трация), по времени (временная фильтрация), по направлению коррелируемости сигнала, в частности по скорости в сейсмораз- ведке (скоростная фильтрация), одновременно и по времени и по направлению (пространственно-временная фильтрация в сейсмо- разведке) и т. д. Преобразование экспериментальных данных, иначе — входных данных f (t) или f (х), в некоторую выходную функцию у (/) или у (х) проводится путем применения оператора фильтра L: y(tj) — L[f(tj)]r j = l, . . . , п. (6.7) Последовательность у (tj) получается как результат воздейст- вия оператора L на входную функцию f (f). Операторы L могут быть линейными и нелинейными. Линейным оператором L (или линейным фильтром) называется оператор, который удовлетворяет двум свойствам: если С — некоторая постоянная, а A (t) и /2 (/) — различные входные функции, то L[C/(0J=cL[4(01; (6-8) L[M0W0]=W0] + MM0b Фильтры, которые не удовлетворяют этим условиям, называют нелинейными. В частности, расчет автокорреляционной или взаимно корреляционной функции является примером нели- нейной фильтрации. Класс линейных фильтров (операторов) опи- сывается выражением т y(t)= J h(t—x)f (x)dx. (6.9) To Это выражение, называемое интегралом Дюамеля или интег- ралом свертки, характеризует широкий класс преобразо- ваний наблюденного поля: фильтрацию, сглаживание, интерпо- ляцию. Сигнал на выходе любой физический системы (например, элек- трических фильтров) не может предшествовать по времени соот- 170
ветствующему сигналу на входе, т. е. если f (/) = 0, t<zT0, то у (О = L [/(/)]= О, t<T0. (6.10) Фильтр, удовлетворяющий условию (6.10), называется физи- чески осуществимым или каузальным. Если для физических фильтров, например электрических, ус- ловие каузальности обязательно, то для фильтров, реализуемых на ЭВМ, оно теряет свою важность. Более строго, физически осуще- ствимым называется фильтр, удовлетворяющий двум условиям: 1) линейный оператор h (t) = 0 при /<0; 2) Л (I) -> 0 при t оо, причем f \h(t)\dt< оо. о Дискретным аналогом интеграла Дюамеля, т. е. дискрет- ным аналогом свертки, является выражение !/(//) = £л(//-т)/(^), /=0,1..........п. (6.11) «=о Учитывая, что фильтрация может быть осуществлена как по времени, так и по любой пространственной координате, запишем (6.11) в виде ///=£Л/-Л> / = о, 1.......п. (6.11') т=о Другая форма свертки получается путем замены i = /—т: м yi-lLhds-i, 7 = 0, 1, . . . , п. (6.12) <=о Переход от (6.11) к (6.12) определяет свойство перестановочно- сти (коммутативности) операции свертки, состоящее в том, что результат свертки у, остается одним и тем же независимо от того, какая функция fj или hj сдвигается по оси времени, если эта же функция одновременно обращается во времени. Функция hi в (6.12) называется весовой функцией, которая представляет собой последовательность чисел Ло, h^, . . . , Операция, или уравнение свертки (6.12), является важнейшим, наиболее часто применяемым преобразованием в цифровой обра- ботке геофизических данных. Суть этой операции легко уяснить из следующего примера. Пусть входная функция, т. е. исходные данные, задана тремя дискретами: fj = f0, flt f2, а весовая функция — двумя дискретами: hi = h0, ht. В соответствии с формулой (6.12) имеем: при / = 0 t/o = Wo; при j = 1 yi = hofi + hifo, при / = 2 y2 = h0f2 + h1fi-, при / = 3 yz = hif2. 171
Процесс получения выходной функции у, может быть изобра- жен путем перемещения перевернутой по времени весовой функции вдоль значений входной функции согласно схеме fo> fl, f 2 К h0 К, h0 [hi, h0 hi, ho- i Таким образом, процесс свертки состоит из четырех операций: обращения во времени весовой функции, ее смещения вдоль исход- ных значений поля, умножения и суммирования (интегрирования). Общее число значений выходной функции г/;- больше значений входной функции и равно п 4- М—1. Крайние члены выходной последовательности (для рассматриваемого примера — у0 и г/8) по- лучаются при неполной весовой функции, и их значения искажены (так называемые краевые эффекты). Поэтому в практике обработки их не учитывают. Уравнение свертки (6.12) устанавливает связь между входным и выходным сигналами через весовую функцию и при построении любых линейных фильтров является основополагающим. Проблема фильтрации по существу и состоит jb нахождении весовой функции, исходя из заданных критериев цели обработки, выбранной мате- матической модели экспериментального материала, полноты апри- орной информации о сигнале и помехах. Свертка некоторой функции /у с-единичной функцией 6,, опреде- ляемой как =J b /==°’ '' 10, /V0, (6.13) дает в результате саму исходную функцию fjt в чем нетрудно убе- диться, положив hi = 1, 0, 0. ото свойство в сочетании со свойством коммутативности позво- ляет определять неизвестную весовую функцию некоторой си- стемы. С этой целью в качестве входной функции следует взять fj = б/, тогда по формуле свертки получим м м У1= Z htfj-i = £ /г,6/_( = /г/. 1=0 4=0 Операцию [свертки часто обозначают звездочкой, т. е. вместо (6.12) записывают y = h*f. (6.14) Представление свертки в виде (6.12) и (6.14) называют синте- зом во временной области, если все три величины у, h и f являются функциями времени. 172
Используя преобразование Фурье, в частности свойство о свертке двух сигналов (см. § 24), свертку во временной области (6.12) можно записать в частотной области в виде произведения двух ком- плексных спектров Н (со) и F (со), т. е. Y (со) = Н (со) F (со), (6.15) где Н(со)= ]’ h(t)e~iaidt (6.16) «•30 называется частотной характеристикой фильтра и весовой функции; F (со), Y (со) — спектры соответственно вход- ной и выходной функций. При дискретном задании весовой функции Н (со) определяется через дискретное преобразование Фурье. Обратное преобразование Фурье позволяет получить весовую функцию h (f), если заданарсастотная характеристика фильтра Я (со)Я /i(0 = — J’ Я (co)Je/w/dco. (6.17) 2л —оо Амплитудный спектр функции у (t) равен произведению ампли- тудных спектров функций h (t) и f (t), а фазовый — сумме фазовых спектров этих функций,^, е.: /?!/((0) = ^((0ВД(0); (6.18) сру(со) = ср/ (со)н-(со). (6.19) Частотная характеристика Н (со) является [комплексным спект- ром; через амплитудный и фазовый спектры она выражается как Я(®) = 7?4((о)е/<р<<ш), (6.20) где (со) = | Я (со) | = д/Л2 (со)-FB2 (со) — амплитудно- частотная характеристика фильтра, или к о - эффициент передачи линейной системы; срЛ (со) = arctg [— В (®)1А (со)] — фазово-частотная ха- рактеристика фильтра. Амплитудно-частотная характеристика определяет усиление спектральной составляющей сигнала на определенной частоте при прохождении его через линейной фильтр. По фазово-частотной характеристике для любой частоты определяется временная за- держка, создаваемая фильтром на заданной частоте. Rh (со) и <рл (со) полностью характеризуют фильтр. Для вещественных сигналов на входе и выходе фильтра вы- полняется следующее свойство симметрии: | Я (со)| = | Я (—со) |; <р(— со) = — <р(со). 173
Если применить обратное преобразование Фурье к выражению (6.15), получим 1/(0 = 4“ Гя(со)/=’((о)е'^(0 = = 4- f /?/,(©)£(©) o'(6.21) 2л _oo Таким образом, для получения результата фильтрации во вре- менной области необходимо сначала выполнить прямое преобразо- вание Фурье входного сигнала и весовой функции, затем перемно- жить их спектры и, наконец, найти обратное преобразование Фурье от произведения спектров. Частотная характеристика фильтра Н (со) определяется через ее действительную А (со) и мнимую В (со) части или амплитудно- частотную R (со) и фазово-частотную ср (со) характеристики: Н (со) = А (со) + jB (со) = R (со) ехр [/<р (со)]. (6.22) Построение, или синтез, фильтров в частотной области через характеристики R (со) и ср (со) — весьма распространенный прием, что определяется простотой описания с их помощью желаемых ха- рактеристик фильтра. Расчет фильтров во временной области часто используется при построении оптимальных фильтров (см. гл. VII). Для широкого класса фильтров R (со) и ср (со), так же как А (со) и В (со), не являются независимыми друг от друга: каждая из них может быть однозначно определена из другой функции путем пре- образований Гильберта. В частности, вещественная А (со) и мнимая В (со) части частотной характеристики физически реализуемого фильтра связаны следующей парой преобразований Гильберта: 4 (а) = — { 4 * * * В (v) dv; в (и) = -L- Г -4 dv. Л J V — со л J V — со —оо —оо Таким образом, учитывая изложенное, можно сделать вывод о том, что фильтрация — это линейное преобразование исходных данных. Целью этого преобразования является изменение спек- трального состава входного сигнала, а именно: пропускание одних спектральных компонент и ослабление (подавление) других. В аналоговых устройствах обработки данных частотная филь- трация осуществляется физически реализуемыми фильтрами, пред- ставляющими собой определенную совокупность элементов элек- трических схем. Для выбора необходимого режима фильтрации требуется расчет схемы физического фильтра с определением па- раметров ее деталей (резисторов, конденсаторов и т. д.). При циф- ровой обработке частотная фильтрация может быть реализована либо во временной, либо в частотной области. Для цифрового фильтра весовая функция является временной последовательностью определенных дискретных значений. Соот- 174 ветственно цифровым фильтром называют фильтр, сиг- налы на входе и выходе которого представлены последователь- ностями дискретных значений. Спектр выходной функции, получаемой в результате фильтра- ции, может содержать только те частоты, которые присутствуют и в спектре входного сигнала, и в спектре весовой функции. При фильтрации обычно происходит увеличение длительности сигна- лов по сравнению с входными сигналами. Для установления нор- мального режима фильтрации требуется совмещение всех значений весовой функции со значениями входного сигнала. Цифровые фильтры в отличие от физически реализуемых всегда заданы дискретной весовой функцией и, следовательно, имеют ограниченный частотный диапазон с <огр = ± л/Д/, At — шаг ди- скретности по времени. Принципиальное отличие цифрового фильтра от физически осуществимого заключается в том, что с помощью цифровых фильт- ров возможно реализовать весовую функцию на времени /<0. Начало отсчета, т. е. точка t — 0, может быть расположено в лю- бом месте весовой функции цифрового фильтра: у ее первой орди- наты, у последней, в центре и т. д. Эта особенность цифровых фильт- ров является важным их преимуществом по сравнению с физиче- скими фильтрами, работающими в режиме реального времени, бла- годаря чему при обработке данных на ЭВМ предоставляется воз- можность проведения фильтрации в обратном направлении, т. е. с конца исходной последовательности значений к ее началу. Про- ведение фильтрации сначала в прямом, а затем в обратном направ- лении позволяет исключать влияние фазовых искажений весовой функции, что особенно существенно в тех случаях, когда фазово- частотная характеристика фильтра не определена. Если в уравнении свертки (6.12) весовая функция не изменяет своих значений в процессе фильтрации (обработки) всей исходной совокупности данных, говорят об инвариантном во вре- мени фильтре. Если свойства входного сигнала во времени (или по х) изменяются, следует использовать переменные во времени фильтры, т. е. фильтры с изменяющейся во вре- мени весовой функцией. Фильтры, определяемые уравнением свертки (6.12), называются нерекурсивными в отличие от рекурсивных, для которых выходной сигнал выражается не только через выходную функцию, но и через профильтрованные ранее значения: М L У1=Е hifi-i — £ bflj-l. (6.23) i=0 fZi В уравнении рекурсивного фильтра (6.23) величины входного сигнала определяются через прошлые и текущие значения вход- ного сигнала и прошлые значения выходного сигнала. Рекурсивный фильтр — это фильтр с обратной связью. Именно благодаря обратной связи общее число весовых коэффициентов ht и bt для рекурсивного фильтра оказывается существенно меньше, 175
чем для нерекурсивного. Это основное преимущество рекурсивных фильтров, заключающееся в их экономичности, т. е. в значительно меньших затратах времени на обработку по сравнению с затратами времени для обычных фильтров-сверток. § 30. ПОСТРОЕНИЕ ФИЛЬТРОВ ДЛЯ ЗАДАННОГО ДИАПАЗОНА ЧАСТОТ Фильтры, построение которых проводится в частотной области, делятся ‘на три основных типа: 1) низкочастотные фильтры — фильтры, ампли- тудно-частотная характеристика ние в полосе пропускания | со |< а Н(ш) в в Рис. 31. Частотные характеристики идеальных низкочастотного (а), вы- сокочастотного (б) и полосового (в) фильтров которых имеет постоянное усиле- и нулевое вне ее (рис. 31, а); 2) высокочастотные фильтры — фильтры, ампли- тудно-частотная характеристика которых постоянна в полосе пропускания | со | > со2 и равна нулю вне ее (рис. 31, б); 3) полосовые филь- тры — фильтры, обеспечиваю- щие равномерное усиление в полосе пропускания | сох | < < | со | со2 и нулевое усиление, т. е. бесконечное подавление за пределами указанного диапазона (рис. 31, в). Частоты сох и со2 являются граничными частотами, или частотами среза фильтра. На рис. 31 приведены амплитудно-частотные характеристики идеальных фильтров. Реальные фильтры имеют характеристики, которые представляют ту или иную аппроксимацию характеристик идеальных фильтров. Основой при построении (синтезе) фильтров любых типов служит низкочастотный фильтр, поскольку частот- ная характеристика идеального высокочастотного фильтра Нв(со)=1 —Ян(со), (6.24^ где Нн (со) — характеристика низкочастотного фильтра; в качестве 1 — рассматривается характеристика фильтра, пропускающего без искажений все частоты, а частотные характеристики полосовых фильтров могут рассматриваться как комбинации характеристик низкочастотных и высокочастотных фильтров: /7п(со) = Ян(со2)—Ян(сО1); (6.25) Нп (со) = Нв (coi)—Нв (со2). Следует выделить также режекторный фильтр (за- граждающий полосовой), предназначенный для подавления очень узкого диапазона частот, например 50 ±2 Гц. Его характеристика определяется через характеристики полосовых фильтров и (или) комбинации низкочастотных и высокочастотных фильтров. 176
Наибольший интерес, как правило, представляют .фильтры, не вносящие фазовых сдвигов, поэтому стараются использовать ве- совые функции, мнимая часть частотных характеристик которых В (со) равна нулю. Рассмотрим построение идеального низкочастот- ного фильтра вида (А, I со I < Я(®) = (6.26) ( 0, | со |> соь ' ' где | со | < сох — область пропускания сигнала; | со |>сох — область подавления сигнала; А — действительное число, определяющее усиление, фильтра в полосе пропускания. Обычно весовая функция нормализуется таким образом, чтобы усиление в полосе пропуска- ния фильтра было равным единице, т. е. А = 1. Поскольку Н (со)— действительная величина, равная А или нулю, то амплитудная характеристика определяется только ее вещественной частью, а фазовая характеристика ср (со) = 0. Следовательно, весовую функ- цию h (t) находим из обратного преобразования Фурье: h (t) = -U Jr₽ H (co) e/w/dco = — JrP cos coWco = 2л л 0J у4 » j Лсого sin CDpp^ zz* =-----sin (orD/ =------------. (6.27) Tit JT CDpptf Эта функция имеет форму интегрального синуса sin х/х и беско- нечна по времени. Величина А согр/л — постоянна и без ограниче- ния общности ее можно полагать равной единице, ®гр = ®1- Для реализации цифровой фильтрации во временной области, естественно, используются только фильтры с операторами ограни- ченной длины М, т. е. вместо h (t) применяется некоторая функция h (t), равная нулю при 11 ]>Л1 /2. При этом очевидно, что частотная характеристика ограниченного фильтра h (/) будет уже не Н (со), а другая характеристика ЛС/2 М/2 Я(со) = J h(t)e~ia>tdt = £ (6.28) — MI2 Весовая функция л ( SIH СОгп^/сОгр/, 'Н , о, Функция h (/) и соответствующая ей частотная характеристика приведены на рис. 32. Весовая функция представляет собой сим- метричную кривую с максимумом в центре при t = 0. Видимый период колебаний (осцилляций) близок к 2л/согр. Частотная харак- теристика Н (со) весьма существенно отличается от характеристики идеального фильтра, показанного пунктиром, особенно вблизи граничной частоты. Это отличие проявляется в виде плавного пе- рехода в области ступенчатого изменения и колебаний самой ча- стотной характеристики. /=—ЛС/2 |/|<М/2, (6.29) 177
Колебания возникают из-за разрывности характеристики иде- ального фильтра и определяют так называемое «явление Гиббса». Амплитуда колебаний Гиббса максимальна вблизи граничной ча- стоты фильтра и не зависит от длины весовой функции М и от югр. Она во всех случаях составляет 9 % от проектируемой величины усиления А, в частности от единицы (А = 1). Это — основной недо- статок фильтра (6.28), приводящий к тому, что в области подавле- ния помех их остаточная энергия будет значительной,. На практике используются фильтры, имеющие меньшую кру- тизну частотной характеристики в области среза и меньшую ам- плитуду колебаний Гиббса по сравнению с характеристикой, опре- деляемой по'формуле (6.28). Рис. 32. Частотная характеристика (а) и весовая функция (б) низкоча- стотного фильтра ff hit) Рис. 33. Частотная характеристика фильтра с косинусным сглаживанием Одним из распространенных фильтров, применяемых при об- работке сейсмических записей и данных электроразведки, является фильтр с косинусным сглаживанием в области среза. Амплитудно- частотная характеристика такого фильтра Я(©) = 1, Г1 Ч-COS (I © I — ®гр+£) 2 L 4£ О, [| ©|<®гр — £, ©гр-® I < ®гр4"" | © |>©гр + I- (6.30) Обычно I < ©гр. На рис. 33 видно, что заданием величины | можно регулировать крутизну среза фильтра, одного из важнейших параметров поло- совых фильтров. В соответствии с (6.30) весовая функция определяется выраже- нием [9] h(t) = £ Я(ю)е/т/ = —n Мгр< -о>Гр+& nt 1______sin (од/ + sin a>2t; ~ 2nt 1 — (/2/л2) (<o2 — ©i)8 COS 5< 1 — 452/2/rt2 (6.31) где ©j — ©гр I; ©2 — ©rp 4~ £• 178
Такой фильтр обеспечивает на порядок лучшее подавление по- мех, чем фильтр (6.29) при выполнении условия М|>2,6л (6.32) Поскольку частотная характеристика дискретного фильтра, рассматриваемая как дискретный сигнал, является периодической с частотой повторения 2согр = 2л/Д/, вся информация о спектре обрабатываемых сигналов должна содержаться в частотном квад- ранте— л/Д/<(о<л/Д/. В противном случае повторные макси- мумы частотной характеристики будут приводить к усилению по- мех. Оптимальное число дискретов М. весовой функции определяется из соотношения (6.32). Так, М = 2,6 л/|Д£ = 2,6-3,14/20-0,002 = = 204 при | = 20 Гц и Д / = 0,002 с. Рис. 34. Частотные характеристики полосового фильтра с несимметричными срезами (а) и режекторного фильтра (б) Частотная характеристика высокочастотного фильтра с коси’ нусным сглаживанием /7В (<о) = 1 — (со), где Нн (®) определяется из (6.30). Весовая функция, соответственно, будет определена как я/Д< йв(0= Е —л;Д< С учетом (6.31) Лв (0 = .“—hu(t) = nt = J_[2_______sinwit-sitW—1 f==1 2 (6 ,зз) nt L 1 — <* (co2 — <01)г/л2 J Фактически в силу периодичности характеристики дискретных сигналов фильтр hB (/) является полосовым, так как пропускает частоты от (огр до Q = л/Д t. В противном случае спектр исходного сигнала будет искажен наложением зеркальных частот (эйлясинг- эффект). Соответственно частотная характеристика полосового фильтра находится как разность характеристик двух низкочастотных фильт- ров с разными граничными частотами <о2 и : Нп (®) = Н„ (<о2)— 179
—Ня ((Oj). Отсюда h„ (/) = й2 (/) — Л^(0, где h2 (t) и h± (t) — ве- совые функции, определяемые через Ня (и2) и Ня (©J. Для симметричного полосового фильтра с косинусным сглажи- ванием [19] hn (0 = —7- 2 (sin (d2t— sin ©J0. (6.34) nt 1 — 4|2/2/л2 Задавая различную крутизну срезов низкочастотных фильтров, получим весовую функцию полосового фильтра с несимметричными срезами (рис. 34, а) [19]: _ 1 Г sin co3f + sin со4/__sin со4/ + sin co2< 1 „r. " 2nt L 1 — /2 (<o4 — со3)2/л2 1 — t2 (co2 — Ш1)2/я2 J Смысл частот <o2, <o3 и <o4 ясен на рис. 34, а. По формуле (6.35) рассчитываются весовые функции широкого класса фильтров: прямоугольных при ©4 да ©2 и <о3 да ©4, трапе- цеидальных и треугольных при <о2 = <о3. Весовую функцию режекторного фильтра можно получить как разность весовых функций низкочастотного и полосового фильтров или же как разность весовых функций двух полосовых фильтров. Отметим, что задание граничных частот накладывает существен- ные ограничения на длину применяемых весовых функций: чем уже полоса пропускания и круче срезы характеристики, тем длин- нее должна быть весовая функция. С учетом соотношения (6.32) ширина [пропускания должна удовлетворять условию Д© > 10л/ЛШ. (6.36) Особенно критичным к выбору величины | является режектор- ный фильтр (рис. 34, б). При (<о2—©J/2 он не обеспечит не- обходимого глубокого подавления частотных составляющих в по- лосе режекции, при (<о2—©J/2 теоретически достигается су- щественное подавление, однако в силу соотношения (6.32) это требует применения очень протяженных по времени (до 0,2—0,4 с) весовых функций. Ввиду этого для построения режекторного фильтра следует использовать рекурсивную фильтрацию (см. § 31). Помимо фильтров с косинусоидальным сглаживанием для аппроксимации частотной характеристики идеального низкочастот- ного фильтра используются еще два подхода, связанных с синте- зом фильтров Баттерворта и Чебышева. Фильтры Баттерворта наиболее точно аппроксими- руют характеристику идеального фильтра, причем усиление убы- вает монотонно с возрастанием частоты и амплитудно-частотная ха- рактеристика не имеет колебаний ни в полосе пропускания, ни за ее пределами (рис. 35). Преимуществом этих фильтров является простота аналитического выражения и возможность управления степенью-подавления в переходной зоне. Фильтры Баттерворта обычно задаются квадратом частотной характеристики в виде |Яб(®)|2 = 1/[1 + (®М2п], (6.37) 180
где <ос — частота среза фильтра; п — целое число, определяющее порядок фильтра. При и -> О усиление фильтра согласно (6.37) стремится к еди- нице. Из рис. 35 следует, что чем выше порядок фильтра, тем быстрее характеристика приближается к прямоугольной характеристике идеального фильтра. При со/<ос = 1 характеристика Нъ (©) при- нимает значение 1/V 2 = 0,707 независимо от п. Отметим, что наклон частотной характеристики при переходе от области пропускания к области подавления определяется ее крутизной К (©). Обычно крутизна К (со) измеряется в де- цибеллах на октаву. Децибелл (дБ) — логарифмическая мера от- ношения двух сопоставляемых величин, например \Н (©Л и |/7(ft>i)|. Крутизна К(©) = 201g | Я[(ю2)\/\ Н^)\, (6.38) где ©, и — частоты с интерва- лом-в Гоктаву, т. е. ©а = 2®i- В частности, область пропус- кания характеристики Нъ (©) на уровне \/^ 2 = 0,707 при ©/©гр = = 1 соответствует ослаблению в 3[дБ. ^Действительно, согласно (6.38) имеем 20 1g Мл/2 = = 20 1g 0,707 - — 3 дБ. Рис. 35. Частотные характера- стики фильтров Баттерворта пер- вого, третьего и пятого поряд- ков Величину п для фильтра Баттерворта выбирают, ориентируясь на желаемую степень ослабления в полосе подавления фильтра. Например, какое значение п необходимо использовать в уравнении (6.37), чтобы на частоте 2©с получить ослабление 48 дБ на октаву. Из определения децибелла (6.38) с учетом (6.37) получаем 201g [| Н (©а) |/| Н (ах) | ] = 101g [| Н (ю2) |а/| Н (©х) |3] = = 1Q 1g-1 = 1/[1 + (а>1/сос)2л]<о1/о>с=2 = 101gj[ , 11 1 = 48; 1g 2я = 4,8; n = 8. JL 1/(1 + 22Л) J Следовательно, для ослабления в 48 дБ п = 8. Обычно ослаб- ление изменяется на 6 дБ при изменении п на единицу. Далее по частотной характеристике Нъ (©) необходимо найти весовую функцию ЛБ (/) цифрового фильтра. Проще всего это сде- лать в комплексной плоскости с помощью преобразования Лапласа. Высокочастотный фильтр Баттерворта определяется через ча- стотную характеристику низкочастотного фильтра как | Нв (со) ]3 = 181
= 1—| Ня (<o) |2. При этом (оя, (ов — частоты срезов соответствую- щих фильтров. Очевидно, с учетом (6.37) | нв (©) |2 = 1--------------J'(й)/ -с-)2га 4 1 + (<о/а>с)2" 1 + ((0/(0с)2" (6.39) Другим типом фильтров, удачно аппроксимирующих частот- ную характеристику идеального низкочастотного фильтра, являются низкочастотные фильтры Чебышева, определяемые квад- Рис. 36. Частотные характери- стики фильтров Чебышева с е — 0,6 и N = 3 (/) и Бат- терворта третьего порядка (2) ратом амплитудно-частотной характе- ристики в виде |Z74((o)|2=l/[l + e2Cw((o/(oH)b (6.40) Уравнение (6.40) — фильтр Чебы- шева с характеристикой | Нч (©) |2, имеющей одиночный выброс в полосе пропускания сигнала и монотонно убывающей в области подавления по- мех (рис. 36). Размах этого выброса 6 = 1— (1 +е2)-х/2. В уравнении (6.40) CN ((о/(он) представляет собой полиномы Че- бышева N-ro порядка, получаемые с помощью рекуррентного соотноше- ния Со ((о) = 1; С!((о) = (о; Cw+1 (о>) + CN ,((о) = 2(0 CN ((о). Например, пусть е — 0,6, т. е. о = 0,14, a N = 3. В пределах полосы пропускания частотная характеристика колеблется от 0,86 до 1, что соответствует приблизительно 1,3 дБ. Характеристика для фильтра Чебышева на рис. 36 сравнивается с характеристикой фильтра Баттерворта третьего порядка. Из этого сравнения следует, что фильтр Чебышева имеет большую крутизну среза, чем фильтр Баттерворта того же порядка. «Платой» за увеличение крутизны среза является появление выброса на характеристике в полосе пропускания. Полосовые фильтры Баттерворта и Чебышева вначале исполь- зовались при обработке данных сейсмологии. В настоящее время они применяются в сейсморазведке благодаря их экономичности по сравнению с традиционными полосовыми (с косинусным сгла- живанием) фильтрами. Экономия машинного времени достигается путем реализации этих фильтров в рекурсивной форме. Типичным примером линейной фильтрации вдоль пространствен- ной координаты х, т. е. по профилю, являются трансформации поля силы тяжести и магнитных полей. К трансформациям относятся операции усреднения, сглаживания, пересчет поля в верхнее й нижнее полупространства, вычисление высших производных. (Спектральные характеристики идеальных фильтров этих преоб- разований были приведены на рис. 30.) В основу трансформации заложен принцип линейной фильтрации с целью подавления по- 182
мех и наиболее четкого выделения полезной информации (аномалии). Так, при усреднении поля в скользящем окне, включающем п точек, весовая функция в (6.12) постоянна и ее коэффициенты hi = 1/п. Если ограничить частотную характеристику усреднения Н (<о) = [sin (©п)/2 ]/ [<оп)/2 ] основным (первым) экстремумом, по- давление частотных составляющих наблюденного поля будет про- исходить до частоты © = 2л/п. Поэтому оптимальный размер палетки усреднения (окна) свя- зан с заданием граничной частоты спектра аномалий, подлежащих выделению. Аналогом низкочастотного фильтра с косинусным сглажива- нием в гравиразведке является фильтр Страхова с частотной ха- рактеристикой Н (®) = 1 — {1 — [cos (<о Дх/2)]2N [р. Варьируя величинами N и р, подбирают нужную форму частот- ной характеристики. Обычно = 154-30, р = 3. На базе операции усреднения, используя разницу результатов суммирования данных в окнах разной длины, можно построить полосовой фильтр 1 М, , fi = 2/И1+ 1 fl+‘ ~ 2Л12+1 t=£Mi fl+ {‘ Фильтрующие свойства этой операции ^сследованы К. Сейа при выделении аномалий силы тяжести с помощью преобразований Фурье. Им рекомендовано ее применение при = 1, М2 = 3 и Afj = 3, ТИ2 = 7. Аналитическое продолжение поля f в верхнее полупространство осуществляется на основе интеграла Пуассона f'(x, 1 Л оо HI. 0) —00 [(£-х)2 + Я?] lh) = (Hi — высота пересчета), который можно представить как свертку исходного поля f (|, 0) с весовой функцией h(x, = + Поскольку весовая функция четная, ее частотная характери- стика H(0))=_2^(_£^_dx = nJ О 2Я1 я „-!<>», | __ - [<> ( н, л 2Я1 Частотная характеристика е 1 н‘ экспоненциально убывает с ростом пространственной частоты что свидетельствует о низко- 183
частотном характере операции аналитического продолжения поля вверх. Аналитическое продолжение в нижнее полупространство имеет частотную характеристику Н (©) = е“Н1 и приводит к вы- сокочастотной фильтрации поля (см. рис. 30). Для практической реализации вычислений интеграла Пуассона в гравиразведке существуют разные вычислительные схемы. В качестве примера, иллюстрирующего характер весовых функ- ций и частотных характеристик аналитического продолжения поля как операции линейной фильтра- а h(x) ции, приведем две схемы вычис- I/ г лений: j _ 1) по способу сеток, основан- ному на теореме о среднем значе- 2" нии функции: Рис. 38. Частотные характеристи- ки аналитического продолжения поля в иижнее полупространство. , * «Я „ 1 — точное преобразование е ; 2 —спо- соб сеток; 3 ~ способ Страхова Рис. 37. Весовые функции аналити- ческого продолжения поля в иижиее полупространство для способа сеток (а) и Страхова (б) Д§(х, -Н1) = 4Д^(х, 0)-Д^(х + Яь 0)-Дйг(х-Я1, 0)- — Д^(х, 7/i); Н (©) = 3,750—2,352 cos ©—0,148 cos 2©—0,07 cos 3© — —0,04 cos 4©—0,025 cos 5©—0,0115 cos 6©, H1=\\ 2) по способу Страхова, основанному на замене функции Ag (х, Нх) интерполяционными многочленами Лагранжа: —H^1,3M9bg(x, 0)-2,3258[Д£(х+/Л/2, 0) + + Д^(х-Я1/2,0)]-0,5683[Д^(х + Я1, 0) + &g(x-Hlt 0)]- —0,1931 [Ag(x + 2tflt 0) +Ag(x—2ЯЬ 0)]—0,0178 [Ag (хД- 4-ЗЯь 0) + Д£(х—ЗЯЬ 0)]—0,0041 l.[Ag(x+6Wi, 0) + + Д£(х—6ДЬ 0)]—0,0030[Д£(х+9/Л, 0) + Ag(x—9Яь 0)]; Н (ш) = 7,3029—4,6516 cos 0,5©— 1,1366cos © — —0,3862 cos 2©—0,0356 cos 3©—0,00822 cos 6©—0,006 cos 9©, Hi=l.
Соответствующие этим (вычислительным схемам весовые функ- ции приведены на рис. 37, а частотные характеристики — на рис. 38. § 31. ПОСТРОЕНИЕ ФИЛЬТРОВ в комплексной плоскости z-преобразование с целью синтеза линейных фильтров приоб- ретает в последнее время все большее значение в связи с возмож- ностью реализации режекторных фильтров, фильтров Баттерворта и Чебышева в рекурсивной форме, обеспечивающих существенную экономию машинного времени, что особенно важно при обработке огромного потока сейсмической информации. Рассмотрим некоторые свойства z-преобразования, связанные с фильтрацией данных. Начнем с операции свертки у = h*f. За- меняя входную и весовую функции f и h их z-преобразованиями Z7 (2) = fo + М 1 ^rfiz 2+ • • • +/м2 ", 77 (z) = Ао hxz h2z 2+ . . . -\-hMz м, получим, как это следует из (5.44), последовательность 7/(z)F(z) = Wo + WiZ-1 + W2z-2+ . . . + -\-hofnZ " + W#z 1+ WiZ * + . . . 4~ + hifnZ п + Wог 2 + • • • + Wnz " + . . . + + ^м/п2 = hofo + (Aofx + hif0) z 1 + + (Wa + Wi + Wo)2 2 + . . . +hMfnz (6.41) Сопоставив полученный результат с результатом свертки (6.12), нетрудно, заметить что первый член (6.41) — это нулевой элемент выходного сигнала, коэффициент при z-1 — первый элемент вы- ходного сигнала, коэффициент при z~a — второй элемент и т. д., т. е. правая часть (6.41) представляет собой z-преобразование вы- ходной функции у: . Y(z) = H(z)F(z)=y0 + y1z-'+ . . . +ynz~iM+n). (6.42) z-преобразование удобно для количественного описания фазовых соотношений, важных при реализации фильтрации сейсмических данных. Многочлен вида (6.42) может быть представлен в виде произве- дения биномов: У (z) = a0(ai + 2-1)(a2 + z-1)(a84-z-1) . . . (aM+z-1), (6.43) где alt а2, . . . — корни многочлена. Во временной области разложение (6.43) эквивалентно покас- кадной свертке множества сигналов, охарактеризованных двумя ординатами —аъ 1; — а2, 1; —а3, 1; . . . ; —ам, 1, 185-
т. е. можно записать t/ = a0(—аъ 1) * (—аа, 1)»(—а8, 1)* . . . *(— ам, 1). Рассмотренные свойства г-преобразований позволяют опреде- лить понятие минимально-фазового сигнала. Если сигнал у (t) представлен всего двумя ординатами, т. е. у (г) = — у0 + z/iZ-1, то при у0<.У1 он называется минимально-фазовым или сигналом с минимальной задержкой. При сигнал на- зывается максимально-фазовым или сигналом с мак- симальной задержкой. При у0 = уг оба определения равноправны. Рис. 39. Геометрическая интерпретация системной функции при двух нулях и двух полюсах (а) и Н (г) = 2 + г-1 = 2 (z+ 0,5)/г в плоскости г-1 (б). J — положение нулей, 2 — положение полюсов Сигнал с множеством ординат, т. е. сигнал вида (6.42) или (6.43), будет минимально-фазовым, если каждый из биномов аг + z-1, а2 + г-1, . . . является минимально-фазовым, и, наоборот, сигнал будет максимально-фазовым, если каждый из биномов максимально- фазовый. Другими словами, на основании (6.43) сигнал можно счи- тать минимально-фазовым, если все корни а2, . . . его полинома у (г) больше г. Поскольку г = е/<0 выражает задержку по времени и в комплексной плоскости представляет собой окружность еди- ничного радиуса (рис. 39), сигнал является минимально-фазовым, если все корни alt а2, . . . его полинома лежат внутри единичного круга е/и или на этом круге. При z = е_/“ корни полинома будут расположены, наоборот, вне единичного круга. Допустим, что весовая функция в общем виде может быть за- писана как частное от деления, двух многочленов, представленных их z-преобразованиями: (6.44) 186
Для такого отношения значения весовых коэффициентов а{ и bt определяют тип фильтрации — рекурсивной или нерекурсивной. Если хотя бы один коэффициент а; 0, а все коэффициенты bt, кроме первого, равны нулю, фильтрация является нерекурсивной. Если же, кроме того, имеется хотя бы один из коэффициентов bt 0, кроме первого Ьй =# 0, то последовательность выходной функции зависит от текущих и прошлых значений входного сигнала, а также от прошлых (профильтрованных) значений выходного сигнала. В этом случае фильтрация будет рекурсивной, т. е. фильтрация с обратной связью. Действительно, с учетом (6.44) выходная функция пвинимает вид У(г) = В(г)Л(г)/В(г) или У(г)В(г) = В(г)Л(г). (6.45) Перейдем к представлению выражений (6.45) во временной об- ласти, заменив произведение г-преобразований сверткой времен- ных рядов: у *b = f *а. Например, пусть Л (г) = а0 + а^1 + а2г~г\ В (г) = 1 + fejZ-1 + b2z~2. Перемножая соответствующие z-преобразования согласно (6.45), получим: Уо= / оао> УоЬ1 + У1 = f oai+fia0, 2/0^2 + У1К + Уч — + (6.46) У1Ьч + уФг + Уз = Ла2 + /А + /А» Выходная функция у0, ylt у2 находится из уравнений (6.46) следующим образом: Уо — У1= Mi + f iao—Уо^ъ Уч — fo&i 4“ f iai + —(уо^ч ~Ь У1Ь1), Уз = f А + fidi+f A—(yibi +1/261), (6-47) ....................4......... У! = fi-i^i + f 1-1O.1A—(yi-ibi + Z//-1&1), или в общем виде М L , У1= Z aifi-i— У biyj^i, i=0 что совпадает с определением рекурсивной фильтрации (6.23). 187
d Рекурсивная фильтрация может представлять интерес лишь в тех случаях, когда М + L<P, где Р — число весовых коэффи- циентов нерекурсивного фильтра, и расчет по (6.47) оказывается экономичнее, т. е. быстрее, чем по обычной формуле свертки (6.12). } Такая экономичность обеспечивается при синтезе узкополосных и особенно режекторных фильтров. Затраты машинного времени могут быть снижены в 5—10 раз и более. Проблема расчета весовой функции рекурсивных фильтров сво- дится к определению корней z-полиномов числителя и знаменателя выражения Н (z) = А (г)/В (г). (6.48) В силу (6.43) числитель и знаменатель могут быть представлены произведениями биномов, поэтому для частотной характеристики имеем м «0 П (* - Я(г) = ^--------------, (6.49) П—рг2-1) i=Fl где ri и pi — корни соответствующих полиномов. Множитель а0 является масштабным и на форму частотной ха- рактеристики не влияет. Числитель в (6.49) равен произведению членов, описывающих нули H(z), а знаменатель — произведению членов, представляю- щих полюсы z-преобразования, т. е. корни числителя являются «нулями», а корни знаменателя — «полюсами» Н (z). С точностью до постоянного множителя эти корни полностью характеризуют свойства фильтра. Если мы установим положение нулей и полюсов на комплексной плоскости, тем самым определим и амплитудно- частотную и фазово-частотную характеристики фильтра. Пусть, например, Н (г) определяется двумя нулями rj и г2 и двумя полю- сами plt рг, положение которых дано на рис. 39, а. Тогда ам- плитудно-частотная характеристика IН (z) | = t\r<JpiPi, (6.50) а фазово-частотная характеристика агсЯ(2) = ф1 + фа—(0i + 0a). (6.50') Весьма существенно, чтобы все корни знаменателя, т. е. «по- люсы», были по модулю больше единицы. В противном случае фильтр оказывается неустойчивым, поскольку не может быть опи- сан ограниченным числом весовых коэффициентов. [Покажем это на примере. Пусть а0 =1; аг = а2 = 0; 60 — 1; Ь± = — 2; Ь2 = 0. Тогда полюс этого фильтра, определяемый равенством 1 + Ьг~1 = 0, будет р = — 1/2 = = - 0,5. Найдем выходную последовательность ’при входном импульсе f = (1, 0, 0, . . .). Отклик фильтра иа этот сигнал определяет импульсную 188
реакцию фильтра, а ее z-преобразоваиие представляет системную функцию Н (г), или частотную характеристику. Из системы уравнений (6.47) для указанного фильтра находим выходные значения: уд = а0 = 1; у1 = = ааЬх = 2; уг = айЬ] = 4; у3 = — а06^ = 8; t/4 = agb\ = 16 и т. д. Таким образом, весовая функция расходится. Подставляя в полученные значения у = (а0; aabx, aab\‘, aobl; а0Ь* . . .) числовые значения, равные ад = 1 и Ьх = 0,9, имеем (полюс р = 1/0,9 = = 1,1) импульсную реакцию в виде (1, — 0,9, 0,81,—0,729, 0,656, . . .), т. е. фильтр является устойчивым, так как весовая функция фильтра сходится. Приведенный пример показывает эффективность применения рекурсивного фильтра по сравнению с применением обычного фильтра-свертки. Действительно, при а0 = 1, Ьг = 0,9 для нахож- дения каждого отсчета выходного сигнала при использовании ре- курсивного фильтра вида yj = а0Х/—b^j-r (рекурсивный фильтр первого порядка) требуется выполнить одно умножение и одно сло- жение. При а0 = 1 и !>i = 0,9 ряд h.{ сходится медленно и надо вычислить по крайней мере 20 членов ряда, прежде чем. их вели- чина станет меньше 0,1. Это означает, что при выполнении нере- курсивной фильтрации на ЭВМ для получения каждого отсчета выходной последовательности требуется выполнить около 20 пар- ных операций сложения — умножения, чтобы обеспечить удов- летворительную точность. В приведенном примере рекурсивной фильтрации на вычисления нужно затратить времени практически в 20 раз меньше. Убывание (по абсолютной величине) отсчетов весовой функции рекурсивного фильтра первого порядка определяется величиной коэффициентов Ьг. При приближении b к единице это убывание замедляется. Заметим, что фильтр с весовой функцией, г-преобразование которой имеет все корни, по модулю большие единицы, называется минимально-фазовым в соответствии с определением минимально- фазового сигнала. Заметим также, что при нахождении системной функции Н (г) можно использовать переменную г, а не г-1 = е_/“. При этом Н (г) не изменяется, так как отсчеты выходной функции описываются той же системой (6.47) и критерий устойчивости | Ь|<1 сохраняется. Однако существенное различие между ука- занными случаями состоит в том, что при использовании переменной г~1 полюсы находятся вне единичной, окружности, а при исполь- зовании переменной z— внутри нее. В обоих случаях единичная окружность делит z-плоскость и z-’ -плоскость на устойчивые и неустойчивые области. Критерии, обеспечивающие положение полюсов вне z-1-плоскости и внутри z-плоскости, выполняются для всех устойчивых фильтров. Положение нулей на устойчи- вость фильтров не влияет. Преимущество построения частотной характеристики (сис- темной функции) Н (z) в виде (6.49), т. е. при одновременном использовании нулей и полюсов, можно проиллюстрировать на следующих примерах: 1. Исследуем функцию Н(z) =2-t-z~I. Она имеет нуль гх = —2 и полюс первого порядка (в нулеz-плоскости). Положе- 189
ния нуля и полюса относительно единичной окружности в г-1-плос- кости показаны на рис. 39, б. Точка С на единичной окружности, отвечающая угловой частоте' й, при интервале дискретизации А/= 1 с является изображением величины г-1 = e~iQ. При этом, как следует из рис. 39, б, значение амплитудно-частотной характе- ристики | Н(г) | для © = й определяется расстоянием между точ- кой С и нулем гх. Значение | Н (г) | для других частот можно по- лучить перемещением переменной z-1 по единичной окружности и из- мерением для каждого z-1 расстояний Сгг. При этом фазовый сдвиг измеряется углом <р (©) = 0 (©). Поскольку сама системная функция Н (г) не меняется от того, в какой плоскости она определяется г- или г-1-плоскости, рассмот- рение нулей и полюсов должно приводить к одинаковым резуль- татам независимо от формы представления Н (г). В z-плоскости для точек С на единичной окружности для данного примера ам- плитудно-частотная и фазовая характеристики при © = й соот- ветственно будут: | Н (й) | = 2СгГ/Ср7; <р (©) = 0—ф. 2. Построим фильтр, направленный на подавление постоянной составляющей входного сигнала. Такой фильтр позволяет пода- вить самые низкочастотные составляющие. При этом идеальный фильтр для подавления постоянной составляющей должен иметь нулевое усиление при а = 0 и равномерное пропускание для всех остальных частот. Приемлемая аппроксимация такого идеального фильтра может быть реализована с помощью функции Яа(г) = (1-г-1)/(1-61г-1). Эта системная функция имеет нуль г1 — 1 и полюс pr = l/b^ Для любой частоты © амплитудно-частотная характеристика пред- ставляет собой отношение Cr-JCp±, где С — точка на единичной окружности. Очевидно, что усиление | Я2 (®) I равно нулю при Сгг = 0 и приблизительно постоянно и близко к единице для ча- стот, на которых Сг± = Срг. Иначе, полюсрг должен располагаться ближе к для того, чтобы приблизить значение характеристики к единице для любой частоты, кроме © -> 0. Еще одно требование вытекает из критерия устойчивости | b± |< 1, т. е. полюс должен находиться вне единичной окружности. Например, для b = 0,95 , Яа(г) = (1—2-1)/(1—0,95г-1). [(6.51) Из амплитудно-частотной характеристики, нормализованной относительно максимального усиления (для © = л) (рис. 40), видно, что фильтр полностью подавляет постоянную составляющую и про- пускает все более высокие частоты с постоянным усилением. Так, _ для частот 0,03©™ и 0,15 ©гр усиление соответственно будет 0,95 | Ятах | и 0,99 | Яшах |. Следовательно, фильтр-Я2 (г) является весьма универсальным средством для подавления постоянной со- ставляющей. 190
Н(ы)г 0,25Ыц qfG)r? 075ь)г, u>rf Рис. 40. Нормализованные ампли- тудно-частотные характеристики для режекторных фильтров, настроен- ных на подавление постоянной со- ставляющей (а) и частоты 0,25 шн (б). Слева показано расположение нулей (/) и полюсов (2) фильтров в г-1-пло- скости Основным параметром, влияющим на форму характеристики | Н2 (z) |, является расстояние между полюсом и нулем: чем оно короче, тем уже диапазон подавляемых частот. Для представления фильтрации во времени умножим обе части формулы (6.51) на (1 — 0,95 г-1) F (г), т. е. имеем (1— 0,95г-1)У(г) = (1— z~l)F(z). __ Отсюда вытекает рекурсивная формула для получения /-го зна- чения выходной функции с целью подавления постоянной состав- ляющей: = x/-i~|-0,95r/z_1. (6.52) 3. Проведем синтез режекторного рекурсивного фильтра для подавления промышленной частоты 50 Гц. Отметим, что для фильтра, устраняющего частоту <ofe, сле- дует расположить н ули, т. е. корни числителя, в точках z [ = 1, для которых 2 = e-'“A,(Ai=l) = 2Re + + J2/m = COS <0 A £ — / sin ©Af, ZRe = COS (О* Д/, ZIm = sin <dk&t. (6.53) Эти точки в z-плоскости на- ходятся на единичном круге под углами ср* = ± ®аД^, из- меренными в радианах, или Фа = ± (180/л) со*. Д/ в граду- сах (см. рис. 40). Из рис. 41, а видно, что фильтр с одним ну- лем устраняет нежелательную частоту ©а> но вместе с тем ис- кажает все остальные частоты. Для ослабления указанных искажений в характеристику Н (z) (6.49) следует ввести пару комплексно-сопряженных корней знаменателя, т. е. полюсов, расположенных в непосредственной бли- зости к нулям. Эти полюсы в силу обеспечения устойчивости | &t|< 1 должны быть вне единичной окружности. Наиболее удобно для даль- нейших расчетов расположить полюсы на продолжении лучей, соеди- няющих начало координат с нулями фильтра. Амплитудно-частот- ная характеристика, как уже отмечалось, будет выражаться от- ношением длин векторов Ci\ICpt. При этом амплитудно-частотная характеристика становится более остронаправленной (рис. 41, б). Путем приближения полюса к нулю регулируется направленность фильтра, и таким образом можно сузить полосу подавления (ре- жекции) до искомого предела. Пример. Построим фильтр при шаге дискретизации Д< = 0,002 с с целью подавления частоты 50 Гц. 191
Решение. Найдем действительную и мнимую части ZRe и z/mB (6.53). Очевидно, что <р60 — ± 2л X 50-0,002 (180°/л) = 36° и, согласно (6.53), ZRe == cos 36° = 0,809; zjm = sin 36° = 0,588. Следовательно, корни чис- лителя располагаются в точках с координатами г01 = 0,809 + j 0,588, г02 = 0,809—j 0,588. Расположим полюсы на лучах под тем же углом <р вблизи, но вне единичной окружности. Пусть |z|= 1,02. Тогда z'Re = = 1,02 zRe = 0,825 и полюсы (корни знаменателя) получим в виде Pi = 0,825 + /0,600; р2 = 0,825 — /0,600. a -Ц-р -CJ/c Q Ct)K <Vrp “&>гр О ^гр Рис. 41. Амплитудно-частотные характеристики \Н (со) Црежекторных фильт- ров с одним нулем (а) и с нулем и полюсом (б) в z-плоскости Таким образом, выражение для системной функции режекторного фильтра будет Н (z) = (1 — _ U (1,02 — piz-* 1) (1,02 — р2г-!) 0,962 (1 — l,618z-i + г~8) (б зд 1 — 1,587г-1 + 0,981г-2 * * * * * ’ V • 1 Отсюда реализация рекурсивного фильтра во временной области выра- жается в виде уп = 0,962 (/ „ -1,6-f„_2) - 0,981 г/„_2 +1,587г/,, При дискретизации Д/ = 0,001 с <рво = 18° и нули Н (г) расположены в точках г12 = 0,951±/0,309. Если при этом полюсы разместить возле нулей при |г|= 1,01, их координаты будут р12 = 0,960 ±/0,312. Тогда z-преобразование весовой функции (системная функция) Н = 0.980(1 — 1,902г-1 + г-2) U 1 — 1,882г-1 4-0,980г-2 I Подчеркнем еще раз то обстоятельство, что применение рекур- I сивных фильтров эффективно, если необходимо иметь большую кру- i тизну частотной характеристики. При этом реализация обычной 1 свертки сводится к очень длинным весовым функциям, например для подавления частоты 50 Гц при обработке сейсмических записей их длина достигает 100 коэффициентов (0,2 с) и более. Реализация рекурсивного фильтра (6.54) требует всего пяти весовых коэффици- ентов, т. е. этот фильтр по крайней мере в 40 раз экономичнее обыч- ного нерекурсивного фильтра-свертки. Сложность построения рекурсивных фильтров с использованием нулей и полюсов системной функции резко возрастает при увели- 192
чении числа ее особых точек, поэтому на практике получили при- менение лишь фильтры низкого порядка. § 32. ДВУМЕРНЫЕ ЛИНЕЙНЫЕ ФИЛЬТРЫ Площадной характер наблюдений потенциальных геофизических полей, многоканальность сейсмических записей, регистрация ка- ротажных кривых по профилю скважин вызывают необходимость построения двумерных линейных фильтров. В общем случае такие фильтры приводят к двумерной пространственной фильтрации. В сейсморазведке преобразование волновой картины, регистри- руемой по времени t и в пространстве (по х), называют пространст- венно-временной фильтрацией. Аналогичный характер (пространственно-временной) фильтра- ции имеет место при обработке данных частотных зондирований в электроразведке, когда результаты измерений представляют в вертикальной плоскости (И, х). Двумерный аналог свертки (6.12), определяющий двумерную фильтрацию входных данных fp/ (/ = 0, 1, . . . , п, п — число пи- кетов, р = 0, 1, .... N, N — число профилей), имеет вид t/pl = 'EZhkifP-k,i-i, (6.55) к i где hki — матрица весовых коэффициентов; индекс k = 0,1, . . . , ..., К изменяется по профилям; индекс i = 0, 1, . . . , I изменяется по пикетам. Часто отсчет значений весовых коэффициентов производят от центральной точки весовой функции, при этом k изменяется от — А72 до J</2, a i — от — Z/2 до Z/2. В частотной области двумерная фильтрация определяется про- изведением двумерных спектров весовой функции Н (&х, coj и входной функции F (<аи, их): Y (сох, ау) = И (®х, <лу) F (сох, аи), (6.56) где (пх = 2л/тАх и <ли = — пространственные частоты (тАх и М&у — протяженности сигналов вдоль профиля и по пло- щади). Формулы (5.26) и (5.27) выражают прямое и обратное преобра- зование Фурье для сигналов (аномалий), описывающих геофизи- ческое поле по площади съемки. Для сейсмических записей прямое и обратное преобразования Фурье, связывающие упругую волну / (/, х) с ее спектром, выра- жаются следующим образом: ОО 00 S (и, kx)= J J f(t, х)ехр[ — j (atkxx)] dtdx, —00 —00 (6.57) f Г f S (“- k*) exP I/ M + Ml d&dkx. (2л)2 7 А. А. Никитин 193
Здесь <о = 2л/Г определяет йрёмеййук) я а С16 t у, ййё- личина k.x — пространственную частоту. По аналогии с и = 2л/Т (Т — период сигнала по времени) для сейсмических сигналов kx = 2л/Хк, где %к — кажущаяся длина волны. Очевидно, что %к = TvK (ук — кщкущаяся скорость волны) и, следовательно, пространственная частота kx = 2л/Хк = 2л/Ток= = и/ок- Пространственные частоты часто называют волно- выми числами, ив связи с этим употребляется термин «вол- ночисловая фильтрация». Двумерная пространственная фильтра- ция по координатным осям х и у используется для различных ви- дов потенциальных полей (гравитационных, магнитных) и в сей- смологии при обработке площадных наблюдений. При входном сигнале fpt и весовой функции hki для пространст- венных координат х и у выходная функция ypj определяется сверт- кой (6.55). Соответствующее уравнение в волновой области выра- жено (6.56). По аналогии с частотной характеристикой идеального фильтра низких частот (6.26) частотную характеристику двумерного низко- частотного фильтра можно задать в виде: (1, |их|<л/Дх, |иД < я/Ьу, (®х, ®») —I |иж|>л/Ах, |(0(,|>л/Аг/, ' где л/Ах и л/Д# — граничные значения волновых чисел, или, иначе, волновые числа Найквиста. Эти числа обычно не одинаковы по разным осям. В общем случае обратное преобразование Н (их, <ои) дает * Л(х, у) = - f Н(ах, ©^ехрЩи^Ч-ш^йсо/Ц,. 4Я —я/ Дх —я/ Д{/ (6.59) Если положить Ах = A# = 1, для дискретных данных получим I к Н (®х, юи) = 4 hki cos i wx cos ka>p (6.60) и i 1/2Дшх 1/2Д®„ = — У У Я(mA(ox, pAojJcos^Ao^Jcos^A®^). (6.61) n n^O p^O Эту процедуру применяют по следующей схеме: 1) вначале вы- бирают функцию Я (сох, а>и), удовлетворяющую требованиям для разделения сигналов по волновым числам; 2) вычисляют hik по (6.61); 3) проводят свертку hik с исходным полем fp,j, в результате чего получают выходную функцию yp,j как результат фильтрации. Для.сглаживания полей, т. е. выделения низкочастотных со- ставляющих, применение частотной характеристики (6.58) ввиду 194
ее периодичности приводит к нежелательному усилению высоко- частотных составляющих наблюденного поля на зеркальных ча- стотах. Поэтому вместо (6.58), как и в одномерном случае, целесо- образно использовать сглаживание Н (сох, сой). Так, В. Н. Стра- ховым выбор частотных характеристик с целью сглаживания гра- витационных полей предлагается проводить по форме Я (сох, ®й) = Н (<ох) Н (<ой) = {1 — [1 - (cos ихДх/2)2ЛГ‘]р‘) X X {1—[1-(cos®,Ai//2)2JV’]p’}. (6.62) Варьируя параметрами /Vj, 7v2 и plt рг, можно подобрать нуж- ную для данных условий форму частотной характеристики. Наи- более часто употребляемыми яв- ляются значения 2Я1>г = 30-? 60; Pi, 2 = Зч-4. Большие значения Nlt а рекомендуются для сглажи- вания аномалий силы тяжести, меньшие — при сглаживании вто- рых производных гравитацион- ного потенциала. Использование сглаживания обеспечивает резкое уменьшение влияния случайных ошибок на результаты пересчета полей. В области волновых чисел час- тотные характеристики, с помощью Рис. 42. Различные виды филь- трации в частотио-волиочисловой области: которых реализуется соответствен- но усреднение в квадрате со сто- роной L, вычисление вторых про- а — частотная, б — волночнсловая, а — скоростная, а — частотно-волно числовая, д — частотно-скоростная, е — по скорости н волновому числу изводных и продолжение поля в нижнее полупространство на глубину Н, имеют простой вид: Н1 ((Ох, ®й) sin s>xL sin s>yL . wxL a>yL ’ Hz(<i>x, (Uy) — (0* + (0y‘, Ha(ax, (Dy) = exp (ff V®x + ®y )• Последние две характеристики безгранично возрастают при увеличении х и у, поэтому на практике вместо точных выражений используются приближенные формулы. Особое место двумерная фильтрация занимает при обработке сейсмических записей. Ее различные модификации (рис. 42, а—ё) имеют самостоятельное значение. Известно много модификаций пространственно-временнбй филь- трации сейсмических записей, которые различаются моделью вол- нового поля, видом частотных характеристик, целью применения. В отличие от одноканальных временных фильтров, базирующихся на частотном различии сигналов и помех, двумерные, фильтры осу- 7» 195
ществляют выделение сигналов по признаку кажущейся скорости и степени коррелированное™ по заданному направлению. Огра- ничимся рассмотрением двух групп двумерных фильтров: ско- ростных фильтров, осуществляющих выделение сиг- налов с прямолинейными осями синфазности, иинтерферен- ционных систем, в которых отсутствует поканальная фильтрация и процедура фильтрации сводится к суммированию некоторого числа трасс вдоль заданной линии с весами, постоян- ными для каждой трассы. Скоростная (или частотно-волночисловая) фильтрация основана на различии кажущихся скоростей полезных сигналов и волн-по- мех. Идеальная частотная характеристика такого фильтра в об- ласти двумерного спектра при | пк |> окгр Н (со, kx) = Н (vK) — 1 и равна нулю за пределами этой области, т. е. на плоскости (со, kx) область пропускания фильтра образует сектор (см. рис. 42, в). По внешнему виду области пропускания фильтр называется веер- ным и при этом является пропускающим. В том случае, когда области пропускания и подавления меняются местами, веерный фильтр будет режекторным. Амплитудная частотная характеристика веерного фильтра, про- пускающего без искажения сигналы внутри веера кажущихся ско- ростей — i>K1< ок< %2, выражается уравнением Я (со, ^={0, — I со |/vK гр «£ kx < I (0 |/ок гр, I СО |/^к гр, ky^> | СО |/Uk гр' (6.63) Для того чтобы веерный фильтр не вносил фазовых искажений, его фазовая характеристика должна быть равна нулю. С помощью обратного преобразования Фурье получим ЯДсо) = -L- ?Я(со, kx)^dkx = м —->г> 1 ' “ У"к гр e/^dkx = sin [(| <01/рк гр) X] 2п -|ю 1/и * пх I W|/VK Гр (6.64) Формула (6.64) определяет частотную характеристику одно- мерного фильтра по направлению х для обработки записей, заре- гистрированных на расстоянии х от центра базы фильтруемых трасс. Пространственно-временная весовая функция получается из (6.64) путем вторичного обратного преобразования Фурье с учетом его четности по аргументу <о: h(t, х)=— F Ях (со) е/0/Ясо = \ 2л ОО —f sinf—i-^-LxAcoscoidco. ft % J \ Vk rp / 0 (6.65) 196
Если теперь учесть дискретный характер записи как по t (i = = t/&t = 0, ± 1, . . . , ± Т), так и по х, при этом число каналов N берется четным и k = х/Ах = ± 1/2; ± 3/2; . . . , ± (N—1) 2, то весовая функция веерного фильтра, пропускающего волны с ка- жущимися скоростями | vK |>Ркгр= Ах/А/ принимает вид htk=l/na(k2—i2). (6.66) Графическое изображение весовой функции веерного фильтра для Г=±5и^=8 приведено на рис. 43, а. Результат приме- нения веерного фильтра (6.66) при Т=±50иЛ/=18к сейсмо- грамме рис. 43, б с целью выделения волн с разными направлениями их распределения показан на рис. 43, в. Большое распространение при обработке геофизических данных получили преобразования, связанные с направленным суммирова- нием, т. е. суммированием исходных данных по направлению кор- реляции полезного сигнала (аномалии). В сейсморазведке сумми- рование сейсмических трасс вдоль заданной линии с весами hK, постоянными или меняющимися от трассы к трассе, реализуется в интерференционных системах. При этом линии суммирования соответствуют форме годографов полезных сигналов [6]. Общая формула результирующей трассы при обработке интер- ференционными системами может быть представлена в виде • N-1 = (6.67) где т* — временной сдвиг на k-й трассе (относительно произволь- ного начала отсчета), определяемый годографом волны. Если на сейсмотрассах наблюдается регулярная волна f (t, х) с годографом вступления t (х) = у* (/) = f (t—tk), то из (6.67) следует выражение, описывающее выходную функцию интерфе- ренционной системы: ЛГ-1 N—1 y(t)=L Ы(t-tk + т*) = Z W (6.68) k=0 k=0 где величины 0* = —т* определяют отклонение годографа от Даданной линии суммирования. Применяя свойство преобразований Фурье о запаздывании функ- ции (см. § 24), найдем спектр профильтрованных данных У(о>) = Нв(®)Г(®), где N-1 Нв(а>) == ^ (6.69) F (и) — спектр волны f (I) на трасее k = 0. Форма годографа волны зависит от направления ее подхода к линии наблюдения, поэтому функцию Нв (<в) называют харак- теристикой направленности интерферен- 197
Рис. 43. Весовая функция веерного фильтра (а), исходная сейсмограмма (б) и результат ее веерной фильтрации (в)
Ц И б н н о й системы. &та характеристика прёдстайляёт сб- бой периодическую функцию с главным (основным) и побочными максимумами. Число побочных максимумов и соотношение между их амплитудами и амплитудой главного максимума зависит от числа суммируемых каналов /V и величины 0*. При 0* = 0, т. е. когда годограф волны совпадает с направле- нием суммирования, имеет место синфазное суммиро- вание, при этом N—1 (6.70) Если hk — 1, то |Яе(®)1тах = Яе(®) = ^. (6.71) Отношение энергии сигналов на выходе интерференционной си- стемы Ее к энергии сигнала, полученного при синфазном сумми- ровании, Ее = (2Л*)2 ^о. гДе — энергия сигнала на исходных трассах; Ее/Ев — коэффициент направленного действия, характе- ризующий разрешающую способность интер- ференционной системы, т. е. показывает, насколько интерференционная система ослабляет интенсивность сигнала при отклонении его годографа от линии суммирования. Интерференционные системы также ослабляет влияния случай- ных волн-помех. Если иа исходных трассах энергетическое отно- шение сигнал/помеха равно рвх = Е0/с*, то при синфазном сумми- ровании энергия полезного сигнала на выходе интерференционной системы Евых = (W2£<r Энергия помехи на выходе системы N—1 Ствых = о2^ hk и энергетическое отношение сигнал/помеха на вы- ходе Рвых = ^ВЫХ^^ВЫХ = S/IjEq/O' S/lft- Отношение ______ _______ N-\ J N—l s = д/рвых/рвх = Л*/Д/ 2 Л* ’ (6.72) называемое статистическим эффектом интерфе- ренционной системы, показывает, во сколько раз уси- ливается интенсивность сигнала по отношению к некоррелирован- ной по х случайной помехе. При hk = 1 получаем максимальную величину статистического эффекта, равную з = л] N. Теперь рассмотрим, как изменяется характеристика направлен- ности интерференционной системы, если годограф полезной волны не совпадает с направлением суммирования. Если вдоль профиля распространяется волна с постоянной ка- жущейся скоростью Vk, время ее прихода на n-й канал относительно нулевого канала tn — nAxlvK. Наклон линии суммирования можно задать параметром оКсум = Дх/Дт, где Дт— временной сдвиг ме- жду соседними трассами. Отсюда временной сдвиг для колебаний 199
п-и трассы относительно нулевой т„ = пАх/оксум- Отклонение го- дографа волны от линии суммирования Хп ~ пДх — 1/Ц& сум)- (6.73) Подставив (6.73) в (6.69), получим N-1 Нв (<о) = £ /гпе-/пД^ = Н (kx), (6.74) п=0 где kx — разностное волновое число, характеризующее различие пространственных частот волны kxB и линии суммирования kxcy№, kx — kx B — kx cyM = (й/Vk в w/Uj сум = ©/Од- Параметр 1/ик имеет смысл разностной кажущейся скорости И 1 / V к = 1/Окв—1/Оксум- Характеристика направленности интенференционной системы представляет собой функцию разностной пространственной частоты и вычисляется как спектр дискретной весовой функции. Характе- ристика Н (kx) является периодической функцией пространствен- ной частоты с периодом kx = 2л/Ах, и ее называют обобщен- ной характеристикой интерференционной системы ввиду того, что ее аргумент — пространственно-вре- менной параметр [6]. При hn = 1 из (6.74) следует, что N-1 H(kx}=- £ е-/пД*\ (6.75) п=0 Выбрав начало отсчета х в центре базы системы, получим по- следовательность равных весовых коэффициентов в виде четной функции. При этом Н (kx) будет функцией с нулевой фазовой харак- теристикой. Для вычисления (6.75) надо найти сумму N членов геометрической прогрессии со знаменателем, равным е-/Лх*х, поме- стив начало отсчета каналов в центр базы суммирования. Тогда характеристика направленности (6.75) примет вид H(k\— sin (N^xkx!^) х . sin (ДхЛ*/2) (6.76) Функция (6.76) зависит от величин N и Ах, имеет период 2л/Ах и максимум, равный Н (kx)max = Н (0) = N. Обычно для построения обобщенной характеристики направ- ленности (рис. 44) используют относительные значения Н. Эти характеристики зависят от изменения числа суммируемых каналов (рис. 44, а и б), от увеличения базы суммирования /УАх (рис. 44, б) и изменения vK (рис. 44, в). Увеличение числа N при постоянном шаге Ах ведет к сужению области пропускания, определяемой главным максимумом характе- ристики, и к расширению области подавления, к которой относят интервал между главным и побочным максимумами, его граничные значения 2л//УАх и 2л (N—1)//УДх. При увеличении шага между каналами в 2 раза (см. рис. 44, б) при тех же значениях N вдвое увеличивается база суммирования. 200
При этом период функции Н (kx) уменьшается вдвое и соответст- венно сокращаются размеры областей пропускания и подавления. Для волны с vK = const от Н (kx) легко перейти к Н (со), для чего значения kx следует пересчитать в соответствующие значения = kxVx, где % — разностная кажущаяся скорость волны от- носительно линии суммирования. Характеристика Н (со) с перио- Рис. 44. Характеристики направленнЬсти интерфе- ренционных систем для сейсмических плоских волн [6]. а — при Дх = const; б — Дх' = = 2Дх = const; в — для ок (при N = 4) равной: 1 — оК1 2 — 2v'K, 3 — 4 t»R. 4 —оо дом Q = kxvK = 2nvK/Ax растянута по оси со пропорционально величине vK (см. рис. 44, в). Для синфазно суммированной волны = °°. Н (<л) = const форма колебаний при суммировании не искажается. Спектры ос- тальных волн, годографы которых отклоняются от линии суммиро- вания, подвергаются искажениям тем значительнее, чем больше это отклонение, т, е. чем меньше разностная скорость vK (см. рис. 44, в). Характеристики направленности, приведенные на рис. 44, оп- ределяют процесс обработки по методу регулируемого направлен- ного приема (РНП). Совершенно аналогичные характеристики будут оценивать ка- чество приемов обработки потенциальных полей, направленных на выделение аномалий путем скользящего суммирования исходных данных в пределах N профилей, например способ межпрофильной корреляции (см. § 41). Характеристики направленности могут быть использованы при анализе преобразований двумерных потенциальных геофизических полей,- если аномалию описать выражением f (х, у) = f (у—фх), где ф — азимут простирания аномалии (сравни с описанием сейсми- ческой волны s (t, х) = s (t—x/v)). Выражение для азимута про- стирания при линейном смещении аномалии от профиля к профилю Ф = arctg (0Ax/At/), где Ах, At/ — расстояния между пикетами и профилями; 0 — число пикетов, на которое смещена аномалия между соседними профилями. 201
ГЛАВА VII ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ФИЛЬТРЫ Рассмотренные в гл. VI линейные фильтры были построены на ос- нове задания тех или иных частотных характеристик. При этом предполагалось, что области повышенных амплитуд частотных ха- рактеристик соответствуют частотным составляющим полезных сигналов, а области отсутствия частотных характеристик — ча- стотным составляющим помех, т. е. построение фильтров осущест- влялось в рамках детерминированного подхода к обработке данных. Такие фильтры не учитывают того обстоятельства, что на практике спектры сигнала и помех часто занимают перекрывающиеся между собой диапазоны частот. При наличии перекрывающихся спектров фильтры с прямоуголь- ной частотной характеристикой, используемые в гл. VI, не могут полностью выделить сигнал на фоне помех, поскольку при этом они пропускают некоторую часть помех и подавляют определенную часть полезной информации. Таким образом, все приведенные в гл. VI фильтры можно рас- сматривать как неоптимальные. При этом возникает вопрос о построении оптимальных фильтров, позволяющих иаилучшим образом выделять сигналы на фоне помех. На постав- ленный вопрос ответ дает теория оптимальной фильтрации, осно- ванная на критериальном подходе к построению линейных фильт- ров. § 33. КРИТЕРИАЛЬНЫЙ ПОДХОД К ПОСТРОЕНИЮ ЛИНЕЙНЫХ ФИЛЬТРОВ При критериальном подходе к построению фильтров задача состоит в том, что на основе известных корреляционных (или спектральных) свойств сигнала и помех требуется реализовать такой фильтр, ко- торый будет либо воспроизводить, либо обнаруживать искомый сигнал наилучшим образом с точки зрения некоторого критерия. В настоящее время в практике обработки геофизических полей нашли применение три основных критерия построения линейных фильтров: минимум среднеквадратического отклонения профильт- рованного сигнала от желаемого (заданного априори); максимум пикового отношения сигнал/помеха и максимум энергетического отношения сигнал/помеха на выходе фильтра. В соответствии с ука- занными критериями решаются задачи сглаживания, воспроизве- дения, обнаружения и разделения сигналов. Построение оптималь- ных фильтров в отличие от неоптимальных требует задания апри- орной информации о корреляционных или спектральных характери- стиках как сигнала, так и помех, В то же время для оптимальных 202
фильтров возможна Оценка погрешностей фильтраций, которые являются предельно достижимыми для неоптимальных фильтров. При построении оптимальных фильтров используется аддитив- ная модель поля (6.1): ft = Sy + п/. Из-за наличия помехи Пу пол- ное восстановление сигнала з/ по наблюденному полю ft путем ли- нейной фильтрации обычно невозможно. Профильтрованный вы- ходной сигнал yi в той или иной степени всегда будет отличаться от S/. Поэтому вполне разумно для выделения сигнала выбрать такой критерий, при котором среднеквадратическое отклонение требуемого, т. е. желаемого, сигнала от профильтрованного было бы минимально. Этот критерий, как видим, исходит из задания желае- мого выходного сигнала. Обозначим его через зу. В частности, можно считать, что желаемым выходным сигналом является точ- ная копия входного сигнала зу, т. е. Sj = Sj. В общем случае желае- мым сигналом может быть любая заданная от координат х или t функция. Фактический выходной сигнал будет отличаться от желаемого на величину 8у = у/—S/, которую можно рассматривать как по- грешность воспроизведения желаемого сигнала. Качество линей- ного фильтра можно оценить либо средним значением модуля 8у, т. е. |е|, либо средним значением квадрата в/, т. е. е4. Крите- рий минимума среднеквадратического от- клонения еа, предложенный А. Н. Колмогоровым (1941г.). и Н. Винером (1949 г.), придает большой вес значительным погреш- ностям 8/ и игнорирует малые. Очевидно, что, полагая у1 = = Z htfj-t, где hi — весовые коэффициенты фильтра, получим вы- ражение критерия минимума среднеквадратического отклонения eJ=^ZW/-t-S/y=>min. (7.1) Минимизация ъл (см. § 34) позволяет определить значения hi через корреляционные характеристики сигнала Зу и помехи Пу. По своему принципу критерий (7.1) близок к критерию наимень- ших квадратов, применяемому с целью вычисления коэффициентов регрессионных зависимостей (см. гл. II). Проводя аналогию ме- жду этими критериями, можно считать, что для метода наимень- ших квадратов желаемым сигналом является заданная модель рег- рессионной зависимости. Как критерий минимума среднеквадрати- ческого отклонения, так и критерий наименьших квадратов исхо- дят из статистической модели экспериментального материала (на- блюденного поля), т. ё. работают в рамках вероятностно-статистиче- ского подхода. При детерминистской модели поля в рамках детер- минированного подхода аномалия обычно задается в виде аналити- ческой, ограниченной функции, а относительно помех не делается каких-либо предположений. Обратные задачи разведочной геофи- зики при детерминированном подходе являются некорректно по- ставленными как из-за наличия помех во входном сигнале, так и 203
ввиду принципа эквивалентности. Основой построения решений некорректных задач служит сформулированный А. Н. Тихоновым (1963 г.) принцип регуляризации. В конечном итоге этот принцип сводится к учету априорной информации о свойствах искомого решения и о помехе во входных данных на базе так называемого регул яр изующего функционала (или стабилизатора). Суть регу- ляризации, по А. Н. Тихонову, состоит в том, что при решении системы линейных уравнений, к которым сводится реализация всех оптимальных фильтров, производится минимизация отклонений точного решения рт от приближенного ра с учетом стабилизатора— регулирующего функционала й (р): II Рт—ра lit + ай (р) => min, (7.2) где а — параметр регуляризации; й (р) — стабилизатор, учиты- вающий априорные свойства искомого решения; £2 — евклидово пространство с квадратичной метрикой. Выбор стабилизатора неоднозначен и определяется характером решаемой задачи. Фактически его введение является «штрафом», накладываемым интерпретатором на решение за его нежелательные свойства, в частности за негладкость, т. е. искажение помехами. При решении задачи построения фильтров с целью выделения сигналов на фоне помех регуляризации сводится к регуляризации по помехам. Для некоррелированной помехи стабилизатор является не чем иным, как ее дисперсией, которая неизбежно учитывается при построении фильтров на основе статистической модели на- блюденного поля. Таким образом, в рамках вероятностно-статистического подхода не требуется использование принципа регуляризации, точнее, он реализуется несколько иными критериями, чем (7.2). Однако если при решении задач обработки геофизических данных достижения вероятностно-статистического подхода велики, то при количествен- ной интерпретации аномалий возможности такого подхода пока весьма ограниченны. Именно поэтому критерий (7.2) получил ши- рокое применение прежде всего в задачах количественной интер- претации аномалий в гравиразведке. На основе критерия минимизации отклонений профильтрован- ного сигнала от желаемого (7.1) и близкого к нему критерия наименьших квадратов решаются задачи преимущественно по оценке формы сигнала (выделение сигнала) и оценке формы корре- ляционной связи. Совершенно иной критерий оптимизации используется в тех случаях, когда требуется решить вопрос лишь о наличии сигнала известной формы, т. е. только установить факт его наличия в на- блюденном поле. При этом говорят о задаче обнаружения сигнала, в отличие от задачи выделения его. ; Поскольку форма сигнала считается известной, нетнеобходи- мрсти ограничивать искажение его фильтром. С целью уверенного обнаружения (установления факта наличия) сигнала фильтр дол- 204
жен обеспечить максимально возможное превышение его ампли- туды над помехой, использовав при этом различия в корреляцион- ных или спектральных свойствах сигнала и помех. При визуальном обнаружении сигнала применяются отношения сигнал/помеха нескольких типов. При корреляции волны на сей- смограмме, а также узких аномалий потенциальных полей исполь- зуют пиковое отношение сигнал/помеха Pi = Лэкс/<т, (7.3) где ЛЭкс — экстремальное значение сигнала (максимальное или минимальное); о — среднеквадратический уровень помех. При расплывчатой форме сигнала (аномалии), т. е. при отсутст- вии ясно выраженного экстремума, более приемлемым оказывается отношение средних квадратов |12 = ?/о2, (7.4) т где s2— средний квадрат амплитуды сигнала, s2=£s2/m; т— число аномальных значений; о2 — дисперсия помех. Обе оценки для отношения сигнал/помеха (7.3) и (7.4) содержат параметры интенсивности сигнала и помехи. В то же время оче- видно, что ни амплитуда сигнала, ни среднеквадратический уро- вень помех не являются достаточными для полного и объективного описания отношения сигнал/помеха. При описании сигнала (аномалии) помимо интенсивности су- щественное значение имеет его протяженность, при описании по- мехи величина ст2 является достаточной лишь в случае ее некорре!- лированности. Наиболее полной характеристикой для отношения сигнал/по- меха следует считать энергетическое отношение, которое для заданного по форме сигнала и некоррелированной по- мехи будет p = ^s2/o2 = s2/n/a2, (7.5) а в случае коррелированной помехи p = sR7’s, (7.6) где s', s — соответственно вектор-строка и вектор-столбец ординат сигнала; R71 — обратная корреляционная матрица помехи. Критерии оптимизации при построении фильтров обнаружения основаны на максимизации отношения сигнал/помеха на выходе фильтра (это так называемый согласованный фильтр, см. § 35) и энергетического отношения сигнал/помеха на выходе фильтра (энергетический фильтр, см. § 36). 205
Приведенные выражения (7.3) — (7.6) представляют собой раз* личные типы отношений сигнал/помеха на входе фильтра. Для того чтобы получить выражения для пикового и энергети- ческого отношений сигнал/помеха на выходе фильтра, обозначим профильтрованные значения полезного сигнала и помехи соот- ветственно через S/ и nf. sj = 2h(Sj-i; nt = 2hirij^i, где Sj и nt — значения сигнала и помехи на входе фильтра. Профильтрованное значение сигнала в точке х0 равно хВЫх (х0) = = s'h. Энергия сигнала на выходе фильтра определяется суммой квад- ратов ординат профильтрованных значений: Es вых = s/ = £ hiSj_lJ. Возведя элементы внутренней суммы этого выражения в квадрат и учитывая, что = Rs (т—0 корреляционная мат- рица сигнала, получим энергию профильтрованного сигнала в виде Esвых = Е ЕhmRs (т — i)ftt =h'RJi. т i Совершенно аналогично получим выражение для мощности помехи на выходе фильтра Еп вых — h'Rnh, где Rn = Rn (m—i) — корреляционная матрица помехи. Пиковое отношение сигнал/помеха на выходе фильтра в неко- торой точке х0 Цвых (x0)/na (х) = (sVT) /A'R„A, (7.7) П*=Еп, вых, . где "s — вектор координат заданного по форме сигнала (s0, Si, . . . s„,); h — вектор искомых весовых коэффициентов фильтра; Rn — корреляционная матрица помехи. Критерий максимума пикового отноше- ния сигнал/помеха сводится к максимизации выражения (7.7). Впервые этот критерий предложен Д. Норсом (1943 г.). Оче- видно, что числитель (7.7) равен квадрату произведения строки из координат сигнала на столбец из координат искомой весовой функ- ции Л. Знаменатель, оценивающий энергию помех на выходе фильтра, 206
равен произведению следующих матриц: (йо, йх, ₽„(М) Rn(M—i) . . . R„(0) й0 Й1 Йм В частности, если s = (s0, sx), а помеха задана двумя значениями ее автокорреляции Rn (0) и Rn (1), мы имеем =__________(Mi + Siftp)2__________________(Mi + Мо)2________, .. . Г/?П(О)Я„(1) 1/M (Л§+ h?)/?Л(0)+2й0Л1Я„(1) ’ (Mi) I III L/?„(i)/?n(o) J W так как перемножение матриц знаменателя дает /Йо\ [йоЯп (0) + Й!₽„ (1); йо₽„ (1) + йх7?я (0)] =» = (й2+й?)₽я(0) + 2йой1/?я(1). Полагая й? + й? = Rh (0) и й0Й! = Rh (1), получим ______(Ml + Sl^o)8______ я„(о) яЛ(о)+2/г„(1) /гЛ (I) (78) Критерий максимума энергетического отношения сигна л/п о м е х а соответственно состоит в максимизации энергетического отношения^ си гнал/помеха на вы- ходе фильтра, т. е. max pBMx=max Е,,лых/п*. Если сигнал и помеха заданы своими автокорреляционными функциями Rs и Rn, то Рвых — Л Rsft Т t___________ h'R^i ^,ZhihlRn4 (7-9) где Rstf и Rni/ — элементы корреляционных матриц сигнала и по- мехи. Выражение (7.9) представляет собой отношение двух квадратич- ных форм. Раскрывая это выражение для случая, когда сигнал 207
и помеха заданы двумя значениями их автокорреляционных функ- ций, с учетом (7.8) получим rRs(0) /?s(i)-| /V (h0, /ii) L/?s(l) RS(O)J \h^ РВЫХ ГЯл(О) Я„(1)Т /ho (ho, Л1) ( Ltfn(l) /?n(0)J Ux __ Rs(0)Rh(0) + 2Rs(V)Rh(l) Rn(0)Rh(0) + 2Rn(l)Rh(l) (7.10) Сигнал Sj в модели исходного поля f = s;- + nt можно рассмат- ривать и как детерминированный, т. е. заданный своей формой. При этом требуется расчет его автокорреляционной функции. § 34. ФИЛЬТР КОЛМОГОРОВА—ВИНЕРА Фильтр Колмогорова—Винера строится на основе критерия мини- мума среднеквадратического отклонения е/ профильтрованного сигнала У/ — Y.hcfi-i от желаемого st: ? = (ЕМ/-«—S/^. (7.11) Черта сверху означает усреднение ошибки отклонения в2 по всем j-m значениям. В общем случае этот фильтр решает задачу сглажи- вания, т. е. (7.11) полностью совпадает с (7.1). Перепишем (7.11) с учетом возведения в квадрат и усреднения входящих в него членов: e‘=(EW/-l) —2s)EW/-i + S/ = = + 1, И1 = 0, 1...M. mi m Очевидно, что = Rf(m— i), (m), где Rj (m—i) — корреляционная матрица исходного поля f\ — взаимно корреляционная функция желаемого сигнала s и исходного поля f. Отсюда * = Е Е hthmRf (т- i)-Е hmB~f(rn) -Й,2. (7.12) т i т Для нахождения минимума еа необходимо взять производную 82 по hm и приравнять ее к нулю, т. е. из (7.12) следует, что -^- = EA/Rf(/n-i)-B7f(/n) = 0. (7.13) dhm t 208
Анализ (7.13) показывает, что необходимым и достаточным ус- ловием обращения (7.11) в минимум для нахождения весовой функ- ции фильтра ht является решение матричного уравнения вида £/i{R,(m-0 = B7,(m). ' (7-14) Уравнение (7.14) представляет собой дискретный аналог урав- нения Колмогорова—Винера, которое для непрерывных случайных процессов выражается как ^h(;t)Rf(t—x)dx = B'-sf (t) и из- вестно под названием уравнения Винера—Хопфа. Впервые оно получено А. Н. Колмогоровым, однако для решения задачи филь- трации было предложено Н. Винером. Если сигнал s и помеху п считать независимыми друг от друга, то их взаимно корреляционная функция будет равна нулю и пра- вую часть (7.14) можно записать как (/и) = B7s (т) + В?п (т) = В~ (т). Учитывая также, что для fj = Sj + п/ корреляционная матрица Rf = Rs + Rn, уравнение (7.14) перепишем в виде ^hi [7?s (т—i) + Rn(m—i)] = Въ (m). (7.15) i Уравнение (7.15) по известным автокорреляционным функциям сигнала и помехи и по взаимно корреляционной функции желае- мого сигнала Sj с исходным s/ позволяет найти весовую функцию фильтра сглаживания. Если принять, что желаемый сигнал s совпадает с исходным s, т. е. s = s, то B~s (т) = Rs (т) и уравнение (7.15) преобразуется следующим образом: Е ht [7?s (m—i) + Rn (m—i)] = 7?s (m). (7.16) Уравнение (7.16) по известным АКФ сигнала и помехи позво- ляет рассчитывать весовую функцию фильтра, называемого фильт- ром воспроизведения исходного сигнала. Уравнение (7.16), так же как и уравнение (7.15), можно записать в виде системы линейных уравнений: при т = 0 h0[Rs(Q) + Rn(Q)] + h1[Rs(l) + Rn(l)]+ . . . + + hM [Rs(M\+Rn(M)] = Rs(Q)- при m=l /iolRs(l) + Rn(l)] + /ii[R,(O) + Rn(O)]+ . . . + + hM [Rs (M-1) + Rn (M-1)] ±= Rs (1); (7.17) при m=M ha[Rs(M)+Rn(M)]+h1[Rs(M-l)]+Rn(M-l)] + + . . . +hM [Rs(V + Rn (0)] = R,(M). В этой системе учтена четность автокорреляции R (— т) = R (т). 209
Проиллюстрируем нахождение весовых коэффициентов из урав- нений (7.15) и (7.16) на простой числовой модели. Пример. Пусть полезный сигнал на входе фильтра представлен двумя значениями s0 = 3 и sx = 1. Этот сигнал осложнен некоррелированной по- мехой с единичной дисперсией и нулевым средним: п0 = 1; ni = 0; i 0. Зададим желаемый сигнал s/ на выходе фильтра в виде единичного: 0, 1, 0. Тогда функция взаимной корреляции В- (т) в правой части (7.15) будет B?s(0)= 1 и B?f (l)= 3. Функция автокорреляции входного сигнала без учета его усреднения состоит из двух значений: Rs (0) = Sq + sj = 10 и Rt (1) = SqS, = 3, со- ответственно для помехи Rn (0) = Пд + nJ = 1 и Rn (1) = n<fil = 0. Решение. Уравнение Колмогорова—Винера (7.15) в матричной форме с учетом полученных выше ГЯ,(0) + /?„(0) (Л»> МI LRs(l) + Rn(l) Последние выражения значений Л.(1) + Я„(1) R»(0) + R„(0)J системе линейных уравнений (7.17) примут вид: в hg[Rs (0) + Rn (0)] + hl [Rs (1) + Rn (1)] = B?f (0); ft0[Rt (1) + Rn (1)] + [/?,(0) + Rn (0)] = B?s (1). Подставив полученные числовые значения, имеем Г Ло-11 4-ЛгЗ= 1, (1, 3) или < ( fto-3-l-fti-ll =3. (Ao. hi) Отсюда Ло = 0,018, = 0,268. Для того чтобы не было усиления сигнала на выходе фильтра за счет свертки, т. е. чтобы масштаб выходного сигнала соответствовал масштабу входного сигнала, весовые коэффициенты обычно нормируют к единичной энергии: Лц + ftj = 1. С учетом этой нормировки получаем Ло = = 0,018 <0,018» + 0,268» = 0,067, = 0,998. Профильтрованный сигнал, согласно свертке, будет представлен значе- ниями: у0 = soho = 0,201; yi = htSi + AjSq = 3,061; yt =s1h1 — 0,998. Для рассмотренного фильтра с учетом (7.8) и (7.10) найдем пиковое и энергетическое отношения сигнал/помеха на входе фильтра: R,(0) R,<0) + 2R,(l)R,(l) R.(0)R.<0)"9'”’ ---------R.(0)R,(0) '°’’* Здесь Rh (0) = hg + hl = 1, /?h(l) = hghi = 0,067 — значения АКФ ве- совой функции. ОчеЬиДно, и (m) = R SS S /11 (Л«. hl) I \3 Применяя свойства преобразований Фурье линейности и свертки функций (см. § 24) к (7.16) Н (со) [ Ws (со) + Wn (<*>)! = (со), получим выражение для частотной характеристики фильтра вос- произведения Н (<о) = W, (©)/[№, (со) + Wn (®)1, что для фильтра воспроизведения (7.16), когда s=s (m), получим систему уравнений 3\ ) = (10, 3). 11/ (7-19) 210
где Ws (со) и Wn (со) — соответственно энергетические спектры сиг- нала и помехи, которые, в частности, могут быть рассчитаны по их автокорреляционным функциям. Если сигнал s, во входной последовательности не является случайным процессом, а представ- лен аналитически заданной функцией, вместо Ws (со) следует пи- сать | S (со) |2. Из выражения (7.19) видно, что фильтр Колмого- рова—Винера эффективен именно в задачах сглаживания и вос- произведения, для которых необходимо большое отношение сиг- нал/помеха. Действительно, при большом отношении сигнал/по- меха Wn (со) < W, (со) частотная характеристика Н (со) 1. Сле- довательно, весовая функция есть дельта-функция и фильтр точно воспроизводит сигнал. Таким образом, из (7.16) и (7.19) следует, что для построения оптимального фильтра воспроизведения сигнала необходимо зна- ние автокорреляционных функций сигнала и помехи или их спектров на входе фильтра. Преимущество оптимальных фильтров по сравнению с неопти- мальными состоит в возможности получения оценок качества филь- трации. Так, для фильтра воспроизведения качество оценивается среднеквадратической погрешностью ё2=—С WsWWnM da Л J U7,(®) + «М®) о (7.20) Если спектральная плотность помех мала по сравнению со спектральной интенсивностью сигнала, т. е. Wn (со) W, (со), то г2 = J- f Wn (©) dio = Rn (0) = о2, Л 0 что означает равенство среднеквадратической погрешности сгла- живания (воспроизведения) сигнала дисперсии помех о2. Применение фильтра Колмогорова—Винера не ограничивается решением задач сглаживания и воспроизведения сигнала, оно зна- чительно шире. Поэтому приведем примеры использования фильтра для решения наиболее часто встречающихся в практике обработки геофизической информации задач. Выделение аномалий в гравиразведке При обработке данных гравиразведки фильтр Колмогорова—Ви- нера был использован И. Г. Клушиным с целью сглаживания вы- сокочастотных составляющих поля, его исследованием также за- нимались В. И. Аронов, С. А. Серкеров, П. Ганн и другие. Весовую функцию фильтра воспроизведения И. Г. Клушин определял на основе обратного преобразования Фурье частотной характеристики (7.19): ОО hi — — \-----------------cos coiAxdco (7.21) ' л] «7,(<о) + W'n(o) v ' о 211
В этом выражений учтена четность Н (со) [см. (7.19)1, которая следует из симметрии энергетических спектров. Спектры Wt (со) и ,Wn (®) в гравиразведке предложено опреде- лять через АКФ гауссова типа, т. е. 72 Rs (пг)= —ехр (—/и2//-?); у2л Rn (т) — 7— ехр (—т2//^) > ___ _ у2п где А2 и п2 — средняя интенсивность аномалии и помех. Соответствующие этим спектрам энергетические спектры: оо Fs(<o) =f А2 ехр (—m2/rs2) cos comd/n = о = 7Prs (д/лУ2) ехр ( — a>2rs2/4); ОО Wn (®) = f n2 ехр (—tn/rfy cos asmdm = 0 = n2rn (д/л /2) exp ( — co2/-2/4). Отсюда частотная характеристика фильтра воспроизведения аномалии будет представлена в виде и (ю) =-------------------=---------!--------= «М®) + Wn(a) 1 + Wn(a>)/Ws(a) .____________________1_________________ 1 + (п2г„/Л%) ехр [ - а2 (г2 - г2)/4] Полагая, что аномалия по интенсивности соизмерима с уровнем помех, т. е. п2 = А2, а ее интервал корреляции rs в 5 раз больше интервала корреляции помехи rn = 1, получим Н (со) ----------!-------- ' ’ 1 + (1/5) ехр (6<йа) С учетом (7.21) имеем ОО . _ 1 f cos m/Axdto 1 + (1/5) exp (6ш2) 0 Этот интеграл можно вычислить, воспользовавшись формулой трапеций. Переходя к дискретной свертке, получим профильтро- ванные значения поля fc. у. — — 2 f t (0,293 5i~e,8‘A* + 0,172 = У1 п 1 \ 0,8/Дх 0,4/Дх ) — 0,148/ j + 0,136 (//+1 + f /-1) + 0,107 (f/+i + f y_j) + + 0,069 (fj+з + f /-з) + 0,033 (fi+t + f /-«)• Пример, иллюстрирующий сглаживание высокочастотной по- мехи, соизмеримой по интенсивности с аномалией силы тяжести, приведен на рис. 45. 212
Если модель наблюденного поля включает помимо локальной составляющей региональный фон: f = sper + smK + п, то при ус- ловии независимости их появления между собой и от помехи спектр наблюденного поля Wf (ш) = U7per (<о)+№Лок (®) + Wn («), где №Рег (<о), Н7ЛОК (®) И Wn (со) — энергетические спектры соответст- венно регионального фона, локальной аномалии и помех. Следовательно, частотная характеристика фильтра Колмого- рова—Вииера для выделения (воспроизведения) локальной ано- Рис. 45. Результаты выделения аномалии на фоне помех по критерию Кол- могорова—Винера: 1 — заданная аномалия; 2 — аномалия, осложненная помехой; 3 — результат фильтра- ции (по И. Г. Клушнну) малии, осложненной региональным фоном и погрешностями на- блюдений (помехами), примет вид Я(ю)=------------^лок (т)---------- (7.22) №per (®) 4" ^лок (<о) + Wn (со) ' 7 При этом фильтр Колмогорова—Винера соответствует полосовому фильтру. При аппроксимации энергетических спектров U7per (со), И^лок (<*>), Wn (со) выражением W (со) = Ааг (д/л /2) ехр (— <о2г/4) получим частотную характеристику такого полосового фильтра с учетом (7.22) ц = _____________________1 + сехр ( — <оааа/8)__________________ 1 + са ехр ( — <оааа/4) -j- d2 ехр ( — <оа6а/4) + 2с ехр ( — <оааа/8) ’ (7.23) где 2 2 2 ,2 2 2 О —Грег — Глок! О —Гп — Глок! J2 -П (Л — Рег Рег . J2 . т Г плок лок лок лок Результат применения частотной характеристики (7.23) к сум- марному полю Ag (рис. 46, а) позволяет провести выделение ло- кальных аномалий с высокой достоверностью (рис. 46, б) и тем самым подчеркнуть основные структуры кристаллического фунда- мента (рис. 46, в). По эталонным профилям I и II на схеме поверх- ности фундамента (см. рис. 46, в) проводилась оценка параметров А рег И Грег и Л^лок и Глок, помеха принималась некоррелированной и оценивалась по погрешностям наблюдений. Для регионального 213
Рис. 46. Результаты выделения локальных аномалий &g на фоне регионального поля и помех с целью картирования поверх- ности кристаллического фунда- мента на одном из участков Цен- тральной части Московской сине- клизы (по С. А. Серкерову). л — наблюденное поле Ag в уел. ед.; б — поле локальных аномалий Д£ в — структурная схема поверхности кри- сталлического фундамента фона были получены Лрег — 0,64 км’, Грег= 50,9 км, для локаль- ных ПОДНЯТИЙ 11ок = 0,16 км’, Глок = 24 км. Обратная фильтрация Обратная фильтрация широко используется в сейсморазведке для повышения разрешающей способности сейсмических записей, в ча- стности для подавления реверберационных волн-помех в морской сейсморазведке. Цель обратной фильтрации — максимально при- близить сейсмический импульс к дельта-функции, т. е. в конечном итоге получить импульсную сейсмограмму. Поэтому обратный фильтр часто называют фильтром сжатия. Идеальный обратный фильтр имеет частотную характеристику Н (©) = l/S(to) = S*(©)/|S (©)(’. (7.24) где S (®) — спектр желаемого сигнала; S* (ш) — комплексно- сопряженный спектр сигнала. 214
Очевидно, что на выходе фильтра получим сплошной спектр Y (со) = Н (со) F (со)-> 1, если F (со) » S (со), который и соот- ветствует дельта-функции или единичному импульсу. Первые попытки реализации обратной фильтрации были свя- заны с использованием характеристики (7.24). Однако нетрудно видеть, что, если спектр сигнала на некоторых частотах принимает близкие к нулю значения, например из-за его искажения помехами, на тех же частотах \Н (со)| -> оо и фильтр становится неустойчи- вым. Дальнейшие исследования обратной фильтрации были на- правлены на ее стабилизацию путем введения в знаменатель (7.24) дополнительного члена для исключе- ния возможностей деления на нуль, т. е. //(©) = S*(©)/(|S (u>)f + a). (7.25) Рис. 47. Сигналы: 1 — исходный, 2 — зеркально отраженный относи- тельно оси ординат Величину а предлагалось задавать равной 5 или 10 % от мак- симальной частоты сигнала S (со). Это, естественно, приводило к существенному повышению устойчивости обратного фильтра, но в то же время возникала новая проблема уже по определению оп- тимальной величины а. Использование общего уравнения фильтра Колмогорова—Винера (7.15), в котором в качестве желаемого сиг- нала следует принять дельта-функцию, позволяет однозначно ре- шить вопрос о величине а и тем самым построить оптималь- ный обратный фильтр. Положим s (/) = б (0, тогда функция взаимной корреляции B~s(r) = б (/) s (/—т) = s (—т). Следовательно, уравнение Кол- могорова—Винера для реализации обратного фильтра примет вид ZhiRf(m—i)=s(—т) или £ hi [Rs (m—0 + Rn (m—i)] = s(—m). (7.26) Используя свойства преобразований Фурье, из (7.26) получаем частотную характеристику оптимального обратного фильтра Яовр (®) = S* (со)/(| 5 (©) |« + Wn (©)). (7.27) Сравнивая (7.27) с (7.25), видим, что оптимальной величиной стабилизатора а является не что иное, как спектральная плот- ность помех. Во временной области вычисление весовой функции оптимального обратного фильтра сводится к решению системы линейных уравнений вида (7.17), где в правой части вместо авто- корреляционной функции сигнала следует подставить значения самого сигнала, симметрично отраженного относительно оси ор- динат (рис. 47). В случае некоррелированной помехи с дисперсией о® система уравнений (7.26) для нахождения обратного фильтра минимально- го
фазового сигнала (если сигнал минимально-фазовый, обратный фильтр относится к физически осуществимым фильтрам, для ко- торых s (т) = 0 при т<0) принимает вид: ho[Rs(0) + ai] + h1Rs(l) + . . . + hMR,(M) = s(0)-, /*otfs(l) + MKs(O) + a2]+ • • • + hMRs(M—V) = 0; „ o /i0Rs(M) + /i17?s(M-l)+ . . . +/iM[7?s(0) + o2]=0. Во-первых, из этой системы следует, что устойчивость обрат- ного фильтра достигается путем введения дисперсии помехи. Иначе говоря, регуляризация решения обеспечивается стабилизатором, тождественно совпадающим с дисперсией помех. Во-вторых, до- пущение о минимальной фазовости сигнала освобождает от необ- ходимости рассчитывать форму импульса. Пользуясь свободой выбора постоянных коэффициентов при весовой функции фильтра, положим s (0) = 1, тогда для нахождения значений h{ достаточно знания корреляционной матрицы наблюденного поля Rf (т—t) = = Rs (m—i) + Rn (m—i). Применение обратной фильтрации не ограничивается задачами повышения разрешающей способности сейсмической записи. Не- сомненно, она может использоваться и в других методах разведоч- ной геофизики. На базе обратного фильтра, например, основана поточечная интерпретация геофизических параметров в каротаже, реализованная Г. Н. Зверевым [13]. Если после обратной фильтрации реализуется полосовой фильтр с заданной частотной характеристикой Н„ (<л), такая фильтрация называется корректирующей. Частотная' характери- стика корректирующего фильтра Нкор (со) = НовР (со) Нп (со). Оригинальное применение обратного фильтра предложено Г. Н. Богаником для преобразования наблюденной гистограммы mJ / = 0, 1, . . . , L, £ mz = 1 I некоторого случайного параметра \ /=о / с дискретной плотностью распределения р/ (j = 0, 1, . . . , L, jT, Pf = 1) и объемом выборки п в функцию, наименее отличающуюся от единичной дельта-функции 6/. При этом весовая функция об- ратного фильтра находится из системы линейных уравнений м 2 hf [bf-i + 6z_i/(n-1)] = npk4l(n-1), (7.29) / = 0, 1, . . . , M- k = Q, 1, . . . , L + M, где fl при i = /, — 10 при i =/= /; 216
bj_i — элементы корреляционной матрицы (bj-t = bi-j), L-l+i bi-i= 2 PkPk+J-t- fe=0 Вариационный ряд случайной выборки объемом п (гистограмма) преобразуется в функцию, которая в среднем по множеству реали- заций наименее отличается от 6-функции с амплитудой п, распо- ложенной в заданной точке k. От объема выборки п зависят только диагональные элементы матрицы системы (7.29). В (7.29) к величине 60> являющейся максимальным значением автокорреляционной функции дискретной плотности (гистограммы), добавляется слагаемое 1/(п—1). Например, в случае L—M = k = 2 система (7.29) принимает вид: (b0 Н---——'j h0 + bihi + bi/it =--— bih^ (Ьо -----—hi + b^ =----------— pi; \ n — 1 / п — 1 + bihi + (b0 -| — 'j hi =---— p0. \ л — 1 / n — 1 Обратный фильтр служит для разделения смеси однотипных случайных величин, известных с точностью до их математических ожиданий и объемов выборок. Сначала по совокупности из N зна- чений изучаемого параметра строят исходную гистограмму т/ (j=0, 1, . . . , L). Интервал Д между соседними разрядами принимают равным величине среднеквадратической погрешности определения параметра. Анализ гистограммы выполняют путем циклического повторения последовательных операций выявления, оценивания и вы- читания из смеси составляющих компонент в порядке убывания их объемов. В качестве исходных параметров задают теоретиче- скую гистограмму распределения случайных величин р/ (/ = 1, 1, . . . , L) и порог а, соответствующий принятому значению до- верительной вероятности у выявления компонент смеси. При каждом цикле анализируется гистограмма — исходная либо остаточная, полученная из исходной после вычитания ком- понент смеси, установленных в предыдущих циклах. В этой гисто- грамме выделяется наибольшая по объему выборка путем ее свертки с весовой функцией. Для расчета весовой функции необходимо знать объем п искомой выборки, неизвестный заранее. Поэтому задача решается способом последовательных приближений. Первая оценка п' объема максимальной компоненты смеси находится по гистограмме п' — пгтах/ртах, где mmax и ртах — максимальные зна- чения соответственно наблюденной и теоретической гистограмм. Величина п' используется для вычисления первой весовой функции h'i, с которой свертывается гистограмма. Максимальное значение результата свертки yk (k = 0, 1, . . . , L + М) дает вторую оценку п" объема' искомой компоненты смеси, используемую соответст- 217
йеййо для расчета второй весовой функции hi*. Максимальное зна- чение результата свертки y'k гистограммы с функцией h'i рассмат- ривается как оценка nft объема искомой компоненты смеси, распо- ложенной в точке k. Дисперсия оценки п состоит из дисперсии £)с, обусловленной случайным характером интервальных значений данной выборки, и фоновой дисперсии Дф (за счет случайного характера соседних выборок, вычитаемых из гистограммы на предыдущих циклах). Первая дисперсия определяется как De = п I Д htPk—i \ I • Дисперсия Оф рассчитывается по значениям дисперсий Dt и корреляционных моментов Ktj погрешностей в значениях гисто- граммы, которые образовались при вычитании выявленных ранее компонент: L / М М \ 4 t+I / Сумма по L означает сложение результатов обработки, полу- ченных по всем ранее вычтенным L-компонентам. При наличии дисперсии оценки п решается вопрос о значимости полученного результата, т. е. о надежности выделения из смеси очередной компоненты. Последняя считается значимой, если пЛуТЭсЧ-Дф >*v, где V — квантиль нормального распределе- ния. В случае значимости полученной выборки она считается ком- понентой смеси и вычитается из гистограммы; соответствующие значения по разрядам гистограммы уменьшаются на величину пр]. По этим же разрядам гистограммы вычисляются моменты остаточ- ных погрешностей, неизбежных из-за случайного характера, вы- борки. Эти величины используются для расчета Дф в последующих циклах обработки гистограммы. Вычисления по указанной схеме повторяются до тех пор, пока ие будут проанализированы все раз- ряды (точки) гистограммы. В результате получается последова- тельность неотрицательных оценок п*, среди которых отличаются от нуля только те, которые соответствуют значимым компонентам смеси. Далее выполняется коррекция оценок п* для того, чтобы сделать их целыми числами и согласовать со значениями исходной гистограммы на соответствующих ее интервалах. Полученные в итоге-оценки п* рассматривают как результат разделения исход- ной гистограммы на составляющие ее элементарные выборки. Ал- горитм разделения смеси случайных величин использован Г. Н. Бо- таником для иллюстрации следующего примера (рис. 48). Смесь состояла из трех нормально распределенных выборок разных объе- мов, смещенных одна относительно другой на два интервала. Тео- ретическая гистограмма задана пятью значениями pt = mj/n 218
a Рис. 48. Результаты разделения смеси случайных величин обратным фильт- ром (по Г. Н. Ботанику) (/ = О, 1, 2, 3, 4) с интервалом, равным величине среднеквадрати- ческого отклонения, при этом р0 = pt = 0,07; рх = ра = 0,24; р3 = 0,38. Для обработки гистограммы использовался фильтр с пятью значениями hi (i = 0, 1, 2, 3, 4). Порог tv = 1,28 (у = 0,9). Слева на рис. 48, а даны смеси, состоящие из выборок объемом по 20 зна- чений, а справа — по 80 значений. На рис. 48, а показаны теоре- тические гистограммы, на которых с помощью вертикальных линий указаны местоположение и объемы компонент, образующих смесь. На рис. 48, б и в приведены варианты эмпирического распреде- ления для каждого случая, которые были образованы суммирова- нием выборок, полученных с помощью таблиц нормально распреде- ленных случайных чисел. Результат разделения каждой смеси 219
изображен с помощью вертикальных линий, расположение и вы- сота которых соответствуют параметрам выявленных компонент, оценки объемов этих компонент указаны числами. Пример иллю- стрирует общую закономерность: с уменьшением объемов выборок задача выделения отдельных компонент из наблюденной смеси слу- чайных величин решается менее точно. Фильтр прогнозирования Оптимальный фильтр Колмогорова—Винера используется для ре- шения задачи прогноза (предсказания) значений поля в некоторых «будущих», например еще не измеренных, точках Xk = k&x (&>1). При этом в правой части уравнения (7.14) желаемым сигналом s/ является входной сигнал f{, т. е. s7- = fjt в последующие (будущие) моменты времени. Тогда = Rf (т + k) и уравнение Кол- могорова—Винера принимает вид У, i) = Rf(m + k). (7.30) 1=0 Практическая реализация фильтра прогноза (7.30) сводится к многократному решению систем линейных уравнений для каж- дого заданного значения k = 1, 2....Правая часть выражения (7.30) при k — 1 представляет собой автокорреляционную функцию исходного поля без ее значения в нуле, при k = 2 — ту же функ- цию без первых двух значений АКФ исходного поля и т. д. При k<0 уравнение (7.30) соответствует фильтру запаздывания. Фильтр прогнозирования предсказывает будущие значения сигнала по предшествующим значениям («истории») сигнала и по- мехи. Следовательно, его можно с успехом использовать для ре- шения задач интерполяции поля в любые наперед заданные точки. Широкое применение получил алгоритм обратной фильтрации с прогнозированием, включенный в стандартную процедуру циф- ровой обработки сейсмических записей. На основе фильтра прогноза строится новый метод оценки энер- гетических спектров, отличающийся существенным увеличением разрешающей способности по сравнению с методами расчетов спект- ров Фурье. Этот метод, предложенный И. Бургом, исходит из мак- симизации энтропии стационарного нормального случайного про- цесса и поэтому получил название метода максимума энтропии. И. Бургом показано, что спектральная плотность, отвечающая максимуму энтропии случайного процесса, W (со) =------------ 2<Х>гр _______£z+i_____________ I 2 1 + У hu ехР (— /штЛ) /=1 где соГр = 1/2Д, Di+i и Ц, { находятся из системы уравнений про- 220
гнозирующего фильтра "R(0) R(l) . . . R(l) ~ R(l) R(0) . . . R(/-l) R (Z) R(Z—1) Di+i 0 (7-31) Эта система уравнений преобразует входной сигнал, заданный его АКФ R (т), в белый шум с дисперсией Di+1. Она, по существу, описывает обратный фильтр с прогнозом на один интервал и сов- падает с системой (7.28). В то же время дисперсию прогноза можно найти через средний квадрат разности между входным сигналом в момент I 4- j и предсказанным его значением yi, т. е. Di+j = = (h+} Используя специальный метод вычисления hi,i, можно полу- чить рекуррентное соотношение hu— ht-ц — htihi+ci—i и значения автокорреляционной функции для т = I + 1, выраженные через весовые коэффициенты фильтра (7.31): «4-1 R (/ + 1) = - £ hl+1(R (i + 1 -/). (7.32) Первый индекс при коэффициенте й/+ц обозначает номер ите- рации, иначе — длину фильтра прогнозирования (число его ко- эффициентов), вычисляемого на данном этапе. Алгоритм метода максимума энтропии начинается с того, что полагают I = 0, тогда уравнение (7.31) запишется как [R (0)]• 1 = £>х. При определении АКФ при нулевом сдвиге сред- няя мощность одночленного фильтра прогноза Dr — R (0). При расчете двучленного фильтра прогноза вида (1, йХ1) сначала свер- тывается входной сигнал /х, f2, . . . , fn, и ошибка прогнозирова- ния — fl+t—huff, j — 1, . . . , п. Если фильтр прогноза обра- тить и провести фильтрацию в обратную сторону, то 8/ = fj—huff+i j = 1, ... , п—1. Средняя энергия при прямом и обратном направлении свертки 1 "-1 221
или £а= ,Лп XW/+i-W/)2 + (f/-W/+i)2l- X {Fl LJ /^1 На основании максимума энтропии htt определяется так, чтобы Е2 была бы минимальной, т. е. dEJdhu — 0: п—1 dEJdhu=[\l{n-1)] g [-Ш1+М/) + Лн (f/+i + f2/)] = 0. Отсюда Ли = 2Ш+1£ (f/ + f/+i) = 2R (1)7(R (0)+О В то же время можно вычислить htt, не используя АКФ и не делая предположений относительно поведения исходных данных за конечными интервалами их определения. Уравнение (7.31) при I = 1 имеет вид Г R (0) R (1) ] Г 1 1 = Г Dt L R (1) R (0) J L Ли J “ L 0 . ’ Эти уравнения решают относительно R (1) с использованием оценки и R (0). Тогда получают R (1) = R (0) ЛХ1. По формуле (7.32) вычисляют значение АКФ при I = 1, т. е. R (2), благодаря которому из системы (7.31), уже состоящей из трех уравнений, находят й21, й22 и Ds. Этот итерационный процесс продолжается др тех пор, пока не будет достигнута заданная погреш- ность D/+1, либо пока не будут использованы все значения ис- ходного поля для коротких реализаций. Наконец, по формуле для W (<о) с известными hu и Di+1 находят спектральную плотность (энергетический спектр), для вычисления которой следует исполь- зовать алгоритм быстрого преобразования Фурье. Метод максимума энтропии обеспечивает высокую разрешаю- щую способность спектра за счет надежной оценки более длинной АКФ наблюденного поля. Достигаемый при этом эффект аналоги- чен расчету спектра по длинной АКФ (см. рис. 25). Одновременно со спектром получаем более надежную оценку АКФ, что сущест- венно при обработке данных по малому числу наблюдений вдоль профиля. Однако важно, чтобы число членов фильтра ошибки прогноза не превышало бы величины [(л + / + 1)/(л—4—1) 1 D/+i, так как при чрезмерном увеличении разрешенное™ спектра на нем появляются ложные максимумы и наблюдается расщепление ча- стоты. Пример, иллюстрирующий высокую разрешенность энергети- ческого спектра по методу максимума энтропии, приведен на рис. 49. Из рисунка видно, что помимо пика для постоянной состав- ляющей четко выделяются еще- два экстремума, соответствующие составляющим поля Ag с различной протяженностью. По этим экстремумам спектра представляется возможность оценить отно- сительную интенсивность составляющих поля и их протяженность. 222
& i i Рис. 49. Результаты обработки исходной кривой Ag с помощью энергетиче- ского фильтра (а) и оценки энергетического спектра кривой Ag (б). 1 — исходная кривая Ag; 2 — результат энергетической фильтрации; 3 — разность ме- жду / и 2; 4 — спектр Фурье; о — спектр, рассчитанный по методу максимума энтропии и = Наибольшему значению спектра отвечает составляющая поля про- тяженностью в 3/4 профиля, а второму по величине максимуму — составляющая с протяженностью около 1/4 длины профиля. Ос- новная составляющая поля определяется структурным фактором, а вторая по протяженности — эффектом от нефтегазовой залежи. По «хвосту» энергетического спектра находится интенсивность некоррелированных помех — погрешностей измерений поля Д#. § 36. СОГЛАСОВАННЫЙ ФИЛЬТР Согласованный фильтр строится на основе критерия максимума пикового отношения сигнал/помеха и предназначен для решения задачи обнаружения сигнала, т. е. установления факта его нали- чия, а в общем случае за счет существенного искажения формы сиг- нала. При этом полагают, что полезный сигнал задан по форме и ее искажение при фильтрации не имеет существенного значения. Выбор формы сигнала (аномалии) может быть осуществлен либо путем решения прямой задачи, либо посредством анализа наблю- денных значений над аномальными объектами на соседних, ана- логичных по геологическому строению участках. При обработке сейсмических записей оценка формы сигнала производится по АКФ или ВКФ исходных трасс. Кроме того, в сейсморазведке, напри- мер, существуют такие типы источников, как вибрационные, для которых форма возбуждаемых в упругой среде волн известна. Поэ- тому задача фильтрации сигналов известной формы, т. е. детерми- нированных сигналов, в разведочной геофизике представляет прак- тический интерес. Ее значение непрерывно, возрастает в связи 223
с поисками глубокозалегакицих месторождений, аномальные эф- фекты от которых искажены помехами различной природы, а ин- тенсивность помех превосходит амплитуду полезных сигналов. Для нахождения частотной характеристики согласованного фильтра исходим из аддитивной модели поля fj = s/+ П/, в которой Sj — известный по форме сигнал, а помеха — стационарный слу- чайный процесс. Вывод частотной характеристики проведем для апериодического сигнала. Если известна форма сигнала s (х), оче- видно, известен и его спектр 3(со), т. е. s(x) = (l/2n) f 3(со)e/“Mco, где S(co) = У s(x)e~iaxdx. —00 —00 Сигнал на выходе фильтра с частотной характеристикой Н (со) можно представить в виде 8вых(х) = (1/2л) f е/ш*Я(со) S(co)dco. (7.33) —00 Энергия помех на входе фильтра выражается через спектраль- ную плотность (энергетический спектр) Wn (со): n2(x)=J_ f rn(co)dco. 2л —оо Выражение для энергии помех на выходе фильтра получим, если учтем, что при преобразовании стационарного случайного процесса (т. е. помех) линейным фильтром его спектральная плот- ность умножается на квадрат модуля частотной характеристики фильтра | Н (со) |2, т. е. Пвых(х) = 4- У | Н (со) |2 W„ (со) da>. (7.34) 2л — оо Пиковое отношение сигнал/помеха в точке х0 на выходе фильтра определяется как Рвых — ®вых (Хо)/Мвых (х). (7.35) Используя выражения (7.33) и (7.34), получаем Рвых- 2Я 00 J ехр (/сохо) Н (со) S (со) dco —00 У | Н (со) |а Wn (со) da> —00 (7.36) К ;На выходе фильтра у (х0) = «вых (х0) + «вых (х0), при этом требуется максимизация рвых. Иными словами, необходимо, чтобы 8вых (х) Пвых (х). 224
Частотную характеристику искомого фильтра получим, если воспользуемся известным неравенством Буняковского—Шварца, согласно которому I f el^H (со) S (©) do < f | H (®) |2 Wn (©) da x I -00 —00 C |S ((0)1* ) Wn (И) da. Отсюда с учетом (7.36) 1 2л JAWJLdtt>, wn (о) Очевидно, выражение (7.37) Рвых- Если принять частотную характеристику Я((о) = е-/“*о S* (a)/Wn (®), (7.38) то максимально достижимое значение пикового отношения сигнал/помеха рВых согласно (7.36) будет (7.37) является верхним пределом для 1 Г | S (<в) |2 . Цвых Ш8Х — \ Ct (О • 2я 1 (7.39) Рис. 50. Графики спектров сигнала (/), помехи (2) и частотной харак- теристики согласованного филь- тра (3) Таким образом, выражение (7.38) является частотной характе- ристикой искомого согласованного фильтра. Физический смысл неравенства (7.37) состоит в том, что согла- сованный фильтр пропускает интервал частот (®, ® 4- Д<о) в тем большей степени, чем больше спектральная амплитуда полезного сигнала и чем меньше спектральная мощность помех в том же ин- тервале (рис. 50). При этом, как следует из (7.39), отношение сиг- нал/помеха иа выходе фильтра будет тем больше, чем больше от- личие спектра сигнала от спектра помехи. Без ограничения общности можно принять х9 = 0, тогда из (7.38) имеем H(<o) = S*(<o)/IFn((o). (7.40) Если помеха представляет белый, некоррелированный шум, то Wn (a) = const и Н (со) = cS* (a). (7.41) Из (7.41) следует, что частотная характеристика фильтра пол- ностью определяется спектром сигнала, иначе говоря, согласована 8 А. А. Никитин 225
со спектром сигнала. Отсюда и название фильтра — согласованный. Если от спектральных представлений (7.41) перейти в область пространственной координаты х, получим h(x) = cs(—х), ht = cs(—г). (7.42) Из (7.42) следует, что при некоррелированной помехе весовая функция фильтра полностью определяется формой сигнала, т. е. ее форма согласована с формой сигнала. Нетрудно видеть, что роль константы в (7.42) играет величина, обратная дисперсии по- мех, т. е. с = 1/о2. Это следует из выражения (7.40), если, исполь- зуя свойство преобразований Фурье о свертке двух функций, от частотной области перейти в пространственную (или временную): м Wn (®) Н (со) = S* (<о) 2 htRn (7.43) i=0 Формула (7.43) представляет собой систему линейных уравнений согласованного фильтра при заданных АКФ помех и форме сиг- нала, ее можно записать в матричной форме: “ Rn (0) Rn (1) ... Rn (М) “ R»(l) R„(0) . . . R„(M-1) (йо, hi, . . . , hM) Rn(M) Rn(M — V) ... R«(0) _ = (s-m> s-m+i. • • • » So) (7-44) или в виде М„(0) + Мл(1)+ • • • +hMRn(M) = s(-M), ад„(1) + ад„(0) + . . . +Ладп(М-1) = а(-М+1), ад„(Л4)+адп(Л1-1)+ . . . +hMRn(0) = s(0). При не коррелированной помехе Rn (0) = о2, Rn (т) = 0 и из приведенных выше уравнений следует, что h{ = s (— i)/o2. Уравнение оптимального согласованного фильтра (оптималь- ность фильтра следует из того, что любой другой фильтр создает меньшее отношение сигиал/помеха) можно получить приравнива- нием производной дрвых/дй( к нулю. Согласно выражению (7.7) дрвьж 2 (ft's) s (ft'Rn ft) — 2Rn ft (ft's)8 о dhi (h' Rn ft)2 Равенство числителя нулю выполняется, если положить Rnh = s; h'Rn=s‘ h = Rnll (7.46) 226
Таким образом, мы вновь получили уравнение (7.43), однако при таком подходе к построению согласованного фильтра следует учесть, что в правой части (7.45) сигнал должен быть переверну- тым, т. е. отсчет его значений производится с конца. Проиллюстри- руем нахождение весовой характеристики согласованного фильтра на простой числовой модели. Пример. Пусть, как и для фильтра Колмогорова—Винера, сигнал и по- меха заданы значениями (s0, sx) = (3,1), (n0, nt) = (1, 0), т. e. (Rn (0) = 1, Rn (1) = 0. Решение. В соответствии с (7.44) получим ( °’ 1 L Rn (1) Rn (0) J (ho. fci) [ о j ] = <sb so)- иля Отсюда ft0 = Ь Й1 = 3. С учетом нормировки весовой функции ho+ hl = 1; h0 = 0,316, hi = 0,948. Найдем пиковое и энергетическое отношение сигнал/помеха на выходе фильтра с учетом (7.8) и (7.10): __ (hpSi -f- hi$o)a__________(hpSi 4- hjSo)2________ ЦВЫХ~ A'R h ~ Kn(0)Rft(0) + 2/?n(l)/?ft(l) ~ = 10 1 (h<A>)2 + (hoSj + hjSo)2 + (hiSi)2 .. „ Ряых = 11 1"1 * — — 1 1 1 =: ll»O. /?„ (0) (0) + 2Л„ (1) (1) Из сравнения полученных значений рВых и рвых с аналогичными значениями для фильтра Колмогорова—Винера видим, что согла- сованный фильтр обеспечивает большие как пиковое, так и энерге- тическое отношения сигнал/помеха. Другой пример, иллюстрирующий применение согласованного фильтра, приведен на рис. 51. Из рисунка видно, что весовая функ- ция в случае коррелированной помехи уже не согласована с фор- - мой сигнала. Таким образом, согласованность форм сигнала и ве- совой функции имеет место лишь для некоррелированной помехи. Максимальное значение профильтрованного сигнала, приходящееся на ПК 50, соответствует центральной точке полезного сигнала. В этом случае решена задача обнаружения сигнала за счет иска- жения его формы. Согласованная фильтрация нашла применение при обработке сейсмических записей. Пример ее применения для обнаружения вступления рэлеевской волны приведен на рис. 52. Здесь макси- мальная амплитуда профильтрованного сигнала указывает иа вступление волны, имеющей период 30 с. Форма весовой функции при этом определялась формой сигнала с частотой, линейно меняю- щейся от 0,02 до 0,06 Гц, и длительностью 630 с. 8* 227
Рис. 51. Пример обнаружения сигнала на фоне коррелированной помехи. а — помеха и ее автокорреляционная функция R (т); б — полезный сигнал зр в — сиг- нал 4* помеха; г — весовая функция согласованного фильтра Лр д — результат согла- сованной фильтрации; е — апостериорная вероятность наличия сигнала заштрихована область значений Рр больших 0 5
Все более широкое использование согласованной фильтрации мы находим в варианте построения корректирующих фильтров, частотная характеристика которых равна произведению частот- ных характеристик обратного и согласованного фильтров. Сравнивая выражения для частотных характеристик обратного (7.27) и согласованного (7.40) фильтров, при | S (со) |2 < (со) получаем, что оптимальный обратный фильтр является фильтром, максимизирующим пиковое отношение сигнал/помеха. Рис. 52. Исходная сейсмическая трасса с записью рэлеевской волны г (/) и выходной сигнал согласован- ЛдЛа,-.____ ного фильтра (2) [8] ! Змин j В заключение подчеркнем, что согласованный фильтр наиболее эффективен при решении задач обнаружения весьма слабых сигна- лов. § 36. ЭНЕРГЕТИЧЕСКИЙ ФИЛЬТР Энергетический фильтр строится на основе критерия максимума энергетического отношения сигнал/.помеха на выходе фильтра и предназначен для выделения сигналов (аномалий), различаю- щихся по энергии. Этот фильтр занимает промежуточное положе- ние между фильтром воспроизведения Колмогорова—Винера и со- гласованным фильтром, поскольку он строится как фильтр обна- ружения (максимизируется отношение сигнал/помеха), а решает задачу выделения, т. е. оценки формы сигнала. В отличие от со- гласованного фильтра для этого фильтра требуется задание авто- корреляционных функций сигнала и помех, т. е. знание формы сигнала несущественно, и априорная информация о сигнале и по- мехах совпадает с той информацией, которая необходима при по- строении фильтра воспроизведения. Оценка формы сигнала при максимизации отношения сигнал/помеха оказывается возможной потому, что максимизируется не пиковое отношение, т. е. отноше- ние лишь в одной точке, а энергетическое — по всей длине фильтра. Энергетическое отношение сигнал/помеха на выходе фильтра (7.9) рвых —h Rsh/h Rnh, —► —> где ft' и h — соответственно вектор-строка и вектор-столбец весо- вых коэффициентов фильтра; Rt и Rn — корреляционные матрицы сигнала и помехи. Энергетический фильтр должен иметь весовые коэффициенты hi, определяющие максимум выражения (7.9) при условии нормали- зации весовой функции £ft, = 1. 229
Для Нахождения весовых коэффициентов обозначим рВЫх че- рез А. Продифференцируем А, по h, а производную dK/dh прирав- няем к нулю, т. е. А — h' Rs h'/h' R„ /г, дк (h' Rn hj (R, ft) - (h' Rs ft) Rnh =Q dh (h' R„ftja —► —► Поделив обе части числителя последнего выражения на ft'RnA и учтя введенное обозначение для А, получим матричное уравнение Rs/i—A Rn h = 0 или [Rs—AR„] h — 0, или м Y, [Rs(m—i)—kRn(m—i)]hi = Q. (7.46) z=o Уравнение (7.46) может быть записано в развернутой матричной форме: ~ R,(0) Rs(l) . . . RS(M) - ед ед . . . я,(л<-1) RS(M) RAM-1) . . . Rs(0) “ R„(0) R„(l) ед ед RAM) RAM-1) Ao Ai _.Rn(M) RAM-1) - Am _ (7.47) 0 _ Значения автокорреляционных функций сигнала и помехи счи- таются известными, заданными. Неизвестными являются параметры А и значения весовых коэффициентов. Решение системы линейных уравнений (7.47) составляет так называемую проблему нахождения собственных значений. Пара- метр А при этом является собственным значением корреляционной 230
матрицы (Rs—R„), а весовая функция — соответствующим ему собственным вектором той же матрицы. Таким образом, построение энергетического фильтра сводится к задаче компонентного анализа, при которой также находятся собственные значения корреляционной матрицы и соответствующие этим значениям собственные векторы. Для корреляционной матрицы (Rs—R„) в уравнении (7.47) собственные значения Хо, Лх, . . . , являются действительными и положительными. Это свойство собственных значений хорошо согласуется с физическим смыслом параметра X. Поскольку Хтах представляет собой энергетическое отношение сигнал/помеха, т. е. отношение двух действительных положитель- ных чисел (энергий сигнала и помех), оно само должно быть дейст- вительной и положительной величиной. Система (7.47) имеет ненулевое решение, если определитель матрицы, составленный по разности двух матриц Rs и Rn, равен нулю. В этом случае существует (Л4 + 1) собственных значений и соответствующих им собственных векторов, удовлетворяющих уравнению (7.47). Все собственные значения можно расположить в порядке убывания и выбрать среди них максимальное, которое будет соответствовать максимальному отношению сигнал/помеха на выходе фильтра. Собственный вектор, связанный с этим ХтаХ, сле- дует выбрать в качестве искомой весовой функции. Следовательно, из всех (М + 1) собственных значений Х<, удовлетворяющих урав- нению (7.47), решение задачи о максимизации рвых обеспечивается вектором матрицы (Rs—XmaxRn). Из сказанного выше раскрывается физический смысл Хтах: Хтах — не что иное, как максимум энергетического отношения сигнал/помеха на выходе фильтра. Поэтому профильтрованный выходной сигнал yt = с весовой функцией, представлен- ной собственным вектором, соответствующим Хтах, является пер- вой главной компонентой в терминах метода главных компонент. Физический смысл Хтах позволяет считать, что выходной сиг- нал ус, соответствующий первой главной компоненте, обеспечивает выделение составляющей наблюденного поля, которая обладает наибольшей энергией. В модели поля// = sper/ + 8лок/+ п/ такой составляющей, как правило, оказывается региональный фон, в мо- дели fj — sMk i + П] — локальная аномалия. Рассмотрим построение энергетического фильтра на той же простой числовой модели, использованной нами в § 34 и 35. Пример. Пусть сигнал (s0, Sj) = (3,1) и помеха (л0, nx) = (1, 0), их автокорреляции R, (0) = 10; Rt (1) = 3; Rn (0) = 1, Rn (1) = 0. Решение. Составим матричное уравнение (7.47): Определитель матрицы, заключенный в фигурные скобки, 3 10 —X 10 —X 3 D = = (10 — — 9 = 91— 20Х + Х2. 231
Приравниваем определитель D к 0 для нахождения Хг и Ха: 20Х +91 = 0, откуда получаем Х1а = 10±V100—91 = 10 ± 3, т. е. = 13; Ха = 7'. Выбираем собственное значение X, имеющее максимальную величину, т. е. Хтах = 13, и подставляем его в исходное уравнение: г ю —13 з Ipl _Г°Т L 3 10-13 IL hl J “ [ О ]' Умножая матрицу на вектор h (h9, hi), получаем систему из двух урав- нений с двумя неизвестными: — ЗЛо 4- ЗЛ1 = 0, 31ц — 3hi — 0. Эта система имеет бесчисленное множество решений, и для нахождения весовой функции надо воспользоваться условием нормировки весовых ко- эффициентов /iQ-|-ftj= 1. Тогда получаем Л0 = Л1 = О,7О7. Рассчитаем пиковое и энергетическое отношение сигнал/помеха на вы- ходе фильтра в соответствии с (7.8) и (7.10): ых = (^t + sifto)2 = 0,707-3 + 0,707-3 = 8. В“Х /?п(0)/?А(0) + 2/?„(1)/?Л(1) 1 /?,(0)RA(0) + 2R,(l)/?A(}) _ 10-1 + 2-30,5 = 13 В“Х Rn(0)Rh(0) + 2Rn(l) RH(1) 1 при этом RA (0) — 1; /?А (1) = 0,5. В рассмотренном примере, как и следовало ожидать, Хт.» = = Рвых = 13, поэтому рвых можно было бы и не вычислять. Срав- нивая значения р и р, полученные ранее для фильтров Колмого- рова-Винера (см. § 34) и согласованного (см. § 35), видим, что наибольшее энергетическое отношение достигается для энергети- ческого фильтра, а наибольшее пиковое отношение — для согла- сованного фильтра. Задача определения весовой функции энергетического фильтра существенно упрощается, если помеха является некоррелирован- ной, в частности, представляет собой процесс типа «белого шума». В этом случае корреляционная матрица помехи — единичная, ее диагональные элементы равны единице, а все остальные — нули: г 1 0 ... От L о о ... 1 J Тогда матричное уравнение (7.46) записывается в виде (Rs—XI) Л=0 или 2 (т—0—X/ (т— 0] h = 0. (7.48) 232
В развернутой форме уравнение (7.48) представляется “К8(0)-Л R,(l) ... R,(M) - ад) /г,(0)—х . . . Ло /ii R,(M) RS(M-1) - 0 - о RS(O)-X _ _hM (7-49) О Весовая функция здесь, как и в рассмотренном выше примере, равна собственному вектору, соответствующему максимальному собственному значению корреляционной матрицы сигнала. Этот вывод имеет принципиальное значение в связи с тем, что в прак- тике обработки экспериментальных данных оценку АКФ сигнала Rs (m) при слабых помехах можно проводить непосредственно по АКФ наблюденного поля Rf (т), т. е. вместо корреляционной мат- рицы Rs в уравнении (7.49) использовать матрицу fy. При обнаружении сигнала известной формы весовая функция согласованного фильтра максимизирует отношение квадрата ам- плитуды сигнала в его центральной точке к мощности помех, а при обнаружении сигнала, заданного его автокорреляционной функ- цией, весовая функция энергетического фильтра максимизирует отношение энергий иа интервале, равном длине фильтра. Поскольку в последнем случае в полосе частот, на которую приходится макси- мальная энергия сигнала, мощность помех уменьшается, искаже- ние формы сигнала при использовании энергетического фильтра будет существенно меньшим, чем в случае согласованной филь- трации. Качество энергетического фильтра, как и фильтра Колмого- рова—Винера, можно охарактеризовать величиной среднеквадра- тической погрешности отклонения результата фильтрации yh полу- ченного при точно заданных АКФ сигнала и помехи, от результата фильтрации полученного при неточно заданных АКФ, т. е. в2 = Е («//~ У/)2- Если ввести понятия автокорреляционных функ- ций Rn (т) и Rf (т) соответственно для весовых коэффициентов hi и /ц и их взаимокорреляционной функции ВА^ (т), то величина в* будет м М ?33
Используя это выражение, можно найти зависимость погреш- ности, вносимой в оценку выходного сигнала, от отношения сиг- нал/помеха и от отношения интервалов корреляции сигнала и по- мехи в случае коррелированности последней. Для моделей сигнала и помехи, описываемых АКФ гауссова типа R (т) = А2е~т’/гг, В. И. Ароновым для фильтра воспроизведения были вычислены зависимости среднеквадратической погрешности сглаживания сиг- нала 7 от отношения rn/rs при различных значениях q = Л1/А? (рис. 53, а) и Т. А. Трофимовой аналогичные зависимости полу- чены для энергетического фильтра (рис. 53, б). Сравнение этих зависимостей еще раз показывает возможность применения энерге- Рнс. 53. Зависимости среднеквадратической погрешности сглаживания от отношения интервалов корреляции помех гп и сигналов г, при различных отношениях их амплитуд q для фильтра Колмогорова—Винера (а) и энерге- тического фильтра (6) тического фильтра для оценки сигнала, поскольку качество этой фильтрации практически не намного хуже качества фильтрации фильтром воспроизведения. Рассмотрим пример, иллюстрирующий принцип действия энер- гетического фильтра, с целью обнаружения и разделения сигналов на фоне некоррелированных помех. На рис. 54, б приведена сумма двух сигналов и помехи, заданной реализацией стационарного случайного процесса с нулевым средним и дисперсией о2 — 1, (рис. 54, а). В качестве АКФ сигнала использовалась АКФ суммы сигналов и помех. Весовая функция была выбрана равной собст- венному вектору, соответствующему XmaJt корреляционной матрицы Rf. На рис. 54, б приведена также оценка сигнала sr на выходе фильтра, свидетельствующая, что решена не только задача обна- ружения, но и задача оценки формы сигнала. По разности fj—s1( (рис. 54, в) проведена аналогичная оценка формы сигнала s2 (рис. 54, г). Возможность вычисления по корреляционной матрице исход- ного поля целого ряда собственных значений и соответствующих им собственных векторов, т. в; весовых функций, позволяет исполь- зовать энергетический фильтр для решения задачи выделения сиг- 234
налов из общей смеси по их энергиям. Действительно, располагая собственные значения матрицы Rf по их убыванию, Xi>X2i> • • • и решая для каждого из них систему урав- нений (7.49), находим соответствующие им весовые функции. Пу- тем фильтрации y/k — где k — индекс собственного зна- а -21- Рис. 54. Результаты обнаружения и оценки формы двух сигналов с помощью энергетического фильтра. а — сигналы а, и а, с различными энергиями и некоррелированная помеха п; б — сигнал на входе фильтра f =- а, + з, + л и результат оценки формы сигнала а", путем фильтра- ции; а — разность между суммой t н результатом фильтрации а,; е — результат оценки формы сигнала s. чения, получаем главные компоненты. Эти компоненты и отражают различные составляющие наблюденного поля, расположенные по убыванию их энергии. Принцип действия энергетического фильтра с целью выделения различных составляющих наблюденного поля по их энергии иллюстрируется рис. 55. Рассмотренный пример показывает возможность энергетической фильтрации при выделе- нии аномальных эффектов на весьма сложном фоне. Практически всю энергию исходного поля несут две-три его составляющие, т. е. основная энергия, или дисперсия, поля приходится в данном при- мере на два собственных значения. Разделение сигналов будет тем точнее, чем сильнее они отли- чаются друг от друга по интенсивности и интервалу корреляции. С подобными задачами в геофизике сталкиваются, например, при 235
выделении гравитационного эффекта от нефтегазовой залежи на фоне более интенсивной аномалии от структуры (см. рис. 49, а). При этом в силу того, что фильтр максимизирует энергетическое отношение сигнал/помеха, произойдет выделение более энергоем- кой составляющей, или иначе, аномалии, обусловленной струк- турным фактором. Эффект от залежи можно будет выделить либо по разности между исходными значениями поля и полученными Рис. 55. Результаты энергетической фильтрации поля ДТ. а — исходное поле; б—д результаты фильтрации с помощью первого — четвертого собст- венных векторов; е — результат энергетической полосовой фильтрации с использованием второго — четвертого собственных векторов (сумма в + е -f- д) при фильтрации значениями поля от структуры (рис. 49, а), либо по второй главной компоненте поля, рассчитанной для Х2 (Xa<Xi но Х2>ХЬ i =/= 1 и 2). § 37. ДВУМЕРНЫЕ ОПТИМАЛЬНЫЕ ФИЛЬТРЫ Практическая реализация оптимальных фильтров требует решения систем линейных уравнений для определения весовых коэффици- ентов и поэтому сопряжена со значительными затратами машинного времени. Эти затраты возрастают при использовании переменных во времени оптимальных фильтров, когда для осуществления филь- трации вдоль одного профиля (трассы) необходимо проводить пе- ресчет весовых коэффициентов несколько раз. Так, например, при фильтрации сейсмических записей с учетом сохранения стацио- нарцости по частоте (периоду) на интервале в 0,7—1,0 с требуется смена фильтра через такой интервал. Еще большие вычислительные трудности и затраты машинного времени связаны с реализацией двумерных оптимальных фильтров. 236
Если при построении Одномерных Оптимальных фильтров исходят из задания АКФ сигнала (или формы самого сигнала) и помех, то для определения весовых коэффициентов оптимальных двумерных фильтров hk.t необходимо задание соответствующих двумерных АКФ- Нахождение двумерной весовой функции hk,i потребует решения уже не одного, а Л/ матричных уравнений (N — 2р 4- 1), где N — число профилей (трасс), для которых ведется фильтрация. Например, система уравнений двумерного оптимального согласо- ванного фильтра будет записана в виде [сравни с (7.43) — (7.44) ]: р м S S hkiRn(p—k, m—i)=s(—p, —т) (7.50) А=—р 1=0 или /?п(0, m)k0=s0, Rn(l, m)hi = s1, Rn(— 1, m)h_i=s_i, ................................................ (7.51) Rn(p, m)hp = sp, Rn(—p, m)h~p = s_p, где R (p, m) — корреляционные матрицы порядка (M + 1) (Л4 + 1), при фиксированных значениях индекса р они представляют собой автокорреляционные и всевозможные взаимно корреляционные функции, используемые при построении двумерной АКФ; h-p, .... ft0, . . . , hP и s_p, . . . , s0, ... , sP —векторы-столбцы весовых коэффициентов и сигнала для соответствующих профилей (трасс). В уравнении (7.50) двумерная АКФ помехи Rn (р, т) с введе- нием индексов k, i превращается в матрицу матриц. Обращение этой матрицы матриц требует решения N систем линейных урав- нений (7.51). Число уравнений в каждой системе определяется про- тяженностью сигнала на соответствующем профиле (трассе). Совершенно аналогично строятся двумерные оптимальные фильтры Колмогорова—Винера и энергетические. Для фильтра воспроизведения в выражении (7.50) вместо Rn (р—k, т—i) и s (— р, — т) должны быть записаны Rf (p—k, m—i) и Rs (р, т); а для энергетического фильтра соответственно Rs (p—k, m—i) — — ^Rn (p—k, m—i) и нули. Таким образом, в общем случае реализация оптимальной дву- мерной фильтрации весьма трудоемка. С целью построения дву- мерных оптимальных фильтров применяют различные упрощения. Упрощение алгоритмов двумерной фильтрации возможно в сле- дующих случаях: 1) при некоррелированности помехи между профилями (трас- сами). В этом случае осуществляется оптимальная фильтрация лишь по одной координате (по х или по t), а затем по результатам фильтрации проводится суммирование в пределах скользящего 237
окна, включающего N профилей (трасс) по заданному направлению сигнала. Если с помощью подбора соответствующих фильтров в сейсмостанции удалось добиться оптимальной фильтрации по времени, а нерегулярные волны-помехи при этом являются некор- релированными между каналами, методы РНП и ОГТ можно счи- тать реализующими оптимальные двумерные согласованные фильтры; 2) при учете корреляции помех как по координате х (по про- филю), так и по координате у (между профилями), но при опреде- ленной симметрии двумерной АКФ помехи, которая позволяет представить двумерную АКФ в виде произведения одномерных автокорреляционных функций, полученных раздельно по х и по у. Так, при R (p—k, m—i) = Rx (m—i) Ry (p—k) = Rmi Rpk из равенств ^RmiRy = и ^RpkRki = 6pZ следует (7.52) Согласно (7.52) алгебраическое дополнение элемента Rmp,lk для матрицы матриц R (р—k, т—i) можно представить в виде Rmp,ck= RmliR^k- Это соотношение позволяет получить уравнение для весовых коэффициентов hki при известных выражениях для матриц Rx (m—i) и Ry (p—k), характеризующих корреляционные связи при сдвигах в направлениях по х и по у. Уравнение свертки для выходного сигнала тогда получим в виде ypl = -£hkZh{fp_kj_{, (7.53) где весовые коэффициенты hk являются решением системы Rkih — s, T.e.h = [7?wl] s, а коэффициенты h( — решением системы ROT//i ==s. Таким образом, двумерная согласованная фильтрация здесь сводится к раздельно реализуемой фильтрации по координате х для каждого профиля и по координате у, т. е. между профилями. Для получения соответствующих весовых коэффициентов hi и hk необходимо раздельное обращение матриц Rx и Ry, что позво- ляет значительно упростить построение двумерных фильтров. В ка- честве примера рассмотрим вычисление весовых коэффициентов для модели помехи марковского типа; Kml—rx i Kpk—'y > где rx = e~Ax; rb = е~ь». Как известно, матрица, обратная АКФ марковского типа, имеет вид матрице, построенной по 1 — гх 0 0 " Rm*= —Ц- 1-^ — гх 1+4 — гх . . 0 0 0 0 1 _ 238
С учетом этого получаем обратную матрицу Rmp.» в виде де- вяти элементов: Rmp.'ik — — ^(1 + ^) -- гх (1 (1+г2)(1+4) --гх(1 + г») гХГу — ^(1+d) ГХГу Оптимальная согласованная фильтрация для каждой точки площади (х{уь) величины состоит в вычислении Уы ____1____ 0-^)0-^) (ffe+i, < + i + + fit. i-f-1 + fk. (-1) + ~-rry-— (fk+1, t+1 + fk+1, i-1 + + i+1+ /*-!. l-l)- На рис. 56 приведен пример раздельной фильтрации по х и по t для девяти трасс с целью выделения на фоне нерегулярных корре- лированных помех полезного сигнала на времени 3,2 с. Вначале была осуществлена фильтрация по х в предположении марковской корреляции помехи по х (рис. 56, б). Затем к полученному резуль- тату добавлена оптимальная согласованная фильтрация по t. В ре- зультате достигнуто существенное увеличение отношения сиг- нал/помеха (рис. 56, в); 3) при аппроксимации двумерных спектров сигналов и помех изотропными спектрами на основании предположения о централь- ной осевой симметрии поля. Для изотропных двумерных сигналов с центрально осевой симметрией это можно сделать путем замены <а на р = у/+ ®у в формуле (7.23). Реализация двумерного оптимального фильтра и в данном случае становится возможной за счет сведения его к одномерному в силу изотропности поля. Если способ построения корреляционной матрицы по одномер- ной АКФ (см. § 19) распространить на построение корреляцион- ной матрицы по двумерной АКФ, мы сможем реализовать двумер- ную оптимальную фильтрацию в самом общем случае, не прибегая к обращению матрицы матриц. Покажем такую возможность на следующем примере. Пусть для двумерной АКФ R ,N-\p\ n-|m| ? ? Мр~к’ т~1 значения р = т = 0; ±1; ±2. Элементы матрицы матриц R (p—k, т—') при этом будут представлены таблицей значений (см. табл. 21). 239
Рис. 56. Результаты двумерной оптимальной фильтрации сейсмической за- писи по х и t\ а — исходные сейсмические трассы; б — результат фильтрации исходных трасс по х; в — результат фильтрации данных, приведенных на рис. о. по t Для получения коэффициентов ковариации через значения двумерной АКФ R (р, т) можно использовать следующие выра- жения: rw = #(P> т)‘, k, i = l, 2, . . ., nxn; r- г i — IT, г k — И m = [i—r] — n -------1 + nl------ • L » J L n J Квадратные скобки здесь обозначают целую часть от деления указанных в них индексов. Найдем rw = R (р, т). При k = 2; i = 9; п = 3 согласно при- веденным выражениям rae = R (—2,1). Таким образом, для трех смещений по профилю т и трех сме- щений между профилями р получаем матрицу размером 9X9. 240
С учетом симметрии двумерной АКФ /? (р, т) = /? (— р, — т) эта матрица симметрична относительно главной диагонали, на которой расположена дисперсия поля /? (О, 0) = о2. Если весовые коэффициенты и значения двумерного сигнала в (7.50), представленные матрицами вида Рис. 57. Результаты двумерной энергетической фильтрации при обработке данных ВСП. о — исходный временной разрез ВСП; б — данные обработки расположить по строкам, в которых сначала идут значения весо- вых коэффициентов h^i (и сигнала) при k = 0 (р = 0), а индекс i (т) пробегает все значения, затем идут значения hki (и spm) при k = 1 (р = 1) и т. д., мы сведем случай умножения матрицы ве- совых коэффициентов на матрицу матриц с учетом приравнивания этого произведения к матрице сигнала к случаю нахождения ве- совых коэффициентов одномерного фильтра. При этом вектор- строка из девяти весовых коэффициентов фильтра умножается на матрицу, приведенную в табл. 21, а произведение приравнивается к вектору-строке из девяти значений сигнала. После нахождения весовой функции путем решения системы линейных уравнений проводится двумерная свертка ypj — — Yfikifp-i, i-i, обеспечивающая двумерную оптимальную филь- трацию поля. 241
Пример, иллюстрирующий применение двумерного энергети- ческого фильтра, рассчитанного по описанной выше методике, при- веден на рис. 57. На рис. 57, б показан результат обработки участка профиля ВСП по одной из скважин в Чу-Сарысуйской депрессии. На исходном разрезе (рис. 57, а) прослеживаются две интерфери- рующие системы волн: 1) падающие продольные волны и парал- лельные им многократные нисходящие волны-помехи; 2) восходя- щие волны, несущие полезную информацию об отражающих гори- зонтах. Обработка проводилась с целью выделения отраженных волн, подавляемых нисходящими и другими волнами-помехами. В ре- зультате двумерной энергетической фильтрации полезный сигнал, характеризующийся меньшей интенсивностью, по сравнению с вол- нами-помехами, уверенно выделяется. Дополнительное применение к полученному результату обратной фильтрации позволит достичь и временной разрешенности поля. При нахождении весовых функций оптимальных фильтров, осо- бенно двумерных, требуется решение системы линейных уравнений большого порядка. Для решения систем уравнений этого типа раз- работан специальный алгоритм Левинсона, позволяющий в N раз сократить время вычислений и объем памяти, занятый коэффи- циентами матрицы. Описание алгоритма можно найти в [11].
ГЛАВА VIII ВЫДЕЛЕНИЕ СЛАБЫХ ГЕОФИЗИЧЕСКИХ СИГНАЛОВ НА ОСНОВЕ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ Критерии оптимальной фильтрации и соответствующие им алго- ритмы обработки исходных данных обеспечивают выделение сиг- налов на фоне помех, однако принятие решения о наличии или от- сутствии полезного сигнала после фильтрации осуществляется интерпретатором визуально. Это обстоятельство делает последний этап обработки весьма субъективным, особенно для случая обна- ружения слабых сигналов. Достаточно вернуться к рис. 51, г, на котором приведены результаты фильтрации согласованным фильт- ром, чтобы увидеть три примерно равных по своей амплитуде мак- симума. Хотя наибольший из них и соответствует искомому сиг- налу, тем не менее при обработке геофизических данных в подоб- ной ситуации и два других максимума можно было бы принять за полезный сигнал. Следовательно, при фильтрации слабых сиг- налов не хватает обоснованной процедуры принятия решения о наличии сигнала. В разведочной геофизике слабым сигналом (слабая аномалия) принято считать сигнал, который соизмерим по интен- сивности с уровнем помех или ниже этого уровня. Йх визуальное обнаружение практически исключено. Тем не менее проблема об- наружения слабых сигналов в разведочной геофизике приобретает все большее значение в связи с поисками месторождений, залегаю- щих на больших глубинах, а также с поисками объектов, аномаль- ные эффекты от которых осложнены интенсивными помехами са- мой разной природы. Под обнаружением сигнала, обычно понимают факт установления его наличия. Однако, уста- навливая факт наличия сигнала, мы тем самым относим сигнал к определенной точке наблюдения, частично решая одновременно и задачу выделения сигнала, состоящую в оценке параметров и формы сигнала. Нередко после обнаружения сигнала удается пе- рейти и к оценке его формы. Поэтому, рассматривая алгоритмы обнаружения слабых сигналов и оценку их параметров, можно считать, что решаем задачу их выделения. Общей задачей фильтрации является извлечение полезной, ин- формации из смеси сигнала и помех. Рассмотренные в гл. VI и VII приемы обработки исходных данных в значительной степени направлены на достижение возможно большего отношения сиг- нал/помеха, исходя из того, что именно помехи в конечном итоге ограничивают чувствительность метода и, следовательно, чем сла- бее помеха, тем лучше. Ф. Вудворд подчеркивает: «Такой подход 243
справедлив до тех пор, пока он приводит к цели, однако он не со- держит постановки задачи об извлечении полезной информации. Кроме того, не существует общей теоремы, утверждающей, что максимальное отношение сигнал/помеха на выходе фильтра обеспе- чивает максимальное извлечение информации». Под максимальным извлечением информации в настоящее время понимается получение апостериорных вероятностей, в частности для задачи обнаруже- ния сигнала — апостериорных вероятностей наличия и отсутствия сигнала. Результатом развития статистической теории оптимальной филь- трации в середине 50-х годов, благодаря трудам В. А. Котельни- кова, Ф. Вудворда, Д. Мидлтона и др., явилась статистическая теория оптимального приема. При оптимальном приеме, в отличие от оптимальной фильтрации, результатом обработки данных яв- ляются условные вероятности интересующих нас событий, напри- мер вероятность наличия полезного сигнала. Статистическая тео- рия приема, в свою очередь, возникла на базе теории проверки ста- тистических гипотез. В теории приема также фигурирует параметр отношения сигнал/помеха. Однако роль этого параметра здесь бо- лее скромная, поскольку вопрос о наличии (отсутствии) сигнала решается без его помощи. Для решения задач обнаружения (и вы- деления) сигнала используются критерии принятия статистических гипотез, которые позволяют установить порог принятия решения о наличии сигнала. При этом оптимальная фильтрация входит как составная часть общего решения. § 38. КРИТЕРИИ ПРИНЯТИЯ СТАТИСТИЧЕСКИХ РЕШЕНИЙ Статистическое решение связано с понятием статистиче- пении задачи обнаружения сигнала е гипотезы: 1) гипотеза о наличии сигнала, т. е. когда наблюденное поле ft = Si + щ, эту гипотезу называют ненулевой, обозначим ее Ht; 2) гипотеза об отсутствии сигнала, т. е. когда ft = nt, эту гипотезу называют нулевой, обо- значим ее Но. Для каждой гипо- тезы по значениям ft можно по- строить оценку плотности их рас- пределения — гистограмму. Такие условные плотности распределе- ния значений Л, обозначаемые со- ответственно Р (F/Ho) и Р FtHj), где F = flt . . . , fm, называются о д о б и я. Функции правдоподо- бия для задачи обнаружения сигнала приведены на рис. 58, где Р (FIHO) соответствует оценке плотности распределения помех и может быть построена на участках, на которых заведомо отсутст- 244 с к о и имеют гипотезы, место две стати Рис. 58. Графики плотностей распределения гипотез Но и Нх для оценки вероятностей ошибок первого и второго рода п О
вуют полезные сигналы, Р (FIHх) соответствует оценке плотности распределения суммы сигнала и помехи, причем если среднее зна- чение помех равно нулю, то среднее значение сигнала является величиной а. Вся область значений вектора F разделяется на две: область So, которая образует множество значений ft, соответст- вующих гипотезе Но, и область 51я которая образует множество значений fit соответствующих гипотезе Ях. Точка h на оси /, раз- деляющая эти области, называется порогом принятия решения о наличии той или иной гипотезы. Принятие решения (статистического решения) о наличии (от- сутствии) сигнала не может быть безошибочным. Ошибки неиз- бежны, поскольку заключение о наличии или отсутствии сигнала дается на основании обработки данных, осложненных помехами. Все критерии принятия статистических решений о наличии сигнала и вытекающие из них алгоритмы обработки связаны с вероятно- стями ошибок, возникающих из-за помех. Принятие решения со- провождается ошибками двух родов. Ошибка первого рода заключается в том, что принимается гипотеза Нь в то время как в действительности выполняется гипотеза Но. Такая ошибка в случае обнаружения сигнала означает, что принимается решение о наличии сигнала, в то время как на самом деле он от- сутствует. Эта ошибка называется ошибкой обнаруже- ния ложного сигнала. Она появляется тогда, когда наложение помех создает ситуацию, похожую на полезный сигнал. Ошибка второго рода заключается в том, что прини- мается гипотеза Нй, в то время как в действительности справедлива гипотеза Н^. Такая ошибка означает, что принимается решение об отсутствии сигнала, в то время как сигнал имеется. Эта ошибка называется ошибкой пропуска сигнала. Она по- является тогда, когда помехи настолько искажают сигнал, что соз- дается ситуация, похожая только на помеху. С ошибками обнаружения ложного сигнала и пропуска сигнала связаны соответствующие вероятности. Вероятность ошибки об- наружения ложного сигнала а= J Р (FIHO) dF = [P (f/Яо) dF, (8.1) а вероятность ошибки пропуска сигнала h р = f Р (F/Hi) dF = f Р (F/HJ dF. (8.2) So —op Вероятности а и p на рис. 58 заштрихованы. Если ввести априорные вероятности для гипотез Но и Hi — Ро и рх, то 9 = роа + р!р (8.3) определяет полную безусловную вероятность ошибки, связанную 245
как с обнаружением ложного сигнала, так и с пропуском сигнала. Величина Т=1-Р (8.4) называется вероятностью правильного обнару- жения сигнала или надежностью обнару- жения. Соответственно вероятность правильного необнаруже- ния сигнала <р = 1—а. Учитывая, что при выборе порога h потери, обусловленные различными ошибками, могут быть разными с экономической точки зрения, вводят понятие цены для ошибок первого и вто- рого рода — Са и Ср. Произведение Саа называют риском (потерей), соответствующим гипотезе Но. В задаче обнаружения сигнала это будет потеря, обусловленная неправильным решением о наличии сигнала. Обнаружение ложного сигнала неизбежно при- ведет к затратам средств на его проверку другими геофизическими методами или же горно-буровыми работами. Аналогично произве- дение Сар есть риск (потеря), соответствующий гипотезе Ях. Про- пуск действительного сигнала (аномалии) может привести к про- пуску месторождения полезного ископаемого, при этом потери могут быть весьма велики. Средний риск при принятии решения r(ft) = PoCaa + piCpp. (8.5) Величина среднего риска г зависит от Л, поскольку от h зависят значения а и ($. Естественный критерий принятия статистических решений свя- зан с минимизацией среднего риска. Согласно критерию ми- нимального риска, или критерию Байеса, вы- бирается такое значение h, которое обеспечивает минимум выра- жения (8.5). Для нахождения величины г (й) с учетом (8.1) и (8.2) выпишем выражение (8.5), к которому добавим и от которого выч- тем одну и ту же величину JC^PtF/HJdF: r(h) = J CfipJtF/HJdF+j CaPoP(F/Ho)dF + + $ С$Р1Р(FIHJdF — SC^PtFIHJdF. St Si После объединения первого члена с третьим, а второго с чет- вертым получаем г(Л)= f C^p1P(F/H1)dF+ С [СаРйР (F(H0)— S»So4-Si Si - С^Р1Р (F/Hi)] dF = C₽P1 + f [CaPoP {F/He)—C^P1P (F/HJ] dF. St В последнем выражении первое слагаемое положительное, поэ- тому для минимизации риска нужно выбрать область 5t, иначе, 246
порог h, таким образом, чтобы подынтегральная функция была отрицательной, т. е. Сор0Р(Г/Я0)<СрР1Р(Е/Я1). Из этого следует, что Л = Р(Р/Я1)/Р(Р/Я0)>Сар0/С₽р1 = Л. (8.6) Отношение функций правдоподобия Л = Р (F/Ho) на- зывается коэффициентом правдоподобия. Для критерия минимального риска коэффициент правдоподобия в слу- чае выполнения гипотезы (гипотезы о наличии сигнала) должен превосходить величину порога h, равную C^pJC^pi. Таким обра- зом, применение критерия минимального риска возможно лишь при известных ценах ошибок первого и второго рода и априорных вероятностях р0 и pv Достоверная оценка Са и Ср требует тщатель- ного анализа большого статистического материала, который может быть получен в районах с хорошей геолого-геофизической изу- ченностью. В ином случае приходится считать Са = Ср, т. е. при- писывать пропуску сигнала и обнаружению ложного сигнала оди- наковый вес. При этом следует минимизировать безусловную ве- роятность ошибки (8.3), что приводит к правилу принятия решения [см. также 8.6) при Са = Ср] в виде A>p0/p1 = /i. (8.7) Правило (8.7) соответствует критерию Котельни- кова (или идеального наблюдателя). Если при обработке геофи- зических данных априорные вероятности наличия и отсутствия сигнала (р0 и р^ считать равными, что отвечает максимальной не- определенности этих событий, то порог h в (8.7) становится равным единице: Л>1=Л. (8.8) Правило принятия решения (8.8) соответствует критерию максимального правдоподобия. Согласно этому критерию решение о справедливости гипотезы Нг принимается тогда, когда вероятность Р (F/Hi) больше вероятности Р (F/Ho) в (8.6), т. е. h ~ 1. Критерий Котельникова при заданных вероят- ностях До и Pi позволяет на основе формулы Байеса (1.2) оценить апостериорную вероятность наличия сигнала: p(HJF) — ------Р1Р ---------=—^Ра)— -. (8.9) 1 7 рхР(Р1Нг) + рлР{Р1Н^ (рМ)Ь+\ Когда задание априорных вероятностей является нецелесооб- разным, используются следующие три критерия: минимакса, Ней- мана—Пирсона и Вальда. Согласно критерию минимакса порог h находится при минимизации максимально возможного риска. Поскольку г (h) зависит от р0 и Pt наименьший риск имеет максимум при некотором значении pj = 1—р*, не равном ни нулю, ни единице, ибо как при Рл1, так и при р-> 0 риск г->-0. Если выбрать критическое значение р* и определить порог h =Саро/С^Р\, действительный 247
риск при любом, отличающимся от pi значений р! не превзойдет риска, рассчитанного для h = h*. Значение р‘ находится из урав- нения дг!дрг = 0. Из (8.5) легко видеть, что dr (h)ldpx = С$—Саа, т. е. уравнение для нахождения р\ будет Ср0 = Соа. Правило принятия решения при отсутствии сведений об апри- орных вероятностях и о ценах Са, Ср дает критерий Ней- мана —П и р с о н а. Согласно этому критерию минимизируется величина 0 вероятности пропуска сигнала при условии, что вероят- ность обнаружения ложного сигнала а не превосходит заданной величины а0, т. е. min 0 при а = а0. При известной функции прав- доподобия P(FIH0) и заданной величины а0 из (8.1) можно найти порог Л, соответствующий разбиению области наблюдений F на So и Sx. В этом нетрудно убедиться, если в (8.1) перейти от m-мер- ной выборки поля F к одномерной переменной коэффициента прав- доподобия Л, положив Р (F/HJ dF — P (AJHi) dA; Р (F/Ho) dF = P dk. Правые и левые части указанных равенств выражают одну и ту же условную вероятность принятия решения о наличии сигнала и его отсутствии. Области So и Sx при переходе от переменной F к переменной Л преобразуется в числовую ось Л, на которой зна- чение Л = Л 0 является порогом для принятия решений. Таким образом: а= f P(A/tf0)dA; (8.10) Ло Ло 0= J P(A/Hx)dA. (8.11) —00 Для критерия Неймана—Пирсона вероятность а равна заданной величине а0, отсюда заданным является и пороговое значение Ло. Для всех рассмотренных выше критериев и соответствующих им правил принятия решения характерно было условие фиксиро- ванного объема выборки поля F, а именно его m-мерная размер- ность. Существует подход к установлению правила принятия ре- шения, при котором размер выборки т не фиксируется, а ограничи- вается в процессе наблюдений в зависимости от уже ранее прове- денных наблюдений. При таком подходе наряду с принятием ре- шения о выполнении Но и Нг возможно принятие решения о необ- ходимости продолжить наблюдения, т. е. отказаться на данном этапе от принятия одного из решений о справедливости Но и Если же принимается решение о выполнении Но или Я1( наблю- дения на этом заканчиваются. Целесообразность такого подхода очевидна при проведении дорогостоящих экспериментов, напри- мер при подсчете запасов с помощью бурения скважин. Этот под- ход был разработан А. Вальдом и получил название последо- вательного анализа. При последовательном анализе размер выборки наблюдений т заранее неизвестен и является слу- 248 J
чайной величиной. Область наблюдений делится уже не на две, а на три области: 50, и Snp (промежуточная область). Если мы попадаем в промежуточную область, необходимо продолжить на- блюдения. Критерий Вальда сводится к следующему правилу: при т-м наблюдении принимается решение о гипотезе Но, если f/(l—a)<A(f1........../*)<(!—р)/а, (8.12) k = 1, . . . , tn— 1; A(ft, .... fm) < p/(l—а)<1, и о гипотезе Hit если справедливо (8.12) и A(fx.........fm) >(1-Р)/а^>1- Как видно, критерий Вальда основан на сравнении коэффици- ента правдоподобия с порогами, зависящими от задания вероятно- стей ошибок первого и второго рода. / Таким образом, правила принятия решения для всех критериев сводятся к нахождению коэффициента правдоподобия Л и сравне- нию его с некоторыми пороговыми значениями Ло (или Л). Для решения задачи обнаружения слабых геофизических сиг- налов используются критерии максимального правдоподобия и Неймана—Пирсона. В сейсморазведке применяются фильтры, по- строенные на минимаксном критерии. Проиллюстрируем применение рассмотренных выше критериев и со- ответствующих им правил для решения задачи о наличии аномалии в точке при условии, что амплитуда поля в ней в 3 раза больше среднеквадратиче- ского значения фона помех <Тф. Без ограничения общности положим, что помехи распределены нормально с нулевым средним и Оф= а2 = 1, а также некоррелироваиы. Соответственно нормальным будет и распределение суммы аномалии и помех со средним а0 = 3 и дисперсией а* = 1. Отсюда функции правдоподобия будут Р (F/Ha) = (д/а Van) ехр (- И Р (F/HJ = (1/о V&T) ехр [ - (/ - а0)«/2ст»], а коэффициент правдоподобия примет вид Л = Р (FIHi)IP (FIH0) = ехр ( - -Д- + > Ло = Л. (8.13 \ 2а* а* / Для критерия максимального правдоподобия априорные вероятности р0 и pi и цены ошибок Св и Ср равны, т. е. порог Ло = h = 1, что обеспе- чивает граничную величину для f из (8.13), равную /пор = at/2 = 1,5, так как Oq/202 = /а0/а2. Таким образом, искомое значение поля можно считать аномальным. Применим критерий Котельникова, для которого Ло = h = Po/pi. Про- логарифмировав (8.13), найдем а2 / fnop =-------1 In Ло -( До \ Др \ Ар а21пЛо 2а* / . 2 во 249
Пусть Ло = р»)Р1 = Ю, тогда пор = 2,4 и заданное значение поля яв- ляется аномальным. Только при Ло = Pol Pi = 100 (/пор = 3,03)- его нельзя считать аномальным. Для критерия минимального риска пороговое значение Ло = Cap0/Cppj. Пусть цена пропуска аномалии в 10 раз выше цены обнаружения ложной аномалии, тогда Са/Ср = 0,1. При p0/pj = 10 и а„/о2 = 9 из (8.13) находим /пор =1,5, т. е. в этом случае более высокая цена пропуска аномалии ском- пенсировала более низкую величину априорной вероятности наличия ано- малии и в результате получен тот же порог, что и для критерия максималь- ного правдоподобия. Для применения критериев минимакса и Неймана—Пирсона необхо- димо вычисление вероятности а и 0. С учетом (8.1) и (8.2) имеем “-----У ехр (— ха/2) dx ±= 1 — ф( а 'у2л ^пор~~ао \ о <т = 1-_Фг_д°-+ glnft>Y \ 2о а0 ) (8.14) где Ф (() = —!— У ехр ( — [х*/2) dx. 2л — оо Аналогично для вероятности 0 получим (1пор~аа) =------!= f ехр ( - х»/2) Лг = ф<7пор~ о 'у 2я V ° = ф( __go_ + .gjn4o Y \ 20 а0 ) Отметим, что для критерия максимального правдоподобия (Ло = 1) согласно (8.14) и (8.15) в нашем примере а ~ 0 = 7,5 %. Выражение для среднего риска (8.5) при Са = 6 Ср имеет вид г (h) = ср (ьРо Г1 - ф (-3L-+ gln^Y| + Р1ф + -SJaAAl. I L \ 2о о® /J \ 2о во /) В нашем примере г (Л) = Ср ^ро [1 - Ф (у- In + 1 ,б)] + Р1Ф (у In X X РрЬ 1 — Ра 250
Для drldpi — 0 имеем Соа = Ср₽. Подставляя сюда выражение для аире учетом Ср/Са = Mb, получаем — ф(— In—------------1,5'1 = 1- ф(— In—----------Н.бУ b \ 3 1 — pt / \ 3 1 — рл ) При заданном значении поля наименее благоприятная величина ра соответствует максимальному г (h). Например, при b = 1 из последнего уравнения следует, что р0 = 0,5, т. е. при равных ценах ошибок наименее благоприятным случаем является равенство априорных вероятностей pj = = ₽! = 0,5. Этот случай соответствует критерию максимального правдо- подобия. Наконец, для применения критерия Неймана—Пирсона необходимо из выражения (8.14) определить Ло или fnop при заданной величине а = 5 %: 01пЛо ^ = 1—а= 0,95; go^ а 1п Ло _165 V 2а at 7 2а ав С учетом (8.14) получаем Ло = 1,57 (fnop = 1,57), т. е. заданное значе- ние поля можно вновь считать аномальным. При этом из (8.15) 0 = 16 %, т. е. вероятность пропуска аномалии достаточно велика. § 39. НАДЕЖНОСТЬ ОБНАРУЖЕНИЯ СИГНАЛА Под надежностью обнаружения сигнала (ано- малии) понимается вероятность его правильного обнаружения у = 1—0, где Р — вероятность ошибки пропуска сигнала. Надежность обнаружения сигнала позволяет оценить качество проводимой обработки (фильтрации) данных. Вспомним, что для согласованного фильтра качество фильтрации оценивалось по ве- личине пикового отношения сигнал/помеха на выходе фильтра. Надежность же обнаружения, как увидим, определяется по вели- чине энергетического отношения сигнал/помеха, что подчеркивает преимущество последнего перед пиковым отношением. Найдем вероятности ошибок первого и второго рода для задачи обнаружения сигнала известной формы и амплитуды на фоне не- коррелированных помех с нулевым средним и дисперсией о2. При этом гипотеза об отсутствии сигнала Но состоит в том, что ft = nt, а гипотеза о наличии сигнала — в том, что ft = s< + nt, i = = 1, . . . , m. Полагая распределение помех нормальным, полу- чаем следующие выражения для функций правдоподобия: p.(f/h0)= L wp(-fW). . . —-L.............х V 2л а V2л а X ехр (—/„/За2) = - т ехр( —£ /1/2а21; (8.16) (у2л ) а 41 7 P(F/H1)= —А_—ехр [—(fi—S1)a/2o2] . . . _L X -у2л а -у2л ° X ехр [—(fm—sm)2/2o*] = 1 ехр х (V2^) а 251
[т 1 i j (8.17) Соответственно из (8.16) и (8.17) коэффициент правдоподобия т Е»? 1 т 1 л_. Р(^1) Р (F/Ht) ”’г \ 2<т2 1 о2 7 Согласно рассмотренным выше критериям, решение сигнала принимается при Л>Л0 = й. Тогда с учетом i.si ] = ехр (8.18) о наличии (8.18) Л = ехр или после логарифмирования 1 т ф = — EfiSt>lnA0 + p/2, а2 1 где р = £s2/ct2 = /ns2/o2 — энергетическое отношение сигнал/по- меха; <р — корреляционная сумма заданного сигнала с наблюден- ными значениями поля. Вероятность ошибки обнаружения ложного сигнала а — это вероятность того, что при отсутствии сигнала si величина <р ока- жется больше порога Ло и будет принято неправильное решение в наличии сигнала, т. е. при ft = nt Ф = Ц- 2n{s, >1п Ло + р/2 (8.19) и для вычисления а необходимо определить вероятность осущест- вления такого неравенства. Поскольку помеха — некоррелиро- ванная случайная величина с нулевым средним, математическое ожидание и дисперсия величины ф, также имеющей нормальное распределение, будут соответственно: Мф = 0; Dtp = У, = р. Отсюда плотность распределения ф при отсутствии Р (ф/#0) = —-— ехр (—ф2/2р) = —-— ехр х Г. (1П Ло + р/2)2 1 L 2р J (8.20) сигнала (8.21) Следовательно, вероятность ошибки первого рода с учетом (8.20) ОО 00 а= f Р(ф/Я0)б/ф = У Р (ф/Я0)^ф = ’пор 1п Ло+Р'2 = 1 _ф(_1пЛо+р/2 ), (8.22) 252
где ф (f) = —i— г ехр (—х®/2) dx. л/in -io Аналогично находим вероятность ошибки пропуска сигнала 0 как вероятность того, что величина ф окажется меньше порога Ло, несмотря иа наличие сигнала, т. е. при f{ .= sj + nt ф= _l_£(Sf_]_nj)St<lnA0+ р/2, аа ИЛИ ; ф = “V Е П,5(<1п Ло— р/2. (J* Плотность распределения ф при наличии сигнала, когда М<р = = Dq> = р, будет Р (Ф/# i) = -т=г ехр [—(<р—р/2)а/2р! = -у2лф = ~ - ехр [ (1пА»~Р/2)а j. (8.23) Следовательно, вероятность ошибки второго рода ’пор ,п Ло— 0= J Р(ф/я1)йф= у Р(Ф/я1)^ф = фГ 1пЛа~р/-2-у \ Vp ) (8.24) Надежность обнаружения сигнала, определяемая как вероят- ность правильного обнаружения сигнала, у=1 — 0=1 — ф/ 1п А».Т1Р/2 \ . (8.25) V Vp ) Рассмотрение полученных [вероятностей а, 0 и у [показывает, что качество обработки определяется через энергетическое отно- шение сигнал/помеха и порог принятия решения Ло. Для критерия максимального правдоподобия Ао = 1 и из выражений (8.22), (8.24) и (8.25) следует: а = 0 = 1 — ф(Ур/2); (8.26) ? = ф(Л/р/2). (8.27) Характеристики обнаружения сигнала, представляющие за- висимости между надежностью обнаружения и энергетическим от- ношением сигнал/помеха, для критерия максимального правдо- подобия приведены на рис. 59. Для критерия Неймана—Пирсона (8.22) порог принятия ре- шения находится при заданных значениях а0 и Р- 253
Характеристики обнаружения сигнала иллюстрируют тот факт, что для достижения большей надежности требуется и большее отношение сигнал/помеха. Это утверждение описывается количест- венной зависимостью с помощью характеристики обнаружения. По кривым рис. 59 при заданной надежности для критерия макси- мального правдоподобия (а для критерия Неймана—Пирсона также и заданного значения а) определяется требуемая величина энерге- тического отношения р. Из (8.22) и (8.25) нетрудно получить Рис. 59. Характеристики обнаружения сигнала: 1 — по критерию максимального правдоподобия, 2 — по критерию Неймаиа—Пирсона где Ф"1 — функция, обратная интегралу вероятности. Из (8.27) соответственно имеем р = 4 [Ф-1 (т))а. (8.29) Таким образом, характеристики обнаружения позволяют еще до начала обработки оценить возможности выявления тех или иных сигналов (аномалий). Например, надежность обнаружения сигнала, соизмеримого с уровнем помех, т. е. sa =аа, при 10 аномальных значениях по критерию максимального правдоподобия равна 95 % (р = тз2/в2 = 10). Для критерия Неймана—Пирсона при одном и том же отношении р обнаружение характеризуется различной надежностью в зависимости от величины а. Так, например, для р = 10 можно обеспечить высокую степень надежности 99 % (ве- роятность пропуска сигнала 1 %), однако при этом будет большая вероятность обнаружения ложного сигнала — 20 %. Наоборот, небольшая величина надежности — 80 % при р = 10 связана с ма- лой долей ложных сигналов — 1 %, но с большой вероятностью пропуска действительного сигнала — 20 %. 254
Все приведенные выше выражения справедливы и для случая обнаружения сигнала на фоне коррелированных помех, для которого энергетическое отношение сигнал/помеха р = s' RJT’s, где s' из — вектор-строка и вектор-столбец значений сигнала; R71 — обратная корреляционная матрица помехи. При обнаружении сигнала по нескольким профилям (трассам) N Рх = X Ра» W Рк— отношение сигнал/помеха на k-м профиле. В частности, при рх = . . . = pN = р имеем р2 = Л/р и соответст- венно надежность обнаружения по критерию максимального прав- доподобия у = Ф(УЛ/р/2). (8.30) Если форма сигнала заранее неизвестна, оценка энергетического отношения может быть проведена по исходным данным следующим образом. По функциям взаимной корреляции в предположении коррелируемое™ сигнала от профиля к профилю рассчитывается величина s2/ct2 = Ви (тв)/[1—Вл (ms)]> где Вя (тз) — экстремаль" ное значение нормированной ВКФ - Протяженность сигнала М оцени" вается по величине интервала корреляции, определяемого с помощью АКФ- Отсюда р = з2т/ст2. Эта оценка р является усредненной, т. е. для некоторого среднестатистического сигнала, тем не менее она позволяет до начала обработки установить возможности выде- ления слабых сигналов. На основе количественной зависимости между р и надежностью обнаружения у определяется понятие достоверная гео- физическая аномалия (достоверный сигнал). Наибо- лее распространенным подходом к оценке достоверности геофизиче- ских аномалий является такой, при котором под аномалией пони- мается совокупность не менее трех точек со значениями в них поля, превышающими тройную среднеквадратическую погрешность на- блюдений ст. Интуитивно предполагая наличие связи между на- дежностью обнаружения аномалии и числом аномальных точек, для увеличения достоверности аномалии на практике сгущают сеть наблюдений. При этом интерпретаторы считают возможным ' пренебречь условием о наличии трех точек со значениями, боль- шими Зст, при выделении протяженных по профилю или площади аномалий. Такой подход действительно оправдан. Пусть, напри- мер, мы исходим из приведенного выше подхода к определению достоверности аномалии, т. е. когда имеются три точки (т = 3) со значениями st/a > 3. При этом р > 27, что по критерию макси- мального правдоподобия соответствует надежности обнаружения у > 99,5 % (см. рис. 59). Следовательно, согласно действующим инструкциям по магнито-, электро- и гравиразведке, аномалию предлагается считать достоверной, если надежность ее обнаруже- ния по критерию максимального правдоподобия не менее 99,5 %, Отсюда вполне очевидно, что аномалию протяженностью в семь 255
точек, но уже при отношении s/o = 2 также можно считать досто- верной, ибо р = s2m/o2 > 27. Из тех же соображений полагаем, что аномалия с отношением s/o = 1 будет достоверной при т > 27. Проведенный анализ позволяет дать более точное определение понятия «достоверная аномалия»: под достоверной аномалией сле- дует понимать такую составляющую поля, отношение энергии ко- торой к мощности (в частности, к дисперсии) помех а2 превосходит порог, соответствующий заданной вероятности (надежности) обна- ружения у. Например, при у = 99,5 % порог р = 10 (см. рис. 59). При проведении радиометрических наблюдений за аномалию принимается одна точка (т = 1) со значением s/Оф = 2, где Оф — среднеквадратический уровень фона пород. Из критерия макси- мального правдоподобия следует, что р = 4иу = 84%.По кри- терию Неймана—Пирсона при а = 20 % и р = 4 надежность у = = 88 %, т. е. доля, приходящаяся на пропуск аномалии р = 12 %, почти в 2 раза меньше вероятности обнаружения ложных аномалий (а = 20 %). Другой практический вывод из характеристик обнаружения сигнала по критерию максимального правдоподобия состоит в по- лучении объективного критерия для выбора параметров геофизи- ческой съемки. Действительно из (8.27) следует, что в7ст=(2/Ут')ф-1(у). (8.31) Задавшись надежностью обнаружения аномалии от интересую- щего нас объекта, по выражению (8.31) можно найти шаг съемки при некотором отношении s/o, величину которого оценивают пред- варительно либо путем решения прямой задачи, либо по функциям взаимной корреляции. Наконец, по надежности обнаружения оценивается предель- ная глубина исследований геофизическим методом. Глубина зале- гания геологических объектов является одним из параметров, от которого зависят ординаты и энергия аномалии. Поэтому исполь- зовав решение прямой задачи для заданной модели и оценив дис- персию помех по наблюденным данным, нетрудно установить за- висимость энергетического отношения аномалия/помеха от глу- бины залегания искомого объекта, т. е. р = f (ft). Далее из (8.29) при заданной допустимой надежности обнаружения у0 получим пороговое значение рпор = 4 [Ф~1 (у0)Р и по зависимости р = — f (ft) оценим предельную глубину исследований объекта, для которого решена прямая задача данным геофизическим методом. При выводах, которые следуют из анализа надежности обна- ружения, мы исходили из предположения отсутствия корреляции помех. Только в этом случае надежность обнаружения аномалии растет пропорционально увеличению числа аномальных значений поля /и, таккак р = ($2/ст8) т, и чем больше т при одном и том же отношении s*/o8, тем больше р*, а следовательно, и вероятность правильного обнаружения аномалии у. Однако на определенном 256
этапе сгущения сети (на определенной стадии детализации анома- лии) увеличение т не будет приводить к увеличению р, поскольку уменьшение шага наблюдений по профилю в конечном итоге при- ведет к коррелированное™ помех, обусловленных, в частности, эффектами от поверхностных неоднородностей. Пусть АКФ помехи треугольного типа (см. рис. 15, б), тогда дисперсия помехи D = r/т2, где гх — интервалы корреляции по- мехи по профилю. Отсюда энергетическое отношение р = s2/n/parx, и чем больше т, тем больше гх, т. е. сгущение сети путем увеличе- ния т будет скомпенсировано возрастанием величины гх. При этом выигрыша в увеличении энергетического отношения не будет. Сле- дующий путь повышения надежности обнаружения аномалии — увеличение р за счет увеличения числа независимых наблюдений аномалии по ряду профилей. Тогда р = 8*т№о*гх, где N — число профилей, по которым прослежена аномалия. Однако на опреде- ленном этапе сгущения сети профилей появится корреляция помех между профилями и р = где ги — интервал корреля- ции помех между профилями. И вновь увеличение числа незави- симых наблюдений путем сгущения сети компенсируется ростом гу. В то же время практические возможности выделения аномалий при использовании данных площадных съемок существенно рас- ширяются. При достаточно большом числе N мы достоверно сможем обнаружить аномалию, по интенсивности меньшую уровня помех и в то же время небольшой протяженности по профилю. Увеличение надежности обнаружения аномального эффекта мо- жет быть достигнуто также путем использования данных комплекса геофизических методов. Если для каждого независимого физического параметра анома- лия связана с одним и тем же геологическим объектом, ее надеж- ность у = ф(д/2р//2) где pi — отношение аномалия/помеха для l-го параметра, — число параметров. § 40. СПОСОБ ОБРАТНЫХ ВЕРОЯТНОСТЕЙ Способ обратных вероятностей предназначен для обнаружения заданных по форме сигналов. В отличие от способа обработки со- гласованным фильтром, он включает порог принятия решения и вы- числение апостериорных (обратных) вероятностей наличия сигнала по формуле Байеса. Способ обратных вероятностей в геофизике, предложенный А. Г. Тарховым (1959 г.), вначале был использован О. А. Демидовичем (1964 г.) в задачах рудной электроразведки, а затем получил широкое применение и в других методах разведоч- ной геофизики. Рассмотрим обнаружение детерминированного, т. е. заданного по форме сигнала, на фойе некоррелированных помех с позиции проверки статистических гипотез. 1. Модель поля и постановка задачи. Пусть результаты изме- рений вдоль профиля представляют собой сумму сигнала S; и помехи 9 А. А. Никитин 257
nt fi — Si + n(. Помеху будем считать стационарным эргодиче- ским процессом, некоррелированной и нормально распределенной с нулевым средним и дисперсией о2. Требуется на основе имеющейся последовательности значений поля F = (fi....., /т) с определенной вероятностью установить, является ли эта последовательность суммой сигнала и помехи, т. е. fi = st + п(, или она представлена лишь одной помехой, т. е. ft = ni. Такая постановка задачи приводит к сравнению двух ста- тистических гипотез Нх и Яо; при наличии сигнала выполняется гипотеза Я1( при его отсутствии — гипотеза Нй. 2.....Оценка формы сигнала и корреляционных свойств помех. Форма полезного сигнала s0 может быть получена путем решения прямой задачи для подходящей физико-геологической модели иско- мого объекта и вмещающей среды, либо просто по наблюденным визуально сигналам (аномалиям) на соседних, сходных по геоло- гическому строению объектах, либо, наконец, путем расчета ВКФ или АКФ. При этом ординаты сигнала целесообразно определять исходя из заданной величины надежности обнаружения сигнала у = 95 % (99 % и т. д.), например согласно критерию максималь- ного правдоподобия. Пусть получен сигнал с ординатами s0 = (sOi, ...... .. som). Для этого сигнала по критерию максимального прав- доподобия энергетическое отношение сигнал/помеха р0 = 2s0(/o2, а заданной величине надежности обнаружения у соответствует от- ношение р. Если р =/= р0, все ординаты сигнала s0 следует умно- житьна Vp/Po, что и обеспечивает обнаружение сигнала S/ = = -v/p/PoSo i с заданной надежностью у. Оценка корреляционных свойств помехи проводится на заве- домо безаномальных участках съемках путем расчета АКФ и не- обходима для проверки некоррелированного характера помехи и определения дисперсии^о2. 3. Выбор критерия принятия решения. Для обнаружения^из- вестного по форме сигнала в теории оптимальной фильтрации (см. гл. VII) следует использовать критерий максимума пикового от- ношения сигнал/помеха. Этот критерий обеспечивает построение согласованного фильтра. При проверке статистических гипотез выбор критерия определяется наличием априорной информации (см. § 38). Если цены ошибок первого Са и второго рода и апри- орные вероятности наличия р0 и отсутствия рг сигнала полагать равными, т. е. Са = Ср, р0 = plt что соответствует максимальной неопределенности событий наличия и отсутствия сигнала, следует выбрать критерий максимального правдоподобия. Согласно [этому критерию задача обнаружения сигнала состоит в нахождении ко- эффициента правдоподобия А = Р (F/Ho), где Р (F/Hi) и Р (F/Ho) — функции (условные плотности распределения) прав- доподобия соответственно при наличии и отсутствии сигнала, и в сравнении А с порогом Ао = 1. По формуле Байеса от вычисления коэффициента правдоподо- бия можно перейти к вычислению вероятности гипотезы о наличии 258
сигнала, т. е. от вероятности Р (FjH^ к вероятности р (HJF), иначе, к обратной вероятности. Именно поэтому рассматриваемый прием обработки данных получил название способа обрат- ных вероятностей, поскольку результатом обработки является получение апостериорных (обратных) вероятностей на- личия сигнала. При равных априорных вероятностях наличия сигнала (гипо- теза Hj) и его отсутствия (гипотеза Но), т. е. Po~Pi~ 0,5, со- гласно формуле Байеса (8.9) получаем: р (Hi/F) = (Р1/р0) Л/[(Р1/р0) Л + 1] =Л/(Л + 1). (8.32) С учетом (8.32) правило принятия решения по критерию максимального правдоподобия будет следующим: при p(//1/F)>0,5— есть сигнал; при p(HilF)<0,5—нет сигнала, так как порог приня- тия решения Ло=1. 4. *Построение и анализ алгоритма обнаружения. Для случая некоррелированной помехи нормального типа с нулевым средним и дисперсией о2 согласно выражениям (8.16) и (8.17) была полу- чена формула для вычисления коэффициента правдоподобия ((8.19) в виде / . т 1 т \ (833> Если теперь заданный сигнал sx, . . . , sm перемещать вдоль профиля наблюдений как весовую функцию линейного фильтра, получим распределение коэффициента правдоподобия по профилю (, т 1 т \ (8-34) 2аа «=1 a2 £=i / где индекс / характеризует смещение сигнала вдоль профиля от пикета к пикету. Согласно критерию максимального правдоподобия для тех пи- кетов, где Л/>1, будем принимать решение о наличии сигнала, а по формуле Байеса (формуле обратных вероятностей) решение о наличии сигнала принимаем по величине апостериорной вероят- ности рДЯ1/£)>0,5, (8.35) где p/(/f1/F) = Ay/(Ay+ I)- В основном алгоритме обнаружения (8.34) первый член под знаком экспоненты представляет собой энергетическое отношение сигнал/помеха р и при вычислениях остается неизменным; второй член является сверткой, обеспечивающей фильтрацию исходных данных, т. е. сам процесс обнаружения, по критерию максимума пикового отношения сигнал/помеха. Весовой функцией при этом служат ординаты сигнала, нормированные на дисперсию помехи о2, т. е. hi = st/o2. Следовательно, в алгоритме обнаружения сигнала (8.34) и (8.35), полученном на основе проверки статистических ги- 9* 259
потез, с одной стороны, обеспечивается оптимальная согласован- ная фильтрация исходных данных, с другой — возможность вы- числения апостериорной вероятности наличия сигнала, т. е. из- влечение максимума информации о полезном сигнале. Рассмотрим реализацию алгоритма (8.34) — (8.35) на числовом примере. Пусть исходные данные представлены 12 значениями: fi = — 2, — 2, О, 2, — 1, 3, 2, 1, —2, 0, 1, —2. Среднее значение f = 0, а дисперсия оа = 3. Пусть сигнал задан ординатами s/ = 1, 2, 4, 2, 1. Очевидно, его энергия £«2 = 26, а энергетическое отношение сигнал/помеха р = Y.s2/o2— = 8,67, что соответствует достаточно высокой надежности обнаружения сигнала по критерию максимального правдоподобия (см. рис. 59) 93 %; р/2 = 4,34. Нахождение корреляционных сумм в (8.34) <р = (l/o2) прово- дится согласно схемы: ' Mi Ml f&a Ма ftsz s8 = Ms’ = Ms’ 2б = ИТ-Д- ftst Мб м« fbSt> . Ms Ms Фз = 2 3/аа; ф4 = 24/оа; ф6=26/аа и т. д. Расчет апостериорной вероятности (8.35) с учетом (8.34) сведем в табл. 24. Таким образом, решение о наличии сигнала следует принять лишь для ПК 6, для которого вероятность р/ (Hi/F) > 0,5. Таблица 24 пк Ф/=2)/°2 —р/24-фу лу=ехр(_р/2+ф/) P/=A;./(A/+l) 3 —4 —1,33 —5,87 0,00 0,00 4 7 2,33 —2,01 0,13 0,12 5 7 2,33 —2,01 0,13 0,12 6 17 5,67 1,33 3,78 0,79 7 13 4,33 —0,01 0,99 0,50 8 7 2,33 —2,01 0,13 0,12 9 —3 —1,00 —5,34 0,00 0,00 10 —3 —1,00 -5,34 0,00 0,00 Обнаружение заданного по форме сигнала на фоне коррелиро- ванных помех включает те же самые процедуры, что и в случае не- коррелированных помех. Отличие состоит в том, что для описания статистических свойств помех требуется оценка корреляционной матрицы Rn (т—i) по ее АКФ. Алгоритм обнаружения при этом сводится к вычислению коэффициента правдоподобия: A^exp^-^-S/ifSi + S/iJ;.^, (8.36) где весовые коэффициенты hi являются решением системы линей- ных уравнений YfaRn (tn—i) = s (— /и), т. е. определяются аца- 260
логично согласованному фильтру. Величина ^h{Si в (8.36) опреде- ляет энергетическое отношение сигнал/помеха, а второй член пред- ставляет собой свертку, обеспечивающую фильтрацию данных по критерию максимума пикового отношения сигнал/помеха. Решение о наличии сигнала принимается при Л/>1 или при Pj (Я1//г)>0,5 [см. формулу (8.35)]. Пример обнаружения сигнала на фоне коррелированной помехи с треугольной функцией автокор- реляции приведен на рис. 51 (интервал корреляции гКоР = 3), Энергетическое отношение сигнал/помеха для этого примера р = = sWakopO2 = 5,5. 5. Оценка качества обработки. Завершающим этапом любой обработки является оценка ее качества. К оценке качества в способе обратных вероятностей отнесем надежность обнаружения, оценку параметров сигнала и величину разрешающей способности алгоритма. Надежность обнаружения оценивается по величине энергетического отношения сигнал/по- меха р, которая еще до начала обработки может быть получена из расчета ВКФ данных соседних пар профилей s2/o2 = = Вя (тэ)/11—Вя (/Пэ)] и нахождения интервала корреляции сиг- нала по АКФ- Анализ надежности обнаружения, в частности, с ис- пользованием критерия максимального правдоподобия показы- вает, что возможности обнаружения слабых сигналов вдоль оди- ночных профилей ограничены: вдоль профиля можно провести на- дежное обнаружение (у > 95 %) сигнала, по интенсивности соиз- меримого с помехой s2 = о2, лишь при достаточной его протяжен- ности (/и > 10). Для оценки параметров сигнала используются следующие вы: ражения. Оценка амплитуды сигнала после фильтрации = (8-37) Дисперсия этой оценки (8.37) при р > 1 есть величина, обрат- ная энергетическому отношению сигнал/помеха: Da = оя = ± 1/д/Р- (8.38) Из выражения (8.38) следует важный практический вывод о том, что возможности интерпретации слабых сигналов (аномалий) весьма ограниченны. Действительно, для проведения количественной ин- терпретации требуется знание амплитуд аномалии с погрешностью не более 10 %, т. е. — ± 0,1, следовательно, р должно быть при этом не менее 100. Для оценки протяженности сигнала (аномалии) получить явное выражение трудно, можно лишь воспользоваться формулой (8.38) соответственно для дисперсии и среднеквадратического отклонения протяженности /пА, когда сигнал задан в форме прямоугольного импульса (а~ = ± 1/д/р)- Оценка положения сигнала на профиле сводится к определе' н^ю его центральной точки х0 по максимальному значению коэффи* f 261
циента правдоподобия Лу (при Лу> 1) или по апостериорной ве- роятности pj (при >0,5). Дисперсию оценки положения центральной точки сигнала можно найти по приближенным формулам: Dz = 2 (mA)2/p2; = ± д/2тЛ/р, (8.39) где т — ширина прямоугольного импульса, совпадающего по энер- гии с искомым сигналом. Очевидно, что при р — 10 и т = 10 (s2/o2 = 1; т = 16) средне- . квадратическая погрешность оценки местоположения сигнала о~ = ± д/2 = 1,4Д, т. е. местоположение слабых сигналов устанавливается достаточно точно. Возможности разрешения двух близко расположенных по про- филю сигналов оцениваются с позиции решения задачи о разли- чении сигналов, при которой гипотеза Н± является гипотезой о наличии сигнала slt т. е. когда ft = s1( + nit а гипотеза Но — ги- потезой о наличии сигнала s2, т. е. когда = s2i + Тогда ко- эффициент правдоподобия Г 1 т Л = ехр (52г-й)4 L2aa i m 1 (8.40) Основная операция в алгоритме (8.40) — получение величины <р = У, (sXi—s2() fi, нахождение ее статистических характеристик При условии равенства энергий сигналов Esl = ES2 (т. е. psl = = pS2 = р) и априорных вероятностей psi — pS2 = 0,5 приводит к надежности различения по критерию максимального правдопо- добия в виде ? = O(V2p(l-/-12)/2), (8.41) где г12 = EsxrSa/ZffqOsj — коэффициент корреляции, между sx и s2. Безусловная вероятность ошибки различения сигналов будет q = 1—у. Наибольшей ошибкой различения при одинаковом от-, ношении сигнал/помеха обладают сигналы, для которых коэффи- циент корреляции г12 максимален. Так, для одинаковых по форме сигналов r12 = 1 и при р = 10 из (8.41) следует, что у = 50 % и q = 50 %, т. е. сигналы неразличимы. В то же время для оди- наковых по форме, но противоположных по знаку сигналов г12 — = — 1 и при р = 10 из (8.41) у « 100 %. § 41. СПОСОБ МЕЖПРОФИЛЬНОЙ КОРРЕЛЯЦИИ Площадная съемка ведет к увеличению информации о полезном сигнале при его корреляции по нескольким профилям и вследствие этого расширяет возможности выделения слабых сигналов. Рас- смотренные^в § 40 алгоритмы обнаружения допускают обобщение и на двумерный случай. Выделение двумерных сигналов, или ано- малий, приводит к возможности решения принципиально новой задачи — разделению интерферирующих между собой аномалий, 262
т. е. когда аномальные эффекты от объектов, различающихся своим простиранием, накладываются друг на друга и наблюдаемые поля приобретают сложный интерференционный характер. Накопление аномальных эффектов за счет использования наблюдений по пло- щади позволяет обнаруживать и выделять сигналы при минимуме априорной информации о сигнале и помехах. Как следует из анализа характеристики надежности обнаруже- ния (см. § 39), повышение надежности сигнала у связано не только с увеличением числа т, но и с увеличением независимых наблюде- ний за счет числа профилей N, по которым прослеживается сигнал. Алгоритм способа межпрофильной корреляции аномалий вы- текает из решения задачи обнаружения заданного по форме сиг- нала, прослеживаемого по N профилям, на фоне некоррелирован- ных (как вдоль профилей, так и между ними) помех с дисперсией о2. При такой задаче сравнивается гипотеза Нг о том, что многомер- ный вектор наблюденного поля Fb.. N содержит и сигнал, и по- меху, с гипотезой Но о том, что тот же вектор наблюденного поля Fi,,,n содержит только помеху. Вследствие условия некоррелированности помехи между про- филями гипотезам Нг и Но соответствуют следующие функции правдоподобия: Р (Fi. . . jv/Hi) = Р (Fi/Hj . . . Р (FM- P(Fi... n/H0) = Р (Ft/H0) . . . Р (Fn/H0), (8.42) где Fi...л — матрица из наблюденных значений поля fkt, состоя- щая из N строк и т столбцов, где т — протяженность сигнала по каждому из профилей, причем fki = ski + Пн для гипотезы и fkt — nki — Для гипотезы Но. Входящие в (8.42) функции правдоподобия по отдельным про- филям определяются формулами (8.16) и (8.17), на основании ко- торых для (8.42) получаем: P(F,. . .N/HJ = т- -—ехр Г--J-SS^-s^)2!; cmN (2л)тЛ2 L 2аа k i J ~ (8.43) P(Fb..»/H.)= >(^..rap(--X-??ft). (8.44) Отсюда коэффициент правдоподобия A = P(F1...N/Hl)/P(F1...N/H0) = ==exp(-ib_??s‘‘+ ±№4 (8,45) Если ввести индексы / для смещения сигнала вдоль профиля и р для смещения сигнала между профилями, рабочий алгоритм 263
для вычисления Л примет вид: Лр/=ехр( —--±-£ Zskifp-k.j-iy (8.46) где т — четное; I — оценивает смещение центральной точки сиг- нала от профиля к профилю, I = 0; ±1; ± 2, . . . , (N + 1)/2 < < р < М — (N—1)/2; М — общее число профилей. Первый член под знаком экспоненты в (8.46) определяет энер- гетическое отношение сигнал/помеха в окне из Ntn точек, а второй член — представляет двумерную свертку, обеспечивающую филь- трацию исходных данных путем расчета двойной корреляционной суммы <рр/ наблюдаемых значений поля fkl с заданным по форме двумерным сигналом sftj. По формуле Байеса нетрудно от вычисления по (8.46) перейти к вычислению вероятности наличия сигнала по (8.35). Однако по- стараемся из (8.46) извлечь алгоритм обработки при отсутствии сведений о форме сигнала. Если двумерную свертку в (8.46) за- писать в виде Фр/= * (8-47) о i k то при отсутствии сведений о форме сигнала для его выделения ограничимся лишь результатом суммирования данных по несколь- ким профилям, т. е. нахождением сумм (8-48) Выражение (8.48) отражает межпрофильное суммирование ис- ходных данных и в принципе обеспечивает оценку формы сигнала, если помехи остаются некоррелированными. При таком суммиро- вании интенсивность помехи возрастает в aJN раз, а амплитуда сигнала возрастает в N раз. Общий выигрыш в отношении сигнал/помеха получается b^N, раз, причем он достигается лишь при суммировании в направлении корреляции сигнала (простира- ния аномалии). Величина смещения /, т. е. смещение центральной точки аномалии от профиля к профилю, определяется по экстре- мумам ВКФ данных соседних пар профилей. Поскольку ВКФ для каждого смещения I = 0; ± Ах; ± 2Ах; . . . представляет собой выборочный коэффициент корреляции, величина Вя (Z) будет на- дежной, если превышает двойную — тройную ошибку ее опреде- ления, т. е. oBh = [1-Bh(0]/V^> Надежные оценки Вя (/) получаются в тех случаях, когда имеется несколько аномалий (сигналов) одного и того же прости- 264
рания, либо одиночные аномалии с большой энергией. Поэтому способ межпрофильный корреляции в основном эффективен при выделении и разделении групп аномалий одного и того же прости- рания. Для решения задачи разделения аномалий должно наблю- даться несколько надежных экстремумов ВКФ, причем доверитель- ный интервал для смещения I определяется дисперсией вида, (А. К. Яновский) Dt = 2 [1 — В2 (/,)] Гкор Ах/пАх®2Вн (/,), (8.49) где Гкор — интервал корреляции, /-Кор = (т) dm\ (т) — нормированная АКФ;<о = (оо+ Асо; ®0 — частота максимума спектра аномалии; А® — среднеквадратическая частота спектра. Разрешающая способность алгоритма межпрофильной корреля- ции связана с надежностью оценивания величины Вн (/) и самого смещения I. В случае наложения аномалий, различных, но близких по про- стиранию, получается расплывчатый экстремум ВКФ. Для более точной оценки смещения I, характеризующего направление каждой аномалии, требуется расчет ВКФ для данных, расположенных через профиль, два профиля и т. д. Обработка данных по способу межпрофильной корреляции вклю- чает следующие процедуры: 1. Расчет нормированных ВКФ для данных соседних пар про- филей Вн (/). Максимальное смещение /тах при вычислении ВКФ должно соответствовать максимально возможному смещению ано- малий от профиля к профилю. Величина 1тзх обычно не менее пяти и, как правило, не более 15 дискретов. 2. Определение смещения 13 по положительным экстремумам ВКФ с оценками значимости Вн (/э) и дисперсией величины /9 по (8.49). Обычно ВКФ имеет не более трех экстремумов. В случае расплывчатых экстремумов ВКФ, когда достоверная оценка ве- личины 13 затруднена, следует провести вычисление ВКФ для данных, расположенных через профиль или через два профиля. Расплывчатые экстремумы обусловлены интерференцией аномалий близкого простирания или широкими аномалиями. Расчет допол- нительн'ых ВКФ позволяет уточнить величину смещения для каж- дой интерферирующей аномалии. Если экстремум ВКФ не разде- ляется на два, его расплывчатость объясняется широкой аномалией. 3. Задание направлений суммирования и выбор базы суммиро- вания. Направления суммирования задают по результатам оценок 13 по ВКФ с учетом доверительного интервала 13 ±о/э и значимости Вв (Z9). Обычно величина о/э — не менее шага съемки по профилю, поэтому разброс значений 13 в пределах одного пикета можно не учитывать. Вычисление нормированных ВКФ дает возможность оценить отношение сигнал/помеха $2/ст2 = Вя (Z9)/[l—В„ (13)], что, в свою очередь, позволяет найти базу суммирования А/, т. е. число профилей для дальнейшего суммирования, с учетом заданной на- дежности у по (8.30). 265
При s4/o2 = 1, Вн (/э) = 0,5 обычно достаточно принять N = 3, поскольку протяженность аномалии по профилю т > 5, что в це- лом обеспечит надежность обнаружения аномалии по критерию максимального правдоподобия у > 97 % (р> 15). Лишь для очень узких аномалий (при т = ЗА) надо выбирать N > 5. При s2/oa<; 1, когда Вн (/э) = 0,3-j-0,4, N > 5 4-7. Число профилей больше девяти даже в случае съемок крупного масштаба задавать не имеет смысла. 4. Нахождение сумм вида (8.48) по каждому заданному направ- лению суммирования. Так, при /э = А, что соответствует смеще- нию аномалии в один пикет и базе суммирования N = 3, схема вычислений имеет вид fsi fai /зг fu + faa + f 33 f 12 + faa + /з4 fai fn fit fai + /32 + f43 f 22 + f 33 + f 44 и т. д. fin—3 + /2П-2 + /ЗП-1 fin—2 + /гп-1 + /зп fln-1 fin fin fin-3 + fan-2 + fin-1 _ fan—2 + fan-i + fm fan-i fan fan Полученные суммы на приведенной схеме отмечены квадрат- ными скобками. Результаты суммирования относятся к среднему из суммируемых профилей. При этом часть информации теряется (по одному, двум значениям с каждого конца профилей). Для при- ведения масштаба данных суммирования к исходному результаты суммирования следует разделить на N. 5. Выделение аномалий и аномальных зон по коррелируемым особенностям суммарного поля. При этом надежными аномалиями следует считать лишь те, которые коррелируются по числу профи- лей, превышающему базу суммирования. Аналогичный алгоритм заложен в сейсморазведочных методах регулируемого направлен- ного приема и общей глубинной точки. Однако выбор направления суммирования с учетом экстремумов ВКФ повышает надежность разделения сигналов. Для оценки разрешающей способности межпрофильной корре- ляции следует воспользоваться обобщенной характеристикой на- правленности (6.75). Разделение аномалий магнитного поля Za, обусловленных, с одной стороны, контактами пород, а с другой — тектоническими нарушениями, по способу межпрофильной корреляции проиллю- стрировано на рис. 60. 266
Bt.14 Рис. 60. Результаты обработки поля Za способом межпрофильной корреляции. а — исходные данные Za; б — функции взаимной корреляции; результаты суммирова- ния по пяти профилям: а — северо-восточного простирания, е — северо-западного про- стирания; 1 н 2 — смещение осей аномалий; 3 — зона пониженных значений поля
На рис. 61 приведена геологическая карта участка с результа- тами статистической обработки. Исходные данные магнитного поля приведены на рис. 60, а. Сеть съемки 250 X 50 м. Точность наблю- дений ± Ю нТл. Графики поля Za свидетельствуют о его сложном характере. Какие-либо четкие аномальные зоны, связанные с кон- тактами различных пород, с тектоническими нарушениями, харак- терными для местных геологических условий, выделить трудно. Построение ВКФ (см. рис. 60, б) позволило зафиксировать два основных направления аномалий: северо-восточное и северо-запад- ное. Дальнейшее суммирование исходных данных в пределах пяти Рис. 61. Геологическая карта с результатами статистической обработки. 1 — разломы; 2 — контакты пород; 3 — порфириты; 4 — конгломераты; 5 — песчаники; 6 — алевролиты; 7 — яшмы; 8 — кремнистые сланцы; 9 — осн геофизических аномалия, выделенные по результатам обработки профилей вдоль установленных направлений аномалий (см. рис. 60,в и а) дает возможность обнаружить отдельные аномалии и аномаль- ные зоны, проследить характер их изменения по площади. На рис. 60, в четко выделена зона отрицательных значений Za, кото- рая хорошо увязывается с областью распространения порфири- тов на геологической карте. Помимо этой зоны уверенно прослежи- ваются две положительные аномалии северо-восточного простира- ния, из которых одна приурочена к разлому того же простирания, а другая — к контакту песчаников и яшм. На рис. 60, г также четко выделяются две аномалии. Одна совпадает с установленным тектоническим нарушением северо-западного простирания, другая, более интенсивная,— фиксирует нарушение, подтвержденное в дальнейшем при тщательном изучении керна картировочных сква- жин. .268
§ 42. СПОСОБ АДАПТИВНОЙ (САМОНАСТРАИВАЮЩЕЙСЯ) ФИЛЬТРАЦИИ Рассмотренный способ межпрофильной корреляции эффективен в тех случаях, когда можно рассчитывать на наличие нескольких аномалий одного и того же простирания, либо широких аномаль- ных зон. При этом слабые одиночные аномалии, отличающиеся по своему направлению от превалирующих, не будут выявлены. Одним из наиболее эффективных приемов выделения слабых сиг- налов при минимуме априорных сведений о форме сигнала в общем случае является способ адаптивной (самонастраи- вающейся) фильтрации. Под адаптацией, самонастрой- кой, понимается «приспособляемость» алгоритма обработки к из- менению свойств сигнала (его формы и параметров) и помех, в ча- стности к изменению дисперсии помех о2. Оценка этих свойств производится непосредственно в процессе обработки. Получение подобных оценок возможно лишь по данным площадных наблюдений, когда имеется уверенность в корреляции сигнала по нескольким профилям. При использовании адаптив- ных (самонастраивающихся) процедур обработки (см. также § 43) основное значение приобретают критерии многомерного статисти- ческого анализа. Рассмотрим применение одного из таких крите- риев, содержащего алгоритм решения задачи обнаружения сигна- лов на фоне помех и их разделения по различным направлениям. Эта задача формулируется следующим образом. Пусть имеются данные геофизических наблюдений F по пло- щади в виде двумерного массива fki, где k — номер профиля, i — номер пикета на профиле. Положим, что поле F представляет собой аддитивное наложение некоррелированных нормально рас- пределенных помех на совокупность неизвестных по форме сигна- лов различного направления. За сигнал принимается любой ре- гулярный процесс с математическим ожиданием, не равным нулю, процесс регистрируется по нескольким профилям (трассам) с ли- нейным смещением (или без смещения) от профиля к профилю, Рассмотрим в поле F окно, включающее N профилей и т точек по каждому профилю, т. е. определяющее матрицу размером fk+l, t+l> fk+l, t+2> • • • , fk+l, l+mi fk+2, i+1+0, fk+2, /+2+0, • • • » fk+2, i+m+0, fk+N, /+1+0Л» fk+N, /+2+0ЛП • • • , fk+N, i+m+eN- Индексы k + 1, i + 1 указывают на положение левого верхнего угла выбранного окна, 0 — его наклон к простиранию профилей, определяемый величиной смещения на один (0 = 1), два (0 = 2) пикета и т. д. последующего профиля относительно предыдущего; 0Г<; 0< 02; 0 = 0, ± A, ± 2А, . . . Величины 0Х и 02 задаются интерпретатором в зависимости от возможных направлений сигна- 269
лов. Наибольшая величина 0, т. е. 02, отвечает максимально воз- можному углу, образуемому направлением осей сигналов с направ- лением профилей. С изменением индексов I и k связывается пере- мещение окна соответственно по простиранию и вкрест простира- ния профилей. Задача состоит в том, чтобы получить оптимальный для неко- торого критерия алгоритм обработки в указанном окне и решить, является ли соответствующий ему участок съемки аномальным или безаномальным. Не уменьшая общности, рассмотрим окно в левом верхнем углу матрицы F при 0 = 0, относительно которого и проведем необхо- димые рассуждения. Таким образом, имеет место матрица вида /н» flit • • • , flm F (2V, т, 0 = 0) = fiit fiit • • • t fim -f Nit fxz • • v t f Nm - (8.50) Допустим, что в пределах окна дисперсия помехи изменяется незначительно, т. е. оы = о2. Тогда векторы-строки матрицы (8.50) имеют /n-мерное нормальное распределение с векторами средних значений flt . . . , fN и одинаковыми корреляционными матрицами D = о21, где I — единичная матрица. Иначе говоря, = /11, . . . , fim) — вектор-строка распределена нормально с параметрами (/lt D); In = Owi> • • • » fwm) — вектор-строка распределена нор- мально с параметрами (fN, D). В пределах окна (8.50) возможны три случая. 1. Участок поля внутри окна является безаномальным, т. е. f! = . . . = fN и векторы-строки Д распределены соответственно с параметрами (0, D). Это гипотеза Но. 2. В окне присутствует аномалия, но ее направление не совпа- дает с наклоном окна . В этом случае векторы-строки распреде- лены с параметрами (fk, D), причем Это гипо- теза Н}. 3. В окне имеется аномалия и ее направление совпадает с на- клоном окна, т. е. /\ == /2 =_. . . = fN = f и векторы-строки fk распределены с параметрами (/, D). Это почти нулевая гипотеза Н*о, Последний случай соответствует сохранению формы и парамет- ров аномалии (сигнала) от профиля к профилю. В первом и третьем случаях все строки матрицы (8.50) являются выборками одного и того же вектора. Решение о наличии первого и третьего случаев заключается в проверке нулевой гипотезы Но о том, что векторы средних значений векторов-строк равны: h = fa = . . . = fN —f. Гипотеза Но легко сводится к чисто нулевой гипотезе Но путем —> —* образования (N—1) новых векторов гъ ... , где векторы 270
z = fk-i — fk распределены с параметрами (0, D*). Следовательно, гипотеза Но состоит в том, что все векторы zft имеют нормальное распределение с параметрами (О, D*) и при ее проверке мы отде- ляем первый и третий случаи от второго. Задача отделения первого случая от третьего решается как проверка гипотезы Но о том, что векторы-строки Д распределены с параметрами (0, D), в то время •*> как для гипотезы Hi векторы-строки Д распределены с парамет- рами (f, D). Остановимся на задаче проверки гипотезы Но. Для этой проверки в теории статистических решений существует кри- терий, основанный на ^-статистике Хоттелинга: Т2 = A7'R-1/, f = (Д, . . . , fm) — оценка вектора математических ожиданий, причем 1 N h=-^-Zfki, (8.51) I?-1 — обратная корреляционная матрица помехи. В нашем случае R = D — о21 и к = = (8's2> Отсюда tn Т* =--------------^4------------- (8.53) ----!-----2 Е ki Гипотеза Но принимается, если 7’2<Та(7'а — порог принятия решения при заданной вероятности ошибки первого рода), и от- вергается если T22>7t- С учетом (8.51) перепишем формулу (8.53) в виде m / N m z=i \ N J 1 и> = (8.54) N m / N у n ES(f«—— Е(«) m(N— 1) л=1 t=i \ Л/ й / Величина w в случае выполнения гипотезы Но (отсутствие аномалии в окне) имеет так называемое центральное F (0, qlt ga)- распределение с qt = m и q2 = m (N—1) степенями свободы, а в случае выполнения гипотезы (наличие, аномалии в окне) — нецентральное F (b, qlf «/^-распределение с теми же степенями свободы qr и q2 и параметром нецентральное™ b = N^gla2, (8.55) 271
где si — компоненты вектора аномалии (сигнала) _ N Sl = (UN) Y Ski. k=i Если провести анализ выражения (8.54), нетрудно увидеть, что при наличии аномалии числитель с точностью до множителя, равного N, представляет собой оценку среднего квадрата ампли- туды сигнала в окне размером mN. Для нахождения этой оценки сначала следует усреднить наблюденные значения fk{ по N профи- лям согласно (8.51), а затем вычислить их средний квадрат ампли- туды вдоль профиля по т точкам, т. е. - т f N \2 S2=— (8.56) т i=\ \ N fe=i / . Знаменатель (8.54) выражает оценку дисперсии помехи в том же сжне. Для ее получения из наблюденных значений fki следует —мячбсть усредненные по N профилям значения поля, а результат возвести „в квадрат и усреднить, т. е. N т f N & = -Tv % Е Е fkJ • (8.57) m(N — 1) i=i \ N k=\ / Таким образом, выражение (8.54) в случае наличия аномалии (сигнала) в окне с точностью до множителя N представляет собой оценку отношения среднего квадрата амплитуды аномалии к дис- персии помех, т. е. если р, = sVo2, то w — N\k (8.58) Основной алгоритм адаптивной фильтрации сводится к вычис- лению оценки отношения сигнал/помеха ц в окне, состоящем из mN точек: N т / N v ' -———т— Ё Ё (/« —— Ё fki) m(N — V) k-ii=i\ N Л=1 / С величиной ц. непосредственно связан параметр нецентраль- ное™ (8.55) для нецентрального F (b, qlt q2)-распределен и я b = Nmp. (8.60) Для принятия решения о наличии аномалии, т. е. гипотезы Hlt необходимо выбрать порог d: при W>d (р>рпор) следует прини- мать решение о наличии аномалии, а при W<Zd — решение об от- сутствии аномалии в окне (гипотеза Но). Для нахождения порога используем критерий Неймана—Пирсона, т. е. порог d будем уста- 272
навливать путем задания вероятности ошибки первого рода а, где ОО а = J PF(0.q„q2)(X)dx’ PF (01 ff2) (х) обозначает плотность центрального /•'-распределения. Для а = 1 и 5 % значения порога d приведены в табл. 25. Таблица 25 (N—1)т т 5 7 9 15 20 а = 1 % 10 5,64 5,20 4,94 4,56 4,40 15 4,56 4,14 3,89 3,67 3,37 20 4,10 3,70 3,46 3,23 2,94 30 3,70 3,30 3,07 2,84 2,55 60 3,34 2,95 2,72 2,50 2,20 а = 5 % 10 3,33 3,14 3,02 2,84 2,77 15 2,90 2,71 2,59 2,40 2,33 20 2,71 2,50 2,39 2,20 2,12 30 2,53 2,33 2,21 2,01 1,93 60 2,37 ' 2,17 2,04 1,84 1,75 Соответственно для (8.59) пороговое значение цПоР = d/N. Надежность обнаружения аномалии (при W^>d) по критерию Неймана—Пирсона определяется как у = 1—Р, где р — вероят- ность ошибки второго рода; d Р — f PF (6, qt. q2) (*) dx, Pp ((,, (?11 —00 —плотность нецентрального F-распределения. Примеры характе- ристик обнаружения сигнала для заданных значений т и N при- ведены на рис. 62. Из графиков рис. 62 следует, что при фиксированных ц. и т надежность обнаружения резко возрастает с накоплением ано- мального эффекта по N профилям. Надежное обнаружение (с ве- роятностью у >95 %) для аномалий, соизмеримых по интенсив- ности с уровнем помех, s2 = о2 возможно для нешироких аномалий (т = 5-5-7 А) при накоплении аномального эффекта не менее чем по пяти профилям; для аномалий с т = 9 и 11 такая надежность достигается при N = 3 (а = 5 %). Естественно, что возможности накопления сигналов в сейсморазведке гораздо шире, чем в дру- гих'методах. Известны примеры выделения слабых сигналов, когда в накоплении участвовало 600 каналов. 273
Существенное значение имеет выбор размеров окна. В сейсмо- разведке размер окна по времени определяется периодом сигнала. Так, при частоте fs = 40 Гц период составляет 0,025 с. Число N обычно выбирают не менее 12. При обработке данных потенциаль- ных полей размер окна оценивается путем построения двумерной АКФ исходных данных. В ряде случаев целесообразно проводить обработку при разных размерах окна. Рис. 62. Характеристики обнаружения сигнала адаптивным фильтром, а в %; а — 5, 6 — 1; значения т: 1 — 5. 2 — 7 Адаптация алгоритма обработки (8.59) связана с перемещением окна сначала вдоль профилей с шагом, равным расстоянию между пакетами, а затем вкрест простирания профилей с шагом, равным расстоянию между профилями. Для каждого такого смещения вы- числяется отношение сигнал/помеха ц или статистика W. При этом получается непрерывная оценка ц (или W) по всей площади съемки. При р.>рПор (W>d) принимается решение о наличии аномалии. Совершенно аналогичные вычисления осуществляются в пределах окон с различными значениями 0. Подобный анализ позволяет, с одной стороны, выделить аномалии на фоне помех, с другой — провести их классификацию по разным направлениям. Как следует из выражения (8.59), величина ц. находится лишь по наблюденным значениям поля, априорные сведения о форме аномалии при этом не привлекаются. Форма и параметры аномалии могут изменяться в пределах съемки существенно. Для принятия решения о наличии аномалии важно лишь, чтобы ее энергия превосходила дисперсию помех. Изменения формы аномалии и дисперсии помех раздельно не сказываются на конечном результате обработки, поскольку в алгоритме существенна лишь достаточно большая величина отно- шения сигнал/помеха, т. е. р.2>ц.ПоР- На рис. 63 приведены результаты обработки модельных данных адаптивным фильтром. На случайную реализацию, состоящую из 274
50 значений, в пределах каждого профиля наложены две аномалии, местоположение которых указано на рис. 63, а. Одна аномалия знакопеременная и задана с положительным смещением от профиля к профилю на один пикет (0 = 1), другая — отрицательная со смещением 0 = — 3. Обе аномалии соизмеримы по интенсивности с уровнем помех и визуально не прослеживаются. Обработка по алгоритму (8.59) с учетом выбора порога по (8.58) включала вычис- ления р. для окон N = 5 и т ~ 7 с наклонами 0 = 0; ± Г, ±2 и ± 3. Результаты обработки приведены на рис. 63, б в виде гра- фиков р>|лПор = 0,66 (Цпор = d/N = 3,30/5 = 0,66, см. табл. 25). Надежность обнаружения обеих аномалий, если положить для них р. = 1, составляет приблизительно 95 % (см. рис. 62, б). Таким образом, обработка данных по алгоритму адаптивной фильтрации позволяет уверенно проследить обе аномалии даже в местах их перекрытия. На рис. 63, б выделена также ложная аномалия: 0 = — 2, совпадающая по местоположению с аномалией при 0 = — 3. Эта ложная аномалия по простиранию меньше числа профилей М заданного окна и ее отбраковка не представляет труда. Из рассмотрения вопросов по разрешающей способности адап- тивной фильтрации следует, что определяющим при ее оценке яв- ляется исследование параметра нецентральности Ь. Это рассмотре- ние показывает, что выделение знакопеременных аномалий прово- дится более «чисто», чем знакопостоянных. Для знакопостоянных аномалий со значениями р > 1 происходит выделение ложных осей, простирание которых близко к истинному в пределах 0 = = ± Д, с достаточно большой вероятностью. Примером могут слу- жить результаты обработки модельного материала на рис. 63, б, где зафиксирована ложная аномалия с направлением оси, близким к истинному. Поэтому в практике обработки следует задавать зна- чения 0 = 0; ± 2Д; ± 5Д. Максимальная величина 0 опреде- ляется углом 45° относительно простирания профилей. Если этот угол больше 45°, сеть профилей должна быть повернута на 90°. В качестве примера реализации алгоритма (8.59) приведем схему вычислений ц при параметрах окна т = 5; N = 3; 0 = 0. Исходная матрица значений поля в окне имеет вид /11 /12. /13 /14 /15 . /21 /22, /23 /24 /25 /з1 /з? /зз / 34 /зь Оценка формы аномалии проводится путем суммирования зна- чений поля без смещения между профилями, так как 0 = 0. Ординаты аномалии в окне, если она имеется, будут: si= ~7~ (/11 + /21+/31); О / Sa = —(/12 + /22 + /за); О 275
Рис. 63. Результаты обработки (б) модельных данных (а) адаптивным фильт- ром. / — сумма сигналов и помех; 2 — форма аномалий и нх местоположение; значения ц для наклонов окна*. 3 — положительного, 4 —• отрицательного. Параметр кривых — значения 0
S3 — ""T-(f 13 Т f 23 Н-f зз) > О s4 — —5- (/14+/24+/34); Sb = (fib + f25 + /зб) • О Далее вычисляется средний квадрат ординат аномалии s2 = . 5 =------Для оценки дисперсии помехи требуется найти разно- 5 1 сти: /11--S1 fli--Si /13 S3 fl4-S4 /16 Sb‘, hi — Sj hi — ®2 /28—S3 hi—S4 h5 — sB; hi—si hi—s2 /зз—S3 /34 — s4 fsB—s5. Путем возведения этих разностей в квадрат с последующим сум- мированием и нормировкой на (N—1) /п=2-5= 10 получим оценку дисперсии помехи, т. е. 1 3 6 Величина ц = s2/o2 относится к центральному пикету окна, т. е. к точке 2, 3. Затем окно перемещается на один пикет по про- стиранию профилей и аналогичному анализу подвергается уже матрица /12 /13 fit fib fi» fit hi f 24 fib f 2» hi /зз /34 ha fat- При этом величина ц = s2/o2 будет отнесена к точке 2, 4, После завершения вычислений ц по первым трем профилям окно сме- щается на один профиль и анализу подвергается матрица hi fn faa fu f 25 hi ha ha fat fse /41 /42 /43 fu fib- Полученное значение ц относится к точке 3, 3 и т. д. Способ адаптивной фильтрации нашел широкое применение при выделе- нии слабых эффектов, связанных с нефтегазоносностью разреза, по сейсмическим данным, а также для прослеживания контактов и тектонических нарушений при обработке данных гравитацион- ных съемок. 277
FvV FT7]? Fvh FF7U |д|* Ш7 PvTk Ш} 1^1/g Рис. 64. Геологическая схема с осями аномалий р.. 1 — альбититы; 2 — плагиограниты; 3 и 4 — мигматиты соответственно бнотнт-плагно- клаэовые н плагноклазовые; 5 — диабазы; 6 — пегматиты; 7 — гнейсы; S — геологи- ческие границы; 9 — тектонические нарушения по геологическим данным; а — установ- ленные, б — предполагаемы; 10 — оси аномалий ц, определенные путем адаптивной фильтрации На рис. 64 приведена геологическая схема одного из участков Северного Криворожья с выделенными осями аномалий ц., полу- ченными в результате обработки данных магнитной ^ъемки (рис. 65) адаптивным фильтром. Для выбора параметров обработки — раз- меров и наклонов окна — была использована двумерная АКФ исходного поля (см. рис. 17). Рельеф ДАКФ показывай» что кор- реляция практически пропадает (коэффициент коррел^ии <0,3) на расстояниях 5—7 пикетов (т) и 4—5 профилей (N) бт ее центра. Таким образом, при обработке наиболее подходящими размерами окна mN следует считать 5 X 5 и 7 X 5. Рельеф ДАКФ отмечает 278 '
Рис. 65. Наблюденные графики Za и результаты их обработки адаптивным фильтром. 1 — графики Za; 2—4 — графики аномалий |Л соответственно для субмериднонального северо-западного и северо-восточного простираний два основных простирания аномалий: субмеридиональное (0 = 0) и северо-западное (0 == 3). Если первое из них картируется по гра- фикам Za визуально, то второе — на них вообще не выделяется По графикам значений р четко прослежен целый ряд аномальных зон, визуальное выделение которых по исходной карте Za было исключено. Через всю площадь участка прослеживается зона се- веро-западного простирания, параллельно которой в юго-западной части участка отмечается несколько аномалий меньшей протяжен- ности. Эта зона связана с тектоническим нарушением, не выделен- ным по геологическим данным. Остальные выявленные аномалии р обусловлены дайками диабазов, контактами пород различного со- става, разломом северо-восточного простирания, установленного ранее по геологическим данным. 279
§ 43. НЕПАРАМЕТРИЧЕСКИЕ ПРИЕМЫ ОБНАРУЖЕНИЯ СИГНАЛОВ В основе рассмотренных выше способов выделения геофизических сигналов на фоне помех лежит предположение о нормальном рас- пределении помех. Такие способы можно назвать параметрическими, поскольку нормальный закон характеризуется двумя парамет- рами — средним и дисперсией (для коррелированных помех — корреляционной матрицей). В то же время предположение о нор- мальном законе распределения помех не всегда имеет место на прак- тике. В связи с этим необходимо применение так называемых н е - параметрических способов (алгоритмов) обра- ботки, которые оказываются эффективными в тех случаях, когда использование статистических приемов, базирующихся на нормаль- ном законе распределения, является сомнительным или вообще невозможным. Основное достоинство непараметрических способов состоит в том, что их построение не требует предположения относительно вида распределения. При решении задачи обнаружения сигнала на фоне помех распределение последних может носить любой ха- рактер. Весьма вероятно, что большинство типов помех, осложняю- щих обнаружение геофизических аномалий, не имеет нормального распределения. В частности, помехи, создаваемые геологическими неоднородностями верхней части разреза, с большей достоверностью можно считать имеющими равномерное распределение, чем нор- мальное. Изучение помех, возникающих при измерении геофизических полей в скважине, проведенное С. М. Махмутовым, указывает на наличие двух дополнительных экстремумов в их распределении соответственно при очень низких и очень высоких значениях из- меряемого параметра по сравнению с нормальным законом. На- личие подобных экстремумов связывается с помехами технического характера, такими, как сбои при движении скважинного снаряда. Таким образом, отказ при построении алгоритмов выделения сиг- налов от конкретного вида распределения помех, кстати, как и са- мих сигналов, если они представлены случайным процессом, по- зволит обнаруживать сигналы в тех случаях, когда параметриче- ские способы не являются эффективными. Использование непараметрических способов обработки геофи- зических данных связано с применением знаковых, ранговых и знаково-ранговых статистик. Знаковая статистика — произвольная функция век- тора /, т. е. последовательности наблюденных значений поля, /1( ...,/„ с компонентами sgn / = (sgn flt ... , sgn /„), где sgnf,= —(8.61) IM 1-1, A<0. ; Например, пусть 280
/ = (—1, 2, 3, —5, 0, 5). (8.62) Его знаковая статистика будет — 1, 1, 1, — 1, 1, 1. Алгоритм, использующий только знаки элементов вы- борки наблюдений, называется знаковым. Порядковая статистика — упорядоченная вы- борка, в которой все элементы вектора / (Л, • • . , /п) расставлены в возрастающем порядке. Для того же примера (8.62) порядковая статистика будет — 5, — 1, 0, 2, 3, 5. Рангом Rt элемента выборки fa называется порядковый но- мер этого элемента в порядковой статистике. Так, для примера (8.62) с учетом его порядковой статистики получаем /<=—5, —1, 0, 2, 3, 5 fa= — 1, 2, 3, —5, 0, 5 = 2, 3, 4, 5, 6, ИЛИ R{ = 2, 4, 5, 1, 3, 6. Ранговая статистика — это произвольная функция от рангового вектора R (f) = R . . . , R (fn), представляющего перестановку чисел 1, 2, . . . , п, которая получается при замене элементов выборки их рангами. Ранговый алгоритм — есть сравнение ранговой ста- тистики с некоторым заданным порогом. Знаково-ранговый алгоритм использует зна- ково-ранговую статистику R*, зависящую как от вектора рангов R (f), так и от вектора знаков sgn f выборки fa Например, значение знаково-ранговой статистики для первого элемента выборки (8.62) . п ^=^-Zsgn(|/1|-|fA|)+-J- = Z k=\ = _1_(1 —1 —1 _ 1.+1 _ 1) + 3 = 2. Рассмотрим алгоритмы обнаружения сигналов, построенные на указанных статистиках, на их основе получим непараметрические аналоги способов обратных вероятностей, межпрофйльной корре- ляции и адаптивной фильтрации. Знаковый алгоритм обнаружения детерминированного (задан- ного своими значениями) сигнала Si на фоне некоррелированной помехи с нулевым средним и симметричным распределением имеет вид 1 п У1 = — Е sgn st sgn fj^t + > ho, (8.63) где ho — порог принятия решения, равный (1/2) (ФйЧ/л+л): а — заданная вероятность ошибки первого рода; Ф«’ — величина обратная интегралу вероятности при фиксированном значении а. Так, при а = 5 % ta = 0,52. В качестве иллюстрации работы алгоритма (8.63) рассмотрим следующий пример. 281
Пусть требуется обнаружить сигнал s (+ 1, + 5, — 5, — 1) в выборке f =.— 1, 2, 3, — 5, 0, 5. Очевидно, что максимальная величина (8.63) будет наблюдаться при значениях s, и равных — 5. Найдем при этом величину выходного сигнала yj. Сначала определим знаковые статистики: sgn f = (— 1, 1, 1, — 1, 1, 1) и sgn s = (1, 1, — 1, —1). Отсюда у3 = (1 + 1 + 1—1) +2 = 3. Порог при- нятия решения: Ло = (1/2) (0,52 -у^4 + 4) = 2,52. Поскольку профильтро- ванное значение сигнала 3>А0, принимается решение о наличии сигнала. Другой, более эффективный вариант знакового обнаружения детерминированного сигнала имеет вид У/ = £ si sgn fi-i > h0. (8.64) Для рассмотренного примера на основе (8.64) получаем yt — = 1 + 5 + 5-1 = 10. Значение yt существенно выше порога 2,52, рассчитанного при заданной 5 %-ной вероятности ошибки первого рода. Алгоритмы обнаружения сигналов, построенные на ранговых статистиках, наиболее эффективны при обнаружении сигналов, не содержащих постоянной составляющей. Хотя эти алгоритмы можно использовать с целью обнаружения сигналов и с постоянной со- ставляющей, их эффективность будет ниже эффективности знаково- ранговых алгоритмов. Приведем один из основных ранговых алгоритмов, получивший название алгоритма Вилкоксона, п У1 = Е SiRf-i > h<!- (8.65) 1=1 Порог й0 определяется из соотношения ho = ta. (я&$пфп) 1 + (8.66) где ta. — квантиль нормального распределения при заданной ве- роятности ошибки первого рода (при а — 5 %, ta = 0,52); . л < 2 1 V* 2 ^sn — Щп--Osn> Wsrt—------- n i=i 1 n atn=—E st» n i=i фп и фп — соответственно среднее и дисперсия функции R] в (8.65). Найдем, например, значение порога для алгоритма (8.65), когда сиг- нал задан в виде s; = (+ 1, + 5, — 5, — 1). Тогда Wsn = 52/4 = 13; ci3fi = 0; Ь3ц ~ 13; ф« = (1 + 2 + 3 + 4)/4 = 2,5, 282
так как сигнал представлен четырьмя значениями и его ранговая статистика включает ранги 1, 2, 3, 4: ф2 = 2-1,52 + 2'0,52 == 5. Таким образом, по (8.66) получаем й0 = 0,52 (4-13-5),/2= 8,3. Макси- мальное значение выражения (8.65) при использовании исходного вектора наблюдений (8.62) с учетом того, что s/= 1, 5, — 5, — 1, f/= — 1, 2, 3, —5, 0, 5, /?< = 3, 4, 1, 2 будет 4 У1 = У 1-3 + 5-4 —5-1 —1-2= 16. /г—1 Поскольку yi>h0, принимается решение о наличии сигнала. 3на к о в о-ранг о вый алгоритм обнаруже- ния детерминированного сигнала имеет вид (8.67) Z {osl Z i=l Порог принятия решения Ло = (fa +n2as„/V^). (8.68) Z В качестве примера, иллюстрирующего выполнение операций в (8.67), вновь рассмотрим обнаружение сигнала st = (1, 5, — 5, — 1) в исходной выборке (8.62). __ Согласно (8.68) порог для обнаружения такого сигнала ft0 = 2V13- 0,52д/4/3 = 5,0, а значение у/ в (8.67) будет у/=_Ьц.3.1 + 5-41+(-5)Н-D+ (- 1)-2-1] + Z -4- —[1-3 + 5-4-5-1 -1-2] = 13 + 8 = 21. 2 Очевидно, что yt = 21>Л0 = 5,0. Из рассмотренных примеров видно, что знаково-ранговый ал- горитм наиболее эффективен по сравнению со знаковым и ранго- вым алгоритмами. Следует отметить, что устойчивость ранговых алгоритмов, настроенных на нормально распределенную помеху, всегда больше устойчивости неранговых алгоритмов, настроенных на ту же нормально распределенную помеху. Это свойство ранго- вых алгоритмов имеет место при любом законе распределения помех. Алгоритмы (8.63) — (8.65) и (8.67) являются соответствующими аналогами алгоритмов способа обратных вероятностей. Обработка по наиболее эффективному из них — знаково-ранговому алгоритму включает три основные процедуры: 1) задание окна, размер кото- рого определяется длительностью детерминированного сигнала т (в пределах этого окна находится ранг и знак каждого значения исходного поля, а также рассчитывается величина (1/2) 283
постоянная для данного сигнала); 2) нахождение свертки вида у, = = (1/2) X sgn/j_i; 3) сравнение статистики (8.67) с поро- говым значением h0, определяемым по (8.66), и принятие решения о наличии сигнала, если и об отсутствии сигнала, если yi<Zh0. Для выделения неизвестных по форме сигналов в § 41 и 42 со- ответственно были рассмотрены способы межпрофильной корреля- ции и адаптивной фильтрации. На основе ранговых статистик не- трудно получить их непараметрические аналоги. Пусть= (fn, . . . , /1п) и/2 = (f21, . . . , fin) — наблюденные значения по двум профилям съемки (это могут быть и наблюденные значения на одном и том же профиле по двум методам) и пусть /?=(/?!,..., Rn) и Q = (Qx, . . . , Qn) — ранговые векторы этих наблюдений. Решение о наличии сигнала на обоих профилях сле- дует принять, если y=iRiQi>h0. (8.69) i=i Статистика (8.69) — не что иное, как коэффициент ранговой корреляции Спирмена (см. гл. II). Порог принятия решения для (8.69) /lo = (fa + 3Vn)nS2/12. Если в выражении (8.69) учесть среднее значение рангов по каждому профилю и его нормировку на дисперсию, получим ран- говую взаимо корреляционную функцию BR0 [см. формулу (4.26)]. RQ По экстремальным значениям (4.26) можно найти смещение сигнала (от профиля к профилю), как это делается в способе меж- профильной корреляции. Аналог процедуры суммирования для межпрофильной корреляции найдем, если проранжируем значения исходного поля по направлению суммирования. Ранжировке под- вергаются значения поля с разных профилей, после чего для рангов этих значений находится медиана /?* = (/V + 1)/2 и проводится выбор значения поля, соответствующего Следовательно, ранговый аналог межпрофильной корреляции включает: 1) оценку простирания аномалий по экстремумам ран- говой ВКФ; 2) ранжирование исходных данных по направлению простирания аномалий (направлению суммирования); 3) выбор центрального элемента ранжированного ряда значений. Значение, соответствующее центральному элементу ранжированного ряда, есть медиана, т. е. вместо среднего значения по N профилям съемки здесь в качестве оцейки аномалии используется значение поля, соответствующее медиане рангов. Допустим, по семи профилям вдоль направления суммирования значения поля расположились с 1 по 7 профиль следующим обра- 284
зом: 2, — 82, 3, 1,4, 123, 5. Располагаем этот ряд значений в воз- растающем порядке с присвоением ранга: fk= — 82, 1, 2, 3, 4, 5, 123, Pft=l, 2, 3, 4, 5, 6, 7. где k — индекс для профиля; Rk — (N + 1)/2 = (7 + 1)/2 = 4. Результатом обработки будет значение поля, равное 3, соответст- вующее Rk = 4. Рис. 66. Выделение слабого сигнала путем нелинейного накопления. 1 — сигнал; 2 — сигнал + помеха; 3 — результат линейного накопления; 4 — резуль- тат нелинейного накопления Описанный прием целесообразно использовать, когда на фоне сравнительно небольших по абсолютной величине значений поля появляются резкие выбросы, явно искажающие результаты наблю- дений. К таким искажениям относятся помехи импульсного типа при каротаже. Ранговый вариант межпрофильной корреляции по- зволяет провести подавление помех подобного типа. При обычном же суммировании, в основе которого лежит предположение о нор- мальном характере распределения помех, резкие выбросы оказы- вали бы существенное влияние и были бы приняты за аномалии. Пример, иллюстрирующий эффективность ранговой межпрофиль- ной корреляции, иначе, нелинейного накопления, по сравнению с линейным накоплением при искажении результатов наблюдений помехой, распределение которой наряду с центральным имеет два боковых экстремума, приведен на рис. 66. Непа'раметрический аналог адаптивной фильтрации основан на использовании статистики (критерия) Фридмана, в то время как параметрическая адаптивная фильтрация строится на базе статистики Хоттелинга. При применении статистики Фридмана процедура обработки сводится к ранжировке значений поля в каждой строке того же 285
окна, включающего N профилей и т пикетов по каждому профилю^ суммированию полученных рангов по каждому из столбцов и вы- числению величины %’ в виде [см. формулу (3.13) ] т z N 12 Ё *«) %? = У , 1» -ЗЛГ(т + 1), Nm (т +1) N т где R( = У Rm — сумма рангов для t-ro пикета окна; У, Rj — ука- k=i i=i зывает на необходимость суммирования квадратов полученных сумм рангов по всем пикетам. Рнс. 67. Выделение слабого сигнала с помощью непараметрической адаптив- ной фильтрации (по С. М. Махмутову). а — сигнал; б — сигнал 4- помеха по 11 профилям; в и г — значения, полученные соот- ветственно с помощью параметрической и иепараметрнческой адаптивной фильтрации Величина называемая статистикой Фридмана, имеет рас- пределение Пирсона (хи-квадрат) при (т—1) степенях свободы, когда сигнал в выбранном для анализа окне отсутствует. Это поз- воляет найти величину порога при решении задач обнаружения неизвестного по форме сигнала на фоне некоррелированных помех. Пример применения статистики Фридмана рассмотрен в § 13. Как и в параметрическом варианте адаптивной фильтрации, окно, включающее mN точек, перемещается сначала вдоль профилей со смещением, равным одному пикету, а затем вкрест их простира- ния со смещением на один профиль. Это позволяет определить ме- стоположение сигналов по площади съемки. Пример, приведенный на рис. 67, свидетельствует о преиму- ществе непараметрической адаптивной фильтрации по сравнению с параметрической при обнаружении сигнала на фоне ненормально распределенных помех. В заключение подчеркнем, что при обработке геофизических данных с целью выделения сигналов на фоне помех нельзя, как правило, ограничиваться использованием лишь одного приема, одного алгоритма обработки, особенно в сложно построенных в гео- 286
логическом отношении районах. Неизбежные изменения формы наблюдаемых аномалий и свойств помех, в том числе характера их распределений, приводят к выводу о необходимости сочетания различных алгоритмов обработки по одним и тем же участкам гео- физической съемки. Комплекс способов межпрофильной корреля- ции, адаптивной параметрической и непараметрической фильтра- ции с различными окнами, как показано Г. В. Демурой и А. С. Ле- виным, в ряде случаев позволяет только по данным магнитной съемки добиться такой разрешающей способности, какую полу- чают по данным геологической съемки с использованием достаточно густой сети картировочных скважин. При этом наибольшее число контактов пород и тектонических нарушений выделяется путем межпрофильной корреляции и адаптивной параметрической филь- трации. Роль непараметрической адаптивной фильтрации сущест- венно меньше по сравнению с параметрической, однако с ее по- мощью удается откартировать такие участки, которые. не выде- ляются на базе параметрических алгоритмов. Применение непара- метрических приемов будет весьма полезным при обработке данных геохимических и спектрометрических съемок.
ГЛАВА IX ОБРАБОТКА ДАННЫХ КОМПЛЕКСА ГЕОФИЗИЧЕСКИХ ПРИЗНАКОВ В предыдущих главах учебника неоднократно указывалось на воз- можность использования анализов различного вида (регрессион- ного, факторного, спектрального) для обработки данных комплекса геофизических признаков. Цель обработки данных комплекса при- знаков — достижение однозначности геологического истолкова- ния геофизических полей. Применение комплекса методов позволяет существенно увели- чить надежность обнаружения аномалий от искомого объекта за счет возрастания энергетического отношения сигнал/помеха рК0Ип = = £р/, гДе Pt — отношение сигнал/помеха для /-го признака (ме- 1 тода); L — число признаков (методов). Обработка данных геофизического комплекса направлена чаще всего на решение прогнозных задач, в частности на локализацию площадей для дальнейших поисковых или разведочных работ. Использование различных физических признаков (или пара- метров) в общем случае приводит к задаче классификации геологи- ческих объектов по данным геофизического комплекса. Для решения задач классификации объектов по совокупности признаков создана обширная теория распознавания образов. Понятие образа предпо- лагает наличие определенных взаимосвязей между структурой поля (геофизического, геологического, геохимического и др.) и конкретным геологическим объектом — образом. Выделение ано- малии на фоне помех, в том числе выделение аномалии в поле лишь одного признака, можно рассматривать как задачу распознавания объектов двух классов, соответствующую задаче поисков место- рождений. При разделении объектов по геофизическим полям на число классов, большее двух, решаются, как правило, задачи гео- картирования и прогноза месторождений различных видов полез- ных ископаемых. Выбор того или иного способа обработки данных комплекса зависит от наличия априорной информации об искомых объектах, от характера исходных признаков и их зависимости ме- жду собой, а также от решения конкретной задачи. Если в пределах исследуемых площадей£выделяются участки с доказанной рудо- носностью (нефтегазоносностью) и участки с доказанным^ отсутст- вием, т. е. эталонные объекты, используют способы обработки при наличии эталонных объектов, в противном случае — способы клас- сификации объектов на принципах самообучения. 288
§ 44. ПРИНЦИПЫ ОБРАБОТКИ ДАННЫХ КОМПЛЕКСА Принципы обработки данных геофизического комплекса анало- гичны принципам обработки геофизических полей с целью выде- ления аномалий на фоне помех, поскольку задачу выделения ано- малии можно рассматривать как задачу распознавания образов. Действительно, несмотря на большое разнообразие используе- мых для выделения аномалий приемов фильтрации, были сформу- лированы принципы решения этой задачи [10], заключающиеся в: 1) задании математической модели поля; 2) изучении спектраль- ных, корреляционных свойств аномалий и помех; 3) выборе фильтра, т. е. алгоритма обработки, с учетом модели поля, априорной ин- формации, решения конкретной задачи; 4) принятии решения о наличии аномалии; 5) оценке качества проведенной обработки. Ана- логичные принципы обработки данных комплекса заключаются в: 1) задании математической модели и постановке задачи распозна- вания; 2) оценке статистических характеристик и информативности признаков; 3) выборе способа обработки (алгоритма обработки) данных комплекса и проведении обработки; 4) принятии решения о наличии перспективных объектов; 5) оценке качества проведен- ной обработки. Математическая модель и постановка задачи В качестве модели обработки целесообразно использовать стати- стическую модель, поскольку объекты исследований обычно ха- рактеризуются случайными распределениями признаков ввиду различия их размеров, глубины залегания, контрастности физиче- ских Свойств ит. п., а аномальные эффекты от этих объектов иска- жены помехами различной природы. В общем виде математическую модель можно представить как либо + Х,= либо аы + п*/->Яь «••••«••а либо ад!/ + пм»_*’^м» (9.1) где X, (Xlt X 2» • • • » Х^У — вектор значений L. различных /при- знаков; I = L\ k — М — характеризует различные по геологической природе объекты исследований; М — общее число разных классов объектов, соответствующих М статистическим ги- потезам Нк; ак1 — неслучайная аномальная составляющая 1-го признака; п*/ — случайная составляющая (помеха) по тому же признаку. /аЮ А. А. Никитин 289
Для решения задачи поисков полезного ископаемого одного I вида в модели (9.1) принимается М = 2. В частности, модель для 1 задачи выделения аномалии на фоне помех по комплексу призна- I ков принимает вид: либо xt — at + nt -> Нг (ненулевая гипотеза), 1 —► —► 1 либо xt = ni -> Но (нулевая гипотеза). | Когда модель (9.1) предполагает наличие априорной информа- 1 ции о числе классов М, на которое требуется разделить все пункты j наблюдений, а также о статистических характеристиках для этих 1 классов, говорят о распознавании образов с обу- I ч е н и е м на эталонных объектах или об обработке данных Ком- 1 плекса при наличии эталонных объектов. Отсутстиве эталонных 1 объектов с известными статистическими характеристиками изу- I чаемых признаков приводит к необходимости применения таких 1 алгоритмов (способов) обработки, которые обучаются принятию 1 решения в процессе самой обработки. Этот вид обработки назы- | вается классификацией объектов без обуче- 1 ния на эталонных объектах или просто самообучением. I Задача обработки данных геофизического комплекса при наличии | эталонных объектов формулируется следующим образом: с помощью 1 выбранного алгоритма (и критерия) распознавания, провести раз- ] деление пунктов наблюдений на два (например, рудные и безруд- I ные объекты) класса или большее число классов при априорно за- I данных распределениях значений каждого признака на эталонных 1 объектах. При использовании алгоритмов обработки с обучением 1 на эталонах весьма важен выбор эталонных о б ъ е к - 1 т о в, т. е. тех пунктов наблюдений, по которым проводится изу- I чение статистических характеристик признаков. Наиболее эффек- | тивной обработка оказывается в тех случаях, когда по площади 1 исследований наблюдается равномерное чередование эталонных 1 и неизвестных (распознаваемых) объектов. В противном случае, I т. е. при значительном смещении эталонов относительно области | распространения распознаваемых объектов, возникают существен- I ные различия в статистических характеристиках признаков. Осо- I бенно это касается районов со сложным геологическим строением, I для которых наблюдается сильная изменчивость геофизических I полей даже в пределах небольших участков. I Задача обработки данных комплекса при отсутствии эталон- | ных объектов заключается в следующем: с помощью выбранного. | алгоритма классификации провести разделение пунктов наблюде- 1 ний по комплексу признаков на конечное число однородных обла- 1 стей (классов) с заранее неизвестными статистическими характе- 1 ристиками Признаков. При решении этой задачи геологическая ] природа выделенных по комплексу признаков статистически одно- 1 родных областей устанавливается либо непосредственно их разбу- риванием, либо привлечением дополнительных данных, например о физических свойствах горных пород района и т. д. Под признаками понимаются всевозможные характери- стики геофизических, геохимических^ а также часто привлекаемых 290
при распознавании образов геологических полей, особенности ото- бражения поверхности Земли на материалах аэрокосмических съе- мок и другие характеристики, поддающиеся непосредственному наблюдению, измерению или вычислению. Оценка статистических характеристик и информативности признаков Изучение статистических характеристик признаков проводится на эталонных объектах. В общем случае оно включает построение гистограмм, нахождение первых моментов, расчет коэффициентов корреляции признаков. Площадь исследований обычно разбивается на элементарные ячейки, размер которых, т. е. число профилей и пунктов наблюдений в ячейке, определяется масштабом съемки. Элементарная ячейка представляет собой минимальную еди- ницу площади, которая в дальнейшем либо рекомендуется к опо- искованию (разведке), либо не рекомендуется. В пределах такой ячейки рассчитывается значение того или иного признака. При другом подходе в качестве ячейки используется скользящее окно, к центру которого относятся вычисляемые статистические харак- теристики признаков. Для геофизических полей, несущих количественную информа- цию, признаками чаще всего являются: среднее значение поля в ячейке (окне); дисперсия поля; азимут основного направления изолиний; интервал корреляции или величина коэффициента кор- реляции, вычисленная для значений поля, расположенных через пикет; видимая частота (видимый период)* пбля в ячейке; значения первой и второй производной поля и ряд других признаков. Важно, чтобы признаки были независщицми друг от друга. Так, среднее значение поля, дисперсия, азимут простирания, интервал корре- ляции являются независимыми признаками. В то же время часто используемый признак изрезанности поля связан с его дисперсией, видимая частота (или период) зависит от интервала корреляции и т. д. Для геологических полей в пределах ячейки рассчитываются такие признаки, как число различных типов горных пород, коли- чество нарушений, интенсивность проявления метасоматоза, гид- ротермальных изменений и т. д. При обработке данных комплекса признаков элементарная ячейка аппроксимируется точкой, для которой присваиваются значения изучаемых признаков и получае- мых конечных результатов. Элементарная ячейка с установленным бурением или другими предшествующими исследованиями значением целевого свой- ства, под которым в задачах прогноза понимается наличие оруде- нения прогнозируемого класса, представляет эталонный объект. Ячейки, значение целевого свойства которых необходимо оценить, образуют совокупность распознаваемых или исследуемых объек- тов. Таким образом, объектом, выделяемым в результате обработки данных комплекса, обычно является не отдельное геологическое тело, а некоторая область, перспективная в отношении обнаруже- но* 291
ния объектов прогнозируемого класса. В зависимости от масштаба исследований и целевого свойства объектом прогноза может быть рудный район, рудное поле, месторождение, отдельные рудные залежи. При решении «артировочных задач целевое свойство пред- ставлено М различными типами пород. При наличии эталонных объектов для алгоритмов, основанных на использовании критериев статистических решений, требуется оценка плотностей распределения изучаемых признаков (гисто- грамм). Эту оценку можно проводить, когда число эталонных объек- тов, т. е. соответствующих элементарных ячеек, для каждого класса не менее 25—30. При построении гистограмм не следует брать большое число разрядов, поскольку при этом резко ухудшается точность опреде- ления частоты признака по каждому разряду. Обычно за интервал группирования значений признака принимается погрешность оп- ределения этого признака, либо эмпирическая оценка Дх = = (Xmax—xmin)/(l + 3,32 1g п), где хтах и хт1п— максимальное и ми- нимальное значения признака в исходной выборке размером п. В алгоритмах классификации без обучения на эталонных объек- тах чаще всего предусматривается оценка плотностей распреде- ления признаков: либо одномерные, либо многомерные. Для зависимых друг от друга признаков необходима оценка коэффициентов корреляции между отдельными парами признаков, что позволяет по эталонным объектам построить корреляционную матрицу 1 G2 ... rlL R= Г21 1 * ’ ’ r*L ,, , (9.2) rLl Г1Л ... 1 где Гц — коэффициент корреляции между значениями i-ro и j-ro признаков. Такие матрицы оцениваются для каждого класса эталонных объектов. Ряд алгоритмов классификации без обучения также ос- нован на оценке корреляционных матриц изучаемых признаков. Оценка информативности признаков и их комплекса производится на эталонных объектах. Информативность признака — способность при- знака различать сравниваемые объекты. Эта способность зависит от того, как часто определенные значения признака встречаются у объектов прогнозируемого класса и как широко они распростра- нены за их пределами. Некоторые признаки, не несущие полез- ной информации об исследуемом объекте, следует исключить при интерпретации, поскольку существуют признаки-помехи, создаю- щие информационный шум. Различают частную информативность отдельных значений (градаций) признака, которая содержится в появлении данной градации признака о значении целевого свойства исследуе- 292
мого объекта, и информационную значимость признака как интегральную характеристику, отражающую способность признака в целом различать сравниваемые объекты. Информационная значимость, или просто информатив- ность признака, позволяет ранжировать признаки и вы- являть те из них, изучение которых может дать наибольший эффект при прогнозе. Для вычисления информативности признаков предложены раз- личные оценки, основные из которых рассмотрены в § 45. Нахождение информативности для различных сочетаний при- знаков позволяет определять информативную сово- купность признаков (ИСП), т. е. набор признаков, обеспечивающий наибольшую надежность решения поставленной задачи, например задачи прогнозирования. *! Выбор алгоритма обработки данных комплекса Выбор алгоритма обработки зависит от следующих факторов: 1) от принятой модели и решения конкретной геологической задачи. Для решения задачи поисков обычно требуется разделение объектов наблюдений на два класса. При геологическом картиро- вании необходимо применение алгоритмов, позволяющих осущест- влять классификацию объектов более чем на два класса; 2) от характера исходной информации. Так, для признаков, имеющих лишь два значения (состояния) — 0 — «нет» и 1 — «да», эффективными являются алгоритмы распознавания, базирующиеся на методах математической логики (см. § 46). Такие признаки обычно описывают геологическую информацию. Состояния этих признаков можно описать с вероятностных позиций, используя частоту их встречаемости на эталонных объектах. В общем случае как для признаков, имеющих несколько дискретных состояний, так и для признаков, несущих количественную информацию, наи- более эффективным оказывается применение алгоритмов, основан- ных на проверке статистических гипотез; 3) от наличия или отсутствия корреляционных связей между признаками. Алгоритмы обработки зависимых признаков сложнее алгоритмов обработки независимых признаков. Для зависимых признаков обычно требуется и выполнение условия о нормально- сти распределения их значений; ' 4) от полноты априорной информации об изучаемых объектах, т. е. от совершенства физико-геологической модели среды. При наличии эталонных объектов используются алгоритмы, рассмот- ренные в § 46; при отсутствии эталонных объектов применяются алгоритмы классификации пунктов наблюдений по комплексу при- знаков, основанные на принципах самообучения (см. § 47). 10 Л. А. Никитин 293
Принятие решения о наличии искомых объектов При обучении на эталонных объектах сравнительная оценка пер- спективности отдельных участков (ячеек) исследуемой территории в соответствии с принципом аналогии обычно проводится по ве- личине меры сходства, являющейся количественной оцен- кой степени подобия исследуемых объектов известным рудным объектам по информативной совокупности признаков. Вычисление мер сходства базируется на свертке разнотипных (геологических, геофизических, геохимических) данных в единый комплексный па- раметр, анализ которого и обеспечивает выделение перспективных объектов. В различных алгоритмах обработки данных комплекса применяются и различные меры сходства. В алгоритмах, основан- ных на проверке статистических гипотез, мерой сходства служит либо величина коэффициента правдоподобия, либо величина апо- стериорной вероятности, а для принятия решения используют рассмотренные в § 38 критерии статистических решений и соответст- вующие им пороги. При определении порога принятия решения важным является выделение такой наименьшей площади перспек- тивности, которая бы содержала максимальное число контрольных эталонных объектов, т. е. известных рудных объектов, не вошедших в эталонные объекты обучения. Такие объекты часто называют объектами экзамена. М. А. Белобородов предлагает считать класси- фикацию (распознавание) оптимальной, если обеспечивается ми- нимум риска последующих поисков (разведки). Для оценки риска им вводятся два параметра: локальность прогноза L — доля исследуемой площади, относимая при данном алгоритме распознавания к потенциально рудоносной и рекомендуемой для поисков, и надежность прогноза у — 1—7, где q — относительное число ошибок классификации контрольных объек- тов при том же алгоритме обработки. В качестве критерия оптими- зации используется коэффициент риска поисков. R = (L + 0/(l-0. (9.3) Очевидно, что при L -> 1 и величина R оо. Порог принятия решения о наличии минимальной перспективной пло- щади соответствует минимуму коэффициента риска (9.3). Величину (9.3) можно представить в виде = + 1)-1, (9.4) Nx>bt k «в ' где hi — пороговое значение меры сходства; т — величина меры сходства; s0 и 2V0 — число соответственно исследуемых и контроль- ных объектов; sx>h. — число исследуемых объектов, отнесенных к рудному классу; Л/т>л, — число правильно распознанных кон- трольных объектов. Оптимальный порог определяется из соотношения R (hi-J>R (ЛоптХ R (Ai+1). (9.5) 294
Для каждой потенциально рудоносной ячейки в зависимости от ее меры сходства может быть получена оценка вероятности нали- чия прогнозируемого объекта по формуле Байеса: 2 Pr = Р (HJX > й*) = p(HJ Р(х> h'/ну Е р (ЯА) Р (т > Й*/Яг), Л=1 (9-6) где k = 1, 2; h* = hom + Ай; Ай — шаг квантования меры сход- ства; г — индекс ячейки. Обычно априорные вероятности появле- ния рудных р (Hj) и безрудных р (Я2) объектов при т>й0ПТ по- лагают равными. Принятие решения о наличии искомых объектов завершается их ранжированием по индексу перспективности Сг — параметру, определяемому по М. А. Белобородову как функ- ция вероятности обнаружения оруденения и его прогнозных запасов: С, = р,.10Ч (9.7) где величина рг находится из (9.6); yr = 1g zT\ zr— величина известных запасов для r-й ячейки. Для оценки уг используется уравнение линейной регрессии мер сходства с логарифмом запасов Уг = Гу^ух1ох + (у—ГучРух/ах}, где г ух—коэффициент корреляции мер сходства с логарифмами запасов, вычисляемый на эталонных объектах; от и <уу — средне- квадратические отклонения мер сходства и логарифмов запасов. Связь между запасами и мерами сходства считается существен- ной, если величина коэффициента корреляции больше двойной погрешности его определения: —(1 fyt)/Vn • где п — число пар значений у и т. В случае ^<207^ гипотеза о зависимости между запасами и мерами сходства исследуемых объектов отвергается и решение о наличии искомых объектов принимается без индекса перспектив- ности. Поскольку для количественного прогноза далеко не всегда имеются требуемые данные, при распознавании объектов ограни- чиваются вычислением меры сходства (комплексного параметра) и ее сравнением с пороговым значением. При отсутствии эталонных объектов распознавание исследуе- мых объектов ограничивается разделением площади исследований на области, однородные по совокупности признаков. Это разделе- ние может быть выполнено на основе различных критериев при- нятия решений. Результаты классификации и значительной сте- пенц зависят от задания числа классов. 10е 295
Оценка качества обработки данных комплекса I Эта оценка в большинстве алгоритмов-с обучением на эталонных объектах проводится путем вычисления ошибки распознавания контрольных (экзаменуемых) объектов, т. е. объектов известной геологической природы, не вошедших в обучение при формирова- нии информативной совокупности признаков. Ошибка равна от- ношению правильно распознанных контрольных объектов к об- щему числу контрольных объектов. Для алгоритмов, основанных на проверке статистических ги- потез, используется оценка вероятности ошибки, полученная пу- тем интегрирования плотностей распределений коэффициента прав- доподобия. Эти плотности распределений строятся отдельно для контрольных объектов разных классов. Рассмотрим нахождение вероятности ошибки распознавания для случая двух классов, когда решение о наличии искомого объекта принимается согласно крите- рию максимального правдоподобия. При условии, что контроль- ные объекты отнесены к первому классу Нг, т. е. являются теми пунктами наблюдений, которые оконтуриваются величиной меры сходства, представленной коэффициентом правдоподобия, Л(Х)>1. Коэффициент правдоподобия Л (X) >1 в силу случайной природы будет иметь вполне определенное распределение Р (Л/Ну). При условии, что другие контрольные объекты отнесены ко второму . классу Н2, т. е. Р (Л/Я2)<1, плотность распределения коэффи- ! циента правдоподобия будет равна Р(Л/Я2). Очевидно, в общем | случае Р (Л/ЯО не равна тождественно Р (Л/Я2). Таким образом, > по контрольным объектам разных классов получены два одномер- ных распределения Р (А/Ну) и Р (Л/Я2) (см. рис. 68, г). Интегри- i руя эти распределения, можно оценить вероятность ошибки про- J веденной обработки и ее надежность. ] Так, вероятности ошибок первого и второго рода (обозначим I их через акомп = и ₽Комп = е2) будут: ] •^пор 61 = аКОмп = f P(AJHy)dA; (9.8) —00 б2 = ₽комп= f Р(Л/Я2)4/Л. (9.9) ; . ^пор В частности, величина Лпор для критерия максимального прав- доподобия равна единице. Общая безусловная вероятность ошибки 2 <7комп= Е P(Hk)ek. (9.10) fe=l Отсюда надежность распознавания Ткомп=1---<7комп« (9.11) 296
При наличии контрольных объектов трех различных классов и более плотности распределений коэффициента правдоподобия имеют несколько точек пересечения. Вероятность ошибки распоз- навания при этом определяют следующим образом. Вычисляют коэффициент правдоподобия Л = Р (х/Нг)/ f Р (x/Hk)- (9.12) k—\ Плотности распределения Л получают при условиях: а) объект относится к первому классу; б) объект не относится к первому классу. Путем непосредственного интегрирования величины (9.12) на- ходят вероятность ошибки распознавания объектов первого класса. Затем вычисляют вероятность ошибки для каждого оставшегося (М—1) — класса, причем каждый раз используют коэффициент правдоподобия Л = р(х/Н;)/Д p(x/Hfe); j = l............М. (9.13) *7/ Вероятность ошибки распознавания м <7комп = S (9.14) k=l Надежность распознавания определяют по (9.11). § 45. ОЦЕНКА ИНФОРМАТИВНОСТИ ПРИЗНАКОВ Необходимость оценки информативности признаков вызвана тем, что не все признаки геофизических полей представляют интерес для решения конкретной геологической задачи. Некоторые при- знаки, не несущие полезной информации об изучаемых объектах, следует исключить при обработке. Наконец, отбор наиболее ин- формативных признаков позволяет установить первоочередность изучения территории соответствующими методами разведочной гео- физики. Механическое увеличение признаков может не только улучшить, но и снизить качество прогноза из-за существования признаков-помех, создающих «информационный шум», на фоне ко- торого затушевывается полезная информация об объекте. Оценка информативности признаков производится по эталон- ным объектам, при этом используются самые различные приемы. Укажем основные из них. Надежность разделения объектов разных классов Эта величина является достаточно универсальной оценкой инфор- мативности как отдельно взятого признака, так и сочетаний (ком- плекса) признаков. Расчет надежности разделения объектов осно- 297
ван на проверке статистических гипотез. Информативность призна- ков при этом оценивается по вероятности. Для определения надежности разделения объектов двух классов, соответствующих гипотезам Hi и Нг, вводятся вероятности ошибок первого и второго рода а и 0. Ошибка первого рода состоит в том, что принимается решение о наличии объекта класса Я2, в то время как на самом деле имеется объект класса Hv Ошибка второго рода Рис. 68. Плотности распределения признака xt (а—в и коэффициента правдо подобия Л (г) возникает тогда, когда принимается решение о наличии объекта класса Яь в то время как в действительности имеет место объект класса Я2. Вероятности ошибок первого и второго рода а и 0 оп- ределяются так, как показано в § 38 (рис. 68, а). Через а, 0 и ап- риорные вероятности появления объектов Ях и Я2, р (Нг) и р (Я2) находят вероятность общей безусловной ошибки разделения q и вероятность правильного разделения объектов, называемую на- дежностью разделения у: q = p1a + p2^, у=1— q, (9.15) где pi = р (&!), р2 = р (Я2). Как видно из рис. 68, а, сумма вероятностей ошибок первого и второго рода характеризует степень расхождения плотностей распределения (гистограмм) значений признака xt : Р (xilH-^ и Р (хг/Я2). При полном их совпадении признак xt не обладает по- лезной информативностью, надежность разделения у = 0,5 при Pi — р2 — 0.5. Если при Р (xi/HJ =# 0 Р (xi/H^ ~ 0, а при, Р (xtIH^ у= 0 Р (хг/Я1) = 0, решение о Нг и Н2 принимается одно- значно и величина надежности у = 1 (100 %). Признаки с боль- шими значениями у характеризуются большей информативностью. Неинформативные признаки устанавливаются по совпадению плот- 298
ностей распределения в пределах доверительных интервалов и в дальнейшем отбрасываются. В случае разделения объектов двух классов, что отвечает ре- шению задачи поисков, по величине у с помощью графика для кри- терия максимального правдоподобия (см. рис. 59) можно найти отношение сигнал/помеха /-го признака рг. При этом один класс объектов рассматривается как помеха для другого. Аналогично величина р определяется по каждому исследуемому на информа- тивность (или геологическую эффективность) признаку, после чего при условии независимости признаков рассчитывается отношение сигнал/помеха рКомп по комплексу признаков как сумма ркомп = = У, pi, где L — общее число признаков. С использованием вы- ражения (8.27) представляется возможность оценить надежность разделения объектов двух классов: Ткомп = ф(д/21Р//2). (9.16) По максимальной величине укомп, определяемой для различных сочетаний признаков, устанавливается информативная совокуп- ность признаков, в частности этой совокупностью определяется наиболее эффективный в геологическом отношении комплекс гео- физических методов. В качестве примера рассмотрим расчет величины у по гистограммам, приведенным на рис. 68, а и б. Эти гистограммы характеризуются следую- щими значениями: 5, 10, 15, 20, 20, 15, 10, 5 Для P(x/Hi) 5, 10, 15, 20, 20, 15, 10, 5 для Р (х/Н2) 10,20,40,20,10 для P(x/Hi) 5, 8, 12, 15, 20, 15, 12, 8, 5 для Р(х!Нг) В первом случае при равных значениях Pi и р2 величина q = 0,5 (5 + + 10 + о) = 10 %. Соответственно надежность разделения у = 90 %. Во втором случае q = 0,5 (10 + 15 + 20 + 15 + 10) = 35 % и соответственно у = 65 %. Ясно, что разделение признаков в первом случае более эффек- тивно, чем во втором. Количественно это разделение оценивается величиной у. Для оценки информативности совокупности двух рассмотренных признаков найдем величину рх = 6 по уг = 90 % и р2 = 1 по у2 = 65 %, используя зависимость рис. 59. Отсюда рк0Мп = 7, укомп = 91 %. Определение информативности признака, связанное с надежностью раз- деления, нетрудно обобщить на случай любого числа классов [15]. Так, на- пример, для трех классов, гистограммы которых приведены на рис. 68, в, получаем Укоми = 1 — (Pi®i2 + PaPia) — (раИаз + PsPas) — (pi“is + РзРхз) = = 1 — ?ia — ?аз — ?is> (9.17) где Pi—рз — априорные вероятности появления объектов классов Hi—Н3, полагаемые обычно равными между собой; а12, а23 и а13 — вероятности ошибок первого рода при разделении объектов соответственно первого и вто- рого, второго и третьего, первого и третьего классов; р12, Р23 и р13 — ана- логичные значения вероятностей для ошибок II рода. 299
Для случая, приведенного на рис. 68, в, гистограммы представлены сле- дующими значениями: 5, 10, 15, 20, 20, 15, 10, 5 для Р (xlHj) 5, 10, 15, 20, 20, 15, 10, 5 для Р(х!Н3) 5, 10, 15, 20, 20, 15, 10, 5 для Р (х/Н3). При Pi= р2 = р3= 0,33 получаем укомп = 69 %. Использование оценок информативности в виде (9.17) позволяет срав- нивать информативность тех признаков, для которых разделение осущест- вляется на разное число классов, например для признака х2 на два класса, а для признака ха на три. С целью сравнения информативности по величине у в этом случае следует считать, что какие-то два класса по признаку Xj не разделяются (либо Нг и Н3, либо Н2 и Н3). Оценка информативности для зависимых друг от друга призна- ков может быть осуществлена -путем разложения их корреляцион- ной матрицы (9.2) по собственным значениям и собственным векто- рам. Корреляционная матрица при этом вычисляется по всем зна- чениям признаков, полученных на эталонных объектах разных клас- сов. При выборе информативной совокупности признаков доста- точно ограничиться нахождением максимального собственного зна- чения и соответствующего ему главного собственного вектора мат- рицы (9.2). Координаты этого вектора определяют вес каждого признака. При малом весе признак считается неинформативным и не используется в дальнейшей обработке. Оценку значимости вклада каждого признака следует проводить на базе дисперсионного анализа (см. гл. III). С этой целью для ис- ходной совокупности признаков находят первую главную компо- ненту. Первая главная компонента является линейной комбина- цией исходных данных хц с главным собственным вектором /iu матрицы (9.2), т. е. ylt = 2 ХцНи Например, для L = 4 при на- личии п эталонных объектов имеем Хц Х12 Хц Хц *81 Хц Хц Х42 /1ц /112 L Уи — Х2п Хзп Х^п _ /113 _ /*14 _ = ^X2(/li£. В качестве примера приведем первую главную компоненту, полученную по четырем признакам (см. рис. 69): х1{ = Agocr — остаточное гравитационное поле; хц = рк — кажущееся сопротив- ление; xsi = т] — коэффициент вызванной поляризации; хц — = Za — вертикальная составляющая магнитного поля. По исходным данным была получена матрица вида Agocr Рл Л AgocT 1 0,55 —0,48 0,61 300
Pa 0,55 1 —0,79 0,41 Я —0,48 —0,79 1 —0,51 0,61 0,41 —0,51 1 Координаты главного собственного вектора этой матрицы со- ответственно: hri = 0,49; 0,52;-—0,52; 0,46. Таким образом, первая главная компонента уи = 0,49 AgOcTi4- + 0,52 рк i — 0,52 т]( 4- 0,46 Za t. В данном примере все координаты главного собственного век- тора значимы. Полный анализ информативности должен включать вычисление комплексного параметра i/комп при разном числе при- знаков и их различных сочетаниях. Информативной совокупностью признаков является такая совокупность, при которой достигается максимальное различие классов по величине i/комп- Для случая двух классов отношение большего значения уК0Мп к меньшему, полученных на эталонных объектах, будет аналогично отношению сигнал/помеха р, и по фор- муле у = Ф (V р/2) можно оценить надежность разделения этих классов. Количество информации Эта величина используется М. Н. Столпнером для оценки информа- тивности признаков при решении задач геокартирования. Расчет информативности признаков основан на оценке среднего количе- ства информации о системе А, содержащейся в сообщении о состоя- нии системы В, равного разности энтропий до и после получения сообщения, т. е. 1ав=Н(А)-Н(А/В), (9.18) где Н (4)— априорная энтропия, м Н(А)= — Zp(4ft)logp(4ft); /г—1 Н (А/В) — апостериорная энтропия, м м Н(А/В) = - £ p(Bj) У p(Ak/Bj)logp(Ak/Bl). Если принять, что А — система геологических объектов, т. е. число различных классов пород, установленных по геологической карте (разрезу), а В — система интервалов значений признака, то геометрические вероятности, которые являются исходными для расчета информации, определяются по формулам: p(Ak) = SAkIS или p(Ak) = LAkIL-, p(Bj)-SB]/S или p(B;)=LBf/L; p(Ak/Bj) = SAkBj/S или p(Ak/Bj) = LAkBj/L, 301
где S и L — соответственно площадь съемки и длина профиля; SAk и LAk — участки площади и отрезки профилей, в пределах которых закартирован объект класса 4*; SBj и — то же, для /-градации признака В; SAkBj и LAkBl — участки площади и от- резки профилей, на которых одновременно наблюдается объект класса 4fe и / — градация признака В. Величина IАВ зависит от априорной энтропии системы эталон- ных объектов. Поэтому при сравнении информативности призна- ков следует использовать величину относительной информативно- сти 1Ав/НА, что позволяет сопоставить информативность призна- ков, измеренных на разных участках и объектах неодинаковых размеров, характеризующихся различными величинами априор- ной энтропии. Для нахождения информативной совокупности при- знаков (ИСП) сравниваются суммарные относительные информа- тивности, полученные при различных сочетаниях признаков. ИСП устанавливается по максимальной величине суммарной относи- тельной информативности. Для отбраковки неинформативных при- знаков выбирается эмпирически рассчитанный порог. Оценка частной информативности градаций признаков Рассмотренные выше оценки информативности носили интеграль- ный характер и соответствовали информационной значимости при- знаков. Кроме того, для этих оценок существенным являлось на- личие эталонных объектов каждого класса. В то же время одни градации признака могут оказаться весьма информативными, а другие градации создавать «информационный шум». В задачах про- гноза оруденения (нефтегазоносности) можно быть уверенным в на- личии эталонных объектов рудного класса, если они обнаружены, например, бурением, однако отсутствие рудных объектов при от- рицательных результатах бурения нельзя считать установленным фактом. Поэтому оценку информативности признака целесообразно начинать с оценки частной информативности его градаций и исполь- зовать эталонные объекты только одного, рудного класса, что яв- ляется существенным именно при решении задачи прогноза оруде- нения или нефтегазоносности. Для оценки i-й градации l-го признака М. А. Белобородовым предложено смещенное отношение условных вероятностей: I (хц/НД = — 1, (9.19) Р^/Хц) где р (Н^Хц) и р (HJxh).— вероятности появления рудных объек- тов в_случаях реализации оцениваемой и любой другой градации, т. е. xti означает противоположное i-й градации событие. Условные вероятности оцениваются по формулам Байеса с использованием обучающей выборки из числа эталонных объектов. Область значений частной информативности 1ц (9.19) изме- няется от — 1 до оо. При равновероятном появлении руд- 302
ного объекта в случаях оцениваемой и любой другой градации при- знака величина /»2>0 при р (Н^Хц) и — 1</и<0 при р (HJxi^Cp (Hj/хц). Таким образом, значения 1ц, соответствующие отрицанию при- надлежности объекта к рудному классу заключены в интер- вале (— 1, 0). Градации с информативностью, близкой к нулевой, подлежат дискриминации, отбраковке. Порог дискриминации малоинформа- тивных градаций можно выбрать равным 5 %-ному уровню значи- мости связи градаций с эталонными объектами обучения по кри- терию %2. Расчет частной информативности (9.19) проводится по формуле f (1 — k) mu — knu 1Ц = ---------------!---- » (mu + пц) fe(l — mu/mo) где Шц и пц — число объектов соответственно обучения и иссле- дования, обладающих признаком хц\ k = tnj(tn.o + n0), — число объектов обучения; п0 — число объектов исследования. При шц = /По величина rhu искусственно занижается на единицу, так как в этом случае выражение (9.20) неприемлемо. Такое искажение можно рассматривать как случайное отклонение при вероятности появления данной градации, близкой к единице, и оно не ведет к существенному изменению величины тц. Оценка информативности признака, или его информационной значимости, определяется как сумма значимостей градаций при- знака: (9.20) т __ r ma mo т. е. ni Jt^Z Ju, (9-21) i=i где tii — количество градаций /-го признака. Формирование информативной совокупности признаков (ИСП) в задачах прогноза должно учитывать основную цель прогноза — минимизацию отношения числа исследуемых и контрольных руд- ных объектов. Для отбора ИСП используются признаки с и их сочетания. Полный перебор всевозможных сочетаний признаков при боль- шом их количестве практически не реализуем на ЭВМ. Так, для 100 признаков количество различных сочетаний равно 2100. Поэ- тому обычно реализуется направленный перебор, при котором при- знак включается в ИСП, если его добавление не снижает качества правильно распознаваемых контрольных объектов. При формиро- вании ИСП контрольный объект считается правильно распознан- ным, если сумма информативностей соответствующих ему градаций 305
признаков не меньше минимальной аналогичной суммы в обучаю- щей выборке эталонных объектов. Первым следует рассматривать признак, обладающей наиболь- шей информативностью, последним — наименьшей. После ранжи- рования всех признаков по их информативности осуществляется распознавание с первым информативным признаком, который всегда входит в ИСП. Затем производится распознавание тех же контрольных объектов по совокупности двух признаков — первого и второго по информативности. Результаты распознавания сравни- вают для обоих случаев. Если число ошибок при добавлении при- знака не возрастает, вновь полученное число ошибок запоминается, а признак включается в ИСП. В противном случае в памяти сохра- няется число ошибок, полученных на предыдущем шаге, а признак исключается из ИСП. Далее к включенным в ИСП признакам (к пер- вому или к первому и второму) добавляется третий признак и цикл повторяется. § 46. обработка данных ПРИ НАЛИЧИИ ЭТАЛОННЫХ ОБЪЕКТОВ В настоящее время имеется большое число алгоритмов обработки комплекса признаков с предварительным обучением на эталонных объектах и оценкой их качества на контрольных объектах. В за- висимости от применяемого математического аппарата алгоритмы распознавания можно разделить на три группы: 1) использующие средства математической логики с расчетом либо суммарной ин- формативности признаков, либо с нахождением «обобщенного» расстояния; 2) основанные на методах регрессионного анализа; 3) базирующиеся на проверке статистических гипотез. Приведем основные алгоритмы из каждой группы. Логические алгоритмы Суть этих, алгоритмов состоит в установлении меры сходства (меры аналогии) исследуемых объектов с эталонными по величине сум- марной информативности ИСП. Одним из первых в разведочной геофизике был предложен (Ш. А. Губерман) алгоритм «К о Р а -3», с помощью которого решается задача выделения не- фтегазоносных пластов по комплексу промыслово-геофизических данных. Кодирование признаков чаще всего осуществляется в дво- ичной системе, и объект задается набором признаков х, где Xik = О, если fe-й объект не обладает Z-м признаком, ихц = 1, если fe-й объект обладает Z-м признаком. Все эталонные и исследуемые объекты характеризуются единым набором признаков и единым порядком их расположения. Этап обучения сводится к перебору всех возможных сочетаний признаков по три (отсюда цифра «3» в названии алгоритма) для каждого класса. Если появилось соче- тание признаков, которое не менее р раз встречается среди этало- 304
нов первого класса и ни разу не встречается среди эталонов других классов, такое сочетание выделяется как сложный признак первого класса. Пороговое значение р задается, эмпирически. Если один из двух сложных признаков характеризует большее число эталон- ных объектов, то он будет информативнее другого. На следующем этапе осуществляется распознавание исследуемых объектов. При этом проверяется, сколько 'сложных признаков первого класса встретилось в искомом объекте. Если сложных признаков первого класса больше, чем сложных признаков других классов, объект относится к первому классу. С увеличением мощности и памяти современных ЭВМ указанный алгоритм позволит осуществлять перебор сочетаний признаков по любому их числу и неограничи- вается кодированием признака двумя состояниями. Другим распространенным алгоритмом является алгоритм тупиковых тестов (А. Н. Дмитриев, Ю. И. Журавлев), основанный на поиске матрицы Т, содержащей описание объектов обучения (объекты, как правило, кодируются в двоичной системе) специальных подмножеств — так называемых тупиковых тестов. Подмножество столбцов (flt i2, • • • . *z) матрицы Т называется тестом, если после удаления из Т всех столбцов, за исключением (4, /2, . . . , £/), получается матрица, все строки которой различны. Тест называется тупиковым, если после исключения любого столбца он перестает быть тестом. Для каждого из признаков Хц . . . , xL, характеризующих объекты обучения, вычисляется информационный вес признака А; = пг/А (/=!,...,£), где п, — число вхождений признака xi в тупиковые тесты; N — общее число тупиковых тестов для мат- рицы Т. Информационный вес исследуемого объекта определяется как сумма информационных весов, которые присутствуют на дан- ном объекте, т. ё. принимают значение «1». Для каждого объекта обучения ak (хк1, ... , xkL) и исследуе- мого объекта ах , xL) находится вероятность: ( 0 при xm=^xi. Рн < ( 1 при Хи=Х[, plt — 1/2, если значение xki или xt соответствует прочерк (отсутст- вие данных о признаке), где х^ — значение /-го признака объекта Л-го класса. Затем для каждого из Л! классов оценивают величину комплекс- ного параметра (меры сходства): "Л L z/комп л-2 S Рн^ь k — 1, • • , zVf, (9.22) пк Z=1 где nk — число объектов обучения k-ro класса. Объект ах относится к тому классу (образу), которому соот- ветствует максимальная величина г/комп*. Достаточно широкое применение получили алгоритмы распоз- навания, основанные на построении потенциальной функции, вы- 305
ражаемой через обобщенное расстояние для изучаемых признаков в L-мерном пространстве. Алгоритм «Потенциал-2» (И. Д. Савинский) позво- ляет для каждого исследуемого объекта найти в /.-мерном про- странстве признаков «потенциал» вида V= — nt afe (9.23) [ Дhi “xi)2 где xu, Xi — координаты Z-го признака k-ro объекта обучения и исследуемого объекта; п* — число объектов обучения k-ro класса; a*, hi — «веса» k-ro объекта обучения и Z-ro признака, соответст- венно обусловленные совокупностью объектов различных классов. Исследуемый объект относится к тому классу, «потенциалы» (меры сходства) которого будут большими, чем для других классов. С целью оценки качества обработки по этому алгоритму на самих объектах обучения предусмотрена процедура поочередного исключения объектов из обучающей выборки и их контроль на основе остающихся классов. Число е ошибочно распознаваемых объектов обучения при этом служит одним из показателей эффек- тивности распознавания. Для выделения ИСП указанная проце- дура повторяется. Вначале при поочередном исключении призна- ков из их совокупности признак, исключение которого обусловило наименьшее е, выбрасывают из совокупности как «наихудший». Таким же путем проводится отбраковка «наихудшего» признака в остающихся совокупностях из L—1, L—2 и т. д. признаков. Другая аналогичная мера сходства (А. П. Петров) определяется как L L (1 —I*/ —“ill A,= J----X-------------- (9.24) (?.L где xi и ai — нормированные значения признаков, характеризую- щих соответственно распознаваемый (исследуемый) и -эталонный объекты. Алгоритмы (9.23) и (9.24) построены на предположении о неза- висимости признаков. Результат опробования алгоритма (9.24) приведен на рис. 70, в и а для Бенкалинского меднопорфирового месторождения, для которого исходные геофизические поля пред- ставлены на рис. 69. По материалам обучения на тех же геофизиче- ских полях, полученных для месторождения Коянды того же типа и генезиса, контур Бенкалинского месторождения по значениям X не выделяется (рис. 70, г). Этот пример свидетельствует о том, на- сколько существенное влияние на результат обработки данных комплекса оказывает выбор эталонных объектов. Следовательно, в общем случае при решении прогнозных задач нельзя ориенти- 306
а <Г Рис. 69. Геофизические поля над Бенкалинским меднопорфировым место* рождением. « » в яТл; в — АВ в усл. ед.; в — в %; в — рк в Ом и роваться на величину меры сходства, необходимо проводить ин- терпретацию мер сходства. С этой целью М. А. Белобородовым, как указывалось в § 45, используется минимизация коэффициента риска (9.4), для которого мера сходства т определяется как отно- шение суммарной частной информативности на рассматриваемом объекте г к средней суммарной частной информативности для М. объектов обучения, т. е. Tr — Jr!JM. (9.25) Расчет Jr ведется согласно формуле (9.21). 307
a 5 Рис. 70. Результаты обработки геофизических полей, приведенных на рис. 69, по алгоритмам: а — метода главных компонент, б — дискриминантного аналнаа, а — расчета потенци- альной функции при обучении на материалах Бенкалннского месторождения, г — при обучении на материалах Кояиды. Пунктир — контуры Бенкалннского месторождения <по А. Н. Кленчину) С той же целью большей однозначности эталонных и распозна- ваемых объектов Н. Г. Евстафьевым построен детермини- стский алгоритм, устанавливающий квазифункциональ- ную зависимость между многомерным свойством признакового пространства (мерой сходства) и целевым свойством, т. е. числом классов. Алгоритм включает анализ качества признакового про- странства на эталонных объектах и отбраковку на этой основе не только отдельных объектов, но и целых классов. Материал обуче- ния считается оптимальным при разбиении объектов на макси- 308
мально возможное число классов, пересекаемость которых (по ги- стограммам признаков) не превосходит допустимую величину еПоР, и минимальной мощности признакового пространства. Сначала с учетом ограничения е<епоР добиваются выполнения первого условия оптимальности — разбиения материалов обучения на мак- симальное число классов. Затем, сохраняя полученное разбиение на максимальное число классов и ограничение e<enop, добиваются выполнения второго условия оптимальности — минимальной мощ- ности признакового пространства. В детерминистском алгоритме каждой точке признакового пространства, описывающего материал обучения, должен соответствовать один единственный класс, если это не так — происходит пересекаемость классов и е 0. Поэтому из совокупности классов, соответствующих одной и той же точке в пространстве L признаков, необходимо выбрать единственный класс, который считается «истинным», а остальные — «ложные». Алгоритмы регрессионного анализа Эти алгоритмы впервые были использованы для решения задач промысловой геофизики (М. М. Элланский) и количественной ин- терпретации гравимагнитных данных (Г. И. Каратаев). Суть этих алгоритмов состоит в построении регрессионной зависимости ме- жду искомым параметром и признаками физических полей, напри- мер между пористостью пласта, определяющей его коллекторские свойства, с одной стороны, и данными измерений КС, ПС, ГК и т. д.— с другой. Обычно при построении регрессионной зависимости для дан- ных на эталонных объектах ограничиваются заданием полиномов второй степени, в которые признаки xi входят в качестве линейных и квадратичных членов, а также в виде их произведений. Напри- мер, для случая двух признаков I = 1, 2 k-ro класса имеем Ук — ak*lk + bkXik + CkXikXik + dkxlk + gkx2k • Постоянные коэффициенты в уравнении регрессии находят ме- тодом наименьших квадратов с учетом данных обучения на эталон- ных объектах разных классов, где известны значения искомого геологического параметра уь и проведены измерения признаков X! и х2. В случае определения природы объекта с помощью уравне- ния регрессии на эталонах разных классов находят пороговые зна- чения для yk. Подставляя в найденное уравнение регрессии пока- зания признаков для объекта с неизвестным значением (или с не- известной геологической природой) геологического параметра, уста- навливают величину этого параметра (или природу объекта). Ин- формативность признаков и их сочетаний оценивают по значениям постоянных коэффициентов регрессии. Алгоритмы регрессионного анализа (РЕГР) удобны для исполь- зования комплекса данных, поскольку подключение новых при- знаков означает лишь дополнение новыми членами соответствую- 309
щих уравнений регрессии. Они эффективны при построении мате- матических моделей геологических параметров по геофизическим признакам (например, при построении петрофизических моделей). В качестве примера приведем вид уравнения регрессии, связываю- щего коэффициент пористости kn с набором четырех признаков: kn = —97,2 + 333,6 In оп—32,61пРп + 19,61пи—24,81пД17пс — —242,5 (In стп)2—32,3 In ап In Рп—20,5 In <тп 1пи + + 30,7 In стп In A Unc, где ап — плотность породы в г/см3; v — скорость продольных волн в м/с, Рп — параметр пористости; Д£7ПС — разность между мембранными потенциалами образца и глины. Алгоритм РЕГР предусматривает пошаговое построение рег- рессии у = f (х1( . . . , xL). Целесообразность включения в поли- ном нового члена оценивается на основе дисперсионного анализа (см. табл. 16). Вид полинома и число членов устанавливаются в ре- зультате анализа, а не предопределяются априори. Особенности алгоритмов регрессионного анализа состоит в том, что при обработке одной и той же выборки можно получить не- сколько видов уравнений, практически не различающихся по за- данной ошибке прогноза. Это обстоятельство особенно сильно про- является при наличии взаимно коррелируемых признаков. Поэ- тому коэффициентам уравнения регрессии обычно нельзя придать определенный физический смысл, а уравнению в целом — найти соответствующую физическую модель. Физическая интерпретация оказывается возможной лишь тогда, когда форма уравнения пре- допределена заданной моделью, а в результате процедуры построе- ния уравнения регрессии определяются лишь его коэффициенты. Алгоритмы по проверке статистических гипотез Эти алгоритмы базируются на применении критериев принятия статистических решений, в частности критериев максимального правдоподобия и максимума апостериорной вероятности. Для их использования строятся оценки плотностей распределения значе- ний признаков (гистограмм) и корреляционных матриц по эталон- ным объектам разных классов. Рассмотрим алгоритм обработки для случая двух классов, ко- торый соответствует сравнению двух гипотез Н± и Я2 на основе вычисления коэффициента правдоподобия. Для независимых при- знаков коэффициент правдоподобия равен отношению функций правдоподобия Р (xi/Hk), вычисляемых для каждого l-го признака и по каждому k-му классу: 1 ~ Р (Xi/H2) Р (х2/Н2) . . . P<xL/H2) ' 1 ’ Значения частных коэффициентов правдоподобия Л (xi) = = Р (xilH.-^lP (xilH^ характеризуют относительный вклад каж- 310
дого признака в общую величину Л (X). Эти значения можно рас- сматривать как количественную оценку информативности призна- ков. Распознавание исследуемых объектов сводится к нахождению в i-й точке (ячейке) значений Р(хц!Н^ и Р (хц/Н^, которые сни- маются с гистограмм, полученных на эталонных объектах. После этого рассчитываются величины коэффициента правдоподобия (9.26). Следует отметить, что ограничения на законы распределения признаков при этом отсутствуют. Решение о принадлежности i-ro искомого объекта к классу принимается согласно критерию максимального правдоподобия при Л (Хх)>1. Если Л (Х/)< 1, справедлива гипотеза Я2, т. е. объект принадлежит ко второму классу. На основании формулы Байеса по коэффициенту правдоподо- бия находится апостериорная вероятность гипотезы Ях: , (9.27) (Pi/ps) Л(Х() + 1 где рх и р2 — априорные вероятности появления объектов соот- ветственно классов /7Х и Н2. Приняв рх = р2, получаем правило решения для апостериорной вероятности в виде р (Ях/Х()>0,5, т. е. справедлива гипотеза Ях, при р IHifXtX, 0,5 — справедлива гипотеза Н2. Поясним расчет коэффициента правдоподобия (9.26) и апосте- риорной вероятности (9.27) на примере. Пусть гистограммы значений двух признаков (Za и 6g) над эталонными объектами двух классов и На имеют вид, аналогичный приведенному соответственно на рис. 68, а и б. Требуется установить принадлежность точки наблюдений (искомого объекта) со значениями хх = Za = 550 нТл и ха = 0,65 мГал, к одному из классов. По гистограмме рис. 68, а получаем Р (х^Н,) = 0,15(15 %), Р (xalHi)= — 0,05 (5 %), а по гистограмме рис. 68, б Р (xalHj) — 0,2 (20 %), Р (xa/Ha)— = 0,17 (17 %). Тогда согласно формуле (9.26) имеем А (хх, х2) == (15/5) • (20/17) = 3 • 1,2 == 3,6 > 1 = Апор, т. е. объект со значениями Za = 550 нТл и Д# — 0,65 мГал принадлежит к классу Ях. Значение апостериорной вероятности из (9.27) при рх = ра = 0,5 будет р (Ht/xi, х2) = 3,6/(3,6 + 1) = 0,76>0,5, что соответствует гипотезе Ях. В случае необходимости распознавания объектов на число клас- сов, большее двух (М>2)» вычисления производятся непосредст- венно по формуле Байеса p(Hk/Xt)~ (9.28) У Pkp (xtiHk) 311
При этом для каждого класса последовательно находят значения piHjXi), . . . , р (НМ1Х{) и по максимальному из них принимают решение о принадлежности искомой i-й точки к тому или иному классу. При построении алгоритмов распознавания в случае зависимых признаков исходят из предположения об их нормальном распреде- лении и оценивают корреляционные матрицы R&, составленные из коэффициентов корреляции Гц (I, / = 1, . . . , L) по каждому классу в отдельности. Многомерная плотность распределения век- тора признаков Х = (Х1( ..., XL) для класса Hk определяется выражением ----------ехрГ —L(x{-pk) Rr'd-Й)Ъ (2л)£'2 I Rk I1'2 L 2 J (9.29) где R71 — матрица, обратная матрице Rft; | R* | — определитель корреляционной матрицы; р* — вектор средних значений призна- —► —► ков k-ro класса; (X,-—р.*) и (Xt—р*) — вектор-строка и вектор- столбец. Используя опять формулу Байеса (9.28), рещение о принадлеж- ности объекта к тому или иному классу принимают по максималь- ной величине апостериорной вероятности из М чисел р (Hk!Xi), k = 1, . . . , М. Реализация такого алгоритма весьма громоздка, поэтому с целью упрощения используются различные допущения, одним из которых является условие равенства матриц Rr = R2 = = . . . = Rm = R. Для случаев двух классов выражение для коэффициента правдо- подобия принимает вид Л, = ехр [ —(Xt—pO'R-1 (Xt—pi) + + -L-(X{_£)' К-Чй-Й)]. (9-30) При Л,>1 принимается решение о наличии объекта класса Нх. Логарифмирование выражения (9.30) приводит к алгоритму Х<-^КЙ-Рг)/2]*Р-1(Й-Й/>О. (9.31) Левая часть (9.31) носит название дискриминантной функции. Эффективность алгоритма построения дискриминант- ной функции проиллюстрирована рис. 70, б. Поскольку вектор признаков Xt входит в (9.31) линейно, то при равенстве нулю это выражение описывает гиперплоскость в /.-мерном пространстве признаков, разделяющую это пространство на две области Х{ £ Ht и Xi £ Я2. Алгоритм построения дискри- 312
минантной функции можно использовать и для распознавания объек- тов при М >2, производя последовательное деление каждого класса на два подкласса. Наконец, в тех случаях, когда имеется лишь один класс эта- лонных объектов и решается задача о принадлежности искомого объекта по комплексу признаков именно к этому классу, можно использовать критерий %2. В указанной ситуации возможна про- верка следующих гипотез: 1) о равенстве средних векторов признаков эталонного и рас- познаваемого объектов. Для проверки этой гипотезы используется правило (9-32) 2 2 о 1 где ад и а/2 — оценки дисперсии Z-го признака xi для эталонного (I) и распознаваемого (2) объектов; х? (L) — квантиль вероятно- сти у распределения х2 с L степенями свободы; 2) о равенстве средних значений и среднеквадратических от- клонений. Эта гипотеза проверяется по правилу - "-1П2 ~ Г~^1 ~ + 2 (In < Xv (L), (9.33) «1 + «2 L °2 ' °2 / J где о2 = (n^i + n2ff2)/(«i + п2); пг и п2 — объемы выборок со- ответственно для эталонного (1) и распознаваемого (2) объектов- и х-2, о2 и ст2 — оценки соответственно средних векторов и дис- персий признаков эталонного и распознаваемого объектов; 3) о равенстве корреляционных матриц при условии зависи- мости признаков. Эта гипотеза имеет решающее правило в виде (Хг-Х.У Г-^- + (Xi + Х2) < Xv (Ь), (9-34) L Hi n3 J где и Д2— оценки корреляционных матриц для эталонных и распознаваемых объектов. Для рассмотренных выше алгоритмов решение о принадлежно- сти объекта к тому или иному классу принимается на основе фикси- рованного порога ЛпоР=1; %? = Хо.э и т. д. Эти алгоритмы для зависимых признаков строятся в предположении об и£ нормальном распределении. На преодоление последнего ограничения направ- лена разработка алгоритмов непараметрической классификации, для которых выбор порога принятия решения происходит в про- цессе обучения на эталонных объектах. Непараметрический алгоритм, рассмотренный В. Н. Нико- ленко, основан на введении критерия качества распознавания и выборе е-окрестности распознаваемого объекта путем оптимиза- ции этого критерия. За е-окрестность принимается такое значение^ которое максимизирует величину разрешающей способности рас- познавания V. 11 А. А. Никитин 313
Разрешающая способность распознавания v определяется как разность между наибольшей и следующей по величине оценками вероятности классов в е-окрестности распознаваемого объекта с вектором признаков X, т. е. v(X, е) = р'(Х, 8)—р"(Х, в), где р (X, в) = р*(Х, е) == maxjpfe(X, е)], k=l, . . . , Л4; р”(Х, в) = р/(Х, е) = max [р{ (X, е)], / = 1, . . . , М, j k\ М. — число классов. Оценки pk и pj при равных априорных вероятностях классов определяются следующим образом: mk(X, е) / V my (X, е) Pk I / > nk I Ди П/ где tnk (X, е) — число объектов k-ro класса, попавших в в-окрест- ность распознаваемого объекта с X; nk — число всех объектов в классе л*; аналогично определяются /пДХ, в) и П/. При этом мк тк(Х, 8)=Ер«(Х, в), где Pw(X, е) = 1, Р(Х, ХЛ<)<е. О, р(Х, Х^)>8; Хн — значения вектора признаков i-ro объекта k-ro класса; р (X, Xki) — расстояние, определяемое в соответствии с выбран- ной метрикой оценки, в частности могут быть использованы фор- мулы (9.23) и (9.24). Решение о принадлежности распознаваемого объекта к определенному классу принимается по максимальной величине вероятности соответствующего класса в оптимальной е-окрестности объекта. § 47. ОБРАБОТКА ДАННЫХ КОМПЛЕКСА ПРИ ОТСУТСТВИИ ЭТАЛОННЫХ ОБЪЕКТОВ Отсутствие эталонных объектов, на которых проводится оценка статистических характеристик и информативности изучаемых при- знаков, приводит к необходимости разработки алгоритмов обра- зы
ботки данных комплекса на принципах самообучения. Распозна- вание образов без обучения на эталонных объектах называется самообучением. При этом число классов и статистические характеристики (распределение) признаков по каждому классу должны быть получены в процессе обработки исходных данных. При распознавании образов без обучения термин «классификация» больше отвечает сущности задачи, поскольку в конечном итоге пло- щадь исследования разделяется на конкретное число однородных по комплексу признаков классов. Геологическая природа таких классов остается неизвестной из-за отсутствия возможности их срав- нения с некоторыми эталонами, для ее установления требуется про- ведение горнобуровых работ. Однако необходимость разбуривания посети здесь отпадает, так как достаточно бурения одной скважины для каждого класса. Классификация геологических объектов без обучения приобретает особое значение при обработке данных руд- ной геологии и геофизики в сложно построенных в геологическом отношении районах, когда сложный и непостоянный характер геофизических полей обычно исключает возможность использова- ния эталонных объектов. Среди существующих алгоритмов классификации выделяются: эвристические, использующие различные приемы суммирования (произведения) признаков; корреляционные, базирующиеся на аппарате компонентного и факторного анализа; статистические, основанные на проверке статистических гипотез. Эвристические алгоритмы классификации Эти алгоритмы обычно строятся в предположении независимости признаков и одинаковой их информативности. Так, в одном из ал- горитмов суммирования диапазон значений каждого признака раз- бивается на заданное и одинаковое по каждому признаку число градаций, например четыре. Результатом суммирования является число (9.35) 1=1 где х/Р — представляет /-й разряд l-го признака в i-й точке. Каждый признак принимает одну из четырех градаций: 1, 2, 3, 4. В предположении о независимости и нормальном распределе- нии значений признаков при делении объектов на два класса по- рог принятия решения согласно критерию максимального правдо- подобия при суммировании (9.35) равен полусумме наибольших градаций всех признаков [10]. Например, при 1 = 4 и наиболь- шей градации, равной 4, получаем порог упор = 8, разделяющий область исследования на два класса: со значениями yt>ynoP и Z/iCl/nop- В тех же предположениях о признаках проводится суммиро- вание полных нормированных градиентов, предварительно рассчи- 11* 315
тайных по методике Березкина для каждого признака в отдельно- сти. Помимо равновесного суммирования признаков типа (9.35), когда равновесность, т. е. равная информативность, обеспечивается делением признаков на одно и то же число разрядов, используются алгоритмы неравновесного суммирования типа [3] или I ХЦ — Х1 I (9.36) — 2 где xi и — соответственно среднее значение и дисперсия /-го признака. Для определения порога принятия решения можно ис- пользовать критерий %2. При решении частных задач оказываются эффективными алго- ритмы типа yt — ХцХ21/х31, для которых не существует математи- ческого обоснования и соответственно невозможно оценить вели- чину порога принятия решения. Корреляционный алгоритм классификации В гл. III отмечалась возможность использования факторного и ком- понентного анализа для обработки данных геофизического ком- плекса, в частности метода главных компонент. Их применение позволяет провести классификацию геологических объектов по зависимым друг от друга признакам, а с помощью дисперсионного анализа оценить значимость вклада (весового коэффициента) каж- дого признака. Чтобы свести задачу обработки данных комплекса признаков для случая разделения объектов на два класса к задаче компонентного анализа, сформулируем принцип классификации следующим образом. Пусть i-й объект относится к классу Hlt если выполняется условие L hixit>yi^>//пор, . (9.37) /=1 где yt — комплексный параметр, равный сумме взвешенных зна- чений каждого признака для i-го объекта; ht — весовой коэффи- циент l-го признака; упор — порог принятия решения. Если в рассматриваемом множестве объектов существуют два класса и веса ht выбраны так, что обеспечивают различнее значе- ния у{ для этих классов, задача выделения искомого объекта сво- дится к максимизации величины Е (у/—у)2=>тах. <=1 где у = 2hi хг, xi — усредненное по всем объектам значение /-го признака. 316
При увеличении | hi | указанное выражение будет неограниченно возрастать, поэтому необходимо максимизировать отношение: * = f (yi-yY/Zhi. (9.38) i=l Z=1 Величину (9.38) можно представить в виде A'R/i, a = h'\h, где h' — вектор-строка весовых коэффициентов; h — вектор-стол- бец тех же коэффициентов; R — выборочная корреляционная мат- рица признаков; I — единичная матрица. Таким образом, максимизация (9.38) аналогична максимиза-, ции X = ft'Rft/(ft'Ift). (9.39) Это в свою очередь приводит к решению матричного уравнения вида |R—М|й = 0. (9.40) Решение уравнения (9.40), как следует из § 15, составляет за- дачу нахождения собственных значений Л и собственных векторов h симметричной положительно определенной матрицы R. Максимальное отношение (9.39) равно максимальному значе- нию Хтах матрицы R. Соответствующий ему собственный вектор h будет набором весовых коэффициентов, которые максимизируют выражение (9.39). Порог для принятия решения о наличии объекта искомого класса определяется на основе центральной предельной теоремы, согласно которой сумма случайных величин распределена нормально. Поэтому величина комплексного параметра yi распре- делена нормально и порог z/пор определяется заданием вероятности где х = (утр>—у)/ау V 2). Для вероятности у — 95 % упор = 1-65. Поскольку дисперсия величины yi равна Хтэх, для вероятности 95 % порог будет $пор = = 1,65 V^-max• Соответственно, для вероятности а=99% Упор = 2,4 -^Хппх Последовательное вовлечение в обработку новых признаков дает возможность по скорости возрастания комплексного параметра yi судить об их информативности. Пример, иллюстрирующий применение описанного алгоритма, приведен на рис. 70, а. Выражение (9.37) представляет собой глав- ную компоненту, поэтому сам алгоритм реализует вычисление по методу главных компонент. В дальнейшем применение метода главных компонент может идти; путем последовательного нахож- дения первой главной компоненты для объектов со значениями 317
У(<Упор и yi>yaop и т. д.; путем нахождения нескольких главных компонент, определяющих основную часть дисперсии в простран- стве признаков, и их геологического истолкования. Первая главная компонента выделяет объекты, характеризующиеся наибольшей энергией (дисперсией) в пространстве всех признаков. С целью гео- логического истолкования нередко оказывается полезной проце- дура получения нового набора главных компонент (факторов), т. е. вращения факторов (см. § 15 и [9]). Алгоритмы классификации на основе проверки статистических гипотез Эвристические и корреляционные алгоритмы классификации по- зволяют успешно решать задачи разделения объектов по комплексу признаков обычно на два класса. В общем случае требуется разде- ление объектов на большее число классов, причем с учетом иска- жения исходных данных помехами и возможной интерференцией аномальных эффектов. Такая задача не может быть решена при ограниченном объеме исходных данных, и необходимость исполь- зования измерений по площади при этом становится совершенно очевидной. Один из алгоритмов в предположении о независимости призна- ков основан на проведении классификации путем выделения ано- малий на фоне помех по каждому из признаков, в частности по спо- собу адаптивной фильтрации. Все выявленные этим способом аномалии являются границами некоторых однородных по своим статистическим параметрам об- ластей в плане. Такие области выделяются по каждому признаку в отдельности. Выбранный с целью обнаружения аномалий порог принятия решения предопределяет число областей по каждому признаку, а в конечном итоге и число классов, выделенных по ком- плексу признаков. Для выделенных областей каждого признака строят гистограммы и сравнивают их между собой на основе кри- терия х2 с целью объединения мало различающихся по статисти- ческим параметрам областей в один класс. В результате такой про- цедуры осуществляется разделение объектов наблюдений по каж- дому признаку на определенное число классов, охарактеризованных соответствующими оценками плотностей распределения (гисто- граммами) признаков. Завершающая процедура алгоритма клас- сификации состоит в определении индекса комплексного класса. С этой целью полученные по каждому признаку гистограммы рас- полагают в порядке возрастания их средних значений, при ра- венстве средних — в порядке возрастания дисперсий. Решение о принадлежности искомого объекта к тому или иному классу по признаку Х[ принимается по максимальному значению апостери- орной вероятности (критерию максимума апостериорной вероятно- сти), вычисляемой для каждого класса по формуле Байеса. Соответствующие решения принимаются по каждому признаку в отдельности. В результате вся площадь съемки разбивается на 318
некоторое число непересекающихся между собой участков произ- вольной формы, охарактеризованных индексами, указывающими на принадлежность данного участка к тому или иному комплекс- ному классу. Например, комплексный класс с индексом 213 озна- чает, что объект принадлежит ко второму классу первого признака, к первому классу второго признака и к третьему классу третьего признака. Для большого числа признаков обозначение комплекс- ных классов следует сводить к одной цифре или букве, имеющей соответствующие идентификаторы, например А-213. Другие алго- ритмы классификации, основанные на принципах самообучения, содержат адаптивные процедуры самой классификации. Алгоритм классификации методом /С-средних Алгоритм предложен Д. Мак-Куином и реализован А. Н. Кленчи- ным, его суть состоит в следующем. Пусть множество объектов п следует разбить на заданное число классов М п, однородных в смысле заданной метрики классов. Каждый i-й объект описан вектором изучаемых признаков хц (1=1,..., п). На первом этапе случайно выбирается k объектов из общей совокупности п объектов (точек наблюдений или ячеек) и в дальнейшем ведется последовательное уточнение этих выбранных, полагаемых эталон- ными, объектов: £v (еТ, ёг, . . . , еь) с соответствующим пересче- том приписываемых им весов h], . . . , /г*, где v — номер итерации, v = 0, 1,2,.... Первые случайно расположенные ^-объекты яв- ляются нулевым приближением, т. е. = х(; М0) = 1; i = 1, . . ., k. Затем извлекается объект (точка) x*+i и выясняется, к какому из эталонов е|0) он оказался ближе всего. Этот эталон заменяется новым, определяемым как «центр тяжести» старого эталона и при- соединенного к нему объекта Xk+i с увеличением на единицу со- ответствующего ему веса. Пересчет эталонов и соответствующих им весов на v-м шаге проводится согласно формулам e(v) = ° + *fe+V t h(v) A(v-1) + j ft<v) +1 v—1 при условии, что расстояние между Xk+V и е, минимально, т. е. р (xft+v, е?"1’) = min р (xfe+v, ejv-1)), / = 1..k, и по формулам eP = hte(v~", = • если это условие не выполняется. После уточнения эталонной совокупности проводится оконча- тельная классификация множества объектов п по комплексу при- знаков с целью выделения М классов в соответствии с правилом 319
Рис. 71, Результаты классификации геофизических полей, приведенных на рис. 69, по методу К-средних на два (а), три (б), четыре (в) и пять (г) классов (по А. Н. Кленчину) минимального дистанционного разбиения относительно «центров тяжести» (эталонных объектов) классов, т. е. ЗДЕ) = [Х:р(х, £/)<р(х, £,)], /=1......../=/=0. Это разбиение — наилучшее в смысле функционала качества Q(£)=E £ p’U, *(/)). Г=1 X] £ S который является взвешенной суммой внутриклассовых дисперсий. 320
Описанный алгоритм прост, характеризуется высоким быстро- действием и отсутствием требований к повышенному объекту ма- шинной памяти. Его применение проиллюстрировано при класси- фикации четырех геофизических полей на Бенкалинском медно- порфировом месторождении (см. рис. 69, а—г) с целью разбиения площади исследований на два — пять классов (рис. 71). Выбор критерия качества классификации определяет и сам спо- соб группирования объектов в классы, а также характер однород- ности комплексных классов. Алгоритм классификации, построен- ный В. Н. Николенко, основан на критерии максимизации средней по формируемым комплексным классам величины меры сходства*
ГЛАВА X ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ОБРАБОТКИ ГЕОФИЗИЧЕСКОЙ ИНФОРМАЦИИ Обработка геофизических данных в настоящее время ведется глав- ным образом на ЭВМ третьего поколения, что обусловлено непре- рывным увеличением объема получаемой информации. По приме- нению ЭВМ разведочная геофизика занимает одно из первых мест среди отраслей народного хозяйства. Внедрение ЭВМ в практику обработки геофизической информации проходит в рамках создания автоматизированных систем обработки (и интерпретации) данных и разработки проблемно-ориентированного программного обеспе- чения. Основные задачи автоматизированных систем обработки данных (АСОД) состоят в сборе, накоплении и хранении информации, обработке ее по определенным программам, выдаче результирую- щей информации (в виде графиков, карт, временных разрезов, ли- тологических колонок и т. д.). Функции накопления и хранения информации обеспечиваются внешними запоминающими устройст- вами ЭВМ, обработка информации выполняется процессором ЭВМ, а сбор, ввод и вывод информации — специализированными уст- ройствами ввода—вывода и каналами связи. Математическое обеспечение АСОД позволяет осуществлять все общие функции системы: управление потоком информации, передачей и записью информации и т. д. Проблемно-ориентированное программное обеспечение состоит из проблемно-ориентированной библиотеки программ и трансля- торов, позволяющих соблюдать необходимую последовательность обработки данных. АСОД — это человеко-машинная система, в ко- торой ЭВМ выполняет полностью формализованные операции и функции (обработку информации по определенным алгоритмам, передачу, накопление, хранение информации, выбор вариантов управляющих воздействий), а человек определяет цели обработки, корректирует параметры обработки при изменении структуры поля, выбирает нужное решение и т. д., т. е. человек осуществляет диа- лог с ЭВМ. Этим АСОД отличаются от систем автоматической об- работки, которые функционируют без вмешательства человека. В то же время АСОД различных геофизических методов, создавае- мых в разных организациях, не имеют технологической и информа-. ционной связи с системами обработки данных других методов и дру- гих авторов. Это приводит к дублированию многих разработок, а увязка программных комплексов осуществляется путем создания программ переформачивания данных. 322
Общесистемное программное обеспечение. При обработке геофизической информации разных методов важно придерживаться единой методологии и технологии формирования программного обеспечения с целью дальнейшего комплексного ана- лиза и создания баз данных. Программное обеспечение обработки геофизической информации, как показано В. В. Ломтадзе [9], должно быть основано на обще- системных соглашениях по логической организации массовых гео- физических данных. Общеси- стемный программный аппарат, представленный системой опе- рирования данными (СОД), рассматривается в качестве свя- зующего звена всего геофизиче- ского программного и ин- формационного обеспечения (рис. 72). Связующая роль СОД опре- деляется тем, что массовая геофизическая информация пра- ктически всегда может быть представлена в виде наборов описаний однотипных объектов так или иначе сгруппирован- ных; при обработке изменяются лишь принцип объединения объ- ектов в группы, наборы призна- ков группы и т. д. Однако все эти факторы можно описать ограниченным числом парамет- ров в каталоге (паспорте^ фай- ла (набора данных). При таком подходе структура и состав кон- кретного файла описываются со- вокупностью параметров,образу- ющих так называемое хранимое определение данных, т. е. хранимых вместе с данными в виде каталога файла. Наиболее целесообразная форма представления и хранения геофизических данных — файловая, ввиду необходимости прове- дения операций на ЭВМ с. большими объемами данных и унифика- ции результатов обработки. В СОД имеются четыре структуры данных [9]: 1) элемент — логическая неделимая структура, из которой со- ставляются структуры остальных типов. Для описания элемента используют идентификатор, т. е. имя, длину в байтах и тип эле- мента (число с фиксированной точкой или плавающей запятой или символ). Элементы — это характеристики (признаки, координаты) одного объекта; f Базы X I геолога- > 'георизичес- \них Банных , Рис. 72. Принципиальная схема программного и информационного обеспечения обработки и интерпрета- ции геофизических данных (по В. В. Ломтадзе) 323
2) запись — упорядоченная совокупность элементов, относя- щаяся к одному объекту. Запись характеризуется числом W об- разующих ее элементов и их суммарной длиной в байтах. Объектом может быть точка, ячейка, профиль, участок и т. д.; 3) массив — совокупность записей одинаковой структуры», объединяемых общим смысловым признаком. Массив состоит из заглавия (особой записи, содержащей V элементов) и записей об объектах, содержащих по W элементов. Для доступа к массиву -^используется код К, характеризующийся идентификатором Д0) который определяет принцип группировки информации в массивы. Например, R0-SMTR применительно к сейсмической информации означает, что массиву соответствует трасса, а код массива содержит номер сейсмограммы (старшие десятичные цифры) и номер трассы в сейсмограмме (две младшие десятичные цифры), SMTR-10120 означает номер сейсмограммы SM-101, а номер трассы TR-20. Воз- можно расчленение массива на подмассивы. При этом подмассивы одного массива должны иметь один и тот же код, т. е. код данного массива и заглавие массива содержатся только в первом под- массиве; 4) файл — именованная совокупность массивов одинаковой структуры, объединяемых одним признаком. Файл состоит из крат- кого паспорта и массивов. В паспорте файла содержатся: а) имя (название) файла; б) имя (обозначение) владельца; в) параметр РАСК обычно равный 1, что означает хранение данных, содержа- щихся’в файле, на ленте или диске в упакованном виде; при РАСК-0 упаковка данных запрещается; г) параметр V — число элементов данных в заглавии каждого массива; д) параметр W — число эле- ментов данных в записях файла; е) параметр Ро, символически означающий принцип кодирования массивов файла, например, Р -XX обозначает, что кодом массива является координата X про- филя, параллельного оси Y (ось X обычно направлена на север, ’ у — на восток); ж) параметры Ph Uh С, (/ = 1, . . . , V + W) описание элементов заглавий и записей массивов. Кроме перечисленных параметров, паспорт файла может вклю- чать специальную часть, т. е. любые неформализованные данные, в частности любой текст, описывающий файл. Придавая парамет- рам Ро, W, V, Pj, Uj, Cj (j = 1, . . . , V + W) определенные зна- чения, можно формализовать представление различных геолого- геофизических данных. Унификация представления массовых данных в виде файлов, характеризующихся определенным набором параметров, по су- ществу, и является основной идеей разработанной В. В. Ломтадзе системы оперирования данными — СОД. Предложенная им логи- ческая организация данных единообразна для различных версий СОД созданных для ЭВМ БЭСМ-6, «Сайбер», ЕС. В частности, созда’на версия СОД/ОС для ЭВМ типа ЕС, в которой длина и число массивов в файле не ограничены. Программный аппарат СОД включает в себя: базовые подпро- граммы управления файлами и программы общего назначения. 324
Базовые подпрограммы — это обслуживание таблиц адресов фай- лов, обмен таблиц, записанных на магнитных лентах и дисках, определение относительных адресов элементов в записи, переход от символьного представления элемента данных к словному, сор- тировка записей по возрастанию одного из элементов, ввод под- массива с перфокарт, редактирование и печать строки, опериро- вание с байтами. Подпрограммы управления файлами выполняют следующие типовые действия над ними: открытие файлов, чтение каталогов файлов; подготовку к созданию файлов и выделение пространства в памяти для файлов; открытие массива, включающее доставку в основную память всего массива или его части; подготовку к соз- данию результирующего массива; закрытие файла, включающее завершение работы с последним массивом, запись каталога файла и каталогизацию файла. Подпрограммы общего назначения выполняют следующие ос- новные функции: ввод данных с перфокарт и формирование файла на МЛ и МД; логический контроль файлов, их исправление, печать и транспортировку с выборкой требуемых массивов; перегруппи- ровку (перераспределение по массивам) информации в файлах и ее сортировку (в пределах массивов); перекомпоновку информации в записях файлов и слияние файлов. Программы общего назначе- ния представляют собой набор взаимосвязанных средств програм- мирования, облегчающих и унифицированных разработку про- граммы в целом — от ввода управляющих параметров до закры- тия созданных файлов. Эти программы позволяют свободно мани- пулировать файлами: вводить их и распечатывать, логически кон- тролировать и исправлять, перегруппировывать в них записи, объединяя эти записи в массивы по новому принципу, сортировать записи в пределах массивов, изменять последовательность элемен- тов данных в записях и состав записей, выполнять слияние запи- сей двух файлов, присоединять массивы одного файла к массивам другого. Благодаря программам общего назначения, любые системы программ, разработанные с учетом требований СОД, оказываются информационно связанными. При этом исключаются ситуации, в которых результаты работы одной программы, оформленные в виде файла, не могут быть преобразованы в файл, играющий роль входного для другой программы. Таким образом, программы об- щего назначения характеризуются максимальной независимостью от данных и их основное назначение чаще всего состоит в переходе от файлов одних структур к файлам других структур. Следовательно, системы программ обработки данных каждого геофизического метода должны создаваться с учетом общесистем- ных соглашений по организации данных, что приводит к необхо- димости группировки всей исходной, промежуточной и результи- рующей информации в файлы определенных типов. Например, в сейсморазведке исходная информация по профилю, т. е. совокуп- ность сейсмотрасс, группируется в файлы одного типа (пусть это будут файлы типа S), суммотрассы, образующие временные раз- 325
резы, группируются в файлы другого типа (тип Г), амплитудные спектры, автокорреляционные функции, получаемые при анализе волнового поля, группируются в файлы третьего типа (тип F) и т. д. Понятие файла оказывается чрезвычайно важным при создании АСОД любого геофизического метода. Назначение любой специ- альной программы заключается в осуществлении перехода от од- ного или нескольких файлов одних типов к одному или нескольким файлам других типов. Таким образом, если для геофизического метода определены типы файлов, то многочисленные программы об- работки данных этого метода могут разрабатываться независимо друг от друга. Любой переход, например от файла типа А к файлу типа В, может быть осуществлен с применением разных алгорит- мов и программ, благодаря чему обеспечивается функциональная избыточность программного аппарата. Бесспорным достоинством такого подхода является то, что АСОД по отдельным методам могут развиваться самостоятельно, но при необходимости — взаимодейст- вовать друг с другом, а также с программно-информационным обеспечением баз данных и комплексного анализа материалов. Любые файлы, создаваемые при обработке данных отдельных гео- физических методов, или непосредственно доступны другим АСОД, или с помощью программ общего назначения могут быть сделаны доступными другим АСОД, помещены в базы данных и переданы автоматизированным системам обработки данных комплекса АСОД—К. Общий подход к организаций данных всех геофизических ме- тодов позволил сформулировать и общий метод конструирования, создания и развития АСОД любых геофизических методов и их комплекса [9]. Этот метод заключается в следующем: 1) решаются основные вопросы организации данных на базе конкретизации об- щесистемных соглашений по логической организации данных, когда все исходные и промежуточные данные, а также результаты обра- ботки группируются в файлы определенных типов; решение основ- ных вопросов организации данных завершается построением двух взаимосвязанных таблиц — элементов данных и типов файлов; 2) проектируются и составляются основные программы, осущест- вляющие переходы от файлов одних типов к файлам других типов; 3) при проектировании программ выделяются и оформляются в виде автономных подпрограмм процедуры, имеющие самостоятельное значение; 4) АСОД неограниченно расширяется за счет разработки новых программ и подпрограмм, а также введения новых типов файлов. Основой общего метода В. В. Ломтадзе является решение во- просов организации обработки данных. При этом АСОД мало за- висит от выбора отдельных алгоритмов, поскольку всегда можно создать новые программы, осуществляющие переход от файлов одних типов к файлам других типов более эффективно. Кроме того, достигается полная независимость одних программ от других, а описание каждой программы становится предельно кратким, на- 326
пример: «Программа вычисления аномалий Буге осуществляет переход от одного типа файла к другому с одновременной печатью каталога гравиметрических пунктов. Вычисления выполняются в следующей последовательности: . . .», «Для управления работой программы задаются следующие управляющие параметры . . .». Независимость программ между собой, обеспечиваемая рассмотрен- ным подходом, важна для создания АСОД и их дальнейшего раз- вития. Для пользователей АСОД — геофизиков, занимающихся обработкой материалов, важна также независимость данных от программ, которая обеспечивается применением хранимого опреде- ления данных и общим методом создания АСОД. Независимость данных от программ означает, что при подго- товке данных для обработки геофизик может не знать, какими именно программами эти данные будут обрабатываться. Различ- ные группы признаков могут подготавливаться независимо друг от друга в разных журналах. Слияние информации и различные ее перегруппировки затем выполняются с помощью программ об- щего назначения. Организация баз геолого-геофизических данных Использование АСОД требует рациональной организации больших объемов информации — ее накопления, хранения и поддержания в актуальном состоянии, поиска и выборки по различным крите- риям для последующей обработки и представления новой резуль- тирующей информации. С этой целью создаются автоматизирован- ные банки данных (АБД). Под АБД понимают совокупность сле- дующих его составляющих: технического обеспечения АБД—ЭВМ определенного типа; информационного обеспечения АБД — сово- купность данных, организованных в форме баз данных (БД); ма- тематического обеспечения АБД — комплекс программ, представ- ленных в виде систем управления базами данных (СУБД); органи- зационного обеспечения АБД — специалисты по обслуживанию технических средств, системные программисты базы данных, обес- печивающие поддержание в рабочем состоянии и функционирование технического, информационного и математического обеспечения банка данных. База данных (БД) — это именованная совокупность данных, отображающая состояние объектов и их отношений в рассматри- ваемой области. Сама база данных состоит: из схемы БД, иерархи- чески организованной по определенным правилам с использова- нием специального языка описания данных (ЯОД) и из совокупно- сти данных, организованных в соответствии со структурой, описан- ной в схеме БД. Банк данных организуется таким образом, чтобы данные со- бирались один раз и централизованно хранились. Это обеспечи- вает их доступность всем специалистам. Одна из важных черт базы данных — это независимость данных от особенностей прикладных 327
программ, которые их используют, т. е. изменение значений дан- ных или особенностей их хранения не требует изменения приклад- ных программ. Любая АСОД может иметь в своем составе несколько баз дан- ных с различной структурой и одну универсальную СУБД, обслу- живающую все базы данных. Задачи СУБД; а) создание БД;, б) поддержание БД в актуальном состоянии, т. е. возможность модификации данных — замена и удаление записей и массивов, загрузка новых записей и массивов; конструирование новых струк- тур данных; замена и удаление отдельных схем структур; загрузка новых структур; в) поиск и выборка данных из БД. Результатом работ геолого-геофизических организаций яв- ляется информация о геологическом строении территории, о вы- явленных и разведанных месторождениях полезных ископаемых. Следовательно, проблема сохранения этой информации для целей последующего комплексного анализа совместно с новыми данными чрезвычайно важна. Но при решении такой проблемы следует учи- тывать специфику геолого-геофизических данных, которая затруд- няет эффективное использование универсальных систем управле- ния базами данных. Эта специфика заключается в следующем: 1) геолого-геофизические данные обычно являются площадными, т. е. файлы (наборы данных) привязаны к конкретным площадям, а записи, соответствующие отдельным объектам или точкам наблю- дения, имеют координатную привязку; 2) геолого-геофизические данные характеризуются огромными объемами и подготавливаются многими организациями; 3) массовые геолого-геофизические дан- ные, в отличие от информации, рассматриваемой с позиции созда- ния банка данных, характеризуются не иерархической структурой, а масштабами, детальностью и точностью работ. Кроме того, при организации базы геолого-геофизических дан- ных (БГД) необходимо учитывать проблему связи с ней при обра- ботке информации. Обычно эта проблема решается путем универ- сальных СУБД с помощью ЯОД. При решении задач обработки геофизической информации, когда круг применяемых алгоритмов очень широк, а объемы данных велики, применение универсальных СУБД оказывается неэффективным по двум причинам: 1) для об- работки данных по конкретной территории требуются записи, от- носящиеся только к этой территории, и поэтому эффективнее выб- рать эти записи из БД перед обработкой и сгруппировать их в файл, а не извлекать каждую запись из общей БД на каждом этапе и для каждого алгоритма обработки; 2) для решения разных задач дан- ные должны-быть сгруппированы и упорядочены по-разному, иначе затраты машинного времени на доставку записей с дисков и лент будут недопустимо велики; именно поэтому в СОД Ломтадзе ис- пользуется такая структура данных, как массив, а перегруппировка записей файла в новые массивы и сортир’овка записей в массивах легко выполняются одной из программ общего назначения; выпол- нять же аналогичным образом многократную реорганизацию всей базы данных практически невозможно. 328
С учетом сказанного в СОД предусматривается обработка дан- ных на основе файлов, но такой подход не отвергает концепцию баз данных, а сочетается с ней. Файлы «откладываются» в регио- нальных БД по мере поступления их, и в любой момент из регио- нальных БД может быть создана локальная (целевая) БД. При организации баз геолого-геофизических данных первооче- редной задачей является сохранение всех фактических материалов и обеспечение возможности использования их для многократной последующей обработки совместно с новыми данными. Решение этой задачи основывается В. В. Ломтадзе на вводимых им понятиях региональных и локальных баз данных — РБД и ЛБД. Под ЛБД понимается совокупность файлов, содержащих информацию, не- обходимую для решения конкретной геологической задачи в за- данном районе. РБД — это совокупность всех файлов, содержа- щих геолого-геофизические данные на один год одного листа кар- тографической разграфки масштаба 1 : 1 000 000. Фактически ЛБД всегда существует в период обработки первичных материалов. Например, все файлы, используемые при подготовке отчета, обра- зуют ЛБД. Часть этих файлов содержит первичнее, еще не обра- ботанные данные. В других файлах содержатся обработанные дан- ные с прямыми связями с геологией участка работ. Обычно каж- дый из файлов содержит данные одного геофизического метода. Поэтому локальные базы, создаваемые геолого-геофизическими пар- тиями в период подготовки отчетов, следует называть локальными методными базами Данных. ЛБД создают также для проведения комплексного анализа геолого-геофизической информации, накопленной за многие годы. Такие базы данных можно считать временными, целевыми. Созда- ние целевых баз для проведения комплексных тематических работ по обобщению и анализу можно осуществить путем извлечения требуемых данных из РБД. В свою очередь, основным источником информации для формирования РБД являются локальные метод- ные базы. К ЛБД следует отнести постоянно действующие целе- вые базы по месторождениям определенного типа, скважинам, ло- кальным структурам и т. п. Формы их взаимодействия с РБД раз- ные. Для управления постоянно действующими целевыми базами данных целесообразно использование универсальных СУБД. Ком- пактной и эффективной является СУБД «Компас», на основе ко- торой Э. Ю. Миколаевским и др. создана СУБД «Геокомпас», спо- собная работать и с файлами в форматах СОД для БЭСМ-6. Рассмотрим пример записи базы данных с учетом формирования РБД по листам масштаба 1 : 1000 000. Каждая база имеет имя, состоящее из буквы и четырех цифр. Имя Р4879 означает, что БД включает все файлы, содержа- щие результаты работ, завершенных в 1979 г. в пределах листа Р48. Каждому файлу, включаемому в БД, например в базу Р4879, присваивается трехзнач- иый регистрационный номер в пределах базы, допустим 102. Тогда именем файла является сочетание имени базы и этого номера, т. е. Р4879102. При включении в РБД, например в базу листа Р48, файл записывается на одну из леит, относящихся к этому листу, например на ленту Р4800. По- сле записи на МЛ файла на диск записывается поисковый образ этого файла. 329
С этой целью на дисках для каждого листа масштаба 1 : 1 000 000 создается файл образов файлов, имеющий имя этого листа, пусть Р48. Файл образов состоит из коротких массивов, при этом одним массивом описывается поиско- вый образ одного файла РБД. Рассмотренная организация баз геолого-геофизических данных позволила построить программный аппарат, доступный массовому пользователю. Его функциями являются: а) создание и хранение РБД; б) внесение изменений в файлы в случае ошибок в хранимых данных; в) формирование ЛБД из региональных по запросам; г) предоставление справок по запросам. Первые две функции вы- полняет СОД, а остальные две — специально созданные программы, в результате использования которых быстро (минуты) создается файл ЛБД, доступный всем комплексам программного обеспече- ния обработки геофизических данных. Программное обеспечение отдельных геофизических методов К настоящему времени для каждого из основных геофизических методов создано по несколько АСОД, в результате чего накоплен значительный опыт разработки геофизических АСОД. Однако их постоянный рост свидетельствует о том, что существующие АСОД во многих отношениях неудовлетворительны. Поэтому поиск оп- тимальных систем продолжается. Любая высокоорганизованная АСОД состоит из трех частей: базы данных, управляющей части и библиотеки обрабатывающих (прикладных) программ. Специфика регистрируемых физических полей, методики на- блюдений и предварительной обработки данных вынуждает строить АСОД по каждому методу в отдельности. Наиболее развитыми си- стемами являются системы обработки сейсморазведочных данных, полученных методом МОВ—ОГТ. Конечным результатом обработки обычно является временной разрез. Одной из распространенных в производстве сейсморазведочных работ является система СЦС-3 для ЕС ЭВМ, основанная на исполь- зовании мощной операционной системы ЕС (Центральная геофи- зическая экспедиция Миннефтепрома). Другой используемой в про- изводстве системой является СЕЙСПАК (сейсмический пакет), созданный во ВНИИГеофизике. По своим основным параметрам — насыщенности графа обработки процедурами и технологичности — СЕЙСПАК уступает СЦС-3. В системе оперирования данными, предложенной В. В. Лом- тадзе для сейсморазведки, по сравнению с системой СЕЙСПАК проще реализуются межпрограммные связи и упрощена процедура включения новых подпрограмм в библиотеку. При решении вопро- сов организации данных вся информация (сейсмическая, вспомо- гательная и временно создаваемая при работе программ) группи- руется в файлы нескольких типов. При этом программа-монитор, выполняющая, например, построение различных временных раз- 330
резов, осуществляет переход от файлов типа S к файлам типа Т, но к обработке трасс как до, так и после суммирования могут быть подключены любые функциональные подпрограммы. Программное обеспечение гравиразведки развивается многими геофизическими организациями. Первые АСОД в гравиразведке были созданы в МГУ (О. К- Литвиненко) и Институте геофизики АН УССР (В. И. Старостенко и др.). В ПГО «Днепргеофизика» разработана специальная форма полевого журнала, используе- мого партиями, перешедшими на АСОД. Достаточно мощная АСОД разработана в Казахстанской опытно-методической экспедиции Мингео КазССР. В то же время совершенно очевидна целесообраз- ность создания единой отраслевой системы, поскольку для создан- ных АСОД в гравиразведке отсутствуют технологическая и инфор- мационная связи и связь между АСОД других методов. Кроме того, существенна зависимость данных от программ, как правило, имеются ограничения на объемы обрабатываемых данных, отсутст- вуют связи между этапами обработки и количественной интерпре- тацией. Поэтому разработка АСОД ГРАВИПАК была нацелена на устранение перечисленных недостатков. К настоящему времени система ГРАВИПАК включает программы [9J: стандартной пер- вичной обработки (введение поправок за рельеф, вычисление ано- малий Буге, пересчет координат и т. д.); аппроксимации, интерпо- ляции и разделения полей; решения прямых задач; решения обрат- ной задачи способом эквивалентных призм. Этот комплекс программ создан в соответствии с общей методологией СОД и требует даль- нейшего функционального накопления. Для обработки данных магниторазведки разработана автомати- зированная система АСОМ— АГС/ЕС (Л. А. Коваль и др.). Она предназначена для обработки материалов наземных и аэрогеофи- зических (магнитных, спектрометрических и электроразведочных) съемок на ЭВМ ЕС с топографической привязкой данных различ- ными способами. Существенным скачком качества обработки данных магниторазведки является переход на магнитомеры с твердотельной памятью. На основе принципов организации обработки, заложенных в си- стему ГРАВИПАК, во ВНИИГеофизике создается система ЭПАК для обработки и интерпретации данных электроразведки. При существенных различиях в объемах информации, регистра- ции физических полей, физических и математических основах раз- ных геофизических методов в обработке их данных выделяются следующие общие этапы: 1) подготовительный, при котором данные вводятся в ЭВМ (при аналоговой записи — после аналого-цифро- вого преобразования), затем введенная информация преобразуется в один из стандартных форматов, формируется паспорт объекта и производится визуализация данных в графической форме для их контроля; 2) редактирование данных, включающее ввод различ- ных поправок (за рельеф, верхнюю часть разреза), отбраковку из- мерений с грубыми ошибками, коррекцию регистрирующей аппа- ратуры, уточнение координат точек наблюдения, упорядочение (сор- 331
тировка) данных и т. д.; 3) выделение сигналов на фоне помех. При этом изучаются частотный состав и корреляционные характери- стики поля, направление осей сигналов и помех, выполняются различные процедуры фильтрации с целью выделения полезных сигналов, трансформации и редукции, получение изображений геофизических полей, максимально очищенных от помех. После перечисленных трех этапов осуществляется количественная интер- претация данных отдельных методов, при которой определяются параметры искомых геологических объектов и проводится построе- ние физике-геологической модели среды. Заключительным этапом обработки данных является комплексная интерпретация призна- ков различных методов (комплексный анализ). Программное обеспечение обработки данных комплекса геофизических методов Наибольшее число АСОД создано с целью обработки данных ком- плекса геологических, геофизических и геохимических признаков. В их основе, как правило, лежат те или иные алгоритмы распозна- вания образов, решающие задачи прогноза оруденения или нефте- газоносности. Для регионального прогноза месторождений твердых полезных ископаемых по данным наземных и космических съемок создано две АСОД с достаточно универсальными базами данных: системы РЕГИОН (Международный научно-исследовательский институт про- блем управления) и АСПО-8 (ПГО «Аэрогеология»). Система РЕГИОН состоит из: 1) регионального банка картогра- фической, числовой и текстовой информации (данные аэрокосми- ческих и наземных съемок и комплексные геолого-геофизические описания месторождений); 2) блока разработки вариантов решения, содержащего специальные математические и эвристические модели и алгоритмы распознавания; 3) блока диалоговых процедур; 4) че- ловеко-машинной технологии, охватывающей основные этапы ре- шения задач геологического прогноза. Блок диалоговых процедур является техническим обеспечением человеко-машинного взаимо- действия и состоит из комплекса внешних и внутренних интер- фейсов. К внешним интерфейсам относятся блоки ввода исходной информации, язык пользователей системы и блок оформления вы- ходной информации. К внутренним интерфейсам относятся трансля- тор языка пользователей, блоки преобразования информации в вид, пригодной для машинного анализа, и блоки формирования целевых массивов пользователей. Исходная и преобразованная картографическая и числовая ин- формации хранятся в ЭВМ на внешних магнитных носителях в виде библиотечных файлов. Структура хранения картографического, материала в банке сочетает в себе иерархический и матричный принципы. Широкий комплекс различных технологий обработки информа- ции, хранящейся в банке данных, позволяет специалистам-геоло- 332
гам осуществлять быструю оценку информативности различных на- боров признаков для возможных типов месторождений и выделять на изучаемой территории участки, имеющие сходство с эталонами по тем или иным наборам признаков. Другая аналогичная система — АСПО-8 (автоматизированная система прогноза оруденения до 8 различных типов месторождений) также содержит разветвленную базу данных и позволяет прово- дить справочно-информационное обслуживание. Структура хране- ния данных построена по иерархическому и матричному принци- пам. Данные хранятся на магнитных дисках в файлах прямого доступа. Применение системы позволяет решать задачи прогноза, в числе которых: учет всех имеющихся данных и выявление важнейших рудоконтролирующих факторов и признаков оруденения; синтез различных признаков объектов в единый показатель — индекс перспективности объекта с учетом количественной оценки прогноз- ных запасов (см. § 44); оперативность обработки данных и возмож- ность контроля качества прогноза. Введенный здесь индекс пер- спективности существенно отличает АСПО-8 от системы РЕГИОН. Кроме того, АСПО-8 предусматривает расчет широкого набора вторичных признаков, в частности полученных путем аналитиче- ского продолжения физических полей. АСПО-8 реализована на ЭВМ ЕС с операционной системой ДОС/ЕС на языке ФОРТРАН. Оперативная память 5J2 К-слов обеспечивает решение прогнозно- металлогенических задач при количестве признаков до 100, коли- честве градаций в каждом признаке до 25,’размере целевых масси- вов одновременно обрабатываемых данных до 12 000 чисел по каж- дому признаку, количестве классов объектов до 8, количестве эта- лонных (обучающих и контрольных) объектов в каждом классе от 32 до 150. Математический аппарат распознавания системы РЕГИОН в основном базируется на проведении гиперплоскостей, а АСПО-8—на вычислении апостериорных вероятностей. Широкий спектр геологических задач: расчленение и сопостав- ление разрезов, геологическое, геохимическое, петрофизическое, литофациальное виды картирования, оценка перспективности пло- щадей в процессе геолого-съемочных, прогнозных и поисковых ра- бот — решает созданная в КазВИРГе АСОД—Прогноз. Автомати- зированная система обработки материалов разведочной геофизики АСОМ-РГ, также разрабатываемая в КазВИРГе, имеет основную область применения — построение математических моделей гео- логических объектов и их взаимоотношений с целью количествен- ной комплексной интерпретации геолого-геофизических данных. АСОМ-РГ включает 36 модулей решения прямых задач по грави- разведке, 15 — по магниторазведке и И—по электроразведке, охватывающих методы МПП, ВП и заряда. Автоматизированная система прогноза нефтегазоносности гео- логического разреза «Припять» (БелНИГРИ) по комплексу, первич- ных и вторичных признаков сейсмического поля, рассчитываемых в окне, осуществляет прогноз на основе регрессионного анализа. 333
Эта система уже имеет базу данных. Формирование базы данных не включено пока в систему СКИД (ВостСНИИГиМС). В системе КОМПАК (В. В. Ломтадзе) вопросы обработки дан- ных комплекса решаются на основе общесистемного обеспечения (см. рис. 72). В рамках этой технологии включены следующие этапы комплексного анализа данных: извлечение информации из методных файлов и получение файла, записи которого описывают изучаемые объекты полным набором признаков; расширение ис- ходной системы признаков путем расчета вторичных признаков; одномерный статистический анализ и нормализация распределе- ний признаков; факторный анализ; регрессионный анализ и рас- познавание образов на основе проверки статистических гипотез. В начале 70-х годов появились первые автоматизированные системы комплексной интерпретации результатов геофизических исследований скважин: КАРОТАЖ (ВНИИГеофизика), Ц-3, (Цикл-3) (Центральная геофизическая экспедиция Миннефте- прома); ГИК-2М (ВНИИНефтепромгеофизика и ВНИИГИС); ПГ-20 (ЮжНИИГеофизика и АзИНефтехим); САМОТЛОР (Тюменьнефте- геофизика). Эти системы были ориентированы на ЭВМ разных ти- пов и отличались друг от друга организационной структурой, но все они были направлены на решение задач оперативной обработки данных ГИС. К настоящему времени ведущими организациями Мингео СССР и Миннефтепрома завершена совместная разработка по единому техническому заданию автоматизированной системы обработки и интерпретации результатов ГИС — АСОИГИС, пред- назначенной для ЭВМ третьего поколения и, в частности, для ЭВМ ЕС в двух версиях, рассчитанных на различные операционные си- стемы ЭВМ ЕС: АСОИГИС/ОС рассчитана на ЭВМ с большим объе- мом памяти (512 К-байт и более) и АСОИГИС/ДОС — для ЭВМ с меньшей памятью (256 К-байт). Система АСОИГИС/ОС построена на основе единой базы данных, структура которых не зависит от содержания конкретных задач и назначения обрабатывающих программ. Данные, содержащиеся в базе, отдельны от их описания [13]. Эта система оперирует с двумя понятиями базы данных: посто- янной и временной. Постоянная база данных предназначена для долговременного хранения и использования информации, необ- ходимой для решения геолого-геофизических задач. Временная база представляет собой совокупность информации, необходимой для работы всех программ, включенных в одно задание. Содержа- ние врёменной базы используется и сохраняется только на протя- жении выполнения одного задания. Основные обрабатывающие программы выполняют решение следующих задач: 1) редактирование каротажных данных с маг- нитной ленты, получаемой с помощью устройства подготовки дан- ных ЕС-9002, которое состыковано с преобразователем Ф014;; 2) трансформация каротажных данных; 3) расчленение разреза по кривым КС градиент-зондов; 4) определение существенных значе- ний КС; 5) уточнение удельного электрического сопротивления 334
промывочной жидкости; 6) определение удельного электрического сопротивления пластов универсальным способом по данным БКЗ и ИК; 7) построение сводного геофизического разреза; 8) выделе- ние коллекторов глин и плотных пород путем диагностических ко- дов (обработка данных комплекса ГИС с использованием эталон- ных объектов); 9) оценка коэффициента пористости по данным АК с учетом глинистости и НГК; 10) оценка коэффициента водонасы- щенности; 11) выдача результатов интерпретации либо на АЦПУ, либо на специализированные устройства.
СПИСОК ЛИТЕРАТУРЫ 1. Аронов В. И. Методы математической обработки геолого-геофизи- ческих данных на ЭВМ. М., Недра, 1977. 2. Большее Л. Н., Смирнов Н. В. Таблицы математической статистики. М., Наука, 1965. 3. Вахромеев f. С. Основы методологии комплексирования геофизи- ческих исследований при поисках рудных месторождений. М., Недра, 1978. 4. Вычислительные математика и техника в разведочной геофизике. Справочник геофизика. Под редакцией В. И. Дмитриева, М., Недра, 1982. 5. Гольцман Ф. М. Статистические модели интерпретации. М., Недра, 1971. 6. Гурвич И. И., Боганик Г. Н. Сейсмическая разведка. М., Недра, 1980. 7. Жуков Н. Н. Вероятностно-статистические методы анализа геолого- геофизической информации. Киев, Вища школа, 1975. 8. Кулханек 0. Введение в цифровую фильтрацию в геофизике. М., Недра, 1981. 9. Ломтадзе В. В. Программное обеспечение обработки геофизических данных. Л., Недра, 1982. 10. Никитин А. А. Статистические методы выделения геофизических аномалий. М., Недра, 1979. 11. Рапопорт М. Б. Вычислительная техника в полевой геофизике. М., Недра, 1984. 12. Системы регистрации и обработки данных сейсморазведки/М. К. Пол- шков, Е. А. Козлов, В. И. Мешбей и др. М., Недра, 1984. 13. Сохранов Н. Н., Аксельрод С. М. Обработка и интерпретация с по- мощью ЭВМ результатов геофизических исследований нефтяных и газовых скважин. М., Недра, 1984. 14. Страхов В. Н. Основные идеи и методы извлечения информации из данных гравитационных н магнитных наблюдений.— В кн. Теория и ме- тодика интерпретации гравитационных и магнитных аномалий. М., изд. ИФЗ, 1979, с. 146—264. 15. Тархов А. Г., Бондаренко В. М., Никитин А. А. Комплекснрова- ние геофизических методов. М., Недра, 1982. 16. Тихонов А. Н., Арсенин В. JJ. Методы решения некорректных за- дач. М., Наука, 1979. 17. Троян В. Н. Статистические методы обработки сейсмической инфор- мации при исследовании сложных сред. М., Недра, 1982. 18. Шрайбман В. И., Жданов М. С., Витвицкий 0. В. Корреляционные методы преобразования и интерпретации геофизических аномалий. М., Недра, 1977. 19. Цифровая обработка сейсмических данных/Е. А. Козлов, Г. Н. Го- гонеиков, Б. Л. Лернер и др. М., Недра, 1973.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ А Автокорреляционная функция 106, 109, 208, 233 --гауссова типа 112 --марковского типа 112, 238 --треугольного типа 112 Автоматизированная система обра- ботки данных 322 -------АСОД-Прогноз 333 -------АСОИГИС 334 -------АСОМ-АГС/ЕС 331 -------АСОМ-РГ 333 -------АСПО-8 332 -------ГРАВИПАК 331 -------КАРОТАЖ 334 -------КОМПАК 334 -------«Припять» 333 -------РЕГИОН 332 -------СЦС-3 330 Адаптивная фильтрация 269 Алгоритм Вилкоксона 282 — детерминистский 308 — зиаково-ранговый 281 — Кора-3 304 — корреляционный 316 — метода К-средних 319 — потенциала 305 — регрессионного анализа 309 — тупиковых тестов 305 Амплитудно-частотная характери- стика фильтра 173 Аномалия достоверная 255 — геофизическая 165 — локальная 165 — фоновая 166 Асимметрия распределения 14 Б Бейеса формула 10, 247, 259, 295 База данных 327 ---- локальная 329 ---- региональная 329 В Варимакс 88 Вероятностно-статистический под- ход 4, 5 Вероятность апостериорная 10 — априорная 10, 245 — ошибки первого рода 245 — ошибки второго рода 245 — правильного обнаружения сиг- нала 246 --- события 9 Весовая функция 171 Взаимно-корреляционная функция 116, 208, 233 Волновое число 194 Выборочный коэффициент корреля- ции 40 ---регрессии 48 Г Генеральная совокупность 20 Геометрическая вероятность 12 Геофизическая информация 3 Геофизический фон 57 Гиббса явление 178 Гипотеза ненулевая 244 — нулевая 244 — простая 26 — сложная 26 Гистограмма 25, 216, 244 Главные компоненты 91, 231 д Двумерная автокорреляционная функция 122, 237 Двумерная взаимно корреляцион- ная функция 126 Двумерный фильтр 193, 236 Двусторонний критерий 26 Дельта-функция 112, 143, 157 Детерминированный подход 4 Дискриминантная функция 312 Дисперсионный анализ 74 Дисперсия — аппроксимации 40 — общая 76 — остаточная 75 — предсказания 40 — случайного процесса 105 — факторная .75 Доверительная вероятность 21 Доверительный интервал 21 Закон больших чисел 19 Запись данных 324 Знаковая функция 143 И Импульс Кронекера 110 Индекс перспективности 295 Интеграл Пуассона 183 — свертки 142, 170 337
— Фурье 139 Интервал корреляции 113 Интерполяционный полином Лаг- ранжа 65 ------ Ньютона 66 Интерполяция системой гармониче- ских функций 72 Информативная совокупность при- знаков 293 Информативность признака 292 Информационная матрица Фишера 39 К Квантиль распределения 13 Квартимакс 88 Ковариация 15 Компонентный анализ 91 Корреляционная трансформанта 56 Корреляционное отношение 46 Корреляционный метод разделения аномалий 57 --- трансформации аномалий 56 --- преобразования аномалий 55 Корреляционный момент 15 Корреляция 35 Коэффициент вариации 14 — корреляции 15 — правдоподобия 247 — ранговой корреляции 42 — риска 294 — Кендалла и Смита 45 — Фурье 131, 135 Критерий Байеса 246 — Вальда 249 — Вилкоксона 28 — Кочрена 78 — Колмогорова 26 — максимального правдоподобия 22, 247 — максимума пикового отношения сигнал/помеха 206 — максимума энергетического отно- шения сигнал/помеха 207 — минимального риска 246 — минимакса 247 — минимума среднеквадратического отклонения 203 — Неймана—Пирсона 248 — Пирсона 27 — Стьюдента 30 — Фишера 30 — Фридмана 80, 286 Критическая область 26 Крутизна среза 181 Кубический сплайн 67 Л Лапласа преобразования 157 Линейный оператор 170 — сплайн 66 338 — фильтр 170 Логнормальный закон 17 Локальность прогноза 294 М Массив данных 324 Математическая модель 164, 289 Математическое ожидание случай- ного процесса 105 ---случайной величины 14 Матрица ковариационная 15 — корреляционная 15 Мера сходства 294 Метод главных компонент 91 — интерполяции 65 — максимального правдоподобия 22 — максимума энтропии 220 — моментов 22 — наименьших квадратов 35 Множественный коэффициент кор- реляции 43 Мода 14 Модель аддитивная 164 — мультипликативная 164 Н Надежность разделения объектов 297 — обнаружения сигнала 246, 251, 253 — прогноза 294 Начальный момент 14 Независимость случайных вели- чин 15 Некоррелированность случайных ве- личин 15, 40 Непараметрические способы 280 Нормальное поле 165 Нормальный закон распределения 16 О Область принятия гипотезы 26, 245 Обобщенная характеристика си- стемы 200 Односторонний критерий 26 Оператор фильтра 170 Ортогональное вращение 88 Отношение сигнал/помеха 205 Ошибка первого ряда 245, 298 — второго рода 245, 298 Оценка 21 — асимптотически нормальная 22 — несмещенная 21 — состоятельная 21 — эффективная 21 П Первая главная компонента 91 Период сигнала 129
Плотность распределения 13 Полная группа событий 9 Помехи геологические 166 — негеологические 166 — неслучайные 166 — случайные 166 Преобразование Фурье 136 ---быстрое 136 --- обратное 133 ---прямое 133 — Гильберта 174 Произведение событий 9 Пуассона закон 18 Р Равномерный закон 17 Радиус корреляции 113 Разрешающая способность 115, 199, 314 Ранговая взаимно-корреляционная функция 117, 284 Распознавание образов — • — без обучения 290 --- с обучением 290 Распределение Пирсона 18 — Стьюдента 19 — Фишера 19 Реализация случайного процесса 104 Регуляризация по Тихонову 204 Регрессия линейная 46 — множественная 52 — нелинейная 50 Репрезентативная выборка 20 Риск 246 Ряд Котельникова 147 С Свертка двух сигналов 142, 171, 185 — двух спектров 142, 185 Сечение случайного процесса 104 Сигнал апериодический 129, 139 — дискретный 129 — желаемый 202 — максимально-фазовый 186 — минимально-фазовый 186 — непрерывный 138 — периодический 129 — слабый 243 Система нормальных уравнений 37 — оперирования данными 323 — случайных величин 14 — управления базой данных 328 Системная функция 186, 189, 192 Случайная величина 12 Случайный процесс 104 ---стационарный 106 ---эргодический 107 Собственные векторы 90 — значения 90 События достоверные 8 • — независимые 10 _ — несовместные 8 — противоположные 9 — случайные 8 Спектр амплитудный 131, 138, 139 — комплексно-сопряженный 133, 138 — комплексный 133, 138 — мощности 139 — текущий 153 — Уолша 159 — фазовый 131, 138, 139 — Ханкеля 140 — энергетический 133, 138, 152 Спектральная плотность 142, 150, 154, 220 Сплайн-функции 66, 67, 69 Способ адаптивной фильтрации 269 — межпрофильной корреляции 262 — непараметрической фильтрации 280 — обратных вероятностей 257 Средний риск 246 Средняя мощность 133 Статистика 21 — знаковая 280 — порядковая 281 — ранговая 281 ' Статистическая гипотеза 26, 244 — зависимость 35 — функция распределения 24 Статистический эффект 199 Статистическое определение вероят- ности 9 Стерджеса формула 25, 31 Структурная функция 108, 127 Сумма событий 8 Т Теорема Котельникова 144, 147 Тренд-аналнз 58 Треугольная функция 143 У Узлы интерполяции 65 Условия интерполяции 65 Условная вероятность 10 Ф Фазово-частотная характеристика фильтра 173 Файл 324 Факторизация матрицы 87 Факторная сумма 76 Факторное пространство 102 Фильтр Баттерворта 180 — веерный 196 — воспроизведения 209 — высокочастотный 176 339
— двумерный 193 — инвариантный во времени 175 — Колмогорова—Винера 208 — корректирующий 216 — косинусного сглаживания 178, 183 — линейный 170, 193 — низкочастотный 176 — обратный (сжатия) 214 — оптимальный 202 — переменный во времени 175 — полосовой 176 — прогнозирования 220 — пространственно-временной 193, 196 — режекторный 176, 192 — рекурсивный 175, 187, 192 — сглаживания 209 — скоростной 170, 196 — согласованный 223 — физически осуществимый 171 — цифровой 175 — Чебышева 182 — энергетический 229 Фильтрация 170 Формула Байеса 10, 247, 259 Функция отсчетов 143 — правдоподобия 22, 244 — распределения 13 — Уолша 159 — Хэвисайда 143 — Чебышева 159 г— целевая 88 X Характеристика направленности си- стемы 197 Ц Целевое свойство 291 Центральная предельная теорема 20 Центральный момент 14 Ч Частота дискретизации 147 — Найквиста 131 — основная 131 — пространственная 194 — среза фильтра 176, 181 Частный коэффициент корреляции 45 Частотная характеристика фильтра 173 Э Эксперимент регрессионный 101 — факторный 102 — экстремальный 101 Эксцесс распределения 14 Элайсннг-эффект 148 Элемент данных 323 Энергетическое отношение сигнал/по- меха 199 Эргодичность случайного процесса 107
ОГЛАВЛЕНИЕ Введение ........................................................ 3 Глава I. Основные понятии теории вероятностей н математической статистики в задачах обработки геофизических данных . . 8 § 1. Событие и вероятность.............................. 8 § 2. Случайная величина ................................12 § 3. Статистические оценки..............................20 § 4. Статистическая проверка простых гипотез............26 § 5. Обработка данных измерений физических свойств горных х пород .................................................31 Глава II. Корреляционно-регрессионный анализ, интерполяции и аппроксимация геофизических данных...............................35 § 6. Корреляция и регрессия.........................35 § 7. Оценка тесноты корреляционной связи............40 § 8. Виды регрессий, и нх применение................46 § 9. Корреляционные методы преобразования гравитацион- ных н магнитных аномалий................................54 § 10. Кусочно-полиномиальная аппроксимация сейсмической информации .............................................62 § 11. Полиномиальные интерполяция и сглаживание .... 64 § 12. Интерполяция системой гармонических функций ... 72 Глава III. Дисперсионный н факторный анализы геофизических дан- ных . . .........................................................74 § 13. Основы дисперсионного анализа.....................74 § 14. Дисперсионный анализ при изучении тренда..........82 § 15. Факторный анализ..................................85 § 16. Метод главных компонент...........................89 § 17. Области применения факторного и компонентного ана- лизов ..................................................93 Глава IV. Корреляционные характеристики геофизических полей . 104 § 18. Основные понятия теории случайных процессов .... 104 § 19. Автокорреляционная функция и ее применение .... 109 § 20. Взаимно корреляционная функция н ее применение . . 116 § 21. Двумерные корреляционные функции.................122 § 22. Структурная функция..............................127 Глава V. Спектральный анализ геофизических сигналов.............129 § 23. Спектры дискретно заданного сигнала..............129 § 24. Спектры непрерывных сигналов и их дискретных анало- гов ............................................... . . 138 § 25. Спектры случайного процесса................... . . 149 § 26. г-преобразование и разложение сигналов по другим си- стемам ортогональных функций...........................155 § 27. Основные приложения спектрального анализа при обра- ботке геофизических данных.............................161 Глава VI. Лниейнаи фильтрации геофизических полей ...... 164 § 28. Математическая модель поля. Понятия сигнала (анома- лии) и помехи......................................... 164 § 29. Понятие о линейной фильтрации. Свертка...........170 § 30. Построение фильтров для заданного диапазона частот . 176 841
§ 31. Построение фильтров в комплексной плоскости .... 185 § 32. Двумерные линейные фильтры . ....................193 Глава VII. Оптимальные линейные фильтры.........................202 § 33. Критериальный подход к построению линейных фильтров 202 § 34. Фильтр Колмогорова—Винера........................208 § 35. Согласованный фильтр.............................223 § 36. Энергетический фильтр............................229 § 37. Двумерные оптимальные фильтры....................236 Глава VIII. Выделение слабых геофизических сигналов на основе проверки статистических гипотез.................................243 § 38. Критерии принятия статистических решений . . . - . . 244 § 39. Надежность обнаружения сигнала...................251 § 40. Способ обратных вероятностей................... 257 § 41. Способ межпрофнльной корреляции..................262 § 42. Способ адаптивной (самонастраивающейся) фильтрации 269 § 43. Непараметрнческне приемы обнаружения сигналов . . 280 Глава IX. Обработка данных комплекса геофизических признаков . 288 § 44. Принципы обработки данных комплекса..............289 § 45. Оценка информативности признаков.................297 § 46. Обработка данных при наличии эталонных объектов . . 304 § 47. Обработка данных при отсутствии эталонных объектов 314 Глава X. Программное обеспечение обработки геофизической информации .................................................... 322 Список литературы............................................... . 336 Предметный указатель............................................337
УЧЕБНИК Алексей Алексеевич Никитин ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОБРАБОТКИ ГЕОФИЗИЧЕСКОЙ ИНФОРМАЦИИ Редактор издательства И. П. Иночкина Технические редакторы Ф. П. Мельниченко, Л. Г. Лаврентьева Корректор Т. М. Столярова ИБ № 5497 Сдано в набор 02.12.85. Подписано в печать 13.05.86. Т-07965. Формат 60X90*/ie. Бумага кн.-журн. имп. Гарнитура Лите- ратурная. Печать высокая. Усл.-печ. л. 21,5. Усл. кр.-отт. 21,5. Уч.-изд. л. 21,69. Тираж 5500 экз. Заказ 79/9335—3. Цена 1 руб. Ордена <3нак Почета» издательство «Недра», 103633, Третьяковский проезд, 1/19 Ленинградская типография № 4 ордена Трудового Красного Знамени Ленинградского объединения «Техническая книга» им. Евгении Соколо- вой Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 191126, Ленинград, Социа- листическая -ул., 14.
Вниманию читателей! f В издательстве „Иедра„ готовятся к печати и выйдут в свет новые книги Вахромеев Г. С. Давыденко А. Ю. МОДЕЛИРОВАНИЕ В РАЗВЕДОЧНОЙ ГЕОФИЗИКЕ М.: Недра — 15 л.—2 р. 30 к. Рассмотрены сущность фнзико-геологической модели объекта геофизического изучения (ФГМ), классификация ФГМ, способы и особенности формирования моделей, их использование при пла- нировании полевого эксперимента и интерпретации геофизиче- ских данных. Применение детерминированных, вероятностно- статистических и динамических ФГМ иллюстрируется примерами из региональной, нефтяной, рудной и инженерной геофизики. Для научных работников — геофизиков и геологов, занимаю- щихся комплексированнем, математической обработкой и интер- претацией данных геофизических методов. Полезна студентам геологических специальностей вузов. План 1987 г. № 27 КОМПЛЕКСИРОВАНИЕ ГЕОФИЗИЧЕСКИХ МЕТОДОВ ПРИ РЕШЕНИИ ГЕОЛОГИЧЕСКИХ ЗАДАЧ/Под ред. Никитского В.Е. Бродового В. В.— 2-е изд. перераб. и доп.— М.: Недра,— 35 л.— 2 р. 20 к. Рассмотрены методика комплексирования геофизических нссле' дований и применение комплексов при решений геологических задач, связанных с поисками и разведкой полезных ископаемых (рудных, нерудных, нефти, газа, угля и др.), изучением строе- ния регионов, геологическим картированием, инженерно-гео- логическими и гидрогеологическими исследованиями. Приведены сведения об основах методов, о геологических возможностях геофизических методов на основе петрофизических критериев и геолого-геофизических моделей. Во втором издании (1-е изд.— 1976) обновлены основные разделы, включены материалы о си- стемном подходе к комплексированию. Для геофизиков, геологов, занимающихся планированием и про- ведением геофизических работ, обработкой и интерпретацией материалов. План 1987 г. № 32. Предварительные заказы на книги принимают местные магазины книготорга, распространяющие научно-техническую литературу. Своевременно оформите заказы на интересующие Вас издания! Предварительный заказ гарантирует приобретение нужной книги! Издательство «Недра»