Text
                    ФИЗИКи-МАТШАТИЧЕСКАН ЫШЛИОТ?КЛ ИНЖЕНЕРА
В. В. НАЛИМОВ
ПРИМЕНЕНИЕ
МАТЕМАТИЧЕСКОЙ
СТАТИСТИКИ
ПРИ АНАЛИЗЕ
ВЕЩЕСТВА
ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1960


13-5-4 АННОТАЦИЯ В книге рассматривается применение аппа- аппарата математической статистики в химических и физических методах анализа вещества. Изло- Изложение материала иллюстрируется многочислен- многочисленными примерами, доведенными до численных расчетов. Большое внимание уделяется физи- физической интерпретации результатов статистиче- статистических исследований. Подробно освещен опыт зарубежных работ в этой области. Книга предназначена для инженеров-физи- инженеров-физиков и химиков, работающих в аналитических лабораториях. Она может служить настоль- настольным пособием по применению математической статистики при анализе вещества. ОГЛАВЛЕНИЕ Предисловие ' Глава I. Задачи математической статистики .... И Глава П- Классификация аналитических ошибок . . 18 Глава Ш. Случайная величина и ее характеристики. 34 § 1. Распределение случайной величины 34 § 2. Среднее значение случайной величины и дисперсия 38 Среднее значение случайной величины C9). Дисперсия и средняя квадратичная ошибка D2). § 3. Вычисление дисперсий по текущим измерениям . . 49 § 4. Закон сложения ошибок 52 § 5. Ошибки косвенных измерений • . . . . 60 Абсорбционный спектральный анализ F1). Эмиссионный спектральный анализ F3). Глава IV. Нормальное распределение 68 § 1. Функция нормального распределения 68 § 2. Некоторые специальные распределения, связанные с нормальным распределением 78 {-распределение G9). /.^-распределение (89). F-распреде- ление (93). г-распределение (96). § 3. Критерии для оценки степени близости наблюдае- наблюдаемого распределения к нормальному распределению 98 Оценка с помощью /.2-критерия (99). Оценка с помощью ^.-критерия A07). Проверка гипотезы нормальности по большому числу малых выборок A12). Метод спрямлен- спрямленных диаграмм A18). § 4. Отклонения от нормального распределения в анали- аналитической работе 122 Глава V. Распределение Пуассона и биноминальное распределение 135 § 1. Распределение Пуассона 135 § 2. Оценка результатов полуколичественных определе- определений при помощи распределения Пуассона .... 145 § 3. Биноминальное распределение 153
ОГЛАВЛЕНИЕ Глава VI. Оценка результатов анализа 159 § 1. Сравнение двух средних с помощью 2-критерия . . 159 § 2 Сравнение нескольких дисперсий 164 § 3. Проверка гипотезы однородности результатов из- измерений. Оценка резко выделяющихся опреде- определений . 168 § 4. Секвенциальный (последовательный) анализ . . . 177 § 5. Непараметрическая статистика 185 Проверка гипотезы о наличия постоянного расхождения в результатах наблюдений A86). Проверка гипотезы о случайном характере флуктуации A89). Метрологи- Метрологические оценки на основании неравенства ЧеОышева A93). Глава VII. Дисперсионный анализ .... 197 § 1. Определение дисперсии, обусловленной действием одного фактора 197 Идея метода и простейшие примеры A97). Дисперсион- Дисперсионный анализ при неравных столбцах B05,). Условия, при которых можно применять дисперсионный анализ B07). Пример применения дисперсионного анализа при изу- изучении методических ошибок B09). § 2. Многоступенчатая классификация 214 Двухступенчатая группировка B14). Трехступенчатая группировка B21). § 3. Комплексный опыт 227 Двухсторонняя классификация B27). Трехсторонняя классификация B42). § 4. Планирование эксперимента по методу латинского квадрата 253 § 5. Эффективность дисперсионного анализа 256 Г лава VIII. Статистика линейных связей 258 § 1. Способ наименьших квадратов 258 Определение параметров градуировочного графи- графика B58). Среднее взвешенное неравноточных измере- измерений B67). § 2. Регрессионный анализ 268 Проверка гипотезы линейности B68). Сравнение парамет- параметров градуировочных графиков с теоретически ожидае- ожидаемыми значениями B72). Сравнение двух градуировочных графиков B84). Проверка гипотезы о параллельном сме- смещении градуировочных графиков B90). Оценка резуль- результатов анализа, полученных с помощью градуировочного графика B93). | 3. Корреляционный анализ 298 § 4. Пример комплексного планирования эксперимента с применением различных статистических методов анализа 314 оглавление 5 Глава IX. Некоторые приемы работы, связанные со ста- статистическим планированием эксперимента . 325 § 1. Отбор проб и рандомизация условий эксперимента. Применение таблицы случайных чисел 325 § 2. Выбор числа параллельных определений .".... 328 § 3. Документация материала 339 § 4. Контрольные диаграммы 357 Приложение Таблица 1. Значения функции Ф (и) = —т==. \ е 2 с!и 362 —оо Таблица 2. Значения удвоенной нормированной функ- U и2 2 С ции Лапласа 20 (и) =—== \ е 2 du . . 366 ]/2я * Таблица 3- Значения t для различных уровней зна- значимости 367 Таблица 4. Значения Хр в зависимости от вероятности Р (X2 > %%) и числа степеней свободы Х2-рас- пределения 368 Таблица 5. Вероятность Р (X2 > Хр) н зависимости от значения Хр и числа степеней свободы %г-рас- пределения 370 Таблица 6. Значения F для различных уровней значи- значимости 374 Таблица 7. Значения г для различных уровней значи- значимости 378 Таблица 7А. Значения rmax (или rmin) для различных уровней значимости 378 Таблица 8. Значения коэффициента корреляции rX!l для различных уровней значимости 379 Таблица 9. Вероятности -Р(^) для различных значепий к 380 Таблица 10. Вероятности появления значений г, заклю- заключенных в интервале шириной 0,1 .... 380 Таблица 11. Число испытаний с менее часто встречаю- встречающимся знаком для различных уровней зна- значимости при различном числе наблюдений п 382 Таблица 12. Значения верхних и нижних пределов об- общего числа серий R для различного числа наблюдений п 383 Таблица 13. Пяти- и однопроцентные пределы для отно- отношения наибольшей эмпирической диспер- дисперсии к сумме А' эмпирических дисперсий . . 384
ОГЛАВЛЕНИЕ Таблица 14. Случайные числа 386 Таблица 15. Квадраты трехзначных чисел 397 Литература 401 I. Основные руководства и монографии по математи- математической статистике и теории вероятностей 401 II. Обзоры и библиографические источники по вопро- вопросам, связанным с применением математической ста- статистики при анализе вещества 407 III. Статьи по вопросам, связанным с применением ма- математической статистики при анализе вещества, опубликованные в периодической печати и сборни- сборниках 408 Алфавитный указатель 425 ПРЕДИСЛОВИЕ Целью настоящей книги является изложение методов математической статистики в применении к задачам, свя- связанным с анализом вещества. В конце XIX и начале XX века на базе теории вероят- вероятностей началось создание современной математической статистики в связи с запросами биологии и экономики. За последние десятилетия математическая статистика как метод исследования стала интенсивно применяться в таких областях науки и техники, как агробиология, медицина, машиностроение и приборостроение, химиче- химическая промышленность, металлургия и др. Особенно интен- интенсивное развитие статистических методов исследования наблюдается в последние годы. Совсем недавно на основе теории вероятностей создалась совершенно новая дисцип- дисциплина—теория информации, первоначальной задачей кото- которой было изучение вопросов, связанных с передачей сигналов в радиотехнике. На базе теории информации стала развиваться кибернетика—наука об управлении. Совершенно неожиданно теория информации нашла при- применение в оптике. Весьма перспективным представляется сейчас применение идей теории информации при доку- документации научных и технических материалов. В связи с интенсивным развитием ядерной физики появилась новая область применения теории вероятностей—ста- вероятностей—статистика счета ядерных частиц. Одной из новых областей применения математической статистики являются исследования, связанные с анали- анализом вещества. Необходимость применения статистиче- статистических методов при анализе вещества обусловливается рядом факторов. Здесь надо прежде всего указать на то, что внедрение в производство новых сложных по своему
ПРЕДИСЛОВИЕ составу сплавов, материалов и непрерывное ускорение процесса производства заставили широко применять но- новые физические методы анализа, основанные на протека- протекании мало изученных процессов, не поддающихся строгому контролю и точному регулированию. Наличие множества новых аналитических методов наряду со старыми класси- классическими методами анализа остро ставит вопрос об отыска- отыскании разумных критериев для сравнения результатов анализа, полученных разными методами. Развитие и внедрение новых аналитических методов происходит значительно быстрее, чем их стандартизация. Это неизбежно приводит к тому, что в каждой, даже не- небольшой, аналитической лаборатории приходится посто- постоянно сталкиваться со сложными метрологическими про- проблемами, рациональное решение которых невозможно без применения методов современной математической статистики. Уже сейчас стало ясно, что аналитик должен так же хорошо владеть методами современной матема- математической статистики, как геодезист владеет методом наименьших квадратов. Каждая новая область применения математической статистики требует своего особого методического подхода. Опыт, полученный при статистических исследованиях в одной области, нельзя механически переносить на сосед- соседние, даже, казалось бы, близкие области. В частности, например, математическая теория ошибок, разработан- разработанная, исходя из задач метрологии и геодезии, не может быть без существенного видоизменения перенесена в об- область аналитической химии. Поэтому наряду с руковод- руководствами общего характера по математической статистике появилась необходимость в специализированных руковод- руководствах, рассчитанных на работников данной узкой обла- области. Большой опыт в издании специализированных ру- руководств накопился за рубежом, где вместе с выпуском значительного количества пособий общего характера, посвященных применению математической статистики в исследовательских работах, появился ряд специальных руководств по применению статистических методов иссле- исследования в химии. В книге делается попытка систематизировать и обоб- обобщить те работы, которые появились за последние годы ПРЕДИСЛОВИЕ 9 в области статистических исследований, связанных с ана- анализом вещества. Мы полагаем, что в ближайшем будущем можно будет построить общую теорию анализа вещества па базе теории вероятностей так, как в свое время уда- удалось создать общую теорию измерений—метрологию. В настоящее время создание такой теории находится еще в зачаточном состоянии. Первым и наиболее трудным шагом в построении этой теории является формулировка на математическом языке всех задач, связанных с анали- анализом вещества. Книга написана преимущественно в рецептурном пла- плане. Основные положения математической статистики не доказываются, а разъясняются на примерах, заимство- заимствованных из работ, связанных с анализом вещества. Теоре- Теоретические вопросы рассматриваются только в той мере, в какой это необходимо для понимания метрологической стороны рассматриваемой проблемы. Для чтения книги необходимо знание математического аппарата в объеме втузовского курса и знакомство с осно- основами теории вероятностей. Главы, посвященные общим вопросам теории вероятностей, ставят задачей напом- напомнить читателю основные положения этой дисциплины. Книга не претендует на систематическое и полное из- изложение идей современной математической статистики. В ней рассматриваются только те статистические методы, которые уже нашли применение в лабораторной работе при анализе вещества и были освещены в периодической печати. Расположение материала в книге подчинено развитию основных идей статистического анализа, которые иллю- иллюстрируются примерами их применения при анализе вещества. При таком расположении материала к решению задач, связанных с одим и тем же видом аналитических работ, приходится возвращаться несколько раз. Тем не менее такое изложение является с нашей точки зрения вполне оправданным, поскольку при решении задач, связанных с одними и теми же видами аналитической работы, приходится пользоваться как некоторыми очень простыми статистическими методами, так и сложными приемами, понимание которых возможно только на базе изучения предыдущего материала.
10 ПРЕДИСЛОВИЕ В конце книги дается аннотированный указатель основных руководств по математической статистике и журнальных статей, посвященных статистическим иссле- исследованиям проблем, связанных с анализом вещества. Мы надеемся, что издание этой книги будет способ- способствовать дальнейшему развитию и внедрению статисти- статистических методов исследования в аналитических лабора- лабораториях. Автор заранее выражает благодарность как за замеча- замечания принципиального характера, так и за указания на возможные опечатки. В, Налимов ГЛАВА I ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ Математическая статистика—наука, опирающаяся на теорию вероятностей и использующая результаты опыта для изучения объективных закономерностей исследуемых явлений. Это определение математической статистики носит весьма общий характер, обусловливаемый тем, что мате- математическая статистика находит применение в самых раз- разнообразных областях науки и техники. Применение мате- математической статистики в какой-либо одной научной дис- дисциплине всегда связано с преимущественным использо- использованием определенных ее аспектов. В лабораторной работе и, в частности, при анализе вещества математическая статистика используется преимущественно для свертыва- свертывания (сокращения) и анализа экспериментального материа- материала методами, основанными на теории вероятностей. Объяс- Объясняется это тем, что в исследовательских работах приходит- приходится иметь дело с действием и взаимодействием большого числа факторов, трудно поддающихся учету, поэтому постановка одной серии экспериментов обычно не дает возможности обнаружить действующие здесь физические закономерности. Эти закономерности могут быть выявле- выявлены только при сравнении результатов исследований, выполненных над различными объектами в различных условиях и разных лабораториях. Такое сравнение ста- становится возможным только в том случае, если результаты опытов с помощью математической статистики представ- представляются в компактной форме, удобной для хранения, передачи и дальнейшей обработки. Свертка (сокращение) информации, в частности, заключается, например, в том, что с помощью аппарата математической статистики всю
12 ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ [гл. I информацию о точности аналитического метода можно представить в виде функции (закона) распределения оши- ошибок этого метода, характеризующегося параметрами рас- распределений: дисперсией или средним квадратичным от- отклонением и математическим ожиданием*). В аналитической работе часто приходится ограничи- ограничиваться сравнительно небольшим числом определений. Это небольшое количество наблюденных величин можно рассматривать как случайную выборку из некоторого гипотетического бесконечного множества—генеральной совокупности, которая является математической моделью реально наблюдаемых величин. Задача свертывания ин- информации с математической точки зрения сводится в этом случае к тому, что по выборке определяют некоторые величины (выборочную дисперсию и среднее арифметиче- арифметическое значение случайной величины), которые являются оценкой неизвестных параметров (соответственно дис- дисперсии и математического ожидания) функции распре- распределения этой генеральной совокупности. При оценке (оп- (определении) параметров генеральной совокупности по выборке, естественно, вносится известный элемент неопре- неопределенности, который можно учесть методами математиче- математической статистики. Среди экспериментаторов распростра- распространено совершенно неправильное мнение о том, что математи- математическая статистика применима только к большому цифро- цифровому материалу. Современная математическая статистика дает возможность оценивать параметры генеральных сово- совокупностей и устанавливать для них доверительные пре- пределы даже по весьма малым выборкам,—в некоторых случаях всего по двум измерениям. Но при этом, есте- естественно, что чем меньше экспериментальный материал, тем менее точно может быть произведена оценка парамет- параметров генеральной совокупности по их выборочным значе- значениям. Таким образом, математическая статистика, с одной стороны, дает возможность компактным образом предста- представить результаты эксперимента, а с другой стороны, по- позволяет количественно оценить тот элемент сомнения, который сопутствует каждому эксперименту при малом числе опытов. *) Определение этих понятий см. в гл. III. гл. I] ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 13 Вопрос о разработке и стандартизации достаточно надежных и удобных способов свертывания информации становится особенно актуальным в последние годы в связи со все увеличивающимся числом исследовательских работ во всех областях науки. На рис. 1 приведена кривая, 200 180 160 140 120 100 80 60 40 го - - 1300 /310 /920 /7 И / / 1930 /940 МО Рис. 1. Рост суммарного числа публикаций в ре- реферативном журнале «Physics Abstracts», начиная с 1900 г. [162]. По оси ординат — накопленные суммы в тысячах, по оси абсцисс — годы. показывающая рост числа публикаций в реферативном журнале «Physics Abstracts», начиная с 1900 г. [162]. На протяжении почти 50 лет удается проследить экспо- экспоненциальный ход кривой*), который нарушился только *) Экспоненциальный характер роста наблюдается для числа научных журналов, количества работников, занятых на исследо- исследовательских работах, и для ассигнований на эти работы. Общее число журналов в настоящее время достигает 100 000, количе- количество реферативных журналов близко к 300. Во всех случаях постоянная экспонент такова, что показа- показатели развития науки удваиваются за каждые 10—15 лет. Эсктра-
14 ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ [ГЛ. I в годы войны. Каждые 10—15 лет число публикаций удваи- удваивается. Увеличение числа публикаций неизбежно приво- приводит к сокращению среднего объема публикации. Неко- Некоторые журналы за последние годы сократили объем пуб- публикуемых статей почти в два раза, в дальнейшем надо предвидеть еще большее сокращение объема публикуемых работ. Произвольное сокращение статей редакторами журналов приводит к потере значительной части инфор- информации, содержащейся в экспериментальном материале. Если раньше читатель имел возможность оценить степень достоверности результатов на основании пространных описаний как условий эксперимента, так и способов его обработки, то теперь эта возможность исключается, и с особой остротой возникает необходимость в компактной количественной оценке того элемента неопределенности, который связан с экспериментом. Сведения о точности и правильности анализа, приводи- приводимые в разного рода рабочих инструкциях и аналитических поляция в историческое прошлое приводит к значению, равному единице в 1700 г., т. е. в эпоху Ньютона, которая может считаться началом современного периода развития науки. Таким образом, экспоненциальный характер развития науки, по-видимому, вы- выполнялся в течение последних 200—250 лет. Экспоненциальный характер развития науки можно вывести из весьма вероятного предположения достаточно общего характера. Аналитическое выражение для экспоненты y = aekt, k>0, можно рассматривать как решение дифференциального уравне- уравнения dy где производная -j- означает скорость роста интересующих нас показателей, т. е. увеличение их за единицу времени. Таким образом, экспоненциальный характер развития является следст- следствием весьма вероятного предположения о том, что относительная скорость роста dy ydt •= const является постоянной величиной. Нетрудно видеть, что удвоению всех показателей за 10—15 лет соответствует относительная ско- скорость роста в 5—7% в год [172]. гл. I] ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 15 ГОСТ'ах, и данные, характеризующие эталоны и стандарт- стандартные образцы (однородность эталонов, достоверность, с ко- которой установлено среднее содержание вещества в них и пр.), также надо рассматривать как свертывание информа- информации, содержащейся в тех больших экспериментальных рабо- работах, которые проводились при изучении данного вопроса. Наконец, результаты текущих анализов также можно рассматривать как свертывание той информации, которая была получена в результате нескольких параллельных определений пробы неизвестного состава, а в ряде слу- случаев еще и контрольных анализов эталонов или стандарт- стандартных образцов. Таким образом, можно утверждать, что свертывание информации при помощи математической статистики долж- должно явиться составной частью любого аналитического про- процесса. Анализ вещества может считаться законченным только тогда, когда материал представлен компактным образом и произведена оценка надежности полученных данных. Идея применения математической статистики для свер- свертывания информации была выдвинута Р. Фишером [28а]. Основатели англо-американской статистической школы Р. Фишер и К. Пирсон, как известно, стояли на махистских позициях, и в их работах свертка информации часто превращалась в самоцель. Такая интерпретация одной из задач математической статистики, конечно, не может быть признана правильной, она противоречит позиции советской статистической школы, которая считает главной задачей математической статистики выявление объектив- объективных закономерностей. Свертывание информации в действительности представ- представляет собой не самоцель, а одну из составных частей слож- сложного процесса познания объективно существующих зако- закономерностей. Поясним это следующим примером: такой важный для эмиссионного спектрального анализа вопрос, как влияние «третьих элементов», освещен в той или иной степени в сотнях работ, причем каждая из работ рассма- рассматривает этот вопрос для какого-то частного случая, ис- используя ограниченный экспериментальный материал. Ни одна из этих работ, взятая в отдельности, не содержит до- достаточно данных для того, чтобы можно было проникнуть
ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ [ГЛ. I в природу этого сложного явления. Если бы результа- результаты всех работ были свернуты при помощи математиче- математической статистики и представлены некоторым стандартным образом, удобным для сопоставления и дальнейшей обра- обработки, то, по-видимому, можно было бы, обобщая весь материал в целом, приблизиться к пониманию природы этого сложного явления, с одной стороны, а с другой стороны, сделать практически важные выводы для разра- разработки аналитических методов. Таким образом если мы воспользуемся математической статистикой для свертки информации, то это даст возмож- возможность рассматривать отдельные работы как части одного большого коллективного эксперимента, а сам процесс свертки рассматривать как некоторую составную часть процесса познания, которая становится особенно актуаль- актуальной сейчас, в связи со все увеличивающимся числом отдельных исследований частного значения, нуждаю- нуждающихся в дальнейшем обобщении. При такой постановке вопроса интересующие нас аспекты математической ста- статистики могут рассматриваться и как задачи кибернети- кибернетики—дисциплины, которая занимается прежде всего проб- проблемами свертки и переработки информации. Более сложной является вторая из интересующих нас задач математической статистики—анализ эксперимен- экспериментального материала. Обе задачи математической стати- статистики—анализ экспериментального материала и компакт- ное представление полученных при этом результатов— оказываются органически связанными между собой. Целью статистического анализа является, с одной стороны, получение максимальной информации при ми- минимальной затрате труда на проведение эксперименталь- экспериментальных работ, с другой стороны—оценка достоверности полу- полученных результатов. К статистическому анализу исследователю приходится обращаться каждый раз, когда он, пользуясь ограниченным экспериментальным материалом,- - хочет трезво оценить роль того или иного изучаемого фактора. Статистический анализ значительно усложняется, если приходится изу- изучать одновременное действие нескольких факторов и их взаимодействие. Благодаря развитию статистических ме- методов анализа в ряде случаев оказалось возможным ГЛ. I] ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 17 радикальным образом изменить методику проведения экспериментальных работ. Если при классической поста- постановке экспериментальных работ исследователь стремился поставить опыты так, чтобы варьировать только один фактор, а остальные факторы оставались по возможности на одном уровне, то теперь с применением статистических методов анализа становится возможным варьировать одновременно несколькими факторами—такая постановка оказывается экономически более выгодной, так как по- позволяет получить больше информации при меньшей затрате труда. Применение статистического анализа дает возможность в ряде случаев получить существенную информацию путем несложной обработки результатов текущих анализов, если эти анализы выполнялись в соответствии с заранее разработанной программой. Статистический анализ нельзя рассматривать только как некий более или менее удобный прием математической обработки цифрового материала. Опыт показал, что при- применение статистического анализа оказывается эффектив- эффективным только в том случае, если эксперимент планируется в полном соответствии с тем способом статистического анализа, который в дальнейшем будет применен для обра- обработки его результатов. Та или иная форма статистического анализа, выбранная исследователем, полиостью определяет собой планирование эксперимента и интерпретацию его результатов. Естественно поэтому, что формы статисти- статистического анализа, несмотря на их некоторую общность, должны разрабатываться в соответствии с задачами дан- данной дисциплины, так как они в дальнейшем определят методологию исследования в данной области науки. 2 В. В. Налимов
ГЛАВА II КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК Рассмотрим «опрос о том, в какой степени возможно применение методов теории вероятностей к изучению тех сложных процессов, которые связаны с анализом вещества. Ответ на этот вопрос можно дать, проведя последователь- последовательную классификацию аналитических ошибок. В повседневной лабораторной работе обычно принято делить аналитические ошибки на две группы: ошибки воспроизводимости и методические ошибки, причем пер- первую из этих групп принято относить к случайным ошиб- ошибкам, вторую группу—к систематическим. В соответствии с таким делением часто считают, что математическую статистику можно применять только к аналитическим ошибкам воспроизводимости. Указанное деление аналитических ошибок нельзя считать правильным. Говорить о случайных ошибках можно только тогда, когда четко определено и ограничено множество измерений. Если переменная величина, при- принадлежащая к этому множеству, принимает значение, зависящее от случая, и для нее может быть определена некоторая функция, называемая функцией распределения, то такую величину принято называть случайной. Говорить, что значение переменной величины зависит от случая, можно тогда, когда невозможно предсказать «конечное состояние», исходя из «начального состояния» и извест- известных нам законов природы. С подобной ситуацией прихо- приходится сталкиваться каждый раз, когда мы не можем точно описать начальное состояние системы, или когда недоста- недостаточно хорошо известны законы, которым подчиняется процесс, а также тогда, когда эти законы хорошо известны, но очень сложны, и поэтому точное вычисление становится ГЛ. Ilj КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК 19 невозможным, и, наконец, тогда, когда действует очень большое количество факторов, строгий и точный учет которых становится практически невозможным. По-ви- По-видимому, нельзя дать точного и легко поддающегося физи- физической интерпретации определения того, что понимается под словом случайность, смысл этого понятия будет уточ- уточняться по мере рассмотрения отдельных примеров. Систематические ошибки—это ошибки, вызванные од- одной или несколькими причинами, действующими по определенным законам [1]. Для того чтобы с уверен- уверенностью установить наличие систематической ошибки, мы должны знать эти законы ; в этом случае систематиче- систематическая ошибка может рассматриваться как поправка к измерению. Необходимо подчеркнуть, что различие между слу- случайными и систематическими ошибками весьма относи- относительно—оно зависит от выбранного для рассмотрения множества измерений и от поставленной перед исследова- исследователем задачи. Например, если рассматривается множество измерений диаметра какой-нибудь детали при помощи дефектного микрометра, то по отношению к этому множе- множеству измерений ошибку, вносимую дефектным микромет- микрометром, можно рассматривать как систематическую. Если же мы будем рассматривать множество микрометров, выпу- выпущенных заводом, то ошибку в изготовлении микрометров можно уже рассматривать как случайную величину. Второй пример, если мы рассматриваем множество изме- измерений, выполненных при разных температурах, а изме- изменение температуры не учитывается, то по отношению к этому множеству температурная ошибка будет случай- случайной величиной. Если же измерения производить при строго фиксированных температурах и определить закон, по которому действует изменение температуры на резуль- результаты измерения, то температурную ошибку можно будет рассматривать как систематическую и даже как по- поправку к измерениям. Анализ вещества является сложным измерительным процессом, поэтому здесь нужно с особой осторожностью подходить к разделению ошибок на случайные и система- систематические. При изучении аналитических ошибок нужно рассматривать следующие множества измерений. 2*
20 КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК [ГЛ. II 1. Предположим, что имеется статистический ансамбль, состоящий из множества измерений одного стандартного образца (или спектрального эталона*)), выполненных в одной лаборатории, в пределах небольшого отрезка времени. Если мы примем за центр рассеяния среднее арифметическое из результатов анализа, то случайную ошибку, полученную по отношению к этой величине, будем в дальнейшем называть внутрилабораторной ошиб- ошибкой воспроизводимости или просто ошибкой воспроизво- воспроизводимости. Очень часто совершенно необоснованно считают, что все случайные ошибки анализа ограничиваются одной ошибкой воспроизводимости. Если при достаточно большом количестве параллельных определений обна- обнаруживается упорное расхождение между результатами анализа (центрами рассеяния) и паспортными данными стандартного образца (или спектрального эталона), то имеем постоянную ошибку, которую часто называют «систематической ошибкой» анализа. Обычно полагают, что она характеризует методическую ошибку анализа в целом, по крайней мере, для проб, близких по составу к данному стандартному образцу, хотя причины появ- появления этой ошибки и законы, по которым действуют эти причины, обычно остаются неизвестными. Если исходить из данного выше определения систематической ошибки, то эту величину, постоянную для данного множества из- измерений, еще нельзя рассматривать как систематическую ошибку данного метода анализа. Грубое и метрологически не оправданное деление аналитических ошибок только на две категории—внутрилабораторные ошибки воспроиз- воспроизводимости и «систематические» ошибки—привело к тому, что объектом применения математической статистики в аналитической работе до сих пор часто оказываются только внутрилабораторные ошибки воспроизводимости, *) Стандартные образцы для химического анализа и эталоны для спектрального анализа — это образцы с надежно установлен- установленным содержанием вещества, выпускаемые специально на то упол- уполномоченными организациями. Термин «спектральные эталоны» не надо путать с метрологическим понятием эталонов, которые определяются как «образцовые меры и образцовые измерительные приборы, служащие для воспроизведения и хранения единиц измерения с метрологической точностью» (ГОСТ 1453-42). ГЛ. II] КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК 21 так как математическая статистика по своему существу имеет дело только со случайными величинами. Интересно отметить, что существующие аналитические ГОСТ'ы также ограничиваются только требованиями, предъявляемыми к внутрилабораторным ошибкам воспроизводимости—это показано в работе А. Б. Шаевича [105], а также в нашей работе по изучению ошибок воспроизводимости при хими- химическом анализе углеродистых сталей [117]. В общем балансе ошибок химического анализа внутрилабораторная ошибка воспроизводимости играет небольшую роль, по- поэтому некоторые авторы [114] считают, что математиче- математическая статистика вообще не может применяться для выяв- выявления действительных ошибок химического анализа. 2. Допустим, что тот же стандартный образец (или спектральный эталон) продолжают анализировать через более или менее длительные интервалы времени. Теперь становится случайной переменной та величина, которая по отношению к предыдущему множеству измерений была постоянной. Происходит это потому, что ряд факторов, которые были постоянными при получении предыдущего множества измерений, стали теперь переменными. Во времени меняется чистота воды, реактивов, происходит износ разновеса, изменяется давление, влажность, тем- температура, освещенность рабочего места, иногда незамет- незаметным образом меняются некоторые приемы работы и про- прочее; все это в той или иной степени оказывает влияние на результаты анализа. В [64] на большом эксперименталь- экспериментальном материале, относящемся к изучению 40 различных методов химического анализа, было показано, что ошибки, характеризующие рассеяние результатов относительно средних значений, полученных за длительный интервал времени, могут в два раза и более превосходить ошибки воспроизводимости, полученные в благоприятных усло- условиях, за короткий промежуток времени. Интересно отме- отметить, что даже при такой простой измерительной опера- операции, как отсчет по линейной шкале, разность средних значений, полученных двумя операторами, заметно флук- флуктуирует во времени. Это иллюстрируется на рис. 2, заим- заимствованном из работы [84], на котором нанесены средние отсчеты, полученные при изучении старения медицинских термометров. Каждая точка на графике представляет
22 КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК [ГЛ. II собой средний результат отсчетов, сделанных для 216 тер- термометров. Разность средних отсчетов для двух наблюда- наблюдателей меняется во времени как по величине, так и по знаку. Здесь мы имеем типичный пример того, как наблю- наблюдатели незаметным для себя образом меняют во времени систему наблюдения даже при выполнении самых простых Наблюдатель В и'/ш год /7/ ~зш т 28 ш Рис. 2. Изменение во времени средних значе- значений, полученных двумя наблюдателями при изучении старения термометров [84]. По оси ординат—отсчеты по шкале Фаренгейта выше точки, соответствующей 106°. отсчетов. Разность отсчетов, выполненных двумя наблю- наблюдателями, может рассматриваться как постоянная вели- величина до тех пор, пока мы ограничиваемся множеством измерений, выполненных за короткий промежуток вре- времени и она превращается в случайную величину, если мы переходим к рассмотрению множества измерений, выполненных за длительный интервал времени. 3. Пусть тот же стандартный образец или спектраль- спектральный эталон анализируется в разных лабораториях—мы получаем каждый раз новое множество измерений, кото- которое может быть существенно отличным по величине сред- среднего арифметического от предыдущих,—здесь опять-таки случайной переменной становится та величина, которая была постоянной в отдельном множестве измерений. Кроме того, статистический ансамбль (совокупность), состоящий из множества измерений одной пробы в разных ГЛ. II] КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК 23 лабораториях, может существенно отличаться от стати- статистического ансамбля, полученного из множества анализов другой пробы в тех же лабораториях. Опыт показывает, что относительная квадратичная ошибка*), полученная для одного из этих ансамблей, не дает возможности пред- предсказать, какова будет аналогичная величина для другого ансамбля; законы распределения для этих ансамблей также могут быть различны. 4. Наконец, рассмотрим множество измерений раз- различных по составу, но однотипных стандартных образцов или спектральных эталонов, выполненных в одной лабо- лаборатории в течение небольшого промежутка времени. Вычислим для каждой пробы разность между паспортны- паспортными данными и средним результатом анализа и выразим эту разность в процентах по отношению к паспортным данным. Образуем совокупность объектов для статисти- статистического исследования из подсчитанных таким образом относительных ошибок. Эту несколько необычную сово- совокупность рассмотрим наиболее подробно, так как с ней в аналитической практике приходится сталкиваться каж- каждый раз, когда для контроля за уровнем методических ошибок наряду с неизвестными пробами анализируется еще один или несколько стандартных образцов. Конечной целью всякого метрологического исследования для анали- аналитика, занимающегося серийными анализами, является стремление оценить возможную величину отклонения результатов анализа от «истинного содержания»**) с по- помощью небольшого числа (иногда даже одного) эталонов или стандартных образцов, имеющихся в его распоряже- распоряжении. Поскольку здесь приходится иметь дело с различ- различными по составу пробами, отличными в той или иной степени от эталонов и стандартных образцов, то есте- естественно переходить к изучению относительных отклонений. При переходе от множества измерений, состоящих из результатов повторных анализов одной пробы, к множе- *) Определение понятия относительной квадратичной ошибки, см. в гл. III. **) Под «истинным содержанием» вещества в пробе мы здесь понимаем то содержание, которое может быть установлено, если анализ пробы превратить в специальное исследование так, как это делается, например, при изготовлении стандартных образцов.
24 КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК [ГЛ. II ству, состоящему из относительных отклонений для раз- различных по составу проб, постоянная ошибка методиче- методического характера превращается в случайную величину, значение которой определяется, с одной стороны, концен- концентрацией анализируемого компонента, а с другой стороны, концентрацией сопутствующих компонентов, причем за- законы, которыми задаются эти зависимости, остаются для нас неизвестными. Например, при весовом анализе загряз- загрязнение за счет недостаточной чистоты воды, реактивов, разрушения посуды и прочего дает относительную ошибку, зависящую от концентрации анализируемого компонента. Соосаждение сопутствующих элементов дает относитель- относительную ошибку, зависящую как от концентрации анализи- анализируемого компонента, так и от концентрации сопутствую- сопутствующих компонентов. Наконец, неполнота осаждения также зависит от состава пробы. Учесть количественно вклад, вносимый каждым из этих факторов для всего многообра- многообразия анализируемых проб, вообще говоря, не представляет- представляется возможным. При объемном и фотоколориметрическом методах анализа титр и коэффициент пересчета также часто зависят в той или иной степени от концентрации сопут- сопутствующих элементов. Особенности фазового состава проб, которыми определяется их растворимость, также нередко приводят к появлению случайной ошибки для рассматри- рассматриваемого нами множества анализов различных по составу проб. Особенно сложная картина наблюдается при эмис- эмиссионном спектральном анализе, где процесс анализа свя- связан с протеканием сложных и мало изученных явлений в газоразрядной плазме и на электродах (окислительно- восстановительные реакции, диффузия элементов к по- поверхности электрода, переход вещества из электрода в облако и пр.). Суммарное действие этих факторов, зави- зависящих от особенностей как химического, так и фазового состава проб, приводит к появлению случайной методи- методической ошибки для рассматриваемого нами статистиче- статистического ансамбля, состоящего из относительных ошибок для различных по своему составу проб. Рассмотрим в качестве примера несколько подробнее следующий простой, но видимо довольно распространен- распространенный случай появления методической ошибки, зависящей от концентрации анализируемого компонента. Если ГЛ. II] КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК 25 имеется несколько стандартных образцов, то для объем- объемного (или фотоколориметрического) анализа можно построить градуировочный график, откладывая по оси абсцисс концентрацию, и по оси ординат—число кубиче- кубических сантиметров, пошедших на титрование. Тогда котан- котангенс угла этого графика будет титром, а отрезок, отсекае- отсекаемый по оси ординат, будет равен числу кубических санти- сантиметров, пошедших на титрование «холостой» пробы (рис. 3). ем3 Рис. 3. Графическое определение тит- титра по нескольким стандартным образ- образцам (сплошная линия) и одному стан- стандартному образцу и неправильно определенному значению «холосто- «холостого» опыта (пунктирная линия) [128]. Однако обычно в распоряжении аналитика имеется толь- только один стандартный образец, в качестве второй точки используется количество кубических сантиметров, пошед- пошедших на «холостой» опыт. Непосредственное определение «холостой» связано с большими трудностями из-за слабой окраски—относительная ошибка в определении этой точки получается очень большой. Кроме того, надо учесть, что в «холостом» опыте должна быть равна нулю только кон- концентрация анализируемого компонента, а концентрация остальных компонентов (основы и сопутствующих эле- элементов) должна оставаться без изменения—это требование нельзя выполнить при непосредственном эксперименталь- экспериментальном определении «холостого» опыта. Определение титра
26 КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК [™- II при помощи ненадежно установленного «холостого» опыта эквивалентно замене правильного графика, обозначенного сплошной линией на рис. 3, на неправильный график, обозначенный пунктиром. Сравнение этих двух графиков показывает, что в этом случае величина методической ошибки и ее знак зависят от положения пробы относи- относительно эталона, по которому устанавливается титр. Мето- Методическая ошибка здесь может рассматриваться, как слу- случайная величина, так как при массовых анализах поло- положение анализируемой пробы относительно стандартного образца зависит от случая. В инструкциях обычно гово- говорится, что стандартные образцы можно применять для установки титра только при анализе проб, близких по составу к данному стандартному образцу; это уменьшает величину ошибки, но принципиально не устраняет ее. В качестве примера укажем на то, что в [128] 40 проб мартеновского шлака были проанализированы на FeOO6iK и расчеты велись двумя методами по графику, построен- построенному по нескольким (комбинированным) стандартным образцам, и по титру, который определялся по одному стандартному образцу и «холостому» опыту—расхожде- опыту—расхождение, обусловленное только этой причиной, дало относи- относительную квадратичную ошибку в 3,7%. Как в отечественной, так и в зарубежной литературе при классификации аналитических ошибок часто поль- пользуются двумя понятиями: правильностью и точностью анализа. Исходя из приведенной выше систематической классификации аналитических ошибок, можно дать сле- следующие четкие определения этим двум понятиям. Правильность анализа характеризуется отклонением среднего результата определений от надежно установлен- установленного («истинного») содержания вещества в пробе. Правиль- Правильность анализа обычно оценивается при помощи стандарт- стандартных образцов или эталонов. Методическая ошибка, харак- характеризующая правильность анализа,' в зависимости от рассматриваемого множества измерений, может быть как постоянной, так и случайной величиной. Точность анализа характеризуется рассеянием резуль- результатов анализа относительно их среднего значения. При оценке точности нужно указывать: 1) внутрилабораторную ошибку воспроизводимости, полученную аналитиком в ГЛ. II) КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК 27 пределах одной лаборатории на одном комплекте оборудо- оборудования за короткий промежуток времени, 2) внутрилабо- внутрилабораторную ошибку, характеризующую рассеяние относи- относительно среднего, полученного за длительное время, 3) меж- межлабораторную ошибку воспроизводимости, полученную разными аналитиками на разных приборах в разных лабораториях*). Приведенные выше соображения показывают, что мето- методические ошибки, изучению которых уделяется основное внимание при анализе вещества, могут рассматриваться как случайные величины, если удачным образом произ- произведена их систематизация. Вопрос о выборе множества, подлежащего рассмотрению, здесь играет решающую роль. Интересно отметить то обстоятельство, что сам факт появления методических ошибок связан с тем, что анализ вещества представляет собой процесс, протекающий во времени, в условиях, когда ряд факторов, существенно влияющих на результаты анализа, не может поддерживать- поддерживаться на одном уровне. Если бы все факторы удалось стандар- стандартизировать на длительный интервал времени в такой степени, с которой их удается стандартизировать на корот- короткие интервалы, то, по-видимому, можно было бы избежать случайных методических ошибок. В этом случае каждая лаборатория могла бы в начале своей организации потра- потратить много времени на изучение того уровня, на котором находятся интересующие ее факторы, и в дальнейшем вводить соответствующие поправки. То обстоятельство, что приходится анализировать пробы, различные по свое- своему химическому и фазовому составу, также можно рас- рассматривать как некоторый фактор, случайным образом меняющийся во времени, в силу чего мы не можем вводить поправки на результаты анализа по одному стандартному образцу или эталону. Если бы нам нужно было для чего- нибудь анализировать периодически одну и ту же пробу, *) В США и Англии понятия правильности (accuracy) и точ- точности (precision) строго стандартизированы, причем в последнее время в США в некоторых стандартах, выпущенных Американ- Американским обществом испытания материалов, под рубрикой «точность» указывается как внутрилабораторная воспроизводимость (repea- (repeatability), так и межлабораторная воспроизводимость (reprodu- cibility) [138].
28 КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК [ГЛ. II и все остальные важные для нас факторы оставались постоянными для длительных интервалов времени, то, очевидно, что тем или иным путем можно было бы найти способ введения поправок к анализу, пользуясь одним стандартным образцом, несмотря па всю сложность физи- физических и химических процессов, протекающих при ана- анализе. С такой ситуацией приходится иметь дело в метро- метрологических измерениях, где нет необходимости прибегать к приемам статистического анализа для изучения и оценки методических ошибок. Таким образом, анализ вещества представляет собой процесс, протекающий во времени и управляемый вероят- вероятностными законами. Методические ошибки анализа можно рассматривать как последовательности случайных вели- величин, зависящие от параметра, за который в некоторых случаях может быть принято время. Совокупность зна- значений случайной величины, отвечающих различным зна- значениям некоторого неслучайного параметра, принято на- называть в теории вероятностей стохастическим*) или слу- случайным процессом. Для случайного процесса с дискрет- дискретным параметром применяется также термин вероятност- вероятностная (случайная) последовательность. При анализе вещества в некоторых случаях приходится иметь дело с такой ситуацией, когда на случайную после- последовательность накладывается некоторая несущественная с точки зрения исследователя упорядоченность. Эту не- несущественную упорядоченность всегда можно нарушить при помощи искусственного приема—рандомизации**). Простейший пример рандомизации—это хорошо про- продуманная система отбора проб для анализа. В материале, подлежащем анализу, обычно наблюдается некоторая несущественная для аналитика упорядоченность в рас- распределении отдельных компонентов, которая часто не может быть полностью нарушена при перемешивании. Поэтому исходную пробу разбивают на отдельные квад- квадратики и отбор материала для навесок производят из этих квадратиков чисто случайным образом. По отно- *) Термин стохастический происходит от греческого слова ато%аат1хо? — умеющий отгадывать. **) От английского слова random — случайный. ГЛ. II] КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК 29 шению к такой системе отбора проб упорядоченная неод- неоднородность исходного материала превращается в случай- случайную величину и учитывается ошибкой воспроизводимости анализа. Если нужно произвести сравнительное изучение работы нескольких спектральных лабораторий, то отобранный для этой цели образец заставляют циркулировать по разным лабораториям так, чтобы в каждой из них он побывал по нескольку раз; при таком планировании эксперимента неоднородность пробы становится случайной величиной и учитывается при статистическом анализе как составная часть внутрилабораторной воспроизводимости. Если по- поступить иначе—разрезать образец на несколько частей и послать их в разные лаборатории, то эффект, вызванный различием в условиях работы лабораторий, нельзя будет отделить от эффекта, обусловленного неоднородностью изучаемой пробы. При эмиссионном спектральном анализе надо иметь в виду, что свойства фотографической пластинки могут меняться по некоторой весьма сложной закономерности, которая зависит как от способа приготовления эмульсии, так и от способа ее обработки и может быть различной для разных пластинок и даже для различных участков одной и той же пластинки. Если мы хотим установить с высокой степенью надежности наличие незначительной ликвации в пробе и снимем для этого две большие серии спектрограмм, располагая их на фотопластинке последо- последовательно одну за другой, то трудно будет сказать, чем определится разность между средними значениями этих двух серий—действительной ликвацией пробы или неко- некоторым закономерным изменением свойств пластинки по ее высоте. Изучать эту закономерность было бы неразумно, выгоднее спектрограммы на фотопластинке расположить случайным образом; тогда неоднородность пластинки, если даже она имела некоторую закономерность, можно будет рассматривать как случайную величину по отно- отношению к принятой нами системе расположения спектро- спектрограмм и при дальнейшей обработке материала она будет учтена общей ошибкой воспроизводимости. Необходимо обратить особое внимание на то, что приме- применение математической статистики при анализе вещества
'60 КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК [>'Л. II связано с целым рядом специфических трудностей, кото- которые не имеют места при статистической обработке ре- результатов, полученных в других областях измерительной техники. В простейших измерительных процессах, когда погрешность измерения целиком определяется инструмен- инструментальными ошибками, как это имеет место, например, в астрономии, геодезии и простейших метрологических измерениях, можно говорить о случайной природе оши- ошибок измерения как о некотором элементарном метрологи- метрологическом законе, для выполнения которого не требуется какой-либо специальной классификации изучаемого ма- материала. Иное положение мы имеем в таких сложных измери- измерительных процессах, как анализ вещества,—здесь трудно говорить о каких-либо общих метрологических законах. Применение методов математической статистики при ана- анализе вещества надо рассматривать только как некоторый методологически удобный прием, который дает возмож- возможность результаты, полученные в сложных условиях эксперимента, описать при помощи некоторых хорошо разработанных математических моделей. При этом во многих случаях приходится прибегать к искусственным приемам—систематизировать материал, рассматривать специальным образом выбранные множества, рандомизн- ровать условия эксперимента и т. д. Недостаточно четкая оценка этого обстоятельства иногда приводит к досадным недоразумениям. Здесь интересно напомнить историю вопроса о класси- классификации аналитических ошибок с точки зрения возможно- возможности применения для их изучения методов теории вероят- вероятностей. Одна из первых работ в этом направлении при- принадлежит Стьюденту (В. Госсету)—английскому химику и статистику, который предложил еще в 1927 г. рассмат- рассматривать аналитические ошибки, как полупостоянные ошиб- ошибки [56]. Подобная классификация не могла получить при- признания. Она не вносила чего-либо нового в методологию аналитических исследований, так как нельзя было, осно- основываясь на этой классификации, найти адэкватной мате- математической модели для описания аналитического процесса. Виньерон [7] вообще пришел к отрицанию возможности применения методов теории вероятностей в физико-хими- ГЛ. И] КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК 31 ческих исследованиях. Его книга, пользующаяся у нас до сих пор широкой популярностью, надолго задержала внедрение методов математической статистики в лабора- лабораторные работы. Стремление рассматривать анализ вещества как про- процесс, управляемый вероятностными законами, имеет глубо- глубокий метрологический смысл. При анализе вещества мы всегда имеем дело с громадным количеством факторов, которые нельзя сделать строго подконтрольными. Здесь дело не б принципиальной невозможности подобного контроля, а в его экономической и технической нецелесо- нецелесообразности. Современное состояние науки дает возмож- возможность анализ любой данной пробы превратить в исследо- исследование, при котором все методические ошибки были бы определены как постоянные величины с любой нужной степенью точности. Например, для весовых методов ана- анализа можно составить полный материальный баланс, пользуясь спектральными методами исследования, мето- методами меченых атомов и пр. Проведение такого анализа превратилось бы в метрологическое исследование—для его выполнения понадобилось бы несколько месяцев. Подоб- Подобное метрологическое исследование уместно проводить при изготовлении эталонов и стандартных образцов, но оно совершенно неприемлемо в рядовой работе. Современная техника все время настойчиво требует ускорения аналитического процесса. Начавшаяся сейчас автоматизация производства в ближайшее время потребует непрерывного контроля за состоянием вещества в процессе его технологической обработки. Это неизбежно поведет к дальнейпгей разработке физических методов анализа, основанных на протекании сложных процессов, которые могут находиться только в статистически подконтрольном состоянии. В исследовательских работах, направленных на разра- разработку и изучение новых аналитических методов, также методически оправданным является статистический под- подход. Например, при изучении и разработке такого слож- сложного измерительного процесса, как эмиссионный спек- спектральный анализ, вряд ли имело бы смысл пытаться достаточно строго сформулировать те законы, которым подчиняются процессы, протекающие на электродах. Для
32 КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК [гл. II строгого изучения этих закономерностей потребовалось бы необычайно много времени, если учесть, с одной сто- стороны, многообразие физических и химических свойств изучаемого материала, а с другой стороны—возможность широкого варьирования в условиях возбуждения. Совре- Современные генераторы такого типа, как «мультисурс», дают возможность получать до 500 вариантов в условиях воз- возбуждения, к тому же еще можно варьировать форму электродов, расстояние между ними и т. д. Наконец, если все же удалось бы достаточно строго установить и представить аналитически те закономерности, которым подчиняются процессы на электродах, то это вряд ли принесло бы какую-то практическую пользу. Мы не смог- смогли бы воспользоваться этими закономерностями, так как не в состоянии с достаточной степенью надежности просле- проследить за изменениями фазового состава и температуры в тех тончайших поверхностных слоях, в которых развиваются интересующие нас процессы. С чисто теоретической точки зрения подобное изучение также вряд ли было бы оправ- оправданным—здесь нет основания ожидать появления каких- либо новых физических эффектов—все те явления, с кото- которыми мы здесь имеем дело, видимо, могут быть изучены в более простых экспериментальных условиях. Поэтому естественно при разработке и изучении методов спектраль- спектрального анализа планировать эксперимент, пользуясь мето- методами статистического анализа так, чтобы в результате этого эксперимента действие того или иного фактора оценивалось в виде некоторых статистических характе- характеристик, позволяющих сделать нужные практические выводы. Такой подход никоим образом нельзя считать агности- агностическим. Статистический анализ сводится к проверке не- некоторых гипотез, выдвинутых априори, и к количе- количественной оценке того вклада, который вносится действием и взаимодействием отдельных факторов. Планирование эксперимента, направленного на проверку гипотез и изу- изучение роли отдельных факторов, может быть удачным только тогда, когда достаточно хорошо известны общие физические закономерности. Смысл статистического ана- анализа в работах исследовательского характера сводится к оценке того вклада, который вносится известными гл. II] КЛАССИФИКАЦИЯ АНАЛИТИЧЕСКИХ ОШИБОК 33 физическими эффектами в сложных условиях экспери- эксперимента, когда классические методы исследования стано- становятся неприемлемыми. Если из-за недостаточного знания физической сущности явлений проверяемые гипотезы будут сформулированы неудачно, то статистический ана- анализ даст или отрицательный ответ, или результаты, ко- которые не смогут быть разумно интерпретированы, и про- проведенная работа окажется в значительной степени бес- бесполезной. В. В. Налимвв
ГЛАВА III СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ § 1. Распределение случайной величины Случайная величина х считается заданной, если из- известна ее функция распределения F(xa)=P(x<xa), которая определяет вероятность*), того, что случайная *) Практически за вероятность Р(А) появления события А может быть принята относительная частота (частость) w(A), ко- которая определяется выражением где п — общее число испытаний, среди которых \д раз имело место событие A (v^— абсолютная частота появления события А). Веро- Вероятность Р(А) может рассматриваться как некоторая физическая константа, связанная со случайным событием А при данных усло- условиях испытания. Эта величина изменяется, как только изме- изменятся условия эксперимента. Приближенная оценка вероятности появления события при помощи частости оказывается тем более точной, чем больше число испытаний. Такое определение вероят- вероятности называется статистическим. Вероятность Р(А) всегда выражается числом, заключенным между 0 и 1 или принимающим одно из этих крайних значений В теории вероятности важную роль играют понятия достоверного и невозможного событий. Достоверным событием называется со- событие, наступающее при каждом наблюдении. Вероятность до- достоверного события А равна единице Р{А) = \. Событие V, появление которого в условиях данного эксперимента заведомо невозможно, называется невозможным событием, Веро- § п РАСПРЕДЕЛЕНИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ величина при испытаниях примет значение, не превос- превосходящее значение некоторого действительного числа ха, т. е. окажется в пределах от —со до ха. Определен- Определенная таким образом функция называется интегральной функцией распределения или интегральным законом рас- распределения. Если случайная величина х принимает только дискрет- дискретные значения xv ж2,..., хп, то может быть определена веро- вероятность появления каждого значения случайной величины 0г=1- Для Д"с- Р(хг), Р (х2), ...,Р(хг) так, чтобы кретной случайной вели- величины интегральная функ- функция распределения опре- определяется формулой где суммирование ведется по всем тем значениям i, для которых Xi<^xa. Гра- График интегральной функ- функции дискретного распре- распределения представляет со- собой ступенчатую кривую. На рис. 4 в качестве примера представлена интеграль- интегральная кривая одного из дискретных распределений. Если случайная величина х непрерывна, то ее инте- интегральная функция распределения во всех практически важных случаях может быть представлена выражением Рис. 4. График интегральной функции распределения дискрет- дискретной случайной величины. F (aj = J ср (х) dx, причем, исходя из определения вероятности, очевидно, ятность невозможного события равна нулю P(V) = 0. Подробно об основных сведениях по теории вероятностей см. [9, 14, 1].
36 СЛУЧАЙНАЯ ВЕЛИЧИНА И BE ХАРАКТЕРИСТИКИ [ГЛ. Ill что должно иметь место равенство \ ф (х) dx = 1. — со Функция ф (х) называется плотностью вероятностей величины х или ее дифференциальным законом (иначе— О Рис. 5. График интегральной функции распределе- распределения непрерывной случайной величины. функцией) распределения. В качестве примера^на рис. 5 приведен график одной из интегральпых функций распро- О Рис. 6. График дифференциальной функции рас- распределения непрерывной случайной величины. Заштрихованная область изображает вероятность Р (ха<х<"х деления непрерывной случайной величины, а на рис. 6 приведен график соответствующей ей дифференциальной РАСПРЕДЕЛЕНИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 37 функции распределения. Интегральная функция представ- представляет собой монотонно возрастающую кривую. Ордината этой кривой, соответствующая точке ха, представляет собой вероятность того, что случайная величина х при испытаниях окажется меньше ха. Разность двух ординат, соответствующих точкам ха и хь, дает вероятность того, что случайная величина будет лежать в интервале между ха и хъ Дифференциальная кривая г/=ф(ж) вместе с осью абс- абсцисс ограничивает площадь, равную единице. Площадь под кривой, находящаяся влево от ординаты уа=Ц>(ха), определяет вероятность Р(х< ха). Площадь, которая огра- ограничена двумя ординатами, проходящими через точки ха и хь, определяет вероятность попадания х в интервал между ха и хъ: хь P(xa<x<xb)=:\(f (x) dx. Необходимо отметить, что для непрерывной случайной величины х имеет смысл говорить только о вероятности попадания ее в некоторый интервал Ах, эта вероятность определяется произведением ф(х) Ах. Плотность вероят- вероятностей не может рассматриваться как вероятность, так как вероятность того, что непрерывная случайная вели- величина примет некоторое фиксированное значение ха, вооб- вообще говоря, равна нулю. Это, конечно, не значит, что при измерениях мы не можем получить значения х—ха, так как всякий результат измерения непрерывной случайной величины, представленный в виде х=ха, в действитель- действительности размазан в некоторой области значений вокруг точки ха. Функция распределения представляет собой некото- некоторую абстрактную математическую модель, при помощи которой описываются экспериментально наблюдаемые ве- величины. Одна из задач статистической обработки материала заключается в нахождении такой функции распределения.
38 СЛУЧАЙНАЯ ВЕЛИЧИНА II ЕЕ ХАРАКТЕРИСТИКИ [ГЛ. Ill которая, с одной стороны, описывала бы достаточно хороню наблюденные значения случайней величины, а с другой стороны — была бы удобна для дальнейшего статистического анализа. § 2. Среднее значение случайной величины н дисперсия Аналитические выражения функций распределения содержат одну или несколько постоянных величин, кото- которые называются параметрами распределения. Так, на- например, нормальное распределение имеет дна параметра: математическое ожидание, или, как его иначе называют, среднее значение случайной величины и дисперсию; распределение Пуассона имеет одни параметр, который тождественно равен среднему значению и дисперсии и т. д. Если нам известен закон распределения случайной вели- величины, то она может быть полностью охарактеризована численными значениями параметров. Одна из задач ста- статистической обработки материала заключается в опреде- определении численного значения средней и дисперсии. Поэтому, прежде чем переходить к изучению функций распределе- распределения, мы подробно остановимся на рассмотрении некоторых общих свойств среднего значения случайной величины и дисперсии. При обработке экспериментального материала данную систему наблюдений над случайной величиной принято рассматривать как случайную выборку из некоторой гипотетической генеральной совокупности, которая пред- представляет собой совокупность всех мыслимых наблюдений над случайной величиной при данных условиях экспе- эксперимента. Задача статистического анализа состоит в том, чтобы оценить параметры генеральной совокупности по результатам данной случайной выборки с учетом того элемента неопределенности, который вносится ограничен- ограниченностью экспериментального материала. Поэтому в ста- статистическом анализе все время приходится проводить четкое разграничение меяэду выборочными параметрами и параметрами генеральной совокупности. Согласно уста- установившейся традиции мы будем в дальнейшем обозначать греческими буквами параметры генеральной совокупности «и латинскими буквами—выборочные параметры. I 2] СРКДНЕЕ ЗНАЧЕНИИ СЛУЧ. ВЕЛИЧИНЫ И ДИСПКГ'СПН Зй Сред и (; е з н а ч е п и е с л у ч а и и о и и е л и ч и п ы Для генеральной совокупности среднее значение слу- случайной величины с непрерывным распределением опреде- определяется выражением I хц> (х) </.<• \ <f{:r)tix C.1) где ф (х) — плотность вероятностей. Для дискретного распределения сроднее значение определяется равенством со xlJ l V 'л У, !>(*,) 1 = -° C.2) где Р (хг) — вероятность появления дискретных значений х. Среднее (или арифметическое среднее) п наблюденных значений величины х определяется выражением C.3) 1=1 Среднее значение х называется выборочным средним в отличие от генерального среднего и,. Для среднего значения случайной величины употребляются также дру- другие обозначения: М {х}, Е {х}. (Фигурные скобки указы- указывают на то, что здесь имеется в виду не функция от х, а число, соответствующее всей функции распределения.) Рассмотрим следующий пример: при анализе SiO2 в шлаке были получены следующие результаты: 28,6; 28, 3; 28,4; 28, 2. Средним значением будет величина х = 28,0 + 28,3-1-28,4 + 28,2 _ .ж ,о Вычисления могут быть значительно упрощены, если начало отсчета сместить па разумно выбранную вели- величину а. Тогда каждое наблюденное значение х-г будет
40 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ [ГЛ. III записано как их сумма и среднее ж, = а + vit =а C.4) Для предыдущего примера начало отсчета удобно сме- сместить на а = 28; тогда вычисление среднего запишется так: При обработке очень большого материала вычисления могут быть упрощены, если п наблюденных значений хи х2, ..., хп сгруппировать в т интервалов со средни- средними tu t2, ..., tm и одной и той же длиной интервала At. Допустим, что каждому из этих интервалов соответствуют численности наблюдений (абсолютные частоты, или просто частоты) Vj, v2, ..., vm. Тогда среднее определяется выра- выражением C.5) х си t вследствие округлений при расчете tj. Если ввести относительную численность групп (относительную частоту, или иначе, частость) hj = \j/n, то t представится выражением = 2 C.6) так как Разность между х и t будет небольшой, если число наблюдений велико, а интервалы группирования малы. [2] СРЕДНЕЕ ЗНАЧЕНИЕ СЛУЧ. ВЕЛИЧИНЫ И ДИСПЕРСИЯ 41 Абсолютная или относительная численность групп (vj или hj) называется «весами» наблюдений. Написанные выше выражения для t называются взвешенными средними с весами Vj и hj. Суммы Hljhj и 2^v;- называются взве- взвешенными суммами с весами hj и Vj. Таблица 3.1 Вычисление среднего по сгруппированным данным *) Середина интервала группиро- группирования (, —0,07 —0,06 —0,05 —0,04 —0,03 —0,02 —0,01 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 Сумма . . Среднее . . Частота v; 2 0 8 75 107 147 121 186 130 119 71 32 2 0 0 1000 — t;=0,01 (Oj wi —7 -6 —5 4 —3 —2 I 0 1 2 3 4 5 6 7 — — V; —14 0 —40 —300 —321 —294 —121 0 130 238 213 128 10 0 0 -371 -0,371 x « 1 = 0,01ш= —0,00371 *) Распределение спектральных анализов марганца в чугуне по величинам их отклонений от данных химического анализа. Интервал группирования равен 0,01%. Данные заимство- заимствованы из [115]. В табл. 3.1 в качестве примера приведено вычисле- вычисление среднего по сгц^ЦШШ1 Hjjwq^данным. Для того
2 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ ['лЛ- III чтобы избежать вычислений с дробями, значения lj были представлены выражениями Wj = -тг^т , и подсчитывалось среднее значение со, от которого уже легко перейти к t. Дисперсия и средняя квадратичная ошибка Рассеяние случайной величины относительно средне- среднего принято характеризовать дисперсией. Дисперсия случай- случайной величины х для генеральной совокупности опреде- определяется как математическое ожидание или среднее значе- значение квадратов отклонений х от и. Следовательно, по аналогии со средним значением случай- случайной величины, для непрерывного распределения можно написать C.8) а дли дискретного распределения C.9) Для генеральной дисперсии употребляются также обозначения: а*, о2{х}, D{x}, Dx. В отечественной лите- литературе генеральную дисперсию принято также называть теоретической дисперсией. Для п наблюденных значений хъ х2, . .., хп случай- случайной величины х дисперсию принято определять выра- выражением с- — *12 C.10) re—1 si или просто s2 называется выборочной дисперсией. В дальнейшем все время будет проводиться четкое разгра- § 2] СРЕДНЕЕ ЗНАЧЕНИЕ СЛУЧ. ВЕЛИЧИНЫ И ДИСПЕРСИЯ 43 ничение генеральной дисперсии а2 и выборочной диспер- дисперсии s2. Оценка генеральной дисперсии по выборочной диспер- дисперсии, определенной формулой C.10), удобна тем, что эта оценка лишена систематической ошибки {М{sl} = o%), т. е. выборочная дисперсия s% является несмещенной оценкой генеральной дисперсии о|. Определение выборочной диспер- дисперсии по формуле C.10), когда в знаменателе стоит п— 1, а не п*), дает возможность производить оценку гене- генеральной дисперсии по нескольким значениям выборочной дисперсии, полученным для различных рядов наблюдений; это обстоятельство имеет очень важное практическое зна- значение. Положительное значение корня квадратного из дис- дисперсии называется средним квадратичным**) или стандарт- стандартным отклонением (ошибкой), а иногда просто стандартом и обозначается символами о и s, причем опять-таки а будет обозначать квадратичное отклонение для генераль- генеральной совокупности, a s — квадратичное отклонение для выборки ***). Относительная квадратичная ошибка, выраженная в процентах от среднего значения случайной величины, называется коэффициентом вариации (или коэффициентом изменчивости) и обозначается символом vx: v =^ X C.11) *) Если известно генеральное среднее [i, выборочная диспер- дисперсии определяется по формуле 71 **) Во многих руководствах по математической статистике пользуются термином квадратическан ошибка по аналогии с тер- термином арифметическая ошибка. Мы будем употреблять термин квадратичная ошибка (отклонение), принятый в метрологии [19] и прочно укоренившийся в лабораторной практике. ***) Такое разграничение обозначений не всегда проводится достаточно четко. Во многих работах прикладного характера выбо- выборочную дисперсию и соответствующее квадратичное отклонение обозначают через а2 и а.
44 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ [ГЛ. Ill в аналитической работе коэффициент вариации иногда обозначают символами а%с и s%c. Знаменатель в выражении C.10) представляет собой число степеней свободы. Это понятие играет очень боль- большую роль в современной математической статистике, оно несколько аналогично соответствующему понятию в меха- механике. Число степеней свободы можно определить как число независимых измерений минус число тех связей, которые наложены на эти измерения при дальнейшей обработке материала. При определении выборочной дис- дисперсии по п независимым наблюдениям мы имеем п — 1 степеней свободы, так как при подсчете среднего значе- значения на результаты измерений была наложена одна связь вида C.3). В дальнейшем понятие о числе степеней свободы будет уточняться на отдельных примерах. Вычисление дисперсии может быть значительно упро- упрощено, если мы произведем следующее преобразование числителя в формуле C.10): = {x\ - ^c + x2 ) + (x\ - 2x2x (x2 + x2 — 2x(x1 + xt+... xn) + (x2 + x2 + .. . + x2) = 2 *t B *0 i=l i=l V / i=l Окончательно для вычисления дисперсии получаем: ¦ ZiXi re~ re—1 C.12) При вычислении дисперсий, так же как и при вычис- вычислении средней, можно производить смещение начала от- § 2] СРЕДНЕЕ ЗНАЧЕНИЕ СЛУЧ. ВЕЛИЧИНЫ И ДИСПЕРСИЯ 45 счета. Если положить то получим: xi—x = vi — и, следовательно, n _ n _ 2fr — тЛ2 — У Со — гЛ2 C 131 Vе i x) — ZJ lui—v) • (O.1O) t=l i=l Для того чтобы избежать вычислений с десятичными дробями, положим vt = Pcoj и представим результаты ана- анализа выражением хг = а + Pcuj. Тогда s% определится формулой ' (S -О2 re— \ C 14) причем очевидно, что s% = $2sl>. В примере на стр. 39 мы имели следующие результа- результаты анализов: 28,6; 28,3; 28,4; 28,2. Представим эти ре- результаты выражением х{ = 28,3 +0,1а; и подсчитаем • = 2,92, •><»- 4-1 si = 0,01s* = 0,0292; sx^0,l7. Если п наблюденных значений хх, х2 ,.. ., хп сгруппи- сгруппировано в т интервалов Ц + At/2 с частотами vx, v2, ... ..., vm, то можно написать
46 СЛУЧАЙНАЯ ВЕЛИЧИНА II ЕЕ ХАРАКТЕРИСТИКИ 1гл. Ill и подсчитать 3=1 n — 1 C.15) Здесь будет иметь место приближенное соотношение Разность между ss и st будет небольшой, если число наблюдений велико, а интервалы группирования малы. В качестве примера в табл. 3.2 приведено вычис- вычисление дисперсии по сгруппированным данным, получен- полученным при сравнительном изучении двух аналитических методов. Все вычисления обязательно должны контролиро- контролироваться. Для этого нужно, чтобы они производились неза- независимым образом двумя разными работниками. Если вы- вычисления вынужден производить один работник, то кон- контрольные вычисления нужно делать с другим началом отсчета. В табл. 3.2 для контроля за вычислениями бы- было использовано очевидное соотношение т т 2 v; (со,-+1J= 2 VjtoJ 3=1 i = l 3=1 + 2 v,; 3 = 1 для этого пришлось дополнительно вычислить сумму l () Вычисление дисперсии и среднего значения можно еще упростить, если воспользоваться более грубой груп- группировкой, чем та, которая указана в табл. 3.2. Но при этом как показал В. Шеппард, дисперсия оказывается завышенной на величину Л2/12, где h—величина интерва- интервала группирования. Для исключения этой систематиче- систематической ошибки вводят так называемую поправку Шеппарда, вычитая из дисперсии, подсчитанной по грубой группи- группировке, величину, равную /г2/12. В качестве примера в табл. 3.3 приведены результаты вычисления дисперсии и среднего значения по данным предыдущего примера, сгруппированным для величины интервала h = 0,03. 2j СРЕДНИЕ ЗНАЧЕНИЕ СЛУЧ. ВЕЛИЧИНЫ И ДИСПЕРСИЯ 47 Таблица 3.2 Вычисление дисперсии но сгруппированным данным *) Середина интервала т^ т\ лт гт тт тт— l p упни рования ч —0,07 —0,06 -0,05 —0,04 —0,03 —0,02 —0,01 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 Сумма . Ча- РТОТЯ 2 0 8 75 107 147 121 186 130 119 71 32 2 0 0 1000 <о;. —7 -6 —5 —4 -3 —2 —1 0 1 2 3 4 5 6 7 <О2. 49 25 16 9 4 1 0 1 4 9 16 25 — — ) (Ш;.+ 1J 36 16 9 4 1 0 ¦1 4 9 16 25 36 — — = 0,01@ 1 V;(O. -14 0 —40 —300 —321 —294 —121 0 130 238 213 128 10 0 0 —371 v/°2; 98 0 200 1200 963 588 121 0 130 476 639 512 50 0 0 4977 v;.«o;+l>2 72 0 128 675 428 147 0 186 520 1072 1136 800 72 0 0 5235 Проверка: m m У v,(o?- + 2 у h ! з4 2 vy = 4977—742 + 1000 = 5235, Svyc 3=1 B VjCB;- 4Q77 (-371J ^=4,84, re —1 1000—1 P2s? =0,0001 • 4,84; sx «= 0,022. *) Распределение спектральных анализов марганца в чугуне по величине их отклонения от данных химического анализа. Интервал группирования равен 0,01%. Данные заимствованы из [115].
48 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ [гл. III Результаты вычислений показывают, что хсх -0,00369, sx~ 0,021. Выполненные ранее более точные вычисления (табл. 3.1 и 3.2) дали ж~-0,00371, sx~ 0,022. Разница в результатах вычислений оказывается незначи- незначительной, но при этом количество вычислений сократилось в три раза. ТаГлпда 3.3 Вычисление дисперсии и среднего значения при грубой группировке Середина интер- интервала группиро- группирования ч —0,06 —0,03 0,00 0,03 0,06 Сумма . Частота vi 10 329 437 222 2 1000 СО СО ОСО СО (=0,01ш 36 9 0 9 36 —60 —987 0 666 12 —369 360 2961 0 1998 72 5391 «2 = s* Ю-4 = 5,26 -Ю-4, h2 0,032 - = —0,00369, 12 ~ 12 - = 0,75-10-4, "a 1000—1~""~ ' ' 8Я = 0,021. Поправку Шеппарда можно вводить только в тех слу- случаях, когда выполняются следующие условия: 1) распределение относится к непрерывной переменной, 2) численности постепенно снижаются на двух концах кривой, 3) число наблюдений достаточно велико. I 3] ВЫЧИСЛЕНИЕ ДИСПЕРСИЙ ПО ТЕКУЩИМ ИЗМЕРЕНИЯМ '& При небольшом чипе наблюдений (менее 500) пли при обычно)! группировке, такой, например, кап это было сделано в табл. ,'5.2, поправку Шеппарда вводить не надо. При вычислении дисперсий часто бывает удобно поль- пользоваться таблицами квадратов чисел (см. Приложение, табл. 15). О применении при вычислениях малых вычис- вычислительных машин см. [30а]. § 3. Вычисление дисперсий по текущим измерениям Во многих аналитических лабораториях до сих пор для определения среднего квадратичного отклонения, характеризующего впутрилабораторную воспроизводи- воспроизводимость анализа, принято ставить специальную серию опытов, состоящую из многократного повторного анализа одной и тон же пробы. На проведение подобной работы тратится много труда, а результаты подобного экспери- эксперимента трудно поддаются интерпретации, так как в тече- течение того длительного времени, которое требуется на вы- выполнение многократных анализов, может изменяться неконтролируемым образом второй параметр распределе- распределения—среднее значение результатов анализа. Значительно проще н удобнее определять ошибку воспроизводимости по текущим измерениям, используя для этого данные аналитического архива. Допустим, что мы имеем результаты анализа т проб, выполненные из п параллельных определений. Предста- Представим эти результаты так, как это показано в табл. 3.4. Таблица 3.4 1-е определение 2-е определение п-в определение Суммы 1-я 2-я ПР°ба проба проба • • • с ""Д^сом гп z21 хт1 г12 z22 %. хт хга хтп Xl %2 X,:i 4 И. И. Па ли мп и
50 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ [ГЛ. Ш Для того чтобы найти дисперсию, характеризующую внутрилабораторную ошибку воспроизводимости, можно было бы поступить следующим образом: найти дисперсии по результатам анализа каждой пробы в отдельности, а затем определить среднее арифметическое значение этих дисперсий C.16) Вычисления удобнее производить по алгебраически экви- эквивалентной формуле т т п 2 Х\ 2 2 «ь-Чг- где Х{ — сумма значений х^ по столбцам, а В этом случае число степеней свободы равно т (п — 1), так как на наше множество измерений, состоящее из тп анализов, мы положили т связей при подсчете т средних значений. Рассмотрим несколько подробнее более общий случай, когда анализы выполняются из различного числа парал- параллельных определений [149], в этом случае столбцы в табл. 3.4 будут состоять из неравного числа индивидуумов. Обозначим число параллельных определений в i-й пробе через щ. Дисперсия, обусловленная ошибкой воспроизводи- воспроизводимости для таблицы, состоящей из столбцов с неравным числом индивидуумов, определится формулой, которую получим, если возьмем сумму отдельных дисперсий, взве- взвешенную по их степеням свободы, и разделим ее на общее число степеней свободы, которое равно общему числу т измерений 2 пг минус число связей, использованных для г=1 § 3] ВЫЧИСЛЕНИЕ ДИСПЕРСИЙ ПО ТЕКУЩИМ ИЗМЕРЕНИЯМ определения средних значений, т ..2 _ 1=1 2 г=1 После простых преобразований, используя формулу C.12) получаем следующее выражение, удобное для вычислений: а _ C.18) Рассмотрим следующий пример: при определении SiO2 в трех пробах шлака были получены следующие резуль- результаты: 28,6 25,1 21,2 28.3 24,8 21,4 28.4 21,0 28,2 Нужно найти ошибку воспроизводимости результатов анализа. Для упрощения вычислений представим резуль- результаты анализа следующими выражениями: .т1У = 28,3 + 0,1а>, a:2i = 25,0 +0,1м, Тогда дисперсия s,20 будет равна C + 0+1 —IJ A— 2J @+2 —2J 4 2 3 __ _ si = 0,014 = 0,0354; ss ~ 0,1.88. /.*
^ .СЛУЧАЙНАЯ ВЕЛИЧИНА И ЁК ХАРАКТЕРИСТИКИ [гл. Ш При вычислении ошибок воспроизводимости по фор- формулам C.16) и C.17) мы исходим из того предположе- предположения, что результаты анализа т проб можно рассматри- рассматривать как случайную выборку из т генеральных совокуп- совокупностей. Для вычислений мы объединяем между собой только те пробы, которые можно рассматривать как выборки из таких генеральных совокупностей, которые, несмотря на различные средние значения, имеют одина- одинаковую дисперсию. В этом случае каждое из значений s\, s\, ..., «m можно рассматривать как оценку для одной и той же генеральной дисперсии. Такое объединение различных по составу проб можно делать, конечно, только в известных пределах —до тех пор, пока ошибка воспроизводимости остается независимой от среднего зна- значения. Без каких-либо дополнительных исследова- исследований можно быть уверенным, что это условие во всяком случае выполняется, когда крайние значения концент- концентрации определяемого компонента находятся в отноше- отношении 1 : 3. Для вычисления дисперсии здесь можно объе- объединить результаты анализа, полученные за ^длитель- ^длительный интервал времени, так как результаты расчетов не зависят от возможного изменения средних значе- значений под влиянием факторов, медленно меняющихся во времени. Вычисление ошибки воспроизводимости по текущим анализам становится особенно простым, если анализы выполняются всего из двух параллельных определений — этот прием будет рассмотрен в следующем параграфе (см. стр. 56). § 4. Закон сложения ошибок Для стохастически (вероятностно) независимых слу- случайных величин*) свойством алгебраической аддитивно- аддитивности обладают дисперсии, а не квадратичные ошибки. Если мы имеем две независимые случайные величины х и у, то дисперсия суммы и разности этих случайных *) Случайные величины х и у называются стохастически не- независимыми, если функция распределения каждой из них не зави- зависит от того, какое значение приняла другая. ЗАКОН СЛОЖЕНИЯ ОШИБОК 53 величин может быть представлена выражением х ± v — х "т" 1/* v1-^* ^*v В правой части соотношения C.19) стоит знак плюс как для дисперсии суммы, так и для дисперсии разно- разности. Закон сложения дисперсий можно обосновать сле- следующим образом: если х и у— независимые случайные величины, то мы, очевидно, можем написать*): а2 {х ± у} = М {(х ± у)*} - [М {х ± у) f = = М {х* ± 2ху + у2} - [М {х} ± М {y}f = = М {х*} ± 2М {х} М {у} + М {у"} - [М {х}]2 Т Т 2М {х} М {у} - [М {y}f = ol -f о;,. Для суммы п случайных величин z = хп дисперсия суммы будет определяться выражением sl = sl+sl+...+sl Дисперсия случайной величины z = агхг -f а2х2 + . . . + апхп, C.20) где ах, а2, ..., ап — произвольные постоянные, опреде- определится выражением Если положить ах — а2= . .. = ап= 1//г, то z становится средним арифметическим случайной величины . = В этом случае можно написать х „г — „ *) Здесь используются две известные в теории вероятностей теоремы: 1) для любых двух случайных величин математическое ожидание суммы равно сумме математических ожиданий; 2) ма- математическое ожидание произведения двух независимых случай- случайных величин равно произведению их математических ожиданий.
54 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕВ ХАРАКТЕРИСТИКИ [lVI. Ill где Если величины хх, х2, ...,хп интерпретировать как п независимых наблюдений одной и той же случайной не- неличины х со средним значением х, то в этом случае si ~ S2 — • • • — sn- Тогда получим соотношение si = ^, C.22) х п которое играет очень большую роль в метрологии. Из соотношения C.22) следует, что увеличивать число на- нараллельных определений для повышения точности ана- анализа имеет смысл только до какого-то определенного предела. Если, например, мы хотим увеличить точность в два раза, то для этого надо сделать четыре парал- параллельных определения, такое соотношение между повыше- повышением точности и количеством затраченного труда кажется вполне приемлемым с практической точки зрения. Если же надо повысить точность анализа в 10 раз, то для этого необходимо сделать 100 параллельных определений, что уже вряд ли можно считать разумным мероприятием. Из соотношения C.22) также следует, что при оценке точности ¦двух методов надо учитывать длительность анализа [59]. Если, например, ошибки воспроизводимости двух методов характеризуются коэффициентами вариации в 5 и 10%, причем второй из них дает возможность сде- сделать четыре параллельных определения за то время, когда первым методом делается один анализ, то точно- точности анализа с учетом фактора времени в обоих случаях можно считать одинаковыми. Если учитывать фак- фактор времени, то мы иногда вынуждены бываем признать, что ускоренные методы оказываются точнее длительных классических методов анализа. В тех случаях, когда случайные величины хну сто- стохастически связаны между собой *), дисперсия их суммы *) Следует различать стохастическую (вероятностную) зависи- зависимость и функциональную. Стохастическая зависимость может быть более или менее тесной: по море увеличения тесности вероятно- вероятностная зависимость все более приближается к функциональной. И] ЗАКОН СЛОЖЕНИЯ ОШИБОК 55 и разности может быть представлена выражением sx±y = sx i 2r_Ty sx sy-\- sy, C.23) к где гху — выборочный коэффициент корреляции (строгое определение выборочного и теоретического коэффициен- коэффициентов корреляции см. на стр. 299—300). В правой части выражения C.23) перед чле- членом 2rxy sxsy стоит знак плюс для дисперсии суммы слу- случайных величин и минус для дисперсии их разности. Коэф- Коэффициент корреляции является мерой линейной связи меж- между двумя случайными вели- величинами, его значения всег- всегда заключены между -+ 1 и —1. Если между двумя случайными величинами нет линейной стохастической связи, то fxy = 0. Если между величинами х ну существует строгая линей- линейная связь, то \r\ i Рис. 7. Геометрическая интер- интерпретация закона сложения ошибок: rxV=-cos a- Д/Г .'х„1-- Между этими двумя пре- предельными случаями могут существовать различные сте- степени стохастической связи, оцениваемые с иомощыо коэффициента корреляции, меняющегося от 0 до ± 1. Положительное значение коэффициента корреляции ука- указывает на то, что обе величины меняются в одном на- направлении, отрицательный коэффициент корреляции ука- указывает на то, что одна из переменных увеличивается, а другая уменьшается. Закон сложения ошибок можно интерпретировать гео- геометрически при помощи векторов, так как это показано на рис. 7. В первом примере на рис. 7 между величи- величинами хну нет линейной корреляционной связи (гху = 0). Из геометрического построения ясно видно, что в этом случае'нет необходимости затрачивать усилия на уменьше- уменьшение меньшей из двух компонентов, так как уменьшение
56 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ [ГЛ. III меньшего из катетов не оказывает существенного влия- влияния на изменение гипотенузы. Рассмотрим следующий числовой пример: результаты анализа зависят от двух факторов — один из них вносит ошибку, равную 5%, дру- другой—ошибку, равную 2%. Суммарная ошибка анали- анализа будет равна ]/25 -t 4 са 5,4. Если мы введем какие- либо усовершенствования, которые дадут возможность уменьшить вдвое ошибку, вносимую вторым фактором, то суммарная ошибка практически почти не изменится, так как ]/25 +1 с^5,1. Во втором примере на рис. 7 ошибки в измерении двух величин хну связаны между собой строгой линейной зависимостью. В этом случае суммарная ошибка определяется сложением двух парал- параллельных (или антипараллельных) векторов, здесь алгеб- алгебраически аддитивными величинами становятся не диспер- дисперсии, а ошибки. В третьем примере на рис. 7 ошибки анализа стохастически связаны между собой зависи- зависимостью, определяемой коэффициентом корреляции, лежа- лежащем в пределах 1 > гху >0. В этом случае, так же как и в первом примере, имеет место только геометри- геометрическое сложение ошибок, если их рассматривать как векторные величины. Пользуясь законом сложения ошибок, можно полу- получить формулу для подсчета ошибок воспроизводимости по текущим измерениям, состоящим из двух параллель- параллельных определений [101, 117, 121]. Допустим, что анализу подвергалось п различных по своему составу проб. Обо- Обозначим через d: разность между двумя параллельными определениями; тогда мы можем^написать „2 _ °>зс—у — -ОJ Здесь число степеней свободы равно п, так как мы априори положили, что d = 0. По условиям нашей за- задачи sx = sy = sBOcn, следовательно, ошибка воспроизво- воспроизводимости определится формулой _ «восп = C.25) ЗАКОН СЛОЖЕНИЯ ОШИБОК 57 Этим приемом определения ошибки воспроизводимости можно пользоваться только в том случае, когда работа организована так, что аналитик в процессе выполнения анализов не знает, что два параллельных определения принадлежат одной и той же пробе. Если это условие не выполняется, то параллельные определения не будут уже стохастически независимыми величинами и диспер- дисперсию разности нужно будет интерпретировать выражением *х — у ~ $х "Г" Sy "xy $х $у- В этом случае для подсчета sBOcn уже нельзя пользо- пользоваться выражением C.25), так как оно даст заниженные результаты. Результаты анализа, выполненные в двух разных лабораториях, также в некоторых случаях можно рас- рассматривать как два параллельных определения. Напри- Например, в [117] ошибка воспроизводимости химического ана- анализа сталей определялась по материалам аналитического архива. При подсчетах определялась квадратичная ошибка Язн-цен. характеризующая расхождение между результатами экспресс-анализа и данными проверки, полученными в центральной лаборатории. Эта величина интерпретировалась следующим образом: °восп—цен i=l к—цеп т C.26) где Sbocii-эк — воспроизводимость единичного определения в экспресс-лаборатории, тх— число определений, по кото- которым там сдаются анализы, sB0Cn—цен — воспроизводимость единичного определения в центральной лаборатории, т2 — число параллельных определений в центральной ла- лаборатории, п — общее число анализов, взятое для обра- обработки. МОЖНО было ПОЛОЖИТЬ, ЧТО SBocn-3K СИ 5восп-цен, так как анализы велись в обеих лабораториях одними и теми же методами, в одних и тех же условиях, ла- лаборантами одинаковой квалификации. Поэтому, опу- опустив второй индекс в обозначениях sROcn, можно было
58 случайная величина и ее характеристики [гл. III т2 = написать 2 sbocii | 4isocn ¦Уэк-цен - ~— i- -~- ¦ Определение углерода производилось при m1 = _, ...., _, следовательно, sBocn = «Эи-цен- Определение серы и фос- фосфора производилось при пг1=1, те2 = 2. В этом случае, как показывает простой подсчет, sBocn = 0,82 «эк—цен- В повседневной практике работы аналитических лабо- лабораторий принято подсчитывать ошибки, характеризую- характеризующие расхождение результатов анализов, выполненных двумя разными методами или одним методом, но в раз- разных лабораториях. В этом случае надо иметь в виду, что, во-первых, d Ф 0, так как каждый из методов может иметь некоторую постоянную ошибку а, а во-вторых, наряду с ошибками воспроизводимости могут иметь место случайные методические ошибки «сл-хим. обусловленные особенностями химического и фазового состава проб. Результаты подобных подсчетов можно интерпретировать следующим выражением: 2 2 2 _ SBocn I | 6восп II ,2 2 41-И ~ т ~i ^ г *'сл—хнм I + *сл—хим И — ~ 2/"i- п S ел-хны I ^'сл-хим И f (и! — апJ. C.27) Здесь индексами I и II обозначена ошибка двух разных методов. Если подсчет si-ц вести по форм\ле ге-1 C.28) то последний член в формуле C.27) обратится в нуль. Так, в частности, производился подсчет ошибки, характе- характеризующей отклонение результатов спектрального анализа от данных химического анализа, в табл. 3.2 и, следова- следовательно, эта ошибка может быть интерпретирована выра- выражением C.27), если в нем опустить последний член. Методы статистического анализа, позволяющие опреде- определить раздельно каждую из ошибок в выражении C.27), будут приведены в гл. VII. •ЧАКОН СЛОЖЕНИЯ ОШИБОК 59 В частном предельном случае работа двух лаборато- лабораторий может быть настолько хорошо согласованной, что мы будем иметь: '-11^1, «сл-хпм 1 ^ «сл-хпм П, ai~an. В этом случае sf-n будет определяться только ошибками воспроизводимости *). Таким образом, если при межлабо- межлабораторном контроле мы получаем небольшое численное 2 "у значение для величины si_n, подсчитанной по фор- формуле C.28), то это еще не говорит о действительном отсутствии методических ошибок. При особенно ответственных химических анализах, например при изготовлении стандартных образцов и эта- эталонов, часто большие и дорогостоящие усилия затрачи- затрачиваются на то, чтобы согласовать результаты химического анализа разных лабораторий, причем вполне возможно, что в ряде случаев эти усилия оказываются фактически направленными на приближение к единице значения коэффициента корреляции, а не на действительную борьбу с ошибками. Можно привести следующий любопытный пример: в Англии был выпущен стандартный образец шлака, в котором содержание А12О3 было указано с ошиб- ошибкой около 100%. Эта ошибка была обнаружена только после того, как начали разрабатывать спектральный метод анализа шлаков. Методы химического анализа в этом случае были столь хорошо коррелированы, что даже при выполнении особенно ответственных анализов была допущена очень большая ошибка, которую удалось обнаружить только благодаря применению принципиально нового метода, некоррелированного с классическими мето- методами химического анализа. *) При интерпретации результатов определения «эк-дсн в ПРе~ дыдущем примере мы опустили в формуле C.26) члены, харак- характеризующие методические ошибки. Работа двух лабораторий одного и того же завода всегда настолько хорошо согласована, что коэффициент корреляции оказывается практически равен еди- единице. При сравнении результатов анализа, выполненных в лабо- лабораториях разных заводов, нужно учитывать методические ошибки, так как в этом случае коэффициент корреляции может быть не равен единице.
60 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ [1VJ. Ш При разработке новых методов анализа обычно при- приходится затрачивать большие усилия на согласование результатов анализа с данными ранее применявшихся классических химических методов анализа. Например, для согласования результатов эмиссионного спектраль- спектрального анализа с данными химического анализа часто при- приходится прибегать к таким мероприятиям, как изготов- изготовление вторичных внутренних эталонов, выбор специаль- специальных условий возбуждения, параллельное смещение гра- графиков для различных по составу проб, излом прямоли- прямолинейных графиков и пр. Возможно, что здесь иногда усилия опять-таки сводятся к поднятию значения коэф- коэффициента корреляции до величины, близкой к единице. Этим обстоятельством во многих случаях можно объяс- объяснить то, что расхождения в результатах анализов, выпол- выполненных в одной лаборатории принципиально разными методами, оказываются часто меньшими, чем расхожде- расхождения в результатах анализов, полученных для одного и того же метода в разных лабораториях. § 5. Ошибки косвенных измерений В метрологии измерения принято делить на прямые и косвенные (посредственные). В первом случае непо- непосредственно измеряется интересующая нас величина, во втором случае —интересующая нас величина задается некоторой функцией от непосредственно измеряемых вели- величин. Анализ вещества представляет собой косвенное из- измерение, при котором интересующая нас концентрация вещества задается функцией таких непосредственно изме- измеряемых величин, как титр, навеска пробы, почернение аналитических линий и т. д. При изучении аналитиче- аналитических ошибок эксперименты часто бывает удобно плани- планировать так, чтобы сначала изучить ошибки прямых изме- измерений с тем, чтобы затем, пользуясь методами математи- математического анализа, определить ошибку, выраженную в про- процентах концентрации анализируемого компонента. Если z = f(xi, х2, ...,хг) есть некоторая нелинейная функция п случайных некоррелированных величин хг, х2, ...,хп, слабо меняющаяся во всей области измене- изменений (xv xv . .., хп), то дисперсию S* можно апроксими- § 5] ОШИЬКИ КОСВЕННЫХ ИЗМЕРЕНИЙ ровать выражением Это выражение получаем путем разложения функции z = f(x1, х2, ...,хп) в ряд Тейлора, ограничиваясь чле- членами первого порядка, и суммированием по закону сло- сложения дисперсий. Формулу C.29) называют законом накопления или законом распространения ошибок. Пользуясь формулой C.29), можно оценить ошибку косвенного измерения, если известны ошибки прямых из- измерений. Рассмотрим следующий пример: нужно оценить точность определения удельного веса медно-цинкового сплава, пользуясь следующими результатами измерений: /га = 420,20 г, и = 50,15 см3, 0,22 г, 0,12 см3, _ /E0,15 х 0,22J+D20,20 х 0,12J d±2sd = 8,38 ±0,04 г-см'3. При анализе вещества точность метода принято харак- характеризовать коэффициентом вариации. Рассмотрим не- несколько относящихся сюда примеров. Абсорбционный спектральный анализ В абсорбционном спектральном анализе основное уравнение может быть представлено в виде г 71 ¦* Аг\—Ыс /о оа\ где с — концентрация определяемого вещества, & —кон- —константа для данного вещества, / — длина кюветы, / и /0 — показания прибора соответственно для кюветы с анали-
HZ СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ tJV|. Ill зируемым раствором и для кюветы с растворителем. Найдем соотношение, связывающее коэффициент вариа- вариации vc с экспериментально определяемой ошибкой s?-, полагая, что длина кюветы остается постоянной и что измерения производятся прямыми фотоэлектрическими методами, без применения фотопластинки. Введем поня- понятие оптической плотности E = klc = lg-^. C.31) Логарифмируя равенство Е = klc и дифференцируя по переменным Е и с, получаем: Ш Пользуясь этим выражением, мы можем найти относи- относительную ошибку в определении концентрации, если нам известна ошибка в опре- определении оптической плот- плотности. Дифференцируя выра- выражение lg Т = — Е, нахо- находим (опуская знак минус): А г, 0.43Д71 2J О 0,2 QW 0,8 1,0 Рис. 8. График функции 0,43 Ф(Я)- Е-10- Е Подставляя полученное выражение для АЕ в C.32), получаем: у ^-Р^З 6-г 100. C.33) с Е-10~Е х ' Легко показать, что vc бу- будет минимально при Е = = 0,43. Следовательно, условия измерения концентрации будут оптимальными, когда размер кюветы для данного интервала концентраций выбран так, чтобы измерения производились вблизи точки ?" = 0,43. На рис. 8 приведен график функции <р (Е) ~0,АЗ/Е- Ю~Е, показывающий, что она имеет широкое плато: при значениях Е от 0,2 до 0,8 коэффициент при st варьирует от 2,7 до 3,4. Точность анализа может быть существенно повышена, если воспользоваться дифференциальным методом, при §5] ОШИБКИ КОСВЕННЫХ ИЗМЕРЕНИЙ 63 котором в качестве нулевого раствора берут некоторый эталонный раствор. В этом случае Т = 4-= [О lg 7 = - Ьт; c 10 Полагая, что Еат = Е = 0,43, имеем ис = sr100. Для обыч- обычного метода из C.33) при ?" = 0,43 получаем ус = 2,7^100. Оптимальные условия работы для дифференциальной спектроскопии будут при максимальном значении Еэт (око- (около 2,0) и Ет = 0. При этих условиях минимальная вели- величина ис будет в 10—12 раз меньше, чем при обычном методе фотометрирования, если считать, что st не зави- зависит от Т. Эмиссионный спектральный анализ Основное уравнение количественного спектрального анализа с фотографическим методом регистрации обычно представляется в виде f=blgc + lga, C.34) где AS — разность почернений аналитических линий, с — концентрация, у — фактор контрастности фотопла- фотопластинки, Ъ и а—параметры уравнения. Дифференцируя это выражение по переменным AS, у и с и применяя закон сложения дисперсий, получаем*): 2,3-100 V C.35) ) Здесь мы предполагаем, что параметры градуировочного графика lg a и Ь определены без ошибок. Если это" условие не выполняется, то задача становится более сложной —к решению ее мы вернемся в гл. VIII.
64 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ [ГЛ- Ш Если ограничиться изучением рассеяния результатов анализа в пределах одной пластинки, то мы можем счи- считать, что у =const, и тогда получаем: fc = ^s-100. C.36) Уравнение C.36) обычно применяют в текущей аналити- аналитической работе для определения ошибки, выраженной в процентах концентрации, пользуясь экспериментально найденными значениями sAS. Например, если sAS = 0,02, Y& = 1, то ис = 4,6%. Из приведенных выше соотношений следует, что для повышения точности нужно, с одной стороны, стремиться к увеличению у и Ъ, а с другой стороаы, так выбирать аналитические пары линий, чтобы в середине интервала определяемых концентраций AS ~ 0, так как в этом случае будет сведен к минимуму вклад, вносимый в общую ошибку анализа величиной sy [60]. Из соотношения C.36) следует, что для эмиссионного спектрального анализа коэффициент вариации не зависит от концентрации определяемого вещества. Поэтому эмис- эмиссионный спектральный анализ находит особенно широкое применение при анализе малых концентраций, где он оказывается точнее химического анализа, для которого коэффициент вариации увеличивается с уменьшением концентрации. Рассмотрим чрезвычайно важаый в спектральном ана- анализе вопрос о возможности получения максимальной информации из одной спектрограммы. В [158] было пред- предложено при проведении анализа использовать две ана- аналитические пары линии одной и той же спектрограммы, откладывая по оси ординат при построении градуиро- вочного графика сумму ASj -Ь ASa. В этом случае основ- основное уравнение количественного спектрального анализа может быть представлено в виде + iga1 + lga3. C.37) Коэффициент вариации при этом определится выра- выражением vc § •>) ОШИБКИ КОСВЕННЫХ ИЗМЕРЕНИИ 65 Усредняя значения v'c для различных аналитических методов и разных анализируемых материалов, мы можем положить, что в среднем b1^ib2, .?as1^sas2, r^s^O; тогда из C.36) и C.38) получаем, что и'с са ис/У 2 . В [158] приведен большой экспериментальный материал, показывающий, что применение этого приема работы действительно в среднем уменьшает ошибку воспроизво- воспроизводимости в 1,4 раза. В отдельных случаях возможны большие отклонения от этой средней величины. Напри- Например, если проба имеет резко выраженную микроликвацию, то оба значения AS будут корродированы между собой с коэффициентом корреляции, близким к единице, и тог- тогда, как это следует из C.38), мы не получим умень- уменьшения ошибки. Если еще при этом окажется, что 62 < blt то ошибка воспроизводимости может даже увели- увеличиться . В том случае, когда анализу подвергаются пробы, пере- переведенные в водные растворы, исключается микропеодно- родность образца. Если при этом аналитические пары выбраны так, чтобы при изменениях температуры воз- возбуждения AS для одной аналитической пары линий уве- увеличивалась, а для другой уменьшалась, то ошибки ана- анализа будут отрицательно коррелированы (гх_2 < 0), и тогда, как это следует из C.38), окажется возможным умень- уменьшение ошибки воспроизводимости более чем в 1,4 раза. Экспериментальные данные, приведенные в [158], под- подтверждают это положение. Рассмотрим еще в качестве примера вопрос о выборе оптимальных условий проведения спектрального анализа по методу «добавок» [150]. При определении малых кон- концентраций примеси часто не представляется возможным найти достаточно чистый материал для изготовления на его основе эталонов. В этом случае эталоны приходится готовить, добавляя к анализируемой пробе некоторое количество определяемого вещества. Уравнение количе- количественного спектрального анализа имеет два параметра, поэтому нужно приготовить по крайней мере два эталона, добавляя в них определяемый компонент в количествах Ci и с2. Для того чтобы найти неизвестную концентра- концентрацию с,., мы должны, вообще говоря, решить совместно •' В, В. Налимов
66 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ХАРАКТЕРИСТИКИ [ГЛ. III три следующих уравнения: AS, Вычитая первое уравнение из второго и третьего, получим: * , ,\ AS2-ASX yb ' 'sVc,T V~ yb Разделив одно из этих уравнений па другое, имеем: \%[(СЪ1СХ) ~М] AS2 ASX „ , до ДО ДО \ Дифференцируя по переменным сх, ASj, AS2 и L .5 1,0 2,0 5,0 10,0 (с, с2 \ —— > —— I при различных значениях параметра-^ [150]. найдем выражение для относительной ошибки sx ' Су- X X §5] ОШИБКИ КОСВЕННЫХ ИЗМЕРЕНИЯ Г>7 где Сх. = 2.3 Будем рассматривать Cj/cx как независимую перемен- переменную, а с„/сх — как параметр; тогда для различных зна- значений этого параметра мы получим семейство кривых, представленных па рис. 9. Из рассмотрения этого семейства кривых следует, что условия анализа будут оптимальными, если первая добавка будет того же порядка, что и неизвестная кон- концентрация, а вторая добавка—на порядок больше. Несо- Несоблюдение этого условия может привести к увеличению ошибки в несколько раз. Этот пример еще раз показы- показывает, насколько важно пользоваться при косвенных из- измерениях математическим анализом основных уравнений, связывающих искомую величину с результатами прямых измерений.
ГЛЛМЛ j\ НОРМАЛЬНОЕ РАСПРЕДЕЛЕН HE § 1. Функция нормального распределения 1. В математической статистике исключительно боль- большую роль играет нормальное распределение*), которое является непрерывным распределением с плошостыо вероятности dx D.1) где ж —значение случайной лелнчпп.м, ;д п и'1- ;; а ра:,н?тр„т распределении, которые соотве-iCrs;;-.ют среднему значению и дисперсии случайной величины. Постоянная 1/сг \.'Г2л иыбрлна так. чтобы соотношение D.1) было нормировано, т. ния случайной величины была равна единице: со 1 г о Vn J е, чтоом вероятное в тглтерг.ал — --< (X -JiJ попала - D.2) Следовательно, площадь, ограниченна,'! кршюп D.1) и осью абсцисс, равна единице при любых .-шачепиях параметров \i и а. Часть этой площади, ограниченная кривой -ф(.х), осью абсцисс и ординатами, проходящими через точки хх и ж,, соотнетстнует вероятности, с которои *) Нормальное распределение оыло открыто мугиц.ом в Ы., i. и затем детально научалось Лапласом п Гауссом. В мегть lax.-.-д нормальное распределение масло иазыиают гаугсонекпм paciipv.u1- лениом. 5 11 ФУНКЦИЯ НОРМАЛЬНОГО Р-ЛСШ'ЕДЕЛЕНИН 69 случайная величина ж нрнпимяет аначеппя, лежащие и интервале г, <.'<"<>''.,: _ \ с На рис. .10 лрннедопа дпфферентшальнан кривая пор- малы(ого распределемпя. Пта кривая колоколообразной i'i!c. 10. i'jjaq.p.!; Д|1ффи;)О1:1;]1а.ч1.иоГ| i;))ii'joii нормаль- нормального раслоодр.'кчшн. формы, симметричная относительно ординаты, проходящей через точку на оса абсцисс x=\i, имеет две точки пере- перегиба при .с — и -(- а и асимптотически приближается к осп абсцисс. Инд кривой зависит от величины квадратичного отклонения. Чем больше квадратичное отклонение, тем более пологой гтаношпч'н кривая. При малых значениях квадратичного отклонении крпсая принимает иглообраз- иглообразную форму. .')то иллюстрируется на рис. И, где приве- приведено семейство крпиых норл'>»льион) ]>асп]'>еделе1шя с па- параметрами ,и = 0, 0^ = 1, а, —-2, сг3 - 4. В нратчгческнх приложениях обычно пользуются нормированным распре- распределением, которое получается при переходе от величины х к функции «-=^; D.4) при атом очевидно, что геегла
70 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [гл. IV При переходе от х к и мы получаем из D.1) функцию D.5) 1 - — 2 которая называется нормированной плотностью нормаль- Рис. 11. Семейство кривых нормального распреде- распределения с параметрами ц = 0, Ci = l, сг2 = 2, 03 = 4. ного распределения. Для практического применения функ- функция D.5) удобна своей универсальностью — здесь отсут- отсутствуют параметры распределения [х и а, изменяющиеся при переходе от одной генеральной совокупности к дру- другой. Нормирование сводится к тому, что начало коорди- координат переносится в центр распределения, а по оси абсцисс вместо переменной величины х откладываются отклонения от среднего значения, выраженные в долях о\ 1] ФУНКЦИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 71 Интегральная нормированная функция нормального распределения определяется выражением *) «2 Ф (и) = -т±= " «fa. D.6) На рис. 12 дано графическое представление инте- интегральной и дифференциальной функций нормированного нормального распределе- ния. Интегральная кривая ''р распределения монотон- но возрастает от 0 до 1, имея точку перегиба при it = 0, при этом Ф (и) — =0,5. Абсцисса интеграль- интегральной кривой, соответствую- соответствующая некоторой заданной ординате, называется квап- тилью. Для нормированного нормального распределения -3 -2 -I квантиль ир, соответствую- соответствующая уровню вероятности р, определяется из уравнения где р — вероятность того, что значение и не превзой- превзойдет некоторого заданного значения ир. Из симметрии нормаль- нормального распределения следует, что ир + Щ_р = 0. Квантиль и fluH^{ пЗ\ -3 -2 О 2 3 и Рис. 12. Интегральная и диф- дифференциальная кривые норми- нормированного нормального рас- распределения. р возрастает от — оо до +оо, когда р возрастает от 0 до 1. Квантиль, соответствующая значению р = 0,5, получила осо- особое название — медианы, так как одна половина значе- *) Здесь, как.это будет часто делаться и в дальнейшем, пре- предел интегрирования и переменная интегрирования обозначен^ одной и той же буквой.
72 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИИ [ГЛ. IV ний х больше этой величины, другая меньше. Для норми- нормированного нормального распределения медиана itOr5=O. В табл. 1 Приложения табулированы значения инте- интегральной функции распределения D.6). Пользуясь этой таблицей, мы легко можем найти квантиль, соответствую- соответствующую заданной вероятности, и вероятность, соответствую- соответствующую заданной кваптили. Пусть, например, нам требуется найти квантиль, отвечающую условию ф (,, \ _ о о<ж По табл. 1 находим it0;025 = —1,96. Следовательно, с ве- вероятностью в 2,5% можно ожидать, что величина и не превзойдет значения, равного — 1,96. Найдем вероятность того, что и принимает значения, лежащие в интервале от -0,25 до +0,35, Р ( - 0,25 < и < 0,35) = Ф (+ 0,35) - Ф (-0,25) =--. = 0,6368-0,4013 = 0,2355. В практической работе при статистических подсчетах принято также пользоваться табулированными значениями интеграла _ J^i e'^du, D.7) 1 который называется нормированной функцией Лапласа Учитывая симметричность нормального распределения оказывается удобным табулировать значения удвоенной функции Лапласа 2 с -^ 1 +Г -^ 26(it) = -4=\e zdu=-k=\e 2 du D.8) V ; /2л \ /2л J V ' О * -и так, как это сделано в табл. 2 Приложения. П. Пользуясь табулированными значениями функции нормального распределения, мы легко можем установить доверительные границы*) для результатов анализа, полученного из единичного определения, если с доста- *) О доверительных границах см. стр. 83. § 1] ФУНКЦИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 73 точной степенью надежности нам известна величина квадратичной ошибки. Пусть, например, требуется опре- определить вероятность того, что результаты анализа будут лежать в пределах X — \1 — 4- 2G. Определим значения иг и и2: По табл. 2 Приложения находим: Р(-2,0<и< + 2,0) = 26 B, 0) = 0,95450. Следовательно, мы можем утверждать, что с вероят- вероятностью 95% результаты анализа будут лежать в преде- пределах ± 2а. Тот же результат мы получили бы, конечно, и пользуясь значениями, табулированными в табл. 1: Р(-2, 0<и< + 2, 0) = Ф( + 2, 0)-Ф(-2, 0) = = 0,97725 - 0,02275 = 0,95450. Но учитывая симметричность заданных пределов, здесь оказывается удобнее пользоваться значениями удвоенной функции Лапласа. Во многих практических приложениях, в том числе в аналитической работе, двухсигмовые пределы часто принимают за допустимые отклонения, а величину ± 2а называют максимально допустимой ошибкой. Здесь надо подчеркнуть, что понятие максимальной ошибки не име- имеет строго определенного, безусловного смысла. Кривая плотности вероятности нормального распределения асимп- асимптотически приближается к оси абсцисс и, следовательно, вообще говоря, пределы появления ошибок оказываются неограниченными*). Ограничить эти пределы можно толь- только условно, задавшись определенной вероятностью попада- попадания ошибок в этот интервал. Интересно отметить, что в существующих у нас ГОСТ'ах даются допустимые пределы *) В практической работе появление очень больших ошибок всегда может быть ограничено, исходя из некоторых соображений общего характера. Например, если результат определения какого- нибудь компонента окажется больше величины навески, взятой для анализа, то такой результат, конечно, будет отброшен.
74 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ.IV для отклонения результатов анализа без указания вероят- вероятности, с которой можно ожидать попадания ошибок в эти пределы. Ясно, что при такой формулировке эти допуски не имеют никакого метрологического смысла. Если какая- либо лаборатория захочет проверить, в какой степени принятая у них методика отвечает требованиям ГОСТ'а, то остается неясным, какое количество анализов при этом надо выполнить. Любые пределы, указанные в ГОСТ'е или каких-либо инструкциях, всегда можно превзойти, если сделать достаточно большое количество определений. Совершенно очевидно, что в ГОСТ'ах наряду с указанием допусков надо указывать и вероятность попадания ана- анализов в эти допуски. В некоторых случаях при выполнении особенно ответ- ответственных измерений за максимально допустимое откло- отклонение принимают трехсигмовые пределы. В этом случае Р (- 3,0 < и < + 3,0) = 26 C, 0) = 0,99730. Следовательно, вероятность появления отклонений, по абсолютной величине превосходящих За, равна 0,27%. Важно обратить внимание на то обстоятельство, что Р (—0,675 < и < + 0,675) = 26 @,675)^ 0,5. Следовательно, одна половина ошибок измерений по абсо- абсолютной величине больше 0,675 а, а другая половина меньше. В силу этого свойства величина q ~ 0,675 а полу- получила специальное название вероятной ошибки измерения (иначе — срединной ошибки или срединного отклонения). III. Введем понятие среднего арифметического откло- отклонения (иначе — ошибки)*), которое иногда применяется наряду с а2, о и q как характеристика рассеяния. Ыайдем соотношение между квадратичной ошибкой и средним арифметическим отклонением # для генераль- генеральной совокупности Из соотношения D.1) после умножения на \х — [х | и введения новой переменной z — (х — \iJ/2a2 *) Среднее арифметическое отклонение, или ипаче, средняя арифметическая ошибка, является абсолютным центральным мо- моментом (см. [9], [14]) первого порядка, в отличие от начального момента первого порядка — среднего значения случайной вели- величины и от центрального момента второго порядка — дисперсии случайной величины. ФУНКЦИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИИ 75 получаем, пользуясь определением среднего C.1), со (х—|хJ со °2 \х — \х\ dx= , \ e~z dz — 1 ' 1/2л J аУ~2л J = |/|-сг~0,80сг. D,9) Следовательно, для случайной величины, подчиняющейся нормальному распределению, существует очень простое соотношение, связывающее квадратичную и среднюю арифметическую ошибки, определенное для генеральной совокупности: Ф = 0,80а, а =1,25*. Во всех практических приложениях приходится ограничиваться определением выборочной дисперсии s2 C.10). Учитывая это обстоятельство, выражение, связы- связывающее выборочную квадратичную ошибку s и выбороч- выборочную ошибку т, нужно написать так: ~0,80 га—1 = 0,80s отсюда &¦ ~- 1,25У! \xi-i i=l V га (га— Г) 1,25т У (га —1)/га ! D.10) где | хг — х | — абсолютное значение разности. Можно поступить иначе— определять выборочное сред- среднее арифметическое отклонение формулой 2 т = D.11) При таком определении между выборочными квадратич- квадратичной и средней арифметической ошибками останется такое же соотношение, какое имеет место для соответствую- соответствующих величин в генеральной совокупности. Определение
76 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [гл. IV выборочного среднего арифметического отклонения по формуле D.11) дано, в частности, в руководстве по метрологии М. Ф. Маликова [19]. Но тем не менее это определение не привилось; обычно под выборочным сред- средним арифметическим отклонением понимают величину, п ]>! \Xi-x\ определяемую формулой т = — . В старой литературе по математической статистике, оперирующей с большим экспериментальным материалом, часто в качестве дисперсионного параметра пользовались величинами 0 и Q. Обычно поступали так: подсчитывали среднее арифметическое отклонение, а окончательные ре- результаты выражали при помощи вероятной ошибки. Это аргументировалось тем, что вероятная ошибка имеет очень простое и наглядное толкование, а средняя арифметичес- арифметическая ошибка легко поддается вычислению. Последующее развитие математической статистики показало нецелесо- нецелесообразность применения # и q в качестве меры рассеяния. Это можно мотивировать следующими соображениями: A) Соотношение q = О,б7о<т справедливо только тогда, когда строго выполняется нормальное распределение. Те статистические ансамбли, с которыми приходится иметь де- дело в практической работе, часто существенно отклоняются от нормального распределения, и в этом случае применение1 написанного выше соотношения вносит дополнительный элемент неопределенности без всякой на то необходимости. B) Если статистической обработке подвергаются боль- большие выборки, функция распределения которых не сильно отличается от нормального закона, то в этом случае для выборочных квадратичной и средней арифметической ошибок можно пользоваться тем соотношением, которое имеет место для соответствующих величин в генеральной совокупности, так как при достаточно большом п величи- величина |/(/г— 1)/п в выражении D.10) мало отличается от единицы. Но этот прием становится совершенно непригод- непригодным, когда материал, подлежащий обработке, представ- представляет совокупность, состоящую из небольших групп изме- измерений. Если мы подсчитаем две средние арифметические ошибки для одного и того же множества измерений, § П ФУНКЦИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 77 разбивая их один раз на группы численностью пг, а дру- другой раз на группы численностью п„, то получим, как это следует из D.10), следующее соотношение между сред- средними арифметическими отклонениями: D.12) У К— l)/"t которое будет существенно отличаться от единицы при небольших значениях пг и т?2. В [85] последовательность в 20 измерений была представлена в виде совокупностей, состоящих из групп с п1 = 4 и п2 — 2, как это показано ниже xl-!xlsxl9x20. Непосредственный подсчет показал, что т1/т2 = 1,246; ио формуле D.12) можно было бы ожидать, что это отно- отношение будет равпо 1,225. В повседневной аналитической работе часто приходится пользоваться материалом, пред- представляющим собой совокупность малочисленных групп, поэтому применение средней арифметической ошибки как меры рассеяния становится нежелательным. C). Наконец, надо иметь в виду, что в последнее время в аналитической работе все более широкое при- применение начинают находить регрессионный, корреляцион- корреляционный и дпеперсиопный анализы, в которых всегда не- непосредственно вычисляются дисперсии. Учитывая все эти соображения, можно рекомендовать для оценки рассеяния всегда подсчитывать непосред- непосредственно дисперсию, а окончательные результаты обработ- обработки материала выражать с помощью квадратичных ошибок. Это было бы первым шагом по пути к стандартизации способов представления экспериментального материала. IV. Отметим следующее важное свойство нормального распределения: если мы имеем две нормально распреде- распределенные независимые случайные величины с параметрами AЖ, [ху, al, a%, то их сумма также распределена нормаль- нормально с параметрами Иж+у — he + ^y и a|f,, = al + cr,}. Эта теорема справедлива также и для суммы п случайных нормально распределенных величии.
78 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЙ [гл. IV Из теоремы сложения для нормального распределения следует, что среднее п стохастически независимых наблю- наблюдений над нормально распределенной случайной величи- величиной с параметрами [х и <з\ распределено нормально с пара- параметрами ц, и сг| = <?!//?. Нормируя эту новую случайную величину, получаем: II — X — U, ах/['п D.13) Рассмотрим следующий пример: при изготовлении вторичного эталона в нем было' надежно установлено среднее содержание вещества, равное 0,50%, с квадра- квадратичной ошибкой единичного измерения, ранной 0,05%. Спрашивается, с какой вероятностью можно ожидать, что при повторном анализе средний результат 25 параллель- параллельных определений будет варьировать и пределах 0,49— 0,51%. Примем полученные памп величины в качестве оценок для параметров генеральной совокупности: ji = 0,50, сг = 0,05. Произведем вычисления: : Уп ;' 25 _ 7Х — р. _ 0,49 ¦ ~~ ~ОхГ ~ ОДЛ 0,50 -= -1 й,= г —ц 0,51—0,50 0,01 __;_ Л По табл. 2 Приложения находим: Р (—1, 0 < и < + 1, 0) = 20 A, 0) -= 0,6827. Следовательно, для нашего примера в 68% случаев сред- средний результат 25 измерений будет находиться в преде- пределах 0,49-0,51%. § 2. Некоторые специальные распределения, связанные с нормальным распределением Каждый экспериментатор знает, что если он про- производит небольшое число измерений, то результаты схо- сходятся очень хорошо, и только затем, по мере увеличе- увеличения числа измерений, появляются большие расхождения. § 2] РАСПРЕДЕЛЕНИЯ. СВЯЗАН. С НОРМАЛЬНЫМ РАСПРЕД. 79 Это постоянно наблюдаемое явление легко объяснить, исходя пз нормального закона, согласно которому ве- вероятность появления малых отклонения значительно больше, чем вероятность появления больших отклонений. Вероятность появления погрешностей по абсолютной величине, превышающих 2а, равна ~0,05, поэтому, если мы сделаем 20 измерений, то здесь можно будет ожидать появления одного такого отклонения. Если же экспери- экспериментатор сделал всего два измерения, то естественно ожидать, что среди них таких больших отклонений не будет. Подсчет выборочных дисперсий производится простым суммированием квадратов отклонений, поэтому естественно, что ошибка, подсчитанная но малой выбор- выборке из генеральной совокупности, в большинстве случаев будет меньше, чем ошибка соответствующей ей гене- генеральной совокупности. Если мы в выражение D.13) под- подставим вместо а ее оценки, полученные по малым выбор- выборкам, то не получим нормального распределения. В силу этих обстоятельств классическая теория ошибок, осно- основанная на нормальном распределении, неприменима для обработки малого числа измерений. Она нашла очень широкое применение в метрологии, астрономии и геоде- геодезии, где всегда выполняется большое число измерений, и оказывалась мало полезной при анализе вещества, где, как правило, делается небольшое число параллель- параллельных определений. Только с начала XX века стало раз- развиваться новое направление и математической статисти- статистике, которое можно назвать статистикой малых выборок или макростатистикой. /-распределение Рассмотрим прежде всего распределение Стьюдента*), после опубликов нпя которого началось развитие микро- статистики. Если обработке подвергается небольшое число измерений, то вместо дисперсии а2, характеризующей рассеяние в генеральной совокупности, мы вынуждены *) Распределение открыто в 1908 г. английским статистиком и химиком Госсстом, работавшим в пивоваренной промышленности. Стьюдеит—псевдоним Госсета.
80 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИК [ГЛ. IV пользоваться выборочной дисперсией s2, степень прибли- приближения которой к генеральной дисперсии зависит от числа степеней свободы, по которым подсчитывается выборочная дисперсия. Выражение D.13), написанное для генеральной квадратичной ошибки, нужно заменить выражением 1 = ^=^, D.14) которое не содержит неизвестной нам величины ах. Распределение величины t называется ^-распределением или распределением Стьюдента. Плотность вероятности ^-распределения дается выражением D.15) 'Vnf (— со <t< со), где / = п—1 число степеней свободы, по которым под- подсчитана дисперсия s2. Символ Г (/) обозначает гамма- функцию *). Гамма-фупкция определяется интегралом ее можно рассматривать как обобщение факториала натурального числа. Когда и— положительное целое число, то Г(м+1)=м!. Для гамма-функции известны также соотношения Ч " У Пользуясь этими соотношениями, можно определить гамма-функ- гамма-функцию для и, кратного 1/i. Например: V я Практически для любых значений и гамма-функция может быть вычислена с помощью таблицы значений Г (и). §2] РАСПРЕДЕЛЕНИЯ, СВЯЗАН. С НОРМАЛЬНЫМ; РАСПРЕД . 81 Иа D.15) видно, что 2-распределение зависит только от числа степеней свободы /, по которым определялась выборочная дисперсия. На рис. 13 приведены дифферен- дифференциальные кривые распределения Стьюдента для числа степеней свободы /=1, 5 и со. Эти кривые по своей -4 -3 -2 -/ ' " О 1 2 3 4 Рис. 13. Кривые г-распределения при /=1,5 и со. форме напоминают "кривые нормального распределения, но при малых значениях / они значительно медленнее сближаются с осью абсцисс при \t\~->oo. Вероятность того, что случайная величина t попадет в некоторый интервал (tp, t v) определяется выраже- 2 1~2 нием P(tE<t<t г) = 1-р. D.16) 2 2 Это иллюстрируется рис. 14. Из симметрии кривых распределения следует, что in = — t -л. Поэтому вероятность того, что t окажется за пределами 6 В. В. Налимов
82 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ {tp, t р), будет равна 2 1-2 *2 2 со р= ^ <p{t)dt+ ^ <p(t)dt = 2 -о. t п t [гл. IV 2 ^ <f{t)dt. D.17) Учитывая симметрию кривых ^-распределения, часто пользуются обозначением ?р ,, где / означает число CC'f-P Рис. 14. Графическое изображение1? вероятности того, что случайная величина t окажется за пре- пределами интервала (t р, t p ). степеней свободы, а р—вероятность того, что t нахо- находится за пределами интервала (tp, t p). Обычно из тек- 2 4~2 ста всегда бывает видно, в каком значении употреб- употребляется нижний индекс р при t. В табл. 3 Приложения табулированы значения t в за- зависимости от числа степеней свободы / для вероятностей /> = 0,10, 0,05, 0,02 и 0,001, определяющихся соотноше- § 2] РАСПРЕДЕЛЕНИЯ, СВЯЗАН. С НОРМАЛЬНОМ РАСПРЕД. Й нием D.17). Например, при /? = 0,10 и /=10 находим ? = 1,81. Это значит, что?0>93 = —?OiO3 = lf81. Следовательно, P(t< 1,81) = 0,95; P(t< -1,81) = 0,05; i>(—1,81 <*< +1,81) = 0,90; P(\t\> 1,81) = 0,10. Ниже из этой таблицы выписаны некоторые значения t для р = 0,05. f 12,71 4,30 2,57 10 2,23 20 2,09 1,96 При /—> со ? =1,96, что точно совпадает с значением соответствующей величины для нормального распределе- распределения, которая находится с помощью табл. 2 Приложений: 28 (и) = 0,95, и =1,96. При / = 20 распределение Стьюдента еще довольно хорошо апроксимируется нормальным распределением. Большая разница в оценках, полученных с помощью нормального распределения и распределения Стьюдента, будет при / < 10. Эта разница увеличивается с уменьше- уменьшением числа степеней свободы /. Исходя из D.14) и D.16), мы можем написать соотно- соотношение -Р- D.18) Решая в этом соотношении неравенство относительно |х, мы получим доверительные границы*) для |л --1-р. D.19) величин х! к х"' ™1 ф2 ( и **' '''' *» от величии j.j, х2, ..., хп, для которых неравенство ( х, Xt, ..., Вер°ЯТН0СТЬЮ ° = И вероят- 6'
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV Вероятность а = 1 — р называется доверительной вероятностью или «коэффициентом доверия», а также иногда «коэффициентом надежности». Совершенно анало- аналогичные соотношения мы будем иметь и для нормаль- нормального распределения, если t и s соответственно заменить на и и а: -.\-р. D.20) Если, например, п = 2, р/2 = 2,5% и соответственно 1~ р/2 — 97,5%, то для нормального распределения мы получим: р ( -№' <Гх - р < Щ^) = 0,95. D.21) V )/2 У2 у Щ^) = 0,95. У2 у Для распределения Стьюдента по табл. 3 Приложения находим, что i = 12,71 при / = 1 и р = О,ОЪ, Следова- Следовательно, при тех же условиях для распределения Стью- Стьюдента будем иметь: = 0,95. D.22) /2 " г Поэтому если мы планируем опыты в условиях, когда генеральная дисперсия неизвестна, то с 95%-ной вероят- вероятностью можем ожидать, что при п = 2 выборочная сред- средняя будет отклоняться от генеральной средней в пре- пределах + 12,71s:c/l/2. Здесь пределы оказываются более широкими, чем в случае применения нормального распределения — из-за незнания генеральной дисперсии мы извлекаем из опытов значительно меньшую инфор- информацию. Рассмотрим пример из аналитической практики: в результате двух параллельных определений были полу- получены следующие данные, характеризующие содержание хрома в эталоне: 4,50% и 4,70%. Требуется найти сов- совместимые с опытом доверительные границы для гене- генеральной средней, исходя из 95%-ной доверительной вероятности. Произведем подсчеты: - 4,50+4,70__.т „ _ 2] РАСПРЕДЕЛЕНИЯ, СВЯЗАН. С НОРМАЛЬНЫМ РАСПРЕД. 85 Мы знаем, что t = 12,71 при / = 1, /? = 0,05. Поль- Пользуясь найденными значениями х и sx, получаем: tsx 12,71x0,14 , „ Vn !>4 Следовательно, при доверительной вероятности а = 0,95 совместимые с опытом границы для генерального среднего в данном эксперименте определяются неравен- неравенством - 1,27 < 4,60-н< +1,27. Решая его относительно \i, получаем *). 3,33<ц<5,87. Результаты анализа могут быть записаны так: 4,60 ± 1,27. По паспортным данным наш эталон содержит 3,90% хрома. При оценке полученных нами результатов можно было бы сформулировать задачу и несколько иначе, поставив вопрос о том, является ли статистически значи- значимым расхождение между паспортными данными и резуль- результатами анализа, т. е. случайно ли расхождение между х и \i (тогда им можно пренебречь) или оно не случайно (статистически значимо) и целесообразно констатировать, что выборочное среднее х не является оценкой данного генерального среднего \i, записанного в паспорте. При такой постановке вопроса вычисляют значение t по экспе- экспериментальным данным и сравнивают его с табличными *) Здесь необходимо обратить внимание на одпу тонкость в формулировках (см. [14]). Выло бы неправильным утверждать, что вероятность неравенства 3,33 < ц < 5,87 равна 0,95. Это последнее неравенство мы получили из неравен- неравенства в соотношении D.22), подставляя туда вместо случайной величины х ее значение, полученное в данном конкретном опыте. После такой подстановки неравенство уже не содержит случай- случайных величин и для данного опыта оно может выполняться или не выполняться и, следовательно, с ним может быть связана только вероятность 1 или 0,
86 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV данными, учитывая число степеней свободы ___^Г-Ц __ 4,60-3,90 п п sx/VW 0,14/1,4 ~ '-U- По табл. 3 Приложения мы находим, что вероятность P(\t]> 1,0) лежит где-то между 0,10 и 0,05. Следова- Следовательно, вероятность *)/>(?> 7,0) будет находиться где-то между 0,05 и 0,025. В статистическом анализе с известной степенью услов- условности считают значимыми только такие расхождения, вероятность появления которых р<0,01, полагая, что с практической точки зрения можно пренебрегать появ- появлением событий со столь малой вероятностью. Вероят- Вероятность р, которую принимают за основу при статистической оценке гипотезы, называется уровнем значимости. Часто в практических приложениях ориентируются на более жесткий 5%-ный уровень значимости. Такой подход не всегда может быть оправданным. Часто нужно считать целесообразным постановку дополнительных опытов в тех случаях, когда критерий оказывается вблизи 5%-ного уровня значимости. В нашем примере, если мы будем ориентироваться на 5%-ный**) уровень значимости, то вынуждены будем признать наличие неслучайного рас- расхождения между средним результатом анализа и паспорт- паспортными данными. Но такой вывод является малонадежным. Правильнее было бы в нашем случае результаты статисти- статистического анализа сформулировать более осторожно, утвер- утверждая только то, что в результате двух параллельных определений у нас появилось сомнение в том, что средний результат неслучайно отличается от паспортных данных *) Здесь мы пользуемся так называемым односторонним критерием, так как найденной величине t можно приписать опре- определенный знак. В некоторых случаях, например при сравнении двух средних, величине t нельзя приписать определенный знак, тогда пользуются двусторонним критерием. В нашем случае, если применять двусторонний критерий, то при статистической оценке результатов определения нужно будет ориентироваться на вероятность P(\t\> 7,0). **) Если ориентироваться на односторонний 5%-ный критерий значимости, то для генерального среднего нужно было бы уста- устанавливать 90%-ную двустороннюю доверительную вероятность. § 2] РАСПРЕДЕЛЕНИЯ, СВЯЗАН. С НОРМАЛЬНЫМ РАСПРЕД. 87 и что для окончательного решения этого вопроса нам нужны дополнительные опыты. Всякий раз, когда экспериментатор сталкивается с си- ситуацией, подобной описанной, он выдвигает так называе- называемую нуль-гипотезу*), т. е. гипотезу о том, что изучаемый эффект оказывается в данном эксперименте незначимым. В приведенном выше примере нуль-гипотезой было утвер- утверждение об отсутствии систематического расхождения между паспортными данными и результатами анализа. Если значимость изучаемого эффекта оказывается < 0,01, то нуль-гипотеза отвергается, если же значимость ока- оказывается <0,05, то в зависимости от принятых условий нуль-гипотеза ставится под сомнение или также отвер- отвергается. К оценке полученных результатов можно было бы подойти и с других позиций. На основании большого экспериментального материала, вообще говоря, известно, что коэффициент вариации, характеризующий ошибку воспроизводимости единичного спектрального определе- определения, равен приблизительно 5%. Следовательно, в нашем случае мы можем полагать, что квадратичная ошибка в генеральной совокупности равна приблизительно 0,23%. Зная величину генеральной квадратичной ошибки, мы можем для установления доверительных границ восполь- воспользоваться нормальным распределением. В этом случае при доверительной вероятности а = 0,95, исходя из соотношения D.21), мы получим значительно более узкие пределы для генерального среднего, совместимые с результатами нашего двукратного определения: 4,28 < р < 4,92. Далее можно подсчитать 4,60—3,90 По табл. 1 Приложения находим, что Р (гг>4,3)=0,00001, тогда Р (| и\ > 4,3)=0,00002. Здесь уже бесспорно мы должны признать наличие неслучайного расхождения *) Термин нуль-гипотеза введен английским статистиком Р. Фишером.
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV между средним результатом двух наших определений и паспортными данными эталона. В нашем примере получилось очень большое расхож дение между двумя оценками, так как анализ выполнялся всего из двух параллельных определений. Между этими двумя оценками есть глубокая принципиальная разница. В первом случае оценка точности производится только на основании результатов данного анализа; при этом выска- высказывается только одна гипотеза о том, что наши измерения являются случайной выборкой из генеральной совокуп- совокупности, подчиняющейся нормальному распределению. Во втором случае высказывается еще гипотеза о том, что дисперсия, характеризующая ошибку воспроизводимости, является устойчивой величиной и что наша малая выборка является случайной выборкой из той генеральной сово- совокупности, для которой раньше нами достаточно надежно была определена генеральная дисперсия. Вопрос о том, чем пользоваться—распределением Стьюдента или нормальным распределением, решается каждый раз в зависимости от условий эксперимента. Распределением Стьюдента приходится пользоваться во всех тех случаях, когда аналитик делает определения по методике, которая не является стандартной для дан- данной лаборатории, или когда он разрабатывает и изучает новые методы анализа, или, наконец, когда анализ одной и той же пробы проводится в разных лабораториях и дове- доверительные границы для генерального среднего устанав- устанавливаются по межлабораторной ошибке воспроизводимости. Во всех этих случаях приходится определять ошибки воспроизводимости только по результатам данного экспе- эксперимента. В то же время, если мы имеем хорошо изученный и строго установившийся процесс анализа, то для уста- установления доверительных пределов можно применять нор- нормальное распределение, определяя генеральную диспер- дисперсию по результатам предыдущих текущих анализов, используя для этого данные аналитических архивов, как это было показано в предыдущей главе. Производить оценку результатов анализа с помощью распределения Стьюдента можно . только тогда, когда наша малая выборка может рассматриваться как случай- случайная выборка из генеральной совокупности, подчиняющейся 2] РАСПРЕДЕЛЕНИЯ, СВЯЗАН.С НОРМАЛЬНЫМ РАСПРЕД. 89 нормальному распределению, или хотя бы из генеральной совокупности, функция распределения которой не при- принадлежит к какому-то другому классу распределения, существенно отличному от нормального. Специальные исследования показали, что некоторые отклонения от нормального распределения в генеральной совокупности не вносят существенных изменений в оценки, полученные с помощью распределения Стьюдента. особенно если число измерений не очень мало. %2-р аспределение Одна из задач статистического анализа заключается в установлении доверительных пределов для генеральной дисперсии, если известна выборочная дисперсия. Эта задача решается с помощью ^-распределения *). Допустим, что мы имеем / независимых случайных величин иъ п2, ..., uf, распределенных нормально с пара- параметрами ц = 0 и а=1 каждая. Сумма квадратов этих случайных величин обозначается через %2 @<Х2<со), D.23) где В{ =т ——-; / — число степеней свободы %2. Можно дать другое определение для %2. Если мы имеем п стохастически независимых наблюдений xlt х2, ..., хп над нормально распределенной случайной величиной, то можно показать, что сумма у_п—1 D.24) распределена как %2 с / = га—1 степенями свободы. *) Х2-распределение впервые было получено Гельмертом в 1876 г. Затем оно снова было открыто и детально разработано Пирсоном в 1900 г,
90 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV Плотность вероятности распределения значений х2 определяется выражением С2Jе 2 @<x«<oo), D.25) 1 где / — число степеней свободы. На рис 15. приведены кривые плотности вероятности ^-распределения для различного значения числа степеней 20 25 30 X' 5 Ю 15 Рис. 15. График плотности вероятности ^-рас- ^-распределения при / = 2, 4, 10. свободы. Кривые асимметричны, степень асимметрии уменьшается с увеличением /. В табл. 4 Приложения приведены значения Хр в зависимости от вероятности Р (х2 > Хр) = Р и числа степеней свободы /. В табл. 5 Приложения табулированы вероятности Р (х2 > xl) — Р в зависимости от значений хр и числа степеней свободы/. При такой системе обозначений /?-квантиль *) равна х1-р- *) В некоторых руководствах, например в книге Хальда [30, 44], таблицы всех распределений построены для квантилей. Такое построение таблиц значительно облегчает изложение материала, но делает более громоздким их применение. 2] РАСПРЕДЕЛЕНИЯ, СВЯЗАН. С НОРМАЛЬНЫМ РАСПРКД. 91 Для того чтобы подчеркнуть зависимость xl от числа степеней свободы, часто пишут XpJ или Хр(/)- Например: %о,ю; ю — 16,0. Это значит, что Р(Х2> 16,0) = 0,10 для /=10. Двусторонние доверительные границы для xs можно получить из соотношения P(xk<X2<xk) = Pi-Pz D-26) с доверительной вероятностью а = р1 — р2. Например, если нам нужно найти с доверительной вероятностью а = 90% границы для х2 ПРИ Ю степенях свободы, то по табл. 4 Приложения находим: x§,95;io — = 3,94, Хо,о5; ю = 18,3. Следовательно, Р C,94 < х2 < 18,3) = 95% - 5% = 90%. Подставляя выражение для х2. определенное по D.24), в соотношение D.26) и решая неравенство в этом соот- соотношении относительно а2, мы получаем доверительные границы для генеральной дисперсии («—1)*? XI а у2 I — Pi р2- D.27) Рассмотрим следующий пример: на основании 20 повторных определений была найдена ошибка воспро- воспроизводимости sx; требуется установить доверительные границы для генеральной квадратической ошибки при доверительной вероятности а = 90%. По табл. 4 Прило- Приложений находим: хо,О5; 19 = 30,1, хо,95,-19 = Ю,1. Следова- Следовательно, совместимые с опытом границы для генеральной квадратичной ошибки будут определяться неравенством ^ /19 1 /10,1 и которое равносильно неравенству 0,79^ < а < 1,376V Доверительные границы оказываются асимметричными в соответствии с асимметрией кривых распределения,
92 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИИ [ГЛ. IV Асимметрия оказывается особенно резко выраженной при низком значении /. Если выборочная дисперсия s2 определяется по двум измерениям, расчеты, анало- аналогичные приведенным выше, дают при 90-процентной доверительной вероятности доверительные границы 0,51s!<c< 16,0Sl. При / = 29 доверительные границы становятся почти симметричными 0,82s! < с < 1,28s!. Установление доверительных границ для генеральной дисперсии значительно упрощается, если выборочная дисперсия определена по достаточно большому числу наблюдений. Можно показать, что при_га^-_ЗЛ случайная величина s распределена приближенно нормально со сред- средним значением а и квадратичной ошибкой °* = Л=- D-28) Следовательно, в этом случае доверительные границы для генеральной квадратичной ошибки будут опреде- определяться неравенством D.29) Рассмотрим следующий пример: при доверительной вероятности а = 0,90 нужно найти доверительные гра- границы для генеральной квадратичной ошибки, когда выборочная дисперсия определена по 30 измерениям. Находим квадратичную ошибку в определении ошибки sx: = 0,13s!. "¦ V 2/ /2C0—1) По табл. 2 Приложения находим, что и =1,645 для условия 29 (в) = 90%. Следовательно, совместимые с опы- опытом границы для генеральной квадратичной ошибки определятся неравенством 0,79.?г < о < 2] РАСПРЕДЕЛЕНИЯ, СВЯЗАН. С НОРМАЛЬНЫМ РАСПРЕД. 93 которое мало отличается от приведенных выше строго рассчитанных границ. В заключение нужно напомнить, что если дисперсия определяется по текущим измерениям, то число степеней свободы f=m(n— 1). В этом случае при достаточно большом т мы получим узкие доверительные границы даже при очень низких значениях п, так как при соот- соответствующих вычислениях везде п — 1 надо будет заме- заменить на т(п— 1). F-p аспределение В экспериментальной работе часто возникает необхо- необходимость проверить гипотезу о равенстве генеральных дисперсий а\ - <з\, если известны выборочные дисперсии s\ и s\. Эта задача решается при помощи /^-распреде- /^-распределения, которое также называется ^-распределением, или распределением Фишера *). Плотность вероятности /^-распределения определяется выражением Ф (/?) = ¦ h+h /1-2 0 к ~\ h h 2 J D.30) >)• Распределение зависит только от числа степеней свободы f1 и /г, по которым подсчитываются выборочные дисперсии. На рис. 16 приведены кривые плотности вероятности /^-распределений для некоторых значений /х и /2, Кривые имеют асимметричную форму. В табл. 6 Приложения даны значения F (/х, /2) для уравнений значи- значимости Р = 0,20, 0,05, 0,01 и 0,001 и различных сочетаний j1 и /2. Таблица составлена так, что в верхнем горизон- горизонтальном ряду отложены значения j1 для большей диспер- дисперсии, а в левой вертикальной колонке — значения /2 для *) Английский статистик Р. Фишер дал распределение для отношения z=l/2 In sf /s|. Позднее Сне декор предложил перейти непосредственно к распределению отношения F = s\ls\.
94 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [гл. IV меньшей из сравниваемых дисперсий. Нужно обратить внимание на то, что F (/ц /2) Ф F (/2, /х). При проверке гипотезы о равенстве двух генеральных дисперсий а\ = <з\ нужно различать два разных случая: 1. Альтернативной является гипотеза а\ > а|, т.е. у нас априори есть основания полагать, что о{ может о Рис. 16. График плотности вероятности /"-распре- /"-распределения при (/l /2)=A0,4) и A0,50). быть только равна или больше <з\. В этом случае одно- односторонняя доверительная граница будет определяться неравенством *) >F, Нуль-гипотеза о\ = o\ будет отброшена в том случае, если экспериментально найденное значение F = s\/s\ будет превосходить значение Fp (jv /2), полученное по табл. 6 Приложения для выбранного уровня значимости р. Рас- Рассмотрим следующий пример: при разработке спектро- аналитической методики нужно было проверить, есть ли необходимость в соблюдении геометрической формы электрода с высокой степенью точности. Было поставлено две серии опытов: в одной из них правильность изго- *) Здесь индекс при F означает уровень значимости для проверки гипотезы. При такой системе обозначения р-квантиль равна /"i_p. РАСПРЕДЕЛЕНИЯ СВЯЗАН. С НОРМАЛЬНЫМ РАСПРВД. 95 товления электродов измерялась «на глазок», во второй — с помощью специального измерительного инструмента. Здесь заранее, исходя из условий постановки экспери- эксперимента, можно было ожидать, что <з\ может быть только больше или равно <з\. Результаты экспериментов пока- показали, что s1 = 0,023, s2 = 0,019. Дисперсии в обоих слу- случаях определялись по п1 = п2 = 25. Подсчет показывает s\ __ 0,023г s\ ~ 0,0192 1) По табл. 6 Приложения находим, что Fo,O5 B4,24) = = 2,0; F0,20 B4,24) = 1,4. Следовательно, у нас нет основания отбрасывать или даже сомневаться в правиль- правильности нуль-гипотезы. Проведенные нами опыты не дают возможности утверждать, что контроль формы электро- электродов «на глазок» ухудшает воспроизводимость анализа. 2. Рассмотрим второй случай, когда альтернативной является гипотеза а\ Ф а\, т. е. когда заранее, исходя из постановки эксперимента, нельзя утверждать, что возможны только два результата: о\ = а2 и о\ > о\. В этом случае нужно пользоваться двусторонними доверитель- доверительными пределами— нуль-гипотеза о\ = а\ здесь отбрасы- отбрасывается, когда выполняется одно из неравенств D.31) Но из соотношения следует, что рD 4 ^Fv{h,hV 2 • Поэтому двусторонние доверительные границы могут быть представлены одним неравенством: большая дисперсия меньшая дисперсия p (/„, /„). D.32)
96 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [гл. TV Этот критерий будет двусторонним, если мы будем отвергать гипотезу a\ = al с уровнем значимости р тогда, когда отношение большей дисперсии к меньшей будет превосходить табличные значения Fp(f6,fM), а не значе- 2 ния Fp (/б, /м), как это имело место в предыдущем примере, когда применялся односторонний критерий. Рассмотрим следующий пример: при разработке спектро- аналитической методики для двух вариантов ана- анализа были получены следующие квадратичные ошибки: sx = 0,027 и s2 = 0,014. Число определений в первом слу- случае было 25, во втором — 15. Подсчеты показывают: 0,027' 0,014a — По табл. 6 Приложения находим: /"o.oi B4,14) = 3,4; ^0,001 B4,14) = 5,4. Следовательно, различие в ошибках воспроизводимости вполне значимо при 2%-ном уровне значимости. Можно показать, что распределения t и %2 являются частными случаями /^-распределения F{fv co) = ^-, /-A,/,) = *»(/.)• D.33) Например, по соответствующим таблицам, находим: /'о,о5(Ь, со) = 2,1; g = -^- = 2,1, F0}05 A,8) = 5,3; г§,05 (8) = 2,312 = 5,3. г-р аспределение В некоторых практических приложениях приходится пользоваться распределением относительного отклонения л- = ¦ D.34) Это выражение получается после замены в нормированной случайной величине и = (х—\х)/а параметров генеральной совокупности на их выборочные оценки х и s. Плотность § 2] РАСПРЕДЕЛЕНИЯ, С1ШЗЛН. С НОРМАЛЬНЫМ РАСПРЕД, 97 вероятности величины i\ определяется выражением Г D.35) где число степеней свободы / = п —2, так как величины ri связаны двумя очевидными соотношениями Можно показать, что имеет место простое соотношение г= |/п- D.36) где гху — выборочный коэффициент корреляции между случайными величинами х и у. В табл. 7 и 8 Приложе- Приложения табулированы значения г и г в зависимости от / при jo = 0,10, 0,05, 0,01 и 0,001, где р определяется равенством (г) dr. Например, по табл. 7 Приложения находим, что г —1,910 при jD = 0,05 и / = 10. Это значит, что при 10 степенях свободы Р(\г\ > 1,910) - 0,05. Пользуясь табулированными значениями гху, можно производить оценку значимости выборочного коэффициен- коэффициента корреляции для случайных выборок из генеральной совокупности — этот вопрос подробнее будет рассмотрен в гл. IX. Распределение величины г может быть получено из ^-распределения и, следовательно, также может рассмат- рассматриваться как частный случай /^-распределения. При боль- больших значениях / r-распределение близко к нормальному распределению, при /—>оо мы получаем доверительные границы, соответствующие пределам для нормального распределения. 7 В. В. Налимов
98 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV § 3. Критерии для оценки степени близости наблюдаемого распределения к нормальному распределению В предыдущих разделах были рассмотрены свойства нормального распределения и некоторых специальных распределений, с ним связанных. Те реальные статисти- статистические ансамбли, с которыми приходится иметь дело в повседневной практической работе, всегда имеют рас- распределения, в той или иной степени отличающиеся от нормального распределения. Поэтому при статистическом анализе нового экспериментального материала прежде всего возникает необходимость в оценке степени близости экспериментально наблюдаемого распределения к нормаль- нормальному распределению. При этом здесь могут быть постав- поставлены две задачи: A) Выяснить, носит ли отклонение от нормального распределения случайный характер. Если имеет место неслучайное отклонение, то экспериментатор может выдви- выдвинуть ряд гипотез относительно причин, вызывающих эти отклонения, и, устранив их, улучшить методику анализа. B) Решить вопрос о том, не имеет ли место распре- распределение, существенно отличное от нормального распреде- распределения. Если статистической обработке подвергается ire очень малое количество экспериментального материала, то F, t, 5C2 и r-критерии можно применять для. оценки результатов испытаний и тогда, когда имеет место неслу- неслучайное отклонение от нормального распределения. Важно только, чтобы эти отклонения не приводили к появлению распределения, принадлежащего к какому-то иному клас- классу распределений, существенно отличному от нормального распределения. Для решения первой из этих задач есть строгие ста- статистические критерии. Вторая задача может решаться только путем простого сопоставления рассматриваемых распределений — применение строгих статистических кри- критериев здесь не представляется возможным. Нужно иметь ввиду, что к данному эмпирическому материалу, основан- основанному всегда на ограниченном числе экспериментов, можно подобрать множество теоретических формул, более или менее удовлетворительно описывающих наблюдения. И во § 3J КРИТЕРИИ БЛИЗОСТИ 1С НОРМАЛЬНОМУ РАСПРЁДЕЛ. 99 многих случаях приходится принимать гипотезу нормаль- нормальности не в силу того, что она наилучшим образом опи- описывает эмпирический материал, а только потому, что нормальное распределение является хорошо разработанной математической моделью, которой удобно пользоваться для статистического анализа. Оценка с помощью %г~к р и т е р н я Рассмотрим возможность применения ^-распределения для решений первой из поставленных задач. Допустим, что мы имеем п наблюдений над случайной величиной х. Распределим наши наблюдения среди произвольно выбран- выбранных интервалов tx, tv ..., tk и обозначим через v; число наблюдений (частот), попавших в интервал с индексом tx. Затем с помощью некоторого теоретического распре/деле- распре/деления найдем вероятности pv p2, . .., pk попадания наблю- наблюдений в интервалы t1, /,, ..., t.k, и подсчитаем теорети- теоретически ожидаемое число наблюдений v[ = прг. Образуем взвешенные суммы квадратов отклонений величин v1( v,, ..., v,j от их теоретически ожидаемых значений v,', va, . . ., v'k: V2 — ^J vj - 4- D.37) Можно показать, что эта сумма распределена прибли- приближенно как у/ с числом степеней свободы / = /г—1 —/, где / — число тех связей, которые были наложены на экспери- экспериментальный материал при оценке параметров распределе- распределения, необходимых для вычисления теоретических частот. Пользуясь соотношением D.37), можно производить проверку гипотезы о степени близости данного эмпириче- эмпирического распределения к тому пли иному теоретическому распределению и, в частности, к нормальному распреде- распределению. Для этого мы подсчитываем значение %2 по D.37J и находим по табл. 5 Приложения вероятность, с которой можно ожидать появления значений %2, превышающих найденные нами значения. Если эта вероятность окажет- окажется ниже некоторого выбранного нами уровня значимости, например ниже 0,01 пли 0,05, то .мы признаем наличие неслучайного отклонения от нормального распределения.
100 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV Применять %2-критерий нужно с известной осторож- осторожностью, так как он основан не на строгом законе, а на приближении, которым можно пользоваться только в том случае, если численность групп не менее пяти. Группы с Vi<5 нужно объединять вместе. Возможность произволь- произвольного группирования приводит к некоторой условности этого критерия. При проверке гипотезы нормальности желательно, чтобы число наблюдений было не менее 50. Рассмотрим следующий пример: нужно было прове- проверить, подчиняются ли нормальному распределению ошиб- ошибки, характеризующие расхождение между результатами определений серы и фосфора в сталях, выполненных в экспресс-лаборатории и центральной лаборатории одного и того же завода. Определение серы производилось хими- химически, определение фосфора—фотоколориметрически. Пользуясь правом произвольного группирования мате- материала, интервалы были выбраны так, как это показано в табл. 4.1 и 4.2. Такое группирование удобно своей на- наглядностью, оно позволяет расположить материал по таким интервалам, которые важны с метрологической точки зрения при оценке результатов анализа. В колонках 2 и 3 этих таблиц приведены численности интервалов, полученные экспериментально и ожидаемые теоретиче- теоретически, исходя из нормального распределения. Например, для интервала 0,67—1,00 находим по табл. 2 Прило- Приложения (округляя последнюю цифру): р=0,6827 —0,4971 = =0,1856, умножая эту величину на общее число наблю- наблюдений п = 455, получаем теоретически ожидаемую числен- численность группы: v'=455 x 0,1856 ~ 84,4. В колонке 4 этих таблиц подсчитаны значения %2. При подсчетах мало- малочисленные группы объединялись вместе. При подсчете числа степеней свободы f=k—1—I мы принимали, что Z=l, так как при обработке материала мы априори при- принимали, что среднее значение расхождений равно нулю, и подсчитывали только дисперсию по формуле C.26) так, как это обычно делается при обработке парных измерений. Результаты статистического анализа, приведенные в по- последней графе табл. 4.1 и 4.2, показывают, что в трех случаях расхождения между экспериментально наблю- наблюденными и теоретически ожидаемыми частотами носят случайный характер. В одном случае—при химическом 3] КРИТЕРИИ БЛИЗОСТИ К НОРМАЛЬНОМУ РАСПРЕДЕЛ. 101 И в ч 05 в Н о а я а о о о & g ч в «19 о о к а Р я ч со н о ею 5<и 2 я 5 в1 S я |5 S о ч о с? а I V/ Ill Ill* аи я к gas Sag? HSU ao»«e Я Kg CO о CM 1 1 CO тн CM oT CO CM 1 CO CM ОЭ CO CM со" см" CM 1 Ю CM CO CM CM oo со" 1 CM CM CO о о -84, со см см •& со со со оо i> см 0—0, оо со" S о СМ ю
Про до лж ени е т а б л. 4.1 Интервалы ошибок в долях квадратичной ошп Оки ^ 0,0030% Частоты наблюденные эксперимен- экспериментально v ожидаемые для нормаль- нормального рас- распределения V' (У-У'J V' наблюденные эксперимен- экспериментально у с=0,031—0100% Частоты ожидаемые для нормального распределения у' (у—у') 2 V' 2,00—2,60 2,60—3,00 3,00—4,00 4,00—5,00 п X2 9 3 3 0 455 15 16,5 3,0 1,2 0,03 455,0 20,7 A5-20,7J '5 7 1 0 0 145 5,2 1,0 0,4 0,01 145,0 6,6 (8—6, бJ 2,57 = 3, Р(Х2> 2,57) =0,5 *) Данные для таблицы заимствованы из [117]. 6,6 3,10 =0,30 = 3, Р(Х2> 3,10) =-0,4 С й в н н м Е Та б лица 4. 2 "" Распределение химических определений серы в сталях по величине абсолютной ошибки *) S В в S со о о S X О S, (Г М о о Н •d И и и и о со Интервалы ошибок в долях квадра- квадратичной ошибки с =0,021-0,050% Частоты наблюденные эксперимен- экспериментально у ожидаемые для нормаль-! ного распре- распределения V V—V'J наблюденные эксперимен- экспериментально у с=0,051—0,100% Частоты ожидаемые для нормального распределения у' (у-у'J V' 0,00-0,67 0,67—1,00 1,00-1,40 1,40—2,00 225 84 43 226,2 84,4 70,9 52,8 B25-226,2J 226,2 (^=^=0,15 (-^=^=2,42 D3-52, { 52,8 -1 JOji 330 118 146 70 349,0 130,3 109,4 81,4 330-349.0) 349,0 118—130.3J 130,3 109,4 =1 > =1,16 G0—81,4J^ О Л А > 81,4 60
104 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV 3] КРИТЕРИИ БЛИЗОСТИ К НОРМАЛЬНОМУ РАСПРЕДЕЛ. Ю5 Ч ю Ф в Я ф ч о н о ы ОШИД нор расп; sic si* 2 л i E Явоа s я я а Se a a н is со о о" V Л 702 CM CM l>- CNl ю CD со о cqo O3 Л о т< -э< о 455 О СО 888 СО ¦* Ю I I I оо о о о о Н анализе оеры в интервале концентраций 0,051—0,100% — расхождение оказалось не случайным. Из непосредствен- непосредственного сопоставления экспериментально наблюденных и теоретически ожидаемых частот видно, что это расхожде- расхождение обусловлено появлением значительного количества больших ошибок. С метрологической точки зрения такой результат является крайне неблагоприятным—при вполне приемлемой средней квадратичной ошибке анализа лабо- лаборатория не могла гарантировать попадание анализов в пределы За: из общего числа 702 определений за пределы Зст попало 19 анализов вместо двух, ожидаемых для нор- нормального распределения. Пришлось поставить специаль- специальное исследование для выяснения причин этого явления. Как выяснилось, одна из причин этого явления заключа- заключалась в большой ликвации, которая имеет место при высоком содержании серы в пробах, если они отбираются сразу же по расплавлении металла или даже еще до пол- полного расплавления. Б табл. 4.3 приведены результаты сопоставления экспе- экспериментально наблюденных и подсчитанных теоретически частот для ошибок, характеризующих полуколичествен- полуколичественный спектральный анализ вольфрама в геологических пробах. Здесь расхождение между частотами оказалось столь большим, что нормальное распределение приходится признать непригодным даже для приближенного описания экспериментального материала. Пользуясь нормальным распределением, мы не сможем здесь даже приближенно предсказать частоту появления тех или иных интересую- интересующих нас ошибок. Мы имеем дело с законом распределения, существенно отличным от нормального распределения. К анализу этого случая мы еще вернемся в гл. IV. В приведенных выше примерах при распределении материала на группы мы учитывали только абсолютные величины отклонений. В некоторых случаях нужно проводить более тонкий анализ эмпирических распреде- распределений, учитывающий их возможную асимметрию. В этом случае распределение материала на группы производится с учетом знаков, как это будет показано ниже. Здесь нужно отметить одну тонкость при сопоставле- сопоставлении эмпирических и теоретических распределений. Если изучаемый материал представляет собой множество
100 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV Таблица 4.3 Полуколичественное определение вольфрама *) Интервалы ошибок в долях квадратичной ошибки Частоты наблюденные эксперимен- экспериментально v ожидаемые для нормального распределения 0,00-0,67 0,67—1,00 1,00—1,40 1,40—2,00 2,00—2,60 2,60—3,00 >3,00 п X2 80 19 6 0 26 12 3**) 146 41 72,4 27,1 22,8 16,9 5,3 1,0 0,4 145,9 6,7 (80 — 72,4J iTJ A9 — 27,1J 27,1 F-22,8J 22,8 @ — 16,9)* 16,9 D1-6.7J 6,7 --=0,8 -2,4 - 12,4 = 16,9 =* 175,6 208,1 / ***) = 3, Р (X2 > 208,1) < 0,00001 *) Распределение анализов по абсолютной величине ошибки, полученной при многократном анализе серии эталонов. Данные для таблицы заимствованы из [159]. **) Две ошибки имели величину 9а. ***) Изучение ошибок велось на эталонах с известным содер- содержанием вещества. Поэтому число степеней свободы в данном случае равно / = 5 — 1 — 1=3. парных анализов, сделанных одним методом для разных по составу проб, то расхождениям нельзя приписывать какой-либо знак, так как парные измерения неразличимы между собой. В этом случае экспериментальный материал не содержит информации относительно асимметрии рас- распределения. Если парные анализы делались с большим интервалом по времени, то первое и второе определения становятся различными—здесь уже можно ошибкам при- § 3] КРИТЕРИИ БЛИЗОСТИ К НОРМАЛЬНОМУ РАСПРЕДЕЛ. 107 писывать определенный знак. Аналогичным образом мож- можно говорить о знаках ошибок при изучении расхождения в результатах определений, выполненных двумя разными методами. Оценка с помощью Я-к р и т е р и я Для оценки степени близости эмпирического распреде- распределения к теоретическому может быть использована извест- известная теорема А. Н. Колмогорова о распределении максимума отклонения теоретической интегральной функции распре- распределения от соответствующей эмпирической функции [14, 22]. Допустим, что Х± <^, Хп ^. . . представляют собой п наблюдаемых значений случайной величины, расположенных в неубывающем порядке. Обо- Обозначим через F (х) накопленные относительные частоты, т. е. долю тех значений случайной величины х, которая не превосходит некоторого ее заданного значения. Через F (х) обозначим интегральную функцию теоретического распределения, которое мы хотим сравнить с нашим эмпирическим распределением. Тогда согласно упомянутой выше теореме вероятность Р (к) неравенства 7= D.38) Dmax = max | F (ж) - F (ж) приближенно определяется суммой бесконечного ряда со Р(к)~1- 2 (-l)ve-2**s. D.39) Значение вероятностей Р (к) для различных значений к табулировано в табл. 9 Приложения. При использовании Я-критерия предполагается, что теоретическая функция F (х) непрерывна, а эмпирическая функция F{x) построена по несгруппированным данным. В практических приложениях ради простоты вычислений приходится идти на приближения, группируя значения случайной величины в небольшие интервалы. Рецептура применения Я-критерия сводится к тому, что, сравнивая
108 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [гл. IV полученные значения накопленных эмпирических частот с соответствующими теоретическими значениями, находят наибольшее отклонение Dmax и определяют X: X = Dmax\fn, D.40) для которого по табл. 9 Приложения находят Р (X). Если вероятность Р (X), найденная для наблюденного значения X, окажется меньше выбранного нами критерия значимо- значимости, например < 0,05, то расхождение между эмпирическим и теоретическим распределениями признается не слу- случайным. Этот критерий, вообще говоря, можно применять лишь тогда, когда гипотетическое распределение полностью известно из каких-либо теоретических соображений, т. е. когда известен не только вид функции распределения, но и все входящие в него параметры. Такой случай на практике встречается крайне редко. Обычно известен вид теоретической функции, а параметры определяются из опыта. При применении %2-критерия это обстоятельство учитывается соответствующим уменьшением числа степе- степеней свободы ^-распределения. Я-критерий такого согла- согласования не предусматривает, поэтому его применение в большинстве случаев приводит к завышенному согласию, когда параметры теоретической функции заранее неизве- неизвестны. Это обстоятельство нужно учитывать при интер- интерпретации результатов, полученных с помощью Я-критерия. В некоторых работах, например в [17], исходя из прак- практического опыта, предлагается считать расхождение между эмпирическим и теоретическим распределениями незначи- незначимым, когда Р (X) >0,6, если параметры теоретического распределения заранее неизвестны. Рассмотрим применение Я-критерия для оценки близо- близости к нормальному распределению опытного ряда частот, полученного при сопоставлении результатов спектрального и химического определения марганца в чугуне. Квадра- Квадратичное отклонение и среднее для этого эмпирического распределения было подсчитано в табл. 3.1 и 3.2. В табл. 4.4 в колонках 1, 2 и 3 приведены середины интервалов группирования и соответствующие им экспе- экспериментально наблюденные и подсчитанные теоретически частоты. Экспериментальный материал заимствован из 3] КРИТЕРИИ БЛИЗОСТИ К НОРМАЛЬНОМУ РАСПРВДВЛ. 1УУ Таблица 4.4 Распределение результатов спектральных определений марганца в чугуне по величине их отклонения от данных химического анализа *) Середины интер- интервалов группи- группирования, выражен- выраженные в % содержа- содержания марганца —0,08 -0,07 —0,06 —0,05 —0,04 -0,03 — 0,02 —0,01 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 Час наблю- наблюденные ЭКСПерИ- МРТТТ Я ТТЬТТО V 0 2 0 8 75 107 147 121 186 130 119 71 32 2 0 0 0 тоты ожида- ожидаемые для нормаль- нормального ления V' 0,5 2,1 7,3 20,8 47,1 82,2 145,0 171,1 175,6 150,6 99,2 57,6 26,6 10,2 3,1 0,8 0,2 Накопленные частоты наблю- наблюденные экспери- ЛДРТТТ9 TTUTTA iVlCti 1 (\JltttL\J N 0 2 2 10 85 192 339 460 646 776 895 966 998 1000 1000 1000 1000 ожида- ожидаемые для нормаль- нормального ления N' 0,5 2,6 9,9 30,7 77,8 160,0 305,0 476,1 651,7 802,3 901,5 959,1 985,7 995,9 999,0 999,8 1000,0 Разности накоплен- накопленных частот j ^у jy' \ 0,5 0,6 7,9 20,7 7,2 32,0 34,0 16,1 5,7 26,3 6,5 6,9 12,3 4,1 1,0 0,2 0 Подсчет Ха (V—V'J V 6,3 7,9 16,5 7,5 0,03 14,7 0,6 2,8 4,0 3,1 1,1 10,6 J *) Составлено по материалам, заимствованным из [115]. работы [115]. В колонках 4 и 5 этой таблицы *) приведены накопленные частоты, в коленке 6 — разности накоплен- накопленных частот, необходимые для определения -Dmax- *) При составлении этой таблицы начинаем с того, что опре- определяем для нижнего края интервала группирования значение нормированной величины и^. ti + At/2 — i где ij — середина интервала группирования, At —длина интерва-
110 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [гл. IV Из табл. 4.4. видно, что максимальная разность накопленных абсолютных частот равна 34.0. Отсюда следует, что за значение Dmas. можно взять относитель- относительную разность частот 34,0/1000. Следовательно, ;. ч г,, .max | N — N' | _ 34,0 (X) t (X) | - п - 1щ , к = - 34,0-у 1000 п = ' 10'0()— ~ 1,08. По табл. 9 Приложения находим, что вероятность Р (к) для к — 1,08 несколько больше, чем 0,17. Здесь парамет- параметры теоретического распределения не были известны за- заранее, поэтому нельзя считать незначимым расхождение между эмпирическим и нормальным распределениями. Подсчеты, приведенные в колонке 7 той же таблицы, показали, что %2 = 75,1. Число степеней свободы здесь равно / = К— 1 — I = 12 — 1 -- 2 = 9. По табл. 5 Приложе- Приложения находим, что Р (%2 > 75,1) < 0,001 при / = 9. Следо- Следовательно, применение %2-критерия также подтверждает вывод, сделанный выше с помощью Я-критерия. Нужно обратить внимание, что к- и %2-критерии при- применяются для проверки гипотезы о наличии некоторого фактора, приводящего к неслучайному отклонению эмпи- эмпирического распределения от нормального распределения. Чем больше число наблюдений, тем, естественно, более тонкие эффекты могут быть обнаружены с помощью этих критериев. Обнаружение этих эффектов имеет важное практическое значение, так как оно указывает на недо- работанность изучаемого метода анализа вещества. В этом случае среди множества факторов, влияющих на результа- результаты анализа, есть некоторые доминирующие факторы, кото- которые могут быть устранены. В то же время опыт показывает, что при наличии таких тонких эффектов, обнаружи- обнаруживаемых только при большом числе испытаний, эмпири- эмпирические распределения обычно можно апроксимировать нормальным распределением, с тем, чтобы в дальнейшем ла группирования, (=s;. Затем по табл. 1 Приложения находим значение />;=Ф(и;) и подсчитаем теоретически ожидаемую накоп- накопленную частоту npi. Накопленные частоты, наблюденные экспери- экспериментально, определяются обычным последовательным сложением частот. § 3] КРИТЕРИИ БЛИЗОСТИ К НОРМАЛЬНОМУ РАСПРЕДЕЛ. И1 можно было при статистическом анализе пользоваться всеми критериями, основанными на нормальном распре- распределении. Вопрос о законности такой апроксимации ре- решается на основании графического сопоставления эмпи- эмпирического и нормального распределений. На рис. 17 графически изображены эксперименталь- экспериментальная (ломаная линия) и теоретическая (плавная линия) 50 ¦ '. -0.0Б -0.04 -0,02 0 0,02 0,04 0,06 0,08 Рис. 17. Распределение спектральных анализов марганца в чугуне по величине их отклонения от результатов/химического анализа (по мате- материалам, заимствованным из [115]). кривые распределений для рассмотренного выше примера с определением марганца в чугунах. На рис. 18 приведены аналогичные кривые для ошибок, характеризующих рас- расхождение результатов спектрального и химического ана- анализов кремния в чугуне по данным, заимствованным из [115]. В этом случае подсчеты показали, что А,=1,20, чему соответствует Р(Я)=0,11, следовательно, основы- основываясь на Я-критерии, и здесь нужно признать наличие неслучайного расхождения. Непосредственное сравнение кривых распределения показывает, что в обоих случаях
112 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ гл. IV эмпирические распределения с достаточной для метро- метрологических целей точностью могут быть апроксимиро- ваны нормальным распределением. Зная квадратичную ошибку и пользуясь нормальным распределением, мы 50 - -ojo ~o,os -о,об -о,О4 -о,ог о о,ог 0,04 о,ов ом ojo Рис. 18. Распределение спектральных анализов кремния в чугуне по величине их отклопения от данных химиче- химического анализа (поматериалам, заимствованным из [115]). здесь с достаточной для практической цели уверенностью можем предсказать частоту появления ошибок в любом интересующем нас интервале. Оба эти примера интересны тем, что они показывают возможность применения нормального распределения не только при изучении внутрилабораторных ошибок вос- воспроизводимости, но также и для изучения методических ошибок, характеризующих расхождение между двумя разными аналитическими методами. нормальности малых выборок Проверка гипотезы по большому числу В аналитической работе очень важно иметь возмож- возможность проверить гипотезу нормальности по результатам текущих измерений, не прибегая к специальным много- многократным повторным анализам одной и той же пробы. Допустим, что мы имеем анализы тп различных по своему составу проб, причем каждая проба проанализи- 3] КРИТЕРИИ БЛИЗОСТИ К НОРМАЛЬНОМУ РАСПРЕДЕЛ. ИЗ рована из п независимых параллельных определений. Нам нужно проверить гипотезу о нормальности генераль- генеральных совокупностей, из которых взяты эти выборки, при условии, когда оба параметра—среднее значение и дисперсия—могут иметь разные значения. Рассмотрим относительное отклонение D.41) si re —1 V — ? п какого-либо случайно взятого определения х,г от сред- среднего арифметического значения Xj анализа /-й пробы. В предыдущем параграфе было показано, что величина г подчиняется так называемому /--распределению, плот- плотность вероятности которого определяется выражением D.35). Из D.35) следует, что /'-распределение зависит только от числа параллельных определений п и не зависит от параметров исходных генеральных совокупностей. Поэтому этим распределением можно воспользоваться для решения поставленной задачи [1, 14, 137]. Пользуясь свойством гамма-функции из D.35), при разных значениях п получаем *): п = 4, ф (г) = п = 5, ф (/¦) = • п = 6, ф (г) = 2} 3 я 3( i~ -2<г<2; 4/5 ' *) Например, для ге = 4 из D.35) имеем: ф(')=7зТгA) 8 в. В. Налимов _ У Зя 2 /3
114 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV Все эти кривые симметричны относительно г = 0. При п=3 кривая имеет U-образную форму, значе- значение ф(г) стремится к бесконечности, когда г прибли- приближается к ±1/2; при г = 0 кривая имеет минимум. При п = 4 имеет место равномерное распределение: все значе- значения г в интервале от -"j/З до + К3 имеют равную вероятность. При п-»оо, как уже указывалось выше, r-распределение приближается к нормальному распреде- распределению. В табл. 10 Приложения приведены значения вероят- вероятностей появления г для интервалов в 0,1 при п = 3, 4, 5, 6 и оо. Проверку гипотезы нормальности можно производить только в том случае, если число параллельных определений в текущих анализах не менее трех. Это следует из того, что при определении г нам нужно знать две величины—сред- величины—среднюю и дисперсию, для подсчета которых используются две степени свободы, следовательно, из парных измерений не представляется возможности извлечь какой-либо другой дополнительной информации. При и=2 величина /•, как это следует из ее определения, может принимать только два значения: +1 и—-1, каково бы ни было распределение исходных измеряемых величин. В [131] этот прием проверки гипотезы нормальности был применен при обработке результатов трехкратного спектрального определения Си, Ga, Mg, Mn, Mo и V в 68 пробах почв. В общей сложности было выполнено 1224 определения, которые были разбиты на три группы по 408 определений. В каждую группу случайным образом отбиралось по одному из трех параллельных определений (здесь можно идти на некоторое упрощение: в первую группу отбирать все первые измерения, во вторую—все вторые измерения и т. д; такой отбор также можно рас- рассматривать как случайный). В табл. 4.5 произведены подсчеты %2-критерия. В первой колонке этой таблицы приведены интервалы группирования для г, во второй колонке—теоретически ожидаемые абсолютные частоты, полученные путем умножения числа определений на веро- вероятности pv p2, ... pk, взятые из табл. 10 Приложения. В колонках 3—8 даны экспериментально найденные ча- частоты и взвешенные суммы квадратов для трех групп определений. Экспериментальные значения г определя- КРИТЕРИИ БЛИЗОСТИ It НОРМАЛЬНОМУ РАСЛРЕДКЛ. К ю а I о в о о и I и Я т о g а я и w о в I I I В HI ах о, о-*о~ооо оооо ми m Ю CM CD CO ОС С— CM —| со с о <м"о о ) CO 1С CO CD ) -* CO Г
116 НОРМАЛЬНОЦ РАСПРЕДЕЛЕНИЕ ГЛ. IV 3] КРИТЕРИИ БЛИЗОСТИ К НОРМАЛЬНОМУ РАСПРЕДЕЛ. 117 1 ax и х 3 a л о 5 a a ащ н о со о и ?>к я О Н я 9 -? а а- il н о !3 пин &Р. о со О ОООЭ1^ГОЮГОГО— -г-н j^^cq^Mcogg;; ооо ^ о СО О S c? S S 3 S S н « С C3 ?B «B НИИ О (_ CO^LOcbt---CbCDO- H ft a о К о И и и и к и и н № о И о К о К о и I 3 S к VO ?В н в о О И и и я §•«• лись по формуле D. 41). При составлении табл. 4.5 были объединены вместе значения г, полученные для всех шести определяемых компонентов. Результаты подсчетов показали, что для всех трех *) групп %2~20. Число степеней свободы в этом случае равно f=k—1=30—1 = 29. (При вычислении теоретических ча- частот не используются параметры распределения, поэтому 1=0.) Из табл. 5 Приложения находим, что.Р(%2>20)~0,9, поэтому мы можем считать, что экспериментальный мате- материал достаточно хорошо описывается нормальным распре- распределением. Последний этап статистического анализа в дан- данном примере можно было бы, конечно, провести и с по- помощью Я-критерия. Применение этого метода проверки гипотезы нормаль- нормальности удобно тем, что оно дает возможность использовать архивные материалы, объединяя вместе результаты опре- определений различных компонентов в разных по своему со- составу пробах так, как это было сделано в предыдущем примере. Основываясь на работе 1166], надо считать, что для проверки гипотезы нормальности по текущим измерениям надо иметь большое число наблюдений (порядка тысячи). Выполнение этого требования в аналитической работе не вызывает затруднения, так как хорошо организован- организованные аналитические архивы содержат сведения о десятках и сотнях тысяч определений. Нужно обратить внимание на то, что проверка гипо- гипотезы нормальности по совокупности малых выборок может найти широкое применение во многих областях техники при изучении неоднородных объектов. Допустим, напри- например, что нужно определить содержание вещества в различ- различных участках какого-либо геологического разреза или карьера, подвергающегося разработке. Для того чтобы установить доверительные границы для среднего ре- результата анализа, полученного для проб, отобранных из различных мест данного участка, нужно быть уве- уверенным в том, что распределение проб по отклонениям, *) При подсчете %2 три группы нельзя объединять вместе, так как они не являются независимыми. В практической работе можно ограничиться подсчетами для какой-нибудь одной группы.
118 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV характеризующим неоднородность внутри участка, не отли- отличается существенно от нормального распределения. Ре- Результаты анализа, полученные для различных участков данного карьера мы должны рассматривать как выборки из различных генеральных совокупностей, которые могут иметь различные средние и различные дисперсии. При обычных методах проверки гипотезы нормальности мы ие можем объединять результаты текущих анализов, полу- полученные для генеральных совокупностей с различными параметрами, и нам пришлось бы проделать большую допол- дополнительную работу специально для проверки этой гипотезы. При проверке гипотезы нормальности по большому числу малых выборок мы можем получить нужный нам материал, используя совместно результаты опробования разных уча- участков, если каждое такое опробование было сделано не менее чем из трех проб. Метод спрямленных диаграмм В аналитической работе часто можно ограничиться качественной оценкой степени близости эмпирического распределения к нормальному распределению. Такую качественную оценку проще всего можно получить, поль- пользуясь методом спрямленных диаграмм. Допустим, что мы имеем к точек (з^), (х2р2), .. . ..., (xhpk), где ръ р2, ..., ph — значения неизвестной функции распределения в точках xlt х2, ..., xh. Найдем по табл. 1 Приложений квантили, соответствующие зна- значениям plt р2, ..., рк, и отложим их по оси ординат, а по оси абсцисс отложим значения xlt х2, ..., xh. Тогда, если справедлива гипотеза нормальности, из урав- уравнения X — U и -— ?_ следует, что мы должны будем получить прямую линию с тангенсом угла наклона l/о, проходящую через точку ((х, 0). Степень близости нанесенных нами точек к пря- прямой линии может служить критерием для оценки гипо- гипотезы нормальности. 5 3] КРИТЕРИИ БЛИЗОСТИ К НОРМАЛЬНОМУ РАСПРЕДЕЛ. 119 Для упрощения вычислений можно определить ир как функцию *) р:ир = Ф (р). Это преобразование можно сделать графически при помощи так называемой вероят- вероятностной бумаги, которая строится по такому же прин- принципу, как и логарифмическая бумага. По оси ординат на вероятностной бумаге указываются значения р, а наносятся соответствующие им значения ир. В практических приложениях обычно гипотеза нор- нормальности проверяется по материалу, сгруппированному 50г 10- -0,5-0Л -0,3 -0,2-0,1 0 0,1 0,2 0,3 ОМ 0,5 Рис. 19. Распределение анализов Р2О5 в суперфос- суперфосфате по величине отклонения, характеризующего расхождение в результатах, полученных двумя раз- различными химическими методами [бб]. в к интервалов, с границей интервала группировки tj + At/2. Если мы на вероятностной бумаге будем откла- откладывать по оси абсцисс значения tjt а по оси ординат соответствующие им накопленные частости (относитель- (относительные частоты), то получим некоторую ступенчатую кри- кривую и вынуждены будем при проверке гипотезы нормаль- нормальности оценивать степень ее близости к прямой линии. Вместо того чтобы вычерчивать ступенчатую кривую, удобнее наносить на график к ее точек с абсциссами tj + At/2. Рассмотрим следующий пример: на рис. 19 приведены экспериментальная и теоретическая кривые распределе- распределения для ошибок, характеризующих расхождение в двух химических методах определения Р2О3 в суперфосфате. *) Эта'функция табулирована в [42].
120 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [гл. IV На рис. 20 для этого же распределения приведена спрям- спрямленная диаграмма, построенная на вероятностной бумаге. При построении этой диаграммы на оси абсцисс откла- откладывалась верхняя граница интервала группирования tj-{-At/2, а по оси ординат— накопленные частости по 89,35 99,8 995 99 97 95 з 60 ' 50 I 40 ? 30 i 20 I 15,9 3 10 ~ ,5 2 I 0,5 0.2 0Л5 z ZL. Ю О 12 3 4 5 6 7 Я а И/нала интервалов гя/ллирооки -0,5-0,4-0,3-0,2 -0.1 0 0,1 0.2 0.3 01 0.5 Рис. 20. Спрямленная диаграмма, пост- построенная на вероятностной бумаге, по дан- данным, взятым с рис. 19. последовательным интервалам 11 i = %Vj/n, где п — общее число анализов, v; — число анализов с ошибками, попав- попавшими в интервал t.;. Накопленные частости выражены в процентах в соответствии с обозначениями, принятыми на вероятностной бумаге. Точки, нанесенные на вероятностной бумаге на рис. 20, по-видимому, лишь случайно отклоняются от прямой линии, поэтому мы можем принять гипотезу нормальности. Такой же вывод, конечно, мы могли бы 3] КРИТЕРИИ БЛИЗОСТИ К НОРМАЛЬНОМУ РДСПРЬДКЛ. 121 сделать и из рассмотрения кривых, приведенных на рис. 19. Существенным здесь является то обстоятельство, что для построения спрямленной диаграммы нам не нужно делать каких бы то ни было вычислений, тогда как для построения теоретической кривой нормального распределения необходимо провести довольно громоздкие вычисления. После того как построена спрямленная диаграмма, можно графически оценить параметры распределения по двум значениям функции распределения (х1р1), (х2р2). Напишем уравнения иго-\- решая их, получаем: (X - Х1 = Z»— И.,О. Графическое определение параметров становится особенно простым, если на оси ординат выбрать точ- точки: р1 = 0,500 и р2 = 0,159. Тогда, как это следует из табл. 1 Приложения, г?х-=0, и.,--- -¦ 1 так, что \1 = хъ о = xt — х2. На графике, приведенном па рис. 20, ординате, рав- равной 50%, соответствует точка с абсциссой — 0,05 су и. Ординате, равной 15,9%, соответствует точка с абсцис- абсциссой — 0,23. Следовательно, оценкой для о будет -0,05-(-0,23) = 0,18 ~а. Таким образом, метод спрямленных диаграмм дает возможность с минимальной затратой труда решить вопрос о степени близости эмпирического распределения к нормальному и позволяет оцепить параметры распреде- распределения. Поэтому он может найти очень широкое примене- применение в повседневной аналитической работе. Вероятностная бумага может быть получена путем копирования с рис. 20 пли построена в любом другом масштабе с помощью табл. 1 Приложения.
122 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV § 4. Отклонения от нормального распределения в аналитической работе Очень важно определить условия, при которых можно ожидать появление нормального распределения в анали- аналитической работе. Здесь нужно исходить из центральной предельной теоремы Ляпунова, которую можно сформули- сформулировать следующим образом: сумма v независимых слу- случайных величин xv х2,..., xv при достаточно большом значении v имеет нормальное распределение даже тогда, когда независимые случайные величины xv x2,...,xv имеют произвольное распределение, при условии, что среди рас- рассматриваемых случайных величин не должно быть таких, значения которых сравнимы по своему порядку со всей суммой этих величин, т. е. когда дисперсия каждой из величин xvx2,..., xv оказывает лишь малое влияние на суммарную дисперсию. В аналитической работе как при рассмотрении ошибок воспроизводимости, так и при рассмотрении методических ошибок мы имеем дело с большим количеством независи- независимых переменных факторов; законы распределения этих переменных нам неизвестны, но мы можем полагать, что по крайней мере для хорошо отработанных методик и в хо- хорошо организованных лабораториях, как правило, должны отсутствовать доминирующие факторы,—это дает воз- возможность полагать, что аналитические ошибки должны, вообще говоря, подчиняться нормальному распределе- распределению. Но в то же время в аналитической работе, естествен- естественно, могут встретиться случаи, когда нарушаются условия, вытекающие из центральной предельной теоремы Ляпу- Ляпунова, и тогда неизбежно появляются неслучайные откло- отклонения от нормального распределения. В некоторых слу- случаях приходится даже констатировать появление распре- распределений, существенно отличающихся от нормального распределения. В силу этого обстоятельства в литературе, посвященной проверке гипотезы нормальности в аналити- аналитической работе, имеются весьма противоречивые сведения. В работе Клэнси [67] было изучено 250 распределений для различных аналитических методов, включающих в общей сложности 50 000 отдельных определений, и пока- показано, что с практической точки зрения только в 10—15% § 4] ОТКЛОНЕНИЯ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 123 случаев имеет место нормальное распределение. В осталь- остальных случаях наблюдалось настолько существенное откло- отклонение от нормального распределения, что при оценке результатов анализа уже не представлялось возможным применять критерии, основанные на нормальном законе и связанных с ним распределениях. В то же время можно указать на целый ряд работ 158, 66, 95, 103, 115, 116, 117, 128, 131, 133], в которых показано, что как ошибки вос- воспроизводимости, так и методические ошибки достаточно хорошо описываются нормальным распределением. Ре- Результаты некоторых из этих работ были рассмотрены в качестве примеров в предыдущем параграфе. Учитывая накопившийся в настоящее время опыт по изучению распределения аналитических ошибок, можно следующим образом сформулировать условия, при кото- которых ожидается отклонение от нормального распреде- распределения: 1. Нормальное распределение нарушается, если ана- аналитическая методика содержит доминирующие случайные величины, не подчиняющиеся нормальному распределе- распределению. Наличие неучтенного, постоянно действующего фа- фактора приводит к смещению теоретического распределения относительно эмпирического. В предыдущем параграфе мы рассматривали пример с определением серы в сталях химическим методом—там нормальное распределение было нарушено из-за того, что пробы с большим содержанием серы, отобранные до полного расплавления металлической ванны, в некоторых случаях обладали очень большой неоднородностью. Лик- Ликвация в пробах оказалась случайным доминирующим фактором, нарушающим нормальное распределение оши- ошибок анализа. В примере со спектральным определением кремния и марганца, рассмотренном в предыдущем параграфе, эмпи- эмпирические распределения оказалось возможным апроксими- ровать нормальным распределением после того, как ошиб- ошибки, характеризующие расхождение в двух методах ана- анализа, разложили на две составляющие—постоянную и переменную. Если же рассматривать распределение анали- анализов по отношению к величине суммарной ошибки, то мы получим существенное расхождение между эмпирически
124 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV найденным и теоретическим распределением—кривые, характеризующие эти распределения, будут смещены друг относительно друга. Доминирующим фактором адесь будет постоянная величина, характеризующая смещение градуировочного графика по отношению к контрольным химическим анализам, которая не была замечена в текущей работе—ее удалось обнаружить только при статистической обработке большого материала. В 1165] была описана методика спектрографического анализа шлака со сложной системой градуцровочных графиков, которые смещались параллельно при изменении состава пробы (выбор градуировочного графика для ана- анализа данного компонента определялся результатами ана- анализа других компонентов). При такой сложной системе построения градуировочных графиков удалось получить вполне приемлемую ошибку анализа, характеризующую расхождение с данными химического анализа, но распреде- распределение ошибок для большинства определяемых компонен- компонентов оказалось отличным от нормального. Это объясня- объяснялось тем, что аналитик в некоторых случаях в силу слож- сложности состава проб не мог правильно выбрать нужные градуировочпые графики. С такими сложными по составу пробами приходилось сталкиваться тогда, когда нару- нарушался технологический процесс варки стали. При стило- метрическом анализе тех же шлаков использовались обычные градупровочпые графики—в этом случае средняя квадратичная ошибка оказалась значительно большей, но распределение ошибок существенно не отличалось от нормального. Здесь оказался исключенным доминирую- доминирующий фактор, связанный с применением сложной системы градуировочных графиков. 2. Опыт показывает, что нормальное распределение имеет место тогда, когда мы объединяем в одну совокуп- совокупность анализы проб, у которых концентрация определяе- определяемого компонента колеблется, как правило, не более чем в 3—4 раза. Следует отметить, что в аналитических ГОСТ'ах допустимые отклонения указываются обычно также для интервалов, которые не превосходят эти пределы. Если объединить в одну совокупность пробы, в которых содержание определяемого компонента колеблется в пре- пределах более одного порядка величины, то мы получим §4] ОТКЛОНЕНИЯ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 125 асимметричное распределение. В этом случае между вели- величиной квадратичной ошибки и концентрацией определяе- определяемого компонента обнаруживается корреляционная связь, которую можно апрокспмироватъ лппойпой функцией: ах~Ыс-\-а. D.42) Зависимость квадратичной ошибки от концентрации определяемого компонента становится доминирующим фа- фактором, нарушающим нормальное распределение. С подоб- подобной ситуацией часто приходится встречаться в различных областях техники и обычно в этом случае от асимметрич- асимметричных распределений удается перейти к нормальному рас- распределению путем логарифмического преобразования *) случайной переменной. В аналитической работе при проверке гипотезы нор- нормальности обычно нет необходимости объединять пробы с очень большим интервалом концентрации определяемого компонента. По при решении некоторых статистических задач, в частности в дисперсионном анализе, который будет рассматриваться ниже, часто приходится объеди- объединять в один статистический ансамбль пробы с очень ши- широким диапазоном концентрации определяемого компо- компонента, причем там бывает нужно найти такую функцию преобразования, которая бы давала возможность полу- получать одинаковые дисперсии дли различных по своему составу проб. Поэтому рассмотрим несколько более под- подробно вопрос о преобразовании случайной переменной величины. Допустим, что мы имеем т случайных выборок н;{ нормально распределенных генеральных совокупностей с параметрами ((ija!), {l>-2o2), ..., (\imom) и предположим, что между квадратичной ошибкой и средним значением существует связь G,-/0*). D.43) Заменим случайную величину х преобразующей функ- функцией y~g(x). Тогда согласно C.29) можно написать: *) Принято говорить, что случайная величина подчиняется логарифмически-нормальному распределению, если логарифм этой пеличины распределен нормально.
126 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV или, пользуясь соотношением D.43), o0w = f(x)g'(x). D.45) Выберем преобразующую функцию q (x) так, чтобы ад (х) оказалась одинаковой для всех генеральных совокуп- совокупностей / (х) g' (х) = с, где с — постоянная величина. Тогда искомая преобразую- преобразующая функция будет представлена неопределенным инте- интегралом Отсюда следует, что если между ах к \ь существует линейная связь D.42), то преобразование можно произ- производить при помощи функции В простейшем случае, когда ах=Ь\а, преобразование производится при помощи соотношения g (х) = lg х. 3. В аналитической работе, так же как и во многих других областях техники, часто приходится иметь дело со смешанными (неоднородными) распределениями, когда рассматриваемая совокупность образована смешиванием двух или даже нескольких генеральных совокупностей с разными параметрами. При смешивании двух генераль- генеральных совокупностей обычно получаются асимметричные распределения, а иногда также двухвершинные кривые или кривые с более пологой вершиной, чем это имеет место для нормального распределения. Форма кривых смешанных распределений определяется, с одной сторо- стороны, тем соотношением, в котором смешаны два распре- распределения, а с другой стороны—тем, насколько отли- отличаются параметры смешиваемых генеральных совокупно- совокупностей. Это иллюстрируется несколькими примерами на рис. 21. Со смешанными распределениями часто приходится сталкиваться при изучении распределения анализов по величине отклонения, характеризующего расхождение в результатах, полученных для двух разных аналитических § 4] ОТКЛОНЕНИЯ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 12? методов. В этом случае в силу особенностей химического и фазового состава проб можно ожидать наличия двух или нескольких центров рассеяния, относительно кото- которых будут группироваться результаты. Если мы внима- внимательно посмотрим на кривые, приведенные па рис. 17 и 18, то, учитывая тот большой экспериментальный материал, Рис. 21. Смешанные распределения. Кривая 1 изображает плотность нормального распределения. Кривые 2 и 3 изображают плотность распределения неоднородной совокупности, об- образованной из двух нормальных распределений, смешанных в отноше- отношении 1:1, с расстояниями между средними, равными 2а и За. Кривые 4 w б относятся к двум нормальным распределениям, смешанным в отношении 1,5:1, с расстояниями между средними, равными также 2а и За [30]. на основании которого они были получены, мы вынуж- вынуждены предположить, что эти распределения представ- представляют собой, по-видимому, смешанные распределения. Это подтверждается тем обстоятельством, что примене- применение I- и х2-критериев указывает на неслучайное отклоне- отклонение этих эмпирических распределений от нормального распределения. Но вместе с тем с практической точки зрения, как это указывалось выше, эти два распределения можно считать достаточно однородными п апроксимиро- вать их нормальным распределением. В старых работах при изучении ошибок воспроизво- воспроизводимости обычно проводили многократные последователь-
128 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. IV ные анализы одной и той же пробы. Для того чтобы получить достаточный материал, приходилось анализы производить в течение длительного времени. При этом под влиянием факторов, медленно меняющихся во времени, происходит флуктуация положения центра рассеяния; это также приводит к получению неоднородного распре- распределения. На это обстоятельство впервые обратил внимание Оертель [131], предложивший для проверки гипотезы нормальности пользоваться r-критерием, основанным на использовании большого числа малых выборок, как это по- показано в предыдущем параграфе. Учитывая эти соображе- соображения, нужно рекомендовать аналитикам отказаться от традиционного метода проверки гипотезы нормальности при изучении ошибок воспроизводимости путем много- многократного повторного анализа одной и той же пробы. Нужно обратить внимание также и на то обстоятельство, что некоторая неоднородность распределений, обнаружен- обнаруженных в рассмотренных выше примерах с определением марганца и кремния в чугунах также возможно объяс- объясняется тем обстоятельством, что за то длительное время, которое было необходимо для получения 1000 спектраль- спектральных п химических определений, могло происходить смещение центра рассеяния. К сожалению, указанный выше метод проверки гипотезы нормальности неприменим при изучении методических ошибок, поэтому единствен- единственная рекомендация, которую здесь можно дать,—это стремиться выполнять анализы в возможно более короткий промежуток времени. 4. При изучении межлабораторных ошибок воспроиз- воспроизводимости в некоторых случаях приходится сталкиваться с тем обстоятельством, что приемы работы отдельных лабо- лабораторий оказываются настолько несогласованными между собой, что это приводит к нарушению условий, вытекаю- вытекающих из центральной предельной теоремы Ляпунова, и тогда неизбежно получаются отклонения от нормаль- нормального распределения. На рис. 22 приведены распределения анализов гранита и диабаза по результатам определений, полученным 34 аналитиками в 25 лабораториях 10 раз- разных стран [90]. Имеющийся здесь материал оказывается недостаточным для того, чтобы провести проверку гипо- гипотезы нормальности, пользуясь статистическими крите- § 4] ОТКЛОНЕНИЯ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 1 29 риями. Тем не менее, непосредственно из рассмотрения рис. 22 ясно, что в некоторых случаях распределение результатов оказывается существенно отличным от нор- нормального. Отдельные лаборатории дают по некоторым компонентам результаты, отличающиеся от результатов, Гра.чит Диабаз SiO, 71 72 73 5/ 52 53 FeO 0,5 1,0 t,5 6,5 70 7,5 8.0 8.5 9,0 9,5 MgO 4,5 5.0 5.5 6.0 6,5 70 7.5 CaO 10 1,5 2.0 IQj 11,0 lt,5 Рис. 22. Распределение анализов гранита и диабаза по результатам, полученным в разных лабораториях [90]. полученных для других лабораторий, на величину, зна- значительно большую, чем это можно было бы ожидать, исходя из нормального распределения. Мы вынуждены признать, что результаты анализа этих лабораторий находятся в статистически неподконтрольном состоянии. Такой ре- результат не должен нас удивлять, так как подобная про- проверка проводилась впервые и ранее не применялось каких- либо мер для согласования результатов работы лабора- лабораторий. При статистическом изучении межлабораторной ошибки воспроизводимости часто приходится результаты 9 В. В. Налимов
130 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [гл. IV анализа отдельных лабораторий отбрасывать, с тем чтобы в дальнейшем подвергнуть специальному изучению условия работы в этих лабораториях и приблизить их к условиям, принятым в большинстве остальных лабора- лабораторий. Критерии для отбрасывания отдельных наблюдений будут рассмотрены в гл. VI. Если в изучении межлабораторной ошибки воспроиз- воспроизводимости принимают участие только две лаборатории, обменивающиеся между собой большим количеством проб, различных по своему составу, то оказывается удобным рассматривать распределение результатов анализа по величине относительного отклонения Ас/с, где Ас харак- характеризует расхождение в результатах, полученных двумя лабораториями для пробы со средним результатом анализа с. Такие распределения оказываются часто асимметрич- асимметричными, по если отбросить знаки отклонений и перейти к изучению распределения анализов по абсолютной величине относительных отклонений | Ас | /с, то получаем распределения, которые в некоторых случаях хорошо описываются односторонним нормальным распределением с удвоенными ординатами [128], аналогично тому, как это было сделано в предыдущем параграфе при изучении распределения результатов определения серы и фосфора в сталях по величине абсолютного отклонения. 5. Нормальное распределение, вообще говоря, является распределением непрерывных величин. Однако в практи- практической работе все результаты измерений, в том числе и результаты анализа, в той или иной степени дискретны во-первых, в силу того, что результаты измерений можно получать только кратными той наименьшей единице, которую показывает измерительный инструмент, во-вто- во-вторых, в силу тех округлений, которыми всегда пользуются при вычислениях. При количественном определении доста- достаточно высоких концентраций эта степень- дискретности меньше, чем наблюдаемые флуктуации измеряемой вели- величины х, поэтому с хорошей степенью приближения можно отвлечься от этого фактора и считать х непрерывной вели- величиной. Иное положение мы имеем при полуколичественном анализе или при количественном анализе очень низ- низких концентраций, который также надо рассматривать 4] ОТКЛОНЕНИЯ ОТ 1101'МАЛ[,ИОГо РАСПРЕДЕЛЕНИЯ VM как полуколичественный анализ. Грубая измерительная шкала и округления здесь оказывают существенное влия- влияние на распределение результатов анализа; это влияние становится доминирующим фактором. В беспорядочное нормальное распределение вносится элемент произволь- произвольной упорядоченности—распределение случайной величины становится существенно дискретным. В результате этого нарушаются условия появления нормального распределе- распределения, вытекающие из теоремы Ляпунова. Рассмотрим следующий пример: при стилоскоппческом анализе определение элементов производится путем срав- сравнения интенсивностей двух аналитических линий. Здесь мы имеем дело с грубой измерительной шкалой, которая определяется числом пар линий с одинаковой интенсив- интенсивностью в заданном интервале концентраций, так как глаз человека с достаточной определенностью может констати- констатировать только равенство двух интенсивностей. Если же стилоскоп снабдить специальным фотометрическим уст- устройством, позволяющим плавно изменять интенсивность линий, то мы получим достаточно тонкую измерительную шкалу, при помощи которой можно уже перейти от дис- дискретных полуколичественных анализов к непрерывным количественным анализам. В качестве второго примера рассмотрим материалы, приведенные в табл. 4.3, где с нормальным распределе- распределением было сопоставлено найденное экспериментально распределение ошибок спектрального полуколичествен- полуколичественного определения вольфрама в геологических пробах. Из этой таблицы следует, что нельзя говорить о каком- нибудь даже приближенном соответствии между наблюден- наблюденным распределением и нормальным распределением. Под- Подсчет критерия согласия дал в этом случае следующие результаты: у} са 208 при трех степенях свободы. Следова- Следовательно, вероятность случайного расхождения между двумя распределениями ничтожно мала. Среди 146 определений оказались две пробы с ошибками в 9 ст. Эти ошибки нельзя отбросить как грубые, так как подобные отклонения наб- наблюдаются и при полуколичественном анализе других ком- компонентов, хотя появление их практически исключено для совокупностей, подчиняющихся нормальному распреде- распределению.
132 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИИ [ГЛ. IV Исходя из формально математических соображений, мы можем ожидать для полуколичественного анализа появления распределения Пуассона, в которое вырож- вырождается нормальное распределение, когда на измерения накладывается указанное выше ограничение применением грубой измерительной шкалы и большими округлениями, соизмеримыми с определяемой величиной. При качествен- качественном анализе, который можно рассматривать как частный случай полуколичественного анализа, имеем дело с бино- биноминальным распределением. Распределениям Пуассона и биноминальному ниже будет посвящена отдельная глава. Исходя из рассмотренных выше метрологических сооб- соображений, можно дать следующую общую классификацию аналитических методов: а) Количественный анализ—это такой метод, при котором результаты многократных последовательных опре- определений одной и той же величины представляют собой практически непрерывную совокупность величин. Степень дискретности, которая вносится измерительными шкалами приборов, округлениями при вычислениях и пр., не является доминирующим фактором в общем балансе оши- ошибок. Величины ошибок обычно па порядок и больше отличаются от определяемого содержания. б) Полуколичественный анализ—это такой метод, при котором результаты многократных последовательных определений представлиют собой дискретную последова- последовательность величин, причем степень дискретности (вели- (величина интервала между двумя возможными результатами), оказывается по порядку величины, сравнимой с опреде- определяемой величиной. в) Качественный анализ—это частный случай полу- полуколичественного анализа, когда результаты определения выдаются в виде двух альтернативных ответов: элемент в пробе присутствует или отсутствует. Исходя из этой классификации, для количественного анализа мы можем ожидать появления нормального рас- распределения, если выполняются условия, вытекающие из центральной предельной теоремы Ляпунова. Для полу- полуколичественного и качественного анализов можно ожидать соответственно распределения Пуассона п биноминаль- биноминального распределения. § 4] ОТКЛОНЕНИЯ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИИ 133 Приведенные выше примеры дают возможность понять, почему в литературе существуют столь противоположные высказывания о возможности применения нормального распределения при изучении аналитических ошибок. После классических работ Гаусса и Лапласа было принято рассматривать нормальное распределение как некоторый метрологический закон, автоматически вы- выполняющийся при измерительных процессах. Такую точку зрения нельзя распространять на такой сложный изме- измерительный процесс, как анализ вещества. Если говорить о каком-то общем законе в метрологии, то в качестве такого метрологического закона нужно было бы рассмат- рассматривать центральную предельную теорему Ляпунова, В со- соответствии с такой постановкой вопроса задача экспери- экспериментатора, изучающего новый материал, должна заклю- заключаться не просто в проверке гипотезы нормальности, а в та- такой предварительной обработке и группировке изучаемого материала, которая обеспечила бы выполнение требований, вытекающих из центральной предельной теоремы Ляпу- Ляпунова. Здесь трудно дать какие-нибудь рекомендации общего характера. Важно, чтобы экспериментатор хорошо знал физическую сущность изучаемого процесса и легко мог так сгруппировать материал, чтобы были исключены доминирующие факторы. С распределениями, существенно отличными от нор- нормального распределения, часто приходится сталкиваться при применении математической статистики в различных областях техники. Опыт показал, что в этих случаях часто удается получить нормальное распределение, если подходящим образом выбрать преобразующую функцию g(x), при помощи которой от случайной переменной х переходят к новой переменной y — g{x). Этим приемом часто пользуются в зарубежной практике [30], Преобразующую функцию подбирают обычно эмпирическим путем. Для этого удобно использовать метод спрямленных диаграмм, рассмотренный в предыдущем параграфе (стр. 118—121). Если на вероятностной бумаге вместо прямой линии мы получим, например, логарифмическую кривую, то это зна- значит, что преобразование случайной переменной при помощи функции у=\%х даст возможность получить нормальное распределение, В аналитической работе вид преобразующей
134 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ [гл. IV функции обычно определяют, исходя из некоторых общих метрологических соображений, связанных с пла- планированием эксперимента и интерпретацией его резуль- результатов. Например, в фотографических методах анализа обычно изучают распределение анализов по величине AS, рассматривая AS как независимую случайную перемен- переменную. Разность почернения AS связана простым соотноше- соотношением с интенсивностью аналитических линий: lg R— = lg G//0) = AS/y. Следовательно, по отношению к случай- случайной переменной R найденное нами нормальное распреде- распределение будет логарифмически-нормальным. Из основного уравнения количественного спектраль- спектрального анализа с фотографической регистрацией спектров C.34) следует также, что распределение анализов по вели- величине определяемой концентрации с должно быть, вообще говоря, логарифмически-нормальным, если имеет место нормальное распределение анализов по величине AS. Однако в большинстве случаев в количественном спект- спектральном анализе имеем дело с коэффициентом вариации vc < 15%, а в этом случае как для AS, так и для с практи- практически имеет место нормальное распределение (при малых значениях а\ёх функция y—\gx в интервале M{lgx}± ± 2 0ig х почти совпадает с некоторым линейным преобра- преобразованием [30]). В весьма редких случаях, например при спектральном анализе геохимических объектов иногда при- приходится иметь дело с коэффициентом вариации ve=l5— 30% ii более; тогда распределение анализов по величине определяемой концентрации с становится заметно асим- асимметричным и для описания его приходится прибегать к логарифмически-нормальному распределению, как на это обратил внимание Арене [171]. ГЛАВА V РАСПРЕДЕЛЕНИЕ ПУАССОНА И БИНОМИНАЛЬНОЕ РАСПРЕДЕЛЕНИЕ § 1. Распределение Пуассона При анализе вещества результаты измерений часто представляют собой дискретные величины. Это имеет место, например, при измерении радиоактивности в радиохими- радиохимических анализах, при измерениях интенсивности излуче- излучения в рентгеновской и оптической спектроскопии при по- помощи счетчиков квант (квантометрические методы опти- оптических анализов), при изучении распределения структур- структурных составляющих на шлифе и пр. Результаты полуколи- полуколичественного анализа всегда представляют собой последо- последовательность дискретных величин, независимо от того ме- метода, каким производится полуколичественный анализ. Во всех этих случаях экспериментальный материал может быть описан при помощи распределения Пуассона*). Случайная величина х, принимающая только целочис- целочисленные значения ж = 0, 1, 2, ..., подчиняется распределе- распределению Пуассона, если вероятность появления какого-либо значения х определяется выражением Сумма вероятностей Р^{х) появления всех значений х равна единице при любом значении [х: ж=оо 2 х=0 х\ ¦ = 1. E.2) *) Это распределение было получено Пуассоном в 1837 г., оно также называется законом Пуассона и законом редких событий.
136 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ [гл. V Единственный параметр распределения Пуассона и. численно равен среднему значению и дисперсии случай- случайной величины: М{х} = а1 = \л. В качестве оценки для параметра и. применяется выборочное среднее х. Громоздкие таблицы для распределения Пуассона мы не приводим в этой книге. Нужные для статисти- статистического анализа значения вероятностей могут быть легко подсчитаны по формуле E.1) с помощью таблиц логариф- логарифмов или в некоторых случаях даже с помощью логариф- логарифмической линейки. Из математических соображений следует, что если в некоторой области Т случайным образом распределено N событий, то число появлений события на интервале t, являющемся частью области Т, приближенно подчи- подчиняется распределению Пуассона тогда, когда вероят- вероятность появления события в бесконечно малом проме- промежутке At пропорциональна At и события появляются независимо друг от друга. Параметр распределения Пуассона можно представить выражением u. = kt, где t интерпретируется как некоторая мера отрезка, на кото- котором появляются события, а к = N/Т — среднее число событий на единицу меры. Закон Пуассона может быть написан в форме (kt)xe-hi E.3) Интервалы t (t — непрерывно изменяющийся параметр) представляют собой последовательность равных отрезков времени, в течение которых производится наблюдение за появлением событий, или последовательность интер- интервалов равной длины, площади или объема, на которых появляются случайные события, и т. д. Исходя из сформулированных выше условий, можно ожидать, что закону Пуассона будет подчиняться рас- распределение числа частиц при радиоактивном распаде, измеряемое в те или иные промежутки времени, если полупериод распада вещества достаточно велик и при распаде не образуются дочерние вещества, испускающие те же частицы. Если же последние два условия не выполняются, то очевидно, что появление числа частиц в данном промежутке времени будет зависеть от числа РАСПРЕДЕЛЕНИЕ ПУАССОН4 137 0,50 0,25 A=0.4 Ра ( 0,25 частиц в предыдущем интервале, и распределение Пуас- Пуассона не будет выполняться. Аналогичным образом можно ожидать, что распределение числа зерен определенной структурной составляющей на некоторой площади t будет подчиняться закону Пуассона, если при кристаллизации про- пробы не было каких-либо факто- факторов, нарушающих случайный характер распределения зерен. В технике закон Пуассона при- применяется при изучении распре- распределения числа телефонных вы- вызовов в течение промежутка времени t, числа несчастных случаев в интервале длиной t, при контроле качества про- продукции, когда показателями качества являются дискретные величины, например число пя- пятен на производимых предметах и т. д. Форма распределения Пуас- Пуассона зависит от величины и. — это иллюстрируется графиками распределения вероятностей, приведенными на рис. 23. Если и. < 1, то первый член (член с х = 0) будет наибольшим и тем большим, чем меньше и.. Если же 1 < и. < 2, то макси- максимальным будет второй член с х= 1. С увеличением и. степень Рис. 23. Распределение Пу- асимметрии постепенно умень- ассона для значений ц = шается. При больших значе- =0,4; 0,8 и 1 2. ниях и. распределение Пуас- Пуассона может быть хорошо представлено нормальным рас- распределением со средним значением и. и дисперсией 02 = = \а. В этом случае 95%-ные доверительные границы для среднего будут определяться выражением 0/23 и-0.8 _L 0 12 3 4 0,25 0/2345 н.±1,96]/[1 E.4)
138 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ [Г-1!- V Практически можно считать, что распределение Пуас- Пуассона достаточно хорошо может быть представлено нор- нормальным распределением уже при и.>9. Это иллюстри- иллюстрируется на рис. 24, где приведен график плотности вероят- вероятности нормального распределения для и. = 9, 0 = 3 и нанесены значения вероятностей Рр,{х) для распре- распределения Пуассона с и. = 9 ь виде прямоугольников *) с основанием 1 и высотой .Рц(ж), т. е. с площадью Р^ (х). р 0,12\ 0,06 1\ 1 У 3 4 S 6 78 9 Ю II 12 13 /4 15 16 /7 18 19 х Рис. 24. Графики нормального распределения для ц.=9,0 = 3 и для распределения Пуассона с ц=9. Возможность приближенного представления распре- распределения Пуассона с помощью нормального распределе- распределения значительно облегчает проведение статистического анализа. Рассмотрим несколько относящихся' сюда при- примеров. Допустим, что нужно найти вероятность появления х в интервале (хи х2). В этом случае, для того чтобы площади прямоугольников апроксимировать площадью, ограниченной кривой, рекомендуется вводить поправку *) Графическое представление распределений с помошью пря- прямоугольников, площадь которых пропорциональна частости появления случайной величины х в данном интервале, называется гистограммой. С помощью гистрограмм часто представляются эмпирические распределения. § 1] РАСПРЕДЕЛЕНИЕ ПУАССОНА 139 на непрерывность, заменяя пределы суммирования х1 л х2 на пределы интегрирования я^ —1/2 и ж2+1/2. 2 х < хг) = ^ pv> И ~ ТгЩ \ 2ц dx = X=Xi = ф —1/2 _ф г- E-5) Пусть, например, требуется найти РE<ж<15) для [х = 9. Подсчитываем нормированное отклонение с учетом поправки на непрерывность: M2 = jy^= 2,167, -= -1,500. Пользуясь табл. 1 Приложения, находим: Р(ж<15)^ * Ф B,167) = 0,9849, Р(х<, 5) ~ Ф(-1,5) = 0,0668. Отсюда получаем, что Р E < х < 15) ^ 0,9849 - 0,0668 = 0,9181. Точные значения, найденные несколько более громоздким способом (непосредственно из формулы для распределе- распределения Пуассона), дают: Р (х < 15) = 0,9780, Р (х < 4) = 0,0550. Отсюда имеем: Р E < х < 15) = 0,9780 - 0,0550 = 0,9230. Следовательно, найденное выше приближение можно считать вполне удовлетворительным. При проведении дисперсионного анализа важно, чтобы дисперсия не зависела от среднего значения случайной величины. Пользуясь соотношением D.46) и равенством 0=]/^ц можно получить для распределения Пуассона преобразующую функцию, которая даст новую перемен- переменную с дисперсией, не зависящей от ее среднего значения Следовательно, если случайная величина распределена нормально со средней и. и дисперсией и., то величина
140 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ [ГЛ. V у = 2 Yх также будет приближенно распределена нормально со средним значением 2 Уц и дисперсией, равной еди- единице, как это следует из D.45). Исходя из этого, можем написать новое приближен- приближенное соотношение для попадания случайной величины х в интервал а E.6) Подставляя сюда числовые значения из предыдущего примера, получаем: = -1,758. Пользуясь табл. 1 Приложения, находим: Р(а;<15) «в *Ф A,874) = 0,9695, Р(х< 5) ~Ф(-1,758) = 0,0394. Сле- Следовательно, Р E <х < 15) = 0,9695 - 0,0394 = 0,9301. Среднее из двух приближений равно 0,9241, оно оказывается ближе к точному значению, чем каждое из приближений, взятых в отдельности. Для дискретного распределения имеет место очевид- очевидное соотношение Р(х>ха+1)=1-Р(х<ха). Поэтому доверительные границы для генерального сред- среднего [i: И-i < И- < И-2 можно получить, как это предложено в [34], решая относительно ц1 и \л2 уравнения ==*,,; E.7) РАСПРЕДЕЛЕНИЕ ПУАССОНА 141 где ир и и р—квантили 2 i~2 нормированного нормального распределения. Рассмотрим следующий пример: при измерении уровня радиоактивного фона было получено 36 отсчетов за 10 мин. Среднее число отсчетов в минуту будет 3,6. Нужно установить 95%-ные доверительные границы для гене- генерального среднего, совместные с нашим экспериментом. Подставим в предыдущие уравнения вместо ха суммар- суммарное число отсчетов, полученное за 10 мин.: = -1,96, 2 j = - 6,08 - 0,98 = - = -7,06, ) = 1,96, = - 6 + 0,98 = =-5,02, (i2 = 4,98; ^ = 2,53. Следовательно, 95%-ные пределы для генерального сред- среднего определяются неравенством 2,53 < ц < 4,98. Аналогичным способом можно проверить гипотезу о равенстве двух средних результатов радиоактивного анализа, полученных из п1 и п2 независимых определе- определений. Найдем их общее среднее: и полагая, что и1[г1 < п^ и n2\i2 > п2ц, подсчитаем: E.8) Разность и2 — мх распределена приближенно как разность двух нормированных нормально распределенных величин. Поэтому мы будем считать, что два средних отличаются с 5- или 1%-ньщ уровнем значимости, если разность и2 — и1 будет соответственно превосходить вели- величину УТ-1,96 = 2,77 или 1/2-2,58=3,64. Рассмотрим следующий пример: а-активность двух проб оказалась равной 15 и 18 частицам в минуту,
142 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ [ГЛ. V причем первый результат был получен как среднее из измерений, сделанных за 10 мин., второй—за 12 мин. Л _ 15 х 10 + 18х 12 _.,... Р ~ 10+12 ~~ ' ' их = 2 ( И 150 + 1 - |/166] с* - 1,2, м2 = 2A/216- /Щ2)~1,2, Следовательно, у нас нет оснований считать, что два средних значения значимо отличаются друг от друга. При статистическом анализе результатов измерений, представленных в виде дискретных величин, часто нужно бывает проверить степень близости полученного эмпири- эмпирического ряда частот к распределению Пуассона. Подсчет критерия согласия можно производить, образуя взвешен- взвешенную сумму квадратов -- (Vi-v;)s „2 = (Г..9) так, как это было показано в гл. IV. Здесь v; —эмпири- —эмпирически полученные абсолютные частоты, v[ — теоретически ожидаемые частоты, полученные по формуле E.1), в которую подставляется найденное эмпирически значе- значение х в качестве оценки для ц.. Взвешенная сумма квадратов E.9) распределена приближенно как %2 с числом степеней свободы / = к — 1 - I, причем I в данном случае равно 1, так как для подсчета теоретических частот определялся только один параметр распределения и.. При небольшом числе наблюдений (<50) приведен- приведенным выше критерием согласия пользоваться нельзя. В этом случае можно получить критерий согласия, исходя из соотношения %2/f—Sx/Ox (см. формулу D.24)), вводя х в качестве оценки для ах. Подсчитываете;! величина X2 га —1 (n-l)x — 9 X E.10) § 1] РАСПРЕДЕЛЕНИЕ ПУАССОНА IM где хх, х2, ..., хп — наблюденные значения дискретной случайной величины х. Если отношение s\/x оказывается больше 1, то мы определяем вероятность Р (%2// > %lK/f), где Хак//— найденная нами величина из E.10), если же sj/x меньше 1, то определяем вероятность P(%2/f < %эк//)- Когда соответствующие вероятности оказываются <0,01, мы вынуждены признать наличие неслучайного расхо- расхождения между эмпирически полученным рядом частот и распределением Пуассона. При /<30 для определения вероятностей можно пользоваться табл. 5 Приложения. В [44] табулировано непосредственно распределение %2// вплоть до значений / = 10 000. Приближенным соотно- соотношением E.10) можно пользоваться даже для небольших значений ц. A < х < 5). При этом число наблюденных значений случайной величины х должно быть больше 5. Для еще меньших значений параметра распределения, когда (.1 порядка единицы, число наблюдений должно быть больше 15 [30]. Рассмотрим в качестве примера изучение распределе- распределения структурных составляющих на металлографическом шлифе по материалам работы [130]. На металлографи- металлографический шлиф накладывалась сетка, состоящая из 165 кле- клеточек, и подсчитывалось число зерен графита, попадаю- попадающих в каждую клетку. В результате наблюдений получился ряд целых чисел такого вида 2, 0, 3, 5, 0 и т. д. со средним значением ж = 6,17. Затем по формуле E.1), в которую в качестве оценки для и. подставлена величина а; = 6,17, были подсчитаны теоретически ожидаемые частоты. На- Например, частота появления шести зерен в клетке опреде- определится из равенства 165-6,170 6 . v« = тп е-"*1' = 2Ь,44. Все подсчеты выполнялись с помощью логарифмов. В табл. 5.1 сопоставлены теоретически ожидаемые частоты с частотами, наблюденными экспериментально, и подсчи- подсчитано значение %2 = 20,83. При / = 9 — 2 = 7 х§,005 = 20,3 и Хо,002=22.6, поэтому вероятность Р (%2 > 20,83) лежит где-то между 0,005 и 0,002. Следовательно, с вероятностью сделать ошибку, меньшей чем 0,5%, можем утверждать,
144 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ [гл. V Таблица 5.1 Распределение зерен графита на металлографическом шлифе [130] Число зерен графита в одной клетке измери- измерительной сетки 0 1 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 17 18 19 Частоты наблюденные эксперимен- экспериментально V 2 ] 1 7 4 1 7 20 34 30 17 22 21 41 2 0 1 0 0 0 0 0 0J ¦ 7 ожидаемые для распре- распределения Пуассона V' 0,34 1 2,13 9,04 6.57 ) 13,51 20,84 25,37 26,44 23,31 17,98 12,32 7,60т 4,26 2,19 1,04 0,46 0,30 0,11 0,04 0,01 0.00J •16,01 v-v' 2,04 6,51 0,84 8,63 3,56 6,31 4,02 8,68 9,01 (У-У'J V' 0,46 3,14 0,03 2,94 0,48 1,71 0,89 6,11 5,07 2 = 20,83 что процесс графитизации в рассматриваемом случае происходил неслучайно—на шлифе имеются зоны с селе- селективным распределением графита—факт, который пред- представляет существенный интерес для металловедов. С метрологической точки зрения чрезвычайно важное значение имеет соотношение sx = V х, пользуясь которым можно сделать ряд важных заключений без каких-либо дополнительных исследований. В частности, если про- проверка с помощью соотношения E.10) показывает, что отношение s%lx значимо не превосходит единицы, то это указывает на отсутствие методических ошибок в кванто- 2] ОЦЕНКА РЕЗУЛЬТАТОВ ПО РАСЛРЕДЕЛ. ПУАССОНА 14о метрическом методе анализа. Соотношение s| = x опреде- определяет собой ту минимальную-ошибку, которая может быть получена при анализах, основанных на счете частиц. Если в результате каких-либо мероприятий удалось до- вости ошибку анализа до соотношения sx = Vx, то не имеет смысла предпринимать каких-либо шагов для даль- дальнейшего улучшения методики анализа. В [49, 81] рас- рассматривался вопрос об оптимальном соотношении между числом проб и числом эталонов при радиоактивных изме- измерениях со счетчиком Гейгера—Мюллера. Обычная пра- практика измерений состояла в том, что после каждого образца неизвестного состава измерялся один эталон. Специальные исследования показали, что если в блок объединять по 10 проб, то зх1х^^Ъ, если же в блок объеди- объединять по 4 пробы, то это соотношение близко к единице. Следовательно, работу можно организовать так, чтобы эталон измерять один раз после измерения трех проб неизвестного состава, более частое измерение радиоактив- радиоактивности эталонов для счетчиков изучаемой системы не может улучшить результатов. При обработке результатов измерений, выполняемых с помощью счетчиков частиц, возникает ряд сложных метрологических проблем, связанных с учетом роли пере- счетпых схем, «мертвого» времени счетчика и пр. Ряд инте- интересных статистических проблем возникает в связи с изу- изучением совпадений при регистрации частиц. В связи с интенсивным развитием ядерной физики в последнее время стала развиваться новая прикладная ветвь теории вероятностей—статистика счета частиц. Мы не рассмат- рассматриваем здесь весь круг связанных с этим вопросов—он обстоятельно изложен в монографии [20]. § 2. Оценка результатов иолуколичественных определений при помощи распределения Пуассона Результаты полуколичественного спектрального ана- анализа обычно представляются с помощью специально раз- разработанной шкалы дискретных величин. Например, если анализируется проба, содержащая 0,01 % какого-нибудь вещества, по шкале, соответствующей трехкратному 1ft П. В. Палимой
146 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ [гл. V интервалу концентраций, то результаты анализа могут быть представлены рядом дискретных значений: 0,01%, 0,03%, 0,1%, 0,003%, 0,001% и т. д. Здесь результаты анализа квантуются измерительной шкалой. Аналитик не может выдать данные, характеризующие содержа- содержание вещества в пробе, вне указанных выше дискретных значений. Когда на множество факторов, подчиняющихся требо- требованиям, вытекающим из центральной предельной теоремы Ляпунова, накладывается квантование, обусловленное при- применением очень грубой измерительной шкалы, то есте- естественно ожидать появления распределения Пуассона, предельным случаем которого является нормальное рас- распределение. Для того чтобы ошибки полуколичествеп- ного анализа можно было представить распределением Пуассона, воспользуемся специальным кодом, состоящим из ряда положительных целых чисел 0, 1, 2, 3... Допустим, что имеем пробу, содержащую 0,01% того или иного элемента, и выполняем анализы, пользуясь трехкратной шка'лой концентраций. В этом случае могут быть получены следующие результаты при многократном повторном ана- анализе: 1) с = 0,01%—анализ выполнен без ошибки, и ошибка анализа может быть закодирована числом 0, 2) с = 0,03% или с = 0,003%—анализ попал в ближайший интервал концентрации (справа или слева от истинного содержа- содержания), и ошибка может быть закодирована числом 1, 3)с = 0,1% или с = 0,001%—анализ попал во второйинтер- вал концентрации—ошибка кодируется числом 2 и т. д. В результате при многократном анализе пробы мы полу- получаем следующий ряд чисел: 00201023000102... E.11) Если имеем несколько различных по составу проб с известным содержанием компонент и подвергаем их полуколичественному анализу, то результаты анализа могут быть объединены в один статистический ансамбль и также представлены рядом чисел E.11). Дискретные значения случайной величины представле- представлены рядом чисел E.11) и могут быть описаны с помощью распределения Пуассона. Для этого находим среднее значение случайной величины и, подставляя его в каче- § 2] ОЦЕНКА РЕЗУЛЬТАТОВ 110 РАОПРЕДЕЛ. ПУАССОИЛ 147 стве оценки для ц в E.1), получаем теоретически ожидае- ожидаемые значения для частот. В табл. 5.2 сопоставлены полу- полученные таким способом теоретические частоты с эмпири- эмпирически найденными частотами, полученными при изучении ошибок полуколичественного спектрографического ана- анализа искусственных эталонов с известным содержанием определяемых элементов A59). Эталоны готовились на основе следующих соединений: 1) SiO2; 2) SiO2-fCaCO3 в отношении 1 : 1; 3) SiO2-fFeS-3 : 1; 4) SiO2+СаСО3 + +MgO-3 : 2 : 1; 5) SiOa+NaaCO8-3 : 1; 6) SiO2+Al2O,- 3:1; 7) SiO2-!-CaCO3+MgO-4 : 1 : 1; 8) SiOg+пирит- 4:1. Анализ проводился по методу продувания пробы воздуха между угольными электродами дуги переменного тока. Каждый эталон анализировался по 10—15 раз, применялась трехкратная шкала концентраций. Непосредственно из сопоставления эмпирически най- найденных частот с теоретически ожидаемыми частотами следует, что распределение ошибок полуколичественного анализа довольно хорошо описывается законом Пуас- Пуассона. Для того чтобы объективно оценить вероятность расхождения между опытными и вычисленными частотами, были подсчитаны значения %эк по формуле E.9). Резуль- Результаты подсчетов, приведенные в предпоследней строчке табл. 5.2, показывают, что Р (%2 > %ы) во всех случаях, кроме одного, >0,04, причем в трех случаях эта вероят- вероятность оказывается > 0,20, —все это указывает на доста- достаточную правдоподобность нашей гипотезы. Поскольку имеем дело с обработкой сравнительно небольшого экспе- экспериментального материала, нужно подтвердить получен- полученные результаты с помощью оценки степени близости к еди- единице отношения s%lx. Для этого подсчптывается значение lllf ^ s%lx по формуле E.10). Отношение s%/x во всех слу- случаях оказалось меньше единицы. Вероятность Р (%2// < %«//) почти везде >0,01, причем в трех случаях эта величина близка к 0,20. Интересно отметить, что оценки, произве- произведенные двумя методами, довольно хорошо согласуются между собой. В нашем случае, естественно, нельзя рас- рассчитывать на такое хорошее совпадение эксперименталь- экспериментальных данных с теоретическими, как, например, при изуче- изучении эмиссии электронов с катода, когда полностью 10*
148 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ |lM. \ S -<г- Он Ч si в? В ¦а Я ".8 I я 5 § ss ч .. р Н1 s « в ч Е §1 as QOO ц оп эгшэвИижо ончггехнэкийэп оне энннэьКиоп ц оп эниэвИишо 0НЧ[ГЕД,НЭИИAЭП osie энннэь.?1гоп эниэвИишо ончгеьнэии dan •оне эиннэьКегоп ц оп эниэвИишо -оне энннэьЛиоп ц оп эниэвИишо -оне энннэьЛиоп ц он эмгеэвИишо оне энннэьЛи-оц ц оп эниэвИишо 0НЧ1ГВД,НЭИИAЭП •оне энннэьЛтш О ZC Ю (N ¦* СО СС vh CD t- CO о СМ СМ t^ СО 00 СО ¦* СО т« 00 СМ О" -г- ЧС СО ГО OJ О со оо ю о со с— о о ю о^ со со CSI I-O -— СМ с Ю СО т" IM С- О> 00 С оо ¦* «' " Ч О> L1 О О ¦"г* 00 СО СО о о о CM CN1 Ю ~ со с- О О о о о о" II И см о со о о о о о О СО LO СО 00 ОО О I- СО С~ CD С- О О О О О о: »г: ч^ —i ю с- о О о о о о О с- ¦* СМ ¦* с- О О о о о о л Л 00 00 CM ITJ о о о о ОЦЕНКА РЕЗУЛЬТАТОВ ПО РАСПРЕДЕЛ. ПУАССОНА исключены дополнительные неслучайные факторы. При количественном спектрографическом анализе, уже в силу его ограниченной чувствительности, в ряде случаев могут появиться неслучайные расхождения между эксперимен- экспериментальными данными и законом Пуассона. Например, если мы анализируем пробу с малым содержанием вещества, то появление резко завышенных ошибок ничем не ограни- ограничено, тогда как появление резко заниженных ошибок ограничивается пределами чувствительности метода—все результаты ниже определенного предела будут выдаваться как «следы», кодируемые одной цифрой. Следовательно, для проб с низким содержанием вещества число анализов, кодируемых индексами 2 и 3, будет ниже, чем это должно быть согласно распределению Пуассона—это обстоятель- обстоятельство резко снижает величину s?, поэтому в некоторых случаях отношение s%lx оказывается существенно меньше единицы. Таким образом, из приведенного здесь анализа следует, что распределение ошибок полуколичественного спектро- спектрографического анализа, вообще говоря, следует закону Пуассона, хотя в некоторых случаях возможны отклоне- отклонения от этого закона. Во всяком случае можем утверждать, что экспериментально наблюдаемое распределение частот не принадлежит к какому-то закону, существенно отлич- отличному от закона Пуассона. В нашем случае параметр рас- распределения Пуассона оказывается порядка единицы и ме- менее, поэтому распределение Пуассона здесь не может быть апроксимировано нормальным распределением. В качестве меры для оценки точности или правиль- правильности полуколичественного анализа нам кажется воз- возможным использовать величину [х—единственный пара- параметр распределения Пуассона. Зная величину [х, всегда можно найти ожидаемое распределение результатов ана- анализа по формуле E.1) и таким образом оценить надеж- надежность получаемых результатов анализа. На рис. 23 при- приведены графики распределения вероятностей для трех значений [х, равных 0,4, 0,8 и 1,2. Из сопоставления этих графиков ясно видно, как меняется распределение резуль- результатов анализа при изменении величины [А. В приведен- приведенных нами примерах на табл. 5.2 значения ц (которые оцениваются с помощью найденного экспериментально
150 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ [r.'l. V значения х) колеблются от 0,4 до 1,14. Полученное раз- различие в величинах [х поддается четкой физической интер- интерпретации. Так например, то, что при определении меди получено [х = 0,39, имеет своим основанием хорошую концентрационную чувствительность линии Си 2824 А, по которой производилось определение. Линия эта удобна для визуальной оценки концентраций и не подвержена самообращению в рабочем интервале концентраций. То же относится к линии W 2896,4 А, которой пользовались при определении вольфрама, и в этом случае [х = 0,40. Наоборот, линия серебра Ag 2380,7 А, по которой оно опре- определялось, рано самообращается ц маскируется фоном, в этом случае |л = 1,14. Остановимся несколько подробнее на интерпретации параметра распределения [х при описании ошибок полу- полуколичественного анализа с помощью закона Пуассона. Выше уже указывалось, что распределение Пуассона имеет место тогда, когда на некоторых интервалах t, образующих непрерывную последовательность величин, появляются события случайным образом и независимо друг от друга, причем вероятность появления события на бесконечно малом промежутке At пропорциональна At. Параметр распределения Пуассона можно представлять равенством [х = kt, где t—некоторая мера интервала, к— среднее число событий на единицу меры. При кванто- метрических анализах интервалы t представляют собой отрезки времени, на которых появляются события— импульсы счетчика, причем число событий пропорцио- пропорционально отрезку времени At. При полуколичественном анализе множество определений представляет собой неко- некоторую непрерывную последовательность равных интер- интервалов t, причем каждому анализу соответствует опреде- определенная ошибка, которую мы рассматриваем как некоторое случайное событие и кодируем ее рядом чисел 0, 1, 2... в зависимости от ее величины. Если ошибки нет, то собы- событие не появилось и результат анализа кодируется числом 0, если же результат анализа попал в ближайший интервал концентрации, то это рассматривается как появление одного события, и т. д. В распределении Пуассона числа 0, 1,2, 3 ... пред- представляют собой арифметическую прогрессию^-в нашем § 2] ОЦЕНКА РЕЗУЛЬТАТОВ ПО РАСИРЕДЕЛ. ПУАССОНА 151 случае интервалы концентрации увеличиваются в геомет- геометрической прогрессии. Это обстоятельство не должно вызы- вызывать недоумения, так как измеряемая величина AS про- пропорциональна логарифму концентрации, а в логарифми- логарифмическом масштабе мы будем иметь арифметическую про- прогрессию. При полуколичественном анализе вероятность появления ошибки обратно пропорциональна выбранной кратности шкалы концентраций. Следовательно, в нашем случае интервал t должен рассматриваться как некоторая условная мера, при помощи которой выражается кон- концентрация вещества в пробе, причем эта мера может принимать значения 1/3, 72, 1/Ъ5, х/ы и т. д. соответственно 3-х, 2-х, 1,5- и 0,5-кратным интервалам шкалы концен- концентрации, выбранным для анализа. Закон Пуассона в этом случае может быть записан в форме E.3). Если в какой-то серии опытов с мерой tx будет получена точность или правильность анализа, характеризуемая параметром а2 = [х, то, пользуясь соотношением \i=kt, можно будет полу- получить точность для другой меры ?2 (для шкалы концентра- концентраций другой кратности). Например, в [159] при определении ниобия в геологических пробах по 2-кратной шкале (t = Уз) было получено значение [х = 0,6. Это дает возможность полагать, что при 3-кратной шкале (t = x/z) мы имели бы ц=0,40*). Нужно обратить внимание на то, что распределение Пуассона будет иметь место только при вполне опреде- определенном способе кодирования ошибок, выбранном так, чтобы выполнялись условия, необходимые для того, чтобы дискретная случайная величина подчинялась закону Пуас- Пуассона. Если предложенную выше систему кодирования изменить, то распределение Пуассона может и не выпол- выполняться. Например, если с помощью ряда чисел 0, 1, 2, 3 ... закодировать не ошибки анализа, а результаты анализа так, чтобы содержание вещества ниже определенного *) При увеличении t степень дискретности результатов ана- анализа уменьшается, соответственно с этпм увеличивается р,, и рас- распределение Пуассона будет приближаться к нормальному распре- распределению. Это обстоятельство имеет важное практическое значение. Его, например, нужно учитывать при выборе шкалы для мето- методов фотометрического интерполирования при количественных и полуколичественных анализах.
152 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ [гл. V предела кодировалось цифрой нуль, первый определяемый результат—единицей, второй—двойкой и т. д., то при последовательном многократном анализе одной и той же пробы мы также получим ряд дискретых величин, но при этом уже не будет иметь место распределение Пуас- Пуассона. Здесь дискретные случайные величины нельзя бу- будет рассматривать как случайные события, связанные с некоторым интервалом t, так что вероятность появ- появления события в малом промежутке At пропорциональ- пропорциональна At. В заключение рассмотрим на конкретных примерах особенности изложенного здесь метода оценки ошибок анализа. Допустим, что анализ ведется по 2-кратной шкале концентраций, и для пробы с содержанием 0,2% мы получили два результата анализа: 0,4% и 0,01%. С точки зрения обычной системы оценки ошибок, приня- принятой при количественном анализе, мы в обоих случаях практически получаем одну и ту же относительную ошиб- ошибку в 100% и должны будем ожидать появления этих ошибок с одинаковой вероятностью. По предложенному здесь способу первую ошибку мы кодируем числом 1, вторую ошибку числом 4 и вероятность появления этих ошибок будет существенно различна. Анализ эксперимен- экспериментального материала бесспорно подтверждает это послед- последнее положение. С точки зрения геологов, использующих данные полуколичественного анализа, эти два резуль- результата также существенно различны. В первом случае резуль- результат анализа и действительное содержание вещества в пробе находятся в пределах одного порядка, во втором случае результат анализа и действительное содержание отличаются больше чем на порядок—это может привести к большим недоразумениям при использовании данных этого анализа. Второй пример: при анализе пробы с содер- содержанием 0,01% получено два результата: 0,001% и 0,1%. Обычный способ подсчета дает в первом случае ошибку в 90%, во втором случае ошибку в 900%—имеем ошибки разного порядка. При подсчете ошибок по предложенному здесь методу в обоих случаях результат кодируется одним и тем же числом—вероятность появления этих ошибок одинакова—такой результат кажется более естественным при иолуколичественном анализе. § 3] ЬИНОМИНАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 1^ § 3. Биноминальное распределение Частным случаем полуколичественного анализа являет- является качественный анализ. Здесь результаты анализа, зависящие от множества случайных факторов, квантуют- квантуются таким образом, что в каждом отдельном опыте может быть дан только положительный или отрицательный ответ. Допустим, что вероятность положительного ответа равна 0, тогда очевидно, что вероятность отрицательного ответа (непоявление события) равна 1 — 6. Если вероят- вероятность положительного ответа не зависит от исхода пре- предыдущих испытаний, то вероятность того, что при п на- наблюдениях положительный ответ появится х раз, опре- определится биноминальным распределением*) 1 -9)ПЛ E.12) х] (п — х)\ Биноминальное распределение имеет два параметра О и п, причем обычно свободным остается один параметр 6, другой параметр определяется самой задачей. С помощью простых вычислений можно показать, что среднее значение частоты х равно произведению числа наблюдений я на вероятность 6 появления события в од- одном наблюдении: M{x}=yixPXtn=nB. E.13) х=.О Среднее пЬ называется также ожидаемым числом появ- появления событий в я наблюдениях. Дисперсия частоты х определяется выражением о|=/гбA-б). E.14) Если через h = x/n обозначить относительную ча- частоту (частость) появления события, то очевидно, что *) Биноминальное распределение было получено Я. Бернулли и опубликовано в 1713 г.
154 РАСПРЕДЕЛЕНИЯ ПУАССОНА И БИНОМИНАЛЬНОЕ [гл. V среднее значение относительной частоты события будет равно вероятности его появления 6, а дисперсия этой частоты определится выражением CT? = Mbi). E.15) /1-/0 0-OJ Г - Форма биноминального распределения зависит от вели- величины его параметров. На рис. 25 приведены графики би- биноминального распределения для я=10 и 8 = 0,1; 03 и 0,5, Для 0 = 0,5 биноминальное распределение симметрично. При увеличении п и заданном значе- значении 0 биноминальное распределе- распределение сходится к нормальному рас- распределению. При значениях 6 от 0,30 до 0,70 хорошее приближение к нормальному распределению на- наблюдается при я > 40. Если при я—> оо одновременно 8—^0, то биноминальное распределение схо- сходится к распределению Пуассона. Практически и при малых значе- значениях я принято пользоваться рас- распределением Пуассона в качестве приближения к биноминальному распределению, если 8<0,1. При заданном 0 минимальное число наблюдений п, необходи- необходимое для того, чтобы можно было применять нормальное распреде- распределение, определяется формулой 9 E.16) р0.4 0,3 0,2 0,1 0 р0,4 0,3 0,2 0,1 о 0,4 0.3 0,2 0,1 о 0123456 78 810 х в-0,3 Р 0 1 2 34 5 67 8910 х 6'-0,5 1 0 1234 5 67 8910 Рис. 25. Биноминальное распределение для я=10 и 6=0,1, 0,3 и 0,5. п = 0A — 6)" Например, при 6 = 0,1 имеем: 9 я = 0,1 A — 0,1) = 100. Для того чтобы определить вероятность попадания случайной величины х в интервал х < ,т2 здесь, у р ± 2 так же как и в случае распределения Пауссона, рекомен- § 3] БИНОМИНАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 155 дуется вводить поправку на непрерывность при переходе от суммирования к интегрированию ys \ E.17) где \х, — пб, а = )/я8A —8). Все вычисления проводятся так же, как это было показано при рассмотрении распре- распределения Пуассона. Рассмотрим следующий пример: процентное содержа- содержание цементита на металлографическом шлифе определяли с помощью острия, которым прикасались к шлифу слу- случайным образом и отмечали число попаданий острия на изучаемую структуру [130]. Было сделано 310 наблюде- наблюдений, причем в 106 случаях острие попало на цементит. Процентное содержание цементита равно h% = Ц-100-34%. Поскольку при « = 310, 8 = 0,34 биноминальное рас- распределение достаточно близко к нормальному распреде- распределению, 95%-ные доверительные границы для вероятно- вероятности 6 в генеральной совокупности, совместимые с нашим экспериментом, могут быть представлены неравенством Л-1,96ог<9<Л +1,96а, где а определяется из E.15). ± 0,05. Окончательный результат может быть записан так: про- процентное содержание цементита равно 34 ± 5%. Здесь количественный результат был получен с помощью большого количества качественных определений, поэтому
1 •'jtj РАСПРЕДЕЛЕНИЯ ПУАССОНА 11 ШШОМИНАЛЬ ПОИ [ГЛ. V подсчет ошибки производился с помощью выражения, полученного для биноминального распределения. Во многих случаях имеет смысл контроль за устой- устойчивостью количественного анализа осуществлять при по- помощи некоторого качественного признака, и тогда для статистических оценок нужно пользоваться биноминаль- биноминальным распределением. Например, если текущие анализы в лаборатории выполняются из двух параллельных опре- определений, то в качестве такого признака можно взять число тех анализов, которые пришлось переделывать из-за большого расхождения в параллельных определе- определениях. Допустим, что в результате длительного наблюде- наблюдения установлен средний процент h% = 7% бракуемых параллельных определений. Тогда текущий контроль за устойчивостью аналитического процесса можно вести, проверяя число забракованных анализов на каждые 150 выполненных анализов. При я = 150, 6 = 0,07 биноминаль- биноминальное распределение, как это следует из E.16), может быть представлено нормальным распределением. Поэтому, пол!» зуясь формулой E.15), может следующим образом напи- написать 95%-ные двусторонние доверительные границы для вероятности забраковать параллельные определения из-за большого расхождения между ними: 0,07 ±1,96,/^}^. Производя вычисления, получаем: 0,07 ±0,041. Следовательно, если на 150 выполненных анализов лабо- лаборатория вынуждена была переделать более 17 анализов (> 11%), то возникает необходимость в тщательной про- проверке условий работы лаборатории. Такой способ контроля за устойчивостью аналитиче- аналитического процесса не отличается большой чувствительностью, но он удобен своей исключительной простотой. В практической работе часто приходится сталкиваться со сравнением двух относительных частот h1=x1/n1 и h2=x2jn2, полученных для двух независимых серий опы- опытов. Будем рассматривать две серии опытов как один опыт с числом испытаний п1 -\- пг и абсолютной часто- 3] БИНОМИНАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 157 той появления события х1 -\- х2. Тогда относительная час- частота появления события в объединенном опыте опреде лится выражением ь=Й?- E-18) Нам нужно проверить гипотезу о том, что две наши выборки принадлежат к одной и той же генеральной совокупности, и найденные частости h1 и h2 являются оценкой для одной и той же вероятности 6 в генераль- генеральной совокупности. Если эта гипотеза верна и к обоим частостям применимо нормальное распределение, то раз- разность hx~h2 будет распределена со средним значением, равным нулю, и дисперсией, равной E.19) Нормированная величина определяется равенством*)  E'20) Для двустороннего уровня значимости р гипотеза будет принята, если ! и I < и , р , где и , v — квантиль норми- 2 ТГ рованного нормального распределения. Рассмотрим следующий пример: в одной лаборатории было сделано 100, а в другой 150 анализов по одной и той же методике; в первой лаборатории вынуждены были повторить 15 анализов (из-за большого расхожде- расхождения в параллельных определениях), а во второй —12 ана- анализов. Нужно выяснить, отличаются ли значимо усло- условия работы этих двух лабораторий. Пользуясь формулой E.16), прежде всего убеждаемся в том, что для обеих частей применимо нормальное распределение. Затем *) Для упрощения вычислений здесь по вводим поправки на непрерывность.
158 РАСПРЕДЕЛЕНИЯ ИУАССОЙА И БИНОМИНАЛЬНОЕ [гл. V производим вычисления по формулам E.18) и E.20): " "" 100 + 150 "" U) Шй> 15 12 100 ~ 150 /о,Ю8х 0,892 х D+^1 150 « 1,75. Найденное значение и меньше, чем гг0|975 = 1,96, сле- следовательно, нет основания считать значимым различие в двух наблюденных частотах. ГЛАВА VI ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА § 1. Сравнение двух средних с помощью ^-критерия В § 2 гл. IV рассматривался вопрос об оценке сред- среднего результата анализа с помощью i-критерия. В анали- аналитической работе часто приходится производить более слож- сложную задачу—сравнение между собой двух средних ре- результатов. Допустим, например, что одна и та же проба была проанализирована двумя различными методами и результаты анализа представлены двумя рядами величин: 1 2 * * * "^Tti j Ух 2/2 ••• Уп2- Нам нужно выяснить, есть ли статистически значи- значимая разница в результатах анализа, выполненных двумя методами. Эту задачу можно решить с помощью г-крите- рия, .если есть основания полагать, что имеем дело с нормально распределенными наблюдениями, и диспер- дисперсии двух систем наблюдений s| и Sy не отличаются зна- значимо друг от друга. Последнее проверяется с помощью ^-критерия, как это было показано в § 2 гл. IV. При выполнении указанных условий для проверки пулевой гипотезы (хж—(ху = 0 вычисляют среднее взвешен- взвешенное двух дисперсий 7T_ — 2 и величину t =,/¦=. F.1) F.2)
160 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [гл. VI Число степеней свободы здесь равно / = м1 + я2—2. Если найденное значение t по абсолютной величине превосхо- превосходит табличное значение для 1%-ного уровня значимости, то нуль-гипотеза отбрасывается, и она ставится под сом- сомнение, если найденное значение t превосходит табличное для 5%-ного уровня значимости. Здесь применяется дву- двусторонний критерий значимости, так как у нас априори нет оснований полагать, что одно из двух средних мо- может быть больше, чем другое. В частном случае, когда я1=п2, выражение F,2) упрощается: F.3) Рассмотрим следующий пример: определение SiO2 в мартеновском шлаке производилось весовым и фотоко- фотоколориметрическим методами, и были получены следующие результаты: весовой метод х = 20,5, sx = 0,23, я1 = 5, у = 21,3, s =0,40, гс2 = 6. фотоколориме- фотоколориметрический метод Вычисления дают: 0,16 UjUOo ' -Л_ 5x0,16+4/, 0,053 п 9 %- 5 + 6-2 ~ U'V^' 21,3-20,5 /5>Гб_о qr , о 0,334 У 5+6~ ' ' /"~ При / = 9 для двусторонних границ по табл. 3 Прило- Приложений находим: *o, oi ^0,001 — 4,7о. Следовательно, P(\t\> 3,95)^0,005. Таким образом, результаты статистического анализа показывают следующее: 1) На основании данного экспериментального мате- материала нет оснований считать, что sx значимо отличается § 1] СРАВНЕНИЕ ДВУХ СРЕДНИХ С ПОМОЩЬЮ (-КРИТЕРИЯ 161 от Sy, так как найденное значение F оказалось меньше табличного значения F для 5%-ного уровня значимости. Здесь надо заметить, что априори у нас не было осно- оснований считать, что для нулевой гипотезы альтернативной является утверждение, что ау > о|, поэтому мы должны пользоваться двусторонним критерием значимости, а таб- таблица F-распределения составлена для односторонней гра- границы. В связи с этим можем утверждать, что найден- найденное ^-отношение незначимо с 10%-ным уровнем значи- значимости. 2) Полученное значение t оказалось больше двусто- двустороннего 1%-ного критерия, следовательно, расхождение между результатами анализа надо считать значимым. В тех случаях, когда нулевая гипотеза не отвергнута для оценки параметров генеральной совокупности, можно использовать обе системы наблюдений, рассматривая «! + я2 анализов как одну выборку из одной и той же генеральной совокупности. В этом случае средняя и ди- дисперсия определяются выражениями: F.4) F-5) Если применение F-критерия показывает, что нет основания считать дисперсии равными, то для сравне- сравнения двух методов анализа при щ = я2 можно воспользо- воспользоваться приближенным ^-критерием (х-у) Уп с числом степеней свободы где Sx-j-Sy F-8) В отличие от F.3) здесь уменьшается число степеней свободы, которое, как нетрудно видеть, может изме- изменяться в пределах между я —1 и 2 (я— 1). 11 В. В. Налииоп
162 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [ГЛ. VI Сравнение двух аналитических методов удобно произ- производить по результатам текущих анализов, когда пробы анализируются двумя различными методами в одной ла- лаборатории, или одним и тем же методом, но в двух раз- разных лабораториях. Допустим, что мы имеем следующие результаты анализов: № пробы 1 2 п Результат анализа по . методу х х1 х% хп Результат анализа по методу у 2/1 2/2 Уп Разности <*1 = 24 —2/1 d% = х2 — 2/2 dn=xn—yn Если оба метода дают одинаковые результаты, то при достаточно большом числе измерений очевидно, что мы должны были бы получить d = 0. В практической работе часто бывает нужно проверить гипотезу об отсут- отсутствии постоянного расхождения по небольшому числу анализов. Для вычислений используются формулы: л—1 п dVn F.9) F.10) Число степеней свободы здесь равно / = я—1. Пользуясь этим приемом, можно сравнивать средние значения для двух методов анализа с разными ошибками воспроизводи- воспроизводимости, не прибегая к приближенному значению ^-критерия. Рассмотрим следующий пример: в лабораториях двух институтов, специально занимающихся анализами чер- черных металлов, было произведено определение углерода в 43 пробах нелегированной стали. Результаты анализа приведены в табл. 6.1. Подсчеты показывают, что найден- § 1] СРАВНЕНИЕ ДВУХ СРЕДНИХ С ПОМОЩЬЮ (-КРИТЕРИЯ 163 ное значение t несколько больше, чем значение двусторон- двустороннего критерия для 10%-пого уровня значимости, но зна- значительно меньше 5%-ного критерия значимости. Следова- Следовательно, на основании имеющегося экспериментального материала мы не можем сомневаться в правильности нуль-гипотезы. Здесь интересно обратить внимание на то обстоятель- обстоятельство, что в аналитическом ГОСТ'е 2331-43 указаны следую- следующие допустимые расхождения в результатах анализов углерода в сталях: Таблица 6.1 Определение углерода в нелегированных сталях № про- пробы 1 2 3 4 5 6 7 Институт № 1 0,18 0,12 0,12 0,08 0,08 0,12 0,19 Институт Кя 2 0,16 0,09 0,08 0,05 0,13 0,10 0,14 Разность +0,02 +0,03 + 0,04 +0,03 —0,05 +0,02 +0,05 №. про- пробы 8 9 10 И 12 13 Институт № 1 0,32 0,27 0,22 0,34 0,14 0,46 Институт № 2 0,30 0,31 0,24 0,28 0,11 0,42 ' Разность +0,02 —0,04 —0,02 +0,06 +0,03 +0,04 d = 0,018, sd = 0,034, 0,018 V^13 . on ' = 0,034 =1'89' При /=12 двусторонние критерии для 10- и 5%-ных уровней зна- значимости равны *0,1<Г Следовательно, = 1,78; го,О5=2,18. P{\t\> 1,89) «0,09. для интервала концентраций 0,11—0,20%— ± 0,020% и для интервала 0,21—0,50%- ±0,025%. В [117]_было показа- показано, что эти допуски отвечают величине 2а/|/я, если под а понимать внутрилабораторную ошибку воспроизводимости единичного анализа, а результаты анализа выдавать, как это обычно принято, усредняя данные нескольких парал- параллельных определений, так, чтобы я было в пределах от 4 до 2 для различных аналитических методов. Но допуски, 11*
164 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [гл. VI указанные в ГОСТ'е, никоим образом нельзя распро- распространить на межлабораторные ошибки воспроизводимо- воспроизводимости, как это иллюстрируется табл. 6.1, где в большин- большинстве случаев расхождения оказались за пределами ука- указанных допусков, несмотря на то, что анализы делались специализированными лабораториями двух институтов, которые неоднократно занимались сверкой своих резуль- результатов. Здесь нужно отметить то, что эти недопустимо большие расхождения не могут быть откорректированы поправкой, так как разность d — О оказалась незначимой. Этим примером мы хотим еще раз подчеркнуть важность изучения межлабораторных ошибок воспроизводимости. В приведенном примере, несмотря на использование большого числа анализов различных по своему составу проб, мы по существу сравнивали только два средних значения: d с предполагаемым средним, равным нулю. Если в результате подобного анализа примем нулевую гипотезу M{d] = 0, то это будет указывать только на отсут- отсутствие постоянного расхождения в работе двух лаборато- лабораторий. Такой анализ не дает информации о том, чем выз- вызваны случайные расхождения в результатах анализов различных по своему составу проб—большими внутри- лабораторными ошибками воспроизводимости или случай- случайными методическими ошибками. Ответ на этот вопрос дается дисперсионным анализом, который будет рассмот- рассмотрен в гл. VII. § 2. Сравнение нескольких дисперсий Вопрос о сравнении двух дисперсий был рассмотрен в § 2 гл. IV. В некоторых случаях в аналитической ра- работе бывает нужно сравнивать несколько дисперсий. До- Допустим, что в результате изучения к различных вариан- вариантов нового аналитического метода были получены дис- дисперсии si, si, . . ., s{ с числом степеней свободы fv f2,... . . ., fh. Определим среднюю взвешенную дисперсию: F.И) §2] СРАВНЕНИЕ НЕСКОЛЬКИХ ДИСПЕРСИЙ 165 где и найдем величину D 2,303 /=2 и. il где с F.12) F.13) Бартлет показал, что величина В распределена при- приближенно как х2 с & - 1 степенями свободы, если вес /j > 2. Когда найденная величина В превосходит значе- значение %2 при выбранном уровне значимости, мы отбрасы- отбрасываем гипотезу об однородности дисперсий — в этом слу- случае изучаемые дисперсии нельзя рассматривать как оценки для одной и той же генеральной дисперсии. В частном случае, когда /х = /2= . .. = /fe = /0, фор- формулы упрощаются: С А+1 " ЗЛ/0 • F-14) F.15) Рассмотрим следующий пример: при разработке спе- спектрографического метода анализа изучались различные способы заточки электрода и различные системы контро- контроля этого процесса. В табл. 6.2 проведен статистический анализ однородности полученных при этом дисперсий. Вычисления показывают, что найденное значение В =1,59 меньше, чем xo.os C) = 7,8, следовательно, имеющийся экспериментальный материал не дает воз- возможности утверждать, что тот или иной метод заточки дает лучшую воспроизводимость анализа. Если число степеней свободы для всех выборок одина- одинаково, то для сравнения дисперсий вместо приближенного
166 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [ГЛ. VI Таблица 6,2 Сравнение четырех дисперсий, полученных при различных способах заточки электродов *) [Способ заточки X Y Z Т Суммы si 0,023 0,028 0,031 0,025 h 14 19 19 13 65 «? 0,00053 0,00078 0,00096 0,00062 hA 0,00742 0,01482 0,01824 0,00806 0,04854 lgsf —3,2757 —3,1079 —3,0177 -3,2076 — 45,8598 — 59,0501 — 57,3363 - 41,6988 —203,9450 0,0714 0,0526 0,0526 0,0769 0,2535 65 Igs*- -3,1267, lg «2 =—203,2355, 1//=0,0154, c= 1 +0,2535-0,0154 B= 2,303 1,026' 3D-1) -*'"*¦"» — 203,2355—(—203,9450)) = 1,59 • ) = 7,8. *) Ошибки выражены в разностях почернений аналитических линий. критерия Бартлета следует пользоваться критерием Кохрена. Этот критерий основан на законе распределе- распределения отношения максимальной эмпирической дисперсии к сумме всех дисперсий: В табл. 13 Приложений даны значения Gmax, отве- отвечающие 5- и 1%-ному уровням значимости при объеме выборок п от 2 до 145 и числах к от 2 до 120. Если найденные значения окажутся больше указанного в таб- таблице для соответствующих к и / = « —1, то гипотеза об однородности дисперсий отбрасывается для выбранного уровня значимости. §2] СРАВНЕНИЕ НЕСКОЛЬКИХ ДИСПЕРСИЙ 167 Рассмотрим следующий пример: допустим, что при разработке спектроаналитической методики изучалась воспроизводимость пяти различных вариантов и были получены следующие квадратичные ошибки: 0,025; 0,028; 0,032; 0,024; 0,027. Ошибки во всех случаях подсчитывались по 20 изме- измерениям. Находим отношение максимальной дисперсии к сумме остальных дисперсий г 0.0322 = 0 274 Umax~0,0252+0,0282+0,0322+0,0242+0,0272 ' В табл. 13 Приложения нет значений, соответству- соответствующих к = 5, п — 1 = 19. Пользуясь линейной интерполя- интерполяцией, находим значение критерия для к = 5, « — 1 = 19, при 5%-ном уровне значимости: 0,3645 -0,3066 л ос/к f 0,3645 — ( 3 1 = Таким образом, окончательно имеем: = 0,274 < 0,356. Следовательно, у нас нет оснований для того, чтобы отбро- отбросить гипотезу об однородности дисперсий,—все пять изу- изученных вариантов по результатам наших опытов оказыва- оказываются равноценными. В некоторых старых работах шли на дальнейшее, во- вообще говоря, нежелательное упрощение, применяя F-кри- терий для проверки гипотезы об однородности дисперсий, если все дисперсии получены по выборкам одинакового объема. Если наибольшая и наименьшая дисперсии не отличаются значимо при проверке с помощью F-кри- терия, то ясно, что всю группу дисперсий можно считать оценкой для одной и той же генеральной дисперсии. Для предыдущего примера имеем: = |°§г = 1.78 < FoM A9,19) = 2,2, что также указывает на достаточную правдоподобность гипотезы об однородности дисперсий. При проверке гипо- гипотезы об однородности дисперсий с помощью F-критерця
168 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [гл. VI используется не вся информация, полученная в данной серии опытов. Если принимается гипотеза об однородно- однородности изучаемых дисперсий, то при опубликовании работ нужно приводить только значение о~]/ s2. § 3. Проверка гипотезы об однородности результатов измерений. Оценка резко выделяющихся определений Каждый экспериментатор знает, что даже одна грубая ошибка может сильно исказить результаты небольшого ряда измерений. Поэтому в аналитической работе, как и во всяком измерительном процессе, надо иметь критерии для оценки резко выделяющихся определений. Единствен- Единственным вполне надежным методом выявления грубых ошибок является детальный анализ условий эксперимента, позво- позволяющий исключить те наблюдения, при которых были нарушены стандартные условия измерения. В этом слу- случае сомнительные измерения отбрасываются независимо от их величины; например, если при фотометрировании линий на фотопластинке оказывается, что эмульсия в окрестности данной линии повреждена, то результаты измерений надо отбросить, даже если они ие отличаются существенно от всего ряда измерений. Практически, одна- однако, не всегда удается провести такой анализ условий измерений, и поэтому для оценки грубых ошибок прихо- приходится обращаться к статистическим критериям, которые оказываются также очень полезными при решении таких сложных аналитических задач, как изучение межлабора- межлабораторных ошибок воспроизводимости, исследование неодно- неоднородности материала, оценка методических ошибок при малом числе стандартных образцов и эталонов и т. д. Статистические критерии для оценки грубых откло- отклонений являются, конечно, условными, так как они бази- базируются на нормальном распределении, которое допускает, вообще говоря, появление сколь угодно больших ошибок, хотя вероятность появления их исчезающе мала. При статистическом анализе результатов измерений не всегда возникает необходимость в оценке грубых отклоне- отклонений. Часто задача формулируется иначе—нужно бывает проверить гипотезу об однородности (совместимости) результатов измерений, т. е. гипотезу о том, что все изме- § 3] ОЦЕНКА РЕЗКО ВЫДЕЛЯЮЩИХСЯ ОПРЕДЕЛЕНИЙ 169 рения, входящие в данную совокупность, можно рассматри- рассматривать как значения одной и той же случайной величины, подчиняющейся нормальному распределению. Иногда так- также нужно бывает найти доверительные границы для неко- некоторого будущего (п + 1)-го измерения, когда известны результаты первых п измерений. В литературе было предложено несколько способов для проверки гипотезы об однородности наблюдений и для оценки грубых отклонений. Мы здесь рассмотрим только следующие приемы: 1) Допустим, что имеется п определений xv x2,...,xv и у нас по тем или иным причинам возникает подозре- подозрение в том, что некоторое, произвольным образом выбран- выбранное, i-e определение х{ несовместимо с остальными изме- измерениями. Подсчитаем х и sx, пользуясь всеми п значени- значениями случайной величины, и определим относительное отклонение для ?-го определения г; =¦ — V— V п каждое из которых, как было показано в § 2, гл. IV, подчиняется /--распределению с числом степеней свободы f = n — 2. Численные значения/"-распределения табулиро- табулированы в табл. 7 Приложения. Если найденное значение гг для любого i-ro измерения не превосходит по абсолют- абсолютной величине табличного значения г для выбранного уро- уровня значимости, то мы можем принять гипотезу об одно- однородности результатов измерений [1]. Из рассмотрения табл. 7 Приложения следует, что при больших значениях / г-распределение весьма близко к нормальному распреде- распределению. Поэтому при достаточно больших / для проверки гипотезы об однородности измерений можно пользоваться критерием 3 а, полагая, что в этом случае выборочная дисперсия достаточно хорошо характеризует генераль- генеральную дисперсию. Если ни одно из отклонений при боль- большом числе измерений не превосходит по абсолютной вели- величине утроенной квадратичной ошибки, то допустимо счи- считать все измерения совместимыми. Когда одно из значений г оказывается по абсолютной величине больше соответствующего табличного значения,
170 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [ГЛ. VI то это, вообще говоря, еще не может служить основанием для отбрасывания этого измерения, как грубого. Описан- Описанный выше критерий пригоден только для оценки некото- некоторого произвольным образом выбраного г'-го измерения. Если же мы хотим оценить какое-то специальным обра- образом выбранное измерение, например максимальное или минимальное измерение, то должны рассматривать рас- распределение максимального отклонения ПЛИ Распределение гтах (или rmin) изучалось в [169, 170]. В табл. 7А Приложения табулированы значения гшах (или rmin) для уровнен значимости 0,10, 0,05, 0,025 и 0,01 при значениях / = л—2 от 1 до 23. Если найден- найденное значение гтах (или rmin) окажется больше соответ- соответствующего табличного значения для выбранного нами уровня значимости, то такое измерение может быть от- отброшено как грубое. Рассмотрим в качестве примера применение /--крите- /--критерия для оценки совместимости следующих четырех па- параллельных определений SiO2 в мартеновском шлаке- 28,6, 28,3 28,4 и 28,2%. На стр. 39 и 45 для этих ре- результатов было подсчитано среднее значение н квадра- квадратичная ошибка, которые оказались равными: х = 28,38, sx = 0,l7. Произведем подсчеты, необходимые для при- применения г-критерпя: = 0,17 28,60 — 28,38 1 0,15 28,30 — 28,38 --0,53; г4 = 28,40 — 28,38 0Д5 ' 28,20-28,38 --1,2. По табл. 7 Приложения находим при / = 4—2 = 2 двусторонний критерий для 10%-ного уровня значимости; '"о,ю B) = 1,559. Следовательно, у нас нет оснований сомневаться в однородности результатов измерений. § 3] ОЦЕНКА РЕЗКО ВЫДЕЛЯЮЩИХСЯ ОПРЕДЕЛЕНИИ 171 Рассмотрим второй пример: анализ мартеновского шлака на содержание SiO2 производился из пяти парал- параллельных определений. Были получены следующие резуль- результаты: х = 28,40%, sx = 0,20, причем результат одного из определений х — 28,76 вызывал подозрение, так так очень резко отличался от результатов остальных определений. Здесь, в отличие от предыдущего примера, задача фор- формулируется иначе: нам нужно решить вопрос о том, можно ли Отбросить одно измерение как грубое. Под- Подсчитаем 7'гпах: _ 28,76-28,40 _опп 'шах — 0,20 Пользуясь табл. 7А Приложения, находим, что гтах = = 2,00 > /-max;O,oiC) = 1,955. Следовательно, результат определения ж = 28,76 может быть отброшен, так как здесь имеет место грубая ошибка. Если среди п измерений имеется два результата, один из которых вызывает сомнение в силу того, что он значи- значительно больше остальных величин, а другой—пз-за того, что он значительно меньше, то поступают следующим образом: сначала проверяют гипотезу о том, можно ли отбросить как грубое одно из измерений, например мак- максимальное. Если окажется, что измерение с максималь- максимальным значением нужно отбросить, то подсчитывают х и sx по оставшимся п—1 измерениям и затем проверяют гипо- гипотезу о возможности отбросить измерение с минимальным значением. Иногда может создаться такая ситуация, что будут вызывать сомнения два измерения в силу того, что оба они будут значительно .меньше остальных измерений. В этом случае сначала произвольно отбрасывается меньшее из двух измерений и проверяется гипотеза о наличии грубой ошибки во втором (большем) измерении; при этом х и sx подсчитываются по оставшимся и —1 измерениям. Если окажется, что второе измерение можно классифи- классифицировать как отягченное грубой ошибкой, то естественно, что может быть отброшено и первое измерение. Если же выяснится, что второе измерение не отягчено грубой ошибкой, то тогда проверяют гипотезу о наличии грубой
172 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [гл. VI ошибки в первом, меньшем из двух измерений, подсчи- подсчитывая х и sx по всем п измерениям [169]. К сожалению, табл. 7А составлена только до значе- значения и = 25. При большем числе измерений приходится ограничиваться проверкой гипотезы об однородности результатов измерений. Нужно обратить внимание на то, что при достаточно большом числе измерений вопрос об отбрасывании или принятии того или иного измерения может решаться на основании некоторых общих, иногда недостаточно строгих, соображений; если здесь будет до- допущен некоторый произвол, то он существенно не отразит- отразится па результатах дальнейшего статистического анализа. 2) Допустим, что имеется п измерений xv x2, ..., хп и требуется установить оценку доверительного предела для некоторого будущего (n-f-l)-ro измерения, совмести- совместимого с остальными измерениями. Подсчитаем х и sx, пользуясь п измерениями. Доверительный предел для некоторого измерения жп+1, совместимого с остальными п значениями х, найдем из выражения г х _t 1А+1, х "tVi*l — ''ьх у п ' F.16) в которое надо подставить значения t из табл. 3 Приложения для выбранного уровня значимости при / = и—1 [1, 23]. Выражение F.16.) легко получить из F.2), если там среднее значение у заменить единичным измерением и со- соответственно считать, что п2 — 1. Этот прием оценки совме- совместимости результатов определений удобен тем, что он дает возможность по п определениям установить доверитель- доверительный предел для некоторого, еще не выполненного (п-\~ 1)-го определения. Рассмотрим в качестве примера возможность примене- применения выражения F.16) при оценке доверительного пре- предела для методической ошибки химического анализа в пробах неизвестного состава, если правильность анализа контролируется по небольшому числу стандартных образ- образцов. Допустим, что в лаборатории была проанализиро- проанализирована большая партия проб неизвестного состава и вместе с ними для оценки методических ошибок анализировалось m стандартных образцов, причем для каждого стандарт- § 3J ОЦЕНКА РЕЗКО ВЫДЕЛЯЮЩИХСЯ ОПРЕДЕЛЕНИИ ного образца выполнялось большое число параллельных определений. Поэтому будем полагать, что ошибкой вос- воспроизводимости можно пренебречь. Будем рассматривать методическую ошибку, характеризующую отклонение сред- среднего результата анализа от действительного содержания вещества в пробе, как независимую случайную перемен- переменную, различными значениями которой являются ошибки, полученные для каждой данной пробы. Подсчитаем по нашим m стандартным образцам среднее значение методи- методической ошибки х, характеризующее постояную для дан- данного метода ошибку, и дисперсию sL-xiim> обусловлен- обусловленную случайной методической ошибкой, зависящей от химического и фазового состава проб. Пользуясь соот- соотношением F.16), мы можем определить максимально возможную случайную методическую ошибку для неко- некоторой пробы, анализ которой будем рассматривать как (тп-\- 1)-е определение по отношению к нашим m стандарт- стандартным образцам: X — Х„ = tsc F.17) Задавшись 5%-ным уровнем значимости, мы получим при всл-хим коэффициенты, равные 16,0; 5,0; 3,6; ...; 2,4 для тп = 2, 3, 4, ..., 10. Допустим, например, что в результате многократного повторного анализа двух стандартных образцов мы убеди- убедились в том, что х = 0, sCJ[-xhm Ф 0. Тогда результаты анализа некоторого третьего стандартного образца будут несов- несовместимы с результатами анализов первых двух стандарт- стандартных образцов, только в том случае, если средний резуль- результат будет отличаться от паспортных данных более чем на 16 Ясл-хим- Если же мы произвели анализы 10 стандар- стандартных образцов и также получили х = 0, scn.XIIM Ф 0, то анализ некоторого нового одиннадцатого образца будет несовместим с анализами 10 стандартных образцов, тогда, когда средний результат, полученный для этого образца, будет отличаться от паспортных данных более, чем на 2,4 sot-xhm- Для результатов анализов большой серии проб, выпол- выполненных в двух лабораториях, часто приходится наблю-
174 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [ГЛ. VI дать отдельные очень большие отклонения, несмотря на то, что каждая из этих лабораторий проверяла правильность своих анализов по одним и тем же стандартным образцам и не имела существенно больших отклонений от паспорт- паспортных данных. Этот хорошо известный аналитикам факт легко объясняется на основании изложенных выше сооб- соображений. В табл. 6.3 приведены результаты химического Таблица 6.3 Результаты определения фосфора в углеродистых сталях пробы 1 2 3 4 5 6 7 8 9 10 11 12 13 Лаборатория института М i 0,028 0,032 0,021 0,022 0,021 0,022 0,022 0,033 0,024 0,026 0,024 0,024 0,028 Лаборатория института № 2 0,025 0,029 0,015 0,012 0,010 0,013 0,023 0,030 0,021 0,022 0,020 0,023 0,027 Заводская лаборато- лаборатория 0,022 0,024 0,015 0,014 0,011 0,013 0,025 0,025 0,017 0,020 0,016 0,019 0,025 определения фосфора в простых углеродистых сталях, выполненные в лабораториях двух институтов и одного завода. По ГОСТ 2331-41 для этого интервала концен- концентраций считаются допустимыми отклонения ±0,0030%. При сопоставлении результатов анализа, выполненных в лабораториях двух институтов, обращает на себя вни- внимание то обстоятельство, что для большинства проб рас- расхождение находится в допустимых пределах. Вместе с тем в некоторых случаях для проб № 3, 4, 5 и 6 наблюдаются недопустимо большие расхождения. На первый взгляд этот результат кажется мало понятным. Грубые ошибки здесь должны быть исключены, так как каждый анализ выполняется из нескольких параллельных определений. Методические ошибки также, казалось бы, не должны § 3] ОЦЕНКА РЕЗКО ВЫДЕЛЯЮЩИХСЯ ОПРЕДЕЛЕНИЙ 175 были достигать столь больших размеров, так как их величина контролировалась с помощью стандартных образ- образцов. Обычно аналитики склонны рассматривать резуль- результаты, аналогичные приведенным в табл. 6.3, как некото- некоторый необъяснимый парадокс. Между тем, если для ана- анализа этих результатов воспользоваться формулой F.17), то обычно все недопустимо большие отклонения оказы- оказываются совместимыми с результатами анализа небольшого числа контрольных стандартных образцов. Для данного примера мы не могли проверить это предположение, так как нам оставались неизвестными результаты анализа соответствующих стандартных образцов. Здесь можно только выяснить, являются ли совместимыми расхожде- расхождения для всех 13 анализов, выполненных в лабораториях двух институтов. Для этого подсчитываем: d~ 0,0044, sd = 0,0036. Вычисления, выполненные с помощью фор- формулы F.10), показывают, что среднее расхождение меж- между двумя лабораториями значимо отличается от нуля. Подсчет г{ для проб с наибольшими расхождениями дает следующие результаты: г4«1,60 г, «1,31. По табл. 7 Приложения находим для /==13 — 2 = 11: 1-0,1 = 1,649, 1-0,05 = 1,916, rOi(M = 2,368. Следовательно, мы вынуждены признать, что наибольшие отклонения находятся в допустимых пределах и все измерения оказываются совместимыми между собой. Приведенный прием оценки методических ошибок по небольшому числу стандартных образцов может быть применен только в том случае, если значения концентра- концентрации определяемого компонента заключены в узких пре- пределах. Практически обычно в распоряжении аналитика имеется небольшое число стандартных образцов, поль- пользуясь которыми он должен сделать заключение о величине методических ошибок для широкого интервала концен- концентраций определяемого компонента. В этом случае, как это будет показано ниже (см. стр. 211), в качестве незави- независимой случайной переменной надо брать не величину
176 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [Г.1. VI Ас, а величину у = Ас/си, где Ас = с — са, с —средний результат анализа стандартного образца, сп —надежно установленное содержание компонента в стандартном образце, указанное в его паспорте. Для того чтобы получить некоторое представление о границах, в которых должны находиться относитель- относительные ошибки проб неизвестного состава, мы можем опять воспользоваться формулой F.17), подставляя туда зна- значения у и s . Если анализы каждого стандартного образца выполнены из достаточно большого числа параллельных определений, то можно считать, что sy определяется относительными методическими ошибками, обусловлен- обусловленными особенностями химического и фазового состава проб. Допустим, например, что при многократном повтор- повторном анализе двух стандартных образцов были получены следующие относительные отклонения: -f-1,5 и —1,5%. Среднее значение относительного отклонения здесь равно нулю, sy = 2,2%. Следовательно, для некоторого третьего стандартного образца можем на основании F.17) ожидать с вероятностью 0,05, что отклонение от паспортных дан- данных будет по абсолютной величине больше 35%. Если те же оценки параметров были бы получены для 10 стан- стандартных образцов, то с той же вероятностью мы можем ожидать, что для некоторого одиннадцатого'стандартного образца отклонение от паспортных данных по абсолютной величине будет больше 5,3%. Все эти расчеты, конечно, имеют характер грубой оценки. При малом числе стандартных образцов они спра- справедливы только в том случае, если строго выполняется нормальное распределение для соответствующих случай- случайных величин, что далеко не всегда имеет место. Но, несмо- несмотря на всю свою условность, они полезны тем, что дают возможность ясно представить себе тот элемент неопре- неопределенности, с которым приходится иметь дело аналитику, когда он контролирует правильность анализа по малому числу стандартных образцов. Здесь можно сделать сле- следующий практически важный вывод: контроль за правиль- правильностью анализа по небольшому числу стандартных образ- образцов не эффективен, если методические ошибки изменяют- изменяются с изменением состава пробы. Поэтому при разработке каждого нового аналитического метода нужно прежде § 4] СЕКВЕНЦИАЛЬНЫЙ (ПОСЛЕДОВАТЕЛЬНЫЙ) АНАЛИЗ 17" всего выяснить природу методических ошибок. Для этой цели удобно пользоваться комплексным дисперсионным анализом, как это будет показано в следующей главе *) (см. примеры на стр. 212 и 237). § 4. Секвенциальный (последовательный) анализ Все рассмотренные выше приемы статистического ана- анализа основывались на фиксированном числе эксперимен- экспериментов и позволяли получать один из двух возможных отве- ответов: выдвигаемая гипотеза принимается или отвергается. В сороковых годах Вальд предложил новый, секвенциаль- секвенциальный критерий [30, 34, 37, 46], при котором испытания производятся в виде последовательной серии, причем после каждого испытания делается одно из трех следую- следующих заключений: 1. Проверяемая гипотеза принимается. 2. Гипотеза отвергается. 3. Испытание надо продолжить. При систематическом применении секвенциального (по- (последовательного) анализа в среднем число испытаний в два раза уменьшается по сравнению с обычными методами, когда число испытаний фиксируется заранее. При секвенциальном анализе на основании п наблю- наблюдений мы должны сделать выбор между двумя альтерна- альтернативными гипотезами: \х, = \х,0 и \х, = и.х или продолжить наши испытания. Допустим, что вероятность принятия неверной гипотезы (.1 = [ij, когда в действительности [i = [i0, меньше некоторой небольшой величины а и соответственно веро- вероятность принятия гипотезы ц = ц0, когда ц = цг, меньше некоторой величины р\ В первом случае говорят, что мы делаем ошибку «первого рода», во втором случае— ошибку «второго рода». Секвенциальный анализ основан на том, что для каж- каждого п-го испытания находят вероятность plt n того, что случайные значения хг, х2, . .., хп взяты из совокупности *) Рассмотренные здесь приемы оценки методических ошибок относятся к прямым методам анализа, в которых не используются градуировочные графики. Оценка методических ошибок для вто- вторичных методов анализа, основанных на применении градуиро- вочных графиков, будет дана в § 2 гл. VIII. 12 в. в. Налимов
I7K ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА |ГЛ. VI (х, ..., Цу), и вероятность р0, п того, что они взяты из совокупности (х, .. ., ц-о). Затем вычисляют отношение вероятностей pitn/po,n- Испытания продолжаются до тех пор, пока сохраняется неравенство А. F.18) Ро, Если окажется, что Pun Ро> п то испытания заканчиваются и принимается гипотеза \i>\iy. Соответственно при Pu Ро, принимается гипотеза [i<u,0. Для практических целей можно положить, что В = 1 —а ' F.19) Если результаты п испытаний рассматривать как слу- случайную выборку из генеральной совокупности, подчиняю- подчиняющейся нормальному распределению, то после простых, но несколько громоздких преобразований можно полу- получить следующее неравенство 2. 3^ Здесь введены следующие обозначения: причем предполагается, что о была оценена заранее на основании большой серии каких-то предыдущих экспе- экспериментов. Для того чтобы в практической работе при последо- последовательных испытаниях удобно было пользоваться нера- § 4| СЕКВЕНЦИАЛЬНЫЙ (ПОСЛЕДОВАТЕЛЬНЫЙ) АНАЛИЗ ] 7'-> сенством F.20), строят две параллельные прямые: пря- мую Lo, которая определяется уравнением То = а0 + Ьп, и прямую Ly. где F.21) Последовательные испытания продолжаются до тех пор, пока точки попадают в область, ограниченную па- параллельными прямыми Lo и Ly, и прекращаются, когда экспериментально получен- полученная точка окажется вне этих пределов так, как это пока- показано на рис. 26. Из F.21) следует, что с, увеличением дисперсии и уменьшением 6 = \Ху - и,0 ста- становится шире область, огра- ограниченная двумя прямыми, и следовательно, увеличи- увеличивается число испытаний, ко- которые надо 1фОизвести, чтобы Рис. 26. Применение секвенци- закончить анализ. При при- применении секвенциального критерия часто возникают опасения, что потребуется слишком много испытаний для того, чтобы принять ту или иную гипотезу. Вальд показал, что вероятность того, что секвенциальный критерий закончится принятием од- одной из двух выдвинутых гипотез, равна единице, причем очень мала вероятность того, что число испытаний при секвенциальном анализе окажется в два или три раза больше, чем при классическом способе планирования 12* 0 12 3 4 5 6 7 8 9 10 г/ ального критерия. По оси абсцисс — число наблюде- наблюдений п, по оси ординат — накопле- накопленная сумма Sx.
180 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [гл. VI эксперимента. В среднем, как уже упоминалось выше, число испытаний при секвенциальном анализе оказывает- оказывается примерно вдвое меньше, чем число испытаний, необ- необходимое при применении классического критерия *). Рассмотрим следующий пример: при ускоренном опре- определении SiO2 в шлаке весовым методом получаются за- заниженные результаты из-за неучета SiO2 в фильтрате. Перед аналитиками была поставлена задача — повысить полноту выделения SiO2 путем применения специальных приемов (например, использование желатина для коагу- коагуляции и пр.). Для проведения исследования был выбран стандартный образец, содержащий 24,5% SiO2. На осно- основании обработки предыдущего экспериментального мате- материала была оценена ошибка воспроизводимости сг~0,25%. Исходя из практических соображений, обусловленных требованиями производства, было принято, что осажде- осаждение можно считать достаточно полным, если резуль- результаты анализа стандартного образца будут больше чем 24,25%. Таким образом, проверяемая и альтернативная гипоте- гипотезы были сформулированы следующим образом: [i0 = 24,25, M-i = 24,50. При оценке результатов было принято <х = 0 = 0,05. Результаты вычислений дают: 6 = 24,50-24,25 = 0,25; |Г = 24'25+24|50 = 24,375; ._ 2,30-0,25», 0,05 а ^ 0,25 ^0^5 2,30-0,252 ,0,95 . _,_ !8 ад5 = + °'735' а1" 0,25 6 = 24,375. Область продолжающихся испытаний будет ограни- ограничена прямыми: То= -0,735+ 24,375 и, Т1= +0,375+ 24,375 и. *) Вопрос о выборе числа испытаний при планировании эксперимента более подробно будет рассмотрен в гл. IX. § 4] СЕКВЕНЦИАЛЬНЫЙ (ПОСЛЕДОВАТЕЛЬНЫЙ) АНАЛИЗ 181 Результаты последовательных определений для одно- одного из изучаемых вариантов приведены на рис. 27. По оси абсцисс здесь отложено число последовательных определений, а по оси ординат сумма последовательных результатов определений, причем для удобства построе- построения графика из каждого результата вычиталось произ- произвольно выбранное число, равное 24,0%. Поэтому при Рис. 27. Применение секвенциального критерия при изучении одного из вариантов определения SiO2 в шлаке. построении прямых вместо написанных выше уравнений использовались уравнения: То= -0,735+ 0,375 и, Г1= +0,735+ 0,375 и. Испытание закончилось после четвертого определе- определения. Четыре последовательных определения дали следую- следующие результаты: 24,50; 23,78; 24,12; 23,90. Вычитая из каждого результата число 24,00, получаем следующие накопленные суммы: 0,50; 0,28; 0,40; 0,30, которые нанесены на график. Во многих исследованиях, связанных с разработкой новых аналитических методов, мы не знаем, в какую сторону могут отклониться результаты определений от
182 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [ГЛ. VI надежно установленного содержания вещества в данном образце. В этом случае, если справедлива нуль-гипотеза, то возникает возможность появления двух ошибок пер- первого рода: ошибочно может быть установлено, что иссле- исследуемый метод завышает результаты анализа, или наобо- наоборот, занижает их. Поэтому испытания должны быть днусторошгами с вероятностью появления ошибки пер- первого рода, равной а/2. Величина двустороннего интервала |а0 ± б ([i0—содержание вещества в стандартном образце или эталоне) устанавливается из практических требова- требований, предъявляемых к правильности анализа. Область продолжающихся испытаний будет ограничена двумя парами параллельных прямых: х = a1-\-bn, T[ = a[-\- b'n, где 6 = 4-в. b'=-U, О о 02 1 Р -2,з?: 1-— ., 0' 1 _Л — , -3-ft-lg-^ «! = -2,3 ^lg i-P а т F.22) Пример применения двустороннего секвенциального критерия приведен на рис. 28. В этом случае по оси орди- ординат откладывают накопленные результаты последователь- последовательных определений, вычитая из каждого из них определен- определенную величину—[i0. Секвенциальные испытания являются новым методом статистического анализа, еще не нашедшим широкого рас- распространения, вследствие чего нет достаточного опыта по его использованию. Нам представляется, что он может найти широкое применение при анализе вещества в рабо- работах поискового характера, при опробовании большого числа различных вариантов одного и того же метода в условиях, когда имеется стандартный образец или § 4] СЕКВЕНЦИАЛЬНЫЙ (ПОСЛЕДОВАТЕЛЬНЫЙ) АНАЛИЗ 183 эталон с надежно установленным содержанием вещества и известна величина ошибки воспроизводимости. Варь- Варьируя условиями анализа, можно подобрать такой прием, который, по крайней мере для данного образца, позволит получить методическую ошибку в заданных пределах. Но вместе с тем надо учитывать и некоторую ограничен- ограниченность этого метода. Им удобно пользоваться только при Завышенные результаты Результаты анализа не быходят за пределы ju^S "«""Ztf0****. Рис. 28. Применение двустороннего секвенциального критерия. изучении и разработке прямых методов анализа, не свя- связанных с построением градуировочных графиков. В таких методах, как эмиссионный спектральный анализ, этот прием может найти применение лишь в работах, связан- связанных с изучением влияния отдельных факторов на резуль- результаты анализа при заданном режиме возбуждения. Надо отметить также, что в спектральном анализе этот метод может найти применение только при фотоэлектрической регистрации спектра—при фотографической регистра- регистрации он уже будет неоправданно громоздким. Широкое применение секвенциальный анализ, видимо, может найти при контроле химического состава вещества, когда продукция бракуется, если содержание того .или иного компонента выходит за некоторый предел, В. этом
184 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [ГЛ. VI случае нужно иметь две границы: границу А, выше кото- которой, допустим, продукция принимается, и нижнюю гра- границу В, ниже которой она бракуется. Разность А—В вме- вместе с величиной ошибки анализа определит область про- продолжающихся испытаний. Обычно мы привыкли к тому, что во всех инструкциях и технических условиях указы- указывается одна граница, представленная в виде некоторого определенного числа. Вместо этого числа разумно указы- указывать некоторый интервал концентрации для продолжаю- продолжающихся испытаний. С каждым результатом анализа всегда связан некоторый доверительный интервал для генераль- генерального среднего, совместимого с результатами данного ана- анализа. Если среднее значение оказалось как раз равным установленной границе, то получаем доверительные пре- пределы, лежащие по обе стороны границы—здесь нет доста- достаточных оснований для того, чтобы сказать, по какую сто- сторону от границы находится действительное содержание вещества. Этот интервал неопределенных значений, с которым в несколько завуалированной форме всегда приходится сталкиваться в аналитической работе и нужно принять в качестве области продолжающихся испытаний. С очень большим объемом аналитической работы свя- связана проверка степени однородности материала, предна- предназначенного для изготовления эталонов [118], поэтому здесь также целесообразно применить секвенциальный критерий. Исходя из метрологических требований, кото- которые мы рассматривать не будем, можно установить то значение аНеод> при котором материал должен браковать- браковаться, когда известна ошибка воспроизводимости аВОСп- При последовательных испытаниях материала, предназначен- предназначенного для изготовления эталонов, можно выдвинуть ну- нулевую гипотезу а2 = а!осп = о^ и альтернативную гипо- гипотезу а2 = alocn + анеод - о[, причем обе величины а|Осп и ге заранее фиксируются. Обозначим через а вероят- вероятй 2 l l р р ность принятия неверной гипотезы a2 = alocn + oleon, когда в действительности а2 - а|осп> и через |3 — вероят- вероятность принятия гипотезы а2 = а!0Ст когда имеет место недопустимая неоднородность материала а2 > а!0Сп + Стнеод- Область продолжающихся испытаний будет расположена между параллельными прямыми, определяющимися 5] НЕПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА 186 уравнениями с параметрами 4,6 lg 1-P a, = of J_ 1 On as J F.23) F.24) При построении графика по оси абсцисс отклады- откладывается и—1, а по оси ординат — накопленная сумма квадратов: п П П ( /, Xj ) V _ Х^ /п. ^\2 _. Х^ ^2 __ i=i /С пг\ Здесь еще раз надо подчеркнуть, что этот метод испытания неоднородности материала, предназначенного для изготовления эталонов, может быть рекомендован только при фотоэлектрических способах регистрации спектра. § 5. Непараметрическая статистика Результаты исследования в некоторых случаях можно оценить не прибегая к определению параметров распре- распределения—среднего и дисперсии. Непараметрическая статистика имеет одно несомненное преимущество по сравнению с обычными методами—здесь нет необходи- необходимости высказывать какие-либо предположения относи- относительно закона распределения случайной величины. В § 3 гл. IV к непараметрической задаче была сведе- сведена проверка гипотезы нормальности по результатам текущих измерений. Здесь мы рассмотрим несколько
186 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [гл. VI примеров применения неиараметрической статистики к решению задач, встречающихся в аналитической практике. Проверка гипотезы о наличии постоянного расхождения в результатах наблюдений В лабораторной работе часто утверждают, что между двумя аналитическими методами (или между двумя ла- лабораториями) имеется систематическое отклонение, осно- основываясь только на том, что расхождения в результатах анализа имеют преимущественно один знак. Этому ме- методу можно дать статистическое обоснование и указать границу его применимости. Допустим, что п проб были проанализированы двумя разными методами и при этом получены результаты 2/i> 2/г. • • •. Уп и zv Z2' • • •' zn- Найдем разности уг — zv у2 — z2, . , ., yn — zn и обозначим через q число разностей с менее часто встречающимся знаком. Это значит, что q = х как в том случае, когда среди п пар испытаний было х разностей с одним знаком, так и тогда, когда с тем же знаком было п — х разностей. Если справед- справедлива нуль-гипотеза об отсутствии постоянного расхож- расхождения, то распределение числа разностей с каким-нибудь одним знаком должно подчиняться биноминальному зако- закону с параметром 8 = 0,5. Поэтому вероятность появления числа разностей q с менее часто встречающимся зиаком можно получить, суммируя вероятности для двух «хвостов» биноминального распределения с параметром G = 0,5: ^0,п=,,,„я1.,и, 0,5* A-0,5)"-* + 0,5п-х A - 0,5)(П-(П-х>) = [п — х))! + ^Ц (ге — х)\ (ге — ( = ,,2ге! .,0,5". F.26) х\(п — х)\ ' v ; Здесь и —число парных испытаний, а; —число раз- разностей с одним знаком. В табл. 11 Приложения, заимствованной из [38], приведены значения q для различных уравнений значи- значимости. Если для данного числа проб, каждая из которых 5] НЕПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА 187 анализируется двумя методами, или в двух разных лабо- лабораториях, вероятность появления найденного нами зна- значения q меньше или равна 5%, или же <1%, в зависимо- зависимости от принятых условий, то мы должны отказаться от нуль-гипотезы. Табл. 11 Приложения составлена с боль- большим округлением, так как в общем случае нет таких величин д, которые бы точно соответствовали значениям вероятностей 1, 5, 10 и 25%. Критерий в среднем оказы- оказывается несколько более строгим, чем уровни значимости, указанные в таблице. Для малого числа проб критерий но многих случаях значительно строже. Рассмотрим в качестве примера приведенные в табл. 6.1 расхождения в результатах определения углерода, выпол- выполненных в двух разных лабораториях. Для 13 проб мы имеем 10 расхождений с одним знаком и 3 расхожде- расхождеиия с другим знаком, следовательно, д = 3. По табл. 11 Приложения находим, что вероятность появления q -- 2 при п — 13 равна 5 %, а вероятность появления q = 3 равна 10 %. Поэтому у нас нет достаточного основания полагать, что между двумя лабораториями имеется систематическое расхождение в результатах анализа. К такому же выводу мы пришли на стр. 163, подвергая этот материал статисти- статистическому анализу при помощи z-критерия. Если мы обра- обратимся к данным, приведенным в табл. 6.3, то сможем кон- констатировать наличие постоянного расхождения в результа- результатах определения фосфора, выполненных в лабораториях двух институтов, так как там q = 1 при и = 13. Этот результат подтверждается также статистическим анали- анализом с помощью ^-критерия. Из табл. 11 Приложения следует, в частности, что при небольшом числе проб, проанализированных двумя различными методами, нельзя высказать гипотезы о суще- существовании систематического расхождения даже тогда, когда все разности имеют один знак. Например, если при п = 1 все разности имеют один знак, то это еще не дает осно- основания утверждать, что имеет место какое-то систематиче- систематическое расхождение между двумя аналитическими метода- методами. Опыт показывает, что в повседневной лабораторной работе часто делают выводы о наличии систематического расхождения на основании преобладания одного знака, когда для этого нет достаточных оснований.
188 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА [ГЛ. V] Этот метод статистического анализа отличается край- крайней простотой, так как здесь не требуется производить какие-либо вычисления. Но в то же время надо иметь в виду, что он является весьма малочувствительным методом, Здесь мы отказываемся от количественного сравнения результатов определений, выполненных двумя разными методами, и ограничиваемся их качественным сопоставлением, используя биноминальное распределе- распределение, которое применимо во всех случаях, когда резуль- результаты оцениваются на основании серии последовательных качественных определений. При этом, конечно, значитель- значительная часть информации, содержащейся в полученном мате- материале, остается неиспользованной. В табл. 6.4. приве- приведено число образцов, которое надо иметь для того, чтобы с уверенностью в 95% отбросить гипотезу 6 = 0,5, когда в действительности имеет место та или иная асимметрия знаков. Если например, знаки распределены с соотноше- соотношением 45 E5)%, то для того, чтобы с 95%-ной уверенностью отбросить гипотезу 6 = 0,5, надо иметь не менее 1297 проб, проанализированных двумя разными методами; если же соотношение знаков 5 (95)%, то достаточно иметь 12 проб. Та'блица 6.4 Количество проб п, необходимых для того, чтобы с уверенностью в 95% отбросить гипо- гипотезу 8=0,5, когда в действительности 8=^=0,5 Соотношение внаков в: A-в) 45 E5) '' 60) 40 35 30 65) 70) Число проб п Соотношение внаков в, Aв) 1297 327 143 79 25G5) 20 10 80) 90) 95) Число проб 49 35 17 12 Проверим непосредственным расчетом данные табл. 6.4 для случая, когда имеется 25% разностей с одним знаком и 75% разностей с другим знаком. Из табл. 6.4 следует, что в этом случае, для того чтобы с уверенностью в 95 /о отбросить гипотезу 6=0,5, надо иметь не менее 49 проб. Для условий данной задачи биноминальное распределе- распределение достаточно хорошо приближается к нормальному §5] ШШАРАМЕТРИЧЕСКАН СТАТИСТИКА 189 распределению, поэтому односторонний 95%-ный дове- доверительный предел для ожидаемого числа событий ив, согласно E.14); определяется выражением —6) = = 0,25-49 + 1,641/49-0,25A-0,25) ~ 12 + 5. Из табл. И Приложения следует, что для и=49 невер- неверная гипотеза 6=0,5 будет еще отброшена при д=12+5, но уже будет принята при д=12+6. Приведенный здесь статистический анализ показывает, что оценку результатов определений на основании асим- асимметрии знаков надо делать значительно более осторожно, чем это обычно принято в практике лабораторной работы. Проверка гипотезы о случайном характере флуктуации В аналитической работе часто приходится наблюдать изменение во времени параметров градуировочных гра- графиков (изменение углового коэффициента и отрезка, отсе- отсекаемого от оси ординат в эмиссионном и абсорбционном спектральном анализах, изменение титра и «холостой» в объемном анализе и т. д.). При этом важно выяснить, являются ли флуктуации чисто случайными или имеет место какое-то закономерное (систематическое) смещение. Допустим, что мы имеем п значений случайной величины xv х2, . .., хп, которые являются случайной выборкой из генеральной совокупности с непрерывной функцией распределения. Расположим эти величины в возрастающем или убывающем порядке и найдем ме- медиану, т. е. значение х = Хщ, которое находится посре- посредине этого ряда. Если и —нечетное число: п = 2т-\-1, то медиана равна xM = xwt_1, если же п четное число: п = 2т, то медиана является любым числом, лежащим между хт и ят+1, чаще всего в этом случае за медиану принимают значение хм — -к- (ят + ят+1). Образуем разно- разности хг — хм, х2 — хш, ..., хп — хш. Предположим, что для этих разностей мы получили последовательность знаков
19U ОЦЕНКА 1'Ка.УЛЬТАТОи АНАЛИЗА [гл. VI Очевидно, что эта последовательность отличается, напри- например, от последовательности + -+ -+-+- + -, или от последовательности Всякую последовательность, состоящую из одних и тех же знаков, будем называть серией, число серии будем обозначать через R. В первом из приведенных выше примеров мы имели 4 серии, во втором 10 и и третьем 2 серии. Пользуясь комбинаторикой, можно показать, что при достаточно большом п величина R распределена при- приближенно нормально со средним значением -в п + 2 и дисперсией J п — 1 F.27) F.28) Учитывая дискретность R и вводя поправку на не- непрерывность, получаем: . 1 п + 2 F.29) откуда upVn - 1), F.30) где и —^-квантиль нормированного нормального распре- распределения. Например, для п = 20п рх = 0,025, р.2 - 0,975 находим: i?0,026~|Bi-l,96j/l9) = 6,2, До,973 ~ 1 B1 +1,96 VT9) = 14,8. Следовательно, при п=20 с вероятностью 0,95 можно ожидать появление числа серий R, лежащих в пределах 6—15. Если для данного экспериментального материала 5 Л| МЕПЛ1'Л.ЧЕТ1'11ЧЕа;А11 СТАТИСТИК \ IWI при п=20 число серий будет лежать вне указанного интер- интервала, то нужно будет отбросить гипотезу о случайном характере флуктуации, или по крайней мере поставить ее под сомнение. В табл. 12 Приложения табулированы значения R[h,,ib 11 -^),Э75 ДЛ5Г различного числа наблюдений. Рассмотрим следующий пример: при изучении харак- характера флуктуации параметров градупровочпых графиков для рентгеноспектралыюго определения гафния была получена следующая последовательность 18 угловых коэффициентов: 0,95 0,95 1,01 1,02 1,39 0,95 1,02 1,17 J ,00 1,38 0,93 1,06 0,97 1,09, 1,18 1,15 1,38 1,21; располагая эти величины в возрастающем порядке, полу- получаем: 0,93 0,95 0,95 0,95 0,97 1,00 .1,01 1,02 1,02 1,06 1,09 1,15 1,17 1,18 1,21 1,38 1,38 1,39. Отсюда видно, что медиана лежит между значениями 1,02 и 1,06, и мы можем за медиану принять величину 1.04. Обозначая знаком плюс величины, расположенные справа от люднаш.т, и знаком минус величины, располо- расположенные слева от медианы, получаем для исходной посл(- дователыюстн угловых коэффициентов ряд знаков. Здесь мы имеем 10 серлп. Из табл. 11 Приложений следует, что при п~]8 для 5%-ного уровня значимости перхпне п нижние пределы общего числа серий лежат между 5 и 14. Следовательно, в рассматриваемом случае у нас пет оснований отбросить иуль-пшотезу о чисто случайном характере флуктуации углового коэффициента грлдупроночиого графика. Для отрезка, отсекаемого но оси ординат, при этих же опытах была получена последовательность величин: 0,16 0,12 0,15 0,13 0,10 0,07 0,10 0,15 0,12 0,05 0,08 0,11 0,08 0,12 0,07 0,06 0,03 0,06. Располагая их в возрастающем порядке, получаем ряд: 0,03 0,05 0,06 0,06 0,07 0,07 0,08 0,08 0,10 0.10 0,1'1 0,12 0.12 0,12 0,13 0,15 0,15 0.16.
192 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА (ГЛ. VI Здесь медианой будет значение 0,10. Последователь- Последовательность знаков в этом случае будет: Два значения, равные медиане, классифицированы как лежащие срава и слева от нее. Число серий здесь равно 8, следовательно, и второй параметр градупровочпого гра- графика подвергается чисто случайным флуктуациям. Отсюда следует практически важный вывод о том, что эпизодическая проверка параметров градунровочных гра- графиков не повышает точности анализа. Нужно контроли- контролировать параметры градуировочного графика для каждой пленки. Если же это по условиям выполнения анализов невозможно, то надо пользоваться средними значениями параметров градуировочного графика, полученными для большого числа пленок за длительный интервал времени. Изучение условий работы многих аналитических лабора- лабораторий показало, что при выполнении экспрессных анали- анализов часто пользуются эпизодической проверкой параме- параметров градунровочных графиков тогда, когда в действитель- действительности имеет место чисто случайная их флуктуация. Строгий статистический анализ, аналогичных! приведенному выше, позволил обнаружить бесполезность этого приема. При проверке гипотезы случайности мы связываем значения изучаемой величины с некоторым произвольно выбранным неслучайньш параметром. Часто в качестве такого неслучайного параметра берутся последовательные значения времени, как это было сделано в предыдущем примере. Интересно отметить, что по отношению к некото- некоторому параметру значения величины х могут быть упоря- упорядочены, хотя при этом не нарушается нормальный закон распределения. Поясним это следующим примером: допустим, мы имеем некоторое число зерен, распределение которых по удель- удельному весу подчиняется нормальному закону. Поместим эти зерна в какой-нибудь сосуд и будем его встряхивать в течение длительного времени. При этом в силу гравита- гравитационного обогащения в нижней части сосуда сосредоточат- сосредоточатся преимущественно тяжелые зерна, в верхней части сосуда—легкие. Если мы возьмем в качестве параметра высоту сосуда, то по отношению к этому параметру зерна 5] НЕПАРАМЕТРИЧЕСКАЯ СТА!ИСТИНА 1 93 будут находиться в упорядоченном состоянии. Вместе с тем распределение зерен по их удельному весу по- прежнему будет подчиняться нормальному распределению. Упорядоченность зерен по высоте сосуда всегда легко нарушить путем простого перемешивания. Таким образом, упорядоченность по отношению к некоторому произвольно выбранному параметру еще не свидетельствует о неприме- неприменимости методов теории вероятностей для изучения того или иного явления. Метрологические оценки на основании неравенства Чебышева В аналитической работе иногда приходится иметь дело со статистическими ансамблями, для которых не легко установить закон распределения. В этом случае мы уже не можем рассматривать квадратичную ошибку как пара- параметр конкретного распределения, так как закон распреде- распределения остается неизвестным. Возникает вопрос—какой метрологический смысл может иметь тогда квадратичная ошибка. Для того чтобы квадратичную ошибку можно было в таких случаях рассматривать как меру рассеяния, приходится прибегать к неравенству Чебышева *): P(\x-li\>aa)<^, F.31) где а — некоторое положительное число. Проведем числовые расчеты для различных значе- значений а: а = 2; Р(|ж-и.|>2ст)<0,25, а = 3; Р(\х- а =10; Р(\х-р\> -10а)< 100 • Здесь уместно напомнить, что для статистического ансамбля, подчиняющегося нормальному распределению, *) Это неравенство было иолунто П. С1. Чебышевьгм в Г Г. в. в. Налимов
ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА (ГЛ. VI вероятность появления отклонений > 2а и > За равна 0,05 и 0,003. Для симметричных одновершинных распределений можно написать [38] F.32) Вероятность появления больших отклонений, подсчитан- подсчитанных по этому неравенству, уже не столь сильно отли- отличается от соответствующих результатов, полученных для нормального распределения. Применяя неравенство Чебышева для среднего значе- значения случайной величины, получаем: Р(|х-Н>^.)<1. F.33) Положив \п находим: ?1 'red2 ' Рассмотрим следующий пример: каково должно быть число анализов п для того, чтобы с вероятностью 0,95 выборочное среднее х отличалось от генерального сред- среднего [I не более чем на а/2. Здесь d = 0,5a: 1 _ о2 _ 1 а2~ @,5аJ ге ~0,25ге " По условиям задачи эта величина должна быть равна: 1 0,25и п — = 0,05, 1 = 80. 0,25-0,05 Следовательно, нужно сделать 80 определений для того, чтобы с вероятностью 0,95 можно было ожидать, что ошибка среднего пе превзойдет 0,5 а. Простой расчет показывает, что из генеральной совокупности, подчиняю- подчиняющейся нормальному распределению, достаточно было бы 51 НБЦАРАМВТРИЧБСКАЯ СТАТИСТИКА I <)Гр взять выборку с /2=16, чтобы получить такой же рог зультат. Приведенные примеры показывают, что свертывание информации о точности при помощи квадратичной ошибки становится не эффективным, если закон распределения остается неизвестным, и в качестве ключа для расши- расшифровки свернутой информации приходится пользоваться неравенством Чебышева. Выгоднее там, где это возможно, подвергнуть экспериментальный материал такой допол- дополнительной обработке (преобразование переменных, раз- разбиение на отдельные группы и т. д.), которая дала бы воз- возможность получить некоторое приближение к нормаль- нормальному распределению. Из этих примеров следует также, что нельзя сравни- сравнивать между собой точности двух аналитических методов, основываясь на величине их квадратичных ошибок, если не известны законы распределения для тех статистических ансамблей, к которым относятся эти ошибки. Может оказаться, что один из аналитических методов, имеющих большую ошибку, будет более приемлемым, чем второй, имеющий меньшую ошибку, если в первом случае выпол- выполняется нормальное распределение, а во втором нет. В некоторых аналитических методах, например в эмис- эмиссионном спектральном анализе, часто удается получить низкое значение суммарной квадратичной ошибки, поль- пользуясь различными искусственными приемами (смещение градуировочных графиков под влиянием третьих эле- элементов и пр.), но эти приемы иногда приводят к резкому нарушению нормального распределения, и метод теряет свою ценность, несмотря на низкое значение ошибки. Проверка гипотезы нормальности должна быть неизбежной составной частью любого исследования, связанного с раз- разработкой нового аналитического метода. Неравенство Чебышева можно написать следующим образом: P(\x-v\<d)>l-?n, F.34) где d и а2—некоторые заданные числа. Из этого неравеп- ства следует: вероятность того, что выборочное среднее отклонится от генерального среднего меньше чем на 13*
196 ОЦЕНКА РЕЗУЛЬТАТОВ АНАЛИЗА |ГЛ. VI произвольно заданную малую величину, стремится к еди- единице по мере возрастания объема выборки. Это—так назы- называемый закон больших чисел, играющий очень важную роль в теоретическом обосновании методов математиче- математической статистики. Закон больших чисел может быть сфор- сформулирован в виде более общего принципа, согласно кото- которому элемент неопределенности, связанный с действием большого числа случайных факторов, погашается при большом количестве наблюдений, и мы получаем резуль- результаты, почти не зависящие от случая. В практических приложениях этими соображениями общего характера надо пользоваться с большой осторож- осторожностью. Неравенство Чебышева применимо только до тех пор, пока генеральное среднее остается постоянным. В аналитической работе ряд факторов удается стабилизи- стабилизировать только на короткий промежуток времени. Если нам потребуется сделать очень большое число определе» ний, то на это понадобиться длительное время, в течение которого часть факторов из постоянных превратится в переменные—появятся новые источники ошибок, и мы вынуждены будем констатировать смещение генерального среднего. Серии анализов, сделанные с большим проме- промежутком времени, уже нельзя будет рассматривать как случайные выборки из генеральной совокупности с одним и тем же средним значением. Поэтому вопрос о плани- планировании эксперимента и выборе оптимального числа изме- измерений является весьма трудной задачей; к ней мы еще вернемся в дальнейшем. ГЛАВА VII ДИСПЕРСИОННЫЙ АНАЛИЗ § 1. Определение дисперсии, обусловленной действием одного фактора Идея метода и простейшие примеры Целью дисперсионного анализа*) является разложение суммарной дисперсии на две величины: дисперсию, обу- обусловленную техникой эксперимента (внутрилабораторная ошибка воспроизводимости), и дисперсию, вызванную действием изучаемого фактора. В случае многофакторного опыта при помощи дисперсионного анализа определяются дисперсии, обусловленные действием каждого фактора в отдельности и их взаимодействиями, и оценивается ста- статистическая значимость этих величин с учетом ошибки воспроизводимости. Рассмотрим следующий простейший пример. Допу- Допустим, что при разработке и изучении спектрального ана- анализа нам нужно оценить ошибку, обусловленную факто- факторами, медленно меняющимися во времени. Для решения этой задачи будем в течение длительного времени выпол- выполнять анализы одной и той же пробы, делая ежедневно по *) Разработка методов дисперсионного анализа в значитель- значительной степени связана с именем английского статистика Р. Фишера. Первые работы в этом направлении были выполнены на Рочэм- стедской экспериментальной агробиологической станции, основан- пой в 1920 г. Там впервые был создан специальный статистический отдел как постоянная часть исследовательского штата. Планиро- Планирование сложных комплексных опытов связано с именем Иэйтса, которым, начиная с 1932 г., была опубликована серия работ в этом направлении.
198 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VI] нескольку параллельных определений. Результаты ана- анализа, выраженные в значениях AS (или AS/у, если анализ ведется с учетом фактора контрастности), могут быть представлены так, как это показано в табл. 7.1. Таблица 7.1 Расположение материала при определении дисперсии, обусловленной действием одного фактора 1-я пла- пластинка 2-я пла- пластинка Пластинка с индексом m 1-е определе- определение . . . . 2-е определе- определение . . . . хп i-e определе- определение .... Итоги .... X, х, . . . . . . хтп Хщ В этой таблице в каждом столбце расположены резуль- результаты определений по спектрограммам, полученным на одной фотопластинке за короткий промежуток времени. При таком расположении материала рассеяние между строчками будет определяться ошибкой воспроизводи- воспроизводимости, а расстояние между столбцами—факторами, медлен- медленно меняющимися во времени*). Чтобы ОЦеНИТЬ Ошибку ВОСПРОИЗВОДИМОСТИ Своей. можно поступить следующим образом: подсчитать дис- дисперсию по каждому столбцу в отдельности, а затем найти среднее значение дисперсий. Этим приемом мы уже поль- пользовались в § 3 гл. III при определении ошибок воспроиз- воспроизводимости по текущим измерениям (см. формулу C.16)). *) Дисперсия, обусловленная факторами, медленно меняю- меняющимися во времени, также является суммарной величиной. Она может быть разложена на отдельные составляющие при помощи более сложных методов дисперсионного анализа, которые будут рассматриваться ниже. ОПРЕДЕЛЕНИЕ ДИСПЕРСИИ 19lJ Затем можно определить дисперсию средних значе- значений по столбцам xt по отношению к общему среднему по всей таблице хТ. Эта дисперсия, очевидно, равна сумме двух дисперсий: дисперсии от, обусловленной факторами, медленно меняющимися во времени, и дисперсии, обу- обусловленной ошибкой воспроизводимости, деленной на число параллельных определений (число строк в столбце): 2 &-* — m —1 G.1 Обычно' для упрощения вычислений паходят следующие вспомогательные суммы квадратов: сумму квадратов всех индивидуумов m n t=l j=l сумму квадратов итогов по столбцам, деленную на число индивидуумов в столбце 2 4 s»= t=i квадрат общего итога, деленный на общее число индивидуумов m B**)' mn Результаты подсчетов представляются так, как это показано в табл. 7.2. Прежде чем приступить к определению компонентов дисперсий, нужно убедиться в значимости значения С этим отношением связаны два значения числа сте- степеней свободы: для числителя т-1 и для знаменателя те (га - 1). Если F, > F0M ((яг - 1), (mn - яг)), то с 5%-ным
200 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VI] Т аблиц а 7.2 Представление результатов дисперсионного анализа Рассеяние Между столб- столбцами .... Между строч- строчками .... Сумма .... Суммы квадратов Л — ^з St Sa Si — ^з Число степе- степеней свободы т — 1 т (ге—1) /иге—1 Дисперсии „2 S2—S3 т — 1 „, s,-st "х m(re-l) Компоненты генеральных дисперсий ^ЕОСП риском *) сделать ошибку мы можем утверждать, что а2 > а2. Это может иметь место только тогда, когда а% > 0. В этом случае мы можем определить компоненты дисперсий, пользуясь соотношениями: G.2) Здесь нужно иметь ввиду, что s\ и s\ являются только приближенными оценками для компонентов дисперсий а%. Если значение F1 окажется незначимым, то восп мы вынуждены будем принять нуль-гипотезу а| = 0. Тогда мы можем считать, что все т групп наблюдений извлечены из одной и той же генеральной совокупности. В этом случае для дисперсии а^осп, обусловленной ошиб- ошибкой воспроизводимости, мы получим две оценки s2 и si, *) В дисперсионном анализе проверяют гипотезу а| > о2 при альтернативе а\=о\, поэтому пользуются односторонним крите- критерием, для которого составлена табл. 6 Приложения. Обычно зна~ чимость /"-значений в дисперсионном анализе проверяется для 5%-ного уровня значимости. Если /'-значения оказываются зна- значимыми для более низкого уровня значимости, то это всегда от- отмечается отдельно. В некоторых, правда очень редких случаях, приходится сталкиваться с тем, что s\ оказывается значимо меньше, чем s\. Это можно интерпретировать двояко: или как редкое событие, вероятность появления которого меньше 5%, или как результат грубого нарушения условий эксперимента. s и ОПРЕДЕЛЕНИЕ ДИСПЕРСИИ 201 которые можно объединить в сводную дисперсию: СТ2 r^j o2 восп — ° ' где s2 будет иметь число степеней свободы тп — 1. Рассмотрим в качестве примера применение диспер- дисперсионного анализа для оценки аВ0Сп и От при изучении рентгеноспектральлого метода определения гафния с фото- фотографической регистрацией излучения. В течение длитель- длительного времени было получено 20 пленок, на каждой из которых за короткий промежуток времени было экспо- экспонировано по три спектрограммы. Результаты измерений представлены в табл. 7.3. Для упрощения вычислений Таблица 7.3 • Результаты измерения значений AS при определении ат для рентгеноспектрального анализа 1-е определение 2-е определение 3-е определение Итого ...... 1-е определение 2-е определение 3-е определение Итого ... Номера пленок 1 2 —2 —2 —6 2 5 7 3 15 3 1 —1 1 1 4 —1 4 10 5 5 5 —5 5 6 2 7 0 9 7 —5 —7 —8 —20 8 3 —4 —2 —3 9 —4 —5 —5 —14 10 —4 —4 —7 —15 Номера пленок 11 —3 —5 —7 —15 12 0 — 2 0 —2 13 —4 —5 1 —8 14 5 5 6 16 15 —2 —2 —6 —10 16 7 5 7 19 17 8 5 4 17 18 3 0 —1 2 19 —7 ——О —3 —15 20 9 9 10 28 i = (-2J+(-2L-(-2J+...+92-f92 + 102 = _(-6+15+...+2-15+28)» S, ^-^ = 3,3.
202 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII в таблицу записывались значения xi, связанные с изме- измеряемой величиной ASj (разность почернения аналити- аналитических линий) соотношением хг = 100 (ASt — 0,65). В табл. 7.4. приведены результаты дисперсионного анализа. Таблица 7.4 Результаты дисперсионного анализа для материала, приведенного в табл. 7.3 Рассеяние Между столб- столбцами .... Между строч- строчками .... Сумма .... Сумма квадратов 1203,3—3,3= =1200 1448—1203,3= =244,7 1448—3,3= =1444,7 Число степе- степеней свободы 20 — 1 = 19 20C — 1) = =40 20-3—1=59 Дисперсии 1200 -Jg — 63,16 244'7 6 12 40 Ь' ~ Fi 63,16 6,12 =10,32 Значение Fv оказалось значимым с 0,1%-ным уров- уровнем значимости, поэтому, пользуясь формулойG.2), на- находим компоненты дисперсий аВОсп &г 1/6Д2 х Ю-2 = 2,47• 10, Применение дисперсионного анализа для определения ат обычно служит первым этапом исследования сложных аналитических процессов. После того как эта величина надежно установлена, обычно удается высказать те или иные гипотезы о причинах ее появления, и в некоторых случаях удается стабилизировать процесс анализа на- настолько, что эту величину оказывается возможным снизить до значения, близкого к нулю. Дисперсионный анализ в той простой форме, как он изложен выше, находит широкое применение не только при проведении длительных или сложных иссле- § определение дисперсии 203 дований, но также и в текущей повседневной анали- аналитической работе, когда нужно бывает оценить вклад, вносимый тем или иным фактором в общую ошибку анализа. Допустим, например, что под влиянием тех или иных причин технологического характера изменился состав силикатных проб, поступающих для анализа, и у анали- аналитика возникло подозрение в том, что ранее принятый метод растворения не дает достаточно воспроизводимых резуль- результатов. Для проверки этой гипотезы можно применить рас- рассмотренный выше метод дисперсионного анализа. Нужно будет взять несколько навесок одной и той же пробы и растворить их раздельно, а затем для каждой навески сделать несколько параллельных определений. Данные, полученные при таком небольшом исследовании, можно представить в виде дисперсионной таблицы, располагая по столбцам результаты анализа различных растворов, а по строчкам—результаты параллельных определений при одном и том же растворении. Тогда дисперсия между столб- столбцами будет обусловлена нестабильностью процесса рас- растворения, а дисперсия между строчками—ошибками, обусловленными всеми остальными аналитическими опе- операциями. В общем балансе ошибок большую роль играет ошибка, связанная с отбором пробы. Поэтому при разработке того или иного аналитического метода в программу работ всегда нужно включать исследование степени неоднород- неоднородности исходных объектов—сырья, поступающего на производство, металлической ванны и шлакового по- покрова в металлургических цехах и т. д. Для решения этой задачи отбираются пробы в различных местах изу- изучаемого объекта и анализируются путем нескольких параллельных определений. Результаты анализа проб, отобранных в разных местах, располагаются по столбцам, параллельные определения—по строкам. Тогда дисперсия между столбцами будет определяться неоднородностью объекта, а дисперсия между строчками—ошибками вос- воспроизводимости . Суммарная дисперсия, характеризующая ошибку в оп- определении вещества для неоднородных по своему составу
204 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VII объектов, очевидно, будет равна: L % W G.4) где Овосп и о|еод—дисперсии, обусловленные ошибкой воспроизводимости и неоднородностью объекта, аи — число параллельных определений, по которым сдается анализ. Из соотношения G.4) следует, что нет необходи- необходимости делать большое число параллельных определений, если ст|еод значительно больше, чем alocn- Пользуясь данными дисперсионного анализа, можно предложить рациональную систему отбора проб для неоднородных по своему составу объектов. Положим, что отбирается т проб одного объекта и каждая проба анализируется посредством п параллель- параллельных определений. Тогда суммарная дисперсия опреде- определится равенством 2 _ а восп "неод Г Введем обозначение к = анеод/Овосп, тогда соотношение G.5) может быть записано следующим образом: В табл. 7.5, заимствованной нами из [49], приведены численные значения выражения {nk-\-i)lmn, получен- полученные при различных значениях п, к и т. Таблица 7.5 Численные значения выражения (nk-\-i)lmn Общее число определений при опробо- опробовании объекта 4 з ft 4 Число образцов т 2 3 3 4 Число парал- параллельных оп- определений п образца 2 1 2 1 1/2 0, о, 0 о, 50 50 33 38 0 0 0 0 "неод'°восп 1 ,75 ,67 ,50 ,50 1 1 0 0 25 00 83 75 1 1 1 1 „ ,75 ,33 ,1V ,00 2 2 1 1 75 00 83 50 ОПРЕДЕЛЕНИЕ ДИСПЕРСИИ 205 Пользуясь этой таблицей, можно выбрать оптимальные условия опробования неоднородных объектов. Например, если анеод/0восп>1, то единичный анализ трех образцов дает лучшие результаты, чем двукратный анализ двух образ- образцов, и аналогично, единичный анализ четырех образцов дает лучшие результаты, чем двукратный анализ трех образцов, при этом в 1,5 раза уменьшается объем аналити- аналитической работы. При изучении неоднородности очень больших объектов часто возникает необходимость в многоступенчатой клас- классификации. Например, может возникнуть необходимость определить раздельно дисперсии, характеризующие неод- неоднородность между вагонами с продукцией, внутри ваго- вагонов—между контейнерами, и внутри контейнеров. В этом случае пользуются дисперсионным анализом с многосту- многоступенчатой классификацией, рецептура применения которого дана во втором параграфе этой главы. Дисперсионный анализ при неравных столбцах В практической работе часто приходится сравнивать между собой несколько серий анализов, полученных при неравном числе параллельных определений. В этом случае мы получаем дисперсионную таблицу с неравными столбцами. Формула для вычисления дисперсий здесь несколько изменяется. Обозначим через щ число инди- индивидуумов в i-M столбце и подсчитаем следующие вспо- вспомогательные суммы квадратов: сумму квадратов всех индивидуумов сумму квадратов итогов по столбцам, деленную на число индивидуумов в столбцах Та
206 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII квадрат общего итога, деленный на Общее число инди- индивидуумов т Результаты расчетов представляют так, как это пока- показано в табл. 7.6. Таблица 7.6 Представление результатов дисперсионного анализа для таблиц с неравными столбцами Рассеяние Между столбцами Между строчками Сумма Сумма квад- квадратов s,-s, Si-S, Число степеней свободы т — 1 т У щ—т i=l т i=i Дисперсии •1 Нетрудно видеть, что дисперсия, характеризующая рассеяние между строчками, определяется здесь так же, как в § 3 гл. III мы определяли дисперсию для ошибок воспроизводимости по текущим измерениям, состоящим из серий с неодинаковым числом параллельных опреде- определений. Компоненты дисперсий определяются приближен- приближенными равенствами: S2~ On ¦ ат щ G.6) II ОПРЕДЕЛЕНИЕ ДИСПЕРСИИ 207 Выражение G.6) переходит в G.2), когда все щ = п% т. е. когда все столбцы одинакового размера. В остальном дисперсионный анализ при неравных столбцах проводится так же, как кэто было показано выше. Условия, при которых можно применять дисперсионный анализ Дисперсионный анализ в той простейшей форме, как он был рассмотрен выше, сводится к тому, что мы определяем дисперсию, обусловленную рассеянием сред- средних результатов, полученных в разных сериях наблюде- наблюдений, и сравниваем эту дисперсию с дисперсией, обуслов ленной ошибкой воспроизводимости. Этот прием стати стического анализа является естественным обобщением рассмотренного в первом параграфе предыдущей главы способа сравнения двух средних при помощи i-критерия. Дисперсионный анализ, так же как и сравнение двух средних, можно производить только, когда выполняются два следующих условия: 1) серии измерений можно рассматривать как слу- случайные выборки из генеральных совокупностей, подчи- подчиняющихся нормальному распределению; 2) дисперсии, обусловленные ошибками воспроизво- воспроизводимости, для всех серий измерений должны быть одно- однородными. Нет необходимости предъявлять жесткие требования к проверке первого из этих условий, так как ^-критерий оказывается применимым и тогда, когда имеется неслу- неслучайное нарушение нормального распределения, важно только, чтобы мы не имели дело с каким-либо распределе- распределением, существенно отличным от нормального распреде- распределения. Иногда приходится сталкиваться с тем, что неко- некоторые средние значения резко отличаются от совокупности остальных средних значений. С такой ситуацией часто приходится встречаться, например, при изучении меж- межлабораторной ошибки воспроизводимости (см. рис. 22 на стр. 129). В этом случае приходится исключить из дисперсионного анализа сведения, полученные от лабо- лабораторий, результаты которых резко отличаются от
208 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII большинства остальных результатов, с тем, чтобы в даль- дальнейшем подвергнуть индивидуальному обследованию усло- условия работы в этих лабораториях. Исключение резко отли- отличающихся значений можно делать, пользуясь приемами, изложенными в § 3 предыдущей главы, рассматривая средние по лабораториям как различные значения одной и той же случайной величины и отбрасывая те из них, которые оказываются несовместимыми с остальными значениями. Второе из указанных выше условий должно выпол- выполняться достаточно строго: мы должны быть уверены в том, что рассматриваемые серии измерений являются выбор- выборками из генеральных совокупностей с одной и той же дисперсией, обусловленной ошибками воспроизводи- воспроизводимости. Если априори нет уверенности в этом, то следует проверить однородность дисперсий, пользуясь критериями Бартлета, Кохрена или хотя бы ^-критерием. Здесь надо обратить внимание на следующее обстоя- обстоятельство. Если критерий Бартлета, Кохрена или i^-кри- терий укажут на отсутствие неоднородности дисперсий, то это не исключает возможности того, что генеральные дисперсии несколько отличаются между собой—это раз- различие мы могли не уловить при статистической оценке выборочных дисперсий из-за ограниченности эксперимен- экспериментального материала. Поэтому при интерпретации результа- результатов дисперсионного анализа, несмотря на все меры пред- предосторожности, все же в принципе возможно, что значимое значение i^-отношения будет обусловлено не только раз- различием в генеральных средних, но также и различными генеральными дисперсиями, обусловленными ошибками воспроизводимости или их комбинацией*). В аналитической работе часто приходится сталкиваться с неоднородностью дисперсий, обусловленных ошибками воспроизводимости. В этом случае для применения дис- дисперсионного анализа приходится прибегать к искусствен- *) Это затруднение с интерпретацией результатов не являет- является специфической особенностью дисперсионного анализа. С анало- аналогичной ситуацией мы сталкиваемся и при сравнении двух средних с помощью г-критерия — там также приходится считаться с тем- что незначимость значения /? = s|/si не исключает возможности того, что а1Фа\. 1] ОПРЕДЕЛЕНИЕ ДИСПЕРСИИ 209 ным приемам. Рассмотрим несколько относящихся сюда примеров: 1) Однородность дисперсий может быть нарушена, если мы объединим в одну совокупность пробы, в которых концентрация определяемого компонента изменяется в очень широких пределах. В этом случае рекомендуется производить преобразование наблюдений с помощью функ- функции y=lgx. Относящиеся сюда примеры будут рассмотрены в § 3 этой главы (теоретическое обоснование этого метода обсуждалось на стр. 126). 2) Дисперсионный анализ нельзя применять непосред- непосредственно к данным радиоактивных и квантометрических из- измерений, так как там величина дисперсии определяется средним значением результатов измерений. В этом случае производят преобразование результатов наблюдений при помощи функции у = 2 \/ х и получают случайную перемен- переменную, для которой дисперсия уже не зависит от среднего значения (обоснование этого приема см. на стр. 125 и 126). 3) При сравнительном изучении нескольких аналити- аналитических методов может оказаться, что их точности суще- существенно различны. В этом случае можно поступить двояко: разбить материал на несколько групп так, чтобы в каждую из них объединить одинаково точные методы, или при составлении дисперсионной таблицы для менее точного ме- метода вписывать результаты, полученные с помощью не- нескольких параллельных определений, рассматривая их как исходные индивидуумы. Второй прием будет равноси- равносилен тому, что мы при данном планировании эксперимента повышаем точность определений одного из методов. Пример применения дисперсионного анализа при изучении методических ошибок В связи с разработкой методов спектрального анализа шлаков нужно было оценить величину методических ошибок химического анализа, так как результаты спек- спектрального анализа всегда сопоставляются с данными хими- химического анализа, который обычно рассматривается как арбитражный метод. Для решения этой задачи в хими- химической лаборатории было приготовлено несколько проб 14 в. В. Налимов
210 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII с надежно известным составом путем смешивания в раз- разных пропорциях стандартных образцов Уральского инсти- института металлов. Эти пробы были проанализированы с по- помощью нескольких параллельных определений. Сравне- Сравнение средних результатов анализа с паспортными данными при помощи i-критерия привело к противоречивым ре- результатам: для одной части проб расхождение оказалось */ О 10 20 30 40 са,% Рис. 29. Рассеяние точек, характеризующих абсолют- абсолютные методические ошибки химического анализа шла- шлаков при определении CaO, SiO2, FeO, MnO и MgO. незначимым, тогда как для другой части проб обнаружи- обнаружились бесспорно значимые расхождения, причем величины расхождений и их знаки оказались различными для раз- разных проб, проанализированных одним и тем же методом. Таким образом, оказалось невозможным охарактеризо- охарактеризовать правильность метода анализа различных по своему составу проб при помощи одного числа. В связи с этим была сделана попытка рассматривать методические ошибки химического анализа как случай- случайные величины. На рис. 29 показано рассеяние точек, ха- характеризующих абсолютные методические ошибки при химическом анализе шлака на компоненты: CaO, SiO3, FeO, MnO и MgO. По оси абсцисс здесь отложены содержа- содержания определяемого компонента в пробе, а по оси ординат вначения |Ас | = | с — сп|, где с—средний результат анализа ОПРЕДЕЛЕНИЕ ДИСПЕРСИИ 211 иробы, а еп—надежно установленное содержание веще- вещества в пробе, основанное на паспортных данных соответ- соответствующих стандартных образцов. На рис. 30 показано рассеяние точек для относительных методических оши- ошибок—здесь по оси абсцисс также отложена концентрация вещества, а по оси ординат абсолютная величина относи- относительной методической ошибки | у | = | Ас | /сп. Из сравнения to О 10 20 30 40 г Рис. 30. Рассеяние точек, характеризующих отно- относительные методические ошибки химического анализа шлаков при определении CaO, SiO2, FeO, MnO и MgO. характера рассеяния точек на этих двух рисунках сле- следует, что если мы выберем в качестве параметра шкалу концентраций, то по отношению к этому параметру величина у = Ас/си образует случайную последовательность для довольно широкого интервала концентраций, тогда как о случайной последовательности для величин Ас можно говорить только в узком интервале концентраций. Поэтому дальнейший статистический анализ было решено проводить, пользуясь значениями у = Ас/сп. Для каждого аналитического метода была составлена дисперсионная таблица, в которой по столбцам распола- располагались значения у, полученные для какой-нибудь одной пробы. При таком расположении материала дисперсия между столбцами определится относительными мето- методическими ошибками, обусловленными особенностью хи- химического и фазового состава проб, дисперсия между 14*
212 ДИСПЕРСИОННЫЙ ЛНАЛИ.Ч |i.i VII строчками определится относительными ошибками вос- воспроизводимости. Общее среднее по всей таблице а дает величину постоянной методической ошибки. Результаты дисперсионного анализа приведены в табл. 7. 7. Незначимые величины в этой таблице взяты в круглые скобки. Значимость постоянной методической ошибки а определялась, как обычно, с помощью ^-критерия. Для этого подсчитывалась дисперсия, характеризующая рас- рассеяния средних значений по столбцам, относительно общего среднего но всей таблице. При проведении дисперсионного анализа были объе- объединены пробы в широком интервале концентрации опре- определяемого компонента. Поэтому было обращено внимание на проверку гипотезы об однородности дисперсий, обуслов- обусловленных ошибками воспроизводимости. Из рассмотрения этой таблицы следует, что случайная методическая ошибка почти везде оказалась значимой. По величине она равна ошибке воспроизводимости, даже несколько больше ее. Постоянная методическая ошибка оказалась значимой только в трех случаях: при двух весовых методах определения SiO2 и при упрощенном методе анализа А12О3, когда применялось только одно- однократное удаление SiO2. Если учесть, что анализы, как правило, сдаются из нескольких параллельных определе- определении, то ясно, что в большинстве случаев суммарная вели- величина ошибки определяется случайной методической ошиб- ошибкой. Это обстоятельство дало возможность объяснить те отдельные большие расхождения, которые наблюдались нами при сопоставлении результатов химических ана- анализов, выполненных в разных лабораториях, в условиях, когда методы анализа несколько варьировались. Поль- Пользуясь данными, приведенными в табл. 7.7, легко сде- сделать сравнительную оценку двух методов. Например, при определении MgO в шлаке комплексоыетричеекгш метод имеет несомненные преимущества по сравнению с весо- весовым методом, несмотря на то, что последний обладает меньшей ошибкой воспроизводимости. Приведенный пример интересен тем, что он дает воз- возможность наглядно представить те величины, из которых складываются ошибки, определяющие правильность анализа. 1] ОШ'КДКЛКИИ]:) ДИОНЬРСИИ Таблица 7.7 Результаты дисперсионного анализа, полученные при научении .методических ошибок химического анализа шлаков [136] 1 о ™ Й c г — м,о Методы анализа Весовой фосфат- фосфатный Объемный ком- плексометрпчо- CKiiii Фотоколо рнметри- ческий .... [ ^ у [2 1,8—13 12,4—38 ') ',) J ,7 П -'. г: •¦- С. ^ '¦" ш 4 *2 6 9 10 9 to 3,2 5,2 2,8 5 A 3 (Hi S ч о ,7 .0) иг.ьп A (+0 (-1 (-0 ни. .5) ,0) ,8) SiO, SiO, Носовой, учет SiOj | в одном филь- трат(; без обра- обработки о.:адка HF 12,4—38,7 j G 10 1,0j 2,6 Весовой,учетSiO2 в трех фильт- фильтратах, орработ- ] : ! I ка осадка I1F . 12,4—38,7 ; 4 42! 1,0 j 1,6 ! —2,6 -2,0 MuO 11ерс,ул1,фатш)со- , ] рсбрянып . . . | 2,2—16,6 | 4 9 3,3 3,6 j (--0,9) Объемный щаве- щавелевокислый . . 22,2-44,8 -\!2O3 Весовой, фосфат- фосфатный, однократ- ное здаление SiO2 Весоиой, фосфат- ] ный, трехкрат- трехкратное удаление SiO2 2 I 7 0,8, 1,2 (-0,9) 2,1-5,4 6,4 | 8,6 1,5—5,4 J5.6 4,6 ( + 0,3) '¦'•'об.ц Объемный нодо- мстрическнй . . 3,3—28,3 7 I 3,0 '1('ci6.n Объемный бихро- ! матныи . . . 3,5-29,3 1,1 A,4) (,6) 1,6 ! (+0,2) рнмечание. В скобки взяты пезначпяие величины.
214 ДИСПЕРСИОННЫЙ АНАЛИЗ 1гл. VII § 2. Многоступенчатая классификация Двухступенчатая группировка При разработке и изучении новых аналитических методов часто приходится рассматривать многоступенча- многоступенчатый процесс и изучать воспроизводимость анализа, свя- связанную с каждым звеном этого процесса. Например, при Проба Лаборатория I Лаборатория П Анализ Параллельные определения за короткий промежуток бркмпни Рис. 31. Схема планирования экспе- эксперимента при изучении межлаборатор- межлабораторной ошибки воспроизводимости (двух- (двухступенчатая классификация). изучении межлабораторной воспроизводимости резуль- результатов анализа может представлять интерес изучение: 1) ошибки воспроизводимости, характеризующей рас- рассеяние результатов относительно среднего, полученного в одной лаборатории за короткий промежуток времени; 2) ошибки воспроизводимости, характеризующей рас- рассеяние результатов анализа относительно среднего зна- значения, полученного в одной лаборатории за длительный промежуток времени; 3) межлабораторной ошибки воспроизводимости, ха- характеризующей рассеяние результатов анализа относи- относительно среднего значения, полученного для всех лабо- лабораторий. В качестве примера на рис. 31 приведена схема такого эксперимента для того простейшего частного случая, когда каждое изучаемое звено состоит из Двух уровней (две лаборатории, в каждой из которых рассматривается два различных момента времени, в каждый выбранный момент времени делается по два параллельных определе- определения). Такая схема анализа является дальнейшим обобще- §2] МНОГОСТУПЕНЧАТАЯ КЛАССИФИКАЦИЯ нием первого примера, приведенного в предыдущем параграфе. Результаты анализов располагают в общем случае так, как это показано в табл. 7.8. Здесь мы имеем к разных Таблица 7.8 Расположение материала прн двухступенчатой группировке Первая сту- ступень: разные лаборатории 1 к Вторая сту- ступень: анали- анализы, выпол- выполненные в pas- личные мо- моменты вре- времени 1.1 1.2 l.m k.i к.2 km Параллельные определения, выполненные sa короткий промежуток времени ximixim2 ¦ ¦ хкихк1ъ • • xkmixhmt • ¦ .... xltn • ¦ * • ^lmn ¦ ¦ • %kin ¦ • ¦ "^hmn Итоги x m лабораторий, в каждой из которых анализ повторялся т раз через длительные интервалы времени, причем каждый анализ выполнялся из п паралле.льных определений. Исходя из условий планирования экспериментов, мы можем считать, что все наблюдения стохастически независимы.
216 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VIJ Далее мы предполагаем, что каждый из km анализов, состоящий из п параллельных определений, может рас- рассматриваться как случайная выборка из km генеральных совокупностей, приближенно подчиняющихся нормаль- нормальному распределению. Эти генеральные совокупности имеют, вообще говоря, разные генеральные средние, но одну и ту же генеральную дисперсию <т|Ост определяю- определяющуюся ошибками воспроизводимости данного аналити- аналитического метода. При этих предположениях достаточно общего характера мы можем провести дисперсионный анализ по схеме, приведенной в табл. 7.9, которая Таблица 7.9 Дисперсионный анализ для изучения межлабораторнон воспроизводимости по двухступенчатой классификации материала Рассеяние Между лабо- лабораториями . Внутри лабо- лаборатории, для различных интервалов времени Между парал- параллельными определе- определениями в пре- пределах не- небольшого интервала времени . . Сумма .... Сумма квадратов ft пт ^ (Xi — х J ¦ А 1=1 h m " ^ Z (xH—xi) i=l 3=1 k m n Z Z Z ^ i;'v \3> i=l j=l v=l k rrt n N1 V V (r r 12 Z Z Z ^i3V~xT^ i=l j=l v=l Число степеней свободы ft—1 ft(m—1) ftm (n— 1) kmn— 1 Ди- спер- сперсии s| 4 „2 Sl Компоненты генерал1,ных дисперсий 2 9 9 ^восп получена на основании соображений, аналогичных рас- рассмотренным в предыдущем параграфе. Например, если мы подсчитываем дисперсию, характеризующую рассея- рассеяние результатов межлабораторного анализа относительно §2J МНОГОСТУПЕНЧАТАЯ КЛАССИФИКАЦИЯ 2\1 их общего среднего, то ее можно интерпретировать следующим образом: лаб +—+¦ ft—1 G.7) так как каждый из межлабораторных анализов является сродним из m анализов, выполненных на второй ступени нашей классификации, и средним из run определений, характеризующих воспроизводимость анализа за короткие интервалы времени. Умножая правую и левую части написанного выше уравнения на тп, мы получаем те выражения, которые приведены в табл. 7.9 для компо- компонентов дисперсии на первой ступени. Пользуясь анало- аналогичными рассуждениями, мы получим выражение для определения компонентов дисперсии и на второй ступени нашей классификации. В формулах для сумм квадратов, приведенных в табл. 7.9, приняты следующие обозначения: хт — общее среднее по всей таблице, х; — среднее по лабораториям, х;у — среднее по каждому анализу. Дисперсия s\ представляет собой среднее km дисперсий, полученных для отдельных анализов, выполненных из п параллельных определений; она служит оценкой гене- генеральной дисперсии о"^осп. Дисперсия *'| характеризует рассеяние результатов во времени, она является оценкой генеральной дисперсии по%, + о^жп, где а| — дисперсия обусловленная факторами, медленно меняющимися во вре- времени. Наконец, s2 — дисперсия, характеризующая рассея- рассеяние между лабораториями, она является оценкой теоре- теорей * \ ^ тической дисперсии пто*аб + w\ , где а^аб — диспер- дисперсия, обусловленная нестандартностью условий работы в разных лабораториях. Для упрощения расчетов обычно сначала находят следующие вспомогательные суммы: сумму квадратов всех индивидуумов
218 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VII сумму квадратов итогов для каждого анализа, делен- деленную на число параллельных определений ft m г, _ t=lj=l ' п ' сумму квадратов итогов по вторым ступеням, делен- деленную на число индивидуумов в каждом блоке второй ступени ft m i=l з=1 пт квадрат общего итога, деленный на общее число индивидуумов ft m * птк Пользуясь ими, легко подсчитать нужные нам суммы квадратов: i=l 3=1 G.8) После подсчета сумм квадратов оценивают статисти- статистическую значимость дисперсионных отношений при помощи F-критерия. Дисперсии а| и с?аб могут быть отличны от нуля только в том случае, если статистически значимыми окажутся значения F — sl/sl и F = sl/sl- Численные зна- знаG.9) чения а^аб и о| находят решением уравнений: 5 2] МНОГОСТУПЕНЧАТАЯ КЛАССИФИКАЦИЯ 219 Если значение F = s\js\ оказывается незначимым, то для оценки а^осп находим среднее из s: к+т G.10) с числом степеней свободы km (п — 1) -\- к (т — 1) = — к(тп— 1). В этом случае о^аб может быть отлична от нуля, только когда значимым будет значение F = s\/s\. Рассмотрим следующий пример, заимствованный из [83], в котором приводятся результаты межлабораторного исследования стандартности широко употребляемого ра- раствора тиосульфата натрия. В работе принимало участие 11 лабораторий, в каждой из которых на протяжении недели выполнялось три испытания, каждое испытание состояло из трех параллельных определений. Результаты определений сведены в табл. 7.10. При составлении таблицы начало отсчета выбрано так, чтобы получить величины, удобные для дальнейших подсчетов, при этом часть цифр оказалась со знаком минус. Произведем рас- расчеты: S1 = 12 + 0 + I2 + (- IJ ... + ( - ЗJ + 0 = 438, S _ О 1539 B-4-4+ ...-6+0J 99 25 Результаты расчетов сведены в табл. 7.11. Пользуясь табл. 6 Приложения, находим, что значе- значение F = 3,7 превосходит табличное значение F для 1%-ного уровня значимости, а значение ^=1,8 превос- превосходит табличное значение F для 5%-ного уровня значи- значимости. Теперь мы можем вычислить A7,07—4,58) х 10~8 _
220 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VII Таблица 7.10 Изучение стандартности раствора тиосульфата натрия [83] *) Лаборатории № № Si № № № № 1 2 3 4 5 6 7 8 9 10 11 Дни 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 Параллельные определения 1 -1 -1 -3 2 1 -1 1 1 0 0 0 1 -1 0 3 -2 -1 1 -1 -1 -6 0 —5 2 0 3 5 1 3 2 j 3 0 -1 -4 1 2 j 3 1 1 0 0 0 -1 -1 0 1 -1 -2 1 3 -1 —В -3 0 1 2 1 5 1 0 -3 -1 -3 1 -2 1 -4 -1 0 1 1 0 1 0 0 —1 -2 1 0 з -1 -3 2 0 -1 -1 0 1 2 2 5 3 1 -3 —4 0 Итоги 2 -4 -4 -6 3 0 3 3 2 1 0 0 -3 -4 1 4 -6 -4 1 4 -2 -13 -4 —5 4 4 6 15 5 4 -4 -6 0 *) Табулированные величины = (наблюденная величина в г-экв/л—10,1240)-10*. 2] МНОГОСТУПЕНЧАТАЯ КЛАССИФИКАЦИЯ 221 Таблица 7.11 Результаты дисперсионного анализа материала, приведенного в табл. 7.10 Рассеяние Между лаборатория- лабораториями ..... . . Внутри лаборатории Между параллельны- параллельными определениями Сумма Число степе- степеней свободы 11-1=10 11C—1)=22 33C—1)=66 98 Суммы квад- квадратов S3-St=l70,7 ^2-^з=100,7 ^-^=165,3 Диспер- Дисперсии 17,07 4,58 2,50 F 3,7*) 1,8**) *) Значимо для 1%-ного уровня значимости. **) Значимо для 5%-ного уровня значимости. X Окончательно мы имеем: <7ВОсп ~ 1,58 х 10-*, от ~ 0,83 х Ю-4, слаб с* 1,17 Описанный здесь дисперсионный анализ с двухступен- двухступенчатой группировкой был предложен в США как стандарт- стандартный прием исследования при разработке новых аналити- аналитических методов [83]. Для каждого нового метода анализа такому исследованию подвергаются два образца, в кото- которых концентрация определяемых компонентов имеет край- крайние значения. Такой подход к изучению новых аналити- аналитических методов дает возможность получить максималь- максимальную информацию о степени стандартности получаемых результатов. Трехступенчатая группировка В некоторых случаях в аналитической практике оказы- оказывается желательным применение трехступенчатой клас- классификации материала при планировании эксперимента. В качестве примера на рис. 32 приведена схема такого анализа для простейшего случая, когда каждая изучаемая
222 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VII МНОГОСТУПЕНЧАТАЯ КЛАССИФИКАЦИЯ 223 Проба ступень состоит из двух уровней. В общем случае мате- материал располагается так, как это показано в табл. 7.12. Здесь каждый анализ делается из п параллельных опре- определений, первая ступень име- "~ ет t уровней, вторая к уров- I ней и третья т уровней. I При расчетах находят сле- следующие вспомогательные суммы: сумму квадратов всех индивидуумов ступень с ту пень\ ступень Параллельные определения Рис. 32. Схема планирования эксперимента при трехступен- трехступенчатой классификации. t ft m L Ь .2j 2, xqa g=l i=l 3=1 V=l сумму квадратов итогов для каждого анализа, делен- деленную на общее число параллельных определений 2 2 q-i i=l сумму квадратов итогов по третьим ступеням, делен- деленную на число индивидуумов в каждом блоке третьей ступени ! ft m 2 2 г. Q=l i=l О» = nm сумму квадратов итогов по вторым ступеням, делен- деленную на число индивидуумов в каждом блоке второй ступени t ft m 2 B 2 0=1 i=l 3=1 °4~" knm квадрат общего итога, деленный на общее число инди- индивидуумов t ft m B2.2W r> __ 9=1 i=l 3=1 5 ~" tkmn Таблица 7.12 Расположение материала при трехступенчатой группировке Пер- Первая сту- ступень 1 t Вто- Вторая сту- ступень 1.1 \.k l.\ I.k Третья ступень 1.1.1 1.1. in l.k.i i.k.m t.i.i t.i.m t.k.i t.k.m Параллельные определения xhiixuis- ¦ -я-ти xllm\x\vn& • ¦ •'"llmii a;lfflla;lfel2- ¦ -Xlktn ^lhmi^ihma- ¦ -х\ктп xtmxtU2-- -xlnn xtimixtirm- • .xt\mn xtkuxtk\2- ¦ -xlb.\n xlhmixtkm2- • •xtkmn Итоги -^lfti -S'lftm Xlvm Xthm
224 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VII Результаты расчетов могут быть представлены так, как это показано в табл. 7.13, где символами а\, а\ и а| обозначены дисперсии, обусловленные рассеянием между уровнями первой, второй и третьей ступеней соответ- соответственно. После того, как произведен подсчет сумм квад- квадратов, приступают к оценке статистической значимости значений F = s\/s\, F = sys\, F = s*/sf, и если эти значе- значения оказываются значимыми, то подсчитывают компо- компоненты дисперсий, пользуясь выражениями, приведенными в последней колонке табл. 7.13. Если одно из значений F окажется незначимым, то две оценки для одной диспер- дисперсии объединяют вместе и находят s2 так, как это было показано в предыдущем разделе. Таблица 7.13 Дисперсионный анализ при трехступенчатой классификации материала Рассеяние Сумма квадратов Число степеней свободы Дис- пер- персии Компоненты гене- генеральных дисперсий Между уровнями 1-й ступени . . Между уровнями 2-й ступени . . Между уровнями 3-й ступени . . Между параллель- параллельными определе- определениями Сумма t—1 t (k-l) tk{m—i) tkm{n~i) tkmn—1 ктпа\-\-тпа\-{- +паЦ-а2восп тпа\-\-па%-\- 2 па|+ст2восп В [88] дисперсионный анализ с трехступенчатой клас- классификацией был применен для изучения ыежлабораторной ошибки воспроизводимости при определении ацетила в ацетатцеллюлозе (х= 39,04%). Эксперимент планировался следующим образом: анализ выполнялся в восьми лабо- $ 2| МНОГОСТУПЕНЧАТАЯ КЛАССИФИКАЦИЯ 225 раториях A-я ступень), в каждой лаборатории анализы делались двумя аналитиками B-я ступень), каждый ана- аналитик делал анализы в три различных момента времени C-я ступень) и, наконец, каждый анализ выполнялся из двух параллельных определений. В результате этой ра- работы было установлено, что ошибка воспроизводимости, характеризующая разброс результатов параллельных опре- определений, и ошибка, вносимая фактором времени, имеют одинаковую величину, равную 0,068%. Ошибка, вносимая индивидуальностью аналитиков, оказалась незначимой, ошибка, вносимая особенностями работы разных лабо- лабораторий, равна 0,270%. В общем балансе ошибок эта по- последняя играет доминирующую роль. Область применения дисперсионного анализа с много- многоступенчатой классификацией не ограничивается изуче- изучением ошибок межлабораторной воспроизводимости. Этот метод планирования эксперимента может быть применен при решении самых разнообразных аналитических задач и в первую очередь при изучении вклада, вносимого и общую погрешность отдельными звеньями аналитиче- аналитического процесса. В эмиссионном спектральном анализе подобные исследования проводятся начиная с 1936 г. [58, 63, 65, 68, 77, 120, 121, 132, 135]. В этих работах оценивался вклад, вносимый ошибками фотометриро- вания, ошибками, связанными с микро- и макронеодно- макронеоднородностью фотопластинки, нестабильностью процессов возбуждения, проявления и т. д. Аналогичные работы проводились и при изучении классических методов ана- аналитической химии. Например, в Ц43] производилось изучение ошибок, вносимых отдельными звеньями комплек- сометрических и иодометрических методов определения сульфидов. Полученные при этом результаты представ- представлены в табл. 7.14 В этой таблице as—суммарная ошибка анализа; ае— ошибка выделения H2S; aa—ошибка, связанная с пог- поглощением H2S; a0—ошибка, связанная с окислением суль- сульфида иодом; at—ошибка титрования. Все исследования подобного рода можно проводить методом многоступенчатого дисперсионного анализа. По- Последним этапом при таком планировании эксперимента оудут уже не параллельные определения, как это было при 15 В. в. Налимов
226 ДИСПЕРСИОННОЙ АНАЛИЗ [гл. VII изучении межлабораторной воспроизводимости, а парал- параллельное выполнение последней из изучаемых операций, например титрования, фотометрирования и пр. Рассмот- Рассмотрим в качестве примера возможную схему планирования Таблица 7.14 Результаты определения ошибок, вносимых отдельными звеньями химического анализа сульфидов Квадратичная ошибка as Ое Оа Оо Ot Комплексо- метрический анализ, мг S 0,059 0,048 0,031 — 0,013 Иодометри- ческий анализ, мг S 0,083 0,048 0,061 0,027 0,041 эксперимента при спектрохимическом анализе силикат- силикатных проб с переводом их в водный раствор. Первой сту- ступенью таких исследований может быть изучение ошибки воспроизводимости, связанной с процессом растворения пробы. Для изучения этого звена аналитического процесса растворению будут подвергаться несколько навесок одной и той же пробы. Второй ступенью исследования может быть изучение влияния кислотности на результаты спек- спектрального анализа*). Для изучения этого фактора каждый из растворов, полученных на первой ступени, делят на несколько частей и в них изменяют рН раствора. Наконец, третья ступень может быть использована для изучения влияния фактора времени на результаты спектрального анализа. Влияние этого фактора нужно учитывать, так как растворы поступают для спектрального анализа не сразу после их приготовления, а через некоторый про- промежуток времени, в течение которого может измениться агрегатное состояние кремниевой кислоты, находящейся *) Кислотность раствора после выщелачивания может несколь- несколько варьировать. КОМПЛЕКСНЫЙ ОПЫТ 227 в растворе. Для изучения этого фактора растворы, полу- полученные на второй ступени исследования, делят на не- несколько частей и подвергают спектральному анализу через некоторые промежутки времени. Последним этапом исследования будет выполнение спектрального анализа аз нескольких параллельных определений. Подобного рода работы, связанные с изучением вклада, вносимого отдельными аналитическими операциями, до сих пор в большинстве случаев планируются из класси- классических традиционных приемов работы, без применения дисперсионного анализа с многоступенчатой классифика- классификацией. При классическом планировании эксперимента сначала ставится специальная серия опытов только для изучения ошибки воспроизводимости последнего этапа экспери- эксперимента. Затем проводятся серии опытов для изучения каждого фактора в отдельности. При таком планировании эксперимента значительно увеличивается количество экс- экспериментальной работы, так как здесь каждое определе- определение используется только для изучения какого-нибудь од- одного эффекта, тогда как при дисперсионном анализе с многоступенчатой классификацией используются все те определения, которые были сделаны на предыдущих этапах. § 3. Комплексный опыт Двухсторонняя классификация В предыдущем параграфе мы рассматривали такое планирование эксперимента, при котором одна и та же проба анализировалась в разных лабораториях и суммар- суммарная дисперсия разлагалась последовательно на отдель- отдельные составляющие. При такой постановке опыта мы полу- получали информацию относительно ошибок, относящихся к какой-то одной пробе. Значительно более полную инфор- информацию о данном аналитическом методе можно получить п комплексном методе исследования, когда несколько проб будут анализироваться в нескольких лабораториях. При таком планировании эксперимента результаты ана- анализа располагаются так, как это показано в табл. 7.15. 15*
228 ДИСПЕРСИОННЫЙ АНАЛИЗ ГЛ. VII В этой таблице к столбцов соответствуют различным по своему .составу пробам, т строчек соответствуют т раз- различным лабораториям или т различным вариантам одного и того же метода, выполненным в одной лаборатории при разработке какого-нибудь нового метода анализа веще- вещества. Каждая проба анализируется в каждой лаборатории Таблица 7.15 Расположение материала при двухсторонней классификации Л"° лабо- лаборатории 1 2 т Итоги № пробы 1 х111х112->:р11П xiUx212--x21n xmnxml2- 'Xmln .Х[ 2 x121xlS2-'X12n хтихти • • xmin х* ft *lftl*lftS--*lftn xihlxihi--xihn xmhixmhi--xmkn X'k Итоги Хг Xi Хщ (или каждым вариантом одного и того же метода) из п параллельных определений. Результаты всех этих опреде- определений заносятся в соответствующие клетки таблицы. При такой постановке эксперимента мы получим сле- следующие дисперсии: 1) дисперсию, характеризующую различие в химиче- химическом составе проб, 2) дисперсию, обусловленную особенностями работы различных лабораторий, 3) дисперсию, обусловленную эффектом взаимодей- взаимодействия особенностей условий работы лабораторий с особен- особенностями химического состава проб, 4) дисперсию, обусловленную внутрилабораторной ошибкой воспроизводимости. Первая из этих дисперсий не имеет для нас существен- существенного значения, так как она характеризует только разброс § 3] КОМПЛЕКСНЫЙ ОПЫТ 229 определяемой концентрации в пробах, выбранных для эксперимента, относительно их среднего значения. Опре- Определение этой величины производится попутно с другими вычислениями, необходимыми для определения осталь- остальных дисперсий. Существенно новым моментом в комплекс- комплексном дисперсионном анализе является определение дис- дисперсии, обусловленной эффектом взаимодействия. Эффект взаимодействия появляется каждый раз, когда одновре- одновременно варьируют два фактора и действие одного из них зависит от того уровня, на котором находится другой фактор. При классической постановке экспериментов эффект взаимодействия обнаружить не удается, так как там опыты ставятся так, чтобы варьировал только один фактор, а второй фактор стараются поддерживать на по- постоянном уровне. Физическая интерпретация эффекта взаимодействия связана с известными трудностями—она определяется условиями планирования и проведения экс- эксперимента и далеко не всегда может быть строго одно- однозначной. В простейшем случае, когда мы изучаем межла- межлабораторную воспроизводимость на различных по своему составу пробах, интерпретация эффекта взимодействия оказывается очень простой—здесь вполне естественно ожидать, что различие в приемах работы отдельных лабо- лабораторий сказывается различным образом на разных по своему составу пробах. При проведении комплексного дисперсионного анализа подсчитывают следующие вспомогательные суммы квад- квадратов: сумму квадратов итогов по каждой клетке, деленную на число параллельных определений т k n 2 2B -iivJ С J=i i=l V=l сумму квадратов итогов по каждой строчке, деленную на число анализов в каждой строчке т 2*? кп
230 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII сумму квадратов итогов по столбцам, деленную на число анализов в столбце квадрат суммы общего итога, деленный на общее число определений т k t=i ктп ктп сумму квадратов всех результатов т к п •у.-.22 ЪЛ,- j=i i=l v=l Подсчет дисперсий производится так, как это пока- показано в табл. 7.16. Сумма квадратов, относящаяся к эффекту взаимодействия между строками и столбцами, получена здесь путем вычитания из общей суммы квадратов ^5~^4 тРех ДРУГИХ сумм квадратов. При разложении суммарных дисперсий на отдельные компоненты введены следующие обозначения: а\ — диспер- дисперсия, обусловленная особенностями работы лабораторий, ог| — дисперсия, характеризующая различие в составе проб, а2 —дисперсия, обусловленная взаимодействием между условиями работы лабораторий и составом проб, or2 —дисперсия, обусловленная ошибками воспроизво- воспроизводимости внутри лабораторий. Здесь нужно еще раз напом- напомнить, что среднее квадратов отклонений является только оценкой для компонентов дисперсий. Разложение суммарных дисперсий на отдельные ком- компоненты можно делать так, как это показано в табл. 7. 16, в том случае, когда имеется большое число лабораторий, пользующихся данным аналитическим методом, и только небольшая часть из них.участвует в работе по изучению межлабораторной ошибки воспроизводимости. Если же данный аналитический метод используется в небольшом числе лабораторий и все эти лаборатории или большая КОМПЛЕКСНЫЙ ОПЫТ 231 Таблица 7.16 Дисперсионный анализ при двухсторонней классификации Рассеяние Между строч- строчками .... Между столб- столбцами .... Пнаимо дейст- действие .... Между парал- параллельными определени- определениями .... Сумма .... Сумма квад- квадратов Число сте- степеней сво- свободы /Л—1 ft—1 (m-l)X X(ft—1) mk (n—1) mnk—1 Диспер- Дисперсии «I 4 Компоненты генеральных дисперсий knO* +гаОвзаим+ ~г восп 2 га0в8аим+0восп 2 0ВОСП часть из них принимают участие в работе по изучению межлабораторной воспроизводимости, то для разложения дисперсий на отдельные компоненты пользуются форму- формулами: si ~ кп / т — 1 О^взаим ~г G.11) При достаточно большом т величина поправочного коэф- коэффициента т/(т—1) мало отличается от единицы и приме- применение его в этом случае несущественно изменяет резуль- результаты. Если при дисперсионном анализе изучаемыми факто- факторами являются произвольно выбранные уровни некоторой непрерывной переменной величины (например, темпера- температуры, давления и пр.), то разложение дисперсий на от-
232 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII дельные компоненты производят так, как это показано в табл. 7.16. При проведении дисперсионного анализа не всегда есть необходимость прибегать к разложению дисперсий на отдельные компоненты. В некоторых случаях, как это будет показано ниже на нескольких примерах, экспери- экспериментатор делает необходимые ему выводы, основываясь на дисперсионных отношениях. Проверка значимости дисперсионных отношений произ- производится так, как это делается обычно в дисперсионном анализе: прежде всего проверяют значимость значения F=s\/sl. Если это значение оказывается значимым, то это указывает на то, что сг!заим отлична от нуля. В этом случае проверяют значимость значений F=sl/sl и F= =^s\ls\. Значимость этих значений указывает на то, что а\ и а\ отличны от нуля. В том случае, когда значение F=s\ls\ оказывается незначимым, мы получим две оценки s\ и s\ для alocm которые нужно объединить вместе, складывая соответствующие суммы квадратов и деля их на общее число степеней свободы. Рассмотрим два примера применения комплексного дисперсионного анализа с двухступенчатой классифика- классификацией материала. Один пример будет относиться к изучению межлабораторной ошибки воспроизводимости, другой пример—к обработке материала, связанного с разработкой нового аналитического метода. Изучение межлабораторной ошибки воспроизводимо- воспроизводимости. В [110] производилось изучение межлабораторной ошибки воспроизводимости химического метода определе- определения углерода в катализаторе. В работе принимало уча- участие 11 лабораторий. Изучение ошибок производилось на четырех пробах с концентрациями углерода в преде- пределах 1,6—0,23%. Каждая проба анализировалась в каждой из лабораторий по три раза. Приемы работы в отдельных лабораториях могут очень сильно отличаться от приемов, принятых в большинстве других лабораторий. Поэтому прежде, чем приступить к проведению дисперсионного анализа, надо решить вопрос о том, являются ли совместимыми между собой средние результаты, полученные по каждой пробе в раз- разных лабораториях, а затем выяснить, являются ли одно- § 3J КОМПЛЕКСНЫЙ ОПЫТ 233 родными дисперсии, обусловленные внутрилабораторной воспроизводимостью. -Чтобы выяснить первый из этих вопросов, подсчиты- подсчитывают общее среднее для каждой пробы и затем находят дисперсию, характеризующую рассеяние отдельных сред- средних, полученных по разным лабораториям, относительно их общего среднего. Проверку совместимости всех средних можно делать с помощью r-критерия так, как это было показано в § 3 предыдущей главы. Если одно из средних значений очень резко отличается от всех остальных, то можно подсчитывать общее среднее, не включая этот ре- результат, и, пользуясь формулой F.16), определять сов- совместимость этого среднего с остальными средними, а затем совместимость остальных средних проверять при помощи r-критерия. При проверке совместимости средних значе- значений с помощью г- и ^-критериев рекомендуется пользо- пользоваться 1%-ным уровнем значимости. Для проверки гипотезы об однородности дисперсий подсчитывают для каждой лаборатории дисперсии, харак- характеризующие внутрилабораторные ошибки воспроизводи- воспроизводимости, и затем сравнивают между собой крайние по своему значению дисперсии с помощью F-критерйя или сопостав- сопоставляют между собой все дисперсии, пользуясь критерием Бартлета или критерием Кохрена. В рассматриваемом нами случае данные одной из 11 ла- лабораторий были отброшены из-за того, что в ней среднее по третьей пробе оказалось несовместимым с остальными средними (оно оказалось равным 0,43, тогда как общее среднее по всем лабораториям было равно 0,735). Данные по 'трем лабораториям были отброшены из-за того, что в двух из них дисперсии, характеризующие внутрилабо- раторную ошибку воспроизводимости, оказались значи- значительно больше, чем в других лабораториях, а в третьей,— наоборот, дисперсия оказалась значительно ниже. Под- Подробности вычислений, связанных с этим предварительным анализом материала, мы здесь не приводим, так как этот вопрос был достаточно подробно рассмотрен в предыдущей главе. Условия работы в лабораториях, данные которых были исключены из общего статистического анализа, затем обычно подвергаются индивидуальному изучению.
234 Дисперсионный анализ [гл. VII Результаты химического определения углерода в ката- катализаторе по оставшимся семи лабораториям приведены в табл. 7.17. Таблица 7.17 Результаты определения углерода в катализаторе [110] Лабо- рато- ратории В С D Е F Итог . . Среднее Итог. ¦ Среднее Итог . . Среднее Итог . . Среднее Итог. . Среднее Пробы 1 % 1,60 1,58 1,57 4,75 1,58 1,74 1,69 1,65 5,08 1,69 1,70 1,69 1,70 5,09 1,70 1,57 1,53 1,58 4,68 1,56 1,55 1,52 1,50 4,57 1,52 1 2 углерода в 0,78 0,75 0,71 2,24 0,75 0,75 0,76 0,81 2,32 0,77 0,76 0,81 0,78 2,35 0,78 0,70 0,67 0,70 2,07 0,69 0,60 0,67 0,64 1,91 0,64 1 * катализаторе 0,83 0,83 0,75 2,41 0,80 0,81 0,80 0,79 2,40 0,80 0,84 0,86 0,79 2,49 0,83 0,78 0,74 0,80 2,32 0,77 0,73 0,77 0,69 2,19 0,73 0,24 0,22 0,24 0,70 0,23 0,21 0,23 0,22 0,66 0,22 0,26 0,23 0,23 0,72 0,24 0,20 0,20 0,22 0,62 0,21 0,21 0,21 0,19 0,61 0,20 Итоги по строчкам 10,10 10,40 10,65 9,69 9,28 КОМПЛЕКСНЫЙ ОПЫТ 235 Продолжение табл. 7.17 Лабо- рато- ратории / J Итог . . Среднее Итог. . Среднее Итоги по столб- столбцам . . . 1 1, 1, 4, 1, 1, 1, 1, 4, 1, 33 1 % 66 62 64 92 64 62 64 60 86 62 95 Пробы 2 углерода в 0,74 0,75 0,76 2,25 0,75 0,72 0,74 0,75 2,21 0,74 15,35 3 катализаторе 0,70 0,80 0,76 2,26 0,75 0,81 0,70 0,81 2,32 0,77 •16,39 4 0,26 0,22 0,23 0,71 0,24 0,21 0,21 0,19 0,61 0,20 4,63 Итоги по строчкам 10,14 10,00 Подсчитаем нужные нам вспомогательные суммы квад- квадратов: _ 4,75а+2,242 + 2,412+0,702 + . .. +4,862+2,212+2,322+0,612 3 = 80,0686, 10,102+10,462+10,652+9,692+9,28г И0,142+10,002 3x4 S. = о X 7 о _ C3,95+15,35 + 16,39+4,63J ,„ Rfi q •V5 = 1,60*+ 1,58* +1,57*-|- ... + = 80,1150.
236 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII Результаты анализа сведены в табл. 7.18. Из этой таблицы следует, что значения F для дисперсионных отно- отношений во всех случаях оказались значимыми. Таблица 7.18 Результаты дисперсионного анализа, полученные при изучении межлабораторной ошибки воспроизводимости Рассеяние Между лаборато- лабораториями Между пробами Взаимодействие лабораторий и проб Внутрила бора- торная воспро- воспроизводимость . . Сумма Сумма квадратов S2—,У4=0,1053 6"s—^4=21,0509 iSi-j-iS^—"^8—"^2 — =0,0445 Sb—^=0,0464 S5—Si=21,2471 Число степеней свободы 6 3 18 56 83 Диспер- Дисперсии 0,0175 7,0170 0,002471 0,000828 F 7,08*) 2841*) 2,98*) *) Отношения значимы для 1%-ного уровня значимости. Пользуясь формулами G.11), были получены следую- следующие оценки для квадратичных ошибок: ошибка внутрилабораторной воспроизводимости огвосп~ ~0,029%; ошибка межлабораторной воспроизводимости ах ~ ~0,033%; ошибка, обусловленная эффектом взаимодействия, ,~ 0,022%. Суммарная ошибка, характеризующая точность еди- единичного определения при межлабораторном контроле различных по составу проб, равна + о* + о-1за„„ ~ 0,05%. КОМПЛЕКСНЫЙ ОПЫТ 237 Эта ошибка в два раза больше ошибки внутрилаборатор- внутрилабораторной воспроизводимости. Значительной по своей величине является ошибка, обусловленная эффектом взаимодей- взаимодействия. Это указывает на то, что разнообразие в условиях работы лабораторий различным образом сказывается на неодинаковых по своему составу пробах. Такое положе- положение затрудняет возможность согласования работы отдель- отдельных лабораторий. Использование дисперсионного анализа при разработ- разработке нового аналитического метода. В [102] дисперсионный анализ с двухсторонней классификацией применялся при сопоставлении спектрохимического и спектрофотометри- ческого методов анализа золы нефтяных продуктов. Эксперименты планировались так, что дисперсионный анализ применялся на разных этапах работы. Прежде всего нужно было выбрать оптимальные условия растворения проб для спектрофотометрического метода анализа. В табл. 7.19 приведены результаты опре- определения ванадия в четырех пробах при трех различных Таблица 7.19 Определение ванадия i золе [102] Варианты растворе- растворения I II III в нефтяной Пробы А \ В \ С ' D Содержание V2O5 в % 65,04 62,27 68,68 57,49 54,22 56,60 69,73 61,67 63,46 35,36 34,57 36,74 36,50 36,43 35,89 37,70 37,06 38,19 35,67 33,33 33,86 34,45 35,36 33,76 35,95 36,19 35,16 2,69 2,78 2,74 3,21 3,04 3,20 2,63 2,87 2,50 вариантах растворения пробы. В этой таблице объединены вместе пробы с концентрацией определяемого компо- компонента, отличающейся более чем на порядок, поэтому прежде всего нужно было проверить однородность
238 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VI1 дисперсий, обусловленных ошибками воспроизводимости. Применение /"-критерия показало, что дисперсии для проб с крайними значениями концентрации значимо раз- различаются. Для того чтобы не исключить пробу с крайне низкой концентрацией, здесь было применено логариф- логарифмическое преобразование переменной. В табл. 7.20 пред- представлены десятичные логарифмы результатов анализа. Таблица 7.20 Логарифмы результатов определения *Чо5 [Ю2] Варианты растворения I II III Пробы А 1,813 1,794 1,837 1,760 1,734 1,753 1,843 1,790 1,803 в 1,549 1,539 1,565 1,562 1,561 1,555 1,576 1,569 1,582 1,522 1,523 1,530 1,537 1,549 1,528 1,556 1,559 1,546 0,430 0,444 0,438 ,507 0,483 0,505 0,420 0,458 0,398 Применение /^-критерия показывает, что после лога- логарифмического преобразования дисперсии становятся однородными. В табл. 7.21 приведены результаты дис- дисперсионного анализа. Дисперсия, обусловленная раз- различием в способах растворения проб, оказалась незна- незначимой, но значимым оказался эффект взаимодействия. Это указывает на то, что три изучаемых метода рас- растворения не являются одинаково эффективными для всех проб. Непосредственное сопоставление материалов, приведенных в табл. 7.19, дает возможность предполо- предположить, что эффект взаимодействия обусловлен особен- особенностями поведения пробы А при 2-м методе растворения. Повторные подсчеты, проведенные после отбрасывания результатов анализа, выполненных по второму методу, показали незначимость эффекта взаимодействия. Таким образом, было признано, что второй метод растворения не § 3] КОМПЛЕКСНЫЙ ОПЫТ 239 Таблица 7.21 Результаты дисперсионного анализа для материала, помещенного в табл. 7.20 [102] Рассеяние По методам раство- растворения Между пробами . . Взаимодействие . . Воспроизводимость Сумма Сумма квадратов 0,00033755 9,71947844 0,01869223 0,00634267 9,74485089 Число степеней свободы 2 3 • 6 24 35 Дисперсии 0,00016878 3,23982615 0,00311537 0,00026428 F <1 высокое *] 11,78*) *) Значимо для 1%-ного уровня значимости. может быть пригодным при определении ванадия во всех типах образцов. Приведенный пример интересен тем, что он дает возможность наглядно продемонстрировать появление эффекта взаимодействия. Аналогичным образом дисперсионный анализ был при- применен при изучении трех вариантов растворения и при определении других компонентов в нефтяной золе. В за- зависимости от результатов анализа принималось то или иное решение, причем наличие значимых эффектов взаи- взаимодействия заставляло проводить дополнительные иссле- исследования того метода растворения, который вызывал сомнение. Дисперсионный анализ здесь применялся как вспомогательный прием для выбора оптимальных условий растворения. В табл. 7.22 приведены результаты определения ва- иадия в четырех пробах золы, выполненные спектрогра- спектрографическим и спектрофотометрическим методами. Приме- Применение /'-критерия здесь также указывает на неоднород- неоднородность дисперсий, поэтому было применено логарифмиче- логарифмическое преобразование. Результаты дисперсионного анализа представлены в табл. 7.23. Здесь также значимой оказалась дисперсия, обусловленная эффектом взаимодействия. По- Последнее обстоятельство указывает на то, что расхождение
240 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII Таблица 7.22 Результаты спектрографического и спектрофотометрического определения ванадия в нефтяных золах [102] Пробы А в содержание V2O5 в Среднее ... с % спектрографически! 77 80 83 76 65 66 68 76 62 72 0 ,0 ,5 9 Q ,?, ,8 ,0 ,4 ,9 метод 33 31 34 34 37 33 35 33 35 34 0 7 3 3 7 3 5 0 ,6 ,з 50 48 46 4? 39 37 36 38 33 41 ,9 ,2 ,0 ,0 ,6 ,7 ,3 ,9 ,7 ,5 : 3 3 3 3 3 3 4 4 4 3 D ,65 ,80 ,83 !«з ,57 ,67 ,05 ,00 ,18 ,84 А ( 69, 61, 61, 60 61 59 72 63 60 63 Пробы в с содержание V2O5 в °/ D 0 спектрофотометр иче- 7 7 9 3 0 5 0 5 9 4 скии 37 39 34 37 38 35 39 40 38 38 7 2 6 7 2 7 7 ,7 ,5 ,0 метод 36 36 35 35 34 35 35 37 32 35 2 0 6 ь 2 2 b ,6 ,0 ,3 2 2 3 2 2 2 2 2 2 2 ,63 ,50 ,08 ,87 ,58 ,08 ,78 ,96 ,И» ,64 Таблица 7.23 Результаты дисперсионного анализа для материала, приведенного в табл. 7.22 *) [102] Рассеяние Между методами Между пробами Взаимодействие Воспроизводимость Сумма Сумма квадратов 0,068400 18,831009 0,099607 0,089401 19,088417 Число степеней свободы 1 3 3 64 71 Дисперсии 0,068400 6,277003 0,033202 0,001396 F 2,060**) высокое ***] 23,784***) *) Дисперсионный анализ проведен после логарифмического преобразования. **) Незначимо для 5%-ного уровня значимости. Если дис- дисперсию, обусловленную различием между методами, сравнивать с дисперсией, обусловленной воспроизводимостью, то мы полу- получим значение ^"=48,997, значимое для уровня значимости р<0,1%. ***) Значимо для уровня значимости р<01% § 3] КОМПЛЕКСНЫЙ ОПЫТ 241 в результатах анализа, выполненных двумя методами, зависит от состава проб. Смысл дисперсионного анализа сводился к тому, что он позволил с высокой степенью надежности установить этот факт, весьма важный для сравнительной оценки двух методов. Дополнительное исследование средних значений с помощью ^-критерия показало, что средние, полученные для двух разных ме- методов, отличаются значимо для 5%-ного уровня значи- значимости. Дисперсионный анализ в двух последних примерах применялся как некоторый промежуточный этап, являю- являющийся составной частью большой программы исследова- исследования. Результатами дисперсионного анализа здесь опреде- определяется дальнейшее планирование эксперимента. Если, например, различие в методах анализа (или в вариантах анализа одного и того же метода) окажется значимым, а эффект взаимодействия незначимым, то дальнейшее сопоставление этих методов можно производить, пользуясь только одним стандартным образцом или эталоном с надеж- надежно установленным содержанием вещества. Если же эффект взаимодействия оказывается значимым, как это было в предыдущем примере, то окончательное сопоставление двух методов, с точки зрения правильности получаемых результатов, можно делать, только пользуясь большим числом стандартных образцов. Изучение эффекта взаимодействия должно быть состав- составной частью программы исследования при разработке каждого нового аналитического метода. Даже после того, как новый метод бывает внедрен в повседневную работу, его результаты иногда приходится сопоставлять с ранее применявшимися классическими методами, которые обыч- обычно рассматриваются как арбитражные. При таком сопо- сопоставлении результатов анализа очень важно знать харак- характер методических ошибок. Если результаты дисперсионного анализа покажут, что имеет место значимый эффект взаимодействия, то в этом случае важно бывает установить, который из двух мето- методов—новый или ранее применявшийся—является ответ- ответственным за эффект взаимодействия. Для решения этой задачи можно воспользоваться приемом, рассмотренным в конце § 1 этой главы. 18 ¦. В. Валжмвв
242 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VII Трехсторонняя классификация Во многих случаях аналитической практики может представлять интерес трехсторонняя классификация. До- Допустим, что мы планируем проведение эксперимента, варьируя тремя величинами A, W и Т, которые могут принимать соответственно a, w и t различных значений. Положим для простоты, что для каждой комбинации этих значений делается всего по одному определению. Результаты экспериментов можно будет расположить так, как это показано на табл. 7.24. Эта таблица имеет три «входа»—она представляет собой как бы трехмерную таблицу, свернутую на плоскость. Таблица 7.24 Расположение материала при трехсторонней классификации Ах Аа ww xm xlwl xall xawi Z11S xiwi xal2 xawi xiwt *ait xawt Результаты дисперсионного анализа при трехсторон- трехсторонней классификации могут быть представлены так, как это показано на табл. 7.25. комплексный опыт 243 Таблица 7.25 Дисперсионный анализ при трехсторонней классификации Рассеяние Число степеней свободы Дис- пер- персии Компоненты генераль- генеральных дисперсий По фактору А По фактору W . По фактору Т . . Взаимодействие AXW . . . Взаимодействие WXT . . . . Взаимодействие ТХА . . . . Воспроизводи- Воспроизводимость .... Сумма .... W — 1 t - 1 (а - 1) (w - 1) (w - 1) (I - 1) («-1) (а~\) (а - 1) (t - awl — 1 -1) si 4 s? + • + r,1 „«2 , „ ta WA .2 'A T « 2 2 WT + 0 ¦2 ,„2 Здесь мы имеем три дисперсии ад, a\v и а^, каждая из которых характеризует ту изменчивость, которая имела бы место, если бы варьировал только один фактор, обозначенный в нижнем индексе дисперсии, а два других фактора оставались постоянными. Далее имеется три дисперсии oiw, air и Gwt> характеризующие три взаимодействия первого порядка: А X W, А X Т " WxT. Взаимодействие Ах W служит мерой того, насколько влияние величины А зависит от величины W и наоборот. Аналогично интерпретируются и остальные взаимодействия. Наконец, в табл. 7.25 имеется о-Восп — Дисперсия, характеризующая ошибку воспроизводимости. 16*
244 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII При трехсторонней классификации может еще иметь место эффект взаимодействия второго порядка, определяю- определяющий зависимость эффектов взаимодействия А X W от уровня Т, W X Т от уровня Аи Т X А от уровня W. Обычно эффект взаимодействия второго порядка от- отсутствует или оказывается очень малым. Поэтому, если для этого нет каких-либо специальных оснований, эффект взаимодействия второго порядка отдельно не вычис- вычисляется, и если он все же существует, то входит как часть в ошибку воспроизводимости. При подсчетах табл. 7,24 с тремя входами разбивают на три таблицы с двумя входами так, как это сделано при построении трех таблиц, помещенных под общим номером 7.26. Здесь первая таблица получена суммиро- суммированием результатов анализа по w при каждом значении Таблица 7.26 Построение трех таблиц с двумя входами при трехсторонней классификации материала л, А, Аа ¦аг.1 ¦^12 ^22 Л а» ¦ill Л at КОМПЛЕКСНЫЙ ОПЫТ Продолжение табл. 7.26 245 Ai zu Z2i Zwi Zl2 Z22 Zwt Aa zla Zia Zwa А и Т, вторая таблица—сз^ммированием по а при всех значениях W и Т и третья таблица—суммированием по t при всех значениях А и W. Подсчитаем следующие вспомогательные суммы квадратов по первой из этих трех таблиц: сумму квадратов индивидуумов, деленную на количе- количество первоначальных индивидуумов, просуммированных при построении этой таблицы г. о, = 1 3=1 1=1 сумму квадратов итогов по строчкам, деленную на первоначальное число индивидуумов, просуммированных для получения этих итогов (S il wt сумму квадратов итогов по столбцам, деленную на первоначальное число индивидуумов, просуммированных для получения этих итогов
246 ДИСПЕРСИОННЫЙ АНАЛИР [ГЛ. VII квадрат общего итога, деленный на общее число инди- индивидуумов (S 2 *0" 4 wat Эти вспомогательные суммы подсчитываются так же, как соответствующие суммы в дисперсионном анализе с двухсторонней классификацией, с той только разницей, что знаменатель в каждом выражении умножен на число и;, по которому производилось суммирование индивидуумов при переходе от таблицы с тремя входами к данной таб- таблице с двумя входами. Пользуясь этими вспомогательными суммами квадра- квадратов, составляют табл. 7.27 для подсчета дисперсий. В этой Таблица 7.27 Дисперсионный анализ для первой таблицы с двумя входами Рассеяние По фактору Л .... По фактору Т . . . . Взаимодействие А х Т Сумма Сумма квадратов S2 — St s3-st Si-\- St — S2 — Si-St Число степеней свободы a -1 t- 1 (a - 1) (« - 1) at — 1 Диспер- Дисперсии «? si s\ таблице сумму квадратов, характеризующую изменчи- изменчивость, обусловленную эффектом взаимодействия, полу- получают путем вычитания из общей суммы S1—St двух дру- других сумм. От соответствующей таблицы для двухсторонней классификации эта таблица отличается только тем, что здесь нет суммы квадратов для оценки воспроизводимости. Аналогичным образом, пользуясь двумя другими таб- таблицами с двумя входами, мы получим нужные нам суммы квадратов для подсчета дисперсий, обусловленных измен- изменчивостью по фактору W и изменчивостью, обусловленной двумя другими эффектами взаимодействий. I 31 комплексный опыт 247 Наконец, подсчитываем общую вспомогательную сумму квадратов для всех индивидуумов в первоначальной таблице с тремя входами a w t sT-% 2 v 2 2 v=l 3=1 и находим разность для суммарной дисперсии по всей таблице. Вычитая из общей суммы St—Si все остальные шесть сумм квад- квадратов, полученных нами для определения дисперсий s*, «в> S5' S4' S3» S2> находим сумму квадратов для оценки дисперсии sj, обусловленной ошибкой воспроизводи- воспроизводимости. • Приведенный здесь прием вычисления легко обобщить на тот случай, когда каждый анализ xiv;- делается из двух параллельных определений. В этом случае, пользуясь известными нам приемами, находим сумму квадратов для дисперсии, обусловленной ошибкой воспроизводимости. Вычитая из общей суммы квадратов St—?4 все семь дру- других сумм квадратов, получим сумму квадратов для опре- определения дисперсии, обусловленной взаимодействием вто- второго порядка. Статистическая оценка дисперсионных отношений здесь становится значительно более сложной, и она может широко варьировать в зависимости от тех гипотез, кото- которые выдвигаются экспериментатором при планировании эксперимента. Рассмотрим применение дисперсионного анализа с трех- трехсторонней классификацией при изучении однородности заготовок, предназначенных для изготовления спектраль- спектральных эталонов из сплавов цинка, по материалам, изложен- изложенным в [154]. При изучении однородности заготовок эксперимента- экспериментатора могут интересовать два фактора: неоднородность по сечению заготовки, неоднородность по высоте заготовки и, конечно, эффект взаимодействия этих факторов, кото- который дает возможность оценить степень изменения одного из них в зависимости от изменения другого. При такой
248 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VI] постановке вопроса казалось бы естественным применение двухсторонней классификации при планировании экспе- эксперимента. Но здесь возникают серьезные трудности, свя- связанные с тем, что, флуктуируют во времени результаты квантометрнческого анализа, с помощью которого только и можно проделать эту громадную аналитическую работу. Если для оценки ошибки воспроизводимости каждый анализ выполнять двумя параллельными определениями, следующими непосредственно одно за другим, то при обработке материала мы определим только ту ошибку воспроизводимости, которая характеризует рассеяние ре- результатов относительно среднего, полученного за короткий промежуток времени. Дисперсия, обусловленная факто- факторами, медленно меняющимися во времени, при таком пла- планировании эксперимента войдет у нас как составная часть в дисперсию, обусловленную эффектом взаимодействия, так как эта последняя величина определяется той суммой квадратов, которая получается путем вычитания из общей суммы квадратов всех остальных сумм квадратов (см. табл. 7.16). Можно, конечно, эксперимент запланировать иначе— так, чтобы параллельные определения производить через некоторые значительные интервалы времени. Тогда ошибка воспроизводимости будет отражать и действие факторов, медленно меняющихся во времени. Но здесь возникнет новое осложнение: мы будем иметь очень большое значение для дисперсии, обусловленной ошибкой воспроизводимости, и следовательно, у нас окажутся значимыми интересующие нас эффекты только тогда, когда мы будем иметь дело с очень большой неоднородно- неоднородностью. Значительно выгоднее воспользоваться трехсто- трехсторонней классификацией, рассматривая флуктуацию резуль- результатов анализа во времени как некоторый самостоятельный фактор. При таком планировании эксперимента мы из общей суммы квадратов вычтем еще сумму квадратов, обусловленную флуктуацией результатов анализа во времени, и для дисперсии, характеризующей ошибку воспроизводимости, получим небольшую величину, ко- которая будет определяться только факторами, быстро меняющимися во времени. Этот прием повысит точность нашего анализа—мы сможем обнаружить значительно § 3J КОМПЛЕКСНЫЙ ОПЫТ 249 меньшую неоднородность, чем при планировании экспе- эксперимента при двухсторонней классификации. Учитывая эти соображения, в [154] была принята трех- трехсторонняя классификация материала при планировании эксперимента. Изучение неоднородности производилось на шести различных по своему составу плавках металла, предназначенного для изготовления эталонов. Для каждой плавки было получено по 100 прутков, из них пять прут- прутков отбиралось для изучения неоднородности. Эти пять Рис. 33. Участки темплета, в которых производился анализ при изучении по- поперечной неоднородности заготовок для изготовления эталонов [154]. прутков отбирались так, чтобы они соответствовали раз- различным моментам разливки плавки. Из каждого прутка вырезалось по одному темплету, на котором анализ про- производился в 11 различных участках, расположенных так, как это показано на рис. 33. Каждый анализ производился пз одного определения, затем поверхность темплета про- простругивалась и определения повторялись. При таком планировании эксперимента параллельные определения оказывались разделенными во времени; это давало воз- возможность оценить эффект, обусловленный факторами, мед- медленно меняющимися во времени. Дисперсионный анализ проводился отдельно по ка- каждой плавке для каждого из следующих 11 элементов: Mg, Pb, Sn, Cd, Fe, Si, Mn, Ni, Cr, Си, А1. Исходный якспериментальный материал располагался так, как это
250 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VII показано в табл. 7.28 для одного из элементов. В общей сложности было составлено 66 таких таблиц. Таблица 7.28 Расположение материала при изучении ликвации [154] Участки на тем- плете А=1 А=1 А=20 А-ЪО А=85 1 2 3 4 Г» 7 8 9 10 И 0,076 0 0,071 0, 0, 0, 0,071 070 0 067 0 060 0 065 0 067 0 071 066 0 068 0 ,067 0,066 ,065 ,066 0 ,0590 0,065 0 ,067 0 ,067 0,067 ,063 0 ,068 Г 0690 068 0 ,071 ,068 ,071 ,060 0 ,066 0 ,068 0 ,071 ,0690 ,066 0,062 ,066 0,066 0 ,060 0 ,065 0 ,066 0 0,067 0 ,067 0 070 0,065 0 068 0,068 0 ,073 0,070 0 '" ,068 0 ,066 0 069 0 ,068 0 ,0690,067 065 0,061 ,070 0 ,070 0 ,065 0 ,067 0 ,067 0 1,064 ,073 0 ,075 0 ,069 0 ,068 0 ,065 0 ,068 0 ,069 0 ,073 0 0,068 0 0,072 0 ,061 ,069 0 ,0690 ,072 0 ,063 0 ,0690 ,0690 ,063 0 ,0690 ,067 0 ,068 0 0,060 0 ,066 0 ,065 0 ,082 0 ,063 0 ,066 0 ,066 0 070 0 ,066 ,068 0 ,068 0 ,058 0 ,064 ,070 0 0690 ,067 0690 ,067 ,069 0,064 ,063 ,064 ,055 0,067 ,065 ,064 0,064 ,068 0,069 *) Участок № 5 отбрасывается. Анализы, соответствующие положению точки на тем- плете под № 5, отбрасывались, так как они оказались несовместимыми с остальными анализами. Однородность дисперсий не проверялась, так как, исходя из условий планирования эксперимента, не было оснований сомне- сомневаться в этом. Подсчет дисперсий производился так, как это пока- показано в табл. 7.29. Здесь априори можно было ожидать появления только одного эффекта взаимодействия, свя- связанного с двумя главными факторами: ликвацией по длине и по сечению. Что касается третьего фактора— эффекта, обусловленного нестабильностью анализов во вре- времени, то здесь заранее можно было предвидеть, что он не даст значимого взаимодействия с другими двумя фак- факторами. Поэтому при обработке материала вычисляли четыре суммы квадратов, соответствующие трем главным эффектам и одному эффекту взаимодействия, а затем эти з 3] КОМПЛЕКСНЫЙ ОПЫТ 251 суммы вычитались из общей суммы квадратов, и таким образом находилась сумма квадратов для оценки ошибки воспроизводимости. Таблица 7.29 Дисперсионный анализ при изучении неоднородности материала по данным табл. 7.28 [154] Рассеяние Ликвация по высото Ликвация по сечению Эффект времени .... Взаимодействие двух первых факторов . . Воспроизводимость . . Число степеней своОоды 4 9 1 36 49 Диспер- Дисперсии •г 4 При проведении дисперсионного анализа проверя- проверялись следующие нуль-гипотезы: 1) Ликвация по высоте отсутствует. Для проверки этой гипотезы находилось отношение Гипотеза отбрасывалась, если Ft > FUAb(i, 49). 2) Ликвация по сечению отсутствует. Находилось отношение El Sl Гипотеза отбрасывалась, еслп F2 > F0M(9, 49). 3) Эффект, обусловленный факторами, медленно меня- меняющимися во времени, отсутствует. Подсчитывали и отбрасывали гипотезу, если Ft >FOtOi(l, 49).
252 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VII § 4| ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 253 В га « В о се се В О о в в о в ш а g п о а ш в в ш и g в в tr к в К в- в I S 04 9 о •а о о 6" t х ю о о" CD СЭ «^ CD СО ,.00 г CSI о2 ой о о *8 СО 8 о о" о о о о" о о" ОсЗ X О "см х о оо Оо ) СО v 00 8 X ю о^. О5 Ю о о о о" ю о оо ю см о S ю оо CD CM тч X СМ Т. °чо. X О5 О00 X со со •^ч О О О о о" ; о х о о о° о" о" о о о" о о" CD -^ч СМ -^ч 00 v "^ X Г- X ю 00 СМ Г" X Ю НО v so & о о as Сб ф 05 о, СО о 03 н о S И ft СО о Is СО о 8 5 СО о Й 8 1 со «о 1 о л н о i CO aj И & СО о в и f н се о и о я 3 И О ей CD И о « Я :|3 «1 - и gi о ш со В 5 ^Э^ се S Я 2 в IS со 6" к се «8 в is О1 се I I si О» 4) Эффект взаимодействия отсутствует. Находили от- отношение Л-if н отбрасывали гипотезу, если / > i7OlO3C6, 49). Результаты дисперсионного анализа по всей работе в целом приведены в табл. 7.30. Последний этап этой работы, который мы здесь рас- рассматривать не будем, заключался в выборе такого сочета- сочетания отдельных зон плавки, который позволил бы полу- получить достаточно однородные эталоны. Изучение ликвации не является чисто аналитической задачей. Анализ вещества здесь оказывается только составной частью обширной программы работы по приго- приготовлению эталонов. На рассмотрении этого примера мы остановились столь подробно с тем, чтобы показать эффек- эффективность планирования экспериментов с помощью дис- дисперсионного анализа в тех случаях, когда анализ вещества является только завершающим этапом в выполнении сложных исследований технологического характера. Подоб- Подобное планирование эксперимента может быть рекомендо- рекомендовано во всех тех случаях, когда изучается два каких-то эффекта, а в качестве третьего эффекта рассматривается процесс анализа вещества, при помощи которого оцени- оцениваются результаты двух первых эффектов. С постановкой задач такого рода постоянно приходится сталкиваться как в заводских лабораториях, так и в лабораториях науч!но-исследовательских институтов. § 4. Планирование эксперимента по методу латинского квадрата Во многих случаях, особенно в исследованиях техно- технологического характера, часто приходится сталкиваться с необходимостью проведения экспериментов на неодно- неоднородном материале. Если при этом можно априори пред- предположить, что два изучаемых фактора не могут дать эффекта взаимодействия или если оценка эффекта взаимо- взаимодействия не представляет существенного интереса, то экс- эксперимент можно планировать, пользуясь так называемым методом латинского квадрата.
254 ДИСПЕРСИОННЫЙ АНАЛИЗ [гл. VII Допустим, что мы имеем четыре партии материала А, В, С, D, и нам нужно изучить действие двух факто- факторов Т и W. В соответствии с числом партий материала будем изучать действие каждого фактора на четырех различных уровнях. Расположим материал так, как это показано в табл. 7.31, которая представляет собой квадрат с одина- одинаковым числом строк и столбцов. Таблица 7.31 Расположение материала при планиро- планировании эксперимента по методу латин- латинского квадрата*) w2 w3 wt Tl A В С D В С D A Та С D A В n D A В С *) Партии материала обозначаются латинскими буквами—отсюда название: латинский квадрат. При таком расположении материала, называемом латинским квадратом, каждая партия попадает по одному разу на каждую строчку и на каждый столбец. По- Поэтому естественно, что эффекты по строчкам и столбцам не будут зависеть от неоднородности материала. Подсчитаем следующие вспомогательные суммы ква- квадратов: St—сумму квадратов результатов всех наблюдений, S2—сумму квадратов итогов по каждой строчке, делен- деленную на число индивидуумов в строчке, S3—то же по столбцам iS4—то же по партиям, iS5—квадрат общего итога, деленный на общее число индивидуумов. Разбиение полной суммы квадратов производится так, как показано в табл. 7.32, где п—размер квадрата. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА 255 Таблица 7.32 Дисперсионный анализ по методу латинского квадрата Рассеяние Между столбцами Между строчками Но партиям Остаточное Сумма . . . Суммы квадратов sa — ss = s7 St-S6 = Sa S1 — S$ — S9 — S; — -s, st — s$ Число степеней своСоды rt-1 rt-1 n-1 (я-1)Х X(rt-2) n*- 1 Дис- пер- персии ..2 bi si .2 S2 Sl Компоненты генеральных дисперсий па2 4-а2 W ' восп 2 t 2 2 1 2 2 Остаточная дисперсия здесь является опять-таки разно- разностью между общей суммой квадратов St—Ss и всеми осталь- остальными суммами квадратов. Компоненты дисперсий ow, От и Ом характеризуют действие факторов W, Т и неод- неоднородность материала. При оценке статистической значимости всех эффек- эффектов везде берется отношение соответствующих дисперсий к остаточной дисперсии. Остаточная дисперсия сама является суммарной величиной: она складывается из дисперсии, обусловленной опШбкой опыта, и дисперсии, обусловленной эффектом взаимодействия, если последний существует. 13 таблицах [42] приведены примеры построения латин- латинских квадратов вплоть до объема 12 X 12. В аналитической работе к планированию экспери- эксперимента по методу латинского квадрата приходится при- прибегать в тех случаях, когда объект, подвергающийся анализу, может изменяться как в процессе отбора пробы, так и при хранении пробы в течение времени, необходи- необходимого для выполнения всего запланированного цикла работы. Интересный пример планирования эксперимента по методу латинского квадрата в аналитической работе приведен в [124].
256 ДИСПЕРСИОННЫЙ АНАЛИЗ [ГЛ. VII § 5. Эффективность дисперсионного анализа Планирование экспериментов при помощи дисперсион- дисперсионного анализа имеет следующие преимущества по сравне- сравнению с традиционными, классическими приемами иссле- исследований: 1) При оценке действия каждого фактора оценивается значимость эффекта, которую можно рассматривать как меру надежности полученных результатов. 2) В комплексных опытах удается оценить эффекты взаимодействия факторов, которые невозможно обнару- обнаружить при классической постановке экспериментов. Эффект взаимодействия оказывается очень важной характери- характеристикой при решении ряда задач, связанных с анализом вещества. 3) В многофакторном дисперсионном анализе каждый результат служит для оценки всех факторов, а не одного, как это имеет место при традиционном планировании эксперимента. Поэтому применение дисперсионного ана- анализа дает возможность сократить число экспериментов. Практически особенно выгодным оказывается такое пла- планирование эксперимента, при котором удается выделить в виде самостоятельного фактора нестабильность во вре- времени результатов анализов. 4) Результаты дисперсионного анализа могут быть представлены в компактной форме, удобной для дальней- дальнейшего изучения, хранения и опубликования. Это, в част- частности, иллюстрируется табл. 7.30, в которой представлены результаты громадной экспериментальной работы, при- причем наряду с полученными результатами в этой таблице дана и оценка надежности результатов анализа. При классической постановке экспериментов в этом случае мы вынуждены были бы результаты работы представить в виде 66 мало вразумительных таблиц или графиков. Дисперсионный анализ впервые был применен в агро- агробиологических исследованиях. Там имеется уже более чем тридцатилетний опыт его использования. За последние 15—20 лет дисперсионный анализ нашел широкое при- применение в самых разнообразных исследовательских рабо- работах как лабораторного, так и промышленного характера. В настоящее время зтот метод стал довольно широко при- ЭФФЕКТИВНОСТЬ ДИСПЕРСИОННОГО АНАЛИЗА 257 меняться и при анализе вещества [72, 74, 80, 81, 83, 86, 88, 97, 98, 102, 110, 124, 136, 139, 143, 145, 147, 154]. В этой книге мы имели возможность рассмотреть только цростейшие формы дисперсионного анализа. Возможности применения дисперсионного анализа при анализе веще- вещества не ограничиваются рассмотренными здесь приме- примерами. Более подробные сведения о планировании экспери- экспериментов по методу дисперсионного анализа читатель найдет в специальных руководствах п монографиях [5, 30, 34, 36, 37, 39—41, 45, 47, 49]. Весьма полезными при диспер- дисперсионном анализе оказываются таблицы [42]. ' ' В. в. Налимов
ГЛАВА VIII СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ § 1. Способ наименьших квадратов Определение параметров градуировочного графика В аналитической работе часто имеют дело с построени- построением линейных градуировочных графиков. Линейными гра- графиками пользуются в эмиссионном и абсорбционном спект- спектральных анализах, в рештеноспектральном анализе, по- полярографии, а также в некоторых классических методах анализа; например, в объемном анализе титр и «холос- «холостую» можно рассматривать как параметры прямой линии. При иостроении градуировочных графиков возникают две задачи: 1) нужно найти параметры прямой, которая наилучшим образом соответствует результатам анализов, выполненных для серии эталонов или стандартных об- образцов; 2) произвести сравнительную оценку параметров градуировочных графиков. Первая из этих задач решается методом наименьших квадратов, вторая—с помощью регрессионного анализа. Для построения градуировочного графика аналитик обычно выполняет анализы имеющихся в его распоряже- распоряжении эталонов. Результаты этих анализов могут быть пред- представлены системой уравнений: у2 = Ьх2 + а, Ут = Ьхт + а. Здесь Xj — концентрация определяемого компонента в г-м эталоне, ^ — результаты прямых измерений, связан- связанных с анализом г-го эталона, а и 6 —параметры граду- градуировочного графика. В случае эмиссионного спектраль- СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ 259 ного анализа уг = ASj/y, xi = Jgci, где AS— разность почернения аналитических линий, у — фактор контраст- контрастности фотоэмульсии, lgq логарифм концентрации опре- определяемого компонента в г-м эталоне. При построении градуировочных графиков обычно предполагается, что величины yi отягчены ошибками измерения, а величины х{ являются точными резуль- результатами, или, во всяком случае, ошибки в определении xi значительно меньше, чем в определении у^. Для рассматриваемой нами системы уравнений (8.1) параметры а и b являются неизвестными величинами, которые нам нужно определить. Здесь мы имеем т урав- уравнений для определения двух неизвестных величин. В силу того обстоятельства, что значения уг отягчены ошибками измерений, вообще говоря, не может суще- существовать ни одной системы значений а п 6, которые бы строго удовлетворяли всем т уравнениям. Поэтому задача сводится к отысканию таких значений для параметров а и Ь, которые бы только наилучшим образом удовле- удовлетворяли всем уравнениям. Ясно, что такая задача не мо- может быть решена без некоторых произвольных допущений. С подобной ситуацией мы встречаемся при прямых измерениях. Для того чтобы компактным образом пред- представить множество значений случайной величины, полу- полученной в том или ином измерительном процессе, обычно пользуются средним арифметическим значением резуль- результатов отдельных измерений. Среднее арифметическое обладает тем свойством, что сумма квадратов отклонений от него отдельных измерений имеет минимальное значе- значение. Это чрезвычайно важное для метрологии утвержде- утверждение легко доказать. Приравняем нулю первую производ- производную по Q от суммы квадратов отклонений отдельных измерений хг от некоторой величины Q: = 0, 17*
260 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII Следовательно, сумма квадратов отклонений отдель- отдельных измерений от некоторой величины Q будет иметь минимальное значение тогда, когда эта величина равна среднему арифметическому результатов измерений. Компактное представление результатов измерений при помощи среднего арифметического не является един- единственно возможным. Результаты измерений можно, напри- например, представить и с помощью медианы, которая обла- обладает тем свойством, что сумма абсолютных отклонений от нее имеет минимальное значение. Для того чтобы доказать это положение, найдем сумму абсолютных от- отклонений хг от медианы М \х1-М\ + \х2-М\+ .. .+\хп-М\ = Т, располагая измерения в порядке возрастающих величин Ж; и допуская, что М лежит между хг и жг+1. Тогда, взяв от Т первую производную по М, получаем: dM dM1 + (xr+1-M)±(xr+2-M)+...+(xn-M)} = Следовательно, 2 dM = 0, если r = n — r или r = n/2, т. е. тогда, когда М является медианой. В отличие от арифметического среднего медиану часто называют срединным сродним. В свое время в метрологии детально обсуждался вопрос о выборе того или иного среднего для компакт- компактного представления результатов измерений [19]. Выбор среднего арифметического х в качестве оценки для измеряемой величины и. основан на том, что эта оценка лишена систематической ошибки. При этом чрезвычайно важно, что в случае нормального распределения, с кото- которым мы преимущественно имеем дело, арифметическое среднее является оценкой с наименьшей дисперсией. § 1] СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ 261 И если мы выбрали среднее арифметическое, а не медиану для компактного представления результатов измерения, то естественно, что в качестве меры рассеяния надо поль- пользоваться квадратичной, а не средней арифметической ошибкой, как об этом уже говорилось в § 1 гл. V. Принцип среднего арифметического может быть применен и при определении параметров уравнений по результа- результатам отдельных измерений. Это обобщение принципа сред- среднего арифметического называется методом наименьших квадратов *). Вернемся к рассмотрению задачи, поставленной и начале этого параграфа. Применение методов наимень- наименьших квадратов здесь сводится к определению параметров прямой, которая обладает тем свойством, что сумма квад- квадратов разностей между наблюденными значениями и соот- соответствующими значениями на прямой принимает наимень- наименьшее возможное значение. Условия минимальности для суммы квадратов отклонений могут быть записаны сле- следующим образом: д Та д_ ш> (8.2) ) откуда, опуская индексы суммирования, получаем: 1'ошая эти уравнения относительно а и Ь, находим: а= yJ*n у 7 , (8.3) 6 = mllxy— (8.4) *) Принцип наименьших квадратов был сформулирован н начале XIX в. в трудах Лежандра, Лапласа и Гаусса и при- применен ими для решения метрологических проблем астрономии и геодезии.
262 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII Параметры уравнений а и Ь называются коэффициен- коэффициентами регрессии. Иногда коэффициентом регрессии назы- называют только угловой коэффициент, так как, зная его, можно определить отрезок, отсекаемый по оси ординат, с помощью формулы а — у ~Ьх. (8.5) Величины а и b могут рассматриваться как оценки для теоретических параметров аир уравнения Найденное методом наименьших квадратов уравнение прямой: Y = a + bx (8.6) наилучшим образом удовлетворяет нашим т измерениям, если величины уъ .. ., уп независимы и нормальны и справедлива высказанная априори гипотеза о линей- линейной зависимости между величинами у и х. Дисперсия, характеризующая рассеяние значений у{ относительно прямой, определяется выражением то—2 (8.7) Здесь число степеней свободы равно т — 2, так как две степени свободы были использованы для определения параметров прямой. О 2 рр Обычно вычисление зуясь формулой дисперсии s2 производят, поль- поль2а;2 — (8-8) или формулой (т-2) st = 2у2-у2у - ЬBху-х2у), (8.9) которые эквивалентны формуле (8.7). Большая часть сумм §1] СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ 263 квадратов, необходимых при определении s2 по этим фор- формулам, подсчитывается при определении параметров урав- уравнения (8.6). Определение параметров уравнения а и Ъ по форму- формулам (8.3) и (8.4) можно рассматривать как результаты косвенных измерений. Для того чтобы оценить точность определения а и Ъ, воспользуемся законом накопления ошибок, который в этом случае должен быть написан следующим образом: Полагая, что s\ = s\ =. . образований получаем: =Sm = s2,, после простых пре- пре(8.10) — Ba;J ' 'те2а;2-Bа;J * (8.11) Разделив на т числитель и знаменатель правой части выражения (8.11), получаем: s0 2а;2 —тоа;2 2 (а; —а;J (8.12) Отсюда следует, что определение углового коэф- коэффициента чградуировочного графика будет тем точнее, чем дальше расположены друг от друга крайние точки по оси х. В эмиссионном спектральном анализе часто приходится делать анализы в узком интервале концен- концентраций в соответствии с допусками, установленными для той или иной продукции, но эталоны всегда приходится готовить для широкого интервала концентраций с тем, чтобы уменьшить ошибку в определении углового коэф- коэффициента. При этом, конечно, нужно иметь в виду, что верхний возможный предел для выбираемого интервала концентраций всегда ограничен той областью, для кото- которой сохраняется линейная зависимость.
264 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII При вычислении параметров градуировочных графи- графиков и соответствующих им ошибок обычно располагают материал так, как это показано на табл. 8.1. Таблица 8.1 Расположение материала при вычислениях Эталоны ху x+v Суммы Среднее х у Последние две колонки используются только для про- проверки вычислений с помощью очевидного соотношения Если при проверке результаты вычислений не схо- сходятся, то таким же образом производят проверку по каждой строчке в отдельности. В качестве примера в табл. 8.2 и 8.3 приведены последние этапы подсчетов, связанных с определени- определением параметров градуировочных графиков для эмиссион- эмиссионного спектрального определения кремния в углеродис- углеродистых сталях. В таблицах введены следующие обозначения: у = AS/y, х — Igc, где AS—разность почернения анали- аналитических линий, у—фактор контрастности фотоэмульсии, СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ 265 Таблица 8.2 Вычисление параметров градуировочного графика для определения кремния в сталях методом эмиссионного спектрального анализа *) Сумма .... Среднее . . . у 0,126 -0,077 0,207 0,055 0,282 -0,059 0,240 0,259 0,160 0,385 1,578 0,1578 X -0,770 -0,921 -0,638 -0,796 -0,553 -0,886 -0,602 -0,569 —0,678 -0,409 -6,822 -0,6822 2я2 = 4,885736 2s.v=— 0,863417 2i/a = 0,449190 (Sa;J = 46,539684 2s2t/=—10,765116 IPX (-0,863417)-(-10,765116) "- 10x4,885736-46,539684 a = 0,1578-0,919432x (-0,6822) =0,785, 8_0,449190-0,1578Xl,578-0,919432{(-0,863417)-(-0,6822)Xl,578}_ 10-2 = 0,000532, *„ =0,0231, sb = 0,0231 -3^^39584=0,00231 /2,108054 = 0,034. *) Для построения графика используются вторичные эталоны.
266 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII Таблица 8.3 Вычисление параметров градупровочного графика для определения кремния и сталях методом эмиссионного спектрального анализа *) Сумма .... Среднее . . . У 0,235 -0,063 —0,017 0,363 0,518 0,12950 эс -0,639 -1,018 —0,924 -0,468 -0,049 -0,76225 t 4 х (-0,240207) - (-1,579382) А „лп 2^ = 2,517445 Ъху= -0,240207 2г/2 = 0,191252 BгJ = 9,296401 ZzZ у =—1,579382 ЯП7 4x2,517445—9,296401 о=0,12950-0,799807х (-0,76225) = 0,738, 2_0,191252-0,12950х0,518-0,799807{(-0,240207)-@,76225)х0,518}_ ао=- 4—2 = 0,000245, s0=0,0156, s"=°>0156 /4Х2,5Ш457-952964О1 =0,0156/3,255125 = 0,028. *) Для построения графика используются первичные эталоны. с—концентрация кремния в эталоне. На рис. 34 с помощьр параметров, найденных расчетным путем, построены градуировочные графики. Каждая точка, нанесенная на график, есть средний результат, полученный для 12 спект- спектрограмм, экспонированных на разных пластинках. Градуи- ровочный график, проведенный пунктирной линией, отно- относится, к первичным эталонам Уральского института ме- металлов. Сплошной линией показан график, построенный по вторичным эталонам, полученным в одной из заводских §1] СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ 267 лабораторий. Химический анализ вторичных эталонов проверялся в трех квалифицированных лабораториях и дал достаточно хорошо совпадающие результаты. 0,25 0,00 -1,0 -0,75 -0,5 Рис. 34. Градуировочные графики для определения кремния в углеродистой стали методом эмиссионного спектрального анализа по аналитическим линиям Si Я, 2881,6 A, Fe X 2869,3 А. Пунктирной линией обозначен график, построенный по пер- первичным эталонам, сплошной линией—график, построенный по вторичным эталонам. Сравнительный статистический анализ этих двух гра- дуировочных графиков будет дан в следующем параграфе. Среднее взвешенное неравноточных измерений Пользуясь методом наименьших квадратов, можно полу- получить формулу для оценки среднего взвешенного неравно- неравноточных измерений. Допустим, что для оценки генерального среднего произведено т серий неравноточных измерений, которые дали средние значения хи х2, .. ., хт, являющиеся оцен- оценками для одной генеральной средней \i, и существенно различные дисперсии s\, s\, .. ., s%i, являющиеся оцен- оценками для генеральных дисперсий а\, о2.* ..., От- Согласно принципу наименьших квадратов в качестве оценки для
268 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII генерального среднего \i надо взять такое значение х, которое обращает в минимум выражение у Приравняв нулю первую производную этого выраже- выражения по х, после простых преобразований получаем: (8.13) Следовательно, при определении среднего взвешенного для неравноточных измерений в качестве весов надо взять обратные дисперсии. Применяя закон накопления ошибок к уравнению (8.13), получаем дисперсию среднего взвешенного В повседневной аналитической работе обычно не при- приходится пользоваться неравноточными измерениями. Но в некоторых исследовательских работах, например при сравнении двух градуировочных графиков, нам при- придется воспользоваться формулами (8.13), (8.14). § 2. Регрессионный анализ Проверка гипотезы линейности При разработке новых аналитических методов, осно- основанных на применении градуировочных графиков, всегда нужно проверять гипотезу линейности. Если между величинами у и х существует строгая линейная связь, то дисперсия, обусловленная рассеянием точек относительно линии регрессии, будет определяться целиком ошибками в определении у{. Поэтому при про- РЕГРЕССИОННЫЙ АНАЛИЗ 269 верке гипотезы линейности эксперименты планируются так, чтобы для каждого эталона было выполнено несколько параллельных определений. Тогда, сравнивая дисперсию, обусловленную рассеянием средних значений относи- относительно линии регрессии с дисперсией, обусловленной ошибками воспроизводимости, мы можем решить вопрос о том, является ли среднее значение величины у, соответ- соответствующее данному значению х, линейной функцией х. Допустим, что каждый эталон анализируется из п параллельных определений. Если у нас есть какие-либо основания сомневаться в однородности дисперсий, полу- полученных при анализе отдельных эталонов, то предвари- предварительно проверяем гипотезу однородности, применяя, как обычно, критерий Бартлета или Кохрена. Затем, поль- пользуясь формулой C.16) (см. стр. 50), находим сводную по всем эталонам дисперсию s2B0Cni обусловленную ошиб- ошибкой воспроизводимости. Дисперсию, соответствующую рассеянию средних • значений у{ относительно линии регрессии, находим с помощью формулы (8.15) в которой сумма квадратов отклонений от линии регрес- регрессии умножена на коэффициент п для того, чтобы учесть число параллельных определений, по которым определя- определялись средние значения у{. Эта формула аналогична тем, которыми мы пользовались в дисперсионном анализе при подсчете дисперсий по столбцам, с той только разницей, что здесь разности берутся не по отношению к общему среднему, а по отношению к соответствующим значениям Уг на линии регрессии, ц поэтому число степеней сво- свободы равно т—2. Гипотеза линейности проверяется путем сравнения дисперсионного отношения Р = Т?- (8-16) восп с табулированными значениями /^-распределения при выбранном уровне значимости, с учетом числа степеней
270 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII свободы: т—2 для числителя и т(п—1) для знаменателя. Если s\ значимо превосходит s2Bocn, то гипотеза линей- линейности не может быть принята. В тех случаях, когда дис- дисперсионное отношение незначимо, рассеяние точек отно- относительно линии регрессии определяется только ошибкой воспроизводимости. Для 0J мы будем иметь в этом случае две оценки: s2Bocn и s\, которые можно объединить в свод- сводную оценку: ^. (8.17) "о- тп-1 Эта формула имеет больше степеней свободы, чем каждая из оценок, подсчитанных в отдельности. Применение сводной дисперсии в дальнейшем статистическом анализе делает его более чувствительным. Нарушение линейности может быть обусловлено раз- различными факторами. В некоторых случаях, характер расположения точек указывает на то, что в качестве гра- дуировочного графика надо выбрать кривую второго порядка: + сх\ (8.18) Часто в аналитической практике нарушение линей- линейности связано с тем, что точки оказываются почти сим- симметрично рассеяны относительно прямой, как бы образуя ломаную линию, причем это рассеяние точек относительно линии регрессии оказывается значительно большим, чем это можно было бы ожидать, исходя из ошибок воспроиз- воспроизводимости. С такой ситуацией, например, приходится встречаться в эмиссионном спектральном анализе. Объяс- Объяснить это можно тем, что средние результаты анализов эталонов отягчены не только ошибками воспроизводи- воспроизводимости, но также и случайными методическими ошибками. Последние являются постоянной величиной по отноше- отношению к множеству параллельных определений одной и той же пробы и случайной величиной по отношению к множеству анализов различных по своему составу проб. В эмиссионном спектральном анализе появление случай- случайных методических ошибок может быть, с одной стороны, обусловлено неучтенным влиянием «третьих элементов», с другой стороны—особенностями физического состоя- §2) РЕГРЕССИОННЫЙ АНАЛИЗ 271 ния пробы, связанными с его «металлургической исто- историей». С последним фактором постоянно приходится встре- встречаться при изучении градуировочных графиков, построен- построенных по вторичным эталонам, отобранным непосредственно из производственных образцов. В этом случае надо, конечно, учитывать и возможность появления ошибки при установлении содержания вещества в эталопе. Вклад, вносимый случайной методической ошибкой, может быть оценен путем разложения дисперсии на отдель- отдельные компоненты так, как это делается обычно в диспер- дисперсионном анализе. Для рассматриваемого нами планиро- планирования эксперимента мы можем написать: st^aloou + nal, (8.19) где 0ф —дисперсия, обусловленная случайными методи- методическими ошибками. Физическая интерпретация 0ф может быть различна в зависимости от условий эксперимента и характера изучаемого материала, но метрологический смысл ее всегда остается вполне определенным. Эта величина характеризует ту ошибку, которая не может быть умень- уменьшена путем увеличения числа параллельных определений и которая имеет различную величину для различных по своему составу проб. Наш опыт показал, что при разработке новых методов эмиссионного спектрального анализа всегда полезно про- проверять гипотезу линейности и оценивать величину 0Ф, варьируя условия эксперимента. Пользуясь этим прие- приемом, можно достаточно обоснованно выбрать такие усло- условия проведения анализа, которые дадут возможность свести к минимуму нелинейность графика. В качестве примера произведем проверку гипотезы линейности градуировочных графиков, приведенных на рис. 34. На основании предыдущего опыта мы можем дать оценку ошибки воспроизводимости результатов измерений по одной спектрограмме: sB0Cn = 0,025. При построении графиков для каждого эталона бралось сред- среднее значение, полученное по 12 спектрограммам. Следо- Следовательно, для градуировочного графика, построенного
272 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ (гл. V111 по первичным эталонам, имеем: *; = 12s02 = 12-0,000245 = 0,002940, и для графика, построенного по вторичным эталонам,— si = 12s02 = 12 • 0,000532 = 0,006384. Находим дисперсионное отношение для первого из этих графиков: 0,00294 _, 0,000625 -q'U- Это значение F несколько больше, чем значение ^o,oiB,oo) = 4,6. Для второго градуировочного графика имеем: F_ si locn = 10,2. p_ si _ 0,006384 ~slocn~ 0,000625 Это значение Т значительно больше, чем/^о.оо! (8, со ) = 3,3. Таким образом, для обоих градуировочных графиков гипотеза линейности, безусловно, должна быть отброшена. Расположение точек относительно градуировочных графиков не дает нам возможности предполагать, что мы сможем уменьшить методические ошибки, если для построения графиков возьмем какую-то кривую высшего порядка. Здесь кажется весьма правдоподобным выска- высказанное выше предположение о том, что- гипотеза линей- линейности не выполняется из-за того, что результаты анализа эталонов отягчены методическими ошибками, которые можно рассматривать как случайные величины по отно- отношению к линии регресии. Сравнение параметров градуировочных графиков с теоретически ожидаемыми значениями В аналитической работе часто возникает необходимость сравнить эмпирически найденные параметры градуировоч- ного графика а и Ъ с некоторыми теоретически ожидаемыми значениями этих параметров а и р. Например, в эмис- § 2J РЕГРЕССИОННЫЙ АНАЛИЗ 273 сионном спектральном анализе в ряде случаев представ- представляет интерес выяснить, отличается ли значимо угловой коэффициент от теоретически ожидаемого значения E = 1. В объемном анализе угловой коэффициент, равный обрат- обратной величине титра, часто нужно бывает сравнить с соот- соответствующим стехиометрическим соотношением, а отре- отрезок, отсекаемый по оси ординат, сравнить с числом куби- кубических сантиметров, пошедших на титрование «холостого» опыта. При сопоставлении результатов прямого химиче- химического анализа, полученных новым ускоренным методом, с данными арбитражного метода часто также бывает полез- полезным применение метода наименьших квадратов. В этом случае мы получаем систему уравнений уг = а + Ьхи (8.20) где yi—результаты определения, полученные ускоренным методом, xi—результаты весьма надежного арбитражного анализа или заданное количество вещества. Пользуясь методом наименьших квадратов, можно определить пара- параметры а и Ъ, которые в этом случае легко поддаются ясной метрологической интерпретации. Если параметр а суще- существенно не отличается от теоретически ожидаемого зна- значения а = 0, то это значит, что изучаемый метод свободен от постоянной ошибки, не зависящей от концентрации вещества. Далее, если угловой коэффициент Ъ не отли- отличается существенно от теоретически ожидаемого значе- значения Р = 1, то новый метод свободен от методической ошибки, изменяющейся пропорционально концентрации определяемого компонента. Наконец, если еще подтвер- подтвердится гипотеза линейности, то это будет указывать что новый метод вообще не имеет иных ошибок, кроме ошибок воспроизводимости. В тех случаях, когда а и Ъ существенно отличаются от теоретически ожидаемых значений а = 0, |3 = 1, мы можем ввести поправки к результатам анализа, полу- полученным при помощи нового изучаемого нами метода. Поправки можно вводить графически, используя линию регрессии как градуировочный график, или аналитиче- аналитически, решая уравнение регрессии относительно х. После введения этих двух поправок еще останутся те мето- методические ошибки, которые оказываются случайными 18 в. В. Налимов
274 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII величинами по отношению, к линии регрессии и которые могут быть обнаружены только при проверке гипотезы линейности. Таким образом, если сопоставлять результаты нового аналитического метода непосредственно с паспортными данными стандартных образцов или с результатами надежных арбитражных анализов, то это дает возмож- возможность из суммарной методической ошибки выделить только одну постоянную составляющую, соответствующую посто- постоянному смещению всех результатов анализа относи- относительно надежно установленного содержания вещества во всех изучаемых пробах. Если же сопоставление резуль- результатов анализа двух методов производить с помощью спо- способа наименьших квадратов, то это дает возможность еще определить величину, учитывающую ошибку, изменяю- изменяющуюся пропорционально определяемой концентрации,- и ввести соответствующую поправку. Этот метод введения поправок, естественно, применим только для прямых аналитических методов, где получе- получение результатов анализа не связано с построением градуи- ровочных графиков. Что касается вторичных аналитиче- аналитических методов, основанных на построении градуировочных графиков, то там внесение указанных выше поправок осу- осуществляется автоматически при построении градуиро- вочного графика. На возможность применения метода наименьших квад- квадратов для изучения правильности прямых аналитических методов впервые указал Юдин [49, 69]. Он предложил несколько упрощенный метод оценки разностей а—О и Ъ—1, основанный на определении величин * = _?-, / = те-2; * = -^, 1 = т-2- (8.21) и сопоставлении их с соответствующими табличными дан- данными для ^-распределения. Если найденные значения t не превосходят 95%-ный критерий, то, естественно, отпа- отпадает необходимость введения поправок. В настоящее время имеется уже довольно болыпай литература о применении метода наименьших квадратов для изучения правильности прямых химических методов анализа: [49, 69, 107, 109, ИЗ, 142, 143, 156]. 2] РЕГРЕССИОННЫЙ АНАЛИЗ 275 Опыт показал, что этим методом надо пользоваться с большой осторожностью. Поясним это примером, кото- который уже неоднократно обсуждался в литературе 149, 69," ИЗ]. В табл. 8.4 сопоставлены результаты хими- химического определения СаО при заранее известном содер- содержании вещества в пробе. Результаты статистического анализа, приведенные в этой таблице, оказываются противоречивыми. С одной стороны, регрессионный анализ показывает, что пара- параметры уравнения Г= - 0,2281 + 0,9947572 незначимо отличаются от теоретически ожидаемых зна- значений а = 0, р = 1. С другой стороны, оказывается, что среднее расхождение d значимо отличается от нуля. Сле- Следовательно, если ориентироваться на метод наименьших квадратов, то нет основания для введения поправок, если же ориентироваться на оценку величины среднего отклонения, то безусловно нужно вводить поправку в результаты анализа. Это противоречие, связанное с применением упрощен- упрощенного статистического анализа, объясняется тем, что для 7-го из 10 анализов отклонение от действительного содержания вещества в пробе оказывается несовместимым с остальными отклонениями*). Это можно проверить при помощи г- и гшах-критерия: 7 0,2068 гМ1 (8) = 2,294; rm« o.os (8) = 2,294. Если отбросить эту явно сомнительную пробу, то получим уравнение регрессии Y= -0,2196 +0,991944г. *) Противоречие в результатах анализа исчезнет, если от упрощенного статистического анализа перейти к более сложному и вполне корректному методу анализа, в котором о и Ъ рассма- рассматриваются как зависимые величины. Описание этого метода будет дано ниже, на стр. 280—284. 18*
СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII Таблица 8.4 Определение СаО в смесях известного состава [49, ИЗ] 1 2 3 4 5 6 7 8 9 10 Сумма . . Среднее . . Найдено У 3,7 7,8 12,1 15,6 19,8 24,5 31,1 35,5 39,4 39,5 229,0 22,90 Взято X 4,0 8,0 12,5 16,0 20,0 25,0 31,0 36,0 40,0 40,0 232,5 23,25 Разность d -0,3 -0,2 -0,4 -0,4 -0,2 -0,5 +0,1 -0,5 -0,6 -0,5 -3,5 -0,35 2х2 = 6974,25 Zxy = 6884,65 Si/2 = 6796,66 BжJ = 54056,25 SxSy = 53242,50 ь_ 10X6884,65-53242,50_ 15604,00 _ 10x6974,25-54056,25" 15686,25 -и>аа*'а7> (т—2) S2 = 6796,66 —B2^0J—1552,2181=0,3419, so = VO, 04274=0,207, а = 22,90 — 0,994757х23,25= —0,2281, у 6974-25 о 0,2281 = 0,138, =1.853, / = 8, sa 0,138 P(\t\> 1,653) > 0,10, , = 1/^5 = 0,005220, 0,005243 «ь d = — 0,35; sd = 0,2068; s-=0,0654, f—* = A11 > 1,0044) > 0,10, -0,35 = s- 0,0654 a = -5,35, / = 9, P(\t\ >5,35) < 0,001. 2] регрессионный анализ 277 Здесь s'o = 0,0945 и соответственно уменьшаются ошибки в определении свободного члена и угла наклона: Sa = = 0,0630 s'b = 0,00244, а величины а 0,2196 о /о. 1 п г = = 348 / 7 и^- 0,008356 «b ~ 0,00244 оказываются между значениями t0i02 G) = 3,00 и tOlQ1 G) = = 3,50. Следовательно, если считать, что результаты анализа пробы № 7 отягчены грубой ошибкой, то нужно признать, что изучаемый аналитический метод нуждается в двух поправках, которые можно вводить с помощью написанного выше уравнения регресии, решая его отно- относительно х. Рассмотрим еще один упрощенный вариант исследова- исследования параметров уравнения регрессии, предложенный в [142]. Допустим, что результаты анализа двух различ- различных по величине навесок г1 и е2 одной и той же пробы могут быть представлены уравнениями: (8.22) где г/х и г/2 — наиденное количество вещества в навесках е1 и е2, а х1 и ж2 — действительное содержание вещества. Очевидно, что относительное содержание вещества в обоих случаях должно быть одним и тем же Подставляя вместо х1 и х2 их значения, найденные из (8.22), получаем: 2/1- ^_ г/2—а &8j Ье2 Решая это уравнение относительно а, находим: — —у а = —— . (8.24)
278 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII Следовательно, если при выполнении серии анализов для т проб параллельные определения будут произво- производиться из различных по своей величине навесок (прак- (практически удобно выбрать ej/e2~2), то, пользуясь фор- формулой (8.24), мы можем найти значения ох, а2, .. ., ат, определить а, sa и оценить вероятность появления зна- значения t = JL j/^. (8.25) Для того чтобы определить величину Ь, делают два параллельных определения из одинаковых по величине навесок и к одной из них добавляют известное количе- количество вещества z. В этом случае мы можем написать два уравнения: Решая эти уравнения относительно 6, находим: Ь= Уз~У1 . (8.26) Если выполнена серия анализов из двух параллельных определений с добавлением известного количества веще- вещества к одному из них, то можно определить Ъ, sb и оценить вероятность появления - значения t = ^Vm. (8.27) Sb При одновременном определении обоих параметров уравнения эксперименты можно планировать следующим образом: берутся две одинаковых по величине навески, после перевода их в раствор для дальнейшего анализа используется весь объем раствора, полученный для пер- первой навески, а объем раствора, полученный для второй навески, делится на две части. Эти две части объема ана- анализируются независимым образом, причем к одной из них добавляется известное количество вещества. Такая схема планирования эксперимента может быть применена и при выполнении текущих анализов. Тогда, пользуясь резуль- результатами аналитического архива, можно будет определять §2] РЕГРЕССИОННЫЙ АНАЛИЗ 279 параметры а и Ъ на основании очень большого экспери- экспериментального материала. При этом можно будет также исследовать стабильность во времени этих величин, при- привлекая для этого дисперсионный анализ. Таблица 8.5 Статистическое исследование объемного определения AgNO8 в условиях, когда были вскусственно внесены «ошибки» [142] Количество мл 0,i н. раствора A8NO3, взятое для экспери- экспериментов 8,00 15,00 18,00 12,00 25,00 22,00 16,00 30,00 26,00 20,00 40,00 30,00 Количество мл 0,1 н. раствора NH4CNS, пошедшее на ти- титрование 7,79 14,72 17,22 11,75 24,57 21,68 15,71 29,52 25,61 19,67 39,43 29,50 CL В МЛ 0,1 Н. pdO I U"JJd NH4CNS -0,13 -0,08 -0,07 -0,09 0,993 0,993 0,993 0,983 а=— 0,09, 6=0,991, sa = 0,026, sb = 0,005, В качестве примера в табл. 8.5 приведены результаты статистического анализа, полученные при изучении объем- объемного метода определения AgNO3 в условиях, когда искус- искусственно создавались постоянная и неременная «ошибки» добавлением к каждой пробе 1 мл центинормального рас- раствора NH4GNS и применением неверного фактора к = 0,9900 (вместо к = 1,0000). Статистический анализ
280 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII дал возможность обнаружить искусственно внесенные «ошибки» и позволил найти параметры линейного уравне- уравнения а = — 0,09 и Ъ = 0,991, при помощи которого эти ошибки могут быть исключены. Нужно обратить внимание на то, что рассмотрен- рассмотренные выше методы сравнения эмпирически найденных 6 1,016v /,0/4 1,0/2 1,0/0 1,008 1,006 WO', 1,002 1,000 6 8 Ю Рис. 35. График, показывающий корреляционную связь между па- параметрами линейного уравнения, определенными методом наимень- наименьших * квадратов. Сплошной линией проведена прямая надежно установленных параметров, пунктиром — прямая, параметры ко- которой определены с некоторыми ошибками. Рис. 36. Эллипс, ограничи- ограничивающий доверительную об- область для параметров урав- уравнения прямой линии. На графике нанесена точка с ко- координатами A=6,99 и в=1,00765, которые соответствуют парамет- параметрам линейного уравнения, полу- полученным методом наименьших квад- квадратов, при изучении правильности химического анализа [156]. параметров уравнения с теоретическими, вообще говоря, недостаточно корректны. Параметры градуировочных графиков, определенные методом наименьших квадратов, оказываются корреляционно связанными между собой. Это иллюстрируется рис. 35, где сплошная линия пред- представляет собой прямую, проведенную для надежно уста- установленных параметров, а пунктирная линия—прямую, параметры которой установлены с некоторыми ошибками. Из рисунка видно, что небольшое занижение углового коэффициента приводит к увеличению отрезка, отсекае- отсекаемого по оси ординат, а увеличение углового коэффи- 2] РЕГРЕССИОННЫЙ АНАЛИЗ 281 циента, наоборот, приводит к уменьшению свободного члена. Поэтому при строгом статистическом анализе нельзя устанавливать доверительные пределы для каждого параметра раздельно. Если мы выбрали некоторое фикси- фиксированное значение одного из параметров, то тем самым определяются возможные значения для другого параметра. При таком более строгом подходе к оценке параметров нужно построить доверительную область для их возмож- возможных значений. В качестве примера на рис. 36, заимство- заимствованном из [156], построена доверительная область для параметров линейного уравнения, полученного при изуче- изучении объемного метода определения жирной кислоты в каучуке. По оси ординат здесь отложены значения углового коэффициента Ь, по оси абсцисс — значения свободного члена а. На графике нанесена точка с координа- координатами а = 6,99, Ъ = 1,00765, которые соответствуют пара- параметрам, полученным методом наименьших квадратов, для линейного уравнения, связывающего найденное количе- количество жирной кислоты с действительным ее содержанием в пробе. Доверительная область ограничивается эллипсом, правила построения которого будут даны ниже. Стати- Статистический анализ должен был ответить на два вопроса: 1) можно ли для компенсирования постоянной ошибки вычитать из результатов анализа величину 7,40, получен- полученную при титровании «холостого» опыта, 2) нужно ли вво- вводить поправку на ошибку, изменяющуюся пропорцио- пропорционально концентрации определяемого компонента. Чтобы ответить на первый вопрос, проводим верти- вертикальную линию для значения а = 7,40. Эта линия пере- пересекает эллипс и проходит вблизи его центра. Следова- Следовательно, величина 7,40, полученная при титровании «холо- «холостого» опыта, может служить в качестве поправки для исключения постоянной ошибки. Горизонтальная прямая для значения 6 = 1 пересе- пересекает доверительную область, ограниченную эллипсом, вблизи ее границы. Поэтому гипотеза Ъ = 1 кажется мало- маловероятной. Расположение эллипса относительно прямой 6 = 1 указывает на большую правдоподобность гипотезы Ъ > 1. Если мы выбрали в качестве свободного члена вели- величину а — 7,40, то величина Ъ должна быть выбрана в пре- пределах 1,0013—1,0117, которые несколько уже, чем пределы
282 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII 1,000—1,016, в которых может изменяться Ь, когда вели- величина а не фиксирована. Угловой коэффициент Ъ = 1,00765, определенный методом наименьших квадратов, как раз попадает в указанный выше интервал, следовательно, эта величина может быть принята для компенсирования ошибки, увеличивающейся пропорционально определяемой концентрации. Таким образом, приведенное исследование показы- показывает, что результаты определения жирной кислоты в каучуке, полученные с использованием стехиометриче- ского фактора, должны быть откорректированы с помощью двух поправок а = 7,40 и Ь= 1,00765. Первая из этих величин вычитается из результата анализа, и затем разность делится на вторую величину. Вторая величина может быть интерпретирована как поправка к стехиомет- рическому фактору. Эллипс, ограничивающий доверительную область, определяется уравнением т (а - а'J + 2 Bз) (а - а') (Ь-Ь') + (?г>) F - Ъ'J = 2Fsl (8.28) где Ъ' и а' — значения параметров линейного уравнения, найденные методом наименьших квадратов. Величина F находится по таблице ^-распределения для числа сте- степеней свободы f1 = 2, /2 = т — 2, при выбранном уровне значимости. Приведенный на рис. 36 эллипс был построен для 95%-ных доверительных пределов, следовательно, величина F находилась для 5%-ного уровня значимости. Для построения эллипса находят следующие вспомо- вспомогательные величины: K2 = 2Fs\, La = i d .-к/ 2W -sbV2F, da = -^< (8.29) Построение (рис. 37) начинают с выбора масштаба на осях координат, затем наносят точку С с координатами а' и Ь', соответствующими параметрам уравнения, най- найденным методом наименьших квадратов. Через точку С 2] РЕГРЕССИОННЫЙ АНАЛИЗ 283 приводят две взаимно перпендикулярные прямые, парал- параллельные осям координат. Отмечают две точки Е и Е' сверху и снизу от точки С на расстоянии ± db и две точки D и D' справа и слева от точки С на расстоя- расстоянии ± da. Проводят две наклоненные прямые ED и E'D', которые являются касательными к эллипсу, и строят ше- шестиугольник RNTR'N'T' так, как это показано на рис. 37. Этот шестиуголь- шестиугольник можно рассматривать как достаточно хорошее приближение к эллипсу и использовать ограничен- ограниченную им площадь для уста- установления доверительных пределов. Воспользуемся довери- доверительным эллипсом для проверки гипотезы а = 0, Р = 1 в рассмотренном вы- выше примере с определе- определением СаО в смесях извест- известного состава (см. стр. 275). Определим значение F, при котором точка с ко- координатами @, 1) не вый- выйдет за границы довери- доверительного эллипса. Подставляем значения а = 0, Ъ—\ в (8.28) и, опуская индексы при а' и V', получим отно- отношение 2 — 2а (Ь — Рис. 37. Построение эллипса, ограничивающего доверительную область [158]. которое имеет ^-распределение с числом степеней сво- свободы /х = 2, /2 = т—2. Пользуясь числовыми значе- значениями, приведенными в табл. 8.4, получаем: 10(-0,2281J-2( — 0,2281) @,9948- 1J32,5+ + @,9948-1J6974,25 , ,-
284 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIIi Найденное значение F су 15 > F0MB,8) — 8,7. Сле- Следовательно, полученные методом наименьших квадратов значения а и b значимо отличаются от значений а = О, C = 1. Корректный метод статистического анализа дает возможность получить правильный ответ, не прибегая к отбрасыванию сомнительного измерения при вычис- вычислениях. Нужно отметить, что рассмотренные здесь методы сравнения эмпирических и теоретических параметров эффективны только при анализе однотипных проб. В пробах очень сложного состава, когда в широких пределах изменяется концентрация многих компонентов, часто приходится сталкиваться с появлением методи- методической ошибки, которую надо рассматривать как слу- случайную величину относительно линии регрессии. В этом случае резко увеличиваются ошибки, характеризующие рассеяние точек относительно прямой, и поэтому оценка параметров становится мало чувствительной. К интерпретации результатов регрессионного ана- анализа надо подходить очень осторожно, учитывая каж- каждый раз особенности условий постановки экспериментов, при которых были получены исходные данные. Сравнение двух градуировочных графиков В аналитической работе часто возникает необходи- необходимость сравнить между собой два уравнения регрессии: Одно из них, например, могло быть получено при построении градуировочного графика по первичным эталонам, второе — при построении графиков по вто- вторичным эталонам, изготовленным из производственных сплавов. Здесь аналитику важно выяснить, можно ли считать, что различие в двух градуировочных графиках определяется только ошибками эксперимента. При сопоставлении между собой двух линий регрессии прежде всего сравнивают две дисперсии: s^ и s22, обусловленные рассеянием точек относительно соответ- § 2| РЕГРЕССИОННЫЙ АНАЛИЛ 28Г) ствующих прямых. Если дисперсии не различаются значимо, то находят сводную дисперсию где т1 и т2 - числа эталонов, по которым были по- построены градуировочные графики. Затем определяют дисперсию разности между двумя угловыми коэффициентами: sbl_b2=So(^-^j--b-^J , (8.32) где П _ V -г2 _ т г2 Чтобы решить вопрос о том, можно ли считать две линии регрессии параллельными прямыми, находят величину г = А^1; (8.33) которая имеет ^-распределение с числом степеней сво- свободы / = m1 + m2 —4. Если найденное значение t пре- превышает табличное значение t для выбранного нами уровня значимости, то угловые коэффициенты двух линий регрессии надо считать существенно различными. В тех случаях, когда s^ и s\2 различаются значимо, определяют величину г = -А^1==, (8.34) /д01 i S02 D, + D2 / которая приближенно имеет ^-распределение с числом степеней свободы /, где (8.35) (8.36) U при «01
286 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII Если рассеяние точек относительно линий регрессии не противоречит гшютезе линейности, то сравнение двух линий регрессии можно сделать более чувстви- чувствительным, анализируя каждый эталон из п параллельных определений. В этом случае s2, и s22 необходимо заме- заменить сводными дисперсиями, пользуясь формулой (8.17) с числом степеней свободы пт — 2. В соответствии с этим величины Dt и D2 в формулах (8.32), (8.34), (8.36) заменяются на nDx и nD2, а значение t, определяемое формулой (8.33), будет иметь число степеней свободы пт1 -+ пт2 — 4. Если угловые коэффициенты не различаются значи- значимо, то можно проверить гипотезу о совпадении двух градуировочных графиков. Условие ^?^.0,2 мы можем, пользуясь (8.5), записать следующим образом: if 1 11 ~~~ о % 2 2* V*/ Так как мы еще предполагаем, что Ьх и Ь2 также не различаются значимо, то в качестве оценки для угло- углового коэффициента градуировочного графика можно взять величину г. 2/i — 2/г /Я QQ\ О = =: =— (О.ОО) и сравнить ее по средним взвешенным значениям Ь, используя в качестве весов, значения, обратные дис- дисперсиям, Jh.-L.Jh. Sol s02 (8.39) Величина be может быть геометрически интерпретиро- интерпретирована как угловой коэффициент прямой линии, прохо- проходящей через точки (xv уг) и (ж2, у2). Оценка углового коэффициента по формуле (8.39) основана только на предположении о параллельности прямых, тогда как 2] регрессионный анализ 287 оценка по формуле (8.38) основана на предположении о совпадении диух прямых. Сравнение этих двух оце- оценок дает возможность проверить гипотезу о совпадении двух линий регрессии, определяемых уравнениями (8.30). Пользуясь формулой (8.14), находим дисперсию среднего взвешенного значения углового коэффициента: (8.40) когда s2! и s22 различаются незначимо. Если эти вели- величины различаются значимо, то имеем: ,2 1 D, (8.41) Применяя закон накопления ошибок к величине Ь, определяемой формулой (8.38), получаем в первом случае: 2 «| /1 1 Л Sg =—=—=—^f 1 ) (8.42) (xi — я-'чJ v^i ^2 У и во втором случае: S't= (х -х * (т!г + ^) • (8'43) Следовательно, для разности двух оценок углового коэффиенента дисперсии будут равны: в первом случае и соответственно во втором случае . (8.45) .2 ь02 В первом случае, когда s%t и s22 различаются незна- незначимо, гипотеза о совпадении двух прямых будет при- принята, если величина (8.46)
288 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII не превосходит табличного значения t при выбранном уровне значимости. Во втором случае, когда s^ и s2M различаются зна- значимо, возникает затруднение с установлением числа степеней свободы при оценке разности b - b. Здесь приходится принимать s^_j в качестве оценки для о^^ь и ограничиваться сопоставлением величины ъ-ъ и — аь-ь с квантилями нормированного нормального распределе- распределения, что можно делать, конечно, при условии, когда /х и /2 больше 20, или хотя бы больше 10. В качестве примера проверим гипотезу с параллель- параллельности двух градуировочных графиков, приведенных на рис. 34 (см. стр. 267). Находим дисперсионное отноше- отношение для дисперсий, характеризующих рассеяние точек относительно линий регрессии, р _ 0,000532 _ о , ~~ 0,000245 -^>1'- Это отношение меньше, значение F0,20 (8.2) = 4,3, следо- следовательно, у нас нет оснований считать, что дисперсии различаются значимо. Поэтому находим сводную дис- персику ,1 = 2-0'00042^+!:04'000532 = 0,0004746, УЩ = 0,0218. Затем находим ошибку для разности угловых коэф- коэффициентов: и подсчитываем: , _ 0,9194-0,7998 _ „ 7Я 1 070671 -1-'0- Эта величина оказывается меньше, чем toaO A0) = 1,81, следовательно, угловые коэффициенты не различаются значимо. §2) регрессионный анализ 289 Теперь можно проверить гипотезу о совпадении двух градуировочных графиков. Для этого, пользуясь форму- формулами (8.38) и (8.39), находим Ь и Ь: I 0,1578-0,1295 —0,6822-(-0,7623) = 0,3535, Ь = 0,919432 х 0,231768 0,799807X 0,193345 0,000532 0,000245 0,231768 0,193345 1 ' . = 0,842356. 0,000532 т 0,000245 Затем пользуясь формулой (8.44), находим s Л _..= 0,000475 [ (_о,7а23_1(_о,6822))' (й+т ГО, 231768+0,19с ?_ь~ 0,164. Пользуясь (8.46), находим величину . 0,8424-0,3535 „ Q, Это значение t находится между t0l02 A0) = 2,76 и tOtO1 A0) = 3,17. Следовательно, мы должны признать, что градуировочные графики не совпадают. Этот вывод можно также проверить геометрически: проведя на рис. 34 линию через точки с координатами (xv г/х), (х2, у2), получаем прямую с углом наклона, резко отли- отличающимся от углов наклона двух изучаемых графиков. Таким образом, результаты регрессионного анализа приводят к следующему заключению: у графиков, построен- построенных по первичным и вторичным эталонам, угловые коэф- коэффициенты отличаются незначимо, а отрезки, отсекаемые по оси ординат, оказываются существенно различными. Графики не являются взаимно заменяемыми. Различие с градуировочных графиках, видимо, объясняется осо- особенностями физического состояния проб, связанных с их металлургической историей. Это обстоятельство затрудняет стандартизацию методов эмиссионного спек- спектрального анализа. Если завод-потребитель будет •9 В. В. Налимов
290 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII принимать сталь по данным спектрального анализа, то он, очевидно, воспользуется первичными эталонами, и тогда для ряда проб получится очень большое расхождение с результатами анализа, указанными заводом-изготови- заводом-изготовителем, выдающим результаты анализа по своим вторич- вторичным эталонам. Проверка гипотезы о параллельном смещении градуировочных графиков В аналитической работе очень важно иметь возмож- возможность проверить гипотезу о параллельном смещении гра- градуировочных графиков. Если при наблюдении за дли- длительный интервал времени удается установить, что имеет место флуктуация только одного параметра—отрезка, отсекаемого по оси ординат, а второй параметр—угловой коэффициент—остается постоянным, в пределах ошибок измерений, то при анализе проб неизвестного состава достаточно пользоваться одним контрольным эталоном. Проверку гипотезы о параллельном смещении градуиро- градуировочных графиков нужно производить в каждой лабо- лаборатории, так как характер флуктуации параметров гра- градуировочных графиков определяется в значительной степени особенностями работы данной лаборатории. Допустим, что у нас имеется т эталонов, дающих возможность построить график, для которого выполняется гипотеза линейности. Будем этот комплект эталонов анализировать через более или менее длительные интер- интервалы времени так, чтобы можно было получить к гра- градуировочных графиков. Найдем для каждого графика дисперсии sjjj, $о2, ..., Sox, характеризующие рассеяние точек относительно линии регрессии и подсчитаем среднюю арифметическую дисперсию о" — . = k(m-2), предполагая, что все к дисперсии однородны. Если это предположение вызывает сомнение, то можно произвести, проверку однородности дисперсий с помощью критерия Бартлета или Кохрена. РЕГРЕССИОННЫЙ АНАЛИЗ 291 Подсчитаем методом наименьших квадратов к угловых коэффициентов bv b2, . .., bh и найдем среднее арифме- арифметическое значение углового коэффициента для всех к градуировочных графиков: В соответствии с общими правилами дисперсионного анализа дисперсию, связанную с рассеянием угловых коэффициентов, определим, пользуясь формулой (8-47) 1=1 где 2 v=l Гипотеза о параллельном смещении графиков будет принята, если дисперсионное отношение F = U si с числом степеней свободы к—1 для числителя шк(т — 2) для знаменателя не будет превосходить соответствующее табличное значение для 1%-ного уровня значимости. Если гипотеза о параллельном смещении принята, то можно проверить гипотезу о тождественности прямых линий. Принятие этой гипотезы будет указывать на то, что второй параметр градуировочного графика —отре- —отрезок, отсекаемый по оси ординат, — остается постоян- постоянным во времени в пределах ошибок измерений. В этом случае анализы можно будет производить, пользуясь постоянным, надежно установленным градуировочным графиком, без применения контрольного эталона. Для проверки гипотезы о тождественности к парал- параллельных линий строят усредненный градуировочный график по точкам (ж^), (х2у2), ..., (хтут), где h 19*
292 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII Дисперсию, соответствующую рассеянию точек относи- относительно усредненного графика, находим с помощью фор- формулы т S4~ „_9 1л "*> ] — ™. — 4, [0.40) где d{ — разность между значением v/t и положением со- соответствующей точки на усредпенном графике. Эта дис- дисперсия сравнивается со сводной дисперсией sj, образо- образованной из двух дисперсий si и sj: о К \ Ttv ' ^ ) о л —I ¦ I ti/ ' л.) о *> ¦* ___ jy> vyj l/k Л о * v / v \ \ / д , 1 [bill /ъ 1. so~ A(m-2) + A-l Гипотеза о тождественности градуировочных графиков принимается, когда дисперсионное отношение с числом степеней свободы для числителя т — 2 и для знаменателя km — к— 1 не превышает соответствующего табличного значения при выбранном нами уровне зна- значимости. Если дисперсия s\ значимо превышает диспер- дисперсию si, то это указывает на то, что наряду с ошибками воспроизводимости имеет место еще смещение результатов анализа во времени. Предложенная здесь схема для изучения характера флуктуации параметров графика во времени, конечно, может применяться только в том случае, если эталоны выбраны так, что может быть принята гипотеза линей- линейности. Если это требование не выполняется, то часть эталонов, дающих систематическое отклонение от линии регрессии, надо отбросить или скорректировать содержа- содержание определяемого компонента в этих эталонах так, чтобы можно было принять гипотезу линейности. В некоторых случаях, в связи с особенностями пла- планирования эксперимента и дальнейшим использованием его результатов, оказывается нежелательным отбрасы- отбрасывать часть эталонов или корректировать содержание определяемого в них компонента. Тогда некоторое пред- представление о характере смещения графиков во времени § 2] РЕГРЕССИОННЫЙ АНАЛИЗ 293 можно получить, сравнивая дисперсию sj, определяемую формулой (8.47), с дисперсией: т(к— 1) (8.49) которая характеризует рассеяние точек относительно их среднего значения, полученного за длительный интервал времени. Если флуктуация во времени точек, по которым строятся графики, носит чисто случайный характер, то дисперсия si не может быть значимо меньше дисперсии si?. Поэтому если дисперсионное отношение F = s\/s\ не отли- отличается значимо от соответствующего табличного значе- значения, то можем отбросить гипотезу о параллельном сме- смещении графиков во времени. Если же окажется, что s| значимо меньше si, то это указывает на неслучайный характер флуктуации положения точек во времени. В этом случае нужно провести более строгий анализ для реше- решения вопроса о том, происходит ли только параллельное смещение графиков или имеются и другие различия. Оценка результатов анализа, полученных с помощью градуировочного графика При вторичных методах анализа, основанных на по- построении градуировочных графиков, важно уметь опре- определить доверительные пределы для результатов неко- некоторого (/га+1)-го определения, когда график построен по т эталонам. Допустим, что по т эталонам мы получили уравне- уравнение регрессии Y = y + b(x-x). Найдем, пользуясь этим уравнением, значение жт+1, со- соответствующее значению Y = ут+1, полученному при ана- анализе некоторой (яг + 1)-й пробы: ¦rm+l — _ Ут*1 Х. (8.50)
294 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII Пользуясь законом накопления ошибок, определим дисперсию si : где 5ц — дисперсия, характеризующая рассеяние точек от- относительно линии регрессии. При этом предполагается, что проба и эталоны анализируются из одного и того же числа параллельных определений. Таким образом, ошибка в определении неизвестной концентрации хт+1 будет равна: Sx =-gs. *m+i Ь (8.52) Пользуясь этой величиной, находим доверительные пределы для результатов анализа (т + 1)-й пробы*): хт+1 ± V*m+i, (8-53) где tp— значение t для выбранного нами уровня значи- значимости р при f = m — 2. В эмиссионном спектральном анализе при построении градуировочных графиков по оси абсцисс откладывают логарифмы концентрации: x = lgc, дифференцируя эту функцию, находим: dx = *) Если в дальнейшем предполагается определить значения х, соответствующие многим значениям у (т. е. многократно исполь- использовать градуировочный график), то целесообразно выбирать не- несколько завышенную доверительную вероятность (например, 99% вместо 95%). •2] РЕГРЕССИОННЫЙ АНАЛИЗ 295 Следовательно, в этом частном случае получаем очень простое выражение для коэффициента вариации: Чп+1 = 2'3<Чп+1100- (8-54) Анализируя формулу (8.52), видим, что величина ошибки в определении неизвестной концентрации зави- зависит от угла наклона графика, величины ошибки, обуслов- обусловленной рассеянием точек относительно графика, числа эталонов, по которым строился график, расположения эталонов относительно х и расположения анализируемой пробы относительно у. Для одного и того же градуиро- вочного графика величина ошибки оказывается различной для проб с разной концентрацией определяемого компо- компонента. Она достигает минимальной величины при значе- значении ут+1 = у. В этом частном случае ошибка в определе- определении угла наклона не оказывает влияния на результаты анализа и доверительные пределы определяются выра- выражением xm*l i то+1 (8.55) Эти доверительные пределы отличаются только числом степеней свободы для t и коэффициентом 1/6 от дове- доверительных пределов, полученных при изучении методи- методических ошибок прямых методов анализа (см. стр. 173). Для того чтобы наглядно представить себе область возможных значений а;т+1 при различных значениях ?/т+1, укажем доверительные пределы в следующем виде: i — У? (8.56) Это—уравнение гиперболы относительно переменных (xm+i, Ут+i)- Возможные значения xm+i, совместимые с резуль- результатами измеренного нами значения ym±i, заключены между двумя ветвями гиперболы, как это показано на рис. 38, построенном по данным табл. 8.2. Надо иметь в виду, что дисперсия s2, обусловленная рассеянием точек относительно графика, является сум- суммарной величиной. Она складывается из дисперсии,
296 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII характеризующей ошибку воспроизводимости,и дисперсии, характеризующей нелинейность графика, которая в случае спектрального эмиссионного анализа металлов и сплавов может быть обусловлена особенностями физического состояния пробы, связанными с ее «металлургической историей». Поэтому рассмотренные выше формулы при- применимы только при построении градуировочных графиков У 0,50 0,0 -1,00 -0,75 -0,50 Рис. 38. 95%-ные доверительные пределы для определения кремния в стали методом эмиссионного спект- спектрального анализа. по вторичным эталонам, полученным в условиях, не отли- отличающихся существенно от тех условий, в которых полу- получают текущие пробы для анализа. Что касается первичных эталонов, то формулой (8.53) для установления довери- доверительных пределов можно пользоваться только в том слу- случае, если предварительные исследования покажут, что величины a, b и s\, полученные для первичных эталонов, существенно не отличаются от соответствующих значений для вторичных эталонов. В том частном случае, когда справедлива гипотеза линейности, выгодно работу планировать так, чтобы неиз- неизвестная проба анализировалась из п параллельных опре- определений, а графики строились по т эталонам, каждый из которых анализируется один раз. Тогда ошибка в опре- ? 2] РЕГРЕССИОННЫЙ АНАЛИЗ 297 делении пензи/ стной концентрации оудет равна 1 m Уп1+1~ VI (8.57) так как в этом случае s \Ут+1 У} ~ ( "^ ~Г — J sa ¦ Доверительные пределы для результатов анализа могут пыть установлены только в том случае, если градунровоч- ный график строится не менее, чем по трем эталонам. Результаты анализа трех эталонов имеют три степени сво- свободы; две из них используются для построения графика, а третья степень свободы может быть использована для оценки линейности графика. Именно в силу этого обстоя- обстоятельства в спектральном анализе для выполнения серий- серийных анализов был предложен так называемый метод «трех эталонов». При построении графика по трем этало- эталонам, естественно, мы в большинстве случаев получаем низкие значения s%, но доверительные пределы оказы- оказываются широкими, так как в формуле (8.53) <0,05 A) = 12,71. На это важное обстоятельство часто не обращают вни- внимания. В качестве примера, пользуясь формулами (8.52) и (8.54), подсчитаем коэффициент вариации при опреде- определении кремния по градуировочному графику, параметры которого были рассчитаны в табл. 8.2 (см. рис. 34 и 38), полагая, что проба анализируется из того же числа парал- параллельных определений, как и каждый из эталонов, исполь- использованных при построении графика. Рассмотрим сначала наиболее благоприятный случай, когда результаты изме- измерений ym+i = AS/у точно совпадают с у. В этом частном слу- случае, как уже указывалось выше, на результатах анализа не сказывается ошибка в определении угла наклона гра- графика, и мы получаем минимальное значение для коэффи- коэффициента вариации: 2,3x0,0231x100- I ^ 6 io/o 10— ' /0- и — 0,919432 В качестве второго примера рассчитаем коэффициент вариации для неблагопрятного случая при значении
298 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII Ут+i = 0,4078, когда отсчет результатов анализа произво- производится на краю графика, вблизи положения точки для последнего эталона: _ 2,3 х 0,0231 х 100 V ~ 0,919432 V 1 , @,4078 — 0.1578J Тб "г0,91У4322Х 0,231768 ~ 6,996. Ошибка анализа на краю градунровочного графика оказывается примерно на 13% больше, чем в центре гра- графика. Если на основании предыдущего опыта известно, что, пользуясь этим графиком, можно допустить некото- некоторую экстраполяцию, то для некоторого значения Ут+i = 0,5578, находящегося на значительном расстоянии от последнего эталона, получаем коэффициент вариации v ~ 8,1%, что уже более чем на 30% отличается от коэф- коэффициента вариации, получаемого в центре графика. При интерпретации этих ошибок надо иметь в виду, что они характеризуют не точность, а правильность анализа, как это следует из вывода формулы (8.52). Если графики построены по эталонам, химические анализы кото- которых выполнены недостаточно надежно, то указанные выше ошибки будут характеризовать расхождение в результа- результатах, полученных разными методами. Рассмотренный здесь прием оценки правильности вто- вторичных методов анализа является дальнейшим обоб- обобщением ранее изложенного способа определения методи- методических ошибок по стандартным образцам для первичных методов анализа. Надо еще раз подчеркнуть, что этим приемом оценки методических ошибок можно, конечно, пользоваться только тогда, когда эталоны и анализируе- анализируемые пробы получены в одинаковых условиях, т. е. когда графики построены по вторичным эталонам. § 3. Корреляционный анализ До сих пор мы рассматривали статистическую теорию линейных связей только в связи с проблемой эталониро- эталонирования и при этом априори полагали, что между перемен- переменными существует некоторая функциональная связь. Иногда в аналитической работе приходится иметь дело с более сложными задачами, при решении которых нельзя зара- заранее быть уверенным в том, что между изучаемыми перемен- § 3] КОРРЕЛЯЦИОННЫЙ АНАЛИЗ 299 ныли существует та или иная математическая связь. С подобной задачей мы сталкиваемся, например, при изучении флуктуации параметров градуировочпых гра- графиков. В этом случае важно бывает выяснить, существует ли связь между значениями параметров и такими внешними факторами, как температура воздуха, влаж- влажность и пр. Часто также важно бывает установить, суще- существует ли зависимость между некоторыми трудно под- поддающимися определению показателями качества про- продукции и другими показателями, легко поддающимися оценке. Решение всех подобных задач производится обычно с помощью корреляционного анализа, основанного на опре- определении и оценке коэффициента корреляции. Будем рассматривать двумерные наблюдения, т. е. такие наблюдения, которые дают значения двух случай- случайных величин х и у. Допустим, что для обоих признаков х и у выполняется гипотеза нормальности — в этом слу- случае говорят, что имеет место двумерное нормальное рас- распределение. Нам нужно проверить гипотезу о наличии стохастической линейной связи между двумя случайными переменными х и у. Введем новую статистическую характеристику —кова- рпацию или второй смешанный центральный момент (иначе—корреляционный момент) величин х и у: covfryH-Sfr-^-2'* ¦ (8.58) Сопоставим между собой три статистические характе- характеристики, полученные для двух случайных величин: „2 _ S (Х — Х) (Х—Х) cov (ху) = т—1 (х-х) (у-у) т—1 2 _ S (у—у) {у—у) у~~ т —1 Коэффициент корреляции гх следующим образом определяется с помощью этих трех величин: . _cov(ry)_ S(r-x)(y-y)_ (859)
300 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII Определенный по формуле (8.59) выборочный коэф- коэффициент корреляции является статистической оценкой теоретического коэффициента Q, определяемого выраже- выражением о{х, у} 0 = а{х}.а{у} ' где а {х, у} — теоретический смешанный момент второго порядка, который определяется равенством При вычислениях коэффициента корреляции материал располагают так, как это было показано в табл. 8.1 на стр. 264, и находят следующие суммы квадратов: щ B г/J (8.60) значения которых подставляют в формулу (8.59). При вычислениях можно произвольным образом смещать на- начало отсчетов для обеих переменных. Рассмотрим некоторые свойства коэффициента кор- корреляции. Найдем прежде всего соотношение между коэффициентом корреляции и коэффициентом регрес- регрессии у по х: ! — т S ХУ — S хS У r . S ху—тху __ Sa(SJ ~" SOJ ~ (х — х)(у — у) __ COV (ху) __ Sy (8.61) Следовательно, уравнение регрессии у по х может быть написано следующим образом: Y-y = rrSL(x-x). (8.62) КОРРЕЛЯЦИОННЫЙ АНАЛИЗ 301 При изучении статистических связей мы считаем, что обе переменные х и у можпо рассматривать как случай- случайные величины. Поэтому здесь имеет смысл написать также уравнение регрессии х но у: Х-х = Ь'(у-у). • )та линия регрессии обладает тем свойством, что дает .минимум суммы квадратов отклонений, измеряемых для каждой точки, параллельно оси х. Она позволяет полу- получить наилучшую оценку для х по заданному значению у. Угловой коэффициент здесь также можно выразить через коэффициент корреляции; тогда уравнение регрессии ж по у будет записано следующим образом: 96 X-* = rxv^(y-y). (8.63) Таким образом, мы получаем, вообще'говоря, два'урав- ненпя регрессии (8.62) и (8.63), которые отвечают двум различным математическим формулировкам задачи: в пер- иом случае минимальное значение имеет сумма квадратов отклонений, взятых параллельно оси ординат, во втором случае — сумма квадратов отклонений, взятых параллельно оси абсцисс. Выбор того или иного из этих двух урав- уравнений для описания наблюдаемой статистической связи является, конечно, совершенно произвольным. Он опре- определяется тем, которую из двух величин, х или у. счи- считаем заданной. Например, если изучаем зависимость пара- параметров градуировочных графиков от колебания темиера- i уры окружающего воздуха, то естественно, что физический смысл может иметь только одно уравнение регрессии, которое выражает зависимость величины изучаемого пара- параметра от температуры, рассматриваемой в данном случае как заданную величину. Если же изучается зависимость между двумя показателями качества продукции, то оба уравнения регрессии имеют физический смысл. Здесь для дальнейшего практического применения выбирается то уравнение, в котором независимой переменной является наиболее точно определяемая величина. При подсчете коэффициентов регрессии можно вос- воспользоваться суммами квадратов (8.60), найденными для
302 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ определения коэффициента корреляции: xysx ХУ\/ т-1 %(х-х)* * [ГЛ. VIII j B/— г/J а = у - Ьх, а'=х-Ь'у. Из (8.62) и (8.63) следует, что коэффициент корреля- корреляции можно рассматривать как среднее геометрическое из угловых коэффициентов двух линий регрессии: (8.64) Таким образом, корреляционный анализ является даль- дальнейшим обобщением регрессионного анализа. Ниже, на стр. 353, будет показано, как, пользуясь формулой (8.64), можно производить приближенную оценку коэффициента корреляции по сгруппированным данным. Рис. 39. Две линии регрессии, полу- полученные методом наименьших квадра- квадратов, для случая, когда гху находится между 0 и 1. На рис. 39 показаны две линии регрессии, соответст- соответствующие уравнениям (8.62) и (8.63) для случая, когда значение коэффициента корреляции находится где-то между 0 и 1. Прямые пересекаются в точке с коорди- КОРРЕЛЯЦИОННЫЙ АНАЛИ.Ч здо патами (х, у). Для этих прямых, очевидно, можно написать: b tP Поэтому тангенс угла между линиями регрессии будет равен: tg<p = tg (Р - а) = 6 Т 6 U «7 1 ху 1+tgptga rxy При гху = 1, tg<p = 0, следовательно, в этом частном случае обе линии регрессии совпадают. Двумерное рас- распределение вырождается в одномерное. Каждая из пере- переменных становится линейной функцией другой переменной. При гху=-0 мы получаем две взаимно перпендикуляр- перпендикулярные прямые Х = х, Y = y, параллельные координатным осям ц проходящие через точку с координатами (х, у). В этом случае очевидно, что между переменными не может существовать линейная статистическая связь. При значениях \г \, изменяющихся от 0 до 1, угол между линиями регрессии изменяется от 90° до 0°. Таким образом, абсолютная величина коэффициента корреляции служит мерой угла между двумя линиями регрессии, а следовательно, и мерой жесткости линейной связи между переменными. Г1з (8.61) следует, что знак коэффициента корреляции исегда совпадает со знаком углового коэффициента. По- Поэтому, если коэффициент корреляции имеет положитель- положительный знак, то это значит, что ж и у одновременно возрастают пли одновременно убывают. Если коэффициент корреля- корреляции имеет отрицательный знак, то это значит, что одна из переменных увеличивается, когда другая уменьшается. Одна из задач корреляционного анализа заключается в оценке реальности корреляционной связи. Если для обоих признаков х и у справедлива гипотеза нормальности и коэффициент коррелцпи для генеральной совокупности равен нулю, то, как это указывалось выше (см. стр. 97), случайная величина r = V(m-l)rxy, |Де /'^--выборочный коэффициент корреляции, имеет
304 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VII! r-распределение с числом степеней свободы / = т—2. Для удобства вычислений в табл. 8 Приложения табули- табулированы значения гху для различного числа степеней сво- свободы при р = 0,1, 0,05, 0,02, 0,01 и 0,001. Мы будем считать что наблюденное значение гху значимо отличается от нуля, если оно превосходит табличные значения для выбранного нами уровня значимости при числе степеней свободы / = т—2. При интерпретации коэффициентов корреляции надо быть крайне осторожным. Если величины хну стохасти- стохастически независимы, то безусловно г = 0. Но когда г = 0, это значит только, что между х и у не может существовать линейная корреляционная свзяь, но криволинейная связь может существовать. Для криволинейной корреляции зна- значение коэффициента корреляции может служит только мерой точности линейного по х приближения величины у. Корреляционную зависимость не следует путать с при- причинной зависимостью. В экспериментальной работе часто приходится наблюдать корреляционную связь между пере- переменными, обусловленную некоторыми другими факторами, которые не фиксируются в данном наблюдении. Здесь можно привести следующий любопытный пример непра- неправильной интерпретации корреляционной связи. При изучении технологического процесса на металлургиче- металлургическом заводе была обнаружена тесная корреляционная связь между содержанием углерода в металлической ванне по ее расплавлении и основностью шлака*). На этом основании была выдвинута гипотеза о возможности регу- регулирования содержания углерода по расплавлении путем наведения нужного шлака в период предшествующий рас- расплавлению. Проведенные опыты не привели к положитель- положительным результатам, так как содержание углерода в метал- металлической ванне не было причинно обусловлено основностью шлака. Обе эти величины определялись третьим факто- фактором—содержанием чугуна в шихте, взятой для завалки. Рассмотрим следующий пример: при изучении флук- флуктуации параметров градуировочных графиков в эмис- эмиссионном спектральном анализе в план работы было вклю- включено исследование корреляционных связей между пара- *) Основность шлака — ято отношение содержаний CaO/SiO2. 31 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ 005 метрами градуировочных графиков и значениями Д5/у для фикс-пары*). На рис. 40 приведена одна из полу- полученных диаграмм рассеяния, на которой по оси ординат отложены значения AS/y для фикс-пары, а по оси абсцисс значения свободного члена, полученного методом наимень- наименьших квадратов при построении градуировочного графика. В табл. 8.6 произведены подсчеты коэффициента корре- корреляции и коэффициентов регрессии. Коэффициент кор- корреляции здесь оказался равным гху = —0,511 при / = 21. 0J0 0.0 Роуяссия i/поЛ 0.0 0!0 Рис. 40. Диаграмма рассеяния для случая, когда между величинами х и у имеется слабая линейная корре- корреляционная связь. В таил. 8. Приложении имеются значения коэффициента корреляции только для / = 20 и / = 25. Применяя лнпиГшую интерполяцию, находим: г0H2 B1) = 0,483 и г0H] B1) = 0,527. Найденное нами значение коэффи- коэффициента корреляции находится ближе ко второй из этих величин, следовательно, менее, чем с 2%-ным риском сделать ошибку мы можем принять гипотезу о наличии корреляционной связи между двумя переменными. Гео- Геометрически полученные результаты можно интерпретиро- интерпретировать следующим образом: угол между двумя линиями регрессии, полученными методом наименьших квадратов, *) Фпкс-парой называется пара линии одного и того же элемента, выбранная так, что одна из них принадлежит спектру нейтрального атома, другая — спектру нона. Флуктуация зна- значении AS/y для фикс-нары вызвана изменением температуры воз- возбуждения. 20 в. В. Налимов
306 СТАТИСТИКА ЛШ1ЕППЫХ СВЯЗЕЙ [гл. VIII 'Г а о л и ц а 8.6 Подсчет коэффициента корре.ппин! и коэффициентов регрессии N 1 2 3 4 5 0 7 а О 9 10 И 12 13 14 15 10 17 18 19 20 21 22 23 а" 0,032 0,045 0,000 0,051 0,057 0,063 0,077 0,047 0,055 0,070 0,077 0,083 0,100 0,071 0,077 0,057 0,083 0,100 0,074 0,081 0,091 0,054 0,092 V 0, 0, 0, 0, 0, о, 0 о 0 0 о 0 0 0 0 0 0 0 0 0 0 0 0 106 114 122 104 102 108 111 088 080 091 090 091 089 086 081 073 070 006 059 057 059 ,056 ,037 ( 2 (х 2(?/ 2 (х гху= 7 L С Подсчет коэффициента корреляции: Zx = 1,597; 1у= 1,940; 2а;2--=0,118155; 2 if = 0,175302; Z.i-Г,т = 0,110887; (Zy)- яг = 0,164648; Z.n/ = 0,130024; Bг) Bу),т = 0,135120; - 7J = 0,118155-0,110887 =0,007268; -у)'2 = 0,175302— 0,164048 = 0,010054; — х) (У —«77 = 0,130624 — 0,135120 = = —0,004496; = - 0,004490/V/O,OO7208x0,010054=—0,511. Подсчет коэффициентов регрессии: 2х,то = 0,069435; 2у> =0,084009; -. / () 010054 'i • 0 "il 1 1/ ' и - о (\\п ' У 0,1ХO2((8 ~ ' ' 9> 0 51ll/°'UU7268- 0 492- ~ ' У 0,010654 - '4-2' (i = 0,085-(-0,619)-0,009 = 0,128, / = 0,009 — (—0,422) -0,085 = 0,105. Уравнении линий регрессии: У =—0,619а:-t-0,128, Х= — 0,422j/-j-0,105. существенно отличается от угла в 90°—это иллюстрируется рис. 40. Рассмотри»] следующие возможные области примене- применения корреляционного анализа: 1. При определении некоторых трудно поддающихся анализу компонентов часто представляет интерес устано- установить корреляционную связь между шиш и другими ком- компонентами, легко поддающимися анализу. Например, в [61, 62] изучалась корреляционная связь между содер- KOI'1'ИЛЯЦИОШГЫП Л II Л Л1ГЗ 307 жаппем кислорода и углерода и металлической ванне и .мартеновских почах. Было установлено, что существует корреляционная связь с коэффициентом корреляции /• 0.84 между содержанием кислорода и обратной вели- величиной содержания углерода. Содержание кислорода может быть определено по содержанию углерода с квадратичной ошибкой И)"о. -Зта ошибка может бить уменьшена до 1Г)'\> , если учесть состав шлака. 2. Прежде чем нводпть какой-либо нопын ипд анализа, часто бывает полезно выяснить, коррелирует ли он с темп показателями технологического процесса, для регулиро- регулирования которых он вводится. Наличие жесткой корреля- корреляции ян.чяетея критерием целесообразности введения этого нового метода анализа в значительно большей степени, чем сравнение его результатов сданными некоторого клас- классического метода, который в силу своей громоздкости ранее не применялся- для текущего контроля, В [95] при внедрении стплометрпческого метода определения оснои- гшетп в мартеновском шлаке было показано, что эта вели- величина хорошо коррелирует с содержанием серн п фосфора г. металле, п, следовательно; даже ее приближенное опре- определение имеет определенный технологический смысл. ?>. Часто при анализе вещества возникают затрудне- затруднения с выбором компонентов, подлежащих определению. Например, для контроля шлакового режима мартенов- мартеновской плавки можно определять раздельно железо в форме закпеного железа FeO и окпепого железа У\\2ОЯ или опре- определять суммарное содержание железа и выражать его с некоторой степенью условности в виде ГеОог;щ,. С точки зрения аналитика последний способ является наиболее удобным, так как он значительно упрощает аналитическую работу п позволяет этот вид анализа выполнять не только химическими, по п спектральными методами. Вопрос о корреляционных связях между различными формами окислов железа и другими технологически важными пока- показателями неоднократно исследовался (см., например, [61]), и было установлено, что в большинстве случаев можно ограничиться определенпе.и общего количества железа. 4, Применение корреляционного п регрессионного ана- лп.чои дает возможность получить значительно более пол- полную информацию при изучении ошибок воспроизводимости.
308 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII Например, в эмиссионном спектральном анализе обыч- обычно при изучении воспроизводимости ограничиваются определением рассеяния разности логарифмов интенсив- интенсивности аналитических линий от ее среднего значения, полученного при многократных повторных анализах пробы. При таком исследовании мы определяем ошибку воспро- воспроизводимости, которая дает нам информацию о точности анализа, но не получаем каких-либо дополнительных све- сведений о факторах, обусловливающих появление этой ошибки. В [146] было предложено при изучении воспро- воспроизводимости спектрального анализа строить диаграммы рассеяния, откладывая по координатным осям значения логарифмов интенсивности аналитических линий, полу- полученные при повторных анализах пробы. На рис. 41 в качестве примера приведено шесть таких диаграмм при двух различных способах приготовления пробы. Оче- Очевидно, что ошибка воспроизводимости для разности логарифмов интенсивности линий будет определяться, вообще говоря, тремя факторами: 1) степенью" близости к единице углового коэффициента линии регрессии, 2) рассеянием точек относительно линии регрессии, 3) протяженностью множества точек, которая характери- характеризует неустойчивость процесса испарения во времени. В предельном случае, когда угловой коэффициент равен единице и точки ложатся строго на линию регрессии, мы будем иметь ошибку воспроизводимости, равную нулю независимо от протяженности множества точек. Анализируя диаграммы рассеяния, можно получить некоторую дополнительную информацию о причинах появ- появления ошибок, а следовательно, и о процессах, происхо- происходящих при анализе вещества. Информация будет осо- особенно интересной, если получать диаграммы рассеяния в различные моменты после начала процесса испа- испарения, для различных пар линий и для разных условий проведения анализа. Сравнительное изучение этих диа- диаграмм может дать некоторое представление о процессах испарения вещества из кратера электрода, о колебаниях температуры возбуждения и об уширении спектральных линий. Можно дать строгий критерий для оценки точности спект- роаналитических методов при двумерном представлении § 3] КОРРЕЛЯЦИОННЫЙ АНАЛИЗ 309 Igl 2,0 Щ2928,75Л Ъ=0,2 Щ 2942,111 2,0 2,2 igi 2,2 2,0 1,8 Igl Mg - 2938,538 1У. b= • • f. ¦J: /: »¦ Mg*, '81,417 f 2,8 3,0 3,2 2,6 Al 256'7,9871 Al 2652,489 1 III' 2,2 2/t 2,6 Igl 2,0\ 1,8 1,6 Igl 1,8 Щ2928.75П t • I * • * • тг it i 1,8 2,0 ? I Mg2938,538 1 1,6 у: Щ 2781,417 I 2,2 2,4 Igl Igl 2,0 M 2567,987 I b-i,o hi 2652,489 I -j 1,6 1,8 2,0 i г '.У 'О /.,U 7 ; Рис. 41. Диаграммы рассеяния, полученные при испарении шпинели из кратера угольного электрода за первые 10 сек. Левые диаграммы относятся к пробе, смешанной с углем в от- отношении 1:3, правые диаграммы—к пробе, смешанной с углекис- углекислым барием и углем в отношении 1:19:20 [146].
310 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII результатов измерений, пользуясь контурными эллипсами, ограничивающими точки на диаграммах рассеяния [161а]. При построении контурных эллипсов производят линей- линейное (ортогональное) преобразование координат, переходя от переменных (х, у) к новым стохастически независи- независимым, нормально распределенным переменным (г)з, q) [30]. Новая система координат имеет своим началом точку (х, у). Ось ty совпадает с большой полуосью контурного эллип- эллипса *), образующей угол а с осью х, который определяет- определяется уравнением (8.65) Ось q перпендикулярна к оси \р. Уравнение контурного эллипса, отнесенное к новым осям координат, можно написать в следующем виде: ¦2 2 Л ' (8.66) где i2 находится по таблице //-распределения для двух й б Д ? i // степеней свободы. Дисперсии уравнениями и а? определяются + 2sxsy У 1 - rlv, si 2sxsy (8.67) Для построения контурного эллипса достаточно опре- определить значения \р, соответствующие q = 0, и значения q, соответствующие г)з = 0. Примеры построения контурного эллипса приведены на рис. 42 для значения Хо,ю B) = 4,6. Можно показать [30, 24], что площадь контурного эллипса пропорциональна величине Эту величину В. И. Романовский [24] предложил на- называть эллиптической дисперсией. *) Главная ось контурного эллипса называется линией орто- ортогональной регрессии, так как ее можно найти, обращая в мини- минимум суммы квадратов перпендикулярных к ней отклонений. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ 311 Очевидно, что при одном и том же уровне стабиль- стабильности источника возбуждения протяженность множества точек будет зависеть от величины средних значений переменных. Поэтому сравнивать площади контурных 06 0,7 0,8 0,9 1,0 1,1 tf 1,3 'У '/? 1,1 1,2 1,3 1/i 1,5 1,6 1,7 0,0 1.0 1,1 1,2 1,3 1/i Рис. 42. Контурные эллипсы, построенные при изучении четырех вариантов спектрального метода определения олова в раститель- растительных продуктах [161а]. эллипсов имеет смысл только тогда, когда все перемен- переменные имеют один и тот же вес. Это условие будет выпол- выполнено, если мы произведем преобразование переменных х и у по формулам:
312 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII После этого преобразования площадь эллипса будет пропорциональна эллиптической дисперсии Qpq — SpSq У 1 ху (8.69) Чем меньше будет эта величина, тем лучше будет воспро- воспроизводимость результатов анализов. Сравнивать площади эллипсов (эллиптические дисперсии) можно при помощи F-критерия при числе степеней свободы (пг—2, пг—2). Сравнение площадей контурных эллипсов имеет смысл делать, конечно, только в том случае, когда линия орто- ортогональной регрессии имеет угловой коэффициент, близкий ¦ к единице (а=45°), или когда эллипс вырождается в окруж- окружность, т. е. имеет место симметричное рассеяние точек относительно центра. Если же угловой коэффициент линии ортогональной регрессии сильно отличается от единицы и точки практически оказываются расположенными вдоль одной из координатных осей, то выбор условий проведе- проведения спектрального анализа надо считать явно неудачным. В качестве критерия для выбора благоприятных условий используется отношение дисперсий s\ и s\\ если дисперсии отличаются значимо, то данный вариант спектрального анализа признается неудовлетворительным и сравнение площадей контурных эллипсов пе производится. В качестве примера в табл. 8.7 приведены сопостав- сопоставления пяти вариантов определения натрия в раститель- растительных материалах с применением олова в качестве внутрен- внутреннего стандарта. Графически результаты определений пред- представлены на рис. 42. В варианте а источником э.д.с. слу- служит батарея, в варианте б—агрегат для дуги постоянного тока. Варианты ей г отличаются от вариантов а л б только применением воздушного потока, окружающего элек- электроды. Вариант д относится к вращающемуся электроду. В процессе вычислений было обнаружено, что для варианта е дисперсии s% и sy отличаются значимо. В этом случае точки будут практически располагаться относи- относительно прямой, параллельной одной из координатных осей. Выбор внутреннего стандарта здесь явно неудачен. Дальнейшие вычисления с данными, характеризующими Этот метод, не производились. § 3] КОРРЕЛЯЦИОННЫЙ АНАЛИЗ 31с Таблица 8.7 Сравнительное изучение пяти вариантов определения патрня в растительных материалах [161а] I Варианты метода*; Средние значении Дисперсии I У !п):|Дратич- 1 s.t и ыс ошибки / sy и iношение дис- дисперсий F К'олффшш- )г сит корре-\ .тянии )''" У1 ол а Квадратич- \а^ иые ошибки }oq if для q = О Q для i|) = О 0,61 0,28 0,0574 0,0292 0,240 0,171 1,07 0,8014 0,6422 33°2J' 0,2811 0,0873 +0,6032 ±0,1873 1435,6 1,31 0,55 0,0032 0,0017 0,056 0,041 1,89 0,9359 0,8759 35°27' 0,0685 0,0118 ±0,147 ±0,0254 10,3 г 1,22 0,60 0,0024 0,0012 0,046 0,034 1,78 0 0 0 0 3 а 1,25 3,78 ,0167 ,0044 ,129 ,067 ,75 —0,0031 0,00001 179°4J' 0,0460 0,0346 ±0,742 ±0,0987 21,7 Qa!Q6 10,4 QalQe 139,4 Qa/Qa 66,2 QIQs 13,4 Q6/Qa 6,4 Qe/Qe 2.1 ") Каждый вариант изучался по 1()-тп точкам. Статистический анализ остальных данных показал, что иг; риниты в и г дают лучшие результаты, чем варианты а и б. Р.-юлнчие между вариантами в и г оказалось незначимым (Va(^ = 2,l</-0>0s(8.8) = 3,4). Ь. Применение корреляционного анализа совместно •" дисперсионным анализом оказывается весьма эффектив- эффективном при изучении причин, вызывающих флуктуацию Панировочных графиков—этот вопрос подробно рас- •чотрен в следующем параграфе.
314 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII Раздел о корреляционном анализе мы изложили очень коротко, так как в аналитической работе до сих пор нашли применение только его простейшие приемы. Совершенно не рассмотрен вопрос о криволинейных корреляционных связях, так как в аналитической работе обычно ограни- ограничиваются изучением их линейного приближения. Не рас- рассматривается также вопрос о множественной корреляции, когда одновременно изучается статистическая связь между многими переменными. Этот метод статистического анализа до сих пор не получпл применения в аналитической работе, несмотря на то, что он очень широко используется при изучении технологических процессов. § 4. Пример комплексного планирования эксперимента с применением различных статистических методов анализа В аналитической работе часто приходится планировать эксперимент с комплексным использованием нескольких статистических методов исследования. В качестве при- примера рассмотрим работу по изучению точности и правиль- правильности спектрального анализа простых углеродистых сталей [135, 157]. Эксперимент планировался так, чтобы на пер- первом: этапе работы можно было разложить общую ошибку анализа на отдельные составляющие и оценить вклад, вносимый каждой из этих ошибок, в общий баланс ошибок. Были изучены следующие ошибки: афот—ошибка фото- метрированпя, апл—ошибка неоднородности фотопластинки и неравномерности проявления, агеп—ошибка, вызванная нестабильностью работы генератора п неоднородностью образца, СТе—суммарная ошибка воспроизводимости, вклю- включающая все перечисленные выше ошибки; схгр_гр—ошибка, обусловленная несовершенством построения градуировоч- ного графика, ОфШ—ошибка, связанная с особенностями физического состояния проб; аосщ—общая ошибка, равная /~<т2 <т'2 - У — + — т ген — ¦ О"Гр_Гр -|- 0"ф113 , где п—число спектрограмм, по которым выполняется анализ. Ошибки, полученные в единицах AS, пересчиты- j 4] ПРИМЕР КОМПЛЕКСНОГО IMAlIIU'OIi. ЭК< НЕР1ШЕ1ГГ \ '->\-> кались в проценты концентрации при помощи форму- формулы C.36). Разложение ошибок на отдельные составляющие пронз- иоднлось с помощью тех формул, которыми обычно поль- пользуются в дисперсионном анализе. Ошибка a(j,,;., обуслов- обусловленная особенностями физического состояния пробы, определялась из дисперсии, характеризующей нелиней- нелинейность градупровочноро графика. Для определения ошибки о",-р-гр, характеризующей несовершенство построения гра- графика, па 30 пластинках в течение I .Г> месяца снимались спектры нескольких проб и производились анализы с применением различных методов построения градупро- вочиых графиков. Для каждого метода построения гра- графика подсчптывалась ошибка анализа но отношению к среднему , полученному за 1,5 месяца, и пз нее по закону квадратов вычиталась суммарная ошибка воспроизво- воспроизводимости. Таким образом удалось определить некоторую среднюю величину ошибки, связанную с тем или иным способом построения графика. Часть полученного материала приведена в табл. 8.8. Эта таблица даст возможность наглядно представить себе вклад, вносимый отдельными ошибками в общий баланс ошибок, в условиях, когда анализы выдаются как среднее пз четырех спектрограмм. Оказывается, что почти всегда в общем, балансе ошибок 60—80% падает па долю методи- методических ошибок: сгГр_Гр и сгфп.1. Если рассматривать отдельно суммарную ошибку воспроизводимости, то там основную роль играет аг(.и. Особое внимание надо обратить на о"ф,м. Величина этой ошибки, конечно, установлена грубо. Реальность ее уда- удалось подтвердить дополнительно прямыми эксперимен- экспериментами. Если текущие анализы проб выполняются каким- нибудь одним методом, например с применением дугового возбуждения, то за длительный период времени удается отобрать несколько проб, которые дают упорное расхож- расхождение с данными химического анализа. Если эти же пробы затем подвергнуть спектральному анализу с искро- искровым возбуждением, то результаты спектрального анализа оказываются достаточно близкими к данным химического анализа. В свою очередь если текущие анализы вести с. применением искрового режима, то опять-таки удается
Таблица 8.8 Коэффициент вариации спектрографического анализа сталей при дуговом и искровом методах возбуждения и четырехкратном сжигании пробы [135] со Источник возбуждения и условия сжигания <об = 0 <эк = 7 сек. too = Ю сек. tm = 20 сек. Метод построения графика Метод двух конт- контрольных этало- эталонов Метод одного контрольного эталона Пары линий Sil 2516,123 А Fel 2518,101 А Sil 2881,578 А Fe 2880,6/8 А Мп 2933,06 А Fell 2926,59 А Sil 2881,578 А Fel 2869,3 А Мп 2939,3 А Fell 2926,6 А «ген vt- 3,8 24,8о/о 4,4 38о/о 2,36 14% 1,35 4% 0,99 6% ¦"ал VT 0,83 1,2% 0,83 1,4% 0,56 0,8% 1,20 3% 0,70 3,0% и фот ) VT 1,20 2,5% 1,20 2,9% 0,80 1,6% 1,17 3% 0,80 4% "гр—гр 5,03 43,9% 5,03 50% 4,81 60,3% 5,0 55% 1,45 13,4% ¦"физ 4,0 27,6% 1,88 6,9% 3,0 23,3% 4,0 35% 3,4 73,4% "общ") 7,6 100% 7,1 100% 6,2 100% 6,8 100% 3,98 100% о > н я о я к > я и н в и Е X о и м со и в 03 Рч й О К toe = 20 сек. tm = 40 сек. «об = 20 сек. t3K = 10 сек. toe =20 сек. гэк = 40 сек. Метор трех этало- эталонов igCj—lgC3= =0,7 Метод двух контрольных эталонов Метод одного контрольного эталона Sil 2881,578 А Fe 2880,6/8 А Мп 2933,063 А Fel 2929,01 А Sil 2881,578 А Fe 2880,6/8 А Мп 2933,063 А Fel 2929,01 А Sil 2881,578 А Fe 2880,6/8 А Мп 2933,063 А Fel 2929,01 А 2,33 26,4% 2,02 18,2% 4,0 46% 3,05 17% 2,33 11,3% 2,02 15,4% 1 0,88 3,8% 0,65 1,8% 0,89 2,0% 0,65 0,7% 0,88 1,6% 0,65 1,6% 1,25 12,3% 0,93 3,8% 1,25 7% 0,93 1,5% 1,25 5,5% 0,93 3,2% 2,0 19,4% 3,8 63,6% 3,32 31% 4,45 36% 5,5 65% 4,3 69% 2,80 38,1% 1,7 12,6% 2,26 14% 5,0 45% 2,80 16,6% 1,7 11% 4,55 100% 4,75 100% 5,85 100% 7,40 100% 6,85 100% 5,18 100% *) Большое значение афот объясняется тем, что измерения производились в заводской лаборато- лаборатории в очень неблагоприятных условиях—близко от железнодорожных путей копрового цеха и пр. **) В этой таблице за 100% взято а^щ и затем по закону квадратов подсчитана доля каждой ошибки. я 13 S S, в 13 я о к и н о и о о а > я s v о а а а в я s н и >
318 <тлтп.тпкл липкппих Ir.i. VIII отобрать часть проб, которые дают упорное расхождение с данными химического анализа. Это расхождение устра- устраняется, если пробы подвергнуть спектральному анализу с дуговым возбуждением. Таким образом, ошибки, обуслов- обусловленные особенностями физического состояния пробы, ока- оказываются независимыми для различных видов возбужде- возбуждения. Несколько примеров, иллюстрирующих это инте- интересное явление, приведены в табл. 8.9. Таблица 8.9 Примеры больших расхождений результатов спектрального и химического анализов при различных источниках возбуждения [135] Номера проб 5284 4470 0038 БФ Si, спектральный дуга 0,24 0,30 искра 0,29 0,37 о/ /0 химиче- химический 0,27 0,36 Мп, %1 спектральный дуга 0,65 0,63 0,65 искра 0,56 0,57 0,80 химиче- химический 0,64 0,55 0,68 Данные, приведенные и этой таблице, представляют собой средний результат многократных повторных ана- анализов, поэтому ошибки воспроизводимости здесь практи- практически исключены. Ошибки, обусловленные особенностями физического состояния проб, являются постоянной вели- величиной по отношению к многократным анализам какой- нибудь одной пробы и случайной величиной по отноше- отношению к множеству анализов различных по своему составу проб. Примеры, приведенные в табл. 8.9 , относятся к про- пробам, с такими особенностями физического состояния, вероятность появления которых мала. В среднем коэффи- коэффициенты вариации, обусловленные особенностями физи- физического состояния пробы, находятся в пределах 2-^4% — они могут быть обнаружены только проверкой гипотезы линейности градупровочного графика. Из рассмотрения табл. 8.8 следует, что в общем балансе ошибок большую роль играет ошибка, связанная с неста- § 4] ПРИМЕР КОМПЛЕКСНОГО ПЛАНШ'ОВ. ЭКСПЕРИМЕНТА ЗИ1 оильностью градуировочных графиков и упрощенным спо- способом контроля за их смещением (метод одного и двух контрольных эталонов). Упрощенный способ построения градуировочного графика по методу «трех эталонов» также не приводит к существенному улучшению резуль- результатов анализа. Поэтому на втором этапе работы экспери- эксперименты планировались так, чтобы можно было изучить причины, вызывающие флуктуацию параметров градуи- градуировочных графиков с тем, чтобы в дальнейшем перейти к работе по методу постоянного графика, надежно уста- установленному по большому числу эталонов. Стабильность градуировочных графиков изучалась для анализов: углеродистой стали па содержание Mn, Si, Cr, Ni в дуговом режиме генератора ДГ-1; среднелегиро- ванной стали на содержание Cr, Ni, Si, Ma и Си; углероди- углеродистой стали на Si, Mn, Си, кремнистой латуни на Zn и Si и мартеновского шлака (брикеты на медной основе) на FeO, МпО и CaO/SiO2 в искровом режиме генератора ИГ-2, собранного по сложной схеме. Применялись фотопла- фотопластинки, специально выпускаемые для спектрального ана- анализа. Фактор контрастности определялся при помощи гомологических пар линий железа, принадлежащих одно- одному мультпплету. В течение 2—3 месяцев с интервалом в 2—3 дня снимались спектры каждой серии эталонов на отдельную пластинку, причем спектр каждого эта- эталона снимался по 3 раза. В итоге для каждой серии эталонов было получено по 30 пластинок, содержащих 90 спектрограмм каждого эталона. Градуировочные гра- графики строились, как обычно, согласно уравнению ^- = 61gc-flg<i, параметры которого F и lg а) определялись методом наи- наименьших квадратов для каждой пластинки в отдельности. Прежде всего представляло интерес выяснить, имеет ли место параллельное смещение графиков во времени. Для большинства из тех комплектов эталонов, с которыми мы имели дело, не могла быть принята гипотеза линей- линейности. Поэтому проверка гипотезы о параллельном смеще- смещении графиков производилась так, как это было показано на стр. 293. Результаты подсчетов показали, что имеет
320 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [ГЛ. VIII место флуктуация обоих параметров без преимущественно параллельного смещения графиков. Дисперсия, характеризующая рассеяние результатов анализа каждого из эталонов относительно их среднего значения, полученного по всем 30 пластинкам, была раз- разложена с помощью дисперсионного анализа на две величи- величины: а2ВОсп—дисперсию, обусловленную ошибкой воспроиз- воспроизводимости, получаемой за короткий промежуток времени при фотографировании спектров проб на одной пластинке, и От—дисперсию, обусловленную факторами, медленно меняющимися во времени, и недостаточно точным учетом свойств пластинки. Пользуясь законом накопления оши- ошибок дисперсию от можно представить выражением (ASJ Y4 ai. (8.70) Здесь als—дисперсия, вызванная флуктуацией во вре- времени величины AS, оу —дисперсия, обусловленная не- несовершенством способа учета фактора контрастности 0,04 0,03 0,02 0,01 02т =0,00025 *0,015{AS)' OJ 0,2 0,3 0,4 0,5 л8 Рис. 43. Зависимость от от AS. Искра, сталь легированная, Си I 3274,0—Fe 3286,8, Д?=6 эв [157]. фотопластинки.Уравнение (8.70) изображается гиперболой с координатами (AS, от)- На рис. 43 в качестве примера приведена кривая, полученная при определении меди в стали. Пользуясь уравнением (8.70), с помощью метода § 4] ПРИМЕР КОМПЛЕКСНОГО ПЛАНИРОВ. ЭКСПЕРИМЕНТА 321 наименьших квадратов были определены параметры гипер- гиперболы Оу и сгдэ Для каждой аналитической пары линий. Обнаружилась отчетливая корреляционная связь меж» ду о"дэ и степенью негомологичности аналитических линий, представленная на рис. 44. За меру негомологичности Рис. 44. Зависимость а, от степени S негомологичности аналитических ли- линий, измеренной путем варьирования самоиндукции в колебательном кон- контуре [157]. была принята величина, которая может быть выражена с помощью AR/R, полученная при варьировании самоиндукции в колебательном контуре источника воз- возбуждения. Коэффициент корреляции оказался равным гху = 0,87 при / = 13. Чтобы оценить реальность корре- корреляционной связи, обратимся к табл. 8 Приложений. Эта таблица составлена для двухстороннего критерия. В нашем случае надо пользоваться односторонним критерием,' так как априори мы можем считать, что альтернативой к нуле- нулевой гипотезе может быть только гипотеза гху > 0 (гипотезу гху < 0 в данном случае исключаем, исходяиз физических соображений). Поэтому приведенные в табл. 8 Прило- Приложений уровни значимости нужно разделить на 2. Полу- Полученный коэффициент корреляции превосходит указанное в таблице значение г0H01 A3) = 0,760 или, пользуясь односторонним критерием, можно считать, что найденное значение гху— 0,87 превосходит также значение го,ООО5 A3) = = 0,760, следовательно, наличие линейной корреляции здесь не вызывает сомнений. Аналогичная корреляция 21 В. В. Налимов
322 СТАТИСТИКА ЛИНЕЙНЫХ СВЯЗЕЙ [гл. VIII оказалась между aAs и разностью энергетических уровней аналитических линий. В этом случае на график удалось нанести меньше точек, так как не для всех применяемых аналитических линий были найдены величины потенциа- потенциалов возбуждения. Коэффициент корреляции в этом слу- случае равен гху = 0,80 при / = 5; эта величина превосходит значение г0;025 E) = 0,754 для одностороннего критерия, но меньше значения г0H1 E) = 0,833. Наличие такой корреляционной связи указывает на то, что a&s обусловлена медленными флуктуациями темпе- температуры возбуждения, заметными лишь при длительных наблюдениях. Этот вывод подтверждается также корре- корреляцией между величиной отрезка, отсекаемого по оси ор- ординат градуировочным графиком, построенным для него- негомологических линий, и значениями разности почернений для фиксопары (см. пример на стр. 305). Между аВОсп и степенью негомологичности аналитических линий корре- корреляционная связь не обнаружена. Не обнаружены связи между флуктуацией параметров градуировочных графи- графиков и такими внешними факторами, как изменение тем- температуры, влажности и давления окружающего воздуха. Значения ау оказались в пределах от 0,05 до 0,24, что соответствует относительной ошибке в определении фак- фактора контрастности в пределах от 3,5 до 17%. Специаль- Специальные измерения показали, что столь значительные вели- величины ау нельзя объяснить непостоянством у для различ- различных участков пластинки, обусловленных ее неоднород- неоднородностью (эта величина характеризуется коэффициентом вариации в 3%). Нельзя объяснить большое значение ау и удаленностью аналитических пар от линий, по которым определяется фактор контрастности. Для области длин волн от 3600 до 2400 А не наблюдается корреляционной зависимости величины ау от расстояния между аналитиче- аналитическими парами и парами, служащими для определения фак- фактора контрастности. Нельзя объяснить большое значение ау также и нестабильностью пар линий, выбранных для определения фактора контрастности, так как наблюдается большое различие в величинах ау для различных анали- аналитических пар при использовании одного и того же значе- значения фактора контрастности. Замена одних линий другими при определении фактора контрастности не привела § 4] ПРИМЕР КОМПЛЕКСНОГО ПЛАНИРОВ. ЭКСПЕРИМЕНТА 323 к улучшению результатов. Кроме того, не было обнару- обнаружено корреляционной связи между параметрами градуи- градуировочных графиков (lg а и Ь), построенных для анали- аналитических пар, составленных из близко расположенных гомологических линий. Следовательно, даже для таких пар линий нельзя найти одного поправочного коэффициента, на который нужно было бы умножать фактор контраст- контрастности, чтобы получить его универсальное значение, позво- позволяющее производить анализы по различным аналитиче- аналитическим парам. Таким образом, из совокупности всех изло- изложенных данных мы приходим к выводу, что большое значение ау вызвано локальными изменениями фактора контрастности, связанными с эффектом проявления. В результате этой работы оказалось возможным наме- наметить ряд мероприятий, которые следует осуществить для перехода на работу по методу постоянного графика. Пре- Прежде всего необходимо вернуться к практике применения возможно более гомологических пар аналитических линий с тем, чтобы резко снизить o&s. Для уменьшения ау сле- следует пользоваться приемами, которые применяются в пре- прецизионной сенситометрии: работать при значениях у, близ- близких к уоо, перемешивать энергично проявитель при помощи механически движущихся кисточек (или тампонов и про- прочих приспособлений) с тем, чтобы удалить бромиды, обра- образующиеся в тонком слое проявителя и адсорбирующиеся на поверхности эмульсии; строго стандартизировать про- процесс проявления с тем, чтобы можно было пользоваться постоянным значением у и таким образом избежать упро- упрощенных и недостаточно надежных способов учета свойств пластинки. К сожалению, далеко не всегда представляется воз- возможным выбрать достаточно гомологические аналити- аналитические линии. Тогда, если ау = 0 (это может быть, когда очень хорошо отработаны условия проявления и способ учета у или когда регистрация производится при помощи прямых фотоэлектрических методов), то мы можем ожидать парал- параллельное смещение графиков, если учесть, что Gas линейно связана с изменением температуры возбуждения. Для доказательства этого положения напишем основное урав- уравнение количественного спектрального анализа для наиболее сложного случая использования дуговой и 21*
324 статистика Линейных связей [гл. VIII искровой линии: У -fefg- " (кТJсъ. После логарифмирования и дифференцирования по R и Т получим: ДЛ_ [F-H?i — Е2)]АТ , 5 ДТ R ~ кТ2 2 Т в предположении, что Ь не зависит от Т. Отсюда сле- следует, что при изменении температуры возбуждения на AT независимо от концентрации определяемого ком- компонента с остается постоянным отношение AR/R. Следо- Следовательно, мы можем написать: — /t, -jj- — Л. -f- I, R R R т. е. график, построенный в координатах \g R, смещается параллельно при изменении температуры возбуждения на AT, если aY = 0. В этом частном случае для контроля за смещением градуировочного графика во времени можно пользоваться одним контрольным эталоном, проводя через соответствующую ему точку прямую, параллельную основному графику, надежно построенному по большому числу эталонов. Рассмотренный пример интересен тем, что он показы- показывает эффективность комплексного применения различных статистических методов анализа при планировании экс- эксперимента. Здесь важно также отметить то обстоятельство, что применение дисперсионного анализа дало возмож- возможность проводить опыты в условиях, когда варьировали оба фактора—изменение температуры возбуждения, с одной стороны, и процесс обработки фотопластинки, с другой стороны. При классической постановке экспери- экспериментов опыты нужно было бы разбить на две серии так, чтобы в каждой из них варьировал только один фактор, а другой оставался на строго постоянном уровне. Такая постановка экспериментов была бы чрезвычайно громозд- громоздкой и трудоемкой. ГЛАВА IX НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ, СВЯЗАННЫЕ СО СТАТИСТИЧЕСКИМ ПЛАНИРОВАНИЕМ ЭКСПЕРИМЕНТА § 1. Отбор проб и рандомизация условий эксперимента*). Применение таблицы случайных чисел В предыдущих главах рассматривались различные методы статистических исследований и связанные с ними приемы планирования эксперимента. Какой бы прием планирования эксперимента ни был принят, всегда надо позаботиться о том, чтобы условия проведения экспери- эксперимента не вносили дополнительных систематических погрешностей. Поэтому условия проведения эксперимента должны быть всегда выбраны так, чтобы по отношению к ним были рандомизированы все те факторы, которые находятся в неподконтрольном состоянии. К таким фак- факторам, например, может относиться неоднородность мате- материала, нестабильность результатов анализа во времени, неоднородность фотоэмульсии в фотографических мето- методах анализа и т. д. Рассмотрим простейший пример: допустим, что нужно отобрать пробу из неоднородного материала так, чтобы выборка возможно более походила на изучаемый материал. Если материал находится в вагонах, контейнерах и пр., то можно переномеровать эти объекты, написать эти номера на фишках, тщательно их перетасовать и затем наудачу выбрать столько фишек, сколько членов должно войти в нашу выборку. Если материал представляет собой *) Рандомизировать условия эксперимента — обеспечить слу- случайный характер их изменений.
326 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [гл. IX сыпучий объект, то его можно разравнять, а затем на него нанести сетку и квадраты ее переномеровать. Случайный выбор номеров удобнее делать с помощью специальной таблицы случайных чисел (см. табл. 14 Прило- Приложений). Таблица состоит из шести страниц, каждая из которых содержит по 2500 случайных чисел, сгруппиро- сгруппированных в столбцы. Допустим, например, что нам нужно из совокупности в 80 объектов извлечь случайную выборку объемом в 10 объектов. Перенумеруем объекты нашей совокуп- совокупности номерами 0, 1, 2 и т. д. до 79. Откроем наугад какую-нибудь, папример вторую, страницу табл. 14 При- Приложений, и возьмем из нее в каком-нибудь случайно выбранном месте, например во втором столбце, первые 10 двузначных чисел, опуская одинаковые числа, если они встретятся, и числа, превышающие 79. Этим способом мы получим следующие числа: 66 40 63 25 61 44 24 27 39 52. Выбранный случайным образом порядок отбора нельзя нарушать под влиянием каких-то неслучайных факторов. Иногда работнику, занятому отбором проб, кажется, что, если числа выбраны случайно, то вместо трудно открывающегося контейнера, предназначенного для отбора проб, можно воспользоваться соседним, легко открывающимся. Или, вместо того чтобы отбирать пробу от вагона с крупногабаритным материалом, можно ото- отобрать ее в соседнем вагоне с более мелким материалом. Такое нарушение случайного отбора часто ведет к полу- получению искаженных результатов. Все хорошо упакован- упакованные контейнеры могут принадлежать к продукции, полу- полученной в одной смене, все вагоны с крупным материалом— одному участку месторождения, а эти объекты окажутся исключенными при отборе проб. Иногда применяется так называемый механический отбор, когда объекты, подлежащие отбору, выбираются периодически через определенные интервалы. Такой спо- способ отбора также иногда может привести к искаженным результатам, так как периодичность отбора проб может совпасть с некоторой периодичностью в выпуске продук- продукции. § 1] ОТБОР ПРОБ И РАНДОМИЗАЦИЯ УСЛОВИИ ЭКСПЕРИМ. 327 Объем выборки можно определить, если на основании предыдущих опытов известна величина ох, характеризую- характеризующая неоднородность продукции по объектам отбора, и в спецификации или в технических условиях оговорена допустимая величина о-. Если бы мы имели дело с выбор- выборкой из бесконечной генеральной совокупности, то объем выборки определялся бы формулой ах = аЦп. Практически мы всегда имеем дело с конечными совокупностями, из кото- которых производится бесповториая выборка. Поэтому для определения объема выборки нужно, вообще говоря, пользоваться формулой " ЛИ). Р-ц где п—объем выборки, N—число элементов в генеральной совокупности, ох —дисперсия, характеризующая рассея- рассеяние между этими элементами. Множитель (N—n)/(N—1) называется поправкой к конечной совокупности. Если берется 100%-ная выборка, то очевидно, что ошибка сред- среднего, обусловленная неоднородностью по объектам, будет равна нулю. Практически в большинстве случаев nIN обычно бывает значительно меньше единицы, и тогда по- поправкой можно пренебречь. Например, если п = 0,1 N, то ! !_ N-n Л' _лп В этом случае можно с достаточным приближением поль- пользоваться формулой а~ = Ох/п. Рассмотрим на простейшем примере применение таб- таблицы случайных чисел для рандомизации условий экспе- эксперимента. Допустим, например, что с помощью эмиссион- эмиссионного спектрального анализа фотографическими методами регистрации изучается какой-нибудь эффект, например влияние «третьих элементов» при анализе растворов, или неоднородность какого-нибудь слитка и пр. Часто экспе- эксперименты в таких случаях ставятся так, что сначала экспо- экспонируется несколько спектрограмм при каком-нибудь одном уровне изучаемого фактора, затем экспонируется такое же число спектрограмм при каком-нибудь другом уровне и т. д.
328 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [ГЛ. IX Результаты такого эксперимента не могут быть одно- однозначно интерпретированы. Средние значения по каждой серии экспериментов могут отличаться как в силу дей- действия изучаемого фактора, так и в силу некоторой неиз- неизвестной нам закономерности в неоднородности фотогра- фотографической эмульсии и возможной флуктуации результатов анализа во времени. Результаты фотометрирования лежа- лежащих близко друг к другу спектрограмм, вообще говоря, нельзя рассматривать как независимые измерения, так как в этом случае отсчеты, сделанные на микрофотометре, могут быть несколько коррелированы. Поэтому при правиль- правильном планировании эксперимента спектрограммы нужно располагать на фотопластинке случайным образом. Это опять-таки можно сделать, пользуясь таблицей случайных чисел. Составим сначала план эксперимента, располагая опыты в некотором нужном нам порядке. Затем, поль- пользуясь таблицей случайных чисел, найдем последователь- последовательность, в которой их нужно расположить на фотопластинке. Допустим, что нам нужно изучить 15 уровней какого-то фактора, проводя опыты с четырехкратным повторением. Откроем любую, например четвертую страницу таблицы случайных чисел и, пользуясь первым столбцом, найдем следующий порядок экспонирования спектрограмм для фотопластинки, на которой можно поместить 60 спектров: Первая серия опытов Вторая серия опытов и т д Номер спектрограммы .... 1234 1234 Порядок экспонирования спектрограмм 13 18 11 38 23 09 55 40 При таком планировании эксперимента неоднород- неоднородность фотопластинки и нестабильность анализов во вре- времени войдут как составные части в ошибку эксперимента. Полученные результаты можно будет дальше обрабаты- обрабатывать с помощью дисперсионного анализа. § 2. Выбор числа параллельных определений После того как отобрана проба, возникает вопрос о выборе оптимального числа определений. Эта задача является очень сложной, так как здесь, с одной стороны, надо учитывать вероятность сделать ошибку первого 2] ВЫБОР ЧИСЛА ПАРАЛЛЕЛЬНЫХ ОПРЕДЕЛЕНИЙ 329 рода—не принять нулевую гипотезу тогда, когда она в действительности верна, и, с другой стороны, вероят- вероятность сделать ошибку второго рода—принять нулевую гипотезу, когда она неверна. Рассмотрим следующий пример: заводская лаборато- лаборатория должна выбрать число параллельных определений так, чтобы риск принять плавку с содержанием вредной примеси—серы более чем 0,050%,—был менее 1 %. Из пре- предыдущего опыта известно, что ошибка анализа а = 0,003% и результаты анализа подчиняются нормальному распре- распределению. Здесь в качестве нулевой гипотезы мы выбираем утверждение jx = 0,050%, в качестве альтернативной гипотезы: fx > 0,050%. Допустим, что па основании сложившихся традиций анализы делаются, как правило, из двух параллельных определений. Посмотрим, к каким результатам это при- приводит. Чтобы риск принять плавку с содержанием серы боль- больше 0,050% был не более 0,01, мы должны в качестве верх- верхнего браковочного предела выбрать величину х, опре- определяемую формулой •"о — го ^2 ' — где fx0 = 0,050, а = 0,030, Ui_p —квантиль нормированного нормального распределения, равная и4_р = 2,33 при р = 0,01. Подставляя числовые значения в (9.2), получаем: х0 = 0,050-2'33;^003 = 0,045. V 2 Следовательно, если мы будем делать анализы из двух параллельных определений и браковать все плавки с содержанием серы более 0,045, то вероятность принять плавку с недопустимо большим содержанием серы будет меньше 0,01. Такая ситуация вполне устроит потребителя стали, но она будет крайне невыгодна для завода-изгото- завода-изготовителя, так как мы часто будем делать ошибку первого рода—браковать годную продукцию. Чтобы наглядно
330 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [ГЛ. IX представить себе вероятность появления ошибки первого рода при различном содержании серы в металле, построим так называемую кривую функции мощности для_и-кри- тория, пользуясь формулой Им = (9.3) в которой в качестве независимой переменной будем рас- рассматривать [х—действительное содержание вещества в л1,00 Р 0,70 Щ 0,50 0,40 030 иго Ц050 Рис. 45. Кривые функции мощности для гс = 2 (кривая /) и п — 1 (кри- (кривая //). По оси абсцисс ц—процент действи- действительного содержания вещества в пробе; по оси ординат р—вероятность приня- принятия продукции. пробе. С помощью табл. 1 Приложений найдем вероят- вероятность р = Ф(%) для выбранных значений \i. При построе- построении кривой функции мощности по оси абсцисс будем откладывать значения ц, а по оси ординат р. На рис. 45 / обозначена кривая функция мощности, построенная для двух параллельных определений. Из рас- рассмотрения этой кривой следует, что при выбранных нами условиях анализа мы примем только 1% плавок с содер- содержанием серы > 0,050%. Но в то же время при действи- действительном содержании серы в металле ц = 0,045% в силу §2] ВЫБОР ЧИСЛА ПАРАЛЛЕЛЬНЫХ ОПРЕДЕЛЕНИЙ 331 ошибок анализа будет забраковано 50% плавок, а при содержании серы ц = 0,042% не будет принято 8% плавок. Наклон кривой функции мощности при заданной вели- величине ошибки определяется числом параллельных опре- определений. Чем больше будет параллельных определений, тем круче пойдет кривая и тем меньше будет вероятность появления ошибки второго рода. В предельном случае, когда п—> со , мы получим прямую, параллельную оси ординат, с абсциссой, равной 0,050. Только в этом случае будут приняты все плавки с содержанием серы меньше 0,050%. Чтобы контроль за содержанием серы сделать прием- приемлемым для завода-изготовителя, нужно, очевидно, уве- увеличить число параллельных определений. При выборе числа параллельных определений можно дополнительно потребовать, например, чтобы вероятность а появления ошибки первого рода была не более 0,02 при действитель- действительном содержании серы в пробе [хх = 0,045%. Тогда число параллельных определений определяется формулой (9.4) где б = ц0 — fxx = 0,050— 0,045 = 0,005, Mi_p = 2,33, p = 0,01; Mi_a = 2,03, a = 0,02. Подставляя в (9.4) числовые значения, получим: п = B,33 + 2,05J @,003/0,005J = 6,9. Таким образом, чтобы выполнялись оба сформулиро- сформулированных выше условия, необходимо сделать семь парал- параллельных определений при выполнении маркировочного анализа. Верхний браковочный предел в этом случае будет равен: х0 = 0,050-2'33^003 = 0,0474. Кривая функция мощности для п — 1 на рис. 45 поме- помечена //. Она поднимается значительно более круто, чем
332 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [гл. IX кривая /. Из рассмотрения этой кривой следует, что при содержании серы в пробе, равном 0,045%, вероятность забраковать плавку теперь уже равна 0,02. При содер- содержании серы 0,047% вероятность забраковать плавку из-за ошибок анализа все же равна 0,33, в предыдущем случае при п = 2 она была равна 0,83. Такая органи- организация работы представляется уже вполне приемлемой с точки зрения как поставщика, так и потребителя, но она крайне неудобна для лаборатории из-за своей гро- громоздкости. Найденное нами число параллельных определений п— 7 является средней величиной, которую мы опреде- определили, не зная содержания серы в той или иной конкрет- конкретной пробе. Если, например, первые два параллельных определения дадут нам среднее содержание серы, равное 0,030%, то вряд ли имеет смысл продолжать анализы. Выбор числа определений становится более экономичным, если учесть первые результаты анализа. Так обычно посту- поступают в лабораториях при маркировочных анализах. Пер- Первые анализы обычно делаются из двух параллельных определений, и если найденное содержание вредной при- примеси оказывается близким к пределу, то число параллель- параллельных определений увеличивают. Но при этом всегда возникает вопрос—до какого количества надо увеличи- увеличивать число параллельных определений по мере прибли- приближения среднего результата анализа к браковочной границе. Ответ.на этот вопрос дает секвенциальный анализ (см. § 4 гл. VI), применение которого, как уже указыва- указывалось выше, в среднем в два раза сокращает объем анали- аналитической работы. Секвенциальный анализ является есте- естественным обобщением того приема работы, к которому интуитивным путем пришли лабораторные работники. Но нужно иметь в виду, что секвенциальный анализ не всегда оказывается приемлемым. В некоторых слу- случаях, например в эмиссионном спектральном анализе с фотографической регистрацией, надо заранее устано- установить окончательное число спектрограмм, так как каждая дополнительная спектрограмма потребовала бы повторе- повторения всего весьма трудоемкого цикла работы, связанного с обработкой фотопластинки. ВЫБОР ЧИСЛА ПАРАЛЛЕЛЬНЫХ ОПРЕДЕЛЕНИЙ 333 Рассмотренный выше пример интересен тем, что он дает возможность наглядно представить себе ту сложную ситуацию, с которой приходится сталкиваться аналитику при выборе числа параллельных определений. Для разум- разумного выбора верхнего предела содержания примеси необ- необходимо, чтобы между допустимым содержанием вещества, указанным в спецификации, и верхним пределом содержа- содержания примеси, предусмотренным технологической инструк- инструкцией, был разрыв, величина которого обусловливается тем элементом неопределенности, который вносится неточ- неточностью анализа. Чтобы рассмотренная выше схема была вполне приемлемой для завода-изготовителя, нужно, чтобы технология ведения мартеновского процесса обеспечи- обеспечивала получение подавляющего большинства плавок с содержанием серы не более 0,045%. Если же технология ведения мартеновского процесса отработана так, что зна- значительное количество плавок в интервале 0,045—0,050%, то, конечно, предложенная выше система контроля даже при п = 7 становится неэффективной, а дальнейшее уве- увеличение параллельных определений, конечно, уже прак- практически невозможно. Нам часто приходилось сталкиваться с тем обстоятель- обстоятельством, что заводские технологи выдвигают требование гарантировать 100%-ное принятие продукции, когда содержание вредной примеси в ней находится на пре- пределе, установленном в спецификации. Такое требование совершенно бессмысленно, оно может быть удовле- удовлетворено, как это показывают кривые функции мощности, только тогда, когда или а = 0, или п—> со . Подобные требования только запутывают и без того сложный вопрос с организацией контроля и не дают возможности выбрать рациональные методы контроля, основанные на секвен- секвенциальном критерии. В предыдущем примере мы рассмотрели вопрос о выбо- выборе числа параллельных определений для случая, когда в спецификации указан верхний предел содержания веще- вещества в пробе. Точно так же решается задача о выборе числа параллельных определений для случая, когда в специ- спецификациях указан нижний предел для определяемого ком- компонента. При этом только формула (9.2) заменяется ана- аналогичной формулой для определения нижней границы
334 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [ГЛ. IX определяемого компонента: Ч = Но + : (9.5) При построении кривых функций мощности в этом случае но оси абсцисс также откладываются значения ц, а по оси ординат 1—р. Кривые функции мощности ока- оказываются зеркально симметричными по отношению к кри- кривым, изображенным на рис. 45. В некоторых случаях в спецификациях указывается не максимальное или минимальное значение для содер- содержания вещества в пробе, а единственно допускаемое содержание вещества ц0. В этом случае в качестве нуле- нулевой гипотезы принимает утверждение (х = (Ло в качестве альтернативы ц Ф ц0. При планировании эксперимента мы должны выбрать число параллельных определений и установить две границы х0+ и хо_ по обе стороны от [х0. Критерий для ошибки первого рода здесь будет двухсто- двухсторонним. С вероятностью а/2 мы можем не принять нуле- нулевую гипотезу тогда, когда она в действительности верна, из-за того, что средний результат анализа х окажется больше х0+, и с той же вероятностью а/2 мы можем не принять нулевую гипотезу из-за того, что х окажется меньше хо_. Через |3 обозначим вероятность принять нулевую гипотезу тогда, когда в действительности содер- содержание вещества отличается от ц0 на некоторую вели- величину ^ б. Число параллельных определений и довери- доверительные границы найдем, пользуясь формулами: (9.6) хо+ = Но + - (9.7) - = Но — ¦ (9.8) Рассмотрим следующий пример: в спецификации на некоторый огранический продукт указано содержание §2] ВЫБОР ЧИСЛА ПАРАЛЛЕЛЬНЫХ ОПРЕДЕЛЕНИЙ 335 вещества [х0 = 20% ± 0,2%, ошибка единичного опреде- определения а = 0,08%. Нам нужно найти такое число парал- параллельных определений, чтобы риск забраковать годную продукцию был не больше а = 0,01, а риск принять про- продукцию, отклоняющуюся от 20% по абсолютной величине более чем на 6 = 0,2%, был не более чем C = 0,01. Для сформулированных нами условий: U 0 = ^0.995 = 2,58, Mi_p = Mo,99 = 2,33. 1 2 Пользуясь формулами (9.6), (9.7) и (9.8), находим: /г = {B,58 + 2,33)-04}2~4, = 20 + 2'58'°'08 = 20,103, 2,58-0,08 = В этом случае контроль можно также организовать с помощью двухстороннего секвенциального критерия, как это было показано на стр. 182. В аналитической работе часто приходится прибегать к сравнению двух средних результатов анализа. В этом случае при планировании эксперимента нужно найти число параллельных определений п1 и п2 для получения каждого из средних результатов и установить крити- критическую величину х0, с которой будет сравниваться раз- разность двух средних х = хг — хг. Если окажется, что х по абсолютной величине больше, чем х0, то принимается гипотеза о том, что два средних результата существенно различны. Определение числа параллельных определений и критической величины х0 производится с помощью формул: (9.9) (9.10) Можно показать, что сумма щ-{ п2 будет иметь мини- минимальное значение, когда пх/п2 = ох/о2, т. е. когда точности определения двух средних значений будут
336 некоторые приемы работы [гл. IX одинаковы. В этом случае из (9.9) имеем: п - ffj В частном случае, когда о\ = о^, имеем: (9.11) (9.12) Формулы для двухстороннего критерия получаем, заменяя в (9.11) и (9.12) м4_а на и а. Рассмотрим следующий пример: методом эмиссион- эмиссионного спектрального анализа с фотографической регистра- регистрацией спектров производится изучение влияния термообра- термообработки на результаты анализа. Заключение о влиянии тер- термообработки будет сделано на основании сравнения двух средних значений разности почернений аналитических линий для двух частей одного и того же образца, одна из которых была подвергнута закалке, другая находится в равновесном состоянии. Из предыдущих опытов известно, что ошибка воспроизводимости для определения, сделан- сделанного по одной спектрограмме, равна а = 0,020. При пла- планировании эксперимента мы хотим выбрать число спек- спектрограмм так, чтобы риск отбросить нулевую гипотезу (отсутствие влияния термообработки) тогда, когда она верна, был не более а = 0,10, а риск принять нулевую гипотезу, когда она неверна (под влиянием термообра- термообработки имеется расхождение, равное квадратичной ошибке воспроизводимости: б = а = 0,02), был не более f5.= 0,05. Под влиянием термообработки может быть как завышение результатов анализа, так и их занижение, поэтому мы должны воспользоваться двухсторонним критерием. Про- Производя вычисления, получаем: U _ц =«0,95 = ' 2 A,64 + 1,64).0,021 2 р ] жо = 1,64 = о.ою, 2] выбор числа параллельных определений 337 При планировании эксперимента было принято, что можно пренебречь 5%-ным риском принять нулевую гипо- гипотезу, если в действительности расхождение между двумя средними равно 0,02. Допустим, что уЪ = 1,4, тогда согласно C.36) расхождение б = 0,02 даст относительную ошибку, равную 3,3%. Если на основании тех или иных соображений экспериментатора не удовлетворит такая постановка задачи при планировании эксперимента и он захочет уменьшить возможное расхождение до 6 = 0,01, то подсчеты, аналогичные приведенным выше, показы- показывают, что пх = п2 = 86. Во всех рассмотренных выше случаях мы предпола- предполагали, что квадратичная ошибка анализа известна. Если, приступая к какому-то эксперименту, мы ничего не знаем о величине квадратичной ошибки, то, конечно, невозмож- невозможно заранее определить число параллельных определений. Обычно аналитик, приступая к разработке нового метода, всегда может дать некоторую приближенную оценку для ожидаемой величины квадратичной ошибки. С помощью этой оценки можно определить число параллельных опре- определений, пользуясь приведенными выше формулами. В этом случае при выборе критических пределов вместо м-критерия надо пользоваться ^-критерием. Допустим, например, что хотим запланировать эксперимент для срав- сравнения среднего результата анализа с паспортными дан- данными стандартного образца в условиях, когда имеется только некоторое весьма ориентировочное представление о возможной величине квадратичной ошибки.,Число парал- параллельных определений найдем, пользуясь формулой (9.6), а критические пределы для двухстороннего критерия опре- определим, заменяя (9.7) и (9.8) формулой хо = no±tas/Vn, где s—квадратичная ошибка, полученная для данной серии экспериментов, ta находим по табл. 3. Приложений. Эта таблица составлена для двухстороннего критерия. Если эксперимент проводится с односторонним критерием, то uj_a заменяется на ^а- При таком планировании экспе- эксперимента исходим из условий, что риск не принять нулевую гипотезу, когда она в действительности верна, меньше а, а риск принять нулевую гипотезу, когда она неверна, меньше |3. Эти условия будут выполняться с тем большим приближением, чем ближе окажется квадратичная ошибка 22 В. Б. Налжмов
338 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [гл. IX вновь разрабатываемого метода к тому ее приближенному значению, которое мы приняли при планировании экс- эксперимента. В аналитической работе очень важно заранее выбрать нужное число параллельных определений при сравни- сравнительном изучении двух дисперсий. Допустим, что при планировании эксперимента мы задаемся риском а не принять нулевую гипотезу тогда, когда она верна (квад- (квадратичные ошибки равны) и риском |3 принять нулевую гипотезу тогда, когда ajo2 = R. В этом случае, допу- допуская, что f1 = /2, число параллельных определений най- найдем, пользуясь формулой 2,3 lg Л 13 (9.13) При двухсторонних критериях заменяем в формуле (9.13) wi_a на и а. 2 Рассмотрим следующий пример: нам нужно найти число параллельных определений при сравнении диспер- дисперсий, полученных при изучении ошибок воспроизводи- воспроизводимости двух аналитических методов, или двух вариантов Одного и того же метода. Здесь нулевая гипотеза состоит в том, что а1 = а2, при альтернативе о1 =h о2, поэтому при испытании должен применяться двухсторон- двухсторонний критерий. Примем, что риск отвергнуть нулевую гипотезу, когда она правильна, должен быть не более a = 0,1, а риск принять нулевую гипотезу, когда в дей- действительности отношение квадратичных ошибок равно 2, должен быть не более р = 0,05. Подсчеты дают: U a = M0,95 = 1.64, И1_р = И0,95= 1,64, 1 п = 25. Следовательно, эксперименты должны быть запланиро- запланированы так, чтобы для каждого из изучаемых методов было сделано по 25 параллельных определений. 5 3] ДОКУМЕНТАЦИЯ МАТЕРИАЛА ззп Если мы хотим запланировать эксперименты так, чтобы риск принять нулевую гипотезу, когда в действительности отношение квадратичных ошибок равно 1,5, был меньше Р = 0,05, то получаем: /-11 [ 3-28 f 1 2,3-0,17609 п = 67. В заключение отметим, что вопрос о выборе алгорит- алгоритмов*) для отыскания оптимального числа параллельных определений находится в настоящее время еще в стадии изучения. В этом параграфе были использованы приемы, рекомендованные в последнем издании руководства, напи- написанного под редакцией Дэвиса 138], и пример, разобран- разобранный в [140]. В этом разделе не рассматривался вопрос о так назы- называемом приемочном контроле, который обеспечивает добро- доброкачественность продукции при помощи выборочного обсле- обследования изготовленных партий изделия. Этот вид стати- статистического контроля находит широкое применение в маши- машиностроении и приборостроении, но не используется в тех случаях, когда доброкачественность продукции оцени- оценивается по такой характеристике, как химический состав вещества. § 3. Документация материала При планировании экспериментальных работ исклю- исключительно большую роль играет правильная организация документации как первичного материала, так и оконча- окончательных результатов работы. Обычная система докумен- документации с помощью таблиц, имеющих два входа—по гори- горизонтали и по вертикали, становится неэффективной при статистических исследованиях, так как с помощью такой двумерной таблицы могут быть сопоставлены между собой только два каких-нибудь признака, тогда как в экспери- экспериментальной работе часто одновременно варьирует не- несколько признаков. *) Под алгоритмом понимают систему вычислений, выпол- выполняемую по строго определенным правилам, для решения всех задач некоторого данного типа. 22*
340 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [гл. IX Очень удобным оказалось применение перфорирован- перфорированных карт для документации как первичного материала, так и результатов сложных исследований. Каждую запол- заполненную перфокарту можно рассматривать как точку много- многомерного пространства, свернутую на плоскость. Каждая перфорация на плоскости карты—координата этой много- многомерной точки, причем эти координаты могут принимать только два значения 0 и 1 (дырка пробита или не пробита). Стопку перфокарт можно рассматривать как множество точек многомерного пространства или как таблицу в много- многомерном пространстве с множеством входов. Заполняются перфокарты с помощью специальных кодов, которые раз- разрабатываются в соответствии с принятой системой доку- документации. Большой опыт применения перфокарт имеется в моле- молекулярной спектроскопии Ц63], где спектры должны быть при помощи одной таблицы увязаны с многообразием хими- химического строения молекул и их физическими свойствами. Поскольку система документации в молекулярной спек- спектроскопии уже хорошо разработана, остановимся подробно на ее описании, а затем коротко укажем и на возможность применения перфокарт в других областях исследований. В США уже в течение нескольких лет для документа- документации в инфракрасной спектроскопии используются так называемые перфокарты с внутренней перфорацией. На рис. 46 приведена фотография этой перфокарты. На ней имеется 80 вертикальных колонок и 10 горизонтальных рядов, перенумерованных числами от 0 до 9; кроме того, перфорироваться могут также еще два верхних ненумеро- ненумерованных ряда (в дальнейшем они будут обозначаться через хну). В общей сложности на перфокарте такого типа можно зашифровать, пользуясь прямым кодом, 960 сведений. Спектры поглощения и данные, характеризующие физические и химические свойства молекулы, наносятся на карту с помощью специального кода. Колонки в левой части карты служат для зашифровывання спектра погло- поглощения в шкале обратных сантиметров (если нанесена пер- перфорация в ряду у) или в шкале длин волн (ряд у не перфорирован). Если пользоваться шкалой длин волн, то первые 25 колонок служат для записи спектра погло- поглощения от 2 до 25 мк с разрешением в 1 мк. Номер 31 ДОКУМЕНТАЦИЯ МАТЕРИАЛА 341 CM CM LU l "o a i ЬМ 3JA1 z 5 5 u. r 2 z — ОТ < - -.- § imiwr i°< < Ш -J " < и r о 5 ОС 1:1 г c-> ~- 5 *~ с с — кя ¦В Ч ч f Q <Го" S'O FD E'O 1 с С *Г 9* A 8 ' гт— Q'9 СЭ о <=> о ° a о ° о га о о о о о ° ° PI о -е>- сз| о 3 о" ~ о | о ел о о э_ 2_ — __, э_ о fc — ? ¦»- « ~ 3 — — S — '? — Я — X — К 1— Й — Й — ? - Й — ^ _-р- g — = ¦¦ ti ^~ ^ -^~ 5 — о. ¦•- *?.,.-? *^ •" "~~ ¦^ ^- """ см <NJ см IS. г\ггг ^J <NJ rsj см <NJ rs, ^! IS] ~ см *M см см см ^ M см см ггг rsj см см см см *V) tM *V) <M см см см см см см см см см (M ro -* со -r ro -r \ ГО «* у 1^ «n Ь Ч- e «Q «О ~ •* - 5 INOE ззз: OEVEl 4 4 44 со -Ч- l ^ ™3 со -Ч- co -4- n -r ' ro -4- fO •** " " CO 4J- со •* со *j- co •¦*¦ ro •* со ¦^t ro -r ГО ^3- co ^3- to ^ CD -4- со ¦ч- ГО 41- ГО •* ГО 41- ГО ¦ч- ГО -Ч- ГО •*»¦ го -ч- ГО ч^- ГО -* ГО -* ГО -* со ШЛ ГО -* ГО -* ГО -* ¦1 -t ГО ->*¦ ГО -* ГО ^t е» -* го •* ^_ ^ ГО -* ГО -* u-i q из Р j 1П ~ IflD P : m — из р f Э u-i — из [ 1Л° ю 3 ту «о ; 1Л 2Е из 1 ; щ J ш; 3 «g и!? f ^ ? из| ! л у (о с ¦ LT1 U3 Р ю из Г lT> U3 Р ю из Г" и"! из Г" ^ и^ [• и-> из ^ ю из Р Ц1 из Р и"> из р 1Л из Р ц-1 из р Ю из Г ю из р и-> из Р 1Л U3 Р Ю 1?3 Р ц-1 СО Г 1Л ш Р 1Л U3 Р |Л иэ Г >^Й1 из Г и"> из Р 1Г> U3 Р и"> из Р 1Г> из С" и"> из 𠦦 (О Р 1Г> U3 | и"> (О Р ¦¦ (О г 1Г> U3 Р ЯВ из Г~ 1Г> U3 Р ir> иэ р 1Л из Р и"> из р !^ !^ ? «. оо ^ оо -* оо - оо "* ^ ОО -* CJ оо ¦о со «. Ой ^ то «. Ой «. со -- со «. со ^ со оо ^- со -. со со «. со -* со *• со ¦ со «. со - со - со о СО «. со о ОО -. со ^ оо -- со *• со -~ со - со "* со - со ч СО •• со «• со «. со *. со «. СО «. со Ш со "• со ¦, ШЛ •~ оо «. со ¦» со ¦• со - со ч СО - ** -. со 1Г> «О Г. то о а сп ? сп К сп к сп к О) р 99 71 72 от з СП - СП " сп ^ сп S сп 5 СП ^ СП К сп я сп Д сп Й отй от s от 5 сп 5 сп* СП $¦ СП ^ от S СП ™ о> ™ СП» СП Й т« от ™ СП ^ СП ? СП Si en jg Ol ^ Ol Q oi г ^^ Ol "i Ol ^ СЛ ^ en = oi а Ol f^S Ol «.« en Z~ CD - i. 4 о ев О. E-i в, Е- И м ев 03 О О. б: га о 1 S s « (В Я в а м Е- се И о -31
342 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [гл. IX колонки обозначает число целых микрон, номер ряда десятые доли микрона. Например, если в колонке 12 про- пробита цифра 5, то это означает полосу поглощения при 12,5 мк. Колонки 26—28 служат для записи спектра в области 26—45 мк с разрешением в один микрон. Напри- Например, если в колонке 27 пробита цифра 3, то это соответ- соответствует длине волны в 33 мк. Для записи спектров в шкале обратных сантиметров используются те же колонки: в интервале 2000—4500 см~г запись производится с раз- разрешением в 100 см, а в интервале 200—2000 см'1 с раз- разрешением 10 см*1. На перфокарту наносятся все максимумы в спектре поглощения, которые на 20% и больше превышают фон. Колонки 29—31 оставлены резервными, на колонках 32—62 подробно шифруются данные, характеризующие химический состав молекулы и ее строение. В колонках 32—57 зашифрованы сведения о классе соединений, к кото- которому относится молекула и о наличии в ней тех или иных структурных элементов. Примеры кодов для нескольких колонок приведены в табл. 9.1. Колонки 58—62 содержат сведения о содержании в молекуле атомов С, N, О и S, колонки 63—65—сведения о температурах кипения и плав- плавления. Колонки 66—70 оставлены для потребностей отдель- отдельных лабораторий, а колонки 71—79 содержат сведения о литературных источниках, из которых заимствованы спектры (журнал, том, страница и т. д.). Перфокарты с внутренней перфорацией сортируются специальными машинами со скоростью 250—650 штук в минуту. После многократного прохождения через сор- сортировочную машину эти карты изнашиваются, что не является их существенным недостатком, так как они легко могут быть скопированы с помощью специальной копиро- копировальной машины. В настоящее время выпущено 16 000 пер- перфокарт для документации инфракрасных спектров. Пользуясь такими перфокартами, за несколько минут можно отобрать группу молекул с любой заданной комби- комбинацией определенных признаков. Система перфокарт оказывается очень удобной для изучения корреляционных связей между спектрами молекул и их физическими и хи- химическими свойствами. Перфокарты с внутренвей перфо- перфорацией могут быть использованы для анализа смесей веще- ДОКУМЕНТАЦИЯ МАТЕРИАЛА 343 ства по их инфракрасным спектрам 1164]. При этом в каче- качестве характеристических признаков вещества исполь- используются не только отдельные полосы, но также и отсутствие колос поглощения в определенной области спектра. Легко Таблица 9.1 Код системы ASTM—Wyandotte для нескольких колонок Ряд 0 1 2 3 4 5 6 7 8 9 X У Колонна 32 Элементы О N ' S F С1 Вг, 1 Р, As, Sb, Bi Si, Go, Sn, Pb So, Те В, Al другие Колонна 44 Азот -C(=NH)N< >NC(=NH)N< —C = N —N=C —NH2 >NH >N =NH >N— N< —N = N— другие гетеро- гетероциклические Колонка 48 Азот—кисло- Азот—кислород >NC(=O)O- >NC(=O)N< -C(=O)N< —N=C=O —OC^N >N—NO2 >N—N=O _N=N(=O)- -ONO2 —ONO другие гетеро- гетероциклические себе представить, сколь громадную работу нужно было бы проделать, занимаясь идентификацией спектров с помо- помощью литературных источников или даже обычных атласов. У нас в Советском Союзе перфокарты с внутренней перфорацией используются в счетно-статистических рабо- работах . Например, на таких заводах, как Кузнецкий и Маг- Магнитогорский металлургические комбинаты, все показа- показатели по ходу мартеновской плавки записываются в спе- специальные паспорта плавок, а затем с помощью специально разработанного кода заносятся на перфокарты с внутрен- внутренней перфорацией, такие же, как показана на рис. 46. Пользуясь перфокартами, легко можно производить даль- дальнейшую обработку материала с помощью счетных машин,
344 НЕКОТОРЫЕ ПРШШЫ РАВОТЫ [гл. IX ДОКУМЕНТАЦИЯ МАТЕРИАЛА 345 используя одну и ту же стопку перфокарт для решения целого ряда статистических задач, в соответствии с зара- заранее разработанной программой. Перфокарты с внутренней перфорацией находят при- применение при проведении лабораторных исследовательских работ. Например, описанная на стр. 248 работа по изуче- изучению неоднородности заготовок при изготовлении этало- эталонов для эмиссионного спектрального анализа произво- производилась с использованием перфокарт с внутренней перфо- перфорацией, на которые заносились результаты анализов [154]. Затем непосредственно с перфокарт данные переносились в счетные машины, с помощью которых производились все вычисления, необходимые для дисперсионного анализа. Перфокарты с внутренней перфорацией применяют также и для документации материала в аналитических лабораториях при выполнении текущей работы. В каче- качестве примера рассмотрим систему документации, приня- принятую в аналитической лаборатории фирмы Esso Standard Oil Co (США) [167]. При поступлении в лабораторию каждая проба снабжается «основной» перфокартой, на которой кодируются: описание образца, его номер, дата поступления и группа аналитиков, ответственная за выпол- выполнение анализа. Пользуясь «основной» перфокартой как шаблоном, готовят «аналитические» перфокарты по числу аналитических операций. Применяются «аналитические» перфокарты двух образцов: для простых и сложных ответов. На рис. 47 приведена фотография заполненной перфокарты для простых ответов. На перфокарту зано- заносятся результаты анализа, условия выполнения анализа и точность анализа. Заполнение перфокарты произво- производится непосредственно на рабочем месте аналитика путем зачеркивания карандашом, дающим токопроводящую черту, соответствующим образом перенумерованных участков, расположенных в 27 колонках. Такая система заполнения перфокарт дает возможность избавиться от всех предварительных «черновых» записей, отнимающих много времени. Заполненная перфокарта поступает в табу- ляторную комнату, где автоматически перфорируется на специальной машине. Сигналы для перфорации поступают от щупа с контактными щеточками, с помощью которого 0 me со1" <О ^ см s СО 2 О. - <М СО ? см 2 СО in g X 1Л = mi о" to i 00 = Ld ANAL ECl; 1 Z 1- « * ( a < eg г §1 ¦ TOR Л и u \ Q VJ Л u n— и m a ш ш 1 ANALYSIS ft VJ ft ft i\™ft VJ U ft U ft п a а ¦ ¦ Bh 1 1 1 Щ 1j ft 1j 1j 1 1j ft vi ft \i ft VJ ft VJ ft VJ u. 0°' u %- ft V) ft' V) ft • Su \J ft u ft u! V) ft. ¦ 0 1 ft ft 0" ft "О- -a ¦ u ft ft V) ¦n V) ft VJ _,ft "vl ft. vj: ¦ 44-CS35 ft ¦Q ft VJ ft u ft v5 ft, 0 ft" ¦ u ft1 ¦ VJ ft CO VJ ft ft 13 4 a- u ft u ft u vi u Б В ft V) u VJ ft 1 ft vJ \ ft IT) VJ u ft u t z ft V) ft VJ ft vJ ft" f\ u ft T\ \ » ft"T\ ct Ш-Ф u~, ml VJ U ft  ft ft ii ft so ¦c Ъ VJ ft VJ ft VJ ft ~? с \ ft •a \> ft TC be ft  ft CD VJ ft Ю VJ ft V> li u LOST ft VJ ft ft VJ ft^ u ft ¦ u ¦ft to \ \ VJ ft v5 % ft  u ft Ю и ft ft u ft' u S_ ГТ l t b0 ft "u ft ft "y ft1 "u ft VJ ft u ft X VJ ft u ft 1j w ft E« o> од ^ ?- ft *¦_ ft _EL_ E3|_ ft " "" VJ % ft %¦ ft =J- ¦ft \3 ft и 1 ^Щ \j-Si ft S3. ft - -> ft =_ vJ =t v3 =- ft -s * о га _ м « -* SW OSOIS» №1 в ч 2 в, о в о н е < О сС 5 в, к II S «4 2 Я ев S- сг в 2 ев ев g til н о, се с е в ft.
346 НЕКОТОРЫЕ ПРИЯМЫ РАБОТЫ [ГЛ. IX ДОКУМЕНТАЦИЯ МАТЕРИАЛА 347 обнаруживаются все зачеркнутые участки иа карте. ]5 табуляторной комнате с помощью перфокарт печатают поя кого рода сводки, необходимые для управления боль- большой лабораторией. С помощью перфокарт легко найти анализ по любому признаку—номеру пробы, описанию пробы или условий проведения анализа, по результатам анализа и т. д. Такая организация документации облег- облегчает последующую статистическую обработку архивного материала, позволяет легко следить за точностью и пра- правильностью работы лабораторий при помощи повторного анализа проб и стандартных образцов, которые направ- направляются для анализа вместе с текущими пробами и т. д. В Англии и ФРГ для документации в молекулярной спектроскопии применяются перфокарты с внешней перфо- перфорацией. На рис. 48 и 49 приведены фотографии лицевой ц тыловой сторон таких перфокарт, известных под назва- названием системы DMS (Documentation of Molecular Spectro- ксору)для документации инфракрасных спектров. На ли- лицевой стороне перфокарты напечатано название соедине- соединения, указаны его основные физические свойства, дана структурная формула, проведено библиографическое опи- описание источника, из которого заимствован спектр по- поглощения, и указаны условия, при которых он получен. На оборотной стороне карточки приведен спектр погло- поглощения в области 200—4000 смГ1, представленный стан- стандартным образом с линейной шкалой для обратных сан- сантиметров и изменением масштаба при 2000 см. Там же приведены табулированные данные для основных полос поглощения. По краям карты имеется 203 отверстия. Для зашифро- иыванпя информации эти отверстия могут быть прорезаны треля различными способами: 1) вырезывается лунка, захватывающая одну внешнюю дырку, 2) лунка захваты- захватывает обо дырки—внешнюю и внутреннюю—и выходит на наружный край карты, 3) оба отверстия соединяются внутренней лункой, не выходящей на наружный край карты. Такая система дает возможность использовать каждую пару отверстий для зашифровывания трех раз- различных сведений. Сортировка карт производится вручную, при помощи спиц—карточки с вырезанными лунками из- извлекаются из общей стопки.
348 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [гл. IX о- if -»«¦><.* '3 i i ЛЩ .41 ДОКУМЕНТАЦИЯ МАТЕРИАЛА 349 Нижний край карты используется для кодирования положения 8—10 главных полос поглощения. Около отверстий отмечены длины волн в микронах и частоты в обратных сантиметрах. Верхний и левый края карты используются для кодирования информации, связанной со строением молекулы, которая рассматривается как состоящая из определенного количества структурных единиц, представляющих интерес с точки зрения химии и спектроскопии. На карте кодируется: число атомов угле- углерода, строение основного скелета молекулы (число нена- ненасыщенных углеродных связей, число колец—конденсиро- колец—конденсированных и неконденсированных, наличие посторонних ато- атомов в кольце), типы групп заместителей и их положение. Если структура соединения неизвестна, то кодируется по алфавиту название соединения. Подробное описание кода дается в специальном руководстве, приложенном к перфокартам. Некоторое представление о системе коди- кодирования можно получить по приведенным фотографиям перфокарты. В системе DMS имеются также библиографические перфокарты. На рис. 50 и 51 приведены фотографии лице- лицевой и тыловой сторон одной из таких перфокарт. На этих перфокартах заносится библиографическая информация как для статей, использованных при составлении перфо- перфокарт с информацией о спектрах, так и для статей обще- методцческого характера. Библиографические и спектраль- спектральные перфокарты связаны перекрестными ссылками. На лицевой стороне перфокарты указываются библиогра- библиографические данные и приводится реферат статьи. По краям карты при помощи перфорированных отверстий коди- кодируются следующие данные: 1) цель статьи (например, анализ степени частоты материала), 2) область спектра, в которой производилась работа, 3) применяемая аппа- аппаратура, 4) агрегатное состояние вещества, 5) год выхода журнала, 6) три первые буквы фамилии автора и первая буква его имени и т. д. При кодировании года издания используется система, при которой числа от 0 до 9 кодируются двумя числами ряда: 7, 4, 2, 1, 0, такими, чтобы сумма их была равна кодируемому числу. Например, 54 год обозначается так: в группе десятков пробиваются отверстия с номерами
350 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [гл. IX ДОКУМЕНТАЦИЯ МАТЕРИАЛА 351 !¦ ¦ *! »••#•««•# a
352 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [ГЛ. IX 4 и 1, в группе единиц пробиваются отверстия с номерами 4 и 0. При кодировании первых трех букв фамилии автора и первой буквы его имени каждая из букв шифруется по двойному коду двудмя числами, как это указано на карте. При такой системе кодирования оказывается воз- возможным при помощи 8 чисел зашифровать 28 букв: С\ =8!/6!2! = 28. Американская нефтяная компания Шелл выпускает спектральные перфокарты с внешней перфорацией, используя преимущественно двойной код. Это дает возможность на 1000 отверстиях зашифровать 4950 сведений: 2 _ 100! _ /q5Q 100 ~98! 2! ~~ ^y0Vi Перфокарты с внешней перфорацией удобны тем, что там кодированная информация эффективно сочетается с обычной информацией (текст реферата на библиографиче- библиографических перфокартах, спектрограмма на спектральных перфо- перфокартах и т. д.). Кодированная информация не всегда бывает достаточно полной из-за недостаточной информационной емкости перфокарт. Например, кодируя спектрограммы, мы неизбежно теряем часть заключенной в них информа- информации, связанной с тонкой структурой спектра, которая не может быть зашифрована на одну перфокарту. В аме- американской системе перфокарт с внутренней перфорацией этот недостаток компенсируется тем, что там еще выпу- выпускается специальный атлас спектров, связанный перекрест- ишчн ссылками с перфокартами. Перфокарты с внешней перфорацией находят широкое применение в самых разнообразных исследовательских работах, в том числе в аналитической работе. В [99] подробно описывается применение перфокарт с внешней перфорацией для занесения на них результатов текущих анализов. Наряду с результатами анализа на перфокарты могут заноситься условия проведения анализа, те или иные изменения, которые могут вноситься в методику анализа по мере ее усовершенствования, результаты кон- контрольных анализов, выполненных другими методами, и т. д. Обрабатывая архивные материалы, представленные с по- помощью перфокарт, легко можно получить ряд сведений об особенностях той или иной методики анализа. Точно S 3] ДОКУМЕНТАЦИЯ МАТЕРИАЛА 353 так же на перфокарты с внешней перфорацией могут зано- заноситься результаты сложных комплексных исследований, проводимых по определенному плану. С помощью данных, зашифрованных на перфокартах, можно, например, очень быстро проверить гипотезу о нали- наличии корреляции между двумя признаками. Для этого сначала сортируют карты по интервалам одного признака, а затем каждую из полученных групп сортируют по вели- величине второго признака. Сосчитав число карт для каждого значения второго признака, легко можно найти среднее взвешенное значение второго признака для каждого интер- интервала первого признака. Аналогичным образом можно получить таблограмму, в которой для каждого интервала второго признака будет найдено среднее значение первого признака. Нанесем результаты подсчетов на миллиметро- миллиметровую бумагу и подберем две линии регрессии, наилучшим образом соответствующие двум множествам точек. Коэф- Коэффициент корреляции можно будет приближенно оценить, пользуясь формулой: \rxy\=Ybb', где bub' —угловые коэффициенты двух линий регрессии. Вопрос о выборе системы перфокарт для документации материала решается в зависимости от конкретных усло- условий работы. В организациях, имеющих дело с большими работами, естественно пользоваться перфокартами с вну- внутренней перфорацией, применяя для обработки материала машинную технику. В небольших лабораториях, в част- частности в аналитических лабораториях, вероятно, имеет смысл ограничиваться преимущественно применением пер- перфокарт с внешней перфорацией, которые не требуют какого-либо дополнительного машинного оборудования. Документация материала может производиться не только при помощи перфокарт, но также и с привлече- привлечением более сложной машинной техники. Остановимся несколько подробнее на работах по машинной документа- документации в области химии, которые проводятся в США под руководством Перри, Кента и Берри [168]. Их основная идея заключается в том, что машинные поиски научных концепций могут осуществляться только в том случае, если произведен переход от естественного языка, как средства передачи информации, к строго формализован- формализованному искусственному языку, состоящему из некоторых 23 В. В. Налимов
364 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [гл. IX элементарных семантических*) единиц. Естественные языки для машинного поиска информации не пригодны в силу своей чрезвычайной гибкости. Большое количество омонимов, синонимов и полусинонимов, зависимость зна- значения слов от их расположения в фразе и от конструкции фразы—все это делает машинные поиски невозможными, если в память машины будет заложена информация, выра- выраженная на одном из естественных языков. Была проведена работа по созданию первого искус- искусственного, информационного языка [168а]. При прове- проведении этой работы с помощью перфокарт как технического средства было изучено и сопоставлено около 30 000 науч- научных и технических терминов. Оказалось, что эти термины можно выразить с помощью небольшого числа семанти- семантических единиц и некоторых знаков, уточняющих их смысл. Некоторое представление о формализованном языке можно получить на основании проведенного ниже перевода на этот язык трех терминов: «абсорбция», «абсорбционная полоса» (полоса поглощения света) и «абсорбционная башня»: 1. Абсорбция—BASB 001. В—SB—семантическая единица, обозначающая понятие абсорбции. Символ А указывает на то, что здесь семантическая единица употреблена для обо- обозначения свойства, являющегося частью широкого понятия. 2. Абсорбционная башня BUSB МАСН 005. В—SB, как и прежде, обозначает абсорбцию, символ U указывает на то, что здесь абсорбция рас- рассматривается как процесс, для протекания которого предназначен кодируемый объект. М—СН обозначает машину или устройство. Символ А указывает на то, что здесь речь идет о некотором объекте, который является частью широкого понятия—машин. Чис- Числовой суффикс «005» служит для дальнейшей диф- дифференциации семантического кода—он позволяет вы- выделить понятие «абсорбционная башня» из широ- широкого класса абсорбционных устройств. *) Лингвистическая семантика — наука о смысловом значе- значении слов. §3] ДОКУМЕНТАЦИЯ МАТЕРИАЛА 355 3. Абсорбционная полоса BWSB GARP MY PR 98 х 001. В—SB, как уже указывалось, обозначает абсорб- абсорбцию. Символ W указывает на то, что полоса воз- возникает в результате абсорбции. G—RP служит для обозначения понятия «коллекция». Символ А ука- указывает на то, что здесь речь идет об объекте, являю- являющемся частью коллекции (полоса поглощения—часть спектра поглощения). М—PR служит для обозна- обозначения свойства вещества. Символ Y указывает на то, что полоса поглощения является характеристикой свойств вещества. Занесение информации в машину производится сле- следующим образом: для каждой статьи пишется реферат в телеграфном стиле, а затем его содержание переводится на формализованный язык с помощью семантических еди- единиц и некоторых символов, отображающих грамматику телеграфных рефератов. Диаграмма, структурные хими- химические формулы, цифровые данные также при помощи специального кода заносятся в память машины. Рассмотрим стратегию поисков информации. Допустим, например, что нам нужно найти вещества класса А, обла- Рис. 52. Диаграмма отношений между признаками. дающие одновременно свойствами В я С (заштрихован- (заштрихованная область на рис.52). Программа поисков в этом слу- случае может быть записана в виде логического произведе- произведения: А ¦ В • С. Если нам нужно найти вещества класса А, обладающие свойством Б и не обладающие свойством С 23*
356 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [ГЛ. IX (эта область на рис. 52 заполнена точками), то эта задача может быть записана в виде логической разности А • В—С. Наконец, допустим, что мы ищем все работы, в которых для некоторого класса веществ X измерено хотя бы одно из свойств А, В или С. Эта задача может быть записана в виде логической суммы: X • A -f- X ¦ В -j- -\~ X ¦ С. Возможна, конечно, постановка и более слож- сложных задач. Машинная документация материала, по-видимому, сможет оказаться очень полезной при проведении науч- научных и технических исследований, особенно исследований статистического характера. Допустим, что мы занимаемся изучением влияния «третьих элементов» на результаты эмиссионного спектрального анализа. Пользуясь инфор- информационной машиной, мы сможем получить сведения о всех тех концепциях, в которых рассматривается проблема трех тел. Машина должна будет дать нам сведения о всех тех работах, в которых изучалось влияние третьих элементов на коэффициенты диффузии в твердом теле и газовом облаке, а также работы, в которых рассматривалось влия- влияние третьих элементов на кинетику испарения и т. д. При этом, конечно, машина выдает информацию, и не представляющую интереса с точки зрения рассматриваемой нами задачи,—например, информацию о проблеме трех тел в механике. Экспериментатор, очевидно, без труда сможет отобрать из этой информации все интересующие его концепции и использовать их в дальнейшем для фор- формулировки гипотез при планировании экспериментов, направленных на изучение влияния «третьих элементов» в спектральном анализе. При этом, пользуясь инфор- информационной машиной, можно будет широко исполь- использовать и весь ранее накопленный в этом направлении опыт. Работы в области создания информационных машин находятся пока в начальной стадии своего развития. Информационный язык, созданный Перри, Кентом и их сотрудниками, по-видимому, является еще весьма несо- несовершенным. Тем не менее сейчас трудно переоценить те воз- возможности, которые открываются перед исследователями и которые, вероятно, приведут к коренным изменениям в организации исследовательских работ. Актуальность КОНТРОЛЬНЫЕ ДИАГРАММЫ 357 постановки этой задачи очевидна, если учесть экспонен- экспоненциальный характер развития науки, рассмотренный 1! ГЛ. I. Здесь важно отметить, что документация результатов научно-исследовательских работ с помощью перфокарт пли машинной техники может быть возможна только тогда, когда эксперименты планируются так, что их результаты могут быть представлены строго стандартным и достаточно компактным образом [172]. § 4. Контрольные диаграммы В последнее время в аналитической работе нашли широкое применение точечные контрольные диаграммы [70, 83, 87, 147, 160, 161], которые уже давно применяются ири контроле качества продукции. Допустим, что в определенный промежуток времени, например раз в неделю, для контроля за правильностью и точностью анализа делается п определений одной и той же контрольной пробы, которая может быть первич- ньш или вторичным стандартным образцом. В результате при текущем контроле мы получим некоторую последова- последовательность средних значений xv х2, ... и дисперсий sj, si, ... Если анализ является установившимся про- процессом и на основании предыдущего опыта нам известно среднее содержание вещества в этой пробе ц и дисперсия о2, характеризующая рассеяние результатов анализа относительно среднего, полученного за длительное время, то мы можем построить контрольные диаграммы для теку- текущего наблюдения за точностью и правильностью ана- анализа. При построении контрольных диаграмм по оси абсцисс откладывают номера последовательных результатов ана- анализа, выполненных из п определений, а по оси ординат на одной диаграмме откладывают соответствующие сред- средине значения хи х2, ..., а на другой диаграмме—ква- диаграмме—квадратичные ошибки sv s2, ... (так, как это показано на рис. 53 и 54). Для первой из этих диаграмм проводят две пунктир- пунктирные линии иа расстоянии ±1,96 а/\^п от генерального
358 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [гл. среднего ц и две сплошные линии на расстоянии ±3,09 о/]/п от ц. Первая пара линий служит «внутрея ними» пределами, вторая пара линий—«внешними» пре- пределами. За «внутренние» пределы могут выходить 5% ана лизов, за внешние—0,2% анализов. Если какое-либ! среднее оказывается за «внешними» пределами, то это, оча видно, указывает на то, что результаты соответствующих ему п определений нельзя рассматривать как случай- 1234567&9ЮЛ О 5 6 У 8 9 10 П Рис. 53. Контрольная диаграм- Рис. 54. Контрольная диаграм- диаграмма для средних значений ре- ма для ошибок воспроизводя- зультатов анализа. мости анализа. ную выборку из генеральной совокупности со средним fi и дисперсией а2. Для второй контрольной диаграммы, характеризующей устойчивость ошибки воспроизводимости, обычно имеет смысл наносить только верхние контрольные линии. Пунк- Пунктиром наносится линия для «внутреннего» предела %% расстоянии, равном стТ^Со.ог; n_i/(rc—1) от генеральной ква- квадратичной ошибки а, и сплошная линия для«внешнего» пре- предела наносится на расстоянии, равном o\^il,mr, -п~\1{п—1}* Например, если п = 5, то «внутренняя» граница про» водится на расстоянии, равном а"(/^11,7/4 = 1,7 (Г, а «внешняя» граница—на расстоянии, равном ctJ/ 18,5/4=а = 2,15 ст. Если точность анализа оказывается устойчиво! во времени, то за «внутренний» предел выходят две точки из ста, а за «внешний» предел — одна точка из тысячи S 4] КОНТРОЛЬНЫЕ ДИАГРАММЫ 359 Наблюдение за расположением точек на контрольной диаграмме относительно «внутренних» и «внешних» гра- границ дает возможность наглядным образом контролировать устойчивость анализа во времени и своевременно прини- принимать меры для устранения неполадок в работе. Если, например, разброс точек на второй контрольной диаграмме находится в разумных пределах, а точки на первой диа- диаграмме начинают выходить за один из «внешних» преде- пределов или группироваться около него, то это значит, что появилось какое-то систематическое смещение среднего значения. Для того чтобы получить возможно более полную информацию об устойчивости результатов анализа во вре- времени, желательно контроль правильности вести одновре- одновременно по нескольким контрольным образцам, строя для каждого из них свои контрольные диаграммы. Точечные контрольные диаграммы можно строить отдельно для разных смен или даже для разных анали- аналитиков. В некоторых случаях контрольные диаграммы полезно также строить при текущем контроле межлабора- межлабораторной воспроизводимости, откладывая по оси ординат пределы, соответствующие величине межлабораторной ошибки воспроизводимости, полученной на основании пре- предыдущих экспериментов. Иногда может оказаться полез- полезным построение контрольных диаграмм для параметров градуировочных графиков. Характер построения контрольных диаграмм может широко варьировать в зависимости от принятой системы контроля за аналитическим процессом. Например, если лаборатория выполняет небольшое число анализов и каждый анализ является весьма трудоемкой операцией, то контроль за правильностью можно организовать, не при- прибегая к анализу контрольных образцов, как это уже рас- рассматривалось на стр. 277—279. В этом случае можно раз- разбить текущие анализы на две равные группы, одну из них анализировать из двух параллельных определений с навес- навесками разной величины. Эта серия анализов дает возмож- возможность определять величину поправки, исключающей по- постоянную ошибку, не зависящую от концентрации анали- анализируемого компонента. Если, исходя из предыдущих ана- анализов, известна средняя величина этой поправки и ее
360 НЕКОТОРЫЕ ПРИЕМЫ РАБОТЫ [ГЛ. IX квадратичная ошибка, то для нее может быть построена контрольная диаграмма. Вторая серия проб анализируется из двух параллельных определений с навесками одинако- одинаковой величины, причем к одной из них добавляется извест- известное количество вещества. Эта серия анализов дает возмож- возможность получить поправку, которая исключает ошибку, зависящую от величины определяемой концентрации. Для этой поправки также может быть построена контрольная диаграмма [161]. ПРИЛОЖЕНИЕ
362 ПРИЛОЖЕНИЕ H R VD я IV е я в т Я я ф Я1 а со ^-i Г- OS CO ч-4 ** •* Ю СО СМ CD C^-i ОС vF •*-* , ^ — v^srCOrOCOCMcNcN ^^^^^^~~ о" d" о" ¦^00-^CDcDv^(NCO чг- СО 1С CM tt) СП v- ^1 i—1 ГГ\ о— . ^ - — - .-,, смгоссососооэоо °^ ^v^occcoc^^C4JOf^-i<t'<NOOtir--coio4*cocM(ra ^ С^ f—, f—i Г~1 <—w—w—- i—- >—• ' • —¦ ¦ ¦ ¦— — - Ю OOOO OOOOOOO 0 00 000 0!'?** > о о о ПРИЛОЖЕНИЕ 363 CD CD Oi <N OS CDCOvF OOOOOOOOOOOOO OOOOOO OOOOOOOOOO OOO OO OOO СОООтООО СОЮСО GOCDCM OOLODGOLO s" —'OTcD^COC^C^^^h.toCOC^^rHCOu^CO'^^-THCDst'iN^OllOCO щш„ _™. clWfN(MC^WCIC^cOI^COOl3CO«4l'4l' Ч» "*«f4iinintnin;D;c:o (^ -;—i ("""i c~i c~i C^ <O d) (O <O <O <O <O *O 'O *O *O <O *O (*^ *O CD (O <O *O *O *O *O *O oooooooooooooo "d'o'^o^o OOOOOOOOOOOOOOOOO o о р, в
«3 s « s 5 о CO ft. 364 ПРИЛОЖЕНИЕ ПРИЛОЖЕНИЕ 365
« s m и >б о a в OS CO t> eo iO •** CO га - о 9985 9990 9993 9984 9990 9993 -a« с» го ОООО С» Ol Ol Oi С1 О1 О1 9983 9989 9992 9982 9988 9992 9982 9988 9992 9981 9987 9992 9980 9987 9991 9979 9986 9991 9978 9986 9990 Г- 00О5 ГО СО СО я s о S4 в s я r'se C3 Cf О a 5 Э о е S §¦ s в о а к т I гаиоэоаэ цэнзиэхо / инодоаэ цзнонохэ CD CD О С <D CM CO l^t^t^h-CDCDl^ сдсмсмсмсмсмсмсчсчсмсмсм ЗЮЮ-ф-чГСМОООСО iOOOOOCOd * CM CM *^ Г— CM t~- n со см -^н о о 01 СОт ГО ГО - CD гогосогососогогосмсмсмсм госмсмсмсмсмсмсмсмсмсм ¦ ooot - ГО -^ I Ю I— —¦ CD CO О OO CD Ю CO CM - см-з«госмсмсмсмсмсмсмсмсмсмсмсмсчсм ^О OO [^ oooorr CD CM CM CM CM - « я и й о ч а в О Я ч ее (=3 s s •A В sH О я к о Си S а, о а 'I я я я о с ев Я СО 3 43 rHO^N-*CN^OOlOOOOMT-**OOOOr- СМОЮО!0!^-<0!СО^«0!ОСМСОООСМ1Г100-3«СО OOOlOOCDCDrO^-C^r^OlCOC^'^ --^^«.._ ,_~~_ _. _ — _^i.SrJ1-__l%^4^1-^*L;--4^^i'1^-J OOOOO ОООООСЗЮ 50:01010101050501 Ю00000^05^0СОСОСОСОО lOCDLQ CDOOOCMCO OCOOCOlQ pOCOtOCO"<J<COtOOOOC50505 Ol ОЬ О -^нСМСО -^Ю CD Г^ ОО о" о" о" о" о"о" о" о" о" CDt4- OO O5 О ¦ C^ CO *^ Ю CD t4- OO O5 О ^н CM CO *^ »Л CD
368 ПРИЛОЖЕНИЕ Таблица Значения Хр в зависимости от вероятности Р(Ха>Х*) и числа степеней свободы %а-распределения [14] Число степе- степеней свобо- свободы / 1 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 30 0 0 0 0 0 0 1 1 2 2 3 3 4 4 5, 5, 6, 7, 7, 8, 8, 9, ю, ю, 11, 12, 12, 13, 15, 0,99 ,00016 ,020 ,115 ,30 ,55 ,87 ,24 ,65 09 56 1 6 1 7 2 8 4 0 6 3 9 5 2 9 5 2 9 6 0 0 0 0 0 0 1 1 2 2 3 3 4 4 5 6 6 7 7, 8, 9, 9, ю, И, 12, 12, 13, 14, 14, 16, 0,98 ,0006 ,040 ,185 ,43 ,75 ,13 ,56 ,03 53 06 ,6 2 8 4 0 6 3 9 6 2 9 6 3 0 7 4 1 8 3 Вероятность Р 0 0 0 0 1 1 2 2 3 3 4 5 5 6 7 8 8 9, ю, 10 и, 12, 13, 13, 14, 15, 16, 16, 18, 0,95 ,0039 ,103 ,352 ,71 ,14 ,63 ,17 ,73 ,32 ,94 6 2 9 6 3 0 7 4 1 9 6 3 1 8 6 4 2 9 5 0 0 0 0 1 1 2 2 3 4 4 5 6 7 7 8 9, 10, 10, 11, 12, 13, 14, 14 15, 16, 17, 18, 18, 20, ,90 ,016 ,211 ,584 ,06 ,61 ,20 ,83 ,49 17 86 6 3 0 8 5 3 1 9 7 4 2 0 8 7 5 3 1 9 6 (А 0 0 0 1 1 2 3 3 4 5 6 7 7 8 9 10 И 12 12, 13 14 15, 16, 17, 18, 18, 19, 20, 21, 23, ,80 ,064 ,446 ,005 ,65 ,34 ,07 ,82 ,59 ,38 .18 0 8 6 5 3 2 0 9 7 6 4 3 2 1 9 8 7 6 4 0 0 0 1 2 3 3 4 5 6 7 8 9 9 10 И 12 13 14 15, 16, 17, 18, 19, 19, 20, 21, 22, 23, 25, ,70 ,148 ,713 ,424 ,19 ,00 ,83 ,67 ,53 39 27 1 0 9 8 7 6 ¦ 5 4 4 3 2 1 0 9 9 8 7 6 5 С 1 0 1 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 17 18 19 20 21 22, 23, 24, 25, 26, 27, 29, ,50 ,45Е ,386 ,366 ,36 ,35 ,35 ,35 ,34 ,34 ,34 3 ,3 3 3 з 3 3 3 3 3 3 з. 3 3 3 3 3 3 3 0,30 1,01 Зщ 4*,« %i 84 95 10,7 11,8 12,9 14,0 15,1 16,2 17,3 18,4 19,5 20,6 21,7 22,8 23,9 24,9 26,0 27,1 28,2 29,3 30,3 31,4 33,5 ПРИЛОЖЕНИЕ 369 ]]родолжеиие табл. 4 Число степеней свободы / 1 2 (f А (> 1 8 9 10 и 12 13 ¦J4 15 IG 17 18 J9 20 21 22 23 24 25 20 27 28 29 30 0,20 1,64 3,22 4,64 6,0 7,3 8,6 0,8 11,0 12,2 13,4 14,6 15,8 17,0 18,2 19,3 20,5 21,6 22,8 23,9 25,0 26,2 27,3 28,4 29,6 30,7 31,8 32,9 34,0 35,1 36,3 0,10 2,7 4,6 6,3 7,8 9,2 10,6 12,0 13,4 14,7 16,0 17,3 18,5 19,8 21,1 22,3 23,5 24,8 26,0 27,2 28,4 29,6 30,8 32,0 33,2 34,4 35,6 36,7 37,9 39,1 40,3 0, 3 6 7 9 И 12 14 15 16 18 19 21 22 23 25 26 27 28 30 31 32 33 35 36 37 38 40 41 42 43 Вероятность Р (/.2>/.р) 05 ,8 ,0 ,8 ,5 ,1 ,6 ,1 ,5 ,9 ,3 ,7 ,0 ,4 ,7 ,0 ,з ,6 ,9 ,1 ,4 ,7 ,9 ,2 ,4 ,7 ,9 ,1 ,3 6 ,8 0,02 5,4 7,8 9,8 11,7 13,4 15,0 16,6 18,2 19,7 21,2 22,6 24,1 25,5 26,9 28,3 29,6 31,0 32,3 33,7 35,0 36,3 37,7 39,0 40,3 41,6 42,9 44,1 45,4 46,7 48,0 0, 6 9 11 13 15 16 18 20 21 23 24 26 27 29 30 32 33 34 36 37 38 40 41 43 44 45 47 48 49 50 01 ,6 ,2 ,3 ,3 ,1 ,8 ,5 ,1 ,7 ,2 ,7 2 7 1 6 0 4 8 2 6 9 3 6 0 3 6 0 3 6 9 0, 7 10 12 14 16 18 20 21 23 25 26 28 29 31 32 34 35 37 38 40 41 42 44 45 47 48 49 51 52 54 005 ,9 ,6 ,8 ,9 ,3 ,6 ,3 ,9 ,6 ,2 ,8 ,3 ,8 ,5 ,5 ,5 ,5 ,5 ,0 ,5 5 5 0, 9 12 J4 16 18 20 22 24 26 27 29 31 32 34 35 37 38 40 41 43 44 46 47 48 50 51 53 54 56 57 002 ,5 ,4 ,8 ,9 ,9 ,7 ,6 ,3 ,1 ,7 ,4 ,5 ,5 ,5 ,5 ,5 ,5 ,5 ,5 ,5 5 0,001 10,8 13,8 16,3 18,5 20,5 22,5 24,3 26,1 27,9 29,6 31,3 32,9 34,5 36,1 37,7 39,2 40,8 42,3 43,8 45,3 46,8 48,3 49,7 51,2 52,6 54,1 55,5 56,9 58,3 59,7 -4 В. в. Налимов
370 ПРИЛОЖЕНИЕ Вероятное™ > Р(Х2>Х?) в зависимости Хр и числа степеней свободы X2 Число степеней свободы / 2 \ ч \ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 0,3173 1574 0833 0455 0254 0143 0081 0047 0027 0016 0009 0005 0003 0002 0001 0001 0000 2 0,6065 3679 2231 1353 0821 0498 0302 0183 0111 0067 0041 0025 0015 0009 0006 0003 0002 0001 0001 0000 0000 0000 0000 0000 0,0000 0000 0000 0000 0000 0000 3 0,8013 5724 3916 2615 1718 1116 0719 0460 0293 0186 0117 0074 0046 0029 0018 ООН 0007 0004 0003 0002 0001 0001 0000 0000 0,0000 0000 0000 0000 0000 0000 4 0,9098 7358 5578 4060 2873 1991 1359 0916 0611 0404 0266 0174 0113 0073 0047 0030 0019 0012 0008 0005 0003 0002 0001 0001 0,0001 0000 0000 0000 0000 0000 Та блица 5 от значения -распределения [14] 5 0,9626 8491 7000 5494 4159 3062 2206 1562 1091 0752 0514 0348 0234 0146 0104 0068 0045 0029 0019 0013 0008 0005 0003 0002 0,0001 0001 0001 0000 0000 0000 6 0,9856 9197 8088 6767 5438 4232 3208 2381 1736 1247 0884 0620 0430 0296 0203 0138 0093 0062 0042 0028 0018 0012 0008 0005 0,0003 0002 0001 0001 0001 0000 7 0 9948 9598 8850 7798 6600 5398 4289 3326 2527 1886 1386 1006 0721 0512 0360 0251 0174 0120 0082 0056 0038 0025 0017 ООН 0,0008 0005 0003 0002 0001 0001 8 0,9982 9810 9344 8571 7576 6472 5366 4335 3423 2650 2017 1512 1119 0818 0591 0424 0301 0212 0149 0103 0071 0049 0034 0023 0,0016 0010 0007 0005 0003 0002 ПРИЛОЖЕНИЕ 371 Продолжение табл. Т> ^ Число степе- ^¦^ пей ^v свободы \. / 2 \. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 9 0,9994 9915 9643 9114 8343 7399 6371 5341 4373 3505 2757 2133 1626 1223 0909 0669 0487 0352 0252 0179 0126 0089 0062 0043 0030 0020 0014 0010 0006 0004 10 0,9998 9963 9814 9473 8912 8153 7254 6288 5321 4405 3575 2851 2237 1730 1321 0996 0744 0550 0403 0293 0211 0151 0107 0076 0053 0037 0026 0018 0012 0009 0,9999 9985 9907 9699 9312 8734 7991 7133 6219 5304 4433 3626 2933 2330 1825 1411 1079 0816 0611 0453 0334 0244 0177 0127 0091 0065 0046 0032 0023 0016 12 1,0000 0,9994 9955 9834 9580 9161 8576 7851 7029 6160 5289 4457 3690 3007 2414 1912 1496 1157 0885 0671 0504 0375 0277 0203 0148 0107 0077 0055 0039 0028 13 1,0000 0,9998 9979 9912 9752 94С2 9022 8436 7729 6939 6108 5276 4478 3738 3074 2491 1993 1575 1231 0952 0729 0554 0417 0311 0231 0170 0124 0090 0065 0047 14 1,0000 0,9999 9991 9955 9858 9665 9347 8893 8311 7622 6860 6063 5265 4497 3782 3134 2562 2068 1649 1301 1016 0786 0G03 0458 0346 0259 0193 0142 0104 0076 15 1,0000 1,0000 9996 9977 9921 9797 9576 9238 8775 8197 7526 6790 0023 5255 4514 3821 3189 2627 2137 1719 1368 1078 0841 0651 0499 0380 0287 0210 0161 0119 24*
372 ПРИЛОЖЕНИЕ Продолжение табл. 5 \. Число степе- \^ ней х. своооды > X ' ч Х^^ \ 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1G 1,0000 1,000:) 0,9998 9989 9958 9881 9783 9489 9134 8666 8095 7440 6728 5987 5246 4530 3856 3239 2687 2202 1785 1432 1137 0895 0698 0540 0415 0316 0239 0180 17 1,0000 1,0000 0,9999 9995 9978 9932 9835 9865 9403 9036 8566 8001 7362 6671 5955 5238 4544 3888 3285 2742 2203 1847 1493 1194 0947 0745 0581 0449 0345 0263 1 1 1 0 18 ,0000 ,0000 ,0000 ,9998 9989 9962 9901 9786 9597 9319 8944 8472 7916 7291 6620 5925 5231 4557 3918 3328 2794 2320 1906 1550 1249 0998 0790 0621 0484 0374 19 1,ОООО 1 1,0000 1 1,0000 0,9999 9994 9979 9942 9867 9735 9539 9238 8856 8386 7837 7226 6573 5899 .5224 4568 3946 3368 2843 2373 1962 1605 1302 1047 0834 0660 0518 1 1 0 20 ,0000 ,0000 ,0.100 ,0,H0 ,9997 9989 9967 9919 9829 9682 9462 9161 8774 8305 7764 7166 6530 5874 5218 4579 3971 3405 2888 2424 2014 1658 1353 1094 0878 0699 1 1 1 1 0 21 ,0000 ,0000 ,0000 ,0000 ,9999 9994 9981 9951 9892 9789 9628 9396 9086 8696 8230 7696 7111 6490 5851 5213 4589 3995 3440 2931 2472 2064 1709 1402 1140 0920 1 1 1 1 0 22 ,0000 ,0000 ,0000 ,0000 ,9999 9997 9990 9972 9933 9863 9747 9574 9332 9015 8622 8159 7634 7060 6453 5830 5207 4599 4017 3472 2971 2517 2112 1757 1449 1185 ПРИЛОЖЕНИИ 373 Продолжение табл. 5 Число степе- степеней свободы 2 3 4 5 6 7 8 9 Ю 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 20 27 28 29 30 23 1,0000 i,oooo 1,0000 24 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 9995 9984 9960 9913 9832 9705 9520 9269 8946 8553 8093 7575 7012 6410 5811 5203 4608 4038 3503 3009 2560 2158 1803 1494 25 0,9099 9997 9991 99 70 9945 9890 9799 9661 9466 9208 8487 8030 7520 6968 6387 5793 5198 4616 4058 3532 3045 2600 2201 1848 1,0000 1 ,(,000 l,000i ;0 1,0000 1,(!С00 1,0000 0,9999 9995 9986 9967 9929 9866 9765 9617 9414 9148 8818 8429 7971 7468 6926 6357 5776 5194 4624 4076 3559 3079 2639 2243 1,0000 i,0000 1,0000 1,0000 ,00ъ0 0000 0 9999 9997 9992 9980 9955 9912 9840 9730 9573 9362 9091 8758 8364 7916 7420 6887 6329 5760 5190 4631 4093 3585 3111 2676 27 1,0000 1,0000 1,00000 1,0000 i,0000 1,С000 1.00С0 0,9999 9995 9988 9972 9943 9892 9813 9694 9529 9311 9035 8700 8308 7863 7374 6850 6303 5745 5186 4638 4110 3609 3142 28 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,00СС 0,8991 9997 9993 9983 9964 9929 9872 9784 9658 9486 9261 8981 8645 8253 7813 7330 6815 6278 5730 5182 4644 4125 3632 29 0000 0000 0000 оооо 1,0000 1,0000 1,0000 1,0000 0,9999 9996 9Э90 9977 9954 9914 9850 9755 9622 9443 9213 8929 8591 8202 7765 7289 6782 6255 5717 5179 4651 4140
О5 -J -a -j Oj Oj Oj Oj Сл Сл O5 O5 *> Сл Сл Сл W *-*-*- О 00 CO it-fO -j-j-j-joo 05 •<] ~-J *~0 *~0 ГОГОГОГОО, Сл Сл СЛ СЛ Сл GO GO CO GO it- OcDOo-аа, 000000 0000 000000 0000 -j -a -j ^1 -а -а-а-а-а-а CD CD CD CD CD СЛ СЛ СЛ CD CD СЛ СЛ СЛ СЛ СЛ 1Л *~ GOIS5 ^ оооооооо со оооооооо со оо оооо оо оо -а-а оо оо оо -r-a-aVoo CD CD CO ~-3 ~-3 СП CD CD CD CD СП СП СП СЛ ОЭ Ocdoo-jc: н^ н^ ГО ГО ГО CD CD О О н^ н^ н^ ГО ГО ГО CD CD О О ^ 00 CD CD О >-*¦ 00 00 СО О н-* --3 00 00 СО О -3 -3 00 СОО Oi -J --3 00 О сл ф- со to »^ ее сл cd о о СО сл cj: to f— to O"i О to •<] ю со со ф- *- to сл 0 со со to сл О Ф-со CO ф-О Ф-СО to Co Oi N> *~ 8 4- 0 Ю значу 1 о to 0 CO я и л S а I? о и 3 3^ II -8 и U g S О К 8 ?8о СО СОФ* Ф- Ьо'сО О ^ со со со со о >-^ со со со со со со CJS --J 00 СО со со со со Ф* СЛ СЛ С75 со со со to со со Ф- сл со со со со *•*¦ to со со _* ^ _*to 00 00 со о СЛ С75 --J 00 О СО ^ Сл со to fw re to О 00 <Л Ф* tO ф* ф* ф* ф* ф* со со tss со со со со ее со со СО СО Ф- Ф* J>- со со со со со СОООО^ со со coco со -J --3 -3 00 00 со со со со со СЛ O"i CT5 О ~-3 со со to со гс Ф* Ф* СП СЛ ОЭ со со to со со •^ н-* Ю СО ЕО ^- >•*> to со to СО COO ОО C7S --J -J -<| 00 О со ос -д о ф*ф* ^ ф- rf> ф- ф*Ф* СЛ СЛ COCO СО СО СО СЛ СЛ О О ОТ со со со со со н-i н^. СО СО СО coco со со со СО СО СО О О to to со to со -1 --J 00 00 О со со со со to С75 СП --1 -J —3 со to to со to со со со ф- Ф* со со со со со i-л. ,-л. h^. СО СО н-* н-* н-* СО СО 00 СОСОО О Сл rf» CC tC hj. ф* ф* ф*ф* 1^. СлЪ5 -J 00 00 СО СО СО СО Ф- --J --J 00 СО О СО СО СО СО СО СО СО Ф- СЛ С75 со со ее со со ь^. t_i СО СО Ф- со ее со со со cooo^to tw СО СО СО СО 00 СО СО О >-* to tc to ic to От Сл Ci -J 00 со со tc tc со CO СО Ф-СЛ CD СО СО N5 СО СО ^ ^ьо со*- О ее ее -1 с; Сл сл сл сл О2 0*^*03 Ъэ О Ф* ф* ф- ф* От н^ СО СЛ --J *-* СО СО Ф-Ф- Ф* -3 СО ^ Ф-00 со со со ф* ф- СЛ СП) 00 *^ 01 СО СО СО Ф- Ф- соелч о*- СО СО СО СО tfc« со ф* 02 со со 1С СО СО СО ^ СО ^ СОО1 О со со со со со -<| СО *-* Ф* 00 со coco со со Сл-1 COtC -1 ! О^ 4^ СО to н-* 1 1-». t-*CD 02 -1 000 ф- С75 --3 ^- СЛ *> )^CD Сл О2 СО СО CD Ъо СО CD СО СЛ со СЛ CD CD СО СЛ Ф- CD CO СО —1 со н-*СО СП CD CO СО Ф- ю ф- >-*• со с5э со h^CO Сл СП) CD CO О >•*¦ со о со to tc н-* СО сл сь оо со Ф* о to со ее о to ф- Сл 00 СО *?- -<| СС -Д Ф* СО ф- сл 00 СО СО от оо о сл о to ф- Сл 00 СО Ф- ф*О Сл СЛ СО *° ^-^ м. to со Щ СП to to rff 8 << овен со начи S § IS 0 0 О
376 ПРИЛОЖЕНИЕ Продолжение табл. 6 \ V ,.\ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 120 оо 1 4052 98,5 34,1 21,2 16,3 13,7 12,3 11,3 10,6 10,0 9,7 9,3 9,1 8,9 8,7 8,5 8,4 8,3 8,2 8,1 7,9 7,8 7,7 7,6 7,6 7,3 7,1 6,9 6,6 2 4999 99,0 30,8 18,0 13,3 10,9 9,6 8,7 8,0 7,6 7,2 6,9 6,7 6,5 6,4 6,2 6,1 6,0 5,9 5,9 5,7 5,6 5,5 5,5 5,4 5,2 5,0 4,8 4,6 3 5403 99,2 29,5 16,7 12,1 9,8 8,5 7,6 7,0 6,6 6,2 6,0 5,7 5,6 5,4 5,3 5,2 5,1 5,0 4,9 4,8 4,7 4,6 4,6 4,5 4,3 4,1 4,0 3,8 Уровень значимости 0,01 4 5625 99,3 28,7 16,0 11,4 9,2 7,9 7,0 6,4 6,0 5,7 5,4 5,2 5,0 4,9 4,8 4,7 4,6 4,5 4,4 4,3 4,2 4,1 4,1 4,0 3,8 3,7 3,5 3,3 5 5764 99,3 28,2 15,5 11,0 8,8 7,5 6,6 6,1 5,6 5,3 5,1 4,9 4,7 4,6 4,4 4,3 4,3 4,2 4,1 4,0 3,9 3,8 3,8 3,7 3,5 3,3 3,2 3,0 6 5859 99,4 27,9 15,2 10,7 8,5 7,2 6,4 5,8 5,4 5,1 4,8 4,6 4,5 4,3 4,2 4,1 4,0 3,9 3,9 3,8 3,7 3,6 3,5 3,5 3,3 3,1 3,0 2,8 8 5981 99,3 27,5 14,8 10,3 8,1 6,8 6,0 5,5 5,1 4,7 4,5 4,3 4,1 4,0 3,9 3,8 3,7 3,6 3,6 3,5 3,3 3,3 3,2 3,2 3,0 2,8 2,7 2,5 12 6106 99,4 27,1 14,4 9,9 7,7 6,5 5,7 5,1 4,7 4,4 4,2 40 3,8 3,7 3,6 3,5 3,4 3,3 3,2 3 1 3^0 3,0 2,9 2,8 2,7 2,5 2,3 2,2 24 6234 99,5 26,6 13,9 9,5 7,3 6,1 5,3 4,7 4,3 4,0 3,8 3,6 3,4 3,3 3,2 3,1 3,0 2,9 2,9 2,8 2,7 2,6 2,5 2,5 2,3 2,1 2,0 1,8 СО 6366 99,5 26,1 13,5 9,0 6,9 5,7 4,9 4,3 3,9 3,6 3,4 3,2 3,0 2,9 2,8 27 2,6 2,5 2,4 2,3 2,2 2,1 2,1 2,0 1,8 1,6 14 1,0 ПРИЛОЖЕНИЮ 377 Продолжение табл. 6 Уровень значимости 0,001 12 24 8 10 11 13 14 15 16 17 18 19 20 22 24 26 28 40 60 120 со Изменяется от 400 000 до 600 000 998 167 74,1 47,0 35,5 29,2 25,4 22,9 21,0 19,7 18,6 17,8 17,1 16,6 16,1 15,7 15,4 15,1 ¦14,8 14,4 14,0 ¦13,7 13,5 13,3 12,6 12,0 11,4 ю,- 999 148 61 36 27 21 18 16 14 13 12 12 11 11 11 10 10 10 ю 9 9 9 8 8 8 7 7 6 3 6 0 7 5 4 9 8 0 3 8 3 0 7 4 ,2 ,0 ,6 ,3 ,1 ,9 ,8 ,2 ,8 ,3 ,9 999 141 56,2 33,2 23,7 ¦18,8 15,8 13,9 12,6 11,6 10,8 10,2 9,7 9,3 9,0 8,7 8,5 8,3 8,1 7,8 7,6 7,4 7,2 7,1 6,6 6,2 5,8 5,4 999 137 53,4 31,1 21,9 17,2 14,4 12,6 11,3 10,4 9,6 9,1 8,6 8,3 7,9 7,7 7,5 7,3 7,1 6,8 6,6 6,4 6,3 6,1 5,7 5,3 5,0 4,6 999 135 51,7 29,8 20,8 16,2 13,5 11,7 10,5 9,6 8,9 8,4 7,9 7,6 7,3 7,0 6,8 6,6 6,5 6,2 6,0 5,8 5,7 5,5 5,1 4,8 4,4 4,1 999 133 50, 28, 20, 15, 12, И, 9, 9, 8, 7, 7, 7, 6, 6, 6, 6, 6, 5, 5 5 5 5 4 4 4 3 I 5 8 0 5 9 1 9 1 4 9 4 1 8 6 4 2 0 8 6 4 2 1 7 4 0 7 999 131 49,0 27,6 19,0 14,6 12,0 10,4 9,2 8,3 7,7 7,2 6,8 6,5 6,2 6,0 5,8 5,6 5,4 5,2 5,0 4,8 4,7 4,6 4,2 3,9 3,5 3,3 999 128 47,4 26,4 18,0 13,7 11,2 9,6 8,5 7,6 7,0 6,5 6,1 5,8 5,6 5,3 5,1 5,0 4,8 4,6 4,4 4,2 4,1 4,0 3,6 3,3 3,0 2,7 999 '126 45,8 25,1 16,9 12,7 10,3 8,7 7,6 6,9 6,3 5,8 5,4 5,1 4,9 4,6 4,5 4,3 4,2 3,9 3,7 3,6 3,5 3,4 3,0 2,7 2,4 2,1
378 ПРИЛОЖЕНИЕ Таблица 7 Значения г для различных уровней значимости (двухсторонний критерий) [1] - 22Я Число степе! свобод 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Уровни значимости 0,1 1,397 1,559 1,611 1,631 1,640 1,644 1,647 1,648 1,649 1,649 1,649 1,649 1,649 1,649 1,649 1,649 1,649 1,649 1,649 1,649 1,649 0,05 1,409 1,645 1,757 1,814 1,848 1,870 1,885 1,895 1,903 1,910 1,916 1,920 1,923 1,926 1,928 1,931 1,933 1,935 1,936 1,937 1,938 0,01 1,414 1,715 1,918 2,051 2,142 2,208 2,256 2,294 2,324 2,348 2,368 2,385 2,399 2,412 2,423 2,432 2,440 2,447 2,454 2,460 2,465 0,001 1,414 1,730 1,982 2,178 2,329 2,447 2,540 2,616 2,678 2,730 2,774 2,812 2,845 2,874 2,899 2,921 2,941 2,959 2,975 2,990 3,003 is Число степен свобод 22 23 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 120 со Уровни значимости 0,1 1,648 1,648 1,648 1,648 1,648 1,648 1,648 1,648 1,648 1,648 1,648 1,647 1,647 1,646 1,646 1,646 1,646 1,646 1,646 1,645 0,05 1,940 1,941 1,941 1,942 1,943 1,943 1,944 1,945 1,945 1,948 1,949 1,950 1,951 1,953 1,954 1,955 1,956 1,956 1,957 1,960 0,01 2,470 2,475 2,479 2,483 2,487 2,490 2,492 2,495 2,498 2,509 2,518 2,524 2,529 2,537 2,542 2,547 2,550 2,553 2,556 2,576 0,001 3,015 3,026 3,037 3,047 3,056 3,064 3,071 3,078 3,085 3,113 3,134 3,152 3,166 3,186 3,201 3,211 3,220 3,227 3,237 3,291 Таблица 7А Значения rnlax (или гт[п) для различных уровней значимоетп [169] «а О И tt 1 2 3 4 5 6 7 8 9 10 И 12 Уровни значимости 0,10 1,406 1,645 1,791 1,894 1,974 2,041 2,097 2,146 2,190 2,229 2,264 2,297 0,05 1,412 1,689 1,869 1,996 2,093 2,172 2,237 2,294 2,343 2,387 2,426 2,461 0,025 1,414 1,710 1,917 2,067 2,182 2,273 2,349 2,414 2,470 2,519 2,562 2,602 0,01 1,414 1,723 1,955 2,130 2,265 2,374 2,464 2,540 2,606 2,663 2,714 2,759 ой °5с? 13 14 15 16 17 18 19 20 21 22 23 Уровни значимости 0,10 2,326 2,354 2,380 2,404 2,426 2,447 2,467 2,486 2,504 2,520 2,537 0,05 2,493 2,523 2,551 2,577 2,600 2,623 2,644 2,664 2,683 2,701 2,717 0,025 2,638 2,670 2,701 2,728 2,754 2,778 2,801 2,823 2,843 2,862 2,880 0,01 2,800 2,837 2,871 2,903 2,932 2,959 2,984 3,008 3,030 3,051 3,071 приложение 379 Таблица 8 Значения коэффициентов корреляции гху для различных уровней значимости (двухсторонний критерий) [5] Число степеней свободы / Уровни значимости 0,10 0,05 0,02 0,01 0,001 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100 0,988 0,900 0,805 0,729 0,669 0,621 0,582 0,549 0,521 0,497 0,476 0,457 0,441 0,426 0,412 0,400 0,389 0,378 0,369 0,360 0,323 0,296 0,275 0,257 0,243 0,231 0,211 0,195 0,183 0,173 0,164 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 о 0 0 о, 0, о, о, о, о, о, о, о, ,997 ,950 ,878 ,811 ,754 ,707 ,666 ,632 ,602 ,576 553 532 514 497 482 468 456 444 433 423 381 349 325 304 287 273 250 232 217 205 195 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 о 0 0 0 о, о, ,999 ,980 ,934 ,882 ,833 ,789 ,750 ,716 ,685 ,658 ,634 ,612 ,592 ,574 ,558 543 528 516 503 492 445 409 381 358 338 322 295 274 256 242 230 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 о, 0. о, о, о, 0, о, о, о, ,000 ,990 ,959 ,917 ,874 ,834 ,798 ,765 ,735 ,708 ,684 661 641 623 606 590 575 561 549 537 487 449 4J8 393 372 354 325 302 283 267 254 1,000 0,999 0,992 0,974 0,951 0,925 0,898 0,872 0,847 0,823 0,801 0,780 0,760 0,742 0,725 0,708 0,693 0,679 0,665 0,652 0,597 0,554 0,519 0,490 0,465 0,443 0,408 0,380 0,357 0,337 0,321
380 ПРИЛОЖЕНИЕ Таблица 9 Вероятности Р(К) для различных значений К (распределение Колмогорова) [22] X 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 1,0000 0,9997 9972 9874 9639 9228 8643 7920 7112 6272 X 0,80 0,85 0,90 0,95 1,00 1,10 1,20 1,30 1,40 1,50 Р(Х) 0,5441 4653 3927 3275 2700 1777 1122 0681 0397 0222 X 1,60 1,70 1,80 1,90 2,00 2,10 2,20 2,30 2,40 2,50 Р(Х) 0,0120 0062 0032 0015 000? 0003 0001 0001 0000 0000 Таблица 10 Вероятности появления значений г, заключенных в интервале шириной в 0,1 [131] Интер- Интервалы для г •) п=3 п=4 п=5 0,0-0,1 0,1-0,2 0,2—0,3 0,3-0,4 0,4-0,5 0,5—0,6 0,02253 0,02264 0,02287 0,02324 0,02375 0,02444 1 20 /3**) 1 20/3 1 20\' 3 1 20/3 1 20 1 20/3 0,03182 0,03174 0,03158 0,03134 0,03101 0,03060 0,03362 0,03338 0,03312 0,03271 0,03218 0,03151 0,03983 0,03943 0,03865 0,03751 0,03604 0,03428 *) Положительные или отрицательные; распределение симме- симметрично. 20/3 -=0,0288675. 3 ПРИЛОЖЕНИЕ 381 Продолмсение табл. 10 Интер- Интервалы для г 0,6-0,7 0,7-0,8 0,8-0,9 0.9-1,0 1,0—1,1 1,1-1,2 1,2-1,3 1,3—1,4 1,4-1,5 I, ¦")-!, 6 1,0-1,7 1,7-1,8 1,8—1,9 1,9-2,0 2.0—2,1 2,1—2,2 2,2-2,3 2,3-2,4 2,4-2,5 п-3 0,02536 0,02656 0,02819 0,03042 0,03367 0,03884 0,04868 0,08364 0,04517 (предел) =/2) 20 20 20 20 i Кз 1 Vz i /з 1 V3 i 20 /3 1 20 20 20 20 20 i Vb l VI 1 i /з l 20 К 3 0,00925 (продел -/3) п=5 0,03010 0,02950 0,02881 0,02800 0,02709 0,02604 0,02484 0,02348 0,02191 0,02010 0,01797 0,01538 0,01203 0,00666 (предел 0,03070 0,02976 0,02869 0,02748 0,02614 0,02466 0,02306 0,02131 0,01943 0,01742 0,01527 0,01299 0,01058 0,00803 0,00534 0,00253 0,00019 (предел =/5) 0,03229 0,03011 0,02780 0,02540 0,02299 0,02060 0,01827 0,01604 0,01395 0,01201 0,01023 0,00863 0,00721 0,00597 0,00489 0,00396 0,00318 0,00253 0,00199 (предела нет)
382 ПРИЛОЖЕНИЕ Таблица 11 Число испытаний с «юнее часто встречающимся знаком для различных уровней значимости прп различном числе наблюдений <п [38] ^\ Уровни n. вначи- N. МОСТИ n N^ 1 2 3 4 5 6 7 8 9 К) 11 12 13 14 15 16 17 18 10 20 21 22 23 24 25 26 27 28 29 30 0,01 0 0 0 0 1 1 1 2 2 2 3 3 3 4 4 4 5 5 6 6 6 7 7 0,05 0 0 0 1 1. 1 2 2 2 3 3 4 4 4 5 5 5 В 6 7 7 7 8 8 9 0,10 0 0 0 1 1 1 2 2 3 3 3 4 4 5 5 5 6 6 7 7 7 8 8 9 9 10 0,25 0 0 0 1 1 1 2 2 3 3 3 4 4 5 5 6 6 6 7 7 8 8 9 9 10 10 10 и \ч Уровни n. значи- \ мости Ns^ П ^ч \ 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 40 50 51 52 53 54 55 56 57 58 59 60 0,01 7 8 8 9 9 9 10 10 И И И 12 12 13 13 13 14 14 15 15 15 16 16 17 17 17 18 18 19 19 0,05 9 9 10 10 И И 12 12 12 13 13 14 14 15 15 15 16 16 17 17 18 18 18 19 19 20 20 21 21 21 0,10 10 10 И 11 12 12 13 13 13 14 14 15 15 16 16 16 17 17 18 18 19 19 20 20 20 21 21 22 22 23 0,25 И 12 12 13 13 14 14 14 15 15 16 16 17 17 18 18 19 19 19 20 20 21 21 22 22 23 23 24 24 25 ПРИЛОЖЕНИЕ 383 Продолжение табл. 11 \. Уровни \. значи- n. мости п ^ч 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 0,01 20 20 20 21 21 22 22 22 23 23 24 24 25 25 25 0,05 22 22 23 23 24 24 25 25 25 26 26 27 27 28 28 0,10 23 24 24 24 25 25 26 26 27 27 28 28 28 29 29 0,25 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 \. Уровпи \^ значи- N. мости п \^ 7E 77 78 79 80 81 82 83 84 85 86 87 88 89 90 0,01 26 26 27 27 28 28 28 29 29 30 30 31 31 31 32 0,05 28 29 29 30 30 31 31 32 32 32 33 33 34 34 35 0,10 30 30 31 31 32 32 33 33 33 34 34 35 35 36 36 0,25 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 Таблица 12 Значения верхних п нижних пределов общего числа серий R для различного числа наблюдений п [14, 38] п 10 12 14 16 18 20 22 24 26 28 30 32 34 0>025 2 3 3 4 5 6 7 7 8 9 10 И И й0,975 9 10 12 13 14 15 16 18 19 20 21 22 24 п 36 38 40 50 60 80 100 120 140 160 180 200 220 й0.025 12 13 14 18 22 31 40 49 58 68 77 86 96 0,975 25 2G 27 33 39 51 61 72 83 93 104 115 125
Таблица 13 Пяти- и однопроцентные пределы для отношения наибольшей эмпирической дисперсии к сумме к эмпирических дисперсий [14] Уровень значимости 0,05 10 10 36 144 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 оэ 0,9985 0,9669 0,9065 0,8412 0,7808 0,7271 0,6798 0,6385 0,6020 0,5410 0,4709 0,3894 0,3434 0,2929 0,2370 0,1737 0,0998 0 0,9750 0,8709 0,7679 0,6838 0,6161 0,5612 0,5157 0,4775 0,4450 0,3924 0,3346 0,2705 0,2354 0,1980 0,1576 0,1131 0,0632 0 0,9392 0,7977 0,6841 0,5981 0,5321 0,4800 0,4377 0,4027 0,3733 0,3264 0,2758 0,2205 0,1907 0,1593 0,1259 0,0895 0,0495 0 0,9057 0,7457 0,6287 0,5441 0,4803 0,4307 0,3910 0,3584 0,3311 0,2880 0,2419 0,1921 0,1656 0,1377 0,1082 0,0705 0,0419 0 0,8772 0,7071 0,5895 0,5065 0,4447 0,3974 0,359о| 0,328E; 0,3029| 0,2024! 0,2195 0,1735 0,1493 0,1237 0,0968 0,0682 0,0371 0 0,8534 0,6771 0,5598 0,4783 0,4184 0,3726 0,3362 0,3067 0,2823 0,2439 0,2034 0,160 0,1374 0,1137 0,0887 0,0623 0,0337 0 0,8332 0,6530 0,5365 0,4564 0,3980 0,3535 0,3185 0,2901 0,2666 0,2299 0,1911 0,1501 0,1286 0,1061 0,0827 0,0583 0,0312 0 0,8159 0,6333 0,5175 0,4387 0,3817 0,3384 0,3043 0,2768 0,2541 0,2187 0,1815 0,1422 0,1216 0,1002 0,0780 0,0552 0,0292 0 0,8010 0,0167 0,5017 0,4241 0,3682 0,3259 0,2926 0,2659 0,2439 0,2098 0,1736 0,1357 0,1160 0,0958 0,0745 0,0520 0,0279 О 0,7880 0,6025 0,4884 0,4118 0,3568 0,3154 0,2829 0,2568 0,2353 0,2020 0,1671 0,1303 0,1113 0,0921 0,0713 0,0497 0,0266 О 0,7341 0,5466 0,4366 0,3645 0,3135 0,2756 0,2462 0 0,2226 0,2032 0 0,1737 0,1429 0,41080 0,0942 0,0774 О, 0,0411 О, О 0,6602 0,5813 0,5000 0,4748 0,40310,3333 0,3720 0,3093 0,2500 0,3066 0595 0,0462 0,0316 0218 0,0165 О О, 2513 2119 0,2000 3,1667 0,26120, 0,2278 0,1833 0,1429 ,2022 0,1616 0,1250 0,1820 0, ,1655 0, 0,1403 0,1100 0,1144 0,0889 0,0667 ,0879 0,0675 0,0743 1446 0,1111 1308 0,1000 0,0604 0,0457 0,0567 0,0417 0,0333 0,0250 0,0167 0347 0234 ( 0120 0,0083 О и о 0,0833 Й 0,0500 Продолжение табл. 11 Уровень значимости 0,01 1 8 9 10 16 36 144 2 3 4 5 6 7 8 9 10 12 15 . 20 24 30 40 60 120 оэ 0,9999 0,9933 0,9676 0,9279 0,8828 0,8376 0,7945 0,7544 0,7175 0,6528 0,5747 0,4799 0,4247 0,3632 0,2940 0,2151 0,1225 0 0,9950 0,9423 0,8643 0,7885 0,7218 0,6644 0,6152 0,5727 0,5358 0,4751 0,4069 0,3297 0,2871 0,2412 0,1915 0,1371 0,0759 0 0,9794 0,8831 0,7814 0,6957 0,6258 0,5685 0,5209 0,4810 0,4469 0,3919 0,3317 0,2654 0,2295 0,1913 0,1508 0,1069 0,0585 0 0,9586 0,8335 0,7212 0,6329 0,5635 0,5080 0,4627 0,4251 0,3934 0,3428 0,2882 0,2288 0,1970 О,1635 0,1281 0,0902 0,0489 О • 0,9373 0,7933 0,6761 0,5875 0,5195 0,4659 0,4226 0,3870 0,3572 0,3099 0,2593 0,2048 0,1759 О,1454 0,1135 0,0796 0,0429 О 0,9172 0,7606 0,6410 0,5531 0,4866 0,4347 0,3932 0,3592 0,3308 0,2861 0,2386 0,1877 0,1608 0,1327 О,1033 0,0722 0,0387 О 0,8998 0,7335 0,6129 0,5259 0,4608 0,4105 0,3704 0,3378 0,3106 0,2680 0,2228 0,1748 0,1495 0,1232 0,0957 0,0668 0,0357 О 0,8823 0,7107 0,5897 0,5037 0,4401 0,3911 0,3522 0,3207 0,2945 0,2535 0,2104 0,1646 0,1406 0,1157 0,0898 0,0625 0,0334 О 0,8674 0,6912 0,5702 0,4854 0,4229 0,3751 0,3373 0,3067 0,2813 0,2419 0,2002 0,1567 0,1338 0,1100 0,0853 0,0594 0,0316 О 0,8539 0,6743 0,5536 0,4697 0,4084 0,3616 0,3248 0,2950 0,2704 0,2320 0,1918 0,1501 0,1283 0,1054 0,0816 0,0567 0,0302 О 7949 0,7067 6059 0,5153 0,4230 0 4884 0,4057 0,3251 4094 0,3351 О, О, о, о, о, о, о, о, 0,2297 0,1961 0,16120 0,1248 0 О, 0,0867 О, 0,0461 0,0242 0 О 0,2644 0 3529 0,2858 0,2229 3105 0,2494 0,1929 0 2779 0,2214 0,1700 0 2514 0,1992 0,1521 0,18110,1376 0 0,1535 0,1157 ,12510,0934 ,960 0,0709 1060 0,0810 0,0595 0 0,0658 0,0480 0 0668 0,0503 0,0363 0,6062 0 0,0344 0,0245 0 ,0178 О 0,0125 0 О ,5000 ,3333 0,2500 ,2000 0,1667 ,1429 ,1250 0,1111 ,1000 0,0833 0,0667 0,0500 ,0417 ,0333 0,0250 ,0167 ,0083 О и о м 3 55
380 ПРИЛОЖЕНИЙ XOtCOOtOliOCOCDOtCDCSlcGOtlNaN *^ CM th i_O CN1 «^ C4* th *^ CD t*** t*** CD *^ t*** *Л О О О5 GO GO )OsJIth ] OS rH GO эааосмсоюсо-з1 :> со ^-> ю со ^ г- о 00 CO h-тН О 1С t^ h-CD IO юсоазазо^нм OiracocococcGOira< Приложение 38/ l> X X О Sfi гн 2">*
388 ПРИЛОЖЕНИЕ з Sco с HO^CDO3 0iOCD "~ — -^P !>• О -^-н CD 00 ) 00 С CO GO CO О CD OJI> CO С ПРИЛОЖЕНИЕ 389 Г- CD ) -т-Н О -ГЧ С > CN] OS CO С 2 ОМ^0H>Ь^1 ss CD CO f4-vfi Ю Q "I CD CO OS О - lO C] Ю »• CO CN] ¦ CD O3 CO O3 Ю Ю '
300 ПРИЛОЖЕНИЕ coggoco . . . . . CD O5 CDCO COO CO 8 GO t^ Ю*^ - тч GO GO t-h С CO^OliOCOsfi CDC ) Г- ГД «tf Ю 00 ПРИЛОЖЕНИЕ 391 Г- 00 ГО N ^ M М^тсСЮ t00 4|* CM »^ О CD C-] з Ооюо^^с^с^-^ю-^н CD CD О "^^ С CM GO -^ GO 1
'<I^05WOOiCOOOWWCOCXi О 00 to 00 CnOCnaOOO(XiCOCDCn<H)tOC0 4 - tO OS CD C3 OS •<! *¦ coo to oo ' h-^ СП to О CDODCDOOCDCn OOCOStOJ <IC>OCЮC>OC^ CD О CO CO OO .. _j о to oo to to as coco с OT~JOTtOtOOOCOCOOCOtOCD?*CDtOCOCnOTC CntOtOOOCOCO cDcocPOooascntooasocsJ C0CDt0Ot0Oit0<l00<lt0CDOi CO СП СП с 00 00 to С 8? CO-^Jh-^CDCnCSCSCOOOb-i-JN. COCOCDOO-JCnCDCnCDOOCOtO O00 to^o^^^ascscocotocasto S О О CD ^ ^-i¦ *¦ Э CD CD •<! CD CD С )О0 0О^Ч<1С it- СЛ as as cd oo tfs to as to О CD 00 CD OS •<! § Jtf oasco oo oo oo as ел ¦ to as со с ¦ as со as < OCDOOOCDOlCDtOasasCncDOSCD OltO^CDb^cDOStOOOb^tOOPS яиняжокиди ЯИНЯЖОиИгШ
304 ПРИЛОЖЕНИЮ C^OtrHClCMGOCMG Ю CO CO ^ sf LO Ю CD ^OlOOSCDsfOOCOCD o: -^ О O) M Q 'чС И X О номю^о о CM ^CO oo a ^ ^ о t^ iN О CO-^ CO CO CO sf t^ ОЮС0М fi'JO InOSOSlO^GOCOOSCOCD О О СО «^ с\] о < " С\1 -гн ZO ч& С OlOCDLOhst GO CD CM IN sji О ¦ ) а с ) CO < 1>СООЭ1>1>Ю1>10Ос CO -^ LC CN] CN] ^C OQ СО-Ю ) CO «^ CO Ю GO ¦' lhСОтнОЗОС 1 О Nji !>• CO CD С 'OOsfOOD^I fl 00 Ш t~ tD CD 00 ( ) Ю C4] !>• CO CO "^ O^ С Ю ПРИЛОЖЕНИИ 395 ^CD 8г L* О oq loco со юсд < LO «^ CO CM f- О С 5rH«*THiOCDiNINh-- н CO —ч GO CO " as см о cd «^ см «^ <. CD CD I> OS OS ^ О : CMasO^ CO Q (D CD 00 > OSraiLOCOOOLOCO^iO^tCOCD О IN тн СО О W 00 CN 00 CO CO О М СО «О
396 ПРИЛОЖЕНИЕ -^HLf^O О !>• OS CO !>• С0тнС0О1>С000тч тн h-OOOlNO CD CO I 2 н s. приложение О СМЮ OS CO M CO CO CO -tf -.__ . _ CD CM CO "<Р О CD CD О !>• CD CD OS CO О OS OS thiNCO -<fCOt^OS thCOCOOSthsJi _„._._-.. _ т-н ^н V-н-^н CM CM CM COCO CO-^ **Р Ю Ю osososososos osososos os сз os os os os ososioosos ososos sfiOt^Q -^н CO CD GO th -^h -^h ^h cococococdco cocococd cocdcdcocdcd cdcdcdcdco cdcdcd *~ "гнС0 Ю1>Отн COlOt--OS-^HCO iOI>-OS-^hCO ЮЬО5 COl>-COC<I CM-^CO-^COCO lOOSlO1^1^ CDOCD тн MCO •fl'lOh'Ol ¦^нСО1Л>00-^н1<-н t^Ov^OOCNI CD-^Hin th ^h -*h ^h C\I CM CM CO CO CO ^ C^6qc^C^!rqC4l tNC4|C4|C4l , , C4ICOC4IOO C4)CDC<IO OC4ICDC4IOO IN CD M О О CMCDcn тнМСО ^ifit^Oi тнСОЮООтн^ Г-О^СССч! СООЮ ^н ^н ,н ^ М СМ СМ СО СО СО -^ -&ЮЮ CDCDCDCOCDCO COCDCOCD CDCDCDCDCDCO CDCDCDCDCD CDCDCD тнОГ^ЮСОтн OSI>-^OCO thOJMO^th О^-ЮСОтн OSF-Ю тнЮтн QQ O^OGO OOOSCOOSr-t-- GOCMGOCDCD L>- тн t> thhM sJiiOo-OO 0<NLOt^OCO CDOCOC^-^h THrH^HrHlNCNl CMCOCOCO1^ , _. _- ». __ _. ». __ __ _, __ w. ,_, w, _. __ OS OS OS OS OS _- —- CDCMGO-^O COCMGO1^ OCDCMOO^O CDCMOO^O CDCMGO "0000 OSCOOCCD CDt^-^HCD1^1^ lOQsfM M COI>-!N нтн M COLf^CDOO OMlOh-OCO CDQCO 1>тн lOCDsJi . , , , ^ «^ ^ ^ -^ Sji Nji Sji Sji SJ< 4* Sji Sji Sj Sji Sji Sji Sji sfGO MCDO -^OOCMCD O^OOCMCDO "^ M C\| CD О -^GOCM thsJIOC^C^ GO-^Ht^1^ •<tilO001<ti^H^H (МЮтнСООО OSCMGO th-thiN CO^OCDOO OCMn^o-QCO ^O^COCDQ cm5coo2Q Й1^- .», -w w -- ^ — ^ >—- -- -. -— -- - - ¦^H-^OSCOCO 1>ОЮ CM CMCOCD-^hOOOO OSCMC^1^1^ Ю0ОСО ¦^нСМ С0ЮСО00 OCMnJ<|>.OSCM IOOSCMCDO -^GOCO тНгНгНтНтнСЧ CMCMCOCO1^ 1<til<ti^ CD CD CD CD О CD CD О О О О О О О CD О О CD О О О О О О ¦^нСМ СО-^СООО OCMsJiCDOSCM ЮСОСМСОО ^н^н^н^н^нСМ СМСМСОСО1^ ¦^нвМСО-^Ю COl>-00OS О^НСМСО^Ю СОГ-COOSCD тн^ тн тн ^н ^н ^ ^н тн тн ^н тн СМ 39?
398 ПРИЛОЖЕНИЕ ) СО CD ¦* СМ О 00 ' П ¦* ¦* ^M( CM CD С ) CO CD-* CM О ОС ) CO «CDCOCMOI о о cooo in ¦ ^СО^^^^Й ^ 23 ""^ "^ Sfi CDcO^hCDC^ MOCO Г~ CD CD ЭГ-Г-СОСООЭ О О-^ч CM CM CO-*inLOCD ОЭ-* -^ч CD ОЗ ОЗ -^i CM CO CM CM CM ¦* ¦*¦*¦* О CD CM CO Ю LO 00 Cvl ¦*¦*¦*¦*¦* ¦*¦*¦*¦*¦* CM CO ¦* О CD CM00-*OCD CD CD I— I— CO 00 CO ¦*¦*¦*¦*¦* ¦* СМОО ¦* О CD CM t- -гч 00 t- t- - . - - ОЭ CO 00 t-COCDOO тн CM CO -¦ -- CM CM CM O3 CD ОЗ ОЗ CD O* CO С" ¦ —i ¦* тн CD CM CO CD Г~ Г~ СО О CD CO О t- ¦* CM CD г- Щ OOthM(N CO ¦* n? LO CD 010005 CO CM CDO ¦* CO CO CD CO CO CO CMO CD CO t- CO CD CD О ¦^ч -^ч -^ -^ CM ОЗ ОЗ ОЗ CO CM CD О Щ -n со r~ r-- -ГЧ CM CO CM CM CM CD CD CD CD CD CD CD H CO Щ Г~ CD т-н CO ОЮОСОтньп CD CD I— I— CO 00 ОЭ CDCDCDCDCD CDCOCDCDCD LOt--a3-r4CO Ю Г- ОЭ -rt CO со см со г- г- азсоооооо CDCDCMCDCD CO тн XCD«tf CDO-^H-^-<CM CO ¦* ¦* Щ CD CDCDCDCDCD LOt—CD-rnCO ooo> CD CD CD LO Г-С5 С— CD CD ¦^ч CM CO CM CM CM lOininiOininin 1П1П1П1О1П ininLOinin LO CM CM CM LO CM CM CM CM CM CM CM CM CMCMCMCMCM CM „ .,.4 О О CM CD CM О О CMCDCMOO CM CD CM О О CM CD CM О О CM CD CDincMO3CD CO О CO CD ¦* CMOO3C0t^ CD 1П 1П - - i 1П 1П CM in 1 1 CM CM CM CM CM CM С cd о- fM CO ¦* ¦* Щ CD t- CO 00 CD О -тнСМсб 1П LO CD О CD ¦* ¦* LOCJincOCO •* 00 ¦* CM CM COt-coSS CMCD CD ¦* Ю CD аз lo о со см oo ¦ oq cDoq CDL^-COGOOS СЗОтИ^гд COCO^iOCD f-t-СОСЪО -^^acO ггп^-н-^н-^н r-i^H-^H—н-гн птн^гим oqoqoq OS CS CS CS OS OS OS ¦tf О CD Oq GO St1 О О ОтнЮОЮХ OS sji OS sji О Ю тгч LO CD CD f- GO 00 OS ОЭ СО CD ОЭ ОЭ CD CM СО ¦* О OJ СО СО СО СО oosoosc^ osasososos CD Oq GO -tf О CD Oq CO ^ О t-^HCC1^^ ЮО5-^С\]СЧ THCSCD-^oq ОСО^-СОЮ COCO-^lQCD t>>t-G0OSO TH ^*H ^rn '^-H чгН чгН чгН чг-Н чг-Н СЧ CD CD ОЭ CD CM 00 CO t- CM s)l COCO -ГЧ CM CO CM CM CM ¦*¦*¦*¦*¦*¦*¦* ¦*¦*¦*¦*¦* ^l-*-*-*-* ¦*¦*¦* v* .* ¦*¦*¦* OO-*C0(MCDO ¦* 00 CM CD О ¦* CO CM CD О ¦* CO CM CD О ¦* 00 CM LO 1Л ¦* OJ Ш CM CM COCDCMOJCD О CO CD CD CD t- О CD CO CO ¦* l> CO CO CO CO CO CD 1П -^4 t-COOCDCO -гн CO 1П CO ^ч CD CO CD 1П ¦* CO CM CO LO CD CD t- Г- СО ОЗ СЗО-^ч-^СМ CO CO ¦* 1П CD CD t— 00 CD О -гч CM CM ¦^н-^н-гн^н ^-i—,^н-гн-гн -гн-гн-^н^нСМ CMCMCM C0OCM-*CDC0O CM-*CD00O (M ¦* CD 00 О CM ¦* CD OO О CM ¦* CD ООтчч@)Юб t-OLOCMC^l CO О -гч CO CO OJCMt--*-* Ш 00 CO C0C000C0G0»*O COCOCDCOCO О t— JO CM О CO t— 1П ¦* CO CM^^CO " — "-C0CD CDOO-^ICM COCO^IQCD CD C— CO CD О -гнСМСМ ^^^^^^^^ ^-(^н^н^^^н -^H-^H-rH-^HCM CMCMCM rCMr 1П CD CD _ _ ___ _ . -ОООО ООООО ООО . _} О О О О О О ^^ О О О О О О О О О О О О О )«^^О тн«41 О5СОЮ СОС^11^ тн О ¦^H*^iOSCDLO CDOS*^ ._ СОС^СОЮО^ OSCDsJicNO GOCDsJiCOOq -^нОО • t^coas ©oOthw с<1со^юсс cdc^cooso ^hojco тн чрн ^н -ги тн^тн^нсм oq oq oq OOQOOOO OOQOO ООООО Ос •^locDo-gooso ¦^нсмсо'^ю coi>>coaso МММ?! M ?1 rj ГОГОГОГОГО fOCOrOCO1^ ПРИЛОЖЕНИЕ 399 О СО CD О О CO ¦* CM О CO CD CO 1П-* ¦* t- O3 О •« CM CO t— оз о -^ см CM CM CO CO CO •* CM С см аз с > CO CD ) CO -^ in CD CO О CO CO ¦* 1П L— 00 CO CO CO CO CO ¦* CM О CD CO СЧ CD in 1П CO -^ ¦* t~- OJO CM CO-* CO-* ¦*¦*¦* ¦* CM О CO CD-* О t— CD CD O3 ¦* •^ •* CO CM CD -^ CD Г- СО О •« CO ¦*¦*¦* in in in CM О CO CD •* •MOO COCO CD *c-i CD *c-i CD •*•*•*•*•* CO •* О CD CM C— •* CO CO CD ООООтн М со о -^ см CM CO CO CO CM C ¦*¦*¦*¦*¦* со-* о со см О t— со со оз ¦* 1П С— ОЗ -гн CO-* Ю CD CO CO CO CO CO CO ¦*¦*¦*¦*¦* CO •* О CD CM со о аз оз см ¦* С— ОЗ CM CD ОЭ О •« ГО-* «-*¦*¦*¦* ¦*¦*¦*¦*¦* 0-* О CD CM CO CO CM CM in ОЗ lOIOOOW ****** LO 1П 1П ¦*¦*¦*¦*¦* ¦* О CD CM CO со ю о со см O3 •* ОЗ 1П m t— со о 1П Ю 1П CD аз аз аз аз аз CM CD О ¦* CO t- CO CM CM-* i oq oq oq м со со аз аз аз аз аз CM CDO ¦* 00 O3 in ¦* •* CD CM ¦* CD CO О CO ¦* in CD CO CO CO CO CO CO аз аз аз аз аз CM CDQ ¦* CO •M t- CD CD CO CO 1П CO -^ •* ОЭО •MCO-* CO-* ¦*¦*¦* аз аз аз аз аз аз CM CD О "* 00 CM со оз со со о m CO -^ 1П O3 »* CO 1П t— CO O3 -^ CM ¦*¦*¦*¦* m m аз аз аз аз аз CDO ¦* CO CM HOONI' CO CO COCO CO ¦* 1П I " "" m m i CD CD CD сою о о oq CD CD CD sJHOCD oq oq oq CO CD CD CD CD CD CN] -e-t -r-f CO cd cocoas о t^xasocvi oq oq смсо со CD CD CD CD CD о- со oq oq sji COiO CO CO CO CD CD CD CD CD GO -tf CO СОЮ QO CO ^ CD CD CD CD CD CD 0 03-rtCOiO t^ 01 Ю sfi sji CD О as t-c oq CD CD CD CD CD omnt ojm СОЮЮ •^ CD -^ CD CM ¦* in Г-СХЗ О 1П 1П 1П 1П CD CM CM CM О OCM LOIOLQ ¦* in CD CM CM CM oq cd oq о о oq Ю CD t>- GO OS _ t^GOQO^ oq oq oq oqco со in in in m in CM CM CM CM CM CD CM О О CM О CM ¦* CD 00 CO-* 1П CD Г- CO CO CO CO CO ю ю lo ю ю ю. oqoqoqoqoqoq cDoqoooq cDoqoooqcc oq'oooqcD OCOCDOSOq lOQCOt^-^iO aso*«-*oqi<t' lOCDoooi-H ^ cosfsf^sf sji sji Nji sji ю Ю CD CD CD SS2 sji Ю CO oq см c^ CDCDCDCDCD CDCDCDCDCD sji ю Ю CD GO t^00O5O-rt oq м oqco со as -и oq sji cd oq sji ю cd t>> со со со со со CD CD CD CD CD со as t>> t— go as - со CD CD CD CD CD CD t>> ю со *«-* as t>> tM GO CD CD C^ ^ > -^н ю as o as о oq Ю CD CD CD CD CD ю со *«-* as t>> О-Ю Ю CDO GO CO GO CO OS CO Ю CD GO OS Ю Ю O Ю E? ОЗ аз аз as аз см со-* о cd со со cd cd t- аз -^ со in СО LO CD С— со coco со со as as as as as oq go -^ о cd CD ^ ^t1 Ю CO CD OS OJ CO аз аз аз аз аз аз см со ¦* о со см аз ¦* гм см со с— CM CD О ¦* СО СМ Ю CD СО О О СМ LQ Щ as as as as as go -^ о cd oq oq о о *«-* lo c^ oq c^ oq c^ CO Ю CD GO C5 ю ю ю o о oq со со -^ Ю r~- go as о *«-* oq oq oq со со 00 CM CD f Ю о- со о oq sji oq сою cd t- coco со со со 00 CM CDO ¦* со ¦* « -^ см со аз см ю со 1 аз •« см со LQ Ю LOLQ LQ ) О СМ )О •« «* СО СО О СМ ¦* ОЗ CD CD С— —н —< СМ СО •* Г-СХЗ ОЭО •« см см см со со •* CD CO О CM О 1П CM CM CO CD С— ОЗ -^ CO CM CO-* CD t- CO CO CO CO CO «* CD CO О CM CD *c-i CO CO O3 in 00 О CO CD CO O3 -^ CM CO CO CO-* ¦*¦* ¦* CD CO О СМ-* CM C— ¦* •* 1П CO о со c— -^ m оз 1П CD С— ОЗ О -^ ¦*¦*¦*¦* Ю 1П CD CO О CM ¦* COO О *-i-* ¦* ОЭ-* ОЭ-* CO-* CD t- ОЭ 1П 1П LO in LO 5 О ОС )О (Г ¦ »* аз cd l о о« см со t- со аз о •« см см см со со «* CD CO О CM CM CO ¦* CD C— П CO COCO CO ¦* O3 CD in ¦* CDO3 CM in CO ОЭО CM CO CO CO-* ¦* ¦* ОЗ CD Ш CD ОЗ СМ Г- CM t- CM CO-* CD Г-СЭ 1П LO LO LO LO OOO OOOOO OQOOO OOOOQ ОЗО-^н CMCO»*LnCD t—CJOCbO-^ CMCO»*LnCD »* m in ю lo lo io in lo io lo со со со со со ее со OOOQOO ООООО г— со аз о « см oo»*locdc— f{") Cf*i Cf*i f^* t4** J44*» t4** 1^^ f^* [^^ ^^
400 ПРИЛОЖЕНИЕ ю ¦^ч СМО СО CD CM 00-* О СМ СОЮ h- CD CD CD CD ¦tf CM CM СЛ I— CO со о CD t> o oo °, 00 r~ CO r~ !?>¦* CM О CO ^4 CD CO CM CM intNOWtD Ю Г~ СО О CM t- r- r-- oo oo со-* см о со LfS О Г- CD CD ЧПНОО! ^ CDCOO ^ oo oo oo со os CO -31 CM Q со oooo со СОЮ^О) CO CO G5 OS CD CMCO-^OCD 00 Г- Г- -3« О CD <-N 66 "^P О CD C^OO- CO0000-?-* Ю CM -^-l -^н sJiOOL. О CD CM CD Ю CM CD CD CO О 00 CD "<Р M тн O3 00 l> t-» CD CD CD CM CO Ю CD ОООтн CO lOr~00OiN sji CD !>• OS -г-н COlO^OS CDCDCDCD CDC^ l> О !>• »• !>• 00 00 00000000CO O5C0C0C0 OS СЛ СЛ ОЭ СЛ ОЭ СЛ СЛ CO CO CO CO OS CO CO CO OS ОЭ Ol C5 CO CO CD О "^ CO CN1 CD О ^ 00 CM CD О "^ ОЭ CM CD О "^ ODMCDO CO CM CM ¦* CO 1Л ¦* -fl< CD чч t~ CD CD CO CO CO 00 00 01.0^0 * тчСЛСО- C0 Ю CD CO CDCDCDCD CM ^1Л^От 00 00 00 CO 00 CO in 1/3 *** тн CO Ю Г~ СЛ CO OlOSOiQ CD CD CD CD CD CD CD CD CD CD CD CD CD ОЭ-тНСО^ 1>!СО-гЧСО Ю t^Cl^iCO CDCDCDCD CDCDCDCO r^OS-^CO Lf^f'-OS-^H - - - riiO'HO t^COCDLfb СЧОО^СЧ ¦^HCO-^CD 00CO*-" CD CD CD CD " " " CD CO ОЭ 00 66 CDt^-^fCSIO OSt^CD-^CO .. CO vJiCDOJOCNI COlOC^OS1^-1 СОЮ f" C-t^t^OOOO 00000000O3 CDCDOS -JC4IC4IC4I C<IC4IoqC4lC4l C<IC4lcaCMC4l СЧСЧСМСМ CD(NOO C\I CD CM О О СЧ1 CD Сч1 О О CM CD СЧ О тн CO -<J< CD CD CD CD CD CD CD t -^-" COIOCOthO: O-Lf^vJiCOCNI . __ CO SjiCOCOO'H СОЮС^СО»-н COlOC^C t^ t^t^t^OOOO 00000000CD O5CDCDC CDCDCDCD CDCDCDCD CDCDCDCDCD CDCDCDCDCD iOCOtHO: С^ЦрСО1^ CDt^iOCO-^н -- — CD CM 001ЛСМО5 CD CO - ^CD ГСЛСМ ^D CDCD ЮСОМтнО CO Ю I- CD t-h 00 00 00 00 CD CD CD CD CO Ol t^lO CO CM CD CM О os oo oooo CM ¦* CD 00 CD ОЭ O CM CD O"tf 1Л CM CM CO ^4 r^ CO OS M * Ш 00 CM CDC CD CM CD С 3 M * Ш CD Ф CD CD f- OS О CM CD CD C— !>• 00 CM CD О CO CD CD CD COOMOOO sji CD !>• CD -г-н е- r- r- c^ oo i 00 . О t-N CD О CD CO CO tOOO^ CO Ю CD 00 00 00 GO 00 •* «tfl «tfl -tf ¦^ 00 CM CD •^ !>• CO О ifi *& sji sji CM -tf CD 00 OS CD OS CD cbooo см CD CD CD t- OMOthC^ . OMsJiLO I>-OSOCM "<^Ю CDCDCDCD CDCDI>-I>- !>• !>• 00O CM-^'cboOO CMI sji' CD CO 6 CM^CDOO "" "" — -- U-, QQ ^ (-J . .. ч ' cM^cboo Г-00 00 00 00 00 OS CD OS OS OS CD С i *~i "^ OS CD Ю ¦ CD СМ00ЮСМ CDCD-^CMO OOCD-^ iLf^ l>-00OCM COlOt^-CD-rH CM-^CD CDCDCD CD CD t> l> t-* t-* t** t** 00 000000 О О OO О О ¦^н sji OS CD iC O o Э CM тн О О О ) О CM «^ CD 00 ) OS CD CD CD CD OOOO OOOO OO ооело« cMco-tfLO со г- oooooo oooo OOO ело« cMo r- oo oo oooo Рч О & О С! СВ н 19 о § а ю н о ев R g о Ш В" OS n и ft я s H II ©_ o" + 00 4rt Я Рч « OJ со ел CM "o ЛИТЕРАТУРА I. Основные руководства и монографии по математической статистике и теории вероятностей 1. Н. Арлей, К. Р. Бух, Введение в теорию вероятностей и математическую статистику. ИЛ, 1951, 246 стр. Краткое систематическое изложение основных вопросов теории вероятностей и математической статистики. 2. С. Н. Б е р н ш т е й н, Теория вероятностей. Гостехиздат, 1946, 556 стр. 3. Г. П. Б о е в, Теория вероятностей. Гостехиздат, 1950, 368стр. 4. Н. А. Б о р о д а ч е в, Анализ качества и точности производ- производства. Машгиз, 1946, 249 стр. Дается детальный анализ кривых распределения производст- производственных погрешностей. 5. К. А. Б р а у н л и, Статистические исследования в производ- производстве. ИЛ, 1949, 227 стр. В рецептурной форме излагаются методы статистического ана- анализа в применении к решению производственных задач. Особое вни- внимание уделено дисперсионному анализу. Приведены многочислен- многочисленные примеры, относящиеся к исследовательским работам на заводах взрывчатых веществ. 5а. И. С. В е н т ц е л ь, Теория вероятностей. Физматгиз, 1958, 464 стр. 6. Ю. С. Виноградов, Математическая статистика и ее применение к исследованиям в текстильном производстве. Государственное издательство легкой промышленности, 1956, 260 стр. Популярное изложение основ математической статистики и примеры применения ее в текстильном производстве. 7. А. В и н ь е р о н, Обработка результатов физико-химических наблюдений. Госхимиздат, 1934, 137 стр. Руководство по обработке результатов лабораторных измере- измерений. Автор считает, что применение теории вероятностей к лабора- лабораторным измерениям ошибочно и необоснованно. 8. Ф. В у д в о р д, Теория вероятностей и теория информации с применениями в радиолокации. Изд-во «Советское радио», 1955, 126 стр. 26 в. В. Налимов
402 ЛИТЕРАТУРА Краткое изложение теории информации—дисциплина, в которой при помощи методов теории вероятностей рассматриваются задачи связанные с передачей сведений при помощи электрических сигна- сигналов (связь, радиолокация, телеметрия автоматического регули- вания и т. д.). 9. Б. В. Г н е д е н к о, Курс теории вероятностей. Гостехиз- дат, 1954, 411 стр. 10. Б. В. Г н е д е н к о, А. Я. Хинчин, Элементарное вве- введение в теорию вероятностей. Гостехиздат, 1957, 144 стр. И. С. Голдмап, Теория информации. ИЛ, 1957, 446 стр. 12. А. М. Длин, Математическая статистика в технике. Изд-во «Советская наука», 1958, 465 стр. Изложение математической статистики в применении к задачам контроля качества машиностроительной продукции. 13. Дж. Л. Дуб, Вероятностные процессы. ИЛ, 1956, 605 стр. Систематическое изложение математической теории стохасти- стохастических процессов. 14. И. В. Д у н и н-Б а р к о в с к и й, Н. В. Смирнов, Теория вероятностей и математическая статистика в технике (общая часть). Гостехиздат, 1955, 556 стр. Систематическое изложение основных вопросов теории вероят- вероятностей и математической статистики, иллюстрированное примерами из области машиностроения и приборостроения. 15. Н. И. И д е л ь с о н, Способ наименьших квадратов и теория математической обработки наблюдений. Геодезиздат, 1947, 359 стр. Излагаются математические методы обработки результатов измерений, исходя из задач геодезии. 16. Г. Крамер, Математические методы статистики. ИЛ, 1948, 631 стр. Систематическое изложение теоретических основ математиче- математической статистики. 17. А. К. Кутай, X. Б. К о р д о н с к и й, Анализ точности и контроль качества в машиностроении с применением методов математической статистики. Машгиз, 1958, 321 стр. Излагаются статистические методы контроля и предупреждения брака в машиностроительной промышленности. 18. Б. Р. Левин, Теория случайных процессов и ее применение в радиотехнике. Изд-во «Советское радио», 1957, 496 стр. Излагаются основы теории вероятностей и теория случайных процессов в применении к задачам радиотехники. 18а. Ю. В. Линник, Метод наименьших квадратов и основы теории обработки наблюдений. Физматгиз, 1958, 331 стр. Изложение метода наименьших квадратов на основании идей и методов современной математической статистики. ЛИТЕРАТУРА 403 18Ь. Я. И. Л у к о м с к и й, Теория корреляции и ее примене- применение к анализу производства. Госстатиздат, 1958, 387 стр. 18с. Ф. М а з и с, Статистические методы, Госстатиздат, 1958, 799 стр. Рассматривается применение методов современной математиче- математической статистики к изучению явлений хозяйственной жизни капита- капиталистического общества. 19. М. Ф. М а л и к о в, Основы метрологии, ч. 1. Учение об изме- измерении, 1949, 477 стр. Излагаются основы метрологии, классическая теория ошибок и способ наименьших квадратов. 19а. Ф. М. М о р з, Д. В. К и м б е л л, Методы исследования операций. Изд-во «Советское радио», 1956, 307 стр. Статистические методы оценки эфективности военных действий по данным второй мировой войны. Изложенные в книге методы иссле- исследования операций могут представлять интерес и для широкого круга читателей, интересующихся вопросами хозяйственной и организа- организационной деятельности. 20. М. И. П о д г о р е ц к и й, В. И. Г о л ь д а н с к и й, А. В. К у ц е н к о, Статистика при регистрации ядерных частиц. Физматгиз, 1959, 411 стр. Излагается новая прикладная ветвь теории вероятностей—ста- вероятностей—статистика счета ядерных частиц. 21. В. С. Пугачев, Теория случайных функций и ее примене- применение к задачам автоматического управления. Гостехиздат, 1957, 659 стр. Систематическое изложение прикладной теории случайных функций и вероятностных методов теории автоматического управ- управления. 22. В. И. Романовский, Применение математической ста- статистики в опытном деле. Гостехиздат, 1947, 247 стр. В популярной форме излагаются методы статистического ана- анализа . Приводятся многочисленные примеры из области агробиоло- агробиологических экспериментов. 23. В. И. Романовский, Основные задачи теории ошибок, Гостехиздат, 1947, 116 стр. Построение теории ошибок на базе современной математической статистики с использованием t и %2-распределений. 24. В. И. Романовский, Математическая статистика. ГОНТИ, 1938, 527 стр. Изложение основ математической статистики. Подробно рас- рассмотрен корреляционный анализ. 25. В. И. Романовский, Элементарный курс математиче- математической статистики. Госпланиздат, 1939, 359 стр. 26*
404 ЛИТЕРАТУРА Элементарное изложение основ математической статистику Подробно рассмотрен корреляционный анализ. 26. Дж. Скарборо, Численные методы математического ана- анализа. Гостехиздат, 1934, 440 стр. Рассматривается широкий круг вопросов, связанных с числен- численными методами математического анализа. Несколько глав посвя- посвящено теории ошибок и методу наименьших квадратов. 27. А. У о р с и н г, Дж. Г е ф ф н е р, Методы обработки экспе- экспериментальных данных. ИЛ, 1953, 346 стр. Рассматриваются методы обработки и представления резуль- результатов опытов и наблюдений. Значительное внимание уделено методам математической статистики. 28. В. Феллер, Введение в теорию вероятностей и ее прило- приложения. ИЛ, 1952, 427 стр. Изложение теории вероятностей, ограничивающееся дискрет- дискретными распределениями. Приведено большое количество примеров, иллюстрирующих действие вероятностных законов. 28а. Р. А. Фишер, Статистические методы для исследователей Госстатиздат, 1958, 267 стр. Применение методов математической статистики в исследова- исследовательских работах. Большое внимание уделяется корреляцион- корреляционному и дисперсионному анализу. Изложение материала иллюстри- иллюстрируется большим количеством примеров из биологии. Первое англий- английское издание этой книги вышло в 1925 г. 29. Т. Фр аи, Теория вероятностей для инженеров. ОНТИ, 1934, 383 стр. 30. А. X а л ь д, Математическая статистика с техническими приложениями. ИЛ, 1956, 664 стр. Систематическое изложение методов математической статистики. Большое внимание уделено дисперсионному, регрессионному и кор- корреляционному методам анализа. Приводятся многочисленные при- примеры из разных областей техники. 30а. Л. С. Хренов, Малые вычислительные машины. Гостех- Гостехиздат, 1957, 154 стр. Краткое описание устройств малых вычислительных машин и подробное изложение методов работы с ними. 31. А. С. Чеботарев, Способ наименьших квадратов с осно- основаниями теории вероятностей. Геодезиздат, 1958, 606 стр» Подробно излагается теория ошибок измерений, способ наимень- наименьших квадратов и основы теории вероятностей применительно к задачам, связанным с геодезическими измерениями. 32. П. И. Шилов, Способ наименьших квадратов. Изд-во ГУГК, 1941, 407 стр. На основе задач, связанных с геодезическими измерениями, излагается теория ошибок измерений, способ наименьших квадратов и теория вероятностей. ЛИТЕРАТУРА 405 33. A. S. Т. М. manual on the presentation of data, Philadelphia, 1945. Способы представления цифрового материала, рекомендован- рекомендованные Американским обществом испытания материалов. 34. С. Bennett, N. L. F г a n k I i n, Statistical analysis in chemistry and the chemical industry, New York, John Wiley and Sons, Inc., London, Chapman and Hall, Limited 1954, 724 pp. Обстоятельное, теоретически обоснованное изложение методов современной математической статистики. Материал иллюстрируется примерами из области химических исследований. 35. Y. Beers, Introduction to the theory of error, Addison— Wisley Publishing Сотр. Inc. Cambridge, Mass. 1953, 65 pp. Элементарное изложение математической теории ошибок. 36. W. G. С о с h г a n, G. М. С о х, Experimental designs, John Wiley and Sons, Inc., New York, Chapman and Hall, Limited, London, 1957, 454 pp. Рассматривается 150 различных вариантов планирования эксперимента при обработке материала методами дисперсионного анализа. 36а.D. R. Cox, Planning of experiments, New York, John Wiley and Sons, Inc., London. Chapman and Hall Ltd., 1958, 308 pp. Рассматриваются современные методы планирования экспери- эксперимента при статистических исследованиях. При изложении материала автор старается избежать применения математического аппарата. Предполагается, что читатель, выбрав тот или иной метод, в даль- дальнейшем обратится к специальным руководствам или к помощи математика-консультанта. 37. О. L. D a v i e s (editor), The Design and analysis of industrial experiments, Imperial Chemical Industries, Limited, Oliver and Boyd, London, 1956, 636 pp. Детально рассматривается планирование эксперимента и ста- статистический анализ его результатов в химической промышлен- промышленности. Основное внимание уделено дисперсионному анализу. Боль- Большой интерес представляет глава, посвященная секвенциальному анализу. Детально рассматривается определение условий, обеспечи- обеспечивающих максимальный выход продукта, или максимальную его чистоту, минимальную стоимость и пр. в сложных эксперименталь- экспериментальных условиях, когда варьирует несколько факторов. 38. О. L. Davies (editor), Statistical methods in research and production, with special reference to the chemical industry, Third edition revised. Imperial Chemical Industries, Limited, Oliver and Boyd, London, 1957, 396 pp. Изложение основных приемов статистического анализа, иллю- иллюстрированное многочисленными примерами из химической инду- индустрии.
406 ЛИТЕРАТУРА 39. W. J. D i x о n, F. J. M a s s e y, Introduction to statistical analysis. New York, Toronto, London, McGraw-Hill Book Com- Company, Inc., 1951, 370 pp. Популярное руководство по статистическому анализу, пред- предназначенное для широкого круга студентов разных специальностей, интересующихся практическим применением этой дисциплины. 40. W. Т. F e d е г е г, Experimental design, The Macmillan Com- Company, New York, 1955, 544 pp. Детально описывается планирование эксперимента и техника дисперсионного анализа. Рассматриваются различные малоизвест- малоизвестные приемы статистического анализа. Библ. 340 наименований. 41. R. A. Fisher, The design of experiments, Oliver and Boyd, Edinburgh, 1935, 252 pp. Рассматривается планирование эксперимента в связи со стати- статистической обработкой материала. Приводятся примеры из биологии и агробиологии. Книга является продолжением руководства [28а]. 42. R. A. F i s h е г, F. Y a t e s, Statistical tables for biological, agricultural and medical research. Oliver and Boyd, Edinburgh, 1957, 5-е изд. Таблицы, необходимые для планирования эксперимента и обра- обработки материала методами дисперсионного анализа. 43. W. L. Gore, Statistical methods for chemical experimenta- experimentation. Interscince Publisher, Inc., New York, London, 1952,210pp. Предельно краткое, рецептурное изложение методов статисти- статистического анализа экспериментального материала. Изложение иллю- иллюстрируется примерами из области химических исследований. 44. А. Н а 1 d, Statistical tables and formulas. New York, John Wiley and Sons, Inc., London, Chapman anl Hall, Limited, 952, 97 pp. Таблицы, необходимые для статистического анализа. Приложе- Приложение к указанной выше [30J книге того же автора. 45. О. Kempthorne, The design and analysis of experiments. New York, John Wiley and Sons, Inc., London, Chapman and Hall, Limited, 1952, 631 pp. Обстоятельно рассматривается планирование эксперимента и статистическая обработка его результатов. Детально изложены следующие вонросы: статистика линейных связей, комплексный дисперсионный анализ, рандомизация материала и рандомизиро- рандомизированные блоки, чувствительность эксперимента и пр. Материал изло- изложен как в теоретическом, так и в практическом аспектах. 45а. М. G. К е n d а 1 1, W. R. В и с k I a n d, A Dictionary of Statistical terms, Published for the International Statistical Institute, Oliver and Boyd, Edinburgh, London, 1957, 493 pp. Толковый словарь статистических теорминов на английском языке и [перевод терминов с французского, немецкого, итальянского и испанского языков на английский язык. ЛИТЕРАТУРА 407 46. Sequential analysis'in inspection and experimentation. 7 Sections and Appendices. Columbia University Press, New York, 1945. Рассматривается применение секвенциального анализа в экспе- экспериментальной работе и при контроле качества продукции. 47. D. S. V i I I a r s, Statistical design and analysis of experiments for development research, W. M. C. Brown Company, Dubuque, Iowa, 1951, 455 pp. Рассматривается применение методов математической стати- статистики в исследовательских работах. Детально излагается планиро- планирование эксперимента, исходя из задач статистического анализа. Рас- Рассматриваются условия, при которых можно получить максимальную информацию при минимальной стоимости экспериментальных работ. Дается теоретическое обоснование статистических методов анализа и в частности дисперсионного анализа. 48. F. Y a t e s, The design and analysis of factorial experiments. Imperial Bureau of soil science, Technical communication, № 35, 1937, 95 pp. Обстоятельное изложение комплексного дисперсионного ана- анализа. 49. W. J. Y о u d en, Statistical methods for chemists. New York, John Wiley and Sons, Inc., London. Chapman and Hall, Lim., 1951, 126 pp. Руководство по применению статистического анализа в анали- аналитической химии. II. Обзоры и библиографические источники по вопросам, связанным с применением математической статистики при анализе вещества 50. Е. С. Wood, Application of statistics to chemical analysis- Annual Repts Progr. Chem. Issued by the Chemical Society 44, 264—275 A947). Обзор работ до 1947 г. по применению математической стати- статистики в аналитической химии. Библ. 64 наим. 51. G. Wernimont, Statistics applied to analysis, Analyt. Chem. 21, 1, 115—120 A949). Обзор работ за 1941—1948 гг. по применению методов матема- математической статистики при анализе вещества. Библ. 134 наим. 52. А. С. Н о 1 1 е г, Sampling of ferrous and non-ferrous alloys— a bibliography, ASTM Bulletin, № 173, 66—67 A951, April). Отбор проб при анализе черных и цветных сплавов и связанные с этим статистические проблемы—библиография работ, опубли- опубликованных до 1949 г., 52 назв. 53. R. J. H a d e r, W. J. Y о u d e n, Experimental statistics, Analyt. Chem. 24, № 1, 120—124 A952). Обзор работ за 1948—1951 гг. по применению математической статистики в экспериментальных работах и в частности при анализе вещества. Библ. 154 наим.
408 ЛИТЕРАТУРА 54. J. M a n d e 1, F. J. L i n n i g, Statistical methods in chemi- chemistry, Analyt. Chem., Analyt. Reviews 28, № 4, 770—777 A956). Обзор работ за 1951—1955 гг. по применению методов матема- математической статистики в исследовательских работах и в частности при анализе вещества. Библ. 218 наим. 54а. J. M a n d е 1, F. J. L i n n i g, Statistical methods in che- chemistry, Analyt. Chem. 30, № 4, 739—747 A958). Обзор работ по применению математической статистики в химии с 1956 по 1958 гг. Библ. 289 наим. 55. Quality control and applied statistics. Interscience Publisher Inc., New York, Interscience Publisher Ltd., London. Реферативный журнал по вопросам прикладной статистики и контроля качества продукции. Журнал выходит с 1956 г., в нем реферируются статьи из 400 журналов, в том числе из некоторых журналов, публикующих статьи по аналитической химии. 55а. International Journal of Abstracts on Statistical Methods in Industry. Published by the International Statistical Institute, under the auspices of its Committee on Statistics in Industry and Technology, the Hague, Netherlands. Реферативный журнал по вопросам применения математической статистики в промышленности. III. Статьи по вопросам, связанным с применением математической статистики при анализе вещества, опубликованные в периодической печати и в сборниках 56. Student, Errors of routine analysis, Biometrika 19,1—2, 151—164 A927). Рассматривается природа аналитических ошибок. Предложено методические аналитические ошибки классифицировать как полу- полупостоянные ошибки. 57. Н. Kaiser, Grundriss der Fehlertheorie, Z. techn. Phys. 17, № 7, 219—226 A936). Изложение математической теории ошибок. 58. Н. Reiser, Die Genauigkeit bei quantitativen Spektralana- lysen, там же, 227—239. Изучены ошибки, вносимые отдельными звеньями спектрального анализа. Приведены материалы, показывающие, что ошибки спект- спектрального анализа подчиняются нормальному распределению. 59. С. М. Р а й с к и й, О практике оценки точности аналитиче- аналитических методов, Заводская лаборатория 6, № 2, 265—269 A937); 8, № 1, 124—125 A939). Рассматривается применение теории ошибок Гаусса в аналити- аналитической работе и, в частности, для оценки точности спектральных методов анализа. 60. В. К. П р о к о ф ь е в, Н. Н. Сорокина, Метод фото- фотографического фотометрирования в приложении к количествен- ЛИТЕРАТУРА 409 ному спектральному анализу, Заводская лаборатория 9, № 4, 417 A940). Рассматривается вопрос об ошибках в определении у. Дана формула, связывающая v с s . '61. К. L. Fetters, J. С h i p m a n, Slag-Metal relationships in the basic open-hearth furnace, Trans. Amer. Inst. Mining and Metallurgical Engrs Iron and Steel Division 140, 170—198 A940). Изучение корреляционных связей между химическим составом металлической ванны и шлакового покрова в мартеновских печах. Показана возможность определения содержания кислорода в метал- металлической вавне с помощью уравнения регрессии. 62. К. Fetters, Statistical methods applied to study and control of chemical Reactions in bath, там же, 166—169. Применение корреляционного анализа для изучения химиче- химических реакций в мартеновской печи. Показано, что между содержа- содержанием FeO в металле и обратной величиной содержания углерода 1/е существует стохастическая связь с г = + 0,84. 63. Н. В. V i п с е п t, R. A. S a w у е г, On precision in spectro- chemical analysis, J. Opt. Soc. America 32, № 10, 686—692 A942). Дифференцированное изучение ошибок воспроизводимости при спектральном анализе стали. Оценивается вклад, вносимый отдель- отдельными факторами в общую ошибку воспроизводимости. 64. R. М о га n, Determination of the precision of analytical control methods, Industr. and Eng. Chem. Analyt. Ed. 15, № 6, 361—364 A943). Изучение ошибок химического анализа, обусловленных факто- факторами, медленно меняющимися во времени. 65. А. С. О е г t е 1, Н. С. Т. S t а с е, Errors in spectrochemical (flame) analysis, J. of the Soc. of Chem. Ind. 65, № 7, 350—354 A946). Изучались ошибки, вносимые отдельными звеньями пламенно- спектрофотометрического анализа. 66. Г. С. Бляхе р, Применение математической статистики к исследованию результатов химического анализа, Заводская лаборатория 13, № 12, 1482—1485 A947). Показано, что ошибки химического анализа при определениях Р2О5 подчиняются нормальному распределению. 67. V. J. С 1 а п с е у, Statistical methods in chemical analyses, Nature 159, № 4036, 339—340 A947). Изучено 250 распределений, включающих 50 000 химических анализов. Показано, что с практической точки зрения только в 10— 15% случаев имеется нормальное распределение. 68. Н. Т. S h i г 1 е у, Е. Е 1 1 i о 11, J. Meeds, Spectrographic analysis of low-alloy steel, J. Iron and Steel Inst. 157, 3, 391—409 A947).
410 ЛИТЕРАТУРА Дифференцированное изучение ошибок воспроизводимости при спектрографическом анализе низколегированной стали. 69. W. J. Y о u d e n, Technique for testing the accuracy of analy- analytical data, Analit. Chem. 19, 12, 946—955 A947). Применение метода паименыпих квадратов для изучения мето- методических аналитических ошибок. 70. J. A.Mitchell, Control of the accuracy and precision of industrial tests and analyses, Analit. Chem. 19, 12, 961—967 A947). Применение контрольных карт для контроля за воспроизводи- воспроизводимостью и правильностью анализов. 71. А. В. Грош ев и В. И. Поносов, Статистическая обработка результатов анализа стандартных образцов, Завод- Заводская лаборатория 14, № 6, 669—677 A948). Произведена статистическая обработка результатов анализа стандартных образцов с применением критерия Фишера. Показано, что существует линейная зависимость между ошибкой, характери- характеризующей воспроизводимость анализа, и средним содержанием веще- вещества в пробе. 72. W. J Y о u d e n, Multiple factor experiments in analytical chemistry, Analyt. Chem. 20, № 12, 1136—1140 A948). Рассматривается применение комплексного (многофакторного) дисперсионного анализа в аналитической работе. 73. P. J. E 1 v i n g, M. G. Mellon, Teaching students how to evaluate data, Analit. Chem. 20, № 12, 1140—1143 A948). Рассматриваются некоторые вопросы, связанные с обучением студентов аналитиков элементарным приемам математической ста- статистики. 74. J. A. We у brew, G. М а п о п е, Н. М. В о х 1 е у, Spectrophotometric determination of serum calcium, Analyt. Chem. 20, № 8, 759—762 A948). Изучался цериевый метод спектрофотометрического определе- определения кальция в кровяной сыворотке. С помощью дисперсионного анализа оценен вклад, вносимый отдельными аналитическими операциями. 75. J. H. Davidson, Statistical tests of significance, Analyt. Chem. 20, № 12, 1132—1135 A948). Рассматривается применение критериев t, F и %2 при оценке статистической значимости результатов исследований в аналитиче- аналитической работе. 76. R. G i г s с h i g, Etude statistique des «mesures aberrantes» en analyse spectrographique. Groupement pour l'Avancement des Methodes d'Analyse Spectrographique des Produits Metal- lurgiques. Paris, 1948, pp. 159—171. Некоторые примеры применения методов математической ста- статистики при оценке точности спектрографического анализа. ЛИТЕРАТУРА 411 77. R. Schmidt, Sur l'exactitude de calibrage de la plaque photogiaphique en analyse spectrale, 1, Comparaison de la precision specif ique de differentes methodes de calibrage. Там же, pp. 137-144. Статистический анализ ошибок, вносимых различными спосо- способами калибровки фотопластинки. 78. W. G. S с h 1 е с h t, The probable error of a chemical analysis. Geol. Sur. Bull., № 992, 57—69 A949). Рассматривается природа аналитического процесса с точки зре- зрения возможности применения математической статистики для его изучения. 79. Е. S с h e u е г, F. II. S m i t h, A note on the accuracy of analysis, Metallurgia 41, № 241, 44—46 A949). Изучалась ^межлабораторная воспроизводимость результатов химического и спектрального анализа цветных металлов. Показано, что между коэффициентами вариации и концентрацией существует нелинейная корреляционная связь. [80. S. М а г с u s e, Optimum allocation and variance component I in nested sampling with an application to chemical analysis, 'Biometrica 5, № 3, 189—206 A949). Дается статистический анализ оптимальных условий системы квартования при отборе пробы для химического анализа. Приво- Приводится численный пример, решенный с помощью методов дисперсион- дисперсионного анализа. 81. Н. Н. Seliger, A new method of radioactive standard calib- calibration, J. of Res. Nat. Bur. Standards 45, № 6,' 496—502 A950). Применен метод латинского квадрата при изучении точности измерения радиоактивности. 82. М. Shepherd, Analysis of a carbureted wather gas by volu- volumetric chemical methods and by mass spectrometer, Analyt. Chem. 22, № 7, 885—889 A950). При участии 51 лаборатории производилось сравнение резуль- результатов объемного и масс-спектрометрического методов анализа газов. Анализ материала производился при помощи сравнения гистограмм. 83. G. W е г n i m о n t, The design and interpretation of interlabo- ratory test, ASTM Bull., № 166, 45—48 A950). Рассматриваются стандартные способы изучения межлаборатор- межлабораторной ошибки воспроизводимости с применением контрольных карт и дисперсионного анализа, принятые Американским обществом испытания материалов при разработке новых аналитических методов. 84. W. J. Youde n, Comparative tests in a single laboratory, ASTM Bull., № 166, 48—51 A950). Показано, что даже при таких простых измерениях, как отсчет по линейной шкале на термометрах, надо учитывать, что ошибка воспроизводимости, полученная за короткий промежуток времени, может существенно отличаться от ошибки воспроизводимости, полу- полученной за длительный интервал времени.
412 ЛИТЕРАТУРА 85. Misuse of the average deviation, Nat. Bur. Standadrs, Techn. News Bulletin 34, „V 1, 9—10 A950). Призыв отказаться от среднего арифметического отклонения как меры рассеяния. 86. L. К. R e i t z, A. S. О'В г i e n, Т. L. Davis, Evalution of three iron methods using a factorial experiment, Analyt. Chem. 22, № 12, 1470—1473 A950). Описывается применение дисперсионного анализа для изучения методических ошибок фотоколориметрических методов определения железа. Варьировались следующие факторы: 1) содержание железа, 2) содержание примеси—свинца, 3) содержание инертного материа- материала—Na2SO4, 4) методы анализа. Показано, что для некоторых мето- методов оказались значительными как влияние изучаемых факторов, так и их взаимодействие. 87. L. В. G e n u n g, Analysis of cellulose derivatives, Analyt. Chem. 20, № 3, 401—408 A950). Применены контрольные карты при анализе производных цел- целлюлозы. Показано, что ошибки анализа укладываются в Зо-е пре- пределы, если о подсчитана для результатов анализа, выполненных за длительное время. Это значение о в 4 раза превосходит ошибку, полученную для анализов, выполненных за короткий промежуток времени. 88. G. Wernimont, Design and interpretation of interlabora- tory studies of test methods, Analyt. Chem. 23, № 11, 1572— 1576 A951). Дифференцированное изучение ошибки при определении аце- ацетила в ацетате целлюлозы. Суммарная ошибка разложена на сле- следующие величины: 1) ошибку воспроизводимости, 2) ошибку, вноси- вносимую фактором времени, 3) ошибку, вносимую индивидуальностью аналитика, 4) ошибку, вносимую особенностями работы разных лабораторий. 89. Н. A. L i е b h a f s к у, H. G. Р f е i f f е г, Е. W. В а 1 i s, Statistical operating rule for analytical chemists, Analyt. Chem. 23, № 11, 1531—1534 A951). Рассматривается вопрос об установлении статистически обосно- обоснованных допусков для химического анализа. Утверждается, что, учитывая особенности химического анализа (не строгое выполнение нормального распределения, определение а по малому числу образ- образцов), можно ожидать, что в Зо-е пределы, будет укладываться только 95% анализов. 90. Н. F. F a i r b a i r n, A cooperative investigation of precision and accuracy in chemical, spectrochemical and modal analysis of silicate rocks, Geol. Surv. Bull., № 980, 1—69 A951). Производится сравнение результатов анализа двух силикатных проб, выполненных 34 химиками в 25 лабораториях десяти разных стран. Полученные результаты сравниваются также с данными спек- спектрального и минералогического анализов. ЛИТЕРАТУРА 413 91. Chemists advised to abandon deviation, Chem. and Eng. News 29, 24, 2380—2381 A951). Сообщается о том, что на конференции Американского общества по контролю качества продукции был дан совет химикам отказаться от применения среднего арифметического отклонения при оценке результатов анализа. 92. G. L. 0 g g, С. О. W i 1 1 i t s, С. R i с с i u t i, J. А. С о п- nelly, Microdetermination of carbon and hidrogen, Analyt. Chem. 23, 6, 911—914 A951). С помощью г-критерия производилось изучение влияния 20 фак- факторов на ошибки анализа при микроопределении углерода и водо- водорода. В работе принимало участие 12 лабораторий. 93. Н. П. К о м а р ь, К вопросу о применении математической статистики в аналитической химии, Ж. аналит. химии 7, № 6, 325—340 A952). Изложены основные положения теории ошибок и матема- математической статистики: нормальное распределение, критерии t и F и их применение в аналитической работе. Приведен ряд при- примеров применения математической статистики в аналитической работе. 94. Е. Г. Г р а ч е в а, О применении математических методов для обработки результатов химического анализа, Ж. аналит. химии 7, № 1, 48—51 A952). Применение критерия t при оценке результатов анализа. 95. В. В. Налимов, Н. И. К а м б у л а т о в, К. И. И о н о в а, Экспресс-анализ основных мартеновских шлаков на стилометре по ходу плавки, Заводская лаборатория 18, № И, 1354—1358 A952). Показано, что распределение ошибок, характеризующих расхо- расхождение результатов стилометрического и химического анализов, не отличается существенно от нормального распределения. 96. G. L. P e a k e s, Fundamentals of a test method, ASTM Bull., № 179, 37—61 A952). Применение /"-критерия при оценке дисперсий в аналитической работе. 97. W. J. Y о u d e n, Statistical aspects of analytical determina- determinations, Proc. Internat. Cong. Analyt. Chem., Heffer and Sons, Ltd, England, 1952, pp. 318—322. Применение дисперсионного анализа в аналитической химии. Рассмотрено два новых способа группирования материала в блоки. 98. G. E. P. Box, Statistical design in the study of analytical methods, там же, 322—333, дискуссия, 333—335. Рассматривается применение дисперсионного анализа в анали- аналитической химии. Дается метод, позволяющий эмпирически найти уровни факторов, дающие максимальный выход для изучаемой аналитической реакции.
414 ЛИТЕРАТУРА 99. А. Н. Н а 1 е, J. W. S t i I 1 m a n, Development of an efficient analytical record system, Analyt. Chem. 24, № 1,143—149 A952). Применение перфокарт для регистрации результатов химиче- химического анализа. Показано, что эта система удобна для контроля и наблюдения за качеством аналитической работы. 100. Н. И. К а м б у л а т о в, С. А. Г е н ш а ф т, В. В. На- л и м о в, К вопросу о способах оценки точности аналитических методов, Заводская лаборатория 19, № 1, 115—119 A953). Дан критический анализ оценки точности, принятой в сущест- существующих ГОСТ. Предложено составить специальный ГОСТ на спо- способы оценки точности аналитических методов, основанный на мето- методах математической статистики. 101. А. Л. Столов, И. С. Ф и ш м а н, Расчет ошибок по теку- текущим измерениям, Уч. зап. Казанского ун-та, 113, № 9, 145 A953). Дано математическое выражение для подсчета ошибок воспроиз- воспроизводимости по результатам текущих анализов, выполненных из двух параллельных определений. 102. G. V. D у г о f f, J. Н a n s e n, С. R. Н о d g k i n s, Com- Comparison of spectrochemical and semimicromethods in analysis of petroleum ashes, Analyt. Chem. 25, № 12, 1898—1905 A953). Сравнительное изучение двух методов анализа нефтяных зол производилось с помощью дисперсионного анализа. Применя- Применялось логарифмическое преобразование переменных. Показано, что имеют место эффекты взаимодействия между методами анализа и образцами. 103. А. С. О е г t е 1, А. Е. Cornish, The frequency distribu- distribution of the spectrographic (d. с arc) error, Austral. J. Appl. Sci. 4, № 4, 489—507 A953). На большом материале показано, что ошибки спектрографиче- спектрографического анализа почв и золы растений подчиняются нормальному распределению, если результаты анализа выражать в логарифмах интенсивности линий. 104. Н. Klein, Die Grundlagen moderner statistischer Auswert- verfahren mit Bezug auf die Probenahme, Arch. Eisenhiittenwesen 24, 1/2, 11—20 A953). Применение методов современной математической статистики при решении задач, связанных с отбором проб. 105. А. Б. Ш а е в и ч, Исследование погрешностей химического анализа сталей и чугунов, Ж. аналит. химии 9, № 6, 373—376 A954). Раздельно изучены внутрилабораторные и межлабораторные ошибки при химическом анализе стандартных образцов и спектраль- спектральных эталонов чугунов и сталей. Установлена зависимость между величинами указанных ошибок и концентрацией определяемого компонента. ЛИТЕРАТУРА 415 106. С. А. Г у с и н с к а я, К вопросу о применении математи- математической статистики в аналитической химии. Ж. аналит. химии 9, № 4, 245—247 A954). Примеры применения математической статистики в аналитиче- аналитической работе. 107. F. J. Linnig, J. Mandel, J. Peterson, A plan for studing the accuracy and precision of an analytical procedure, Analyt. Chem. 26, № 7, 1102—1110 A954). Рассматривается применение метода наименьших квадратов для изучения аналитических ошибок. 108. J. Sherman, The correlation between fluorescent ж-гау intensity and chemical composition, ASTM Spec. Publ., № 157, 27-33 A954). Рассматриваются метрологические вопросы квантометрического рентгеноспектралыюго анализа. Указывается на необходимость введения поправки на мертвое время счетчика. 109. С. A. U. Craven, Statistical estimatmation of the accuracy of assaying, Bull. Inst. Mining and Metallurgy, № 574, 551—563 A954). Рассматривается применение метода наименьших квадратов для оценки правильности анализа. НО. D. S. McArthur, E. L. Baldeschwieler, W. H. W h e i t e, J. S. Anderson, Evaluation of test procedures, Analyt. Chem. 26, № 6, 1012—1018 A954). Применение комплексного дисперсионного анализа для изу- изучения межлабораторной воспроизводимости результатов определе- определения углерода в катализаторе. 111. J. Noar, J. Reynolds, Establissement et emploi des cour- ves d'erreur dans la photometrie photographique, 16 Congres Groupement pour L'Avancement des Methodes d'Analyse Spectrographique des Produits Metallurgiques, Paris, 1954, pp. 243—257. Построены кривые, показывающие зависимость между ошибкой в определении интенсивности, выраженной в относительных процен- процентах, и величиной прозрачности. Показана возможность применения этих кривых при выборе аналитических линий. 112. L. H. A h r e n s, A note on the relationship between the pre- precision of classical methods of rock analysis and the concentration of each constituent, Mineral. Mag. 30, № 226, 467—470 A954). На основании обработки данных, приведенных в [89], показано, что между относительной ошибкой и логарифмом концентрации существует линейная связь с тангенсом угла наклона 0,65. ИЗ. P. D. Lark, Application of statistical analysis of analytical data, Analyt. Chem. 26, № 11, 1712—1715 A954). Рассматривается возможность применения метода наименьших квадратов для изучения аналитических ошибок.
416 ЛИТЕРАТУРА ЛИТЕРАТУРА 417 114. А. К. Б а б к о, О правильности и воспроизводимости хими- химического анализа, Заводская лаборатория 21, № 3, 269—277 A955). Изучение правильности и точности химического анализа сили- силикатных проб. Утверждается, что математическая статистика при- применима только для изучения ошибок воспроизводимости. 115. Н. Н. Ц в е т к о в а, Л. М. Эпельман, В. И. Д а- щ е н к о, Определение кремния и марганца в бессемеровском чугуне и стали спектральным методом. Статья в сборнике: «Современные методы анализа в металлургии», Госметаллург- издат, 1955, 60—63 стр. Приводятся графики частоты отклонений результатов спектраль- спектрального анализа от данных химического анализа, полученные на боль- большом экспериментальном материале. 116. Ю. А. Ш е р с т к о в, Количественный спектральный анализ огнеупорных глин на Fe,O3, ТЮ2, MgO, CoO в растворах. Завод- Заводская лаборатория 21, № 3, 320—324 A955). Приведены гистограммы, показывающие, что ошибки, характе- характеризующие расхождение между результатами спектрального и хими- химического анализов, не принадлежат к классу распределений, су- существенно отличному от нормального распределения. 117. С. А. Геншафт, В. В. Налимов, В. Г. П и н е с, Применение математической статистики для изучения воспроиз- воспроизводимости химического анализа нелегированных сталей, За- Заводская лаборатория 21, № 7, 877—880 A955). Произведена оценка воспроизводимости химических методов определения углерода, серы и фосфора в сталях на основании обработки архивных материалов. 118. А. Б. Ш а е в и ч, О методологии изготовления эталонов для спектрального анализа, Заводская лаборатория 19, № 10, 1189—1196 A953); 21, № 3, 332—336 A955). Рассматриваются метрологические требования, предъявляемые к эталонам для спектрального анализа. Дается методика иссле- исследования степени неоднородности эталонов. 119. А. М. Дымов, С. А. Гусинская, В. Г. Кориц- к и й, Ю. А. Ш р е й д е р, О способах оценки точности аналитических методов, Заводская лаборатория 21, № 4, 504—505 A955). Дается оценка результатов анализов, выполненных по малому числу параллельных определений. Указывается на необходимость широкого внедрения статистических методов в аналитическую ра- работу. 120. О. Б. Ф а л ь к о в а, А. А. Ф р и ш б е р г, Исследова- Исследование постоянства характеристик на различных участках поверх- поверхности фотографических пластинок, Заводская лаборатория 21 № 3, 336-341 A955). Оценка ошибки, вносимой фотопластинкой в результаты спек- спектрального анализа. 121. Е. Л. Грянзайд, Оценка погрешностей, возникающих в отдельных звеньях спектрографического анализа, Изв. АН СССР, сер. физ. 19, № 1, 132—133 A955). Информ. техн. листок Ленинградского Дома научно-технич. пропаганды, № 5а, 632 A954). Оценивается вклад, вносимый отдельными звеньями в ошибку воспроизводимости спектрографического анализа. При расчетах используется метод размаха варьирования. 122. J. L о t lie, Indirect spectrophotometry, A study of precision, Analyt, Chem. 27, № 10, 1546—1551 A955). Дана математическая теория точности косвенного спектрофото- метрического анализа, при котором концентрация неизвестного эле- элемента определяется по обесцвечивающему действию этого элемента на окрашенный комплекс. 123. Н. A. Liebha f sky, И. G. P f e i f f е г, P. D. Z e- m a n y, Precision in ж-гау emission spectrography, Analyt. Chem. 27, № 8, 1257—1258 A955). Обращается внимание на то, что в эмиссионном рептгеноспек- тра льном анализе невыполнение условия s—yx (где х—среднее число сосчитанных фотонов) указывает на наличие методических ошибок. 124. С. R i с с i u t i, J. Col e m a n, С W i 1 1 i t s, Statistical comparison of three methods for determining organic peroxides, Analyt. Chem. 27, № 3, 405—407 A955). Эксперимент планировался по методу латинского квадрата при сравнительном статистическом изучении правильности и точности трех аналитических методов. 125. W. S. Н о г t о n, Some statistical aspects of X-ray fluorescence spectrometry, Appl. Spectroscopy 9, № 4, 173—177 A955). Получена функция распределения для времени счета Т, необ- необходимого для получения заданного числа импульсов. 126. С. Ю. Ф а й н б е р г, Л. Б. Гинзбург, Опыт примене- применения метода математической статистики для составления норм допустимых расхождений между результатами анализов, Заводская лаборатория 22, № 10, 1157—1166 A956). Использование статистических методов для установления норм допустимых расхождений при анализах продуктов свинцового цинкового и медного производства. 127. В. II. Толмачев, Г. Г. Ломаки и а, Исследование погрешностей спектрографического метода получения спектров поглощения растворов в ультрафиолетовой области, Уч. зап. Харьковского ун-та 71, 111—118 A956). Дифференцированное изучение ошибок абсорбционного спект- спектрального анализа. -7 В. В. Палимоп
418 ЛИТЕРАТУРА 128. В. В. Н а лимо в, О систематических и случайных ошибках хи- химического анализа, Ж. аналит. химии, 11, Л: 3, 341—350 A956). Дана классификация аналитических ошибок. Рассматриваются условия, при которых можно ожидать появления нормального рас- распределения для аналитических ошибок. Производится оценка мето- методических ошибок, при контроле аналитической работы, по малому числу стандартных образцов. 129. И. С. Ф п ш м а и, A. J1. С т о л о и, Расчет ошибок спект- спектрального анализа по текущим измерениям, >ч. зап. Казанского ун-та, 115, № 12, 57—71 A1M6). Применение метода наименьших квадратов при оценки ошибок, связанных с построением градуирокочпых графикой. 130. J. G е 1 a i п, Determination sur шю micrographio do la pro- proportion et de la repartition des constituents, Exempie d'appli- catiou des melhodes statistiques, Fouderie, JVJ 124, 198—200 A956). Применение биноминального распределения и распределения Пуассона при микроструктурном анализе. 131. А. С. О е г t e I, Frequency distribution of speclrographic error in d. с arc exitat.on of soil samples, Austral. J. Appl. Sci. 7, № 2, 133—141 A956). Предложено применение неиараметрического метода проверки гипотезы нормальности по большому количеству малых выборок с разными параметрами. Доказано, что ошибки спектрографиче- спектрографического анализа почв подчиняются нормальному распределению, ес.чп результаты анализов выражаются в lg R. 132. F. W. J. G a r t о и, W. Ramsden, К. Т а у 1 о г, И. J. Webb, The assessment of the performance of spectrograpluc methods, Spectrochem. Acta 8, JS° 1, 94—101 A9o6). Дана классификация ошибок для спектрографических методов анализа и рассмотрены способы их определения. 133. F. II. S m i t h, Reproducibility iu the spectrographic analysis, Metallurgia 53, № 319, 237—240 A956). Изучалась воспроизводимость спектрографического анализа алюминиевых сплавов в четырех лабораториях в различные моменты времени. Приведены гистограммы, показывающие, что распределе- распределение ошибок существенно не отличается от нормального. Остановлена корреляционная связь между величиной ошибки воспроизводи- воспроизводимости и концентрацией анализируемого вещества. 134. Н. К a i s е г, Н. S р е с k e г, Bewertung und Vergleich von Analysenverfahren, Z. aualyt. Chem. 149, № 1—2, 46—66 A956). Краткое изложение современной теории ошибок в применении к задачам аналитической химии. 135. К. И. II о н о в а, В. В. На л и м о в, Статистическое науче- научение точности спектрографического анализа сталей. Изв. ЛИТЕРАТУРА 419 АНаСССР, сер. физ. 19, № 1, 129—133 A945). Заводская лабо- лаборатория, 23, № 5, 586—591 A957). Оценивается вклад, вносимый отдельными аналитическими звеньями, в общую ошибку анализа. 136. В. В. Нал и м о в, Применение дисперсионного анализа для оценки результатов определений, Ж. аиалит. химии 12, Л1» 2, 157—165 A957). Применение дисперсионного анализа при изучении методиче- методических ошибок. 137. А. А. II. 13 a z i ц, Aspect statistique des mesures statist, appliquee 5, As 2, 45—75 A957). de grain, Hov. Показано, что имеет место логарифмически нормальное распре- распределение для диаметров зерна на металлографических шлифах цвет- цветных металлов. На этом основании вводится статистический критерий для оценки однородности зерна. 138. Е. A. Field, Measuring the precision of test methods, J. Inst. Petrol. 43, Aa 404, 233—334 A957). Сообщается, что в стандартных методах испытаний, предложен- предложенных Американским обществом испытаний металлов и Институтом нефти, в рубрике точность указывается «повторяемость» (repeatabi- (repeatability) и «вопроизводимость» (reproducibility) результатов определе- определений. Повторяемость определяется как мера рассеянии результатов, полученных одним работником в пределах одной лаборатории. Вос- Воспроизводимость определяется как количественная мора рассеяния результатов, полученных разными работниками разных лабора- лабораторий. 139. С. G о г d о n-G r а у, A. Comparison of the results of estima- estimating black wattle tannin by the official hide powder method and by a proposed ultraviolet spectrophotomotric method, Parts I, II, III, J. Soc. Leather Trades Chemists 41, 8, 269—275, 275— 286, 287—300 A957). Применение корреляционного и дисперсионного анализов для сравнения двух методов анализа танина в дубителях. 140. J. Philippe, Example d'application des methodes stati- statistiques a la reception d'une substance de purete determinee, J. Soc. Statist., Paris, 98, № 4—6, 147—151 A957). Показано, что, пользуясь методами математической статистики, можно установить нижний предел для маркировочного анализа и необходимое число параллельных определений, исходя из заранее заданных вероятностей пропустить некондиционный и забраковать кондиционный материал. 141. К. Doerfell, Fehlerrechnung in der analytischen Cheniie. 1. Die Messfehler . Z. analyt. Chem. 157, № 3, 195—200 A957). При изучении аналитических ошибок предлагается пользо- пользоваться выражением для максимальной величины суммарной ошибки. 27*
420 ЛИТЕРАТУРА В этом случае суммируются относительные ошибки, а не их квадраты, как это делается при подсчете средних значений суммарной ошибки, тогда выражение для суммарной ошибки оказывается очень про- простым. 142 К. Doerffel, Fehlerrechung in der analytischen Chemie, там же, № 4, 241—248. Предлагается метод для оценки методических ошибок без при- применения стандартных образцов или каких-либо других проб извест- известного состава. 143. М. J. Maurice, Einige Beispile der Verwendung statistischer Methoden in der analytical Chemie, Z. analyt. Chem. 158, № 4, 271—279 A957). Приводятся три примера применения методов математической статистики в аналитической химии: 1) использование метода наи- наименьших квадратов для построения градуировочного графика при фотоколориметрическом анализе, 2) статистический метод изучения взаимозаменяемости кювет, 3) применение дисперсионного анализа для оценки ошибок, вносимых отдельными звеньями аналитического процесса при определении сульфидов. 144. G. Gottschalk, P. Dehmel, Statistik der chemischen Analyse I, Die Aufdeckung systematischer und grober Fehler und die Bedeutimg zufaliger Febler im Rahmen gravimetrischer und titrimetrischer Analysenverfahren, Z. analyt. Chem. 159, 2, 81—94 A957). Рассматривается применение метода наименьших квадратов для внесения двух поправок, одна из которых исключает^ постоянную методическую ошибку, не зависящую от определяемой концентра- концентрации, другая исключает методическую ошибку, изменяющуюся про- пропорционально определяемому содержанию вещества в пробе. 145. I. А. V о i n о v i с h, Mme V i 1 n a t, Etude statistique du dosage de SiO2 et A13O3 par spectrographie, Bull. Soc. Franc. Ceram. 36, 83—108 A957). На большом экспериментальном материале произведено изуче- изучение ошибок спектрального анализа А12О3 и SiO2 в трех образцах огнеупоров. Материал обрабатывался методами современной мате- математической статистики с применением дисперсионного анализа. Показано, что результаты спектрального анализа по точности и правильности приближаются к данным традиционного химиче- химического анализа. 146. G. Н о 1 d t, Zur Korrelation der Intensitaten von Emissions- linien I, Die vollstandige Prufung des statistischen Verhaltens von Intensitatsverhaltnissen, Proceedings Colloquim Spectro- scopicum International, VI, London, Pergamon Press, 1957, pp. 222—232. Рассматривается возможность изучения процессов, связанных с испытанием вещества из кратера электрода при помощи исследо- исследования корреляционных связей между логарифмами интенсивностей аналитических линий. ЛИТЕРАТУРА 421 147. В. N. Nelson, Statistical evoluation of spectrographie methods, Appl. Spectroscopy 11, № 3, 123—127 A957). Статистическая оценка спектрографических методов анализа. Рассматривается применение контрольных карт и методов комплекс- комплексного дисперсионного анализа. Дается два примера планирования эксперимента при многофакторном дисперсионном анализе. 148. Г. Г. Петраш, С. Г. Р а у т и а н, О точности измерения оптической плотности, Физический сборник Львовского ун-та, вып. 3 (8), 102—106 A957). Рассматривается вопрос о выборе условий, при которых сум- суммарная ошибка измерения плотности была бы минимальной. 149. I. Kotlazski, Wykorzystywanie dawnych wynikow analizy chemiczney ilosciowej przy szacowaniu nieznanej wariancji a2 w popylaji tych wynikow, Normalizacja 25, № 7—8, 342—343 A957). Рассматривается возможность определения ошибки воспроиз- воспроизводимости по текущим измерениям, состоящим из неодинакового числа параллельных определений. 150. F. Rosendahl, Untersuchung der statistischen Stre- ung der Restgehaltsbestimmung nach dem Spectrochemischen Zugabeverfahren, Spectrochim. Acta 10, JV» 2 201—212 A957). Получены математические выражения для ошибки, характери- характеризующей рассеяние результатов анализа при работе по методу добавок. 151. Резо Т а р ь я н, Измерительная техника и теория информа- информации, Измерит, техника, № 2, 22—25 A957). Проводится параллель между процессом измерения и матема- математической моделью системы связи для передачи сигнала. Показана применимость основного соотношения теории информации для описания процесса измерения. 152. A. L о f t h u s, The accuracy of photographic intensity mesure- ments of absorption spectra, Spectrochim. Acta 9, № 3, 216—226 A957). Дано выражение, связывающее ошибки в определении экстинк- ции, с ошибками в определении толщины кюветы, концентрации вещества, плотности почернения и фактора контрастности при абсорбционном анализе, проводимом с помощью фотопластинки. Рассмотрены условия, обеспечивающие получение оптимальных ре- результатов анализа. 153. J. Agterdenbos, Ober die genaue Berucksichtigung des Blmdwertes bei colorimetrischen Bestimmungen, Z. analvt. Chem. 157, № 3, 161—165 A957). Получены аналитические выражения для ошибки колориметри- колориметрического анализа при различных способах учета коэффициента экстинкции «холостого опыта».
422 ЛИТЕРАТУРА 154. R. С. Frank, I.E. Daliemand, D. L. F г у, A sta- statistical study on the homogeneity of zinc-base spectrographic standards. Spectrochim. Acta 9, № 4, 323—331 A957). Статистическое изучение однородности эталонов для спектраль- спектрального анализа с помощью комплексного дисперсионного анализа. 155. С. А. В i с k i n g, Statistical approaches to the study of test precision, I, Defining precision standards, Tappi 40, № 3, 191— 192 A957). Точность (precision) определяется как мера рассеяния резуль- результатов определений относительно их среднего значения. Правиль- Правильность анализа определяется ошибками, которые могут быть обна- обнаружены только при помощи применения стандартов. 156. J. M a n d е 1, F. J. L i n n i g, Study of accuracy in chemical analysis using linear calibration curves, Analyt. Chem. 29, 5, 743—749 A957). Рассмотривается вопрос об установлении доверительных пре- пределов для параметров линейного уравнения, с помощью которого вводятся поправки на результаты анализа. 157. В. В. Н а л и м о в, К. И. И о п о в а, Статистическое изу- изучение флуктуации градуировочных графиков при спектраль- спектральном анализе. Материалы X Всесоюзного совещания по спектро- спектроскопии, т. II, Атомная спектроскопия, изд. Львовского ун-та, 1958, стр. 528—533. Применение метода наименьших квадратов, дисперсионного и регрессионного анализов при изучении флуктуации параметров градуировочных графиков. 158. И. К. Майборода, К вопросу увеличения воспроизво- воспроизводимости спектрального анализа, Заводская лаборатория 24, № б, 748—750 A958). Показано, что в ряде случаев точность анализа можно сущест- существенно повысить, если для построения градуировочного графика использовать сумму значений AS1 -|- AiS для двух аналитических пар. 159. В. В. Налимов, В. В. Н е д л е р, Оценка результатов полуколичественного спектрографического анализа с помощью распределения Пуассона, Ж. аналит. химии 13, № 4, 379—387 A958). Показано, что ошибки полуколичественного спектрографиче- спектрографического анализа подчиняются распределению Пуассона. 160. Y. L а с г о i х, N. В u g a t, J. M a r s, Le controle statistique en chimie analytique, Application аи dosage de azote par la methode Devarda. Mem. poudres 39, 459—468 A957). На примере с определением азота в нитроцеллюлозе показана эффективность применения точечных контрольных диаграмм для текущего контроля надежности результатов анализа. 161. К. D е г f f e 1, Richtigkeitskontrolle von Serienanalysen, Chem. Technik 10, № 3, 151—152 A958). ЛИТЕРАТУРА 423 Указывается на возможность применения контрольных диаграмм при определении поправок по методу, описанному ранее [142]. На примере с фотометрическим определением Си показано, что по- постоянная ошибка, не зависящая от концентрации анализируемого компонента, не изменяется во времени. 161а. A. Strasheim, R. J. К е d d у, A mathematical method of comparing spectrochemical results, Appl. Spectroscopy 12, № 2, 29—32 A958). Предлагается при оценке точности спектроаналитических методов сравнивать площади контурных эллипсов на диаграммах рассеяния (см. [1461). 161b. G. Н о 1 d, Zur statistischen Bearbeitung spectrochemischer Intensitatmessungen, 5. Vortr. Spektroskopie, Jena, 1957; Berlin, Akad. Verl. 5—10 A958). Рассматривается вопрос о возможности повышения точности спектрографического анализа путем введения весовых коэффициен- коэффициентов при вычислении разности логарифмов интеисивностей аналити- аналитических липий в тех случаях, когда коэффициенты регрессии на диаграммах рассеяния (см. [146!) не равны единице. 161с. С. М. Crawford, Precision Absorptiometry, Analyt. Chem. 31, № 3, 343—348 A959). Дается детальный математический анализ ошибок дифферен- дифференциальной абсорбционной спектрофотометрии, Библиография—60 наименований. IV. Разное 162. D. J. Price, The exponential curve of science, Discovery, 17, № 6, 240—243 A956). 163. В. В. Н а л и м о в, B.C. H е п о р е н т, Система докумен- документации молекулярных спектров, УФН 65, № 3, 521—540 A958). Библиография—15 наименований. 163а. R. S. Casey, J. W. Р е г г у, А. К е n t, M. Berry (Ed.), Punched cards. Theier application to science and industry, Sc. Ed. Reinhold Publishing Corporation, New-York, Chapman and Hall. LTD, London, 1958, pp. 697. Подробно рассматривается применение различных систем пер- перфорированных карт для механизации многоаспектных информа- информационных поисков в разных областях науки и техники. Большое внимание уделяется применению перфокарт для аналитических целей (оптическая спе троскопия, масс-спектроскопия, рентгено- структурный анализ). Подробно рассматривается вопрос о кодиро- кодировании химических структурных формул, Библиография — с 277 по 677 наименований. (Библиография первых 277 наименований дана в первом издании этой книги.) 164. A. W. В а к е г, N. Wright, Automatic infrared punched- card indentification of mixture, Machine method combining use
424 .ЧИТЕРАТУГЛ of band wave lengths and intervals of no bands, Analyt. clieni. 25, № 10, 1457—1460 A953). Применение перфокарт для идентификации органических соедп нений в смесях по инфракрасным спектрам поглощения. 165. В. В. Налимов, К. М. И о н о в а, Спектрографический анализ основных мартеновских шлаков с применением искро- искрового возбуждения и учетом влияния третьих элементов, Завод- Заводская лаборатория 18, № 3, 305 A952). 166. А. А. Петро в, Проверка статистических гипотез о типе рас- распределения по малым выборам, «Теория вероятностен н ее при- применение» 1, № 2, 248—271 A956). 167. Т.. М. Addison, Е. Н. S р е и с е г, Е. М. Chariot, Analytical Laboratory operation and control, utilizing bussines.s maching punched card procedures, Analyt. Chem. 30, Ш 5, 885— 891 A958). 168. J. W. Perry, A. Kent, M. 13 e r r y, Machin Literature searching, IntersciencePublishers Inc., New York, 1956, pp. 162. См. также: статьи в журналах: Amer., Docum, Dokumentation, IBM, J. Res. and Development. 168a. J. A. Perry, A. Kent, Tool for machine literature sear- searching, Interscience Publishers, New York, 1958, pp. 972. 169. F. E. G r u b b e, Sample criteria for testing outlying observa- observation, Ann. math, statistics 21, № 1, 27—58 A950). 170. H. В. Смирно в, Об оценке максимального члена в ряду наблюдений, ДАН СССР 33, № 5, 346—349 A941). 171. L. H. A h r e n s, Quantitative Spectrochemical analysis of silicates. Pergamon Press, London, 1954, pp. 119. 172. Г. Э. В л э д у ц, В. В. Н а л и м о в, Н. II. С т я ж к и и, Научная и техническая информация как одна из задач ки- кибернетики, УФН 69, № 1, 13-56 A959). ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсолютная частота появления события 34 Вероятность появления собы- события 34 Веса наблюдений 41 Взвешенное среднее 41 Взвешенные суммы 41 Генеральная совокупность 38 Гипотезы нормальности, провер- проверка ^-критерием 107—113 ¦— — — методом спрямления диаграмм 119—122, 134 — — — по большому числу ма- малых выборок ИЗ—118 — — — %2-критерием 99—107 Гистограмма 138 Градуировочные графики см. регрессионный анализ Диаграммы рассеяния 305 — — при изучении воспро- воспроизводимости эмиссионного спектрального анализа 309—311 Дисперсионный анализ см. так- также латинский квадрат и ре- регрессионный анализ, идея ме- метода 197 — —, изучение межлаборатор- межлабораторной ошибки воспроизводимос- воспроизводимости комплексным методом при двухсторонней классификации 227—237 — —, — — — методом двух- двухступенчатой группировки 214—221 — —, — — — — трехсту- трехступенчатой группировки 221— 225 Дисперсионный анализ, изучение неоднородности материала при изготовлении эталонов 248—255 , образцов 203—205 , — факторов, медленно меняющихся во времени 197— 203 -- — при неровных столбцах 205—207 — —, условия, при которых можно пользоваться диспер- дисперсионным анализом 207—209 Дисперсия 38, 42 —, выбор числа параллельных определений при сравнении двух дисперсий 338—339 —, вычисление 44, 45 —, — по двум параллельным определениям 56, 57 —•, сгруппированным дан- данным 45—48 —, — — текущим измерениям 49—51 —, применение секвенциального анализа при сравнении двух дисперсий, одна из которых имеет фиксированное значение 184—185 —, сравнение двух дисперсий 94—96 --, — нескольких дисперсий критерием Бартлета 164—160 —t Кохрана 166— 168 — эллиптическая 310 Доверительная вероятность 84 Доверительные границы для квадратичной ошибки 91—93
426 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Доверительные границы для (т-(-1)-й пробы в первичных методах анализа 173, 175—177 во вторичных методах анализа, основанных на построении градуировоч- ных графиков 293—298 среднего 83—85 , определение 83 Документация материала (см. также перфокарты), библио- библиографическая 349—352 — — в молекулярной спектро- спектроскопии 340—344, 346—348 — —, информационный язык 354—356 — — при исследовательских ра- работах 352—353, 356 — — — организации аналити- аналитических лабораторий 344—345, 347 Допустимые отклонения (см. также ошибки грубые) 73, 74 Закон накопления (распростра- (распространения) ощибок 61 , применение 61—67, 126, 268, 294, 320 — сложения ошибок 53—60 Информационный язык 354—356 Квадратичная ошибка (см. так- также дисперсия), определение 43 Квантиль, определение 71 Кибернетика (см. также докумен- документация материала, перфокар- перфокарты, информационный язык) 16 Контроль внутрилабораторный, изучение методических оши- ошибок методом дисперсионного анализа 201—203, 209—213, 225—227, 237—242 по преобладанию одного знака в расхождениях анали- анализов 186—189 текущим анализам 277—280 , применение перфокарт 344—346 , проверка гипотезы о слу- случайном характере флуктуа- флуктуации градуировочных графи- графиков 191—193 Контроль внутрилабораторный с помощью контрольных диа- диаграмм 357—359 — межлабораторный методом дисперсионного анализа 214—225 по результатам теку- текущих анализов с помощью «-критерия 162—164 по преобладанию одпого знака в расхождениях анали- анализов 186—189 — — — частоте появления больших Ошибок 156—158 — — путем проверки гипотезы о совместимости результатов определений 173—175 Контрольные диаграммы 357— 359 Контурные эллипсы 310—313 Корреляционный анализ, идея .метода 298—304 — —, изучение воспроизводимо- воспроизводимости эмиссионного спектраль- спектрального анализа 308—314 — —, интерпретация результа- результатов 304 — —, линия ортогональной ре- регрессии 310 — —, области применения 306—308; 313 Коэффициент вариации 43 — доверия 84 — корреляции 55 , вычисление 300, 305^ 306 , — приближенное по мате- материалам, нанесенным на пер- перфокарты 353 , определение 299—300 — —, распределение 97, 303 , свойства 300—303 — надежности 84 — регрессии, определение (см. также регрессионный анализ) 262 Критерий Вартлета 164—166, 208, 269, 290 — двухсторонний 86 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 427 Критерий Кохрена 166—168, 208, 269, 290 — односторонний 86 Латинский квадрат 252, 254, 255 Математическое ожидание слу- случайной величины 38 Медиана 71, 72, 189 Металлографический анализ, статистические оценки 142— 144, 155 Метод трех эталонов 297 Микростатистика 79 Неоднородность проб 29, 203— 205 Неравенство Чобышева 193—196 Неравноточные измерения, оцен- оценка среднего взвешенного 267, 268 Нуль-гипотеза, определение 87 Отбор проб, изучение оптималь- оптимальных условий отбора проб с по- помощью дисперсионного ана- анализа 203—205 , определение объема вы- выборки 327 , применение таблицы слу- случайных чисел 325—326 Относительная частота появле- появления события 34 Ошибка вероятная 74, 76 — воспроизводимости, изучение методом корреляционного ана- анализа 308—313 — максимальная 73, 74 — средняя арифметическая 74— 77, 261 Ошибки грубые 168, 171 —, классификация 18—33 — косвенных измерений для аб- абсорбционного спектрального анализа 61—63 — для эмиссионного спе- спектрального анализа 63—67 — межлабораторные 22, 23, 129, 162—164, 174, 175, 214—225 — методические 18—33, 112 Ошибки методические, изучение методом дисперсионного ана- анализа 197—203, 209—213, 225—242 , изучение методом секвен- секвенциального анализа 183 , — характера флуктуации параметров градуировочных графиков 189—192 — —, контроль за смещением среднего значения во времени при помощи контрольных диаграмм 357, 358 — —, обсуловленные действием факторов, медленно изменяю- изменяющихся во времени 21, 22, 201, 202 — —, — металлургической ис- историей образца 272, 336—337 — —, — особенностью физиче- физического состояния образца 272, 315, 318 , оценка методом регресси- регрессионного анализа 272—284 — —, — основанная, на том, что расхождения в анализах име- имеют преимущественно один знак 186—189 — — ,— по разбросу точек от- относительно графика 271—272, 293—298 , — с помощью стандарт- стандартных образцов 173, 175—176 — — при построении градуиро- ночного графика 270—284 , связь между флуктуа- циями параметра градуировоч- ного графика и температурой возбуждения 304—306 — первого и второго рода 177, 182, 329—339 — при определении параметров градуировочных графиков 263 Параметры градуировочного графика, определение методом наименьших квадратов 258, 259, 261—267 — — —, ошибки при опреде- определении параметров методом на- наименьших квадратов 263
428 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Перфокарты, применение в мо- молекулярной спектроскопии 340 344, 346—352 —, исследовательской ра боте 352—353 —, — при изучении корреля- корреляционных связей 353 — с внешней перфорацией 346— 352 — — внутренней перфорацией 340—345, 347 Планирование экспериментов, выбор числа параллельных определений для оценки сред- среднего в условиях, когда имеет- имеется только приближенная оцен- оценка для 0 337—338 — —, — — — — , пользуясь неравенством Чебышева 194 — —, — — — — при марки- маркировочном анализе с учетом ошибок первого и второго рода 329—335 — —, — — — — — неодно- неоднородных пробах 203—205 — —, — — — — — оценке двух средних 335—337 — —, — — — секвен- секвенциальном анализе 177—185 — —, — — — — — сравне- сравнении двух дисперсий 338—339 — —, пример комплексного пла- планирования эксперимента при изучении эмиссионного спект- спектрографического анализа 314— 324 — —, рандомизация условий эксперимента 28—29, 325— 328 Плотность вероятностей 36 Поправка на непрерывность 139, 155 — Шеппарда 46—48 Поправки, определение методом наименьших квадратов 273— 277, 280—284 —, — по результатам текущих анализов 277—279 Последовательный анализ см. секвенциальный анализ Правильность 26, 27 Правильность, изучение методом наименьших квадратов 274 Преобразование случайной пере- переменной 125, 126, 133, 134 139, 238—240 Радиационный анализ, статисти- статистические оценки 141—142, 144— 145 Рандомизация 28—29, 325— 328 Распределение биномипалыюе 153—158 — логарифмически - нормальное 125, 134 — нормальное 68—78 — — двумерное 299 — —, условия, при которых можно ожидать отклонения от нормального закона в анали- аналитической работе 122—134 — Пуассона 135—145 — результатов определений при качественном анализе 132— 133, 153, 155—158 — при количественном анализе 100—130, 133, 134 — — — — полуколичествел- пом анализе 131—133, 145— 152 — смешанное 126, 127 — структурных составляющих на шлифе 143—144, 155 —, /^-распределение 93—96 —, г-распредоление 96—98 —, ^-распределение (Стьюдеята) 79 89 —. X2-распределение 89—93 Регрессионный анализ, коэффи- коэффициенты регрессии 262 — ^-, линия ортогональной ре- регрессии 310 — —, проверка гипотезы линей- линейности для градуировочного графика 268—272 — —, — — о параллельном смещении градиуровочных гарфиков 290—293 — —, сравнение двух градуи- ровочных графиков 284— 290 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 429 Регрессивный анализ, сравнение параметров градуировочных графиков с теоретически ожидаемыми значениями 272—284 Секвенциальный (последователь- (последовательный) анализ, возможность при- применения при маркировочных анализах 332 — — —, идея метода 177— 180 -- — —, примеры применения 180—185 Серия 190 Систематические ошибки см. по- поправки и ошибки системати- систематические Случайная последовательность 28, 192, 193 Случайные числа 326 Случайный процесс 28, 189— 193 Способ наименьших квадратов, идея метода 261 — — —, определение парамет- параметров градуировочных графи- графиков 261—267 — , среднее взвешенное не- равпоточных измерений 267— 268 Сравнение двух аналитических методов с помощью дисперси- дисперсионного анализа 237—242 — — — — ^-критерия 162 Сроднее арифметическое значе- значение случайной величины 38, 39 — — — — —, выбор числа па- параллельных определений при сравнении двух средних 335— 337 среднего с данными некоторой спецификации 329—338 — — —, неравноточные измерения 267, 268 — , нескольких средних сравнение методом дисперсионного анализа 207 — — — — —, подсчет по сгруппированным данным 40, 41 Среднее арифметическое значе- значение случайной величины, при- применение секвенциального ана- анализа при сравнении среднего с некоторой заданной величи- величиной при известной а 177—184 — — — — —, свойство 259— 261 — — — — —, сравнение двух средних с помощью i-крите- рия 159—161 Стандартное отклонение, опре- определение 43 Стандартные образцы 20 Степени свободы, определения 44 Стохастический процесс 28 Точность 26, 27 Уровень значимости 86 Фукнция мощности критерия при проверке гипотез 330, 334 — распределения дифференци- дифференциальная 36, 37 — — интегральная 34—36 Центральная предельная теоре- теорема 122, 133 Частость 34 Эллипс, ограничивающий дове- доверительную область при опре- определении коэффициента регрес- регрессии 280—284 Эталоны, изучение неоднородно- неоднородности методом дисперсионного анализа 248—252 —, определение 20 Эталонирование, определение параметров графика методом наименьших квадратов 261— 267 —, оценка результатов анализа, полученных с помощью гра- графика 293—298
430 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Эталонироваие ошибки в определении параметров градуировочнного графика 263 —, проверка гипотезы линейно- линейности для градуировочного гра- графика 268—272 t о параллельном сме- смещении графиков 290— 293 Эталонирование, проверка га- потезы о случайном характе- характере флуктуации параметров градуировочного графика 191—193 —, сравнение градуировочного графика с теоретически ожи- ожидаемыми значениями 272—284 —, — параметров двух градуи- ровочных графиков 284—290 ЧИТАТЕЛИ! Своевременно заказывайте необходимую литера- литературу. Заказы покупателей определяют тираж книг. Количество экземпляров книги, поступающей для продажи в магазины, зависит от числа заказов по- покупателей. О выходящих книгах можно узнать в книжных магазинах или из объявлений и реклам Издательства. Предварительный заказ оформляется на почтовой открытке в книжном магазине. О поступлении за- заказанной литературы в книжный магазин покупатель извещается магазином по почте. Заказ сохраняется в течение недели с момента извещения. Предварительные заказы можно также направ- направлять отделам «Книга—почтой» по адресам: Москва, К-9, Петровка, д. 15 Москва, Центр, ул. Кирова, д. 6 Предварительные заказы экономят время и обе- обеспечивают покупку книг в первые дни продажи.