Text
                    Дж. Тейлор
ВВЕДЕНИЕ В ТЕОРИЮ ОШИБОК
Перевод с английского
канд. физ.-мат. наук Л. Г. Деденко
Москва «Мир» 1985


A Series of Books in Physics Eugene D. Commins, Editor AN INTRODUCTION TO ERROR ANALYSIS The Study of Uncertainties in Physical Measurements John R. Taylor Professor of Physics University of Colorado University Science Books Mill Valley,
ББК 22.172 ТЗО УДК 53.088 Тейлор Дж. ТЗО Введение в теорию ошибок. Пер. с англ.— М.: Мир, 1985. —272 с, ил. Книга профессора Колорадского университета (США) Дж. Тейлора явля- является пособием по математической обработке результатов измерений в учебных физических лабораториях. Подробно разъясняются неизбежность ошибок из- измерений, способы фиксирования результатов измерений и на основе нормального распределения рассматриваются элементы статистической обработки случайных ошибок, обсуждаются проблема «промахов», «взвешивание» результатов раз- различных измерений, метод наименьших квадратов, корреляции, распределение Пуассона н биномиальное распределение, критерий у}. В конце каждой главы приведены задачи, для большинства которых в конце кннгн имеются ответы и решения. Для студентов и преподавателей вузов, сотрудников измерительных лабо- лабораторий, а также учащихся средних специальных учебных заведений и старше- старшеклассников 2103000000—213 041@1)—85 151—85, ч. 1 ББК 22.172 517.8 Редакция литературы по физике Джон Тейлор Введение в теорию ошибок Научн. редактор В. И. Самсоиова Художник В. А. Скерсис Технический редактор Е. Н. Подчепаева Мл. научн. редактор Г. Г. Сорокина Художественный редактор В. А. Захаров Корректор В. И. Постиова ИБ № 4097 Сдано в набор 30.07.84. Подписано к печати 15.01.85. Формат 60X90'/is. Бумага ки.-журн. Гарнитура литературная. Печать высокая. Объем 8,50 бум. л. Усл. печ. л. 17,00 Усл. кр.-отт. 17,25. Уч.-изд. л. 15.97. Изд. № 2/3349. Тираж 30 000 экз. Заказ 294' Цена 1 р. 20 к. ИЗДАТЕЛЬСТВО «МИР» Москва, 129820, ГСП, И-110, 1-й Рижски Ленинградская типография № 2 головное предприятие Знамени Ленинградского объединения «Техническая кн, Союзполиграфпрома при Государственном Комитете ССцР |по, лиграфни н книжной торговли. 198052, г. Ленинград, Л-5! сного С#к<3шовой [телвств, по- Ш, 29. 1982 by Univ Перевод на 1985
ПРЕДИСЛОВИЕ ПЕРЕВОДЧИКА Студенты физических и инженерных специализаций уни- университетов и технических вузов обычно уже с первого се- семестра слушают курс общей физики и работают в лаборато- лабораториях физического (или измерительного) практикума. Успеш- Успешная работа в лаборатории наряду с овладением навыками измерений предполагает также знакомство с методами мате- математической обработки результатов измерений. Современные учебные планы и программы высших учебных заведений уде- уделяют этим вопросам недостаточное внимание. Практически дело сводится к двум-трем лекциям и рекомендациям исполь- использовать имеющиеся на русском языке пособия (см. список ли- литературы, добавленной при переводе), которые давно стали библиографической редкостью и мало доступны новым поко- поколениям студентов. Поэтому студенты младших курсов нуж- нуждаются в элементарном руководстве, в котором на доступных примерах объяснялись бы основные идеи и понятия и выво- выводились рабочие формулы на основе, как правило, здравого смысла и элементарных понятий теории вероятностей и мате- математической статистики. Книга профессора Колорадского университета (США) Дж. Тейлора и является таким элементарным пособием. От- Отмечая, что в современных программах обучения эксперимен- экспериментальной физике в США практически нет места и времени для основательного обучения методам обработки результатов из- измерений, проф. Дж. Тейлор предлагает возместить этот недо- недостаток официальной программы самостоятельной работой сту- студентов. В соответствии с эгой задачей автор с особой тщатель- тщательностью подходит к выбору и способу изложения материала книги. Отдельные главы строятся по возможности таким об- образом, чтобы их можно было изучать независимо друг от друга. В целях большей ясности изложения автор иллюстри- иллюстрирует основные идеи и понятия на большом числе простых при- примеров (отсюда значительный объем книги). Чтобы обратить внимание на основные результаты, Дж. Тейлор выделяет их в тексте книги. Для контроля в конце каждой главы приве- приведены задачи. С автором можно только согласиться, что реше- решение задач — один из лучших методов усвоения материала. Для самоконтроля в конце книги приведены решения и ответы для большинства задач. Наконец, автор предполагает, что
Предисловие переводчика студенты будут широко использовать микрокалькуляторы и другие современные вычислительные средства. Для удобства в конце книги приведены таблицы различных распределений. Хотя автор справедливо считает, что студенты должны рабо- работать с книгой самостоятельно, однако некоторое число лек- лекций и домашних заданий придадут работе студентов целена- целенаправленный характер. Книга состоит из двух частей. Первокурсники могут огра- ограничиться изучением первой части. Две первые главы, не со- содержащие математических трудностей, можно рекомендовать старшеклассникам и учащимся средних специальных учебных заведений. Вторую часть можно рекомендовать студентам вто- второго курса, а некоторые разделы — и старшекурсникам. В книге не рассматриваются вопросы, связанные с оформле- оформлением лабораторных работ. В литературе, добавленной при пе- переводе книги, можно найти ответы на эти вопросы. Книга предназначена для студентов и преподавателей ву- вузов; она может быть полезной сотрудникам измерительных лабораторий, а также учащимся средних специальных учеб- учебных заведений и старшеклассникам. Л. Г, Деденко
Моей жене ПРЕДИСЛОВИЕ Результаты всех измерений, как бы тщательно и на каком бы научном уровне они ни выполнялись, подвержены некото- некоторым погрешностям. Теория ошибок — наука, занимающаяся изучением и оценкой погрешностей; эти две ее функции позво- позволяют ученому определить, насколько велики погрешности в его измерениях, и помогают уменьшить их, когда это необхо- необходимо. Анализ погрешностей, или «ошибок», является суще- существенной частью любого научного эксперимента, и поэтому теория ошибок занимает важное место в любом университет- университетском курсе обучения экспериментальным наукам. Она может быть даже одной из наиболее интересных частей этого курса. Оценка погрешностей и поиск возможности их уменьшения до уровня, позволяющего сделать надлежащий вывод, могут пре- превратить всю систему скучных и рутинных измерений в под- подлинно интересное упражнение. Эта книга служит введением в теорию ошибок, предназна- предназначенным для использования при изучении вводного универси- университетского курса по экспериментальной физике, который обычно читается студентам первого или второго курса научных или инженерных специальностей. Я не берусь утверждать, что тео- теория ошибок является семой (или тем более единственно) важной частью такого курса, но, как показали мои исследо- исследования, она обычно представляет собой ту часть, которой наи- наиболее часто пренебрегают или которую неправильно исполь- используют. Во многих таких курсах теорию ошибок «преподают» вручением студенту пары страничек, содержащих несколько формул, после чего предполагается, что студент справится с работой самостоятельно. Результатом подобного подхода к теории ошибок становится бессмысленный ритуал, при кото- котором студент добавляет несколько строчек вычислений в конце каждого отчета по лабораторной работе не потому, что он по- понимает смысл проделанного, а просто по той причине, что так требует преподаватель. Я написал эту книгу с убеждением, что любому студенту, даже такому, который никогда не слышал об этом предмете,.
Предисловие необходимо знать, что представляет собой теория ошибок, по- почему она интересна и важна и каким образом следует применять ее основные понятия в отчетах по лабораторным работам. Первая часть книги (гл. 1—5) содержит материал, отвечающий на все эти вопросы и иллюстрированный много- многочисленными примерами экспериментов, встречающихся в учеб- учебных лабораториях. Студент, овладевший этим материалом, бу- будет знать и понимать почти все аспекты теории ошибок, с которыми он может встретиться в лаборатории первого года обучения: расчет ошибок в случае косвенных измерений, ис- использование элементарной статистики и обоснование этих рас- расчетов на базе нормального распределения. Вторая часть книги охватывает более сложные темы: ап- аппроксимацию методом наименьших квадратов, коэффициент корреляции, критерий /2 и др. Эти темы почти наверное не будут официально включены в лабораторные работы перво- первокурсников, хотя некоторые студенты могут заинтересоваться отдельными вопросами. Однако студентам второго года обучения необходимо знать некоторые из этих тем, и глав- главным образом по этой причине они включены в данную книгу. Я понимаю, что при выполнении лабораторных работ прак- практически не остается времени на изучение такого предмета, как теория ошибок. В Колорадском университете мы читаем одно- одночасовую лекцию в неделю в течение первых шести недель ла- лабораторных занятий первокурсников. Эти лекции вместе с не- небольшим числом домашних заданий, в которых используются задачи, приведенные в конце каждой главы, позволяют нам подробно охватить материал, изложенный в гл. 1—4 и крат- кратко— в гл. 5. Все это дает студентам активные знания расчета ошибок в случае косвенных измерений и элементов статистики плюс поверхностное знакомство с теорией нормального рас- распределения, лежащей в основе этих расчетов. Из высказываний нескольких студентов нашего универси- университета мы поняли ясно, что эти лекции — ненужное излишество по крайней мере для некоторых студентов, которые познако- познакомились с предметом по рекомендуемой литературе и по набо- наборам задач. Я твердо верю, что материал этой книги может быть освоен без помощи каких-либо лекций. Для изучения ч. II может потребоваться несколько лекций в начале второго года лабораторных работ (также сопровож- сопровождаемых домашними заданиями). Но даже в большей мере, чем ч. I, она предназначена для самостоятельного изучения студентом в любое время, когда его собственные нужды и ин- интересы могли бы потребовать этого. Все семь глав этой части почти полностью независимы друг от друга, что облегчает самостоятельное изучение каждой темы.
Предисловие В конце каждой главы приводится набор задач; читателю и в самом деле следует поработать с некоторыми из них, чтобы получить соответствующие навыки. Большинство рас- расчетов ошибок выполняется совсем просто. Студент, который вдруг обнаружит, что он увяз в многочисленных сложных рас- расчетах (будь то задачи из этой книги или лабораторная ра- работа), почти наверное делает что-то вовсе не обязательным и излишне трудным способом. Чтобы показать преподавателям и читателям, как надо вычислять ошибки, я включил в книгу значительно больше задач, чем нужно для среднего читателя. Читатель, который решит хотя бы треть задач, во всем хо- хорошо разберется. На обложках приведены сводки всех основных формул. Я надеюсь, что они будут полезны читателю как во время изучения, так и после. Эти сводки сделаны по главам и, как я полагаю, должны служить краткими обзорами, к которым читатель может обратиться после изучения каждой главы. В тексте книги некоторые формулы и правила даны в рам- рамках. Таким образом выделены только наиболее важные утвер- утверждения, сформулированные в окончательном виде (т. е. в та- таком, который впоследствии уже не изменяется). Читателю, несомненно, рекомендуется запомнить эти утверждения; они и выделены для того, чтобы привлечь к себе внимание. От читателя книги требуется постепенно возрастающий уровень математической подготовки. Для чтения двух пер- первых глав достаточно знания только алгебры; для понимания гл. 3 нужно уметь дифференцировать (включая умение вычис- вычислять частные производные в разд. 3.9, который не обязате- обязателен) ; гл. 5 требует умения интегрировать и знакомства с экс- экспоненциальной функцией. В ч. II предполагается, что чита- читатель свободно владеет всеми этими понятиями. В книге приведены многочисленные примеры физических экспериментов, однако понимание лежащей в основе этих экспериментов теории не является обязательным. Примеры в основном взяты из элементарной механики и оптики, в этом случае более высока вероятность того, что студент уже изу- изучал соответствующую теорию. Читатель, которому это будет необходимо, может найти обзор нужной теории в любом ввод- вводном курсе физики. Теория ошибок—-предмет, при обсуждении которого часто возникают споры, и ни одно изложение не может быть таким, чтобы с ним все согласились. Мое собственное убеждение состоит в том, что когда надо сделать выбор между доступ- доступностью изложения и его абсолютной строгостью, то в физи- физических книгах следует отдать предпочтение первому. Напри- Например, по спорному вопросу, следует ли использовать квадра- квадратичное сложение ошибок или складывать обычным образом
10 Предисловие их абсолютные значения, я предпочел изложить сначала обыч- обычное сложение их абсолютных величин, так как студент легко может понять доводы, обосновывающие такое сложение. За последние несколько лет в учебных лабораториях про- произошли существенные изменения в связи с появлением кар- карманных калькуляторов. Это имело несколько неблагоприят- неблагоприятных последствий, и наиболее значительное из них — ужасная привычка выписывать совсем незначащие цифры только по- потому, что калькулятор их выдает. Однако почти с любой точ- точки зрения это нововведение имеет огромное значение, осо- особенно в теории ошибок. Карманный калькулятор позволяет за несколько секунд рассчитать средние и стандартные от- отклонения, на что раньше требовались часы. Он делает не- ненужными многие таблицы, так как с его помощью можно рассчитать функции, подобные гауссовой, быстрее, чем найти их значения в этих таблицах. Я пытался использовать это чу- чудесное устройство везде, где только можно. Мне доставляет удовольствие поблагодарить некоторых людей за их полезные замечания и предложения. Предвари- Предварительное издание этой книги использовалось в нескольких уни- университетах, и я признателен многим студентам и коллегам за их критику. Особенно полезными были замечания Джона Мор- рисона и Дэвида Несбитта из Колорадского университета, профессоров Пратта и Шредера из Мичиганского универси- университета, проф. Шугарта из Калифорнийского университета в г. Беркли и проф. Симона из Бэйтского университета. Диана Каспарян, Линда Фруэ и Конни Геруле отлично и быстро от- отпечатали черновые наброски. Без помощи моей тещи Фрэн- Фрэнсис Кретшманн корректура никогда не была бы прочитана вовремя. Я признателен всем этим людям за их помощь; но самую большую благодарность приношу моей жене, которая тщательным и безжалостным редактированием способство- способствовала значительному улучшению книги. Дж, Р. Тейлор 1 ноября 1981 г. Боулдер, Колорадо
ЧАСТЬ I 1. Предварительное знакомство с теорией ошибок 2. Как приводить и использовать погрешности 3. Погрешности в косвенных измерениях 4. Статистический анализ случайных погрешностей 5. Нормальное распределение В ч. I вводятся основные понятия теории ошибок в том объеме, который требуется студенту первого года обучения для работы в типичной университетской лаборатории по фи- физике. Две первые главы дают представление о том, что такое теория ошибок, почему она важна и как можно ее использо- использовать в типичном отчете по лабораторной работе. В гл. 3 опи- описан расчет ошибок в случае косвенных измерений, когда по- погрешности в прямых измерениях «распространяются» в про- процессе вычислений на погрешности в конечных рассчитанных значениях. В гл. 4 и 5 вводятся статистические методы, с по- помощью которых могут быть оценены так называемые случай- случайные погрешности.
Глава 1 Предварительное знакомство с теорией ошибок Теория ошибок — изучение и оценка погрешности в изме- измерениях. Опыт показывает, что ни одно измерение, как бы тща- тщательно оно ни проводилось, не может быть совершенно сво- свободно от ошибок. Поскольку в основе любой науки и ее при- применений лежат измерения, исключительно важно уметь рассчитывать эти ошибки и сводить их к минимуму. В этой главе описываются некоторые простые измерения, на которых иллюстрируется неизбежность появления экспе- экспериментальных ошибок и показывается, насколько важно знать, как велики эти ошибки. Затем мы объясняем, по крайней мере для некоторых простых случаев, как можно правильно рассчитать величины экспериментальных ошибок, главным образом не более чем на основе здравого смысла. 1.1. Ошибки как погрешности В науке слово «ошибка» не имеет обычного значения чего- то неправильного. «Ошибка» в научном измерении означает неизбежную погрешность, которая сопутствует всем измере- измерениям. Ошибки как таковые нельзя отнести к промахам экспе- экспериментатора; вы не можете избежать их, стараясь быть очень внимательными. Лучшее, на что вы можете рассчитывать,— это свести ошибки к возможному минимуму и надежно рас- рассчитать их величины. В большинстве учебников вводятся до- дополнительные определения слова «ошибка». Некоторые из них мы обсудим позднее. Пока, однако, мы будем использовать слово «ошибка» исключительно в значении «погрешность», считая эти два слова равнозначными. 1.2. Неизбежность погрешностей Чтобы показать неизбежность появления ошибок, мы долж- должны лишь тщательно проанализировать любое повседневное из- измерение. Рассмотрим, например, действия плотника, который,
Предварительное знакомство с теорией ошибок 13 чтобы установить дверь, должен измерить высоту дверного проема. Делая прикидку, он мог бы просто взглянуть на двер- дверной проем и оценить его высоту в 210 см. Это грубое «из- «измерение» определенно содержит погрешность. При необхо- необходимости плотник мог бы учесть эту погрешность, допу- допуская, что высота может быть и меньше B05 см), и больше B15 см). Если бы он захотел произвести более строгое измерение, он мог бы использовать рулетку и определить, что высота равна 211,3 см. Это измерение определенно является более точным, чем его первоначальная прикидка, но и оно, очевидно, содержит некоторую погрешность, поскольку невероятно, чтобы он мог знать, что высота равна точно 211,3000 см, а не, например, 211,3001 см. Имеется много причин, влияющих на эту остающуюся по- погрешность. Часть из них мы будем рассматривать в этой книге. Некоторые из источников ошибок можно было бы устранить, если бы плотник проявил больше внимания к из- измерению. Например, одним из источников ошибки могло слу- служить плохое освещение, затрудняющее считывание с рулетки. Эту причину ошибки можно было бы устранить, улучшив осве- освещение. С другой стороны, некоторые из источников ошибки при- присущи самому процессу измерения и никогда не могут быть полностью устранены. Например, предположим, что рулетка плотника проградуирована полусантиметровыми делениями. Верх дверного проема, по всей вероятности, не совпадает точ- точно ни с одним из полусантиметровых делений. В этом случае плотник должен оценить положение верха проема между двумя делениями. Если же верх проема совпал с одним из делений, то, учитывая, что само деление имеет ширину по- порядка миллиметра, он должен оценить положение верха в пределах деления. В любом случае плотник должен в конеч- конечном счете оценить, где лежит верх дверного проема относи- относительно делений на его рулетке, и это приводит к некоторой ошибке в его отсчете. Купив другую рулетку с чаще расположенными и более тонкими делениями, плотник может уменьшить ошибку, но не может ее полностью устранить. Если бы он преисполнился решимости определить высоту проема с наилучшей точностью, допускаемой современным техническим уровнем, он мог бы купить дорогой лазерный интерферометр. Но даже точность интерферометра ограничена величиной порядка длины волны света (около 0,5-10~6 м). Хотя теперь плотник был бы в со- состоянии проводить измерения с фантастической точностью, ему все же не удалось бы точно определить высоту дверного проема
14 Глава I Более того, стремясь достигнуть все более высокой точ- точности, наш плотник столкнется с важной и принципиальной проблемой. Он определенно обнаружит, что высота в разных местах различна. Даже в одном и том же месте он найдет, что высота изменяется, если меняются температура и влаж- влажность или даже если он случайно сотрет тонкий слой пыли. Другими словами, он обнаружит, что нет такой величины, как высота дверного проема. Такого рода проблема называется проблемой определения (высота дверного проема не является точно определяемой количественной характеристикой). Она играет важную роль во многих научных измерениях. Опыты нашего плотника иллюстрируют известную истину. Ни одну физическую величину (длину, время, температуру и т. д.) нельзя измерить с полной определенностью. Ценой особых усилий мы можем свести ошибки до очень малых значений, но исключить их полностью невозможно. В повседневных измерениях мы обычно не затрудняем себя обсуждением ошибок. Иногда ошибки просто не имеют значе- значения. Если мы говорим, что расстояние между домом и школой равно 3 км, то (в большинстве случаев) не важно, значит ли это, что оно лежит «между 2,5 и 3,5 км» или «между 2,99 и 3,01 км». Часто ошибки важны, но их нельзя оценить интуи- интуитивно без точного анализа. Когда наш плотник начнет подго- подгонять дверь, он должен знать ее высоту с ошибкой порядка 1 мм. В конце концов, пока ошибка столь мала, дверь (во всех практических случаях) будет отлично подогнана и его интерес к теории ошибок пропадет. 1.3. Как важно знать погрешности Наш пример с плотником, измеряющим дверной проем, ил- иллюстрирует возникновение ошибок в измерениях. Теперь мы рассмотрим пример, который более отчетливо показывает, на- насколько важно знать величину этих ошибок. Предположим, что мы столкнулись с проблемой, которую, как говорят, решил Архимед, а именно: нас попросили опре- определить, изготовлена ли корона из 18-каратного золота1), как об этом заявили, или же из более дешевого сплава. Следуя Архимеду, мы решили определить плотность материала ко- короны, зная, что плотности 18-каратного золота и подозревае- подозреваемого сплава равны соответственно Рзолото= 15,5 Г/СМ3 и Рсплав = 13,8 Г/СМ3. ') 18-каратное золото — сплав, на 24 части которого приходится 18 ча- частей драгоценного металла и 6 частей цветных металлов. — Прим, перев.
Таблица 1. Измеренная Наилучшая Вероятный Предварительное знакомство с I. Плотность короны величина оценка для Ркорона интервал рКОрона (в г/см3) теорией ошибок Эксперт А 15 13,5—16,5 15 Эксперт Б 13,9 13,7—14,1 ЕСЛИ бЫ МЫ МОГЛИ ИЗМерИТЬ ПЛОТНОСТЬ КОрОНЫ Ркорона, ТО (в соответствии с гипотезой Архимеда) можно было бы ре- решить, действительно ли это золотая корона, сравнивая ркорона С ИЗВеСТНЫМИ ПЛОТНОСТЯМИ рзолото И рсплав. Предположим, что мы обратились к двум экспертам по определению плотности. Эксперт А мог быстро измерить ркорона и сообщить, что его наилучшая оценка для ркорона равна 15 и что ркорона практически достоверно лежит в интервале между 13,5 и 16,5 г/см3. Эксперт Б мог поработать немного больше и затем объявить наилучшей оценкой 13,9 и вероятный интер- интервал от 13,7 до 14,1 г/см3. Результаты наших двух экспертов можно свести в табл. 1.1. Относительно этих результатов следует сделать два заме- замечания. Во-первых, хотя измерения эксперта Б значительно точнее, данные эксперта А, вероятно, также правильны. Каж- Каждый эксперт приводит интервал, в котором, как он уверен, лежит ркорона, и эти интервалы перекрываются. Таким обра- образом, вполне вероятно (и фактически так оно и есть), что оба измерения правильны. Во-вторых, ошибка в измерениях эксперта А столь велика, что его результаты просто бесполезны. Значения плотности 18-каратного золота и сплава лежат в полученном им интер- интервале от 13,5 до 16,5 г/см3, так что измерения этого эксперта не позволяют сделать никакого заключения. С другой сто- стороны, измерения эксперта Б ясно показывают, что корона не подлинная. Плотность предполагаемого сплава 13,8 как раз находится внутри определенного экспертом Б интервала от 13,7 до 14,1, в то время как плотность 18-каратного золота, 15,5, явно не попадает в этот интервал. Очевидно, если из измерений необходимо делать определенные выводы, то экспе- экспериментальные ошибки не должны быть слишком велики. Од- Однако нет необходимости в том, чтобы ошибки были очень малы. В этом отношении наш пример типичен для многих научных измерений, в которых ошибки должны быть разумно малы (возможно, несколько процентов от измеряемой вели? чины), но чрезмерная точность часто является излишней. Так как наше решение основывается на результатах экс- эксперта Б, состоящих в том, что ркорона лежит между 13,7 и
16 Глава 1 14,1 г/см3, то важно получить от эксперта Б убедительные до- доказательства, чтобы мы поверили в его результаты. Другими словами, экспериментатор должен доказать правильность ве- величины определенного им интервала. Этот момент часто игно- игнорируется начинающим студентом, который просто утверждает, что его ошибка равна 1 мм или 2 с и т. п., опуская какие-либо доказательства. Простое утверждение ошибки без краткого объяснения способа ее оценки чаще всего бесполезно. Наиболее важный вывод относительно измерений наших двух экспертов состоит в следующем: подобно большинству научных измерений, оба измерения были бы бесполезны, если бы они не содержали надежных сведений об их ошибках. Дей- Действительно, если бы мы располагали только информацией, содержащейся в верхней строке табл. 1.1, то мы не только не могли бы сделать какое-либо правильное заключение, но фак- фактически были бы введены в заблуждение, так как результат эксперта А A5 г/см3) наталкивал бы на предположение, что корона подлинная. 1.4. Другие примеры Примеры, обсуждаемые в предыдущих двух разделах, представляют хорошее введение к некоторым основным поло- положениям теории ошибок. Они были выбраны не вследствие их собственной большой важности, и читателя можно извинить, если он сочтет их немного искусственными. Однако легко при- привести примеры, которые исключительно важны почти в любой области прикладной или фундаментальной науки. В прикладных науках инженер, конструируя ядерную си- силовую установку, должен знать характеристики материалов и ядерного горючего, которые он собирается использовать. Про- Производителю карманного калькулятора необходимо знать ха- характеристики его различных электронных компонент. В любом случае кто-то должен измерить требуемые параметры, а из- измерив их, установить достоверность своих результатов. Здесь- то и требуется применение теории ошибок. Инженеры, заня- занятые обеспечением безопасности самолетов, поездов или авто- автомобилей, должны разбираться в ошибках времени реакции водителей, в тормозных путях и еще во множестве других вещей. И ошибка в расчетах погрешностей может привести к несчастным случаям, подобным изображенному на обложке этой книги. Даже в области, далекой от науки, такой, как по- пошив одежды, теория ошибок в виде контроля качества играет решающую роль. В фундаментальных науках теория ошибок имеет еще бо- более важное значение. Когда предлагается любая новая тео-
Предварительное знакомство с теорией ошибок 17 рия, она должна быть проверена наряду с более ранними в одном или нескольких экспериментах, для которых новая и старые теории предсказывают различные результаты. В прин- принципе просто ставится эксперимент, результаты которого позво- позволяют сделать выбор между соперничающими теориями. На практике положение осложняется вследствие неизбежных экспериментальных ошибок. Все эти ошибки необходимо тща- тщательно учитывать и уменьшать до тех пор, пока эксперимент не позволит выбрать одну приемлемую теорию. Другими сло- словами, экспериментальные результаты вместе с их ошибками должны находиться в согласии с предсказаниями одной тео- теории и расходиться с данными всех известных альтернативных вариантов. Очевидно, успех такой процедуры решающим об- образом зависит от понимания ученым теории ошибок и его способности убедить других в правильности своего понимания. Известный пример такого рода проверки научной теории — измерение отклонения луча света, проходящего вблизи Солн- Солнца. Когда Эйнштейн в 1916 г. опубликовал свою общую тео- теорию относительности, он отметил, что, согласно предсказа- предсказаниям этой теории, свет от звезды, проходя вблизи края Солн- Солнца, будет отклоняться на угол а= 1,8". Простейшая класси- классическая теория не предсказывала никакого отклонения (а = 0), а более тщательное рассмотрение с классических по- позиций давало (как указал сам Эйнштейн в 1911 г.) отклоне- отклонение на угол а = 0,9". В принципе необходимо было лишь на- наблюдать звезду, когда она сравняется с краем диска Солнца, и измерить угол отклонения а. Если бы результат был а = 1,8", то общая теория относительности была бы под- подтверждена (по крайней мере для этого явления). Если бы угол а был равен 0 или 0,9", то общая теория относительности оказалась бы неверна, а правильной была бы одна из более ранних теорий. На практике измерение отклонения света Солнцем исклю- исключительно затруднено и возможно только во время солнечных затмений. Тем не менее оно было успешно измерено в 1919 г. Дайсоном, Эддингтоном и Дэвидсоном. Их наилучшая оценка составила а = 2", и они нашли, что с вероятностью 95 % от- отклонение лежит в пределах от 1,7" до 2,3" !). Очевидно, этот результат оказался в соответствии с общей теорией относи- относительности и противоречил любым более ранним предсказа- предсказаниям. Следовательно, он убедительно подтвердил эйнштейнов- эйнштейновскую общую теорию относительности. ') Это упрощенное рассмотрение основано на оригинальной статье Дайсона, Эддингтона и Дэвидсона (Philosophical Transactions of the Royal Society, 220A, 291 A920)). Я перевел вероятную ошибку, приведенную в оригинале, в 95 °/о-ный доверительный интервал. Точный смысл такого доверительного интервала будет установлен в гл. 5.
18 Глава 1 В течение какого-то времени этот результат считался спор- спорным. Многие предполагали, что ошибки сильно недооценены и, следовательно, эксперимент неубедителен. Последующие эксперименты подтвердили предсказание Эйнштейна и оправ- оправдали заключение Дайсона, Эддингтона и Дэвидсона. Важный момент состоит в том, что решение всего вопроса зависело от способности экспериментатора достоверно оценить все ошибки и убедить других, что это сделано правильно. Студент в лаборатории вводного курса физики обычно не будет в состоянии проводить решающие испытания новых тео- теорий. С другой стороны, многие эксперименты в лаборатории вводного курса физики задуманы как тесты существующих физических теорий. Например, теория тяготения Ньютона предсказывает, что тела падают с постоянным ускорением g (при соответствующих условиях), и студент может проводить эксперименты по проверке правильности этого предсказания. С первого взгляда такой тип эксперимента может показаться искусственным и бессодержательным, поскольку эти теории, очевидно, были проверены много раз со значительно большей точностью, чем это возможно в учебной лаборатории. Тем не менее если студент понимает решающую роль теории ошибок и принимает вызов по выполнению наиболее точных проверок, возможных с имеющимся оборудованием, то такие экспери- эксперименты могут быть интересными и поучительными упражне- упражнениями. 1.5. Оценка погрешностей присчитывании со шкалы Итак, мы рассмотрели несколько примеров, которые иллю- иллюстрируют, почему каждое измерение содержит погрешности и почему важно знать их величину. Но мы еще не обсуждали, как фактически можно оценить величину ошибки. На прак- практике такая оценка может быть довольно сложна; она и состав- составляет главный предмет данной книги. К счастью, для ряда про- простых измерений легко с приемлемой точностью оценить по- погрешность часто на основе лишь здравого смысла. Здесь и в разд. 1.6 мы рассмотрим два примера таких простых изме- измерений. Понимание этих примеров позволит студенту приступить к использованию теории ошибок в своих экспериментах и по- послужит нам основой для дальнейшего изложения. Наш первый пример — измерение с использованием мар- маркированной шкалы, такой, как у линейки на рис. 1.1 или у вольтметра на рис. 1.2-. Чтобы измерить длину карандаша на рис. 1.1, мы должны сначала совместить торец карандаша с нулем линейки и затем определить, где окажется его острие
Предварительное знакомство с теорией ошибок 19 Миллиметры О 10 20 30 40 50 I..,.!,,..!,...!,.,,!,,,,!,.,,!,,,,!..,,!.,,. I,... Рис. 1.1. Измерение длины линейкой. Рис. 1.2. Считывание со шкалы вольтметра. на шкале линейки. Чтобы измерить напряжение согласно рис. 1.2, мы должны определить то место на шкале вольтмет- вольтметра, куда указывает стрелка. Если допустить, что правиль- правильность показаний линейки и вольтметра гарантируется1), то главная задача в каждом из этих двух случаев — определить, где располагается определенная точка по отношению к мет- меткам шкалы. (Конечно, если существует вероятность того, что правильность показаний линейки или вольтметра не гаранти- гарантируется, то мы должны будем это учесть.) Метки на линейке на рис. 1.1 довольно близки друг к другу (с интервалом в 1 мм). Экспериментатор вполне разумно мог бы решить, что искомая длина, без сомнения, ближе к 36 мм, чем к 35 или 37 мм, и что более точный отсчет невозможен. Следовательно, он мог бы сформулировать свой вывод как наилучшая оценка длины = 36 мм, вероятный интервал 35,5—36,5 мм ') В нашей стране такая гарантия реализуется системой поверочных измерений на основе соответствующих ГОСТов. Эта система состоит в поверке данного прибора по контрольному, который в свою очередь пове- поверяется по еще более точным приборам и т. д., пока не будет обеспечено сравнение с эталоном измерения данной величины. Однако учебные и де- демонстрационные приборы, как правило, не поверяются, т. е. правильность «оказаний таких приборов не гарантируется, •=• Прим. перев.
20 Глава I и сказал бы, что он измерил длину до ближайшего миллимет- миллиметрового деления. Такой тип заключения — что величина лежит ближе к дан- данной метке, чем к любой из соседних, — является довольно об- общим. По этой причине многие ученые следуют соглашению, в соответствии с которым утверждение / = 36 мм без допол- дополнительных пояснений означает, что / ближе к 36, чем к 35 или 37 мм, т. е. / = 36 мм означает 35,5 мм ^/^36,5 мм. Подобным же образом запись типа х = 1,27 без указания ка- какой-либо погрешности в соответствии с соглашением означает, что х лежит между 1,265 и 1,275. В данной книге мы не будем следовать этому соглашению и всегда будем указывать наши погрешности явным образом. Тем не менее для студента важно понимать это соглашение и знать, что оно используется по отношению к любому числу, приведенному без погреш- погрешности. Особенно важно знать об этом соглашении в наш век карманных калькуляторов, которые часто показывают много цифр1). Если студент слепо перепишет со своего калькуля- калькулятора, скажем, число 123,456 без какого-либо объяснения, та человек, читающий это число, обязан принять, что число опре- определенно верно до шести значащих цифр, а это представляется весьма невероятным. Метки на шкале вольтметра, показанного на рис. 1.2, рас- расположены гораздо реже, чем на линейке. В этом случае боль- большинство наблюдателей согласились бы, что можно сделать больше, чем просто идентифицировать метку, к которой стрел- стрелка ближе всего Поскольку промежутки между метками боль- больше, можно уверенно оценить, в каком месте между метками находится стрелка. Таким образом, разумное заключение об измеренном напряжении может иметь вид наилучшая оценка напряжения = 5,3 В, вероятный интервал 5,2—5,4 В. Процесс определения положений между метками шкалы назы- называется интерполяцией. Этот важный навык совершенствуется с практикой. Другие наблюдатели могли бы не согласиться с оценками точности, даваемыми соотношениями A.1) и A.2). В частно- частности, кто-то мог бы решить, что можно прибегнуть к интерпо- интерполяции при измерении длины на рис. 1.1 и измерить ее с мень- ') В карманных калькуляторах используется форма представления чисел с фиксированным и большим числом разрядов. — Прим. перее.
Предварительное знакомство с теорией ошибок 21 шей погрешностью, чем приведено в соотношении A.1). Тем не менее лишь меньшинство стало бы отрицать, что соотно- соотношения A.1) и A.2) разумно оценивают соответствующие вели- величины и их вероятные погрешности. Таким образом, мы видим, что приближенная оценка погрешностей представляет доволь- довольно легкую задачу в случае, когда единственной проблемой является определение положения точки на маркированной шкале. 1.6. Оценка погрешностей в случае многократных измерений Многие измерения содержат погрешности, которые значи- значительно труднее оценить, чем ошибки, связанные с определе- определением положения точки на шкале. Например, когда мы изме- измеряем временной интервал с помощью секундомера, главным источником погрешностей является не считывание с цифер- циферблата, а наше собственное неизвестное время реакции при за- запуске и остановке секундомера. Такого рода погрешности иногда можно надежно оценить, если повторить измерение несколько раз. Предположим, например, что мы измеряем пе- период колебаний математического маятника один раз и полу- получаем в результате 2,3 с. Из одного измерения нельзя много сказать об экспериментальной погрешности. Но если мы по- повторим измерение и получим 2,4 с, то можно немедленно ска- сказать, что погрешность, вероятно, порядка 0,1 с. Если последо- последовательность четырех измерений дает результаты (в секундах) 2,3; 2,4; 2,5; 2,4, A.3) то мы можем сделать довольно правдоподобные оценки. Во-первых, естественно предположить, что наилучшей оценкой периода будет среднее значение 2,4 с1). Во-вторых, представляется довольно разумным предполо- предположение, что правильное значение для периода лежит где-то между наименьшей величиной 2,3 и наибольшей 2,5. Таким образом, мы могли бы вполне резонно заключить, что наилучшая оценка = среднее = 2,4 с, A 4) вероятный интервал 2,3—2,6 с. ; В случаях, когда мы можем повторить одно и то же изме- измерение несколько раз, разброс в измеренных значениях дает ') Мы покажем в гл. 5, что наилучшая оценка, основанная на не- нескольких измерениях какой-то величины, есть почти всегда среднее резуль- результатов измерений.
22 Глава 1 ценное указание о погрешности в наших измерениях. В гл. 4 и 5 мы обсудим статистические методы обработки результа- результатов таких многократных измерений. При соответствующих условиях эти статистические методы дают более правильную оценку погрешности, чем соотношение A.4), полученное толь- только на основе здравого смысла. Правильная статистическая об- обработка обладает также тем преимуществом, что дает объек- объективную величину для погрешности, не зависящую от мнения индивидуального наблюдателя1). Тем не менее оценка A.4) дает простое и реалистическое заключение, полученное на основании четырех измерений A.3). На результаты многократных измерений, такие, как A.3), не всегда можно опираться для обнаружения погрешности. Во-первых, мы должны быть уверены, что измеряемая вели- величина действительно есть та же самая величина в каждом слу- случае. Предположим, например, что мы измеряем разрывное усилие для двух предположительно идентичных проволок, под- подвергая их разрыву (процедуре, которую мы не можем выпол- выполнить более чем один раз для каждой проволоки). В случае получения двух различных ответов эта разница может ука- указывать на то, что наши измерения выполнены с погрешностью или что две проволоки в действительности не идентичны. Сама по себе разница между двумя ответами ничего не говорит о надежности наших измерений. Даже в случае, когда мы можем быть уверены, что изме- измеряем каждый раз одну и ту же величину, многократные изме- измерения не всегда укажут на погрешность. Например, предпо- предположим, что секундомер, используемый при получении резуль- результатов A.3), имел ход на 5% быстрее правильного. В этом слу- случае все времена, получаемые с его помощью, будут на 5% больше, и никакое количество повторений (с тем же секундо- секундомером) не обнаружит этого дефекта. Погрешности такого рода, которые оказывают одно и то же влияние на все изме- измерения, называются систематическими ошибками. Эти ошибки трудно обнаружить, как мы увидим в гл. 4. В нашем примере выходом из положения могла быть поверка данного секундо- секундомера относительно более надежного. В общем случае должно быть ясно, что если у кого-то имеются основания сомневаться в правильности показаний какого-либо измерительного при- прибора (секундомера, рулетки, вольтметра), он должен попы- ') Правильная статистическая обработка обычно дает также меньшую погрешность, чем полный интервал между наименьшим и наибольшим на- наблюдаемыми значениями. В самом деле, по четырем результатам в A.3) мы заключили, что период, «вероятно», лежит где-то между 2,3 и 2,5 с. Статистические методы, изложенные в гл. 4 и 5, позволят нам утвер- утверждать, что с вероятностью 70 % он лежит в меньшем интервале: от 2,36 до 2,44 с.
Предварительное знакомство с теорией ошибок 23 таться поверить его относительно прибора, о котором изве- известно, что его показания более надежны *). Примеры, обсуждаемые в этом и предыдущем разделах, показывают, что в некоторых случаях экспериментальные по- погрешности могут быть легко оценены. С другой стороны,, имеется много измерений, для которых оценить ошибки не так легко. В конце концов, мы также хотим получить более точ- точные значения для погрешностей, чем те, которые могут нам дать обсуждаемые выше простые оценки. Эта тема будет за- занимать нас в последующих главах, начиная с гл. 3. В гл. 2 временно предполагается, что нам известны методы оценки погрешности для всех величин, представляющих интерес, так что мы можем обсуждать, как лучше записывать погрешности и как их использовать при получении экспериментальных вы- выводов. ') См. примечание переводчика на с. 19. —Прим. перев.
Глава 2 Как приводить и использовать погрешности Итак, у нас имеются некоторые представления о том, на- насколько важны экспериментальные погрешности, каковы при- причины их появления. Мы также видели, как можно их оценить для ряда простых ситуаций. В этой главе будут представлены некоторые основные соображения и правила теории ошибок и приведены примеры их использования в нескольких типичных экспериментах физической лаборатории. Наша главная цель—¦ познакомить вас с основным словарем теории ошибок и с его применением в учебной лаборатории. После этого, начиная с гл. 3, мы будем готовы перейти к изучению реальной оценки погрешностей. В разд. 2.1—2.3 определяются несколько основных поло- положений теории ошибок и обсуждаются некоторые общие пра- правила представления погрешностей. В разд. 2.4—2.6 мы обсу- обсудим, как эти определения могли бы быть использованы в не- некоторых типичных экспериментах в учебной физической лабо- лаборатории. Наконец, в разд. 2.7—2.9 вводится еще одно основ- основное определение — относительная погрешность-—и обсуждает- обсуждается ее, значение. 2.1. Наилучшая оценка ± погрешность Мы видели, что корректный способ представления резуль- результата любого измерения состоит в том, что экспериментатор указывает свою наилучшую оценку измеряемой величины и интервал, в котором, как он уверен, она лежит. Например, результат измерения периодов, обсуждаемый в разд. 1.6, был представлен как наилучшая оценка времени = 2,4 с, вероятный интервал 2,3—2,5 с. В этом случае наилучшая оценка 2,4 с лежит в середине оце- оцененного интервала вероятных значений от 2,3 до 2,5 с, так же,
Как приводить и использовать погрешности 25 как это было во всех наших примерах. Такое положение, оче- очевидно, очень естественно и относится почти ко всем измере- измерениям. Оно позволяет выразить результаты измерений в наи- наиболее компактном виде. Например, измерение времени, зафик- зафиксированное в B.1), обычно выражают следующим образом: измеренное значение времени = 2,4 ± 0,1 с. B.2) Это выражение точно эквивалентно двум в B.1). В общем случае результат любого измерения величины х приводится как (измеренная величина х) = хнанл dh 6л". B.3) Это утверждение означает, что, во-первых, наилучшая оценка экспериментатора для измеряемой величины есть число хнаал и, во-вторых, он до определенной степени уверен, что эта ве- величина лежит где-то между х„анл — бл: и жнаил + 8х. Число 8х называется погрешностью или ошибкой в измерении х. По- Погрешность бл: принято считать положительной величиной, так что Хнаил + бл: есть всегда наибольшее вероятное значение из- измеряемой величины и Хнаил — 8х— наименьшее. Мы умышленно оставили смысл понятия интервала от Хнанл — бл: до Хнанл + бл: в какой-то степени неопределенным. В некоторых измерениях его можно определить более точно. В случае простого измерения, подобного определению высоты дверного проема, мы можем легко указать интервал от Хнанл — бл: ДО ЛСнаил + 8х, Внутри КОТОрОГО, КЭК МЫ пбсОЛЮТНО уверены, лежит измеряемая величина. К сожалению, для большинства научных измерений очень затруднительно сде- сделать такое утверждение. В частности, если мы хотим быть вполне уверены в том, что измеряемая величина лежит между ^наил —бл: и л:Наил + 8х, обычно необходимо выбрать для бл: такое значение, которое слишком велико, чтобы представлять практический интерес. Чтобы избежать этого, мы можем иногда выбирать такое значение бл:, для которого вероятность того, что действительное значение лежит между л:Нанл — бл: и л:Наил + бл:, будет равна, например, 70%. Однако этого, конечно, нельзя сделать без детального знания статистических зако- законов, которым подчиняются процессы измерения. Мы вернемся к этому вопросу в гл. 4, а пока довольствуемся определением погрешности 8х, согласно которому мы «до некоторой сте- степени» уверены в том, что измеряемая величина лежит где-то Между Хнанл — б* И Хнаил + 8х.
26 Глава 2 2.2. Значащие цифры Следует отметить несколько основных правил записи по- погрешностей. Во-первых, поскольку величина 8х служит оцен- оценкой погрешности, ее, очевидно, нельзя приводить с очень боль- большой точностью. Если мы измеряем ускорение силы тяжести g, было бы абсурдом представлять результат, подобно следую- следующему: (измеренное значение g) = 9,82 ± 0,02385 м/с2. B.4) Невероятно, чтобы погрешность в измерении могла быть из- известна до четырех значащих цифр. В случае высокоточных измерений иногда приводятся погрешности с двумя знача- значащими цифрами, но для учебной лаборатории мы можем сфор- сформулировать следующее правило1): Правило приведения погрешностей В начальной учебной лаборатории экспери- экспериментальные погрешности обычно должны округляться до одной значащей цифры. B.5) Таким образом, если некоторый расчет дает для погреш- погрешности 8g = 0,02385 м/с2, то это значение должно быть округ- округлено до 8g = 0,02 м/с2, и вывод B.4) следует переписать как (измеренное значение g) = 9,82 ±0,02 м/с2. B.6) Важное практическое следствие этого правила состоит в том, что многие расчеты ошибок можно выполнить в уме, без по- помощи калькулятора или даже карандаша и бумаги. Есть только одно важное исключение из правила B.5). Если первая цифра в погрешности 8х есть 1, то, возможно, лучше сохранить две значащие цифры в 8х. Например, предпо- предположим, что некоторый расчет дал для погрешности 8х = 0,14. Округлить это значение до 8х = 0,1 —значит на 40 % умень- уменьшить ошибку; так что более правильным было бы сохранить две цифры и привести 8х = 0,14. Тот же аргумент, вероятно, можно было бы использовать, если первая цифра есть 2, но уже определенно нельзя, если она больше. Когда погрешность в измерении рассчитана, необходимо проанализировать, какие цифры в измеренной величине яв- являются значащими. Утверждение типа измеренная скорость = 6051,78 ± 30 м/с B.7) ') Для удобства ссылок иа такие правила они включены в нумеро- нумерованную последовательность соотношений независимо от того, содержат ли они уравнения.
Как приводить и использовать погрешности 27 очевидно нелепо. Погрешность 30 означает, что цифра 5 на третьем месте от начала числа 6051,78 могла быть в действи- действительности равна 2 или 8. Ясно, что последующие цифры 1,7 и 8 вовсе не имеют значения и должны быть округлены. Та- Таким образом, корректная запись B.7) есть измеренная скорость = 6050 ± 30 м/с. B.8) Ясно, что общее правило выражается следующим образом: Правило приведения результатов Последняя значащая цифра в любом приводимом результате обычно должна быть того же порядка величины (находиться в той же десятичной пози- позиции), что и погрешность. B.9) Например, результат 92,81 с погрешностью 0,3 должен быть округлен до 92,8 ± 0,3. Если же ошибка равна 3, то тот же результат следует пред- представить как 93 ±3, а если ошибка равна 30, то как 90 ± 30. Однако используемые в расчетах числа должны, как пра- правило, содержать на одну значащую цифру больше, чем это оправдано. Это уменьшит неточности, возникающие при округ- округлении чисел. В конце расчета окончательный ответ следует округлить и избавиться от этой добавочной (и незначащей) цифры1). Заметим, что погрешность в любой измеренной величине имеет ту же размерность, что и сама измеренная величина. Следовательно, будет понятнее и более экономно писать еди- единицы измерения (м/с2, см2 и т. д.) после результата и погреш- погрешности, как в выражениях B.6) и B.8). Подобным же образом, если измеренное число настолько велико или мало, что оно ') Имеется еще одно небольшое исключение из правила B.9): если первая цифра в погрешности мала A или 2), то может быть более пра- правильным сохранить одну дополнительную цифру в конечном результате. Например, такая запись, как измеренная длина = 27,6 ± 1 см, вполне приемлема, поскольку, как можно показать, ее округление до 28 ± 1 см означало бы потерю информации.
28 Глава 2 требует «научной записи» (т. е. использования формы 3-Ю3 вместо 3000), то проще и нагляднее приводить результат и погрешность в одинаковом виде. Например, результат измеренный заряд = A,61 ± 0,05) • 10~19 Кл гораздо проще прочитать и понять в такой форме записи, чем в виде измеренный заряд = 1,61 • 10~19 ± 5 ¦ 10~21 Кл. 2.3. Различие Прежде чем обратиться к вопросу о том, как использовать ошибки в экспериментальных отчетах, необходимо ввести и определить несколько важных терминов. Во-первых, если два измерения одной и той же величины различаются, то мы бу- будем говорить, что между ними имеется различие. Численно определим различие между двумя измерениями как их раз- разность: различие = разность между двумя измеренными значениями одной и той же величины. B.10) Важно иметь в виду, что различие может быть значимым или незначимым. Если два студента измеряют одно и то же сопротивление и получают результаты 40 ±5 Ом и 42 + 8 Ом, то различие в 2 Ом меньше, чем погрешности их результа- результатов, так что два эти измерения, очевидно, согласуются. В этом случае мы бы сказали, что различие является незначимым, С другой стороны, если бы два результата были 35 ± 2 Ом и 45 ± 1 Ом, то оказалось бы, что два измерения явно расходятся, и разли- различие в 10 Ом было бы значимым. В этом случае требуется ряд тщательных проверок, чтобы обнаружить, какой из результа- результатов является неверным. В учебной лаборатории часто измеряют величины (такие, как скорость света с или заряд электрона е), которые прежде много раз тщательно измерялись и для которых очень точное
Как приводить и использовать погрешности 29 принятое значение известно и опубликовано в учебниках. Это принятое значение, конечно, не является абсолютно точным; ¦оно представляет собой результат измерений и, подобно всем экспериментальным результатам, обладает некоторой погреш- погрешностью. Тем не менее в большинстве случаев принятое значе- значение намного точнее того, которое студент может получить сам. Например, принятое значение величины скорости света сесть (принятое значение с) = 299 792 458 ± 1 м/с. B.11) Как ожидалось, этот результат имеет погрешность, но она исключительно мала по стандартам большинства учебных ла- лабораторий '). Хотя имеется много экспериментов, в которых измеряют величины, принятые значения которых известны, тем не менее лишь в небольшом числе случаев известен «истинный ответ»2). Фактически истинное значение измеряемой величины никогда не может быть точно известно, и его в действительности труд- трудно определить. Однако иногда полезно обсуждать разницу между измеренным значением и соответствующим истинным значением, и некоторые авторы называют эту разницу истин- истинной ошибкой. 2А. Сравнение измеренного и принятого значений Мало смысла в выполнении эксперимента, если из него не делается какого-либо вывода. Лишь очень небольшое число экспериментов имеет целью главным образом качественный результат — наблюдение интерференционной картины на по- поверхности кюветы с водой или наблюдение цвета светового луча, прошедшего через некоторую оптическую систему, — в то время как огромное большинство экспериментов приводит к количественным выводам, т. е. к утверждению численных результатов. Поэтому важно осознать, что не представляет никакого интереса результат, представленный в виде един- единственного измеренного значения. Утверждения, подобные тому, что для плотности некоторого металла измерения дали ') Однако так бывает не всегда. Например, если кто-то определяет показатель преломления стекла, то может получать значения в интервале. от 1,5 до 1,9 в зависимости от состава стекла. Следовательно, в экспери- эксперименте по определению показателя преломления стекла, состав которого неизвестен, «принятое» значение есть не более чем грубый ориентир к ожидаемому результату. 2) Так как читатель может быть в затруднении придумать любой та- такой эксперимент, приведем пример. Если кто-то измеряет отношение длины окружности к ее диаметру, то истинный ответ есть точно л. Очевидно, та- такие эксперименты очень надуманны.
30 Глава 2 9,3 ± 0,2 г/см3 или что для импульса тележки измерения дали 0,051 ± 0,004 кг-м/с, сами по себе не интересны. В выводе, представляющем интерес, должны сравниваться два или бо- более значений: измеренное и принятое значения; результат из- измерения и теоретически предсказанное значение или резуль- результаты нескольких измерений, чтобы было видно, в каком отно- отношении друг к другу они находятся в соответствии с некото- некоторым физическим законом. Именно при таком сравнении чисел особенно важна теория ошибок. В этом и двух последующих разделах мы обсудим три типичных эксперимента, чтобы про- проиллюстрировать, как используются погрешности при получе- получении выводов из эксперимента. По-видимому, простейший тип эксперимента — измерение величины, принятое значение которой известно. Как мы уже обсуждали, это несколько искусственный, характерный для учебной лаборатории, эксперимент. В нем измеряют величину, оценивают экспериментальные погрешности и, наконец, срав- сравнивают их с принятым значением. Например, эксперимент по определению скорости звука в воздухе (при нормальных тем- температуре и давлении) мог бы привести к выводу, что измеренная скорость = 329 ± 5 м/с B.12) сравнивается с выражением принятая скорость = 331 м/с. B.13) Этот численный вывод студент мог бы, вероятно, прокоммен- прокомментировать тем, что поскольку принятое значение скорости ле- лежит внутри полученного им интервала скоростей, то измере- измерение было удовлетворительным, на чем его отчет мог бы и за- закончиться. Смысл погрешности 8х заключается в том, что правильное значение х, «вероятно», лежит между х„анл— 8х и хнанл + 8х, и, конечно, возможно, что правильное значение слегка выхо- выходит за рамки этого интервала. Следовательно, измерение можно рассматривать как удовлетворительное, даже если при- принятое значение слегка выходит за рамки измеренного интер- интервала. Например, измеренное значение 325 + 5 м/с можно счи- считать совместимым с принятым значением 331 м/с. С другой стороны, если принятое значение выходит далеко за рамки измеренного интервала (скажем, различие намного больше, чем удвоенная погрешность), то имеются основания полагать, что где-то допущена ошибка. Таким образом, незадачливый студент, который получит измеренная скорость = 345 ± 2 м/с B.14) по сравнению с принятая скорость = 331 м/с, B.15)
Как приводить и использовать погрешности 31 должен проверить свои измерения и расчеты, чтобы обнару- обнаружить допущенные огрехи. К сожалению, очень сложно проследить появление его ошибки, так как существует множество разных возможностей. Он мог допустить ошибку в измерениях или расчетах, которые привели к результату 345 м/с. Он мог неправильно оценить погрешность своего эксперимента. (Результат 345+10 м/с был бы вполне приемлемым.) Он мог сравнивать свои изме- измерения с ошибочным принятым значением. Например, принятое значение 331 м/с есть скорость звука при нормальных темпе- температуре и давлении. Так как нормальная температура равна 0°С, то вполне вероятно, что измеренная скорость в B.14) получена не при нормальной температуре. На самом деле, если измерение было выполнено при 20 °С (т. е. при обычной комнатной температуре), то правильное принятое значение для скорости звука составит 343 м/с и результат измерения окажется вполне приемлемым. Наконец (и, возможно, наиболее вероятно), различие, по- подобное полученному между B.14) и B.15), может указывать на некоторый необнаруженный источник систематической по- погрешности (как в случае секундомера, ход которого быстрее нормального, что обсуждалось в гл. 1). Обнаружение таких систематических погрешностей (которые изменяют результат в одном направлении) потребует тщательной проверки калиб- калибровки всех приборов и детального рассмотрения всех про- процессов. 2.5. Сравнение двух измеренных значений Во многих экспериментах измеряют два значения, которые, согласно теории, должны быть равны. Например, закон сохра- сохранения импульса утверждает, что полный импульс изолирован- изолированной системы есть величина постоянная. Чтобы проверить это, мы могли бы выполнить серию экспериментов с двумя тележ- тележками, которые могут сталкиваться при движении без трения по скамье. Мы могли бы измерить полный импульс двух теле- тележек перед столкновением (р) и после столкновения (р') и за- затем проверить, выполняется ли равенство р = р' в пределах экспериментальных погрешностей. Для одной пары измерений наши результаты могли бы иметь вид начальный импульс р= 1,49 ± 0,04 кг • м/с и конечный импульс р'= 1,56 ± 0,06 кг • м/с. В этом случае интервал, в котором, возможно, лежит р (от 1,45 до 1,53), перекрывается с интервалом, в котором, воз-
32 Глава 2 Таблица 2.1. Измеренные импульсы (в кг • м/с) Начальный Конечный импульс р (±0,04) нмпульс р' (±0,06) Начальный Конечный импульс р (±0,04) импульс р' (±0,06) 1,49 1,56 2,10 2,12 1,16 1,06 и т. д. и т. д. можно, лежит р' (от 1,50 до 1,62). Следовательно, это измере- измерение находится в согласии с законом сохранения импульса. Если бы, с другой стороны, оказалось, что два вероятных ин- интервала даже не близки к тому, чтобы перекрываться, то из- измерение не находилось бы в согласии с законом сохранения импульса и мы должны были бы искать ошибки в наших из- измерениях или расчетах, определять возможные систематиче- систематические погрешности и проверять возможность того, что какие-то внешние силы (такие, как сила тйжести или трения) изме- изменяют импульс системы. Предположим, что мы повторяем подобные пары измере- измерений несколько раз. Каков лучший способ представить наши результаты? Во-первых, почти всегда удобнее всего предста- представить последовательность подобных измерений в виде таблицы, а не как отдельные результаты. Во-вторых, наша погрешность часто очень мало изменяется от одного измерения к другому. Например, мы могли бы принять, что погрешность во всех из- измерениях начального импульса р есть Ьр « 0,04 кг- м/с и что ошибка конечного импульса р' есть Ьр' « 0,06 кг -м/с. В этом случае хороший способ представить наши измерения был бы такой, как показано в табл. 2.1. Для каждой пары измерений вероятный интервал значений р перекрывается (или почти перекрывается) с интервалом значений р'. Если бы это оста- оставалось верным для всех измерений, то мы могли бы считать, что наши результаты согласуются с законом сохранения им- импульса. Немного поразмыслив, мы могли бы представить наши ре- результаты в виде, который сделает наш вывод даже яснее. На- Например, закон сохранения импульса требует, чтобы разность р — р' была равна нулю. Если бы мы добавили в нашу таб- таблицу столбец со значениями р — р', то в любом месте этого столбца стояли бы величины, не отличающиеся от нуля. Един- Единственная трудность здесь заключается в том, что мы должнц знать, как рассчитать погрешность для разности р — р'. Hq это можно легко сделать. Предположим, что мы произвели измерения и получили (измеренное значение р) = рнанл ± Ьр
Как приводить и использовать погрешности 33 (измеренное значение р') — р'лшп±Ьр'. Числа рнаил и р^аил — наши наилучшие оценки для р и р'. Следовательно, наилучшая оценка для разности (р — р') есть (Рнаил — Рнаил)- Чтобы НаЙТИ ПОГреШНОСТЬ В (р — р'), МЫ должны определить наибольшее и наименьшее вероятные зна- значения величины (р — р'). Наибольшее значение величины (р— р') получилось бы, если бы величина р имела наиболь- наибольшее вероятное значение рНаил + 8р и в то же время р' имела наименьшее вероятное значение р'нанл — Ьр'. Таким образом, наибольшее вероятное значение р — р' есть наибольшее вероятное значение = (рнаил — Р,'анл) + (бр + бр')- B.16) Аналогично наименьшее вероятное значение получается, когда величина р минимальна (рНаил— бр), а р' — максимальна (Далл+бР> ЭТО ДаеТ наименьшее вероятное значение = (рнаил — р„аил) — (бр + бр'). B.17) Сопоставляя B.16) и B.17), мы видим, что погрешность в разности (р — р') есть сумма бр + бр' начальных погрешно- погрешностей. Например, если р= 1,49 ±0,04 кг • м/с и р'= 1,56 ±0,06 кг- м/с, р — р' = —0,07 ±0,1 кг • м/с. то Затем мы можем добавить лишний столбец для р — р' в табл. 2.1 и получить табл. 2.2. Теперь можно с первого взгляда определить, находятся ли наши результаты в согласии с законом сохранения импульса, проверяя, согласуются ли с нулем числа в последнем столбце (т. е. меньше ли они или сравнимы с погрешностью 0,1). Таблица 2.2. Измеренные импульсы (в кг -м/с) Начальный импульс р ±0.04) Конечный „ импульс р' Pa3H?c,Tbn,v (±0,06) Р-Р' (±0'!> Начальный Конечный нмпульс р импульс в' газность (±0,04) (±0,06) Р-Р' (±0.1) 1,49 2,10 1,66 2,12 —0,07 —0,02 1,16 и т.д. 1,05 и т.д. 0,11 и т.д.
34 Глава 2 Другим способом получения того же эффекта было бы табули- табулирование отношений р'/р, которые должны быть в согласии с ве- величиной р'1р=\. (В этом случае мы были бы вынуждены рассчитать погрешность в р'/р; эту проблему мы рассмотрим в гл. 3.) Наш вывод погрешности в р— р', очевидно, применим к разности любых двух измеренных чисел. Таким образом, мы установили следующее общее правило: Погрешность разности Если величины х и у измерены с погреш- погрешностями Ьх и Ьу и если измеренные значе- значения х и у используются для расчета раз- разности q = х — у, то погрешность в q есть сумма погрешностей в х и у: bq « Ьх~\- Ьу. B.18) Мы использовали знак приближенного равенства («), чтобы подчеркнуть два момента. Во-первых, у нас до сих пор нет точного определения погрешностей, с которыми мы имеем дело, так что было бы абсурдом утверждать, что 8q точно равняется 8х-\-8у. Во-вторых, в разд. 3.4 мы увидим, что погрешность bq часто несколько меньше, чем дает B.18); луч- лучшая оценка — это так называемая «квадратичная сумма» Ьх и Ьу, определенная в C.13). Таким образом, знак «»» в B.18) использован как напоминание о том, что мы позднее заменим B.18) лучшей оценкой. Результат B.18) — первый в серии правил вычисления погрешностей в случае косвенных измерений 1). Когда мы рас- рассчитаем величину q в единицах измеренных величин х и у, нам нужно будет узнать, как погрешности в х и у «распро- «распространяются» и приводят к погрешности в q. В гл. 3 детально обсуждается проблема расчета погрешностей в случае кос- косвенных измерений. 2.6. Проверка пропорциональности с помощью графика Многие физические закономерности предполагают, что одна величина должна быть пропорциональна другой. Закон ') Автор использует термин «propagation of errors», что иногда пере- переводится как «распространение ошибок». Однако в литературе на русском языке для этого выражения принята терминология «вычисление ошибок ¦в случае косвенных измерений». — Прим. перев.
Как приводить и использовать погрешности 35 Гука утверждает, что растяжение пружины пропорционально силе, растягивающей ее; согласно закону Ньютона, ускоре- ускорение тела пропорционально полной приложенной силе, и это только два из бесчисленного множества примеров. Многие эксперименты в учебной лаборатории организованы так, чтобы проверять этот вид пропорциональности. Когда одна величина у пропорциональна некоторой дру- другой х, то график зависимости у от х есть прямая линия, про- проходящая через начало координат. Таким образом, можно про- проверить пропорциональность у и х, если нанести измеренные значения у для данных х и посмотреть, лежат ли в действи- действительности полученные точки на прямой линии, проходящей через начало координат. Поскольку прямая линия очень легко распознается, то такой путь является простейшим и эффектив- эффективным способом проверки пропорциональности. Чтобы проиллюстрировать такое использование графиков, представим себе эксперимент по проверке закона Гука. Этот закон, обычно записываемый в виде F = kx, утверждает, что растяжение пружины х пропорционально силе F, которая ее растягивает, т. е. х = F/k, где k есть коэффициент упругости пружины. Простой способ проверки этого закона —¦ повесить пружину вертикально и подвешивать к ней различные массы т. В этом случае сила F есть вес груза mg, так что растяже- растяжение равно Растяжение х должно быть пропорционально нагрузке т, и график х от т должен представлять прямую линию, прохо- проходящую через начало координат. Если мы будем измерять х для набора различных грузов т и откладывать на графике эту зависимость х от т, то в высшей степени невероятно, чтобы измеренные значения в точности легли на прямую линию. Предположим, например, что мы измеряем растяжение х для восьми различных грузов m и получаем результаты, представленные в табл. 2.3. Эти значения приведены на рис. 2.1, а, где мы также начертили возможную прямую линию, которая проходит через начало координат и примерно одинаково близка ко всем восьми точ- точкам. Как и ожидалось, восемь точек не лежат точно на одной Таблица 2.3. Нагрузка н растяжение Нагрузка от, г {6т пре- 200 330 400 600 600 700 800 900 небрежимо мало) Растяжение х, см (±0,3) 1,1 1,5 1,9 2,8 3,4 3,5 4,6 5,4
36 Глава 2 а 5оо woo /77, г а 5 I VI о woo т, г 500' т, г в WOO Рис. 2.1. Три графика, на которых изображена зависимость растяжения х пружины от нагрузки т. а — данные табл 2 3 без черточек ошибок; б — те же данные с черточками оши- ошибок, которые показывают погрешности в х. (Погрешности в т предполагаются пре-> небрежимо малыми.) Эти данные находятся в согласии с ожидаемой пропорцио- пропорциональностью х и т; в — другой набор данных, который ие подтверждает пропор- пропорциональность хит. прямой. Возникает вопрос, обусловлено ли это эксперимен- экспериментальными погрешностями (как хотелось бы надеяться), или же мы наделали ошибок, а может быть, даже растяжение х не пропорционально т. Чтобы выяснить это, мы должны рассмотреть наши погрешности. Естественно, что измеренные значения растяжения х и массы т подвержены некоторым погрешностям. Для простоты предположим сначала, что массы известны с очень высокой точностью, так что погрешность в т пренебрежимо мала.
Как приводить и использовать погрешности 37 •С другой стороны, предположим, что все измерения х имеют погрешность порядка 0,3 см (как показано в табл. 2.3). На- Например, для груза в 200 г растяжение, вероятно, будет нахо- находиться где-то в интервале 1,1 + 0,3 см. Наша первая экспе- экспериментальная точка ляжет на вертикальную линию т = 200 г в середине интервала между х — 0,8 и х=1,4 см. Это ото- отображено на рис. 2.1,6, где мы представили вертикальными черточками ошибок интервалы, в пределах которых вероятно лежит каждое значение. В данном случае мы сможем найти прямую, проходящую через начало координат и через чер- черточки ошибок или вблизи них. На рис. 2.1,6 приведена по- подобная прямая; таким образом, мы могли бы сделать вывод, что данные, на основании которых построен рис. 2.1,6, нахо- находятся в согласии с пропорциональностью между х и т. Мы видели из уравнения B.19), что наклон графика за- зависимости х от т есть g/k. Измеряя наклон прямой на рис. 2.1,6, можно найти коэффициент упругости пружины k. Проводя возможно более крутую и более пологую линии, ко- которые все еще хорошо отображали бы экспериментальные данные, мы могли бы также найти погрешность для этого значения k (см.задачу 2.8). Если бы наилучшая прямая проходила в стороне от боль- большой доли черточек ошибок или на слишком большом расстоя- расстоянии от некоторых из них (по сравнению с длиной интервала ошибок), то наши результаты не согласовались бы с пропор- пропорциональностью между х и т. Этот случай отображен на рис. 2.1,в. Результаты, представленные на этом графике, та- таковы, что мы должны были бы перепроверить наши измере- измерения и вычисления (включая расчет погрешностей) и поду- подумать, нет ли оснований к тому, что величина t может быть не пропорциональной т. До сих пор мы предполагали, что погрешность в массе ^значения которой откладываются по горизонтальной оси} X — а- /77 Рис. 2.2. Изображение результатов измерений с учетом погрешностей в х и т в виде крестиков, составленных из одной черточки ошибок для х И одной — для т.
38 Глава 2 ничтожна, а все погрешности могут содержаться только в хг что отображено вертикальными черточками ошибок. Для слу- случая, когда как х, так и т подвержены заметным погрешно стям, имеются различные способы отобразить их. Простейший состоит в том, чтобы начертить как вертикальные, так и го- горизонтальные черточки ошибок в каждой точке, причем длина половины каждой черточки должна равняться соответствую- соответствующей погрешности, как показано на рис. 2.2. Каждый крест на этом графике соответствует одному измерению х и т, при- причем х, вероятно, лежит в интервале, определенном вертикаль- вертикальной чертой креста, а т, вероятно, в интервале, определенном горизонтальной чертой. Несколько более сложная ситуация возникает тогда, когда ожидается, что одна физическая величина пропорциональна некоторой степени другой. Рассмотрим путь х, пройденный телом за время t при свободном падении. Этот путь равен х = l/2gt2 и пропорционален квадрату t. Если графически представить зависимость х от t, то экспериментальные точки должны лечь на параболу. Однако визуально трудно прове- проверить, лежат ли точки на параболе (или на любой другой кри- кривой, кроме прямой линии). Намного проще проследить зави- зависимость х ~ t2, когда график зависимости х от t2 должен представлять собой прямую линию, проходящую через начало координат, и такой график позволит проверить, согласуются ли данные с прямой линией так же, как в предыдущем при- примере. Аналогично если величина х пропорциональна экспонен- экспоненциальной функции eAt (где А — некоторая постоянная), то график зависимости \пх от t должен представлять собой пря- прямую линию, и такой график легко позволит проверить про- пропорциональность х -~ eAt. (Этот вопрос мы обсудим в гл. 8.) Имеются другие, неграфические, методы проверки пропор- пропорциональности двух величин. Например, если х ~ т, то отно- отношение х/т должно быть постоянным. Можно было бы просто добавить к таблице значений х и т один дополнительный ряд или столбец, показывающий отношения х/т, и таким образом легко проверить, остаются ли эти отношения постоянными в пределах их погрешностей. Другой способ — с помощью про- программируемого калькулятора просчитать специально написан- написанную программу, что позволит автоматически проверить, на- насколько хорошо совокупность измерений согласуется с пря- прямой линией. Однако даже в случае применения каких-либо других способов проверки пропорциональности х ~ т весьма желательно было бы воспользоваться также и графическим методом. Графики, подобные изображенным на рис. 2.1,6 и в, ясно показывают, насколько хорошо предсказания подтверж- подтверждаются измерениями; вычерчивание таких графиков помогает понять эксперимент и связанные с ним физические законы.
Как приводить и использовать погрешности 39 2.7. Относительные погрешности Погрешность Ьх в измерении (измеренное значение х) = хиаил ± Ьх показывает надежность или точность измерения. Однако по- погрешность сама по себе не раскрывает всей картины. Погреш- Погрешность в 1 см для расстояния 1 км означала бы необычайно точное измерение, в то время как погрешность в 1 см для расстояния в 3 см означала бы лишь грубую оценку. Оче- Очевидно, что качество измерения характеризуется не только са- самой погрешностью Ьх, но также и отношением Ьх к хНаил, и это обстоятельство заставляет нас рассматривать относитель- относительную погрешность B.20) (Относительная погрешность также называется точностью.) В этом определении символ 1хнаил| обозначает абсолютную величину1) хнаил. Чтобы избежать недоразумений с относительной погреш- погрешностью, саму погрешность Ьх иногда называют абсолютной погрешностью. В большинстве серьезных измерений погрешность Ьх на- намного меньше измеряемой величины хнаил. Поскольку при этом относительная погрешность бх/|хнаил| представляет собой обычно малое число, часто удобно умножать ее на 100 и при- приводить как погрешность в процентах. Например, результат измерения длина / = 50±1 см B-21) имеет относительную погрешность Т7^-1- = 4 = 0,02 I'наил I ои относительная погрешность = ') Абсолютная величина \х\ числа х равна самому числу х, если х — по- положительная величина, и получается отбрасыванием знака минус, если х — отрицательная величина. Мы использовали абсолютную величину в B.20), чтобы гарантировать, что относительная погрешность, подобно самой погрешности Ьх, всегда положительна независимо от того, положительна или отрицательна величина хнаил. На практике обычно делается так, чтобы измеряемые числа были положительными, и в этом случае знак абсолютно- абсолютного значения в B.20) может быть опущеи.
40 Глава 2 и погрешность, выраженную в процентах, 2%. Таким образом, результат B.21) мог быть представлен как длина / = 50 см ±2 %. Следует обратить внимание на то, что, в то время как абсо- абсолютная погрешность б/ измеряется в тех же единицах, что и /, относительная погрешность 6//|/Наил| является безразмер- безразмерной величиной. Учет этого различия поможет вам избежать обычных ошибок, когда путают абсолютную погрешность с от- относительной. Относительная погрешность приближенно характеризует качество измерений независимо от значения измеряемой ве- величины. Относительная погрешность в 10% или около того — это обычно характеристика довольно грубых измерений. (Гру- (Грубое измерение 10 см могло бы иметь погрешность в 1 см; грубое измерение 10 км могло бы иметь погрешность в 1 км.) Относительная погрешность в 1 или 2% характеризует уже довольно точные измерения, и это, пожалуй, лучшее, на что можно надеяться во многих экспериментах, выполняемых в учебной физической лаборатории. Относительных погрешно- погрешностей, значительно меньших 1 %, обычно трудно добиться, и они редки в учебной лаборатории. Эти оценки, конечно, весьма условны; при некоторых чрез- чрезвычайно простых измерениях без труда можно получить от- относительную погрешность в 0,1%- С хорошей рулеткой рас- расстояние в 3 м легко измерить с погрешностью в 0,3 см, или приблизительно 0,1%, с хорошими часами отрезок времени в один час легко измерить с погрешностью меньшей, чем секун- секунда, или 0,03%- С другой стороны, для многих величин, кото- которые очень трудно измерить, погрешность в 10% рассматрива- рассматривалась бы как экспериментальный триумф. Следовательно, боль- большая относительная погрешность не означает, что измерение в научном смысле бесполезно. Многие важные измерения в ис- истории физики имели экспериментальные погрешности 10% или более. В учебной физической лаборатории с оборудова- оборудованием, которое позволяет получать результаты с минимальной погрешностью порядка нескольких процентов, можно изучать многие интересные физические закономерности. 2.8. Значащие цифры и относительные погрешности Концепция относительной погрешности тесно связана с обычным понятием значащих цифр. Действительно, число зна- значащих цифр в численном значении какой-то величины прибли-
Как приводить и использовать погрешности 41 Таблица 2.4. Приблизительное соответствие между значащими цифрами и относительной погрешностью Соответствующая относительная погрешность Число значащих цифр или очень приближенно лежит между равна 1 5 и 50% 10% 2 0,5 и 5% 1% 3 0,05 и 0,5% 0,1% женно указывает на относительную погрешность этого значе- значения. Например, рассмотрим два числа 510 и 0,51, точность которых до двух значащих цифр удостоверена. По- Поскольку число 510 (с двумя значащими цифрами) означает 510 ± 5, или 510 ± 1 %, и 0,51 означает 0,51 ±0,005, или 0,51 ± 1 %, то мы видим, что оба числа определены с точностью до 1 %• Другими словами, утверждение, что числа 510 и 0,51 имеют две значащие цифры, эквивалентно высказыванию, что они определены с точностью до 1 %. Аналогично число 510 с тремя значащими цифрами характеризовалось бы относительной по- погрешностью 0,1% и т. д. К сожалению, это полезное соответствие является лишь приблизительным. Число ПО, данное с двумя значащими циф- цифрами, означает ПО ±5, или 110±5%, в то время как число 910 (тоже с двумя значащими цифрами) означает 910 ± 5, или 910 + 0,5%. Мы видим, что относительная погрешность, связанная с двумя значащими цифрами, изменяется от 0,5 до 5% в зависимости от первой цифры рассматриваемого числа. Итог наших рас- рассуждений отражен в табл. 2.4. 2.9. Умножение двух измеренных значений Пожалуй, наиболее важная особенность в понятии отно- относительной погрешности проявляется при умножении измерен- измеренных значений друг на друга. Например, чтобы найти импульс тела, мы могли бы измерить его массу т и скорость v, затем
42 Глава 2 перемножить их и получить импульс р = mv. Обе величины т и v обладают погрешностями, которые мы должны будем оценить. Затем возникнет задача найти погрешность в р, ко- которая является следствием известных погрешностей в т и v. Во-первых, для удобства запишем число в стандартном виде (измеренное значение х) = хпашл ± Ьх и, используя понятие относительной погрешности, (измеренное значение *) = янаилA ± -.—-—г). B.22) V I хнаил | ) Например, если относительная погрешность составляет 3%> то, следуя B.22), имеем 1 ± -щ)> т. е. погрешность в 3 % означает, что х, вероятно, лежит где-то между значениями хНаил, умноженным на 0,97, и хнаял, умно- умноженным на 1,03, т. е. @,97) • хнаил < х < A,03) • хнанл. Мы увидим, что это полезная форма представления числа, которое мы собираемся умножать. Вернемся теперь к нашей задаче вычисления р = mv, когда т и v были измерены как (измеренное значение т) = тнаилA ± -:—^—г) B.23) V | /«наил I / И (измеренное значение v) = vaaaA\ ± -,——г). B.24) V I °наил I / Поскольку тнаил и инаил — наши наилучшие оценки для т и vy то наилучшая оценка для р = mv есть Рнаил = (наилучшая оценка для р) = тнаилонаил. Наибольшие вероятные значения т и v даются выражениями B.23) и B.24) со знаком плюс. Таким образом, наибольшее вероятное значение для р = mv есть (наибольшее значение р)=тнанлунаил A +|ОТн^д|) (! B.25) Наименьшее вероятное значение для р дается аналогичным выражением с двумя знаками минус. Теперь результат произ- произведения скобок в B.25) может быть представлен как
Как приводить и использовать погрешности 43 Поскольку две относительные погрешности 8т/\тиаял\ и 6и/|уНаил| — малые числа (возможно, порядка нескольких про- процентов), то их произведение очень мало. Следовательно, по- последним членом в B.26) можно пренебречь. Возвращаясь к B.25), мы получаем (наибольшее значение р) = /пнавлунаил A + i m Ш , + , " ¦ V V I наил I I ^иаил I / Наименьшее вероятное значение дается аналогичным выраже- выражением с двумя знаками минус. Наши измерения т и v приво- приводят, следовательно, к значению р = mv, определяемому выра- выражением (значение р) = тнаилинанлA ±[,m|+i.."|l)- V L I ОТнаил I |Рнаил1-1/ Сравнивая это выражение с общей формой записи (значение рааал) = разал (l ± ¦ р А, МЫ ВИДИМ, ЧТО Наилучшая Оценка ДЛЯ р еСТЬ Рнаил = /ПнаилУнаил (как нам уже известно) и что относительная погрешность р равна сумме относительных погрешностей m и v: Ьр Ьпг , &v I Рпанл I I Наил I I анаил I Если, например, у нас были следующие измеренные значе- значения для m и у: /п = 0,53 ±0,01 кг и и = 9,1 ±0,3 м/с, то наилучшая оценка для р = ту равна Рнаил = тнаилУнаил'= @,53) • (9,1) = 4,82 КГ • м/с. Чтобы рассчитать погрешность в р, мы сначала вычислим от- относительные погрешности 6т _ 0,01 _ п п9 _ о о/ ¦ — 7Гк7 — O,UZ = Z % I /Инаил I И ¦ t q | ¦—- \Jf\JO О /Q I ^нэнл I a>i Относительная погрешность в р есть сумма = 2 %-\-Ъ% =5 %
44 Глава 2 Если мы захотим узнать абсолютную погрешность в р, необ- необходимо умножить полученное число на рНаиЛ: Ьр = - • рнаил = 0,05 • 4,82 = 0,241. Затем, округляя бр и рНаил, получаем окончательный ответ (значение р) — 4,8 ± 0,2 кг • м/с. Предыдущее рассмотрение применимо к любому произве- произведению двух измеренных величин. Таким образом, мы полу- получили второе общее правило для косвенных измерений. Если мы измеряем две величины и ищем их произведение, то по- погрешности в исходных двух величинах «распространяются» и образуют погрешность в их произведении. Эта погрешность дается следующим правилом: Погрешность в произведении Если величины х и у измерены с малыми относительными погрешностями 6*/|л:наил| и б(//|уНаил| и если измеренные величины х и у используются для вычисления произве- произведения q — ху, то относительная погреш- погрешность q равна сумме относительных погреш- погрешностей х и у: <7наил B.27) Мы использовали знак приближенного равенства в B.27), поскольку, как и в случае правила вычисления погрешности для разности, мы позже заменим B.27) более точным пра- правилом. Следует подчеркнуть также две другие особенности, этого правила. Во-первых, при выводе выражения B.27) пред- предполагалось, что относительные погрешности х и у должны быть достаточно малы, чтобы их произведением можно был» пренебречь. На практике это условие почти всегда выпол- выполняется, так что мы всегда будем его предполагать. Тем не менее следует помнить, что если относительные погрешности ненамного меньше единицы, то правило B.27) неприменимо. Во-вторых, даже если л; и у имеют различную размерность^ то в уравнение B.27) входят безразмерные величины, по- поскольку все относительные погрешности безразмерны. В физике мы постоянно перемножаем числа, поэтому оче- очевидно, что правило B.27) для нахождения погрешности в про- произведении играет важную роль в теории ошибок. В данный момент наша главная цель — подчеркнуть, что погрешность
Как приводить и использовать погрешности 45 любого произведения q = ху наиболее просто выражается через относительные погрешности выражением типа B.27). Задачи Напоминание: звездочка у номера задачи означает, что задача ре- решается или ее ответ приводится в разделе «Ответы» в конце книги. 2.1 (разд 2.1). В гл. 1 плотник представил результаты своего изме- измерения высоты дверного проема в виде утвержения, что его наилучшая оценка высоты равна 210 см и что, по его убеждению, высота может составлять величину, лежащую где-то между 205 и 215 см. Перепишите этот результат в стандартной форме хнгпл ± Их. Проделайте то же для измерений, отраженных соотношениями A.1) и A.2) и A.4). *2.2 (разд. 2.2). Перепишите следующие ответы в наиболее наглядном виде с нужным числом значащих цифр: а) измеренная высота = 5,03 ± 0,04329 м; б) измеренное время = 19,5432 ± 1 с; в) измеренный заряд = —3,21 -Ю9 ± 2,67-К)0 Кл; г) измеренная длина волны = 0,000000563 ± 0,00000007 м; д) измеренный импульс = 3,267-103 ± 42 г-см/с. *2.3 (разд. 2.3). а. Студент измеряет плотность жидкости пять раз и получает резуль- результаты (в г/см3): 1,8; 2,0; 2,0; 1,9; 1,8. Что вы могли бы предполо- предположить о наилучшей оценке и погрешности, основываясь на его из- измерениях? б. Ему сказали, что принятое значение равно 1,85 г/см3. Каково раз- различие (между его наилучшей оценкой и принятым значением)? Считаете ли вы его значимым? 2.4 (разд. 2.5). Время десяти оборотов диска проигрывателя изме- измеряется путем фиксирования моментов времени начала и конца вращения при помощи второсортных ручных часов с последующим вычитанием одной величины из другой. Если время начала и время конца вращения имеют погрешность по ±1 с, то какова погрешность времени десяти оборотов? *2.5 (разд. 2.5). В эксперименте по проверке закона сохранения мо- момента импульса студент получил для начального и конечного моментов импульса (L и L') вращающейся системы результаты, представленные а табл. 2.5. Добавьте к табл. 2 5 дополнительный столбец для разности L — V и ее погрешности. Согласуются ли результаты студента с законом сохранения момента импульса? 2.6 (разд. 2.5). Экспериментатор измеряет массы М и т автомобиля и прицепа. Он приводит свои результаты в стандартной форме УИнаил ± ЬШ и т„аил ± 6т. Какова будет его наилучшая оценка для полной массы М + т? Рассматривая наибольшее и наименьшее вероятные значения пол- полной массы, покажите, что его оценка погрешности полной массы равна, Таблица Начальный 3,0±0,3 7,4±0,5 14,3±1 2.5. L Момент импульса Конечный L' 2,7±0,6 8,0±1 16,5±1 (в кг • м/с) Начальный L 25±2 32±2 37±2 Конечный U 24±2 31±2 41±2
46 Глава 2 Таблица 2.6. Значения высоты и скорости Л, м (±0,05) 0,4 0,8 1,4 2,0 7±3 17±3 25±3 38±4 ft, м (±0,05) 2,6 3,4 3,8 о2, м!/с! 45±5 62±5 72±6 сумме ЬМ и 6т. Приводите свои результаты последовательно и аргумен- аргументированно, а не просто записывайте ответ. 2.7 (разд. 2.6). Используя данные задачи 2.5, постройте график зави- зависимости конечного момента импульса L' от начального L для описанного там эксперимента. Нарисуйте вертикальные и горизонтальные черточки ошибок. (Как и при составлении всех графиков, отчетливо разметьте ваши оси, указывая названия величин и единицы измерения. Используйте соответствующую миллиметровую бумагу. Выберите масштаб таким обра- образом, чтобы график заполнял разумную долю площади бумаги и включал начало координат ) На какую кривую, по-вашему, будут ложиться все точки? Лежат ли точки на ожидаемой кривой (с учетом экспериментальных погрешностей) ? *2.8 (разд. 2.7). Если камень бросить вверх со скоростью v, он дол- должен подняться до высоты h, определяемой уравнением у2 = Igh. В част- частности, величина и2 должна быть пропорциональна h. Чтобы проверить это, студент измеряет и2 и h для семи различных бросков и получает резуль- результаты, приведенные в табл. 2.6. а. Постройте график зависимости и2 от h, включая вертикальные и горизонтальные черточки ошибок. (Как обычно, разметьте оси ко- координат, используйте миллиметровую бумагу и разумно выберите масштаб.) Согласуется лн ваш график с предсказанием, что у2 ~ /г? б. Наклон вашего графика должен быть равен 2g. Чтобы найти на- наклон, проведите наилучшую, по вашему мнению, прямую через на- начало координат и все остальные точки и затем определите ее на- наклон. Чтобы найти погрешность в определении наклона, проведите наиболее крутую и наименее крутую прямые, которые еще разумно совпадают с точками. Наклоны этих прямых дадут наибольшее и наименьшее вероятные значения наклона. Согласуются ли ваши ре- результаты с принятым значением 2g = 19,6 м/с2? *2.9 (разд. 2 6). а. В эксперименте с математическим маятником студент решает про- проверить, действительно ли период Т не зависит от амплитуды А (определенной как наибольший угол, ка который отклоняется маят- маятник от вертикали во время его колебаний). Он получает результаты, представленные в табл. 2.7. Постройте график зависимости Г от А. Таблица 2.7. Амплитуда и период колебаний маятника Амплитуда А град Период Г, с Амплитуда А, град Период Г, с 5±2 17±2 25±2 1,932±0,005 1,94±0,01 1,96±0,01 40±4 53±4 67±6 2,01±0,01 2,04±0,01 2,12±0,02
Как приводить и использовать погрешности 47 Обратите внимание на выбор масштаба. Если почувствуете затруд- затруднения, постройте два графика: один, включающий начало координат Л = 0, Г = 0, и второй, на котором показаны только значения Т между 1,9 и 2,2 с. Должен ли студент сделать вывод, что период не зависит от амплитуды? б. Рассмотрите, как изменились бы результаты «а», если бы все изме- измеренные значения Г имели погрешность +0,3 с. 2.10 (разд 2.7). Рассчитайте погрешности в процентах для пяти изме- измерений, приведенных в задаче 2.2 (не забудьте округлить до разумного числа значащих цифр). 2.11 (разд. 2.7). С помощью деревянной линейки можно произвести отсчет с точностью До миллиметра, а с помощью измерительного микро- микроскопа— до 0,1 мм. Предположим, вы хотите измерить длину 2 см с точ- точностью 1 %. Можно ли это сделать с помощью деревянной линейки? А с помощью микроскопа? *2.12 (разд. 2.7). Чтобы рассчитать ускорение тележки, студент изме- измеряет ее начальную и конечную скорости vi и V; и вычисляет разность (vf — Vi). Его данные для двух независимых испытаний (в см/с) приве- приведены в табл. 2 8. Все четыре результата измерения характеризуются по- погрешностью 1 °/о- а. Вычислите абсолютные погрешности всех четырех измерений, най- найдите разность (vt ¦— vt) и ее погрешность для каждого испытания. б. Вычислите погрешность в процентах для каждого из двух значений (vt — vi). (Ваши ответы в этом задании, особенно в случае второго испытания, иллюстрируют отрицательные последствия методики из- измерения малых чисел с помощью разности двух гораздо больших чисел.) 2.13 (разд. 2.8). а. Калькулятор студента показывает результат 123,123. Если студент решил, что это число в действительности имеет только три знача- значащие цифры, оцените, каковы его абсолютная и относительная по- погрешности. б. Сделайте то же для числа 0,123123. в. Сделайте то же для числа 321,321. г. Лежит ли относительная погрешность в интервале, ожидаемом для случая трех значащих цифр? *2.14 (разд. 2 9). а. Студент измеряет две величины а и Ь и получает а= 11,5 ±0,2 см и 6 = 25,4 ± 0,2 см. Затем он вычисляет произведение q = ab. Получите его ответ и приведите абсолютное значение его погреш- погрешности, а также погрешность в процентах. б. Повторите действия задания «а* для измерений а= 10 ±1 см и Ь = 27,2 ± 0,1 с в. Повторите задание «а» для а = 0,8 м ± 8 % и Ь = 1,5 кг ± 2 %. *2.15 (разд. 2 9). а. Студент измеряет два числа х и у и находит а- = 10± 1, г/=20± 1. Какова его наилучшая оценка для произведения q = ху? Исполь- Используя наибольшие вероятные значения для х и у A1 и 21), вычислите Таблица 2.8. Начальные Первое испытание Второе испытание и конечные °г 14,0 19,0 скорости Vf 18,0 19,6
48 Глава 2 наибольшее вероятное значение для q. Аналогично найдите наи- наименьшее вероятное значение q и, следовательно, интервал, в кото- котором, вероятно, лежит q. Сравните ваш результат с тем, что дает правило B.27). б. Сделайте то же для измерений х = 10 ± 8, у — 20 ± 15. Напоминаем: правило B.27) было получено в предположении, что относительные погрешности намного меньше единицы. 2.16 (разд. 2.9). Согласно известному правилу, при перемножении двух чисел результат будет более надежным, если его округлить до ко- количества значащих цифр в наименее точном из двух исходных чисел. а. Используя правило B.27) и тот факт, что значащие цифры опреде- определяют относительную погрешность, докажите, что это «известное правило» приближенно верно. (Для определенности рассмотрите случай, когда наименее точное число имеет две значащие цифры.) б Покажите на примере, что ответ в действительности несколько ме- менее точен, чем дает «известное правило». (Это особенно справедливо при перемножении одинаковых чисел.)
Глава 3 Погрешности в косвенных измерениях Большинство физических величин обычно невозможно из- измерить непосредственно, и их определение включает два раз- различных этапа. Сначала измеряют одну или более величин х, у, ..., которые могут быть непосредственно измерены и с помощью которых можно вычислить интересующую нас вели- величину. Затем, используя измеренные значения х, у, ..., вычис- вычисляют саму искомую величину. Например, чтобы найти пло- площадь прямоугольника, обычно измеряют его длину I и высоту h и затем рассчитывают его площадь А по формуле А = lh. Аналогично наиболее очевидный способ определения скорости v некоторого тела состоит в том, чтобы измерить путь d, прой- пройденный телом, и затраченное на это время t, а затем вычис- вычислить v по формуле v = d/t. Для читателя, проработавшего какое-то время в учебной лаборатории, не составит труда при- привести и другие примеры. Действительно, если хоть немного задуматься, то станет ясно, что почти все важные измерения включают эти два различных этапа, состоящих из простых из- измерений и последующих расчетов. Если измерение включает эти два этапа, то и оценка по- погрешностей также включает их. Сначала надо оценить по- погрешности в величинах, которые измеряются непосредственно, а затем определить, как эти погрешности «распространяются» в расчетах и приводят к погрешности в конечном резуль- результате1). Это «распространение ошибок», или расчет погреш- погрешностей в случае косвенных измерений, составляет главную тему данной главы. Фактически мы уже рассмотрели некоторые примеры рас- расчета погрешностей в случае косвенных измерений в гл. 2. 4) В гл. 4 мы рассмотрим другой способ, с помощью которого иногда вычисляют результирующую погрешность. Если все измерения можно по- повторить несколько раз и если есть уверенность, что все погрешности по природе случайны, то погрешность в интересующей величине можно оце- оценить, исследуя разброс в ответах. Но даже когда этот метод применим, его обычно лучше использовать как проверку двухэтапной процедуры, опи- описанной в этой главе.
50 Глава 3 В разд. 2.5 обсуждался случай, когда измеряются два числа х и у, которые используются для расчета разности q = х— у. Мы нашли, что погрешность в q равна сумме bq « бл: -f- бу погрешностей в х и у. В разд. 2.9 мы рассмотрели произведе- произведение q = ху и в задаче 2.6 предложили рассмотреть сумму q = х + у. Эти случаи обсуждаются также в разд. 3.2. В конце главы мы рассмотрим более общие методы расчета погреш- погрешностей в косвенных измерениях и приведем несколько при- примеров. В разд. 3.1, прежде чем коснуться расчета погрешностей в косвенных измерениях, мы кратко обсудим оценку погреш- погрешностей в величинах, которые измеряются непосредственно. Бу- Будет сделан обзор методов, рассмотренных в гл. 1, и затем рассмотрено еще несколько примеров оценки погрешности в прямых измерениях. Начиная с разд. 3.2, рассматриваются погрешности в кос- косвенных измерениях. Мы обнаружим, что почти все проблемы расчета погрешностей в косвенных измерениях могут быть решены с помощью трех простых правил. Мы сформулируем также единственное, более сложное, правило, которое при- пригодно во всех случаях и из которого могут быть получены три более простых правила. Это довольно длинная глава. Однако читатель может опу- опустить два последних раздела без какой-либо потери непрерыв- непрерывности изложения. 3.1. Погрешности в прямых измерениях Почти все прямые измерения включают считывание со шкалы (например, линейки, часов или вольтметра) или с циф- цифрового табло (например, цифровых часов или цифрового вольтметра). Некоторые проблемы считывания со шкалы уже обсуждались в разд. 1.5. Иногда главными источниками по- погрешностей служат считывание со шкалы и необходимость интерполяции между метками шкалы. В таких ситуациях ра- разумная оценка погрешностей не составляет труда. Например, если кто-то должен измерить некоторую точно определенную длину I при помощи линейки, проградуированной миллиметро- миллиметровыми делениями, то он мог бы вполне разумно решить, что длина может быть измерена до ближайшего миллиметра, и не лучше. В этом случае погрешность б/ составляла бы б/ = 0,5 мм. Если метки шкалы отстоят друг от друга дальше (например, на 5 мм), то экспериментатор вполне разумно мог бы решить, что он может считывать, например, с точ- точностью до одной пятой деления. В любом случае погрешности считывания со шкалы, очевидно, могут быть довольно легко и разумно оценены.
Погрешности в косвенных измерениях 51 Изображение, сфокусированное на экран /Iuhju Лампа на- накаливания Рис. 3.1. Фокусирование изображения лампы накаливания, помещенной справа, на экран, установленный слева. К сожалению, часто имеются другие источники ошибок, которые гораздо более существенны, чем любые трудности, обусловленные считыванием со шкалы. При измерении рас- расстояния между двумя точками главной проблемой может стать определение истинного положения этих точек. Напри- Например, в оптическом эксперименте желательно измерить расстоя- расстояние q от центра линзы до сфокусированного изображения, как показано на рис. 3.1. На практике линза обычно имеет тол- толщину несколько миллиметров, так что определение ее центра вызовет затруднения, а если линза смонтирована в массив- массивной оправе, как эго часто бывает, то определение центра ста- становится еще более сложной задачей. Более того, может ока- оказаться, что изображение будет хорошо сфокусированным на длине порядка многих миллиметров. Даже если вся система смонтирована на оптической скамье, которая проградуиро- вана отчетливыми миллиметровыми делениями, погрешность в расстоянии от линзы до изображения могла бы, следова- следовательно, легко составлять величину порядка сантиметра. По- Поскольку погрешность обусловлена тем, что положение двух представляющих интерес точек точно не определено, то про- проблема такого рода называется проблемой определения. Этот пример указывает на серьезную опасность при оцен- оценке погрешностей. Если смотреть только на шкалу и забыть о других источниках погрешностей, то можно очень сильно не- недооценить полную погрешность. Фактически наиболее частая ошибка начинающего студента — это игнорирование некото- некоторых источников погрешности и, следовательно, недооценка по- погрешностей часто на порядок или более. Однако важно и не переоценивать ошибки. Экспериментатор, который решил бы перестраховаться, приводя избыточные погрешности, может избежать неприятной несогласованности во всех измерениях, но его измерения не будут представлять большого интереса для других. Очевидно, в идеальном случае следовало бы учесть все возможные источники погрешности и аккуратно
52 Глава 3 оценить их влияние, что обычно не так трудно, как может по- показаться. Считывание с цифрового табло легче считывания с обыч- обычной шкалы. Если такой прибор исправен, он показывает толь- только значащие цифры. Цифровые часы, которые показывают се- секунды с двумя знаками после запятой, могли бы показать время t, равное 8,03 с, что означает (в худшем случае), что / = 8,03 ± 0,01 с. В зависимости от того, как устроены часы, погрешность могла бы быть и вдвое меньше, т. е. 8,03 может означать 8,03 ± 0,005. Цифровое табло даже в большей степени, чем обычная шкала, может создать ложное впечатление большой точности. Например, кто-то мог бы использовать цифровые часы для определения времени движения грузов на машине Атвуда или подобном приборе. Если часы показывают три цифры после запятой, то они могут показать время t = 8,036 с, и в этом случае время движения есть / = 8,036 ± 0,001 с. C.1) Однако осторожный студент, который повторяет эксперимент при как можно более идентичных условиях, мог бы найти, что результат второго измерения равен / = 8,13 с. Одно вероятное объяснение этого различия состоит в том, что погрешности в процедуре запуска изменяют начальные условия и, следовательно, время движения. В любом случае ясно, что точность, представленная в C.1), до абсурда хо- хороша. Судя по проделанным до сих пор двум измерениям, бо- более реалистичный результат был бы / = 8,07 ± 0,05 с. Этот пример возвращает нас к другому моменту, упомяну- упомянутому в гл. 1. Если измерения могут быть повторены, их обыч- обычно следует выполнить несколько раз. Получающийся разброс величин часто служит хорошей мерой погрешностей, и сред- среднее измеренных значений всегда более заслуживает доверия, чем результат любого единичного измерения. В гл. 4 и 5 мы коснемся вопросов статистической обработки многократных измерений. Сейчас лишь подчеркнем, что если измерение мож- можно повторить, его следует повторить как для получения более точного результата (при усреднении), так и, что даже более важно, в связи с возможностью оценить погрешности. К со- сожалению, как уже было отмечено в гл. 1, повторение измере- измерений не всегда приводит к обнаружению погрешностей. Если измеряемая величина подвержена некоторым систематиче-
Погрешности в косвенных измерениях 53 ским ошибкам, которые смещают все результаты в одну и ту же сторону (подобно часам, которые отстают), то разброс в результатах не будет отражать этой систематической ошибки. Исключение таких систематических ошибок потребует тща- тщательной проверки калибровки приборов и других процедур. Наконец, имеется еще один, совсем особый тип измерения, для которого погрешности легко могут быть оценены. Некото- Некоторые эксперименты включают счет событий, которые происхо- происходят случайно, но с определенной средней скоростью. Напри- Например, в образце радиоактивного вещества каждое индивиду- индивидуальное ядро распадается в случайный момент времени, но су- существует определенная средняя скорость распада, согласно которой мы бы ожидали увидеть какое-то число распадов в единицу времени, происходящих во всем образце. Мы можем попытаться измерить этот средний темп, наблюдая число рас- распадов, происходящих за определенный временной интервал, например за одну минуту. (Это может быть сделано, напри- например, с помощью счетчика Гейгера, который регистрирует за- заряженные частицы, испускаемые при распаде каждым ядром.) Предположим, мы нашли, что произошло v распадов, пока мы считали их в течение одной минуты. Поскольку распады про- происходят случайным образом, мы не можем быть уверены, что v есть действительно верное среднее число распадов, которое ожидается за одну минуту. Вопрос, конечно, заключается в том, насколько недостоверна величина v как мера ожидаемого среднего числа событий. Теория вопросов, связанных с таким подсчетом, обсуж- обсуждается в гл. 11, но ответ исключительно прост и может быть приведен сейчас. Если мы сосчитаем число событий за время Т и получим в результате v, то в качестве меры ожидаемого среднего числа событий за время Т наш результат v имеет погрешность Vv- Таким образом, наш вывод (основанный на этом одном измерении) следует представить в виде (среднее число событий за время T) — v ± <\Jv . C.2) Например, если бы мы насчитали 15 распадов от образца ра- радиоактивного урана за одну минуту, то могли бы сделать вы- вывод, что в среднем в нашем образце происходит 15 ± л/15, или 15 + 4 распадов в минуту. 3.2. Суммы и разности; произведения и частные До конца этой главы мы будем предполагать, что мы про- провели измерения одной или более величин х, у, ... с соответ- соответствующими погрешностями бх, 8у, ... и что теперь мы хотим по измеренным значениям х, у, ... вычислить величину q, ко-
54 Глава 3 торая нас в действительности интересует. Расчет величины q обычно выполняется непосредственно; проблема, которую мы должны обсудить, заключается в том, каким образом погреш- погрешности 6х, бг/, ..., «распространяясь» через вычисления, приво- приводят к погрешности б<7 косвенных измерений окончательной ве- величины q. Суммы и разности В гл. 2 мы обсуждали, что происходит, когда измеряются две величины х и у и вычисляется их сумма х + у или их разность х — у. Чтобы оценить погрешность как в сумме, так и в разности, мы должны были только определить их наиболь- наибольшие и наименьшие вероятные значения. Наибольшее и наи- наименьшее вероятные значения х равны лгнаил ± бх, а аналогич- аналогичные величины для у равны z/наил ± бг/. Следовательно, наи- наибольшее вероятное значение х-\-у есть и наименьшее вероятное значение 6у). Таким образом, наилучшая оценка для q = х + у есть и ее погрешность тнаил -^наил "Т~ г/наил бд ^ бл; + бг/. C.3) Аналогичные аргументы (вы должны быть уверены, что смо- сможете воспроизвести их) приводят к тому, что погрешность в разности х—у дается той же самой формулой C.3). Таким образом, погрешность как в сумме х\-у, так и в разности х — у представляет собой сумму блг + бг/ погрешностей в х и у. В случае нескольких чисел х, ..., w, которые надо скла- складывать или вычитать, повторные применения C.3) приводят к следующему правилу. х, ..., w изме- изме., бда и исполь- испольПогрешности в суммах и разностях Если несколько величин рены с погрешностями бл:, . зуются для вычисления q = х + ... + z — {и + ... + w), то погрешность в рассчитанной величине q есть сумма bq « 6х + ... + 6z + 6« + ... + dw всех исходных погрешностей. C.4)
Погрешности в косвенных измерениях 55 Другими словами, когда складывают или вычитают любое число измеренных величин, то погрешности этих величин всегда складываются. Как и прежде, мы используем знак «s, чтобы подчеркнуть, что вскоре мы улучшим это правило. Пример В качестве простого примера применения правила C.4) предположим, что экспериментатор смешивает жидкости из двух фляг, предварительно измерив по отдельности- массы этих наполненных и затем пустых фляг и получив в резуль- результате Мх = масса первой фляги и ее содержимого = 540 ± 10 г; тх = масса первой пустой фляги = 72 ± 1 г; М2 = масса второй фляги и ее содержимого = 940 ± 20 г; т2 = масса второй пустой фляги = 97 ± 1 г. Затем он рассчитывает полную массу жидкости как М = М, — тх + М2 — т2 = E40 — 72 + 940 — 97) г = 1311 г. В соответствии с правилом C.4) погрешность в его резуль- результате есть сумма всех четырех погрешностей: 6М « 6Afi + бт! + бЛ12 + бт2 = A0+ 1 +20+ 1)г = 32г. Таким образом, его конечный результат (надлежащим обра- образом округленный) имеет вид полная масса жидкости = 1310 ± 30 г. Заметьте, что существенно меньшие погрешности в массах пустых фляг вносят ничтожную добавку в конечную погреш- погрешность. Это очень важный эффект, который мы обсудим позд- позднее. С опытом студент сможет научиться заранее выявлять те погрешности, которые пренебрежимо малы и поэтому могут быть исключены из рассмотрения. Часто это может очень су- существенно упростить расчет погрешностей. Произведения и частные В разд. 2.9 мы рассмотрели погрешности в произведении q = ху двух измеренных величин. Мы нашли, что при условии малых относительных погрешностей исходных величин относи- относительная погрешность в q = ху есть сумма относительных по- погрешностей в х я у. Вместо того чтобы повторно обсудить вывод этого результата, рассмотрим сейчас подобный же слу- случай частного q = х/у. Как мы увидим, погрешность в частном дается тем же самым правилом, что и для произведения, т. е. относительная погрешность в q = х/у равна сумме относи- относительных погрешностей в х и у.
56 Глава 3 Поскольку погрешности в произведениях и частных наи- наилучшим образом выражаются в терминах относительных по- погрешностей, то удобно для последующего ввести более крат- краткое обозначение. Напомним, что если мы измеряем некото- некоторую величину х как (измеренное значение х) = хааи„ ± бл:, т. е. обычным образом, то относительная погрешность в х определяется как (относительная погрешность в х) — -, г. I -^наил I (Абсолютное значение в знаменателе всегда обеспечивает по- положительность относительной погрешности, даже когда вели- величина Хнаил отрицательна.) Поскольку выражение блг/|лгНаил| неудобно писать и читать, с этого момента мы будем исполь- использовать его сокращенное написание, в котором опустим индекс «наил»: (относительная погрешность в х) = -,—г. Ix I Результат измерения любой величины х может быть выра- выражен через его относительную погрешность бл:/ j л: | как (значение *) = *нанЛA ± 6*/|*|). Следовательно, значение q = х/у может быть переписано как (значение q) = н ил , _,_ . v ч/ Уптл 1 ± &У/\у\ Наша задача теперь — найти экстремальные вероятные зна- значения второго множителя справа. Этот множитель максима- максимален, например, когда числитель равен его наибольшему зна- значению, 1 -\-6х/\х , а знаменатель равен его наименьшему зна- значению, 1 — &у/\у . Таким образом, наибольшее вероятное зна- значение для q = х/у равно (наибольшее значение q)= „наил -:—, ,. f . C.5) #наил 1 — """ " ' Последний множитель в выражении C.5) имеет форму !A_|_а)/A—Ь), где числа о и Ъ обычно малы (т. е. много меньше единицы). Эту форму можно упростить с помощью двух приближений. Во-первых, поскольку число Ь мало, бино- биномиальная теорема') дает ^^l+b. C.6) ') Биномиальная теорема позволяет выразить 1/A — 6) через бесконеч- бесконечный ряд 1+6 + 62 + 6а+ ... . Если 6 много меньше 1, то 1/A—6)» и 1 +(), как в C 6) Читатель, незнакомый с биномиальной теоремой, может найти дополнительные сведения в задаче 3.7»
Погрешности в косвенных измерениях 57 Следовательно, 1 -Ь A + а) A + Ь) = 1 + а + Ь + аЪ да 1 + а + Ь, где в последнем выражении мы пренебрегли произведением двух малых величин ab. Возвращаясь к C.5) и используя эти приближения, мы получаем для наибольшего вероятного зна- значения q = х/у (наибольшее значение q) = *наил ( 1 -|_ _f_ _|_-JL.). У наш ^ 1*1 \ У \ / Аналогичное рассмотрение показывает, что наименьшее ве- вероятное значение дается подобным же выражением с двумя знаками минус. Объединяя эти результаты, находим (з„а,е„„е „ = ^ Сравнивая это выражение со стандартной записью (значение q) = <?наил A ± у^ мы видим, что наилучшее значение q равно qaaail = лгНаил/г/наил, как мы могли бы ожидать, и что относительная погрешность есть Ьх . by км ¦" ui ' 1*1 • CJ) Мы приходим к выводу, что при делении или умножении двух измеренных значений х и у относительная погрешность результата равна сумме относительных погрешностей х и у, как в C.7). Если теперь умножать или делить целый ряд чи- чисел, то повторные применения этого результата приведут нас к следующему общему правилу: Погрешность в произведениях и частных Если несколько величин х, ..., w измерены с малыми погрешностями 6л;, ..., 8w и из- измеренные значения используются для рас- расчета 4 UX---XW jo относительная погрешность рассчитанной величины q равна сумме \я\ \х\ б« + ... +¦ .«| ' ' ' " ' \w\ относительных погрешностей в х, . .., W. C.8)
E8 Глава 3 Итак, при умножении или делении величин относительные по- погрешности складываются. Пример При съемке местности иногда приходится определять не- недоступную непосредственному измерению длину / (такую, как высота большого дерева) при помощи измерений трех дру- других длин 1\, /2, /з, которые дают ,_ hh h " Предположим, что мы выполняем такой эксперимент и полу- получаем результаты (в метрах) /j = 50 ± 0,5; /2= 1,5 ±0,03; 4 = 5,0 + 0,2. Наша наилучшая оценка для / равна , _ 50-1,5 - 'нанл — jj =10 М. В соответствии с C.8) относительная погрешность этого ре- результата равна сумме относительных погрешностей в 1\, 12, /з, которые равны соответственно 1, 2 и 4%. Таким образом, и наш окончательный результат имеет вид / = 15±1 м. Измеренная величина умножается на точное число Два важных частных случая применения правила C,8) за- заслуживают отдельного упоминания. Во-первых, предположим, что мы измеряем величину х и используем ее для вычисления произведения q = Вх, где число В не содержит погрешности. Например, мы могли бы измерять диаметр окружности и за- затем вычислять ее периметр как с = я X d, или мы могли бы измерять толщину Т 100 идентичных листов бумаги и затем определять толщину одного листа как ^ = A/100)Х^- В со- соответствии с правилом C.8) относительная погрешность в q = Вх равна сумме относительных погрешностей для вели- величин В я х. Поскольку 8В = 0, то 6<7 Ьх
Погрешности в косвенных измерениях 59 Умножая на |^| = |Вл;|, мы находим, что 6^ = |В|6л;, т. е. получаем следующее полезное правило: Измеренная величина умножается на точное число Если величина х измеряется с погрешностью Ьх и используется для вычисления произве- произведения q = Bx, в котором В не имеет погрешности, то по- погрешность в q равна \В\, умноженному на погрешность в х: 6q = \B\6x. C.9) Это правило особенно полезно в случае, когда надо изме- измерять что-то необычно малое, но имеющееся в большом коли- количестве, такое, как толщина листа бумаги или время оборота быстро вращающегося колеса. Например, если мы измеряем толщину 7 100 листов бумаги и получаем результат толщина 100 листов = Т = 30 ± 3 мм, то отсюда сразу же вытекает, что толщина t одного листа равна толщина одного листа ==^ = ]ооХ Т = 0,3 ± 0,03 мм. Заметьте, как такой прием (измерение толщины нескольких идентичных листов и последующее деление на число листов) делает легко выполнимым измерение, которое в противном случае потребовало бы довольно сложного оборудования, и приводит также к исключительно малой погрешности. Ко- Конечно, необходима уверенность, что все листы имеют одина- одинаковую толщину. Возведение в степень Второй частный случай правила C.8) касается оценки сте- степени некоторой измеренной величины. Например, мы могли бы измерять скорость v некоторого тела и затем для опреде- определения кинетической энергии A/2) mv2 вычислять и2. Поскольку v2 = v X v, то из C.8) следует, что относительная погреш- погрешность в v2 равна удвоенной относительной погрешности в о.
60 Глава 3 Если обобщить, то из C.8) ясно, что общее правило для лю- любой целой степени будет следующим: Погрешность при возведении в степень Если величина х измеряется с погрешностью 6л; и измеренное значение используется для вычисления степени этого числа то относительная погрешность в q в п раз больше относительной погрешности в х, 6q блг C.10) Наш вывод этого правила требовал, чтобы п было целым и положительным числом. Фактически, однако, правило можно обобщить на случай любых показателей степени п [см. C.26)]. Пример Предположим, что студент определяет ускорение свобод- свободного падения g, измеряя время t падения камня с высоты h. После нескольких измерений времени он находит /=1,6 ±0,1 с и измеряет высоту h как /г=14,1 ±0,1 м. Поскольку h определяется известной формулой h — A/2) gt2, то он вычисляет g как 2А 2 • 14,1 м . , /2 Погрешность этого результата может быть найдена при помощи сформулированного выше правила. Здесь нам необхо- необходимо знать относительные погрешности в каждом из множи- множителей выражения g = 2h/t2, используемого для расчета g. Множитель 2 не содержит погрешности. Относительные по- погрешности в h и t равны 6А 0,1 _ „ _ и Ы 0,1 «on/ -у = —=6,3%. В соответствии с правилом C.10) относительная погрешность в t2 в 2 раза больше, чем в t. Следовательно, применяя пра-
Погрешности в косвенных измерениях 61 вило C.8) для произведений и частных к формуле g = 2h/t2, мы получим для относительной погрешности ^? = ^. + 2-^- = 0,7% +2- F,3%) =13,3%, C.11) и, следовательно, погрешность 1 ^ Ч = (ll м/с2) .iM = i,46 м/с2. Таким образом, окончательный результат нашего студента (необходимым образом округленный) составляет g = 11 ± 1 м/с2. Этот пример показывает, насколько простой часто может быть оценка погрешностей. Отсюда видно также, каким обра- образом теория ошибок не только позволяет оценить величину по- погрешностей, но подсказывает пути их уменьшения. В данном случае из C.11) ясно, что наибольший вклад в погрешность обусловлен измерением времени. Если мы хотим иметь более точное значение g, то необходимо улучшить именно измере- измерение f, любая попытка улучшить измерение h была бы в зна- значительной мере напрасным усилием. 3.3. Независимые погрешности в сумме Правила, которые мы пока нашли, могут быть сформули- сформулированы кратко: когда измеряемые величины складываются или вычитаются, погрешности складываются; когда измеряе- измеряемые величины умножаются или делятся, складываются отно- относительные погрешности. В этом и следующем разделах мы рассмотрим, как при определенных условиях погрешности, рассчитанные на основании этих правил, могут оказаться не- неоправданно большими. Точнее, мы увидим, что если исходные погрешности независимы и случайны, то более реалистичная (и меньшая) оценка окончательной погрешности дается ана- аналогичными правилами, в которых погрешности (или относи- относительные погрешности) складываются квадратично (т. е. в со- соответствии с процедурой, которую мы вскоре определим). Рассмотрим сначала вычисление суммы q = х-\-у двух чисел х я у, которые были измерены обычным образом: (измеренное значение х) = хнаИЛ ± 6л; и аналогично для у. Способ, который использовался в по- последнем разделе, выглядел следующим образом. Во-первых, наилучшая оценка q — х + у есть, очевидно, <7наил = Хнаил + + г/наил- Во-вторых, поскольку наибольшие вероятные значе- значения для х и у равны соответственно лгнаил + бх и г/наил + бг/, то
52 Глава 3 наибольшее вероятное значение величины q есть *.,аил + г/наил + б* + &У- C.12) Аналогично наименьшее вероятное значение q есть ¦*"наил ~Г Уиаил "¦* "У'¦ Отсюда мы делаем вывод, что величина q, вероятно, лежит между этими двумя значениями, и погрешность в q равна 6<7 « Ьх + Ьу. Чтобы увидеть, почему эта формула скорее всего переоце- переоценивает 6<7, рассмотрим, в каком случае фактическая величина q сравнивается с наибольшим значением C.12). Очевидно, это может случиться, если мы недооценили х на полную величину Ьх и недооценили у на полную величину Ьу. Однако это весьма маловероятно. Если х и у измеряются независимо и наши ошибки случайны по природе, в 50% случаев недооценка х будет сопровождаться переоценкой у или наоборот. Тогда ясно, что вероятность недооценки как х, так и у на полные величины Ьх и Ьу довольно мала. Следовательно, значение 8<7 ~ Ьх-\-Ьу переоценивает нашу возможную ошибку. А что же тогда будет лучшей оценкой для 6<7? Это зависит от того, что мы понимаем под ошибкой (т. е. что мы подра- подразумеваем, утверждая, что q, «вероятно», лежит где-то между <7наил — б<7 и <7наил + 6<7). Это также зависит от того, каковы статистические законы, которым подчиняются наши ошибки в измерениях. В гл. 5 мы обсудим нормальное распределение, или распределение Гаусса, которое описывает измерения, под- подверженные случайным погрешностям. Мы увидим, что если измерения х и у выполняются независимо и если они оба подчиняются нормальному распределению, то погрешность в q — х + у дается выражением C.13) Когда комбинируют два числа, возводя их в квадрат, скла- складывая квадраты и затем извлекая квадратный корень, как в C.13), то говорят, чго числа складывают квадратично. Та- Таким образом, правило, которое содержится в C.13), может быть сформулировано следующим образом: если измерения х и у независимы и подвержены только случайным погрешно- погрешностям, то погрешность bq в рассчитанном значении q = х + У равна сумме квадратично сложенных погрешностей Ьх и Ьу, или их квадратичной сумме. Важно сравнить новое выражение C.13) для погрешности в q = х + У с нашим старым выражением bq^bx + by. C.14)
Погрешности в косвенных измерениях 63 Рис 3.2. Так как любая сторона треугольника меньше суммы двух дру- других сторон, то всегда верно неравенство М'а2 + Ь2 < а + Ь. Во-первых, новое выражение C.13) всегда меньше, чем ста- старое C.14), как можно видеть из простых геометрических со- соображений. Для любых двух положительных чисел а и b числа а, Ь и sja2 + Ь2 соответствуют трем сторонам прямоугольного треугольника (рис. 3.2). Поскольку длина любой стороны треугольника всегда меньше суммы двух других сторон, то ясно, что -у а2 + Ь2 < а + Ь и, следовательно, C.13) всегда меньше, чем C.14). Так как выражение C.13) для погрешности в q = x-\-y всегда меньше, чем C.14), то всегда, когда это применимо, следует использовать выражение C.13). Однако оно не всегда применимо. Выражение C.13) отражает возможность того, что переоценка х может быть как-то скомпенсирована недо- недооценкой в у или наоборот. Легко можно привести пример из- измерения, где такая компенсация невозможна. Предположим, например, что q = х + у есть сумма двух длин х и у, измеренных одной и той же стальной рулеткой. Предположим также, что главный источник погрешности за- заключается в том, что, как мы опасаемся, рулетка предназна- предназначена для использования при температуре, отличающейся от данной. Если мы не знаем этой температуры (и не имеем на- надежной рулетки для сравнения), то мы должны будем при- признать, что наша рулетка может быть длиннее или короче, чем ее калиброванная длина, и что, следовательно, она может давать недооцененные или переоцененные значения длины. Эту погрешность легко учесть1). Однако смысл заключается в том, что если рулетка несколько длиннее, то мы недооцени- недооцениваем оба значения х и у, а если рулетка несколько короче, то мы переоцениваем оба значения х и у. Таким образом, нет ') Предположим, например, что рулетка характеризуется коэффициен- коэффициентом расширения а = 10~5 на градус, и пусть мы решили, что разность между температурой, при которой производилась калибровка, и фактиче- фактической температурой, по всей вероятности, не больше 10 град. Тогда мало- маловероятно, чтобы длина рулетки более чем на 10~4, или на 0,01 %, отлича- отличалась от правильной, и наша погрешность, следовательно, составляет 0,01 %.
64 Глава 3 шансов для взаимной компенсации ошибок, которая оправды- оправдывает использование квадратичной суммы для вычисления по- погрешности в q = х + у. Позднее (в гл. 9) мы докажем, что независимо от того, являются ли наши ошибки независимыми и случайными, по- погрешность в q — х + у определенно не больше, чем простая сумма бх + Ьу: б<7<бх + бг/, C.15) т. е. наше старое выражение C.14) для bq представляет со- собой в действительности верхний предел, который справедлив во всех случаях. Если у нас имеются какие-либо основания подозревать, что ошибки в х и у не независимы и случайны (как в примере с измерением стальной рулеткой), то исполь- использование нами квадратичной суммы C.13) для bq не будет оправданным. С другой стороны, предел C.15) гарантирует, что 6<7 определенно не больше, чем 6х + бу, и более надеж- надежным будет использование старого правила б<7 « 6л: + by. Фактически часто не существенно, каким образом склады- складывать погрешности: квадратично или непосредственно. Напри- Например, предположим, что х и у — длины, измеренные обе с по- погрешностями 6х = Ьу = 2 мм. Если бы мы были уверены, что эти погрешности независимы и случайны, то мы оценили бы ошибку в х-\-у квадратичной суммой л/FхJ + (буJ = V4 + 4 мм = 2,8 мм~3 мм, а если бы мы подозревали, что погрешности могут не быть независимыми, то были бы вынуждены использовать обычную сумму 6л: + by ~ B + 2) мм = 4 мм. Во многих экспериментах оценка погрешностей настолько груба, что различие между этими двумя результатами C и 4 мм) не важно. С другой стороны, иногда квадратичная сум- сумма значительно меньше, чем обычная сумма. Кроме того, как это ни удивительно, квадратичную сумму иногда легче вычис- вычислить, чем обычную сумму. Мы встретимся с примерами этих эффектов в следующем разделе. 3.4. Еще о независимых погрешностях В последнем разделе мы видели, как независимые случай- случайные погрешности в двух величинах х и у вызывают погреш- погрешность в сумме х + у- Было показано, что для такого типа погрешностей две ошибки должны складываться квадратично. Естественно, можно рассмотреть соответствующую задачу для разностей, произведений и частных. Как мы докажем позже,
Погрешности в косвенных измерениях 66 можно показать, что во всех случаях наши предыдущие пра- правила C.4) и C.8) модифицируются только в том отношении, что суммы ошибок (или относительных ошибок) заменяются квадратичными суммами. В дальнейшем мы докажем, что старые выражения C.4) и C.8) являются фактически верх- верхними пределами, которые всегда справедливы независимо от того, независимы и случайны ли погрешности. Таким образом, конечный вариант наших двух главных правил выглядит сле- следующим образом: Погрешность в суммах и разностях Предположим, что х, ..., да измерены с по- погрешностями 8х, ..., бда и что измеренные значения используются для вычисления q = х + . .. + 2 — (и + . .. + да). Если известно, что погрешности в х, ..., да независимы и случайны, то погрешность в q равна квадратичной сумме .+ (б2J + (б«J + ... + (бшJ исходных погрешностей. В любом случае 8q никогда не больше, чем их обычная сумма бл: + • • • + бг + б« + • • • + бш- Погрешности в произведениях и частных Предположим, что х, ..., да измерены с по- погрешностями Ьх, ..., бш и что измеренные значения используются для вычисления ¦* uX.-.Xw ¦ Если погрешности в х, ..., w независимы и случайны, то относительная погрешность в q равна квадратичной сумме исходных отно- относительных погрешностей kl " В любом случае она никогда не больше, чем их обычная сумма
¦66 Глава 3 Заметим, что мы не обосновали возможность использова- использования квадратичного сложения для независимых случайных по- погрешностей. Мы только высказали соображения, что когда различные погрешности независимы и случайны, то имеется вероятность взаимной компенсации ошибок, и что результи- результирующая погрешность (или относительная погрешность) долж- должна быть меньше, чем простая сумма исходных погрешностей (или относительных погрешностей). Квадратичная сумма дей- действительно обладает таким свойством. Мы приведем надле- надлежащее доказательство ее применимости в гл. 5. Предельные соотношения C.17) и C.19) будут доказаны в гл. 9. Пример Как мы уже отмечали, иногда нет существенного различия между погрешностями, полученными как квадратичные сум- суммы, и погрешностями, вычисленными простым сложением. С другой стороны, иногда имеется существенная разница и, что довольно удивительно, квадратичную сумму часто намного проще вычислить. Чтобы увидеть, как это происходит, рас- рассмотрим следующий пример. Предположим, что мы желаем определить коэффициент полезного действия электрического мотора постоянного тока, используя этот мотор для того, чтобы поднять массу т на высоту h. Совершенная работа равна mgh, а электрическая энергия, подведенная к мотору, равна Vlt, где V — приложен- приложенное напряжение, / — ток и t — время, в течение которого ра- работал мотор. В этом случае коэффициент полезного действия равен коэффициент полезного действия е = работа, совершенная мотором mgh энергия, подведенная к мотору Vlt Предположим, что т, 1г, V и / могут быть измерены все с точ- точностью 1%: (относительная погрешность т, h, V и /)=1 % и что время t имеет погрешность 5 % (относительная погрешность t) = 5%. (Конечно, величина g известна с ничтожной погрешностью.) Если мы теперь вычислим коэффициент полезного действия е, то в соответствии с нашим старым правилом («относительные ошибки складываются») погрешность будет равна
Погрешности в косвенных измерениях 67 С другой стороны, если мы уверены, что различные погреш- погрешности независимы и случайны, то мы можем вычислить Ье/е как квадратичную сумму, что дает бе__ . /( Ш\1 , ( bh ^2 е ~ +Ьг) +(—) +{-) = Ясно, что квадратичная сумма приводит к значительно мень- меньшей оценке для бе. Более того, как можно увидеть, с точ- точностью до одной значащей цифры погрешности в т, к, V и / совсем не вносят вклад в погрешность е, рассчитанную таким способом, т. е. с точностью до одной значащей цифры мы на- нашли (в этом примере) 6е_ 6t_ е ~~ t # Это поразительное упрощение легко понять. Когда числа скла- складываются квадратично, они сначала возводятся в квадрат, а затем суммируются. Процесс возведения в квадрат сильно преувеличивает влияние больших чисел. Например, если одно число в 5 раз больше любого другого (как в нашем примере), то его квадрат уже в 25 раз больше аналогичных величин для других чисел и мы можем обычно полностью пренебречь дру- другими числами. Этот пример показывает, что лучше, а часто и легче, скла- складывать ошибки квадратично. Он иллюстрирует также, какого рода проблемы возникают в случае, когда ошибки действи- действительно независимы и когда оправданно квадратичное сложе- сложение. (Пока мы принимаем на веру, что ошибки случайны. Этот более трудный вопрос обсуждается в гл. 4.) Пять изме- измеренных величин (m, h, V, I и t) являются физически различ- различными величинами с разными единицами измерения, и изме- измеряются они с помощью совершенно различных методов. По- Поэтому практически невероятно, чтобы источники ошибок для одной какой-либо величины были коррелированы с источни- источниками для любой другой. Следовательно, ошибки можно рас- рассматривать как независимые и складывать квадратично. 3.5. Произвольная функция одной переменной Теперь мы знаем, как оценивать независимые и зависимые погрешности для сумм, разностей, произведений и частных. Однако многие расчеты включают и более сложные операции, такие, как вычисление синуса, косинуса или квадратного кор- корня, и нам следует знать, как оценивать ошибки и в этих слу- случаях косвенных измерений.
Глава 3 Рис. 3.3. График зависимости q{x) от х. Если величина х. измерена как *наил ± вя, то наилучшая оценка q(.x) есть <'наил = '' ('''наил)' Наибольшее и наименьшее вероятные значения q(x) соответствуют значениям х„ ± &х величины х. В качестве примера можно привести задачу, в которой определяется показатель преломления стекла п методом из- измерения предельного угла 9 полного внутреннего отражения. Из элементарной оптики известно, что п = 1/sin 9. Если мы можем измерить угол 9, то легко вычислить показатель пре- преломления п. Но затем мы должны найти погрешность 6п в определении п— 1/sin 9, зная погрешность 69 в нашем изме- измерении 9. В более общем случае предположим, что мы измерили ве- величину х стандартным образом в виде хНанл ± Ъх и хотим вы- вычислить некоторую известную функцию q{x), например такую, как q(x)= 1/sin x или q(x) = -y/x. Одним из простых спосо- способов решения этой задачи является построение графика q(x), как показано на рис. 3.3. Наилучшая оценка для q(x) есть, конечно, <7„аиЛ = <?(лгНаич), и значения Хнаил и <7нанл на рис. 3.3 соединены жирными линиями. Чтобы определить погрешность dq, воспользуемся обычным способом. Наибольшее вероятное значение х есть лгНаил + Ьх\ используя график, можно немедленно найти наибольшее ве- вероятное значение для q, которое обозначено <7„акс- Аналогично можно найти и наименьшее вероятное значение, обозначенное <7миН- Если погрешность 6л: мала (как мы всегда предпола- предполагаем), то отрезок графика, используемый в наших построе- построениях, приближенно представляет собой прямую линию, и тогда легко видеть, что <7макс и <7МИн находятся на равных рас- расстояниях от <7наил- Погрешность 6<? в этом случае может быть
Погрешности в косвенных измерениях 89 определена из графика, как любое из расстояний, указанных стрелками, и, таким образом, мы нашли значение q в стан- стандартном виде <7наил ± bq. Иногда погрешности действительно вычисляют из графика, как описано выше (см., например, задачу 3.10). Однако обыч- обычно функция q(x) известна в явном виде [например, q(x) = = sin л: или q(x) = л/х], и погрешность 8q может быть выра- выражена аналитически. Из рис. 3.3 ясно, что б<7 = q (хяаил + 6x) — q (хяаял). C.20) Теперь, согласно основному приближенному выражению ма- математического анализа, для любой функции q(x) и любого достаточно малого приращения и можно написать q(x+u) — q(x)=-? и. Таким образом, при условии, что погрешность Ьх мала (как ,мы всегда предполагаем), можно переписать разность C.20) и получить C.21) 6,7=^6*. dx Мтак, чтобы найти погрешность 6q, мы должны вычислить производную dq/dx и умножить ее на погрешность бх. Правило C.21) имеет еще не окончательный вид. Оно вы- выведено для функции, показанной на рис. 3.3, с положитель- положительным наклоном. На рис. 3.4 показана функция с отрицательным на ил Рис. 3.4. Если наклон графика q(x) отрицателен, то максимальное вероят- вероятное значение q соответствует минимальному значению х, и наоборот.
70 Глава 3 наклоном. В этом случае максимальное вероятное значение <?макс очевидно, соответствует минимальному значению *наил — 6л: величины х, так что б? = — 416л:. C.22) (*Х Поскольку производная dq/dx отрицательна, мы можем запи- записать —dq/dx как \dq/dx\ и получим следующее общее пра- правило: Погрешность в произвольной функции одной переменной Если величина х измерена с погрешностью Ьх и используется для вычисления функции q(x), то погрешность 8q равна 1 dx 6*. C.23) В качестве простого примера применения этого правила предположим, что мы измерили угол 9 9 = 20±3 град и хотим найти cos 9. Наша наилучшая оценка для cos 9 со- составляет cos 20° = 0,94, а в соответствии с C.23) погрешность равна б (cos 9) = d cos 6 »= j sin 9169 (в рад). C.24) Мы указали, что погрешность 69 должна быть выражена в ра- радианах, поскольку производная от cos 9 равна —sin 9, только если угол 9 выражен в радианах. Следовательно, перепишем 69 = 3° в виде 60 = 0,05 рад; тогда C.24) дает 6 (cos 6) = (sin 20°) X 0,05 = 0,34 X 0,05 = 0,02. Таким образом, наш конечный результат имеет вид cos 6 = 0,94 ±0,02. В качестве второго примера применения правила C.23) мы можем вновь вывести (и обобщить) результат, полученный в разд. 3.2. Предположим, что мы измерили величину х и за- затем вычисляем степенную функцию q(x) = xn (где п — любое известное фиксированное число — положительное или отрица- отрицательное). В соответствии с C.23) погрешность в q есть
Погрешности в косвенных измерениях 71 Если разделить обе части этого равенства на |<7|: получим дх 1*1 \хп\, то C.25) т. е. относительная погрешность в q = хп в \п\ раз больше, чем в х. Это и есть правило C.10), полученное ранее. Однако в данном случае наш результат является более общим, по- поскольку п теперь может быть любым числом. Например, если я = 1/2, то q = sjx и Ьд \_ Ьх \q\ — Т ~\7\' т. е. относительная погрешность в -\/х равна только поло- половине погрешности в самом х. Аналогично относительная по- погрешность в 1/х — х~1 та же самая, что и в самом х. Результат C.25) — это лишь частный случай правила C.23). Однако он достаточно важен и заслуживает отдель- отдельного рассмотрения, как следующее общее правило: Погрешность в степенной функции Если величина х измерена с погрешностью Ьх и используется для вычисления степен- степенной функции q = хп (где п — фиксирован- фиксированное известное число), то относительная по- погрешность в q в \п\ раз больше, чем в х: 6<7 , , Ьх 1| C.26) 3.6. Метод «шаг за шагом» Теперь мы имеем достаточно правил, чтобы справиться почти с любой задачей вычисления ошибок в случае косвен- косвенных измерений. Любой расчет может быть представлен как последовательность определенных шагов, каждый из которых включает только один из следующих видов операций: 1) на- нахождение сумм и разностей; 2) расчет произведений и част- частных; 3) вычисление функции одного переменного, например хп, sin х, ех или In х. Так, мы могли бы рассчитать q = х (у — z sin и) C.27) по измеренным значениям х, у, z и и в следующей последо- последовательности шагов: вычисление функции sin и, затем расчет произведения г и sin и, потом определение разности у й z sin и и, наконец, произведения х и (у — z sin и).
72 Глава 3 Мы знаем, как вычисляются погрешности для каждой из этих отдельных операций. Таким образом, при условии, что все величины, с которыми мы имеем дело, независимы, мы можем вычислить погрешность конечного результата в серии последовательных шагов, исходя из погрешностей в исходных измерениях1). Например, если величины х, у, г и и в C.27) были измерены с соответствующими погрешностями 6х, ... ..., би, то мы могли бы вычислить погрешность q следующим образом. Сначала найдем погрешность в функции sin и; зная ее, определим погрешность в произведении z sin ы и затем —в разности у— zsinu; наконец, найдем погреш- погрешность в произведении C.27). Прежде чем привести примеры вычисления ошибок с по- помощью этого метода «шаг за шагом», подчеркнем два основ- основных момента. Во-первых, поскольку погрешности в суммах и разностях вычисляются в терминах абсолютных погрешно- погрешностей (подобно бх), в то время как в произведениях и част- частных — в терминах относительных погрешностей (подобно бх/|х|), то наши расчеты потребуют, как мы увидим, неко- некоторых средств, позволяющих переходить от абсолютных по- погрешностей к относительным и наоборот. Во-вторых, важным упрощающим фактором во всех этих расчетах является то, что (как мы уже несколько раз под- подчеркивали) погрешности редко требуется вычислять с более чем одной значащей цифрой. Следовательно, многие рас- расчеты можно выполнить очень быстро в уме и многими мень- меньшими погрешностями можно полностью пренебречь. В типич- типичном эксперименте, состоящем из нескольких попыток изме- измерить что-либо, возможно, будет необходимо тщательно рас- рассчитать на бумаге ошибки косвенного измерения только для первой попытки. Если это было сделано, то часто легко ви- видеть, что все попытки достаточно подобны друг другу, и тогда не потребуется никаких дополнительных расчетов или в худ- худшем случае для последующих попыток можно в уме модифи- модифицировать расчеты, выполненные для первой попытки. 3.7. Примеры В этом и следующем разделах мы детально рассмотрим три примера Типичных расчетов, встречающихся в учебной лаборатории. Ни один из этих примеров не является особенно ') В разд. 3.9 мы обсудим, почему метод «шаг за шагом» иногда неудовлетворителен, например когда различные величины не независимы, как в случае функции, подобной q = х(у — х sin у), в которой х и у встречаются дважды В этом случае вычисления «шаг за шагом» погреш- погрешности bq могут иногда дать завышенную оценку 8q.
Погрешности в косвенных измерениях сложным, и фактически лишь небольшое число встречаю- встречающихся на практике задач значительно сложнее, чем эти рас- рассмотренные примеры. Измерение g с помощью математического маятника В качестве первого примера рассмотрим измерение g, ускорения свободного падения, с помощью математического маятника. Как хорошо известно, период колебаний такого маятника равен Т = 2л ¦y/llg, где / — длина маятника. Таким образом, если / и Т измерены, мы можем найти gs C.28) Это выражение позволяет представить g в виде произведения двух множителей 4я2 и / и частного 4я2//Г2. Если различные погрешности независимы и случайны, то относительная по- погрешность в нашем результате равна квадратичной сумме относительных погрешностей в этих множителях. Множитель 4я2 не имеет погрешности,, а относительная погрешность в Т2 в два раза больше, чем в Т: б (Г2) _.,_р6Г Таким образом, относительная погрешность нашего резуль- результата для g будет */()"()' «•¦*> Предположим, что мы измеряем период Т для одного значения длины / и получаем результаты1) I = 92,95 ±0,1 см, Г =1,936 ±0,004 с. Наша наилучшая оценка для g легко находится из C.28) как 4л2 (92,95 см) п„п . , A936 сJ = 979 см/с2. Чтобы найти погрешность в g согласно C.29), нам необхо- необходимо знать относительные погрешности в / и Т. Они легко рассчитываются (в уме) как ¦^- = 0,196 и -^ = 0,2%. ') Хотя погрешность 6Г = 0,004 с на первый взгляд могла бы пока- показаться неправдоподобно малой, она легко достижима, если измерять время нескольких колебаний. Если измерения выполнять с точностью 0,1 с, что вполне возможно в случае использования секундомера, то, измеряя Время 25 колебаний, можно найти период Т с точностью 0,004 о.
74 Глава 3 Подставляя в C.29), находим B-0,2J 0,4 и, следовательно, bg = 0,004 • 979 см/с2 = 4 см/с2. Таким образом, наш конечный результат, основанный на этих измерениях, равен g = 979 ± 4 см/с2. Если теперь эксперимент повторить (как это необходимо для большинства таких экспериментов) с другими значе- значениями параметров, то не обязательно повторять расчет по- погрешностей во всех деталях. Немного подумав, можно легко свести разные значения /, Т и g и соответствующих погреш- погрешностей в одну общую таблицу (см. задачу 3.13). Определение показателя преломления из закона Снелла Если луч света проходит из воздуха в стекло, то можно определить углы падения (i) и преломления (г) (рис. 3.5). Эти углы связаны законом Снелла sin i = n sin г, где п — показатель преломления стекла. Таким образом, если изме- измерить углы i и г, то можно рассчитать показатель преломле- преломления п как n = sini/sinr. C.30) Погрешность этого результата легко вычисляется. Так как п — частное от деления sin i на sin r, то относительная по- погрешность дается квадратичной суммой — = л /f6sin'V | (Ь sin г у « V V sin i ) ~ \ sin г ) Воздух Рис. 3.5. Углы падения i и преломления г при прохождении луча света из воздуха в стекло.
Погрешности в косвенных измерениях 75 Таблица 3.1. Определение показателя преломления I, град г, град 6 sin I б sin г 6л (±1) (±1) 20 13 0,342 0,225 1,52 5 8 9 40 23,5 0,643 0,399 1,61 2 4 5 относительных погрешностей в sin i и sin г. Чтобы найти относительную погрешность в значении синуса любого угла 9, заметим, что sin 9 = ?*?!. 69 = | cos9|69(в рад). Таким образом, относительная погрешность равна ^| 9 (в рад). C.32; Предположим, что теперь мы измеряем угол г для двух значений i и получаем результаты, приведенные в двух пер- первых столбцах табл. 3.1 (с найденными во всех измерениях погрешностями ±1 град, или 0,02 рад). Расчет п = sin г'/sin г легко выполняется, как видно из трех следующих столбцов табл. 3.1. Погрешность в п находится, как показано в трех последних столбцах; относительные погрешности для sin i и sin г вычисляются по формуле C.32) и, наконец, для п — по C.31). Прежде чем выполнять серию измерений, подобных двум представленным в табл 3.1, тщательно продумайте, как наи- наилучшим образом привести данные и расчеты. Аккуратное представление данных, подобно показанному в табл. 3.1, поз- позволяет легко записывать результаты и уменьшает опасность появления ошибок в расчетах. Читающему также будет легче проследить за записью и проверить расчеты. 3.8. Более сложный пример Два рассмотренных выше примера типичны для экспери- экспериментов в учебной физической лаборатории. Однако неболь- небольшое число экспериментов требует более сложных расчетов. В качестве примера такого эксперимента рассмотрим изме- измерение ускорения тележки, скатывающейся по наклонной пло- плоскости '). ') Читатель, если желает, может пропустить этот раздел без потери непрерывности изложения и вернуться к его изучению в связи с зада- задачей 3.15.
76 Глава 3 Ускорение тележки, скатывающейся по наклонной плоскости Рассмотрим тележку, скатывающуюся по наклонной пло- плоскости с углом наклона 0, как показано на рис. 3.6. Ожидае- Ожидаемое ускорение равно g sin 0, и если измерить 0, то легко можно вычислить ожидаемое ускорение и его погрешность задача 3.15). Мы можем измерить фактическое ускорение а, определяя времена, за которые тележка проходит каждый из двух фотоэлементов, соединенных с часами. Если тележка имеет длину / и за время t\ проходит первый фотоэлемент, то ее скорость равна Vi = l/t\. Аналогично и2 = l/t2. (Строго говоря, эти скорости представляют собой средние скорости тележки за время прохождения фотоэлементов. Однако, пока длина / мала, различие между средней и мгновенной скоро- скоростями незначительно.) Если расстояние между фотоэлемен- фотоэлементами равно s, то в соответствии с известной формулой v\ — = v2 + 2as находим 4 - о? (i2 \ ( 1 1 л is \1s)\t{ t\) C.33) С помощью этой формулы и измеренных значений /, s, t\ и t2 легко найти наблюдаемое ускорение и его погрешность. Пусть данные для этого эксперимента (числа в скобках характеризуют соответствующие относительные погрешности в процентах, как легко можно проверить) выглядят следую- следующим образом: / = 5,0 ±0,05 см A %), s= 100,0 ±0,2 см @,2%), Ь = 0,05.4 ± 0,001 с B %), C.34) /2 = 0,031 ±0,001 с C %). Фотоэлемент 1 Фотоэлемент 2 Рис. 3.6. Тележка, скатывающаяся вниз по наклонной плоскости с углом наклона в. Каждый фотоэлемент соединен с часами, отмечающими интервал времени, в течеч мне которого тележка проходит мимо него.
Погрешности в косвенных измерениях 77 Из этих данных можно сразу вычислить первый множитель в C.33) f/2s = 0,125 см. Поскольку относительные погреш- погрешности в / и s равны соответственно 1 и 0,2%, аналогичная величина для /2/2s есть (Обратите внимание на то, что погрешность в s не дает за- заметного вклада и ею можно пренебречь.) Следовательно, /2/2s = 0,125 см ±2 %. C.35) Чтобы вычислить второй множитель в C.33) и его по- погрешность, будем продолжать расчет по этапам. Так как от- относительная погрешность в t\ составляет 2%, то аналогич- аналогичная величина для 1/^2 составляет 4%. Таким образом, по- поскольку t\ = 0,054 с, 1//2 = 343± 14 с-2. Аналогично относительная погрешность в \Ц\ составляет 6%, l/f|=1041 ±62 с-2. Вычитая эти значения (и складывая ошибки Квадратично), находим -V - -т = 698 ± 64 с~2 (9 %)• C-36) t2 tl Наконец, в соответствии с C.33) искомое ускорение равно произведению C.35) и C.36). Перемножая эти значения (и складывая квадратично относительные погрешности), по- получаем а = @,125 см±2 %) -F98 с~2 ± 9 %)=87,3 см/с2 ±9%, или а = 87 ± 8 см/с2. C.37) Этот результат можно было бы сравнить с ожидаемым уско- ускорением g sin 0, если бы оно было рассчитано. При внимательном изучении расчета, приведшего к C.37), можно отметить несколько интересных особенностей. Во-пер- Во-первых, 2%-пая погрешность множителя /2/2s полностью пере- перекрывается 9%-ной погрешностью в (I//2) — A/^?)- В случае расчетов для последующих испытаний погрешности в / и s можно игнорировать (если прикидка показывает, что они все еще неважны). Другой важной особенностью нашего расчета является возрастание 2- и 3 %-ных погрешностей в tx и t2 при вычисле- вычислении \jt2x и \jt\ и разности AА|) — (lAi), так чт0 конечная по-
78 Глава 3 грешность становится равной 9%. Этот рост частично обус- обусловлен возведением в квадрат и частично вычислением раз- разности больших чисел. Мы могли бы представить себе некото- некоторое расширение эксперимента для проверки постоянства а, когда тележке дается начальный толчок, так что скорости V\ и V2 возрастают. В этом случае времена t\ и h стали бы меньше и ошибки возросли бы (см. задачу 3.15). 3.9. Общая формула для вычисления ошибок в косвенных измерениях') Итак, мы установили три основных правила для расчета ошибок в случае косвенных измерений: правило для сумм и разностей, правило для произведений и частных и правило для произвольной функции одного переменного. В последних трех разделах мы видели, как вычисление сложной функции часто может быть разбито на отдельные элементы и как по- погрешность в рассчитываемой функции можно оценить мето- методом «шаг за шагом», используя три наших простых правила. В этом заключительном разделе мы приведем одну общую формулу, из которой могут быть получены все три упомяну- упомянутых правила и с помощью которой может быть решена любая задача вычисления ошибок в косвенных измерениях. Хотя эта формула на практике довольно громоздка, теоретически она весьма полезна. Более того, имеется ряд задач, для которых лучше проделать вычисления в один прием с помощью общей формулы, чем рассчитывать погрешность методом «шаг за шагом»», как в последних трех разделах. Чтобы проиллюстрировать тип задач, для которых расчет в один прием предпочтительнее, предположим, что мы изме- измеряем три величины х, у, г и должны вычислить функцию типа C.38) в которой какая-то переменная появляется более чем один раз (в данном случае х). Если бы мы намеревались вычис- вычислить погрешность 8q методом «шаг за шагом», то сначала вычислили бы погрешности в двух суммах х + у и х + z и затем в их частном. Поступая таким образом, мы бы совсем не учли возможность того, что ошибка в числителе, связан- связанная с х, может до некоторой степени компенсироваться ошиб- ошибкой в знаменателе, связанной с теми же ошибками в х. Чтобы понять, как это может случиться, предположим, что х, у, г — положительные числа, и посмотрим, что произойдет, если ') Читатель может без ущерба отложить изучение этого раздела. Ма- Материал, который в нем затрагивается, не используется вплоть до разд. 5.6,
Погрешности в косвенных измерениях 79 наше измерение х подвержено ошибке. Если мы переоцени- переоцениваем х, то мы переоцениваем обе суммы х + у и х + г и (в большой степени) эти переоценки компенсируют друг друга, когда мы вычисляем (х + у) / (х + г). Аналогично недо- недооценка х приводит к недооценке обеих сумм x + i/их + г, что опять ведет к компенсации при вычислении частного. В любом случае ошибка в х существенно компенсируется при вычисле- вычислении частного (х + у) /{х + z), а наш метод «шаг за шагом» совсем не учитывает этой компенсации. Всегда, когда функция включает одну и ту же величину более чем один раз, как в C.38), некоторые из ошибок могут взаимно компенсироваться (эффект, который иногда назы- называют эффектом компенсирующихся ошибок). Если это про- происходит, расчеты погрешности методом «шаг за шагом» мо- могут привести к переоценке конечной погрешности. Единствен- Единственный способ избежать этого заключается в расчете погреш- погрешности за один прием с помощью метода, который мы сейчас обсудим '). Предположим сначала, что мы измеряем две величины х я у и затем вычисляем некоторую функцию q = q(x,y). Эта функция может быть простой, как, например, q = х + у, или же несколько более сложной, подобно q = (х3 + y)sin(xy). Для функции q(x) одной переменной мы показали, что если наилучшая оценка для х есть число хнг1НЛ, то наилучшая оценка для q(x) есть ^(хнаил). Затем мы показали, что если экстремальные (т. е. наибольшее и наименьшее) вероятные значения х равны хняал ± 8х, то и соответствующие экстре- экстремальные значения q равны ?(*а.ил±в*). C-39) Наконец, мы использовали приближение q{x + u)~q(x) + 4Lu C.40) (для любого малого приращения и), чтобы переписать экс- экстремальные вероятные значения C.39) в виде *. C-41) где знак абсолютного значения используется, чтобы учесть возможность того, что величина dq/dx может быть отрица- отрицательной. Запись C.41) означает, что dq « \dq/dx\bx. ') Иногда функция, включающая некоторую переменную более чем один раз, может быть переписана в другом виде, в котором это уже исклю- исключено. Например, q = ху — xz можно переписать как q = х(у—г). Для второй записи погрешность 6<7 может быть вычислена методом «шаг за шагом» без какой-либо опасности переоценки.
80 Глава 3 В случае когда q является функцией двух переменных q(x,у), аргументация аналогична. Если хнаил и i/наил суть наилучшие оценки х и у, то мы полагаем, что наилучшей оценкой для q, как обычно, будет Янаил Я У^наил» Унанл/* Чтобы оценить погрешность этого результата, мы должны обобщить приближение C.40) на функцию двух переменных. Требуемое обобщение имеет вид q(x + u, y + v)~q(x, y) + ^u + ^v, C.42) где и и v — любые достаточно малые приращения х и у, а dq/дх и dq/dy — так называемые частные производные функции q по х и у. Таким образом, dq/дх есть результат дифференцирования функции q по х, при котором у считается постоянным, и наоборот для dq/dy. (Дополнительный мате- материал о частных производных приведен в задачах 3.16 и 3.17.) Экстремальные вероятные значения х и у равны Хнанл ± бх и i/наил ± Ьу. Если подставить эти значения в C.42) и напом- напомнить, что dq/дх и dq/dy могут быть как положительными, так и отрицательными, то для экстремальных значений q по- получим Я (*„аил. Унаил) ± (| ff | 6* + | jfc | Эта запись означает, что погрешность в q(x,y) равна 1г|бх + 11гК- C-43) Прежде чем рассматривать различные обобщения этого но- нового правила, имеет смысл применить его для вывода неко- некоторых уже известных. Допустим, например, что q(x, y) = x + y, C.44) т. е. величина q просто равна сумме х и у. Обе частные про- производные равны единице dq dq , in лк\ -^¦z-= -^-= 1, C.45) дх ду ' v ' и тогда в соответствии с C.43) 6? « дх + Ьу, C.46) а это — уже известное правило, согласно которому погреш- погрешность в х + у равна сумме погрешностей в х и у. Совершенно аналогично если q есть произведение q = ху, то, как легко показать, C.43) дает старое правило, согласно
Погрешности в косвенных измерениях 81 которому относительная погрешность в q равна сумме отно- относительных погрешностей в х и у (см. задачу 3.18). Правило C.43) можно обобщить. Читатель не будет удив- удивлен, когда узнает, что в случае независимых и случайных погрешностей бх и Ьу сумма C.43) может быть заменена квадратичной суммой. Если же функция q зависит более чем от двух переменных, то мы просто добавляем лишний член для каждой новой переменной. Все это приводит к следую- следующему общему правилу (надлежащее обоснование которого будет дано в гл. 5 и 9). Погрешность функции нескольких переменных Предположим, что х, ..., z измерены с по- погрешностями бх, ..., бг и что измеренные значения используются для вычисления функции q(x z). Если погрешности в х, ..., z независимы и случайны, то по- погрешность в q равна В любом случае она никогда не больше, чем обычная сумма dq_ дх + ... + dq_ дг 6г. C.47) C.48) Возможно, наиболее полезной особенностью этого общего правила является то, что мы можем вывести из него все наши предыдущие правила вычисления погрешностей в случае кос- косвенных измерений (см. задачу 3.18). Непосредственное ис- использование общего правила довольно громоздко на прак- практике, и обычно проще, если возможно, продвигаться шаг за шагом, используя наши предыдущие, более простые правила. Однако, если функция q(x, ..., z) включает любую перемен- переменную более одного раза, могут возникнуть компенсирующиеся ошибки; в этом случае вычисления методом «шаг за шагом» могут привести к переоценке окончательной погрешности, и тогда лучше вычислять 8q за один прием, используя непо- непосредственно C.47) или C.48). Задачи Напоминание: звездочка у номера задачи означает, что задача ре- решается или ее ответ приводится в разделе «Ответы» в конце книги. *3.1 (разд, 3.1). Двум студентам предложили измерить скорость эмис- эмиссии ос-частиц из некоторого радиоактивного образца. Студент А считал в
82 Глава 3 течение двух минут и насчитал 32 а-частицы; студент Б считал в течение часа и насчитал 786 а-частиц. (Образец распадается настолько медленно, что ожидаемую скорость эмиссии можно считать постоянной за время из- измерений.) а. Используйте формулу C.2) для вычисления погрешности в резуль- результате студента А, равном 32 частицам, испущенным за две минуты. б. Какова погрешность результата студента Б, составляющего 786 ча- частиц, испущенных за один час? в. Каждый студент делит свое число отсчетов на число минут, чтобы найти скорость распада, т. е. число распадов в минуту. Каковы их результаты и погрешности? (Хотя погрешность в общем числе от- отсчетов студента Б больше, чем у студента А, погрешность в скоро- скорости, полученная студентом Б, намного меньше, чем у студента А, т. е., делая отсчеты в течение более длительного времени, можно получить более точный результат для темпа отсчетов, как можно было ожидать.) 3.2 (разд. 3.2). Студент получил следующие результаты измерения: а = 5 ± 1 см; b = 18 ± 2 см; с= 12 ± 1 см; t = 3,0 ± 0,5 с; т= 18 ±1 г. Используя правила C.4) и C.8), вычислите следующие величины, их по- погрешности и относительные погрешности в процентах: а + 6 + с; о + 6 — с; ct; 4а; 6/2 (где цифры 4 и 2 не содержат погрешности) и mb/t. *3.3 (разд. 3.2). Используя правила C.4) и C 8), вычислите следую- следующие выражения: а) E+1) + (8 ±2)—.A0 + 4); б) E±1) X (8 ±2); в) A0± 1)/B0±2); г) 2яA0±1). Числа 2 и л (см. п. г) не содержат погрешности. *3.4 (разд. 3.2). С помощью хорошего секундомера после некоторой практики можно измерять времена примерно от одной секунды до многих минут с погрешностью порядка 0,1 с. Предположим, что мы хотим найти период т маятника, который приблизительно равен 0,5 с. Если измерить время одного колебания, то погрешность составит около 20 °/о, но, измеряя время нескольких последовательных колебаний, мы можем добиться луч- лучшего, как показывают следующие вопросы. а. Если мы измеряем время пяти последовательных колебаний и полу- получаем 2,4 ± 0,1 с, то каков будет наш результат для т, его абсолют- абсолютной и процентной погрешности? [Помните правило C.9).] б. Каков будет ответ на вопросы п. «а», если измерено время 20 коле- колебаний и получено 9,4 + 0,1 с? в. Может ли быть бесконечно улучшена точность измерения т, если измерять время все большего числа периодов? 3.5 (разд. 3.2). Если для i найдено, что t = 8,0 ± 0,5 с, то каковы вначения и погрешности t2, l/t и 1/<3? *3.6 (разд. 3.2). Посетитель средневекового замка решает определить глубину колодца, измеряя время падения брошенного в него камня. Он определяет, что время падения равно t = 3,0 +. 0,5 с. Какой вывод он сделает о глубине колодца? 3.7 (разд. 3.2). Согласно биномиальной теореме, для любого числа п и любого х, удовлетворяющего условию \х\ < 1, имеет место разложение
Погрешности в косвенных измерениях 83 0,9 0,8 OJ 0,6 0,5 .0,4 j 0,3 0,2 1 1 1 11 \ 1 1 ! 1 1 1 1 1 \ \ 11A 1I1 ! I I I 11I 1 ¦ — (III О 0,1 0,2 , см2/г 0,3 0,4 Рис. 3.7. Зависимость энергии Е от коэффициента поглощения \х фотонов в свинце. а. Покажите, что если п — целое положительное число, то этот бес- бесконечный ряд обрывается (т.е. содержит только конечное число членов). Напишите его явное выражение для случаев п = 2 и « = 3. б. Напишите биномиальный ряд для случая п = —1. Это приведет к бесконечному ряду для 1/A +л); когда величина х мала, два первых члена этого бесконечного ряда дают хорошее приближение 1/A + х) « 1-х, как уже упоминалось при записи C.6). Вычислите значения этих двух выражений для каждого из значений х = 0,5; 0,1; 0,01 и в каждом случае рассчитайте процентную погрешность, на которую приближение 1—х отличается от точного значения 1/A +*). *3.8 (разд. 3.3). Студент измеряет четыре длины: а = 50 ± 5, Ь = 30 ± 3, с = 40±1, d = 7,8 ± 0,3 (все в сантиметрах) и вычисляет три суммы а + Ь, а-\- с, а-\- d. Найдите погрешности для этих сумм в случае, когда исходные погрешности могут не быть независимыми [«ошиб- [«ошибки складываются», как в C.14)], а также когда известно, что эти ошибки независимы и случайны [«ошибки складываются квадратично», как в C.13)]. Предполагая, что погрешности надо знать только с одной значащей циф- цифрой, в каком случае из трех погрешность во втором слагаемом (т. е. в Ъ, с или d) можно полностью игнорировать? 3.9 (разд. 3.4). Решите снова задачу 3.2, предполагая, что все погреш- погрешности независимы и случайны, т. е. используя квадратичное сложение, как в правилах C.16) и C.18) расчета ошибок для косвенных измерений'). ') Квадратичное сложение часто можно выполнить в уме с достаточ- достаточной точностью. Если вы используете калькулятор, то заметьте, что при переходе от прямоугольных к полярным координатам автоматически вы- вычисляется величина у хг + уг для любых данных х и у.
84 Глава 3 *3.10 (разд. 3 5) В ядерной физике энергия субатомных частиц может быть измерена разными способами. Один из них состоит в измерении по- поглощения частиц в веществе, например таком, как свинец, и последующем сравнении с известными графиками зависимости энергии от скорости по- поглощения. На рис 3.7 изображен такой график для фотонов (частиц света) в свинце. По оси ординат отложена энергия фотонов Е в МэВ (миллионах электронвольт), а по оси абсцисс — соответствующий коэффи- коэффициент поглощения ц в см2/г. (Точное определение этого коэффициента не должно нас сейчас беспокоить; ц есть просто подходящая мера ско- скорости поглощения фотонов в свинце ) Из этого графика легко найти энер- энергию Е фотона, если известен его коэффициент поглощения ц. а. Студент производит опыты с пучком фотонов( одинаковой энергии) и находит, что в свинце их коэффициент поглощения равен ц = = 0,10 + 0,01 см2/г. Найдите по графику энергию фотонов ? и ее погрешность 8Е (Может быть, вы сочтете полезным представить на графике линии, соединяющие разные точки, представляющие ин- интерес, как было сделано на рис. 3.3). б. Какой вывод сделал бы студент, если бы получил ц = = 0,22 ± 0,01 см2/г? *3.11 (разд. 3 5) а. Угол 9 измерен как 125 ± 2 град, и это значение используется для вычисления sin 0. Используя правило C.23), рассчитайте sin 6 и его погрешность. б. Если величина а измерена как аНаиЛ ± ба и это значение исполь- используется для вычисления f(a) = еа, то каковы /Ьаип и б/? Если а = 3,0 ± 0,1, то чему равны е" и ее погрешность? в. Повторите все задание «б» для функции f(a) = In a. 3.12 (разд. 3.6). Вычислите значения следующих выражений методом «шаг за шагом», как описано в разд. 3 6 (Предположите, что все ошибки независимы и случайны ) а. A2 ±1) X [B5 + 3) -A0+1)], б. Vl6 ± 4 + C,0 + 0,1 K B,0 ± 0,1), в. B0 + 2)е-<1»*|).1). 3.13 (разд. 3.7). Продолжите рассмотрение задачи о математическом маятнике из разд 3 7. В условиях реального эксперимента необходимо измерять период Т для разных значений длин /, и поэтому получатся разные значения g, которые можно сравнивать. Немного подумав, можно представить все данные и результаты расчетов в виде одной удобной таблицы типа табл 3 2 Используя табл. 3.2 (или другую запись, которая вам понравится), вычислите величину g и ее погрешность 6g для приве- приведенных четырех пар данных. Объясните изменения 8g с уменьшением I. (Результаты, представленные в первой строке, позволят проверить ваш метод расчета.) *3.14 (разд. 3 7). Продолжите рассмотрение задачи об измерении по- показателя преломления стекла из разд. 3.7. Используя таблицу, подоб- Таблица 3.2. Определение величины g с помощью маятника I, см (±0,1) Г, с ( + 0,001) g, см/с' 6///, % 6Т/Т, % bTaT 93,8 70,3 45,7 21,2 1,944 1,681 1,358 0,922 980 0,1 0,06 0,14 980±1,4
Таблица 3.3. (в градусах) 1 (±1) г (±1) Погрешности в косвенных измерениях Данные для определения показателя 10 6 20 13 30 19 преломления 50 29 8f 70 38 ную 3.1, вычислите показатель преломления п и его относительную по- погрешность для данных из табл. 3.3. Объясните изменение погрешности. (Все углы измерены в градусах; i — угол падения, г — угол преломления.) 3.15 (разд. 3.8). Продолжите рассмотрение эксперимента из разд. 3 8, в котором тележка скатывается вниз по наклонной плоскости с углом на- наклона 6. а. Если колеса у тележки гладкие и легкие, то ожидаемое ускорение равно gsin6. Если угол 6 измерен как 6 = 5,4 ± 0,1 град, то ка- каковы ожидаемое ускорение и его погрешность? б. Если эксперимент повторяется для разных начальных толчков, со- сообщаемых тележке на вершине склона, то, как обычно, данные и все расчеты удобно поместить в одну таблицу, как показано в табл. 3.4. Используя формулу C.33) для ускорения (и то же зна- значение P/'2s = 0,125 см ±2%, как прежде), вычислите а и 8а для приведенных там данных. Находятся ли результаты в согласии с ожидаемым постоянством величины а и с ожидаемым значением g sin б, вычисленным в задании «а»? Следует ли толкать тележку сильнее, чтобы проверять постоянство величины а при еще больших скоростях? Объясните. *3.16 (разд. 3.9). Частная производная dq/dx от q(x,y) получается дифференцированием функции q по х, когда у считается постоянным Най- Найдите частные производные dq/dx и dqjdy для трех функций: а) q(x,y) =x+y, б) q (x,y) =ху, в) 4{х,у) = хгу3. *3.17 (разд. 3.9). Основное приближение, использованное в разд 3.9, связывает значение функции q в точке (х + «,(/ + v) с аналогичной вели- величиной в соседней точке (х, у) q(x + u, y + v)**q(x, у) + -J2. « + -|i. v C.49) для случая, когда и и v малы. Проверьте в явном виде, что для трех функций из задачи 3.16 это — хорошее приближение, т.е. для каждой из Таблица 3.4. Эксперимент по определению ускорения ') J_ J_ j i_ <±0.001> (±0,001) ,2 t2 ?—q e,c-/C 343±14 1040±62 698±64 87±8 0,054±2% 0,038 0,025 0,031±3% 0,027 0,020 ') Первая строка данных уже была использована в разд. 3.8. Два первых столбиа содержат измеренные времена (, и t2. Погрешность во всех значениях времени равна. 0.QD1 с; для каждого значения времени ее можно выразить как процентную погреш- погрешность.
86 Глава 3 этих трех функций запишите точные выражения для обеих частей равен- равенства C.49) и покажите, что они приблизительно равны, когда и и у малы. Например, если q(x,y) = ху, то левая часть равенства C.49) равна (х + и) (у + v) = ху + иу + xv + uv. Как вы покажете, правая часть C.49) есть ху + уи + xv. Если и и v малы, то величиной uv в первом выражении можно пренебречь и тогда два выражения будут приближенно равны. 3.18 (разд. 3.9). а. Для функции q(x,y) = ху запишите частные производные dq/dx и dq/dy. Предположим, что мы измеряем х и у с погрешностями Ьх и Ьу и затем вычисляем q(x у). Используя общие правила C.47) и C.48), найдите погрешность 6q для двух случаев, когда бх и 8у независимы и случайны и когда это не так. Разделите левую н правую части этих выражений для 6q на \q\ = \ху\ и покажите, что вы получаете простые правила C.18) и C.19) для относитель- относительной погрешности произведения. б. Выполните задание «а» для функции q(x, у) = х"ут, где пит — известные фиксированные числа. в. Какой внд примут формулы C.47) и C.48) в случае, когда q(x) зависит только от одной переменной? *3.19 (разд. 3.9). Если мы измеряем три независимые величины х, у, г и затем вычисляем функцию, подобную q = (х + у)/(х + г), то, как мы уже указывали в начале разд. 3.9, расчеты погрешности в q методом «шаг за шагом» могут дать ее завышенное значение. а. Рассмотрите случай, когда измеренные величины равны х = 20 ± 1, у = 2; г = 0, и для простоты предположите, что бу и бг пренебре- пренебрежимо малы. Вычислите погрешность б<? строго, используя общее правило C.47), и сравните полученный результат с тем, который вы получили бы, если бы рассчитывали 6q методом «шаг за шагом». б. Сделайте то же для значений х = 20 ± 1; у = —40; 2 = 0. Объ- Объясните разницу в результатах для заданий «а» и «б».
Глава 4 Статистический анализ случайных погрешностей Мы уже видели, что один из лучших способов оценить достоверность измерений состоит в том, чтобы повторить их несколько раз и затем сравнить между собой различные по- полученные значения. В этой и следующей главах мы рассмот- рассмотрим статистические методы обработки результатов измерений, полученных таким образом. Как уже отмечалось, не все виды экспериментальной по- погрешности можно выявить на основе статистической обра- обработки многократных измерений. По этой причине погрешно- погрешности разделяются на две группы: случайные погрешности, ко- которые можно обрабатывать статистическими методами, и си- систематические погрешности, к которым эти методы неприме- неприменимы. Такая классификация ошибок описана в разд. 4.1. В большей части последующего материала этой главы наше внимание будет занято случайными погрешностями. В разд. 4.2 мы введем, правда без строгого обоснования, два важных определения, относящихся к ряду измеренных значений xi, ..., xN одной и той же величины х. Во-первых, мы опре- определим среднее значение, или среднее х, для х\, ..., хц. При определенных условиях среднее х является наилучшей оцен- оценкой х, основанной на измеренных значениях хи ..., xN. Затем мы определим стандартное отклонение для х\ хн. Оно обозначается как ах и характеризует среднюю погрешность в отдельных измеренных значениях х\, ..., xN. В разд. 4.3 приведен пример использования стандартного отклонения. В разд. 4.4 мы введем важное понятие стандартного откло- отклонения среднего. Оно обозначается ах и характеризует погреш- погрешность среднего х как наилучшей оценки х. В разд. 4.5 приве- приведены некоторые примеры использования стандартного откло- отклонения среднего. Наконец, в разд. 4.6 мы вернемся к трудной проблеме систематических ошибок. Нигде в этой главе мы не будем пытаться дать строгое обоснование описываемых методов. Наша главная цель — ввести основные понятия и показать, как они используются. В гл. 5 мы приведем надлежащее обоснование, базирующееся на важном понятии нормального распределения.
88 Глава 4 4.1. Случайные и систематические ошибки Экспериментальные погрешности, которые можно обнару- обнаружить с помощью многократных измерений, называются слу- случайными ошибками, а те, которые нельзя обнаружить таким способом, называются систематическими ошибками. Чтобы проиллюстрировать различие между этими видами ошибок, рассмотрим несколько примеров. Предположим сначала, что мы измеряем время одного оборота равномерно вращающе- вращающегося диска. Одним из источников ошибок будет время нашей собственной реакции при запуске и остановке секундомера. Если бы это время реакции всегда было точно одним и тем же, то два запаздывания, обусловленные реакцией, компенси- компенсировали бы друг друга. Фактически, однако, время нашей реакции изменяется. Мы можем больше промедлить при за- запуске и таким образом недооценить время оборота или же больше задержаться при остановке секундомера и в этом случае переоценить время. Так как обе возможности равно- равновероятны, то знак эффекта случаен. При многократном повто- повторении измерения мы иногда будем переоценивать время, а иногда — недооценивать. Таким образом, переменное время нашей реакции проявится в различии полученных результа- результатов. Анализируя разброс в результатах методами статистики, мы можем получить очень достоверную оценку ошибки этого типа. С другой стороны, если наш секундомер постоянно от- отстает, то все измеренные значения времени будут недооце- недооценены и никакое количество повторений (с тем же секундоме- секундомером) не обнаружит этого источника ошибок. Ошибка такого типа называется систематической, поскольку она всегда сме- смещает наш результат в одну сторону. (Если секундомер отстает, мы всегда недооцениваем время, если спешит — всегда переоцениваем.) Систематические ошибки нельзя об- обнаружить теми статистическими методами, которые мы сей- сейчас будем рассматривать. В качестве второго примера проявления случайных и си- систематических ошибок рассмотрим измерение точно опреде- определенной длины с помощью линейки. Один из источников по- погрешности — это необходимость в интерполяции между мет- метками шкалы, и эта погрешность, очевидно, случайна. (При интерполяции мы с равной вероятностью как переоцениваем, так и недооцениваем результат.) Но имеется также вероят- вероятность того, что наша линейка дефектна, а этот источник по- погрешности будет, вероятно, приводить к систематической •ошибке. (Если линейка растянута, мы всегда недооцениваем результат, если сжата — всегда переоцениваем.)
Статистический анализ случайных погрешностей 89 Подобно этим двум примерам, почти все измерения под- подвержены как случайным, так и систематическим погрешно- погрешностям. Вам не трудно было бы привести и другие примеры. В частности, обратите внимание на то, что типичные источ- источники случайных погрешностей — это небольшие ошибки на- наблюдателя (как в случае интерполяции), небольшие помехи, воздействующие на аппаратуру (подобные механическим виб- вибрациям), проблемы определения и некоторые другие. Воз- Возможно, наиболее очевидная причина систематической ошиб- ошибки—это раскалибровка приборов (подобно отстающему секундомеру, вытянутой линейке или стрелочному прибору, у которого стрелка до начала измерений не была установлена на нуль). Различие между случайными и систематическими ошиб- ошибками не всегда можно ясно определить. Например, при изме- изменении положения вашей головы по отношению к типичному стрелочному прибору (например, обычным часам) результаты считывания будут изменяться. Этот эффект называется па- параллаксом, и он приводит к тому, что правильное считывание со шкалы возможно только в случае, когда ваша голова рас- расположена точно перед стрелкой. Даже если вы очень акку- аккуратный экспериментатор, вы не сможете расположить ваш глаз всегда точно перед стрелкой; следовательно, ваши изме- измерения будут содержать малые погрешности, связанные с па- параллаксом, и эта погрешность будет, вероятно, случайной. С другой стороны, неосторожный экспериментатор, который поставит стрелочный прибор сбоку от себя и забудет о влия- влиянии параллакса, внесет систематическую ошибку во все свои отсчеты. Таким образом, один и тот же эффект, параллакс, может привести к случайным погрешностям в одном случае и систематическим — в другом. Учет случайных ошибок совершенно отличен от учета систематических ошибок. Статистические методы, описанные в следующем разделе, дают достоверную оценку случайных погрешностей и, как мы увидим, указывают на точно опреде- определенный способ их уменьшения. С другой стороны, системати- систематические погрешности трудно оценить и даже обнаружить. Опытный ученый должен уметь предвидеть возможные источ- источники систематических ошибок и обеспечить, чтобы все остав- оставшиеся систематические ошибки были значительно меньше требуемой точности. Для этого потребуется, например, повер- поверка стрелочных приборов по принятым стандартам, их исправ- исправление, или даже, если необходимо, приобретение более совер- совершенных приборов. К сожалению, в учебной физической лабо- лаборатории такая поверка приборов возможна только в редких случаях, поэтому учет систематических ошибок всегда пред- представляет собой трудное дело. Мы еще вернемся к этому во-
$0 Глава 4 просу в разд. 4.6, а пока будем рассматривать эксперименты, для которых все источники систематических ошибок выяв- выявлены и приняты меры, чтобы эти ошибки были намного меньше требуемой точности. 4.2. Среднее и стандартное отклонение Предположим, что нам надо измерить некоторую вели- величину х и что мы выявили все источники систематической ошибки и уменьшили их влияние до пренебрежимо малого уровня. Поскольку все оставшиеся источники ошибок слу- случайны, мы будем в состоянии обнаружить их, многократно повторяя измерения. Можно было бы, например, выполнить измерения пять раз и получить разультаты 71, 72, 72, 73, 71 D.1) (где для удобства мы опустили единицы измерения). Первый вопрос, который можно задать: если дано пять измеренных значений D.1), то что мы должны принять за наилучшую оценку хнаил нашей величины х? Представляется разумным, чтобы нашей наилучшей оценкой было среднее значение, или среднее х пяти найденных значений, и в гл. 5 мы докажем, что это обычно так и будет. Таким образом, 71 + 72 + 72 + 73 + 71 ( 2 хнаил— х— к —/1|О. V*-*-) В этом выражении дробь после второго знака равенства — просто определение среднего х для данных чисел '). В более общем случае предположим, что мы производим N измерений величины х (используя одну и ту же аппаратуру и метод измерения) и получаем N значений: хи х2, .... xN. D.3) И на этот раз наилучшей оценкой величины х обычно будет среднее значение от хи ..., xN, т. е. ') В наш век карманных калькуляторов, возможно, стоит заметить, что усреднение, подобное D.2), легко произвести в уме. Поскольку все числа находятся в седьмом десятке, то же должно быть верно и для среднего значения. Остается лишь усреднить числа 1, 2, 2, 3, 1 в позиции единиц. Они, очевидно, усредняются как 9/5 •= 1,8, и иаш результат будет ic = 71,8.
Статистический анализ случайных погрешностей 91 где N X2 N .+ XN D.5) В последней строке мы ввели полезное обозначение 2, со- согласно которому N Е *,-= Е **= Е xi=x\ + *2 +•••+%, i = l / где второе и третье выражения — обычные сокращения, кото- которые мы будем использовать, когда не возникает опасности путаницы. Понятие среднего значения, или среднего, конечно, хо- хорошо знакомо большинству читателей. Следующее наше по- понятие, стандартное отклонение, вероятно, менее известно. Стандартное отклонение результатов измерений хи ..., xN — это оценка средней погрешности результатов измерений х\, .., ..., xN, которое определяется следующим образом. Если принять, что среднее х — это наилучшая оценка ве- величины х, то естественно рассмотреть разность я,- — х = di. Эта разность, часто называемая отклонением (или остатком) Xi от х, показывает, насколько результат 1-го измерения xi отличается от среднего значения х. Если отклонения di = = Xi — х очень малы, то результаты наших измерений близки друг к другу и, вероятно, очень точны. Если некоторые из отклонений велики, то наши измерения, очевидно, не очень точны. Чтобы быть уверенными, что мы усвоили понятие откло- отклонения, вычислим отклонения для набора пяти результатов Таблица 4.1. Вычисление отклонений Номер измерения i 1 2 3 4 5 71 72 72 73 71 Измеренное значение jc. Отклонение d- — x> — х x = 71,8 -0,8 0,2 0,2 1,2 -0,3 d=0,0
•92 Глава 4 измерений, приведенных в D.1). Результаты расчета пред- представлены в табл. 4.1. Обратите внимание, что отклонения (конечно же) не все одинаковы; di мало, если в i-м резуль- результате измерения xi оказывается близким к х, но di велико, если Xi далеко отстоит от х. Заметьте также, что некоторые из di положительны, а некоторые — отрицательны, так как неко- некоторые Xi должны быть больше среднего значения х, а неко- некоторые — меньше. Чтобы оценить достоверность результатов измерений Х\, ..., xs в среднем, мы могли бы, естественно, попытаться усреднить отклонения dt. К. сожалению, как показывает табл. 4.1, среднее значение отклонений равно нулю. На самом деле так будет в случае любого набора результатов измере- измерений х\, ..., xN, поскольку уже само определение среднего значения х ведет к тому, что di — xi — х иногда положи- положительны, а иногда отрицательны таким образом, чтобы d было равно нулю (см. задачу 4.3). Очевидно поэтому, что среднее отклонений — это не лучшая характеристика достоверности результатов измерений х\, ..., Хы- Лучший способ обойти эту неприятность — возвести в квадрат все отклонения, которые в этом случае будут обра- образовывать набор положительных чисел, а затем усреднить эти числа1). Если мы теперь извлечем квадратный корень из полученного результата, то получим величину, которая изме- измеряется в тех же единицах, что и сама величина х. Это число называется стандартным отклонением xi, ..., Хы и обозна- обозначается ох: V Исходя из этого обозначения, стандартное отклонение (или СО) можно описать как среднеквадратичное отклонений ре- результатов измерений Х\, ..., Xn2). Можно показать, что это полезный способ оценки достоверности измерений. (Как мы увидим вскоре, определение D.6) иногда модифицируется таким образом, что в знаменателе вместо N стоит N— 1.) ') Другой возможностью было бы вычисление абсолютных значений \di\ и последующее их усреднение, но оказывается, что усреднение d4- бо- более полезно. Среднее значение [d;| иногда называют (ошибочно) средним отклонением. 2) В оригинале для этого понятия автор приводит известную аббре- аббревиатуру на английскоыг языке — R. M. S. (root mean square). В литературе па русском языке нет эквивалентной общепринятой аббревиатуры, однако и этой книге для удобства мы будем использовать аббревиатуру СО (стан- (стандартное отклонение). — Прим. персе.
Статистический анализ случайных погрешностей 93 Таблица 4.2. Вычисление стандартного отклонения Номер измерения Измеренное i значение x-t Отклонение 1 2 3 4 б 71 72 72 73 71 -0,8 0,2 0,2 1,2 -0,8 0,64 0,04 0,04 1,44 0,64 jc = 71,8 Чтобы вычислить стандартное отклонение ох в соответ- соответствии с D.6), мы должны сначала рассчитать отклонения dit возвести их в квадрат, усреднить эти квадраты и затем из- извлечь квадратный корень из среднего. Для пяти измерений из табл. 4.1 мы могли бы рассчитать ох, как показано в табл. 4.2. Суммируя числа d2. из четвертого столбца табл. 4.2 и деля сумму на 5, мы получим величину а2х (часто называемую дис- дисперсией измерений): Извлекая квадратный корень, находим стандартное отклоне- отклонение ах « 0,7. D.8) Таким образом, средняя погрешность результатов пяти изме- измерений 71, 72, 72, 73, 71 приближенно равна 0,7. К сожалению, имеется альтернативное определение стан- стандартного отклонения. Существуют теоретические аргументы, согласно которым фактор N в D.6) следует заменить на (N— 1), и поэтому стандартное отклонение ох для хи ..., хц определяется как D-9) Здесь мы не будем пытаться доказать, что определение D.9) для Ох лучше, чем D.6), но отметим, чго новое «улучшенное» определение, очевидно, приводит к немного большему значе- значению, чем старое D.6), и это несколько компенсирует недо-
94 Глава 4 оценку погрешности в результатах измерений х\, ..., xN, осо- особенно в случае, когда число измерений N мало. Существова- Существование такой тенденции можно понять, если рассмотреть пре- предельный (и абсурдный) случай, когда jV = 1 (т. е. когда мы сделали только одно измерение). В этом случае среднее зна- значение х равно единственному значению Х\ и единственное отклонение автоматически равно нулю. Следовательно, опре- определение D.6) приводит к абсурдному результату, что ох = 0. С другой стороны, определение D.9) приводит к неопределен- неопределенности типа 0/0, т. е., согласно D.9), ох — неопределенная ве- величина, что корректно отражает нашу полную неосведомлен- неосведомленность о погрешности после выполнения только одного изме- измерения. Определение D.6) иногда называют стандартным от- отклонением генеральной совокупности, а D.9)—выборочным стандартным отклонением'). Различие между двумя выражениями D.6) и D.9) в чис- численном отношении почти всегда незначительно. Каждый мо- может повторить измерение много раз (по крайней мере пять раз и предпочтительнее много больше). Даже если мы про- произведем только пять измерений (N = 5), разница между y\jN = 2,2 и <sjN—1=2 для большинства приложений не- незначительна. Например, если мы пересчитаем стандартное отклонение D.8) с помощью «улучшенного» определения D.9), то получим ох = 0,8 вместо 0,7, т. е. не такую уж значительную разницу. Тем не менее необходимо знать, что существуют два определения. Вероятно, всегда лучше исполь- использовать более консервативное (т. е. приводящее к большему значению) определение D.9), но в любом случае в отчете по лабораторной работе всегда должно быть ясно указано, какое определение использовано, чтобы читатель смог про- проверить расчеты. 4.3. Стандартное отклонение как погрешность единичного измерения Мы отметили, что стандартное отклонение ах характери- характеризует среднюю погрешность результатов измерений Х\, ..., xN, по которым оно было вычислено. В гл. 5 мы приведем обосно- обоснование этого, доказав следующее более точное утверждение. Если результаты наших измерений распределены нормально и если мы повторим измерение х очень большое число раз (всегда с той же аппаратурой), то приблизительно 70% ре- *) В литературе на русском языке выражение D.6) называют, как правило, смещенной оценкой, а D.9) — соответственно несмещенной оцен- оценкой стандартного отклонения, но обе оценки — выборочные, т. е. зависят от выборки. — Прим. перев.
Статистический анализ случайных погрешностей 95 зультатов наших измерений ') будут лежать в пределах ах от х, т. е. 70% результатов наших измерений будут лежать в интервале х ± ох. Это утверждение можно перефразировать следующим образом. Предположим, как и прежде, что мы получили зна- значения х\, ..., Хы и вычислили х и ах. Если затем мы делаем еще одно измерение (с той же аппаратурой), то вероятность того, что результат нового измерения будет лежать в преде- пределах ох от х, равна 70 %. Далее, если число измерений N было велико, то х должно быть очень надежной оценкой действи- действительного значения х. Следовательно, мы можем сказать, что вероятность того, что единичное измерение (полученное с той же аппаратурой) не будет отличаться более чем на ох от действительного значения, равна 70%. Ясно, что ох означает именно то, для чего мы использовали термин «погрешность» в предыдущих главах. Если мы делаем одно измерение вели- величины х, используя данную аппаратуру, то погрешность, свя- связанная с этим измерением, должна быть оценена как Ьх — ох\ при таком выборе погрешности мы на 70% уверены, что ре- результат нашего измерения будет лежать в пределах 6х от фактического значения. Чтобы проиллюстрировать использование этих понятий, предположим, что у нас имеется коробка с одинаковыми пру- пружинами и что нас попросили измерить их коэффициенты упругости k. Вы могли бы измерять коэффициенты упругости, подвешивая грузы к каждой пружине и определяя растяже- растяжение или, что, пожалуй, лучше, подвешивая какую-то массу к каждой пружине и измеряя время ее колебаний. Какой бы метод мы ни выбрали, нам необходимо узнать k и его погреш- погрешность 6k для каждой пружины, но было бы бесполезным расточительством времени многократное повторение наших измерений для каждой пружины. Вместо этого можно рас- рассуждать следующим образом. Если мы измерим k для первой пружины несколько раз (скажем, 10 или 20), то среднее этих измерений должно дать хорошую оценку k для первой пру- пружины. Более важно в этом случае то, что стандартное откло- отклонение Ok этих 10 или 20 измерений дает нам оценку погреш- погрешности нашего метода измерений k. При условии, что все наши пружины в достаточной степени одинаковы и что мы исполь- используем один и тот же метод измерения, мы могли бы с доста- достаточным основанием ожидать той же самой погрешности в любом другом измерении2). Таким образом, для каждой *) Как мы увидим, точное число равно 68,27...%, но, очевидно, аб- абсурдно с такой точностью приводить подобные числа. 2) Если какие-то пружины сильно отличаются от первой, то погреш- погрешность измерения для них могла бы быть другой. Таким образом, если
96 Глава 4 последующей пружины нам нужно провести только одно изме- измерение, и мы можем сразу же сделать вывод, что поскольку 6k равна стандартному отклонению оь, полученному для первой пружины, то с вероятностью 70% наш результат будет ле- лежать в пределах Ok от фактического значения. Чтобы численно проиллюстрировать эти понятия, предста- представим себе, что проведено 10 измерений для первой пружины и получены следующие значения k (в ньютонах на метр): 86, 85, 84, 89, 86, 88, 88, 85, 83, 85, D.10)) По этим данным мы вычисляем k = 85,9 Н/м и по определе- определению D.9) ofe=l,9 Н/м» D.11) ~ 2 Н/м. D.12) Следовательно, погрешность в любом отдельном измерении k составляет примерно 2 Н/м. Если мы теперь сделаем одно измерение для второй пружины и получим результат k = = 71 Н/м, то можно без дальнейших хлопот принять, что 8k = Ok = 2 Н/м, и утверждать с 70%-ной вероятностью, что k для второй пружины = 71 ±2 Н/м. D.13) 4.4. Стандартное отклонение среднего Если х\, ..., Xn — результаты N измерений одной и той же величины х, то, как мы видели, наша наилучшая оценка величины х есть их среднее х. Мы также видели, что стан- стандартное отклонение ох характеризует среднюю погрешность отдельных измерений х\, ..., xN. Однако наш результат хнаил = х есть разумная комбинация всех N измерений, и по- потому имеются основания полагать, что он будет более на- надежным, чем любое из отдельных измерений. В гл. 5 мы дока- докажем это, т. е. получим, что погрешность в нашем результате Хняил = х равна стандартному отклонению ох, деленному на <\/~N. Эта величина называется стандартным отклонением среднего и обозначается ох: D.14) (Другие названия — стандартная ошибка или стандартная ошибка среднего.) Таким образом, основываясь на N изме- пружины существенно различны, мы были бы вынуждены проверить по- погрешность, выполняя многократные измерения для каждой из небольшого числа различающихся пружин.
Статистический анализ случайных погрешностей 97 ренных значениях хь ..., Xn, мы можем сформулировать наш окончательный результат для значения величины х как (значение х) = л;наНл ± &х, где х„аил = х (х— среднее от х\, ..., xN), а Ьх — стандартное отклонение среднего J/ D.15) В качестве примера рассмотрим десять результатов изме- измерений, приведенных в D.10). Это результаты десяти измере- измерений коэффициента упругости k одной пружины. Как мы уже знаем, среднее этих значений есть k = 85,9 Н/м и стандарт- стандартное отклонение равно 0^=1,9 Н/м. Следовательно, стан- стандартное отклонение среднего равно с- = afe/yT6 = 0,6 Н/м, D.16) и наш окончательный результат, основанный на этих десяти измерениях, для коэффициента упругости пружины будет равен * = 85,9 ±0,6 Н/м. D.17) Когда вы приводите ответ, подобный этому, то важно ука- указать, что означают ваши числа, а именно среднее и стандарт- стандартное отклонение среднего, — так чтобы читатель был в со- состоянии судить об их значимости. Важной величиной в стандартном отклонении среднего ах = ox/^jN является множитель *\/N в знаменателе. Стан- Стандартное отклонение ах характеризует среднюю погрешность в индивидуальных измерениях х\ xN. Поэтому, если бы мы должны были выполнить еще несколько измерений (ис- (используя ту же самую аппаратуру), то это не привело бы к заметному изменению стандартного отклонения ах. С дру- другой стороны, стандартное отклонение среднего oJ^N мед- медленно уменьшалось бы с увеличением N. Именно этого мы бы и ожидали. Если бы мы выполнили большее количество измерений перед вычислениями среднего значения, то мы, естественно, ожидали бы, что конечный результат будет более надежным, а именно это и гарантирует знаменатель ^Jfj в D.15). Этот фактор обеспечивает также очевидный способ увеличения точности наших измерений. К сожалению, л/N возрастает довольно медленно с уве- увеличением N. Например, если мы хотим увеличить точность в 10 раз просто за счет увеличения числа измерений N, мы должны были бы увеличить N в 100 раз — перспектива, мягко говоря, пугающая! Более того, мы пока пренебрегали
98 Глава 4 систематическими ошибками, а они не уменьшаются с уве- увеличением числа измерений. Таким образом, на практике, если вы хотите значительно повысить точность, вы, вероятно, по- поступите лучшим образом, если будете совершенствовать вашу аппаратуру, а не уповать на увеличение числа измерений. 4.5. Примеры В качестве первого простого примера применения стан- стандартного отклонения среднего представим себе, что мы должны очень точно измерить площадь А прямоугольной пластинки размером примерно 2,5 см X 5 см. Сначала мы подберем подходящий измерительный прибор, которым может быть штангенциркуль, и затем сделаем несколько измерений длины / и ширины b пластинки. Чтобы учесть неоднородности сторон, мы выполним измерения для нескольких различных положений пластинки, а небольшие дефекты прибора учтем, используя несколько различных штангенциркулей (если они имеются). Мы могли бы сделать по десять измерений величин / и b и получить результаты, показанные в табл. 4.3. По десяти полученным значениям / мы легко можем вы- вычислить среднее I, стандартное отклонение oi и стандартное отклонение среднего ог, что показано в столбцах, обозначен- обозначенных как среднее, СО и СОС1). Аналогично мы можем вычис- вычислить Б, оь и аь. Прежде чем производить еще какие-либо расчеты, необходимо проанализировать эти результаты, чтобы убедиться, разумны ли они. Например, два стандартных отклонения ст( и оь — это, как известно, средние погрешности в измерениях / и Ь. Поскольку / и b измерялись одним и тем же методом, то было бы довольно странно, если бы о/ и оь существенно отличались друг от друга или от той величины, которую мы принимаем за разумную погрешность измерений. Только убедившись в том, что полученные до сих пор результаты вполне надежны, мы можем быстро закончить расчеты. Наша наилучшая оценка для длины есть среднее 7, а ее погрешность — СОС, of, таким образом, окончательный результат для / будет / = 24,245 ± 0,006 мм (или 0,025 %), где число в скобках есть относительная погрешность в про- процентах. Аналогично результат для b имеет вид Ь = 50,368 ±0,008 мм (или 0,016%). ') Автор использует принятую на английском языке аббревиатуру для понятия стандартного отклонения среднего (SDOM — standard deviation of the mean). Для удобства мы будем использовать в соответствующих местах для понятия стандартного отклонения среднего аббревиатуру СОС. — Прим. перев.
Статистический анализ случайных погрешностей 99 Таблица 4.3. Длина и ширина (в миллиметрах) Измеренные значения Среднее СО СОС , 24,25; 24,26; 24,22; 24,28; 24,24 / = 24,245 а =0,019 а-=0,006 1 24,25; 24,22; 24,26; 24,23; 24,24 ' ' . 50,36; 50,35; 50,41; 50,37; 50,36 6 = 50,368 а =0,024 о, = 0,008 0 50,32; 50,39; 50,38; 50,36; 50,38 ь ь Наконец, наша наилучшая оценка для площади А = 1Ъ равна произведению этих значений длины и ширины, а ее относи- относительная погрешность определяется квадратичной суммой от- относительных погрешностей в / и Ъ (в предположении, что ошибки независимы): А = B4,245 мм ±0,025%)-E0,368 мм ±0,016%) = = 1221,17 мм2 ± 0,03 % = 1221,2 ±0,4 мм2. D.18) Чтобы получить результат D.18) для А, мы вычислили средние 7 и В с их погрешностями, равными стандартным отклонениям соответствующих средних. Затем мы рассчи- рассчитали площадь А как произведение 7 и б и определили погреш- погрешность в А, как в косвенном измерении. Мы могли бы посту- поступить иначе. Например, можно было бы перемножить первые измеренные значения / и Ь и получить первое значение А. Продолжая тем же способом, мы могли бы получить десять результатов для А и затем, применяя методы статистики к этим 10 результатам, рассчитать Л, ол и, наконец, о_. Однако, если ошибки в / и Ъ независимы и случайны и если мы проделали достаточно измерений, этот альтернативный метод даст (как можно показать) тот же самый результат, что и предыдущий метод1). В качестве второго примера рассмотрим случай, когда нельзя применять обычные статистические методы к резуль- результатам прямых измерений, но можно — к конечным резуль- результатам. Предположим, что мы хотим измерить коэффициент 4) Во втором методе имеется определенная логическая непоследова- непоследовательность, поскольку иет каких-либо особых причин связывать результат первого измерения / с первым измерением Ь. В самом деле, мы могли бы измерить / восемь раз, а Ь 12 раз, и тогда невозможно было бы образо- образовать пары величин. Таким образом, с логической точки зрения наш первый метод предпочтителен.
100 Глава 4 упругости k пружины, определяя период колебаний для не- некоторой массы т, прикрепленной к ее концу. Из элементар- элементарной механики известно, что период таких колебаний равен Т — 2п ^m/k. Таким образом, измеряя Тит, мы можем найти k по формуле 1г = 4я2т/Т2. D.19) Простейший способ определить k — это взять одну массу га, известную с заданой точностью, и проделать несколько акку- аккуратных измерений Т. Однако по разным причинам более интересным было бы измерение Т для разных масс т. (На- (Например, в этом случае наряду с измерением k мы могли бы проверить, что Т~<\/т.) Тогда можно было бы получить ряд значений, подобных приведенным в двух первых строках табл. 4.4. Очевидно, нет никакого смысла усреднять значения раз- разных масс, приведенных в первой строке (а также и значения периодов во второй строке), так как они не являются раз- различными результатами измерений одной и той же величины. Мы также ничего не сможем сказать о погрешности наших измерений, если будем сравнивать эти разные значения т. С другой стороны, каждое значение га можно объединить с соответствующим значением периода Т и вычислить k, как показано в последней строке табл. 4.4. Наши данные для k в последней строке представляют собой результаты измере- измерений одной и той же величины, и, таким образом, к ним при- применимы статистические методы. В частности, наилучшей оценкой k будет среднее k = 13,16 Н/м, а погрешностью — стандартное отклонение среднего og = 0,06 Н/м (см. за- задачу 4.12). Таким образом, итоговый результат, основанный на данных табл. 4.4, имеет вид коэффициент упругости пружины k= 13,16±0,06 Н/м. D.20) Если бы мы получили разумные оценки погрешностей для наших исходных измерений га и Т, то мы также могли бы оценить погрешность k, используя соответствующие статисти- статистические методы расчета ошибок и положив в основу эти Таблица 4.4. Измерение коэффициента упругости пружины k 0,634 0,691 0,752 0,834 0,901 0,950 1,36 1,44 1,50 1,59 1,65 1,69 и т.д. Масса ш, кг Период Т, с k = 4я-т/Г2 0,513 1,24 13,17 0,581 1,33 12,97
Статистический анализ случайных погрешностей 101 оценки для 8т и 67м). В этом случае неплохо было бы срав- сравнить погрешности в k, полученные двумя методами. 4.6. Систематические ошибки В последних нескольких разделах мы считали как нечто само собой разумеющееся, что все систематические ошибки сведены до пренебрежимо малого уровня еще до начала изме- измерений. Сейчас мы вновь вернемся к той неприятной ситуации, когда имеются заметные систематические ошибки. В рассмот- рассмотренном выше примере мы могли бы измерять т на весах, которые систематически давали бы завышенные или зани- заниженные показания, или наши часы могли бы спешить или отставать. Ни одна из этих систематических ошибок не вы- выявилась бы в процедуре сравнения различных результатов для коэффициента упругости пружины k. Отсюда можно сде- сделать вывод, что стандартное отклонение среднего Og следует рассматривать как случайную составляющую 8kci] погреш- погрешности 8k, но определенно не как полную погрешность 8k. Наша задача состоит в том, чтобы решить, как оценить си- систематическую составляющую басист, а затем — как скомби- скомбинировать б&сл и басист, чтобы получить полную погрешность 8k. Не существует простой теории, которая указала бы, как нам поступать с систематическими ошибками. Фактически единственная теория систематических ошибок состоит в том, что они должны быть выявлены и уменьшены до такой сте- степени, пока не станут намного меньше требуемой точности. Однако в учебной лаборатории это сделать часто невозможно. Как правило, нет возможности поверить стрелочный прибор относительно более надежного, чтобы исправить его, и еще меньше шансов — купить новый прибор, чтобы заменить не- неисправный старый. По этой причине в некоторых учебных лабораториях принято за правило, что в условиях отсутствия точной информации каждому прибору следует приписать ка- какую-то определенную систематическую погрешность. Напри- Например, можно было бы решить, что все секундомеры имеют 0,5%-ную систематическую погрешность, все весы — 1%-ную, все вольтметры и амперметры — 3%-ную и т. д. Вооружившись правилами такого типа, можно продви- продвигаться дальше разными путями. Выбор каждого из них не- невозможно строго обосновать, и сейчас мы рассмотрим только ') В литературе на русском языке измерения, результаты которых приведены в табл. 4.4, называются совместными измерениями двух ве- величин m и Т. Адекватный статистический метод обработки результатов таких измерений — это метод наименьших квадратов (МНК). Автор рас* сматривает этот метод в гл. 8. — Прим. перев.
102 Глава 4 один из путей. В случае последнего примера из разд. 4.5 коэффициент упругости пружины k = Ап2т/Т определялся с помощью измерений ряда значений m и соответствующих значений Т. Как было отмечено, статистический анализ раз- различных значений k приводит к следующей случайной состав- составляющей 8k: 6?сл = <rs = 0,06 Н/м. D.21) Пусть нам известно, что весы, используемые для измерения т, и часы, используемые для измерения Т, имеют систематиче- систематические погрешности 1 и 0,5% соответственно. Теперь мы можем найти систематическую составляющую погрешности 8k мето- методом расчета ошибок в косвенных измерениях, причем возни- возникает только один вопрос: складывать ошибки квадратично или непосредственно? Поскольку ошибки в m и в Т опреде- определенно независимы и поэтому возможна некоторая компенса- компенсация, то, вероятно, разумно использовать квадратичную сумму, которая дает') /(^у(^J= D.22) = У1 + 1% = 1,4% D.23) и, следовательно, 6?сист = A3,16 Н/м)-0,014 = 0,18 Н/м. D.24) Теперь, поскольку мы оценили как случайную, так и систе- систематическую составляющие 8k, нам остается только как-то QKOM6nHHpoBaTb их, чтобы получить саму величину 6ft. Можно было бы обосновать необходимость их квадратичного сложения, и тогда полная погрешность имела бы вид J + FйсистJ = D.25) J + @,18J «0,2 Н/м. D.26) В этом примере систематическая погрешность полностью до- доминирует над случайной. Выражение D.25) для 8k не может быть строго доказано. Не ясен также смысл полученного выражения; например, ') Должны ли мы использовать квадратичную или обычную сумму, з действительности зависит от того, что подразумевают под утверждением, что весы имеют «1 %-ную систематическую погрешность». Если это утвер- утверждение имеет тот смысл, что ошибка определенно не превышает 1 % (и аналогично для Часов), то адекватным будет прямое сложение и 8?Сисг тогда определенно не будет превышать 2 %. С другой стороны, поверка всех весов в лаборатории может показать, что для них справедливо нор- нормальное распределение, и поэтому 70 % из них имеют погрешность мень- меньшую, чем 1 % (и аналогично для часов). В этом случае мы должны были бы использовать квадратичное сложение, как в D.22), и приписывать 70 %-ную вероятность для получающегося интервала.
Статистический анализ случайных погрешностей 103 мы, по-видимому, не можем утверждать, что с вероятностью 70% истинное значение лежит в интервале ?±6&. Тем не менее это выражение дает по крайней мере разумную оценку полной погрешности в условиях, когда наши приборы имеют систематические погрешности, которые мы не смогли ликви- ликвидировать. В частности, существует один важный аспект, вследствие которого результат D.25) правдоподобен и поучи- поучителен. В разд 4.4 мы видели, что стандартное отклонение среднего сгй стремится к нулю с увеличением числа измере- измерений N. Это положение означало, что если вы запаслись тер- терпением и выполняете огромное число измерений, то можете бесконечно уменьшать погрешность, не совершенствуя вашего оборудования или метода измерений. Теперь мы можем ви- видеть, что в действительности это не так. Увеличение N приве- приведет к неограниченному уменьшению случайной составляющей 6&са = сг?. Но любая данная аппаратура характеризуется не- некоторыми систематическими погрешностями, которые не уменьшаются, когда мы увеличиваем N. Из D.25) ясно, что нет большой выгоды в дальнейшем уменьшении 6йсл, когда величина 6йсл стала меньше басист. В частности, полная 8k никогда не может быть меньше 6йСИст. Все это только под- подтверждает то, о чем мы уже догадывались, а именно что на практике значительное уменьшение погрешности требует улучшений в методе измерений или в оборудовании, чтобы уменьшить как случайную, так и систематическую ошибки в каждом отдельном измерении. Задачи Напоминание: звездочка у номера задачи означает, что задача реша- решается или ее ответ приводится в разделе «Ответы» в конце книги. *4.1 (разд. 4.2). Студент измеряет величину х пять раз и получает результаты 5, 7, 9, 7, 8. Вычислите среднее значение х и стандартное отклонение ах. (Выполните расчеты самостоятельно, не пользуясь калькулятором. Укажите, какое определение ах вы используете.) 4.2 (разд. 4.2). Вычислите среднее значение и стандартное отклонение результатов десяти измерений, приведенных в D.10). (Ответы приведены в тексте книги, но важно, чтобы вы действительно выполнили расчеты сами. Вам необходимо подумать об аккуратной, красивой форме представ- представления результатов расчетов; одна из возможностей показана в табл. 4 2.) *4.3 (разд. 4 2). Среднее х от N величин х\, ..., xn определено как их сумма, деленная ва N, т. е. * = (]Fj xi)JN. Отклонение величины xi есть разность d; = х,- — х. Покажите, что среднее отклонений d., ...,й„ автоматически равно нулю. Если вы не привыкли к обозначению 2_,, то, возможно, вам полезно будет решить эту задачу как с этим обозначением, так и без него. Напри- Например, запишите сумму ^ (xt — х)как (*[ — х) + (хг — х) + ... + (xN — х) н произведите перегруппировку членов.
104 Глава 4 *4.4 (разд. 4.2). Чтобы вычислить стандартное отклонение <зх для N измерений Xi xN, необходимо найти сумму ^ [xt — хJ. Докажите, что эту сумму можно представить в виде (Это хорошее упражнение по использованию обозначения /1. Результат очень полезен на практике, и именно по этой формуле вычисляется <зх во всех карманных калькуляторах.) 4.5 (разд. 4.2). Вычислите снова стандартное отклонение по данным задачи 4 1, используя тождество {4.27). 4.6 (разд. 4.3). Студент измеряет период колебаний маятника трн раза и получает результаты 1,6; 1,8; 1,7 (все в секундах). Чему равны среднее значение и стандартное отклонение? (Используйте определение D.9) стан- стандартного отклонения.) Если студент произведет четвертое измерение, то какова вероятность того, что результат этого нового измерения будет ле- лежать вне интервала от 1,6 до 1,8 с? (Очевидно, эти числа выбраны не слу- случайно. В гл. 5 мы увидим, как решать такие задачи в случае произволь- ных границ интервала.) *4.7 (разд. 4.3). а. Вычислите среднее ? и стандартное отклонение о/ для следующих 30 результатов измерений времени t (все в секундах). Вам потре- потребуется калькулятор, но вы будете нажимать гораздо меньше кно- кнопок, если догадаетесь, что необходимо усреднять, в сущности, только две последние цифры, и если вы перед вычислениями сдви- сдвинете десятичную запятую на две позиции вправо. Если у вашего калькулятора нет операции вычисления стандартного отклонения, то вам, вероятно, следует воспользоваться тождеством D.27) 8,16;8,14;8,12;8,16;8,18;8,10;8,18;8,18;8,18;8,24; 8,16;8,14;8,17;8,18;8,21;8,12;;8,12;8,17;8,06;8,10; 8,12;8,10;8,14;8,09;8,16;8,16;8,21;8,14;8,16;8,13. б. Мы знаем, что если выполнить большое число измерений, то можно ожидать, что приблизительно 70 % всех результатов окажется в пределах 0( от i (т.е. внутри интервала l + at). Как будет пока- показано в гл. 5, мы также можем ожидать, что приблизительно 95 % всех результатов окажется в пределах 2о< от ? (т. е. внутри интер- интервала 1 ± 2о(). Для результатов из задания «а» определите, сколько из них, как вы ожидаете, будет лежать вне интервала t ± at? А сколько на самом деле? Ответьте на эти же вопросы в случае интервала t ± 2о<. 4.8 (разд. 4.4). Вычислите стандартное отклонение среднего для пяти измерений из задачи 4.1. Какой итоговый вывод, включая приведение по- грешности бж, должен сделать студент относительно х? *4.9 (разд. 4.4). Если опираться на данные 30 измерений из зада- задачи 4.7, какова будет ваша наилучшая оценка для времени и его погреш- погрешности при условии, что все погрешности случайны? 4.10 (разд. 4.4). После нескольких измерений скорости звука и сту- студент приходит к выводу, что стандартное отклонение измерений равно 0И = Ю м/с. Предполагая, что все ошибки случайны, студент может до- добиться любой желаемой точности, выполняя достаточное число измерений и усредняя. Сколько измерений необходимо сделать, чтобы конечная по- погрешность результата составляла ±3 м/с? А сколько, если погрешность будет всего 0,5 м/с? *4.11 (разд. 4 5). В табл. 4.3 приведены результаты десяти измерений длины / и ширины b прямоугольника, которые используются для вычис- вычисления площади А = lb. Если бы измерения делались так, что каждый раз
Статистический анализ случайных погрешностей 105 определялась пара значении (одно значение / и одно Ь), то было бы есте- естественно перемножить результаты в каждой паре и получить значение А: первое / умножается на первое Ь и получается первое значение Л и т. д. Вычислите таким образом десять значений А, затем среднее А, стандарт- стандартное отклонение ал и стандартное отклонение среднего 0Т. Сравните ваши результаты для А и 0— с ответами D.18), полученными с помощью вы- вычислений 1 и Б (когда А определяется как произведение 15 и погрешности рассчитываются как в косвенных измерениях). (В случае большого числа измерений два метода должны приводить к одинаковым результатам.) 4.12 (разд. 4.5). Закончите вычисления коэффициента упругости пру- пружины k из табл. 4.4. Потом рассчитайте k и его погрешность (т. е. СОС, *«> *4.13 (разд. 4.6). а. Студент измеряет скорость звука, используя формулу и = fK, где f — частота, считываемая с циферблата звукового генератора, а К — длина волны, измеряемая по расположению нескольких макси- максимумов в резонирующем столбике воздуха. Так как измерения А, выполнялись несколько раз, их можно обработать методами стати- статистики, на основании которых студент делает вывод, что X = = П,2± 0,5 см. Измерение частоты f = 3000 Гц было произведено только один раз (установка генератора), и у студента нет основа- оснований, чтобы судить о надежности этого значения. Преподаватель го- говорит, что генератор «определенно надежен с погрешностью 1 %», следовательно, студент указывает 1 %-ную систематическую ошибку в f (но не в X). Какой ответ даст студент для и и ее погрешности? Важна ли 1 %-ная возможная систематическая ошибка генератора (возникающая вследствие недостаточно точной его калибровки)? б. Если бы результат измерений студента был % = 11,2 ±0,1 см, а калибровка генератора была бы произведена с 3%-ной погреш- погрешностью, то каков был ответ? Была бы важна систематическая ошибка?
Глава 5 Нормальное распределение В этой главе мы продолжим рассмотрение статистических методов обработки многократных измерений. В гл.4 мы ввели важные понятия среднего, стандартного отклонения и стан- стандартного отклонения среднего; мы обсудили их значение и рассмотрели некоторые примеры их использования. В этой главе будут рассмотрены теоретические обоснования этих ста- статистических понятий и доказаны некоторые из положений, ко- которые принимались без доказательств в предыдущих главах. Первая проблема, с которой приходится иметь дело при обсуждении многократных измерений, — это поиски методов, которые позволили бы выполнять различные операции со мно- многими полученными значениями и представлять эти значения. Один из удобных методов — использование распределения, или гистограммы, как описано в разд. 5.1. В разд. 5.2 мы введем понятие предельного распределения, т. е. распределения ре- результатов, которое получилось бы, если бы число измерений было бесконечно велико. В разд. 5.3 мы определим нормаль- нормальное распределение, или распределение Гаусса, которое опи- описывает предельное распределение результатов любого измере- измерения, подверженного большому числу небольших случайных ошибок. Как только математические характеристики нормального распределения будут поняты, мы без труда сможем присту- приступить к доказательствам нескольких важных положений. В разд. 5.4 мы докажем, что, как это уже было сказано в гл. 4, примерно 70% результатов всех измерений (одной и той же величины и полученных с помощью одной и той же аппа- аппаратуры) должны лежать в пределах одного стандартного отклонения от истинного значения. В разд. 5.5 мы докажем результат, использованный еще в гл. 1, что если произвести N измерений некоторой величины х и получить значения Х\, х2, ..., хц, то нашей наилучшей оценкой хнапя, основанной на этих значениях, будет среднее х = ? xJN. В разд. 5.6 приводится обоснование квадратичного сложения при расчете ошибок в косвенных измерениях, когда исходные ошибки не-
Нормальное распределение 107 зависимы и случайны. В разд. 5.7 доказывается, что погреш- погрешность среднего х, которое используется как наилучшая оцен- оценка х, определяется стандартным отклонением среднего ах = = Ох/л/N, как было постулировано в гл. 4. Наконец, в разд. 5.8 мы обсудим, как связать степень уверенности в ре- результате, выраженную в виде числовой характеристики, с са- самими экспериментальными результатами. Математический аппарат, используемый в этой главе, немного сложнее, чем применяемый до сих пор. Однако чи- читатель, внимательно следящий за обсуждением нормального распределения в разд. 5.3 (и выполняющий все расчеты с по- помощью карандаша и бумаги, если необходимо), будет в со- состоянии понять большинство аргументов без большого труда. 5.1. Гистограммы и распределения Очевидно, что серьезный статистический анализ результа- результатов эксперимента требует выполнения многократных изме- измерений. Таким образом, наша первая задача состоит в том, чтобы найти методы записи и представления большого числа измеренных значений. Предположим, например, что мы долж- должны были сделать десять измерений некоторой длины х. Напри- Например, х могло бы быть расстоянием от линзы до изображения, образованного линзой. Мы могли бы получить значения (все в см) 26, 24, 26, 28, 23, 24, 25, 24, 26, 25. E.1) При такой форме записи эти десять чисел сообщают довольно мало информации, и если бы мы должны были таким спосо- способом записать существенно больше результатов измерений, то в итоге получили бы беспорядочные джунгли чисел. Очевидно, требуется лучший способ. В качестве первого шага мы можем расположить числа E.1) в возрастающем порядке: 23, 24, 24, 24, 25, 25, 26, 26, 26, 28. E.2) Затем, вместо того чтобы делать три записи: 24, 24, 24, можно просто указать, что мы получили значение 24 три раза. Дру- Другими словами, мы можем записывать различные полученные значения х вместе с числом, указывающим, сколько раз полу- получено каждое значение, как показано в табл. 5.1. В этой таб- таблице мы ввели символ Xk {k — 1,2, ...), чтобы обозначить различные полученные значения: *i = 23; *2 = 24; х3 — 25 и т. д. Величины rik {k = 1, 2, ...) обозначают числа, пока- показывающие, сколько раз было получено соответствующее зна- значение хк: п\ = 1; п2 = 3 и т. д.
108 Таблица 5.1 Различные значения хи Число реализаций п^ Глава 5 23 24 1 3 25 2 26 3 27 0 28 1 Если записать результаты измерений, как в табл. 5.1, то можно переписать определение среднего х таким способом, который окажется более удобным. Из нашего старого опреде- определения мы знаем, что Y*i -_J^ __ 23 + 24 + 24 + 24 + 25 + • ¦ ¦ + 28 ,~ „. X— N — 10 . {0.6) Но это то же самое, что и - _ 23 + B4 X 3) + B5 X 2) + ¦ ¦ ¦ + 28 10 " или в общем случае Е xknk * = -— • E.4) В первоначальном варианте E.3) мы суммировали резуль- результаты всех сделанных измерений; в E.4) мы суммируем все различные полученные значения, умножая каждое значение на число, показывающее, сколько раз это значение реализо- реализовалось. Очевидно, что эти две суммы одинаковы, но оказы- оказывается, что представление E.4) более полезно в случае, когда мы делаем большое число измерений. Сумма, подобная E.4), иногда называется суммой с весовыми множителями или взве- взвешенной суммой, поскольку каждое значение Xk умножается на весовой множитель (взвешивается) — число itk, показы- показывающее, сколько раз это значение реализовалось. Отметим, что если мы сложим все числа пи, то получим полное число сделанных измерений N, т. е. %nk = N. E.5) (Например, в случае табл. 5.1, согласно этой формуле, сумма чисел в последней строке равна 10.) Понятия, обсуждаемые выше в этом разделе, можно сфор- сформулировать иным способом, который часто более удобен. Вме- Вместо того чтобы говорить, что результат х = 24 был получен три раза, мы можем сказать, что результат х = 24 был по- получен в 3/10 случаев от полного числа измерений. Другими словами, вместо использования nk, числа, показывающего, сколько раз получился результат Хь, мы введем отношение
Нормальное распределение 109 0,3 0,2 о 22 23 24 25 26 Z7 2В Рис. 5.1. Гистограмма результатов десяти измерений длины х. По верти- вертикальной оси отложена доля числа случаев Fk, когда наблюдается каждое значение Xk. представляющее собой долю полного числа N измерений, с которой реализуется результат xk, и будем называть его ча- частотой. Говорят, что частоты Fk характеризуют распределе- распределение результатов; они показывают, как результаты наших из- измерений распределены среди различных возможных значений. В терминах частот Fk мы можем переписать формулу E.4) для среднего х в компактном виде: E.7) Таким образом, среднее х есть взвешенная сумма всех различ- различных полученных значений Xk, т. е. когда каждое значение Xk умножается на частоту Fk, с которой оно реализуется. В E.7) предполагается, что E.8) т. е. если сложить частоты Fk всех возможных значений Xk, то должна получиться единица. Говорят, что если сумма какого-то набора чисел равна 1, то эти числа нормированы, поэтому выражение E.8) называют условием нормировки. Распределение результатов наших измерений можно пред- представить графически на гистограмме, как показано на рис. 5.1. Эта гистограмма есть график зависимости Fk от xk, на кото- котором по горизонтальной оси отложены различные измеренные значения Xk, а частоты, показывающие долю случаев, когда
ПО Глава 5 реализуется данное значение Xk, определяются высотой вер- вертикальных черточек, проведенных из Xk- (Можно начертить также график зависимости л* от Xk, но для наших целей бо- более удобен график зависимости Fk от х^) Данные, приве- приведенные на гистограмме типа рассмотренной, весьма наглядны, чем широко пользуются авторы газетных и журнальных пуб- публикаций. Гистограмма, подобная приведенной на рис. 5.1, может быть названа гистограммой для дискретной величины, так как распределение результатов показано высотой вертикальных черточек над дискретными значениями Xk- Такой тип гисто- гистограмм удобен в тех случаях, когда значения xk далеко от- отстоят друг от друга и имеют целые значения. (Например, оценки студентов на экзамене — обычно целые числа, и их удобно представить на такой гистограмме.) Однако в боль- большинстве случаев измерения не приводят к точным целым зна- значениям, так как большинство физических величин имеет не- непрерывный диапазон возможных значений. Например, вместо десяти длин, приведенных в E.1), вы можете получить сле- следующие существенно более вероятные значения: 26,4; 23,9; 25,1; 24,6; 22,7; 23,8; 25,1; 23,9; 25,3; 25,4. E.9) Гистограмма, построенная как для дискретной величины, для этих десяти значений состояла бы из десяти отдельных чер- черточек одинаковой высоты и содержала бы сравнительно мало информации. Если даны результаты измерений, подобные при- приведенным в E.9), то лучше всего разбить диапазон возмож- возможных значений на подходящее число интервалов, или «бинов», и сосчитать, сколько значений попадает в каждый бин. Напри- Например, мы могли бы сосчитать число результатов измерений из E.9) между х = 22 и 23, между х = 23 и 24 и т. д. Резуль- Результаты такого подсчета представлены в табл. 5.2. (Если резуль- результат измерения попадет точно на границу между двумя би- нами, то необходимо будет решить, куда его поместить. Про- Простой и разумный выход — половину результатов приписывать одному бину и половину — другому.) Результаты из табл. 5.2 можно нанести на график, кото- который мы назовем гистограммой для непрерывной величины, как показано на рис. 5.2. На этом графике доля от полного числа измерений, которая приходится на каждый бин, пока- Таблица 5.2 Бин 22-23 23—24 24—25 25—26 26—27 27—28 Число отсчетов 13 14 10 в бине
Нормальное распределение 111 Размер бина лк Рис. 5 2. Гистограмма для непрерывной переменной, показывающая долю измерений х, которая попадает в бины от значения 22 до 23, от 23 до 24 и т. д. Площадь прямоугольника над каждым интервалом равна доле из- измерений, которые попадают в этот интервал. Таким образом, если пло- площадь заштрихованного прямоугольника равна 0.3, то это означает, что 3/10 всех измерений лежат между 23 и 24. зана как площадь прямоугольника, расположенного над со- соответствующим бином. Таким образом, заштрихованный пря- прямоугольник над интервалом от х = 23 до х = 24 имеет пло- площадь 0,3 X 1 = 0,3, откуда следует, что 3/ю результатов изме- измерений попало в этот интервал. В общем случае мы обозначим ширину &-го бина через Ak. (Эти ширины обычно одинаковы, хотя это не обязательно.) Высота fk прямоугольника над этим бином выбирается таким образом, чтобы площадь fkAk была равна /Д измерений в k-u бине. Другими словами, в случае гистограммы для непрерывной величины площадь \kAk &-го прямоугольника имеет тот же смысл, что и высота k-n черточки Fk в случае гистограммы для дискретной величины. Следует соблюдать некоторую осторожность при выборе ширины бинов Ak для гистограммы. Если бины выбраны слиш- слишком широкими, то все (или почти все) отсчеты попадут в один бин и гистограмма выродится в малоинтересный един- единственный прямоугольник. Если же бины выбраны слишком уз- узкими, то лишь очень небольшое их число будет содержать бо- более чем один отсчет и сама гистограмма будет состоять из большого числа узких прямоугольников, причем почти все эти прямоугольники будут иметь одинаковую высоту. Ясно, что ширину бина следует выбирать таким образом, чтобы в каж- каждом из них содержалось по нескольку отсчетов. Следователь-
112 Глава 5 но, если полное число измерений N мало, мы должны выби- выбирать довольно широкие бины, но с увеличением N обычно ста- становится возможным выбрать более узкие бины. 5.2. Предельные распределения В большинстве экспериментов если увеличивать число из- измерений, то гистограмма будет принимать некоторую опреде- определенную простую форму. Это хорошо видно из рис. 5.3 и 5.4, в которых содержатся результаты 100 и 1000 измерений той же самой величины, что и на рис. 5.2. После 100 измерений на гистограмме вырисовывается единственный пик и она ста- становится более симметричной. После 1000 измерений можно вполовину уменьшить ширину бинов, и гистограмма становит- становится совсем гладкой и регулярной. Эти три схемы иллюстри- иллюстрируют важное свойство большинства измерений. С ростом чис- числа измерений до бесконечности их распределение стремится 0,4 0,3 0,2 0,1 О 22 23 24 25 26 27 28 Рис. 5.3. Гистограмма результатов 100 измерений той же величины, что и на рис. 5.2. Рис. 5.4. Гистограмма результатов 1000 измерений той же величины, что в на рис. 5.3. Прерывистая кривая — предельное распределение.
Нормальное распределение 113 зс x+dx a Рис. 5.5. Предельное распределение f(x). а — после множества измерений доля, которая попадает между х и х + dx, равна площади f(x)dx узкой полосы, б — доля, которая попадает между * = а н X — Ь, равна заштрихованной площади. к некоторой определенной непрерывной кривой. Получаю- Получающаяся непрерывная кривая называется предельным распреде- распределением1). Таким образом, для измерений, представленных на рис. 5.2—5.4, предельное распределение представляет собой симметричную колоколообразную кривую, показанную на рис. 5.4. Следует подчеркнуть, что предельное распределение — это теоретическая идеализация, к которой никогда нельзя абсо- абсолютно точно приблизиться на эксперименте. Чем больше из- измерений мы делаем, тем ближе становится гистограмма к пре- предельному распределению. Но лишь в случае бесконечного числа измерений и использования бесконечно узких бинов мы смогли бы получить само предельное распределение. Тем не менее имеются надежные предпосылки, что почти для всех измерений существует предельное распределение, к которому наша гистограмма все более приближается по мере того, как мы делаем все большее число измерений. Предельное распределение, подобное гладкой кривой на рис. 5.4, определяет функцию, которую мы обозначим f{x). Значение этой функции пояснено на рис. 5.5. С ростом числа измерений величины х наша гистограмма будет приближаться к предельной кривой f(x). Следовательно, доля измерений, которая попадает в любой малый интервал от х до x-\-dx, будет равна площади f{x)dx заштрихованного участка на рис. 5.5, а: / (х) dx = доля измерений, попадающая в интервал от х до x-j-dx. E.10) В общем случае доля числа измерений, которая попадает в интервал между любыми двумя значениями а и Ь, равна площади под кривой между х — а и х = b (рис. 5.5,6). Но ') Некоторые из общеупотребительных синонимов (или приблизитель- приблизительных синонимов) понятия предельного распределения: родительское рас- распределение, асимптотическое родительское распределение, генеральное рас- распределение н родительская популяция. (В литературе на русском языке употребляется также термин «генеральная совокупность»,—Прим. перев.\
114 Глава 5 эта площадь есть определенный интеграл от f(x). Таким об- образом, мы получили следующий важный результат: ь \ f {х) dx = доля измерений, а попадающая в интервал от х = а до х = Ь. E.11) Важно понять значение утверждений E.10) и E.11). Они оба определяют долю измерений, которая, как ожидается, бу- будет лежать внутри некоторого интервала в случае очень боль- большого числа измерений. То же самое можно выразить другим очень полезным способом: f(x)dx есть вероятность того, что единичное измерение х приведет к результату, лежащему в интервале от х до х + dx, т. е. / (х) dx = вероятность того, что любое единичное измерение приведет к результату, лежащему в интервале от х до х + dx. E.12) и Аналогично интеграл \/(д;)^д: определяет вероятность того, а что результат любого единичного измерения попадет в интер- интервал от х = а до х = Ъ. Мы пришли к следующему важному заключению: если бы нам было известно предельное распре- распределение f(x) для результатов измерений данной величины х, полученных с помощью данной аппаратуры, то мы знали бы вероятность получения результата в любом заданном интер- интервале а ^ х ^ Ь. Так как полная вероятность получения результата, лежа- лежащего между —сю и +оо, должна быть равна единице, то пре- предельное распределение f(x) должно удовлетворять условию E.13) Это равенство — полный аналог условия нормировки E.8), когда У Fk=l,n поэтому говорят, что функция f(x), удов- удовлетворяющая E.13), нормирована. Читатель может быть введен в заблуждение пределами ±оо в интеграле E.13). Но эти пределы вовсе не означают, что мы действительно ожидаем получать результаты, изме-
Нормальное распределение 115 fix) Высокая точность Низкая •^ точность Рис. 5.6. Два предельных распределения: одно для измерений с высокой точностью, а другое — с малой. няющиеся от —оо до +оо. Совсем наоборот. В любом реаль- реальном эксперименте результаты всех измерений попадают в не- некоторый достаточно малый конечный интервал. Например, все результаты измерений в случае рис. 5.4 лежат между х = 21 и х — 29. Даже после бесконечно большого числа измерений их доля, лежащая вне интервала от х = 21 до х = 29, будет полностью пренебрежимой. Другими словами, f(x) практи- практически равна нулю вне этого интервала, и поэтому нет ника- никакой разницы, равны ли пределы интеграла E.13) ±оо или соответственно 21 и 29. Но поскольку мы в общем случае не знаем этих конечных пределов, то более удобно оставить их как ±оо. Если выполняются очень точные измерения, то все полу- полученные значения будут близки к действительному значению х, и поэтому гистограмма результатов и, следовательно, предель- предельное распределение будут выглядеть как отрые пики, напри- например как сплошная кривая на рис. 5.6. Если точность измере- измерений мала, то результаты будут сильно различаться и их рас- распределение будет описываться широкой кривой, подобно пунк- пунктирной кривой на рис. 5.6. Предельное распределение f(x) в случае измерений дан- данной величины х с помощью заданной аппаратуры предсказы- предсказывает, как были бы распределены их результаты после очень лшогих измерений. Таким образом, зная f(x), мы могли бы рассчитать среднее значение х, которое было бы найдено после множества измерений. Мы видели [см. E.7) ], что сред- среднее любого числа измерений — это сумма всех различных зна- значений хк, умноженных на весовой множитель, представляю- представляющий долю случаев, когда получается это значение: x=Y.xkFk. E.14)
116 Глава 5 В данном случае у нас есть бесконечное число измерений с распределением f(x). Если мы разделим весь интервал зна- значений на малые интервалы от xk до xk + dxk, то доля значе- значений, попавшая в каждый такой интервал, будет Fk = f{xk)dxk, и тогда в пределе, когда все интервалы стремятся к нулю, формула E.14) примет вид E.15) Запомните, что эта формула определяет среднее х, которое соответствует бесконечно большому числу измерений ¦). Аналогично мы можем вычислить стандартное отклонение Ох, полученное после множества измерений. Поскольку мы рассматриваем случай /V->oo, то безразлично, какое опреде- определение Ох мы используем, первоначальное D.6) или же «улуч- «улучшенное» D.9) с заменой N на N-—• 1. В любом случае при N-> сю величина о\ есть просто среднее квадрата отклонений (х — хJ. Таким образом, точно те же аргументы, которые привели к E.15), позволят получить в случае множества измерений о\ = \ (x-xff(x)dx. E.16) 5.3. Нормальное распределение Различные виды измерений имеют разные предельные рас- распределения. Не все предельные распределения имеют вид сим- симметричного колокола, рассмотренного в разд. 5.2. (Например, биномиальное распределение и распределение Пуассона, рас- рассматриваемые в гл. 10 и 11, обычно не симметричны.) Тем не менее оказывается, что огромное множество измерений имеет в качестве предельного распределения симметричную колоко- лообразную кривую. Действительно, мы покажем в гл. 10, что если на результат измерения оказывает влияние большое чис- число источников небольших случайных ошибок, а систематиче- систематические ошибки пренебрежимо малы, то измеренные значения *) В литературе для более подготовленных читателей среднее, опре- определяемое формулой E.15), называется математическим ожиданием, или просто средним, а определяемое формулой E.Н)—выборочным средним. Аналогично употребляются понятия стандартного отклонения ах, опреде- определяемого формулой E.16), и выборочного стандартного отклонения [см. D.6) и D.9)]. — Прим. перев.
Нормальное распределение П7 Истинное значение х Рис. 5.7. Предельное распределение в случае измерений, результаты кото- которых подвержены влиянию множества небольших случайных ошибок. Рас- Распределение имеет колоколообразный вид с центром на истинном значении измеренной величины х. распределяются по колоколообразной кривой, центр которой будет истинным значением х, как показано на рис. 5.7. В ос- оставшейся части этой главы мы ограничимся рассмотрением измерений только с такими свойствами. Если наши измерения подвержены заметным систематиче- систематическим ошибкам, то мы не можем ожидать, что предельное рас- распределение будет иметь центр, совпадающий с истинным зна- значением. Случайные ошибки с равной вероятностью смещают наши отсчеты в обе стороны от истинного значения. Если все ошибки случайны, то после многочисленных измерений будет получено одинаково много результатов, как превышающих ис- истинное значение, так и не достигающих его. Однако система- систематическая ошибка (подобно растянутой рулетке или отстаю- отстающим часам) смещает все значения в одну сторону и, сле- следовательно, смещает центр распределения полученных значе- значений от истинного значения. В данной главе мы будем предпо- предполагать, что центр распределения приходится на истинное зна- значение. Это эквивалентно предположению, что все системати- систематические ошибки уменьшены до пренебрежимо малого уровня. Теперь настало время обратиться к вопросу, который мы до сих пор избегали обсуждать: что такое «истинное значе- значение» физической величины? Это трудный вопрос, на который нет удовлетворительного простого ответа. Поскольку оче- очевидно, что ни в каком измерении нельзя точно определить ис- истинное значение любой непрерывной переменной (например, длины, времени и т. д.), то не ясно, существует ли вообще ис- истинное значение такой величины. Тем не менее оказывается очень удобным предполагать, что любая физическая величина имеет истинное значение, и мы всегда будем исходить из этого предположения. Истинным значением величины можно считать такое зна- значение, к которому мы приближаемся по мере осуществления
118 Глава 5 Ширина б'мала Ширина СГ велика Рис. 5.8. Функция Гаусса E.17) колоколообразной формы с центром в х = 0. Кривая широка, если ширина а велика, и узка, если а мала. все большего числа измерений, выполняемых все более тща- тщательно. Определенное таким образом «истинное значение» есть идеализация, аналогичная понятию математической точки, ко- которая не имеет размеров, или линии, которая не имеет ши- ширины; и, подобно этим двум понятиям, это полезная идеали- идеализация. Мы часто будем обозначать истинные значения изме- измеряемых величин х, у, ... соответствующими прописными бук- буквами X, Y, ... . Если измерения величины х подвержены мно- множеству небольших случайных ошибок и если систематические ошибки пренебрежимо малы, то распределение результатов измерений будет иметь вид симметричной колоколообразной кривой с центром, приходящимся на истинное значение X. В математике функция, график которой имеет форму ко- колоколообразной кривой, называется функцией нормального распределения, или функцией Гаусса '). Основная форма пред- представления этой функции имеет вид е-*''2о\ E.17) где а — фиксированный параметр, который мы будем назы- называть параметром ширины или шириной. Читателю полезно ознакомиться со свойствами этой функции. Когда х = 0, функция Гаусса E.17) равна единице. Функ- Функция симметрична относительно х = 0, так как она имеет одни и те же значения как для х, так и для —х. При удалении х от нуля в любом направлении функция х2/2а2 возрастает, при- причем возрастает быстро, если величина а мала, и более мед- медленно, если а велика. Следовательно, по мере удаления х от нуля функция E.17) стремится к нулю. Таким образом, об- общий вид функции Гаусса E.17) будет таким, как показано на рис. 5.8. Этот график объясняет термин «параметр ши- ') Другие общепринятые наименования функции Гаусса: гауссова функция (или просто гауссиан), нормальная функция плотности и нор- нормальная функция ошибок. Последнее наименование довольно неудачно, так как обозначение «функция ошибок» часто используется для интеграла от функции Гаусса (который мы рассмотрим в разд. 5.4).
Нормальное распределение 119 рины» для а, поскольку при больших значениях о колокол выглядит широким, а при малых а — узким. Функция Гаусса E.17) представляет собой колоколооб- разную кривую с центром в х = 0. Чтобы получить колоко- лообразную кривую с центром в какой-то другой точке х = X, мы просто заменим х в E.17) на х — X. Таким обра- образом, функция e-u-x)W E.18) достигает максимума при х = X и спадает симметрично по обе стороны от х = X, как показано на рис. 5.9. Выражение E.18) еще не является окончательным, оно не описывает предельное распределение, поскольку любое рас- распределение должно быть нормировано, т. е. должно удовлет- удовлетворять условию f(x)dx=l. E.19) Чтобы выполнить это условие, мы введем E.20) (Умножение на N не изменяет ни формы, ни положения мак- максимума при х = X.) Теперь мы должны выбрать «нормиро- «нормировочный множитель» N таким образом, чтобы f(x) была нор- нормирована в соответствии с E.19). Для этого необходимо сде- сделать подстановку подынтегрального выражения, которую мы приведем: f{x)dx = E.21) При оценке интегралов такого вида всегда нужно произ- произвести замену переменных, чтобы упростить подынтегральное x=X Рис. 5.9. Функция Гаусса E.18) колоколообразной формы с центром в
120 Глава 5 выражение. Обозначим х— Х = у (в этом случае dx = dy) и лолучим 00 jj -fWdy. E.22) Затем мы можем обозначить у/а = г (в этом случае dy = adz), тогда = Na jj e-*l*dz. E.23) — оо Получившийся интеграл — один из стандартных интегралов математической физики. Его можно рассчитать элементар- элементарными методами, но детали вычислений не особенно интересны, лоэтому мы просто приведем результат1) -*!/2 dz = у2я. E.24) Возвращаясь к E.21) и E.23), находим, что / (х) dx = No V2JT. Так как этот интеграл должен быть равен единице, нормиро- нормировочный множитель iV следует выбрать как N= l/(cr д/2я;)- Мы приходим к выводу, что нормированная функция Гаус- Гаусса, или нормированная функция нормального распределения, имеет вид E.25) Обратите внимание на то, что мы добавили нижние индексы X, о, чтобы указать центр и ширину распределения. Функция fx,o(x) описывает предельное распределение результатов из- измерений величины х, истинное значение которой равно X и на которую оказывают влияние только случайные ошибки. Говорят, что результаты измерений распределены нормально, если их предельное распределение описывается функцией Гаусса E.25). Вскоре мы выясним значение параметра ширины а. Од- Однако уже ясно, что малые значения а приводят к распределе- ') Вывод см., например, в книге Hugh D. Young. Statistical Treatment of Experimental Data, McGraw-Hill. 1962, приложение D.
Нормальное распределение 121 0 12 3 4 Рис. 5 10. Два нормалных, или гауссовых, распределения. нию типа острого пика, соответствующего точным измерениям, в то время как большие значения а дают широкое распреде- распределение, соответствующее измерениям с малой точностью. На рис. 5.10 приведены два примера распределения Гаусса с раз- различными центрами X и ширинами а. Обратите внимание, как фактор а в знаменателе формулы E.25) автоматически обес- обеспечивает для более узкого распределения (а меньше) боль- большую высоту в центре, как это и должно быть, чтобы полная площадь под кривой равнялась 1. В разд. 5.2 мы видели, что если известно предельное рас- распределение для результатов измерений, то можно вычислить среднее значение х, ожидаемое в случае очень большого числа измерений. В соответствии с E.15) ожидаемое среднее зна- значение в случае очень большого числа измерений равно \ xf (x) dx. E.26) Если предельное распределение есть распределение Гаусса fx, a(x) с центром в истинном значении X, то этот интеграл можно вычислить. Прежде чем мы это сделаем, следует за- заметить, что, как это почти очевидно, среднее значение х в слу- случае очень большого числа измерений будет равно X, так как вследствие симметрии функции Гаусса относительно X оди- одинаковое число результатов окажется как больше X на ка- какое-то значение, так и меньше его на то же значение. Таким образом, среднее значение должно равняться X. Мы можем вычислить интеграл E.26) для распределения Гаусса следующим образом: xfx,a(x)dx = л/2п 2dx. E.27)
122 Глава 5 Если произвести замену переменных у = х — X, то получим dx = dy и х = у -\- X. В этом случае интеграл E.27) можно разбить на два: у ОО ОО ч 1 / Г Г \ v— ' | \ ,,р- yV2a'А,, I Y \ p-yV2a! fji, I (F, 9R\ а У2я I J J / \ —oo —oo / Первый интеграл в этом выражении равен нулю, так как вклад любой точки у точно компенсируется вкладом точки —у. Второй интеграл — нормировочный интеграл, встречавшийся нам в E.22), который равен о л/2п. Это значение сокра- сокращается с множителем о л]2п в знаменателе, и получается ожидаемый результат: х = X E.29) в случае многих измерений. Другими словами, если резуль- результаты измерений распределены в соответствии с распределе- распределением Гаусса fx, a{x), то в случае очень большого числа изме- измерений среднее значение х будет равно истинному значению X, которое соответствует центру функции Гаусса. Результат E.29) был бы верен, если бы мы смогли сде- сделать бесконечное число измерений. Его практическая цен- ценность заключается в том, что если мы сделаем большое (но конечное) число измерений, то наше среднее значение будет близко к X. Другой интересной величиной, которую можно вычислить, является стандартное отклонение ах в случае многих измере- измерений. В соответствии с E.16) оно определяется как оо ol= \ (x-xffx,a(x)dx. E.30) Этот интеграл легко вычислить. Заменяя х на X, производя подстановки х — Х = у и у/а = z и, наконец, интегрируя по частям, получаем (см. задачу 5.6) ol = e2 E.31) в случае многих измерений1). Другими словами, параметр ширины о функции Гаусса fx, a{x) есть просто стандартное отклонение, которое мы получили бы в результате многих из- измерений. Это, конечно, объясняет, почему величина а была использована как параметр ширины и почему а часто назы- называют стандартным отклонением распределения Гаусса fx,0{x). Однако, строго говоря, а есть стандартное отклонение, ожи- ожидаемое только в случае бесконечно большого числа измере- измерений. Если мы сделаем некоторое конечное число измерений ') См. примечание переводчика на о. 116. — Прим. перев.
Нормальное распределение 123 (скажем, 10 или 20) величины х, то полученное стандартное отклонение должно быть некоторым приближением к о, но у нас нет никаких оснований считать, что оно будет точно равно о. В разд. 5.5 мы обсудим дополнительные сведения о среднем и стандартном отклонении, которые можно полу- получить в результате реализации некоторого разумного числа из- измерений. 5.4. Стандартное отклонение как 68 %-ный доверительный предел Предельное распределение f(x) результатов измерения не- некоторой величины х дает возможность вычислить вероятность получения любого данного значения х. Интеграл ь \f(x)dx а есть вероятность того, что любое единичное измерение приве- приведет к результату, лежащему внутри интервала а^.х sg b. Если предельное распределение есть функция Гаусса fx, a(x), то этот интеграл можно вычислить. В частности, мы можем вычислить (как обсуждалось в гл. 4) вероятность того, что результат измерения окажется в пределах одного стандарт- стандартного отклонения о от истинного значения X. Эта вероятность равна Х+в Р (в пределах о) = \ fx,o(x)dx= E.32) Х dx E.33) Х-а Х+а J х —о Смысл этого интеграла проиллюстрирован на рис. 5.11. Этот интеграл можно привести к более простому теперь уже обыч- обычной для нас подстановкой (х — X)/a = z. В этом случае Х-б- Рис. 5.11. Заштрихованная площадь между X — а и Х + а равна вероят- вероятности того, что результат измерения будет лежать в пределах едкого стандартного отклонения от X.
J24 Глава 5 dx = adz, и пределы интегрирования становятся равными ±1. Следовательно, + i Р (в пределах ог) = -р=- \ e~2'12 dz. E.34) •у2я J J Прежде чем оценивать интеграл E.34), заметим, что в равной мере мы могли бы найти вероятность того, что резуль- результат будет лежать в пределах 2ст от X или 1,5а от X. В общем случае мы могли бы вычислить вероятность Р (в пределах ta), что означает «вероятность того, что результат будет ле- лежать в пределах ta от X», где t — любое положительное чис- число. Эта вероятность показана заштрихованной площадью на рис. 5.12, и расчет, аналогичный приведшему к E.34), дает (см. задачу 5.7) + t Р (в пределах ta) =—^=- \ e'^dz. E.35) V2ji Jf Интеграл E.35) — это стандартный интеграл математиче- математической физики; он часто называется функцией ошибок, обозна- обозначаемой erf(/), или нормальным интегралом ошибок. Его нель- нельзя вычислить аналитически, но легко оценить численно с по- помощью карманного калькулятора. На рис. 5.13 его значения представлены графически и приведены несколько его значе- значений. Более полная таблица значений дана в приложении А в конце книги (см. также приложение Б, где приведены зна- значения для другого, но тесно связанного с рассматриваемым интеграла). Прежде всего, как можно заметить из рис. 5.13, вероят- вероятность того, что результат измерения окажется в пределах од- одного стандартного отклонения от истинного результата, со- составляет 68%, как уже принималось в гл. 4 (где говорилось о величине «приблизительно 70%»). Если мы будем рассмат- x-te- Рис. 5.12. Заштрихованная площадь между X ± ta и X — ta равна ве- вероятности того, что результат измерения будет лежать в пределах t стан- стандартных отклонений от X.
Нормальное распределение 125 100% Г 50% О 0,674 7 2 3 4 t О 0,25 0,5 0,75 1,0 1,25 1,5 1,75 2,0 2,5 3,0 3,5 О гО 38 55 68 79 67 92 95,498,8 99,7 99,9599,99 Рис. 5.13. Вероятность Р (в пределах to) того, что результат измерения х будет лежать в пределах t стандартных отклонений от истинного значения к — X. ривать стандартное отклонение как нашу погрешность в изме- измерениях (т. е. запишем к = л:наил ± бл: и примем бл: = а), то мы можем быть на 68% уверены, что наш результат будет в пре- пределах а от правильного результата. Из рис. 5.13 мы также можем видеть, что вероятность Р (в пределах to) быстро стремится к 100% с увеличением t. Вероятность гого, что результат измерения окажется в преде- пределах 2а, равна 95,4%; вероятность результата в пределах За — 99,7%. Это же можно выразить и иным способом, а именно: вероятность того, что результат измерения окажется вне одного стандартного отклонения, довольно значительна C2%), вероятность того, что он будет лежать вне 2а-—много меньше D,6%), а того, что он будет лежать за пределами За, исключительно мала @,3%). Конечно, нет ничего магического в числе 68%; это просто доверительный уровень, связанный со стандартным отклоне- отклонением а. Альтернативой стандартному отклонению может слу- служить так называемая вероятная ошибка (ВОI), которая оп- определяется как такое отклонение, когда результат измерения с вероятностью 50% окажется внутри интервала X ± ВО. Из ') Автор использует встречающуюся в литературе на английском языке аббревиатуру для вероятной ошибки по первым буквам соответ- соответствующих английских слов (P. E. — probable error). В литературе на рус- русском языке соответствующая аббревиатура (ВО) для понятия вероятной ошибки не является общеупотребительной. — Прим. перев.
126 Глава 5 рис. 5.13 можно увидеть (для результатов измерений, кото- которые распределены нормально), что вероятная ошибка равна ВО да 0,67а. Некоторые экспериментаторы предпочитают приводить ве- вероятную ошибку ВО в качестве погрешности в своих измере- измерениях. Тем не менее стандартное отклонение о используется гораздо чаще, поскольку его свойства весьма просты. 5.5. Обоснование среднего как наилучшей оценки В последних трех разделах мы рассматривали предельное распределение f(x), которое получается в случае бесконечного числа измерений величины х. Если бы функция f(x) была из- известна, то мы могли бы вычислить среднее х и стандартное отклонение ст, полученные в случае беконечно большого числа измерений, и (по крайней мере для нормального распределе- распределения) мы могли бы также узнать истинное значение X. К со- сожалению, мы никогда не знаем предельного распределения. На практике обычно имеется конечное число измеренных зна- значений E, 10 или, может быть, 50) Х\, Х2, • • •, XN, и наша задача — найти наилучшие оценки для X и о, осно- основанные на этих ./V измеренных значениях. Если бы результаты измерений описывались нормальным распределением fx,a(x) и нам были известны параметры X и о, то мы могли бы вычислить вероятность получения значений хи ..., Xn, которые фактически были получены. Так, вероят- вероятность получения отсчета вблизи х\ в малом интервале dx\ есть Р (х между хх и xl + dxl) = )= e-to-wwdXl. E.36) Ha практике нас не интересуют ни величина интервала dxu ни множитель -^/2п, так что можно сократить запись до P(xl)~±-e-in-xri*'\ E.37) Мы будем ссылаться на E.37) как на вероятность получения значения х\, хотя, строго говоря, это есть вероятность полу- получения значения в интервале около jci, как в E.36). Вероятность получения второго отсчета хч есть ^ E.38)
Нормальное распределение 127 и аналогично мы можем записать все остальные вероятности, заканчивая выражением p(%)_±e-(^-*>w. E.39) Формулы E.37) — E.39) дают вероятности получения каж- каждого из отсчетов х\, ..., xN, рассчитанные в терминах при- принятого предельного распределения fx,a(x). Вероятность того, что мы будем наблюдать всю совокупность N отсчетов, равна произведению этих отдельных вероятностей1) Рх.Л*\> •••> xN) = Р(Xl)Р{х2) ¦ ... -Р(%), или Рх.в(*и ...,хы)~±е-Ъ(хгХ)>\ E.40) Очень важно понять значение различных величин в E.40). Числа хи ..., xN¦—это фактические результаты N измерений; таким образом, Х\, ..., хц — известные фиксированные числа. Величина Рх, а{х\, ¦ ¦ ¦, *n) есть вероятность получения N ре- результатов х\, ..., xN, вычисленная в терминах X и ст, истин- истинного значения х и ширины его распределения. Числа X и ст неизвестны; мы хотим найти наилучшие оценки для Хна, основываясь на данных наблюдений х\, ..., хы. Мы добавили нижние индексы X и о к обозначению вероятности E.40), чтобы подчеркнуть, что она зависит от (неизвестных) значе- значении X и ст. Поскольку действительные значения X и а неизвестны, мы могли бы зафиксировать некоторые предполагаемые значения X' и ст' и затем с этими предполагаемыми значениями вычис- вычислить вероятность РХ',а' (хи •••> %)• Если бы затем мы за- зафиксировали другую пару предполагаемых значений X" и о" и нашли, что соответствующая вероятность Рх\а" (хи ..., xN) больше, то мы, естественно, могли бы рассматривать эти но- новые значения X" и ст" как лучшие оценки для X и ст по срав- сравнению с первой парой. Продолжая в том же духе, мы могли бы организовать поиск таких значений X и а, которые делают вероятность Рх, a(xi, ¦¦¦> xn) максимально большой, а сами эти значения рассматривать как наилучшие оценки для X и о. Эта процедура определения наилучших оценок для X и а называется в статистике принципом максимального правдопо- ') Мы используем известный результат, а именно что вероятность одновременной реализации нескольких независимых событий равна произ- произведению вероятностей каждого события в отдельности. Например, вероят- вероятность того, что при бросании монеты выпадет «орел», равна 1/2, а вероят- вероятность того, что при бросании кости выпадет «шесты», равна '/е- Следова- Следовательно, вероятность выпадения «орла» и «шести» есть (Va) • (Ve) = */«•
128 Глава 5 добия. Кратко его можно сформулировать следующим обра- образом. Для данных N наблюденных значений х\, ..., xN наилуч- наилучшими оценками X и а будут такие значения, для которых эти значения х\, ..., xN наиболее вероятны. Таким образом, наи- наилучшие оценки для X и о — это такие значения, для которых Рх, о(х\, •••, xN) достигает максимума, где Рх.а(х».... хн)—±ге-*Ъ-*)*/*'. E.41) С помощью этого принципа мы легко можем найти наилуч- наилучшую оценку для истинного значения X. Очевидно, что E.41) достигает максимума, когда сумма в показателе экспоненты достигает минимума. Таким образом, наилучшая оценка для X — это такое значение X, для которого сумма 1(х,-1)У E.42) i = l достигает минимума. Чтобы найти этот минимум, продиффе- продифференцируем сумму по X и приравняем производную нулю, что дает или У х- X = ' (наилучшая оценка). E.43) Иными словами, наилучшая оценка истинного значения X есть среднее наших N измерений, х — ]Г xJN,— результат, который мы принимали без доказательств начиная с гл. 1. Найти наилучшую оценку о, ширины предельного распре- распределения, немного труднее, так как вероятность E.41) пред- представляет собой более сложную функцию ст. Мы должны про- продифференцировать E.41) по ст и приравнять производную нулю. (Мы оставляем детали вычислений читателю, см. за- задачу 5.10.) Эта процедура дает значение а, при котором E.41) достигает максимума и которое, следовательно, представляет собой наилучшую оценку о ст = Л/ -ft-/ (x{ — XJ (наилучшая оценка). E.44) Истинное значение X неизвестно. Таким образом, на прак- практике мы должны заменить X в E.44) нашей наилучшей оцен-
Нормальное распределение 129 кой X, а именно средним х. Это приводит к оценке Другими словами, наша оценка ширины о предельного рас- распределения есть стандартное отклонение N наблюденных зна- значений Х\, ..., Хн, как первоначально было определено в D.6). Читатель может быть удивлен тем, что оценка E.45) сов- совпадает с нашим первоначальным определением стандартного отклонения D.6), в котором используется N, вместо нашего «улучшенного» определения с делителем ./V—1. В действи- действительности при переходе от наилучшей оценки E.44) к выра- выражению E.45) мы умолчали об одной тонкости. Наилучшая оценка E.44) включает истинное значение X, в то время как в E.45) мы заменили X на х (наилучшую оценку X). Эти чис- числа, вообще говоря, не одинаковы, и легко видеть, что число E.45) всегда меньше или почти равно E.44)'). Таким обра- образом, при переходе от E.44) к E.45) мы недооцениваем ши- ширину о. Довольно легко оценить, во сколько раз E.45) мень- меньше E.44), хотя мы не будем здесь этого делать. В результате получим, что наилучшим приближением к о будет не E.45), а то, что получится при умножении E.45) на множитель s\/N/(N—1). Таким образом, наш окончательный вывод со- состоит в том, что наилучшая оценка ширины о — это «улуч- «улучшенное» стандартное отклонение для измеренных значений Х\, . . . , Хм'. V—¦ Л N _ t 2_j (xt ~ -*J (наилучшая оценка). E.46) Теперь, возможно, настало время дать обзор того довольно сложного материала, который мы изложили. Во-первых, если результаты измерения х подвержены только случайным ошиб- ошибкам, то их предельное распределение есть функция Гаусса fx,a{x) с центром в истинном значении X и с шириной о. Ши- Ширина о — это 68%-ный доверительный предел, для которого вероятность того, что любое измерение попадает в интервал в пределах а от истинного значения X, составляет 68%- На практике ни X, ни а не известны. Вместо них мы знаем наши N измеренных значений хи ..., хы, где N так велико, как позволяют получить наше время и терпение. Основываясь на *) Если рассматривать E.44) как функцию X, то мы видели, что эта функция достигает минимума при X = х. Таким образом, E.45) всегда меньше или равно E.44).
130 Глава 5 этих N измеренных значениях, мы показали, что наилучшей оценкой истинного значения X будет среднее х = ^ xrfN и наилучшей оценкой ширины а будет стандартное отклонение Ох для х\, ..., xN, как определено в E.46). В разд. E.7) мы обсудим надежность х как наилучшей оценки X, и аналогично мы могли бы рассмотрегь надежность ох как наилучшей оцен- оценки о, но здесь мы этого делать не будем. Все результаты, полученные в последних двух разделах, зависят от предположения, что данные наших измерений рас- распределены нормально1). Хотя это и разумное допущение, оно относится к разряду допущений, которые трудно проверить на практике, и иногда не совсем верно. Но и в этом случае мы должны подчеркнуть, что, если результаты измерений имеют не нормальное распределение, оно почти всегда является при- приблизительно нормальным, и поэтому вполне допустимо исполь- использовать понятия этой главы по крайней мере как хорошие при- приближения. 5.6. Обоснование квадратичного сложения Теперь мы можем вернуться к проблеме расчета ошибок в косвенных измерениях, которую мы уже рассматривали в гл. 3. Тогда мы постулировали, что если ошибки случайны и независимы, то их можно складывать квадратично в соот- соответствии с определенными стандартными правилами, напри- например либо в соответствии с «простыми правилами» C.16) и C.18), либо в соответствии с общим правилом C.47), которое включает эти «простые» правила как частные случаи. Теперь мы можем обосновать это квадратичное сложение. Задача расчета ошибок в косвенных измерениях возникает в случае, когда мы измеряем одну или более величин х, ..., z и определяем их погрешности, а затем используем измерен- измеренные значения для расчета некоторой величины q(x, ..., z). Главная трудность, конечно, состоит в том, чтобы найти по- погрешность полученного значения q. Если величины х, ..., z подвержены только случайным ошибкам, то они будут рас- распределены нормально с параметрами ширины2) ст*, ..., аг, которые мы будем рассматривать как погрешности любого единичного измерения соответствующих величин. Проблема, ') И что систематические ошибки уменьшены до пренебрежимо ма- малого уровня. 2) Имея дело с несколькими различными измеренными величинами х, ..., г, мы будем использовать нижний индекс х, ..., г у параметра ширины соответствующего предельного распределения, чтобы как-то раз- различать эти параметры Таким образом, ах обозначает ширину распределе- распределения Гаусса fXi а (х) в случае измерений х и т. д.
Нормальное распределение 131 а X -х (измеренное) б (вычисленное) Рис. 5 14. Если измеренные значения х распределены нормально с цен- центром х = X и шириной вх, то рассчитанные значения q = х + А (с фикси- фиксированным и известным А) будут распределены нормально с центром q = X + А и той же шириной а*. которую теперь надо решить, состоит в следующем: что мы можем сказать о распределении значений q, если известны распределения результатов измерений х, ..., г? И в частно- частности, какова ширина распределения значений q? Измеренная величина плюс фиксированное число Мы начнем с рассмотрения двух очень простых частных случаев. Во-первых, предположим, что мы измеряем некото- некоторую величину х и хотим вычислить значение величины q^x + A, E.47) где А — некоторое фиксированное число без погрешностей (например, А = 1 или я). Предположим, что результаты из- измерений х распределены нормально около истинного значе- значения X с шириной ох, как показано на рис. 5.14, а. Тогда ве- вероятность получения любого значения х (в малом интервале dx) равна fx,ox(x)dx или 2 / 2 (вероятность получения значения х)~е~{х~ *. E.48) Наша цель — найти вероятность получения любого значения величины q, определенной E.47). Из E.47) ясно, что х = = q — А и, следовательно, (вероятность получения значения q) = = (вероятность получения x = q — A). Выражение для второй вероятности дается E.48), и поэтому (вероятность получения значения q) ~ -lW-i»)-X]2/a?_ (,_(
132 Глааа 5 Из результата E.49) следует, что вычисленные значения q распределены нормально с центром ъ X-\-А и с шириной ах, как показано на рис. 5.14,6. В частности, погрешность в q та же самая (а именно ах), что ив*, как дало бы наше пра- правило C.16), Измеренная величина умножается на фиксированное число В качестве второго простого примера рассмотрим случай, когда измеряется х и рассчитывается величина q = Bx, где В — фиксированное число (например, В = 2 или В = п), Если результаты измерений х распределены нормально, то на основании тех же аргументов, что и ранее, мы приходим к выводу, что') (вероятность получения значения q) ~ (вероятность получе- получения х = q/B) ~ = ехр [- (<7 - ВХJ/2В2а2х]. E.50) Другими словами, значения q = Вх будут распределены нор- нормально с центром q = ВХ и с шириной Вох, как показано на рис. 5.15. В частности, погрешность в q = Вх в В раз больше, чем в х, как дало бы наше правило C.18), Ширина &х X ^Ширина -х ВХ * Рис. 5.15. Если измеренные значения х распределены нормально с центром х = X и шириной Ох, то рассчитанные значения q = Вх (с фиксированным и известным В) будут распределены нормально с центром ВХ и шириной Box. J) Здесь мы введем альтернативное обозначение ехр (г) для экспонен- экспоненциальной функции ехр (г) = ег. В случае, когда показатель г становится сложным выражением, обозначение ехр более удобно при написании,
Нормальное распределение 133 Ширина Ux Ширина <?, X+Y Рис. 5.16. Если результаты измерений хну независимы и распределены нормально с центрами X и У и ширинами ах и аи, то рассчитанные зна- значения х + у будут распределены нормально с центром X + У и шириной Сумма двух измеренных величин В качестве первого нетривиального примера расчета оши- ошибок в косвенных измерениях рассмотрим случай, когда мы измеряем две независимые величины х и у и вычисляем их сумму х-\-у. Мы будем предполагать, что результаты измере- измерений х а у распределены нормально около соответствующих истинных значений X и У с ширинами ах и ау, как показано на рис. 5.16, а и б, и попытаемся определить распределение рассчитанных значений х-\-у. Мы покажем, что значения х + у распределены нормально с центром, равным сумме ис- истинных значений X + У, и с шириной, равной о о Ох + О у , как показано на рис. 5.16, в. В частности, эта формула обос- обосновывает правило из гл. 3, согласно которому погрешность в х-\-у равна квадратичной сумме индивидуальных погреш- погрешностей в х и у, если х а у подвержены только независимым и случайным погрешностям. Чтобы упростить наши выкладки, сначала предположим, что оба истинных значения X и У равны нулю. В этом случае вероятность получения любого частного значения х равна Р (х) ~ ехр Г — и аналогично для у Р(г/)~ехр(- F.51) E.52)
134 Глава 5 Наша задача теперь заключается в том, чтобы определить вероятность получения любого частного значения х -f- У- Сна- Сначала отметим, что поскольку хну измеряются независимо, то вероятность получения любых данных х и у равна произве- произведению вероятностей E.51) и E.52): $ )] Зная вероятность получения х и у, мы уже можем рассчитать вероятность любого данного значения х-\-у. Для этого выра- выразим показатель в E.53) через представляющую интерес пе- переменную х -\- у. Это можно сделать с помощью тождества (которое читатель легко может проверить) *2 , У2 (х + УУ , (Вх-АуУ _ А т~ В ~ А+ В ^~ АВ(А+ В)~~ *0>0^ *Й? E-55> где во второй строке мы ввели сокращенное обозначение z2 для второго члена в правой части E.54), поскольку его зна- значение не представляет для нас интереса. Если подставить E.55) в E.53), заменяя А на а'2х и В на а2, то получаем [^\ E-56) Эту вероятность получения данных значений х и у можно также рассматривать как вероятность получения данных зна- значений х-\-у и z. Таким образом, мы можем переписать E.56) как f^i^Jf-f]. E.Б7) В конце концов, мы хотим найти вероятность получения данного значения х -\- у безотносительно от какого-либо зна- значения z. Это можно сделать, если просуммировать или, точ- точнее, проинтегрировать E.57) по всем возможным значениям г, т. е. оо Р(х + У)= \ Р(х + У, z)dz. E.58) — со Интегрирование E.57) _по z сводится к интегралу от ехр(—z2/2), что дает ^/2п, и мы получаем
Нормальное распределение 135 Это выражение показывает, что значения х + У распреде- распределены нормально с шириной <уа2х + о2 как и ожидалось. Наше доказательство закончено для случая, когда оба истинных значения х и у равны нулю: X = У = 0. Если X и У отличны от нуля, мы можем рассуждать следующим об- образом. Сначала запишем x + y = (x-X) + (y-Y) + (X + Y). E.60) В этом выражении два первых члена распределены нор- нормально с центрами, равными нулю, с ширинами ах и ау в со- соответствии с E.49). Следовательно, сумма этих двух первых членов распределена нормально с шириной л/о2х + о2. Тре- Третий член в E.60) — фиксированное число. Следовательно, в соответствии с E.49) он смещает распределение к (X-{- У), но не изменяет его ширину. Другими словами, значения (х-\-у), представленные формулой E.60), распределены нор- нормально около (X + Y) с шириной ^Jax + o2y. А это и есть искомый результат. Общий случай Доказав формулу для вычисления ошибки в частном слу- случае суммы х -\- у, мы удивительно просто можем получить формулу для расчета ошибки и в общем случае косвенных измерений. Предположим, что мы измеряем две независимые величины х и у, наблюденные значения которых распреде- распределены нормально, и вычисляем некоторую величину q(x,y) от переменных хну. Распределение значений q(x, у) легко находится с помощью трех предыдущих результатов. Во-первых, ширины ах и ау (погрешности в х и у) должны быть малы. Это означает, что мы имеем дело только с вели- величинами х, близкими к X, и величинами у, близкими к У, и поэтому можем, используя аппроксимацию C.42), написать ^)ху{У-У). E.61) Это — хорошее приближение, поскольку те значения хну, которые реализуются наиболее часто, близки к X и У. Мы привели нижние индексы X, У у частных производных, чтобы подчеркнуть, что эти производные оцениваются в точке X, Y и, следовательно, являются фиксированными числами. Приближение E.61) выражает искомую величину q{x,y) в виде суммы трех членов. Первый член q(X, У) — фиксиро- фиксированное число, поэтому он только смещает распределение. Второй член — фиксированное число dq/dx, умноженное на
136 Глава 5 (х — X), распределение значений которого имеет ширину ах, поэтому значения второго члена распределены с центром в нуле и с шириной Кж)а*- Аналогично значения третьего члена распределены с центром в нуле и с шириной ду) °у Рассматривая все три члена в E.61) и привлекая уже полу- полученные результаты, мы можем сделать вывод, что значения q(x,y) распределены нормально около истинного значения q(X, Y) с шириной - E.62) Если рассматривать стандартные отклонения ах и ау как погрешности в х и у, то результат E.62) — это правило C.47) для расчета случайных ошибок в косвенных измерениях в случае, когда q есть функция двух переменных, q(x,y). Если q зависит от нескольких переменных, т. е. q = q(x, у, ... ..., z), то предыдущие аргументы можно использовать не- непосредственно, чтобы вывести общее правило C.47) для функции нескольких переменных. Так как все правила гл. 3 (касающиеся расчета ошибок в случае косвенных измерений) могут быть получены из C.47), то теперь все эти правила получили обоснование. 5.7. Стандартное отклонение среднего Нам осталось доказать еще один важный результат, при- приведенный в гл. 4. Это касается стандартного отклонения среднего о*. Мы доказали (в разд. 5.5), что если произво- производится N измерений х\, ..., xn величины х (которая распре- распределена нормально), то наилучшей оценкой истинного значе- значения X будет среднее х от х\, ..., xn. В гл. 4 мы утверждали, что погрешность в этой оценке есть стандартное отклонение среднего /V? E.63) Теперь мы можем доказать это утверждение. Доказательство до удивления кратко, и поэтому вы должны будете внима- внимательно проследить за ним. Предположим, что результаты измерений х распределены нормально около истинного значения X с шириной ах. Мы
Нормальное распределение 137 хотим узнать, какова надежность среднего значения N изме- измерений. Чтобы исследовать этот вопрос, естественно предста- представить себе ситуацию, когда эти N измерений повторяются много раз, т. е. представить выполнение целой последова- последовательности экспериментов, в каждом из которых мы делаем по N измерений и вычисляем среднее значение. Затем мы могли бы поинтересоваться распределением этих многих по- полученных средних значений для N измерений. И это легко осуществить. В каждом эксперименте мы получаем N измеренных зна- значений xi, ..., хц и затем вычисляем функцию х, + ... + xN * = дг • E-64) Рассчитанная величина х есть простая функция измеренных значений х\, ..., хц, и мы легко можем найти распределение наших ответов для х с помощью расчета ошибок для косвен- косвенных измерений. Единственная непривычная особенность функ- функции E.64) состоит в том, что все результаты измерений х\, ..., xN — результаты измерений одной и той же величины с тем же самым истинным значением X и с той же самой шириной ах. Сначала мы отметим, что поскольку каждое из измерен- измеренных значений х\, ..., xN распределено нормально, то то же самое должно быть справедливо для функции х, определяе- определяемой E.64). Далее истинное значение для даждого из xi, ... ..., хм есть X, поэтому истинное значение величины х, опре- определяемой E.64), есть Х+...+Х - = л. N Таким образом, после многократного определения среднего значения х для N измерений мы найдем, что все наши мно- многочисленные результаты для х будут распределены нормально около истинного значения X. Единственный оставшийся (и наиболее важный) вопрос состоит в том, чтобы найти ширину нашего распределения средних. В соответствии с E.62) при- применительно к случаю N переменных эта ширина есть Так как х\, ,.., хы представляют собой результаты измере- измерений одной и той же величины х, то и ширины у них у всех одни и те же и равны ах:
138 Глава 5 Ширина /#" Ширина Рис. 5 17. Результаты индивидуальных измерений величины х распределе- распределены нормально около X с шириной ох (пунктирная кривая). Если мы бу« дем использовать то же самое оборудование для определения многих средних значений 10 измерений, то значения х будут распределены нор- нормально около X с шириной O.J = о^/V^O (сплошная кривая). Из E.64) мы также видим, что все частные производные в E.65) одинаковы: дх _ _ дх _ 1 N ' дх, dxN Следовательно, E.65) сводится к = ах/л/Ы, F.66) что и требуется. К искомому результату E.66) мы пришли столь быстро, что, вероятно, следует остановиться и понять, что же он означает. Мы представили себе, что выполняется большое число экспериментов, в каждом из которых производилось по N измерений х и затем вычислялось среднее значение х этих N измерений. Мы показали, что в результате много- многократного повторения такого эксперимента наши многочис- многочисленные значения х будут распределены нормально с центром, равным истинному значению X, и с шириной, которая опре- определяется выражением о* = <ух/-\J~N, как показано на рис. 5.17 для случая N = 10. Эта ширина счесть 68 %-ный доверитель- доверительный предел для нашего эксперимента. Если мы найдем сред- среднее N измерений однажды, то мы можем быть на 68% уве- уверены, что наш результат будет лежать в пределах о*, от истинного значения X. Именно это мы и хотели бы понимать под погрешностью среднего. Этот результат также поясняет,
Нормальное распределение 139 почему такая погрешность называется стандартным откло- отклонением среднего. С помощью такого простого и изящного доказательства мы обосновали все результаты относительно случайных по- погрешностей, приведенные в предыдущих главах. 5.8. Коэффициент доверия Теперь мы можем вернуться к двум вопросам, затрону- затронутым впервые в гл. 2, на которые до сих пор не было дано исчерпывающего ответа. Во-первых, какой смысл мы вклады- вкладываем в ставшее уже привычным выражение: «Мы в разумной степени уверены, что некоторая измеренная величина лежит в интервале *наИл ± б*»? Или, выражаясь определеннее, как можно дать количественную характеристику степени нашего доверия к любому экспериментальному результату? Что касается первого вопроса, то ответ должен быть теперь ясен. Если мы измеряем величину х несколько раз (как это обычно бывает), то наша наилучшая оценка для х есть среднее х, а его стандартное отклонение о* есть наша наилучшая оценка погрешности среднего. Мы могли бы сде- сделать вывод, что (значение х) = х ± Ох, подразумевая под этим, что согласно нашим наблюдениям можно ожидать, что в 68 % случаев результаты любых по- последующих измерений I, сделанных с той же тщательностью, попадут в интервал х ± о^. Нашу погрешность можно оценить иначе. Например, мы могли бы предпочесть такую характеристику: (значение х) = х ± 2o*. В этом случае указывался бы интервал, в котором, как мы ожидаем, будет лежать 95% результатов всех однотипных измерений. Ясно, что при представлении любого измеренного значения главное — привести интервал (или погрешность из- измерения) и коэффициент доверия, соответствующий этому интервалу. Наиболее часто приводится стандартное отклоне- отклонение результата, которое понимается как 68%-ный доверитель- доверительный предел, т. е. коэффициент доверия в этом случае ра- равен 68%. Как подчеркивалось в гл. 2, почти все экспериметальные заключения содержат сравнение двух или более чисел. Во- Вооружившись статистической теорией, мы теперь можем дать количественные критерии для многих таких сравнений. Сей- Сейчас мы рассмотрим только один тип эксперимента, в котором
140 Глава 5 получают некоторое число и сравнивают полученный резуль- результат с известным ожидаемым ответом. Заметьте, что под этот частный случай попадают многие интересные эксперименты. Например, в эксперименте по проверке закона сохранения импульса мы могли бы измерить начальный и конечный им- импульсы р и р', чтобы проверить, что р — р' (в пределах погрешностей), но мы можем в равной мере считать, что ищется значение (р — рг), которое сравнивается с ожидае- ожидаемым ответом, равным нулю. В общем случае, когда мы хотим сравнить результаты любых двух измерений, в которых, по предположению, измеряется одна и та же величина, мы мо- можем образовать их разность и сравнивать ее с ожидаемым ответом, равным нулю. Любой другой эксперимент, в кото- котором измеряется величина (подобная g, ускорению свободного падения), для которой известно точное принятое значение, также попадает под этот тип экспериментов, причем ожидае- ожидаемым результатом является известное принятое значение. Предположим, что студент измеряет некоторую величину х (подобную разности двух импульсов, которые предположи- предположительно равны) в виде (значение х) = янаил ± о, где о обозначает стандартное отклонение его результата. (Это будет стандартное отклонение среднего, если хнаал есть среднее нескольких измерений.) Пусть затем он сравнивает свой результат с ожидаемым ответом хож- В гл. 2 мы отмечали, что если различие |лгнаИл — *ож| меньше (или только незначительно больше), чем а, то согла- согласие будет удовлетворительным, но если \хнаил — хож\ много больше, чем о, то оно неудовлетворительно. Сами по себе эти критерии правильны, но не дают никакой количественной характеристики того, насколько хорошо или плохо это согла- согласие. Они также не говорят нам ничего о границах, которые еще допустимы для согласия. Будет ли различие в 1,5а сви- свидетельствовать об удовлетворительном согласии? А в 2о? Теперь мы сможем ответить на эти вопросы, если пред- предположим, что результаты измерений нашего студента подчи- подчиняются нормальному распределению (а это определенно ра- разумно). Предположим две рабочие гипотезы относительно этого распределения: а) центр распределения совпадает с ожидаемым отве- ответом хож; б) параметр ширины распределения равен оцененной сту- студентом величине а. Гипотеза «а», конечно, заключается в том, что студент при измерении получает правильный ответ. Она добавляет к сде- сделанным допущениям еще то, что систематические ошибки
Нормальное распределение 141 уменьшены до пренебрежимо малого уровня (вследствие чего распределение имеет центр на истинном значении) и что истинное значение на самом деле равно лгож (т. е. основания, в соответствии с которыми ожидается хож, правильны). Ги- Гипотеза «б» представляет собой некоторое приближение, так как о — лишь оценка стандартного отклонения, но это хоро- хорошее приближение, если число измерений, на основании кото- которых определено значение о, велико1). Две наши гипотезы, вместе взятые, добавляют к сделанным ранее допущениям еще одно: измерения и вычисления студента в основном правильны. Теперь мы должны решить, является ли полученное сту- студентом значение хн&ил разумным, если справедливы наши гипотезы. В случае утвердительного ответа нет оснований сомневаться в гипотезах, и тогда все в порядке, но если ответ отрицателен, то в гипотезах следует усомниться и сту- студент должен проанализировать возможные ошибки в измере- измерениях или в расчетах, найти ранее не обнаруженные систе- систематические ошибки или обнаружить, что ожидаемое значение Хож неверно. Сначала определим различие |лснаил — *ож| и затем ве- величину 1 I *наил *ож| /К Qj\ число стандартных отклонений, на которое лсНаил отличается от хож. Затем по таблицам интеграла нормальных ошибок из приложения А можно найти вероятность (которую дают наши гипотезы) получения результата, отличающегося от хож на t или более стандартных отклонений. Эта вероятность есть Р (вне to) = 1 — Р (в пределах to). E.68) Если эта вероятность велика, то различие \хняил — хож\ вполне разумно и результат х„аал приемлем; если же вероятность E.68) «недопустимо мала», то различие следует рассматри- рассматривать как значимое (т. е. неприемлемое), и в этом случае наш ') Мы собираемся судить о надежности измерения величины *„аил, сравнивая \хяаил — хож\ с а, нашей оценкой ширины нормального распре- распределения. Если число измерений, на основании которых определяется а, мало, то эта оценка может быть довольно ненадежной и соответствующие доверительные пределы не точны (хотя все еще полезны как грубые оценки). В случае малого числа измерений можно точно вычислить дове- доверительные пределы при помощи так называемого «распределения Стьюдеи- та для t», которое учитывает возможные вариации нашей оценки а для ширины. См. Alder H. L, Roessler E. В., Introduction to Probability and Statistics, W. H. Freeman. 6th ed., 1977, ch. 10.
142 Глава 5 незадачливый студент должен попытаться определить, где он допустил ошибку. Предположим, например, что различие \хиаял — хож\ равно одному стандартному отклонению. Вероятность такого или большего различия составляет привычные 32%. Ясно, что различие в одно стандартное отклонение вполне допустимо и потому незначимо. В противоположном экстремальном слу- случае вероятность Р (вне За) составляет 0,3%, и если наши гипотезы верны, то крайне невероятно, чтобы мы могли по- получить различие в Зет. Меняя порядок аргументов, можно сказать, что если различие, полученное студентом, равно Зет, то крайне невероятно, чтобы наши гипотезы были верны. Граница между принятием и отвержением гипотезы зави- зависит от уровня, ниже которого мы рассматриваем различие как неразумно маловероятное. Этот уровень зависит от точки зрения экспериментатора. Однако многие считают, что 5% — хорошая граница для «неразумно малых вероятностей». Если принять этот уровень, то различие в 2ст было бы уже неприемлемым, так как Р (вне 2сг) = 4,6%. Действительно, из таблицы в приложении А мы видим, что любое различие, превышающее 1,96ст, неприемлемо на этом 5%-ном уровне. На 2%-ном уровне было бы неприемлемым любое различие, превышающее 2,32ст, и т. д. Итак, у нас до сих пор нет четкого ответа на вопрос, приемлемо или неприемлемо определенное измеренное значе- значение л'нанл. Однако наша теория нормального распределения дала нам ясную количественную меру разумности любого частного результата. И это лучшее, на что мы могли бы надеяться. Имеются, конечно, более сложные типы экспериментов, анализ результатов которых требует соответственно более сложных теорий. Однако большинство основных принципов было уже проиллюстрировано нами на простом и важном примере. Читатель, который захочет познакомиться с допол- дополнительными примерами, может найти некоторые из них в ч. II этой книги. Задачи Напоминание: звездочка у номера задачи означает, что задача ре- решается или ее ответ приводится в разделе «Ответы» в конце книги. *5.1 (разд. 5.1). Студент измеряет моменты количества движения Ц и Lf вращающейся системы до и после добавления дополнительной массы. Чтобы проверить закон сохранения момента количества движения, он вы- вычисляет L, — Lf (ожидая результата 0). Студент повторяет измерение 50 раз и сортирует полученные данные по бинам, как показано в табл. 5.3, где приведены его результаты (в некоторых условных единицах) после 5, ТО и 50 измерений. Начертите соответствующие гистограммы для каждого из этих трех случаев. (Будьте внимательны в выборе масштабов, площадь
Нормальное распределение 143 Таблица 5.3 Бин Число результатов После 5 измерений После 10 измерений После 50 измерений -9 ДО -7 0 0 1 -7 ДО -5 1 1 3 -5 ДО -3 2 2 7 -3 ДО -1 0 2 8 -1 ДО 1 1 3 10 i ДО 3 0 1 9 3 ДО 5 1 1 6 5 ДО 7 0 0 4 7 ДЭ 9 0 0 2 каждого прямоугольника должна равняться доле событий в соответствую- соответствующем бине.) *5.2 (разд. 5.2). Предельное распределение результатов в некотором гипотетическом измерении имеет вид (С жля\х\<а, \о в остальных точках. а. Используйте условие нормировки E.13) и вычислите постоянную С через а. б. Начертите предельное распределение. В чем смысл постоянной а? в. Используя формулы E.15) и E.16), вычислите среднее х и стан- стандартное отклонение, которые получились бы в результате большого числа измерений. 5.3 (разд. 5.3). Используя подходящую миллиметровую бумагу и хо- хорошо размеченные оси координат, постройте хороший график распределе- распределения Гаусса для X = 2, _а = 1 и для X = 3, а = 0,3. Используйте калькулятор для расчета значений fXa (х). Если у калькулятора есть регистры памяти для хранения значений а -\/2п и —2а2, то это ускорит ваши расчеты. Если вы будете помнить, что функция симметрична относительно х = X, то это сократит вычисления наполовину. Представьте оба графика на одном ли- листе для сравнения. *5.4 (разд. 5.3). Если вы не построили, то начертите гистограмму для третьего случая задачи 5.1. Студент, выполняя задачу 5.1, решил, что распределение его результатов согласуется с функцией Гаусса fx a(x)r имеющей центр в точке X = 0 и ширину а = 3,4. Представьте это рас- распределение на том же графике и сравните его с гистограммой. (Прочи- (Прочитайте указания к задаче 5.3. Заметьте, что у вас нет количественного критерия для сравнения степени согласования двух графиков; все, что вы можете, — это посмотреть, хорошо ли функция Гаусса аппроксимирует ги- гистограмму.) 5.5 (разд. 5.3). Ширина распределения Гаусса обычно характеризу- характеризуется параметром ст. Альтернативный параметр с простой геометрической интерпретацией — полная ширина на половине высоты, или ПШПВ1). *) Автор использует принятую в литературе на английском языке аббревиатуру для понятия «полная ширина на половине высоты», состав- составленную из первых букв соответствующих английских слов (full width at half maximum — FWHM). Аналогичная аббревиатура в литературе на рус- русском языке ПШПВ не является общепринятой. — Прим. перев.
144 Глава 5 'макс 'макс Рис. 5.18. Полная ширина иа половине высоты (ПШПВ). Это — расстояние между двумя точками х, в которых /Jf> g (х) равна по- половине своего максимального значения, как показано на рнс. 5.18. Дока» жите, что ПШПВ = 2а л/ШТ= 2,35а. Это означает, что половина максимального значения достигается в точках X ± 1,17с или, очень приближенно, X ± а. *5.6 (разд. 5.3). Выполните детальные выкладки, которые ведут от E.30) к E.31), чтобы показать, что стандартное отклонение ах в случае большого числа измерений, результаты которых распределены нормально с параметром ширины а, равно ах = а. 5.7 (разд. 5.4). Если результаты измерений некоторой величины к описываются функцией Гаусса fx g (х), то вероятность получить значение между X — ta и Л' -j- ta, очевидно, есть X+ta Р (в пределах ta) = \ fXa(x)dx. X-ta Докажите подробно, указывая все необходимые замены переменных, что +t Р(в пределах ta) л/2п e~zy2 dz. E.69) * Бри каждой замене переменных тщательно проверяйте пределы интегри- интегрирования. Интеграл E.69) часто называют функцией ошибок, или интегра- интегралом ошибок, и обозначают erf(^). *5.8 (разд. 5.4). Студент измеряет некоторую величину у много раз и вычисляет среднее у = 23 и стандартное отклонение ау = 1. Какую долю отсчетов студента вы ожидали бы найти между а) 22 и 24? б) 22,5 и 23,5? в) 21 и 25? г) 21 и 23? д) 24 и 25? Наконец, е) в каком интервале (эквидистантном по обе стороны от среднего) вы ожидали бы найти 50 % его отсчетов? Вся необходимая информация для решения этого вопроса приведена на рис. 5.13. Дополнительная информация относительно вероятностей со- событий такого рода приведена в приложениях А и Б.
Нормальное распределение 145 5.9 (разд. 5.4). Массовые обследования показали, что распределение по росту мужчин в некоторой стране нормальное со средним h = 174 см и стандартным отклонением а = 5 см. В случайной выборке из 1000 мужчин сколько из них будут (по вашим ожиданиям) иметь рост а) между 169 см и 179 см? б) больше, чем 179 см? в) больше, чем 189 см? г) между 164 и 169 см? *5.10 (разд. 5.5). Предположим, что мы произвели N измерений Хи ..., Хц одной и той же величины х и полагаем, что соответствующее предельное распределение должно быть функцией Гаусса fx д (х) с неиз- неизвестными X и а. Согласно принципу максимального правдоподобия, наи- наилучшей оценкой для ширины будет такое значение а, для которого вероят- вероятность Рх д(*р ...,xN) для наблюденных значений xit ..., xN макси- максимальна. Продифференцируйте Px,a(xv •••<xn) b (*>.41) по а и покажите, что максимум достигается для значения а, определяемого E.44). Как уже обсуждалось после получения E.44), этот результат означает, что наилучшей оценкой для а является стандартное отклонение N наблюден- наблюденных значений хи ..., Хы. 5.11 (разд. 5.6). Проверьте тождество E.54), использованное для об- обоснования квадратичного сложения при расчете ошибок в косвенных из- измерениях. *5.12 (разд. 5.7). Ниже приведены результаты сорока измерений ti, ..., tko времени падения камня от окна до земли (все в сотых долях секунды): 63 58 74 78 70 74 75 82 68 69 76 62 72 88 65 81 79 77 66 76 86 72 79 77 60 70 65 69 73 77 72 79 65 66 70 74 84 76 80 69 а. Вычислите стандартное отклонение а< для этих 40 измерений. б. Вычислите средние tu ..., ?ю по четырем измерениям в каждом из десяти столбцов. Полученные данные можно рассматривать как ре- результаты десяти экспериментов, в каждом из которых определяется среднее четырех измерений. Считая известным результат задания а, определите значение для стандартного отклонения, ожидаемое для десяти средних ?ь ..., ?ю? Чему оно равно в действительности0 в. Начертите гистограммы для 40 индивидуальных измерений t\, ..., /40 и для десяти средних U, ..., ?ю. Используйте одинако- одинаковые масштабы и размеры бинов для обоих графиков, чтобы их легко можно было сравнивать. Размеры и границы бииов можно выбирать разными способами, из которых, возможно, простейший состоит в том, чтобы границу одного бина выбрать при значении среднего всех 40 измерений G2,90) и использовать бины, размеры которых равны стандартному отклонению десяти средних значений U ?ю. *5.13 (разд. 5.8). Студент измеряет g, ускорение свободного падения, многократно и тщательно и получает конечный результат 9,5 м/с2 и стан- стандартное отклонение, равное 0,1. Если считать, что результаты его измере- измерений распределены нормально с центром, равным принятому значению 9,8 и с шириной 0,1, то какова вероятность получения результата, который отличается от 9,8 так же (или более), как ответ студента? Предполагая, что студент не сделал фактических ошибок, можете ли вы сказать, что, вероятно, его эксперимент подвержен влиянию некоторых невыявленпых систематических ошибок? 5.14 (разд. 5.8). Два студента А и Б измеряют одну и ту же вели- величину х и получают результаты хА = 13 ± 1 н хБ = 15 ± 1, в которых в качестве погрешностей указаны стандартные отклонения.
146 Глава 5 а. Предполагая, что все ошибки независимы и случайны, найдите раз- разность л:д — хБ и ее погрешность. б. Предполагая, что все результаты в соответствии с ожиданием рас- распределены нормально, что вы можете сказать о вероятности полу- получения такого различия, как у студентов? Считаете ли вы это раз- различие значимым (на 5 %-ном уровне)? *5.15 (разд. 5.8). Экспериментатор хочет проверить закон сохранения энергии для некоторой ядерной реакции и получает значения начальной и конечной энергий соответственно Е-, = 75 ± 3 МэВ и Е; = 60 ± 9 МэВ, где в качестве погрешностей приведены стандартные отклонения резуль- результатов. Является ли это различие значимым (на 5 %-ном уровне)? Четко- сформулируйте ваши аргументы при ответе на этот вопрос.
ЧАСТЬ II 6. Отбрасывание данных 7. Взвешенные средние 8. Аппроксимация методом наименьших квадратов 9. Смешанный второй момент и корреляция 10. Биномиальное распределение 11. Распределение Пуассона 12. Критерий х2 Для распределений Если вы прочитали и поняли содержание гл. 5, то для вас теперь не составит труда изучить ряд более сложных вопросов. Семь глав в ч. II содержат семь таких вопросов, причем одни из них являются приложениями уже развитой статистической теории, а другие — ее дальнейшим развитием. Все эти вопросы важны, и вдумчивый студент обязан разо- разобраться в них рано или поздно. С другой стороны, вовсе не обязательно изучить их все одновременно. По этой причине вопросы излагаются в независимых коротких главах, кото- которые можно изучать в любом порядке в соответствии с вашими нуждами и интересами.
Глава б Отбрасывание данных В этой главе мы обсудим довольно щекотливый вопрос, отбрасывать ли результат измерений, который кажется до такой степени неразумным, что похож скорее на ошибку. 6.1. Проблема отбрасывания данных Иногда результат одного из серии измерений поразительно расходится со всеми остальными. Когда это происходит, экс- экспериментатор должен решить, является ли такой аномальный результат измерения следствием некоторой ошибки и поэтому должен быть отброшен, или же это законный результат, кото- который должен рассматриваться наряду с другими. Например, представим себе, что мы делаем шесть измерений периода колебаний маятника и получаем результаты (в секундах) 3,8; 3,5; 3,9; 3,9; 3,4; 1,8. F.1) В этом примере значение 1,8 поразительно отличается от остальных, и мы должны решить, что с ним делать. Из гл. 5 нам известно, что результат нормального изме- измерения может значительно отличаться от результатов других измерений той же самой величины. Тем не менее в обычной ситуации столь большое различие, как в случае последнего измерения в F.1), очень невероятно; поэтому мы можем по- подозревать, что время 1,8 с является результатом какой-то незамеченной ошибки или обусловлено какой-то внешней причиной. Возможно, мы просто ошиблись при считывании этого последнего значения времени, или, может быть, наш электронный секундомер остановился во время последнего измерения из-за внезапного нарушения контакта с блоком питания. Если бы мы очень тщательно следили за каждым изме- измерением, то иногда могли бы обнаружить какую-то определен- определенную причину аномального результата. Например, наши записи результатов могли бы показать, что в случае послед- последнего измерения в F.1) использовался другой секундомер, а последующая проверка могла бы показать, что он отстает. В этом случае результат аномального измерения определенно следует отбросить.
Отбрасывание данных 149 К сожалению, обычно не удается найти какую-то внешнюю причину аномального результата. В этом случае мы должны решить, отбросить этот результат или нет, опираясь только на сами результаты, и тогда наши знания распределения Гаусса оказываются полезными. Отбрасывание данных — спорный вопрос, по которому у специалистов нет единого мнения. Но это также и важный вопрос. В нашем примере наилучшая оценка периода коле- колебаний маятника существенно зависит от того, отбросим ли мы подозреваемое значение 1,8 с. Среднее всех шести изме- измерений равно 3,4 с, в то время как среднее пяти измерений равно 3,7 с, т. е. существенно отличается. Кроме того, решение отбросить какие-то данные в конеч- конечном счете всегда субъективно, и ученого, который принял такое решение, его коллеги могут осудить за такую «под- «подгонку» данных. Однако ситуация осложняется, если учесть вероятность того, что аномальный результат может отражать некоторые важные эффекты. В самом деле, многие важные научные открытия сначала выглядели как аномальные ре- результаты измерений, которые походили скорее на ошибки. Отбрасывая значение времени 1,8 с в примере F.1), мы, возможно, выбрасываем наиболее интересную часть данных. Действительно, единственно честная реакция при встрече с данными, подобными F.1), — повторять измерения много раз. Если аномалия повторится снова, мы, вероятно, будем в состоянии выяснить ее причину, будь то ошибка или реаль- реальный физический эффект; если же она не повторится, то к тому времени мы сделаем, скажем, 100 измерений, так что не будет существенной разницы для нашего конечного резуль- результата, включим мы в расчет аномалию или нет. Тем не менее в большинстве случаев непрактично (осо- (особенно в учебной лаборатории) повторять измерение 100 раз, если только результат покажется подозрительным. Следова- Следовательно, нам необходим критерий, согласно которому отвер- отвергается подозрительный результат. Имеется несколько таких критериев, причем некоторые из них довольно сложные. Кри- Критерий, который мы опишем, называется критерием Шовене; это простой и поучительный случай применения распределе- распределения Гаусса. 6.2. Критерий Шовене Вернемся к шести измерениям примера F.1): 3,8; 3,5; 3,9; 3,9; 3,4; 1,8. Если мы предположим на время, что все эти значения — за- законные результаты измерений величины х, то можно вычис-
150 Глава 6 лить среднее х и стандартное отклонение ах: Jt = 3,4c т.2) и схх = 0,8 с. .6.3) Теперь мы можем установить количественный предел, указы- указывающий, до какой степени подозрительный результат 1,8 ано- аномален. Он отличается от среднего значения 3,4 на 1,6, или на два стандартных отклонения. Если мы предположим, что результаты измерений подчиняются распределению Гаусса с центром и шириной, определяемыми выражениями F.2) и F.3), то мы можем вычислить вероятность Получения ре- результатов, которые по крайней мере так же сильно отли- отличаются от среднего. В соответствии с данными, приведенными на рис. 5.13, эта вероятность равна Р (вне 2ах) = 1 — Р (в пределах 2ах) = 1 - 0,95 = 0,05. Другими словами, предполагая, что значения F.2) и F.3J для х и ах справедливы, мы ожидали бы, что только один результат из 20 отличается от среднего по крайней мере так же сильно, как отличается подозрительное число 1,8 с. Про- Проделав 20 или более измерений, мы действительно должны были бы ожидать появления одного или двух результатов настолько плохих, как 1,8 с, и тогда не было бы оснований отбрасывать их. Но мы произвели только шесть измерений, поэтому ожидаемое число результатов, которые были бы так плохи, как 1,8 с, в действительности равно 0,05-6 = 0,3, т. е. для имеющихся шести результатов измерений вероят- вероятность того, что хотя бы одно из этих значений будет на- настолько плохим, как 1,8 с, составляет '/з- Это число дает нам искомую количественную меру «разум- «разумности» подозрительного результата. Если считать, что число 7з «до смешного невероятно», то мы придем к выводу, что значение 1,8 с — ненормальный результат, который должен быть отброшен. Выбор границы, начиная с которой результат становится «до смешного невероятным», принадлежит экспериментатору. Критерий Шовене в его обычном понимании утверждает, что если ожидаемое число измерений, столь же плохих, как и подозрительный результат, меньше чем '/г. то подозритель-
Отбрасывание данных 151 ный результат следует исключить. Очевидно, выбор величины '/г произволен; но он также разумен, и его можно оправдать. Теперь легко описать применение критерия Шовене к об- общей задаче. Предположим, мы делаем N измерений Х\, . . ., XN одной и той же величины х. Учитывая все N измерений, мы вычисляем х и ах. Если один из результатов измерений отли- отличается от х настолько, что представляется подозрительным (обозначим его хПоп), то мы сначала вычисляем 1поя = ^х ' ^ ' число стандартных отклонений, на которое xnon отличается от х. Затем мы находим (из рис. 5.13 или из более полной таблицы в приложении А) вероятность Р (вне /пода*) того, что нормальное измерение будет отличаться от х на /„од или более стандартных отклонений. Наконец, мы умножаем на N, полное число измерений, чтобы получить «(хуже, чем хпоя) = NP(вне /подох). Полученное значение п — число ожидаемых измерений, ко- которые дают столь же плохие результаты, как хпод. Если п меньше '/г, то д:ПОд не удовлетворяет критерию Шовене и от- отвергается. После отбрасывания результата, не удовлетворяющего критерию Шовене, естественно, надо пересчитать х и ах по оставшимся данным. В этом случае получается значение ах, которое будет меньше первоначального, и может случиться так, что с новым значением ах некоторые другие результаты измерений не будут удовлетворять критерию Шовене. Однако большинство авторитетных специалистов считает, что крите- критерий Шовене не должен применяться второй раз с использо- использованием пересчитанных значений х и ах- Многие ученые полагают, что отбрасывание данных ни- никогда не может быть оправдано, пока не найдется внешнее свидетельство того, что подозреваемые данные неверны. Мо- Может быть, более умеренная позиция состоит в том, что крите- критерий Шовене следует использовать для обнаружения данных, которые могли бы по крайней мере рассматриваться как кандидаты на отбрасывание. Добросовестный студент может сделать вычисления дважды: первый раз с учетом данных, которые находятся под вопросом, и второй раз без них, чтобы посмотреть, насколько в действительности подозреваемое значение влияет на окончательное заключение.
152 Глава 6 6.3. Пример Студент делает десять измерений одной длины х и полу- получает результаты (все в миллиметрах) 46, 48, 44, 38, 45, 47, 58, 44, 45, 43. Заметив, что значение 58 кажется аномально большим, он проверяет свои записи, но не находит указаний на то, что этот результат получился по ошибке. Тогда он применяет критерий Шовене. Какой вывод он сделает? Учитывая временно все десять измерений, он рассчитывает х = 45,8 и сгж = 5,1. Разность между подозрительным значением лгП0д = 58 и сред- средним х = 45,8 равна 12,2, или 2,4 стандартных отклонений, т. е. *под — х 58 — 45,8 „ . ох — 5,1 — 1Л~ Из таблицы приложения А он находит: вероятность того, что результат будет отличаться от х на 2,40* или более, равна Р (вне 2,4сг) = 1 — Р (в пределах 2,4а) = 1 - 0,984 = 0,016. Для десяти измерений он мог бы, следовательно, получить только 0,16 случаев такого плохого измерения, как подозри- подозрительный результат. Так как это число меньше '/г, числа, устанавливаемого критерием Шовене, то студент должен по крайней мере рассмотреть возможность отбрасывания этого результата. Следующий подозрительный результат — это 38, который на 1,5 стандартных отклонений отличается от среднего х = 45,8. Аналогичные вычисления показывают, что среди десяти результатов он мог бы ожидать 1,3 случаев таких же плохих результатов, как и этот, так что этот результат вполне приемлем. Если же он решит выбросить подозрительный ре- результат 58, то он должен пересчитать х и ах и получить х = 44,4 и ах = 2,9. Как можно было ожидать, среднее изменилось немного, а стандартное отклонение заметно уменьшилось. Задачи Напоминание: звездочка у номера задачи означает, что задача ре- решается или ее ответ приводится в разделе «Ответы» в конце книги. 6.1 (разд. 6.2). Усердная студентка делает 50 измерений количества теплоты Q, выделяющейся в определенном процессе. Она получает сред-
Отбрасывание данных 153 нее значение и стандартное отклонение, равные соответственно Q = 4,8 и Cq = 0,4, где оба результата выражены в калориях. а. Предполагая, что результаты ее измерений подчиняются нормаль- нормальному распределению, найдите вероятность того, что любое единич- единичное измерение приведет к результату, отличающемуся_от Q на 0,8 кал или более. Сколько результатов, отличающихся от Q на 0,8 кал, ей следует ожидать? Если бы один из результатов ее измерений был равен 4,0 кал и она решила бы использовать критерий Шовене, то отбросила ли бы она этот результат? б. Если бы один из ее результатов составлял 6,0 кал, то отбросила ли бы она его? *6.2 (разд. 6.2). Студент измеряет некоторую разность потенциалов V десять раз и получает результаты (в вольтах) 0,86; 0,83; 0,87; 0,84; 0,82; 0,95, 0,83; 0,85; 0,89; 0,88. а. Вычислите среднее V и стандартное отклонение ov этих резуль- результатов. б. Если он решит использовать критерий Шовене, то должен ли он отбросить отсчет 0,95 В? Приведите подробно вашу аргументацию. *6.3 (разд. 6.2). Студент делает 14 измерений периода колебаний ге- генератора и получает результаты (в десятых долях секунды) 7, 3, 9, 3, С, 9, 8, 7, 8, 12, 5, 9, 9, 3. Чувствуя, что результат 12 подозрительно велик, он решает использовать критерий Шовене. Отвергнет ли он подозрительный результат? Сколько результатов, так же отличающихся от среднего, как 12, ему следует ожи- ожидать? 6.4 (разд. 6.2). Критерий Шовене определяет границу, за пределами которой результат измерения рассматривается как отвергаемый. Если мы делаем десять измерений и один из результатов отличается от среднего более чем на два стандартных отклонения (в любую сторону), то этот результат рассматривается как отвергаемый; в случае 20 измерений соот- соответствующая граница равна 2,2 стандартных отклонений. Составьте таб- таблицу, показывающую «границу отбрасывания» для случаев 5, 10, 15, 20, 50, 100, 200 и 1000 измерений. (Используйте таблицу функции ошибок из приложения А.)
Глава 7 Взвешенные средние В этой главе рассматривается проблема объединения результатов двух или более отдельных и независимых изме- измерений одной и той же физической величины. Мы покажем, что наилучшей оценкой этой величины, основанной на не- нескольких измерениях, будет соответствующее взвешенное среднее этих измерений. 7.1. Проблема объединения результатов разных измерений Часто бывает так, что одна физическая величина изме- измеряется несколько раз, возможно даже в нескольких незави- независимых лабораториях, и тогда возникает вопрос, как объеди- объединить эти результаты, чтобы получить единственную наилуч- наилучшую оценку. Предположим, например, что два студента А и Б тщательно измеряют величину х и получают следующие результаты: студент А: . х = хА± аА G.1) и студент Б: х = хв ± сгБ. G.2) Каждый из этих результатов, вероятно, и сам по себе яв- является следствием нескольких измерений; например, хА мо- может быть средним всех измерений студента Аи аА — стан- стандартным отклонением этого среднего (и аналогично для А'Б и сгБ). Вопрос теперь состоит в том, как лучше всего объединить хА и хъ, чтобы получить единственную наилуч- наилучшую оценку для х. Прежде чем ответить на этот вопрос, заметим, что если различие | хк — л:Б | между двумя измерениями намного больше обеих погрешностей аА и аБ, то, по-видимому, что-то не в порядке по крайней мере в случае одного из измерений. В этой ситуации мы сказали бы, что два измерения противо-
Взвешенные средние 155 речивы, и необходимо тщательно проанализировать оба из- измерения, чтобы проверить, не подвержено ли одно из них (или оба) незамеченным систематическим ошибкам. Предположим, однако, что два измерения G.1) и G.2) непротиворечивы, т. е. различие \хА — хБ| не намного больше, чем любая из погрешностей аА и аБ В этом случае имеет смысл спросить, какова наилучшая оценка хнаил истинного значения X, основанная на этих двух измерениях. Первой реакцией могло быть вычисление среднего значения (л;д + *б)/2 ДвУх измерений. Однако уже небольшое размыш- размышление заставляет предположить, что этот путь не подходит, если две погрешности аА и аБ не равны. Вычисление про- простого среднего (*A + xB)J2 делает одинаково важными оба измерения, в то время как более точному отсчету следует приписать больший вес. 7.2. Взвешенное среднее Мы легко можем решить нашу задачу, используя принцип максимального правдоподобия почти так же, как мы это де- делали в разд. 5.5. Если предположить, что результаты обоих измерений подчиняются распределению Гаусса, и обозначить неизвестное истинное значение величины х через X, то ве- вероятность того, что студент А получит свое частное значение хА, равна Рх (ха) ~ — е ^ А '' А G.3) СТА и вероятность того, что студент Б получит значение хБ, равна Введя индекс X, мы указали явным образом, что эти вероят- вероятности зависят от неизвестного истинного значения. (Они также зависят от соответствующих ширин оА и аБ, но мы этого не указали.) Вероятность того, что студент А получит значение хх и студент Б — значение хБ, равна произведению двух вероят- вероятностей G.3) и G.4). Теперь должно быть уже привычным, что это произведение будет экспоненциальной функцией с по- показателем, равным сумме двух показателей в G.3) и G.4). Запишем это как Рх (хх, хБ) = Рх (х\) Рх
156 Глава 7 где мы ввели удобное краткое обозначение %2 для показа- показателя / хА - X \2 / хп- X \2 (v)(v) <7-6> Эта важная величина представляет собой сумму квадратов отклонений от X результатов двух измерений, деленных на соответствующие погрешности. Ее иногда называют «суммой квадратов». Принцип максимального правдоподобия утверждает, как уже было отмечено, что наилучшей оценкой для неизвестного истинного значения X будет такое значение, для которого фактически полученные величины хк и хБ наиболее ве- вероятны. Иными словами, наилучшей оценкой для X будет значение, при котором вероятность G.5) достигает макси- максимума, или, что эквивалентно, показатель %2 минимален. (По- (Поскольку максимизация вероятности влечет за собой миними- минимизацию «суммы квадратов» %2, то этот метод оценки X иногда называют «методом наименьших квадратов».) Таким обра- образом, чтобы определить наилучшую оценку, мы просто про- продифференцируем G.6) по X и приравняем производную нулю: Ха — X Ху, — X Z 2 i~ Z 2 —U> Решение этого уравнения относительно X есть наилучшая оценка лгНаил, и, как легко видеть, она равна Этот довольно громоздкий результат можно записать ком- компактнее, если определить веса ша = -т и и>б = —о-- G.8) СТА СТБ Подставляя в G.7), получим лнанл Если два исходных измерения одинаково точны (аА = ав и, следовательно, даА = даБ),то наш ответ сводится к простому среднему значению (хК-\- xh^j2. В общем случае выражение G.9) дает взвешенное среднее; оно аналогично формуле для центра тяжести двух тел, когда wA и wh — действительные веса двух тел, а хА и хБ — их координаты. В данном случае «веса» — обратные значения квадратов погрешностей в исход-
Взвешенные средние 157 ных измерениях, как видно из G.8). Если измерения сту- студента А более точны, чем студента Б, то сгА < ав и, следо- следовательно, wA > wb; поэтому наилучшая оценка лгнаил будет ближе к хк, чем к хБ, как и должно быть. Наш анализ можно обобщить на случай, когда объеди- объединяются несколько измерений одной и той же величины. Пред- Предположим, что у нас есть N отдельных измерений величины х x2 J2> с соответствующими погрешностями в\, ..., on. Рассуждая, как и выше, мы получим, что наилучшая оценка, основанная на этих измерениях, равна взвешенному среднему G.10) где веса Wi — это обратные значения квадратов соответствую- соответствующих погрешностей wt=\/al G.11) для i = 1, 2, ..., N. Поскольку вес wi = 1/сг?, связанный с каждым измере- измерением, содержит квадрат соответствующей погрешности а,, то любое измерение, существенно менее точное, чем остальные, внесет много меньший вклад в конечный результат G.10). Например, если одно измерение в четыре раза менее точно, чем остальные, то его вес в 16 раз меньше, чем другие веса, и во многих случаях это измерение можно просто игнори- игнорировать. Поскольку конечный результат G.10) для лг„аил — это про- простая функция исходных значений х\, ..., xn, to довольно просто вычислить погрешность нашего результата методом расчета ошибок в косвенных измерениях. В задаче 7.5 вам предлагается проверить, что погрешность результата G.10) для Янаил равна / N \-Ч, G-12) где, как обычно, wt = Ijoj.
158 Глава 7 7.3. Пример Три студента измеряют сопротивление несколько раз и по- получают три следующих ответа (в омах): (значение первого студента для R) = 11 ± 1; (значение второго студента для R) = 12 ± 1; (значение третьего студента для R) — 10 ± 3. Если даны эти три результата, то какова наилучшая оценка для сопротивления R? Три погрешности cri, о2, сг3 равны соответственно 1, 1 и 3. Следовательно, соответствующие три веса wt = 1/сг? равны ш1 = 1, тг=\, Щ = -§- Таким образом, в соответствии с G.10) наилучшая оценка есть Y,wtRt A-П)+ (Ы2)+ (¦/»• Ю) _ Анаил о ,,,,!/ 2j Wi I + 1 + I-- = 11,42 Ом. Погрешность этого результата определяется G.12) как Таким образом, наш конечный вывод имеет вид /?= 11,4 ±0,7 Ом. Интересно проследить, какой ответ мы получили бы, если бы полностью игнорировали результаты измерений третьего студента, которые в три раза менее точны и, следовательно, в девять раз менее важны. В этом случае простое вычисление дает А!наил = 11,50 (по сравнению с 11,42) с погрешностью 0,71 (по сравнению с 0,69). Очевидно, третье измерение не имеет большого значения. Задачи Напоминание: звездочка у номера задачи означает, что задача реша- решается или ее ответ приводится в разделе «Ответы» в конце книги. *7.1 (разд. 7.2). а. Два измерения скорости звука и дают результаты 334±1 и 336+2 (оба в м/с). Считаете ли вы эти измерения непротиворечивыми? Если да, то вычислите наилучшую оценку для и и ее погрешность. в. Повторите задание «а» для результатов 334 ± 1 и 336 ± 5. Стоит ли использовать в расчетах второй результат? *7.2 (разд. 7.2). Два студента измеряют сопротивление различными методами. Каждый делает по десять измерений и вычисляет среднее и его стандартное отклонение и получает студент A: R = 72 ± 8 Ом, студент Б: R = 78 ± 5 Ом.
Взвешенные средние 159 а. Рассматривая оба измерения, найдите, чему равны наилучшая оцен- оценка R и ее погрешность. б. Оцените приблизительно, сколько измерений должен сделать сту- студент А (используя свой метод измерений), чтобы вес его результата был бы такой же, как и у студента Б. 7.3 (разд. 7.2). Найдите наилучшую оценку и ее погрешность, осно- основанные на следующих четырех измерениях одной и той же величины: 1,4 ±0,5; 1,2 ±0,2; 1,0 ±0,25; 1,3 ±0,2. 7.4(разд. 7.2). Предположим, что все N измерений одной и той же величины х имеют одинаковую погрешность. Покажите четко, что в этом случае взвешенное среднее G.10) сводится к обычному среднему значе- значению, или среднему, х = ( ^Г XjjjN, и что выражение G.12) для погреш- погрешности сводится к знакомому стандартному отклонению среднего. *7.5 (разд. 7.2). Если даны результаты N измерений Х\, ..., Хц одной и той же величины х с погрешностями CTi, ..., о>, то наилучшая оценка для х определяется выражением G.10), как хнаил = (V w^^K V wi), где веса w( = 1/сг?. Это выражение определяет л:данл как функцию Xi, ..., хы. Используя формулу C.47) для расчета ошибок в косвенных измерениях, покажите, что погрешность в хктя дается G.12) как ах = ( у •"нанл ч i.j
Глава 8 Аппроксимация методом наименьших квадратов Наше обсуждение статистической обработки данных до сих пор было сосредоточено исключительно на многократных измерениях одной и той же величины не потому, что такой анализ многократных измерений одной величины является наиболее важной задачей статистики, а потому, что эта про- простая задача должна быть хорошо понята, прежде чем мы сможем перейти к более общим проблемам. Теперь мы нако- наконец обсудим нашу первую, очень важную более общую проблему. 8.1. Данные, которые должны ложиться на прямую линию Один из наиболее общих и интересных типов экспери- экспериментов состоит в измерении нескольких значений двух раз- различных физических переменных для исследования математи- математической связи этих двух переменных1). Например, можно бро- бросать камень с разных высот hu ..., hN и измерять соответ- соответствующие времена падения t\, ..., t^, чтобы проверить, свя- связаны ли эти значения высот и времен ожидаемым соотноше- соотношением h = l/2gt2- Вероятно, наиболее важными экспериментами такого типа являются те, где ожидаемая связь линейна, как это реали- реализуется в случае, который мы рассмотрим первым. Например, если мы допускаем, что тело падает с постоянным ускорением свободного падения g, то его скорость v должна быть линей- линейной функцией времени t: v = vo + gt. В общем случае мы будем рассматривать любые две физи- физические переменные х и у, которые, как мы считаем, связаны ') В литературе на русском языке такие измерения двух или более разных величин принято называть совместными. — Прим. перед.
Аппроксимация методом наименьших квадратов 16! линейной зависимостью вида = А + Вх, (8.1) где А и В — постояннные. К сожалению, для линейной зави- зависимости используется много разных обозначений; остерегай- остерегайтесь спутать (8.1) со столь же часто встречающейся записью у = ах-\-Ь. Если две переменные у и х связаны линейной зависи- зависимостью вида (8.1), то график у от х должен быть прямой линией с наклоном В, которая пересекает ось у в точке у = А. Если бы мы измерили N различных значений х\, ... ..., xN и соответствующих значений у\, ..., ун и если бы результаты наших измерений не содержали погрешностей, то каждая точка (xt, yi) легла бы точно на линию у = А + Вх, как показано на рис. 8.1, а. На практике же всегда имеются погрешности, и большее, что мы можем ожидать, — это то, что расстояние каждой точки (;с<, г/,) от линии должно быть сравнимо в разумных пределах с погрешностями, как пока- показано на рис. 8.1, б. При выполнении ряда измерений описанного типа возни- возникают два вопроса. Во-первых, если мы примем как факт, что у и х действительно связаны линейно, то придем к интересной задаче определения прямой линии у = А + Вх, которая наи- наилучшим образом аппроксимирует результаты измерений, т. е. к задаче определения наилучших оценок постоянных А и В, основанных на данных (xi,yi), ..., (xN,yN). Эта задача мо- может быть решена графически, как кратко рассматривалось в разд. 2.6. Ее можно решать также аналитически при помощи метода максимального правдоподобия. Этот аналитический a ? Рис. 8.1. а — если две переменные у я х связаны линейной зависимостью, как в формуле (8.1), и если нет экспериментальных погрешностей, то из- измеренные точки (*•(, yi) точно лягут на линию у = А + Вх. б — на прак- практике всегда имеются погрешности которые можно изобразить черточка- черточками ошибок, и точки (xi, yi) в этом случае, как следует ожидать, будут располагаться на разумно близких расстояниях от линии. В данном случае показано, что только значения у подвержены влиянию заметных погреш- погрешностей.
162 Глава 8 метод определения наилучшей прямой линии, которая аппрок- аппроксимирует серию экспериментальных точек, называется линей- линейной регрессией или аппроксимацией прямой методом наи- наименьших квадратов и является главной темой этой главы. Второй вопрос, который можно задать, — это действи- действительно ли измеренные значения {х\,у\), ..., (xN,yN) оправ- оправдывают наши ожидания, что функция у линейна по х. Сна- Сначала мы можем определить линию, которая наилучшим об- образом аппроксимирует данные, но затем мы должны предло- предложить некоторую меру, которая показала бы, насколько хо- хорошо эта линия аппроксимирует данные. Этот вопрос мы рас- рассмотрим в гл. 9. 8.2. Расчет постоянных А и В Вернемся теперь к задаче определения наилучшей прямой линии у = A -f- Bx, аппроксимирующей набор эксперимен- экспериментальных точек (xi,y\), ..., {хы,Уы)- Для упрощения будем предполагать, что, хотя результаты наших измерений хну содержат некоторые погрешности, погрешность в измерениях х пренебрежимо мала. Это — разумное допущение, так как погрешности в одной переменной часто намного больше, чем погрешности в другой, которые мы, следовательно, можем без всякого опасения игнорировать. Далее мы будем предпо- предполагать, что все погрешности в у одинаковы по величине. (Это также разумное допущение для многих экспериментов, но если погрешности различны, то наше рассмотрение может быть обобщено с помощью соответствующего учета весов этих измерений; см. задачу 8.4). Если говорить точнее, мы предположим, что результат измерения каждого у,- подчи- подчиняется распределению Гаусса с одинаковой шириной ау во всех измерениях. Зная постоянные А а В, мы могли бы для любого данного значения Xi (которое, по нашим предположениям, не содер- содержит погрешности) вычислить истинное значение соответ- соответствующей величины ус. (истинное значение yt) = А + Bxt. (8.2) Результат измерения yi подчиняется нормальному распреде- распределению с центром на истинном значении и с шириной ау. Сле- Следовательно, вероятность получения значения yi равна где нижние индексы А и В указывают, что эта вероятность зависит от (неизвестных) значений А и В. Вероятность полу*
Аппроксимация методом наименьших квадратов 163 чения всего набора результатов измерений у\, ..., ут равна произведению Ра.в (Уи ••¦> Уы) = Ра.в(</i) • • • • • Ра.вШ ~ 1/2, (8.4) _1_ где показатель дается формулой ~ А - ВхА2 = V (8.5) Теперь уже нам известно, что наилучшие оценки для неиз- неизвестных постоянных А и В, основанные на данных измере- измерениях,— это такие значения А и В, для которых вероятность Ра, в(У\, ••-, Уы) максимальна или для которых сумма квад- квадратов %2 (8.5) минимальна (вот почему этот метод известен как аппроксимация методом наименьших квадратов). Чтобы найти эти значения, продифференцируем %2 по А и В и при- приравняем эти производные нулю: N -А-ВхЛ = 0, (8.6) (8.7) Эти два выражения можно переписать как систему уравнений для А и В: AN + BY.Xt^Y.yt (8.8) Л?*1 + В?*?=Е*^- (8.9) (В дальнейшем мы опускаем границы суммирования от i = 1 до N у знака суммирования 2-) Эти два уравнения, извест- известные как нормальные уравнения, легко решаются и дают оцен- оценки метода наименьших квадратов для постоянных А и В: (8.10) (8.11)
164 Глава 8 где мы использовали принятое обозначение (8.12) Формулы (8.10) и (8.11) дают наилучшие оценки постоян- постоянных Л и В для прямой линии у = А -\- Вх, основанные на из- измеренных точках (*i, ух) (xN,yN). Получившаяся линия называется линией аппроксимации методом наименьших квад- квадратов этих данных, или линией регрессии у от х. Теперь есте- естественно спросить, каковы погрешности в наших оценках А и В. Оказывается, что, прежде чем мы сможем ответить на этот вопрос, необходимо рассмотреть погрешности ау в наших ис- исходных измерениях у\ yN, что мы и сделаем. 8.3. Погрешность в измерениях у В процессе измерения значений у\, ..., уы у вас, вероят- вероятно, уже сложилось некоторое представление об их погреш- погрешности. Тем не менее важно знать, как вычислить погрешность только из анализа самих данных. Нужно помнить, что числа i/i, • • •, Уы не представляют собой N результатов измерений одной и той же величины. (Они могли бы быть, например, временами, за которые камень падает с N различных высот.) Таким образом, мы не получим никакого представления о на- надежности этих результатов, исследуя разброс в их значениях. Тем не менее можно легко оценить погрешность ау в чис- числах у и ..., ум- Результат измерения каждого г/,- (как мы пред- предполагаем) распределен нормально около истинного значения A -j- Bxi с параметром ширины ау. Таким образом, отклонения tji — А—Bxt распределены нормально, причем все с одним и тем же центральным значением 0 и одной и той же шириной <зу. Это сразу же ведет к предположению, что хорошая оценка ау могла бы определяться суммой квадратов в уже известном нам виде Действительно, этот результат может быть подтвержден при помощи принципа максимального правдоподобия. Как обыч- обычно, наилучшая оценка для представляющего интерес пара- параметра (в данном случае ау) есть значение, для которого ве- вероятность (8.4) получения значений у\, ..., уы максимальна. Как легко проверить, дифференцируя (8.4) по ау и прирав- приравнивая производную нулю, этой наилучшей оценкой будет точ- точно выражение (8.13).
Аппроксимация методом наименьших квадратов 165 К сожалению, как вы могли бы уже догадаться, оценка (8.13) дляа^ вовсе не окончательная. Числа Л и В в (8.13) — неизвестные истинные значения постоянных А и В. На прак- практике они должны быть заменены нашими наилучшими оцен- оценками для А и В, а именно выражениями (8.10) и (8.11), и такая замена немного изменяет значение (8.13). Можно по- показать, что это изменение компенсируется заменой фактора N в знаменателе на (N — 2). Таким образом, наш конечный от- ответ для погрешности в измерениях у\, ..., yN есть JV где А и В даются выражениями (8.10) и (8.11). Если бы у нас была независимая оценка погрешности в у\, ..., yN, то мы могли бы сравнить ее с величиной ау, рассчитанной из (8.14). Мы не пытались обосновать фактор (N — 2) в (8.14), но можем сделать некоторые комментарии. Во-первых, пока N умеренно велико, различие между N и (N— 2) практически неважно. Во-вторых, то, что фактор (N— 2) отражает реаль- реальную ситуацию, становится очевидным, если рассмотреть слу- случай измерения только двух пар значений: (х\,у\) и (х2, г/г) • Если имеются только две точки, мы всегда можем провести прямую, проходящую точно через эти точки, и аппроксимация методом наименьших квадратов дает эту линию. Таким обра- образом, имея только две пары данных, мы не можем, вероятно, сделать никакого заключения о надежности наших измерений. Далее, поскольку обе точки лежат точно на наилучшей пря- прямой, то оба слагаемых в суммах (8.13) и (8.14) равны нулю. Таким образом, формула (8.13) (с N = 2 в знаменателе) дает абсурдный результат ау = 0, в то время как (8.14) с N — — 2 = 0 в знаменателе дает ау = 0/0, конкретно указывая, что после проведения всего лишь двух измерений величина <уу не определена. Наличие фактора (N— 2) в (8.14) напоминает множитель (N—1) в знаменателе выражения E.46) для оценки стан- стандартного отклонения N измерений одной и той же величины х. Там было выполнено N измерений х\, ..., Ху одной величины х. Прежде чем рассчитать ах, мы должны были использовать данные для определения х. Это оставляло только (N— 1) не- независимых измеренных значений, поэтому мы говорим, что, вычислив х, мы оставили только (N—1) степеней свободы. Сейчас мы тоже сделали N измерений, но перед расчетом ау мы должны были вычислить две величины: А а В. Сделав это, мы оставили только (N — 2) степеней свободы. В общем слу- случае мы определим число степеней свободы на любом этапе
166 Глава 8 статистических вычислений как число независимых измерений минус число параметров, рассчитанных из этих измерений. Можно показать (хотя мы не будем здесь этого делать), что именно число степеней свободы, а не число измерений должно появляться в знаменателе формул, подобных (8.14) и E.46). Так объясняется, почему выражение (8.14) содержит фактор (N — 2), а E.46) — фактор (N—1). 8.4. Погрешность в постоянных Аи В Найдя погрешность оу в полученных числах j/i, ..., yNt мы легко можем вернуться к нашим оценкам постоянных А и В и рассчитать их погрешности. Суть здесь в том, что оцен- оценки (8.10) и (8.11) для А и В — точно определенные функции измеренных значений у\, ..., ум. Следовательно, погрешности в А и В определяют простым расчетом ошибок в косвенных измерениях, исходя из погрешностей в у\, ..., yN. Мы предо- предоставляем читателю проверить (задача 8.8), что (8.15) (8.16) где Д определяется (8.12), как обычно. 8.5. Пример Если объем некоторого количества идеального газа под- поддерживать постоянным, то его температура Т будет линейной функцией давления в газе Р Т = А + ВР. (8.17) Здесь постоянная А—температура, при которой давление Р падает до нуля (если газ не сконденсируется сначала в жид- жидкость); она называется абсолютным нулем температуры и имеет принятое значение А = — 273,15 градусов Цельсия. (8.18) Постоянная В зависит от природы газа, его массы и объема1). Измеряя ряд значений Т и Р, мы можем определить наилуч- ') Разность Т — А называется абсолютной температурой. Переписав (8.17) с учетом этого обозначения, мы получаем, что абсолютная темпе' ратура пропорциональна давлению (при постоянном объеме).
Аппроксимация методом наименьших квадратов 167 Таблица 8.1. Измерение давления н температуры Давление Р „ Температура Т,, Номер опыта i ** I ,„ ' ' мм рт. ст. "С 1 2 3 4 5 65 75 85 95 105 —20 17 42 94 127 —22,2 14,9 52,0 89,1 126,2 шие оценки для постоянных А и В. В частности, постоянная А дает абсолютный нуль температуры. Одна система пяти измерений Р и Т, полученная студентом, приведена в трех первых столбцах табл. 8.1. Студент считает, что погрешность в измерениях Р пренебрежимо мала, а по- погрешности в Т все одинаковы и равны «нескольким граду- градусам». Предполагая, что его точки должны ложиться на пря- прямую линию типа (8.17), он вычисляет наилучшую оценку по- постоянной А (абсолютного нуля) и ее погрешность. Какими должны быть его выводы? Все, что нам необходимо сейчас сделать, — это использо- использовать формулы (8.10) и (8.15), заменяя xi на Р, и г/, на 7<, чтобы рассчитать все величины, представляющие интерес. Для этого потребуется вычисление сумм ? Pi, ]Г р\, ? Ti, Yj PtTi. Многие карманные калькуляторы могут вычислять все эти суммы автоматически; но даже и без таких калькуля- калькуляторов мы легко сможем выполнить все необходимые расчеты, если надлежащим образом представим данные. Согласно табл. 8.1, мы можем вычислить Д = 5 000, где Д = Л/(Х Pi) — (X Р<J- В расчетах такого рода важно сохранять много значащих цифр, поскольку нам придется вы- вычислять разности этих больших чисел. Зная эти суммы, мы сразу же можем вычислить наилучшие оценки постоянных А В
168 Глава 8 Это даст наилучшую оценку студента для абсолютного нуля Л = —263 °С. Зная постоянные А и В, мы можем рассчитать числа А + BPi, т. е. температуры, «ожидаемые» на основе нашей наилучшей аппроксимации соотношения Т = А + ВР. Они показаны в правом столбце таблицы, и, как мы и надеялись, все они согласуются в разумных пределах с наблюденными температурами. Теперь можно рассчитать разности между числами в двух последних столбцах и получить < - А - BPiJ = 44>6' и, следовательно, стандартное отклонение Это значение хорошо согласуется с оценкой студента, со- согласно которой его измерения температуры неопределенны с точностью «нескольких градусов». Наконец, мы можем рассчитать погрешность в А, исполь- используя (8.15): или ад =18. Итак, соответствующим образом округленный итоговый вывод студента должен иметь вид абсолютный нуль, А = — 260 ± 20° С, что удовлетворительно согласуется с принятым значением —273°С. Как часто бывает, эти результаты становятся намного яс- яснее, если по ним построить график, как на рис. 8.2. Пять экс- экспериментальных точек вместе с их погрешностями ±7° по шкале Т показаны справа вверху. Наилучшая прямая линия проходит через четыре черточки ошибок и близко от пятой. Чтобы найти значение абсолютного нуля, линию следует продолжить за пределы области, где лежат все эксперимен- экспериментальные точки, до ее пересечения с осью Т. Этот процесс экстраполяции (продолжение кривой за пределы точек, по которым она определяется) может привести к большим по- погрешностям, как это ясно из рисунка. Очень небольшое изме-
Аппроксимация методом наименьших квадратов 169 100 О tV/7/7 -zoo -300 ZO 40 60 ЗГ 80 WO /Давление, мм рт.ст. у ¦ У у -Значение, помученное студентом, 260*20 Рис. 8.2. Графнк зависимости температуры Т от давления Р для газа при постоянном объеме. Черточки ошибок имеют длину в одно стандартное отклонение Of по каждую сто* рону от каждой из пяти экспериментальных точек, а линия — это наилучшая аа- проксимация, полученная методом наименьших квадратов. Абсолютный нуль тем» пературы можно найти, если экстраполировать линию до ее пересечения с осью Г, нение в наклоне линии приведет к большим изменениям в по- положении точки пересечения этой линии с осью Т, поскольку эта ось сильно удалена от экспериментальных точек. Таким образом, любая погрешность в данных значительно возрас- возрастает, если мы вынуждены экстраполировать на большие рас- расстояния. Это объясняет, почему погрешность в значении аб- абсолютного нуля (±18°) намного больше, чем в исходных из- измерениях температуры (±7°). 8.6. Аппроксимация другими кривыми методом наименьших квадратов До сих пор в этой главе мы рассматривали случай двух переменных, удовлетворяющих линейной зависимости у = = А -\- Вх, и обсудили, как вычислять постоянные Л и В. Эта важная задача — только частный случай широкого класса задач по аппроксимации кривыми, многие из которых могут быть решены подобным образом. В этом последнем разделе мы кратко рассмотрим несколько таких задач.
170 Глава 8 Аппроксимация полиномом Часто одна переменная у выражается через полином от второй переменной х: у = А + Вх + Сх2+ ...+Нхп. (8.19) Например, можно ожидать, что высота у, которую пролетает падающее тело, квадратично зависит от времени t: где г/о и Vo — начальные высота и скорость, a g — ускорение свободного падения. Если дана совокупность наблюдений двух переменных, то можно определить наилучшие оценки постоянных А, В, ..., Я в (8.19) с помощью выкладок, кото- которые производятся, как в разд. 8.2, что мы теперь и проделаем. Для упрощения предположим, что полином (8.19) в дей- действительности только квадратичный: у = А + Вх + Сх2, (8.20) (Заинтересованный читатель легко распространит доказатель- доказательство на общий случай.) Предположим, как и прежде, что у нас есть серия измерений (xt,yt), t= 1, ..., N, где у всех г/< одинаковые погрешности и все xi точны. Для каждого Xi соот- соответствующее истинное значение yt дается (8.20), где пара- параметры А, В и С пока неизйестны. Мы примем, что результаты измерений г/,- подчиняются нормальным распределениям, каж- каждое с центром на соответствующем истинном значении и все с одной и той же шириной ау. Это позволяет представить ве- вероятность получения наблюденных значений у\, ..., yN в уже привычном виде: Р(У1 Уы)~е-*'<\ (8.21) где теперь (Это соответствует выражению (8.5) в линейном случае.) Наи- Наилучшие оценки А, В и С — такие, для которых вероятность Р(Уи •¦-, Un) максимальна или величина %2 минимальна. Дифференцируя %2 по А, В и С и приравнивая эти производ- производные нулю, мы получим три уравнения (которые вам следует проверить): AN + В ? xt + С Е х\ = ? yt, (8.23) В Z xl + C Z Xi =
Аппроксимация методом наименьших квадратов 171 Для любого данного набора результатов измерений (xi, yi) эта система уравнений для А, В и С (известная как система нормальных уравнений) может быть решена и, таким обра- образом, могут быть найдены наилучшие оценки для А, В и С. С найденными таким путем значениями А, В, С выражение у = A -f Bx -f Cx2 называется полиномиальной аппроксима- аппроксимацией, полученной методом наименьших квадратов, или поли- полиномиальной регрессией для данных результатов измерений. Метод полиномиальной регрессии легко обобщается для полиномов любой степени, хотя получающиеся нормальные уравнения становятся очень громоздкими в случае полиномов высокой степени. В принципе аналогичный метод может быть применен к любой функции у = f{x), которая зависит от раз- различных неизвестных параметров А, В .... К сожалению, по- получающиеся нормальные уравнения, которые определяют наи- наилучшие оценки для А, В, ..., трудно, а порой и невозможно решить. Однако имеется один класс задач, которые всегда можно решить, а именно задачи, в которых функция у = f(x) линейно зависит от параметров А, В, ... . Этот класс вклю- включает все полиномы [очевидно, что полином (8.19) линейно зависит от коэффициентов А, В ...], а также многие другие функции. Например, в случае некоторых задач у представ- представляется суммой тригонометрических функций: у = Asinx-{- Bcosx. (8.24) Для этой функции и фактически для любой функции, которая Линейна относительно параметров А, В, ..., нормальные урав- уравнения, которые определяют наилучшие оценки для А, В ...,— это система линейных уравнений, которая всегда может быть решена (см. задачи 8.12 и 8.13). Экспоненциальные функции Одна из наиболее важных функций в физике — экспонен- экспоненциальная функция у = Аевх, (8.25) где А н В — постоянные. Интенсивность / излучения после прохождения расстояния х через защиту спадает экспоненци- экспоненциально: где /0 — начальная интенсивность и (j, характеризует погло- поглощение в защите. Заряд на замкнутом через сопротивление конденсаторе спадает экспоненциально:
172 Глава 8 где Qo-—начальный заряд и Я = l/(RC), a R и С — сопро- сопротивление и емкость. Если постоянные Л и В в (8.25) неизвестны, то естественно искать их оценки, основываясь на измерениях х и у. К сожа- сожалению, прямое применение изложенных выше методов приво- приводит к таким уравнениям для А и В, которые не имеют про- простого решения. Однако можно преобразовать нелинейную связь (8.25) между у и х в линейное соотношение, к которому мы уже можем применить наш способ аппроксимации мето- методом наименьших квадратов. Достигнуть желаемой «линеаризации» можно, если просто взять логарифмы от обеих частей (8.25): 1пу = \пА + Вх. (8.26) Мы видим, что, хотя у нелинейно зависит от х, In у зависит линейно. Это преобразование нелинейного соотношения (8.25) в линейное (8.26) полезно во многих случаях помимо аппрок- аппроксимации методом наименьших квадратов. Если бы мы захо- захотели проверить соотношение (8.25) графически, то не смогли бы этого сделать, так как на обычном графике у от х полу- получается кривая, которую трудно идентифицировать визуально. С другой стороны, график зависимости in у от х (или logy от х) — это прямая линия, которую легко можно идентифици- идентифицировать. (Такой график особенно легко построить, если исполь- использовать «полулогарифмическую» миллиметровую бумагу, у ко- которой деления на одной из осей расположены в соответствии со значениями логарифмов. Такая бумага позволяет строить графики \ogy непосредственно, т. е. даже не вычисляя значе- значений логарифма переменной.) Польза в линейном представлении (8.26) для аппроксима- аппроксимации методом наименьших квадратов несомненна. Если мы по- полагаем, что у а х должны быть связаны зависимостью у = АеВх, то в новых переменных г = \пу и х должны быть связаны соотношением z = \nA + Bx. (8.27) Если имеется серия измерений (Xi, «/,•), то для каждого yt мы можем вычислить Zi = \nyu Тогда точки (xi,Zi) должны ле- лежать на линии (8.27). Эта линия может быть рассчитана ме- методом наименьших квадратов, и таким образом будут полу- получены наилучшие оценки для постоянных 1пЛ (по которой мы можем найти Л) и В. Пример Многие популяции (людей, бактерий, радиоактивных ядер и т. д.) изменяются со временем экспоненциально. Если ка-
Аппроксимация методом наименьших квадратов 173 Таблица 8.2. Популяции бактерий Время f(., днн Численность популяции JV^ z — InJV^ 0 153 000 11,94 1 137 000 11,83 2 128 000 11,76 кая-то популяция N уменьшается со временем экспоненци- экспоненциально, мы записываем N = ЛГов-'*, (8.28) где % называется средним временем жизни популяции (кото- (которое тесно связано со временем полураспада Л/2; действительно, /i/2 = 0,693т). Некоторый биолог считает, что популяция бак- бактерий уменьшается со временем экспоненциально согласно (8.28); он измеряет численность популяции на каждый из трех последовательных дней и получает результаты, представлен- представленные в табл. 8.2. Какую наилучшую оценку среднего времени жизни х он получит на основании этих данных? Если N изменяется согласно (8.28), то переменная z = In N должна линейно зависеть от t: z = \nN==\nNo — L. (8.29) Следовательно, наш биолог рассчитывает три числа z,- = In Nt (t = 0, 1, 2), приведенные в третьем столбце табл. 8.2. Ис- Используя эти три числа, он рассчитывает прямую линию (8.29) методом наименьших квадратов и получает следующие наи- наилучшие оценки для коэффициентов In Л/о и (—1/т): In #о=И.93 и (-1/т) = -0,089 день. Из второго значения следует, что его наилучшая оценка для среднего времени жизни равна т — 11,2 дней. Описанный выше метод привлекательно прост (особенно при наличии калькулятора, который автоматически выполняет операцию линейной регрессии) и часто используется. Тем не менее этот метод не вполне обоснован с логической точки зре- зрения. Наш вывод аппроксимации прямой линией у = А + Вх методом наименьших квадратов основывался на допущении, что все измеренные значения у\, ..., yN имеют одинаковые погрешности. В данном же случае мы реализуем эту аппрок- аппроксимацию методом наименьших квадратов по отношению к пе- переменной z = lny. Если все измеренные значения г/, имеют
174 Глава 8 одинаковую погрешность, то значения Zi = \nyi — определен- определенно не одинаковую. Действительно, из простого расчета оши- ошибок в случае косвенных измерений мы знаем, что йг dy Таким образом, если ау одинаковы для всех измерений, то аг отличаются (аг больше для меньших у). Очевидно, что пере- переменная z — In г/ не удовлетворяет требованию, согласно кото- которому погрешности должны быть одинаковы для всех резуль- результатов измерений, если переменная у удовлетворяет этому тре- требованию. Выход из этого положения очевиден. Необходимо обоб- обобщить метод наименьших квадратов на случай, когда погреш- погрешности в результатах измерений неодинаковы, при условии что все эти различные погрешности известны. (Этот метод наи- наименьших квадратов с весами описан в задаче 8.4.) Если из- известно, что результаты измерений у\ уц действительно имеют одинаковую погрешность, то формула (8.30) показы- показывает, как изменяются погрешности в z\, ..., zN, и поэтому мы можем применить метод наименьших квадратов с весами к уравнению z — In A + Вх. На практике, однако, часто нельзя быть уверенным в том, что погрешности в ylt ..., yN действительно одинаковы, по- поэтому можно рассматривать предположение, согласно кото- которому одинаковы погрешности в z\, ..., zn, и использовать обычный метод наименьших квадратов без весов. Часто изме- изменения в погрешностях бывают малы, и поэтому практически безразлично, какой метод использовать, как это и было в пре- предыдущем примере. В любом случае непосредственное приме- применение обычной (без весов) аппроксимации методом наимень- наименьших квадратов — это недвусмысленный и простой способ по- получения разумных (если не наилучших) оценок для постоян- постоянных А и В из соотношения у = АеВх, поэтому он часто исполь- используется именно в этом виде. Множественная регрессия До сих пор мы рассматривали случай, когда наблюдаются только две переменные х и у, и обсуждали их связь. Во мно- многих реальных задачах необходимо рассматривать большее число переменных. Например, измеряя давление газа Р, мож- можно обнаружить, что оно зависит от объема V и температуры Т, и поэтому нужно исследовать Р как функцию V и Т. Про- Простейшим примером может служить задача, когда одна пере- переменная z зависит линейно от двух других хну: z = A-\- Вх + Су. (8.31)
Аппроксимация методом наименьших квадратов 175 Эта задача может быть рассмотрена методом, являющимся прямым обобщением случая двух переменных. Если у нас есть серия измерений (Xi,yt,Zi), i = 1, ..., N (где погрешности всех zi одинаковы, a Xi и yi точны), то мы можем использо- использовать принцип максимального правдоподобия, как и в разд. 8.2, и получить, что наилучшие оценки постоянных А, В, С опре- определяются нормальными уравнениями следующего вида: (8.32) С ? у] = Эти уравнения можно решить относительно Л, В и С и полу- получить наилучшую аппроксимацию для соотношения (8.31). Этот случай называется множественной регрессией («множе- («множественной», так как имеется более двух переменных), но мы его сейчас рассматривать не будем. Задачи Напоминание: звездочка у номера задачи означает, что задача реша- решается или ее ответ приводится в разделе «Ответы» в конце книги. *8.1 (разд. 8.2). Используйте метод наименьших квадратов, чтобы определить линию у = А + Вх, которая наилучшим образом аппроксими- аппроксимирует четыре точки: A; 12), B; 13), C; 18), D; 19). Нарисуйте точки и линию. 8.2 (разд. 8.2). Чтобы определить коэффициент упругости k пружины, студент подвешивает к ней различные массы m и измеряет соответствую- соответствующие длины /. Его результаты приведены в табл. 8.3. Так как сила mg равна k(l—/о), где /о— длина пружины в нерастянутом состоянии, то эти данные должны ложиться на линию / = U + (glk)m. Найдите аппро- аппроксимацию этих данных методом наименьших квадратов и получите наи- наилучшие оценки для собственной длины пружины /0 и коэффициента упру- упругости пружины k. *8.3 (разд. 8.3). Пусть переменные х и у связаны соотношением у = Вх, т. е. известно, что они лежат на прямой линии, проходящей через -начало координат. Предположим, что вы сделали N измерений (xt, yi), причем погрешности в х пренебрежимо малы, а в у — одинаковы. Ис- Используя метод доказательства, аналогичный приведенному в разд. 8.2, покажите, что, согласно методу наименьших квадратов, наилучшая оценка для В равна E *8.4 (разд. 8.2). Предположим, что мы измеряем N пар значений (xq, yi) двух переменных хну, которые, как мы полагаем, связаны ли- линейной зависимостью у = А + Вх. Предположим, что погрешность изме- Таблица 8.3 Масса груза ш, г Длина /, см 200 5,1 300 5,5 400 5,9 500 6,8 600 7,4 700 7,5 800 8,6 900 9,4
176 Глава 8 Таблица 8.4 Расстояние, м 0 1000 2000 3000 Время, с 17,6 40,4 67,7 90,1 рений всех xt пренебрежимо мала, а все yi имеют разные погрешности сг» (т.е. г/1 имеет погрешность <л; уг— Ог и т. д.). Просмотрите еще раз вы- вывод аппроксимации методом наименьших квадратов в разд. 8.2 и обобщите его на случай, когда погрешности в yt неодинаковы. Покажите, что наи- наилучшие оценки для А и В равны А = [(Е ***?) (Е «М - (Е wt*t) (Е •< где веса wt — \1о\ и Этот метод наименьших квадратов с весами можно использовать, когда погрешности ot (или по крайней мере их относительные величины) из- известны. Возможно, наиболее типичной ситуацией, когда все это реали- реализуется, является пример эксперимента с подсчетом событий, подобным подсчету распадов радиоактивных ядер. Как обсуждалось в разд. 3.1 (и доказывается в гл. 11), погрешность, соответствующая любому подсчету v, равна Vv. 8.5 (разд. 8.2). Пусть известно, что у линейно зависит от х, так что у = А + Вх, и предположим, что у нас есть три измерения (х, у): A; 2 ±0,5); B; 3±0,5); C; 2±1,5), где погрешности в х пренебрежимо малы. Используйте метод наименьших квадратов с весами, т. е. формулы (8.33) — (8.35), и найдите А и В. Сравните свои результаты со значениями, которые вы получили бы, если бы пренебрегли изменениями в погрешно- погрешности, т. е. использовали бы аппроксимацию без весов в соответствии с (8.10) — (8.12). Представьте данные и обе линии на графике и попытай- попытайтесь понять разницу. *8.6 (разд. 8.4). Поезд, движущийся, как полагают, с постоянной ско- скоростью, проезжает четыре различных пункта, в каждом из которых де- делаются замеры времени; результаты приведены в табл. 8.4. Примените аппроксимацию методом наименьших квадратов в виде d = rf0 + vt и найдите наилучшую оценку скорости поезда v. Какова погрешность в о? 8.7 (разд. 8.4). Студент измеряет давление газа Р для пяти различных значений температуры Г, поддерживая его объем V постоянным. Его результаты приведены в табл. 8.5. Все данные должны удовлетворять линейной зависимости вида Т = А + ВР, где А — абсолютный нуль тем- температуры (принятое значение которой равно —273 "С, как уже обсужда- обсуждалось в разд. 8.5). Найдите наилучшую аппроксимацию данных студента Таблица 8.5 Давление мм рт. ст. Температура °С Pi. Tt, 79 8 82 17 85 30 88 37 90 52
Аппроксимация методом наименьших квадратов 177 и, следовательно, его наилучшую оценку для абсолютного нуля и ее по- погрешность. *8.8 (разд. 8.4). а. Используйте метод максимального правдоподобия в том виде, в каком он применялся при выводе (8.13), и покажите, что (8.13) определяет погрешность ад в у для серии измерений (xi, </i), ... ..., (Хц, i/n), которые должны ложиться на прямую линию. б. Используйте расчет ошибок в случае косвенных измерений и пока- покажите, что погрешности ал и as в параметрах прямой линии у = А + Вх определяются выражениями (8.15) и (8.16). *8.9 (разд. 8.4). В аппроксимации методом наименьших квадратов, примененной к набору точек (xi, </i), ..., (Хц, yN), переменные х и у рассматриваются несимметричным образом. А именно определяется наи- наилучшая аппроксимация линией у = А + Вх в предположении, что все по- погрешности в уь ..., yN одинаковы, а погрешности ъ Х\ xN пренебре- пренебрежимо малы. Если обратить ситуацию, то надо было бы поменять местами х и у и аппроксимировать линией х = А' + В'у. Две линии у = А + Вх и х = А' + В'у совпадали бы между собой, если бы все N точек точно ложились на линию; но в общем случае эти две линии будут слегка раз- различаться. Определите, как данные задачи 8.1 аппроксимируются линией д = А' + В'у (рассматривая все Xi как одинаково неточные, а </,• — как точные). Найдите А' и В' н их погрешности аД' и ав<. Каковы будут значения А' и В', полученные из ответов задачи 8.1? Сравните линии, найденные двумя методами. Существенна ли разница? 8.10 (разд. 8.6). Рассмотрите задачу аппроксимации набора результа- результатов измерений (xt, yi), i = 1 N, полиномом у — A -f Вх + Схг. Ис- Используйте метод максимального правдоподобия и покажите, что наилучшие оценки для А, В, С, основанные на приведенных данных, даются форму- формулами (8.23). Следуйте аргументам, приведенным между формулами (8.20) я (8.23). *8.11 (разд. 8.6). Один из методов определения ускорения свободно падающего тела состоит в измерении высот yt, на которых оно находилось в последовательные равные промежутки времени tt (например, с помощью киносъемки), и в последующем определении наилучшей аппроксимации ожидаемым полиномом y = yo+vot-jgt\ (8.36) Используйте формулы (8.23) для вычисления наилучших оценок для трех коэффициентов в (8.36) и, следовательно, наилучшей оценки для g, осно- основанных на результатах пяти измерений, приведенных в табл. 8.6. Обратите внимание на то, что мы можем приводить времена в каком угодно виде. Может показаться, что более естественным был бы выбор t = 0, 1, ..., 4. Однако когда вы будете решать задачу, то увидите, что использование времен, симметрично расположенных вокруг нуля, приводит к тому, что примерно половина всех подлежащих вычислению сумм ока- оказывается равной нулю, что сильно упрощает расчеты. Этот прием можно использовать всегда, когда значения независимой переменной разделены равными промежутками. Таблица 8.6 Время /, десятые —2 —1 0 1 доли секунды Высота у, см 131 113 89 51
178 Глава 8 Таблица 8.7 t, десятые доли —4 —2 0 2 4 секунды у, см 3 —16 6 9—8 8.12 (разд. 8.6). Предположим, что, как ожидают, у имеет зависимость от х вида у = Af(x) + Bg(x), где А и В— неизвестные параметры, а / и g — фиксированные известные функции (например, такие, как / = jc и g = х2 или f — cosx и g=sinx). Используйте принцип максимального правдоподобия и покажите, что наилучшие оценки для А и В, основан- основанные на данных (xi, </,), i = 1, ..., N, должны определяться из L[*(*,)]8= !**(*«)¦ *8.13 (разд. 8.6). Груз, подвешенный к вертикально расположенной пружине, совершает колебания, которые описываются высотой его поло- положения у, определяемой формулой у — A cos со/ + В sin со/. Студент измеряет со и находит, что со = 1 рад/с с пренебрежимо малой погрешностью. При помощи киносъемки он определяет затем у для пяти равноотстоящих моментов времени, как показано в табл. 8.7. Используйте формулы (8.37) и найдите наилучшие оценки А и В. Нарисуйте на графике данные и вашу наилучшую аппроксимацию. (Если вы сначала нарисуете данные, то убедитесь, как трудно было бы подо- подобрать наилучшую аппроксимацию без помощи метода наименьших ква- квадратов.) Если студент пришел к выводу, что его измеренные значения у были неточны в пределах «пары сантиметров», могли бы вы сказать, чта такие данные хорошо аппроксимируются ожидаемой кривой? *8.14 (разд. 8.6). Число распадов R в единицу времени для некоторого образца радиоактивного материала уменьшается экспоненциально со вре- временем по мере истощения образца: где т — среднее время жизни образца. Студент проводит наблюдение за образцом радиоактивного материала в течение трех часов и получает ре- результаты, приведенные в табл. 8.8. Определите аппроксимацию In R = = In Ro — //т методом наименьших квадратов и найдите наилучшую оцен- оценку для среднего времени жизни т. Таблица 8.8 Время t 0 12 3 Темп R, произв. ед. 13,8 7,9 6,1 2,9
Глава 9 Смешанный второй момент и корреляция В этой главе мы введем важное понятие смешанного вто- второго момента1). Понятие смешанного второго момента есте- естественно возникает в связи с проблемой расчета ошибок в кос- косвенных измерениях, поэтому мы введем его в разд. 9.2 после краткого обзора расчета ошибок в косвенных измерениях в разд. 9.1. В разд. 9.3 мы используем это понятие второго смешанного момента для определения коэффициента линейной корреляции для случая N измеренных точек (хиУ\), ... ,.., (xN, уы). Этот коэффициент, обозначаемый г, является мерой того, насколько хорошо полученные точки (xt,«/,-) ло- ложатся на прямую линию вида у = A -f- Вх. Использование этого коэффициента рассматривается в разд. 9.4 и 9.5. 9.1. Обзор расчета ошибок в косвенных измерениях В этом и следующем разделах мы в последний раз вер- вернемся к важному вопросу расчета ошибок в косвенных изме- измерениях. Впервые мы рассмотрели вычисление ошибок в кос- косвенных измерениях в гл. 3, где было сделано несколько выво- выводов. Мы считали, что измеряются две величины х и у и вы- вычисляется некоторая функция q(x,y), такая, например, как q = x-\-y или q — х2ъ\пу. (Фактически мы рассматривали также функцию q{x, ..., г) произвольного числа переменных х, ..., г; для простоты мы будем обсуждать здесь только случай двух переменных.) Простое рассмотрение показывает, что погрешность значения q определяется как М. Сначала мы получили этот результат для простых частных случаев сумм, разностей, произведений и частных. Например, ') В литературе на русском языке для этого понятия используются также термины ковариация и корреляционный момент. — Прим. перев.
180 Глава 9 если q есть сумма q = х -\- у, то (9.1) сводится к известному выражению 6q да 6л; + &У- Общий результат (9.1) был полу- получен в C.43). Затем мы поняли, что соотношение (9.1), вероятно, часта переоценивает 8q, поскольку возможна частичная компенса- компенсация ошибок в х и у. Мы утверждали без доказательства, что когда ошибки в х и у независимы и случайны, то лучшая оценка погрешности в рассчитанном значении q(x,y) есть • (9-2> Мы также без доказательства утверждали, что вне зависи- зависимости от того, являются ли ошибки случайными и независи- независимыми, более простая формула (9.1) всегда дает верхний пре- предел для 6q, т. е. погрешность 8q никогда не больше того зна- значения, которое определяется (9.1). В гл. 5 мы дали надлежащее определение и доказатель- доказательство соотношения (9.2). Во-первых, мы увидели, что хорошей мерой погрешности 8х в измерениях является стандартное от- отклонение ох\ в частности, мы показали, что если результаты измерений х распределены нормально, то с 68%-ной вероят- вероятностью можно быть уверенным в том, что измеренное значе- значение лежит в пределах ах от истинного значения. Во-вторых, мы видели, что если результаты измерений х и у подчиняются независимым нормальным распределениям со стандартными отклонениями аг и ау, го значения q(x,y) также распреде- распределены нормально со стандартным отклонением Этот результат обосновывает нашу оценку ошибки (9.2). В разд. 9.2 мы выведем точную формулу для погрешности в q, которая применима вне зависимости от того, независимы ли х и у и имеют ли они нормальное распределение. В ча- частности, мы докажем, что (9.1) всегда дает верхнюю границу погрешности в q. Прежде чем получить эти результаты, обсудим еще раз определение стандартного отклонения. Стандартное отклоне- отклонение Ох для N результатов измерений х\, ..., Хы первоначально было определено формулой — xf. (9.4) Если результаты измерений х распределены нормально, то в пределе, когда число N велико, определение (9.4) эквива-
Смешанный второй момент и корреляция 181 лентно определению ах как параметра ширины, появляюще- появляющегося в функции Гаусса Ох л/2я в соответствии с которой распределяются результаты измере- измерений х. Поскольку теперь мы будем рассматривать случаи,, когда ошибки вх могут не быть нормально распределенными,, то это второе определение для нас больше неприменимо. Од- Однако мы можем и будем определять ах, как в (9.4). Вне за- зависимости от того, нормально или нет распределены ошибки, это определение ах дает разумную меру случайных погреш- погрешностей в нашем измерении х. (Как и в гл. 5, мы будем пред- предполагать, что все систематические ошибки выявлены и умень- уменьшены до пренебрежимо малого уровня, так что все остав- оставшиеся погрешности случайны.) Остается обычная неопределенность: будем ли мы исполь- использовать для ох определение (9.4) или же «улучшенное» опре- определение, когда N в знаменателе заменяется на (N—1). К счастью, все рассуждения, которые мы будем приводить,, одинаково применимы к любому определению, пока мы после- последовательно придерживаемся одного из них. Для простоты мы будем использовать определение (9.4) с N в знаменателе. 9.2. Смешанный второй момент при расчете ошибок в косвенных измерениях Предположим, что для нахождения функции q(x,y) мы измеряем две величины х и у несколько раз и получаем N пар данных (х\,у\), ..., {хы,уы). По результатам N измерений х\, ..., xN мы можем вычислить среднее х и стандартное отклонение ах обычным образом; аналогично по данным у\, ..., ум мы можем вычислить у и оу. Затем, используя N пар результатов измерений, мы можем рассчитать N значений величины, представляющей интерес: Получив q\, ..., qn, мы сможем вычислить их среднее q, ко- которое, как мы предполагаем, дает наилучшую оценку для q, и стандартное отклонение oq, являющееся мерой случайной погрешности в значениях </,-. Будем предполагать, что все наши погрешности малы и что, следовательно, все числа х\, ..., xN близки к х, а все i/i, ,.., уы — к у. В этом случае справедливо приближение 4i = Q (х{, Уд « ~ q (X, у) + |f- (xt - X) + Jj- (yt - у). (9.5>
182 Глава 9 В этом выражении частные производные dq/dx и dq/dy вы- вычисляются в точке х = х, у = у, и, следовательно, они оди- одинаковы для всех i=l, ..., N. В рамках этого приближения среднее принимает вид |^4 (=1 1=1 Это выражение для q есть сумма трех членов. Первый член — q(x,y), а два других точно равны нулю. (Например, из опре- определения среднего х следует, что ? (xi — *)~ 0.) Таким обра- образом, мы получили замечательно простой результат q = q(x, у), (9.6) т. е. чтобы найти среднее q, мы просто должны вычислить значение функции q{x,y) в точке х = х и у = у. Стандартное отклонение для N значений qu ..., qN есть Подставляя в это выражение (9.5) и (9.6), мы находим, что ¦Суммы в первых двух членах — это определения стандартных отклонений ах и ау. Последняя сумма имеет вид, с которым мы еще не встречались прежде. Она называется смешанным .вторым моментом') х и у и обозначается (9.8) ') Термин смешанный второй момент для аха (для переменных х, у) введен, чтобы провести параллель с термином второй момент1) для о\ (для одной переменной х). Чтобы подчеркнуть эту параллель, смешанный второй момент иногда обозначается а2хи, что не особенно удачно, по- поскольку смешанный второй момент может быть отрицательным. Удобная •особенность нашего определения (Э.8) заключается в том, что ахв имеет размерность ху, так же как <зх имеет размерность к. fe) Чтобы не нарушать логику употребления терминов, мы перевели в данном случае термин, обозначающий дисперсию, как второй момент, «оторый широко встречается в литературе на русском языке. — Прим. перев.
Смешанный второй момент н корреляция 18$ С этим определением выражение (9.7) для стандартного от- отклонения Oq переходит в (9.9) Это выражение определяет стандартное отклонение aq вне за- зависимости от того, независимы ли измерения х и у и нор- нормально ли они распределены. Если измерения х и у независимы, то легко видеть, что после многих измерений смешанный второй момент аху дол- должен стремиться к нулю '). Вне зависимости от значения yi ве- величина xi — х с равной вероятностью может быть как поло- положительной, так и отрицательной. Таким образом, после мно- многих измерений положительные и отрицательные члены в (9.8) должны примерно скомпенсироваться, и в пределе бесконеч- бесконечного числа измерений множитель 1/N в (9.8) обеспечит ра- равенство вху нулю. (После конечного числа измерений вели- величина вхУ не будет точно равна нулю, но должна быть мала, если ошибки в х и у действительно независимы и случайны.) При Оху = 0 выражение для aq сводится к <-№)'*+(%¦)'1 <910> знакомому результату для независимых и случайных погреш- погрешностей. Если измерения х и у не независимы, то смешанный вто- второй момент аХу не должен равняться нулю. Например, легко представить себе ситуацию, когда переоценка х всегда влечет за собой переоценку у и наоборот. В этом случае числа (xi — x) и (yi — у) будут всегда иметь один и тот же знак (положительный или отрицательный), а их произведение бу- будет всегда положительно. Поскольку все члены в сумме (9.8) положительны, то аху не должна исчезать даже в пределе,, когда мы делаем бесконечно много измерений. Когда смешанный второй момент аху отличен от нуля (даже в пределе бесконечно большого числа измерений), мы говорим, что ошибки в х и у коррелированы. В этом случае погрешность ач в q(x,y), определяемая (9.9), это не то же самое, что мы получили бы в соответствии с формулой (9.10) для независимых и случайных ошибок. ') В случае конечного числа измерений N в литературе на русскомг языке для Охи используется понятие выборочный смешанный второй мо- момент по аналогии с выборочным средним, выборочным стандартным от^ клоненнем и т. д. — Прим. перев.
184 Глава 9 С помощью формулы (9.9) мы можем получить верхний предел для сг„, который всегда справедлив. С помощью про- простых алгебраических преобразований (задача 9.1) можно по- показать, что смешанный второй момент аху удовлетворяет так называемому неравенству Шварца lor^Kor^. (9.11) Если подставить (9.11) в выражение (9.9) для погрешности ¦Gq, TO ПОЛуЧИМ, ЧТО ••.<(?)• •:+(?)'•;+* дд дд дх ду т. е. — И dq LI дх дд ду дд дх г Оу\, х дд_ ду ву. (9.12) Этим результатом мы окончательно установили точный смысл нашего первоначального простого выражения дд_ дх 6х дд_ ду (9.13) для погрешности bq. Если рассматривать стандартное откло- отклонение oq как нашу меру погрешности в q, то (9.12) показы- показывает, что старое выражение (9.13) в действительности есть верхний предел погрешности. Вне зависимости от того, неза- независимы ли ошибки в х и у и нормально ли они распределены, погрешность в q никогда не больше правой части (9.13). Если измерения хну коррелированы таким образом, что \оху\ = охоу, т. е. |cTjey| достигает максимально возможного значения в соответствии с (9.11), то погрешность в q может быть действительно такой, как она дается (9.13), но она ни- никогда не может быть больше. Роль смешанного второго момента оху в нашем обсужде- обсуждении расчета ошибок в косвенных измерениях является чисто теоретической, и практически понятие смешанного второго момента обычно не имеет существенного значения при рас- расчете ошибок в косвенных измерениях. Теперь мы обсудим проблему, в которой это понятие действительно играет цент- центральную роль и имеет практическое значение. 9.3. Коэффициент линейной корреляции Понятие смешанного второго момента аху, введенное в разд. 9.2, позволяет нам ответить на вопрос, поставленный в гл. 8 о том, насколько хорошо набор результатов измерений
Смешанный второй момент и корреляция 185' У I 100- I I 50 I О 50 /Off Отметка за домашнее задание Рис. 9.1. «График рассеяния», показывающий отметки студентов за экза- экзамены и домашние задания. Каждая из десяти точек (Xt, yi) указывает отметку студента за домашнее задание Xi и за экзамен yi. (xi,t/i) (%ы,Уы) для двух переменных подтверждает гипотезу о линейной зависимости хну. Предположим, что мы получили N пар измеренных зна- значений (хъу\), ..., (хы,уы) двух переменных, которые, как мы ожидаем, должны быть связаны линейной зависимостью вида Важно заметить, что х\, ..., xN в данном случае не резуль- результаты измерений лишь одной величины, как это было в слу- случае двух последних разделов; на самом деле это результаты измерений N различных значений одной переменной (напри- (например, N различных высот, с которых мы бросали камень). То же самое относится и к у\, ..., уы- С помощью метода наименьших квадратов мы можем найти значения А и В для линии, которая наилучшим образом аппроксимирует точки (xi,yi), ..., (хы,уы). Если у нас есть надежные оценки погрешностей в измерениях, то мы можем видеть, действительно ли измеренные точки лежат разумно близко к линии (по сравнению с известными погрешностями). Если это так, то измерения подтверждают наше предположе- предположение, что х и у связаны линейно. К сожалению, во многих экспериментах трудно определить надежные оценки погрешностей заранее, и поэтому мы должны использовать исходные данные, чтобы судить, связаны ли две переменные линейно. В частности, имеется такой при-
186 Глава 9 мер эксперимента, когда невозможно определить величину погрешностей заранее. Этот эксперимент, который более под- подходит к социальным, чем к физическим, наукам, лучше пояс- пояснить на примере. Представим себе, что профессор, желающий убедить своих студентов в том, что выполнение домашних заданий поможет им хорошо сдать экзамены, собирает сведения об их отметках за домашнее задание и за экзамен и изображает их на «гра- «графике разбросов», как показано на рис. 9.1. На этом графике •отметки за домашнее задание отложены по горизонтальной оси, а за экзамен — по вертикальной')¦ Каждая точка (xi,yi) показывает оценку одного студента за домашнее задание xt и за экзамен у/. Профессор надеется показать, что высокие оценки за экзамен коррелируют с высокими отметками за домашнее задание и наоборот (и его график разбросов опре- определенно подтверждает, что это приблизительно так). В этом примере эксперимента нет никаких погрешностей в точках; две отметки каждого студента известны точно2). Погреш- Погрешность будет скорее в степени, до которой коррелированы от- отметки, и именно это должно быть определено из данных. Две переменные х и у (в случае любого типичного физи- физического эксперимента или такого, как описанный выше) могут быть, конечно, связаны и более сложной зависимостью, чем простая линейная связь вида у = А + Вх. Например, множе- множество физических законов приводит к квадратичной зависи- зависимости типа у = А -\- Вх -f- Cx2. Тем не менее мы ограничим наше рассмотрение случаем более простой задачи, когда надо решить, подтверждает ли данный набор точек гипотезу о ли- линейной связи у = А -f Вх. Степень, до которой набор точек {х\,ух), .... (xN,yN) подтверждает линейную зависимость между хну, измеряется коэффициентом линейной корреляции, или просто коэффи- коэффициентом корреляции | (9.14) где смешанный второй момент аху и стандартные отклонения <ух и (Ту определяются точно так же, как и ранее, формулами (9.8) и (9.4K). Подставляя эти определения в (9.14), мы ') На рис. 9.1 приведены отметки по 100-балльной системе.—Прим. перев. 2) В принципе, ввиду того что трудно абсолютно точно и объективно выставить оценку (например, отметки между тройкой и четверкой в слу- случае нашей системы оценок), можно ввести в рассмотрение погрешность оценки. — Прим. перев. 8) Заметьте, однако, что их значения слегка различны. Например, в разд. 9.2 дг1, .... Хи были результатами измерений одного числа, и если бы эш измерения были точными, то величина ах была бы малой. В дан<
Смешанный второй момент н корреляция 187 можем переписать выражение для коэффициента корреляции в виде (9.15) Как мы скоро увидим, число г показывает, насколько хо- хорошо точки (xi, iji) аппроксимируются прямой линией. Это число принимает значения между —1 и 1. Если г близко к ±1, то точки лежат вблизи некоторой прямой линии; если г близко к 0, то точки не коррелированы и либо незначи- незначительно, либо совсем не группируются около прямой линии. Чтобы доказать эти утверждения, сначала заметим, что из неравенства Шварца (9.11) |о*,/1 ^ сыту сразу же следует, что \г\ ^ 1 или как и утверждалось. Далее, предположим, что все точки {xi, yi) лежат точно на линии у = А + Вх. В этом случае yi = A -\- Bxi для всех i и, следовательно, у = А -\- Вх. Вычи- Вычитая эти два равенства, мы видим, что yi — у = В {xi — х) для каждого i. Подставляя полученное выражение в (9.15), находим BYu.-xf В т. е. если точки (хиу\), ¦¦¦, (xN,yN) лежат точно на прямой, то г—±1, причем знак г определяется наклоном линии (г = 1 для положительного В и г = —1 для отрицательного ВI). Даже если переменные хну действительно связаны линейной зависимостью, мы не должны ожидать, что экспе- экспериментальные точки будут лежать точно на линии. Таким образом, не следует ожидать, что г точно равно ±1. С другой стороны, мы действительно должны ожидать, что г близко к ± 1, если считаем, что хну связаны линейно. ном случае xt, ..., xn — результаты измерений различных значений пере- переменной, н даже если бы измерения были точными, то все равно не было бы основания думать, что величина ах будет малой. Заметим также, что некоторые авторы используют число г2 называя его коэфициентом точ- точности измерений. ') Если линия строго горизонтальна, то В = 0, и (9.16) дает г=0/0, т. е. г — неопределенная величина. К счастью, этот частный случай не ва- важен для практики, так как он соответствует ситуации, когда у — постоян- постоянная, Не зависящая от х.
188 Глава 9 Предположим, что нет никакой связи между переменными х и у. Тогда вне зависимости от значения г/,- каждое xi с оди- одинаковой вероятностью может быть как больше, так и меньше х. Таким образом, члены в сумме Е (¦** - х) (j/i ~ 9) в числителе выражения (9.15) для г с одинаковой вероят- вероятностью могут быть как положительными, так и отрицатель- отрицательными. В то же время члены в знаменателе выражения для г всегда положительны. Таким образом, в пределе, когда число измерений N стремится к бесконечности, коэффициент корре- корреляции г будет равен нулю. В случае конечного числа экспе- экспериментальных точек мы не должны ожидать, что коэффи- коэффициент г будет точно равен нулю, но мы действительно ожи- ожидаем, что он должен быть мал (если две переменные дей- действительно не связаны линейной зависимостью). Если две переменные х и у таковы, что в пределе беско- бесконечно большого числа измерений их смешанный второй мо- момент равен нулю (и, следовательно, г = 0), то мы говорим, что переменные некоррелированны. Если после конечного числа измерений коэффициент корреляции г = оху/ахау мал, это будет подтверждением гипотезы о том, что х и у не кор- релированы. В качестве иллюстрации можно рассмотреть пример с от- отметками за экзамен и домашнее задание, показанный на рис. 9.1. Эти отметки приведены также в табл. 9.1. Простой расчет (задача 9.4) дает, что коэффициент корреляции для этих десяти пар отметок равен г = 0,8. Профессор делает вывод, что это значение «разумно близко» к 1, и поэтому может объявить студентам в следующем году, что поскольку имеется хорошая корреляция между отметками за домашнее задание и за экзамен, то очень важно выполнять домашнее задание. Если бы профессор получил, что коэффициент корреля- корреляции г близок к нулю, то он оказался бы в затруднительном положении, поскольку он обнаружил бы, что отметки за до- домашнее задание никак не связаны с отметками за экзамен. Если бы получилось, что величина г близка к —1, то ему пришлось бы сделать еще более смущающее открытие, что Таблица 9.1. Отметки студентов Студент, i Домашнее Экзамен, у задание, Ч XI 1 90 90 2 60 71 3 45 65 4 100 100 5 15 45 6 23 60 7 52 75 8 30 85 9 71 100 10 88 80
Смешанный второй момент и корреляция 189 отметки за домашнее задание и за экзамен подчинены отри- отрицательной корреляции, т. е. что студенты, которые хорошо выполняют домашнее задание, плохо сдают экзамены. 9.4. Количественный критерий значимости г Из рассмотренного примера должно быть ясно, что у нас все еще нет полного ответа на первоначальный вопрос о том, насколько хорошо экспериментальные точки подтверждают линейную связь между хну. Наш профессор получил коэф- коэффициент корреляции г = 0,8, и сделал вывод о том, что это значение «разумно близко» к 1. Но как можно объективно решить, что значит «разумно близко к 1»? Будет ли /- = 0,6 разумно близко? Или 0,4? Мы можем ответить на эти во- вопросы следующим образом. Предположим, что две переменные х и у в действитель- действительности некоррелированны, т. е. в пределе бесконечно большого числа измерений коэффициент корреляции был бы равен нулю. После конечного числа измерений очень маловероятно, чтобы г был точно равен нулю '). Оказывается, можно вычис- вычислить вероятность того, что г будет не меньше, чем любое за- заданное значение. Обозначим через PN(\r\>ro) вероятность того, что N измерений двух некоррелированных переменных хну приведут к значению коэффициента г, не меньшему2), чем любое частное значение г0. Например, мь* могли бы рассчитать вероятность /ММ > 0,8) того, что после N измерений некоррелированных переменных хну коэффициент корреляции будет по крайней мере не меньше, чем полученное профессором значение 0,8. Расчет таких вероятностей довольно сложен, и мы его здесь не будем приводить. Однако результаты таких вычислений для неболь- небольшого числа значений параметров представлены в табл. 9.2, а более полные таблицы приведены в приложении В. Хотя мы не показали, как вычисляются вероятности, при- приведенные в табл. 9.2, можно понять в общих чертах их пове- поведение и научиться их использовать. Левый столбец показы- показывает число экспериментальных точек N. (В нашем примере ') В случае конечного числа измерений в литературе на русском языке употребляется термин «выборочный коэффициент корреляции». — Прим. перев. 2) Так как корреляция означает, что г близко к +1, или —1, то мы рассматриваем вероятность получения абсолютного значения \r\ ^ г„.
190 Глава 9 Таблица 9.2. Вероятность PN ( | г | ^ г0) того, что N измерений двух некоррелированных переменных дс и у дадут коэффициент корреляции \r\^rv Значения вероятностей приведены в процентах} прочерками отмечены значения, меньшие 0,05% N 3 6 10 20 50 0 100 100 100 100 100 0,1 94 85 78 67 49 0,2 87 70 58 40 16 0,3 81 56 40 20 3 0,4 74 43 25 8 0,4 го 0,5 67 31 14 2 — 0,6 59 21 7 0,5 — 0,7 51 12 2 0,1 — 0,8 41 6 0,5 — — 0,9 29 1 — — — 1 0 0 0 0 0 профессор собрал отметки десяти студентов, так что N = 10.),' Числа в каждом последующем столбце — вероятности того, что Л' измерений двух некоррелированных переменных дадут коэффициент г, который по крайней мере не меньше, чем са- самое верхнее число в столбце. Например, как мы видим, ве- вероятность того, что десять некоррелированных точек дадут |г|^0,8, невелика, составляет только 0,5%. Следовательно, наш профессор может сказать, что весьма невероятно, чтобы некоррелированные отметки дали для коэффициента корреля- корреляции значение |г|, большее или равное величине 0,8, которую он получил. Другими словами, очень вероятно, что отметки за домашнее задание и за экзамен действительно коррели- рованы. Несколько особенностей табл. 9.2 нуждаются в коммента- комментариях. Все значения в первом столбце равны 100%, потому что \г\ всегда больше или равно нулю, так что вероятность получения |г|^0 всегда равна 100%. Аналогично все зна- значения в последнем столбце равны нулю, так как вероятность получения |г|^1 равна нулю1). Числа в промежуточных столбцах изменяются с числом экспериментальных точек N. Это также легко понять. Если мы сделаем только три изме- измерения, то вероятность получить коэффициент корреляции, ска- скажем |г|^0,5, очевидно, довольно велика (фактически 67%). Но если мы сделаем 20 измерений и если две переменные дей- действительно не коррелированы, то вероятность получить \r\ ^ 0,5, очевидно, очень мала (фактически 2%). Получив значения вероятности из табл. 9.2 (или из более полных таблиц приложения В), мы теперь можем дать наи- *) Хотя невозможно получить |г|>1, но И = 1 в принципе воз- возможно. Однако г — непрерывная переменная, и вероятность пол>чения значения |г|, точно равного единице, равна нулю. Таким образом, РЛ\Л > 1). = 0.
Смешанный второй момент и корреляция 191 более полный возможный ответ на вопрос о том, насколько хорошо N пар значений (xt, yi) подтверждают линейную связь между х и у. По измеренным точкам можно сначала вычислить значение коэффициента корреляции г0. Затем, ис- используя одну из этих таблиц, мы можем найти вероятность Ри{ \г\ ^ \го\) того, что N некоррелированных точек дадут для коэффициента значение не меньшее, чем полученный коэффициент г0. Если эта вероятность «достаточно мала», то мы можем заключить, что очень невероятно, чтобы хну были не коррелированы, и, следовательно, очень вероятно, что они в действительности коррелированы. Мы еще должны выбрать значение вероятности, которое будем рассматривать как «достаточно малое». Один довольно распространенный выбор состоит в том, чтобы рассматривать наблюденную корреляцию г0 как «значимую», если вероят- вероятность получения коэффициента г, такого, что \г\~^\го\, для некоррелированных переменных меньше 5%. Корреляцию иногда называют «высокозначимой», если соответствующая вероятность меньше 1%. Какой бы выбор мы ни сделали, мы не получим точно определенного ответа, какие данные кор- коррелированы, а какие нет; вместо этого у нас есть количе- количественная мера, показывающая, насколько невероятно пред- предположение о том, что они не коррелированы. 9.5. Примеры Предположим, что мы измеряем три пары значений (xi, yt) и находим, что коэффициент корреляции равен 0,7 (или—0,7). Подтверждает ли это значение гипотезу, что хну связаны линейно? Обращаясь к табл. 9.2, мы видим, что даже если перемен- переменные х и у совсем не коррелированы, то вероятность получения |г|^ 0,7 при N=3 составляет 51%. Другими словами, вполне возможно, что х и у не коррелированы; таким образом, у нас нет надежного доказательства корреляции. Действительно, в случае только трех измерений было бы очень трудно полу- получить убедительное подтверждение корреляции. Даже наблю- наблюденное значение коэффициента 0,9 недостаточно для утверж- утверждения корреляции, поскольку вероятность получения |г|^0,9 в случае трех измерений некоррелированных переменных равна 29%. Если бы мы нашли значение коэффициента 0,7 по шести измерениям, то ситуация была бы несколько лучше, но все же еще недостаточно хорошей. С N == Q вероятность получе- получения |г|^0,7 для некоррелированных переменных равна 12%. Эта цифра не так мала, чтобы исключить возможность того, Что х и у не коррелированы.
192 Глава 9 С другой стороны, если бы мы получили г = 0,7 после 20 измерений, то у нас было бы сильное подтверждение кор- корреляции, так как при N = 20 вероятность получения |л| ^ 0,7 для двух некоррелированных переменных равна только 0,1%. По любым критериям это очень неправдоподобно, и мы могли бы уверенно утверждать, что корреляция обнаружена. В част- частности, эта корреляция могла быть названа «высокозначимой», так как соответствующая вероятность меньше 1%. Задачи Напоминание: звездочка у номера задачи означает, что задача реша- решается или ее ответ приводится в разделе «Ответы» в конце книги. *9.1 (разд. 9.2). Докажите, что смешанный второй момент аху, опре- определенный в (9.8), удовлетворяет неравенству Шварца (9.11) \°ху\<охоу. (9.17) Указание: введите произвольное число t и рассмотрите функцию А {t) = ~w Z[{Xl ~ ~х) + *{У1 ~6)]2 > °- (9Л8) Так как A(t) —положительная величина независимо от значения t, то вы можете найти минимальное значение Лмин, приравнивая производную dA/dt нулю, и это минимальное значение будет все же больше или равно нулю. Покажите, что Амт = сг^ — (о^у/о2у), и получите (9.17). 9.2 (разд. 9.2). а. Представьте себе серию N измерений двух фиксированных длин х и у, выполненных с целью вычислить значение некоторой функции q(x,y). Предположите, что использовалось несколько различных типов рулеток, но при этом каждая пара точек (xi, yi) измерялась одной и той же рулеткой, т. е. пара (xi, yi) измерялась одной ру- рулеткой, (хг, у%)—другой рулеткой и т. д. Предполагая, что глав- главным источником ошибок является некоторая укороченность одних и некоторая удлиненность других рулеток, четко покажите, что смешанный второй момент аХу должен быть положительным. б. Покажите далее, что при тех же предположениях оХу = охоу, т. е. что значение axv настолько велико, насколько это позволяет нера- неравенство Шварца (9.17). Указание: сделайте допущение, что 1-я рулетка короче на фак- фактор к; (где кг близко к 1), тогда длина, которая в действитель- действительности равна X, будет измерена как хг = а.Х. Смысл этой задачи заключается в том, чтобы показать, что существуют ситуации, когда смешанным вторым моментом определенно нельзя пренебречь. *9.3 (разд. 9.3). а. Докажите тождество Z (xt ~ *) (Уг ~ У) — Z xiVi - N*U- б. Следовательно, покажите, что выражение для коэффициента корре- корреляции г (9.15) можно переписать как EXjiji — N iii Г Llf (Q 1Q)
Таблица Xl Vi 9.3 74 76 Смешанный 83 85 103 99 второй 96 109 момент 98 111 и корреляция 100 106 107 107 91 101 120 120 193 124 119 Часто это более удобный способ вычислять г, так как он- ие приво- приводит к необходимости рассчитывать индивидуальные отклонения X; — X И t)i — у. 9.4 (разд. 9.4). а. Проверьте, что коэффициент корреляции г для десяти пар отметок из табл. 9.1 равен г я» 0,8. б. Используя таблицу вероятностей из приложения В, найдите вероят- вероятность того, что кто-то получил бы коэффициент корреляции г .с \r\ ^ 0,8, если бы две отметки и в самом деле были некоррелиро- некоррелированны. *9.5 (разд. 9.4). В случае фотоэффекта кинетическая энергия К испу- испускаемых электронов, как полагают, есть линейная функция частоты / ис- используемого света: K^hf-Ф, (9.20) где h и Ф — постоянные. Чтобы проверить это соотношение, студент изме- измеряет К для N различных значений f и вычисляет коэффициент корреля- корреляции г по своим результатам. а. Если он делает пять измерений (N = 5) и получает г — 0,7, то подтверждает ли он линейную зависимость (9.20) на уровне приня- принятого коэффициента значимости 5 °/о? б. А что будет, если N = 20 и г = 0,5? *9.6 (разд. 9.4). а. Начертите график разбросов для следующих пяти пар измерений: х=\ 2 3 4 5 у = \ 4 3 2 1. Вычислите по этим данным коэффициент корреляции г. Для этого, вероятно, проще использовать выражение (9.19). Показывают ли данные, что имеется значимая корреляция? Нужные вероятности можно найти в приложении В. б. Повторите задание «а» для следующих данных: х=\ 2 3 4 5 (/ = 3 12 2 1. 9.7 (разд. 9.4). Психолог, исследуя связь между умственными способ- способностями отцов и детей, измеряет некоторый коэффициент интеллектуально- интеллектуальности, который мы обозначим для краткости КИ, для десяти отцов и их сыновей и получает результаты, представленные в табл. 9,3, где *< = КИ отца, yi = КИ сына. Подтверждают ли эти данные корреляцию между умственными спо- способностями отцов и сыновей?
Глава 10 Биномиальное распределение Распределение Гаусса, или нормальное распределение,—¦ пока единственный пример изученного нами распределения. Теперь мы рассмотрим два других важных примера, а именно биномиальное распределение (в гл. 10) и распределение Пуассона (в гл. 11). 10.1. Распределения В гл. 5 мы ввели понятие распределения как функции, которая определяет долю случаев реализации каждого из всех возможных результатов при многократных измерениях. Например, мы могли бы сделать N измерений периода Т маятника и найти распределение различных измеренных зна- значений Т, или мы могли бы измерять рост h у N американцев и найти распределение различных измеренных значений роста h. Затем мы ввели понятие предельного распределения как распределения, которое мы получили бы в пределе, когда число измерений N становится очень большим. Предельное распределение можно рассматривать также как такое, кото- которое определяет вероятность того, что единственное измерение приведет к любому из возможных значений: вероятность того, что одно измерение периода даст какое-то определенное зна- значение Т; вероятность того, что какой-то американец (взятый наудачу) будет иметь некоторый определенный рост h. По этой причине предельное распределение иногда называют также распределением вероятности. Из множества возможных предельных распределений мы рассмотрели только одно распределение Гаусса, или нор- нормальное распределение, которое описывает распределение результатов любых измерений в случае, если эти измерения подвержены действию множества небольших и случайных ошибок. Поэтому распределение Гаусса является для физи- физиков наиболее важным из всех предельных распределений,
Биномиальное распределение 195 и именно поэтому мы уделили ему столько внимания и места. Тем не менее имеется несколько других распределений, кото- которые также важны с теоретической и практической точек зре- зрения. Два примера таких распределений обсуждаются в на- настоящей и следующих главах. В данной главе мы рассмотрим биномиальное распреде- распределение. Это распределение не имеет слишком большого значе- значения для экспериментальной физики, однако из-за простоты оно может служить отличным введением к пониманию многих характеристик распределений. Оно также важно и с теорети- теоретической точки зрения, так как из него мы можем получить более важное распределение Гаусса. 10.2. Вероятности при бросании игральных костей') Биномиальное распределение лучше всего может быть описано на примере. Предположим, что мы предприняли такой «эксперимент», как бросание трех игральных костей, причем каждый раз мы подсчитываем число выпавших граней с одним очком, т. е. число единичек. Возможные результаты такого эксперимента — это 0, 1, 2 или 3 единички. Если мы повторим эксперимент огромное число раз, то найдем пре- предельное распределение, из которого можно будет найти ве- вероятность того, что при любой одной попытке бросания (всех трех костей) мы получим v единичек, где v = 0, 1,2 или 3. Этот эксперимент достаточно прост, и мы легко можем рассчитать вероятности четырех возможных исходов. Сна- Сначала, предполагая, что кости подлинные, отметим, что вероят- вероятность выпадения одного очка при бросании одной кости равна '/6- Теперь будем бросать все три кости и найдем сна- сначала вероятность выпадения трех единичек (v = 3). Так как в случае каждой отдельной кости вероятность выпадения одного очка равна 'Д и так как все кости вращаются при бросании независимо, то вероятность выпадения трех едини- единичек равна Р C единички в 3 бросаниях) = Рассчитать вероятность выпадения двух единичек (v = 2) несколько труднее, так как мы можем получить этот резуль- результат различными способами. Первая и вторая кости могли бы выпасть на единички, а третья — нет (А, А, не А); или пер- ') Игральная кость — маленький кубик, на гранях которого имеется маркировка — от одного до шести кружков, которые считаются как очки, т. е. как «единички», «двойки» и т. д. При игре в кости бросают кубик на плоскую поверхность и смотрят, какая грань оказалась наверху, т. е, ка- какие очки «выпали». — Прим. перев.
196 Глава 10 .50 \ О 57,9% 34,7% 6,9% | 0,5% О 1 Z l) Рис. 10.1. Вероятность получения v единичек при бросании трех игральных костей. Эта функция представляет собой биномиальное распределение bn,p(v) с п = 3 и р = '/е- вая и третья могли бы выпасть на единички, а вторая — нет (А, не А, А) и т. д. Будем вычислять вероятность в два приема. Сначала оценим вероятность выпадения двух еди- единичек при какой-то заданной определенной комбинации, на- например такой, как (А, А, не А). Вероятность того, что первая кость выпадет на единичку, равна 'Д и аналогично для вто- второй. С другой стороны, вероятность того, что последняя кость не выпадет на единичку, равна 5Д- Таким образом, вероят- вероятность выпадения двух единичек для заданной частной комби- комбинации равна Р(А,А, неЛ)=AJ.(|). Вероятность выпадения двух единичек для любой другой определенной комбинации та же самая. Существуют только три различные комбинации, когда мы могли бы получить две единички: (А, А не Л), или (А, не А, А), или (не А, А, А). Таким образом, полная вероятность получения двух единичек (в какой угодно комбинации) равна Р B единички в 3 бросаниях) = 3 • (-?•) • (|Л ~ 6,9 %. (ЮЛ) Подобные расчеты дают значения вероятности выпадения одной единички в трех бросаниях C4,7%) и ни одной еди- единички E7,9%). Полученные численные значения могут быть представлены в виде графика распределения вероятностей для единичек, полученных в одной попытке бросания трех костей, как показано на рис. 10.1. Этот график —пример биномиаль- биномиального распределения, к описанию общего вида которого мы сейчас приступаем.
Биномиальное распределение 197 10.3. Определение биномиального распределения Чтобы определить в общем виде биномиальное распреде- распределение, нам необходимо ввести некоторые понятия. Во-первых, представим, что мы делаем п независимых испытаний, таких, как бросание п костей, бросание п монет или опробование п хлопушек. Каждое испытание может иметь различные ис- исходы: кость может выпасть на любую грань от 1 до 6, монета может выпасть на орла или решку, хлопушка может хлопнуть или «прошипеть». Будем называть исход, в котором мы заин- заинтересованы, как успех или выигрыш. Таким образом, «успе- «успехом» могли бы быть выпадения очка при бросании кости, или орла при бросании монеты, или же взрыв хлопушки. Обозна- Обозначим через р вероятность успеха в любом одном испытании и через q = 1 — р вероятность «проигрыша» (т. е. получения любого исхода, кроме представляющего интерес). Таким образом, при бросании кости вероятность выпадения одного очка р = 'Д; вероятность выпадения орла при подбрасывании монеты р = '/г, и вероятность взрыва р могла бы достигать 95% для данного сорта хлопушек. С помощью этих определений мы теперь можем найти ве- вероятность получения v успехов в п испытаниях. Вычисления, которые мы вскоре опишем, показывают, что эта вероятность дается так называемым биномиальным распределением: P(v успехов в п испытаниях) = bn,p (v) = Буква b в формуле означает «биномиальное»; нижние ин- индексы п и р в bn<p(v) указывают, что распределение зависит от п, числа сделанных испытаний, и р, вероятности успеха в одном испытании. Распределение A0.2) называется биномиальным из-за его тесной связи с хорошо известным разложением бинома в ряд. А именно дробь в A0.2) — биномиальный коэффициент, часто обозначаемый ( п ) где мы ввели полезное понятие факториала п\ = 1 • 2 ..... п.
198 Глава 10 Биномиальный коэффициент появляется в разложении бинома (р + <7)" = р" + яр"? + ... + <7" = Р (v успехов в п испытаниях) — bn,p(v) = которое справедливо для любых двух чисел р и q и любого положительного целого п (см. задачу 10.4). Используя обозначение (Ю.З), мы можем переписать вы- выражение для биномиального распределения в более компакт- компактном виде A0.6) где, как обычно, р обозначает вероятность успеха в одном испытании и q = 1 —р. Вывод выражения A0.6) аналогичен получению формулы A0.1) в примере с игральными костями: РB единички в 3 бросаниях) = 3 • {—^ • (-|) . A0.7) Действительно, если подставить v = 2, п = 3, р = 'Д и q=5/e в A0.6), то получим точно A0.7), что вы должны проверить. Более того, смысл каждого множителя в A0.6) тот же самый, что и смысл соответствующего множителя в A0.7). Множи- Множитель pv — вероятность получения только успехов в любых определенных v испытаниях, a qn~v — вероятность проигрыша в оставшихся п — v испытаниях. Как легко показать, бино- биномиальный коэффициент (П) — число различных комбинаций, в которых получается v успехов в п испытаниях. Приведенное рассуждение показывает, что биномиальное распределение A0.6) на самом деле определяет вероятность, как было ска- сказано выше. Пример Предположим, что мы бросаем монету четыре раза (я=4) и подсчитываем число выпадений орла v. Какова вероятность получения различных возможных значений v = 0, 1, 2, 3, 4? Поскольку вероятность выпадения орла при одном броса- бросании равна р = '/г, то искомая вероятность — просто бино- биномиальное распределение bn,P(v) с п = 4 и р = q = '/г, P(v орлов в 4 бросаниях) = ( J (-^j .
Биномиальное распределение 199 50 1 О- 6,25% 37,5% 25% 6,25% Рис. 10.2. Биномиальное распределение ba% p(v) с п = 4, p = 1/2, опреде- определяющее вероятность выпадения v орлов при подбрасывании четырех монет. Эти числа легко рассчитываются (задача 10.5) и приводят к распределению, показанному на рис. 10.2. Мы видим, что наиболее вероятное число выпадений орла v = 2, как можно было бы ожидать. В данном случае ве- вероятности симметричны относительно этого наиболее вероят- вероятного значения. Иными словами, вероятность выпадения трех орлов та же, что и одного, а вероятность выпадения четырех орлов равна вероятности не выпадения ни одного. Как мы увидим, такая симметрия существует, только если р = '/г- 10.4. Свойства биномиального распределения Биномиальное распределение bn,P(v) определяет вероят- вероятность реализации v «успехов» в п испытаниях в случае, когда р есть вероятность успеха в единственном испытании. Если бы мы повторили полностью весь эксперимент (состоящий из п испытаний) много раз, то было бы естественно спросить: а каково среднее число успехов v? Это число определяется как = Е (v) A0.8) и легко вычисляется (задача 10.8) как A0.9) Таким образом, если мы повторим серию п испытаний много раз, то среднее число успехов будет равно вероятности успеха в одном испытании (р), умноженной на п, как можно было
200 Глава 10 бы ожидать. Аналогично можно рассчитать и стандартное отклонение ov для нашего числа успехов (задача 10.10). Результат равен A0.10) Когда р = '/г (как при бросании монеты), то среднее число успехов равно просто л/2. Более того, легко показать, что в случае р = 7г 6п. ¦/, (v) = &».'/, (я-v) A0.11) (см. задачу 10.11), т. е. биномиальное распределение в слу- случае р = 7г симметрично относительно среднего значения «/2, как мы заметили на рис. 10.2. В общем случае, когда р ф '/г, биномиальное распределе- распределение несимметрично. Например, график на рис. 10.1 явно не- несимметричен; наиболее вероятное число успехов равно v=0, и вероятности монотонно уменьшаются для v=l, 2 и 3. Кроме того, среднее число успехов (v = 0,5) в данном случае не совпадает с наиболее вероятным числом успехов (v = 0). Интересно сравнить биномиальное распределение bn,P(v) с более привычным распределением Гаусса fx,a(x). Воз- Возможно, наибольшее различие состоит в том, что результаты эксперимента, описываемые первым распределением, — это дискретные1) значения v = 0, 1, 2, ..., я, в то время как последнее описывает непрерывные значения измерений вели- величины х. Распределение Гаусса представляет собой симмет- симметричный пик с центром на среднем значении х = X; это озна- означает, что среднее значение X есть также и наиболее вероятное значение (такое, для которого fx,a(x) максимальна). Как мы видели, биномиальное распределение симметрично, только когда р = '/г, а в общем случае среднее значение не совпа- совпадает с наиболее вероятным значением. Аппроксимация биномиального распределения гауссовым Несмотря на все различия, имеется важная связь между биномиальным и гауссовым распределениями. Если рассмот- рассмотреть биномиальное распределение bn,P(v) для любого фик- фиксированного значения р в случае, когда п велико, то bn,P{v) хорошо аппроксимируется распределением Гаусса fx,o(v) ') «Дискретный» означает «отделенный от другого» и противоположе- противоположено понятию непрерывный.
Биномиальное распределение 201 а Г б 8 Г\ 8 12 W 20 7/ Рис. 10.3. Биномиальные распределения с р = 1/4 и п = 3, 12 и 48. Непрерывная кривая на каждом графике есть функция Гаусса с тем же средним в тем же стандартным отклонением с тем же средним значением и тем же стандартным отклоне- отклонением, т. е. ba.piy) » fx*<y){fi велико) A0.12) Х — пр и ст = л/прA — р). A0.13) Мы будем ссылаться на A0.12) как на гауссову аппрокси- аппроксимацию биномиального распределения. Мы не будем доказы- доказывать здесь этот результат1), но его справедливость хорошо иллюстрируется рис. 10.3, где показано биномиальное распре- ') Доказательство см. в книгах: Meyer S. L. Data Analysis for Scien- Scientists and Engineers, John Wiley, 1975, p. 226, или Young H. D. Statistical Treatment of Experimental Data, McGraw-Hill, 1962, приложение С.
202 Глава 10 деление для р = !Д и для трех последовательно увеличиваю- увеличивающихся значений п (п = 3, 12, 48). На каждое биномиальное распределение наложено распределение Гаусса с тем же средним и с тем же стандартным отклонением. В случае только трех испытаний (п = 3) биномиальное распределение сильно отличается от соответствующего гауссова. В частно- частности, биномиальное распределение явно асимметрично, в то время как гауссово, конечно, идеально симметрично относи- относительно среднего. В случае п = 12 асимметрия биномиального распределения гораздо менее выражена и два распределения близки друг к другу. Когда п = 48, различие между бино- биномиальным и соответствующим гауссовым распределениями так незначительно, что почти незаметно в масштабе рис. Ю.З.в. Тот факт, что биномиальное распределение может быть аппроксимировано функцией Гаусса при больших п, очень полезен для практики. Расчеты биномиальной функции для значений п, которые больше или порядка 20, чрезвычайно утомительны, в то время как вычисления функции Гаусса всегда просты для любых значений X и а. Чтобы проиллю- проиллюстрировать это, предположим, что мы захотели узнать ве- вероятность выпадения 23 орлов в 36 бросаниях монеты. Эта вероятность дается биномиальным распределением йзб, v2 (v)> поскольку вероятность выпадения орла в одном бросании р = '/2. Таким образом, РB3 орла в 36 бросаниях) = йзб,'/г B3)= A0.14) ^ 36! /1 ye 23! 13! \Т) • Нила; что после довольно утомительных вычислений1) оказывается равным РB3 орла) = 3,36 %. С другой стороны, поскольку среднее распределения равно пр =18, а стандартное отклонение о = л/прA—р) = 3, мы можем аппроксимировать A0.14) функцией Гаусса /18,зB3) и после тривиальных вычислений получить Р B3 орла) ~ /18>3 B3) = 3,32 %. Практически для всех случаев это — отличное приближение. Польза от гауссовой аппроксимации еще более очевидна, если надо вычислить вероятности нескольких исходов. На- *) Некоторые карманные калькуляторы позволяют вычислять функ- функцию я! автоматически, и с помощью таких калькуляторов расчет A0.15) прост. Однако большинство таких калькуляторов может выполнять опера- операцию л! только при п < 70, а при п ^ 70 происходит переполнение, и этой функцией нельзя воспользоваться.
Биномиальное распределение 203 Рис. 10.4. Вероятность получения результата, более чем на 1,5а превы- превышающего среднее, равна заштрихованной площади под кривой Гаусса. пример, вероятность получения 23 или более орлов в 36 бро- бросаниях есть РB3 или более орлов) = РB3 орла) + РB4 орла) +... + РC6 орлов), сумма, которую чрезвычайно утомительно рассчитать. Однако если аппроксимировать биномиальное распределение гауссо- гауссовым, то эту вероятность найти легко. Так как в случае рас- распределения Гаусса v — непрерывная переменная, то вероят- вероятность v = 23, 24, ... рассчитывается лучше всего как ^raycc(v ^ 22,5), т. е. как вероятность любого v ^ 22,5. В случае распределения Гаусса v = 22,5 и на 1,5 стандартных отклонений превышает среднее значение 18. (Помните, что о = 3, так что 4,5= 1,5а.) Вероятность значений, на 1,5а и более превышающих среднее значение, показана как за- заштрихованная площадь под гауссовой кривой на рис. 10.4. Она легко рассчитывается с помощью таблиц приложения Б, и мы находим РB3 или более орлов) «* Praycc(v>^+ 1,5<т) = 6,7 %. Эта цифра хорошо согласуется с точным результатом 6,6% (представленным двумя значащими цифрами). 10.5. Распределение Гаусса случайных ошибок В гл. 5 утверждалось, что если результаты измерений подвержены множеству небольших случайных ошибок, то они будут распределены нормально. Сейчас мы в состоянии доказать это утверждение с помощью простой модели для из- измерений такого типа. Предположим, что мы измеряем величину х, истинное значение которой равно X. Допустим, что в случае наших из- измерений систематические ошибки пренебрежимо малы и что имеется п независимых источников случайных ошибок (эф- (эффекты параллакса, времени реакции и т. д.). Чтобы упростить наше доказательство, предположим еще, что все эти источ- источники характеризуются случайными ошибками одной и той же
204 Глава 10 I X-6 n-1 X a K-2e Рис. 10.5. Распределения результатов измерений, подверженных влиянию п случайных ошибок величиной 8 для я = 1, 2 и 32. Непрерывные кривые на графиках б и в — гауссовы функции с теми же центрам» и шириной. (Вертикальный масштаб различен для трех графиков.) фиксированной величины е, т. е, каждый источник ошибок увеличивает или уменьшает результат на е с равной вероят- вероятностью р = 7г. Например, если истинное значение есть X и имеется только один источник ошибок, то с равной вероят- вероятностью возможны результаты х = Х — е и х = X -f- e. Если имеются два источника ошибок, то результат измерения мог бы быть х = X — 2е (если окажется, что обе ошибки отрица- отрицательны), или х = X (если одна ошибка отрицательна, а дру- другая положительна), или х — А' + 2е (если окажется, что обе ошибки положительны). Эти возможности проиллюстриро- проиллюстрированы на рис. 10.5, а и б. В общем случае если имеется п источников ошибок, наш результат мог бы изменяться от х = X — пе до х = X -J- пе. Для данного измерения, если окажется, что v источников дают положительные ошибки, а (п — v) — отрицательные, ре- результат будет равен х = X -f- ve — (п — v) e = = X + Bv — n)e. A0.16) Вероятность того, что это случится, равна биномиальной ве- вероятности P(v положительных ошибок) = Ьп. чА^)- A0.17) Таким образом, возможные результаты наших измерений бу- будут распределены симметрично около истинного значения X с вероятностями, даваемыми биномиальной функцией A0.17). Все сказанное проиллюстрировано на рис. 10.5 для п = 1, 2 и 32. Теперь мы утверждаем, что если число источников ошибок п велико и если индивидуальные ошибки е малы, то резуль- результаты измерений будут распределены нормально. Если быть более точным, го заметим, что стандартное отклонение бино- биномиального распределения есть av = -\fnp(l — р) = -\fn/4. Сле- Следовательно, в соответствии с A0.16) стандартное отклонение
Биномиальное распределение 205 результатов измерений х будет равно ох = 2eav = e У/г. Устре- Устремим п-+оо и е->0 таким образом, чтобы величина ох = е-\/п оставалась постоянной. Тогда произойдет следующее. Во-пер- Во-первых, как уже обсуждалось в предыдущем разделе, биноми- биномиальное распределение будет стремиться к распределению Гаусса с центром X и с шириной ах- Это отчетливо заметно на рис. 10.5,6 и в, где приведены соответствующие функции Гаусса. Во-вторых, если е->0, то возможные результаты из- измерений становятся ближе друг к другу (что также ясно вид- видно на рис. 10.5), так что распределение дискретной величины переходит в непрерывное распределение, которое представ- представляет собой ожидаемое распределение Гаусса. 10.6. Применения. Испытание гипотез Поскольку нам известно, как должны быть распределены результаты измерений, мы можем спросить: а действительно ли результаты эксперимента распределены так, как ожида- ожидалось? Такой вид проверки распределений — важный элемент в физических науках, но, возможно, он еще более важен в биологической и социальных науках. Один важный и общий тест — критерий %2 — обсуждается в гл. 12. Сейчас мы рас- рассмотрим два примера более простого критерия, который мож- можно использовать при решении некоторых задач, связанных с биномиальным распределением. Испытание новой лыжной мази Предположим, что производитель лыжных мазей заявил, что он изобрел новую мазь, которая существенно уменьшает трение между лыжами и снегом. Чтобы проверить это заявле- заявление, мы могли бы взять десять пар лыж и смазать одну лыжу из каждой пары этой мазью. Затем мы могли бы спускать по подходящему снежному склону каждую пару лыж и смот- смотреть, какая из них в каждой паре, смазанная или несмазан- несмазанная, скатится быстрее. Если бы смазанная лыжа скатывалась быстрее во всех Десяти случаях, то у нас было бы, очевидно, убедительное до- доказательство того, что мазь эффективна. К сожалению, такие однозначные результаты весьма редки, но даже и в этом слу- случае мы бы предпочли иметь количественную меру убедитель- убедительности доказательства. Таким образом, мы должны рассмо- рассмотреть два вопроса. Во-первых, как можно определить количе- количественно меру эффективности мази (или неэффективности)? Во- вторых, где должна быть граница? Если бы смазанные лыжи
206 Глава 10 скатились быстрее в девяти случаях, было бы это убедитель- убедительно? А что было бы, если бы в восьми? Или в семи? Точно такие же вопросы возникают во многих подобных статистических испытаниях. Если бы мы захотели проверить эффективность какого-то удобрения, мы могли бы сравнить какие-то параметры растений, под которые вносились и не вносились удобрения. Чтобы предсказать, кто из кандидатов может победить на выборах, мы могли бы взять случайную выборку избирателей и проверить шансы кандидатов на при- примере этой выборки. Чтобы ответить на поставленные вопросы, нам необходимо решить более точно, что же мы должны ожидать от наших испытаний. Или, употребляя принятую терминологию, мы должны сформулировать статистическую гипотезу. В примере с лыжной мазью простейшая гипотеза — это нулевая гипо- гипотеза, согласно которой новая мазь в действительности не ока- оказывает никакого эффекта. В рамках этой гипотезы мы можем вычислить вероятности различных возможных исходов нашего испытания и затем судить о правдоподобности какого-то ча- частного результата. Предположим, что мы приняли гипотезу, согласно которой лыжная мазь не оказывает никакого эффекта. Тогда в любом испытании смазанная и несмазанная лыжи с равной вероят- вероятностью могут скатиться одна быстрее другой, т. е. вероят- вероятность того, что смазанная лыжа скатится быстрее, равна р = 1/2. Вероятность того, что смазанные лыжи скатятся бы- быстрее в v испытаниях из десяти, определяется биномиальным распределением Р (v выигрышей в 10 испытаниях) = йю, i/2(v) = 101 / J\ io ~ v!A0 — л>)! \2J * A0.18) В соответствии с A0.18) вероятность того, что смазанные лыжи скатятся быстрее во всех десяти случаях, равна Р(Ю выигрышей в 10 испытаниях) = (-5-) ««0,1 %, A0.19) т. е. если наша нулевая гипотеза верна, то очень невероятно, чтобы смазанные лыжи скатились быстрее во всех десяти слу- случаях. И наоборот, если смазанные лыжи действительно скати- скатились быстрее во всех десяти испытаниях, то очень невероятно, чтобы нулевая гипотеза была верна. Действительно, вероят- вероятность A0.19) так мала, что мы могли бы сказать, что доказа- доказательство эффективности мази «высокозначимо», как мы вскоре будем гозорить.
Биномиальное распределение 207 С другой стороны, предположим, что смазанные лыжи ска- скатились быстрее в восьми случаях из десяти испытаний. Тогда мы могли бы вычислить вероятность восьми или более выиг- выигрышей: Р (8 или более выигрышей в 10 испытаниях) = s= P (8 выигрышей) -f- P (9 выигрышей) + -\-РA0 выигрышей) ** 5,5 %. A0.20) То, что смазанные лыжи скатятся быстрее в восьми или более испытаниях, все еще невероятно, но не до такой степени не- невероятно, как в случае всех десяти выигрышей. Чтобы решить, какой вывод можно сделать из случая восьми выигрышей, мы должны осознать, что в действитель- действительности имеются только две альтернативы: либо а) нулевая гипотеза верна (мазь не оказывает никакого эффекта), но по воле случая произошло редкое собы- событие (смазанные лыжи скатились быстрее в восьми ис- испытаниях) ; б) нулевая гипотеза неверна, и мазь эффективна. В статистических испытаниях обычно выбирают некоторую определенную вероятность (например, 5%) и рассматривают ее как определяющую границу, ниже которой вероятность со- события считается неприемлемо низкой. Если вероятность ре- реального исхода (в нашем случае восемь или более выигры- выигрышей) ниже этой границы, то мы выбираем альтернативу «б», отвергаем гипотезу и говорим, что результаты эксперимента значимы. Обычно говорят, что результат значим, если соответствую- соответствующая вероятность не превышает 5%, и «высокозначим», если соответствующая вероятность не превышает 1%. Так как ве- вероятность A0.20) равна 5,5 %, то восьми выигрышей в случае смазанных лыж недостаточно, чтобы обеспечить «значимое» доказательство того, что мазь эффективна. С другой стороны, мы видели, что вероятность десяти выигрышей составляет 0,1%. Поскольку это меньше 1%, то мы можем сказать, что десять выигрышей представляли бы «высокозначимое» дока- доказательство эффективности мази1). ') Вероятно, следует подчеркнуть исключительную простоту описан- описанного выше испытания. Мы могли бы измерять различные дополнительные параметры, такие, как время, за которое скатывается каждая лыжа, ма- максимальная скорость каждой лыжи и т. д. Вместо этого мы просто опре- определяли, какая лыжа скатывалась раньше. Испытания, которые не вклю- включают такие дополнительные параметры, называются непараметрическими испытаниями. Такие испытания обладают большими преимуществами про- простоты и широкой применимости.
208 Глава 10 Общая процедура Методы рассмотренного выше примера можно применить к любой системе п подобных и независимых испытаний, каж- каждое из которых может иметь два возможных исхода: «выиг- «выигрыш» или «проигрыш». Сначала формулируется гипотеза, ко- которая в данном случае состоит просто в том, что выбирается вероятность р выигрыша в любом отдельном испытании. Это принятое значение р определяет среднее ожидаемое число вы- выигрышей v = пр в п испытаниях1). Если действительное чис- число выигрышей v в п испытаниях близко к пр, то против ги- гипотезы нет возражений. (Если смазанные лыжи выигрывают пять из десяти испытаний, то нет свидетельства того, что мазь оказывает какой-то эффект.) Если v заметно больше, чем пр, то мы рассчитываем вероятность (в рамках данной гипотезы) получения v или более выигрышей. Если эта вероятность меньше, чем наш выбранный «уровень значимости» (т. е. 5 или 1 %), то мы заключаем, что наблюденное нами число не- неприемлемо невероятно (если наша гипотеза верна) и, следо- следовательно, что нашу гипотезу следует отвергнуть. Таким же образом, если полученное нами число выигрышей v заметно меньше, чем пр, мы можем сделать аналогичное заключение, только нам пришлось бы рассчитать вероятность получения v или менее выигрышей2). Как и следовало ожидать, описанная процедура не дает простого ответа, что наша гипотеза безусловно верна или без- безусловно неверна. В действительности она дает количествен- количественную меру достоверности наших результатов в рамках гипо- гипотезы. Таким образом, мы можем выбрать объективный, хотя и неоднозначный, критерий, по которому мы отвергаем гипо- гипотезу. Когда экспериментатор делает вывод, основанный на по- подобных рассуждениях, то важно, чтобы он четко указал, ка- какой критерий использовался и чему была равна вычисленная вероятность, чтобы читатель сам мог судить о достоверности выводов. Опрос избирателей В качестве второго примера рассмотрим выборы, когда баллотируются два кандидата А и Б. Пусть кандидат А за- >) Как обычно, v= пр есть среднее число успехов, ожидаемое в том случае, если бы мы были в состоянии повторить всю систему п испытаний много раз. 2) Как мы увидим ниже, в некоторых экспериментах соответствую- соответствующая вероятность — сумма двух «хвостов», т. е. вероятность получения зна- значений v, которые отличаются в любую сторону от пр так же, как факти- фактически полученное значение, или более.
Биномиальное распределение 209 явил, что, согласно тщательному обследованию, в его пользу высказываются 60% избирателей, и предположим, что канди- кандидат Б попросил нас проверить это заявление (в надежде, ко- конечно, показать, что число избирателей, поддерживающих А, значительно меньше 60%). В данном случае наша статистическая гипотеза состоит в том, что 60% избирателей поддерживают А, так что вероят- вероятность того, что случайно выбранный избиратель будет поддер- поддерживать А, равна р = 0,6. Сознавая, что мы не можем опро- опросить всех избирателей, мы тщательно подбираем случайную выборку из 600 человек и спрашиваем об их симпатиях. Если действительно 60% поддерживают А, то ожидаемое число лю- людей, поддерживающих А, в нашей выборке равно пр = = 600-0,6 = 360 Если фактически только 330 предпочтут А, то можем ли мы заявить, что гипотеза о 60%-ной поддержке А на значимом уровне сомнительна? Чтобы ответить на этот вопрос, заметим, что (в соответ- соответствии с гипотезой) вероятность того, что v избирателей выска- выскажутся в поддержку Л, определяется биномиальным распреде- распределением P(v избирателей за А) = Ъпф (v), A0.21) где п = 600 и р = 0,6. Так как п очень велико, то замена биномиальной функции распределением Гаусса с центром пр = 360 и стандартным отклонением ач = -у/прA—р)=12 будет отличным приближением: P(v избирателей за Л) « /36o,i2 (v). A0.22) Среднее ожидаемое число избирателей, отдающих пред- предпочтение А, равно 360. Таким образом, число тех, кто дей- действительно поддерживает Л по нашей выборке (а именно 330), на 30 меньше ожидаемого. Так как стандартное отклонение равно 12, то полученный результат на 2,5 стандартных откло- отклонений меньше предполагаемого среднего. Вероятность такого или меньшего значения (согласно таблице приложения Б) равна 0,6% '). Таким образом, наш результат «высокозначим» и на 1%-ном уровне значимости мы можем отвергнуть гипо- гипотезу, согласно которой 50% избирателей поддерживают Л. Этот пример иллюстрирует две общие особенности испы- испытаний такого рода. Во-первых, обнаружив, что 330 избирате- избирателей поддерживают Л (на 30 меньше, чем ожидалось), мы вычислили вероятность того, что число лиц, поддерживающих ') Строго говоря, мы должны были бы рассчитать вероятность для v ^ 330,5, так как в случае распределения Гаусса v — непрерывная пере- переменная. Это значение на 2,46сг меньше среднего, поэтому правильное зна- значение вероятности равно в действительности 0,7 %; но столь малое отли- отличие никак не влияет на наш вывод.
210 Глава 10 30 а Рис. 10.6. а — «однохвостовая» вероятность получения результата, кото- который более чем на 30 меньше среднего, б — «двухвостовая:» вероятность получения результата, который отличался бы на 30 н более в любую сто- сторону. (Не в масштабе.) А, будет 330 или меньше. На первый взгляд можно было бы рассматривать вероятность того, что число лиц, поддерживаю- поддерживающих А, равно v = 330. Однако эта вероятность чрезвычайно мала (в действительности 0,15%), и даже наиболее вероятный результат (v = 360) имеет невысокую вероятность C,3%). Чтобы получить надлежащую меру того, насколько неожидан- неожиданным является результат v = 330, мы должны рассмотреть v = 330 и любой результат, который еще меньше среднего. Наш результат v = 330 на 30 меньше, чем ожидаемый 360. Вероятность результата, который на 30 или более меньше среднего, иногда называют «однохвостовой вероятностью», по- поскольку она определяется площадью под одним хвостом кри- кривой распределения, как показано на рис. 10.6, а. В некоторых испытаниях соответствующая вероятность есть «двухвостовая вероятность» получения результата, который отличается от ожидаемого среднего на 30 или более в любую сторону, т. е. вероятность получения v ^ 330 и v ^ 390, как показано на рис. 10.6,6. Вопрос о том, использовать ли в статистическом тесте однохвостовую или двухвостовую вероятность, зависит от того, что считается альтернативой исходной гипотезе. В дан- данном случае мы были заинтересованы в том, чтобы показать, что кандидат А пользуется поддержкой меньшей, чем объяв- объявленные 60%, так что однохвостовая вероятность соответство- соответствовала сути дела. Если бы мы были заинтересованы в том, что- чтобы показать, что число лиц, поддерживающих А, отличается от 60% (в любую сторону), то двухвостовая вероятность со- соответствовала бы сути дела. На практике обычно довольно ясно, какую вероятность надо использовать. В любом случае экспериментатор всегда должен четко указать, какая вероят- вероятность и какой уровень значимости были выбраны и чему рав- равна вычисленная вероятность. Располагая этой информацией, читатель может судить о значимости результатов самостоя- самостоятельно. Задачи Напоминание: звездочка у номера задачи означает, что задача реша- решается или ее ответ приводится в разделе «Ответы» в конце книги.
Биномиальное распределение 211 10.1 (разд. 10.2). Рассмотрите эксперимент из разд. 10.2, в котором бросаются три игральные кости. Получите вероятности для выпадения случая, когда нет нн одной единички, и для выпадения одной единички. Проверьте все четыре вероятности, приведенные на рис. 10.1. *10.2 (разд. 10.2). а. Рассчитайте вероятности Р (л> единичек в двух бросаниях) для всех возможных v при бросании двух костей. Нанесите их на гисто- гистограмме. б. Сделайте то же самое для случая бросания четырех костей. 10.3 (разд. 10.3). а. Вычислите 5!, 6!, 251/23! б. Используйте соотношение п\ = (я + 1)!/(п + 1), чтобы показать, что 0! должен быть определен как 1. в. Докажите, что биномиальные коэффициенты, определяемые форму- формулой A0.3), равны (п\ п\ W vl(n — v)l' *10.4 (разд. 10.3). Рассчитайте биномиальные коэффициенты! J для л? = 0, 1,2, 3 и ( ) для v = 0, ..., 4. Потом запишите биномиальное разложение A0.5) выражения (р + q)" для п = 3 и 4. 10.5 (разд. 10.3). а. Рассчитайте и начертите гистограмму биномиальной функции рас- распределения Ьп, Р(л>) для п = 4, р = 4/г и всех возможных v. б. Повторите задание «а» для п = 4 и р = Vs. *10.6 (разд. 10.3). Больница принимает четырех пациентов, страдаю- страдающих от болезни, смертность от которой составляет 80 %. Используйте ре- результаты задачи 10.5,6 и определите вероятности следующих исходов: а) ни один из пациентов не выживет; б) выживет только один; в) выживут двое или более. *10.7 (разд. 10.3). Определите вероятности получения v единичек при бросании пяти костей для v = 0, 1, ..., 5. 10.8 (разд. 10.4). Докажите, что среднее число выигрышей V=0 для биномиального распределения равно пр. Существует много способов доказать это, и один из лучших состоит в следующем: запишите биномиальное разложение A0.5) для (р + q)". По- Поскольку оно верно для любых р и q, вы можете продифференцировать его по р. Если вы затем положите р + q = 1 и умножите почленно на р, то получите требуемый результат. *10.9 (разд. 10.4). Стандартное отклонение для любого распределения /(v) определяется как О' = ("V — Л>J. Докажите, что это то же самое, что и v2— (vJ. *10.Ю (разд. 10.4). Используйте результаты задачи 10.9 и докажите, что для биномиального распределения 6„, p(v) о^ = пр A — р). (Используйте тот же прием, что и в задаче 10.8, но продифференцируйте 00 Р дважды.)
212 Глава 10 10.11 (разд. 10.4). Докажите, что в случае р = '/г Для биномиального распределения верно соотношение Ьп. V, (V) = Ьп. Ч, (" - v)- т. е. что распределение симметрично относительно v = я/2. 10.12 (разд. 10.4). Гауссова аппроксимация A0.12) биномиального распределения превосходна для больших п и, что удивительно, хороша для малых п (особенно если р близко к '/г). Чтобы показать это, вычис- вычислите bA y2 (v) (для v = 0, 1, ..., 4) по точным формулам и с использо- использованием гауссовой аппроксимации. Сравните ваши результаты. *10.13 (разд. 10.4). Используйте гауссову аппроксимацию для опреде- определения вероятности выпадения точно 15 орлов в случае, когда вы бросаете монету 25 раз. Вычислите точное значение той же вероятности и сравните результаты. *10.14 (разд. 10.4). Используйте гауссову аппроксимацию и определите вероятность выпадения 18 или более орлов при 25 бросаниях монеты. (При использовании распределения Гаусса вы должны определить вероят- вероятность для v ^ 17,5.) Сравните с точным результатом 2,16%. 10.15 (разд. 10.6). В испытаниях лыжной мази, описанных в разд. 10.6» предположим, что смазанные лыжи скатились быстрее в девяти из десяти испытаний. Предполагая, что мазь не оказывает никакого эффекта, рас- рассчитайте вероятность девяти или более выигрышей. Обеспечивают ли де- девять выигрышей «значимое» доказательство эффективности мази (на уров- уровне 5%)? Является ли доказательство «высокозначимым» (на 1%-ном уровне)? *10.16 (разд. 10.6). Чтобы испытать новое удобрение, огородник вы- выбирает 14 пар одинаковых растений и вносит удобрение под одно растение каждой пары. Спустя два месяца 12 обработанных растений выглядят более развитыми, чем их необработанные партнеры (два оставшихся вы- выглядят менее развитыми). Если фактически удобрение не оказывает ника- никакого эффекта, какова будет вероятность, что просто случайно у огород- огородника получится 12 и более выигрышей? Представляют ли 12 выигрышей значимое доказательство того, что удобрение полезно (на 5%-ном уров- уровне)? Является ли доказательство «высокозначимым» (на 1%-ном уровне)? 10.17 (разд. 20.6). Известно, чте всхожесть семян определенного сорта равна 25%. Чтобы испытать новый «стимулятор всхожести», 100 таких семян высаживаются и обрабатываются стимулятором. Если 32 из них всходят, то можно ли заключить (на 5%-ном уровне значимости), что стимулятор действует? *10.18 (разд. 10.6). В некоторой школе 420 из 600 учеников выдер- выдержали испытания на стандартный математический тест, который в целом по стране выдерживают 60% учеников. Если студенты не имеют никакого специального отношения к этому тесту, то сколько из них, по вашим ожи- ожиданиям, выдержат это испытание и какова вероятность, что его выдержат 420 или более человек? Может ли школа утверждать, что ее ученики зна- значимо лучше подготовлены к испытанию?
Глава 11 Распределение Пуассона В этой главе мы будем изучать наш третий пример пре- предельного распределения, а именно распределение Пуассона. Оно описывает результаты экспериментов, в которых считают события, происходящие случайно, но в определенном среднем темпе. Это распределение особенно важно в атомной и ядер- ядерной физике, где подсчитывают числа распадов нестабильных атомов и ядер. ИЛ. Определение распределения Пуассона В качестве примера распределения Пуассона рассмотрим случай, когда мы имеем дело с образцом радиоактивного ма- материала. При помощи счетчика Гейгера мы можем сосчитать число v электронов, испущенных в радиоактивных распадах за одну минуту. Если счетчик исправен, то в значении v не будет погрешности. Тем не менее если мы будем повторять эксперимент, то обязательно получим разные значения v. Эта вариация в значениях v не является погрешностью непосред- непосредственно в подсчете, а скорее отражает характерные свойства пвоцесса радиоактивного распада. Каждое радиоактивное ядро характеризуется определен- определенной вероятностью распада за любой одноминутный интервал. Если бы мы знали эту вероятность и число ядер в нашем образце, то могли бы рассчитать ожидаемое среднее число распадов за минуту. Тем не менее каждое ядро распадается в случайный момент времени, и число распадов за любую одну минуту может отличаться от ожидаемого среднего числа. Очевидно, вопрос, который нам следует задать, состоит в следующем: если бы мы повторяли наш эксперимент много раз (восполняя образец, если он существенно истощается), то какое распределение для числа распадов v, наблюдаемых за одноминутные интервалы, мы должны были бы получить? Если вы изучили гл. 10, то поймете, что искомое распределе- распределение является биномиальным. Если имеется п ядер и вероят-
214 Глава И ность того, что любое одно ядро распадется, равна р, то ве- вероятность v распадов — это просто вероятность v «успехов» в п «испытаниях», или bn,P(v). Однако в эксперименте такого рода, который мы сейчас рассматриваем, имеются особен- особенности, позволяющие сделать важное упрощение. Число «испы- «испытаний» (т. е. ядер) огромно (вероятно, п ~ 1020), и вероят- вероятность «успеха» (т. е. распада) для любого одного ядра нич- ничтожна (часто р~ 100). При этих условиях (п велико, р мало) можно показать, что биномиальное распределение не- неотличимо от более простой функции, называемой распределе- распределением Пуассона, т. е. что Р(v отсчетов за любой определенный интервал) = pw (v), A1.1) где распределение Пуассона Pn(v) определяется как A1.2) В этом определении ц— положительный параметр (ц>0), который, как мы скоро увидим, представляет собой ожидае- ожидаемое среднее число отсчетов за рассматриваемый интервал вре- времени, a v! — обычная факториальная функция (и 0! = 1). Мы не будем сейчас выводить распределение Пуассона A1.2), но просто примем, что оно является соответствующим распределением для эксперимента рассматриваемого типа1). Чтобы установить роль параметра ц в A1.2), мы должны вычислить среднее число ожидаемых отсчетов v в случае, если бы мы повторяли наш эксперимент с подсчетами много раз. Это среднее число есть ve-*-g-. A1.3) v=0 v=0 Первый член в этой сумме может быть опущен (так как он равен нулю), a v/v! можно заменить на l/(v— 1)!. Если вы- вынести за знак суммы общий множитель це-(\ то получим v=l Остающаяся бесконечная сумма A1.5) ') Вывод см., например, в книге Young H. D. Statistical Treatment of Experimental Data, McGraw-Hill, 1962, sect. 8 или Meyer S. L., Data Ana- Analysis for Scientists and Engineers, John Wiley, 1975, p. 207.
Распределение Пуассона 215 есть просто экспоненциальная функция е» (как указано). Та- Таким образом, экспонента ег^ в A1.4) сокращается с этой суммой, и мы приходим к простому заключению, что (П.6) Таким образом, параметр ц, который характеризует распре- распределение Пуассона Pn(v), — это просто среднее число отсчетов, которое мы ожидаем в случае многократного повторения счет- счетного эксперимента. 11.2. Свойства распределения Пуассона На рис. 11.1 приведены распределения Пуассона для слу- случаев ц = 0,8 и 3. Из рис. 11.1, а для ц = 0,8 видно, что наибо- наиболее вероятные числа отсчетов равны v = 0 или 1 (причем v = 0 несколько более вероятно) и что имеется заметная ве- вероятность получения v = 2 или 3. Из рис. 11.1,6 для ц = 3 видно, что наиболее вероятные отсчеты — это 2 и 3 и с замет- заметной вероятностью встречаются отсчеты в интервале от v = 0 до v = 7. На обоих рисунках распределения заметно асим- асимметричны. Если рассмотреть эксперимент с большим средним значе- значением отсчетов, например с ц = 9, как показано на рис. 11.2, то мы увидим, что распределение будет приблизительно сим- симметричным относительно среднего. Действительно, можно до- доказать, что при |я—»-оо распределение Пуассона становится все более симметричным и стремится к распределению Гаусса с тем же средним и стандартным отклонением '). На рис. 11.2 50 \ о /1*0,8 I 0 1 Z J 4 5 1) Z0 10 О I 01Z345678S 1) Рис. 11.1. Распределения Пуассона со средними числами отсчетов ц = 0,8 и 3. ') См. ссылку на работу Мейера на с. 214
216 Глава 11 I i 15 10 \ \ iff Рис. 11.2. Распределение Пуассона с (х = 9. Прерывистая линия есть функция Гаусса с тем же центром и стандартным отклонением. пунктирной кривой представлено распределение Гаусса с цен- центром при ц = 9 и с тем же стандартным отклонением, что и у распределения Пуассона. Можно видеть, что, даже когда |я равно только 9, распределение Пуассона очень близко к со- соответствующей функции Гаусса, а небольшое отличие отра- отражает остающуюся асимметрию в функции Пуассона. Как мы вскоре увидим, для практики очень удобно, что в случае боль- больших ц распределение Пуассона можно, аппроксимировать со- соответствующим гауссовым. Другое интересное свойство распределения Пуассона обна- обнаруживается, если вычислить его стандартное отклонение ov. Как мы видели в гл. 4, сг — это среднее квадратов отклоне- отклонений (v — vJ. Таким образом, а2, = (v - vJ или (используя результаты задачи 10.9) оч, = v- — (v) ¦ A1.7) Мы уже вычислили, что v = ц, и аналогичные расчеты дают у2 — ^х2 -)- (я (см. задачу 11.6). Таким образом, а~ = |я, или A1.8) Распределение Пуассона со средним числом отсчетов |л имеет стандартное отклонение Уц- Результат A1.8) чрезвычайно полезен на практике. Если мы провели один счетный эксперимент и получили в итоге v отсчетов, то, как легко видеть (используя принцип максималь- максимального правдоподобия, как, например, в задаче 11.9), наилуч-
Распределение Пуассона 217 шая оценка для ожидаемого среднего числа отсчетов ^ будет равна |яНаил = v. Из A1.8) немедленно следует, что наилучшая оценка для стандартного отклонения будет равна -\'v. Дру- Другими словами, если мы проделаем одно измерение числа от- отсчетов за некоторый временной интервал и получим в резуль- результате число v, то наш итоговый вывод для ожидаемого сред- среднего числа отсчетов за этот же временной интервал будет v±^fv. A1.9) Это и есть результат, приводившийся без доказательства в со- соотношении C.2). Если бы нам пришлось вести измерения в течение более длительного времени, то мы получили бы боль- большее значение v. В соответствии с A1.9) это означало бы боль- большую погрешность Vv- Однако относительная погрешность, которая определяется как относительная погрешность = —^- = —у=, уменьшалась бы, если бы счет продолжался более длитель- длительное время. Интересно сравнить распределения Пуассона и Гаусса. Во- первых, распределение Гаусса fx,o(x) является непрерывным, так как х — непрерывная переменная, а распределение Пуас- Пуассона Pn(v) дискретно (подобно биномиальному), поскольку v = 0, 1, 2, ... . Во-вторых, гауссово распределение fx,a(x) определяется двумя параметрами: средним X и шириной а,, а распределение Пуассона Рц(у) определяется единственным параметром ^, поскольку, как мы только что видели, ширина av распределения Пуассона автоматически определяется сред- средним A (а именно av = Vh-)- Наконец, если мы рассмотрим распределение Пуассона, для которого среднее число отсчетов (я велико, то дискретная природа v становится менее суще- существенной и, как уже обсуждалось в связи с рис. 11.2, распре- распределение Пуассона (подобно биномиальному) хорошо аппрок- аппроксимируется функцией Гаусса fx, 0(x) с теми же средним и шириной, т. е. Pv(v) ~ fx.o(v) (и- велико), (П.10> где _ X = (я и сг== д/ \х . Приближение A1.10) называется гауссовой аппроксима- аппроксимацией распределения Пуассона. Оно аналогично соответствую- соответствующей аппроксимации биномиального распределения (рассмот- (рассмотренной в разд. 10.4) и полезно при выполнении аналогичных условий, а именно когда рассматриваемые параметры велики. Чтобы проиллюстрировать это, предположим, что мы хотим
218 Глава 11 рассчитать распределение Пуассона для ц = 64. Вероятность, например, 72 отсчетов есть Р G2 отсчета) = р64 G2) = «г* ^-. A1.11) и в результате трудоемких вычислений получаем для нее чис- численное значение РG2 отсчета) = 2,9%. Однако в соответствии с A1.10) вероятность A1.11) хорошо представляется как РG2 отсчета) ~ f64>8 G2), откуда после простых вычислений имеем РG2 отсчета) «3,0%. Если бы мы захотели вычислить непосредственно вероят- вероятность 72 или более отсчетов в том же эксперименте, то чрез- чрезвычайно громоздкий расчет дал бы = 17,3%. Если бы мы использовали аппроксимацию A1.10), то должны были бы рассчитать только вероятность получения v^71,5 (так как в случае распределения Гаусса v считается непре- непрерывной переменной). Поскольку 71,5 на 7,5 или на 0,94а пре- превышает среднее, то искомая вероятность может быть опреде- определена по таблице приложения Б как Р (v > 72) ~ Ргаусс (v > 71,5) = РГаусс (v > X + 0,94а) = = 17,4%, что почти по любому критерию является отличным прибли- приближением. 11.3. Примеры Как мы уже подчеркивали, распределение Пуассона опи- описывает распределение результатов в эксперименте, когда ве- ведется счет событий, происходящих случайно, но в определен- определенном ожидаемом среднем темпе. В лаборатории вводного курса физики два наиболее известных примера — это подсчет рас- распадов радиоактивных ядер и подсчет частиц космических лучей. Другой очень важный пример — эксперимент по изучению ожидаемого предельного распределения, подобного распреде- распределению Гаусса, биномиальному распределению или распреде- распределению Пуассона. С помощью любого предельного распреде-
Распределение Пуассона 219 ления можно узнать, сколько событий любого частного типа ожидается, если эксперимент повторяется несколько раз. (На- (Например, с помощью функции Гаусса fx,o(x) можно узнать, каково ожидаемое число результатов измерений х, которое попадает в произвольный интервал от х — а до х = Ь.) На практике наблюдаемое число редко в точности совпадает с ожидаемым. На самом деле оно флуктуирует в соответствии с распределением Пуассона. В частности, если ожидаемое число событий некоторого типа равно п, то полученное число может отличаться от п на число порядка д/'п. Во многих ситуациях разумно предполагать, что некото- некоторые числа распределены приближенно по закону Пуассона. Следует ожидать, что числа яиц, откладываемых домашними птицами на птицеферме за час, числа рождений в день в ро- родильном доме будут следовать распределению Пуассона, по крайней мере приближенно (хотя, вероятно, они также будут отражать и сезонные изменения). Чтобы проверить это пред- предположение, вы должны регистрировать нужные числа много раз. Отложив на графике полученное распределение, вы могли бы сравнить его с распределением Пуассона и получить не- некоторое представление о том, насколько хорошо они совпа- совпадают. Если желательно применить количественный тест, то вы могли бы использовать критерий %2, описанный в гл. 12. Подсчет частиц космического излучения В качестве конкретного примера распределения Пуассона рассмотрим эксперимент с космическими лучами. Эти «лучи» в действительности представляют собой заряженные частицы, такие, как протоны, и а-частицы, которые попадают в атмо- атмосферу Земли из космического пространства. Некоторые из них проходят все расстояние до поверхности Земли и могут быть зарегистрированы (например, с помощью счетчика Гейгера) в лаборатории1). В последующей задаче мы будем использо- использовать тот факт, что число частиц космических лучей, попадаю- попадающих на любую заданную площадь за данное время, должно быть распределено в соответствии с законом Пуассона. Пусть студент А утверждает, что он измерил число частиц космических лучей, упавших на счетчик Гейгера за одну ми- минуту. Он заявляет, что проделал измерения многократно и *) На самом деле первичные космические лучи, попадающие в атмо- атмосферу из космического пространства, взаимодействуют с ядрами атомов воздуха и генерируют вторичные частицы, которые в свою очередь тоже испытывают взаимодействия или распадаются, и т. д. В лаборатории на Земле можно детектировать практически только вторичные частицы (мюоны, электроны). Автор для простоты изложения опускает эти детали» которые несущественны в данном случае. — Прим. перев.
220 Глава 11 тщательно и нашел, что в среднем девять частиц проходят через счетчик за одну минуту, а погрешность «пренебрежимо» мала. Чтобы проверить это утверждение, студент Б подсчи- подсчитывает, сколько частиц регистрируется за одну минуту, и по- получает в результате цифру 12. Вызывает ли этот результат серьезные сомнения в правильности утверждения студента А о том, что ожидаемое число отсчетов равно девяти? Чтобы сделать более тщательную проверку, студентка В считает число упавших частиц за десять минут. По резуль- результатам студента А она ожидает получить цифру 90, но в дей- действительности регистрирует 120. Вызывает ли этот результат существенное сомнение в правильности утверждения сту- студента А? Рассмотрим сначала результат студента Б. Если А прав, то ожидаемое среднее число отсчетов равно 9. Поскольку рас- распределение отсчетов должно следовать закону Пуассона, то стандартное отклонение должно быть равно -\/9 = 3. Резуль- Результат студента Б есть 12, следовательно, он только на одно стан- стандартное отклонение отличается от среднего, равного 9. Это определенно не столь большое отличие, чтобы можно было говорить о противоречии с результатом А. Более строго, зная, что вероятность любого результата v должна быть pg{v), мы можем рассчитать полную вероятность получения резуль- результата, который отличается от 9 на 3 и более. Оказывается, что эта вероятность составляет 40% (см. задачу 11.11). Очевидно, что результат студента Б вовсе не удивителен, и у студента А нет причин для беспокойства. Совсем другое дело — результат студентки В. Если А прав, то В должна была ожидать 90 отсчетов за 10 минут. По- Поскольку распределение должно быть пуассоновым, то стан- стандартное отклонение должно составлять -\/90 = 9,5. Таким об- образом, результат В, равный 120, более чем на три стандарт- стандартных отклонения отличается от предсказания студента А, рав- равного 90. В случае таких больших чисел распределение Пуас- Пуассона неотличимо от функции Гаусса, и мы сразу можем найти по таблице приложения А, что вероятность отсчета, отличаю- отличающегося более чем на три стандартных отклонения от сред- среднего, равна 0,3%, т. е. если А прав, то чрезвычайно невероят- невероятно, чтобы В наблюдала 120 отсчетов. Иначе говоря, мы мо- можем почти наверное утверждать, что где-то допущен просчет. Возможно, А не был столь аккуратен, как он утверждал. Мо- Может быть, счетчик плохо работал в случае А или В, что при- приводило к систематическим ошибкам в одном из результатов. Или, может быть, А делал измерения в момент времени, когда поток космических лучей был действительно меньше нормаль- нормального.
Распределение Пуассона 221 Задачи Напоминание:звездочка у номера задачи означает, что задача реша- решается или ее ответ приводится в разделе «Ответы» в конце книги. *11.1 (разд. 11.1). а. Рассчитайте распределение Пуассона р^ (v) для (х = 0,5 и v = О, 1, ..., 6 и постройте гистограмму р^ (v) для этих дискретных зна- значений V. б. Выполните задание «а» для |х = 1. в. Выполните задание «а» для A = 2. *11.2 (разд. 11.1). а. Распределение Пуассона, подобно всем функциям распределения, должно удовлетворять «условию нормировки» оо ? Pn(v) = l. A1.12) v-=o Согласно этому условию, полная вероятность наблюдения всех воз- возможных значений v должна быть равна 1. Докажите это. [Вспомни- [Вспомните о бесконечном ряде A1.5) для е^.] б. Продифференцируйте A1.12) по (х, затем умножьте на (х и полу- получите таким образом альтернативное доказательство того, что v= u, как в случае формулы A1.6). 11.3 (разд. 11.1). По данным за 28 дней фермер иа птицеферме опре- определил, что между 10.00 и 10.30 утра все его курицы откладывают в сред- среднем 2,5 яйца. Предполагая, что число откладываемых яиц подчиняется распределению Пуассона с (х = 2,5, подсчитайте, сколько за это время было дней, когда между 10.00 и 10.30 утра не оказывалось ни одного отложенного яйца? А сколько дней, когда было 2 яйца или меньше? 3 или больше? *11.4 (разд. 11.1). Некоторый образец радиоактивного вещества со- содержит 1,5-1020 ядер, каждое из которых с вероятностью р= 10~20 мо- может распасться за любую фиксированную минуту. а. Чему равно ожидаемое среднее число (х распадов в образце за одну минуту? б. Вычислите вероятность р (у) наблюдения v распадов в минуту для v = 0, 1, 2, 3. в. Какова вероятность наблюдения четырех или более распадов в одну минуту? *11.5 (разд. 11.1). Ожидается, что в некотором образце радиоактив- радиоактивного вещества происходят три распада в минуту. Студент наблюдает чис- число v распадов в 100 отдельных одноминутных интервалах и получает ре- результаты, показанные в табл 11.1. а. Постройте гистограмму этих результатов, откладывая /v (долю слу- случаев, когда реализуется результат v) в зависимости от v. б. На этом же графике постройте ожидаемое распределение рз(ч). Согласуются лн данные с ожидаемым распределением? 11.6 (разд. 112). _ а. Докажите, что_среднее значение v'- для распределения Пуассона р (v) равно v2 = (х2 + A. [Простейший способ показать это со- Таблица 11.1 Число Число распадов v наблюдений 0 5 1 19 2 23 3 21 4 14 5 12 6 3 7 2 8 1 9 0
222 Глава 11 стоит, вероятно, в том, чтобы дважды продифференцировать тож- тождество A1.12) по ц.] б. Докажите, следовательно, что стандартное отклонение для v равно <jv = Vl^- [Используйте тождество A1.7).] *11.7 (разд. 11.2). Вычислите среднее v и стандартное отклонение <tv данных из задачи 11.5. Сравните полученные вами значения с ожидаемыми результатами 3 и уЗ. 11.8 (разд. 11.2). Известно, что средний темп распада ядер в некото- некотором образце равен примерно 20 в минуту. Если вы хотите измерить этот темп с 4%-ной точностью, то сколько времени вам потребуется для счета? *11.9 (разд. 11.2). а. Предположим, ^то мы считаем число частиц космических лучей, упавших на счетчик за одну минуту, и получаем результат v0. Предполагая, что это число подчиняется распределению Пуассона р (v), где ц — неизвестный ожидаемый средний темп, запишите вероятность получения значения v0. Используйте принцип макси- максимального правдоподобия и докажите, что наилучшая оценка для ц равна (Помните, что наилучшая оценка для \i — это такое значение, для которого вероятность получения vo максимальна.) б. Предположим, что мы сделали N отдельных измерений Vj v^j рассуждая, как и выше, покажите, что в этом случае цнаил равно среднему N Мнаил == ~дГ *11.10 (разд. 11.2). Ожидаемое среднее число отсчетов в некотором эксперименте равно ц = 16. а. Используйте аппроксимацию Гаусса A1.10) для оценки вероятности получения десяти отсчетов. Сравните полученное значение с точным результатом pieA0). б. Используйте аппроксимацию Гаусса для оценки вероятности полу- получения десяти или менее отсчетов. [Помните, что надо вычислять ''гаусс (v ^ 10,5), чтобы учесть тот факт, что в случае распреде- распределения Гаусса v является непрерывной переменной. Нужная вероят- вероятность может быть вычислена с помощью таблицы приложения Б.] Рассчитайте точный результат и сравните его с приближенным. Заметьте, как даже в случае таких малых значений ц, когда оно равно только 16, аппроксимация Гаусса дает вполне приемлемые резуль- результаты, и по крайней мере для задания «б» требует существенно менее тру- трудоемких расчетов, чем точные вычисления. *11.П (разд. 11.3). а. Вычислите вероятности ps(v) получения v отсчетов для v = 7, 8, 9, 10 и 11 в эксперименте, в котором ожидаемое среднее число от- отсчетов равно 9. б. Найдите по этим данным полную вероятность получения отсчета, который отличался бы от среднего 9 на 3 или более. Заставит ли вас отсчет 12 подозревать, что ожидаемое среднее в действитель- действительности не равно 9?
Глава 12 Критерий г2 для распределений Теперь у нас уже имеется некоторый опыт обращения с предельными распределениями. Это такие функции, которые описывают ожидаемое распределение результатов в случае, когда эксперимент повторяется большое число раз. Суще- Существует много различных предельных распределений, соответ- соответствующих множеству различных типов возможных экспери- экспериментов. Вероятно, три наиболее важных в физике распреде- распределения— как раз те, которые мы уже рассмотрели: гауссово (или нормальное), биномиальное и распределение Пуассона. В этой последней главе мы будем рассматривать вопрос о том, как решить, подчиняются ли результаты данного экспе- эксперимента ожидаемому предельному распределению. Или под- подробнее: предположим, что мы выполняем эксперимент, для которого, как мы полагаем, нам известно ожидаемое распре- распределение результатов. Предположим далее, что мы повторяем эксперимент несколько раз и регистрируем результаты наблю- наблюдений. Вопрос, который мы можем задать теперь, состоит в следующем: как определить, согласуется ли наблюдаемое распределение с ожидаемым теоретическим распределением? Мы увидим, что на этот вопрос можно ответить, используя простую процедуру, называемую критерием %2. 12.1. Введение в критерий %2 Начнем с конкретного примера. Предположим, что мы сделали 40 измерений х\, ..., Ао длины траектории х пули, вылетающей из некоторого ружья, и получили значения, при- Тлблица 12 1. Измеренные значения х (в сантиметрах) 731 739 678 698 772 780 748 770 771 709 689 754 681 676 810 830 722 760 805 725 688 748 778 710 653 672 764 738 757 687 753 638 733 766 709 787 742 645 675 712
224 Глава 12 веденные в табл. 12.1. Пусть у нас имеются основания пола- полагать, что результаты этих измерений распределены в соот- соответствии с законом Гаусса fx,a{x), что вполне естественно. В такого рода экспериментах обычно не известны заранее ни центр X, ни ширина а ожидаемого распределения. Следова- Следовательно, нашим первым шагом будет расчет наилучших оценок для этих величин по 40 результатам наших измерений: 40 / (наилучшая оценка X) = х — ? хц 40 = i=i / = 730,1 см A2.1) / V ix (наилучшая оценка а)= Л/ ^ = 46,8 см. A2.2) Теперь мы можем спросить, удовлетворяет ли фактическое распределение наших результатов х\, ..., х40 гипотезе, что эти результаты распределены в соответствии с законом Гаус- Гаусса fx, a(x) с оцененными выше значениями X я а. Чтобы от- ответить на этот вопрос, мы должны рассчитать, как, согласно нашим ожиданиям, были бы распределены наши 40 резуль- результатов, если бы гипотеза была верна, и сравнить это ожидае- ожидаемое распределение с нашим фактически полученным распре- распределением. Первая трудность заключается в том, что х есть непрерывная переменная, поэтому мы не можем говорить об ожидаемом числе измерений для какого-то одного значения х. Вместо этого мы должны говорить об ожидаемом числе в не- некотором интервале а < х < Ь, т. е. мы должны поделить весь интервал возможных значений на бины. В случае 40 измере- измерений мы могли бы выбрать границы бинов при X — о, X и X -(- ст, определяя таким образом четыре бина, как показано в табл. 12.2. Таблица 12.2. Возможный выбор бинов для даииых табл. 12.1 Последняя строка показывает число данных, которые попали в соответствующий бин Номер бина к Значения х в бине Числа наб- наблюдений О k в бине 1 х <Х-а или х < 683,3 8 X- 683,3 ч ¦ а < х или < х< 10 <х 730,1 X 730, 3 <х<Х+а или ,1 < х < 776,9 16 4 или 776,9 < х 6
Критерий х2 для распределений 226 Рис. 12.1. Вероятности Ри ..., Р4 того, что результаты попадут в каждый из четырех бинов (Л •= 1, ..., 4), равны соответствующим четырем пло- площадям, показанным под функцией Гаусса. Позже мы обсудим критерии для выбора бинов. В частно- частности, их следует выбирать таким образом, чтобы все бины со- содержали по нескольку измеренных значений хи Обычно мы будем обозначать число бинов через п; в данном случае, на- например, с четырьмя бинами, п = 4. Поделив весь интервал возможных измеренных значений на бины, мы можем сформулировать наш вопрос более точно. Во-первых, мы можем сосчитать число результатов измерений, которые попадают в каждый бин kl). Обозначим это число через Ok- Для данных нашего примера наблюдаемые числа О\, О2, Оз, О4 показаны в последней строке табл. 12.2. Далее, предполагая, что результаты наших измерений распределены нормально (с X и а, как мы оценили), мы можем рассчитать ожидаемое число Ek результатов измерений для каждого бина k. Затем необходимо будет решить, насколько хорошо наблю- наблюдаемые числа Ok согласуются с ожидаемыми числами Ek. Расчет ожидаемых чисел Ek очевиден. Вероятность того, что результат любого одного измерения попадает в интервал а <С х < Ь, равен площади под функцией Гаусса между х = а их = 6. В нашем примере вероятности Рь Р2, Рз, Pi попада- попадания результата измерения в каждый из четырех бинов — это четыре площади, показанные на рис. 12.1. Две равные пло- площади Р2 и Р3 вместе дают хорошо известное значение 68%, так что вероятность попадания в один из двух центральных бинов составляет 34%, т. е. Рг = Рз = 0,34. Две внешние пло- площади представляют оставшиеся 32%; таким образом, Р\ = = Р4 = 0,16. Чтобы найти ожидаемые числа Ek, мы просто умножим эти вероятности на полное число измерений N = 40. Эти ожидаемые числа приведены в табл. 12.3. Тот факт, что числа Ек не целые, служит нам напоминанием о том, что «ожидаемое число» — это не то, которое мы действительно ожидаем в любом отдельном эксперименте; это скорее среднее ожидаемое число, которое получится, когда мы повторим всю нашу серию измерений много раз. ') Если результат измерения попадает на границу между двумя би- бинами, то вы можете половину результатов приписать одному бииу н по- половину — другому.
16 6,4 8 34 13,6 10 34 13,6 16 16 6,4 6 226 Глава 12 Таблица 12.3. Ожидаемые числа Ек и наблюдаемые числа Ok для 40 измерений, результаты которых приведены в табл. 12.1 Бин ft 12 3 Вероятность Р^, % Ожидаемое число Е^ = Наблюдаемое число Ok Теперь наша задача — решить, насколько хорошо ожидае- ожидаемые числа Ek согласуются с соответствующими наблюдае- наблюдаемыми числами Ок (в нижней строке табл. 12.3). Мы, есте- естественно, не ожидаем идеального согласия между Ек и Ок после любого конечного числа измерений. Но с другой сто- стороны, если наша гипотеза о том, что результаты измерений распределены нормально, правильна, то мы ожидали бы, что в некотором смысле отклонения Ок-Ек A2.3) будут малы. И наоборот, если бы оказалось, что отклонения Oft — Ek велики, то мы стали бы подозревать, что наша гипо- гипотеза неверна. Чтобы придать точный смысл утверждениям, что отклоне- отклонения Ok — Ek «малы» или «велики», мы должны решить, на- насколько большими мы ожидали бы значения Ok — Ek, если бы результаты наших измерений действительно были распреде- распределены нормально. К счастью, это легко сделать. Если предста- представить себе, что вся наша серия из 40 измерений повторяется много раз, то числа Ok результатов измерений в любом одном бине k можно рассматривать как результат счетного экспери- эксперимента типа описанного з гл. 11. Множество наших различных результатов для Ok должно было бы иметь среднее значение Ek и флуктуировать относительно Ek со стандартным откло- отклонением порядка л/Ек- Таким образом, два числа, которые нужно сравнивать, это отклонение Ok — Ek и ожидаемая ве- величина его флуктуации -у/Ек. Итак, мы должны рассмотреть отношение . A2.4) Для некоторых бинов k это отношение будет положительным, для других — отрицательным; для малого числа бинов k оно может существенно превышать единицу, но для большинства бинов оно должно быть порядка единицы или меньше. Чтобы проверить нашу гипотезу (о том, что результаты измерений распределены нормально), естественно число A2.4) возвести
Критерий х2 для распределений 227 Таблица 12.4. Номер бина k Бин х Наблюдае- Наблюдаемое число Oft Ожидаемое число ?fc Ok-Ek Расчет W ДЛя 1 <х_ст х- 8 6,4 1,6 данных табл. 2 -0<*<Х 10 13,6 —3,6 12.1 3 Х<х<Х+а 16 13,6 2,4 4 Х + а<х 6 6,4 —0,4 в квадрат для каждого k и затем просуммировать по всем бинам k = 1, ..., п (в данном случае п = 4). Эта процедура определяет число/называемое %2 ™Е"» . A2.5) Должно быть ясно, что это число х2 служит показателем того, насколько хорошо согласуются наблюдаемое и ожидаемое распределения. Если %2 = 0, то согласие идеальное, т. е. Ok = Ek для всех бинов k, что в высшей степени невероятно. В общем случае отдельные члены в сумме A2.5) должны быть порядка 1, а в сумме всего п членов. Итак, если (%2 порядка п или меньше), то наблюдаемое и ожидаемое рас- распределения согласуются настолько хорошо, насколько можно было бы ожидать. Другими словами, если %2 ^ п, то у нас нет оснований сомневаться в том, что результаты наших изме- измерений были распределены так, как ожидалось. С другой сто- стороны, если Х2»« (х2 значительно больше, чем число бинов), то наблюдаемые и ожидаемые числа значительно различаются и есть все осно- основания подозревать, что результаты наших измерений не рас- распределены в соответствии с ожидаемым законом. В нашем примере наблюдаемые и ожидаемые числа для четырех бинов еще раз приведены в табл. 12.4, и простой рас- расчет с их использованием дает A2.6)
228 Глава 12 Так как величина 1,80 для %2 меньше, чем число членов в сум- сумме (а именно 4), то у нас нет оснований сомневаться в гипо- гипотезе, что результаты наших измерений распределены нор- нормально. 12.2. Общее определение х2 До сих пор мы ограничивались рассмотрением одного ча- частного примера, когда 40 раз измеряется непрерывная пере- переменная л; —расстояние, которое пролетает пуля, вылетевшая из некоторого ружья. Мы определили число %2 и увидели, что оно может служить по крайней мере грубой мерой, характери- характеризующей согласие наблюдаемого распределения результатов измерений и распределения Гаусса, в соответствии с которым, как мы ожидаем, распределены эти наши результаты. Сейчас мы увидим, что можно определять и использовать %2 анало- аналогичным образом и в случае многих других экспериментов. Рассмотрим любой эксперимент, в котором мы измеряем какое-то число х и для которого у нас есть основания ожи- ожидать некоторое определенное распределение результатов. Мы можем представить себе, что эксперимент повторяется много раз (N), и, поделив интервал возможных значений х на п би- бинов, &= 1 п, можем подсчитать числа Ok наблюдений, когда результат попадает в каждый бин k. Предполагая, что результаты измерений действительно распределены в соот- соответствии с ожидаемым распределением, мы затем вычисляем ожидаемые числа Ek измерений для &-го бина. Наконец, вы- вычисляем х2 точно так же, как и в случае A2.5): A2.7) Роль х2 всегда примерно такая же, как и в предыдущем при- примере, т. е. если х2 с< п, то согласие между наблюдаемым и ожидаемым распределениями приемлемое, если %2 3> п, то имеется существенное расхождение. Процедура выбора бинов для слагаемых, по которым вы- вычисляется %2, в некотором отношении зависит от характера эксперимента. В частности, она зависит от того, непрерывна или дискретна измеряемая величина х. Сейчас мы рассмот- рассмотрим эти две ситуации. Измерения непрерывной переменной Пример, рассмотренный в разд. 12.1, относится к непре- непрерывной переменной х, и лишь немногое можно добавить к
Критерий X2 Для распределений 229 тому, что уже было сказано. Единственное предельное распре- распределение, которое мы рассмотрели в случае непрерывной пе- переменной,— это распределение Гаусса, но существует, конечно, множество различных распределений, которые можно было бы ожидать. Например, в случае многих атомных и ядерных экспериментов ожидаемое распределение измеряемой пере- переменной х (энергии) — это распределение Лоренца f М ~ (х-хJ + у2 ' где X и у — некоторые постоянные. Каким бы ни было ожидаемое распределение f(x), полная площадь под графиком f(x) всегда равна 1, и вероятность того, что результат измерения попадет между х = а и х = Ь, — это площадь под графиком между а и Ь: ь Р (а < jc < 6) = J f (х) dx. Таким образом, если k-й бин имеет размеры от х=* ац до х = ак+\, то ожидаемое число измерений в k-u бине (после выполнения всех N измерений) будет равно f{x)dx. A2.8) Когда мы будем рассматривать использование критерия X2 с количественной стороны в разд. 12.4, то увидим, что ожи- ожидаемые числа Ek не должны быть слишком малы. Хотя не существует определенной нижней границы, однако Ek должны быть, вероятно, примерно равны или больше 5, Ек^5. A2.9) Следовательно, мы должны выбирать бины таким образом, чтобы Еь, определяемые A2.8), удовлетворяли этому усло- условию. Мы увидим также, что число бинов не должно быть слишком мало. Так, в случае примера из разд. 12.1, когда ожидаемым было распределение Гаусса, у которого центр X и ширина а не были известны заранее, критерий %2 не дей- действует (как мы увидим), если число бинов меньше четырех, т. е. в случае этого примера нам необходимо иметь п>4. A2.10) Рассматривая вместе A2.9) и A2.10), мы увидим, что нельзя использовать критерий %2 в такого рода экспериментах, если наше полное число наблюдений меньше 20.
230 Глава 12 Измерение дискретной переменной Предположим, что теперь мы измеряем дискретную пере- переменную, такую, как уже знакомое число единичек при броса- бросании нескольких игральных костей. На практике наиболее часто втречающаяся дискретная переменная — целое число (подобно числу единичек), и мы будем обозначать дискрет- дискретную переменную через v вместо х (х мы будем использовать для непрерывной переменной). Если мы бросаем пять костей, то возможные значения v — это v = 0, 1, ..., 5, и фактически нет необходимости разбивать возможные результаты по би- нам. Посто можно сосчитать, сколько раз мы получили каж- каждое из шести возможных значений. Мы можем выразить это и иначе, сказав, что мы выбрали шесть бинов, причем каждый бин содержит только одно возможное значение. Тем не менее часто бывает желательно сгруппировать несколько различных результатов в один бин. Например, если мы бросали пять наших костей 200 раз, то (в соответствии с вероятностями, определяемыми в задаче 10.7) ожидаемое распределение результатов будет таким, как приведено в двух первых столбцах табл. 12.5. Мы видим, что в данном случае ожидаемые числа бросаний, в которых реализуются четыре или пять единичек, равны соответственно 0,6 и 0,03, т. е. оба много меньше, чем примерно пять, что требуется для каждого бина, если мы хотим применять критерий %2. Эту трудность легко устранить, сгруппировав результаты для v = 3, 4 и 5 в один бин. Это приводит к четырем бинам k=l, 2, 3, 4, которые показаны вместе с соответствующими ожидаемыми числами Ek в последних двух столбцах табл. 12.5. Выбрав бины, как описано, мы могли бы сосчитать наблю- наблюдаемые числа выпадений Ok для каждого бина. Затем мы могли бы вычислить х2 и посмотреть, согласуются ли наблю- наблюдаемое и ожидаемое распределения. В этом эксперименте нам Таблица 12.5. Ожидаемые числа выпадений v единичек (v = 0, 1, ..., 5) при бросании пяти игральных костей 200 раз Ожидаемое IT „ ~ Результат число МеР бина Ожидаемое выпадений R число ?ft Ни одной единички Одна единичка Две Три Четыре Пять 80,4 80,4 32,2 6,4 1 0,6 \ 0,03 ) 1 2 3 4 80,4 80,4 32,2 7,0
^ Критерий v2 для распределений 23_1 известно, что ожидаемое распределение — это, конечно, бино- биномиальное распределение Ьь,ч, (у) при условии, что все играль- игральные кости подлинные (т. е. р действительно равно 'ДЬ Таким образом, наше испытание распределения в данном случае есть просто проверка, подлинные ли игральные кости м„ы используем или с утяжелениями у каких-то граней. В любом эксперименте с дискретной переменной бины можно выбирать так, чтобы каждый содержал только один результат при условии, что ожидаемое число реализаций в каждом бине составляет по крайней мере необходимые 5 или около того. В противном случае несколько различных результатов следует сгруппировать в один бин большего раз- размера, который действительно включает достаточное ожидае- ожидаемое число реализаций. Другие формы X2 Мы использовали обозначение %2 еще раньше в этой книге. Оно применялось в формуле G.6) и вновь в (8.5) и могло быть использовано для обозначения суммы квадратов в E.42). Во всех этих случаях %2 — это сумма квадратов, в общем виде записываемая как п 2 V"» ( наблюдаемое значение — ожидаемое значение \2 ,«~ * ~" Z-i V стандартное отклонение J • \ • Во всех случаях %2 служит показателем согласия между наблюдаемыми и ожидаемыми значениями некоторой пере- переменной. При хорошем согласии %2 будет порядка п, при пло- плохом %2 будет много больше, чем п. К сожалению, мы можем использовать критерий %2 для проверки этого согласия только в том случае, если нам изве- известны ожидаемые значения и стандартное отклонение, что поз- позволит нам вычислить A2.11). По-видимому, наиболее типич- типичные случаи, когда эти величины достаточно хорошо известны, рассмотрены в примерах данной главы, в которых предельное распределение определяет Ek и стандартное отклонение -y/Ek- Тем не менее критерий %2 очень широко используется. Обсу- Обсудим, например, рассмотренную в гл. 8 задачу об измерении двух переменных х и у, где ожидается, что у есть некоторая определенная функция х: (подобная у == А-\-Вх). Предположим, что у нас есть N из- измеренных пар значений (xt,yi), причем погрешность в xi пре- пренебрежимо мала, а погрешность а,- в yt известна. В данном
232 Глава 12 случае ожидаемое значение г/,- есть f(xt), и мы могли бы про- проверить, насколько хорошо у аппроксимирует функцию f(x) с помощью вычисления Все наши предыдущие замечания об ожидаемом значении %2 применимы к этому числу, и можно использовать количе- количественные критерии, описанные в последующих разделах. Мы не будем рассматривать здесь этого важного применения, так как оно довольно редко втречается в лаборатории вводного курса физики, поскольку погрешности а, в этом случав должны быть достаточно хорошо известны (см., однако, за- задачу. 12.14). 12.3. Степени свободы и приведенное значение %2 Мы утверждали, что можем проверять согласие между на? блюдаемым и ожидаемым распределениями, вычисляя %* и сравнивая его значение с числом бинов, используемых для представления данных. Оказывается, что более строгой про- процедурой было бы сравнение %2 не с числом бинов п, а с чис- числом степеней свободы, обозначаемым через d. Мы кратко упоминали о понятии числа степеней свободы в разд. 8.3. Теперь необходимо обсудить это понятие более подробно. В общем случае число степеней свободы d в статистиче- статистических расчетах определяется как число полученных данных минус число параметров, вычисленных по этим данным и ис- используемых в расчетах. Для задач, рассматриваемых в этой главе, полученные данные — числа наблюдений Окъ п бинах, где k=l, ..., п. Таким образом, число полученных данных равно п, числу бинов. Следовательно, для рассматриваемых здесь задач d == п — с, где п — число бинов, с — число параметров, которые были вычислены по данным для расчета ожидаемых чисел Ek. Число с часто называют числом связей, что мы кратко по- поясним. Число связей с изменяется в зависимости от обсуждаемой задачи. Рассмотрим сначала эксперимент с бросанием иг- игральных костей из разд. 12.2. Если мы бросаем пять костей и проверяем гипотезу, что кости подлинные, то ожидаемое распределение чисел выпадения единичек — биномиальное
Критерий 5С2 Для распределений 233 распределение 6s, v«(v). гДе v = 0, ..., 5 — числа единичек в любом одном бросании. Оба параметра этой функции — число игральных костей (пять) и вероятность выпадения еди- единички ('/б) — известны заранее, и их не надо вычислять из данных эксперимента. Рассчитывая ожидаемое число выпа- выпадений любого частного значения v, мы должны умножить биномиальную вероятность на полное число бросков N (в случае нашего примера ЛА = 200). Этот параметр и в са- самом деле зависит от данных. В частности, N есть просто сумма чисел 0^. п =1 Ok. A2.12) Таким образом, вычисляя ожидаемые результаты в нашем эксперименте с игральными костями, мы должны рассчитать только один параметр (N) из данных. Число связей равно, следовательно, с=\, и число степеней свободы определяется как В табл. 12.5 результаты эксперимента с костями были сгруп- сгруппированы в четыре бина (т. е. п = 4), поэтому в таком экс- эксперименте было три степени свободы. Формула A2.12) хорошо иллюстрирует термины «связи» и «степени свободы». Когда число N определено, то A2.12) можно рассматривать как уравнение, которое «связывает» значения О\, ..., О„. Точнее, можно сказать, что из-за связи A2.12) только п—1 чисел О\, ..., Оп-\ могут принимать любое значение (в определенных границах), но зато послед- последнее число On полностью определяется формулой A2.12). В этом смысле только п — 1 данных могут принимать неза- независимые значения; поэтому мы говорим, что имеется только л — 1 независимых степеней свободы. В первом примере этой главы дальность полета х пули была измерена 40 раз (ЛА —40). Результаты были собраны в четыре бина (п = 4) и сравнивались с теми значениями, которые мы ожидали бы от распределения Гаусса fx,o{x). В этом случае имелось три связи и, следовательно, только одна степень свободы d = n-c = 4— 3=1. Первая связь такая же, как и A2.12): полное число наблю- наблюдений N равно сумме чисел наблюдений Ok во всех бинах. Но в данном случае имеются еще другие связи, поскольку
234 Глава 12 (как обычно бывает в такого рода экспериментах) нам зара- заранее не известны параметры X я а ожидаемого распределения Гаусса fx,o{x). Таким образом, прежде чем мы смогли бы рассчитать ожидаемые числа Ек, мы должны были оценить X и о, используя данные. Следовательно, всего было три связи, поэтому в данном примере d = n — 3. A2.13) Отсюда ясно, почему мы должны были использовать по край- крайней мере четыре бина в этом эксперименте. Мы увидим, что число степеней свободы всегда должно быть не меньше еди- единицы, поэтому из A2.13) очевидно, что нам пришлось вы- выбрать п ^ 4. В рассмотренных здесь примерах всегда имеется по край- крайней мере одна связь (а именно связь N=^Ok, включаю- включающая полное число измерений), но могут существовать еще одна или две. Таким образом, число степеней свободы d будет изменяться от п—1 до п — 3 (в наших примерах). Когда число п велико, различие между п и й практически не имеет значения, но если п мало (как это часто бывает, к сожале- сожалению), имеется, очевидно, существенная разница. Теперь, используя понятие числа степеней свободы, мы можем приступить к выработке более точного критерия %2. Можно показать (хотя мы и не будем этого делать), что ожи- ожидаемое значение %2 точно равно d, числу степеней свободы (ожидаемое среднее значение %2) = d. A2.14) Эта важная формула не означает, что мы действительно ожи- ожидаем получить %2 = d после одной серии измерений. Но она имеет тот смысл, что если бы мы могли повторить всю нашу серию измерений бесконечное число раз и каждый раз вы- вычислять %2, то среднее этих значений %2 было бы равно d. Тем не менее даже после одной серии измерений сравнение %2 и d служит показателем согласия. В частности, если наше ожидаемое распределение было правильно, то крайне неве- невероятно, чтобы значение %2 было значительно больше, чем d. И наоборот, можно сказать: если мы нашли %2 ^> d, то можем утверждать, что крайне невероятно, чтобы наше ожидаемое распределение было верным. Мы не доказали формулу A2.14), но можем видеть, что некоторые ее следствия очень разумны. Например, так как d = п — с, формулу A2.14) можно переписать как (ожидаемое среднее значение %2) = п — с. A2.15) Иными словами, для любого данного п ожидаемое значение %2 будет меньше, когда с будет больше (т. е. если мы вычис- вычислим больше параметров по данным). Это как раз то, что
Критерий х2 для распределений 235 нам следует ожидать. В случае примера из разд. 12.1 мы использовали данные для расчетов положения центра X и ширины о ожидаемого распределения fx,o{x)- Естественно,, поскольку X и о были выбраны таким образом, чтобы аппрок- аппроксимировать данные, то нам следует ожидать несколько луч- лучшего согласия между наблюдаемым и ожидаемым распреде- распределениями, т. е. следует ожидать, что эти две лишние связи уменьшат значение %2. А это как раз то, что предполагает A2.15). Из формулы A2.14) следует, что существует несколько более удобный способ понимания критерия %2. Мы введем понятие приведенного значения %2 (или %2 на одну степень свободы), которое мы обозначим через %2 и определим как A2.16) Поскольку ожидаемое значение %2 равно d, то мы получаем (ожидаемое среднее значение ЗС2)=1. A2.17) Таким образом, каким бы ни было число степеней свободы, наш критерий можно сформулировать следующим образом: если мы получаем значение %2 порядка 1 или меньше, то у нас нет оснований сомневаться в нашем ожидаемом рас- распределении; если мы получаем значение %2 много большее, чем единица, то невероятно, чтобы наше ожидаемое распре- распределение было верным. 12.4. Вероятности для х2 Наш критерий проверки согласия между полученными данными и их ожидаемым распределением все еще остается только качественным. Нам хотелось бы иметь количественную меру согласия. В частности, нам нужно некоторое указание на то, где проводить границу между согласием и несогласием. Например, в случае эксперимента из разд. 12.1 мы сделали 40 измерений некоторых расстояний х, распределение кото- которых, как мы полагаем, должно быть гауссовым. Мы распре- распределили наши данные по четырем бинам и нашли, что %2 = = 1,80. При трех связях оставалась только одна степень сво- свободы (d=l), поэтому приведенное значение %2, X2 = %2/df также равно 1,80: 22=1,80.
236 Глава 12 Теперь возникает вопрос: достаточно ли велико значение X2 = 1.80 по сравнению с единицей, чтобы отвергнуть ожи- ожидаемое распределение Гаусса? Чтобы ответить на этот вопрос, будем исходить из пред- предположения, что результаты наших измерений действительно распределены в соответствии с ожидаемым распределением (например, гауссовым). В рамках этого предположения можно вычислить вероятность получения значения %2, кото- которое будет не меньше, чем наше значение 1,80. В данном слу- случае оказывается, что эта вероятность равна РB2>1,80)~18%, как мы вскоре увидим. Следовательно, если бы наши резуль- результаты подчинялись ожидаемому распределению, то существо- существовала бы 18%-ная вероятность получения значения %2, боль- большего или равного 1,80, которое мы фактически получили. Другими словами, в этом эксперименте значение %2, равное 1,80, вовсе не является неразумным, поэтому у нас нет при- причин (основанных на этих данных) отвергнуть наше ожидае- ожидаемое распределение. В общем случае наша процедура должна быть теперь довольно ясна. После завершения любой серии измерений мы вычисляем приведенное значение %2, которое теперь мы будем обозначать через %1 [где нижний индекс «о» означает «полу- «полученное» (obtained), так как %20 есть значение, которое дей- действительно получено]. Затем, предполагая, что результаты наших измерений распределены в соответствии с ожидаемым распределением, мы вычисляем вероятность Р(Х2>%1) A2.18) получения значения %2, большего или равного значению %*г фактически полученному. Если эта вероятность велика, то наше значение %„ вполне приемлемо и нет оснований отвер- отвергать наше ожидаемое распределение. Если эта вероятность неразумно мала, то значение у}, столь же большое, как наше полученное %20, очень невероятно (если результаты наших измерений были распределены, как ожидалось), и соответ- соответственно невероятно, чтобы наше ожидаемое распределение было правильным. Как всегда бывает со статистическими критериями, мы должны решить, где проходит граница между тем, что «ра- «разумно вероятно», и тем, что нет. Два обычных выбора уже упоминались в связи с корреляциями. Выбрав границу в 5%, мы бы сказали, что наше полученное значение %20 обнаружи- обнаруживает «значимое разногласие», если
Критерий х2 для распределений 237 Таблица 12.6. Выраженная в процентах вероятность l>d() получения значения х2, большего или равного любому частному значению %о, в предположении, что результаты рассматриваемых измерений распределены в соответствии с ожидаемым распределением. Прочерки соответствуют вероятностям, меньшим 0,05% й 1 2 3 5 10 15 0 100 100 100 100 100 100 0.2S 62 78 86 94 99 100 0,5 48 61 68 78 89 94 0,75 39 47 52 59 68 73 1,0 32 37 39 42 44 45 %о 1,25 26 29 29 28 25 23 1,3 22 22 21 19 13 10 1,75 19 17 15 12 6 4 2 16 14 11 8 3 1 3 8 5 3 1 0,1 — 4 5 2 0,7 0,1 — — 5 3 0,7 0,2 — — — 6 1 0,2 — — — — и мы отвергли бы наше ожидаемое распределение на «5%-ном уровне значимости». Если бы мы установили границу в 1%, то могли бы сказать, что расхождение «высокозначимо», если ¦Р(Й2^%о) < 1 %, и отвергнуть ожидаемое распределение на «1 %-ном уровне значимости». Какой бы уровень мы ни выбрали в качестве границы, когда мы отвергаем гипотезу, выбранный уровень следует указать. Может быть, даже более важно привести и вероят- вероятность Р (х2 ^ Хо)> так чтобы читатель смог самостоятельно судить о ее разумности. Расчеты вероятностей Р(х"^Хо) слишком сложны, чтобы их описывать в этой книге. Однако их результаты можно Легко свести в таблицы, как, например, табл. 12.6 или более полная таблица в приложении Г. Оказывается, что вероят- вероятность получения любого частного значения х2 зависит от числа степеней свободы. Поэтому мы будем записывать инте- интересующую нас вероятность как Pd(%2^%20), чтобы подчерк- подчеркнуть ее зависимость от d. В обычных расчетах вероятностей Pd{%2^%20) полученные числа Ок рассматриваются как непрерывные переменные, ко- которые распределены относительно их ожидаемых значений Ек в соответствии с распределением Гаусса. В задачах, которые мы здесь рассматриваем, Ок— дискретная переменная, рас- распределенная в соответствии с законом Пуассона '). При усло- ') Мы показали, что определение чисел О* происходит в счетном эксперименте и что, следовательно, Oft должны быть распределены по за- закону Пуассона. Если размер бина k слишком велик, то эта аргументация-
238 Глава 12 вии что все рассматриваемые числа достаточно велики, дис- дискретный характер Ok не важен и распределение Пуассона хорошо аппроксимируется функцией Гаусса. При этих усло- условиях можно использовать табулированные значения вероят- вероятностей ^d(X2^Xo) на достаточно законных основаниях. Именно по этой причине мы говорили, что бины должны вы- выбираться таким образом, чтобы ожидаемые отсчеты Ek в каждом бине были достаточно велики (по крайней мере порядка 5). По той же причине число бинов не должно быть слишком малым. С этими предупреждениями мы приводим значения рас- рассчитанных вероятностей Pd(%2^%20) для небольшого числа выбранных значений d и %20 в табл. 12.6. Числа в левом столбце предоставляют выбор из шести значений d, числа степеней свободы (d = 1, 2, 3, 5, 10, 15). Числа сверху над другими столбцами — возможные значения полученных %?. Каждое число в таблице — выраженная в процентах вероят- вероятность ^d(x2^Xo) как функция d и Хо- Например, для десяти степеней свободы (d = 10) мы находим, что вероятность по- получения х2 5г 2 равна 3%: Таким образом, если бы мы получили приведенное значение X2, равное 2, в эксперименте с десятью степенями свободы, мы могли бы заключить, что наши наблюдения «значимо» отличаются от ожидаемого распределения, и отвергнуть ожи- ожидаемое распределение на 5%-ном уровне значимости (но не на 1%-ном уровне). Все вероятности во втором столбце табл. 12.6 равны 100%, так как получение %2 ^ 0 всегда достоверно. С ростом %20 вероятность получения %2^%1 уменьшается, но характер этого уменьшения зависит от d. Например, для двух степеней свободы (d = 2) вероятность Pd{%2~^\) составляет 37%. в то время как для d= 15 Л*(х2^г 1) составляет 45%. За- Заметьте, что Pd(%2 ^ 1) всегда велика (по крайней мере не менее 32%), поэтому значение %20, равное 1 или менее, вполне разумно и никогда не приводит к требованию отвергнуть ожидаемое распределение. Минимальная величина %20, которая ставит под вопрос ожидаемое распределение, зависит от d. Для одной степени свободы мы видим, что Хо может быть и большим, напри- не совсем верна, так как вероятность для такого бина не мала по сравне- сравнению с 1 (что является одним из условий справедливости распределения Пуассона, как упомянуто в разд. 11.1); поэтому мы должны иметь разум- лое число бинов.
Критерий х2 для распределений 239 мер 4, прежде чем расхождение станет «значимым» (на 5%-ном уровне). В случае двух степеней свободы соответ- соответствующая граница равна %2о=3; для d = 5 она близка к 2 (фактически %;; = 2,2) и так далее. Используя вероятности из табл. 12.6 (или из приложе- приложения Г), мы теперь можем приписывать количественный кри- критерий значимости для значения %2 полученного в любом конкретном эксперименте. В разд. 12.5 приведено несколько примеров. 12.5. Примеры Мы уже довольно подробно проанализировали пример из разд. 12.1. В этом разделе мы рассмотрим еще три примера, чтобы проиллюстрировать применение критерия %2. Другой пример распределения Гаусса Пример из разд. 12.1 относился к измерениям, результаты которых, как ожидалось, были распределены нормально. Нормальное, или гауссово, распределение встречается на- настолько часто, что мы кратко рассмотрим еще один пример. Предположим, что некий антрополог интересуется ростом аборигенов на некотором острове. Он полагает, что взрослые мужчины по росту должны быть распределены нормально, и измеряет рост для выборки из 200 мужчин. Используя эти результаты, он вычисляет среднее значение и стандартное отклонение и использует эти числа как наилучшие оценки центра X и параметра ширины а ожидаемого нормального распределения fx,o(x). Затем он выбирает восемь бинов, как показано в двух левых столбцах табл. 12.7, распределяет по Таблица 12.7. Измерения роста 200 взрослых мужчин Номер бииа Рост в бине Наблюдаемое Ожидаемое к число 0^ число Ek 1 менее X— 1,5а 14 13,4 2 между X — 1,5а и X — а 29 18,3 3 между X — а и X — 0,5а 30 30,0 4 между X — 0,5а и X 27 38,3 5 между X и X + 0,5а 28 38,3 6 между X + 0,5а и X + а 31 30,0 7 между Х+а и Х+1,5а 28 18,3 8 более X + 1,5а 13 13,4
240 Глава 12 ним свои наблюдения и получает результаты, показанные в третьем столбце. Далее наш антрополог желает проверить, согласуются ли эти результаты с ожидаемым нормальным распределением fx,o{x). С этой целью он сначала рассчитывает вероятность Р/г, того, что любой один мужчина имеет рост в любом за- заданном бине k (предполагая нормальное распределение). Она равна интегралу от fx, 0{x) в пределах границ бина и легко находится по таблице интеграла ошибок приложения Б. За- Затем ожидаемое число Ek в каждом бине находится умноже- умножением Pk на полное число выбранных мужчин B00). Эти числа приведены в последнем столбце табл. 12.7. Чтобы вычислить ожидаемы-е числа Ек, антропологу при- пришлось использовать три параметра, которые были рассчитаны по его данным (полный объем выборки и оценки для X и о). Таким образом, хотя имеется восемь бинов, но было три связи, поэтому число степеней свободы равно d = 8 — 3 = 5. Простой расчет с использованием данных табл. 12.7 дает для приведенного значения %2 (=1 Так как эта величина заметно больше, чем 1, мы сразу же начинаем подозревать, что рост островитян не подчиняется нормальному распределению. Точнее, из табл. 12.6 мы видим, что если бы по росту островитяне были распределены, как ожидалось, то вероятность Р5(х2^3,5) получения значения %2, не меньшего чем 3,5, составляет примерно 0,5%. По лю- любым стандартам это практически невероятно, и мы заклю- заключаем, что практически невероятно, чтобы островитяне были распределены по росту нормально. В частности, на 1 %-ном (или «высокозначимом») уровне мы можем отвергнуть гипо- гипотезу о нормальном распределении по росту. Вновь игральные кости В разд. 12.2 мы рассмотрели эксперимент, в котором пять костей бросалось много раз и в каждом таком бросании подсчитавалось число выпавших единичек. Предположим, что мы сделали 200 бросков и распределили результаты по би- нам, как было обсуждено раньше. Предполагая, что кости подлинные, мы можем рассчитать ожидаемые числа Ек, как и прежде. Они приведены в третьем столбце табл. 12.8. В фактическом испытании пять костей бросалось 200 раз, и в последнем столбце табл. 12.8 представлены числа, кото-
Критерий х2 для распределений 241 Таблица 12.8. Распределение чисел единичек в 200 бросаниях 5 игральных костей Номер бина Результаты в биие Ожидаемое Наблюдаемое д число Ей число Ои к к 1 2 3 4 Ни одной единички Одна единичка Две единички 3, 4 или 5 единичек 80,4 80,4 32,2 7,0 60 88 39 13 рые в действительности наблюдались. Чтобы проверить согла- согласие между полученным и ожидаемым распределениями, мы просто заметим, что имеется три степени свободы (четыре бина минус одна связь), и вычислим Используя опять табл. 12.6, мы видим, что для трех степеней свободы вероятность получения столь большого или боль- большего значения %2 составляет примерно 0,7%, если кости под- подлинные. Мы заключаем, что почти наверное кости фальшивые. Сравнение чисел Ek и Ok в табл. 12.8 заставляет предполо- предположить, что по крайней мере одна кость утяжелена со стороны единички. Пример распределения Пуассона В качестве последнего примера по использованию крите- критерия х2 рассмотрим эксперимент, в котором ожидаемое распре- распределение есть закон Пуассона. Предположим, что мы исполь- используем счетчик Гейгера для счета частиц космических лучей в некотором месте. Предположим далее, что мы считаем ча- частицы, пришедшие в 100 отдельных одноминутных интерва- интервалах, и получаем результаты, приведенные в двух первых столбцах табл. 12.9. Анализ чисел во втором столбце сразу же заставляет нас объединить все отсчеты с v ^ 5 в один бин. Такой выбор шести бинов (k=l, ..., 6) показан в третьем столбце, а со- соответствующие числа Ok приведены в четвертом. Гипотеза, которую мы хотим проверить, состоит в том, что числа v распределены в соответствии с законом Пуассона Pn(v). Поскольку ожидаемый средний отсчет \х, неизвестен мы должны сначала вычислить среднее значение для нашей сотни отсчетов. Оно легко находится и оказывается равным
242 Глава 12 Таблица 12.9. Числа частиц космических лучей, полученных в 100 отдельных одноминутных интервалах Числа v отсчетов Числа Номер бина „Гблюденнй за одну минуту наблюдений к q в бине ? 1 7 7,5 2 17 19,4 3 29 25,2 4 20 21,7 5 16 14,1 Ни одного 1 2 3 4 5 6 7 8 или более Полное число 7 17 29 20 1G 8 1 2 0 100 11 12,1 v = 2,59, что дает нам нашу наилучшую оценку для ц. Исполь- Используя это значение ц = 2,59, мы можем рассчитать вероятность Pij,(v) любого частного отсчета v и, следовательно, ожидае- ожидаемые числа Ей, которые приведены в последнем столбце. При расчете чисел Ek мы использовали два параметра, определенные из данных, а именно полное число наблюдений A00) и нашу оценку \х (ц —2,59). (Заметьте, что поскольку закон Пуассона полностью определяется заданием \х, нам не пришлось оценивать стандартное отклонение о. В самом деле, так как о = л/ц, то наша оценка ц автоматически дает нам оценку о.) Следовательно, имеются две связи, которые для шести бинов приводят к четырем степеням свободы d = 4. Простой расчет, в котором используются числа из двух последних столбцов табл. 12.9, дает для приведенного значе- значения %2 в Так как это значение меньше единицы, то мы можем сразу же сделать вывод, что согласие между нашими наблюдениями и ожидаемым распределением Пуассона удовлетворительно. Более точно, из таблицы приложения Г видно, что значение >;2, равное 0,35, весьма вероятно; действительно, Р4 (%2^ ^ 0,35) « 85%. Таким образом, наш эксперимент не дает аб- абсолютно никаких оснований сомневаться в ожидаемом рас- распределении Пуассона. Значение %2 — 0,35, полученное в этом эксперименте, дей- действительно значительно меньше, чем 1; это свидетельствует
Критерий х2 Для распределений 243 о том, что наши наблюдения очень хорошо удовлетворяют распределению Пуассона. Однако это малое значение не мо- может служить более строгим свидетельством того, что наши результаты измерений распределены по ожидаемому закону, по сравнению с тем, что давало бы значение %2 « 1. Если ре- результаты действительно распределены по ожидаемому закону и если бы мы могли повторить нашу серию измерений много раз, то мы должны были бы получить множество различных значений х2. флуктуирующих относительно среднего значе- значения 1. Таким образом, если результаты распределены в соот- соответствии с ожидаемым распределением, то значение %2 = = 0,35— результат очень вероятной флуктуации относительно ожидаемого среднего значения. Оно никоим образом не дает лишних подтверждений для нашего вывода о том, что резуль- результаты наших измерений действительно распределены по ожи- ожидаемому закону. Разобравшись в этих трех примерах, вы не должны испы- испытывать затруднений в применении критерия %2 к любой за- задаче, с которой можно встретиться в лаборатории вводного курса физики. Некоторые дополнительные примеры можно найти среди предлагаемых ниже задач. Вам, безусловно, сле- следует проверить уровень вашего понимания, пробуя решать не- некоторые из них. Задачи Напоминание: звездочка у номера задачи означает, что задача реша- решается или ее ответ приводится в разделе «Ответы» в конце книги. * 12.1 (разд. 12.1). Каждому студенту в группе из 50 человек дали по кусочку одного и того же металла (по крайней мере, им было сказано, что это один и тот же металл) и попросили определить его плотность. По 50 результатам были рассчитаны среднее р и стандартное отклонение (Тр, и затем было решено проверить, подчиняются ли результаты измере- измерений нормальному распределению. С этой целью данные измерений были распределены по четырем бинам с границами при р — стр> р и о +<jp Полученные результаты приведены в табл. 12.10. Предполагая, что результаты измерений распределены нормально с центром р и шириной стр, рассчитайте числа Ek результатов измерений, ожидаемых в каждом бине. Затем вычислите %2. Подчиняются ли резуль- результаты измерений нормальному распределению? Таблица 12.10 Бин k Значения р в бине Числа наблюдений Ofe в бине 1 Меньше р — стр 12 2 Между р — Стр и р 13 3 Между р и р + Стр 11 4 Больше р + Стр 14
244 Таблица 12.11 Номер выпавшей грани k Числа наблюдений Oj Глава 12 1 20 2 46 3 35 4 45 5 42 6 52 12.2 (разд. 12.1). В задаче 4.7 приведены 30 результатов измерений времени t, их среднее I = 8,15 с и стандартное отклонение at = 0,04 с. Распределите данные по четырем бинам с границами при t — at, I и t + at и определите числа наблюдений Ok для каждого бина k = 1, 2, 3, 4. Предполагая, что результаты измерений распределены нормально с цен- центром t и шириной at, найдите ожидаемые числа ?"* для каждого бина. Вычислите х2. Имеются ли основания сомневаться в том, что результаты измерений распределены нормально? 12.3 (разд. 12.2). Игрок решает проверить игральную кость, бросая ее 240 раз. В каждом броске может реализоваться одни из шести возмож- возможных исходов (k = 1, 2, ..., 6, где k — номер выпавшей грани); распре- распределение результатов его бросаний приведено в табл. 12.11. Чему равны ожидаемые числа наблюдений Ek в предположении, что игральная кость подлинная? Рассматривая результат для каждой грани как отдельный бин, вычислите х2- Представляется ли вероятным, что кость утяжелена? *12.4 (разд. 12.2). Три игральные кости бросают 400 раз, наблюдают число шестерок, выпавших в каждом броске, и получают результаты, при- приведенные в табл. 12.12. Предполагая, что кости подлинные, рассчитайте ожидаемые числа ?<, для каждого из трех бинов. (Необходимые вероят- вероятности— биномиальные вероятности, рассмотренные в разд. 10.2). Вычис- Вычислите х2- Имеются ли основания подозревать, что кости утяжелены? *12.5 (разд. 12.3). а. Для каждой из задач от 12.1 по 12.4 найдите число связей с и число степеней свободы d. б. Предположим, что в задаче 12.1 принятое значение рПр плотности известно и мы решили проверить гипотезу о том, что результаты подчиняются нормальному распределению с центром рПр. В случае этого испытания сколько имеется связей и каково число степеней свободы? *12.6 (разд. 12.4). По данным задачи 12.1 вычислите приведенное значение %2. Если бы результаты измерений были распределены нормаль- нормально, какова была бы вероятность получения значения х8, столь же боль- большого или даже большего? На 5 %-ном уровне значимости можете ли вы отвергнуть гипотезу о том, что результаты измерений были распределены нормально? А на 1 %-ном уровне? (Нужные вероятности найдите в при- приложении Г.) 12.7 (разд. 12.4). В задаче 12.2 можете ли вы отвергнуть предположе- предположение о нормальном распределении на 5 %-ном или на 1 %-ном уровне зна- значимости? (Нужные вероятности найдите в приложении Г.) Таблица 12.12 Результат Бнн k Числа наблюдений Ofe Ни одной шестерки Одна шестерка Две или три шестерки 1 2 3 217 148 35
Таблица 12.13 Сумма Числа наблюдений Критерий х2 2 3 6 14 дли 4 23 распределений 5 6 7 35 57 50 8 44 9 49 10 39 11 27 24t 12 16 *12.8 (разд. 12.5). Пара игральных костей бросается 360 раз, и для каждого броска регистрируется суммарное число выпавших очков. Воз- -можные значения суммы равны 2, 3 12, и их числа наблюдений .приведены в табл. 12.13. Рассчитайте вероятность для каждой суммы и, следовательно, ожидае- ожидаемые числа ее появления (предполагая, что кости подлинные). Вычислите X2' d и х2 = х2/^- Предполагая, что кости подлинные, найдите, какова вероятность получения значения %2, равного найденному, или большего. На 5 % -ном уровне значимости можете ли вы отвергнуть гипотезу о том, что косги подлинные? А иа 1 %-ном уровне? (Нужные вероятности най- найдите в приложении Г.) 12.9 (разд. 12.5). Для задачи 12.3 найдите значение хг- Можем ли мы сделать вывод о том, что игральная кость утяжелена на 5 %-ном уровне значимости? А на 1 %-ном уровне? (Нужные вероятности найдите в при- приложении Г.) *12.10 (разд. 12.5). Чему равно значение х2 в задаче 12.4? Если иг- игральные кости действительно подлинные, то какова вероятность получения значения %1, равного найденному, или большего? Объясните, позволяют ли результаты предположить, что кости утяжелены? (Нужные вероятности найдите в приложении Г.) 12.11 (разд. 12.5). Вычислите х2 п° данным задачи 11.5, предполагая, •что результаты наблюдений должны быть распределены по закону Пуас- Пуассона со средним числом отсчетов ц = 3. (Сгруппируйте все данные для v>6b один бии.) Сколько имеется степеней свободы? (Не забудьте, что число ц было даио заранее, а не вычислялось по данным.) Чему равно х2? Согласуются ли данные с ожидаемым распределением Пуассона? (Нужные вероятности найдите в приложении Г.) *12.12 (разд. 12.5). а. Утверждается, что в некотором образце радиоактивного вещества происходят в среднем два распада в минуту. Чтобы проверить это, студент измеряет число распадов в 40 отдельных одноминутных интервалах и получает результаты, приведенные в табл. 12.14. Если распады происходят в соответствии с распределением Пуассона с ц = 2, то какие ожидаемые числа наблюдений обнару- обнаружит студент? (Сгруппируйте все данные с v ^ 3 в один бин.) Вы- Вычислите х2. d и х2 = Х2/^ (не забудьте, что число р, не вычислялось из данных). На 5 %-ном уровне значимости отвергаете ли вы гипо- гипотезу о том, что в образце происходят распады в соответствии с законом Пуассона с ц = 2? б. Студент замечает, что фактически среднее значение результатов равно v=l,35, и поэтому решает проверить, подчиняются ли его данные распределению Пуассона с |i= 1,35. Каковы в этом слу- случае значения d и х2? Согласуются ли данные с этой новой гипо- гипотезой? Таблица 12.14 Число распадов v 0 12 3 4 5 или больше Числа наблюдений 11 12 11 4 2 0
246 Глава 12 *12.13 (разд. 12.5). В гл. 10 мы обсудили метод испытания гипотез на основе биномиального распределения. Мы рассматривали п попыток, каж- каждую с двумя исходами: выигрышем (с вероятностью р) и проигрышем (с вероятностью 1—р). Затем мы проверяли, совместимо ли полученное число выигрышей v с некоторым принятым значением р. Если рассматри- рассматриваемые числа достаточно велики, мы можем рассматривать эту же самую- задачу с помощью критерия х2> используя два бина: 4=1 в случае вы- выигрыша и 4 = 2 в случае проигрыша и одну степень свободы. В после- последующем мы будем использовать оба метода и сравним их результаты. Если числа велики, то вы получите отличное согласие, если же числа малы, то согласие будет менее удовлетворительным, но все же достаточна хорошим, чтобы утверждать, что метод х2 очень полезен и чувствителен. а. Производитель супов считает, что он может вводить различные до- добавки из теста в свои порошковые куриные супы, не оказывая влия- влияния на их спрос. Чтобы проверить эту гипотезу, он изготавливает 16 пакетиков, помеченных «рецепт X» и содержащих новую смесь,. и 16 пакетиков, помеченных «рецепт У» и содержащих старый со- состав. Затем он рассылает по одному пакетику каждого состава 16 дегустаторам и спрашивает их, какой состав предпочтительнее. Если его гипотеза верна, то мы должны были бы ожидать, что восемь дегустаторов предпочтут X и восемь — У. Фактически число дегустаторов, которые предпочли X, оказалось равным v= 11. Вы- Вычислите х2 и вероятность получения значения не меньшего, чем вычисленное. Указывает ли испытание на значимую разницу между двумя видами смесей? Затем вычислите соответствующие вероятно- вероятности точно с помощью биномиального распределения и сравните- ваши результаты. Заметьте, что критерий х2 использует отклонения в обе стороны от ожидаемых чисел. Следовательно, для такого сравнения вы должны вычислять «двухвостовую» вероятность для значений v, отличающихся от восьми на три или более в любую- сторону, т. е. как для v = 11, 12, ..., 16, так и для v = 5, 4, ..., 1. б. Повторите задание «а» для следующего испытания, когда произво- производитель изготавливает по 400 пакетиков каждой смеси, а число- предпочитающих X равно 225. (При расчете биномиальных вероят- вероятностей используйте гауссову аппроксимацию.) г» В случае «а» числа довольно малы, так что критерий %2 оказался весьма приближенным. (Он давал вероятность 14 % по сравнению с правильным значением 21,0 %.) В случае одной степени свободы мы можем немного улучшить критерий %2, заменяя его «модифици- «модифицированным х2», определяемым как 2 модифицированный X2—/ ——* ё^ ё^ ^—. Вычислите «модифицированный %Ъ для данных задания «а» и по- покажите, что использование его значения (вместо обычного х2) ПРИ нахождении вероятности в таблице приложения Г даст более точ- точное приближение >). 12.14 (разд. 12.5). Критерий х2 может быть использован для про- проверки того, насколько хорошо набор измерений (xi, yt) двух переменных аппроксимируется ожидаемой зависимостью у = f(x) при условии, что по- ') Мы не обосновали здесь понятие «модифицированный х2*> но этот пример действительно показывает его преимущества Подробности см в книге Alder H. L, Roessler E. В., Introduction to Probability and Statistics, Freeman, 1977, p. 263.
Таблица 12.15 Критерий х (погрешность пренебрежимо tj (для всех значений ±4) X2 для мала) распределений 1 60 2 56 3 71 4 66 247 5 86 грешности хорошо известны. Предположим, что у и х связаны линейной зависимостью y = f(x) = A + Bx. A2.19) {Например, у может быть длиной металлического прута, ах — его темпе- температурой.) Предположим, что, согласно теоретическим предсказаниям, А и В имеют значения, равные А = 50 и В = 6, и что пять измерений х и у дали результаты, приведенные в табл. 12.15. Погрешность, приведенная для у, — стандартное отклонение, т. е. все пять результатов измерений у имеют одно и то же стандартное отклонение О = 4. Составьте таблицу полученных и ожидаемых значений yt и вычис- вычислите %г по формуле Поскольку ни один из параметров не оценивается по данным, связей нет и, следовательно, будет пять степеней свободы. Вычислите %2 и по таблице приложения Г определите вероятность получения значения %2 такой вели- величины, предполагая, что у действительно удовлетворяет зависимости A2.19). На 5 %-ном уровне отвергнете ли вы ожидаемую зависимость A2.19)? (Если бы постоянные А и В не были известны заранее, то пришлось бы рассчитать их по данным методом наименьших квадратов. Затем можно было бы продолжать, как и прежде, но в этом случае было бы уже только три степени свободы.)
приложения Приложение А Интеграл ошибок. I Если результат измерения непрерывной переменной х под- подвержен влиянию множества небольших случайных ошибок, т» ожидаемое распределение результатов будет нормальным, или гауссовым, распределением f v (х) = 1- е ~(дс ~ Х)!/2а' a V2n где X есть истинное значение х, а о — стандартное отклонение» Интеграл от функции нормального распределения ь \ fx,o(x)dx называется интегралом ошибок и определяет ве- а роятность того, что результат измерения окажется между х = а и х = Ь, ь В табл. А приведены значения этого интеграла для а = X — ta и Ь = X + to. Онн определяют вероятность того, что резуль- результат окажется в пределах / стандартных отклонений в любук> сторону от X: Р (в пределах to) — Р {X — ta < х < X + to) == X+ta Х-to t •д/2я -t Эту функцию иногда обозначают erf(/), но такое обозначение используется также и для несколько отличающейся функции.
Интеграл ошибок. I 249 Таблица А. Вероитность, выражениям я 1» *= процентах, (в пределах to) = x+ta \ '« x~ta „ (х) dx, как функция t Л 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 0,03 0,00 7,97 15,85 23,58 31,08 38,29 45,15 51,61 57,63 63,19 68,27 72,87 76,99 80,64 83,85 86,64 89,04 91,09 92,81 94,26 95,45 96,43 97,22 97,86 98,36 98,76 99,07 99,31 99,49 99,63 0,01 0,80 8,76 16,63 24,34 31,82 38,99 45,81 52,23 58,21 63,72 68,75 73,30 77,37 80,98 84,15 86,90 89,26 91,27 92,97 94,39 95,56 96,51 97,29 97,91 98,40 98,79 99,09 99,33 99,50 99,64 0,02 1,60 9,55 17,41 25,10 32,55 39,69 46,47 52,85 58,78 64,24 69,23 73,73 77,75 81,32 84,44 87,15 89,48 91,46 93,12 94,51 95,66 96,60 97,36 97,97 98,45 98,83 99,12 99,35 99,52 99,65 0,03 2,39 10,34 18,19 25,86 33,28 40,39 47,13 53,46 59,35 64,76 69,70 74,15 78,13 81,65 84,73 87,40 89,69 91,64 93,28 94,64 95,76 96,68 97,43 98,02 98,49 98,86 99,15 99,37 99,53 99,66 ——' x-ts- 0,04 3,19 11,13 18,97 26,61 34,01 41,08 47,78 54,07 59,91 65,28 70,17 74,57 78,50 81,98 85,01 87,64 89,90 91,81 93,42 94,76 95,86 96,76 97,49 98,07 98,53 98,89 99,17 99,39 99,55 99,67 0,05 3,99 11,92 19,74 27,37 34,73 41,77 48,43 54,67 60,47 65,79 70,63 74,99 78,87 82,30 85,29 87,89 90,11 91,99 93,57 94,88 95,96 96,84 97,56 98,12 98,57 98,92 99,20 99,40 99,56 99,68 HP К 0,06 4,78 12,71 20,51 28,12 35,45 42,45 49,07 55,27 61,02 66,29 71,09 75,40 79,23 82,62 85,57 88,12 90,31 92,16 93,71 95,00 96,06 96,92 97,62 98,17 98,61 98,95 99,22 99,42 99,58 99,69 УУУУУУЛ A+tff 0,07 5,58 13,50 21,28 28,86 36,16 43,13 49,71 55,87 61,57 66,80 71,54 75,80 79,59 82,93 85,84 88,36 90,51 92,33 93,85 95,12 96,15 97,00 97,68 98,22 98,65 98,98 99,24 99,44 99,59 99,70 0,08 6,38 14,28 22,05 29,61 36,88 43,81 50,35 56,46 62,11 67,29 71,99 76,20 79,95 83,24 86,11 88,59 90,70 92,49 93,99 95,23 96,25 97,07 97,74 98,27 98,69 99,01 99,26 99,46 99,60 99,71 0,09 7,17 15,07 22,82 30,35 37,59 44,48 50,98 57,05 62,65 67,78 72,43 76,60 80,29 83,55 86,38 88,82 90,90 92,65 94,12 95,34 96,34 97,15 97,80 98,32 98,72 99,04 99,29 99,47 99,61 99,72
250 t 0,00 0,01 0,02 Приложение 0,03 0,04 A 0,05 П родолжение 0,06 0.07 0,08 табл А 0,09 3,0 99,73 - 3,5 99,95 - 4,0 99,994 - 4,5 99,9993 - 5,0 99,99994 - Вероятность того, что результат измерения окажется вне этого же интервала, можно найти с помощью вычитания: Я (вне to) = 100 % — Р(ъ пределах to). Дополнительные сведения вы найдете в разд. 5.4 и в прило- приложении Б.
Приложение Б Интеграл ошибок. II В некоторых расчетах удобной формой интеграла ошибок является следующая: X + ta Q(t)= л/2л X X+ttT (Этот интеграл, конечно, равен половине значения интеграла, табулированного в приложении А.) Вероятность Р (а ^ х ^ Ь) того, что результат измерения окажется в любом интервале а ^ х ^ Ь, можно найти по значению Q(t) с помощью одного вычитания или сложения. Например, Х+2сг Аналогично = QB) Ш Л Х+<? Вероятность того, что результат измерения окажется больше, чем любое X + ta, равна 0,5 — Q(t). Например, = 5O°/o-Q(l). l^W Л Х+6-
•гяч Таблица Б. Вероятность выраженная r О @ как t 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1^ 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,5 4,0 4,5 5,0 X+ta =]"¦ функция t 0,00 0,00 3,98 7,93 11,79 15,54 19,15 22,57 25,80 28,81 31,59 34,13 36,43 38,49 40,32 41,92 43,32 44,52 45,54 46,41 47,13 47,72 48,21 48,61 48,93 49,18 49,38 49,53 49,65 49,74 49,81 49,87 49,98 49,997 49,9997 49,99997 ПО О ПА "ITelX. 0 (*) dx 0,01 0,40 4,38 8,32 12,17 15,91 19,50 22,91 26,11 29,10 31,86 34,38 36,65 38,69 40,49 42,07 43,45 44,63 45,64 46,49 47,19 47,78 48,26 48,64 48,96 49,20 49,40 49,55 49,66 49,75 49,82 — — — — — 0,02 0,80 4,78 8,71 12,55 16,28 19,85 23,24 26,42 29,39 32,12 34,61 36,86 38,88 40,66 42,22 43,57 44,74 45,73 46,56 47,26 47,83 48,30 48,68 48,98 49,22 49,41 49,56 49,67 49,76 49,82 — — — — — Приложение 0,03 1,20 5,17 9,10 12,93 16,64 20,19 23,57 26,73 29,67 32,38 34,85 37,08 39,07 40,82 42,36 43,70 44,84 45,82 46,64 47,32 47,88 48,34 48,71 49,01 49,25 49,43 49,57 49,68 49,77 49,83 — — — — — 0.04 1,60 5,57 9,48 13,31 17,00 20,54 23,89 27,04 29,95 32,64 35,08 37,29 39,25 40,99 42,51 43,82 44,95 45,91 46,71 47,38 47,93 48,38 48,75 49,04 49,27 49,45 49,59 49,69 49,77 49,84 — — — — — Б "*" 0,05 1,99 5,% 9,87 13,68 17,36 20,88 24,22 27,34 30,23 32,89 35,31 37,49 39,44 41,15 42,65 43,94 45,05 45,99 46,78 47,44 47,98 48,42 48,78 49,06 49,29 49,46 49.60 49,70 49,78 49,84 — — — — — Л 0,06 2,39 6,36 10,26 14,06 17,72 21,23 24,54 27,64 30,51 33,15 35,54 37,70 39,62 41,31 42,79 44,06 45,15 46,08 46,86 47,50 48,03 48,46 48,81 49,09 49,31 49,48 49,61 49,71 49,79 49,85 — — — — — ^^ 0,07 2,79 6,75 10,64 14,43 18,08 21,57 24,86 27,94 30,78 33,40 35,77 37,90 39,80 41,47 42,92 44,18 45,25 46,16 46,93 47,56 48,08 48,50 48,84 49,11 49,32 49,49 49,62 49,72 49,79 49,85 — — — — — 0,08 3,19 7,14 11,03 14,80 18,44 21,90 25,17 28,23 31,06 33,65 35,99 38,10 39,97 41,62 43,06 44,29 45,35 46,25 46,99 47,61 48,12 48,54 48,87 49,13 49,34 49,51 49,63 49,73 49,80 49,86 — — — — — 009 3,59 7,5а 11,41 15,17 18,79 22,24 25,49 28,52 31,за 33,8» 36,21 38,30> 40, IS 41,77 43,19 44,41 45,45 46,3а 47,06- 47,67 48,17 48,57 48,90 49,16 49,36 49,52 49,64 49,74 49,81 49,86 — — — _ —
Приложение В Вероятности коэффициентов корреляции Степень, с которой N точек (xuyi), ..., {xN,yN) аппрокси- аппроксимируются прямой линией, определяется коэффициентом ли- линейной корреляции: Z (xi ~ *) («i ~ У) г ^ который всегда лежит в интервале —1 =sC r =sC 1. Значения г, близкие к ±1, означают высокую степень линейной корреля- корреляции; значения, близкие к 0, указывают на небольшую корре- корреляцию или на ее отсутствие. Количественная мера аппроксимации может быть получена с помощью табл. В. Для любого определенного ro Ря(|/"|=3= ^\го\) есть вероятность того, что результаты N измерений двух некоррелированных переменных будут иметь коэффи- коэффициент корреляции г, не меньший чем г0. Таким образом, если мы получим коэффициент г0, для которого вероятность ¦Pw(|r| ^ \го\) мала, то невероятно, чтобы наши переменные были некоррелированными, т. е. корреляция существует. В ча- частности, если Рц{\г\ :> jГо| )<| 5%, корреляция называется значимой, если эта вероятность меньше 1%, то корреляция называется высокозначимой. Например, вероятность того, что результаты 20 измерений (N = 20) двух некоррелированных переменных дадут \r\ ^ 0,5, определяется таблицей в 2,5%- Таким образом, если бы ре- результаты 20 измерений дали г = 0,5, то у нас было бы зна- значимое доказательство линейной корреляции между двумя пе- переменными. Дополнительные сведения вы найдете в разд. 9.3—9.5. Значения, приведенные в табл. В, были вычислены по фор- формуле Для справок, см., например, Pugh Е. М. Winslow G. Н., The Analysis of Physical Measurements, 9, Addison-Wesley, 1966, Sect. 12.8.
254 Приложение В Таблица В. Выраженная в процентах вероятность PN (J г | ^ I ro j того, что результаты N измерений двух некоррелированных переменных дадут коэффициент корреляции |г|^|го|, как функция N и г0. (Прочерки указывают на вероятности, которые меньше 0,05%.) 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100 0 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 0 100 100 100 100 100 100 0.1 94 90 87 85 83 81 80 78 77 76 75 73 72 71 70 69 68 67 63 60 57 54 51 0,05 73 70 68 66 64 62 0,2 87 80 75 70 67 63 61 58 56 53 51 49 47 46 44 43 41 40 34 29 25 22 19 0,1 49 45 41 38 35 32 0,3 81 70 62 56 51 47 43 40 37 34 32 30 28 26 24 23 21 20 15 11 8,0 6,0 4,5 0,13 30 25 22 18 16 14 го 0,4 74 60 50 43 37 33 29 25 22 20 18 16 14 12 11 10 9,0 8,1 4,8 2,9 1,7 1,1 0,6 0,2 16 13 9,7 7,5 5,9 4,6 0,5 67 50 39 31 25 21 17 14 12 9,8 8,2 6,9 5,8 4,9 4,1 3,5 2,9 2,5 1,1 0,5 0,2 0,1 0,6 59 40 28 21 15 12 8,8 6,7 5,1 3,9 3,0 2,3 1,8 1,4 1,1 0,8 0,7 0,5 0,2 — — — — 0,25 8,0 5,4 3,7 2,5 1,7 1,2 0,7 51 30 19 12 8,0 5,3 3,6 2,4 1,6 1,1 0,8 0,5 0,4 0,3 0,2 0,1 0,1 0,1 — — — — — 0,3 3,4 2,0 1,2 0,7 0,4 0,2 0,8 41 20 10 5,6 3,1 1,7 1,0 0,5 0,3 0,2 0,1 0,1 — — — — — — — — — — — 0,3 j 1,3 0,6 0,3 0,1 0,1 •— 0,9 29 10 3,7 1,4 0,6 0,2 0,1 — — — — — — — — — — — — — — — 0,4 0,4 0,2 0,1 — - i 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0,45 0,1 — — — -
Приложение Г Вероятности для %2 Если результаты серии измерений распределены по k би- нам, где k= 1 п, то через Ок мы обозначим число на- наблюдений, попавших в бин k. Ожидаемое число (полученное на основе некоторого предположенного или ожидаемого рас- распределения) результатов в бине k обозначается Ек. Степень, с которой результаты наблюдений аппроксимируются пред- предполагаемым распределением, характеризуется приведенным значением %2, определяемым как Y2=— У (Ok k-l где d есть число степеней свободы, равное d — п — с, а с — число связей (см. разд. 12.3). Ожидаемое среднее значение X2 равно 1. Если %2 ^> 1, то результаты наблюдений не согла- согласуются с предполагаемым распределением; если %2 .^. 1, то согласие удовлетворительное. Этот критерий становится количественным благодаря ве- вероятностям, приведенным в табл. Г. Пусть %20 обозначает зна- значение х2. фактически полученное в эксперименте с 4 степенями свободы. Число Ра(%2^Х2о) есть вероятность получения зна- значения %2 не меньшего, чем полученное %2о, если результаты измерений действительно распределены в соответствии с пред- предположенным законом. Таким образом, если Pd(%2^%l) ве~ лика, то полученное и ожидаемое распределения согласуются; если эта вероятность мала, то они, по-видимому, различают- различаются. В частности, если Pd(%2^X20) меньше 5%, мы говорим, что расхождение значимо, и отвергаем предположенное рас- распределение на 5%-ном уровне. Если эта вероятность меньше 1 %, расхождение называется высокозначимым и мы отвер- отвергаем предположенное распределение на 1%-ном уровне. Например, предположим, что мы получили для приведен- приведенного значения %2 2,6 (т. е. %20 = 2,6) в эксперименте с шестью степенями свободы (d = 6). В соответствии с табл. Г
256 Приложение Г Таблица Г. Выраженная в процентах вероятность ''d ( X2 )> Ic^) получения значения X ;> Х2О в эксперименте с d степенями свободы как функция d и 12О. (Прочерки указывают на значения вероятности, которые меньше 0,05%.) d 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 0 100 100 100 100 100 0 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 0,5 48 61 68 74 78 1,0 32 37 ЗЭ 41 42 0,2 0,4 65 82 90 94 96 98 99 99 99 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 53 67 75 81 85 88 90 92 94 95 96 96 97 98 98 98 99 99 99 99 99 100 100 100 100 1,5 22 22 21 20 19 0,6 44 55 61 66 70 73 76 78 80 82 83 84 86 87 83 89 90 90 91 92 93 94 95 95 96 2,0 16 14 11 9,2 7,5 0,8 37 45 49 52 55 57 59 60 62 63 64 65 66 67 63 69 70 70 71 72 73 74 75 76 77 2,5 11 8,2 5,8 4,0 2,9 1,0 32 37 39 41 42 42 43 43 44 44 44 45 45 45 45 45 45 46 46 46 46 46 46 46 47 3,0 8,3 5,0 2,9 1,7 1,0 1,2 27 30 31 31 31 30 30 29 29 29 28 28 27 27 26 26 25 25 25 24 23 23 22 21 21 Х2о 3,5 6,1 3,0 1,5 0,7 0,4 1,4 24 25 24 23 22 21 20 19 18 17 16 16 15 14 14 13 12 12 11 11 10 9,2 8,5 7,8 7,2 4,0 4,6 1,8 0,7 0,3 0,1 l,t 21 20 19 17 16 14 13 12 11 10 9,1 8,4 7,7 7,1 6,5 6,0 5,5 5,1 4,7 4,3 3,7 3,2 2,7 2,3 2,0 4,5 5Д 3 1 0 0 1.8 18 17 14 13 11 9,5 8,2 7,2 6,3 5,5 4,8 4,2 3,7 3,3 2,9 2,5 2,2 2,0 1,7 1,5 1,2 0,9 0,7 0,6 0,5 ,4 2, Л 0, ,4 0, ,1 0, 2,0 16 14 11 92 7,5 6,2 5,1 4,2 3,5 2,9 2,4 2,0 1,7 1,4 1,2 1,0 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,1 ) ! 5 7 ,2 ,1 2,2 14 11 8,6 66 5,1 4,0 3,1 2,4 1,9 1,5 1,2 0,9 0,7 0,6 0,5 0,4 0,3 0,2 0,2 0,1 0,1 0,1 — — 5,5 1,9 0,4 0,1 — — 2,4 12 9,1 6,6 48 3,5 2,5 1,9 1,4 1,0 0,8 0,6 0,4 0,3 0,2 0,2 0,1 0,1 0,1 0,1 — — — — — 6,0 1,4 0,2 — — — 2.6 11 7,4 5,0 3 4 2,3 1,6 1,1 0,8 0,5 0,4 0,3 0,2 0,1 0,1 0,1 — — — — — — — — — 8,0 0,5 — — — — 2,8 9,4 6,1 3,8 9,4 1,6 1,0 0,7 0,4 0,3 0,2 0,1 0,1 0,1 — — — — — — — — — — — 10,0 0,2 — — — — 3,0 8,3 5,0 2,9 1 7 1,0 0,6 0,4 0,2 0,1 0,1 0,1 — — — — — — — — — — — — —
Библиография 257 вероятность получения %2 ^ 2,6 составляет 1,6%, если резуль- результаты измерений распределены в соответствии с предположен- предположенным законом. Таким образом, на 5% -ном уровне (но не на 1%-ном) мы отвергли бы предположенное распределение. До- Дополнительные сведения вы найдете в гл. 12. Значения, представленные в табл. Г, были рассчитаны по формуле Хо Для справок см., например, Pugh Е. М., Winslow G. Н., The Analysis of Physical Measurements, Addison-Wesley, 1966. Sect 12.5.
БИБЛИОГРАФИЯ Следующие книги я счел полезными. Они приводятся в порядке, при* близительно соответствующем их математическому уровню н степени охва- охвата материала. Исключительно ясное введение в статистические методы, в котором автор сумел обойтись без помощи математического анализа, дано в книге Lacy О. L, Statistical Methods in Experimentation, MacMillan, 1953. Книга по статистике более высокого уровня, но также очень понятная н в которой тоже не используются методы математического анализа, Al- Alder Н. L., Roessler Е. В., Introduction to Probability and Statistics, Free- Freeman, 1977. Следующие три книги написаны приблизительно на том же уровне, что и данная книга, и охватывают в основном тот же материал: Baird D. С, Experimentation; An Introduction to Measurement Theory and Experiment Design, Prentice Hall, 1962. Barford N. C, Experimental Measurements; Precision, Error, and Truth, Addison-Wesley, 1967. Young H. D., Statistical Treatment of Experimental Data, McGraw-Hill. 1962. Многочисленные другие вопросы и выводы формул можно найти в следующих книгах более высокого уровня: Bevington P. R., Data Reduction and Error Analysis for the Physical Sci- Sciences, McGraw-Hill, 1969. Чеуег S. L., Statistical Treatment of Experimental Data, John Wiley, 1975, Pugh E. M., Winslow G. H., The Analysis of Physical Measurements, Addl- son-Wesley, 1966. ЛИТЕРАТУРА, ДОБАВЛЕННАЯ ПРИ ПЕРЕВОДЕ Следующие книги предназначены для студентов младших курсов. 1. Цеденко Л. Г., Керженцев В. В. Математическая обработка и оформление результатов эксперимента. — М.: Изд-во МГУ, 1977. 2. Соловьев В. А., Яхонтова В. Е. Элементарные методы обработки результатов. — Л.: Изд-во ЛГУ, 1977. 3. Зайдель А. Н. Ошибки измерений физических величин. — Л.: Наука, 1974. 4. Кассандрова О. Н., Лебедев В. В. Обработка результатов измере- измерений. — М.: Наука, 1970. 5. Свешников А. А. Основы теории ошибок. — Л.: Изд-во ЛГУ, 1972. 6. Сквайре Дж. Практическая физика. — М.: Мир, 1971. Следующие книги полезны для старшекурсников 7. Пытьев Ю. П., Шишмарев И. А. Курс теории вероятностей и ма- математической статистики для физиков. — М.: Изд-во МГУ, 1983. 8. Гришин В. К. Статистические методы анализа н планирования экс периментов. — М.: Изд-во МГУ, 1975.
ОТВЕТЫ К ИЗБРАННЫМ ЗАДАЧАМ Замечание о числе значащих цифр: небольшие различия в последней значащей цифре могут быть обусловлены использованием различных спо- способов округления, и они (различия) обычно не важны. В случае задач из гл. 2 и 3 приведенные ниже погрешности были получены наиболее грубым возможным способом, когда производится округление до одной значащей цифры на каждом этапе вычислений. В небольшом числе случаев, когда более строгие вычисления дают другой ответ, точный ответ, соответствую- соответствующим образом округленный после всех вычислений, указывается