Text
                    


Н. А. ПЛОХИНСКИЙ БИОМЕТРИЯ 2-е издание Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студен- тов биологических специальностей университетов ИЗДАТЕЛЬСТВО МОСКОВСКОГО УНИВЕРСИТЕТА 1970
УДК 578.087.1 2-2-4 191-69
ВВЕДЕНИЕ Современная биология не может развиваться -без математической помощи. Математика требуется прежде всего при описании биологических множеств, таксономических разделов, популяций, штампов, сортов, по- род, линий, посевов, стад, подопытных групп. Математика необходима для исчерпывающего извлечения информа- ции о типичных объектах, разнообразии их, структуре этого разнообра- зия, о системах биологических взаимоотношений и взаимодействий, о разных биоценозах, о влияниях разных факторов на биологические объекты, развивающиеся в различных условиях. Чем обширнее и глубже вскрываются эти явления, тем большую силу получает человек при использовании природных богатств и, главное, при направленных преоб- разованиях живой йрироды. Некоторые биологические ’вопросы не могут быть решены без при- менения специальных математических методов. К таким вопросам отно- сятся сравнение выборочных групп по изучаемым показателям и опре- деление достоверности результатов такого сравнения с заданной вероят- ностью безошибочных прогнозов,‘определение достаточной численности подопытных объектов, измерение силы влияния различных факторов на биологические процессы и явления, разработка формул и номограмм для практического использования зависимостей между основными и сигнальными признаками и, наконец, разработка алгоритмов для авто- матизации диагнозов и прогнозов в биологии, сельском хозяйстве и ме- дицине при помощи электронных счетно-решающих машин. Имеются такие задачи современной биологии,, которые не только не могут быть решены без математики, но и трудно понимаемы без соответ- ствующей математической подготовки. Например, очень глубокое и цен- ное понятие о наследуемости без знания основ дисперсионного анализа обычно воспринимается с большим трудом, далеко не всегда правильно, что часто приводит к ошибочным выводам и неподтверждающимся про- гнозам как в теории, так и на практике. Новейшие вопросы биологической теории—-теория популяций, мате- матическое моделирование биологических процессов—не могли бы даже и возникнуть без разработки специальных математических методов. Современный биолог должен знать основы математики. Многолет- ний обширный опыт использования математики в биологии выявил, кро- ме того, и формы наиболее успешного сотрудничества между биологами и математиками и наиболее эффективный метод внедрения математики в биологию. 3
еще на заре советской биометрии в 1925 г. биолог академик А. С. Серебровский определял отношения биологии и математики сле- дующим образом (сборник «Статистический метод в научном исследо- вании». Издание Коммунистической академии, 1925). «Биолог должен оставаться прежде всего биологом и отнюдь не превращаться в математика. История статистических исследований в биологии показала, что только там, где исследуемый материал наряду с анализом-математическим подвергался интенсивному биологическому анализу — только там метод дал положительные результаты, продвинув биологов за границы доступного «невооруженному глазу». Безусловно, статистический метод получает права гражданства в биологических дис- циплинах. Это внедрение в новые для него области предъявляет само- му математическому методу новые требования, удовлетворить' которые должны сами математики. И можно не сомневаться в том, что подобное сотрудничество биологов с математиками принесет еще богатые плоды». Так же определенно по этому вопросу выступили в печати в 1966 г. советские математики, академики Н. Н. Боголюбов и М. А. Лаврентьев («Правда» от 15 августа 1966 г., № 277). «Современная техника ... требует не рядовых специалистов, а твор- ческих работников нового склада, способных охватывать весь путь от возникновения математической идеи до претворения ее в биологии, хи- мии, экономике и других областях и быстро «вживаться» в соответствую- щую проблему другой, науки. Именно такие математики смогут наиболее успешно реализовать связи с другими науками и осуществлять поиск новых областей применения математических методов и средств вычис- лительной техники». Опыт показал, что математика (если не считать простейшие мате- матические действия) обогащает биодогию только тогда, когда сливает- ся с ней в особой модифицированной форме, предназначенной для ре- шения биологических проблем. , Модификация состоит и в отборе уже имеющихся математических методов и подгонке их к решению биологических задач, и в разработке новых специальных методов и моделей, и в особом построении матема- тических алгоритмов, и, наконец, в усовершенствовании биоматематичё- ской терминологии и символики. . . Биология и математика образуют-не механическую смесь методов, а качественно новый сплав, в котором оба элемента начинают выступать единым мощным фронтом. На определенном этапе развития этого синте- за комплекс новых методов приобретает свои специфические отличЦя и выделяется в особую отрасль знаний. г На стыке биологии и математики зарождается новая синтетическая наука с собственным предметом изучения, с особыми основными мето- дами, особыми терминологией, символикой и специфическими задачами. Если отбросить очень неудачный термин «вариационная статистика», то лучше использовать для обозначения этой новой науки более подходя-/ щее название — «биометрия», принятое в настоящее время большин- ством биологов. Исходя из современного развития этой науки можно сформулировать следующее определение. Биометрия — это наука о статистическом анализе групповых свойств. ' в~бйблогйй'."Пбд статистическим* анализом7 в данном- случае подразуме- 'ваётся~опрёдёлй1ная совокупиость постулатов ji методов теории вероят- 'статистики, модифицированных в соответствии, "со" спецификой биологических" объектов, применительно к особенностям “^оЖгш'че£“1шХ"йКТёДЪТа11йи7."П' ~..." ' .... ' * “-“^йззпгаёМетёПМШётриёй'групповые свойства появляются только при 4
объединении биологических объектов в группы и без этого объединения не существуют. Групповые свойства не могут быть у отдельных объек- тов, поэтому эти свойства отличают группу как целое от простой суммы входящих в нее элементов. Биометрия изучает специфику не единичных явлений. Если получено измерёниё^рт^ам^’одной осо^'то’эта одна дата может иметь боль- шое значение и быть объектом изучения чисто биологических наук: ана- томии, гистологии, физиологии и т. д. Но эта одна дата не может стать объектом изучения биометрии: один объект —не группа. Биометрический анализ применим к любым неединичным явлениям^ объединённым в'группы любой численности, начиная с п=2. Из этого вовсе не следует, что современная биометрия обладает силой делать до- стоверные выводы при любом числе изученных объектов. В большин- стве случаев практически ценные прогнозы в биологии получаются на основе изучения достаточно больших групп. Но не исключена возмож- ность получения достоверных.результатов в некоторых исследованиях и на малочисленных группах. Эту возможность, конечно, не следует упус- кать, и устаревшее мнение о полной невозможности получить ценные результаты на малых группах следует отбросить. Групповые свойства' можно разделить на две категории: основные и сопряженные....« ' i Ц^“ЩПГовн:ым следует отнести четыре групповых свойства: (средний уровень признака, характерный для всей группы в целом; (разнообразие признака, т. е. неизбежная неодинаковость, большее или меньшее различие особей в группе по изучаемому признаку; (распределение признака, т. е. определенные соотношения в коли- чествах особей, имеющих различную величину признака; (репрезентативность, выборочных групп, дающая возможность на основе изучения относительно небольшой правильно выбранной группы объектов (выборки) получить достаточно точную характеристику и всей большой группы объектов изучаемой категории (генеральной сово-. купнбсти). < К сопряженным относятся такие...групповые свойства, которые появляются” вследствие" связи или сопряжения в развитии основных свойств. , 1 Сопряжение средних уровней двух одновременно изучаемых при- знаков состоит в том, что изменение средней по одному признаку, проис- ходит в большей или меньшей зависимости от изменения средней по вто- рому признаку. Это групповое явление получило название регрессии первого признака по второму, или второго, по первому. Измеряется рег- рессия особыми сводными показателями — коэффициентами и формула- ми регрессии. Особенно результативным в биологии оказалось учение о сопря- женном разнообразии, т. е. о зависимости степени и структуры разнооб- разия одного признака от степени и структуры разнообразия одновре- менно изучаемого другого признака. Это групповое явление получило название корреляции и измеряется различными коэффициентами про- стой, частной, сложной, прямолинейной и криволинейной корреляции. Особый вид сопряженного разнообразия выражается в форме влия- ния факторов, определяющих развитие признака, изучаемого в качестве функции этих факторов. Сила и достоверность таких влияний измеряется различными показателями дисперсионного анализа, имеющего для био- логических исследований особенно большое значение. Любое свойство биологических групп измеряется при помощи свод- ных показателей, которые должны быть названы определенным терми- 5
ном и обозначены своим символом. Казалось бы, для молодой биометрии проще всего заимствовать терминологию и символику из дружественной математики. Такие предложения иногда высказываются и биологами, и математиками. Первые же попытки сделать это показали, что такое перенесение совсем не так просто, как кажется с первого взгляда. Все дело в том, что в- математике нет твердо установленной терминологии и символики. Для громадного числа математических показателей не хватает'букв несколь- ких алфавитов. Поэтому математики вынуждены обозначать разные по- казатели одинаковыми символами: Например, распространенный символ М применяется в математике для обозначения и средней величины, и математического ожидания, и вариансы (среднего квадрата). Кроме того, специфика математических школ и направлений приво- дит к тому, .что один и тот же показатель обозначается разными симво- лами и получает разные названия. Обычная средняя арифметическая обозначается в математических работах более чем семью различными символами. Сумма .квадратов центральных отклонений имеет более де- вяти различных символов. Достоверность разности обозначается более чем шестью, а разнообразие признака более чем пятью различными математическими терминами. Одни авторы называют дисперсией сред- ний квадрат, другие эдим термином обозначают юумму квадратов, а средний квадрат называют девиатой или более распространенным тер- мином— вариансой (что и принято в настоящей книге). Некоторые математические термины для биологии оказываются слишком абстрактными и поэтому в отдельных случаях неприемлемыми. Результат первичного измерения в математике обозначается обоб- щенным термином «величина», или «переменная величина», «величина, принимающая разные значения», безотносительно к тому объекту, на / котором это измерение проведено. Для биологии приемлем более конкретный термин «значение приз- Щ®ка>ГЖЙ' «вёлйчин^ изучаемого' признак^»/ Т4мённ6~~это/~содёрж11ниё ' вкладывается "в“тёрмий“«дата'», т. е.результат, измерения определенного ’ 'п'р изОТка "у ’ бпр'ёд ёл ен н бгб "объёкт а’. . “ ‘ " ~ " ""Дакая'ТонкрётЙзацйя"термина'отражает существенное отличие био- логического мышления от чисто математического. Именно в биологии понятие признака получило полное развитие. Биология, используя био- метрию, по-разному изучает различные категории признаков: признаки количественные, поддающиеся точному измерению, — дли- на, ширина, объем, вес и т. д.; признаки количественные, неподдающиеся точному измерению, оце- ' ниваемые на глаз в баллах или каким-нибудь другим способом, — раз- витие экстерьерных статей, густота спермы и т. д.; признаки качественные, которые имеют только две степени прояв- ления— есть или нет — пол, мутация, болезнь и т..д.; признаки порядковые, которые никак не измеряются, но по степени развития которых объекты могут быть ранжированы, т. е. распределены в определенном порядке: цвет меха норок, злость бойцовых петухов, качество театральных постановок для лиц определенного возраста, пола и профессии, интенсивность окраски пера птиц и т. д. Некоторые термины становятся неудобными при перенесении их в биологию, так как здесь имеют совсем не то значение, которое им при- дают в математике. Например, неизбежное большее или меньшее разно- образие особей в группе по любому признаку, измеренному в один опре- деленный момент, называется обычно многими терминами: изменчивость, рассеяние, колеблемость, вариабильность и даже «разброс». Все эти 6
термины обозначают разные процессы и состояния, которые также мо- гут интересовать исследователя, но ни один из этих терминов не соот- ветствует сущности явления, заключающегося в том, что во всякой груп- пе биологические объекты неизбежно различны по любому признаку, 'единовременно измеренному. Наличие в группе особей, неодинаковых по весу — их разнообразие ло этому признаку — нельзя называть изменчивостью веса, так как это совсем другое понятие. Изменчивость генотипов нужно отлйчать от разнобразия генотипов в единовременно изученной группе. Рассеяние диких зверей по ареалу их обитания нельзя путать с их разнообразием. Колеблемость или вариа- бильность численности зайцев по годам нельзя обозначать тем словом, •которым обозначают -их разнообразие, например по величине шкурок в данном году. Разброс.пуль по мишени, разброс эритроцитов по клеткам счетной •камеры —термины вполне определенные и понятные. Но «разброс» уро- жаев, яйценоскости, ног рысаков по их длине, голов по объему, мозгов по силе биотоков становится термином, нелепым, грубо искажающим- сущность того явления, для которого это слово предназначается — на- личие в каждой группе неодинаковых, разнообразных объектов по лю- бому единовременно изучаемому признаку. Неприемлемы для биолога также и все те многочисленные термины (существенность, значимость, надежность, реальность, «разница есть», «разница достоверна, т. е. реальна»), которыми-в математических ра- ботах обозначается понятие о достаточно точном прогнозе величины и знака разности генеральных параметров. Обилие таких терминов сильно .дезориентирует биологов, скрывая от них громадные возможности науч- ных обобщений. Именно это обстоятельство и вызвало необходимость выделить специальный раздел в биометрии о репрезентативности выбо- рочных показателей и. даже ввести новое понятие: Пороги вероятности безошибочных прогнозов. Таким образом, при составлении биометрической терминологии и •символики, конечно, прежде всего надо обращаться к дружественной и щедрой математике, выбирая из громадного арсенала математических терминов и символов то, что наиболее приемлемо для биологов. В неко- торых случаях приходится отказываться от терминов, бытующих в ма- тематике, и переходить к . своим, биометрическим обозначениям. В биометрии лучше использовать термины и символы, введенные советскими основоположниками этой науки. Нет никаких причин менять эту терминологию и символику, так как еще не разработано единой лучшей системы,-на которую можно было бы перейти. Краткое сопоставление чисто математических и биометрических терминов и символов представлено в табл. 1. Эта же таблица может служить и для справок о том, что могут означать термины и символы .в различных математических работах. Во втором изданий «Биометрии» четыре части. Первая часть «Осно- вы биометрии» предназначается для первоначального ознакомления со всеми основными разделами биометрии. Изложение методов определе- ния средних,величин и показателей разнообразия дается в таком объе- ме, который достаточен для освоения теории репрезентативности и ана- лиза достоверности. Кроме того, в первой части даются первоначальные понятия о корреляции, дисперсионном анализе и простой прямолиней- ной регрессии. Вторая часть «Биометрические методы» содержит описание более -сложных методов анализа среднего уровня, разнообразия и распреде- 7
Таблица 1 Математика Величина « V, х, X, у, a, g Среднее значение (величины) М, т, a, b, Р, ti, х, X Сумма квадратов центральных отклонений, сум- ма квадратов, дисперсия S (V—Л4)2, 2 (х—х)?, S, S3, SQ, SAQ, G Средний квадрат, дисперсия, девиата, варианса <т2, s2, v2, ё, М, MS, MQ, ES Среднее квадратическое отклонение, сигма, стан- дарт, стандартное отклонение О, S, V Изменчивость, колеблемость, рассеяние, вариа- бильность, разброс Разность: существенна, достоверна, значима, на- дежна, реальна, «разница есть», разница «до- стоверна, т. е. реальна». Биометрия Дата , (результат измерения признака) V Средняя величина (признака) ' 2 Г М =------ п Дисперсия (сумма квадратов) С=2 (V—Л4)2 Варианса (средний квадрат)* С О2 = S2 = ----— П—1 Сигма (среднее квадратическое откло- нение) Разнообразие Разность достоверна {^>^2 }—»{Л11>Л1а } * Генеральная варианса а2 , выборочная о2- Если требуется противопоставить выборочные показатели генеральным параметрам, удобнее обозначать генеральную вариан- су символом о2, а выборочную s2. ления. Особенно подробно освещаются . новейшие методы определения достоверности разности средних и долей,' специальные приемы дисперси- онного анализа, эмпирические формулы простой и сложной, прямоли- нейной и криволинейной регрессии, а также некоторые методы непара- метрической статистики. Выделение второй части учебника вызвано тем, что для понимания и освоения каждого из новейших методов биометрии требуется общее представление о всех ее разделах, что и дано в первой части учебника. Третья часть «Алгоритмы биометрических расчетов» дает компакт- ное систематизированное и иллюстрированное описание действий, необ- ходимых для получения биометрических показателей, приведенных в первых^ двух частях. Эта часть отличает «Биометрию» от всех других пособий по биометрии. Выделение третьей части позволило освободить теоретические разделы пособия от подробного описания техники вычис- лении, обычно нарушающих последовательность изложения теоретиче- ских основ, и.дать удобный справочник по практике расчета биометри- ческих, показателей. . , - Четвертая часть «Математические таблицы» содержит комплекс ма- тематико-статистических таблиц, необходимых для облегчения и уточне- ния биометрических расчетов. Таблицы четвертой части нумерованы римскими цифрами: I, II, III и т. д. в отличие' от первой и второй частей, где таблицы пронумерованы арабскими цифрами. Содержание «Биометрии» соответствует в основном «Программе по основам биометрии»- (для биологических и биолого-почвенных факульте- тов государственных университетов), утвержденной учебно-методическим управлением по ,вузам Министерства высшего и среднего специального образования СССР. ,
Часть первая ОСНОВЫ БИОМЕТРИИ СРЕДНИЕ ВЕЛИЧИНЫ Из всех групповых свойств наибольшее теоретическое и практиче- ское значение имеет средний уровень, измеряемый средней величиной признака. Средняя величина признака — понятие очень глубокое, появившееся в науке и практике только на определенном этапе развития человече- ского мышления. Всякая средняя величина обладает тремя основными свойствами: срединным положением, абстрактностью (отвлечение от реально существующего разнообразия)~й~единством суммарного дейст- вия. Описание этих свойств дано во второй части книги. ” ' Средняя величина признака определяется различными способами в зависимости от объектов наблюдения, изучаемых признаков и целей исследования. Поэтому имеется не одна, а несколько средних: средняя, арифметическая, средняя геометрическая, средняя квадратичесК а я, с р е д - няя гармоническая, мода, медина. СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ Особое значение имеет одна из средних величин — средняя арифме- тическая, вычисляемая по широко известной формуле П где М — средняя'арифметическая; 2—знак суммирования; , V — дата, результат первичного измерения признака у каждого» объекта в исследуемой группе; п— число объектов в группе. Пример 1. Средняя для пяти дат:’!, 2, 3, 4, 5 _ 1-ф-2-^3-ф-4^-5 _ 15 _g “ 5 ~ 5 — ‘ При современном развитии счетной техники эта простая формула,, дающая точное значение средней арифметической (с требуемым числом 'десятичных знаков), приобретает более общее значение: не только для небольших групп, но и вообще для всех групп любой численности. При наличии счетных машин, таких, как комптометр, контеКс, сум- мирующие перфораторные машины, сложение любого количества чисел
не представляет большого труда, что и позволяет применять единую простую формулу средней арифметической для групп любого объема. . Применение более сложных формул для вычисления средней ариф- метической необходимо только для облегчения учетной работы при отсут- ствии достаточной счетной техники. При этом надо помнить, что облег- шение расчетов получается за счет небольшого практически, малозамет- ного снижения точности определения средней, Если нет достаточной счетной техники и требуется усреднить приз- нак в многочисленной группе, когда непосредственное сложение дат становится затруднительным, применяется обходный путь расчета сред- ней арифметической величины — через составление вариационного ряда. Техника расчета средних величин показана в алгоритмах 1, 2, 3, 4, • 5, 6 и 7. Составление вариационных рядов показано в алгоритме 4. РАЗНООБРАЗИЕ ЗНАЧЕНИЙ ПРИЗНАКА Всякая группа состоит из особей или объектов, отличающихся друг ют друга по каждому из признаков. Различия эти иногда очень великй, иногда они почти незаметны, но они всегда имеются в группе, так как невозможно найти даже двух абсолютно одинаковых особей. Это вторде основное свойство всякой группы — состоять из неодинаковых объектов по любому признаку — точнее всего определяется термином разнооб- р а з и еПпризнака'в группе).~ Часто этомуТруйПОЁОМу свойству даются другие названия: измен- чивость, рассеяние, колеблемость, вариабильность и даже разброс. Как уже показано во, введении, эти термины совсем не применимы в данном случае, так как означают совершенно другие свойства биологических объектов, изучаемые в других разделах биологии и биометрии. В част- ности, изменчивость особей под влиянием разных причин изучается в двух очень важных разделах биометрии по дисперсионному анализу и ^регрессии. СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ (СИГМА) Степень разнообразия особей в группе по изучаемому признаку изме'ряётся несколькими показателями, из-которых. наибольшее значе- ние имеет среднее квадратическое отклонение: С = S (V — Л4)2 = 2Р — ® п ___________________—___________________I ;где о — среднее квадратическое отклонение или просто «сигма» (по названию греческой буквы — символа этого показателя); С — дисперсия или сумма квадратов центральных отклонений, т. е. квадратов разностей между каждой датой и средней арифме- тической; V — дата, значение признака у каждого объекта в группе; М — средняя арифметическая признака для данной группы; п—1—число степеней свободы, равное числу объектов в группе без одного. .10
ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ Число степеней свободы равно числу элементов свободного разнооб- разия в группе’ Оно равно числу всех имеющихся элементов изучения убез числа ограничений разнообразия. р[зр-р^ер“-дЛд исследования требуется взять три объекта с любым развитием изучаемого признака. В данном случае величина признака не имеет никаких ограничений, поэтому число степеней свободы v = 3—0 = 3. Если требуется взять три числа с условием, что сумма их должна ’быть равна определенной величине, например 100, то первое число может быть любой величины: 80, 800 и т. д., второе число также может быть выбрано свободно без всяких ограничений, например 10, 1269 и т. д., третье же число может иметь только одно значение, такое, чтобы оно вместе с двумя предыдущими составило бы в сумме 100. Если два пер- вых числа были 80. и 10, то третье должно быть 10; если два первых чис- ,ла <800 и 1269, то третье должно быть отрицательным: —1969 (800+1269—1969 = 100). В данном случае, при' одном ограничении (сумма чисел должна быть равна 100), два числа выбираются свободно, а третье не имеет свободы выбора: для трех чисел имеются две степени свободы v = 3—1=2. Для п дат при k ограничениях имеется v — n—k степеней свободы. При, вычислении. средн.ей^ариф.мети.ческой..ника1жх^огр.ани.чен«й-ве=- личины значений признака .не имеется,. Поэтому число элементов, обра- зующих'среднюю арифметическую, равно- числу дат. При вычислении среднего квадратического отклонения имеется одно - огранщченйёТТигма вычисляется для определенной группы, имеющей определенную среднюю арифметическую. Поэт,0МХ„-да^ 'ментов, "образующих среднее квадратическое отклонение, ограничено З+йм 'одним' условием й в" данноД случае число степеней свободы равно числу-дЙт’беЗ1 бдйбй v= — Определение критерия достоверности разности t = -- двух сред- них величин производится при числе степеней свободы у=пг+п2—Это связано с тем, что ошибка разности определяется на' основе “ошибок = alYп обеих- средних, каждая из которых имеет число степеней сво- боды (для соответствующей сигмы) п— 1. В сумме число степеней сво- боды v = — 1'4- п2 — 1 — /гг + /г2 — 2. Для критерия достоверн&шидазнОС^ ляции число степеней свободы равно для первого коэффициента '-У1=Щ1Уз2^~''для второго коэффициента V2~n2—2; для их ‘разности: +4 .гЛ*~ 2 + 4г — Пример 2. Для группы объектов, имеющих величины признака 1, 2, 3, 4, 5, среднее квадратическое отклонение можно рассчитать следую- ' -щим образом: М = ^=4 = 3; С= 2 (7 — М)2 = (1 — З)2 + (2 — З)2 + (3 — З)2 + (4 — З)2 + (5 — З)2 = = 4+1 + 0+1+4=10; 11
Дисперсию можно получить и более просто по второй формуле: C = SV2 —= (1 Ц-4 + 9+ 16 + 25) —4^- = 55 —— = Ю. п 5 5 По приведенным формулам можно рассчитывать среднее квадра- тическое отклонение для групп любого объема. Технический прием, облегчающий вычисление двух основных сумм- 217 и S V2 для больших групп, описан в алгоритме 2. Более сложные формулы расчета среднего квадратического откло- нения следует применять только при отсутствии- достаточной счетной техники, когда простое суммирование дат и их квадратов становится затруднительным. В таких случаях прибегают к предварительному со- ставлению вариационных рядов и расчету М и о специальными способа- ми, разработанными для применения их при разных условиях (способ- взвешенных дат, способ взвешенных вариаций, способ произведений,, способ сумм). Техника расчетов среднего квадратического отклонения (вместе с расчетами средней арифметической) показана в алгоритмах 1, 2, 3, 4, 5,. 6 и. 7 с.указанием.условий применения каждого алгоритма. Среднее квадратическое отклонение служит основным показателем разнообразия значений признака в группе. Используется сигма и как са- мостоятельный показатель, и' как основа для построения многих дру- гих показателей биометрии: коэффициента вариации, ошибок репрезен- тативности, различных показателей распределения, коэффициентов кор- реляции и регрессии, элементов, дисперсионного, анализа, формул ре- грессии. . Сигма — показатель именованный и выражается в тех же единицах,, как и средняя величина. Если надо сравнить разнообразие признаков разноименованных, например вес (кг) и длина (см), производится расчет- относительного показателя разнообразия — коэффициента вариации — 100а по формуле С|/ = - - более подробно описанного во второй части. РАСПРЕДЕЛЕНИЕ ПРИЗНАКА Разнообразие объектов, составляющих группу,— основное свойство-- всякой совокупности. Знание закономерностей, по которым формируется разнообразие признака в группе, имеет большое практическое и научное ' ' i значение. । В малочисленных группах трудно подметить какую-либо закономер- + . ность в разнообразии дат. Обычно все значения бывают различны, пов- । торяются без всякой видимой закономерности. i По мере увеличения численности изучаемых групп все более и более проявляется та закономерность в разнообразии, которая в малочислен- ных группах была скрыта случайной формой своего проявления. ' В больших группах эта закономерность проявляется уже достаточно- । ясно в самой форме распределения значений признака в группе. Если имеется многочисленная, группа особей, то различные значе- ния признака встречаются в этой группе неодинаковое число раз: одни значения встречаются чаще, другие реже. Это явление называется рас- пределением признака. Закономерности распределения заключаются в том, что в группе особей наблюдается преимущественное появление определенных значений признака.! Обычно на протяжении всего распре- деления от максимума до минимума бывает одна группа близких значе- 12
яий, которая появляется заметно чаще других значений. Но в некоторых распределениях наблюдаются две или три такие группы. - В процессе изучения многих совокупностей по различным признакам наметилось несколько типов распределения признака-в группе, получив- ших математическое оформление. । При исследовании биологических объектов наибольшее значение имеют: нормальное распределение, биномиальное распределение и рас- пределение Пуассона. Изобразить распределение признака можно различными способами: .вариационным рядом, гистограммой, вариационной кривой, кумулятой. ВАРИАЦИОННЫЙ РЯД Вариационный ряд — это упорядоченное отражение реально сущест- звующего распределения значений признака по отдельным особям изу- ченной группы. , Вариационный ряд — это двойной ряд чисел,'состоящий из обозна- чения классов- и соответствующих частот. Техника составления варйаци- юнных рядов показана в алгоритме 4. Пример 3. Распределение 1000 дат по 11 классам (через 20, на- чиная со 110 до 310) показано в табл. 2. Таблица 2 Средины классов W 110 130 150 170 190 210 230 250 270 290- 310 ' Частоты 2 20 60 160 250 240 180 70 15 2. 1 п = 1 000 В этом распределении имеются следующие элементы: 1. Классы признака, т. е. выделенные из общейТруппы части, в ко- торые собраны объекты;' сходные по своей величине. Способ разбивки группы на классы указан в алгоритме 4. ,2 . Вариации или средины классов, обозначаемые символом W . ПО—130—150 и т. д. В каждый класс занесены объекты, у которых величина признака близка к средине этого класса. Техника разноски дат тю классам показана в алгоритме 4. 3. Классовое промежутки или величина классов, обозначаемый сим- волом k, одинаковые для всех классов распределения. Классовый промежуток равен разности вариаций соседних классов (в табл. 2 /г-20). ‘ 4. Частоты f — число'объектов в классах. 5. Объем распределения — общее число объектов в группе, обозна- чаемое символом п. ; ~ Вариационный ряд включает в себя весь первичный материал по измерению одного признака у всех представителей изучаемой группы. Этот материал в вариационном ряду приведен в определенный порядок таким образом, что становится возможным даже 'для очень многочислен- ных групп достаточно легко определить все показатели, характеризую- щие признак как,;по среднему уройню развития, так и по различным деталям разнообразия. Рассмотрение вариационного ряда без вычислений позволяет опре- делить величину основных показателей среднего уровня и разнообразия с таким приближением, которое вполне достаточно для первого ознаком- 13
ления с признаком. В некоторых случаях внимательное рассмотрение вариационного ряда избавляет от необходимости расчета точных пока- зателей. Но даже и при наличии рассчитанных средней арифметической и среднего квадратического отклонения вариационный ряд не теряет своего значения, так как наглядно показывает все детали распределения .признака в данной группе. Если взять вариационный ряд, приведенный в примере 3, то без вычислений можно видеть, что: а) средняя, арифметическая признака находится между 190 и 210, вероятно, недалеко от 200; б) мода признака (наиболее часто встречаю- щееся значение) равна 190; в) лимиты (минимум и максимум) и размах признака примерно равны 110—310 (200); г) среднее квадратическое отклонение признака, судя по лимитам, равно 200:6,5 = 31, так как в группе объемом 1000 сигма укладывается в размахе примерно 6,5 раз. Точный расчет показателей в этом примере дал очень близкие ре- зультаты: М = 201 кг, о=30 кг, мода = 198 кг. ГИСТОГРАММА Гистограмма— это вариационный ряд, представленный в виде диа- граммы, в которой различная величина частот изображается различной высотой столбиков. Гистограмма распределения животных по весу (при- мер 3, табл. 2) представлена на рис. 1. На гистограмме наглядно прояв- ляются особенности распределения. При помощи гистограмм затруднено- сравнение нескольких распреде- лений. Поэтому разработаны дру- гие способы графической иллю- страции особенностей распреде- ления. Рис. I. Гистограмма Рис. 2. Вариационная кривая ВАРИАЦИОННАЯ КРИВАЯ Вариационная кривая — это изображение вариационного ряда в ви- де, кривой, ординаты которой пропорциональны частотам вариацион- ного ряда. Вариационная кривая того же распределения веса животных представлена на рис. 2. Вариационная кривая — очень удобный и нагляд- ный способ иллюстрации, особенно в тех случаях, когда на одном гра- фике желательно изобразить несколько распределений. На рис. 3 показаны результаты опыта,,в котором семена помидоров, подвергались облучению различными дозами рентгеновских' лучей: 2, , 14 '
4 и 8 р. На контрольной и трех опытных делянках на случайно выбран- ных 100 кустах подсчитывалось число завязавшихся плодов. Распреде- ление кустов по числу завязавшихся плодов (2—4—6... 20—22) для трех: доз облучения (2, 4, 8 р) и для контроля показаны в нижней части ри- сунка в форме вариационных рядов, а в верхнеу—в форме вариацион- ных кривых. Сопоставление четырех вариационных кривых позволяет сделат ьвывод: доза 2 р не увеличивает против контроля ни среднего числа плодов,, ни разнообразия этого признака; доза 4 р оказывает явно повышающее действие и на средний уровень, и на разнообразие; доза 8 р угнетает- образование плодов. . 50 00 1 30 20 10 0 t 1 / / / / 1 1 1 1 1 I / / "1— I 1 1 1 1 1 1 1 1 1 1 1 7 • 1 1 1 1 4 //i Z/i • ; > 1 » I ^х X W 2 0 6 8 10 12 10 16 18 20 22 Контроль 5 22 05 19 7 2 о-"0 2г 0 18 02 25 8 3 _ °—° Or 1 1 2 2 12 21 00 11 8 2*~» 8г 33 52 8 2 - *—* . Рис. 3. Сопоставление вариационных кривых КУМУЛЯТА , ч Кумулята— это изображение распределения в виде кривой, ордина- ты которой пропорциональны накопленным частотам вариационного, ряда. Чтобы составить ряд накопленных частот, нужно к частоте первого, 15.
наименьшего класса, прибавить частоту второго класса (Sf2 для второго класса), затем прибавить частоту третьего класса (Sf3 для третьего класса) и т. д. Кумулята для распределений веса показана на рис. 4. Кумулята иногда имеет преимущество перед вариационной кривой. Не- которые методы биометрии основаны на использовании кумуляты. К ним относятся критерий лямбда, определяющий достоверность различия двух распределений, пробит — метод, вскрывающий детали действия ядов и других агентов. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ В большинстве распределений, с которыми приходится встречаться, биологу, растениеводу, зоотехнику, медицинскому работнику, проявляет- ся определенная закономерность: крайние значения — наименьшее и наибольшее — появляются редко; чем ближе значение признака к сред- ней арифметической, тем оно чаще встречается; в центре,распределения, имеются такие значения, которые встречаются наиболее часто и обра- зуют в вариационном ряду модальный класс. ; Такое распределение значений признака так часто встречается в самых различных областях науки и практики, что первоначально оно принималось за норму всякого массового случайного проявления приз- наков и в соответствии с этим получило особое название: нормальное распределение. В настоящее время нормальным называют распределение, которое с достаточным приближением следует закону, открытому трейя учеными 46
в разное время: Муавром в 1733 г. (Англия), Гауссом в 1809 г. (Герма- ния) и Лапласом в 1812 г. (Франция). Закон нормального распределения выражается формулой , nk 1 --9 р =---• —г— - е 2 а т/ 2л г^е р'— теоретическая частота каждого класса распределения; . и —объем группы, число объектов исследования; k — классовый промежуток (величина классов); л — отношение окружности к диаметру равно 3,1416; е— основание натуральных логарифмов равно 2,71828; W — М х =-------v-нормированное отклонение средин каждого класса распре- деления. - „2 1 — — Вторая и третья части формулы——е 2 есть f(x)—функция у 2л нормированного отклонения, которую можно рассчитать для любых зна- чений х. Таблицы значений f(x) обычно называются таблицами ординат нор- мальной кривой и приводятся в большинстве учебников. В настоящем учебнике эти функции приведены в табл. VI «Первая функция норми- рованного отклонения (ординаты нормальной кривой)». При использо- вании этих функциц рабочая формула нормального распределения при- обретает простой вид ' р' = —Ш О В алгоритме 8 показана техника использования этой формулы для нахождения теоретических частот нормальной кривой, для распределе- ния, приведенного в алгоритмах 4, 5, 6 и 7, в котором «=100, &=10, А4=417,0 и а=13,6. Сопоставление эмпирических и теоретических частот этого распре- деления показано на рис. 5. Нахождение ряда теоретических частот для имеющегося эмпириче- ского распределения называется выравниванием эмпирических кривых по нормальному или какому-нибудь другому закону. Этот процесс имеет очень большое и теоретическое, и практическое значение. Выравнивание эмпирических кривых вскрывает закономерность распределения, кото- рая обычно скрыта под случайной формой своего проявления. Найден- ную таким образом закономерность можно использовать для решения многих практических задач. . .. Одна из этих задач возникает при определении вероятности появле- ния такого значения признака, которое отличается от средней не менее чем заданное число сигм. Например, в любом нормальном распределе- нии доля (процент) объектов со значением признака, превышающим среднюю на 2 сигмы-, составляет 2,275%, а объектов с признаком, отли- чающимся от средней не более чем на 2 сигмы, — 95,45%, не более чем на 2,5 сигмы — 98,758%, не более чем на 3 сигмы — 99,730%. Это значит, что в нормальном распределении можно предвидеть вероятность гГоявления такого значения признака, которое находится в пределах заданных границ, отстоящих з обе стороны от средней на t сигм; т. е. на любое число сигм. 2 Н. А. Плохинокий ‘ 17
При £i = 2 эта вероятность (31 = 0,9545, при £2 = 2,5 (32 = 0,98758, при £3=3,0 ₽з=0,99730. Зная закономерности нормального распределения, можно решать и обратные задачи: при каком максимальном t вероятность появления живого веса первотелок ^-2,56^0,99 ta^3,29ifl3=0^99 Рис. 6. Нормальное распределение: t число сигм, на которое должны отстоять от средней в обе стороны границы (TH—to) и (M+tc), чтобы вероятность появления дат, не выхо- дящих за эти границы, равнялась за- данным порогам 0,95; 0,99; 0,999 объектов будет равна заданной или требуемой . величине? Например, при (31 = 0,95; (32 = 0,99, (33=0,999 со- ответствующие границы должны от- стоять от. средней на число, сигм в обе стороны: £1 = 1,96, £2=2,58, £3 = = 3,29. Эти соотношения, имеющие очень большое значение в, биомет- рии, представлены на рис. 6. На основе закономерностей нормального распределения постро- ены приемы определения достовер- ности выборочных показателей пр трем порогам вероятности безоши- бочных прогнозов, имеющие ис- ключительно, важное значение в биологических исследованиях. Бо- лее подробно практические приемы использования закономерностей нормального распределения описа- ны во второй части учебника. 18
РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРОЧНЫХ ПОКАЗАТЕЛЕЙ Привлечение объектов для исследования можно проводить двумя основными методами. Можно подвергнуть изучению всех особей определенного массива или только их часть, определенным образом выбранную. В первом случае проводится сплошное обследование всей генеральной совокупности, во втором случае — выборочное исследо- вание. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ Весь массив особей определенной категории называется генераль- ной совокупностью. Объем генеральной совокупности опреде- ляется задачами исследования. Если изучается какой-нибудь вид. диких животных или растений, то генеральной совокупностью будут все особи этого вида. В данном случае объем генеральной совокупности будет очень большим и при расчетах он принимается за бесконечно большую величину. Если изучается действие какого-нибудь агента на растения и живот- ных определенной категории, то генеральной совокупностью будут все растения и животные той категории (вида, пола, возраста, хозяйствен- ного назначения), к которой относились подопытные объекты. Это уже не очень большое количество особей, но еще недоступное для сплошного изучения/ \ ' Не всегда объем генеральной совокупности недоступен для сплош- ного исследования. Иногда изучаются небольшие совокупности, напри- мер, определяется средний удой или средний, настриг шерсти у группы животных, закрепленных.за-определенным работником. В таких случаях генеральной совокупностью будет, совсем небольшое количество особей, которые все исследуются. Небольшая генеральная совокупность ветре- ’ чается также при исследовании растений или животных, имеющихся в какой-нибудь коллекции, с целью характеристики определенной груп- пы в данной коллекции. Характеристики групповых свойств. (М, о и т. д.), относящиеся ко всей генеральной совокупности, называются генеральными параметрами. ВЫБОРКА Выборка — группа объектов, отличающихся тремя особенностями: а) это —часть генеральной совокупности;, б) отобранная в случайном порядке, определенным образом; в) исследуемая для характеристики всей генеральной совокупности. Для того чтобы по выборке можно было получить достаточно точ- ную характеристику всей генеральной совокупности, необходимо орга- < низовать правильный отбор объектов из генеральной совокупности. Теорией и практикой разработано несколько систем отбора особей в выборку. В основу всех этих систем положено стремление обеспечить максимальную возможность выбора любого объекта из генеральной со- вокупности. Тенденциозность, предвзятость при отборе объектов для вы- борочного исследования препятствуют получению правильных общих выводов, делают результаты выборочного исследования непоказатель- ными для всей генеральной совокупности, т. е. нерепрезентативными. Например, если изучаются свойства вида, сорта, породы с целью выявить характерные особенности массивов, то нельзя выбирать только лучших представителей из .лучших условий обитания, из лучших хо- зяйств; также неправильно для указанной цели изучать только средних 2" . , 19
или треть лучших, треть средних и треть худших. При такой организа- ции наблюдения получается не объективная, а искаженная характери- стика генеральной совокупности. Эта характеристика будет с таким рас- пределением особей по их качеству, которое совёршенно не соответствует действительному составу генеральной совокупности, и только отражает . то, что исследователю казалось лучшим или худшим еще до проведения самого исследования этого вопроса. Для получения правильной, неискаженной характеристики всей гене- ральной совокупности необходимо стремиться обеспечить возможность, -отбора в выборку любого объекта из любой части генеральной совокуп- ности. Это основное требование должно выполняться тем строже, чем 'более изменчив изучаемый признак. Вполне понятно, что при разнообра- зии, приближающемся к нулю, например в случае изучения цвета волос или перьев некоторых видов, любой способ отбора выборки даст репре,- бентативные результаты. В различных исследованиях применяются следующие способы отбо- ра объектов в выборку. . - ' 1. Случайный повторный отбор, при котором объекты изучения отбираются из генеральной совокупности без предварительного учета развития у них изучаемого признака, т. е. в случайном (для дан- ного признака) порядке; после отбора каждый объект изучается и затем возвращается в свою генеральную совокупность, так что любой объект может попасть повторно в выборку. Такой способ отбора равносилен отбору из бесконечно большой ге- неральной .совокупности, для которого разработаны основные показа- тели взаимоотношений между выборочными и генеральными .величинами. 2. Случайный бесповторный отбор, при котором объекты, отобранные, как и при предыдущем способе, случайно, не возвращаются ' в генеральную совокупность и не могут повторно попасть в' выборку. Это наиболее распространенный способ Ърганизации выборки; он равносилен отбору из большой, но ограниченной генеральной совокуп- ности, что учитывается при определении генеральных показателей по вы- борочным.. 3. Механический отбор, при котором производится отбор объектов из отдельных частей генеральной совокупности, причем эти части предварительно намечаются механически по квадратам опытного йоля, по случайным группам животных, взятых из разных ареалов по- пуляции и т. д. Обычно намечается столько таких частей, сколько пред- полагается взять объектов для изучения, поэтому число частей бывает равно численности выборки. , Механический отбор иногда осуществляется выбором для изучения особей через определенное число, например при пропускании животных через раскол и отборе каждого десятого, сотого и т. д., или при взятии укоса через каждые 100 или 200 м, или отборе одного объекта, через каждые встретившиеся 10, 100 и т. д. экземпляров при исследовании всей, популяции. .4 . Типический пропорциональный отбор предполагает необходимость предварительного изучения генеральной совокупности по общебиологическим или хозяйственным особенностям. На основе такого изучения, вся генеральная совокупность разбивается на части по типу растительных сообществ, в которых обитает вид, по рельефу местности, , по виду хозяина паразита и т. д. Из каждой такой части для изучения выбирается в случайном порядке число экземпляров, пропорциональное населенности отдельных частей. 20
Например, при изучении определенной породы рыб берутся уловы из разных водоемов и из каждого улова берется чйсДо экземпляров, про- порциональное степени заселенности или объему водоема. При опреде- лении среднего процента жира за лактацию коровы пробы молока для исследования берутся в контрольные дни каждого месяца пропорцио- нально удою за эти дни. На основе такой выборки дается характеристика жирномолочности удоя за всю лактацию, который в данном случае является генеральной совокупностью, разбитой на типические части — месячные удои. Типический пропорциональный отбор производится так- же при определении качества шерсти у группы овец по пробам, взятым из каждого руна пропорционально весу рун. 5. Серийный (гнездовой) отбор, при котором генеральная со- вокупность разбивается на части — серии, некоторые из них иссле- дуются целиком. Применяется этот способ с успехом в тех случаях, когда исследуемые объекты достаточно равномерно распределены в опреде- ленном объеме или на определенной территории. Например, при исследовании зараженности воздуха или воды микро- организмами берут пробы, которые подвергаются сплошному исследо- ванию. В некоторых случаях гнездовым способом могут быть обследо- ваны также сельскохозяйственные объекты. При изучении выходов мяса и других продуктов переработки мясной-породы скота в выборку можно взять всех животных этой породы, поступивших на два-три мясокомби- , ната. При изучении величины яйца в колхозном птицеводстве можно в нескольких колхозах провести изучение этого признака у всего пого- ловья. кур. ' ~ ~ Характеристики групповых свойств (Af, о и т. д.), полученные для выборки, называются выборочными показателями. РЕПРЕЗЕНТАТИВНОСТЬ Непосредственное изучение группы отобранных объектов дает преж- де всего первичный материал и характеристику самой выборки. Все выборочные данные и сводные показатели «нужны исследова- телю как воздух», имеют значение в качестве первичных фактов, вскры- тых исследованием и подлежащих тщательному рассмотрению, анализу и сопоставлению с результатами других работ. Но этим не ограничивает- ся процесс извлечения информации, заложенный в первичных материа- лах исследования. , , То обстоятельство, что объекты отбирались в выборку специальны- ми приемами и в достаточном количестве, делает результаты изучения выборки показательными не только для самой выборки, но также и для всей генеральной совокупности, из которой взята эта выборка. Выборка при определенных условиях становится более или ме'нее точным отражением всей генеральной совркупности. Это свойство выбор- ки называется репрезентативностью, что означает представительность с определенной точностью и надежностью. Как и всякое свойство, репрезентативность выборочных данных мо- жет быть выражена в достаточной или в недостаточной степени. В пер- вом случае ,в выборке получаются достоверные оценки генеральных па- раметров, во втором — недостоверные. Важно помнить, что получение недостоверных оценок не умаляет значения выборочных показателей для характеристики самой выборки. Получение же достоверных оценок расширяет область применения достижений, полученных при выборочном исследовании.. 21
ОШИБКИ РЕПРЕЗЕНТАТИВНОСТИ И ДРУГИЕ ОШИБКИ ИССЛЕДОВАНИИ Оценка генеральных параметров по выборочным показателям имеет свои особенности. Часть никогда не может подностью охарактеризовать все целое, поэтому характеристика генеральной совокупности на основе выбороч- ного исследования всегда будет неточной, всегда, будет иметь некоторую большую или меньшую ошибку. Такие ошибки являются ошибками обобщения, ошибками, связан- ными с перенесением результатов, полученных при изучении выборки, на всю генеральную совокупность и называются ошибками репре- зентативности. Ошибки репрезентативности в оценке генеральных параметров нель- зя' путать с другими видами ошибок, которые могут появиться в биоло- гических работах. Вообще могут встретиться пять категорий ошибок в выборочных и сплошных исследованиях. Из них первые четыре не могут быть вскрыты при анализе уже полученного материала биометрическими методами. Надо отбросить необоснованные надежды на то, что методические ошибки, ошибки точности, ошибки внимания и ошибки типичности, до- пущенные при сборе первичного материала, могут каким-то образом быть обезврежены или учтены последующим применением математиче- ских методов. Эта возможность имеется только по отношению к пятой категории ошибок — к ошибкам репрезентативности. Краткое описание ошибок всякого исследования можно представить в следующем виде. А. Ошибки, которые нельзя учесть биометрическими методами, но избежать или свести их к минимуму можно хорошей организацией иссле-, дования. 1. Ошибки методические возникают при применении неправильной методики сбора и обработки материалов, при неточном проведении хи- мических анализов, при невыравненности общих условий жизни для кон- трольной и опытной групп и т. п. 2. Ошибки точности — это пороки первичной регистрации фактов, измерение непроверенными, испорченными инструментами, расчеты с недостаточной, а также и с избыточной ненужной точностью. 3. Ошибки внимания — описки, просчеты, перепутывание материалов, опечатки. 4. Ошибки типичности (иногда их неправильно называют ошибками ♦репрезентативности) возникают главным образом в начальных, стадиях экспериментов и наблюдений. Это особенно опасный вид ошибок, проис- ходящих от того, что в выборку отбирается группа объектов, нетипичная для всей генеральной совокупности, и по такой выборке делаются прог- нозы на всю генеральную совокупность, вследствие чего получается силь- но искаженная характеристика всей массы объектов изучаемой кате- гории. Ошибки типичности могут быть допущены бессознательно, при непо- нимании того, что в выборку должны привлекаться объекты без учета у них величины изучаемого признака, в случайном порядке — рендомизи- рованно. . Ошибки типичности могут быть причиной совершенно ложных гене- ральных выводов, если они применяются сознательно, при тенденциоз- ном подборе первичных данных в соответствии с тем, что хочет получить во что бы то ни стало недобросовестный автор исследования. Такие
ошибки не могут быть вскрыты или учтены биометрией; ликвидация их цедиком лежит на совести авторов биологических исследований. Б. Ошибки, учитываемые биометрическими методами, но неустрани- мые при проведении любого биологического исследования. 5. Ошибки репрезентативности возникают всегда, когда требуется по части охарактеризовать целое. Это неизбежные ошибки, вытекающие- из самой сущности выборочного исследования: вся генеральная совокуп- ность может быть охарактеризована по одной своей части только с неко- торой ошибкой, с определенной погрешностью. Ошибки репрезентатив- ности не могут быть устранены при любой организации работ ‘(за исклю- . чением перехода на сплошное изучение). Законен вопрос: зачем проводить исследование, которое безнадежно обречено на получение ошибочных результатов? Ответ на этот вопрос содержится в особых свойствах этих ошибок. Во-первых, ошибки репрезентативности можно свести к достаточно малой величине, к величине допустимой погрешности, практически при- емлемой при оценке генеральных параметров в конкретных условиях. Делается это путем привлечения в выборку достаточного количества объектов. Во-вторых, возможную величину ошибок репрезентативности можно определить на основе анализа выборочных данных и учесть при оценке генеральных параметров. Математическая статистика дает способы определения ошибок ре- презентативности (ошибок выборочных показателей) средней арифмети- ческой т, доли mv, разности двух выборочных показателей mj, коэффи- циента корреляции тг и др. Понимание сущности ошибок репрезентативности предохранит от необоснованного применения их. Определять величину ошибок репрезен- тативности требуется только для выборочных показателей, так как гене- ральные параметры не имеют ошибок репрезентативности. Предположим, две отары овец исследуются в порядке серийного отбора как выборки из двух различных генеральных совокупностей, на- пример из двух пород, для характеристики этих пород. В этом случае расчет ошибок репрезентативности средних показателей совершенно не- обходим для получения правильных выводов и для правильного сравне- ния обеих генеральных совокупностей — пород по изучаемому признаку. Если же исследуются не выборки, а генеральные совокупности, опре- делять ошибки репрезентативности не нужно. Например, определяется, в отаре какого чабана получей больший настриг шерсти за год. Для. этой цели исследуются две отары и по каждой определяется требуемая средняя годовая величина настрига. В данном случае расчет ошибок репрезентативности не будет иметь ни теоретического, ни практического применения. Обе отары в этом случае являются генеральными совокуп- ностями, сравниваемыми- на основе сплошного исследования. Поэтому любой статистический показатель по этим стадам определяется без оши= бок репрезентативности. Такие невыборочные показатели могут иметь все другие категории ошибок, не учитываемых, математической стати- стикой, но ошибок репрезентативности они не имеют. Определять величину ошибок репрезентативности следует только в тех случаях, когда организация исследования исключает все другие виды ошибок или когда'все они сведены к минимуму. Например, изучает- ся вес рыб, идущих косяком, в котором впереди—.самки, за ними— молодь и сзади — самцы. Если в выборку попали рыбы главным образом из головной части косяка, то при опредедении среднего веса для всего косяка будет допущена ошибка типичности: в выборку попали особи / 23
только из одной части генеральной совокупности, отличающейся от остальных частей. Очевидно, что в данном случае расчет ошибок репре- зентативности уже не поможет, так как отбор особей в выборку произ- веден неправильно. ДОВЕРИТЕЛЬНЫЕ ГРАНИЦЫ Определять величину ошибок репрезентативности необходимо для того, чтобы выборочные показатели использовать еще и для нахождения возможных значений генеральных параметров. Этот процесс называется оценкой генеральных параметров. Оценка генеральных параметров не может быть выражена одним числом: это точное значение параметра остается неизвестным. Но мате- матические методы дают возможность определить, в каких пределах может находиться значение генерального параметра. Практически такая приближенная оценка имеет часто большое значение, например, в метео- рологии при прогнозе температуры: «завтра ожидается в Москве 15—17 градусов тепла». • Оценка генеральных параметров по выборочным данным произво- дится особым способом в форме не одного, а двух значений — минималь- ного и максимального. Эти крайние значения, в пределах которых можёт находиться искомая величина генерального параметра, называются до- верительными? границами. Доверительные границы любого генерального параметра определяются по следующему общему правилу. Генеральный параметр может отличаться от найденного выбороч- ного показателя не более, чем на величину возможной погрешности, определяемой по выборочным .данным. Это правило выражается сле- дующими, формулами: ' ' А = А + Д I; А={(А-А)ч-(А+Д)} _ не более (А + Д); [ не менее (А — Д), где А — генеральный .параметр; А — выборочный показатель; + Д — максимальная доверительная граница, или возможный макси- мум; А—Д — минимальная доверительная граница, или гарантированный минимум; Д = /-тА — возможная максимальная абсолютная погрешность при про- гнозе генерального параметра; t— критерий надежности, или показатель вероятности того,, что величина генерального параметра действительно будет нахо- диться внутри найденных доверительных границ; тл -ч- показатель точности оценки генерального параметра, или ошибка репрезентативности выборочного показателя. . Для предварительной иллюстрации значения всех элементов опреде- ления доверительных границ имеет смысл рассмотреть следующий при- 24
мер, в котором величины t и пг бёрутся уже готовыми. Расчет их будет показан в ближайшем разделе. Пример 4. Промеры шкурок 100 добытых подряд зайцев и после- дующий расчет дали следующие выборочные показатели размеров шку- рок: п= 100, 44=800 см2, о = 80 ои2. Кроме того, были установлены кри- терий надежности £=2 (что соответствует первому порогу вероятности безошибочных прогнозов) и показатель точности т = о/Ип = На основе этих данных доверительные границы генеральной сред- ней размера шкурок определятся следующим образом: А = t-т = 2-8 = 16; М = М ± Д;' 800 ± 16; М = {(800 — 16) -г- (800 + 16)}; _ ' не более 800 + 16 = 816; М = не менее 800— 16 = 784. Таким образом, искомая средняя размеров заячьих шкурок может быть не более 816 и не менее 784. Эти доверительные границы имеют в данном случае определенный практический смысл. Планирование общего выхода шкурок при годовом промысле зайцев лучше вести на основе гарантированного минимума. Например, если предполагается добыть 10 000 зайцев, то лучше ожидать, что общая площадь полученных шкурок будет 784-10 000 = 7 840 000 см2. Все же подсобные мероприятия (расходы по организации промыс- ла, средства доставки, выделка шкурок, складские помещения) лучше планировать из расчета возможного максимума: 816-10000 = 8 160 000 см2. ОБЩИЙ ПОРЯДОК ОЦЕНКИ ГЕНЕРАЛЬНЫХ ПАРАМЕТРОВ Три величины, необходимые для оценки генерального параметра,— выборочный показатель (А), критерий надежности (0 и показатель точности (т).— определяются следующим образом. Выборочный показатель (А) рассчитывается по выборочным мате- риалам способом, изложенным при описании этого показателя. Критерий надежности (t) определяется заранее, при планировании исследования, исходя из представления о большей или меньшей ответ- ственности возможных результатов работы. Критерий надежности — это показатель вероятности безошибочных прогнозов. Практика биологических работ выработала три основных порога вероятности безошибочных прогнозов: при обычной ответственности Pi = 0,95, при повышенной ответственности 02=О,99 и при высокой ответ- ственности 03 = 0,999. Критерий надежности (t) связан с этими тремя порогами вероятно- ' сти безошибочных прогнозов (0) при достаточно больших выборках так, как это показано в табл. 3.. Для выборок, объем которых меньше указанного в табл. 3, и вооб- ще для-выборок любого объема значение t определяется по таблице критериев Стьюдента, в которых критерии надежности приводятся для .25
любого объема выборок в зависимости от числа степеней свободы дан- ного показателя, для каждого из трех порогов вероятности безошибоч- ных прогнозов. В настоящем учебнике таблица критериев Стьюдента приведена в четвертой части книги в форме, удобной для работы биоло- гов (табл. X «Стандартные значения критерия Стьюдента При отсутствии таблицы критериев Стьюдента стандартные значе- ния критерия надежности можно определить с достаточным' приближе- нием по формуле t2 tst = tx + ----, v -ф- 3 — 1,5/оо где tst — стандартное значение критерия при числе степеней свободы v, Zoo — критерий надежности для достаточно больших выборок (Zj = 2,0; Z2 = 2,6; Z3 = 3,3). Для обычных требований надежности (р=0,95) эта формула приоб- ретает более простой вид: Л = 2+ — . у . Таблица 3 Три порога надежности (вероятности безошибочных прогнозов) Порог Применение Надежность или вероят- ность безоши- бочных прог- нозов . Критерий на- дежности для достаточно больших вы- борок Объем доста- точно больших выборок 1 обычные требования надежности в боль- шинстве биологических исследований . . . Pi = 0,95 ^1= 1,960 щ > 30 2 повышенные требования надёжности при проверочных опытах и в экономиче- ских работах 02=0,99 /2= 2,576 п2 > 100 3 высокие требования надежности при разрешении спорных вопросов, при про- верке гипотез и при исследованиях вред- ных и ядовитых веществ 03=0,999 /3 = 3,291 п3 > 200 Показатель точности, или ошибка репрезентативности т, выбороч- ного показателя определяется на основе выборочных данных по форму- лам математической статистики. Некоторые формулы ошибок при изучении количественных призна- ков приведены в следующем списке. Ошибка средней арифметической: а) при бесконечной генеральной совокупности а т = — . у п б) при конечной генеральной совокупности, если объем выборки (п) не менее V5 объема генеральной совокупности (N) 26
. Ошибка среднего квадратического отклонения: о ______ т у/"2п ~ /2 пга = 0,707m Ошибка коэффициента вариации: mcv = CV V2n Ошибка разности средних и любых других показателей:, а) при некоррелированных выборках 1/ 2 » 2 md = к mi + m2 > б) при коррелированных выборках md — V nfi. + — 2гт1т2 (г — коэффициент корреляции). Ошибка суммы средних: S = Мг + М2 + ... + Mg-, tn^ — 1^” 1П\ -ф И12 -ф . .. -ф nig Ошибка средней из средних: g V%т2£ • Ошибка произведения средних: п = мгм2 Ошибка частного средних: Итак, Хля того чтобы оценить генеральный параметр для количест- венных признаков в форме доверительных границ нужно: 1. Установить число степеней свободы по правилам, приведенным при описании оценки каждого параметра. 2. Установить, исходя из ответственности исследования (см. табл. 3), порог вероятности безошибочных прогнозов (pi = 0,95,02—0,99, 03=О,999). 27
3. В соответствии с числом степеней свободы найти значение Крите- ’ ри'я надежности t по таблице стандартных значений--критерия Стьюдента (табл. X). При отсутствии таблицы показатель надежности для данного исследования можно приближенно определить по приведенным форму- лам. Если объем выборки превышает нижние пределы больших выборок (ft^30, zH^lOO, гс^>200), то показатели надежности берутся постоянные для каждого порога вероятности: ^ = 2,0, ^ = 2,6, ^З=3,3. 4. Рассчитать ошибку выборочного показателя по формулам, приве- денным выше и указанным при описании оценки каждого параметра. 5. Определить возможную погрешность оценки генерального пара- метра, помножив критерий надежности на ошибку репрезентативности A = tm . A=A+\ 6. Установить доверительные границы генерального параметра; возможный максимум: и гарантированный минимум: A=A—A . Техника оценки генеральных параметров для .количественных приз- наков средней арифметической, средней разности и разности средних показана на следующих примерах. ОЦЕНКА СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ Оценка средней величины имеет целью установить величину гене- , ральной средней для изученной категории объектов. Требуемая для этой цели ошибка репрезентативности определяется по формуле т = — Число степеней свободы равно числу объектов в выборке без одного: v = п—1 • Пример 5. При изучении шерстной продуктивности одной поро- ды овец было взято из разных мест обитания породы у 100 взрослых овец 100 годовых настригов шерсти. Средний настриг у 100 овец ока- зался 44=5,0 кг, среднее квадратическое отклонение для этой выборки о=1,0. Ответственность исследования обычная, поэтому был принят пер- вый порог вероятности безошибочных прогнозов 01 = 0,95. Оценка среднего настрига для всей породы может быть проведена следующим образом: га= 100, М== 5,0, о= 1,0; v = ЮО — 1 = 99; г- 2,0; т = —=0,1; /100 А = 2,0-0,1 = 0,2; 44тах = 5,0 + 0,2 = 5,2 (возможный максимум); 44min = 5,0 — 0,2 = 4,8. (гарантированный минимум). 28
Выводы. 1. Средний настриг шерсти по изученной выборке равен М±т = = 5,0±0,1, доверительные границы генеральной средней Л4=4,8+5,2. По этим показателям можно провести сравнение результатов проведен- ного исследования с результатами других работ. Методика такого срав- нения изложена в разделе о достоверности разности средних. Запланировать выход шерсти (М—10 000) на основе проведенного исследования следует исходя из гарантированного минимума генераль- ной средней Мп in = 4.8 кг на одну голову, или 48 т шерсти от всех взрос- лых овец породы. 3. Работы по стрижке, обработке, перевозке и хранению шерсти следует планировать исходя из возможного максимума генеральной средней Л4тах=5,2 кг с головы, или 52 т от всех овец изученной кате- гории. Пример 6. При изучении способности' к обучению белых мышей для каждой из 40 особей определенного происхождения регистрирова- лось время прохождения лабиринта в поисках корма .после пятой по- пытки. В одном опыте были получены следующие сводные показатели: п — 40, 44 = 7,0 мин, а=3,0 мин. Требовалось определить возможное время прохождения лабиринта в среднем для мышей всей изучаемой линии, что можно сделать сле- дующим образом: « = 40, 44 = 7,0, о=3,0, v=40—1 = 39, t=2 (ответствен- ность обычная: 0=0,95), пг=3/ (/40 = 0,48; А = 2-0,48 = 0,96?» 1,0 . __Г не более 7,0+1,0=8,0; |_ не менее 7,0—1,0=6,0. Выводы. 1. Среднее время для опытной группы 44 = 7,0 ± 0,48 мин. 2. Доверительные’ границы генеральной средней 44 = 6,0 -н 8,0 мин. 3. Если встретится группа мышей со средним временем или меньше 6 мин или больше 8 мин, возникнет предположение, что эта группа отли- чается от изученной по способности проходить лабиринт. Это предполо- жение необходимо будет проверить методом определения достоверности разности, описанным в ближайшем разделе книги. ОЦЕНКА СРЕДНЕЙ РАЗНОСТИ В некоторых исследованиях в качестве первичных дат берется раз- ность двух измерений. Это может быть в случае, когда каждая особь выборки изучается в двух, состояниях — или в разном возрасте, или при .разных условиях жизни. В этих.случаях индивидуальные и средние раз- ности по своему знаку и величине могут характеризовать действие на изучаемый признак или возраста, или изменения условий жизни. Характеристика действия определенных- факторов по .разности мо- жет быть произведена также и в экспериментах с аналогами, когда каж- дой особи в опытной группе соответствует строго определенная особь в. контроле. Пример 7. При сортоиспытании пшениц новый сорт А сравнивался- со стандартным сортом В по разности урожаев, полученных на'20 парах параллельных делянок: di=At—Вг. В результате в качестве первичных 29
материалов было получено 20 разностей, некоторые из них были поло- жительными (4>В), некоторые — отрицательными (Л<В). Для всей выборки, состоящей из 20 разностей, были получены свод- ные выборочные показатели: «=20, Л4=+1,0 ц/га, о=2,5 ц/га. В этой выборке новый сорт оказался лучше стандартного: А—В =4-1,0; А>В. Возник вопрос: а будет ли и весь новый сорт (а не только выборка из него) в аналогичных условиях лучше стандартного? Можно ли счи- тать, что полученная средняя выборочная положительная разность с/=+1,0 правильно отражает соответствующую генеральную разность между новым сортом и всем стандартным сортом? Будет ли эта гене- ральная разность d=A—В тоже положительной? Этот вопрос можно решить путем оценки генерального значения средней разности на основе полученных сводных выборочных показателей. Генеральный параметр изучаемой разности был оценен в форме до- верительных границ с надежностью р2=0,99 (исследование имело боль- шое экономическое значение) следующим образом: п = 20, v = 20 — 1 19; Md = + 1,0, о = 2,5, т = - = 0,56; . '/20 Р2 = 0,99, t = 2,9, А = tm = 2,9-0,56 = 1,6; ' v = 19. М ' не более + 1,0 + 1,6 = + 2,6 (А > В); не менее +1,0 —1,6 = —0,6 (А < В). Сортоиспытание выявило, что генеральная разность между сортами во всей их массе (а не только в изученной выборке) может находиться в доверительной зоне от +2,6 до —0,6 ц/га, в любой точке этой зоны — или в положительной, или в отрицательной, или в нулевой; если в поло- жительной, значит весь новый сорт лучше стандартного (42>В), если в отрицательной, значит новый сорт хуже стандартного (А<В), если в нулевой, значит урожайность сортов одинакова (А=В, d=A—В = 0). На основной вопрос: какой сорт лучше, А или В, — сортоиспытание Дало ответ; или А лучше В, или А хуже В, или А не отличается от В. НЕДОСТОВЕРНАЯ И ДОСТОВЕРНАЯ ОЦЕНКА СРЕДНЕЙ РАЗНОСТИ Такие результаты выборочных исследований (пример 7), по кото- рым нельзя получить никакой определенной оценки генерального пара- метра (или он больше нуля,-или меньше, или равен нулю), называются недостоверными. - Следует твердо усвоить, что недостоверные результаты выборочного исследования не дают никакого определенного ответа: ни положительно- го (А^>В, новый сорт лучше стандартного’), ни отрицательного (4<В, новый сорт хуже стандартного), ни нулевого (А —В, новый сорт не отли- чается от стандартного, или «разницы между сортами нет»). Ни один из трех возможных ответов не может быть принят, если результаты иссле- дования оказались недостоверными. -Очевидно, что' д о сто в е р н.ым и результатами следует называть такие результаты выборочного исследования, которые совершенно опре- деленно оценивают генеральный параметр. Например, если повторить 30
предыдущее сортоиспытание на 100 парах параллельных делянок и по- лучить такие же сводные показатели Л4= + 1,0, ст=2,5, то оценка гене- ральной средней разности урожаев будет вполне определенной и досто- верной: 100, = 99; Md = + 1,0, o' = 2,5, tn = = 0,25; d /100 (v = 99) = 2,6, A == 2,6-0,25 = 0,65. более + 1,0 H- 0,65 = + 1,65 (Л B); менее 1,0 — 0,65 = + 0,35 (A >• В). >2 = 0,99, Сортоиспытание выявило с надежностью (3 = 0,99 преимущество но- вого сорта перед стандартным. ОЦЕНКА РАЗНОСТИ ГЕНЕРАЛЬНЫХ СРЕДНИХ В биологических исследованиях особое значение имеет разность двух величин. По разности ведется сравнение разных популяций, рас, пород, сортов, линий, семейств, опытных и контрольных групп (метод групп). По разности ведется сравнение одной группы особей в разном возрасте, в разных сезонах года, в разных условиях (метод периодов). По разности выявляются результаты различных воздействий на биологи- ческие объекты. И во всех этих случаях возникает основной вопрос: на- сколько правильно выборочные данные отражают генеральные соотно- шения. Если проведено сплошное исследование двух генеральных совокуп- ностей, то. разность между соответствующими средними определяется без какой, бы то ни было ошибки репрезентативности: всякая генеральная разность- полностью достоверна. Все другие категории ошибок такая разность может иметь. Например, если в одном совхозе средний суточный привес каждого из откормочников за год был 810 г, а в другом — 800 г, то не может быть никакого сомнения в том, что в первом совхозе привес за данный год больше, чем во втором, и при том на полную величину полученной раз- ности: 810—800= + Ю г. Совершенно по-другому оценивается разность между двумя выбо- рочными средними. При анализе такой разности всегда возникает во- прос о ее достоверности, т. е. о том, правильно ли разность между двумя выборочными средними характеризует ту генеральную разностщсредних, которая имеется между двумя соответствующими генеральными совокуп- ностями. Например, в совхозе, разводящем одну породу свиней, при оптималь- ных условиях средний суточный-привес за год составляет 810 г. В сосед- нем совхозе, разводящем другую породу, при таких же оптимальных условиях средний суточный привес за год составляет 800 г. Можно ли на основании полученной разности (810—800=4-10 г) заключить, что все откормочники первой породы при данных условиях будут давать при- весы, большие на 10 г в сутки по сравненйю с откормочниками второй породы? Такого заключения сделать пока нельзя. В данном случае каждая из сравниваемых групп — это серийные выборки: первая из первой породы, вторая из второй породы. Каждая из полученных средних (Ali = 810 г и Af2=800 г) есть вы- борочная средняя и имеет свою ошибку репрезентативности. Поэтому и 31
разность между ними также имеет ошибку репрезентативности. Выбо- рочная разность характеризует различие между обеими генеральными совокупностями по изучаемому признаку всегда с ошибкой репрезента- тивности. , Предположим, в выборочном исследовании получилось, что выбороч- ная средняя в опытной группе больше выборочной средней в контроле. Если при этом проверялось' действие какого-нибудь агента, повышаю- щего хозяйственную продуктивность особей, превышение опыта над контролем имеет большое производственное значение. Но тут же возникает сомнение: а можно ли считать, что и во всей генеральной совокупности таких особей изученный агент будет оказы- вать такое же благоприятное действие. Как показала практика, поло- жительные результаты при выборочном испытании любых воздействий далеко не всегда повторяются и при массовом их применении. Многочисленные удовлетворения и разочарования при массовой про- верке результатов выборочных исследований выявили особое свойство разности выборочных показателей. Свойство это заключается в том, что разность между двумя любыми выборочными показателями в некоторых случаях может совершенно, правильно отражать по знаку генеральную разность, (разность между двумя соответствующими генеральными па- раметрами), что можно выразить следующей формулой: (Я>Я) -> (УИХ>Л12). . Формула иллюстрирует соответствие того, что получилось в выбор- ках (первая выборочная средняя оказалась больше, второй), тому, что имеется в соответствующих генеральных, совокупностях (в них тоже пер- вая средняя больше второй). Свойство выборочной разности правильно, с заданной надежностью оценивать генеральную разность можно обозначить термином досто- верность выборочной разности. В указанном смысле выборочная разность может быть достоверна или недостоверна. ' JlerKQ понять, что значит «разность достоверна». Если в выборочном исследовании оказалась разница между выборочными показателями, то такая же разница по знаку будет и между соответствующими генераль- ными параметрами. В таких случаях основной вывод выборочного иссле- дования имеет не только частное значение для изученной группы объек- тов, но может быть обобщен и перенесен на соответствующие генераль- ные совокупности. Труднее понять, что значит «разность недостоверна». Очень распро- странено ошибочное мнение, что наличие в выборках недостоверной раз- ности свидетельствует об отсутствии разницы между генеральными па- раметрами. Такое правило не имеет никаких ни теоретических, ни прак- тических оснований. Если получена недостоверная разность между выборочными показа- телями, то это значит, что не получено никакого определенного ответа о разности между соответствующими генеральными параметрами. Это можно показать следующей формулой: (Я>м2)-* М,>М2 = 2йа <<м2 32
Если получена благоприятная по смыслу исследования разность между, например, двумя выборочными средними, но эта разность ока- залась (на основе специального анализа) недостоверной, то это значит, что между соответствующими генеральными средними могут быть любые соотношения, а какие именно — неизвестно, но это не может служить доказательством отсутствия разницы между генеральными средними. Имеется и другое неправильное’толкование понятий: достоверная и недостоверная разность. Некоторые авторы считают, что достоверная разность между выборочными показателями свидетельствует якобы о том, что выборки взяты из разных генеральных совокупностей, а недо- стоверная разность — о том, что выборки взяты из одной генеральной совокупности. Легко понять неприемлемость таких указаний для биоло- гов. Биолог всегда сравнивает различные, неодинаковые для него гене- ральные совокупности: разные виды, сорта, породы, разные совокупно- сти по полу^ возрасту, разные совокупности, подвергавшиеся и не под- вергавшиеся воздействиям, разные совокупности по времени их иссле- дования. То, что это разные совокупности, определено еще до исследования и уже не требует выяснения. Что бы ни получилось в результате выбороч- ного исследования, генеральные совокупности всегда останутся разными, только в одних случаях будет установлено их достоверное различие по изучаемому параметру, а в других случаях ничего не будет установлено: ни того, что эти разные генеральные совокупности имеют различные параметры (например, средние), ни того, что эти разные генеральные со- вокупности по данному параметру не различаются. КРИТЕРИЙ ДОСТОВЕРНОСТИ РАЗНОСТИ При том большом значении, которое имеет для исследователей по- лучение достоверных разностей, появляется необходимость овладеть ме- тодами, позволяющими определить — достоверна ли полученная, реально существующая выборочная разность или, при всей ее материальной дей- ствительности, она не достоверна в описанном правильном понимании. Достоверность выборочной разности измеряется особым показате- лем, который можно назвать (в согласии,с большинством авторов) кри- терием достоверности разности. Критерий достоверности разности равен отношению выборочной раз- ности к ее ошибке репрезентативности и определяется по формуле - = —>^(vd = ft1 + rt2 —2) . md В . этой фбрмуле d = M\—-Мг— разность выборочных средних, md = Vm2i-\-mi —ошибка выборочной разности, т\, т2 — ошибки ре- презентативности сравниваемых выборочных показателей, tst — стандарт- ное значение критерия, определяемое по таблице критериев Стьюдента. (четвертая часть, табл. X), для заданного порога вероятности безоши- бочных прогнозов (0,95, 0,99, 0,999), в зависимости от числа степеней свободы, «1, «г— численности сравниваемых выборок, v = rt1 + ft2—-2—чис- ло степеней свободы для разности двух средних. - . При использовании критерия достоверности разности врзможны два основных случая. 3 Н. А. Плохинский. 33
1. ta^tst — полученный в исследовании критерий достоверности раз- ности равен или превышает стандартное рначение критерия, найденное по Стьюденту. В этом случае разность достоверна с определенной на- дежностью, т. е. соответствует по знаку генеральной разности. Если 'эмпирический критерий равен или превышает первый порог, он подчер- кивается одной чертой. Если эмпирический критерий равен или превы- шает 2-й или 3-й пороги, он подчеркивается соответственно двумя или тремя чертами. 2. td<Ztst — полученный в исследовании критерий достоверности раз- ности меньше стандартного значения для минимального или требуемого порога вероятности. В этом случае разность недостоверна, что значит: а) по выборочной разности нельзя сделать никакой оценки генеральной разности; б) осталось невыясненным, какая из двух генеральных сред- них больше; в) осталось недоказанным как наличие, так и отсутствие различия между генеральными средними. За минимальный порог достоверности в подавляющем большинстве исследований принимается первый порог, соответствующий вероятности безошибочных прогнозов Pi=0,95. Эмпирический критерий при недостоверной разности подчеркивается волнистой чертой. .Техника определения достоверности разности показана на следую- щих примерах. ОПРЕДЕЛЕНИЕ ДОСТОВЕРНОСТИ РАЗНОСТИ СРЕДНИХ ' Пример 8. Сравнивался вес взрослых индеек двух пород после одинакового откорма по двум выборкам. Получены следующие сводные показатели: 4 = 20, Л4Х + т1 = 4,0 ± 0,3 кг; я2 = 25, М2 + т2 = 4,6 ± 0,4 кг. Вторая порода в выборке показала больший вес: с?2_х = М2 — Мг = 4,6 — 4,0 = + 0,6. Определение достоверности этой разности проведено следующим образом: d — 0,6, irrid — К0,32 + 0,42 = 0,5, Vd = -^- = 1,2, v = 20+ 25 —2 = 43, d о,5 tst = {2,0 — 2,7 — 3,5}. Выводы. 1. Полученные результаты (б?2-1 = + 0,6) свидетельствуют, что в не- которых группах вторая порода может оказаться' в среднем тяжелее- первой. 2. Так как полученная разность оказалась недостоверной, то ничего недьзя заключить о всех представителях обеих пород; осталось невыяс- ненным, какая порода (вся) может иметь больший средний вес;, нельзя считать доказанным, что разницы в среднем весе между породами нет и что эти породы в среднем одинаковы по весу. 34
d ~ -|- 0,6 + 0,3 — Пример 9. Предыдущее исследование было повторено на более обширном материале. Получены новые сводные показатели: ^ = 100, М1 = 4,1 +0,1; 1 , , пс п2 = 100, М2 = 4,7 + 0,1; / Определение достоверности разности дало следующие, результаты: Выводы: d= 0,6, md = /0,12 + 0,12 = 0,14, ' td = -^- =4,3, v = 100 + 100 — 2 = 198, . 0,14 = tst= {2,0 — 2,6 — 3,4}. 1. Полученная разность оказалась достоверна с высшей надеж- ностью (р>0,999); можно с уверенностью заключить, что вся вторая порода, а не только ее изученная часть, в среднем имеет больший вес взрослых индеек. 2. Ёсли нужен прогноз среднего превышения второй породы над первой, например для того, чтобы запланировать экономический эффект от перемены породы, то это можно сделать обычным методом довери- тельных границ: А = tm = 2,0-0,14 = 0,28^0,3; не более + 0,6 + 0,3 = 0,9 кг; не менее +0,6 — 0,3 = 0,3 кг. _ Гарантированный минимум превосходства второй ' породы: rfmin— +0,3 в среднем на голову. В примере 9 та же по величине разность (0,6), что и в примере 8, оказалась достоверной вследствие увеличения численности изученных выборок, так как уменьшились ошибки средних' Так бывает не всегда. Может случиться} что с увеличением числен- ности выборок уменьшается выборочная разность и вследствие этого достоверность ее не повышается; разность остается недостоверной и при большем объеме выборок. В таких случаях при 2—3 повторениях исследования с увеличением численности выборок недостоверная разность уже может считаться, до- казательством того, что между сравниваемыми генеральными совокуп- ностями не обнаружено различия по изучаемому признаку. Пример 10. Изучалось число ядрышек в ядрах соматических кле- ток серебряного карася у однополых (1) и двуполых (2) особей. Полу- чены следующие сводные показатели: число исследованных клеток Пх = 1602, п2—1601; среднее число ядрышек на одну клетку Afx + = 3,9 + 0,03, М2 + т2 = 2,3 + 0,02; разность di-2 = 3,9—2,3=+ 1,6; ошибка разности md = V0,032 + 0,022 = 0,04; критерий достоверности’ td = -Ь®- = 40,0, v = 1602 + 1601 — 2^оо, tst = (2,0 — 2,6 — 3,3). 3* - 35
Разность оказалась в высшей степени достоверной: однополые и двуполые серебряные караси различаются по числу ядрышек на одно ядро в соматических клетках. У однополых число ядрышек в ядрах явно больше. РЕПРЕЗЕНТАТИВНОСТЬ ПРИ ИЗУЧЕНИИ качественных признаков Качественные признаки обычно не могут иметь градаций проявле- ния: они или имеются, или не имеются у каждой из особей, например пол, комолость, наличие или отсутствие каких-нибудь особенностей, уродств, выдающихся качеств, хромосомных перестроек, точечных мута- ций, заболеваний, исходов болезней и т. д. Принципиальной разницы между количественными и качественными признаками нет. Стерень проявлений большинства качественных призна- ков при более тщательном исследовании может быть измерена, и тогда качественный признак становится количественным. И,, наоборот, любой количественный признак может быть выражен в альтернативной форме (например, больше средней и меньше средней) и тогда он для исследо- вателя превратится в качественный признак. При изучении групповых свойств по качественным признакам харак- теристика группы заключается в указании числа плюсовых и минусовых объектов, т. е. объектов, имеющих и не имеющих признак. Основные сводные показатели: средняя величина и среднее квадра- тическое отклонение качественных признаков имеют, конечно, свои спе- цифические особенности и по технике их расчета и по способам исполь- зования в биологических работах. Средняя величина качественного признакам группе — это доля плю- совых объектов, определяемая по формуле а где р — выборочная доля плюсовых объектов (имеющих изучаемый ка- чественный признак); а — количество плюсовых объектов в группе; п — объем группы. / ' Если группа состоит из 200 особей,, из которых 120 самок, то доля самок в группе р = -!^- = о,б = бо%. , ' . 200 Если долю помножить на 100, то получитря характеристика, выра- женная в процентах. В генеральной совокупности доля плюсовых объектов выражается такой формулой: Р = — N -где s-ных Р— доля плюсовых объектов в'генеральной совокупности; А — количество плюсовых объектов; N — объем генеральной совокупности. Сумма квадратов центральных отклонений или дисперсия качествен- признаков определяется по формулам: ^6
в выборках C—npq-, _ в генеральных совокупностях C — NPQ, где <7=1—р; Q— 1—Р — доля минусовых объектов в выборке и в гене- ральной совокупности. 4 При ft=200, а= 120, р = 0,6, <7 = 0,4 С=200-0,6-0,4 = 48. Среднее квадратическое отклонение качественных признаков опре- деляется по формулам Среднее квадратическое отклонение качественных признаков имеет принципиальное отличие от сигмы количественных признаков. Произве- дение pq = p(l—р) не может быть больше одной четверти: max [рд] = 0,25 •' Эта максимальная величина произведения доли на свое дополнение до единицы получается при р = 0,5 и равна 0,5-0,5 = 0,25. Всякое другое произведение дает уже меньшую величину, например при р = 0,4 pq = 0,4-0,6=0,24. Поэтому и среднее квадратическое отклонение качественных призна- ков не может быть больше определенного предела: в выборках в генеральных совокупностях СГтах = V 0,25 = 0,5. Наличие верхнего предела сигмы значительно упрощает планирова- , ние достаточной численности выборки при изучении качественных приз- наков. Ошибка репрезентативности доли аналогична ошибке средней.и определяется по формуле 0,6-0,4 199 при ц=200, а=120, р = 0,6, <7=0,4 = 0,035. Максимально возможное значение ошибки тр [шах] = 0,5' 37
I Вели в выборке получены крайние значения доли (или 0 или 1, т. е. когда в выборке пет пи одного плюсового объекта или, наоборот, вся выборка состоит из одних плюсовых объектов), то ошибка таких долей определяется по формуле р = 0 \ р= 1 / • Если в выборке из 9 объектов не оказалось ни одного плюсового, то р=0, а тр = ~ = В некоторых биологических исследованиях генеральные доли извест- ны или предполагаются известными и все же требуется определить ошибку выборочной доли для выборок разного объема. В таких случаях ошибка доли определяется по точной формуле т = р /п /я V п ’ где в числителе подкоренного выражения стоит произведение генераль- ной доли на ее дополнение до единицы, а в знаменателе — полный объем выборки (а не число степеней свободы). ОЦЕНКА ГЕНЕРАЛЬНОЙ ДОЛИ Оценка генеральной доли, или определение ее доверительных гра- ниц, производится так же, как и оценка генеральной средней I Р = р ± А; А = tmp ; Ртах Р Н~ А, -РпНп Р А ’ где Р, р — генеральная и выборочная доли; А=(т— возможная максимальная погрешность при прогнозе гене- рального параметра; t —критерий надежности для трех порогов вероятности безоши- бочных прогнозов (£1 = 0,95, £2—0,99, £3=0,999) устанавли- вается так же как и при оценке генеральной средней; или по таблице стандартных значений критерия Стьюдента (X таб- лица) или по приближенным формулам; тр —ошибка репрезентативности выборочной доли (показатель точности). Пример 11,-При исследовании 200 особей одного вида у 60 из них оказалась повышенная способность выдерживать сильное понижение температуры среды обитания. Как часто такие особи могут встретиться среди всей популяции? Для решения этого вопроса достаточно.определить доверительные границы генеральной доли; при сходных данных и=200, а=60, р= —— “ S =од = /ЦГТ " “ °-033' Р' ^t = 2,0, k—tm = 2,0 -0,033 = 0,066; 38
p — n Qnn_i_n orr Г не более 0,300+0,066 = 0,366^37%; г -и,бии±и,иоо ^не менее 0 300—o o66=oj234«23%. Пример 12. Проверка на всхожесть показала: из 100 посеянных семян взошло 70. Какова может быть всхожесть этих семян при массо- вом посеве? 0,9.0,1 n = 100, а=70, р = 0,7, tnp = |/ = 0,046; |32 = 0,99, v = 99, £sf = 2,6, Д = г™=2,6-0,046 = 0,12; Р = 0,70+0,12 — [ не более n’J’n+n’Jn2 =п°’12; ' [не менее 0,70—0,12 = 0,58. Всхожесть оказалась низкая. При посеве следует, исходя из гаран- тированного минимума всхожести 58%, увеличивать обычную норму вы- сева в —-— = 1,73 раза, а не в —— = 1,43 раза. 0,58 0,70 г Пример 13. Автор лечебного препарата гарантировал его благо- приятное действие не менее, чем на 90% больных. При клинических испытаниях из 100 больных, подвергнутых действию препарата, у 90 на- блюдалось явное улучшение. По этим данным определены доверитель- ные границы: ' п+100, а = 90, р = 0,90, т= Т/ 0,9' = 0,03; г ’ ’ р у 99 |33 = 0,999, v=99, ^=3,4, А = 3,4-0,03 = 0,10; Г не более 0,90 + 0,10 = 1,00= 100%; не менее 0,90—0,10 = 0,80 = 80%. Исходя из полученного гарантированного минимума, следует при- знать подтвержденным улучшение не. меньше, чем у 80% больных, а не у 90%, как заявлял автор препарата. ’ Пример 14. При изучении выживаемости черенков гаплоидного томата после обработки сильным холодом из 1600 обработанных че- ренков выжило 900. Какова может быть выживаемость при'этих усло- виях во всей популяции? , плл 900 n -I / 0,56-0,44 ллюл п= 1600, а = 900, р =---= 0,56, т„ = 1/ ------——=0,0124; ’ г 1600 р У 1599 . ^ = 0,95, v=1599, tst = 2,0, А=2,0-0,0124 = 0,025 Р = 0,560+0,025— Гне более L не менее 0,560—0,025 = 0,535 = 54%. Р=0,90±0,10 ДОСТОВЕРНОСТЬ РАЗНОСТИ ДОЛЕЙ Достоверность разности выборочных долей определяется так же, как и для разности средних: ^4 = > Kt = п1 + п2 !> «4 , . где td —• критерии достоверности разности; t/ = pi—р2— разность выборочных долей; md = V~tni-pml—- ошибка разности долей, равная корню квадратному из суммы квадратов ошибок сравниваемых долей. Если требуется определить только достоверность разности, то квадраты ошибок долей определяются непосредственно: 2 _ Р1Ч1 . т _ Р2?2 . -i — , , /ц — 1 п2 — 1 39
tsi стандартное значение критерия определяется так же, как и для разности средних — по таблице стандартных значений критерия Стыодента (табл. X) или по приближенным формулам, исходя из требуемой вероятности безошибочных прогнозов (pi = 0,95, (32 = 0,99, рз = 0,999) и числа степени свободы разности; v — число степеней свободы разности, равное сумме объемов срав- ниваемых выборок tii и п2 без двух. Пример 15. При изучении планктона оказалось, что из 8 особей одного вида 7 были самцами, а из 7 экземпяров другого родственного вида самцами были только 2. Можно ли на основании этих данных- сде- лать заключение, что у первого вида процент самцов в данном сезоне выше, чем у второго? Произведены следующие расчеты: 7 п оо 9 0,88-0,12 о. = —т- = 0,88, тг, = —’---:— = 0,0151; п 8 , ’ ’ 1 7 2 поп 2 0,29-0,71 р, = — = 0,29, пк =-----------— = 0,0343; 7 2 6 d = 0,88 — 0,29 = 0,59, tnd = /0,0151 + 0,0343 = 0,22; - • (8;=У3:2) <„={2,2-3,0-4,4). Оказалось, что разница между видами по проценту самцов даже при сравнении долей в таких малых выборках превышает нижний порог достоверности. Поэтому с достаточной для первой ориентировки уверен- ностью можно заключить, что процент самцов в данном сезоне у первого вида больше; чем у второго. • Пример 16. При изучении заболеваемости гипертонией выяснено, что от здоровых родителей из 580 сыцовей болело 197, а от родителей обоих гипертоников из 39 сыновей болело 28. Можно ли считать, что ги- пертония поражает сыновей, происходящих от гипертоников, чаще, чем сыновей от здоровых родителей не только среди обследованных сыновей, но и вообще среди всех мужчин? рх = — = 0,34, m2 = Л34/’66 = 0,00038^; п 580 1 , 579 1 28 л -то 9 0,72 • 0,28 Л Алкчлк р, =----=0,72, /и2 = ——-------— = 0,005305; ' / 2 39 2 38 d = 0,72 — 0,34 = 0,38, m2 = 0,005692, tnd = 0,075; td = °’380 = 5,1; v = 580 + 39 —2 = 617, С = {2,0— 2,6 — 3,3}. а 0,075 = * 1 ’ Разность оказалась в высшей степени достоверной. Сыновья гипер- тоников вообще явно чаще болеют гипертонией по сравнению с сыновья- ми от обоих здоровых родителей. КОРРЕЛЯЦИЯ Во многих исследованиях требуется изучить несколько признаков в их взаимной связи. Цели вести такое исследование по отношению к двум признакам, то можно заметить, что изменчивость одного признака нахо- дится в некотором соответствии с изменчивостью другого. 40
.В некоторых случаях такая зависимость проявляется настолько силь- но, что при изменении первого признака на определенную величину всег- да изменяется и второй признак на определенную величину, поэтому каждому значению первого признака всегда соответствует совершенно определенное, единственное значение второго признака. Такие связи на- зываются функциональными. - - Встречаются функциональные связи в физических и математических обобщениях. Площадь треугольника точно определяется его высотой и основанием, длина окружности — радиусом, скорость падения есть функ- ция времени падения и ускорения силы тяжести, скорость протекания определенной химической реакции находится в зависимости от темпера- туры. Необходимо учесть, что функциональные связи встречаются только в идеальных условиях, когда предполагается, что никаких посторонних влияний нет. При изучении живых объектов — диких и культурных растений, жи- вотных, микроорганизмов — приходится иметь дело со связями’ другого рода. Живой организм развивается в связи с условиями его жизни, под действием бесконечно большого числа факторов, которые по-разному определяют развитие разных признаков. У живых объектов связь между любыми двумя признаками настоль- ко часто и сильно нарушается и модифицируется, что не всегда даже может быть легко обнаружена. У растений, животных и микроорганиз- мов связь между признаками обычно проявляется особым образом.-Каж- дому определенному значению первого признака соответствует не одно значение второго признака, а целое распределение этих значений при вполне определенных основных показателях этого частного распределе- ния-— средней величины и степени разнообразия. Такая связь называется корреляционной связью или просто корреляцией. Корреляционная ‘свяь, например, между ве'сом животных и их длиной выражается в том, что каждому значению длины соответствует опреде- ленное распределение беса (а не одно значение веса), и с увеличением длины увеличивается и средний вес животных. Корреляционная связь не является точной зависимостью одного признака от другого, поэтому она может иметь различную степень — от полной независимости до очень сильной связи. Кроме того, характер свя- зи между разными признаками может быть различен. Поэтому возникла необходимость определять форму, направление и степень корреляцион- ных связей. По форме корреляция может быть прямолинейной и криволинейной, по направлению — прямой и обратной. Степень корреляции измеряется различными показателями, введенными для установления силы связи между количественными и качественными признаками. Такими ^показа- телями Являются коэффициент корреляции г, корреляционное отношение т), тетрахорический и полихорический Показатели связи, частный и мно- жественный коэффициенты корреляции. Изобразить корреляционную связь двух признаков можно тремя спо- собами: ' ' 1. При помощи корреляционного ряда, состоящего из ряда пар зна- чений, -из которых одно относится к первому признаку, а другое в этой паре относится ко второму признаку, связанному с первым. На рис. 7 по- казаны схемы корреляционных рядов при пяти степенях корреляционной связи. 2. При помощи корреляционной решетки, в которой каждой особи соответствует определенная клетка. На рис. 7 показана схема корреляци- 41
oitiibix решеток дли пяти степеней корреляционной связи между двумя прпзппками. Значения первого признака нанесены по оси абсцисс, значе- ния второго — по оси ординат. И = . 1 2 3 4 5 V1 = 1 2 3 4 5 Прямая полная связь г = > 4,0 0 1 2 3 4 5 1 2 3 4 5 Л V, = 1 2 3 4 5 *2 = 2 Прямая 1 3 5 частичная . связь г=+0,8 4 0 1 2 3 4 5 1 2 3 4 5 Vj = 1 2 '3 4 V2 = . 2 4 3 4 Отсутствие связи г-О V; = / 2 3 4 5 V2= 4 5, 3 1 2 Обратная частичная связь г = -0,8 012345 V, = 1 2 3 4 V2 = 5 4 3 2 Воротная полная связь Г ---ю Рис. 7. Схема прямолинейных корреляционных связей 3. При помощи линии регрессии, абсциссы которой пропорциональ- ны значениям первого признака, а ординаты — значениям второго приз- нака, корреляционно связанного с'первым. На рис. 7 показаны схемы линий регрессии для пяти степеней корреляционной связи между двумя признаками. 42
КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ Коэффициент корреляции измеряет степень и определяет направле- ние прямолинейных связей. Прямолинейная связь между признаками — это такая связь, при ко- торой равномерным изменениям первого признака соответствуют равно- мерные (в среднем) изменения второго признака при незначительных и беспорядочных отклонениях от этой равномерности. Например, при уве- личении длины тела на каждый сантиметр ширина увеличивается в сред- нем на 0,7 см. При графическом изображении прямолинейных связей (см. рис. 7) (если по оси абсцисс отложить значения первого признака, по оси орди- нат— второго и полученные точки соединить) получается прямая или такая кривая, среднее течение которой проходит по прямой. При изображении прямолинейных корреляционных связей в форме корреляционных решеток (см. рис. 7) частоты внутри располагаются в форме эллипса. Большая ось этого эллипса проходит или по диагонали от угла наименьших значений (при положительной корреляционной связи), или по диагонали от угла, где сходятся наименьшие значения одного признака и наибольшие значения другого, к противоположному углу (при отрицательной корреляционной связи). При измерении степени связи между разными признаками приходит- ся сравнивать величины, выраженные в разных единицах, измерения. Например, при измерении .связи между весом животного и его длиной надо сопоставить килограммы веса с сантиметрами длины. В других случаях изменения объема сопоставляются с изменениями возраста, из- менения веса руна в килограммах с изменениями содержания в. нем жиропота в процентах,, длина ног в сантиметрах со скоростью бега в ми- нутах и т. д. Проводить такие сравнения оказалось возможным путем использова- ния нормированного отклонения, вычисляемого по формуле х v—м а Нормированное отклонение служит универсальной и неименованной мерой развития признаков. Эти свойства нормированного отклонения и позволили сконструировать основной показатель корреляционной связи — коэффициент корреляции. - Основная формула, которая вскрывает сущность этого показателя, имеет совсем простую структуру: V где г — коэффициент корреляции; Х[Х2 — нормированные отклонения дат по первому и второму призна- наку; v — число степеней свободы, равное в данном случае числу сравни- ваемых пар без одной. - - Сумма произведений нормированных отклонений, входящая в форму- лу для коэффициента корреляции, обладает следующими тремя особыми свойствами: 1. Если оба признака изменяются параллельно, то сумма произведе- ний их нормированных отклонений дает положительную величину. Если 43
при увеличении одного признака другой уменьшается, то приходится умножать положительные числа на отрицательные и вся сумма произ- ведений нормированных отклонений дает отрицательную величину. По- ' этому коэффициент корреляции может определять направление связи: при прямых связях он. положителен, а при обратных связях отрица- телен. 2. При полных связях, когда изменения обоих признаков строго соответствуют друг другу и корреляционная связь превращается в функ- i циональную, сумма произведений нормированных отклонений стано- вится равной числу степеней свободы: , , Sxtx2 = v = п—1. Поэтому максимальное значение коэффициента корреляции равно 1; для положительных, или прямых связей : ТО = ^ = ^ = + 1,0; v v для отрицательных, или обратных связей _ Зад, _ — v _ , п 'min — ---- — ---- — 1 >и- v v \ ; 3. При полном отсутствии корреляционной связи между признаками сумма произведений нормированных отклонений равна нулю, и поэтому коэффициент корреляции в этих случаях тоже равен нулю: J Предельные значения коэффициента корреляции (г= + 1,0; г=0,0; г=—1,0) на практике встречаются крайне редко. Пять основных видов прямолинейной корреляцинной связи, соответ- t ствующие коэффициентам корреляции +1,0; + 0,8; 0,0; —0,8 и —1,0, по- , казаны на рис. 7. Основная формула коэффициента корреляции г = —Х1*2- хорошо V вскрывает сущность этого показателя, но для работы крайне неудобна, ) особенно при многочисленных группах. Поэтому разработаны разнооб- < разные рабочие формулы для практических расчетов в разных уело- 1 виях — для малых и больших групп при малбзначных и многозначных ) вариантах. * . л Все эти формулы дают одинаковый результат и применение любой . из них обусловливается только удобством и простотой необходимых вычислений. Если требуется рассчитать один, два или вообще- немного коэффициентов корреляции, то можно брать любую формулу. Если нужен расчет целых серий коэффициентов корреляции, то лучше сначала подобрать наиболее подходящую формулу. Это сильно сократит работу и значительно уменьшит возможность ошибок в вычислениях. Наиболее приемлемы в биологических работах две формулы, пред- ложенные для малых групп: y,/v ТО) ТО) г = N г = + КТО ’ 2/ТО где Vi, К — даты первого и второго признаков; N — число сравнивае- мых пар дат, или число объектов, у которых измерено по два признака; 44
Ci, C2, Cd — дисперсии по первому признаку, по второму признаку и по ряду разностей между датами сравниваемых признаков. Первая формула применяется, когда легче вычислять произведения дат (например при малозначных датах), вторая, когда легче получать разности дат. Техника работы с этими двумя простыми формулами показана в алгоритме 14. При современном развитии вычислительной техники эти две фор- мулы коэффициента корреляции приобретают более общее значение не только для малых групп, но и для групп любой численности. Программи- рование вычисления коэффициентов корреляции на электронно-счетных машинах лучше производить по одной из этих двух простых формул. Применять более сложные формулы следует только при отсутствии достаточной счетной техники, когда непосредственное получение сумм дат, их квадратов, произведений становится уже или затруднительным или невозможным. В этих случаях прибегают к расчетам коэффициента корреляции при помощи корреляционной решетки, техника составления которой показана в алгоритме 15. Перед освоением техники составления корреляционной решетки не- обходимо хорошо ознакомиться с правилами составления вариационных рядов при учете объема группы и лимитов признака, что показано в алгоритме 4. Необходимо вариационный ряд по второму признаку помещать в левом крайнем столбце корреляционной решетки, причем классы в нем располагать снизу вверх: внизу классы с меньшими вариациями, вверху с большими. Техника расчета коэффициента корреляции для малых и больших групп показана в алгоритмах 14, 15, 16, 17, 18. Применяется коэффициент кор- реляции в тех' случаях, когда необхо- димо знать направление и силу связи Расположение классов второго 1 коррелируемого признака Правильное 100 90 80 70 60 50 40 Неправильное 40 50 60 • 70 80 90 100 по датам. между признаками, причем заранее известно, что эта связь может считать- ся прямолинейной, или когда требует- ся выяснить степень именно прямоли- нейной связи. При этом лучше прово- дить два этапа исследования: 1) рас- смотрение корреляционной решетки; 2) расчет коэффициента корреляции или по этой же решетке, цли Уже самый вид корреляционной решетки позволяет приблизительно установить направление и степень прямолинейных связей, а также ха- рактер криволинейных связей. При известном опыте по виду корреля- ционной решетки можно получить первое представление об особенностях и силе связи между изучаемыми признаками. Облегчает решение этой задачи схема степеней прямолинейной корреляции, показанная в табл. 4. В этой схеме приведены стандартные корреляционные распределения 50 дсобей при различных степенях прямолинейной связи по девяти града- циям от г= +1,0 до г=—1,0. , Схемой степеней прямолинейной корреляции можно пользоваться как эталоном для первоначального ориентировочного отнесения изучае- мой связи к одной из условных степеней («сильная», «средняя», «сла- бая») только по одному виду корреляционной решетки. В некоторых 45
случаях такая грубая оценка бывает достаточна для выяснения пред- варительных вопросов исследования. Например, при исследовании корреляции нескольких признаков с каким-нибудь основным в целях отбора наиболее с ним связанных доста- точно просмотреть корреляционные решетки. Такой просмотр, а также и сопоставление полученных решеток со стандартными по схеме степе- ней прямолинейной корреляции позволят отбросить признаки, явно слабо связанные,с основным, и оставить для последующих расчетов только признаки-, показавшие наибольшую корреляцию с основным признаком. Выбор из них самого лучшего (для поставленной задачи) возможен, конечно, только уже на основе вычисления коэффициента корреляции. слабая Схема степеней прямолинейной корреляции Прямая корреляция средняя 1 1 И 2 1 1 1 2 1 4 1 4 1 2 11 4 1 8 1 4 1 1 , 2 | 4 1 4 I 2 1 1 1 2 1 J 1 1 Г = + 0,50 отсутствие / корреляции 1 11 2 1 1 1 11 3 1 4 1 3 1 1 2 1 4 1 6 | 4 1 2 1 1 3 1 4 1 3 1 1 1 1 1 2 1 1 1 г = 0,0 11 1 1 11 1 1 11 5 1 3 1 2 1 1 1 1 3 1 10 I 3 1 1 11 2 1 3 1 5 1 1 1 1 1 11 1 1 1 — 0,25 Обратная корреляция средняя 1 1 2 1 11 1 2 1 4 1 4 1 2 1 1 1 4 1 8 1 4 1 1 1 2 1 4 1 4 1 .2 1 1 1 1 2 1 I Г — — 0,50 Таблица 4 ОШИБКА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ Как и всякая выборочная величина, коэффициент корреляции имеет свою ошибку репрезентативности, вычисляемую для больших выборок по формуле т, 1 — г2 где г — коэффициент корреляции в генеральной совокупности, из кото- рой взята выборка; 46
п — численность выборки, Т. е. число пар значений, по которым вы- числялся выборочный коэффициент корреляции. Поскольку в числителе формулы ошибки выборочного коэффици- ента корреляции стоит квадрат генерального коэффициента корреляции, •то эта формула может применяться лишь в исключительных случаях, когда заранее известна или предполагается степень корреляции в гене- ральной совокупности. Пример 17. Для проверки гипотезы о том, что коэффициент кор- реляции между детьми и родителями г=+0,5, была сопоставлена пло- довитость 226 лисиц и их дочерей в соответствующем возрасте и в сход- ных условиях. Коэффициент корреляции оказался, равным + 0,45. Под- I тверждает или опровергает этот результат гипотезу? В данном случае разность между выборочным и генеральным коэф- фициентами d = +0,45—( + 0,50) =—0,05, а ее ошибка равна ошибке вы- борочного коэффициента, так как генеральные величины не имеют оши- бок репрезентативности. Для вычисления ошибки- коэффициента корре- ляции имеется возможность применить точную формулу с генеральным коэффициентом в числителе: 1 —0,5а 0,75 л nr тг — —’ - = —-— = 0,05. г /225 15 ~ / 0.05 , п Оказалось, что критерии достоверности разности r(r_r-j — Q = 1,0 не превышает даже первого порога достоверности (^ = 2,0 01 = 0,95). Гипотеза в данном исследовании не опровергнута, так как эмпири- ческий коэффицент корреляции недостоверно отличается от гипотетиче- ского. В большинстве исследований значение коэффициента корреляции в генеральной совокупности неизвестно, поэтому вместо точного значения • ошибки коэффициента корреляции берут приближенное значение т 1 —г2 п — 2 где г—выборочное значение коэффициента корреляции, п — число сравниваемых, пар дат, или число объектов, у которых измерены два признака. Ошибка коэффициента корреляции используется для определения: 1) достоверности выборочного коэффициента корреляции; 2) доверитель- ных „границ генерального коэффициента корреляции; 3) достоверности разности двух выборочных коэффициентов корреляции; 4) достоверно- сти разности между выборочным и генеральным коэффициентом корре- ляции. ДОСТОВЕРНОСТЬ ВЫБОРОЧНОГО КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ Критерий достоверности выборочного коэффициента корреляции определяется по формуле tr = — > {v = n^- 2} , где tr — критерий достоверности коэффициета корреляции; г — выборочный коэффициент корреляции; 47
п — число коррелированных пар дат; tst — стандартное значение критерия Стьюдента, находимое по табли- це X для установленного числа степеней свободы и порога веро- ятности безошибочных прогнозов. При t^tst коэффициент корреляций достоверен. В' этом случае с определенной вероятностью можно считать, что между коррелируемыми признаками имеется связь и в генеральной совокупности такая же по знаку, какая получилась в выборке (прямая или обратная). При t<.tsi выборочный коэффициент корреляции недостоверен, что не дает возможности сделать какое-либо заключение о связи признаков в генеральной совокупности. Для выяснения этого вопроса требуется провести повторные исследования на более многочисленном материале. Пример 18. При проверке гипотезы о связи крупноплодности с жирномолочностью был рассчитан коэффициент корреляции между про- центом жира в молоке у 50 коров и весом при рождении телят от этих же коров. Получено: коэффициент корреляции г =+0,21; /1 __Л 912 его ошибка тг= 1/ ——:—- = 0,14; V 50 — 2 критерий достоверности 4 = ^^= 1,5; v = 48; ^ = 12,0 — 2,7-3,5}. г 0,14 1 Выборочный коэффициент оказался явно недостоверным. На основе проведенного исследования нельзя ожидать связи между крупноплод- ностью и жирномолочностью у всех коров вообще. Определение достоверности коэффициента корреляции можно значительно упростить, используя свойства особой функции 1 , 1 + Г ° z = —-In —J-, предложенной Фишером. 2 1 — г При помощи, этой функции можно заранее определить, при каком объеме выборки коэффициент корреляции определенной величины будет достоверен по требуемом^ порогу вероятности безошибочных прогнозов, по следующей формуле: t* п = — +3 , г2 ’ где n — количество пар значений, достаточное для достоверности выбо- рочного коэффициента корреляции, t — критерий Стьюдента для каждого из трех порогов вероятности безошибочных прогнозов (£1 = 0,95, 02 = 0,99, 03=О,999), для больших групп: Zi = 1,96,/2=2,58,/з = 3,30. z — функция Фишера, равная половине натурального логарифма частного от деления величины (1 +ir) на величину (1—г). По этой формуле рассчитана табл. XII, по которой достоверность (или недостоверность) коэффициента' корреляции определяется без вы- числёний. В примере 18 в выборке объемом и = 50 получен коэффициент кор- реляции г= +0,21. В табл. XII в строке, соответствующей г = 0Д1, стоят три числа: 87—149—242. Это значит, что выборочный коэффициент корреляции, равный г=0,21, может стать достоверным в том случае, если объем.вы- 48
борки (число коррелируемых пар дат) будет: для первого порога веро- ятности 87, для второго— 149, для третьего — 242. Так как фактический объем выборки п = 50 далеко не достигает первого, максимального поро- га, то полученный коэффициент корреляции оказался недостоверным, что было найдено и обычным способом. ДОВЕРИТЕЛЬНЫЕ ГРАНИЦЫ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ , ' Доверительные границы генерального значения коэффициента кор- реляции находятся общим способом по формуле ' г =^г + Д, где г и г — генеральное и выборочное значения коэффициента корре- . ляции; Д=^т— возможная погрешность при определении генерального па- раметра; z tst — критерий Стьюдента (табл. X) при числе степеней свободы v=n—2; тг — ошибка коэффициента корреляции. Пример 19. При разработке способов определения веса устриц определенного вида по их длине было измерено и взвешено 200 экземп- ляров и определён коэффициент корреляции . между весом и длиной г=+0,85. Ошибка, этого коэффициента . / 1 — 0,852 п т. = \/ -----5— = 0,037. r V 200 — 2 Число степеней свободы и критерий Стьюдента v = п— 2 = 198, tst = {2,0 =- 2,6 — 3,3}. Возможная погрешность при прогнозе генерального параметра Д = tm = 2,0 • 0,037 = 0,074. Доверительные границы: _ ।—не более + 0,85 + 0,074 = 0,92; г = +0,85 + 0,074—1 ।—не менее +0,85 — 0,074 = +0,78. Даже минимальная граница (гарантированный 'минимум) оказа- лась достаточно высокой. Это указывает на возможность практического использования вскрытой закономерности- путем разработки формулы регрессии и номограммы для определения веса устриц по их длине с практически достаточной точностью. Техника этих приемов описцна в главах о регрессии. ДОСТОВЕРНОСТЬ РАЗНОСТИ ДВУХ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ Достоверность разности коэффициентов корреляции определяется так же, как и достоверность разности средних, по обычной формуле Id — ^st ~ п1 п2 — 4}, md 4 Н. А. Плохинский 49
где td — критерий достоверности разности коэффициентов-, корреляции; d=r1 — ri—разность коэффициентов корреляции; md — Y т2 + т2—ошибка разности, равная корню квадратному из; суммы квадратов ошибок обоих сравниваемых коэффициентов корреляции;/и2 = —— tst — стандартные значения критерия Стьюдента- (табл. X); v — число степеней свободы для разности коэффици- ентов корреляции, равное сумме чисел степеней* свободы обоих коэффициентов v = «i—2 + п2—2 = п1 + п2—4. Пример 20. При разработке способов определения высоты дерева? по его обхвату (на высоте груди измеряющего) получены коэффициенты корреляции между этими признаками для двух, пород деревьев: П1 = 200, = 0,60, m2 = = 0,0032; 1 1 1 198 - и2 = 150, г2 = 0,80, т2 = = о,0024. Для выяснения возможности применения единой формулы пересчета обхвата на высоту потребовалось выяснить: достоверно ли различие свя- зи высоты с обхватом между двумя изучаемыми породами деревьев; Получены следующие результаты: у d = 0,80 — 0,60 = 0,20; md = 0,0'032 +0,0024 = 0,0056, md = /0,0056 = 0,075; " td = °’20? = 2,7,-v = 200+ 150 — 4 = 346, tst = (2,0— 2,6 — 3,3}; d 0,075 = . . ’ . Оказалось, что сравниваемые породы достаточно достоверно (по* второму порогу вероятности) различаются по степени связи между высо- той и обхватом дерева. Поэтому для этих пород нельзя пользоваться единой формулой пересчета обхвата на-высоту. КОЭФФИЦИЕНТ ПРЯМОЛИНЕЙНОЙ РЕГРЕССИИ Прямолинейная корреляция отличается тем, что при. этой форме- связи каждому из одинаковых изменений первого признака соответствует- вполне определенное и тоже одинаковое в среднем изменение другого* признака, связанного с первым или зависящего от первого. Та величина, на которую в среднем изменяется второй признак, при изменении первого на единицу измерения, называется коэффициен- том регрессии. Рассчитывается он по формуле «2/1 = Г12, I где — коэффициент регрессии второго признака по первому; о2 — среднее квадратическое отклонение второго признака, кото- рый изменяется в связи с изменением первого; <Т1 — среднее квадратическое отклонение первого признака, в свя- зи с изменением которого, изменяется второй признак; 50 . - • 7
Г12 — коэффициент корреляции между первым и вторым призна- ками. Ошибка коэффициента регрессии равна ошибке коэффициента кор- реляции, умноженной на отношение сигм: т _ сг2 _ сг2 1 /"1 — г2 т,п =----• тг —---- I /------- . щ r Qi V п — 2 Критерий достоверности коэффициента регрессии равен критерию достоверности коэффициента корреляции: Ог * Г12 ^ = А = Л_1 = ^^г. та сг2 тг Пример 21. Для разработки способа определения веса лошадей без взвешивания по обхвату груди было взвешено 1618 лошадей и у каждой из них измерен обхват груди. Получены следующие показатели: х — обхват груди, п= 1618, Л4Х= 174 см, +=7,9 см-, у — вес, и = 1618, Л4,у=424 кг, + = 56,8 кг. Коэффициент корреляции гу/х= + 0,89+0,011. Коэффициент регрессии веса по обхвату равен: ЯУ,Х = гу1х = ^~ (+ 0,89) = + 6,4. . вх 7,9 Ошибка коэффициента регрессии веса лошадей по обхвату их груди равна: тц = тг = 0,011 = 0,08. <ух г 7,9 Достоверность этого коэффициента регрессии определяется следую- щим образом: tR= -^- = 80,0, v = 1618 — 2 = 1616, tst= {2,0 — 2,6 — 3,3}. Возможная максимальная погрешность при прогнозе генерального параметра. ” ' ' Д = tm = 2,0 -0,08 = 0,16. Доверительные границы Ryix = + 6,4 + 0,16 = {6,24 ч- 6,56}. Таким образом, можно ожидать, что при увеличении (или уменьше- нии) обхвата груди на 1 см вес лошадей увеличится (или умень- шится) в среднем на /?=+6,4 кг при гарантированном минимуме изме- нения +6,24 кг и возможном максимуме +6,56 кг, если учитывать изме- нения признаков в обе стороны от их средней величины. ... 4* 51
УРАВНЕНИЕ ПРЯМОЛИНЕЙНОЙ РЕГРЕССИИ Коэффициент-прямолинейной регрессии показывает, на сколько от своей средней отклоняется второй признак, если первый признак от своей средней отклонился йа единицу измерения. Это можно выразить следующей формулой: (У2-М2) = ^/1(У1-М1)/ Обозначая У) через х, У2 через у, Ry/X через b и произведя необхо- димые преобразования этого выражения, можно получить рабочую фор- мулу прямолинейной регрессии: у = а 4- Ьх а= Му — ЬМх' b — Пожатой формуле, зная значение х (аргумент), можно определить Значение у (функция) без непосредственного его измерения: нужно аргу- мент х помножить на коэффициент регрессии и к полученному произве- дению прибавить (или отнять) свободный член а. Для примера 21 (определение веса лошадей по обхвату груди) урав- нение регрессии может быть выведено следующим образом: а = Му — RyixMx = 424 — (+ 6,4) 174 = — 690, 6 — Ry/X = ф- 6,4, у — аbx =—690 + 6,4х = 6,4х — 690. Следовательно, чтобы определить (без взвешивания живой вес ло- шади по этому способу, надо обхват груди лошади умножить на посто- янный коэффициент 6,4 и из полученного произведения вычесть постоян- ное число — 690. ' . На основе уравнения прямолинейной регрессии можно заранее рас- считать значение функции для каждого значения аргумента. По обхвату груди можно определить живой вес лошадей: Обхват груди, см.......... 140 150 160 170 180 190 200 210 220 230 240 Вес лошади, кг 206 270 334 398 462 526 590 654 718 782 846 Если эти цифры нанести на график, по оси абсцисс которого отло- жить через равные интервалы значения аргумента (обхвата), а по оси ординат — значения функции (веса), то получится* номограмма для определения веса лошадей без взвешивания и без вычислений. Ошибки элементов уравнения прямолинейной регрессии. В уравнении простой прямолинейной регрессии ух = а 4- Ьх возникают три ошибки репрезентативности. 1. Ошибка коэффициента регрессии 1 —г2 п — 2 (У V = —— пг Ох ’иллюстрирована в примере. 21. 152
2. Ошибка уравнения регрессии, т. е. ошибка средней величины функции для каждого значения аргумента , По данным примера 21 т- = 56,8 • 0,011 = 0,62. s X Следовательно, максимальная погрешность в определении уровня точек линии регрессии при первом пороге вероятности безошибочных прогнозов (Р! = 0,95, ^1 = 2,0) будет равна: Д = tm'= 2 • 0,62 = ±1,24 кг. 3. Ошибка индивидуальных определений функции ту = ву]/Л—г2. Для примера 21 ту = 56,8/1 — 0,892 = 26,2. Следовательно, индивидуальная погрешность в определении веса лошадей по обхвату груди по найденной формуле регрессии, принимая первый порог вероятности безошибочных прогнозов (|3i = 0,95, =2,0), в крайних случаях не будет превышать Д = 2 • 26 = ± 52 кг. КОРРЕЛЯЦИОННОЕ ОТНОШЕНИЕ Корреляционное отношение измеряет степень криволинейных и пря- молинейных связей. Криволинейная связь между признаками — это такая связь, при которой равномерным изменениям первого признака соответствуют не- равномерные изменения второго, причем эта неравномерность имеет определенный закономерный характер. При графическом изображении криволинейных связей, когда по оси абсцисс откладывают значения первого признака, а по оси ординат — значения второго признака и полученные точки соединяют, получают изогнутые линии. Характер изогнутости зависит от природы коррелируе- мых признаков. При изображении криволинейных связей на корреляционной решет- ке частоты внутри решетки не располагаются в форме эллипса. Ареал их расположения имеет форму изогнутых неправильных фигур. По виду корреляционной решетки можно выяснить характер связи (прямолиней- ная или криволинейная), что показано в табл. 5. Степень статистической зависимости одного признака от другого можно определить, сопоставляя разнообразие этих признаков. В тех случаях, когда первый признак принимает разные значения, а второй признак остается неизменным, можно заключить, что разнооб- разие второго признака не зависит от разнообразия первого и связь между ними равна нулю. ' Если при значительном разнообразии первого признака второй имеет незначительное разнообразие, можно заключить, что статистиче- 53
ская связь между разнообразием обоих признаков Имеется, но она не- большая. В тех случаях, когда при изменениях первого признака второй приз- нак изменяется часто и значительно, можно сделать вывод о большой связи изменений обоих признаков. Поэтому для получения показателя криволинейной связи можно определить численно степень разнообразия второго признака при опре- Таблица 5 Корреляционные решетки при прямолинейной и криволинейной связях 1 1 1 1 1 1 11 1 I I I I 121 | 10 | 8 | 1 j 1; 1 1 1 7 | 8 | 1 1 1 .1 1 35 156 |28 | 7 | 1 1 1 | 21 | 28 | 7 | 1 | | 35 1 70 | 35 | 18 | 1 | 1, . 1 ]35|56|21| | Г 1 21 | 56 |' 35 | | | | 1 1 35 | 70 | 35 | | | 1 1 1 28 I 21 | | 1. ' | 1 1 21 56 | 35 | | | | ' |б | -3 | | | 1. | ! 1 7 28 | 21 1 1' 1 Г 1 |б | | | | ) | 1 1 1 8 7| 1' 1 1 1.1 3 1 1 1 1 1 1 1 1 1 .1 1 1 1 1 1 1 1 1 3 U 1 1 1 1 И . деленном разнообразии первого. Делается это при помощи ряда част- ных средних, рассчитанных для второго признака’при разных значениях первого. Обозначаются частные средние второго признака по первому символом A42-1- Получение таких средних можно 'показать на следую- щем простом примере. Имеется группа из 6' особей, у каждой особи измерено два признака (первый, и второй). В результате получены следующие два ряда значе- ний: . 1 4 4 6 6 8 8 V2 8 4 14 18 4 12. Как видно, особи по первому признаку могут быть разбиты на груп- пы с одинаковым значением этого первого признака (4, 6 и 8). В каж- дой такой группе будет по 2 особи. У первых двух особей первый признак имеет одинаковое значение, второй признак у них неодинаков: у одной особи он равен 8, у другой—4. 4. Если взять среднюю из этих значений, то это и будет частная средняя второго признака при определенном значении первого: • м2:1 = -^- = 6. Вторые две особи с одинаковым значением первого признака (6) имекЗт неодинаковый второй признак (14 и 18).-В этом случае частная средняя ! „ 14ф18 Л12-1 = --!--- = 16. 2 '54
И, наконец, две особи третьей группы имеют, одинаковое значение первого признака (8), второй признак у одной особи равен 4, а у дру- гой—12. В данном случае частная средняя второго признака по первому: Мм = = 8. Теперь к имеющимся двумя рядам можно приписать третий ряд — ряд частных средних второго признака по первому: . 1 4 46688 ; 2 8 4 14 18 4 12 M2.i 6 6 16 16 8 8. Простое сопоставление полученного ряда частных средних второго признака с рядом первого признака показывает, что второй признак не остается неизмененным при изменениях первого. При изменении первого признака на одну и ту же величину (2) вто- рой признак сначала резко увеличивается с 6 до 16, а потом столь же резко уменьшается с 16 до 8. При не очень большом разнообразии пер- вого признака (от 4 до 8) разнообразие второго, судя по разнообразию частных средних, получилось довольно значительным-—от 6 до 16, что, конечно, указывает на большую связь второго признака с первым, или на большую зависимость второго признака от первого. Степень разнообразия частных средних можно выразить не только .лимитами, но и более точным показателем — суммой квадратов цен- тральных отклонений, или дисперсией.. Для получения дисперсии надо рассчитать общую среднюю для всех частных средних второго признака М2, затем для каждой из них определить центральное отклонение £>2.1 = Л42-1 — М2, полученные величины возвести в квадрат и результат сложить: 2Dh = 2(A42.1--A42)* I 2. В разбираемом примере этот расчет показан в последних несколь- ких строках табл. 6. Таблица 6 Расчет дисперсий 4 •4. 6 —4 16 —6 36 2 V2=60 .60 М» = -гг= 10 “ о 2 0^=112= C2J I 2 D|=160= С2 Сумма центральных отклонений для ряда частных, средних второго : -признака по первому Cz-i = 01.5 = 112. Это—величина именованная и поэтому имеет значение только для небольшой группы, которая доступ- на изучению. Чтобы выяснить, насколько велика эта величина, необходимо отне- сти ее к сумме центральных отклонений по всему второму признаку 55
(С2), которая рассчитывается о.бычным путем по разностям между каж- дой датой и общей средней изучаемого признака. Оказалось, что C2=SD2=160. Это значит, что степень разнообразия второго признака, связанная с изменчивостью всех факторов, влияющих на его развитие, выражается для разбираемого примера числом 160. Разнообразие этого же признака, происшедшее в связи с тем, йто первый признак принимал, различные, постепенно увеличивающиеся зна- чения, выражается меньшим, числом С2.1 = 112. Отношение этих двух показателей — частного и общего разнообразия — есть квадрат корреля- ционного отношения второго признака по первому: 2 С2-1 = Ч — = 0,70. Корреляционное отношение второго признака по первому для рас- сматриваемого примера Величина корреляционного отношения не может быть больше еди- ницы и меньше нуля: этот показатель не может быть отрицательным. Значение Ц21—0,84 свидетельствует о сильной корреляционной свя- зд второго признака с первым. Может возникнуть вопрос — зачем понадобился новый показатель; нельзя ли в этом случае измерить степень связи при помощц основного показателя — коэффициента корреляции? . Для решения этого вопроса достаточно рассчитать коэффициент корреляции для случая явно криволинейной связи, например, для толь- ко что изученной группы из .6 особей. Таблица 7 Малый коэффициент корреляции при большой' криволинейной связи V1 4 4 6 6 8 8 S Vi=36 36? 6 v2 8 4 14 18 4 12 S V2=60 60a С -7СП - Ifin i \j\j —— iw 6 16 16 36 36 64 . 64 S Vf=232 ~ . 36-60 2Г>1О2=368—— =+8 64 16 196 324 16 144 S V|=760 +8 W2 32 16 84 108 32 96 2 17^2=368 Г 16-160 + ’ ° Получился очень малый коэффициент корреляции (г= +0,16), что- находится в явном противоречии и с видом корреляционных рядов и с величиной корреляционного отношения. Объясняется это тем, что коэф- фициент корреляции не может характеризовать степень криволинейной связи. На практике расчет корреляционного отношения проводится по спе- циальным рабочим формулам. Применение этих формул показано в табл. 8. 56
Таблица 8 Вычисление корреляционного отношения второго признака (2) по первому (1) и ряда частных средних СВОЙСТВА КОРРЕЛЯЦИОННОГО ОТНОШЕНИЯ Корреляционное отношение измеряет степень корреляции при лю- бой ее форме. Кроме того, корреляционное отношение обладает рядом других свойств, представляющих большой интерес в статистическом анализе корреляционных связей. В отличие от коэффициента корреляции, который дает одинаковую меру связи признаков (первого со вторым и второго с первым), корреля- ционное отношение второго признака по первому обычно не бывает рав- но корреляционному отношению первого признака по -второму: *]2.1^ТЦ-2 . На первый взгляд это кажется невозможным. Казалось бы, между двумя признаками может быть только одна связь, которая в данный момент всегда равна самой себе,-независимо от того, с какого признака мы начинаем ее измерять: от второго к первому или наоборот. 57
На самом деле, это положение, не всегда подтверждается практикой, измерения обратных связей в биологии. Конечно, если изучается связь между такими парами признаков, как длина и ширина тела, цвет волос и цвет глаз, вес и объем продукта, урожай на соседних делянках, равенство обратных связей не подлежит сомнению. Однако существуют такие пары коррелируемых признаков, для ко- торых очевидно, что обратные свяйи не могут быть равны; Например, связь с возрастом различных признаков животных и растений всегда Рис. 8. Графическое изображение зависимости удоя от возраста (I) и воз- - раста от удоя (II) имеет характер односторонней зависимости. Вес, размеры, объем, про- / дуктивность, плодовитость, жизненность имеют явную зависимость от возраста, но сам возраст изменяется совершенно независимо от этих признаков: он регулярно и неотвратимо, увеличивается с каждым днем, месяцем, годом. Связь урожая с количеством осадков или с темпера-, турой, также имеет характер явно односторонней зависимости: урожай •связан с температурой воздуха, но температура воздуха не зависит от урожая. Это неравенство обратных связей между условиями жизни и жиз- ненными функциями и отражается в неравенстве двух обратных корре- ляционных отношений. Неравенство обратных связей может быть столь велико, что одно из корреляционных отношений, например второго признака по первому,, может иметь достаточную величину, а другое (первого признака по вто- рому) равно нулю. Такой случай показан в табл. 9 и на рис. 8. В табл. 9 приведено схематизированное распределение двух приз- наков: 1) возраста (число отелов) и 2) удоя за лактацию (центнеров). Кроме корреляционной решетки, сбоку и снизу даны ряды частных сред- них: М2.1 — удоя по возрасту и . 2— возраста по удою и три показа- теля корреляции: г=0, ц2. i = 0,51, t]i.2=0. Оба ряда частных средних изображены на графиках рис. 8. ОШИБКА РЕПРЕЗЕНТАТИВНОСТИ КОРРЕЛЯЦИОННОГО ОТНОШЕНИЯ Еще не разработано точной формулы ошибки репрезентативности корреляционного отношения. Обычно приводимая в учебниках формула N Имеет недостатку которыми не всегда можно прене- •58
Таблица 9 Корреляционная решетка и два ряда частных средних: удоя по возрасту и возраста по удою (схема); 1-й признак—возраст в отелах, 2-й признак—удой за лактацию, Ц \ 1 2 \ 1 2 3 4 5 6 7 8 9 10 11 п2 м,.2 60 1 1 1 1 1 5 6,0 55 1 1 1 2 1 1 1 8 6,0 50 1 2 3 5 5 5 3 2 1 27 6,0 45 1 1 1 4 10 10 10 4 1 1 1 44 6,0 40 1 2 4 6 8 9 8 6 4 2 1 51 6,0 35 1 3 6 8 7 7 7 8 6 3 1 57 6,0 30 3 6 5 5 5 5 5 5 5 6 3 53 6,0 25 4 5 3 - 2 2 1 2 2 3 5 4 53 6,0 20 4 3 2 1 1 1 1 1 2 3 4 23 6,0 15 4 1 1 1 —— — 1 1 1 4 14 6,0. «1 18 22 25 32 40 41 40 32 25 22 18 314 6,0 Л42-1 25,0 30,0 34,0 37,6 40,0 40,7 40,0 37,5 34,0 30,0 25,0 г=0,00; т)2.1=0,51; t)i-2=0,00 бречь. Эта формула не учитывает числа классов корреляционной ре- шетки, по которой рассчитывается корреляционное отношение. Если один и тот же материал разбить по первому признаку (аргу- менту) на большое или малое число классов, то это различие в числе классов очень заметно скажется на величине выборочного показателя криволинейной связи и на его достоверности. В настоящее время можно использовать примерное значение ошибки не самого корреляционного отношения, а его квадрата т]2: . 4 / /^'=(1 -Т]2) ; где —ошибка квадрата корреляционного отношения; g— число классов первого признака (в верхней крайней строке корреляционной решетки); N ~ объем корреляционной решетки. При использовании этой ошибки для определения критерия досто- верности и доверительных границ квадрата корреляционного отношения вместо критерия Стьюдента следует брать преобразованный критерий Фишера (F), применяющийся в дисперсионном анализе . как критерий достоверности показателей силы влияния. Критерий достоверности (К) и доверительные границы квадрата корреляционного отношения (ц2) определяются по следующим форму- лам:. |V1 =g— 1 1 |v2 = — g| т]а = т]3 + A Д = Fsttn^ В этих формулах F—критерий достоверности квадрата корреляци- онного отношения, основанный на применении примерной формулы ошибки этого показателя. Этот критерий в точности равен критерию Фи- шера; 59
= (1 — т]2) И2—квадрат корреляционного отношения; ——!-----ошибка репрезентативности квадрата корреля- ционного отношения; Vi=g—1 —> первое число степеней свободы, равное числу классов первого признака без одного; v2=N—g — второе число степеней свободы, равное объему корреляционной решетки минус число классов, первого признака; \—Fsttn^—погрешность, возможная при оценке генераль- ного значения корреляционного отношения; Лг — стандартные значения преобразованного кри- терия Фишера, приведенные в табл. IX для трех порогов вероятности безошибочных про- гнозов и для двух степеней свободы. Пример 22. В примере, показанном в табл. 8, получены показа- тели Л/=21, т)2 = 0,76, £=5 (число классов первого признака). , Ошибка репрезентативности квадрата корреляционного отнршения: = (1 — 0,76) - = 0,06. 21 5 Критерий достоверности: F = -21ZL = 12,7; V1= 5~ 1= 4’ р =(3,0 — 4,8 — 7,9).. 0,06 === v2 = 21 —5=16; - Возможная погрешность в оценке генерального параметра: Л = Fstm^ = 3,0-0,06 = 0,18. Доверительные границы квадрата корреляционного отношениям ।—не более 0,76 ф-0,18 = 0,94 т]2 = 0,76 ± 0,18— . . '—не менее 0,76 — 0,18 = 0,58 Доверительные границы корреляционного отношения П = (]/0,58 ч-1/0,94) = (0,76 -ч- 0,97). КРИТЕРИЙ КРИВОЛИНЕЙНОСТИ Все обычно наблюдаемые связи в той или иной степени криволи- нейны. Точно прямолинейная связь является редчайшим исключением. Однако некоторые связи имеют такую незначительную степень криволи- нейности, что практически их можно принять за прямолинейные и этим значительно облегчить все дальнейшие работы по определению частной , корреляции и исследованию простой и множественной регрессии. Для практических целей необходимо установить порог криволиней- ности, перейдя который связь уже не может считаться прямолинейной. Установление такой границы лучше производить исходя из квадратов корреляционного отношения и коэффициента корреляции по формуле ГЕ_А>Л„ Г‘ = г-2|. 60
где g = q2—г2 — показатель криволинейности; .т^ = (1 — q2) — ошибка показателя криволинейности; N, g — объем корреляционной решетки и число клас- сов по первому признаку; Fst — стандартные значения критерия Фишера, опре- деляемые по IX табл., для трех порогов веро- ятности безошибочных порогов по двум степе- ням свободы. Соединив формулы для g и можно получить сводную формулу критерия криволинейности F = (П2-''2) QV-g) > F К = g — 21 6 (1-q2)(g —2) s4v2 = AC- Пример 23. В примере, показанном на табл. 9 и рис. 8, получены показатели: 1V=314, g = 11, q2=0,512=0,26, r2=0,00. Критерий криволинейности v1= 11—2 = 9, (O.;_26-O1OO)(314-llL==1 5 314_11=303 5 (1 — 0,26) (II-2) =^-~- 2 ’ Fs/= {1,9 — 2,5 — 3,4}. ПОЛНЫЙ КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Во многих исследованиях, когда форма связи между коррелируе- мыми признаками неизвестна, требуется определить все три показателя .корреляции — коэффициенты прямолинейной и криволинейной связи ,(г, q) ц критерий криволинейности (|) для того, чтобы выяснить, можно Ли считать связь прямолинейной. ’ _ , Если связь может считаться прямолинейной, то все .последующие работы по разработке практических приемов использования связей в виде формул регрессии и номограмм значительно упрощаются. ’ Если же связь уже не может считаться прямолинейной, то вся по- следующая работа по исследованию закономерностей регрессии значи- тельно усложняется: становится необходимым анализ формы регрессии (т. е. уровня, наклона и изгиба линий регрессии), выведение специаль- ных эмпирических формул, составление сложных криволинейных номо- грамм. Для решения вопросов о степени и форме корреляционных связей можно составить единую программу вместо раздельного нахождения трех показателей. Такая программа представлена в алгоритме 18, где приведено описание полного корреляционного анализа, который дает возможность изучить все основные детали сопряженного разнообразия двух одновременно изучаемых признаков. В алгоритме даны способы расчета пяти показателей: 1) показателя прямолинейной связи в форме квадрата коэффициента корреляции; 2) критерия достоверности квад- рата коэффициента корреляции; 3) показателя криволинейной связи в форме квадрата корреляционного отношения; 4) критерия достоверно- сти квадрата корреляционного отношения; 5) критерия криволиней- ности,'— сведенные в один алгоритм. Достоверность всех трех показате- лей в алгоритме 18 определяется одинаково по преобразованному кри- терию Фишера, стандартные значения которого приведены в сгабл. IX. 61
ДИСПЕРСИОННЫЙ АНАЛИЗ Изучение дисперсионного анализа лучше начинать с освоения эле- ментарных технических приемов определения силы и достоверности влияния одного или нескольких факторов на изучаемый результативный признак. ОДНОФАКТОРНЫЕ КОМПЛЕКСЫ Г В тех случаях, когда требуется изучить действие одного фактора,, производится анализ однофакторных дисперсионных комплексов, орга- низация которых может* быть показана на следующем примере. Пример 24. Для испытания нового снотворного средства изучается несколько степеней действия фактора — пять увеличивающихся доз: 1, 2, 3, 4 и 5 единиц фактора (грамм, минут, действия и т. д.). Для каждой дозы подбираются рендомизированно (random — случайно, наугад) не- сколько подопытных объектов. По установленным дозам снотворного’ взято пациентов по первой 3, по второй 4 и далее: 5, 4, 4. Степени интенсивности (действия) фактора называются градация- ми фактора. Частные группы, подобранные для каждой градации фактора, назы- ваются градациями дисперсионного комплекса. У каждого объекта, вошедшего в комплекс, измеряется результа- тивный признак, например увеличение продолжительности сна в часах: для каждого больного под влиянием данной ему дозы фактора. И, нако- нец, для каждой градации вычисляются частные средние результатив- ного признака. Таким образом получается дисперсионный комплекс, показанный- на табл. 10. • Т а б л ица 10 Однофакторный дисперсионный комплекс (по 19-му алгоритму) Градации фактора 1 2 ’ 3 4 5 г=5 Даты -V Объем-градаций п . . . Сумма дат SV SV Частные средние ЛД= —- 2,3,1 3 6 2 4,3,6 3 4 16 4 5,6,4 6,9 5 30 6 9,7 6,6 4 28 7 3,6 5,6 4 .20 5 N=20 2SV=100 100 _ = — =5 s 20 Решение дисперсионных комплексов начинается с рассмотрения ря- да частных средних. В комплексе (табл. 10) ряд частных средних (Л4^ = 2—4—6—7—5} указывает на заметное влияние изучаемого средства. Средняя прибавка часов сна увеличивается в общем ’соответственно усилению дозы снот- ворного: слабые дозы (1, 2) дают и слабую прибавку, сильные дозы (3, 4, 5) вызывают более продолжительный сон. Ряд частных средних, нанесенный на график (рис. 9), дает нагляд- ное представление о всех деталях действия фактора. После рассмотрения ряда частных средних производится расчет по- казателей дисперсионного анализа. Все расчеты по однофакторным комплексам для количественных признаков показаны в алгоритмах 19^ 20, 21. . ; ' . 62
Приводимое ниже описание техники решения однофакторных комп- лексов построено на примере 19-го алгоритма. Очень полезно предвари- тельно внимательно просмотреть этот алгоритм и пользоваться им при изучении пояснений. " Рис. 9. Действие снотворного средства (пример 24, табл. 10). РАСЧЕТ ПОДСОБНЫХ ВЕЛИЧИН В начале рассчитываются следующие вспомогательные величины (числовые Примеры по 19-му алгоритму). 1. Сумма дат по всему комплексу: SSV = 6 + 16 + 30 + 28 + 20 = 100. 2. Общая подсобная величина: . ' н S = = J2ot = 5OO. N 20 3. Сумма частных подсобных величин: 2Я,= 12 + 64 + 180+ 196+ 100== 552. Отдельные частные подсобные величины рассчитываются по,каждой градации — это квадрат суммы,дат по градации, деленный на объем этой градации. Например: //1 = ТО==^=12. я2 = ^ = 64т. д. «13.4 4. Сумма квадратов дат по всему комплексу — 22 V2. Для избежа- ния ошибок внимания можно предварительно рассчитать 2V2 сумму квадратов дат отдельно по каждой градации, а затем эти частные-суммы. Сложить: 22V2 = 14 + 70+194 + 202 + 106 = 586. 63
РАСЧЕТ ДИСПЕРСИЙ (СУММ КВАДРАТОВ) В однофакторном дисперсионном , комплексе рассчитываются три дисперсии: факториальная (Сж), случайная (Cz) и общая (Су). Сх — факториальная (межгрупповая) дисперсия, сумма взвешен- ных квадратов центральных отклонений частных средних по градациям (или по группам) от общей средней по всему . комплексу: Сж=2п(ЛК—М2)2. Рассчитывается по. рабочей'формуле Сх = 2Hl -'Hz = 552 — 500 = 52. Cz— случайная (внутригрупповая) дисперсия, сумма квадратов центральных отклонений дат от своей частной средней: CZ = S(V—М^)2. Рассчитывается по рабочей формуле Cz = SV2 — = 586 — 552 = 34. Су — общая дисперсия, сумма квадратов центральных отклонений дат от общей средней по всему комплексу Су=^(У—Рассчиты- вается по рабочей формуле ч Су = 2V2 — = 586 — 500 = 86. На основе" трех дисперсий однофакторного комплекса можно рас-, считать оба заключительных показателя дисперсионного анализа. Показатель силы влияния: Л2 = Сх/Су = 52/86 = 0,605. , Показатель достоверности влияния: к р — с* N~r 52 ' .20 — 5 _57 — Сг ‘ г— 1 ~ 34 ‘5 — 1 ~~ ’ Это обстоятельство объясняет и название анализа: дисперсионный. Но, учитывая, что в большинстве работ показатель достоверности рас- считывается по отношению варианс, необходимо остановиться на исполь- зовании этих величин. Кроме того, вариансы требуются и для определе- ния ошибок репрезентативности показателей силы влияния по некото- рым формулам. 1 РАСЧЕТ ВАРИАНС В однофакторном дисперсионном комплексе рассчитываются две вариансы: факториальная (межгрупповая) и случайная (внутригруппо- вая), причем каждая варианса равна дисперсии, деленной на число сте- пеней свободы. где ох — факториальная варианса, равная факториальной дисперсии, деленной на число степеней свободы, равное числу классов без одного: о2 = —С* = 52 = 13,00. * г—1 5—1 64
ol —случайная варианса, равная случайной дисперсии, деленной на число степеней свободы, равное объему комплекса без чис- ла градаций: _9 СГ, = ----------- г N — r 34 20 — 5 = 2,27. ПОКАЗАТЕЛЬ СИЛЫ ВЛИЯНИЯ Показатель силы влияния равен отношению факториальной диспер- сии к общей. Он определяет ту долю общей дисперсии, которая прихо- дится на факториальную дисперсию, или долю влияния изучаемого фак- тора в общей сумме влияния всех вообще факторов, определяющих ве- личину и разнообразие результативного признака. Вычисляется показатель'силы влияния по формуле , = — = — = 0,605. х Су 86 Полученный показатель силы влияния г\х =0,605 (19-й алгоритм) вскрывает достаточно сильное действие проверяемого снотворного сред- ства в разных дозах, обнаруженное у 20-ти больных. Среди всех факто- ров, определивших увеличение продолжительности сна, 61% пришелся на действие изученного снотворного средства, конечно, при всех тех условиях, в которых протекал эксперимент. ' Описанный способ определения силы влияния может применяться во всех случаях изучения действия одного фактора на количественный результативный признак при организации ортогональных (равномерных и пропорциональных) комплексов. Не требуется производить никаких дополнительных поправок ни к дисперсиям, ни к вариансам, рассчитан- ным указанными здесь способами. ПОКАЗАТЕЛЬ ДОСТОВЕРНОСТИ ВЛИЯНИЯ Показатель достоверности влияния определяется по преобразован- ному критерию Фишера по формуле vx = г — 11 ,v2 = N — rl ' где F — эмпирический критерий достоверности силы влияния, равный отношению варианс:. факториальной к случайной F=--------- = 5,7 (19-и алгоритм); 2,27- Fst — стандартные значения критерия Фишера (табл. IX), Vi, vs — первая и вторая степени свободы, по которым в табл. IX нахо- дятся стандартные значения критерия Фишера, N, г — объем комплекса и число градаций. Для того чтобы выяснить достоверно или не достоверно влияние фактора, изучаемое в выборочном дисперсионном комплексе, необходи- мо сравнить эмпирическое значение F со стандартным значением Fst критерия Фишера, найденным в табл. IX для двух степеней свободы; 5 Н. А. Плохинский 65
vi = r—1=5—1=4 и V2=N—r=20—5=15. Стандартные значения крите- рия Фишера для этих степеней свободы равны V1=-*’ = {3,1 —4,9 —8,3}. v2 =15, При испытании снотворного получен эмпирический показатель до- стоверности, превышающий второе стандартное значение: f = 5,7>4,9. Влияние снотворного оказалось вполне достоверным по второму порогу вероятности безошибочных прогнозов (вероятность 0>О,99). В биологических исследованиях могут получиться любые показа- тели достоверности влияния от Е=1 до нескольких десятков и даже со- тен. При F^Fst, т. е. когда эмпирический показатель силы влияния ра- вен или больше минимального стандартного значения Fst, или того зна- чения Fst, которое соответствует принятому в исследовании порогу веро- ятности безошибочных прогнозов, влияние может считаться достовер- ным. Это значит, что при F^.Fst можно ожидать с определенной вероят- ностью, что влияние, подобное тому, которое обнаружено в выборочном комплексе, свойственно и всем тем генеральным совокупностям, кото- рые соответствуют градациям изученного комплекса. В отношении испытания снотворного средства можно с большой уве- ренностью прогнозировать эффективное действие этого средства и при массовом применении к больным изученной 'категории. При F<zFFt, т. е.. когда эмпирически полученный показатель досто- верности влияния оказывается меньше нужного в данном случае стан- дартного значения критерия Фишера, влияние, обнаруженное в выбо- рочном комплексе, считается недостоверным. Это значит, что та мера влияния, которая была найдена при анализе выборочного комплекса, имеет полное значение только для исследован- ной группы объектов. Перенести эту меру влияния на все генеральные совокупности, соответствующие градациям комплекса, нельзя: недосто- верность показателя влияния не дает права ни подтвердить, ни опро- вергнуть подобное влияние в этих генеральных совокупностях. Ошибка репрезентативности показателя силы влияния Еще не найдено точной формулы ошибки репрезентативности выбо- рочного показателя силы влияния. Но ввиду крайней необходимости иметь хотя бы приближенное значение этой ошибки,, можно использо- вать одну из модификаций критерия Фишера, которая дает критерий достоверности в форме отношения показателя силы влияния к его ошибке. Ошибку репрезентативности выборочного показателя силы влияния в однофакторных комплексах можно определить по формуле т 2 = (I — л?) f ~ 1 - , к N—r ’ где win2 — ошибка показателя силы влияния; — выборочный показатель силы влияния; N, г — объем и число градаций для всего выборочного комплекса. 66
Если W=20, г=5, т]2 =0,605 (19-й алгоритм), то ошибка показателя силы влияния равна m 2 =(1 — 0,605)= 0,105. .4 ' > 20 — 5 Ошибка репрезентативности помогает провести определение досто- верности влияния без вычисления варианс. Определение показателя достоверности силы влияния производится . обычным способом, как отношение показателя силы влияния к' его ошибке, но оценка этого показателя производится по критерию Фишера, а не Стыодента: Q==-21_>Fsfv1==r-1 | \ mt?x I v2 —N — г j где Ф—новый показатель достоверности силы влияния; Лх, т^х—показатель силы влияния и его ошибка; Fst—стандартные значения показателя Фишера. Если N = 20, г=5, т]* = 0,605, т„2 =0,105 (19-й алгоритм), то досто- верность силы влияния новым способом определяется так: Ф = А^-=5,7; V1 = 5—1==4, Fst= {3,1 — 4,9-8,3}. 0,105 =’ v2 = 20 —5= 15, st - 1 Новый показатель достоверности влияния (отношение показателя силы влияния к его ошибке) дает в точности такие же результаты, как и' : классический способ (отношение факториальной вариансы к случайной) . Определение доверительных границ генерального параметра силы влияния производится приближенно, пока не найдено точного способа, следующим образом: ' Лх = Лх ± А . А = Fstm 2 , -------------- '1у где л*, Лх— генеральный параметр и выборочный показатель силы влияния; Д — погрешность, возможная при определении генерально- го параметра; Fst — стандартные значения критерия Фишера (а не Стыо- ' 7 дента!) (табл. IX) при vi = г—1, v2=W—г; ’ . ? т^2—ошибка выборочного показателя влияния. Для комплекса 19-го алгоритма (М=20, г=5, л? = 0,605, т 2 =0,105, vi=4, V2=45) доверительные границы генерального параметра опреде- ляются следующим образом (при рх = 0,95: Esi(vi=4, V2=15)=. , = {3,1—4,9—8,3}, Д = 3,1 -0,105 = 0,326; •' Z 2л ллк.л 49R [не болре 0,6054-0,326 = 0,93; ' менее 0,605-0,326 = 0,28. : < Прогноз величины-генерального параметра В данном случае может быть дан при очень широкой амплитуде (284-93%) вследствие малочис- ленности выборочного комплекса. Для уточнения оценки требуется; црр--; .. вести исследование при большем объеме' комплекса. S* 67/
На основании проведенной работы можно пока заключить, что гене- ральная сила влияния изучаемого фактора может быть не менее 28% от силы влияния всех вообще факторов, определяющих величину резуль- тативного признака: Все действия, связанные с использованием ошибки репрезентативно- сти показателя силы влияния, показаны в алгоритме 19. ' ФОРМЫ ИТОГОВОЙ ЗАПИСИ РЕШЕНИЯ ОДНОФАКТОРНЫХ ДИСПЕРСИОННЫХ комплексов Запись результатов дисперсионного анализа однофакторных комп- лексов может быть произведена в различной форме, в зависимости от того, насколько подробные сведения при этом требуются. Полная, сокращенная и краткая формы записи показаны в табл. 11,' 12, 13. Таблица 11 Полная запись результатов дисперсионного анализа однофакторного комплекса (форма № 1) Фактор—снотворное средство , Градации: дозы средства 1,2,3,4,5 Результативный признак: прибавка часов сна после приема снотворного Комплекс , Градации г=5 1 2 3 4 5 Даты V 2,3,1 4,3 6,3 5,6,4 6,9 9,7 6,6 3,6 5,6 SV=100 п 3 4 5 4 4 А=20 Mi 2 4 6 7 5 Mz=5 Разнообразие Дисперсии С Степени свободы v Вариансы а8 Факториальное Случайное Общее 52 34 86 4 15 19 13,00 2,27 13, 00 F= —=5,74 2,27 = Показатель силы влияния Т)2=0,605±0,105, й2={ 0,28-М), 93}, vx=4, v2=15, fs/={3> 1—4,9—8,3}. ДВУХФАКТОРНЫЕ КОМПЛЕКСЫ / Для изучения влияния на результативный, признак двух факторов производится анализ двухфакторных дисперсионных комплексов, при организации которых необходимо соблюдать особые правила,^касающие- ся подбора факторов, разделения факторов на градации и подбора объектов в градации. 68
Таблица 12 Сокращенная запись результатов дисперсионного анализа однофакторного комплекса (форма № 2) Фактор—снотворное средство Градации: дозы средства 1, 2, 3, 4, 5 Результативный признак: прибавка часов сна после приема снотворного Комплекс: А=20, г=5, п=3, 4, 5, 4, 4 X Z У С 52 34 86 Т]2 0,605 0,395 1,000 V 4 15 19 о2 13,00 2,27 F 5,74 ^={3,1 -4,9—8,3} Генеральный параметр ^={0,28-^0,93} Таблица 13 Краткая запись результатов дисперсионного анализа однофакторных комплексов (форма № 3) Фактор—снотворное средство Градации: дозы средства 1, 2, 3, 4, 5 Результативный признак: прибавка часов сна после приема снотворного Комплекс: А=20, ,г=5, п=3, 4, 5, 4, 4 ^=0,605+0,105 ' ^={0^8-0,93} ПОДБОР ФАКТОРОВ При организации однофакторных комплексов фактором считается любое воздействие, влияние которого на результативный признак тре- буется изучить. Это могут быть другие признаки того же животного или растения, различные условия жизни, химические или биологические агенты и другие влияния. При организации двух- и многофакторных комплексов свободный выбор факторов для исследования ограничен требованием полной неза- висимости их между собой. Для таких комплексов нельзя в качестве двух факторов брать, например, вес и размер животных, так как эти признаки нельзя подбирать независимо друг от друга: при малом весе невозможно подобрать такие же значения размера, как и при большом весе. Независимыми факторами могут быть, например, температура и влажность, пол и уровень кормления, химическое и биологическое воз- действие. РАЗДЕЛЕНИЕ ФАКТОРОВ НА ГРАДАЦИИ При проведении дисперсионного анализа не требуется, чтобы фак- торы были разделены обязательно на количественные градации в форме вариационного ряда. Как для однофакторных, так и для двух- и много- 69
факторных комплексов факторы могут иметь и качественные градации, например, пол — мужской, женский; цвет волоса или пера — светло-се- рый, серый, темно-серый; упитанность — жирная, выше средней, средняя, ниже средней; крепость телосложения — слабая, нормальная, сильная. При установлении градации факторов нужно помнить, что резуль- тэты дисперсионного анализа в большой степени зависят от того уров- ня, на .котором установлены градации факторов. . < Если, например, изучается.действие температуры, то при градациях 15°, 20, 25°С может быть найдено достоверное влияние этого фактора на результативный признак, но это совсем не значит, что такое же влия- ние будет при другом уровне градаций, например 5°, 10, 15° С. Большое значенйе также имеет уровень группы неорганизованных факторов, которые составляют фон дисперсионного анализа. Например, комбинированное действие возраста и какого-нибудь стимулятора ожи- f .ренид .дает при одном уровне кормления и содержания определенный эффект, а при другом, например скудном кормлении и плохом содержа- •! ,нии, может и совсем не проявиться. При организации двухфакторного комплекса каждый фактор разде- ляется на градации с таким расчетом, чтобы для каждой градации пер- вого фактора было подобрано одинаковое число одинаковых градаций . второго фактора. Это правило иллюстрируется на двух комплексах табл. 14. . Таблица 14 Правильная и неправильная организация двухфакторного . комплекса Факторы Градации А—пол................ —мужской, А2—женский В—возраст . . . . Bj_—20 лет, В2—30 лет, В3—40 лет Организация комплекса Правильная , Неправильная ПОДБОР ОБЪЕКТОВ ИССЛЕДОВАНИЯ .. .. • . Результаты дисперсионного анализа зависят от того, насколько пра- " вильно.подобраны объекты исследования как по качеству, так и .по коли- честву. - , ; . Пр своему качеству объекты должны отражать те генеральные сово- купности (по градациям комплекса), для изучения которых проводится У исследование. По величине результативного признака объекты должны быть взяты случайно,без учета (при отборе) степени развития изучае- : мого признака. Измерение и учет развития признака производятся после . ; отбора объектов в выборочный комплекс. Нарушение принципа случай- ности при отборе объектов для дисперсионного анализа всегда приводит к неправильным, нерепрезентативным результатам. . 70
Организация дисперсионного комплекса с выполнением принципа случайности отбора объектов называется рендомизацией, а комп- лексы, организованные таким образом, называются рендомизиро- ванными. По количеству объекты могут распределяться по градациям факто- ров различными способами: поровну, пропорционально, неравномерно. В соответствии с этим комплексы бывают равномерными, пропорцио- нальными и неравномерными; различия между ними показаны в табл. 15. Таблица 15 Равномерные, пропорциональные и неравномерные комплексы В равномерных и пропорциональных комплексах отношения объе- мов градаций по второму фактору одинаковы для каждой градации первого фактора. Такое распределение объектов по градациям двухфак- торного комплекса определяет особые ортогональные свойства диспер- сионных комплексов, которые уже достаточно изучены и положены в основу современных простых и точных методов определения силы влия- ний. Комплексы, обладающие этими свойствами (равномерные и пропор- циональные) , называются ортогональными. В некоторых случаях можно полученный .неравномерный' комплекс преобразовать в пропор- циональный или в равномерный путем рендомизированного изъятия отдельных единичных дат. ПРЕОБРАЗОВАНИЕ ЗНАЧЕНИЙ РЕЗУЛЬТАТИВНОГО ПРИЗНАКА Для облегчения счетной работы можно значения результативного признака, неудобные для счета (многозначные, дробные), преобразовать в удобные — малозначные и выражаемые целыми числами. После проведения всей счетной работы с преобразованными датами показатели ц? — CiiCy, Е = о7/Стг получаются точными и не требуют ни- С SV каких поправок. Другие показатели C = SD2, сг2 = —, М —---требуют v п восстановления, что легко сделать путем применения действий, обрат- ных тем, при помощи которых были преобразованы варианты результа- тивного признака. ^Возможны следующие преобразования. > 1. Все даты можно, разделить на одно и то же число k. Это делается ие только тогда, когда все значения делятся на это число без остатка, но и в случае перехода к новым единицам измерения. Если, например, признак выражен в миллиметрах большими числами, с большим разма- 71 1
хом крайних значений, то простая перемена единицы измерения на сан-' тиметры будет равносильна делению всех чисел на 10. Точно так же пе- ремена единицы измерения годового удоя с килограммов на центнеры равносильна делению всех чисел на 100,,что можно сделать при большом размахе значений удоя в пределах изучаемого комплекса. При пере- мене единицы измерения не требуется никаких поправок в новых едини- цах, результаты получаются точными. Если деление происходит без измененйя единицы измерения, то в- конечные результаты надо внести соответствующие поправки: С—ЪО2 и cr2=C/v надо умножить на k2, а М = умножить на k. п 2. Все значения можно умножить на одно и то же число k. Это де- лается. тогда, когда даты выражены дробными числами, например 0,25,. 0,37 и т. д. Умножая все даты на 100, можно получить целые двузнач-. ные числа, удобные для счета. Поправки в конечные результаты при таком преобразовании надо вносить обратные тем действиям, которые производятся при преобра- зованиидат. 3. От всех значений можно отнять одно и то же число А. Это лучше делать, когда даты образуют небольшой размах и деление их на число k или умножение с последующим .округлением может заметно снизить имеющиеся разнообразия результативного признака. Поправку в окон- чательный результат при этом способе преобразования требуется вно- сить только для средней арифметической М:. нужно прибавить число А. Значения С, ц2, a2, F,никаких поправок не требуют: они получаются точ- ными в первоначальных единицах. Вычитать лучше наименьшие зна- чения. 4. Можно сделать двойное преобразование, аналогичное тому, кото- рое проводят при расчете Мне для больших групп на основе условных отклонений, выраженных в классовых промежутках. Из каждого значе- ния можно вычесть одно и то же число А, а полученный результат раз- делить на другое число k. Полученные после такого преобразования С и о2 для восстановления нужно умножить на k2, а М умножить на k и прибавить к произведению А. Величины q2 и F в этом случае не тре- буют никаких поправок. . Основные способы преобразования дат с указанием требуемых по- правок для конечных результатов приведены в табл. 16. Таблица 16 Способы преобразования дат и поправки для восстановления конечных результатов при дисперсионном анализе Способ преобразования Что надо сделать, чтобы исправить конечные результаты анализа, проведенного на преобразованных датах C=SD2 ci ч2=тА- а |Г -г |О 2 аг м V умножить поправка - умножить поправка умножить. k на № не нужна на fe2 не нужна на k Vk разделить на k2 то же разделить на k2 то же разделить- на k V—А поправка не нужна поправка не нужна « « прибавить А / V—A k 72 умножить на fe2 « « умножить на k2 « « умножить на k и прибавить А
АНАЛИЗ ДВУХФАКТОРНЫХ КОМПЛЕКСОВ . Техника анализа двухфакторных комплексов для количественных признаков показана в алгоритмах 23, 24. Сильно облегчит усвоение си- стемы расчетов предварительный внимательный просмотр этих алгорит- мов й последующее сравнение результатов в Приводимом ниже описа- нии с результатами, полученными в алгоритмах 23 и 24. Анализ двуХфакторных ортогональных комплексов можно показать, на следующем примере. . Пример 25. Проводились испытания стимулятора многоплодия при разной полноценности рационов. Полноценность рациона (первый фактор) была представлена двумя градациями: Ai — рацион с недостатком минеральных веществ, А2— рацион, полностью сбалансированный по всем питательным веществам,, включая и минеральные. ' Стимулятор (второй фактор) испытывался в трех дозах: —оди- нарная доза, В2— двойная доза, В3— тройная доза. Результативным признаком была плодовитость самок, измерявшая- ся числом детенышей в помете, полученном после применения стиму- лятора. Для каждого сочетания градаций рациона и стимулятора были по- добраны по методу аналогов три одновозрастные самки. Это испытание было организовано в форме двухфакторного равно- мерного дисперсионного комплекса с трехкратной повторностью. Пер- вичные материалы исследования показаны в табл. 17. Т аблица 17 Двухфакторный равномерный дисперсионный комплекс Рационы А Л1 Лэ ГА~2 Дозы стимулятора В . . Вг в2 Вз Вг В2 Вз ГВ—3 Плодовитость V ... . Число самок п 2V Средняя плодовитость Мj 5,6,7 3 18 6 4,3,5 3 12 4 2,3,1 3 6 2 1,4,1 3 6 2 10,9,11 3 30 10 7,4,7 3 18 6 ’ W=18 SV=90 Ms=5 Просмотр ряда частных средних Начинать анализ двухфакторных дисперсионных комплексов сле- дует также с рассмотрения ряда частных средних по всем градациям- комплекса, т. е. по всем сочетаниям градаций фактора А с градациями фактора В. Лучше пользоваться при этом графиком средних. Для раз- бираемого примера (табл. 17) такой график показан на рис. 10. Ряд частных средних (табл. 17, рис. 10) указывает на следующие особенности изучаемых влияний. 1. Испытываемый стимулятор в данном выборочном комплексе обнаружил влияние на плодовитость: разные градации второго фактора (Bi, В2, В3) дают достаточно различные частные средние результатив- ного признака как при первой, так и при второй градациях первого фактора. Это значит, Что перемена дозы стимулятора изменяет плодо- витость самок. 73
2. Таким же образом обнаружил достаточное статистическое влияние и первый фактор — полноценность рациона. Частные средние во градациям первого фактора (Ai, Аг) достаточно различны: = .18 <12^6 = = 4,0, З^-З^З 9- = 6-> ЗН 18 = = 6 д 3 4>3>3 9 3. Влияние второго фактора в очень сильной степени зависит от того, при какой градации первого фактора он действовал. При неполноценном рационе самая высокая плодовитость наблю- далась при наименьшей дозе стимулятора, очевидно, вследствие того, что это средство содержало комплекс минеральных веществ, отсутст- вовавших в неполноценном рационе. Рис. 10. Влияние на плодовитость рациона' (Л) и стимулятора плодовитости (В): Л), Ai — неполноценный и полноценный рационы; Bi, В2, Вз—одинарная, двойная и тройная дозы стимулятора При увеличении дозы стимулятора на фоне неполноценного рацио- на плодовитость явно уменьшалась, вероятно, вследствие того, что начи- нали усиленно действовать другие ингредиенты стимулятора, ослаб- лявшие организм самок в этих условиях. уНа фоне полноценного рациона действие стимулятора проявилось совершенно: по-другому. Наименьшая доза стимулятора совсем не повы- шала плодовитость, вероятно, потому, что минеральные вещества сти- мулятора в данных условиях уже не имели значения, а остальные ингредиенты при одинарной дозе не оказывали заметного влияния.1 При полноценном рациЪне наивысший эффект покрала двойная доза стимулятора, при увеличении же дозы до тройной эффект сни- жался. Очевидно, что действие стимулятора имеет свой оптимум дози- ровки. Рассмотрение ряда частных средних есть первая фаза дисперсион- ного анализа, дающая общую ориентировку и первое ознакомление с особенностями изучаемых влияний. 74 •
Следующие этапы дисперсионного анализа имеют целью получить количественные характеристики и точные меры влияний, обнаруженных в дисперсионном комплексе при просмотре ряда частных средних. В двухфакторном дисперсионном комплексе анализируется шесть влияний. 1. Влияние первого фактора. 2. Влияние второго фактора. 3. Влияние сочетаний градаций обоих факторов. 4. Суммарное действие организованных (двух) факторов. 5. Суммарное действие неорганизованных (остальных) факторов (случайные влияния). 6. Суммарное действие всех факторов, определяющих величину результативного признака. . . . Анализ ведется по следующим этапам: 1. Расчет подсобных величин. 2. Расчет дисперсий. 3. Определение силы влияний. 4. Характеристика силы влияний. 5. Определение достоверности влияний. 6. Сводка показателей двухфакторного комплекса. 7. Определение ошибок репрезентативности показателей силы влияния. Расчет подсобных величин Подсобные величины для двухфакторного комплекса рассчиты- ваются так же, как .и для однофакторного (числовые значения для при- мера 25, табл. 17). 1. Общая подсобная величина для всех-дисперсий двухфакторного комплекса: tfs = _W_ = J2L = 450. N 18 2. Сумма частных' подсобных величин по всему комплексу: vw v (2Ю2 1 82 ( 122 । 62 । 62 । 302 । 182 1 n • .3 3 3 3 3 3 3. Сумма квадратов дат по всему комплексу: SP = 52 + 62 + 72 + ... + 72 + 42 + 72 = 608. Расчет дисперсий При дисперсионном анализе двухфакторных комплексов в начале рассчитываются шесть исходных дисперсий (сумм квадратов централь- ных отклонений) по шести изучаемым влияниям. 1. С а—дисперсия по первому фактору (по градациям первого •фактора) равна сумме взвешенных квадратов центральных отклонений частных средних по градациям первого фактора от общей средней. Са—^п^Ма—Ms)2 обычно рассчитывается по рабочей формуле: СА = ЪНА-Нъ, где С а — дисперсия по первому фактору; На — частная подсобная величина по каждой градации первого , W (S^)2 . фактора НА = ———; ПА 75
ЯН a — сумма этих величин; И? — общая подсобная величина (450). Расчет величин На, ЯН а н дисперсии С а для разбираемого при- мера (пример 25, табл. 17) показан в табл. 18. Таблица 18 Расчет величин НА, ^НА и Сл ч Градации фактора А п На 1 З^З^-З 9 18^12-рб 36 36? т=144 =468—450=18 2 зч-з-гз 9 6-р36-р18 54 54? --=324 9 / S . 18 90 2ЯЛ=468 - 2. Св — дисперсия по второму фактору — равна сумме взвешен- ных квадратов центральных отклонений частных средних по градациям фактора В от общей средней Св=Яп(Мв—Мв)'2‘ рассчитывается по ра- бочей формуле Св = %НВ — Н-% , где Св — дисперсия по второму фактору; Нв — частная подсобная величина по каждой градации второго' фактора ------------ > 1 пв Н% — общая подсобная величина (450). Для расчета величин Нв требуется выбрать даты, относящиеся к каждой градации второго фактора из, всех градаций первого фактора. Расчет величин Нв, ЯНВ и дисперсии Св показан в табл. 19. Таблица 19 Расчет величин 71 в< %НВ и Св Градации второго фактора п 27 нв Со=2Я„—Яу= LJ & =486—450=36 1 з-^з 6 18-^6 24 242 6 ~96 2 3->3 6 12^30 42 422 —-=294 6 г. 3 з-^з 6 6-^18 24 - 24? —=96 2 18 90 2ЯВ=486 3. Саб — дисперсия по сочетаниям градаций обоих факторов, опре- деляется по.разности: Сав — Сх — С а — Св j, 76
где Cab — дисперсия по сочетаниям градаций обоих факторов; Сх — дисперсия по суммарному действию обоих факторов (описана ниже); С а, Св — дисперсии по первому и второму факторам. Для 25-го примера (табл. 17) дисперсия по сочетанию градаций равна: САВ= 138— 18 — 36 =84. 4. Сх— дисперсия по суммарному действию обоих факторов равна сумме взвешенных квадратов центральных отклонений частных сред- них по всем градациям комплекса от общей средней. Cx=Zn(Mi—Ms)2 рассчитывается по рабочей формуле: Сх = ZHj-Hz} где Сх— дисперсия по суммарному действию обоих факторов; 2ТЛ — сумма частных подсобных величин, по всем градациям комп- лекса; Hs — общая подсобная величина (450). Расчет величин Нс, ^Н, Hs, Сх, Cz, Су показан в табл. 20. Т а б л и ц а 20 Расчет величин Hi, SH[, Hz, Сх, Сг, Су для комплекса в примере 25 (табл. 17) А, -^г ГА=2 И =—=450 2 18 В, Вг в3 в. вг ва гв=3 п 3 3 3 3 3 3 ЛЛ=18 SV 18 12 6 6 30 18 . 2V=90 0^=588—450=138 „ (W яг- п 108 48 12 12 300 108 S f/i=588 С z=608—588=20 2V2 НО 50 14 18 302 114 21/2=608 Cj,=608—450=158 Дисперсия по суммарному действию обоих факторов оказалась равной Сх=588—450 = 138. 5. Cz— случайная дисперсия по суммарному действию неоргани- зованных факторов равна сумме квадратов центральных отклонений каждой даты от частной средней своей градации: CZ—2(V—Мг)2. Рас- считывается по рабочей формуле Cz= 2Р — ZHt где Cz — случайная дисперсия; 2 V2 — сумма квадратов всех дат комплекса; 2Я{ — сумма частных вспомогательных величин по всем града- циям комплекса. Расчет этих величин показан в табл. 20. Дисперсия по румманому действию неорганизованных факторов для примера 25 оказалась равной Cz=608—588=20 (табл. 20). 77
6. Су — общая дисперсия дат по всему комплексу — равна сумме- квадратов центральных. отклонений каждой даты от общей средней комплекса ^ = 5(1/—Afs)2, рассчитывается по рабочей формуле Су= 2Р — Расчет общей дисперсии для примера 25 показан в табл. 20 г Сх=608—450=158. Определение силы влияний Сила влияния измеряется отношением частной дисперсии к общей. Это значит, что сила влияния фактора равна доле, которую составляет- дисперсия по этому фактору в общей дисперсии по всему комплексу, & показатель силы влияния равен отношению частной дисперсии к общей,, что можно выразить единой формулой для всех влияний: Ct Су 2 , где тр — показатель влияния или первого, или второго факторов, ил» сочетания их^градаций, или суммарного действия неорганизо- ванных факторов; Ci — дисперсия одного из изучаемых влияний; Су — общая для всех влияний дисперсия по всему комплексу. Определение показателей силы влияния для 25-го примера (рацио- ны и стимулятор) дало следующие результаты. 1. Влияние первого фактора (влияние разных рационов, испытан- ных в данном комплексе): ' rft = — = — = 0,11 = 11%. 'А Су 158 /0 2. Влияние второго фактора (разных доз стимулятора, испытан- ных в данном комплексе): < = —= —= 0,23= 23о/о. 'в Су 158 /0 3. Влияние сочетания градаций обоих факторов (значение сочета- ний различных рационов с разными дозами стимулятора):- П2 = —= — = 0,53 = 53%. АВ Су 158 - 4. Суммарное действие .организованных факторов (влияние на раз- нообразие плодовитости разнообразия доз -стимулятора при разных рационах): П2 =-^ = — = 0,87 = 87%. ,JC Су 158 0 Проверка: 0,87 = 0,11+0,23+0,53. 5. Суммарное действие неорганизованных факторов (влияние слу- чайных факторов): т]2 = = -JI- = 0,13 = 13%. а Су 158 /0 78
6. Общее суммарное действие всех факторов: Tj2= 1,00= 100%. Проверка: 1,00=0,87+0,13. Показатели силы влияния двухфакторного комплекса приведены, в табл. 21. Таблица 21 Расчет показателей силы влияния в двухфакторном дисперсионном комплексе Влияние Дисперсии С Показатели силы влияний и Первого фактора А . Са=18 2 18 0 11 1л-158-0,1 2 36 Г) оо Второго фактора В Ci САВ~^ Пв-158 2 84 0 53 Сочетания их гра- даций АВ 158 ,5и Организованных факторов Сх=138 • + 138 0 87 X ^-158“°’и7 2 20 о IQ Неорганизованных факторов (случайное) С2=20 Z ^-158 ~°’1о Общее У Су=158 <=1.оо Характеристика силы влияний Разложение общего влияния на его компоненты (табл. 21, при- мер 25) А В АВ X г У 0,11 0,23 0,53 0,87 0,13 100 дает возможность охарактеризовать действие изучаемых факторов с. биологической точки зрения. Биологическую характеристику результа- тов дисперсионного анализа двухфакторных комплексов лучше прово- дить в такой последовательности: 1) суммарное влияние организован- ных и неорганизованных факторов; 2) влияние сочетания градаций;. 3) частные влияния первого и второго факторов. Суммарное действие о р г а н и з о в а н ны'х факторов Для исследованного комплекса (табл. 17, 21) характерна очень, большая доля влияния двух организованных факторов: т]х = 0,87=87%. Это значит, что стимулятор ожирения и полноценность рациона опре- деляли в очень значительной степени то разнообразие плодовитости, какое наблюдалось в исследованной группе самок. 79-
Это сказалось и в необычно малой доле влияния неорганизован- ных факторов: т]1=0,13, т. е. всего 13% от общего влияния всех фак- торов. Влияние сочетания градаций Влияние сочетания градаций обоих факторов возникает вследствие того, что второй фактор обычно действует различно при разных Ьрада- циях первого. То же можно наблюдать и в отношении первого фак- тора: его действие проявляется неодинаково при различных градациях второго фактора. Для разбираемого примера (табл. 21) влияние сочетания града- ций сильно выделяется в суммарном действии обоих факторов (рацио- нов и стимулятора). Разложение факториальной дисперсии Сх на ее компоненты ' х А В АВ С 138 18 % 100 13 36 26 84 61 показывает, что 61 % от суммарного влияния организованных факторов приходится на влияние сочетания их градаций. Как всегда в таких случаях влияние одного фактора сильно зави- сит от того, при какой градации другого фактора он действует. Для разбираемого примера (табл. 17, 21) это значит, что действие стимуля- тора настолько сильно зависит от рационов, что применять этот стиму- лятор, не обращая внимания на полноценность корма, невозможно: при недостатке минеральных веществ в рационах действие этого стимуля- тора не только не повысит плодовитость, но даже может привести к ее снижению. Показатель силы влияния сочетаний градаций фактора цлв —0,53, выявленный в изучаемом комплексе, дал численное выражение тому наблюдению, которое было получено при простом просмотре ряда част- ных средних., Этот показатель подтвердил и уточнил те предположения, которые были описаны выше, в разделе о ряде частных средних по гра- дациям комплекса. Различные случаи сочетания градаций двух факторов показаны в алгоритмах 23, 24, 25, 26, 27, 28. Частные “влияния первого и второго ф ia кторов В разбираемом примере (табл. 21) получено: цА =0,11, гщ=0,23. Эти показатели указывают на то, что в исследованном комплексе влия- ние стимулятора было больше, чем влияние рационов. Но вследствие большого влияния сочетания градаций факторов показатели гц и дв неполно отражают силу действия, с одной стороны, разнообразия' рационов (отдельно от действия стимулятора) и, с дру- гой — стимулятора (отдельно от действия рационов). В данном случае такое занижение показателей не имеет большего значения. Если выявлена большая зависимость действия одного фак- тора (стимулятора) от действия другого фактора (градации рационов), то теряется всякий смысл изучать их раздельное действие в двухфак- торном дисперсионном комплексе. Если потребуется, то раздельное изучение силы влияния как раз- личных рационов, так и разных доз стимулятора на плодовитость сле- 80
дует проводить в отдельных однофакторных комплексах, в которых влияние каждого фактора следует изучать на вполне определенном фоне всего комплекса условий. Определение достоверности влияний Достоверность влияний при анализе двухфакторных комплексов определяется так же, как и при анализе однофакторных — по преобра- зованному показателю Фишера, указывающему, во сколько раз вари- анса данного- влияния превышает случайную вариансу, с последующей оценкой этого отношения по стандартным величинам критерия Фише- ра, для трех порогов вероятности безошибочных прогнозов и по двум степеням свободы по формуле Л- = Д' > Fst N = VZ, V2 = Vz} , О - где Fi — показатель достоверности i-того влияния (первого, второго фактора, сочетания их градаций, суммарного действия орга- низованных факторов); 2 Oi — варианса j-того влияния; Oz — случайная варианса или варианса суммарного действия не- организованных факторов по всему комплексу; Fst —стандартные значения критерия Фишера, определяемые 'по табл, IX; vt — число степеней свободы i-того влияния; vz — число степеней свободы случайного разнообразия. При определении достоверности влияний каждая факториальная варианса (ол, Фв, &ав, <4) сравнивается с одной и той же случайной вариансой ol, служащей базой для оценки достоверности каждого вида факториальных влияний. Определение достоверности влияний. в двухфакторном комплексе показано в табл. 22 на примере изучения совместного действия рацио- нов и стимулятора многоплодия (пример 25, табл. 17). Вскрытие биологического смысла показателей достоверности влия- ний при анализе двухфакторных комплексов производится по общей схеме. - При Fi^Fit влияние считается достоверным, что позволяет сделать прогноз такого генерального влиякия, которое подобно проявившемуся в выборочном комплексе. При Fi<Fst влияние считается недостоверным. Недостоверность влияния для сочетания градаций означает невозможность дать какой- либо прогноз степени такого сочетания в генеральных совокупностях. Для каждого фактора в отдельности получение недостоверного показа- теля силы влияния означает получение неопределенной информации только в случае недостоверности сочетания их градаций. Если же пока- затель т]^в оказался достоверным, то и действие обоих факторов (или одного из них) тоже должно считаться достоверным, но с такими осо- бенностями, какие выявлены в выборочном комплексе. При анализе двухфакторных комплексов, для того чтобы признать достоверность действия одного из двух или обоих изучаемых факторов, достаточна достоверность хотя бы одного из трех показателей: 1]2 в или Т]2‘ ИЛИ Т]2В. 6 , Н. А. Плохинскин 81
Таблица 22 Расчет показателей достоверности влияний в двухфакторном дисперсионном комплексе, приведенном в табл. 17 N = 18, Гд = 2, гв = 3, п = 3 Влияния Диспер- сии С Степени свободы V Вариан- сы (J? Достоверность влияний N -S. ‘ ° 4- II '? ' V1 v2 Fst Первого фактора А 18 VA=rA~1 2—1=1 18 10,8 1 12 4,8—9,3—18,6- Второго фактора В 36 vB = rB~ 1 3—1 = 2 / 18 10,8 2 12 3,9—6,9—12,3) Сочетания их градаций АВ 84 VAB ~ VAVB 1-2=2 42 25,2 2 12 3,9—6,9—12,3- f Организованных факторов X 138 VX==rArB-} 2 - 3 — 1 = 5 27,6 16,5 5 12 3,1—5,1—8,9 Неорганизованных факто- ров Z 20 vZ = N-rArB 18—2 - 3=12 1,67 ,— — __ — Общее у 158 ^=#-1 18— 1 = 17 .9,29 — — — ' < В разбираемом примере (табл. 22) все факториальные влияния? оказались достоверными. Следовательно, можно сделать следующий прогноз действия стимулятора. 1. Стимулятор при его массовом применении будет повышать пло- довитость самок, при условии полноценности рационов. Этот прогноз дается с наивысшей вероятностью (р>0,999). 2. Наиболее благоприятное действие оказывает двойная доза сти- мулятора при полноценных рационах (р>0,99). 3. При недостатке в корме минеральных веществ двукратные и трех- кратные дозы стимулятора могут даже снизить плодовитость (р>0,99). Сводка- показателей двухфакторного дисперсионного комплекса’ может быть представлена в форме, показанной в табл. 23 для разбирае- мого примера (рационы и стимулятор многоплодия). Ошибки репрезентативности показателей силы влияния в двухфакторных комплексах Если требуется определить доверительные границы генеральных параметров, например для установления гарантированного минимума’ силы влияний, то неизбежные при этом- ошибки репрезентативности! 82
Таблица 23 Сводка показателей двухфакторного комплекса Фактор А — полноценность рационов т- . 1 А — неполноценные рационы Градации | _ поЛноценные ра£ионы Фактор В — стимулятор многоплодия [ Вх — одинарная доза Градации < В2 — двойная доза [ В3 — тройная доза Результативный признак: плодовитость самок, число детенышей в помете Градации At В1 в2 в3 в2 в3 гв = 3 И 3 . 3 3 3 3 3 N = 18 V 5, 6, 7 ' 4, 3, 2 2, 3, 1 1, 4, 1 10,9 11 7, 4„ 7 217 = 90 Mi . 6 4 2 2 10 6 М2= 5 можно определить по следующей приближенной формуле, общей для всех факториальных влияний (кроме суммарного действия неорганизо- ванных факторов) ' Чтобы по этой формуле определить ошибку факториального влия- ния, надо число степеней свободы этого, влияния (vi) помножить на постоянную для данного комплекса величину, равную частному от де- ления показателя силы влияния неорганизованных факторов rjz на число степеней свободы случайного влияния vz. Расчет ошибок репрезентативности показателей и определения доверительных границ параметров силы влияний в двухфакторном: комплексе показан в табл. 24. 6* 83
Таблица 24 ^Ошибки репрезентативности показателей и доверительные границы параметров силы влияний в двухфакторном комплексе для примера 25 (стимулятор многоплодия при разных рационах) ТС 0,13 т 2 = via-, а = —- ==----= 0,011; т 2 = 0,011V/; VZ 12 Ч; л?= Д = Влияние' Суммарные действия первого фактора А . второго фактора В сочетаний их градаций АВ организованных факторов х неорганизован* ных факторов z Показатели влияния т|? 0,11 0,23 , 0,53 0,87 0,13 Число степеней сво- боды V i 2 2 5 12 1 Ошибки показателей т , 0,011 • 1 0,011 • 0,011 • 2 0,022 0,011 • 2 0,022 0,011 • 5 0,055 (0,011 Vi) Стандартные значения критерия Fst Фишера (Pi = 0,95) 4,8 3,9 3,9 3,1 ' ! vi = vi) I v2= 12/ Максимальная погреш- ность Д 0,011 .4,8 0,053 0,022 • 3,9 0,086 0,022 • 3,9 0,086 0,055 • 3,1 0,171 (Fst m 2) 4/ Доверительные границы т)? 0,011+0,053 <0,06+0,16 0,23+0,086 0,14+0,32 0,53+0,086 0,44+0,62 0,87+0,171 0,70+1,00 fti ± A)
Часть вторая БИОМЕТРИЧЕСКИЕ МЕТОДЫ СРЕДНИЕ ВЕЛИЧИНЫ Основной показатель биометрии — средняя величина —• широко используется и в науке, и в практике. При изучении растений, живот- ных, микроорганизмов и человека расчет средних показателей состав-, ляет основу обработки первичных материалов. Средние размеры особей служат для характеристики видов, разно- видностей, сортов, пород и других биологических групп; средние пока- затели физиологических процессов характеризуют интенсивность раз- личных сторон обмена, силу действия биологических агентов и медицин- ских препаратов. В производстве средние показатели используются для оценки ра- боты отдельных специалистов, хозяйств, областей. Средняя величина какого-нибудь признака определяется для того, чтобы получить характеристику этого признака для всей изучаемой группы в целом. В зависимости от объекта ..наблюдения и от поставленных целей используются' в биологии не одна, а несколько средних величин: сред- няя арифметическая, средняя геометрическая, средняя квадратическая, средняя гармоническая. Кроме того, для характеристики биологических групп иногда употребляются мода и медиана. ОБЩИЕ СВОЙСТВА СРЕДНИХ ВЕЛИЧИН Для правильного использования средних величин необходимо знать свойства этих показателей: срединное расположение, абстракт- ность и единство суммарного действия. По своему численному значению все средние величины занимают промежуточное положение между минимальным и максимальным- зна- чениями признака. При этом наименьшую величину имеет средняя гармоническая (Я), а наибольшую-— средняя квадратическая (S), что можно представить следующей схемой: min < Я < О < Л1 < S < max Средняя признака показывает, какую величину имел бы каждый из представителей изучаемой группы, если бы все они были одинако- выми и суммарное их действие было такое же, как и фактических не- усредненных значений этой группы. При использовании средних вели- чин предполагается, что пока они применяются, разнородная группа 85
заменена однородной группой, в которой все значения признака одина- ковы и равны средней величине. Например, если имеется пять значений признака: 1; 4; 5; 5; 5 со средней величиной Л4=4, то при использовании этой средней предпо- лагается, что разнородная группа заменена на однородную с одинако- выми значениями: 4; 4; 4; 4; 4. Эта особенность средних величин лежит в основе таких обычных производственных выражений, как «от каждой коровы получено по 3000 л молока», «с каждого гектара получено по 500 ц свеклы», «с каждого улья получено по 80 кг меда», «при откорме получено по 100 кг привеса на каждую голову» и т. п. Коровы дают, конечно, различные удои, на разных участках получен разный урожай и т. д. И все же для производственной характеристики хозяйства и осо- бенно для плановых расчетов оказалось удобным условно принять, что все коровы дали или будут давать одинаковый удой, равный средней величине этого признака для данного стада и года («от каждой коро- вы»), или, что с каждого гектара получен один и тот же урожай, рав- ный среднему урожаю с общей площади («с каждого гектара»). Заменить разнородную группу однородной можно . только путем отвлечения от тех различий, которые существуют в действительности. Только абстрагируясь от имеющихся индивидуальных разнообразных ' значений, можно дать требуемую характеристику группы одним чис- лом — средней величиной признака. В этом смысле всякая средняя ве- личина есть прежде всего абстрактная величина, которая часто в дей- ствительности не существует, а иногда и не .может существовать. Если средний вес особей какого-нибудь вида в определенных усло- виях равен 40,57 .кг, то существование такого экземпляра возможно, но крайне мала вероятность того, что какая-нибудь определенная особь будет весить точно 40,57 кг. Если в совхозе среднее количество деловых ягнят, полученных на одну овцематку, равнялось 1,7 ягненка, то такое число живых ягнят вообще не может существовать в действительности, тем не менее эта средняя имеет вполне определенное производственное значение, напри- мер при сравнении этого совхоза с другим, где аналогичная средняя равна 1,2. v Абстрактность средних величин вызывает необходимость • при .вы- числении их определять, от какого разнообразия следует отвлечься в данном случае. Самая цолная абстракция получается в тех случаях, когда средняя рассчитывается для всех особей изучаемой совокупности. Если требуется учитывать какое-нибудь одно или несколько условий, например пол, возраст особей, сезон года, ареал распространения, фи- зиологическое состояние, принадлежность к опытным и контрольным группам, происхождение от определенных родителей и т. д., то необхо- димо в той или иной степени освобождаться от полной, абстракции и определять среднюю величину для отдельных частных групп. Чем боль- ше таких частных групп и чем они мельче, тем менее абстрактными становятся средние величины. Не всяко,е выравнивание различий в группе может привести к пра- вильной средней величине. Вычисление средних величин необходимо вести таким образом, чтобы суммарное действие выравненных значений признака было' бы равно суммарному действию первоначальных не- усредненных значений. Например, если четыре взрослых особи какой- ~ пибудь промысловой птицы весили 2, 3, 3, 4 кг, то средний вес этих птиц 2 4-3 4-3^'4 о - —'----!--!— = Зкг. Суммарный вес четырех усредненных значении 86
3 + 3 + 3 + 3=12 кг. Такой же суммарный вес имелся и в действительно- сти: 2 + 3+3+4=12 кг. В данном случае выбор средней величины — •средней арифметической — сделан правильно. Но так бывает не всегда. Например, требуется рассчитать среднегодовой прирост популяции" какого-нибудь вида за два года, если известно, что за первый год при- рост составил 20%, а за второй — 60% (от начала второго года). Используя способ средней арифметической, получаем В данном,случае применение этой средней не будет правильным, так как два усредненных значения в своем суммарном действии не дадут того же результата, какой дали два фактических неусредненных значения. Фактический общий суммарный прирост популяции за два года определяется следующим образом. К концу первого года популяция составляет 100+100= 120%; 100 <к концу второго года 120 + -^5- 120= 192%. 100 Прирост за два года равен -^—^- 100 = 92%. 100 Если же принять за средний прирост 40%, то к концу первого года популяция составит 100 + —100 = 140%; 100 к концу второго года 140 +’-12-140 = 196%, . ’ 100 а прирост, за два года _1967112°_ ЮО = 96%. 100 Ошибка в данном случае заключалась в неправильном выборе •средней величины: взята средняя арифметическая, а для вычисления среднего прироста надо пользоваться средней геометрической. Если использовать среднюю геометрическую, то средний прирост определится следующим образом: х = V120-160 — 100 = 38,57 %. При этом суммарный результат будет равен фактическому: ЮО + ЮО = 138,57%; 100 138,57 + -1- 138,57= 192,0%. '100 Прирост за два года составляет 192—100=92%. 87
/ Единство суммарного действия служит проверкой правильности выбора той или иной средней. Если суммарный результат усредненных значений не равен результату, полученному по первоначальным факти- ческим значениям, это значит, что или средняя выбрана неправильно, или вычисления проведены с ошибками. СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ Техника расчета средних арифметических описана в первой части книги и показана в алгоритмах 1, 2, 3, 4, 5, 6, 7. Математические свойства средней арифметической Средняя арифметическая, обладая общими свойствами средних величин, имеет свои особенности, которые можно выразить следующи- ми формулами: 1. 2(7 —44) = О, т. е. сумма центральных отклонений равна нулю. Например, для значений 1; 4; 5; 5; 5 средняя арифметическая Л1=4. Центральные отклонения будут следующие: 1—4= —3, 4—4 = 0, 5—4= +.1, 5—4=. +1, 5—4= +1, а сумма центральных отклонений •—;3 + 0 + 1 +1 +1 =0. Это свойство средней арифметической используется для проверки правильности ее расчета: если 2(7-—Л4) оказалась неравной нулю, зна- чит допущена ошибка в вычислениях. 2. 2(7 — Л)з#0; Л4 = Л+ -S(v~4) , п ' т. е. сумма условных отклонений (отклонений дат от любого значения, не равного средней) не есть нуль. Если же эту сумму распределить 2(7 —А) равномерно по всем датам, то полученная величина —1------ пока- ft жет, как сильно средняя арифметическая отличается от принятой в дан- ном случае условной средней. Например, для пяти значений 1; 4; 5; 5; 5 отклонения от условйой средней, например от А = 5, следующие: 1—5 =—4, 4—5=—1, 5—5 = 0, 5—5 = 0. Сумма услойных отклонений 2(7 —А) = —4—1+0 4-0+0 = —5. На каждую дату приходится отклонение S (V — 4) = —5 = __ j - « . t5 Это означает, что средняя арифметическая меньше данной условной средней на единицу, -и, чтобы получить значение средней арифметиче- . ской, надо по приведенной формуле М = А + —17 к условной сред- :• . ' П ней прибавить полученную ( в данном случае отрицательную) поправ- ку: Л4 = 5+(—1) =4. Полученная величина в точности равна значению средней арифметической. Если для этого примера взять другую условную среднюю, напри- мер А =2, то сумма условных отклонений 2 (7 - А) = (1 - 2) + (4 - 2) + (5 -.2) + (5 - 2) + (5 - 2) = + 10, 88
а средняя M = 2 + = 2 + 2 = 4, 5 т. е. такая же, как и при непосредственном расчете. Описываемое свойство средней арифметической используется для облегчения вычислительной работы при многочисленных группах. Когда усредняется большое количество значений, гораздо легче рассчитывать среднюю арифметическую не непосредственно, а через условную сред- нюю по формуле М = А . 3. 2 (У — Л4)2 min; 2 (V —Л4)2 < 2 (У — Л)2, т. е. сумма квадратов центральных отклонений меньше суммы квадра- тов отклонений от любой другой величины. Эта особенность средней арифметической положена в основу спо- соба наименьших квадратов, который применяется при изучении сте- пени и формы зависимости какого-либо признака от одного или не- скольких влияний. 4. 2D2 = 2 (У — М)2=2(У — Л)2 — , п т. е. сумму квадратов центральных отклонений можно получить через условные отклонения, что и используется для облегчения вычислитель- ной работы при анализе многочисленных групп. В таких случаях гораздо легче получить сумму квадратов центральных отклонений не непосредственно, а через условные отклонения по указанной формуле. При 4=0, 2£)2 = SV2 W. п 5. М(у±а) = Му + а. Если к. каждому значению признака прибавить постоянную вели- чину а (или-ее вычесть), то средняя арифметическая из измененных дат будет равна средней арифметической из первоначальных дат, уве- личенной (или уменьшенной) на величину а. Например, если в разби- раемом примере к каждой из первоначальных дат 1; 4; 5; 5; 5 приба- вить 3, то для полученных величин 4; 7; 8; 8; 8 средняя М. — 7 на 3 боль- ше первоначальной средней М=4. Если в этой группе из каждого зна- чения вычесть, например, 1, то для уменьшенных значений 0; 3; 4; 4; 4 средняя М=3 будет на 1 меньше первоначальной средней М = 4. Это свойство средней широко используется при вычислении сред- ней арифметической для больших групп при многозначных датах, что значительно упрощает и облегчает счетную работу. 6. MVa = аМу, т. е. если каждое значение умножить на постоянное число а,- то средняя арифметическая из измененных дат будет точно в а раз больше перво- начальной средней арифметической. Если в разбираемом примере все значения 1; 4; 5; 5; 5 умножить на 10, то для полученных увеличенных дат (10; 40; 50; 50; 50) средняя арифметическая Af=40 ровно в 10 раз. больше той, которая получена для неувеличенных дат (Л4 = 4). Если ча равно дробному числу, то каждая дата, а также и каждая средняя будут уменьшены во столько же раз. Если в разбираемом при-, мере все даты умножить на Vs.’ т0 средняя арифметическая из умень- 89
щенных дат (0,2; 0,8; 1; 1; 1) Л4 = 0,8 в 5 раз меньше средней арифмети- ческой, полученной для неизмейных дат (Л4=4). Это свойство средней арифметической также широко используется при преобразовании дат для облегчения счетной работы. Применения средней арифметической Пример 26а. Три параллельных определения содержания гемо- глобина в крови у одного и того же животного в одно и то же время, проведенные тремя разными лаборантами, дали такие результаты: 75; 80; 70. Наиболее вероятное содержание, будет равно средней ариф- метической из параллельных проб: 75^804-70 Пример 266. На восьми парных опытных делянках получены •следующие отклонения урожая нового сорта кукурузы от стандарта (в пересчете на гектар): +6; +3; —2; —3; +5; 0; —3; +2 ц. Среднее отклонение урожая нового сорта, полученное в проведенном сорто- испытании, будет равно средней арифметической из отдельных раз- ностей: М = 6 3 — 2 — 3 —5 0 — 3-^2 _ 8 = ! 1 о и 8 Л • 8 ’ - В некоторых случаях при вычислении средней арифметической общая сумма значений признака делится не на число дат, а на другие величины. Так бывает, например, при расчете с среднего удря на одну фуражную корову. Среднюю из Относительных величин можно рассчи- тывать двумя способами: как среднее отношение и как отношение сред- них (отношение сумм). Пр и м е р 27. Четыре повторных посева одного сорта сахарной •свеклы при анализах на сахаристость дали следующее содержание са- хара (в %): 16; 14; 13; 17. Средняя сахаристость сорта, полученная в , данном испытании: jw=J6±14±13±17=6L==i5%> 4 4 , В данном случае получено среднее отношение. П р и м е р 28. На мясокомбинате за сутки переработано 300 голов крупного рогатого скота. Требуется определить фактический средний выход мяса. Для этой цели суммарный вес всех туш (в кг) относят к сумме приемных- живых весов переработанной группы скота. Оказалось, что первая сумма SVi=45 862 кг, вторая сумма SV2= Ю2791 кг. Средний выход в данном случае рассчитывается как отношение сумм: М. = юо= I5862 ЮО = 44,62%. W2 102 791 Средний ранг (непараметрическая средняя) определяется для таких признаков, для которых еще не найдены способы количест- венного измерения. По степени проявления таких признаков объекты могут быть ранжированы, т. е. расположены в порядке усиления (или. 90
ослабления) выраженности признака. Порядковый номер объекта в та- ком ряду называется его рангом. Пример 29. В зверосовхозе, разводящем голубых норок, получе- но от двух самцов и одной и той же группы самок 20 щенков с различ- ной окраской меха: от почти белого до темно-голубого. Требовалось выяснить, какой из производителей дает в. потомстве более темную окраску меха. Затруднением при этом служит то обстоятельство, что ' нет способа* числового измерения интенсивности окраски волоса у норок. Все потомки оцениваемых производителей были распределены в ранжированный ряд в порядке усиления серого цвета, причем при каж- ч дом порядковом номере (ранге) такого ряда был поставлен номер -отца (I, II). Ранг 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Отец I II I II I I II I I I II I II II II II I II. II II. На основе такого ряда можно рассчитать средние ранги окраски в -потомстве каждого производителя и по этим показателям сравнить их: 1 3-Ь5-)-6^-8 + 9+10+12+17 __ 71 _ у д. ' 1 9 9 ’ ’ _ 2 4-4-4 7-411 4-13-4 14+ 15 ц- 16+ 18-4-19-^20 _ 139 _ 6 * Взвешенная средняя арифметическая Обычно, чтобы рассчитать среднюю арифметическую, складывают вер значения признака и полученную сумму делят на число дат. В этом случае каждое значение, входя в сумму, увеличивает ее на полную •свою величину. Но Be всегда это возможно. Иногда значения признака- должны входить в сумму с неодинаковой поправкой. Эта поправка, выраженная определенным множителем, называется математиче- ским весом значения. / Средняя, рассчитанная для значений признака с неодинаковыми весами, называется взвешенной средней. Взвешенная средняя арифметическая рассчитывается по следующей формуле: > дл ___VjPt4* -t* VnPn РЗБ 2р Pi"b РгФ • • • -ф- Рп где V — значение признака, дата; р — математический вес усредняемого значения. Чтобы рассчитать взвешенную среднюю арифметическую, необхо- димо каждое значение признака помножить на его вес, все эти произ- ведения сложить и полученную сумму разделить на сумму весов. П ример 30. Имеются результаты двух исследований длины хо- ботка пчел: в одном случае получена средняя длина хоботка 6,6 мм, в другом — 6,0 мм. Требуется получить общую среднюю, причем извест- но, что в первом исследовании были измерены хоботки у 100 пчел, во втором — у 20. В данном случае значениями признака являются средние Mi—6,6 и Л12 = 6,0 мм\ их весами — численности групп «1 = 100 и ц2=20. Ёзве- шенная средняя арифметическая • рассчитывается следующим образом: — Mini + Л42д2 __ (6,6. X ЮО) + (6,0 X 20) _ 780 _ g g в3а ~ щ + я2 100 + 20 ~ 120 ~ ’ Пример 31. В 100 кг кормовой смеси содержатся следующие количества отдельных кормов: 91
сена 50 кг, с содержанием переваримого белка 3 % молотой овсяной соломы 10 кг, » » » » 1% жмыха подсолнеч- ного дробленого . 20 кг, » » » » 33% отрубей пшеничных грубых 20 кг, » » » » 11% Требуется определить содержание белка в данной смеси. Для решения этой задачи необходимо рассчитать взвешенную сред- нюю арифметическую. Значениями признака будет содержание белка в отдельных кормах: 3; 1; 33 и 11%, а их математическими весами— физические веса кормов, входящих в смесь: 50; 10; 20 и 20 кг. Содержа- ние в смеси переваримого белка: __ 3 х 50 + 1 х 10-|-33 х 20 4 11 х 20 _ 1040 _ jq ~ 5б~+ 10 4- 20 Ч- 20 : 100 ~~ ’ °’ т. е. в каждом килограмме смеси содержится 104 г переваримого белка. Таким же способом рассчитываются средние выхода продукта по нескольким партиям сырья. Пр и мер 32. Проведены три независимых наблюдения числа со- кращений пульсирующей вакуоли у амебы в определенной среде. В пер- вом наблюдении зарегистрировано 24 сокращения в 1 час, во втором — 16 й в третьем-—23, причем первое наблюдение длилось 2, второе — 6 и третье—1 час. Для определения среднего числа сокращений в час необходимо найти взвешенную среднюю арифметическую. Значениями признака будут наблюдавшиеся количества сокращений в час (24, 16 и 23), их весами—-продолжительность отдельных наблюдений (2, 6 и 1 час). Следовательно, м = 24х2+16х6>23х 1 = 167 = 17 5 в3в . 2 Ч- 6 -Ч 1 9 Простая средняя в данном случае: ' 214 = 24 4-16 -Ч 23 __ 63 _ 21 3 3 — ' даст завышенную характеристику. СРЕДНЯЯ ГЕОМЕТРИЧЕСКАЯ Чтобы получить среднюю геометрическую для группы с п датами, нужно все даты перемножить и из полученного произведения извлечь корень n-й степени: 0 = 7777=7^'...^, где G — средняя геометрическая, п — число дат, IJV — произведение дат. Например, средняя геометрическая из 12 и 3 будет равна ' . G = /l2^3 = 6. 92
Если число дат больше двух, то извлечение корня л-й степени за- труднительно, поэтому обычно значение средней геометрической нахо- дят путем логарифмирования величин, входящих в основную формулу lgG = JteJC = lgVi4-lgVW ... 4Hgjzn п п Например, для вариантов 1; 4; 5; 5; 5 среднюю геометрическую можно получить следующим образом: V 1 ' 4 ' 5 5 5 lg V (табл. III) 0,000 0,602 0,699 0,699 0,699 21gV = 2,699, lgG = Sig V = п 2,699 5 = 0,5398, G = 3,4654 (табл, IV). Для проверки правильности вычисления средней геометрической можно использовать принцип единства суммарного действия. Произве- дение всех пяти дат .(1-4• 5• 5• 5 = 500) равно произведению пяти вырав- ненных значений, равных средней геометрической: 3,4654 -3,4654 • 3,4654 • 3,4654 3,4654=499,71 ^500. .Это значит, что средняя в данном случае рассчитана правильно. z Необходимые для логарифмирования таблицы приведены в четвер- той части книги: табл. III — логарифмы и табл. IV — антилогарифмы. Применяется средняя геометрическая во всех случаях, когда необ- ходимо узнать или планировать средние приросты за определенный период. При расчетах среднего пойериодного прироста возможны два способа’ применения средней геометрической. Первый способ применяется, когда имеются сведения о приростах за каждый период, выраженных в процентах или долях1 от начала каждого периода. В таких случаях расчет среднего прироста ведется по формуле , х 4- 1 = G(i+a) = 4^/7 (1 + а), где х— средний попериодный прирост за ряд периодов равной продолжительности; а — фактический прирост за тот или иной период, выражен- ный в долях; п — число периодов; /7(14- а) —произведение величин (14-а). Из этой формулы следует, что для нахождения среднего прироста по первому способу нужно долю фактического прироста за каждый период прибавить к единице, полученные величины (14-а) перемножить, из их произведения извлечь корень n-й степени и вычесть единицу. Если периодов много (п>2), то извлечение корня надо проводить логарифмированием: G _____ 2 ig (1 а) lgCr(i+a) =--~-----• 1 Доля — процент, деленный на 100. 93
По этой формуле находят логарифмы средней геометрической из величин (1+а), затем находится сама величина G(i+aj и вычитанием из нее единицы получается искомая средняя доля прироста. Пр и м е р 33. Поголовье бобров в заповеднике увеличилось за пер* вый год на 5%, за второй — на 20%, за третий — на 50% й за четвер- тый— на 50%, считая каждый раз от начала истекшего года. Требуется определить среднегодовой прирост за эти 4 года. Необходимые расчеты приведены в табл. 25; Таблица 25 Расчет среднегодового прироста Годы Фактический прирост за каждый год 1 4- а lg(l + а) Slg(14- а) = 0,452 0,452 lgG(1+o)-. \ -0,113. % ДОЛЯ G(I+a) = 1,296 1 5 0,05 1,05 0,021 х = 0,296 = 29,6%. 2 20 0,20 1,20 0,079 3 50 0,50 1,50 0,176 4 50 0,50 1,50 0,176 Второй способ расчета средних приростов применяется в тех слу- чаях, когда имеются данные об абсолютных количествах объектов на? начало и конец общего большого периода и требуется рассчитать сред- ний прирост за более мелкие периоды. В таких случаях средний прирост рассчитывается по-формуле ф - - ' _ x+i=7^. При логарифмировании получаем t lg(x+l) = -- где х — средний прирост за более мелкие периоды: среднегодовой за* пятилетку, среднемесячный за год, среднесуточный за месяц, и т. д.; Ап — количество объектов на конец общего периода, или, что то же самое, на конец последнего n-го мелкого периода; Л1 — количество объектов на начало исследуемого общего периода,, или, что то же самое, на начало первого мелкого периода. Пример 34. На пасеке на начало пятилетки было 100 ульев, а к концу стало 140. Определить среднегодовой процент увеличения пасеки, за эту пятилетку. Применяя указанную формулу, получим x+1=i/‘4^; lg(x+1)=j^=atl=0’0292; х +1 = 1,0697, х = 0,0697 или 6,97 % • Пр и м е р 35. Запланировано за пять лет увеличить производство* пенициллина на 60%. Требуется распределить это задание равномерно- 'по годам. В'данном, случае не даны абсолютные количества в начале и конце общего периода, но дан общий процент прироста за весь период- 94
A 60%, что дает возможность легко получить требуемое отношение -у-. Ai Объем продукции должен увеличиться на 60% Это значит, что на каж- дые 100 единиц, бывших в начале общего периода, должно быть 160 единиц в.конце: Ап=. 160, Ai = 100,-^- = = 1,6. Для выполненйя такого задания среднегодовой прирост производ- ства пенициллина можно запланировать следующим образом: I 1 1 -/2 1 / । I, 1,6 0,204 no/ioQ. х ч- 1 = у 1,6; 1g (х + 1) = s. =-------— = 0,0408; 5 5 . х+1 = 1,0985, х=0,0985, или 9,85%. Оказалось, что для увеличения производства за пятилетку на 60%' достаточно обеспечить среднегодовой прирост на 9,85%, а не на — =12%, как это могло показаться без учета того, что средний при- 5 рост образуется по принципу средней геометрической, а не средней арифметической. СРЕДНЯЯ КВАДРАТИЧЕСКАЯ Средняя квадратическая вычисляется по формуле она равна корню квадратному из суммы квадратов дат, деленной на их-., число. Например, если имеется пять дат: 1, 4, 5, 5, 5, то средняя квад- ратическая 1, + 4, + 55, + 5, + 5,-„т/^_1/183'=4,з. Употребляется средняя квадратическая при расчете средних ра- диусов окружностей. Пр и м ер 36. Измерения диаметров колоний, полученных от посе- ва микробов определенного вида, дали следующие результаты (в мм): 15; £0; 10; 25; 30. Для сравнения этого посева с другими требуется определить сред- ний диаметр колоний. Применив формулу средней квадратической^ имеем 1 о2н-252ч-зо2 _ 5 . ~ Средняя арифметическая диаметров М = 15^20-у Ю-Ь25ф30 = юо = 20 о . 5 5 дает неправильную характеристику группы. Это можно проверить по правилу единства суммарного действия. Общая, площадь' всех пяти колоний была 3,14 (7,52+102+52+ ' +12,52+152) = 1766,25 жж2. Если взять пять кругов с одинаковым диаметром, равным средней арифметической Л4 = 20, то общая площадь составит 5хЗ,14х102= = 1570 жж2, что гораздо меньше общей фактической площади. 95
1 Если же взять пять кругов с одинаковым диаметром, равным средней квадратической 5 = 21,22 мм, то общая площадь будет 5X3,14(10,61)2= 1767,4 мм2, т. е. практически той же суммарной пло- щади, которую имели пять измеренных колоний. СРЕДНЯЯ ГАРМОНИЧЕСКАЯ Средняя гармоническая рассчитывается по формуле V Для пяти дат: 1, 4, 5, 5, 5 средняя гармоническая Н =--------- 1 11 1 1 1 5*5^5 — = 2,70. 1,85 Применяется средняя гармоническая при усреднений меняющихся скоростей. ' , /Пример 37. Почтовые голуби одной станции к месту кормежки летят со скоростью 50 км/час, а,в обратном направлении — со скоро- стью 40 км/час. Если ничего больше неизвестно и требуется выяснить среднюю скорость полета для обоих направлений ((расстояния, очевид- но, равны), то сделать это можно, рассчитав простую среднюю гармо- ническую для двух дат 50 и 40: Н =-------- 1 1 50 40. 2 2 -------------=---------= 44,4 км/час. 0,020 4 0,025 0,045 Пример 38. Рысак на тренировках пробегал одну за другой три дистанции, различные по состоянию дороги. Скорость на первой ди- станции составляла 13 км/час, на второй — 20 км/час и на третьей — 10 км/час. Длина дистанций не сообщается: известно, что первая ди- станция была в 2 раза, а Вторая в 4 раза, длиннее третьей. По этим дан- ным можно определить показанную рысаком среднюю скорость по всем трем дистанциям, рассчитав не простую, а взвешенную среднюю гармо- ническую из значений 13, 20, 10 соответственно с весами 2, 4, 1 по фор- муле тт __ 4~ ^2 ____ вза~ у k _ к k2 kn V V, + Взвешивание скоростей производится обычно по расстояниям. Поскольку в данном примере расстояния неизвестны, то весами могут служить отношения первой и второй дистанции к третьей. Такая замена математических весов не повлияет на точность результата, так как. для правильного расчета взвешенной средней гармонической имеют значе- ние не .абсолютные величины расстояний, а их отношения и 2-44-41 7 7 . Яп3п = —---————-— =----------------------=-------— =15,4 км час. в • 2 4 1 0,15440,240,1 0,454 ----4---4----- •13 20 10 96
МОДА Модой, или модусом, называется такая дата или класс распределе- ния дат, который в исследуемой группе особей встречается наиболее часто. В качестве примера рассмотрим распределение, представленное в табл. 26. Таблица 26 Классы Частоты 100— 119 2 120— 139 20 140— 159 60- 160— 179 160 180— 199 250 200— 219 240 220— 239 180 240— 259 70 260— 279 15 280— 299 2 300— 319 1 В этом распределении наиболее многочисленным является пятый класс (180—199) с частотой 250. Это модальный класс. В качестве первого приближения можно принять за моду средину модального класса, т. е. 190. Более точное значение моды можно получить по формуле Мо = + k <---Л , где Мо — мода; Wa —начало модального класса; k — величина классового промежутка; fi—частота класса, предшествующего модальному; f2 — частота модального класса; f3 —частота класса, следующего за модальным. Для приведенного распределения Га = 180, &=20, fi = 160, f2=250, fs = 240 (табл. 26). Следовательно, мода этого распределения Мо = 180 + 20 250 ~ 160 = 198. 500— 160 — 240 Обычно, если классы взяты не слишком мелкие, имеется вс,его один модальный класс. В некоторых распределениях встречаются два или три модальных класса. Иногда это может быть следствием того, что в изучаемую груп- пу попал разнородный материал, относящийся к разным категориям (более крупной и менее крупной) по изучаемому признаку. / МЕДИАНА Медианой называют такое значение признака, которое разделяет всю группу на две равные части: одна часть имеет значения признака меньшее, чем медиана, а другая — большее. Например, если имеется группа из 9 значений признака: 1, 2, 3, 4, 5, 6, 7, 8, 9, то медианой этой группы будет 5. Для многочисленных групп медиану можно рассчитать по формуле / —— S \ ме = Га + k ), где Ме — медиана; Wa — начало того класса, в котором находится медиана; 7 Н. А. Плохинокий ' 97
k — величина классового промежутка; , . п — общее число дат в группе; 4 2—сумма частот классов (начиная с меньшего), предшествую- щих классу, в котором находится медиана; f — частота класса, в котором находится медиана. Нахождение медианы можно показать для распределения, пред- . ставленного в табл. 27. Таблица 27 Номера классов 1 2 3 4 5 6 7 8 9 10 11 Начала классов Частоты Накопленные частоты 100— 2 2 120— 20 22 > 140— 60 82 160— 160 242 180— 250 492 200— 240 732 220— 180 240— 70 260— 15 280— 2 300— 1 п= 1000* Судя по ряду накопленных частот, медиана находится в шестом: классе, так как в первых пяти классах имеется 492 варианта, а’Мень- ше медианы должна быть половина всей группы, т. е. 500 вариантов. Недостающие до 500 восемь вариантов находятся в шестом классе. Для данного распределения УГа=200, & = 20, S=492, /=240, а ме- диана равна Л4 = 200 + 20 <-°£т-492\ = 200,66. е \ 240 J Медиана, обладая в полной мере всеми общими свойствами сред- них величин, дает начало целой серии показателей разнообразия, кото- рые носят общее название квантилей. Квантиль — это такое значе- ние признака, которое отсекает в распределении определенную часть дат больше себя и определенную часть дат меньше себя. К таким пока- зателям относятся кроме медианы (средней, величины) показатели разнообразия: квартили, децили и перцентили. Три квартиля разделяют группу на четыре равночисленные части. Второй квартиль равен медиане, а расстояние между третьим и первым- квартилями является одним из показателей степени разнообразия зна- чений признака в группе. ' Девять децилей разделяют группу на десять равночисленных ча- стей. Пятый дециль равен медиане, а расстояние между девятым и пер- вым децилями служит одним из показателей разнообразия. Девяносто девять перцентилей делят группу на сто равночислен- ных частей. Пятидесятый перцентиль равен медиане; девяносто девя- тый и первый перцентиль используются иногда в качестве максимума и минимума группы; расстояние между, девяносто девятым и первым’ перцентилями служит показателем размаха признака и разнообразия, дат в этой группе. ПОКАЗАТЕЛИ РАЗНООБРАЗИЯ Основное свойство всякой группы разнообразие входящих в нее- объектов по изучаемому признаку — измеряется несколькими показа- телями. К ним относятся: лимиты и р.азмах, среднее квадратическое отклонение, коэффициент вариации, квартили, децили, перцентили. 98
СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ Первое описание среднего квадратического отклонения (или просто «сигмы») и техника его вычисления приведены в первой части книги и показаны в алгоритмах 1, 2, 3, 4, 5, 6.и 7. Следует иметь в виду, что формула сигмы с числом степеней сво- боды в знаменателе подкоренного количества S (V — М)2 п — 1 применяется только для выборок; Сигма генеральной совокупности вычисляется по формуле V N где о — генеральная, сигма; М — генеральная средняя; N— объем генеральной совокупности. П р и м е р 39. На сельскохозяйственной выставке сравниваются экспонаты двух хозяйств, представивших лучшие экземпляры тыквы со своих огородов. Первое хозяйство представило 6 тыкв, весивших 33, 37, 32, 38, 34, 36 кг, второе представило 5 тыкв, весивших 33, 37, 34, 36, 35 кг. Так как средний вес экспонатов оказался одинаковым у обоих экс- понатов (Afi = 35, 71^2 = 35),. было решено провести сравнение стандарт- ности тыкв по среднему квадратическому отклонению. В данном случае сравйивались, не выборки, а генеральные сово- купности, так как оценка проводилась по выставочным экземплярам, которые целиком исчерпывали всю, требующуюся в данном случае, информацию. Дисперсии и вариансы: —о 98 «ваг1’””' / 98 \ Ci= —22+22—32+32—12+12=28; of == 4,7 ( а не —Ц- = 5,6 ; 6 \ 6—1 J С2 = —22+22—12+ 12+02=40; СГ2 = — = 2,0(а не -Д- = 2,5\ 5 \ 5—1 / Средние квадратические отклонения - = /47 = 2,2; ц2 =1,4. Коэффициенты вариации: cvi = -^ = 6>3%; су2=-Т = 4,о%. 00 00 Оказалось, что второй совхоз представил более стандартную пар- тию тыкв. Так как сравнение в данном случае проводилось по генеральным параметрам, то разность сигм заведомо достоверна и не нуждается в определении достоверности. Обычные методы определения достоверно- сти разности в данном случае не нужны и неприменимы, так как сравни- ваемые группы выбирались не так, как это требуется при организации выборок (не рендомизированно). Сравнение стандартности двух партий тыкв характеризует более благоприятно второе хозяйство, которое смогло подобрать более вырав- ненную группу экспонатов. у* 99
КОЭФФИЦИЕНТ ВАРИАЦИИ Среднее квадратическое отклонение — величина именованная, выраженная в тех же единицах измерения, как и средняя арифметиче- ская. Поэтому для сравнения разных признаков, выраженных в разных единицах измерения, используется не абсолютное, а относительное зна- чение среднего квадратического отклонения в форме коэффициента ва- риации: СУ — 100с? ~ М ' * где CV — коэффициент вариации; сг — среднее квадратическое отклонение; М — средняя арифметическая. Коэффициент вариации есть сигма, выраженная в процентах от средней арифметической. Этот показатель неименованный, поэтому он и пригоден для сравнения разных признаков или одного й того же признака, но в группах с резко различной средней величиной признака. Пример 40. Если в стаде коров сводные показатели по удою за первую лактацию равны ЛК = 3000 кг, <л = 600 кг, а по живому весу ЛК —400 кг, 02 = 20 кг, то коэффициенты вариации будут иметь следую- щую величину: ™. ' 100-600 по удою СУ, = —:----= 20 % ; 3 1 3000 , 100 -20 к ' по живому весу CVZ = ——— —- 5 %. Сопоставление коэффицентов вариации указывает на сильное раз- нообразие первотелок изученного стада по удою и слабое разнообразие их по живому весу. В соответствии с этими характеристиками можно заключить, что в исследованном стаде имеются большие возможности отбора по удою (лучших — на племя, худших — на мясо), но слабые перспективы для подобного же отбора по живому весу. , . ЛИМИТЫ И РАЗМАХ Для быстрой и примерной оценки степени разнообразия часто при- меняются простейшие показатели: lim'= {min^-max} — лимиты, т. е. наименьшее и наибольшее значения 1 признака, р=(тах—min) —размах, или разность между лимитами. Для группы дат 1, 2, 3, 4, 5 лимиты и размах могут быть обозна- чены так: lim =- 1 =-5(4). Иногда характеристика разнообразия группы в форме лимитов имеет столь большое производственное значение (например, при упа- ковке яблок, помидор и т. д., при оценке партии беконных тушек), что кладется в основу денежной оценки продукта. При проведении параллельных анализов лимиты результатов и их размах служат показателем качества работы лаборанта. 100 '
В некоторых случаях лимиты могут служить единственной характе* ристикой признака, например: размеры кишечной амебы 204-30 мк, трипанозомы 204-70 мк, инфузории толстых кишок 304-150 мк. ПРИБЛИЖЕННЫЕ ЗНАЧЕНИЯ М и а Если не требуется особой точности, то на основе лимитов можно быстро определить приближенные значения средней арифметической и сигмы. Средняя арифметическая примерно равна полусумме лимитов: min 4- max 2 Среднее квадратическое отклонение примерно равно разности ли- митов, деленной на число К, зависящее от численности группы (п): max — min Число К можно находить по табл. 28. Таблица 28 Числа К, на которые надо разделить размах значений признака, чтобы получить примерное значение среднего квадратического отклонения п 2-5 6—15 16 — 49 50 — 200 201 — 1000 > 1000 к 2 3 4 5 6 7 Пример 41. Среди 20 выловленных волков максимальный вес животного оказался 42 кг, минимальный — 30 кг. 42 4 30 „„ 42 — 30 о М ——— = 36 кг; ------------— = 3 кг. 2 , 4 ” Перечисленные свойства лимитов и размаха показывают, что эти простейшие показатели разнообразия представляют вполне реальный интерес даже при наличии и.более точных показателей. НОРМИРОВАННОЕ ОТКЛОНЕНИЕ Обычно степень развития признака определяется путем его изме- рения и выражается определенным именованным числом: 3 кг веса, ,15 см длины, 20 зацепок на крыле у пчел, 4% жира в молоке, 15 кг на- стрига шерсти, 700 г привеса в сутки и др. Этот основной способ харак- теристики признаков оказывается недостаточным, когда требуется еще и оценить полученное значение, т. е. определить, можно ли его считать значительным или, наоборот; недостаточным, или находящимся в норме. Задачи подобного рода возникают очень часто как в научных рабо- тах, так й в производственных условия'х. Для решения таких задач применяется общий принцип: ценность особи определяется ее отношением к группе, что может быть измерено 101
особым показателем — нормировании ым отклонением, вычисляемым по формуле X _ v-^ , а где х — нормированное отклонение; - > V — дата, результат непосредственного измерения признака; М — средняя арифметическая соответствующей группы, из которой взята изучаемая особь; о — среднее квадратическое отклонение этого признака в группе. Нормированное отклонение показывает, на сколько сигм отклоняет- ся значение признака от средней для соответствующей группы. Нормированное отклонение — величина неименованная, что пред- ставляет большое удобство при сравнении развития различных при- знаков. Например, если мальчик 14 лет имеет длину тела 159 см, обхват груди 64 см*, емкость легких 2070 см3, обхват головы 52 см и вес 40 кг, то по этйм цифрам невозможно дать сравнительную характеристику развития разных частей тела и определить общий тип физического раз- вития ученика. Для этой цели необходимо сравнить индивидуальные показатели со средними характеристиками мальчиков этого возраста по среднему уровню каждого признака и его разнообразию в форме, нормирован- ного отклонения, что показано в табл. 29. Таблица 29 Оценка телосложения Мальчик 14 лет Все мальчики 14 лет Нормированное отклонение V М а X = ' о Длина тела . . . 159 142 8,5 (-Н 17) : 8,5 =-^2,0 Обхват груди . . . 64 66 4,0 (—2) : 4,0 = — 0,5 Емкость легких . . 2070 2300 460 (—230) : 460 = —0,5 Обхват головы . . 52 50 2,0 (+2) :2 = ^1,0 Вес 40 40 6,0 0:6 = 0,0 Выяснилось, что рост мальчика на две сигмы, а обхват головы на одну сигму превышают средние показатели, вес — на среднем уровне, а емкость легких и обхват груди ниже среднего уровня на полсигмы.' Очевидно, это — высокий, узкогрудый, большеголовый мальчик асте- нического типа. ПРОВЕРКА ВЫПАДОВ (АРТЕФАКТОВ) Нормированное отклонение помогает определить выпады, или артефакты, т. е. такие записанные значения признака, которые резко отличаются от всех других значений признака в группе. Проверка арте- фактов должна проводиться всегда перед началом обработки получен- ных первичных данных. Если подтвердится, что резко выделяющееся значение действительно не может относиться к объектам данной груп- 102
яы и попало в записи вследствие ошибок внимания, следует такой арте- факт исключить из обработки. Проверка артефактов может производиться по критерию, равному нормированному отклонению выпада: V — _ * st где Т — критерий выпада; V — выделяющееся значение признака (или очень большое или очень малое); М, о — средняя и сигма, рассчитанные для группы, включающей артефакт; Tst — стандартные значения критерия выпадов, определяемых по табл. 30. Таблица 30 Стандартные значения критерия выпадов (Tst) п Tst п Tst п Tst п Tst 2 2,0 16—20 2,4 47— 66 2,8 125— 174 3,2 3—4 2,t 21—28 2,5 67— 84 2,9 175— 349 3,3 5—9 2,2 - 29—34 2,6 85—104 3,0 350— 599 3,4 10—15 2,3 35—46 2,7 4 105—124 3,1 600—1500 3,5 Например: 1. Даты: 1, 2, 3, 10; п=4, М=4, <т=4, Т10 = = 1,5<2,1 4 ,— .дата 10 еще не может считаться выпадом. 2. Даты: 1, 2, 2, 3, 3, 4, 4, 5, 21; n=9, М=5(1 0=6,1, Т21 = = = 2Д>2,2, дата 21 может считаться выпадом и должна быть исклю-' чена из обработки. СРЕДНЯЯ И СИГМА СУММАРНОЙ ГРУППЫ Иногда бывает неббходимо определить среднюю и сигму для сум- марного распределения, составленного из нескольких распределений. При этом известны не сами распределения, а только их средние и сигмы. Средняя и сигма в таких случаях находятся по следующим фор- мулам: . в — S(nz—1)ст?4>2пг(Л1г —A4S)2 2пг-Г где щ — численность отдельных объединяемых Групп; Mi — средняя арифметическая каждой объединяемой группы; Стг — сигма каждой объединяемой группы. 103
Пример 42. Четыре независимых наблюдения величины одного и того же вида амеб в сходных условиях дали (в микронах): следующие результаты М а ' п М ст п 1 29 2 150 3 30 3 100 2 31 3 50 4 31 2 100 По этим данным средний размер и сигма амеб могут быть вычис- лены, как показано в табл. 31. Таблица 31 Вычисление М и а суммарной группы Исследования 1 2 3 4 «1 150 50 100 100 - Snt- = 400 ' 12 000 — —* 2 400 = 30,0 g 2 324 ф 300 “ 399j = 6,5764 cry = 2,56 it Ml \ Ol 29 2 30 3 30 3, 31 2 — tiiMt 4350 1550 3000 3100 StiiMi = 12 000 4 9 9 4 596 441 891 396 2 (щ — 1) ст? = 2 324 Mi-M^, (Mi —Му.)2 —1 1 -^1 1 0, 0 1 nt (Mt — Ms)2 150 50 0 100 2nz (Mi — M2)2 = 300 РАСПРЕДЕЛЕНИЕ Биологические явления могут иметь три категории распределений.- распределение дат, распределение групп и распределение выборочных, показателей. РАСПРЕДЕЛЕНИЕ ДАТ Общие понятия о распределении дат (значений признака), спосо- бы изображения и графического анализа распределений, а также пер- воначальные приемы использования закономерностей нормального рас- пределения при установлении порогов вероятности безошибочных прог- нозов описаны в первой части книги, в объеме, достаточном для освое- ния теории репрезентативности. 104
НОРМАЛЬНОЕ. РАСПРЕДЕЛЕНИЕ Закономерности нормального распределенйя проявляются в форме трех функций нормированного отклонения. В данном случае подразу- меваются нормированные отклонения вариаций (средин классов): W — M х = —------ в изучаемом вариационном ряду. (У Первая функция нормированного отклонения Нормальное распределение частот по классам вариационного ряда можно выразить формулой хг , nk е -2 Р -----------=—• . о У 2л Tlk Первый множитель —- целиком зависит от показателей изучаемо- го вариационного ряда. Рассчитать его легко, разделив на сигму объем> ряда, помноженнный на величину класса. Второй множитель изменяется от класса к классу в зависимости от величины х — нормированного отклонения средин классов. В данном случае аргументом служит это нормированное-отклонение, а функцией,, т. е. величиной, зависящей от аргумента, — величина, которая получит- ся, если, по данному значению х вычислить второй множитель формулы. ' Эта величина и есть первая функция нормированного’ отклонения, обозначаемая символом и формулой: : X* е~~ = . У 2л По этой формуле можно заранее рассчитать величину функции для всех возможных значений нормированного отклонения. Таблица таких величин называется таблицей ординат нормальной кривой или таблицей первой функции нормированного отклонения. Значения первой функции приведены, в табл. VI. Используется первая функция нормированного отклонения при вы- равнивании эмпирических вариационных кривых по нормальному за- кону и при определении третьей функции нормированного отклонения. Выравнивание эмпирических кривых показано в алгоритме 8. Этот- процесс разбивается на следующие этапы. 1. Составление эмпирического вариационного ряда по алгоритму 4. ' tlk 2. Определение показателей ряда: п, k, М, о, -. .° 3. Расчет центральных (W—М) и нормированных х =——— от- сг клонений по каждому классу. 4. Нахождение величин первой функции f(x) для каждого класса по табл. VI. Расчет теоретических частот ряда путем умножения первой функ- nk ции на величину ---: О’ Tlk р ------?(х) (см. алгоритм 8). 105»
Достоверность различия распределений Не всегда эмпирическое распределение так хорошо соответствует нормальному, как это показано в алгоритме 8. Для практических и научных работ часто требуется выяснить, сильно или слабо расходятся эмпирический и теоретический ряды. Для этого необходимо установить такой предел, недостижение которого -означает, что расхождение между эмпирическим и нормальным распре- делениями еще не настолько велико, чтобы с ним считаться, и что дан- ный эмпирический ряд еще можно практически принять за нормальный. Для этой цели применяются особые показатели, из которых в био- .логических исследованиях используются критерий '%2 и критерий %. i Критерий %2 (хи квйдрат) Критерий %2 предложен Карлом Пирсоном и применяется во всех •случаях, когда необходимо определить степень отличия фактического распределения частот от теоретического. Определяется величина %2 по следующей формуле: Л 7 । ' с/ » где f — эмпирическая частота; /' — теоретическая частота. . . . Современные способы использования критерия %2 отличаются от тех, которые были предложены автором критерия, и тех его модифика- ций, которые были разработаны в первой половине двадцатого века. Это обстоятельство надо иметь в виду при освоении алгоритма 9, где показан способ оценки различий эмпирического и теоретического рас- пределений при помощи критерия %2. Следует обратить внимание на то, что при определении различий между эмпирическим и теоретическим распределениями требуется обратный порядок планирования порогов вероятности безошибочных прогнозов. В таких исследованиях чем выше ответственность, тем при меньшем расхождении распределений различие уже считается досто- верным, и, наоборот, чем менее ответственно исследование, тем при большем расхождении распределений различие между ними все еще может считаться недостоверным. Это различие в планирований порогов достоверности показано в табл. 32. Таблица 32 Три порога вероятности безошибочных прогнозов Пороги Минимальная вероятность безошибочных прогнозов Ответственность исследований в обычных биологичес- ких работах при анализе расхождений эмпи- рических и теоретических распределений I Pi = 0, 95 обычная повышенная (!) II ра = О, 99 повышенная обычная III Рз = 0,999 высокая пониженная (!) 106
Таким образом, при оценке различий между эмпирическими и тео- ретическими распределениями в большинстве биологических работ .сле- дует устанавливать не первый, а второй порог вероятности. Первый порог (Pi^.0,95) будет излишне строгим для обычных био- логических работ, но для очень ответственных исследований придется устанавливать эту пограничную вероятность и даже еще меньшую, на- пример Р^О,93, .§^0,90. Равнение на третий порог (р3^0,999) можно допускать только в первых ориентировочных наблюдениях, так как при таком пороге нор- мальными распределениями будут считаться такие, которые уже сильно от него отличаются. Алгоритм 9 имеет и еще одно важное отличие, касающееся мини- мально допустимых теоретических частот в крайних классах распреде- ления, таких частот, которые следует объединять в один общий крайний класс. В более ранних работах по биометрии требовалось, чтобы край- ние классы содержали не очень малые теоретические частоты — не ме- нее 3, 5 и даже 10 (Бейли). На основе последних работ ван-дер-Вардена это правило стало возможным значительно облегчить р применять так, как это показано в алгоритме 9. После того как по этому алгоритму будет найдено эмпирическое значение %2, надо произвести его оценку путем сравнения со стандарт- ными значениями этого критерия, приведенными в табл. XI, для числа степени свободы У2—г2—3 и трех порогов вероятности безошибочных прогнозов. Такая оценка показана в конце алгоритма 9. При опредёлении числа степеней свободы в нормальном распреде- лении дат по классам следует помнить, что в данном случае (нормаль- ное распр’еделение) имеются три ограничения: , определенный объем всей группы (и); определенная средняя (М), от которой берутся цен- тральные отклонения, и определенная сигма (о), по которой произво- дится нормирование центральных отклонений средин классов. Поэтому число степеней устанавливается следующим образом. 1. Определяется первое число степеней свободы, равное имеющему- ся числу классов без трех: . • ^ = ^ — 3. - 2. По первому числу степеней свободы устанавливается минималь- но допустимая теоретическая частота крайних классов. . 3. Классы с малыми (меньше минимально допустимых) теоретиче- скими частотами объединяются в один общий крайний класс; при этом получается второе, уменьшенное число классов: г2. 4. Устанавливается окончательное число степеней свободы, равное уменьшенному числу классов без'трех: v2 = г2— 3 (см. алгоритм 9). Критерий X (лямбда) Критерий % предложен советскими учеными А. Н. Колмогоровым и Н. В. Смирновым и может применяться для определения достоверности расхождения между фактическими и теоретическими распределениями, а также различий между любыми двумя распределениями частот одно- го и того же признака даже в том случае, когда число классов и число дат у этих распределений неодинаково. Для применения критерия лямбда не требуется определять число степеней свободы и не нужны 107
таблицы для определения трех стандартных значений критерия, так как для любого числа классов эти предельные значения одинаковы: 1,36;: 1,63; 1,95 и соответствуют обычным трем степеням вероятности досто- верного различия: [31 = 0,95; р2 = 0,99; р3 = 0,999. Единственным условием применения критерия лямбда является достаточная численность сравни- ваемых распределений — не менее нескольких десятков дат. Для сравнения эмпирического распределения с теоретическим при одинаковом числе классов и при одинаковой общей численности групп критерий лямбда определяется по формуле _ I d [max _ — I max Vn /n ’ где |rf|—максимальная разность (без учета ее знака) между накоп- ленными частотами в эмпирическом и теоретическом распре- делениях для одного и того же класса; п — общее число дат, образовавших эмпирическое распределе- ние. Для определения критерия лямбда’ требуется составить ряды на- копленных частот для обоих сравниваемых распределений ЕД и ЕД', взять наибольшую разность (без учета ее знака) между этими величи- нами |й| = |ЕД—Sfi'lmax и полученную разность разделить на Vп. Эмпирический критерий оценивается по трем постоянным стандарт- ным значениям: 1,36—1,63—1,95. При этом применяется такой же об- ратный порядок порогов достоверности расхождения, как и при исполь- зовании критерия %2. Оценка различий между эмпирическими и теоретическими распре- делениями по критерию лямбда показана в первой части алгоритма 10.. Для выяснения достоверности различия между двумя любыми рас- пределениями частот одного и того же признака при неодинаковом числе дат и классов критерий лямбда вычисляется по формуле % - ' Xfz I | / «1«2 П2 Imax ”1 "Е п2 где ——----- суммы накопленных частот по каждому классу «1 первого распределения (начиная с меньшего),, деленные на общее число дат; —-----то же по второму распределению; «2 i IVf Vf ] - z ’ —--------— —максимальное абсолютное значение (без учета Я-1 ^2 |тах знака) разности частных от деления накопленных частот на численности групп по каждому классу, начиная с наименьшего; п\, Пэ — общее число дат по. первому и второму распреде- лениям. Оценка расхождения между двумя любыми распределениями пока- зана во второй части алгоритма 10. Асимметрия и эксцесс Некоторые признаки растений, животных и микроорганизмов при объединении объектов в группы дают распределения, значительно отли- чающиеся от нормального. 108
В тех случаях, когда какие-нибудь причины благоприятствуют появлению значений признака, отличающихся от средней величины в сторону уменьшения или увеличения, образуются асимметричные распределения. При асимметрии эмпирическое распределение имеет увеличенные (против симметричного расположения) частоты в левой или правой* части.. В соответствии с этим различают или левую, или правую асимметрию, которые показаны на рис. И. 250 200 150 100 50 0 1 2 1 /\ - *• у г W 0 1 2 3 4 5 6- 7 8 9 10 Л 1 10 45 120 210 252 210 120 45 10 1 П=1024 Л 20 175 240 220 150 100 60 30 20 7 1 П=1024 /- 1 7 20 30 60 . 100 150 220 240 ’175 20 П=702$ ' Рис. 11. Асимметрия: -/ 1—левая, положительная; 2 — правая, отрицательная В тех случаях, когда какие-нибудь причины благоприятствуют преимущественному появлению и средних, и крайних значений призна- ка, образуются положительные эксцессивные распределения, имеющие вид острой пирамиды с расширенным основанием (рис. 12). При отри- цательном эксцессе в центре распределения имеется не вершина, а впа- дина, причем распределение становится двумодальным, а вариацион- ная кривая — 'двувершинной. В некоторых исследованиях требуется выяснить, действительно ли распределение изучаемого признака имеет асимметрию или эксцесс. Например, при изучении ареалов распросранения морских живот- ных можно предположить, что распределение особей этого вида по глу- бине обитания должно быть асимметричным, так как свободному рас- пространению его в одном из направлений-—вверх — препятствует I 109
естественная граница: поверхность моря. Это, предположение можно проверить, исследовав степень асимметричности распределений. Нали- чие эксцессивного распределения одного из жизненно важных призна- ков изучаемого вида животных или растений может указать на тенден- цию этого вида образовывать не только обычные, типичные формы, но также давать в повышенном количестве новые для него вариации, сильно отклоняющиеся от нормы. Для выяснения достоверности того, что (Изучаемое распределение отличается от нормального именно в сторону асимметрии или эксцесса, применяют обычный в биометрии метод сравнения показателей с их ошибками репрезентативности. Показатели асимметрии и эксцесса с их, ошибками рёпрезентатив* ности определяются по следующим формулам: , 2D3 Г 6 , Д Q л=-—; тА=]/ tA = -—>3; Пб3 у п тА с SD* о о ] Г 6 . Е . о В = — ----3; щ£ = 2 1/ —; ^ = — > 3, ПО4 , V П тЕ где А — показатель асимметрии; SD3=S(W7—А4)3— сумма кубов отклонений средин классов от - средней арифметической (центральных, откло* нений),; о3 — среднее ' квадратйческое, отклонение, возведен*-' ное в третью степень; Е — показатель эксцесса; 110
• СО СО СО Ef S ч \о СО н Вычисление показателей асимметрии и эксцесса (/ — частоты классов!) 1И
2£)4=2(1^—Af)4 — сумма четвертых степеней центральных откло- нений средин классов; о4 — четвертая степень среднего квадратического от- клонения; п — общее число дат в эмпирическом распределении; тА, тЕ — ошибки репрезентативности показателей асим- метрии и эксцесса; tB — критерии достоверности выборочных показате- лей асимметрии и эксцесса. Показатели асимметрии и эксцесса свидетельствуют о достоверном отличии эмпирических распределений от нормального в том случае, если •они превышают свою ошибку репрезентативности в три и более раз. Вычисление показателей асимметрии и эксцесса для распределе- ния особей одного морского животного по глубине обитания показано в табл. 33. Были взяты пробы объемом 1 л*3 на разных глубинах: от О (у самой поверхности моря) до примерно 1 км, и в каждой пробе под- считано число особей данного вида. Таким образом, каждый объект исследования получил свое значение признака — глубину его обитания. При обработке первичных материалов все распределение глубин обитания было сведено в вариационный ряд с классовым промежутком 100 м, начиная с классов 0—99, 100—199 и т. д. и кончая классами 900—999, 1000—1099 со срединами классов 50, 150 и т. д. до 950, 1050. Вариационная кривая и кумулята (с соответствующими нормальными кривыми) полученного распределения представлены на рис. 13. Для расчета показателей асимметрии и эксцесса требуется найти суммы третьих и четвертых степеней центральных отклонений (откло- нений средин классов от средней арифметической). При прямых спосо- бах определения М, о, SD3 и 2D4 получаются громоздкие цифры, что очень сильно затрудняет счетную работу даже при наличии простейших счетных машин. Легко запоминающимся способом упрощения расчетов может быть уменьшение средин классов в одно и то же число раз. В примере, представленном в табл. 33, все вариации разделены на 50, в результате вместо многозначных цифр от 50 до 1050 получились мало- значные от 1 до 21. При этом показатели асимметрии и эксцесса полу- чаются такими же, как и при работе с непреобразованными громозд- кими цифрами. Для получения в первоначальных единицах средней арифметиче- ской и среднего квадратического 'отклонения требуется помножить на 50 (на величину, на которую были разделены все средины классов) величины, полученные при преобразованных вариациях. Вторая функция нормированного отклонения При отборе особей для различных целей возникает ряд задач, свя- занных с определением количества особей, обладающих какими-нибудь определенными свойствами: превышающих какой-нибудь стандарт или не удовлетворяющих заданным требованиям. В других случаях, имея задание отобрать из массива определенную часть особей, требуется установить стандарт такого отбора. \ Все такие задачи решаются путем использования закономерностей нормального распределения при помощи второй функции нормирован- ного отклонения. 112 I
Рис. 13. Вариационная кривая' и кумулята распределения глубины обитания МОРСКОГО ЖИВОТНОГО' 8 Н. А. Ялохинский
Вторая функция нормированного отклонения определяется по фор- муле х *2 ср (х) = ——- I е 2 dx-, где <р(%)—обозначение второй функции нормированного отклонения; . х — нормированное отклонение заданной величины признака, или стандарта. Вторая функция есть определенный интеграл первой функции в границах от 0 (от средней) до х, т. е. до заданного значения признака, выраженного в нормированных отклонениях. Вторая функция нормиро- ванного отклонения указывает ту долю особей, которые находятся между средней арифметической и заданной величиной признака. Рис. 14. Первая f (х) и вторая <р (х) функции нормированного отклонения Взаимоотношения между второй и первой функциями нормирован- ного отклонения показаны на рис. 14. На первом графике этого рисунка нормированное отклонение х=+1,0, т. е. стандарт больше средней на одну сигму; на втором гра- фике х=<—1,0, т. е. стандарт меньше средней на лу же величину. Первая функция, или отсекающая ордината, пропорциональна ча- стоте распределения ,в точке заданной величины признака или в точке стандарта. . Вторая функция равна доле особей, у которых значение признака больше средней, но не больше стандарта. Это относится к таким рас- пределениям, которые в точности соответствуют нормальному распре- делению. Так же как и для первой функции, можно заранее рассчитать зна- чение второй функции для любой величины нормированного отклоне7 ния. Такой расчет ведется по специальным рабочим формулам (интегра- ла нормальной кривой или интеграла вероятностей). ' Значения второй функции нормированного отклонения приведены в табл. VII. z ' Применение свойств второй функции нормированного отклонения можно показать на следующих примерах. 114
Пример 43. ГУ пчел определенной породы длина хоботка М = 6,0 мм и о=0,3 мм, а для того чтобы легко опылять клевер, требует- ся хоботок длиной 6,6 мм. Какое количество пчел этой породы будет опылять клеверные поля? В данном случае имеется стандарт признака — 6,6 мм, который больше средней для породы на 6,6—6,0 = 0,6 мм, или на — 0,6 = + 2,0 сигмы. Это и есть нормированное отклонение стандарта. Рис. 15. Величина <7=0,5—<р(х) при х= +2,0 При х= +2,0 вторая функция <р(х)=0;477 (см. табл. VII)'. Это доля пчел, у которых хоботок длиннее среднего хоботка для породы, но не превосходит стандарт. Всего в породе имеется 0,5 (50%) пчел с хоботком длиннее сред- него, из них 0,477 (47,7%) пчел не удовлетворяют стандарту, следова- тельно, опылять клевер будут 0,5—0,477 = 0,023, или 2,3% пчел. Решение таких задач ведется по общей формуле <7 = 0,5— <р(х). Решение этого примера иллюстрируется рис. 15. Пр и мер 44. Пчел, у которых Л4 = 6,4 мм и ст=0,3 мм, перевели на такой сорт клевера, для опыления которого им достаточно иметь хоботок длиной 6,1 мм. Какое количество пчел будет опылять этот сорт клевера? Решение этого примера показано на рис. 16. Теперь стандарт оказался меньше средней, значит опылять клевер будет вся лучшая половина пчел плюс та часть, которая имеет хобо- ток короче среднего для породы, но длиннее требуемого стандарта. Задача может быть решена по формуле q = 0,5 + cp(x) следующим образом: 6,1 —6,4 - , п х = ------— = — 1,0, 0,3 ф(х) = 0,341, 9= 0,5 + 0,341 =0,841, или 84,1%. Решение подобных примеров показано еще и на рис. 17. 8* 115
Х = 1-1,33 х = -О,57 Рис. 17. Доля особей (<?), удовлетворяющих стандартам, выраженным в нор- мированных отклонениях а—<7=0,5—1|)(х) прн х= + 1,33 б—<7=0,5+1]) (х) при х=—0,67 Третья функция нормированного отклонения В некоторых исследованиях требуется предусмотреть среднее качество особей, удовлетворяющих или не удовлетворяющих задан- ному стандарту, или среднюю признака для отсеченной части. Это мож- но сделать при помощи третьей функции нормированного отклонения, которая обозначается символом F(x). Третья функция нормированного отклонения показывает, на сколь- ко сигм отстоит от общей средней средняя отсеченной части:. Mi = Мо ± F (х) о, где Mi — средняя для отсеченной части, например, средняя для особей, превышающих по какому-нибудь признаку заданный стан- дарт; Л40 — средняя для всего массива особей; F(x) — третья функция нормированного отклонения; о — среднее квадратическое отклонение всего массива особей. Определить третью функцию нормированного отклонения можно по следующему правилу: третья функция равна отсекающей ординате (первой функции), деленной на отсеченную долю. Это выражается фор- мулой где f(x) —первая функция нормированного отклонения, ‘или отсекаю- щая ордината; <р(х) —вторая функция нормированного отклонения, показываю- щая долю особей в пределах от средней до заданного зна- чения признака (или между центральной и отсекающей ординатами). Если стандарт больше средней, то доля особей, превышающих зна- чение стандарта, равна „ 0,5 — <р(х); 116
если стандарт меньше средней, то доля особей, превышающих значе- ние стандарта, равна .0,5+ <₽(-*)•’ ' Взаимоотношение между тремя функциями нормированного откло- нения показано на рис. 18. Как видно из графиков, каждое значение стандарта отсекает по обе стороны от себя две части распределения: справа-—особей, превы- шающих заданное значение, слева — особей, у которых величина при- знака меньше стандарта. Поэтому и средних для отсеченных частей может быть две: одна для правой части, где признак больше стандарта, Рис. 18. Первая f(x), вторая ср(х) и третья F(x) функций нормированного отклонения и другая для левой, где величина признака меньше заданной величины. Каждому значению нормированного отклонения соответствуют два значения третьей функции: F.p(x) для левой части и Fg(x') для правой части распределения. В зависимости от того, для какой части определяется средняя (для левой или правой), а также и от того, какое значение имеет нормиро- ванное отклонение (х = 0, х<0, х>0), вычисление идет по рйзным схе- мам, показанным в табл. 34. "Пример 45. Из большой партии яиц необходимо отобрать луч- шую часть с весом яйца 70 г и более и предусмотреть, какие средние, веса будут в отобранной и оставшейся, худшей части. Известно, что эта партия получена от породы кур, которая в условиях данной птицефабри- ки дает обычно яйца со средним весом Л4 = 70 г и о=10 г. В данном случае стандарт отбора равен средней' для всего мас- сива; вычисление третьей функции необходимо вести пр схеме первого столбца табл. 34. Для лучшей части средняя Мд = Мо + 0,8ст = 70 + 8 = 78; для худшей* Мр = Мо — 0,8ц = 70 — 8 = 62. 117
Таблица 34 Схема вычисления третьей функции нормированного отклонения Части распределения Обозначения Р’Ч Третья функция левая (меньше стандарта) правая (больше стандарта) Fp (х) Fq (х) 0,79788 я 0,8 0,79788 я 0,8 / (х) Их) 0,5 — ф (х) Их) ' 0,5 4" Ф (х) f(x) 0,5 4- ср (х) 0,5 — ф (х) Средняя отсеченной части левая (меньше стандарта) правая (больше стандарта) Мр Мд Мв —0,8(7 ТИо -ф- 0,8(7 Mg — Fq (х)(Т Мд ф рд (х) в Л40 — Fp(x)c Fq (#) в П р и м е р 46. Из большого стада овец со средним настригом' шерсти Л4=4,0 кг и ц=1,0 кг решено отобрать элитную часть овец, дающих 5,0 кг и более шерсти за год. Требуется предусмотреть, какой при этом можно ожидать средний настриг у отобранной элитной и у оставшейся части. Стандарт больше общей средней, следовательно, расчет средних для обеих частей (лучшей и худшей) надо вести по третьему столбцу табл. 34. Нормированное отклонение стандарта х = ------— функция/(х) = 0,242, вторая функция <р(х) = 0,341. Для лучшей, элитной, части третья функция = + 1,0, первая Р9 (*) = 0,242 _ 0,242 _ , г99 0,5 — 0,341 — О', 159 “ ’ для худшей, оставшейся части F (х) = —= 0,288. pv 0,5 0,341 0,841 Искомые средние для лучшей части Л4д=Л4о+77д(х)<т=4,О + 1,522 = = 5,52 кг; для худшей части Мр = Мй—Ер(х)(Т=4,0—0,288=3,71 кг. Количество овец, которые попадут в элитную группу, составляет [0,5—<р(х)] 100=15,9%. РАСПРЕДЕЛЕНИЕ ГРУПП Нормальное, асимметричное, эксцессивное распределения — это распределения единичных объектов, попадающих в разные классы ва- риационного ряда. Если исследуется не количественный, а качественный признак, ко- торый может только .или быть или не быть у данного объекта (пол, заболевание, масть, особенность поведения и т. д.), то в таких случаях тоже составляются распределения, но уже не дат, а групп по числу .118
плюсовых объектов, т. е. объектов, обладающих изучаемым качествен- ным признаком. Из таких распределений наибольшее значение в биологии имеют биномиальное распределение и распределение Пуассона. - БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Если изучается несколько (г) групп, одинаковых по числу входя- щих в них особей (п), то можно, составить распределение таких групп по числу особей, имеющих изучаемый признак (плюсовых объектов). Например, в каждом десятке выловленных рыб, могут встретиться О, 1, 2, 3, 4, 5, 6, 7, 8, 9 и все 10 особей, пораженных какой-нибудь глист- ной инвазией. Несколько десятков не будут иметь в своем составе пора- женных рыб, несколько десятков будут иметь только по одной больной рыбе, несколько десятков — по 2 рыбы и т. д. В'результате составится распределение, в котором вариациями будут величины п+— число особей, имеющих изучаемый признак в от- дельных равночисленных частных группах, а частотами —— количе- ство соответствующих групп. Распределение 20 десятков выловленных карпов по числу рыб, по- раженных глистной инвазией, представлено в табл. 35. Таблица 35 Число больных рыб в каждом десятке 0 1 2 3 4 5 6 7 8 9 10 Всего десят- ков Число десятков (г/) .... 1 3 4 5 3 2’ 1 1 0 0 0 20 Распределения частных равночисленных групп по значению п+ (по числу особей в каждой группе, имеющих изучаемый признак) на- зываются биномиальными. Такое название объясняется, .во-пер- вых, тем, что признак может иметь всегда только два варианта: он есть, или его нет; во-вторых, закономерности таких распределений имеют количественное выражение, связанное с коэффициентами разложения бинома Ньютона, который в’применении к этому типу распределений может быть выражен следующим образом: (р + qy = JLpoqn + JL pqn-\ + + n(n— l)(n — 2) 3 3 _ + _1_ п 0 1.2.3 1 г 4 где р — средняя или ожидаемая доля особей, имеющих . изучаемый признак, среди всех особей данной категории (в генеральной совокупности); п — одинаковая численность каждой изучаемой группы. t Каждый член бинома может быть представлен в виде произведе- ния, двух множителей, из которых первый целиком зависит от вели- ., . п п (п — 1) чины п: /(«) = —; ' ' и т. д.,1 а .второй —от соотношения р и q-. f (р, q) =цп; pqn^ и т. д,. Первые множители каждрго члена бинома — коэффициенты бино- ма— определяются в зависимости от величины п (число особей в каж- 119
Таблица 36 Арифметический треугольник (Паскаля) Объем частных групп 0,5" п=1 1 1 0,5 - п=2 1 2 1 0,25 п=3 1 3 3 1 0,125 ' п=4 1 4 6 4 1 0,0625 п=5 1 5 10 10 5 1 0,03125 п=6 1 6 15 20 15 6 1 0,015625 п=7 1 7 21 35 35 21 7 1 0,0078125 п=8 1 8 28 56 70 56 28 8 1 0,00390625 п=9 1 9 36 84 126 126 84 36 .9 1 0,001953125 я=10 1 10 45 120 210 252 210 120 45 10 1 0,0009765625 дой частной группе) по арифметическому треугольнику, в котором каж- дое число равно сумме двух чисел, стоящих над ним (табл. 36s). Подставляя в формулу бинома величины f(n) и f(p, q) и решая ее относительно величины р, можно получить следующие значения: qn — нулевой член бинома (содержащий р в нулевой сте- пени) дает ожидаемую долю таких равночисленных груцп, в которых из п особей ни одна не имеет изу- - чаевого признака; npqn~l— первый член бинома (с р1) дает долю групп, в кото- рых только одна особь имеет ожидаемый признак; —Р2(1п~2— второй член бинома (с р2) дает долю групп, в кото- рых изучаемый признак имеет по две особи; f(n)hpkqn~k— й-тый член бинома, соответствует доле групп, в кото- рых имеется k особей с изучаемым признаком; рп — последний член бинома дает долю равночисленных групп, в которых все п особей имеют изучаемый признак. В тех случаях, когда ожидаемые доли р и q равны, что может быть только при р='(/ = 0,5, формула бинома значительно упрощается: (0,5 + 0,5)" = 0,5" + 0,5" + п(” ~ 0,5" + ... + 0,5". Чтобы определить ожидаемые доли частных групп такого распределе- ния, надо взять числа f(ra)f, f(ra)2 и т. д. из соответствующей (га) строки арифметического треугольника и каждую из них помножить на одно и то же число 0,5", стоящее в той же строке табл. 36. Пример 47. Среди одной популяции львиного зева пелорическая форма цветка встречается у 10% растений. Если взять 100 групп (букетов) по 5 растений в каждом из разных мест без выбора, то сколько можно ожидать букетов без пелорических цветков и букетов с 1, 2, 3, 4 и 5 растениями, имеющими такие цветки? В данном случае имеется га =100 групп по га=5 особей в каждой, причем общая доля особей, имеющих изучаемый признак, равна р=0,1. Определение ожидаемых частот г/ такого распределения представ- лено в табл.37. Расчеты показывают, что при общей доле р = 0,1 особей, имеющих данный признак при г=-100 групп по га=5 особей в каждой, может 120
Таблица 37 Определение ожидаемых частот биномиального распределения букетов по числу растений львиного зева с пелорической формой венчика при г=100, п=5, р=0,1, <7=0,9 Число расте- ний с пелори- ческими цветками f * •п f (Р, 9) = =fWf(P, <7) r. =rf(n)f(p, g) 0 1 р0р5=1 | <_9' JO, 59 049 / ~ 100 000 0,59049 59 1 5 < Г / 9' a 6 561 .0,32805 33 Р<?4— JO, ) \io, 100 000 2 10 pV—1 < 1' \2 < 9' \3 729 0,07290 7 JO, / Aid, 100 000 3 10 Р3Р2= | < Г \3 / 9' \2 81 0,00810 1 JO, / \10. 100 000 4 5 < г \4 < 9' < 1 9 0,00045 Р4Р— JO, / Aio, 100 000 5 1 Р5Р°= < г \5 ) ‘1== 1 0,00001 jo. 100 000 * По арифметическому треугольнику для п==5. * * Доля групп, имеющих 0, 1, 2, 3, 4 и 5 растений с пелорическими цветками. встретиться 59 групп без пелорических цветков, 33 группы, в которых из пяти растений одно будет с пелорическими цветками, 7 групп, имею- щих из пяти два таких растения, и 1 группа, в которой из пяти особей три будут иметь изучаемый признак. Появление групп с четырьмя и пятью растениями, имеющими пелорические цветки, при данных усло- виях маловероятно. ( Легко подсчитать, что при г=1000 можно ожидать, что один букет из тысячи будет иметь четыре ' растения (из пяти) с пелорическими цветками: п, 0 1 2 3 4 5 Всего букетов П 590 328 73 8.1 — 1000 И только набрав десять тысяч таких букетов, можно ожидать, что среди них будет один, в котором все пять растений будут с пелориче- скими цветками. Пример 48. Исследование племенных книг орловского рысака показывает, что если взять всех известных <маток, принесших по 10 жеребят и учесть соотношение полов в приплоде каждой матки, то получится распределение, представленное в табл. 38. Таблица 38 Число жеребчиков n_^_ 0 1 2 3 4 5 6 7 8 9- 10. Всего маток Число кобы- лок n_ 10 9 8 7 6 '5 4 3 2 1 0 г=2гг=231 Число мате- рей ft 0 4 3 33 45 56 44 28 14 3 1 121
Среднее число жеребчиков на приплод из 10 жеребят от каждой матери А4Г = -^-п+ = (1 х 10 + 3x9 + 14x8 + 28x7 +'44x6 + 56x5 + 45x4 + 2г; + 33x3 + 3x2 + 4x1 +0x0): 231 = -^- = 5,1, а общая средняя доля жеребчиков в потомстве 231 матки 1178 5,1 ПС1 ' р =---------= —— = 0,51. 10x231 10 Было высказано предположение, что вообще у всех орловских рыса- ков в условиях наших племенных заводов жеребчиков родится столько же, сколько и кобылок, т. е. общая доля рождающихся жеребчиков р = 0,5, а в потомстве изученных орловских маток произошло обычное случайнбе отклонение от общей генетической закономерности. Число прйплодов . .. *** С'-‘О Q У § Г '2 1 Число жеребчиков В приплоде 0 1 2 3 4 5 6 7 8 Я 10 Эмпирическое распреде- ление матерей Р 0 4 3 33 45 55 ' 44 28 14 3 1 Теоретическое биномиаль- ное распределение Pi 0 2 10 27 48 57 48 27 10 2 0 Рис. -19. Биномиальное распределение приплодов по 10 жеребят в каждом по числу жеребчиков: ' 1 — эмпирическое распределение маток, имевших в приплоде (из 10 жеребят) разное’ число жеребчиков; 2 — теоретическое биномиальное распределение Для проверки этого предположения было рассчитано биномиаль- ное распределение по данным описанного исследования: г=231, п= 10 и р = 0,5. Результаты показаны в табл. 39. Расчеты, а также рис. 19 показывают, что если принять гипотезу о том, что жеребчиков родится столько же, сколько и кобылок, то выте- кающее из этого биномиальное теоретическое распределение очень близко к фактическому и незначительное расхождение теоретического и фактического распределений недостоверно (и по критерию %2, и по критерию X). ' Таким образом, приведенные факты из истории коннозаводства не опровергли гипотезы о том, что вообще у лошадей орловской породы 122 ,
Таблица 39 Расчет ожидаемых частот биномиального распределения приплодов от орловских кобыл по числу родившихся жеребчиков. Число приплодов г=231, жеребят в каждом приплоде и=10, предполагаемая доля жеребчиков и кобылок в генеральной совокупности p=q=0,5. Расчет по формуле 0,510—|—0,510-/(«)14-0,51<)/:(/г)2-|—.. .—|—0,510 Классы распреде- ления. Число жеребчиков в приплоде Эмпирические частоты. Число приплодов ц Число арифме- * тического треу- гольника f(n) п=10 Доли теоретических г. частот =0,510f(rc) 231 Теоретические частоты z\=231-0,510f(«) ’ , ю 1 1 0,00098 0,2 9 3 10 0,00977 2,3 8 14 45 . 0,04395 10,2 7 28 120 0,11719 27,1 6 44 210 0,20508 47,3 5 56 252 0,24609 56,8 4- 45 210 0,20508 47,3 3 33 120 0,11719 27,1 2 3 45 0,04395 10,2 1 4 10 0, 00977 2,3 0 0 1 0, 00098 0,2 231 с 231,0 жеребчиков родится столько же, сколько и кобылок, в соответствии с генетической теорией случайного соединения гамет. Если исследуется распределение многочисленных групп, то значи- тельно усложняются расчеты членов бинома при больших значениях п. В таких случаях с достаточным приближением можно получить теоретическое биномиальное распределение групп, применив формулу нормального распределения в следующем виде: и = -?/(*) > (Т где г/ — теоретическая частота i-того класса частных групп, в который отнесены группы, имеющие определеннее число (i = 0, 1, 2, 3 и т. д.) особей с изучаемым при- знаком; г — общее число исследованных равночисленных групп по п особей в каждой; о — среднее квадратическое отклонение числа особей, обладающих изучаемым признаком; f(n)— первая функция нормированного отклонения, значе- ния которой приведены в табл. VI; и . — п I х = —-----— — нормированное отклонение числа особей, имеющих изучаемый признак (т. е. нормированное отклонение чисел 0, 1, 2, 3 и т. д.); п+ — число особей в группе, имеющих изучаемый признак; по этому числу изучаемые равночисленные группы разносятся по классам- распределения; м+ — среднее число особей, имеющих изучаемый признак, по отдельным равночисленным группам. Средняя арифметическая п+ и сигма О числа особей, имеющих изу- чаемый признак, рассчитываются различно, в зависимости от- исходных данных. 123
Если имеется только эмпирическое распределенйе равночисленных частных групп' по числу особей, имеющих изучаемый признак, и нет никаких предположений или сведений о доле групп, имеющих изучае- мый признак среди всех особей данной категории, то в таких случаях п+ и о определяются по формулам: А; - С = 2гг«+ — ^re+)2, г где м+ — среднее число особей, имеющих изучаемый признак; гг — число равночисленных групп, имеющих одно определенное число особей с изучаемым признаком; это частоты бино- миального эмпирического распределения; п+ — число особей с изучаемым признаком (0,1, 2, 3 и т. д.); это классы биномиального распределения; .r=Sr< — общее число изученных равночисленных групп, каждая из которых имеет всего п особей, из которых п+ особей име- ют изучаемый признак. Если же имеются сведения или высказывается гипотеза о доле осо- бей, имеющих изучаемый признак среди всех особей данной категории, то п+ и о рассчитываются по формулам: п+ = пР; о == Y nPQ, где п — численность изучаемых частных групп (одинаковая для всех групп); Р — доля особей, имеющих изучаемый.признак среди всех' особей данной категории; Q=1—Р — доля особей, не имеющих данного признака среди всех особей изученной категории. Таким образом, выравнивание эмпирических биномиальных кри- вых по нормальному закону при наличии многочисленных частных групп можно проводить в следующем порядке. ' 1. Установить п+ и <т всего распределения описанными способами. - п I — п, 2. Составить ряд нормированных отклонений х = —---- для каж- дого класса. 3. По нормированный отклонениям выписать значения первой • функции f (х) из табл. VI. 4. Умножив первую функцию на величину г/<т, получить теоретиче- ские частоты ряда. Определение числа степеней свободы для биномиальных распреде- лений производится по следующим двум правилам. 1. Если величины п+ и <т определяются на основе эмпирических данных, то имеются три ограничения свободы распределения: общее число частных групп г, среднее число плюсовых объектов п+ и сигма ряда ст. Поэтому в таких случаях число степеней свободы равно числу классов эмпирического распределения (6) без трех: ; v = b — 3. 2. Если же величины п+ и о определяются на основе гипотезы о генеральной доле, то ограничений остается только два: общее число 124 ' .
частных групп г и генеральная доля Р, по которой рассчитывается и п+ и о. Следовательно, в таких случаях число степеней свободы -равно числу классов эмпирического распределения (6) без двух: v = b — 2. РАСПРЕДЕЛЕНИЕ ПУАССОНА При биномиальном распределении число плюсовых объектов может быть любым: и небольшим (О, 1, 2), и большим, достигающим объема группы, когда вся группа состоит из объектов, обладающих альтерна- тивным качественным признаком. В биологии есть и другая категория событий, которые происходят очень редко — один или небольшое число раз на 1000, 10 000 и более обычных явлений. Для таких явлений тоже может быть составлено распределение, в котором вариации — это различное число редких со- бытий, обычно 0, 1, 2, 3, 4, 5 и т. д., а частоты — количество больших групп, в которых редкое событие произошло определенное число раз. Закономерности распределения таких редких событий, вскрытые Пуассоном, можно выразить следующей формулой: где гх' — теоретическая частота распределения, ожидаемое число больших групп, среди которых редкое событие произошло х раз; гх — эмпирическая частота, число больших групп, имею- щих х плюсовых объектов; г=2гж—. общее количество исследованных больших групп; е=2,71 828 — основание натуральных логарифмов; х — число редких событий, происшедших в каждой боль- шой группе; обычно х равно небольшому целому чис- < лу: 0, 1, 2, 3 и т. д.; х! — произведение натуральных чисел от 1 до х (факто- риал). Считается, что факториал нуля равен едини- це: 0! = 1; а ---------среднее число редких случаев на каждую большую г группу: В распределении Пуассойа значение средней величины а примерно равно квадрату сигмы о2 (варианса) :- Из этой особенности распределения редких событий вытекают два следствия. Во-первых, все теоретическое распределение может быть построено на основании только одной средней, полученной для изучаемого эмпи- рического распределения. Это обстоятельство дает возможность рассчи- тать заранее относительные частоты гх е~аах г х! для всех возможных значений а, что значительно упрощает процесс со- ставления теоретического распределения по данному эмпирическому. Величины относительных частот распределения редких событий для ' разных значений а=-----— приведены в табл. VIII. 125
. Во-вторых, при определении достоверности отличия теоретического распределения от эмпирического при помощи критерия %2 число степе- • ней свободы для распределения Пуассона необходимо принимать рав- ным г—2, так как все эмпирическое распределение редких событий ограничивается двумя условиями: числом групп И средним числом плю- совых объектов. Не-следует думать, что примерное равенство а^<т2 есть отличитель- ная особенность только одного распределения Пуассона. Существует много нормальных распределений, в которых Л1 = о2, например: Г 0 2 4 6 8,,.,. / 1 4 6 4 1 М=4’ ° -4- Поэтому распределением Пуассона можно считать только такое, которое следует закону, выраженному указанной формулой, вернее та- кое, которое недостоверно отличается от теоретического, построенного по закону Пуассона. Техника выравнивания распределений по Пуассону показана на примере 49. Пример 49. Смерть человека вследствие• того, что его лягнула лошадь — явление чрезвычайно редкое. Были изучены отчеты десяти армейских,корпусов за 20 лет. Всего исследовано 200 больших групп, причем в 109 группах не было зарегистрировано ни одной смерти от удара лошадью, в 65 группах было по одному такому случаю, в 22 груп- пах — по 2 случая, в трех группах — по. 3 и в одном корпусе за один год зарегистрировано 4 смерти от удара лошади. Анализ показал, что распределение таких редких случаев вполне соответствует закону Пуассона (см. табл., 40). - . Таблица 40 Сопоставление эмпирического и теоретического (по Пуассону) распределения числа смертей кавалеристов от удара лошади (очень редкие случаи) Эмпирическое распределение Теоретическое распределение вариации х (число смертей в одном корпусе за 'один год) частоты тх (число корпусов, в кото- рых за один год было х смертей) относительные частоты т' А X1 (по табл. VIII для а=0,6) абсолютные частоты г' = — 200 х г (по Пуассону) 6 * 0,00004 0, 61 5 0,00036 0,08 4 1 0, 00296 0,06 3 3 0, 01976 4,0 2 22 0, 09879 19,8 , 1 65 0, 32929 65,8 0 109 0,54881 109,8 200 - 1,00001 200,09 r=2rx=200 2хгх=4-1-|-3-34-2-224-1-654-0-109= 122 а—---- г 122 200 =0,61^0,6. РАСПРЕДЕЛЕНИЕ ВЫБОРОЧНЫХ ПОКАЗАТЕЛЕЙ Представим, что из одной генеральной совокупности взято много выборок одинакового объема. Если генеральная совокупность не очень большая, то «много выбо- рок» — это все возможные группы данного объема, которые можно со- 126
ставить из всех объектов Генеральной совокупности. Число таких выбо- рок равно числу сочетаний по п элементов из совокупности объемом N: гп М С N = ----------, nl(N — п)\ где М! п\ (N—n)J — факториалы чисел, т. е. произведения натураль- ных чисел от единицы до данного числа: 5! = = 1-2-3-4-5 = 120. Факториал нуля равен единице. Из генеральной совокупности объемом М=|Ц групп по 3 можно составить следующее количество: „з И! l-2-3.4-5-6-7-8-9-10.il 9.10-11 3-5-11 1СС Си =-----------= --------------------- =---------=------- = loo. 31(11—3)! 1-2-3-1-2-3.4-5.6-7-8 1-2-3 1-1-1 Если генеральная совокупность бесконечна, то «много выборок» означает такое их количество, увеличение которого не изменяет прак- тически величину изучаемых сводных показателей для данной большой совокупности выборок. Если для каждой из многих выборок получены сводные показатели М, <т, Цх, г, то по их величине можно составить распределение, в кото- ром отдельные значения показателя будут иметь определенные частоты или определенные вероятности их появления: значения показателя А; А2 А3 .... Ап вероятности В{ В2 В3 .... Bn(SBi=l). Такие распределения выборочных показателей обладают особыми свойствами. Средняя величина распределения такого выборочного показателя называется его математическим ожиданием, она равна сумме произве- дений отдельных'величин на их вероятности: Е(А) = 2АДг. ' Так определяются математические ожидания как для показателей, так и для любой функции, например у = а+Ьх, Цх —С^С-у и т. д.., полу- ченных в выборках или выборочных комплексах (это справедливо для большинства показателей, используемых в биологии). Каждый выборочный показатель или выборочная (эмпирическая) функция могут служить оценкой соответствующего генерального пара- метра.* Математическое ожидайие помогает определить точность такой оценки. Если математическое ожидание показателя или функции равно генеральному параметру, то оценка называется несмещенной. Если математическое ожидание показателя или функции больше или меньше генерального параметра, оценка называется положительно смещенной или отрицательно смещенной (в большей или меньшей сте- пени). Среднее квадратическое отклонение (сигма) распределения многих выборочных значений данного показателя есть теоретическая величина ошибки репрезентативности этого показателя при данном объеме вы- борки: о^ = тл. Эмпирические значения ошибок репрезентативности, получаемые на основе выборочных данных по известным формулам, есть прибли- женные значения, более или менее близкие к теоретическим. Для на- 127
хождения формул ошибок репрезентативности требуется изучить закон (формулу) распределения изучаемого выборочного показателя, найти формулу среднего квадратического отклонения этого распределения и сконструировать практический алгоритм расчета ошибки репрезентатив- ности для данного показателя. Среднее квадратическое отклонение распределения многих выбо- рочных показателей дает другую характеристику оценки генеральных параметров по выборочным показателям. Степень разнообразия, изме- - ряемая сигмой этого распределения, определяет большую или меньшую эффективность такой оценки. Распределение выборочных средних в полном комплекте или в большом количестве выборок не имеет смещения математического ожи- дания против генерального параметра: Е(Л1) = 7Й. Эффективность оценки средней может быть большей или меньшей, в зависимости от природы изучаемого признака. Кроме того, распреде- ление большого числа (или полного комплекта) выборочных средних стремится к нормальному, даже в тех случаях, когда распределение дат (первичных измерений) заметно отличается от нормального. Поэто- му распределение средней арифметической (распределение 7И) обычно очень близко к нормальному, что позволяет значительно облегчить запрет пользоваться обычными критериями достоверности при не сов- сем нормальном распределении первичных дат. Распределение выборочных среднйх квадратов при расчете их по старой формуле (без учета степеней свободы) имеет явное отрицатель- ное смещение , 2(У — МУ П, 2 при s2 = —---------> Е (s2) <^.о2, и но если расчет ведется по современной формуле, смещение значительно сглаживается 1 ' , 2(V — му „ при s2 = —---------> Е (з2) = ст2. п — 1 Такие же особенности имеет и распределение выборочных средних квадратических отклонений. РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРОЧНЫХ ПОКАЗАТЕЛЕЙ Начальные сведения по теории и практике определения достоверно- сти выборочных показателей, освоение которых возможно без знаком- ства с теорией корреляции й дисперсионным анализом, приведены в первой части книги. Во второй части описываются те части учения о репрезентативно- сти, для понимания которых необходимо знакомство со всеми основами биометрии, в том числе с коэффициентами корреляции и с простейшими приемами дисперсионного анадиза. ДОСТОВЕРНОСТЬ РАЗНОСТИ СРЕДНИХ ПРИ КОРРЕЛИРОВАННЫХ ВЫБОРКАХ Иногда по средней величине признака сравниваются такие выбор- ки, в которых каждой особи в одной .выборке соответствует определен- ная особь в другой выборке. В таких случаях выборки всегда равночис- 128
ленны и все исследуемые особи могут быть соединены в пары, число которых (и) и есть численность каждой коррелированной выборки. Так бывает при проведении опытов по методу аналогов или периодов? а так- же при сравнении дочерей (или вообще потомков) с их матерями или отцами. В таких случаях может быть применена формула ошибки разности в общем виде: md = V ml -\-rnl — 2rm1m2 где mlt т2 — ошибки сравниваемых средних; г — коэффициент корреляции между значениями одного при- знака в двух сравниваемых группах. Можно значительно упростить вычисления и определить точное значение разности средних и ее ошибки при коррелированных выбор- , ках, не вычисляя коэффициента корреляции. Достаточно рассчитать не разность средних (d—Mi—М2), а сред- вюю разность . Md = --- , для чего предварительно необходимо опре- V п ) ' делить ,разности между значениями признаков для. каждой пары. Какую выборку считать для всех имеющихся пар первой — безразлично.. При .этом, если в,выборке, которая для всех пар считается второй, значение признака у представителя пары больше, чем у его аналога, разность' . получается отрицательная. _ . ' Для группы полученных разностей d^2 нужно рассчитать основные показатели: среднюю арифметическую Md = '.1-2 , среднее квадратическое отклонение о^= t-2 — МдУ2, п — 1 ошибку репрезентативности средней арифметической т = . , Критерием достоверности в таких случаях будет отношение сред- ней разности к ее ошибке: td=—>tst’ {v = «— 1}, m где Md, т — средняя разность и ошибка средней разности, определен- ные по ряду разностей; t$t — стандартное значение критерия Стьюдента (табл. X), определяемое по числу степеней свободы/ равному числу разностей или числу сравниваемых пар без одной. ..- Пример 50. При изучении действия удобрений на урожай кар-, тофеля каждый посевной клубень разрезался определенным* образом ' ни две части. Одну' из, них сажали в грядку с обычным удобрением, другую — в соседнюю грядку с .новым видом удобрения. Было выра- / щено таким способом 100 пар кустов. После взвешивания клубней с каждого куста получено 100 разностей. Сводные показатели по ряду этих разностей оказались следующими: п =100, М& — +2 кг, <т=7 кг, т -^=0,7. . /100 9 Н. А. Плохинский 129
/ =2'к = _2_ = 2,9, = d т 0,7 = st Критерий достоверности разности в данном случае 3,4 2,6 2,0 v = 99. Исследование дало достоверный результат: со второй степенью’ вероятности (02>О,99). Можно считать, что новое удобрение в анало- гичных агротехнических условиях является боЛее эффективным, чем. удобрение, применявшееся ранее. Пример 51. При оценке быка Богатыря-60 по жирномолочности 59-ти его дочерей из каждого показателя дочери вычитался показатель, ее матери. Эти 59 разностей можно разнести в вариационный ряд и про- извести необходимые расчеты (табл.41). Таблица 41 Распределение разностей (дочьг—мать) по проценту жира в молоке U7 . а • со ч IF ' 1 /1=59 ' ' 4-2,85-4-4-3, 14 +3,0 1 Alri=4-1,58±0,057 +2,55-4+2,84 +2,7 1 1,58 +2,254+2,54 +2,4 1 d 0,057 =4= + 1,954-42,24 +2,1 8 3,5 + 1,654-+!,94 +1,8 11 + 1,3544-1,64 + 1,5 19 tst— 2,7 + 1,054-+!,34 +1,2 14 2,0 +0,75-4+1,04 +0,9 3 +0,45-4+0,74 +0,6 1 Оказалось, что средняя разность по проценту жира в молоке между дочерьми быка Богатыря-60 и матерями имеет положительное и для данного признака очень большое значение: +1,58% и превышает свою-' ошибку репрезентативности в 31 раз. Богатырь-60 является сильным и: достоверным улучщателем жирномолочности. ОЦЕНКА ВЫБОРОЧНОЙ РАЗНОСТИ ПО КРИТЕРИЮ ФИШЕРА Используя принципы дисперсионного, анализа, можно уточнить и упростить способы оценки разности двух выборочных средних, приме- нив особую форму критерия Фишера. . Р (Mj —М2)2‘. пхп2 Р (у=,1 . ] =-----------•----:--- > ^st l I , «1 + «2 |v2 = ^ + «2 — 21 где Fd — критерий достоверности разности по Фишеру; —М2 — разность средних; «г, —объемы первой и второй выборок, Иг — варианса случайного разнообразия в однофакторном; дисперсионном комплексе, составленном из двух изучае- мых выборок, с двумя частными средними Мд и М2. 130
. Определяется по формулам, удобным для данного слу- чая: 2 (Ух — Л+t)2 -+ S (Уз ~ Л42)2 + Л2 — 2 с~ SV2—-^21 п ' + С2 . Л-1 + «3 — 2 - ' Fst — стандартные значения критерия Фишера, находимые (табл. IX) по двум степеням свободы, из которых пер- вая равна всегда единице, а вторая—-сумме объемов выборок без двух. Применение этого способа показано на следующих примерах. Пример 52. Имеются две выборки; в первой 8 объектов с дата- ми 3 2 2 3 4 2 3 5, во второй 6 объектов с датами 3'3 4 6 5 3. Определение достоверности разности средних по этим выборкам показано в табл.42. Таблица 42 Определение достоверности разности средних для малых выборок и малозначных дат по критерию Фишера • I II V 3 2.23423 5 33.46 5 3 п 8 6 sy . 24 24 м 3,0 4,0 -Sya- 80 104 1 (2У)2' С = 2У2 — Л—— 8 8 n 9 С14~С2 8 +_ 8 О, =---------- =---------= 1,33 «! + л2 — 2 8 + 6 — 2 (Л^-Мз)2 . п^з _ (3 - 4)2 8-6 с of Щ + «2 1,33 8 + 6 Vi=l, v2=8 + 6 —2=12; Д„= {4,8—9,3—12,3}. П р и м е р 53. В двух выборках даты разнесены по неодинаковым классам. Оценка разности средних этих выборок по критерию Фишера показана в табл.43. П р и м е р 54,- По двум выборкам имеются только сводные пока- затели: п1 = 125, ЛК = 35, Oi = 4,0, П2 = 98, М%=32, о2 = 3,0. Критерий достоверности разности по Фишеру в таких случаях рас- считывается по формулам: G = (Пх — 1) of = 124 • 16 = 1984 С2 = (л2 — 1) of = 97 • 9 = 873 £г = 1984 + 873 =2857; d = Mx — Л42 = 35 — 32=3; .of = Cz F=^^~ 12,93 2857 __ 12 93- : ni + п2 — 2 123 + 98 — 2 125 ' 9- = 38,2; 125 + 98 ----- vi=.l; V2 = ni + H2—2=125 + 98—2 = 22.1, Fsi= {3,9—6,8—11,2}. 9* 131
Таблица 43 - M1 = A1-hfela1='2 + 2.2,77 = 7,54 Л42=Д2-4й2а2 = 0 4-3-2,65 = 7,95 С1 = А?с1 = 22-47,73= 190,9 .1 . I Cz= 190,9 4-716,9=907,8; С2 = ^с2 = 32-79,65 = 716,9 J «14-«а = 2 44 -4 51 — 2 Применение такого способа показано в алгоритме 11. Если имеются только п, М±т, то дисперсии вычисляются по фор- муле С=п(п—1) tri2. ' ДОСТОВЕРНОСТЬ РАЗНОСТИ СРЕДНИХ ПРИ МАЛОЧИСЛЕННЫХ ВЫБОРКАХ Существует старинное мнение, что при малочисленных выборках ^никогда не может получиться достоверных результатов. На следующем примере будет показана неправильность такого слишком категориче- ского утверждения. 1 ’ 1 * Пример 55. Проверялось действие новой системы воспитания и откорма бройлеров (3—4-месячных цыплят мясных по.роД). При планировании эксперимента было намечено исследовать так- же и калорийность мяса бройлеров из двух генеральных совокупностей: (бройлеров, подготовленных по новой системе, и бройлеров при старой системе воспитания и откорма. Ввиду технических трудностей определения калорийности мяса до- (ступн-ыми способами оказалось возможным исследовать в лаборатории Л32
всего пять тушек, поэтому решено было взять в выборки 3 тушки .из первой генеральной совокупности и 2 тушки — из второй. ' На птицефабрике одновременна. были организованы две большие группы цыплят, одну готовили по новой системе, другую — по старой. По достижении обеими группами 3—4-месячного возраста из опытной группы (О) были взяты три птицы, из контрольной (К) —две; каждая из пяти птиц выбиралась при строгой проверке достижения одних и тех же товарных кондиций. После убоя и стандартной разделки тушки были -зашифрованы порядковыми номерами (1, .2, 3, 4, 5) и переданы в лабораторию. Из лаборатории были получены следующие данные: Шифр 1 2 3 4 5 Анализ 1690 1930 2009 1610 1911 ккал!кг Расшифровка К 0 0 К 0 Анализ полученных данных мог проходить по-разному в разные периоды развития методики биологических экспериментов. В начальном периоде, когда считалось достаточным просто перепи- сать по порядку все цифровые данное без всякой обработки, вывод из проведенного эксперимента мог заключаться в указаний на то, что все подопытные тушки были более калорийны (1930, 2009, 1911), чем кон- трольные (1690, 1610). 1 Вопрос о достоверности в тот период еще не поднимался. В период использования элементарных приемов биометрии анализ проведенного эксперимента мог заключаться в следующем: 1. Вычисление средних: „ „ 1930 + 2009+ 1911' 1Окп . Опыт Ма =-----—------!---= 1950 ° 3 tz ' » 1690+ 1610 Контроль Mk =-----;— = 1650. 2. Вычисление полученной абсолютной разности: d = 1950 — 1650 = + 300 ккал/кг. 3. Вычисление процентной разности: •100 = + 18’2%- ’ 1650 Выводы: , 1. Применение новой системы подготовки бройлеров в проведенном - эксперименте повысило калорийность мяса на 18%. 2. Распространить вывод на всю массу бройлеров опасно ввиду крайней малочисленности материала. Такой анализ подобных малочисленных материалов был обычен в период, когда считалось, что вариационную статйстику ]можно приме- нять только для многочисленных групп, и что биолога надо приучать к большим выборкам, а на очень малых группах ничего определенного получиться не может.' При современном развитии биометрии анализ материалов экспери- мента возможно провести путем определения достоверности полученной разности способом, показанным в табл. 44. • - ' 133
Таблица 44 Определение достоверности разности при очень малых выборках Опыт Контроль V D=C—M D.2 V D=V—M Первичные данные 1930 2009 1911 -20 +59 —39 400 3481 1521 1690 1610 +40 —40 1600' 1600 п 2V М C = SDa 2 с tnr = — = п п (п— 1) 3 5850 5850 = 1950 3 5402 5402 — = 900 3-2 2 3300 3300 = 1650 . 2 3200 3200 2.1 -160° d ' md = «р + mk md td = d/md 1950— 1650= + 300 900 + 1600 = 2500 /2500 = 50 vd = 3 + 2 —2 = 3 300/50 = 6/ ^ = 3,2-5,8 — 12,9 Разность получилась вполне достоверная по второму порогу, веро- ятности безошибочных прогнозов: (/>0,99. Можно проверить такую оценку разности по критерию Фишера: __(A4j — А4 (+ + ^2 — 2) __ 3002 (3 + 2 —- 2) 3*2 у # С!4-С2 ' щ + п2 _ 5402 + 3200 ’ 3 + 2 ~ vi = l; v2=3+2—2=3; Fst= {10,1—34,1—167,5}. И по этому критерию оказалось, что различие в калорийности мяса до- стоверно с той же высокой надежностью: р>0,99. На основе анализа Достоверности разности, проведенного двумя способами, давшими одинаковый результат, можно сделать такие вы- воды. f. Новая система воспитания и откорма при массовом применении повысит калорийность мяса бройлеров. 2. Этот вывод имеет высокую надежность: (3>0,99. 3. Новую систему можно рекомендовать для массового внедрения при подготовке бройлеров той же породы при сходных общих условиях содержания и реализации птицы. При всей определенности проведенного анализа, несомненно, остается некоторое -недоумение: как при столь ничтожных количествах подопытных животных (3 и 2) могла все же получиться достоверная разность, да еще и по второму порогу вероятности. Это недоумение можно прояснить разбором общего вопроса о фак- торах, определяющих достоверность разности на примере только что рассмотренного эксперимента. 134,
ФАКТОРЫ, ОПРЕДЕЛЯЮЩИЕ ДОСТОВЕРНОСТЬ РАЗНОСТИ Достоверность разности обусловливается не одним, а тремя следую- щими факторами: объемом выборки; разнообразием признака; величи- ной разности. . • • ' 1. Объем выборки, т. е. число изученных объектов, часто опреде- ляет достоверность разности как главный фактор. Это легко понять. Чем больше изучено объектов в «выборке, тем более выборочное иссле- дование приближается к сплошному, тем меньше становятся ошибки репрезентативности, тем сильнее повышается достоверность разности. В исследовании калорийности мяса бройлеров первый фактор (объем выборок) действует явно в неблагоприятную сторону, сильно уменьшая возможность получить достоверную разность. Но было бы ошибкой считать, что объем выборки — это единствен- ный фактор, который может повысить или понизить достоверность вы- борочной разности. 2. Разнообразие признака — не менее важный фактор как увели- чения, так и уменьшения достоверности разности. При нулевом разно- образии признака (все особи одинаковы по изучаемому признаку)' .любое выборочное сравнение даст достоверную разность. Чем больше разнообразие признака, тем больше вероятность получить выборочные показатели, сильно отличающиеся от генеральйых параметров, тем ме- нее достоверной становится разность при том же объеме выборки и той же величине самой разности. При исследовании калорийности мяса бройлеров в выборках ока- залось очень незначительное разнообразие признака. Размах признака в опытной группе ро=2ОО9—1911 =98 и в контрольной pft= 1690—1610 = = 80, что составляет около 5% от средних величин признака. Сигмы признака также оказались небольшими: , Г 5402* со , , Г 3200 z °0 = ]/ ”2~=52’ **=]/—=57’ что дает совсем незначительную величину коэффициентов вариации, редко встречающуюся в биологических исследованиях: Коэффициенты вариации свидетельствуют о столь малом разнооб- разии признака, что возникает необходимость’ найти биологическое> объяснение этого необычного постоянства- калорийности мяса,- которое вообще у.птиц имеет даже повышенное разнообразие. Объяснение выявленного постоянства калорийности мяса можно найти в деталях организации эксперимента. Птицы для исследования отбирались по достижении определенного возраста и при определенных,, строго проверявшихся товарных кондициях. Иначе не могло и быть, так как весь эксперимент был направлен на выяснение техники получе- ния лучших бройлеров именно к моменту их реализации на мясо.. Экс- перимент имел производственные задачи, поэтому калорийность мяса во все другие моменты развития цыплят не представляла интереса. Таким образом, сама организация эксперимента предопределила поступление в выборки стандартного, выравненного материала — бройлеров, достигших строго определенных кондиций, что и привело к 135
тому необычно малому разнообразию признака, которое было выявлено биометрическими методами. . Специальный отбор стандартных бройлеров в данном случае ни- сколько не противоречит общему правилу рендомизированного выбора особей в выборку по следующим соображениям. Во-первых, отбор проводился не по йзучаемому признаку; его на живых бройлерах даже и измерить невозможно, отбор же по другим признакам всегда необходим (по полу, возрасту, условиям жизни и т. д.), всегда производится и не противоречит принципу рендомиза- ции. Во-вторых, способ отбора бройлеров, достигших производственных кондиций, определялся задачами эксперимента; только для таких брой- леров и требовалось выяснить различие в калорийности мяса. Итак, второй фактор •— разнообразие признака (очень малое) действовал в описываемом эксперименте очень сильно и в благоприят- ную сторону — он повышал достоверность разности. 3. Величина разности также может быть сильным фактором: чем больше выборочная разность, тем она достоверней при том же объеме выборки и том же разнообразии. При исследовании калорийности мяса бройлеров получена очень' большая разность. При размахах признака внутри каждой выборки крайне Незначительных (,р0=98; pft=80)-разность равна 300, что более, чем в три раза превышает внутригрупповой, размах. При такой боль- шой разности~оказалось, что две изученные выборки не имеют транс- грессии признака: 1610- 1690 1010 — 1930 — 2009 контроль . ' опыт максимальная калорийность в контроле явно меньше минимальной ка- лорийности в опыте. Несомненно, что в приведенное эксперименте третий фактор (вели- чина разности) действовал в благоприятную сторону, значительно по- вышая достоверность разности. ’ - Таким образом., из трех ф.акторов, влияющих на достоверность раз- ности, при исследовании калорийности мя'са бройлеров первый фактор понижал, а два других повышали достоверность разности: 1. Обт1ем выборок — мал . . . . . . . . (—) 2. Разнообразие признака — малое ....( + ) 3. Величина разности — большая .-.,...( + ) , Очевидно, что при таком соотношении действия* факторов вполне объяснима высокая достоверность выборочной разности, полученной в эксперименте по изучению калорийности мяса бройлеров при разных системах.их воспитания и откорма. ' Не следует думать, что при очень малых выборках могут часто по- лучаться достоверные результаты. Приведенный . пример иллюстрирует только то, что и при изучении очень малочисленных групп все же может быть получена дострВерная разность и что неправильно считать всегда безнадежной работу с любой малой группой. ОШИБКА РЕПРЕЗЕНТАТИВНОСТИ ВЫБОРОЧНОЙ СРЕДНЕЙ ПРИ МНОЖЕСТВЕННОЙ ХАРАКТЕРИСТИКЕ ОБЪЕКТОВ Обычно каждый объект в. выборке измеряется один раз и поэтому получает выраженную одним числом, или единичную, характеристику, напрцмер: длина первого объекта — 22, второго — 35 и т. д. 136 * •
В таких случаях ошибка репрезентативности средней 'арифметиче- ской по группе рассчитывается обычным способом по формуле В данном случае величина ошибки средней зависит от степени раз- нообразия объектов исследования: чем более различны эти объекты по изучаемому признаку, тем с большей ошибкой приходится оценивать, генеральный параметр при том же объеме выборки. МНОЖЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ ОСНОВНЫХ ОБЪЕКТОВ ИССЛЕДОВАНИЯ В некоторых исследованиях по каждому основному объекту произ- водится ‘несколько (nJ первичных измерений и, следовательно, полу- чается несколько первичных дат (VJ по одному признаку. Характеристика каждого объекта обычно делается в виде средней из всех его первичных дат; эту характеристику можно назвать вторич- ной датой: . ni При определении ошибки репрезентативности средней арифметиче- ской для группы основных объектов при множественной их характери- стике число и разнообразие первичных дат учитывается или не учиты- вается в зависимости от причин, вызвавших необходимость множест- венной характеристики основных объектов. ОШИБКА СРЕДНЕЙ БЕЗ УЧЕТА ПЕРВИЧНЫХ ДАТ , В некоторых исследованиях при измерении величины признака до- ступными средствами может быть допущена погрешность измерения, превышающая допустимые пределы. Для уменьшения этой погрешности; производится несколько параллельных (повторных) измерений одного и того же признака и берется "средняя из этих первичных дат, которая уже более точно, с большим приближением к истинному 'значению, ха- рактеризует величину признака в данный момент, у.данного объекта. Такая цель получения множественной характеристики основных объектов исследования имеется в виду, когда производятся параллель- ные химические'анализы, повторные определения медико-биологических, показателей, повторные промеры животных, деревьев для определения йх веса, повторные попытки достижения рекорда .при оценке способно- стей спортсменов и в других исследованиях. .В исследованиях подобного рода разнообразие первичных дат (измерений) зависит только от точности метода измерения признака и совершенно не связано с разнообразием значений изучаемого признака у разных объектов изучаемой выборки. Поэтому в таких работах пер- вичные даты имеют значение только для расчета вторичных дат, кото- рые используются в дальнейшем обычным способом, так же как и при единичной характеристике основных объектов. В исследованиях описы- ваемого типа ни число первичных дат, ни их разнообразие не оказы- вают никакого влияния на величину ошибки средней. 137
ОШИБКА СРЕДНЕЙ С УЧЕТОМ ПЕРВИЧНЫХ ДАТ В некоторых исследованиях -изучается такой признак, который у каждого основного объекта в данный момент имеет несколько (много; неодинаковых величин, например, вес яблока на яблоне определенного •сорта. При этом ни одна из первичных дат (вес одного яблока) не мо- жет одна служить характеристикой всего основного объекта (данной яблони по весу ее яблок). В таких случаях для характеристики каждого основного объекта (например, яблони) берется несколько (много) объектов измерения (например, яблок), по которым и получаются первичные даты. Средняя из этих дат служит характеристикой основного объекта (вторичная дата). Подобные исследования встречаются в самых^ различных разде- лах биологии, что показано в табл. 45. Таблица 45 Исследование с множественной характеристикой объектов Что изучается Основные объекты (вторичные даты V^SV./n.) Измеряемые объекты (первичные даты Диаметр эритроцитов у об- лученных крыс Размер листьев табака-му- танта Размер семечек нового сор- та подсолнуха Диаметр икринок у гибри- да осетра и стерляди Толщина мышечных волокон у скота мясной породы Вес яйца у кур московской . породы. Бактериальная осемененность почвы крысы растения корзинки самки животные несушки образцы почвы эритроциты у каждой- крысы листья с каждого расте- ния семечки с каждой кор- зинки икринки от каждой самки мышечные волокна от каждого животного яйца от каждой несушки пробы из разных мест каждого образца В исследованиях с множественной характеристикой основных- -объектрв первичные даты всегда отражают и средний уровень и сте- пень разнообразия изучаемого признака. Поэтому первичные даты в таких исследованиях должны использоваться не только для получения вторичных дат (по каждому основному объекту), но и для уточнения ошибки средней по изученной группе объектов; При множественной характеристике основных объектбв на величи- ну ошибки средней влияют два вида разнообразия. 1. Разнообразие первичных дат или степень неодинаковости изме- рений, проведенных у каждого основного объекта. 2. Разнообразие вторичных дат или степень неодинаковости основ- ных объектов по вторичным датам, характеризующая индивидуаль- ность особей по изучаемому признаку. Система первичных и вторичных дат и расчет ошибки средней для пяти изученных особей с несколькими .первичными датами у каждой представлена в табл.46. Первичные' и вторичные даты в описываемых исследованиях обра- зуют комплекс из п групп с щ датами в каждой группе. В таком ком- плексе имеются два вида случайного разнообразия. 1. Внутригрупповое разнообразие первичных измерений признака среди rti объектов измерения, взятых для каждого из п основных объек- тов. Это разнообразие аналогично внутригрупповому, случайному раз- 438
Таблица 46 Расчет ошибки средней при множественной характеристике каждого объекта с учетом первичных дат (схема) Основные объекты 1 2 3 i 5 л=5 Первичные даты Vi 2 0 4 3 3 2 5 4 3 6 4 7 6 6 5 'Число первичных дат п; 2 4 3 2 4 N — Зщ — 15 • 'Сумма первичных дат SVj 2 12 12 10 24 SVi = 60 ' SVe Вторичные даты Mi —V — n-l ‘ 1 3 4 5 6 60 •Ж- 15 —4 4 1 Центральные отклонения | первичных дат от частных средних Dz=(Vi-V) + 1 —1< +1 ' 0 0 —1 +1 0 —1 4-1 —1 41 0 0 —1 SDf= 10 = (CZ) вторичных дат от общей средней Dx — V — M —3 —1 0 + 1 +2 2п;£>2 = 40=(Сх) 9 I 0 1 4 n.iDx 18 4 0 2 16 первичных дат от общей средней Dy==Vi — M —2 —4 0 —1 —1 —2 41 0 —1 +2 0 +3 42 42 +1- = 50=(Сэ) iMi SmV 60 • •' Общая средняя М = —:— = = = 4 Srii N 15 Дисперсия первичных дат C2 = S(Vi — V)2==SD|=10 Дисперсия вторичных дат Сх — Zni (V — Л1)2 — = 40 Общая дисперсия Cj, = С2Сх = 10 40 — 50 Общая дисперсия Су — 2 (Vi— Л4)2 ==21)2=50 Су 50 Ошибка средней по группе: т2 — , —0,238; N (N.— 1) 15*14 щ = 0,49. 139
нообразию в обычном однофакторном дисперсионном комплексе. Сте- пень этого разнообразия можно измерить, как обычно, суммой квадра- тов центральных отклонений первичных дат от их средних по каждому основному объекту: Сг = 2(1Л-УЛ В табл. 44 дисперсия первичных дат (по всем основным объектам} равна Cz=ilO. 2. Межгрупповое разнообразие (тоже случайное!) вторичных, дат или средних значений признака по каждому основному объекту анало- гично межгрупповому разнообразию в обычных однофакторных диспер- сионных комплексах. В описываемых исследованиях это разнообразие тоже случайное, так как объекты, в одну группу подбираются рендоми- зиро'ванно. Степень этого разнообразия можно измерить суммой взве- шенных квадратов центральных отклонений вторичных дат (средних по каждому основному объекту) от общей средней: Сх = 2пг (V — Л4)2. В табл. 44 дисперсия вторичных дат равна Сж = 40. Исходя из основного закона дисперсионных комплексов, общая- дисперсия равна сумме внутригрупповой и межгрупповой дисперсий: Су = Сг + Сх. В табл. 46 общая дисперсия по группе равна Су= 10+40 = 50. В данном случае, так же как’ и в обычном дисперсионном анализе, общую дисперсию можно получить как сумму квадратов центральных, отклонений первичных дат от общегрупповой средней: сг/.-2(|/г ж ; В табл. 44 общая дисперсия, рассчитанная таким способом, оказа- лась равной Су—50, т. е. точно такой же, как и при суммировании двух частных дисперсий. ' Простые соотношения трех основных дисперсий в любых дисперси- онных комплексах , ь Су = сг 4- Сх дают возможность наметить общее правило расчета ошибки средней при множественной характеристике признаков. Для учета двух видов разнообразия — первичных, дат и вторичных дат при .расчете ошибки средней — следует взять сумму двух соответ- “ ствующих дисперсий, которая всегда равна общей дисперсии первичных, дат около общей средней. Эту общую дисперсию Су, включающую в себя обе требуемые Частные дисперсии (первичных и вторичных дат), можно рассчитать непосредственно по первичным датам как сумму квадратов отклонений первичных дат от общей средней: Cy = C2.+ Cx=S(iZt.-M)2; Л4=-^К Из этого следует, что при любом соотношении основных и изме- ряемых объектов ошибку средней всегда можно рассчитывать по пер- вичным датам. Порядок таких расчетов показан в табл. 47. Принцип расчета (по первичным датам) можно использовать при. определении всех биометрических показателей: доверительных границ генерального параметра, критерия достоверности разности, показате- лей силы влияния при дисперсионном анализе. 140
Таблица 47 Расчет ошибки средней при множественной характеристике каждого объекта . с учетом первичных дат (рабочая схема) Основные объекты 1 2 3 4 5 л=5 Первичные даты Vt 2 4 5 6 7 М=2яг=15 0 3 4 4 6 SV(-=60 3 3 6 2V?=290 2 5 2V£ 60 Общая средняя Л4= — = — =4 N 15 60р' = 290------— =50 15 -Общая дисперсия Cy=mVt—Л4)2=2У? (W п с 50 «Ошибка средней по группе т2=———— = =0,238; т=0,49 С 50 Варна нса о2 =----=——=3,57 , J /V— I 14 . - «Среднее квадратическое отклонение 0=1,89. О ЧИСЛЕ ОСНОВНЫХ И ИЗМЕРЯЕМЫХ ОБЪЕКТОВ При организации исследований с множественной характеристикой каждого объекта всегда возникает вопрос, сколько надо взять основных ^объектов (например, крыс) и сколько измеряемых объектов для каж- дого основного (например, эритроцитов у каждой крысы). Этот вопрос решается «в самом начале планирования эксперимента независимо от способов расчета ошибок репрезентативности. Ошибки,- которые могут быть допущены при планировании числа основных и из- меряемых объектов, относятся к той категории ошибок, которые обычно «сводятся к минимуму правильными способами формирования выборок, .но не могут быть учтены или исправлены при математическом анализе полученных материалов. Предположим, что в одном исследовании, выясняющем величину -среднего диаметра эритроцитов у крыс, взята одна крыса и у нее изме- рено 100 эритроцитов; в другом опыте для той же цели взято 100 крыс и у каждой измерено по одному эритроциту; в третьем взято 10 крыс и у каждой исследовано 10 эритроцитов. Материалы первых двух исследований должны быть забракованы •еще до их обработки, так как здесь допущены явные ошибки типично- сти: в первом грубо односторонне представлены особи, во втором столь же порочно представлены эритроциты у каждой крысы. Только в единственном случае материалы этих двух исследований •могут быть использованы — если есть доказательство того, что или все особи этого вида не отличаются друг от друга по величине и распреде- лению эритроцитов в крови, или все эритроциты у каждой особи совер- шенно одинаковы. Предположим, что такие доказательства имеются (в достаточном приближении) и, несмотря на все же остающиеся ошиб- ки типичности, требуется включить в биометрический анализ матери а7 лы всех трех исследований. Как рассчитать ошибку средней для этих столь различных.случаев? 141
Во всех трех исследованиях любой показатель, например средний диаметр эритроцитов или его ошибка репрезентативности, должны рас- считываться одним и тем же способом — по первичйым датам. Ошибки типичности, допущенные в первом и втором исследованиях, как и вооб- ще все ошибки типичности, не могут быть учтены при обработке мате- риалов вообще и в частности при анализе репрезентативности получен- ных выборочных показателей. Но эти ошибки типичности могут быть значительно уменьшены правильной организацией выборочного иссле- дования. Еще не разработаны достаточно точные способы определения необ- ходимой численности основных и измеряемых объектов при их множе- ственной характериртике. • В качестве первого приближения можно наметить следующие пра- вила. 1. Достаточная численность выборки планируется по измеряемым: объектам обычными способами. Например, если для изучения диамет- ра эритроцитов у крыс достаточная численность выборки намечена «=1024, то это значит, .что у врех крыс, которые попадут в выборку,, надо исследовать 1024 эритроцита. 2. Число основных объектов первоначально намечается, равное- корню квадратному из числа измеряемых объектов: n=]/rSn£. Это зна- чит, что надо так организовать выборку, чтобы основных объектов бы- ло столько, сколько у каждого_из них берется измерений. Для приве- денного примера надо взять 1024 — 32 крысы и у каждой по 32 эри- троцита; всего же надо измерить 32-32 =4024 эритроцита. 3. Если по техническим причинам второе правило невыполнимо,, надо взять такие количества основных и измеряемых объектов, кото- рые наиболее близки к количествам, определяемым вторым правилом,. и при которых сохраняется общее чцсло первичных дат. 4. Второе правило может стать невыполнимым или из-за недо- статка требуемого числа основных объектов или из-за невозможности получить у каждого основного объекта требуемого количества измеряе- мых объектов. Например, может не оказаться 32 крыс, данной линии; .их всего можно привлечь к опыту 20. Тогда надо взять эти 20 крыс и у 1024 ' । каждой измерить по------= 51 эритроциту. 1 Другой пример. Изучается вес клубней у нового сорта картофеля,, причем запланировано взвесить 10 000 картофелин. По второму правилу надо взять ]Л 10 000= 100 кустов и с каждого по 100 клубней. Сто клубней с одного куста взять нельзя. Поэтому в данном слу- чае надо взять столько кустов (рендомизцрованно!), чтобы в них в об- щей сумме можно было набрать .10 000 клубней, пригодных для дальней- шего исследования. Число кустов и число клубней, взятых с каждого- куста (что должно быть зафиксировано!), определится после получения последнего десятитысячного клубня. Запись числа клубней, полученных с каждого куста (по числу весом отдельных клубней), необходима для оценки стандартности сорта в- отношении наполненности кустов клубнями. ДОСТОВЕРНОСТЬ ВЫБОРОЧНЫХ ПОКАЗАТЕЛЕЙ ПРИ ИЗУЧЕНИИ КАЧЕСТВЕННЫХ ПРИЗНАКОВ Определение доверительных границ генеральных параметров и достоверности разности долей по общим формулам: 142
td = --- P1 Pa — > tsf {vrf = + n2 — 2} • I / Pi1?! . M И nj —l + n2—1 s показано в первой части книги. Кроме этих классических способов разработаны новые приемы исследования достоверности выборочных показателей для качествен- ных признаков. МЕТОД ср (ФИ) При определении доверительных границ и достоверности разности малых (р<0,20) или больших (р>0,80) долей классическими спосо- бами могут получиться ошибочные результаты вследствие резкой асим- метрии распределений с малыми или большими долями. Эти ошибки значительно снижаются, если вместо каждой доли, взять угол ф, синус которого равен корню квадратному из этой доли: ср° = arcsin Vp. По этой формуле определяется угол ср° в градусах. Более удобно использовать угол срн в радианах: ф^ = 2 arcsin]/ р = 0,0349066 arcsin]/р Например, перевод доли р = 0,25 в угол фн можно сделать так: 1. ]/р = J/6^5 = 0,50; 2. sin<p°=0,5; ф° = 30° (табл. V); 3. фн=0,0349066-30= 1,0472. Значение углов ф в радианах, для любой доли (от 0,00001 до- 0,99999) можно определить без вычислений по табл. XIII. По этой же- таблице можно сделать и обратный перевод углов в доли. Угол ф в радианах обладает следующими свойствами. 1. Ошибка репрезентативности угла ф не зависит от величины этого угла и определяется в зависимости только от численности группы по следующему равенству: / где п •—объем выборки. Поэтому определять величину ,/Иф можно по любой таблице обрат- ных чисел. - 2. Для малых долей (меньше 0,20) и больших долей (больше 0,80) определение достоверности разности долей по соответствующим уг- лам ф дает более правильные результаты. 3. ДЛя долей в пределах 0,20<р<0,80 замена их углами ф дает практически такие .же результаты, какие получаются без этой замены, но техника вычислений при этом упрощается. 143
Определение доверительных границ генеральной доли при помощи преобразования ср производится по формулам: Ф=Ф±Д, д = -4 Пример 56. При проверке действия долго хранившегося герби- цида оказалось, что из 1000 обработанных растений погибло 899. Какое - действие этого препарата можно ожидать с вероятностью (32^0,99 при его массовом применении? п = 1000; t = 2,6; Д = = 0.0^2; /1000 р == 0,899; <р = 2,495 (табл. XIII); Ф = 2,495 + 0,082 = {2,413 ч-2,577}; Р = 0,873 4- 0,922 (табл. ХШ, обратный ход); Р % = 874-92%. Гарантированный минимум оказался Рт-т = 87%. Следовательно, норму обработки надо'’повысить на (——------1^100=15% (+), а не -1 \ 87 J на 11%, как можно было бы: ошибочно заключить исходя из выбороч- ной доли р = 0,899. Определение достоверности разности долей, преобразованных в. углы ср, проще (не теряя точности) вести по критерию Фишера, учиты- вая, что для углов срл в радианах случайная варианса с вполне цосга- точным приближением может быть принята равной единице: cd =1. - Вследствие этого значительно упрощается формула критерия: Fd = (<Pi —<Ра)2 П1П2 Щ Ф ^2 St Vi = 1 . V2 + ^2 —2 Пример 57. При исследовании побочного влияния стимулятора ожирения ,на качество спермы золотистых хомяков было найдено, что у самцов, получавших стимулятор, из 5000 исследованных спермиев на ранних стадиях сперматогенеза обнаружено 3 уродливых определенного типа, а из' 500 спермиев, взятых на поздних стадиях сперматогенеза, таких уродливых оказалось тоже 3. В контроле уродливых (такого типа) спермиев не было. ' • , Достоверен ли прогноз о большей восприимчивости к стимулятору, вообще всех спермиев данного вида на поздней стадии сперматогенеза? п, = 5000; р, = —= 0,0006; ф, = 0,0491 Д = 0,106; 1 п 5000 1 - з * щ = 500; р, = —= 0,006; ф2 = 0,155 d2 = 0,0112; 2 / 500 . 7% = 0,0112-°00'— = 5,1; vi~1 fs, = {3,8 —6,6—10,8}. 5500 — v2 = оа si 1 Прогноз оказался достоверным с вероятностью р>0,95. 144
В данном.случае классический метод о, 006 — о,0006_______ 0,006 0,994 0,0006 0,999? 499 + 4999 показал недостоверность разности долей, что следует считать ошибоч- ным выводом для данного исследования. Пример 58. При изучении хромосомных перестроек в клетках роговицы глаза крыс необходимо было выяснить, насколько сильно по этому признаку различаются отдельные животные. Для этой цели были взяты подряд две крысы и в роговице их глаз просмотрено по несколь- ку сотен клеток. У первой крысы было просмотрено 302 клетки и в них обнаружено 36 хромосомных перестроек; у второй крысы просмотрено 392 клетки и в них обнаружено 33 хромосомных перестройки. Определение достоверности различия дало следующие результаты: «! = 302; Р1 =-^- = 0,119; = 0,70441 <* = 0,1163; г .302 п, = 392; р, =-55-= 0,084; го, = 0,5881 d2 = 0,0135; г ’ 392 ’ ’ ’ F = 0,0135 302 ' 392 = 2,3; vi = * Fst = {3,9 — 6,7— 11,0}, 302 + 392 v2 = 692 sr i > ’ f (400) Разность оказалась недостоверной. Наблюдение -не подтвердило предположения о различии данных крыс по доле хромосомных пере- строек во всех клетках их роговиц. ОШИБКА РАЗНОСТИ МЕЖДУ ВЫБОРОЧНОЙ И ГЕНЕРАЛЬНОЙ ДОЛЯМИ В большинстве исследований требуется определить неизвестную характеристику генеральной совокупности с возможно большим при- ближением. ' Но имеется особая категория исследований, когда в основу работы кладутся генеральные показатели или известные или предполагаемые. В некоторых исследованиях требуется выяснить различия между изучаемой группой и какой-нибудь более обширной группой особей, относящейся к изучаемой, как генеральная совокупность к выборке. Такая необходимость может возникнуть, когда требуется отнести впер- вые исследуемую группу к тому или иному виду, породе, сорту и т. д. При этом генеральные показатели для более обширной группы уже известны и требуется установить, возможно ли считать изучаемую но- вую группу принадлежащей именно к данной генеральной совокупности. В таких исследованиях (первого типа) выборочные показатели проверяются по уже известным генеральным путем определения досто- верности разности между выборочной и генеральной долями. Имеются также и такие исследования, в которых, наоборот, гене- ральные величины проверяются по выборочным (исследования второго типа). Такая необходимость возникает, когда по генеральной совокуп- ности с неизвестными генеральными показателями строятся предполо- жения, выдвигаются гипотезы о возможной величине генеральных долей. В таких случаях правильность выдвинутой гипотезы проверяется на практике по одной или нескольким выборкам путем сопоставления 10 Н. А. Плохинский 145
- гипотетической генеральной доли с фактически полученными выбороч- . ными долями и определения достоверности разности между выборочной и генеральной долями. ' В исследованиях подобного рода определение и интерпретация ошибки разности и критерия достоверности разности имеют свои специ- фические особенности. Ошибка разности между выборочной и генеральной долями по общим правилам должна быть равна корню квадратному из суммы квадратов ошибок сравниваемых величин: . т^р-ру = Ут2 + т2. Под корнем стоят квадраты двух величин: ошибки выборочной и генеральной долей. Однако генеральная доля, как и всякая генераль- ная величина, не имеет ошибок репрезентативности и поэтому второе слагаемое под корнем равно нулю: тР = 0. Исходя из этого формула- ошибки разности между выборочной и генеральной приобретает совсем простой вид: fn(p-P) тр т. e. ошибка разности между выборочной и генеральной долями равна: ошибке выборочной доли. Ошибка выборочной доли в описываемых исследованиях имеет также свои особенности. В этих работах генеральные доли или извест- ны, или предполагаются. Поэтому есть возможность рассчитать точное значение ошибки выборочной доли, используя генеральные доли, а не выборочные: а тр ~ V n где тр—- ошибка'выборочной доли в тех случаях, когда-из- . вестны или предполагаются генеральные доли; o = ]/PQ—генеральная сигма качественного'признака; • „Р, Q — доли особей, имеющих и не имеющих признак в генеральной совокупности; „ п — численность изучаемой выборки. Достоверность разности в; описываемых исследованиях имеет так- же свои особенности.. - k ' В обычных работах, если разность достоверна и критерий достовер- ности разности превышает установленный порог, это означает, что меж- ду двумя соответствующими генеральными совокупностями имеется такая же разница (по направлению), какая найдена между выборками.. В таких работах достоверная разность служит показателем благоприят- ных, репрезентативных результатов опыта. А что означает достоверная или недостоверная разность между вы- борочной и генеральной долями? Если эта разница оказалась достоверной в работах первого типа, то это значит, что различие между изучаемой группой и той генераль- ной группой, принадлежность выборки к которой проверяется, столь велико, что- первоначальные предположения не оправдались. ' Если эта разность оказалась достоверной в работах второго типа, то это значит, что при предположенных генеральных показателях не 146
могло быть такого резкого отличия их от выборочных показателей. Гипотеза оказалась неверной, не подтвержденной практикой. Поэтому в таких работах достоверная разность является показа- телем не положительного, а отрицательного результата проведенного исследования. И, наоборот, недостоверная разность, которая обычно является не- благоприятным результатом исследования, в работах, где сравнивают- , ся выборочные и генеральные доли, указывает на положительные выводы. В работах первого типа недостоверная разность говорит о том, что различия между изучаемой группой й ее предполагаемой генеральной совокупностью оказались невелики, и предположение о прйнадлежности выборки именно к данной генеральной совокупности не опровергнуто. В работах второго типа недостоверная разность указывает на то, что различия между выборочными и гипотетическими показателями ока- зались столь незначительными, что не могут опровергнуть выдвинутую гипотезу. ' Планирование порога достоверности при сравнении эмпирических долей с теоретическими имеет особенности, такие же как и при опреде- t лении достоверности расхождения эмпирических и теоретических рас- пределений. Обычно, чем ответственней исследование, тем более высокий порог вероятности безошибочных прогнозов требуется для того, чтобы при- знать разность достоверной. При определении достоверности разности между эмпирической и теоретической долями требуется обратный порядок планирования поро- гов вероятности безошибочных прогнозов. В таких исследованиях чем ,выше ответственность .анализа, тем при меньшем пороге вероятности расхождение уже считается достоверным (гипотеза не подтверждается). И наоборот, чем менее ответственно исследование, тем при большем пороге достоверности разность между эмпирической и теоретической долями все еще может ’считаться недо- стоверной (гипотеза не опровергается). Этб очень важное различие в планировании порогов достоверности показано в табл. 48. Таблица 48 Пороги достоверности Пороги достоверности Вероятность безоши- бочных прогнозов Ответственность исследований в обычных биологи- ческих работах при генетическом анализе I Pi=0,95 обычная повышенная II р2=0,99 повышенная обычная III Рз=0,999 высокая пониженная Установление числа степеней свободы для разности между эмпири- ческой и теоретическими долями также имеет свои особенности. Обычно число степеней свободы для разности двух долей равно: ’V(j = ni+/l2l—2. Но если п2 .относится к генеральной совокупности, то оно прини- мается равным бесконечности, поэтому и v<z тоже должно быть беско- нечным: Vd = «1 + 00 — 00 • 10* . 147
Если принять это правило, то для любого объема выборки с щ- по- требуется принимать vd = oo, и проверка теоретической доли по эмпири- ческой будет проходить при одном и том же числе степеней свободы при очень малых и при очень больших выборках. Поэтому в таких случаях лучше устанавливать число степеней сво- боды исходя из объема только выборки: v(p-d = vp = "— !• Итак, определение достоверности разности между эмпирической щ теоретической долями следует проводить по следующей формуле: Рз = 0,999 при слабой ответственности t(p-p) = р-р |/V > 1st 02 = 1Р1 = 0,99 0,95 » » обычной » повышенной » = п — 1} Практическое использование ошибки разности между выборочной и генеральной долями можно показать на следующих примерах. П р и м е р 59. В изучаемой партии из 50 коконов шелкопряда 40 были темноокрашенными. Требуется проверить предположение о том, что эта партия принадлежит определенной расе, в которой доля темноокрашенных коконов довольно постоянна и равна половине. В данном случае известны генеральные доли Р = 0,5 и Q = 0,5 и по ним можно получить точное значение ошибки выборочной доли: г> n ir 40 по ,/ 0,5 X 0,5 л Р = 0,5; р=---= 0,8; т0 = \/ -—-2- = 0,071 н 50 р V 50 d=0,8— 0,5 = 0,30; md = тр ~ 0,071; t = °’.30 = 4,2; ist 0,071 ~ st '3,5 2,7 2,0. = 49. велика и поэтому Общий Достоверность разности оказалась очень вывод должен, быть отрицательным; предположение о принадлежности изученной партий к данной расе по этому признаку не подтвердилось. П р и м е р 60. При изучении физиологии размножения вида была высказана гипотеза о том, что к половозрелому состоянию на каждые 7 самок должно быть 9 самцов. Для проверки этой гипотезы было выловлено 100 половозрелых особей данного вида, из которых 60 ока- зались самцами, а 40 — самками. Подтверждена ли гипотеза? Расчеты показывают следующее: Р = —= 0,5625; Q = —= 0,4375; 16 16 р = -55- = 0,6; тр = 1/'0,5625 х 0,4375 = 0,04 96; юо р у юо - 348
d = 0,6 — 0,5625 = 0,0375; md = mp = 0,0496; 0,0375 0,0496 ’3,4 2,6 .2,0 vd = 99. Достоверность разности оказалась столь мала, что бесспорен поло- жительный вывод: пробный вылов не опроверг гипотезы. АНАЛИЗ РАСЩЕПЛЕНИЙ При генетическом анализе обычно требуется проверить, насколько эмпирическое, полученное в опыте, расщепление соответствует теорети- ческому, предполагаемому на основе принятой генетической гипотезы. Например, если при скрещивании 'представителей двух чистых ли- ний (черной и белой) в первом поколении получается 100% черных, то очевидно, что черная окраска доминирует. Требуется проверить генетическую гипотезу о том, что в данном случае черная окраска определяется одним геном в гомозиготном и ге- терозиготном состоянии. Если эта гипотеза верна, то при скрещивании гибридов первого поколения с белой, рецессивной родительской фор- мой должно получиться 50% черных (Ла) и 50% белых (аа) особей; отношение 1:1. Допустим, что при проведении такого анализирующего скрещива- ния получено 100 потомков, из которых 40 были черными и 60 белыми; отношение 0,4 : 0,6 или 1 : 1,5. Опровергает ли этот факт гипотезу о моногибридном типе наследо- вания черной окраски и о том, что в данном анализирующем скрещива- нии теоретическая доля черных особей равна Р=0,50, а теоретическое расщепление характеризуется отношением 1:1? Для решения подобных вопросов требуется определить достовер- ность разности между эмпирической и теоретической долями с учетом специфических особенностей этого показателя. Достоверность разности в разбираемом примере может быть опре- делена следующим образом: d= р— Р = 0,40 — 0,50 = ] 0,101; m = | / = 1 / °’5--0’5- = 0,05; а V п V 100 td = = 2,0 a 0,05 Р = 0,99 v = 100 — 1 = 99 ^ = 2,6, Для исследования, в котором теоретическая доля 0,5 по эмпирической 0,4, требуется установить второй порог безошибочных прогнозов: ^ = 2,6; Рг=0,99. Первый порог исследования оказался бы слишком строгим, уже при вероятности 0,95 пришлось бы считать достоверным подученное расхождение. Третий порог позволил бы считать расхождение долей недостоверным даже при очень высоких вероятностях расхождения — вплоть до 0,999. Число степеней свободы для данного случая равно проверялась вероятности для этого vd = 100 — 1 = 99. 149
Фактический критерий ^ = 2,0 оказался меньше требуемого = 2,6, поэтому расхождение между эмпирической и теоретической долями сле- дует признать недостоверным и выдвинутую генетическую гипотезу не опровергнутой. Описанный способ анализа генетических расщеплений по критерию достоверности разности между эмпирической и теоретической долями есть перенесение в генетику общего классического метода ^определения достоверности разности долей. Этот способ следует предпочесть применению для анализа рас- щеплений метода %2, так как последний дает хорошие результаты толь- ко при достаточном числе классов распределения. При 2—3—4 классах (например, в моногибридного или дигибридного скрещивания или при анализирующих скрещиваниях) метод %2 может дать недостаточно точные прогнозы. Пример 61. При скрещивании двух сортов примул, 'различав- шихся по двум признакам, в F2 получены четыре группы расщепления: а —плоские листья с нормальным глазком, б — плоские листья с бледно-розовым глазком, в —сморщенные листья с нормальным глаз- ком, г — сморщенные листья с бледно-розовым глазком. ' а б в г S Число растений 328 122 , 77 33 . 560 Эмпирические доли 0,586 0,21В 0,137 0,059 1,000 Теоретические доли 9/16 3/16 3/J6 1/16 1 0,5625 0,1875 0,1875 0,0625 1,000 Было высказано предположение о том, что в данном случае исход- ные сорта различались по двум генам в разных хромосомах и что по-, лученное расщепление есть обычное случайное отклонение от менделев- ского расщепления в F2 дигибридного скрещивания 9 : 3 : 3 : 1. . , ' Проверка этой гипотезы может быть проведена следующим об- разом. Общие установки: 1. Вероятность безошибочного прогноза 02^0,99 как для оценки расхождения эмпирических и теоретических долрй. 2. Число степеней свободы для каждой группы расщепления vd=560—1=559. • 3. Показатель надежности tst=2,6. 4. Ошибка эмпирической доли тр Первая группа: п 0,586— 0,563 _ 0,563 • 0,437 / 560 0,023 0,021 = 1,1 <2,6. , Вторая группа: G = 0,218 — 0,187 /0,187 0,813 560 0,031 0,017 = 1,8 <2,6. Третья группа: , (0,137 — 0,187) 0,187 0,813\- 560 ) 0,050 0,017 150
Четвертая группа: f = (0,059 — 0,063) f 0^-°—' °2-9—V1/2 = °-004 = 0,4 < 2,6. a \ 560 /. 0,01 Г ’ Оказалось, что из четырех групп расщепления в трех группах эмпи- рическая доля явно недостоверно отличалась от теоретической. В этих группах намеченная генетическая гипотеза не опровергнута. Достоверное отклонение от гипотезы было у одной третьей группы расщеплений — у растений со сморщенными листьями и с бледно- розовыми глазками. Причины этого могут быть различны: меньшая выживаемость таких растений, ошибки первичной регистрации, нечет- кое разделение групп расщепления, действие генов-модификаторов, проявляющееся только, при данной комбинации основных генов, нару- шения мейоза и т. д. t Выяснение этих причин есть задача уже биологической интерпре- тации результатов биометрического анализа расщецдения. Пример 62. При изучении двух отдаленных пород кроликов — черных и белых — было произведено скрещивание их между собой, в ре- зультате чего всегда получались только черные кролики. На этом осно- вании было предположено, что в данном х случае различие окраски волоса вызывается одним доминантным геном.-, который дает; черную масть в гомозиготном и гетерозиготном состоянии, а первоначальное скрещивание пород проходит в соответствии с формулой . ' АА Хаа=100% Аа. Для проверки этого предположения было проведено анализирую- щее скрещивание метисов первого поколения (по предположению Аа) с белыми кроликами (по предположению аа). Ожидалось расщепле- ние 1:1 АаХаа—5О°/о Аа+50% аа. Результат скрещивания оказался неожиданным: из 100 метисов 28 были черными и 72 белыми (как будто скрещивались метисы пер- вого поколения между собой и при этом ген черной окраски из доми- нантного превратился в рецессивный). 1 ' Попробовали объяснить это сильное расхождение выборочной доли (р = 0,28) от генеральной (Р = 0,50) случайными причинами и прове- рили вероятность такого события: 28 ' а по । / 0,5 X 0,5 а пг , р =----= 0,28 т„ = }/ --------= 0,05; * 100 р V 100 d= 0,28 — 0,50 = —0,22; tnd = mp= 0,05; /=2121^4,4; v = 100— 1 = 99; tst = {2,0 — 2,6 — 3,4}: d 0,05 = г ‘ Разница между фактически полученной пропорцией й такой, кото- рая следует из высказанной гипотезы, оказалась столь достоверной (по в.йсшему порогу вероятности: (3>О,999), что ни в'какой степени нельзя считать эту гипотезу подтвержденной. Не найдя объяснения обратному скрещиванию метисов с одной из родительских форм, скрестили метисов Fi между собой; предполага- лось получить расщепление 3:1 АаХАа=2р°!а ДД+50% Ли+-25% аа 75% черных+25% белых 151
Результат этого скрещивания оказался еще непонятнее: из 1000 ме- тисов второго поколения черных было 560 и белых 430. Получились, доли р=0,57, 7 = 0,43, в то время как ожидались Р = 0,75 и Q = 0,25. Опять проверили, нельзя ли считать отклонение выборочной доли /> = 0,57 от генеральной Р = 0,75 случайным. Проверка дала следующие5 результаты: , / 0,75 х 0,25 n т„ = I/. — -----:— = 0,0137; р V 1000 . ^ = 0,75- 0,57 = 0,18, md = mn = 0,0137; и у td = -°’— =13,1, v = 999, = {2,0 — 2,6 — 3,3}. а 0,0137 ‘ ' Получилось, что и гипотеза о случайном искажении отношения 3 : 1 совершенно невероятна, - Поскольку эмпирическое соотношение, получившееся при скрещи- вании FiXF{ 570:430, близко к отношению 1 : 1, то для возможности выдвинуть более верную гипотезу проверили и это предположение: ' т = 1 / о-52£.°’5 = о ,0158; р V юоо • d = 0,57 — 0,50 = 0,07, md = тр = 0,0158; td = —°’-— = 4,4, v = 0,999, С = {2,0 —2,6 —3,3}. 0,0158 = . ‘ ' Оказалось, что и эта гипотеза совершенно не соответствует фактам. Наконец, была выдвинута следующая гипотеза: черная масть иссле- дуемых кроликов обусловливается двумя доминантными генами в раз- ных хромосомах, причем только при наличии обоих генов в гомозигот- ном или гетерозиготном состоянии получается черная окраска волоса. При наличии же только одного из этих генов даже в гомозиготном со- стоянии или при отсутствии обоих генов окраска волоса остается белой. В соответствии с этой гипотезой исходные породы должны иметь наследственную формулу: черные— ААВВ, белые — аавв, а чер- ные метисы первого поколения— АаВв. При скрещивании метисов Fi между собой во втором поколении должно быть обычное дегибридное расщепление - 9 : 3 : 3 : 1, в котором на каждые 16 потомков будет 9' с обоими генами в гомозиготном или гетерозиготном состоянии (следо- вательно, черные), 3 с одним только первым геном (белые), 3 с. одним- только вторым геном (белые) и 1 без обоих доминантных генов (белый). На 9 черных будет 7 белых (3 + 3+1). Проверка по скрещиванию ЛхЛ дала следующие результаты: р=-^- = 0,57; Р= — = 0,5625; 1000 16 / 0,5625 х 0,4375 п -------------= 0,0157; 1000 d = 0,57 — 0,5625 = 0,0075; md = тр = 0,0157; 0, 0075 0,0157 = 0,5. 152
Выявилась совершенно недостоверная разность и в то же время определилась очень большая вероятность того, что, наконец, была най- дена правильная гипотеза. Очевидно, что предложенная гипотеза не должна быть опроверг- нута и при скрещивании черных метисов Fj с белой родительской поро- дой. При таком анализирующем обратном скрещивании соотношение групп можно определить следующей решеткой распределения гамет: = 0,25; тр = На одного черного должно получиться 3 белых кролика. Пррверка гипотезы на. уже описанном обратном скрещивании дала следующие результаты: п = 0,28; Р= — , 4 d = 0,28- 0,25 x 0,75 = 0 0 43 100 0,25 = 0,03; md = тр = 0,043; = JW = 0 0,043 -3- И в этом скрещивании различие фактов с гипотезой оказалось, столь маловероятным, что последняя гипотеза о наследовании черной окраски волоса у кроликов может быть признана правильной (по край- ней мере, отнюдь не опровергнутой). ОЦЕНКА ГЕНЕТИЧЕСКИХ ГИПОТЕЗ О РАСЩЕПЛЕНИИ БЕЗ ВЫЧИСЛЕНИЙ. Используя особенности . метода . <р, можно значительно упростить, технику эмпирической проверки гипотетических расщеплений, сведя ее только к пересчету числа потомков определенной группы расщепления. Достоверно или недостоверно различается эмпирическое расщепле- ние от теоретического, соответствующего генетической гипотезе, можно выяснить по специальной таблице допустимых чисел (табл. 49). В этой: таблице цриведены предельные количества доминантов (рецессивов) для разного общего количества потомков, для достаточной вероятности безошибочных прогнозов р2^0,99 и для обычных расщеплений моно- и дигибридного скрещивания. Пользоваться таблицей совсем просто, вычислять эмпирические доли, их ошибки и критерий достоверности разности не требуется. Надо толь- ко знать: 1) число всех потомков поколения; 2) теоретическую долю одной из групп расщепления; 3) эмпирическое количество потомков в данной группе расщепления. Если эмпирическое число потомков в данной группе расщепления не выходит за пределы двух чисел таблицы для данного общего числа потомков и для данной теоретической доли, значит генетическая гипо- теза не опровергнута. Если выходит за эти пределы — гипотеза не под- тверждена. 153-
Таблица 49 Допустимые пределы числа доминантов (рецессивов) в поколениях потомков при теоретической доле их Р. Если полученное число доминантов (рецессивов) не выходит за указанные пределы, генетическая’гипотеза о величине Р не опровергнута. (Для второго порога вероятности: g>0,99) Число изученных Моногибридное скрещивание Дигибридное скрещивание 4 АахАа Аахаа АаВвхАаВв АаВвхаавв 3 1 1 :1 9:7 3 13 1 15 1 3 потомков р= 3,75 р= 0,50 Р=0,5625 Р=0,1875 Р—0,0625 Р—0,25 10 3 10 1 9 1 10 0 7 0 5 0 7 15 6 15 2 13 3 13 0 8 0 5 0 . 9 20 9 19 4 17 5 17 0 10 0 6 7 11 25 12 23 6 19 7 20 1 И 0 6 2 13 30 15 28 8 22 9 24 1 12 0 7 2 15 35 19 32 10 25 12 27 ' 2 14 0 8 3 16 40 22 36 12 28 14 30 2 15 0 8 4 18 45 25 40 14 31 16 34 3 16 0 9 5 20 50 29 45 16 34 19 37 3 18 0 9 5 21 55 32 49 18 i7 21 • 40 4 19 0 10 ,6 •23 60 35 53 20 40 24 44 4 20 0 10 7 25 65 39 . . 57 22 43 26 47 5 22 0 . 11 8 26 70 42 ‘ 61 24 46 28 50 6 23 1 11 9 28 75 46 65 26 ' 49 31 53 7 24 1 12 10 29 80 49 69 28 52 33 56 7 25 1 12 11 31 85 53 73 31 54 36 59 8 26 1 13 12 32 90 56 77 33 57 38 63 8 28 1 13 13 34 95 59 81 35 60 41 66 9 29 1 13 14 36 100 63 85 37 63 43 69 10 30 2 14 15 37 .110 . .70 93 41 69 48 75 11 32 2 15 17 40 120 77 101 46 74 53 81 12 35 2 16 19 43 130 84 109 50 80 58 88 14 37 2 17 21 46 140 91 117 55 85 63 94 15 39 3 18 23 49 150 98 125 59 91 68 100 17 41 3 19 25 52 160 105 133 64 97 74 106 18 44 4 19 27 55 170 112 141 68 102 79 112 20 46 4 20 29 58 180 119 149 73 10? 84 118 21 48 4 21 31 61 190' 126 157 77 ИЗ 89 124 23 51 5 22 33 64 •200 133 165 82 118 94 130 24 53 5 23 . 35 67 .220 148 181 91 129 105 142 27 57 6 24 39 72 240 162 196 100 140 115 154 30 62 7 26 . 44 78 260 176 212 109 151 125 167 34 66 8 28 48 84 .280 190 228 118 162 136 179 37 71 9 29 52 89 300 205 244 128 173 141 191 40 75 9 31 56 95 ’ 320 219 259 137 183 157 203 43. 79 10 33 61. 101 340 234 275 146 194 168 215 46 83 11 34 65 106 - 360 248 290 156 204 178 227 49 - 88 , 12 36 70 112 380 263 306 165 • 215 . 188 239 53 92 ' 13 37 74 118. 400 277 322 174 226 199 250 56 96 14 39 79 123 500 350 399 221 279 253 310 72 117 19 47 102 151 600 422 476 268 332 306 369 89 138 23 54 124 178 700 495 554 316 384 360 428 106 159 29 62 146 206 800 568 631 364 437 413 486 122 179 34 69 170 .238 900 641 708 411 489 468 544 139 200 39 77 193 259 1000 714 785 459 541 522 603 157 220 44 84 216 286 1500 1082 1167 700 799 795 894 243 321 71 120 333 420 2000 1450. 1550 942 1058 1068 1182 330 420 98 156 450 550 <р 2,0944 1,5708 1,6961 0,8957 0,5054 1,0472 254
Пример 63. Получено 200- потомков в Г2 моногибрид'ного скре- щивания. Среди них доминантов оказалось 140. Опровергает ли этот факт генетическую гипотезу о теоретической доле доминантов Р = 0,75? В таблице допустимых чисел в столбце Р = 0,75 и в строке 200 стоят две цифры 133 и 165. За эти пределы не выходит экспериментальное -число доминантов 140, следовательно, указанная генетическая гипотеза не опровергнута. П р и м е р 64. В примере 62 описаны пять попыток выяснить гене- тическую основу черной окраски волоса у кроликов. В первой попытке из Д=100 потомков получено п — 28 доминантов. По первой генетической гипотезе доля их должна быть равна Р=0,5. В таблице предельных частот (табл. 49) в строке 100 и столбце Р — 0,5 стоят числа 37-4-63. Фактическая частота выходит за нижний предел: 28<37. Гипотеза не подтверждена. Во второй попытке N= 1000, м=570, Р=0,75, п(±.) =7144-785. Фак- тическая частота выходит за нижний предел: 570<714. Гипотеза не ' подтверждена. В третьей попытке ^=4000, п = 570, Р=0,5, п(;±,) =459-4-541. Фак- тическая частота выходит за верхний предел: 570>541. Гипотеза не подтверждена. В четвертой попытке М=1000, м=570, Р = 0,5625, л (±) =5224-603. Фактическая частота не выходит за допустимые пределы: 522<570<603. Гипотеза не опровернута. / В пятой попытке Л7= 100, га —28, Р = 0,25, н(±) = 154-37. Фактиче- ская частота не выходит за допустимые пределы: 15<28<37. Гипотеза не опровергнута. Получить недостающие цифры таблицы допустимых пределов (при интерполяции и экстраполяции) можно следующим образом. Если заданы теоретическая доля Р, объем изученной части, поколе- ния N и вероятность безошибочных прогнозов р = 0,99, то нахождение допустимых пределов числа доминантов (рецессивов) в группе потом- ков ведется по исходной формуле ' 7„max I 1 \ Ttnin — ф i Л_ /jV ' - / в следующем порядке. 1. Определяется угол <р в радианах (табл. XIII) для теоретической доли. 2. Определяется допустимое отклонение эмпирических значений угла ср от теоретического значения: Д = tm = ——. Vn 3. Минимально и максимально допустимые значения углов опреде- ляются по простым формулам ФпНп=Ф —А'- Фтах = ф + Д- 4. Углы ср обратным ходом по таблице (XIII) переводятся в доли, а доли путем умножения йх на объем группы пересчитываются в мини- мально и максимально допустимые количества доминантов (рецессивов). Пример 65. Требуется определить допустимые пределы-числа полных рецессивов в F2 дигибридного скрещивания для сотни получен- ных потомков. 155
Решение: Р = — = 0,0625; ф = 0,5054; А = -^26 = 0,2626; !6 /100 ffi = 0,5054 ± 0,2626; Фтах = 0J680; ртах = 0,140; пгаах = 14; Tmin== 0,2428; prain = 0,015; nmin = 2. Следовательно, если в этой сотне потомков окажется 2, 3... 13, 14 полных рецессивов, то это еще не будет опровергать гипотезу о дигиб- ридном скрещивании с теоретической долей рецессивов Р = 0,0625. Если же в этой сотне окажется 0, 4, 15, 16... и более полных рецес- сивов, то этот факт поставит под сомнение или данную конкретную- генетическую гипотезу, или правильность организации самого скрещи- вания и учета его результатов. Подобные расчеты можно сделать для любого объема группы по- томков и для любого расщепления, не только для малых, но и для. любых долей. В конце табл. 49 для каждого скрещивания, с его теоретической; долей доминантов (рецессивов), приведены значения угла в радианах. Эти значения углов помогут при интерполяции и экстраполяции верти- кальных рядов таблицы допустимых чисел. ПОКАЗАТЕЛИ КОРРЕЛЯЦИОННОЙ СВЯЗИ Главные особенности корреляционных связей и основные показа- тели (коэффициент корреляции, корреляционное отношение и показа- тель криволинейности) описаны в первой части' книги. Техника расчета основных показателей корреляции показана в алго- ритмах 14, 15, 16, 47, 18. Разработано много других показателей связи, некоторые из них. имеют значение для биологических исследований. ' ЧАСТНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ В некоторых исследованиях требуется выяснить, не является ли связь между двумя признаками обусловленной влиянием какого-нибудь третьего признака. Например, при изучении статистических связей между урожаем и средней температурой воздуха имеет смысл учесть влияние третьего признака — количества осадков, который влияет на оба признака? и на урожай, и на среднюю температуру воздуха. Точно так же при изучении корреляционной связи развития тела животных и какого-нибудь показателя их интерьера, например диамет- ра мускульных волокон, требуется выяснить, не является ли наблю- даемая при этом связь результатом влияния такого мощного фактора,, как калорийность пищи, изменение которой, конечно, вызывает одина- ково направленные изменения веса животного и диаметра мышечных волокон, и поэтому, несомненно, в какой-то мере и обусловливает связь между этими признаками. Для того чтобы выяснить в таких исследованиях, влияет или не- влияет третий признак на корреляционную связь между первым и вто- 156
фым признаком, необходимо исследовать эту связь при постоянных зна- чениях третьего признака. Например, при изучении корреляционной связи, между весом животных и диаметром их мышечных волокон можно третий признак (калорийность пищи) разбить на разные классы, организовав в каждом классе кормление при одном определенном уровне калорийности пищи. В каждом из этих классов третий признак имеет практически одинако- вое значение для всех животных, попавших в этот класс, но первый и второй признаки имеют у этих животных, конечно, вполне выраженное, хотя несколько,ограниченное разнообразие. Пользуясь этим обстоятельством, можно определить степень связи между первым и вторым признаком в каждом из организованных клас- сов. Из всех полученных коэффициентов корреляции можно вывести средний коэффициент, который и будет мерой связи между первым и вторым признаком при постоянном значении третьего. Постоянное значение признака означает, что с чисто внешней сто- фоны невозможно подметить статистического влияния этого признака :на все остальные. При постоянном значении признака можно только констатировать, что в изменчивости других признаков нет его влияния; >он постоянен, а другие признаки изменяются. Поэтому коэффициент корреляции между первым и вторым при- знаками при постоянном значении третьего признака считают коэффи- щиёнтом корреляции между двумя признаками при исключенном влия- нии третьего. Такой показатель носит название частного коэффициента корреляции и обозначается символом пг-з-' Для получения частного коэффициента корреляции не нужно про- водить такой сложный эксперимент, какой был описан выше для выяс- нения сущности частного'коэффициента корреляции. Если связь между нарой признаков прямолинейна или отличается от прямолинейной не- значительно, то величину частного коэффициента корреляции можно определить по обычным коэффициентам корреляции: • Г12 — г1з^23 Л2-3 = ---- V — — г2з) Здесь Г12-з — частный коэффициент корреляции между первым и вторым признаком при исключенном влиянии тре- тьего; rl2, ri3,' г23 — обычные коэффициенты корреляции между призна- ками, номера которых указаны в индексе. Пример 66. При исследовании корреляционной связи между ве- .сом животных (1) и диаметром мускульных волокон (2), при исключен- ном влиянии на эту связь калорийности пищи (3), т. е. при постоянном -значении калорийности пищи, были получены следующие коэффициен- ты. корреляции: , между весом и диаметром ц2 = +0,6; между весом и калорийностью г^= +0,8; между диаметром и калорийностью г23 = +0,7. Частный коэффициент корреляции: . Г12.3 = +0,б-(Ф0,8)(+дл = = + 009 / (1 —0,82) (1 — 0,7й) °>428 ^Выявилась очень малая частная корреляция. Исследование пока- -зало, что если исключить статистическое влияние калорийности пищи, 157
т. е. выравнять калорийность рационов, то между весом 'животных и диаметром их мускульных волокон не будет почти никакой связи, хотя обычно без выравнивания калорийности пищи, эта связь внешне выра- жается довольно, значительным коэффициентом: +0,6. При совместном изучении трех признаков можно исключить влия- ние не только третьего, но также и первого или второго признака: г, г13 г12'г23 . „ ^23 — г12 • г13 '13-2 — - , ^23-1 =---. V (1 г2з) —г1з) Пример 67. Для стандартизации разруба свиных туш была изу- чена взаимосвязь осаливания трех основных частей туши: окорока (1),. корейки (2) и грудинки (3). Получены следующие коэффициенты корреляции между каждой? парой этих частей по содержанию жира: между окороком и корейкой г12=+0,70; между окороком и грудинкой ri3= +0,10; между корейкой и грудинкой г23=. +0,14. Потребовалось выяснить, влияет ли на связь между каждой парой частей степень осаливания третьей части. Для этой цели были рассчи- таны три частных коэффициента корреляции: Г„..= +0.70-(+0..0)(+0.1«) = + 0.696. /(1 —0.10«)(l— 0,14s) = +0,10^ (+0,70) (+0,14) _. 0 .003. /(1 — 0,702) (1 — 0.142) ^0’14-^0’70)(+0’10) = + 0.098. /(1 — 0,702) (1 — 0, Ю2) Оказалось, что на значительную связь между окороком и корейкой (по степени осаливания) не влияет степень осаливания грудинки, и вообще взаимосвязь по осаливанию между каждой парой частей сви- ной туши почти не зависит от осаливания третьей части. Можно исключить влияние двух признаков и получить частный .коэффициент корреляции второго порядка по следующей формуле: r12-4 —r13-4f23-4 Г12-34 = — \ О г?3-4) О г2з/ где Г12.34— частный коэффициент корреляции второго порядка между первым и вторым признаками при исклю- ченном7 влиянии третьего и четвертого признаков, . т. е. при постоянном их значении; П2-4, Лз-4, г23.4 — частные коэффициенты корреляции первого по- . рядка. ' Иногда вычисление частного коэффициента- корреляции дает ре- зультаты, кажущиеся на первый взгляд невероятными. При 'более же внимательном анализе явления, уже не с математической, а со специ- альной точки зрения, эти результаты становятся вполне понятными и легко объяснимыми. Пример 68. При изучении зависимости веса древесины от раз- меров дерева (обхвата и высоты ствола) были получены следующие коэффициенты корреляции: 158
между обхватом (1) и высотой (2) ri2=+0,5; ' между'обхватом (1) и весом (3) ri3= +0,9; между высотой (2) и весом (3) г23=+0,8. Частные коэффициенты корреляции каждого размера с весом при исключенном влиянии другого размера не вызывают никаких недоуме.- ний и указывают на большую частную корреляцию обхвата и высоты с весом древесины: 0,90 —0,50 • 0,80 , п пс . Лз-2 = — = + 0,96, / (1 — 0,25) (1 — 0,64) 0,80-0,50-0,90 . п по Г231 = —тзг==г=г=г = +0,92. / (1—0,25)(1 — 0,81) Частная корреляция между обоими размерами при исключенном влиянии веса, т. е. при его постоянном значении равна: 0,50 — 0,90 • 0,80 Л 23 = — — V (1— 0,81)(1 — 0,64) = — 0,84. . Оказалось, что между обхватом и высотой дерева получилась зна- чительная отрицательная частная зависимость: при увеличении высоты обхват дерева уменьшается. Это, казалось бы, явно противоречит обыч- ным процессам развития деревьев: если увеличивается высота, то, конеч- но, увеличивается и обхват. Объяснение этого мнимого противоречия заключается в основном условии частной корреляции — постоянстве исключаемого признака. Если взять деревья одного и того же веса, то среди таких деревьев, увеличение высоты может происходить только за счет уменьшения обхвата. Если бы увеличивались оба размера, не мог бы оставаться по- стоянным вес древесины. ' ТЕТРАХОРИЧЕСКИЙ ПОКАЗАТЕЛЬ СВЯЗИ При.альтернативном разнообразии, когда оба качественных призна-, ка выражаются только наличием или отсутствием их у особей, корреля- ционная связь между двумя признаками измеряется тетрахорическим- показателем связи. Если у каждой особи изучаются два признака, то вся группа раз- бивается на следующие четыре части: а — особи, имеющие оба признака (+ +); b — особи, имеющие первый признак,, но не имеющие второго (4—); с — особи, не имеющие первого признака, но имеющие второй. (—Ь); d-—особи, не имеющие обоих признаков (--). Если обозначить численность этих четырех групп этими же буква- ми (а, Ь, о, d), то степень связи наличия первого признака с наличием второго признака будет определяться тетрахорическим • показателем связи, который вычисляется по формуле ad — be J/ (а + 6) (с + 4) (а + с) (6 + d) 159
Пример 69. При проверке действия прививки против сыпного тифа получены первичные материалы о числе заболевших (—) и не за- болевших ('+) из числа получавших ( + ) и не получавших (—) при- вивку, представленные в табл. 50. Таблица 50 1 2 Получившие у прививку + Не получившие прививку — Не заболели 4- 4-4-а=54 —4-с=106 (а4-с)=160 Заболели —• 4—5=6 d=44 (&4-d)=50 2 (а-|-&)=60 (c-|-d)=150 - n=210 54-44—6-106 4-1740 <60-150-160-50 8485,3 Определить достоверность тетрахорического показателя связи мож- но по величие %2, которая в данном случае равна 2 2 Хг++ = пг++ При числе степеней свободы v=l (что всегда имеет место для тет- рахорической связи) предельные значения , соответствующие трем степеням вероятности отличия от нуля (р^О.95; fJ2 = 0,99; 03 = 0,999), равны соответственно 3,8; 6,6 и 10,8 (см. табл. XI). Для приведенного примера достоверность связи прививки с предо- хранением от заболевания определится так: Хг++ = 210 - 0.2052 = 8Д 2 Xst = • 10,8 6,6 . 3,8 v = 1. Исследование подтвердило вполне достоверную связь (0>О,99) " между прививкой и незаболеванием сыйным.тифом. Если представляет интерес только достоверность тетрахорического показателя связи, то величину %2 можно рассчитать, минуя вычисления показателя связи: . 2 = (ad — bcpn_______ (о Ь) (с 4- d) (а 4- с) (b 4- d) Для приведенного примера по этой формуле получим то же зна- чение: 2 _ (54 44 — 6 106)2 210 _ 635 796 000 _ 8 8 Х 60 • 150 160 -50 ~ 72 000 000 ~ ’ ПОЛИХОРИЧЕСКИЙ ПОКАЗАТЕЛЬ СВЯЗИ Полихорический показатель связи измеряет сопряженное разнооб- разие особых признаков двух категорий. 1. Такие количественные признаки, степень развития которых ха- рактеризуется не результатом точного измерения, не числом, а качест- венными градациями, которые определяются субъективно, путем осмот- 160
I pa, ощупывания и вкусовой пробы. Например, цвет пера птицы может оцениваться как светло-серый, серый и темно-серый; развитие статей экстерьера — сильное, среднее, слабое; вкус сливочного масла — слабо-, средне- и сильносоленый; упитанность животных — жирная, вышесред- няя, средняя, нижесредняя, тощая; болевой синдром — слабый, средний, сильный; подвижность спермиев в баллах (1, 2, 3, 4, 5) и т. д. 2. Признаки, не имеющие степени выражения, но разделяемые на качественные градации. Цвет волос человека — черный (брюнеты), коричневый (шатены), светлый (бдондины); гражданское состояние — холостые, женатые, разведенные; пол — мужской, женский, кастраты (быки); профессия; раса и т' д. Определять степень связи между такими признаками можно при помощи показателя, предложенного Чупровым, на основе коэффициен- та контингенции ср2 (фи-квадрат) Карла Пирсона. Показатель Чупрова «можно назвать полихорическим показателем связи и определять по формуле: yz = j Г_______1 ' V VGh-lHga-l) Входящий в формулу коэффициент контингенции ср2 рассчитывает- ся по формуле: 1 / . где f— частоты ячеек корреляционной решетки по первому и вто- рому признакам; . п\ — частоты ряда первого признака по столбцам в нижней суммарной строке; «2 — частоты ряда второго признака по строкам в правом сум- марном столбце; gi, g2 — число градаций, на которые разбиты первый и второй признаки. Полихорический показатель связи всегда- выражается положитель- ным числом, поэтому определение характера связи производится по виду корреляционной решетки. . ’ Пример 70. При исследовании связи между крепостью телосло- жения производителей (1) и густотой их спермы (2) получены данные, представленные в табл. 51. ' ' Таблица 51 Корреляция между двумя неточно измеряемыми признаками 11 Н. А. Плохинский 161
Сведение материалов В корреляционную решетку выявило вполне заметную связь между изучаемыми признаками: при сильной крепости телосложения большинство производителей имело густую сперму, а при слабом- телосложении большинство из них (конечно, в сравнимых усло- виях) имело сперму жидкую. Степень связи между этими признаками можно определить, рассчи- тав полихорический показатель связи, что показано в табл. 52. Выясни- лось, что между изученными признаками имеется корреляционная связь достаточной степени: ^=0,66. Таблица 52 Вычисление полихорического показателя 1 / связи К = I / ... .. ; V V (§1~1) (§2-1) »1 1 2 Крепость телосложения п2 п=100 §1=3 §2=3 <р2=1,86—1=0,86 Л 0,86 =0,66 сильная средняя слабая Сперма густая 30(900) 22,50 9(81) 2,02 1(1) 0,02 40 средняя 5(25) 0,83 21(441) 14,70 4(16) 0,53 30 жидкая 2(4) 4 0,13 3(9) 0,30 25(625) 20,83 30 П1 ^Г-.п2) П1 37 23,46 0,63 33 17,02 0,52 . 30 21,38 0,71 100 2=1,86 Расчет полихорического показателя связи нужно производить по следующим этапам. 1. Составить корреляционную решетку. 2. Подсчитать частоты щ по первому признаку, суммы по столбцам (37, 33, 30), п2 по строкам. (40, 30, 30) и общую численность группы n = 'Sn1=.'Sn2: ' га = 37 4-33 + 30 = 40 4-30+ 30 = 100. 3. В каждой ячейке возвести в квадрат частоту и полученный ре- зультат (f2) записать в той же ячейке' в скобках. Затем квадрат часто- ты ячейки разделить на. частоту второго признака в той же Строке, в которой находится ячейка, и полученный результат (р: м2) записать в той же ячейке под двумя ранее записанными цифрами.. Например, в. крайней верхней левой ячейке (табл. 52) частота f=30, квадрат этой частоты f2 = 900, а квадрат частоты, деленный на частоту второго при- знака соответствующей строки, (р : п2) =900 : 40 = 22,5. 4. Последние числа ячеек (р : п2) сложить по столбцам, т., е. по- градациям первого признака,, и суммы записать в строке под частотами первого признака. 162
Например, по первому столбцу эта сумма равна 22,50 + 0,83+0,13 = =23,46; по второму столбцу 2,02+14,70 + 0,30= 17,02, а по третьему столбцу 0,02 + 0,53+20,83 = 21,38. 5. Полученное значения Х(Д:н2) разделить на частоты ряда пер- вого признака и результаты записать в следующей строке. Для первого „ S (/2; п ) 23,46 л ' л 17,02 „ столбца— -----— =—-— = 0,63, для второго столбца —:—=0,52, щ 37 33 21,38 для третьего —^—=0,71. 6. Найти сумму значений цифр последней строки: -S (/2: Па) = 0,63 + 0,52 + 0,71 = 1,86. 7. Коэффициент контингенции равен: <р2= 1,86—1=0,86. 8. Полихорический показатель связи равен: К=1/"-^ =/0,43 = 0,66. V /2,2 , Достоверность полихорического показателя связи можно опреде- лить при помощи критерия %2, который для данного показателя равен произведению объема группы на коэффициент контингенции: : = «<Р2> Xs< / = (.gi — 1) (8г — !)}• Для разбираемого примера достоверность полихорического зателя связи определится следующим образом: 18,5 %st= 13,3 (табл. XI). ' 9,5 £ = 1'00 • 0,86 = 86,0 v = (3 — 1) • (3 — 1) = 4. пока- КОРРЕЛЯЦИЯ РАНГОВ (НЕПАРАМЕТРИЧЕСКАЯ КОРРЕЛЯЦИЯ) Есть признаки, которые нельзя или не требуется измерять, но по которым объекты могут быть расположены по возрастающей или убы- вающей степени выраженности признака. Ряд объектов, расположенных по степени выраженности порядко- вого признака, называется ранжированным рядом, процесс составления такого ряда называется ранжированием, порядковый номер объекта в ранжированном ряду называется рангом этого объекта. Если в группе имеются особи, неразличимые между собой по изу- чаемому признаку, то каждой паре или тройке, или четверке и т. д. таких признаков присуждается средний ранг, равный средней арифме- тической из тех рангов, какие имели бы эти объекты, если бы они были различимы. Например: объекты ранги по первому признаку ранги по второму признаку а б в г д 1 2 3 4’ 5 2,5 1 4 5 2,5 По первому признаку все объекты различимы, им присвоены ранги с 1-го по 5-й, по мере усиления выраженности признака. • 163
По второму признаку объекты а и д оказались неразличимы, а по выраженности (одинаковой) признака они должны быть помещены после объекта с рангом 1 (по второму признаку). Если бы они были различимы, они бы получили ранги 2-й и 3-й. Им присвоен одинаковый 2 ь з ранг —— = 2,5, а следующему за ними объекту в — 4-й ранг. Коэффициент корреляции между порядковыми признаками назы- вается порядковым, или ранговым, или непараметрическим. В основу техники вычисления порядкового коэффициента корреля- ции положена одна из формул обычного пирсоновского коэффициента корреляции: Ci-^Cj — Cj 2 С£г (точная формула), где Ci, С2, Са — дисперсии [С=2 (V—М)2].по первому, второму призна- кам и по ряду разностей рангов. Рабочие формулы расчета порядкового коэффициента корреляции имеют разную структуру в зависимости от наличия или отсутствия в коррелируемых рядах усредненных рангов. В тех случаях, когда в одном или обоих , ранжированных рядах имеются усредненные ранги, рабочую формулу расчета порядкового коэффициента корреляции можно сконструировать с учетом того, что Пу=п2, Cd = 2№, 2]/С^^(С1 + С2), 1 S42 , . , ' р = 1 ——;----- (приближенная формула). Ci -р С2 Пр и м е р 71. Десять арбузов а, б, в, г, д, е, ж, з, и, к ранжированы сначала по интенсивности зеленой окраски (первый признак), причем на каждом арбузе поставлен его ранг, а затем по вырезанным пробам эти же арбузы были ранжированы по вкусовым качествам (второй при- знак) и на каждом поставлен второй ранг (по вкусу). Расчет порядкового коэффициента корреляции между интенсив- ностью окраски и вкусовыми качествами арбузов показан в табл. 53. Таблица 53 Расчет порядкового коэффициента корреляции; общий способ ' _1 Р C^Cz Арбу- зы Ранги d (V,-V2) I. II d по I при- знаку Vi по П при- знаку V2 а 2 3 — 1 n 10 10 10 б 1 2 — 1 Sk 55 55 0 в 3 1 +2 SV2 385 383 46 г 6 7 —1 д 10 7 .>.3 C=SV2— —— 82,5 80,5 46,0 е 4 4 0 n, ж 9 5 +4 3 5 7 —2 и .8 9 —1 ~ 1 46 к 7 10 —3 82,5-ф-80,5 J64
Выявлена значительная связь между этими признаками в исследо- ванной группе арбузов: ,р= + 0,72. Общий способ по точной или приближенной формуле можно при- менять во всех случаях анализа корреляции рангов. Для рядов с усредненными (или «связанными») рангами некото- рые авторы предлагали дополнительный прием. Освоение и запомина- ние этого приема на практике не оправдывается тем незначительным уточнением, которое он вносит. Расчет порядкового коэффициента корреляции при наличии в ран- жированных рядах усредненных рангов лучше проводить основным способом по второй формуле. В тех случаях, когда в ранжированных рядах нет неразличимых объектов, расчет порядкового коэффициента корреляции можно значи- тельно упростить, учтя особенности таких рядов. Так как оба коррелируемых рядаt представлены одинаковым набо- ром натуральных чисел от 1 до п (й разном порядке), то эти ряды имеют одинаковые объемы П1 = п2 = я (число пар); суммы рангов':.. SVi='SV2=SV, которые можно определить, минуя сложение, по числу пар 2У =; дисперсии: С1 = С2 = С, которые можно опреде- г (п — 1) п (я + 1) лить также по числу пар: С = ----! Кроме того, в таких рядах сумма разностей рангов равна нулю 2с?=0 и, следовательно, дисперсия по ряду разностей равна просто сумме квадратов разностей рангов: C^=2d2. Подставив эти значения в общую формулу коэффициента корреляции, можно получить совсем простое выражение, впервые предложенное Спирменом: , 6242 г, = 1-------------. • (п — 1) п (п. + 1) Пример 72. Для выяснения связи окраски волосяного покрова с агрессивностью поведения у лисиц были отобраны 8 самцов, явно различающихся по агрессивности: от 1-го самого тихого до 8-го самого буйного. У каждого из этих самцов была оценена окраска и по этому признаку они тоже были распределены от самого плохого (ранг 1) до самого лучшего по окраске (ранг 8). Таким образом, каждый самец получил 2 ранга: по агрессивности и по окраске. Расчет порядкового коэффициента корреляции для данного случая показан в табл?54. Непараметрический коэффициент корреляции - Спирмена должен применяться прежде всего для таких ранжированных рядов, в которых нет усредненных рангов и которые состоят из одинакового полного на- бора чисел натурального ряда от I до п (в неодинаковой последова- тельности). Если не требуется большая точность и можно ограничиться вторым десятичным знаком (до. одной сотой), то коэффициент корреляции Спирмена может применяться и при наличии усредненных рангов или в одном, или в обоих ранжированных рядах. Как показала практика, ошибка в значении rs при таком упроще- нии не превышает одной-двух сотых выборочного показателя. Достоверность порядкового коэффициента корреляции определяет- ся по правилу, показанному в табл. 55. Например, при п = 4 нельзя получить достоверного порядкового, коэффициента корреляции, при м = 5 можно считать достоверной только 1.65
-Таблица 54 Расчет порядкового коэффициента корреляции при отсутствии усредненных рангов _______62а!2 fs (п—1) п (п^1) Лисы Д Е Ж 3 Ранги агрессивность окраска Sda=14 слабая 1 2 3 4 5 6 7 сильная 8 3 худшая 1 2 5 4 лучшая 8 6 7 —2 -^1 —1 —2 +1 чМ 6-14 rs=l-7^7 =^0,83 7-8.9 А Б В d Таблица 55 Предельные значения порядкового показателя связи, достаточные для его достоверности по трем порогам вероятности безошибочных прогнозов в зависимости от числа коррелируемых пар рангов 3 п=5 п=6 п=7 п=8 > ' п>9 0,95 0, 99 0,999 — 1,00 0,89 1,00 0,75 0,89 0-,71 0,86 'll е -ч hili- максимально возможное значение 1,00, при п = 6 будут достоверны'с вероятностью 01^0,95 все значения rs^0,89' и т. д. Если число пар рангов равно или больше 9, то .критерий достовер- ности определяется так же, как и для обычного пирсоновского коэффи- циента корреляции количественных признаков. 'Для разобранных примеров достоверность порядковых коэффици- ентов корреляции определится следующим образом: ; в примере 71 п — 10; rs = 0,72; tTs = 0,72 у -10- = 2,9; в примере 72 v=10 — 2 = 8; tst — {2,3 — 3,4 — 5,0}; п = 8; rs = 0,83 >0,71. ----------------- / В обоих случаях выборочный коэффициент оказался достоверным’. ОБЛАСТЬ ПРИМЕНЕНИЯ НЕПАРАМЕТРИЧЕСКИХ , ПОКАЗАТЕЛЕЙ КОРРЕЛЯЦИОННОЙ СВЯЗИ Расчет порядкового коэффициента корреляции Спирмена отличает- ся значительной простотой. Поэтому некоторые авторы рекомендуют применять коэффициент Спирмена взамен обычного пирсоновского коэффициента корреляции между количественными признаками. 166
Практика такой замены, а также специальные' исследования воз- можности универсального применения коэффициента Спирмена, прове- денные Юлом и Кендэлом, показали, что применение ранговых коэффи- циентов не может быть рекомендовано как сокращенный способ расчета обычного, пирсоновского коэффициента корреляции между количест- венными, точно измеряемыми признаками. Порядковые показатели связи имеют свою область применения, недоступную для обычных коэффициентов корреляции. Коэффициенты корреляции рангов и, в частности,, коэффициент кор- реляции Спирмена следует применять только в тех случаях, когда объекты по изучаемому признаку должны быть ранжированы: или потому, что признак не может быть измерен ни точно, ни при- ближенно; или потому, что ранжирование требуется для решения поставлен- ной задачи. Следующие примеры помогут представить особые и широкие воз- можности непараметрических показателей связи. - Пр и м е р 73. В племенном заводе изучалась зависимость густоты спермы производителей от их кондиций. Для этой цели 7 производите- лей были ранжированы по двум признакам: от самого плохого до са- мого лучшего по густоте спермы (ранги 1 — 7) и от наименее до наибо- лее упитанного — ожиревшего (ранги 1—7). Получено два ранжирован- ных ряда: Производители а б в г Д е ж I Густота спермы 1 2 3 4 5 6 7 II Упитанность (ожирение) 5 . 4 7 6 2 1 3 Разность рангов 4 2 , 4 2 3 5 4Sd2=90 Г = 1--L 90 = 1 — 1,61 = —0,61 <0,75. s .6.7.8 Получен отрицательный показатель связи, достаточный по абсолют- ' ной величине. Это значит,-что с увеличением второго признака (ожире- ние) первый признак (густота спермы) уменьшался: у ожиревающих производителей'сперма хуже,'чем при нормальных кондициях. Недостоверность полученного показателя (см. табл. 53) заставила повторить исследование на 20 производителях. Получено: п = 20, rs = —0,82, ^ = 0,82|/ =6Д; v = 18; tst = {2,1 —2,9 — 3,9}. Пример 74. Для выяснения сходства или различия культурных интересов у супругов одной семьи было предложено мужу и отдельно жене расположить восемь московских зрелищных предприятий по убы- ванию своего интереса к ним: на первое место, ставить самое любимое (первый ранг), на последнее — самое нежелаемое (восьмой ранг). Получено два ряда рангов, по которым рассчитан коэффициент корре- ляции Спирмена: 167
Театры Ранги Муж /Кена d 1-. ГАБТ—опера 8 1 7 2. » —балет 3 2 1 3. МХАТ 6 3 3 4. Малый 7 4 3 6-146 5. Сатиры 5 5 Q 7-8-9— ’ 4 6. Оперетты 4 6 2 7. Эстрадный 2 7 5 ' 8. Цирк 1 8 '7 Sd2=146 Получен явно отрицательный- показатель связи: муж и жена не_ сходятся по своим культурным запросам в области театра и цирка. Пример 75. Испытание,, подобное описанному й предыдущем примере, было проведено в 100 выбранных подряд ,семьях. При этом в каждой семье отмечалось еще и наличие у членов семьи (родителей и детей) заболеваний, связанных с расстройством нервной системы. При обработке материалов испытания все 100 семейств были раз- делены на 4 группы: а) со сходством родителей по их культурным запросам (rs>0) и наличием в семье нервных болезней ( + ); ' Ь) со сходством культурных запросов у родителей (rs>0) и с от- сутствием в семье нервных заболеваний (—); с) с несходством родителей по их культурным запросам (rs^0) и с наличием в семье нервных болезней ( + ) ; d) с несходством родителей (rs^0) и без нервных болезней в семье (—). Таблица 56 Связь между сходством родителей по культурным запросам (I) и наличием в семье нервных болезней (II) ....... i Культурные запросы родителей , 2 и - сходны Р>0 .(+) ' несходны Р<0 (-) Нервные болезни в семье есть (-(-) 10 20 30 нет (—) 60 10 70 70 | 30 . . 100 10-10—60.20 г++= .-------------= —0,52; ++ /70-30.70-30 {10 81 б’б!. 3,’8J ’ По этим данным был рассчитан тетрахорический показатель связи между сходством культурных запросов родителей (I) и наличием в семье заболеваний на нервной почве (II). Расчеты показаны в табл. 56. Был получен отрицательный показатель связи достаточной вели- чины 0,52 и высшей достоверности {3>0,999: чем более сходны родители 168
по своим культурным запросам, тем менее в семье нервных заболе- ваний. П р и м е р 76. В поликлинике 10 больных были ранжированы по- предполагаемому сроку выздоровления профессором (главным врачом), студентом пятого курса и электронно-счетной машиной, сконструирован- ной в этой поликлинике. По мере выздоровления больных они были, ранжированы и по.фактическому сроку выздоровления. На основе, полученных ранжированных рядов были рассчитаны три порядковых коэффициента корреляции по Спирмену между прогнозом и фактическим сроком. Квадрат коэффициента корреляции показал объем эрудиции авто- ра прогноза в долях (или в процентах) от того полного объема, кото- рый обеспечивает безошибочный прогноз сроков выздоровления при' этой болезни. Расчеты показаны в табл. 57. Испытание показало, что профессор обладал 98% полной эрудиции, студент — 66%,. машина — 90%. Таблица 57 rs={H-IVj=l- 9.1031Т=°>818^ г%=0,67=67% rs= {III—IVj=l— 6^- = 0,951, г%=0,90=90% Пример 77. В племенном совхозе для уточнения селекционных планов потребовалось выяснить некоторые детали наследуемости селек- ционируемых признаков, в том числе яйценоскости для элитной части стада. При этом главным был вопрос о том, как из поколения в поколе- ние передается распределение несушек на лучших, худших, ср'едних,. т. е. в какой степени ранги дочерей соответствуют рангам их матерей. Для такого анализа была выбрана группа элитных матерей и для каждой матери была взята рендомизированно и изучена одна дочь. Та- ким образом были составлены пары мать — дочь'и каждая такая пара имела два ранга: для матери по ранжированному ряду матерей и для дочери по группе дочерей. Ранжирование производилось по яйценоско- сти. По этим двум ранжированным рядам определялся порядковый ко- эффициент корреляции Спирмена. 169
Такая проверка проведена по двум фермам с разным направлением племенной работы за два года, отличавшихся по кормообеспеченности. Результаты показаны в табл. 58. Выявилось резкое различие ферм по наследуемости яйценоскости. Первая ферма со средней яйценоскостью на одну несушку 220 яиц в год имела при нормальном кормлении достаточно высокий и в выс- шей степени достоверный показатель наследуемости: /г2=0,75. На этой ферме можно планировать отбор по матерям и ожидать большой эффек- тивности такого отбора. На второй ферме с несколько большей яйценоскостью (250 яиц в год) при нормальном кормлении получен очень, низкий показатель на- следуемости /г2=0,20. Эта ферма вела интенсивный отбор матерей, что ' Таблица 58 Наследуемость по матерям яйценоскости Фермы Кормообеспеченность нормальная слабая п (пар) h2=r 4-щ ,s rs п (пар) №~гАтг s rs Первая 20 0,75+0,16 20 0,45+0,21 Вторая 30 0,20+0,18 30 0,04+0,19 привело к повышению средней яйценоскости и в то же время настолько выровнило генетические различия несушек (на повышенном уровне), что возможности дальнейшего'племенного отбора лучших значительно сни- зились. На. этой ферме невозможно в основу селекционного плана для элиты положить отбор по матерям. При ухудшении кормления показатели наследуемости резко снизи- лись на обеих фермах. Очевидно, недостаточное кормление снизило яйценоскость потомства от лучших матерей, что спутало ранги несушек в двух смежных поколениях. ... При данной степени ухудшения кормовых условий лучше не прово- дить испытаний на наследуемость яйценоскости и материалы по продук- тивности матерей за этот год не включать в те первичные данные, кото- рые привлекаются для составления селекционного плана. Вопрос о'степени искажения групповых показателей селекции при ухудшении кормовых (и’других) условий лучше решать при помощи показателей повторяемости. Пример 78. В племенном птицесовхозе, описанном в предыдущем примере, в одном году произошло ухудшение кормовых условий, сказав- шееся на снижении показателей наследуемости. Требовалось выяснить возможности отбора по яйценоскости несу- шек за этот год и опять гла-вным был вопрос о соответствии рангов. Только для данного исследования нужно было сопоставить не ранги дочерей и матерей, а ранги одной и. той же несушки за благоприятный и неблагоприятный годы в кормовом отношении. Требовалось установить порядковые показатели паратипической повторяемости при ухудшении кормления для двух ферм, описанных в предыдущем примере. Резуль- таты показаны в табл. 59. Выявлена незначительная порядковая корреляция между яйценос- костью за худший и лучший годы, явно недостаточная для того, чтобы вести отбор по фенотипу по данным худшего года. Лучшие несушки, 170
выделенные в год недостаточного кормления, далеко не всегда окажутся , таковыми в лучшие годы, в оптимальных условиях проявления своих потенциальных возможностей. Недостаточная повторяемость признаков продуктивности у сельско- хозяйственных животных наблюдается только при значительном ухуд- шении условий кормления и содержания. При не очень сильных колебаниях уровня этих условий повторяе- мость признаков может меняться столь незначительно, что' остается полная возможность племенного отбора по данным за все эти годы. Таблица 59 Паратипическая повторяемость (П) яйценоскости при переходе от нормального кормления к недостаточному Фермы Число несушек I II ' 0,30±0,26 0,20±б,15 20 30 Кроме паратипической повторяемости, т. е. постоянства рангов осо- бей в разных условиях, не меньшее значение имеют показатели воз- растной повторяемости (для изучения возможности отбора по фенотипу в молодом возрасте) и топографическая повторяемость — при нахожде- нии лучших мест на теле животных для экстерьерной оценки. Все эти показатели могут быть выражены порядковыми коэффи- циентами корреляции, если требуется выявить соответствие рангов от- дельных особей в разных условиях, в разных возрастах и на отдельных участках тела при определении продуктивных качеств. ДИСПЕРСИОННЫЙ АНАЛИЗ Дисперсионный анализ в его современном развитии позволяет ре- шать ответственные задачи, возникающие при изучении статистических влияний в биологии: 1. Измерение силы влияний. 2. Определение достоверности влияний. 3. Оценка генеральных параметров влияния в форме доверительных границ. 4. Оценка разности частных средних. 5. .Функциональный (регрессионный) анализ ряда частных средних. б. Разработка прогнозов возможного развития признаков при за- данном комплексе условий. 7. Разработка алгоритмов работы машин по установлению диагно- зов и прогнозов биологических состояний и процессов при имеющемся или заданном комплексе симптомов. В частности, в области генетики и селекции дисперсионный анализ позволяет производить: 8. Измерение степени наследуемости признаков при передаче гене- тической информации из поколения в поколение. 9. Сравнительный анализ наследственных и комбинационных спо- собностей производителей (отцов и матерей), как основу массового пла- нирования отбора и подбора. 171
ОСНОВНЫЕ ПОНЯТИЯ Сущность дисперсионного анализа заключается в изучении стати- стического влияния одного или, нескольких факторов на результативный признак. ' РЕЗУЛЬТАТИВНЫЙ ПРИЗНАК Результативный признак (у) — это элементарное качество или свой- ство объектов, изучаемое как результат влияния факторов: организо- ванных в исследовании (х) и всех остальных, неорганизованных в дан- ном исследовании (z). Результативными признаками могут быть: а) точно измеряемые особенности объектов: длина, Фирина, рост,, обхват, сила, резвость, шерстность, обильномолочнбсть, содержание ге- моглобина в крови, артериальное давление и т. д.; б) неточно измеряемые признаки: густота спермы в баллах, консти- туциональная крепость, умственные способности и т. д.; в) комбинированные признаки: отношение размеров тела, индексы продуктивности, средние из нескольких дат для одного объекта (напри- мер, средний размер клеток печени у каждой изучаемой особи) и т. д.;. -' г), качественные признаки: масть, цвет глаз, болезнь, выздоровле- ние, смерть и т. д. ‘ ФАКТОР Фактор — это любое влияние, воздействие или состояние, разнооб- разие которых может так или иначе отражаться в разнообразии резуль- тативного признака. Факторами могут быть: а) физические влияния: температура, влажность, радиационное из- лучение; б) химические влияния: питание, стимуляторы, мутагены, алкоголь; в) биологические влияния: здоровье и болезни, биостимуляторы, наследственность, талантливость, идиотизм; г) возраст-, пол, сорт, порода, национальность; д) ареал обитания, условия жизни; е) отдельные признаки, принимаемые за аргумент при изучении других признаков — функций. Например, длина ног рысака как один из факторов, определяющих его резвость. ГРАДАЦИИ ФАКТОРОВ Градации факторов-—это степень их действия (нулевое действие в контрольной группе), или состояние объектов изучения (пол, возраст, обученность и т. д.). Градациями факторов могут быть: а) разная температура, влажность, разные дозы облучения, разная продолжительность физических воздействий; б) разные питательность и состав корма, разные дозы стимуляторов и химических мутагенов, разные стадии .опьянения; в) разные периоды болезни, степени таланта, разные отцы или клас- сы отцов, разные матери или кла,ссы матерей; 172
г) разные возраст, пол, сорт, порода; ' ' д) разные ареалы и условия жизни; е) разная величина признака, принятого за аргумент. ГРАДАЦИИ КОМПЛЕКСА Градации комплекса — это опытные группы исследования. Каждая градация комплекса соответствует одной градации фактора и включает те объекты (с их датами), которые подвергались одной степени действия -фактора или находились в одном из изучаемых состояний. Организация градаций комплекса может осуществляться разными -способами; подбор опытнйх и контрольных групп, привлечение материа- лов ранее проведенных наблюдений и опытов, систематизация записей производственной отчетности. Подбор объектов в градации из ранее намеченных генеральных со- вокупностей (соответствующих каждой градации) производится рендо- -мизированно, т. е. по принципу случайной выборки, без учета развития изучаемого признака (перед отбором). ДИСПЕРСИОННЫЙ КОМПЛЕКС Дисперсионный комплекс — это совокупность градаций с привлечен- ными для исследования датами и средними из дат по каждой градации (частные средние) и по всему комплексу (общая средняя). Если изучается действие одного фактора, комплекс называется од- нофакторным, двух факторов — двухфакторным, трех и более факторов— многофакторным. Если во все градации подбирается одинаковое число дат, комплекс называется равномерным, неодинаковое число дат — неравномерным. Если градации двух- и многофакторных комплексов заполнены неодина- ковым числом дат, но так, что даты по градациям одного, фактора нахо- дятся в одинаковом отношении в градациях всех остальных факторов, такой комплекс называется пропорциональным. Равномерные и пропорциональные комплексы называются орто- гональным и, так как только в этих комплексах полностью проявля- ются такие соотношения между суммой чисел и суммой их квадратов, которые в математике называются ортогональными. Комплексы, составленные по принципу случайной выборки, назы- ваются рандомизированными. При изучении количественных признаков в градации комплекса заносятся даты — числовые результаты измерения изучае- мого признака у каждого отдельного объекта. При изучении качественных признаков в градации комп- лекса заносится число объектов с наличием признака и общее число -объектов. СТАТИСТИЧЕСКИЕ ВЛИЯНИЯ Статистическое влияние — это отражение в разнообразии резуль- тативного признака того разнообразия фактора (его градаций), которое -организовано в исследовании. Для оценки влияния фактора необходимо выявить разнообразие его действия, т. е. установить, насколько различно действуют его градации на результативный признак. Например^ для изучения влияния радиационного облучения на му- тационный процесс требуется организовать минимум две градации фак- 173
тора (облучения нет, облучение есть) и установить, велико ли различие в частоте мутаций при разных градациях облучения (0, +). Если разнообразие результативного признака большое, т. е. если частота мутаций при облучении значительно отличается от частоты без. облучения, значит влияние данного облучения велико; если такого раз- личия нет или оно мало, значит изучаемый фактор действует слабо, ко- нечно, при данных дозах и условиях. Оценка влияния фактора по разнообразию действия его градаций есть основной принцип дисперсионного анализа. Если нет разнообразия результативного признака по градациям фактора, нет. и статистического влияния, хотя физиологическое влияние этого фактора может быть сильным. Например, стимулятор мог сильно повышать плодовитость, но оди- наково при всех дозах, организованных в данном исследовании (силь- ный эффект при любой не нулевой дозе). Тогда при сильном физиоло- гическом влиянии этот стимулятор показал бы очень малое статистиче- ское влияние, конечно, только при организации комплекса без нулевой градации. При проведении,дисперсионного анализа изучаются три основных вида статистических влияний: факториальное, случайное и общее. Факториальное влияние Факториальное влияние — это простое или комбинированное стати- стическое влияние изучаемых факторов. В однофакторных комплексах изучается простое влияние одного- фактора при определенных организованных в опыте градациях и при Определенных общих условиях. Этого не следует забывать при интерпретации результатов анализа. Например, если действие температуры оказалось сильным при града- циях 10°—15—20°, это не значит, что столь же сильное статистическое влияние проявится и при любых других градациях фактора, например при 20°—25—30°. Точно так же, если влияние температуры изучалось при нормальной влажности и естественном освещении, нельзя ожидать такой же степени влияния температуры при повышенной (пониженной) влажности и при искусственном освещении. При анализе двухфактбрных дисперсионных комплексов изучаются четыре факториальных влияния. 1. Влияние первого фактора при. усредненном влиянии второго. 2. Влияние второго фактора при усредненном влиянии первого. 3. Влияние сочетания градаций обоих факторов. 4. Суммарное действие обоих организованных факторов. При анализе влияний первого и второго факторов действуют те- же ограничения, какие необходимо иметь в виду при анализе однофак-ч торных комплексов: выявляется степень влияния только при данных градациях каждого фактора и при данных условиях. Кроме того, следует помнить, чтб действие каждого фактора в двух- факторном комплексе изучается при усредненном влиянии другого фак- тора и усредненном действии всех остальных, неорганизованных в дан- ном комплексе факторов. Например, если изучается степень проявления в данных условиях влияния отцов (первый фактор) и матерей (второй фактор), то сила отцовского влияния (при данном составе матерей и при определенных условиях) изучается при усредненной реализации влия- ния матерей, а сила материнского влияния — при усредненном влиянии отцов, участвовавших в проведенных скрещиваниях. 174
Это, конечно,,только при изучении каждого фактора в отдельности. Вообще же в двухфакторном комплексе изучаются все детали комплекс- ного влияния факторов.- . Третье влияние, или влияние сочетания градаций обоих факторов, возникает вследствие того, что второй фактор часто действует -различно- при разных градациях первого. То же можно наблюдать и в отношении первого фактора: его действие часто проявляется неодинаково при раз- личных градациях второго фактора. Например, если изучается действие стимулятора линьки (две градации второго фактора — контроль, опыт) на самцов и самок (две градации первого-фактора), то может случить- ся так, что введение стимулятора даст большой эффект только для са- мок, а для самцов — незначительный. Такое разнообразие действий одного фактора при разных града- циях другого создает дополнительное статистическое влияние (сверх изолированных влияний каждого фактора), которое учитывается как особый- вид факториальных влияний. Суммарное действие факторов (четвертое влияние) включает в се- бя изолированные влияния каждого из факторов и-влияние сочетаний их градаций. Это суммарный представитель всех факториальных влия- ний в двухфакторном дисперсионном комплексе. Случайное влияние Случайное влияние — это действие тех многих факторов, которые не организованы в изучаемой дисперсионном комплексе и составляют общий фон, на котором действуют организованные факторы. Так как неорганизованных факторов много и действуют они в разных направ- лениях, их влияние рассматривается как случайное, т. е. не вытекающее из закономерности действия организованных факторов. Во всех дисперсионных комплексах случайные влияния выявляют- ся и измеряются единообразно и для одной и той же очень важной цели: для определения той базы, с которой, как с эталоном, сравниваются факториальные влияния при определении их достоверности. Чем больше факториальное влияние, отличается от случайного, тем большая достоверность приписывается этому факториальному влиянию. Это правило в дисперсионном анализе не имеет исключений. При определении достоверности факториальных влияний за базу сравнения можно принимать только случайные влияния. Нельзя за эту базу принимать, например, влияние сочетания града- ций в бесповторных двухфакторных комплексах. Общее влияние Общее влияние — это влияние всех организованных и неорганизо- ванных факторов, определивших,такое развитие признака, которое на- блюдалось в дисперсионном комплексе. Общее влияние служит базой для определения доли влияний — факториальных и случайных. РАЗНООБРАЗИЕ ЭЛЕМЕНТОВ ДИСПЕРСИОННОГО КОМПЛЕКСА Статистические влияния проявляются в- разнообразии или дат, или средних, или разностей. В дисперсионном комплексе каждому виду влияний соответствует свое .разнообразие. В однофакторных комплексах изучаются три вида разнообразия. 1. Факториальное разнообразие, или разнообразие частных средних по градациям комплекса (межгрупповое разнообразие). 175
2. Случайное разнообразие, или разнообразие дат внутри градаций (внутригрупповое разнообразие). ' , - , ’ 3. Общее разнообразие, или разнообразие дат около..общей средней ко всему комплексу. В двухфакторном комплексе изучаются шесть видов разнообразия. 1. Разнообразие по первому фактору, или разнообразие частных -средних по градациям первого фактора при усредненных градациях второго. 2. Разнообразие по второму фактору, или разнообразие частных средних по градациям второго фактора при усредненных градациях первого. 3. Разнообразие по сочетаниям градаций обоих факторов, или до- полнительное разнообразие изменений частных средних по градациям •одного фактора при разных градациях другого фактора. Для иллюстра- ции этого'трудно понимаемого элемента дисперсионного анализа приве- ден рис. 20. 4. Суммарное факториальное разнообразие — сумма первых трех частных межгрупповых факториальных разнообразий. 5. Случайное (внутригрупповое) разнообразие — сумма разнообра- зий дат внутри градаций. 6. Общее разнообразие, или разнообразие дат около общей средней по всему комплексу. Для количественного выражения каждого вида разнообразия в дис- персионном анализе применяются два основных показателя — дисперсия и варианса: 176
Дисперсия Дисперсией мы будем называть и само наличие разнообразия в 'группе и первичную меру, которая определяет степень этого разнообра- зия. . Дисперсия как первичная мера разнообразия равна сумме квадратов центральных отклонений: дат от общей и частных средних, или част- ных средних от общей средней: C = SD2; D = V —М, Р = М;-Л1А • По этой причине дисперсию иногда называют’суммой квадратов и в соответствии с этим термином употребляют и символы: SS, SQ и т. д. Практические способы расчета дисперсий по рабочим формулам и все последующие действия показаны в табл. 25, 26 и в алгоритмах 19, 20, 21, 23, 24 — для 'количественных признаков и ортогональных комплек- сов (полезно предварительно возобновить в памяти систему технических приемов расчета дисперсий по указанным таблицам и алгоритмам). Для понимания приемов дисперсионного анализа необходимо усво- ить систему основных принципиальных формул, показанных на двух схемах для однофакторных и двухфакторных комплексов в табл. 60 и 61. Числовые иллюстрации расчета дисперсий будут приводиться из этих двух схем. В однофакторных дисперсионных комплексах определяются три дисперсии, соответствующие трем влияниям и трем видам разнообра- зия. , Таблица 60 Схема одяофакторного дисперсионного, комплекса < Градации Ai Д2 Лз r—3 Ю s kA \ V1 V2 \ 2 V п Mi 8,0 2 4 10,14 2 12 0,4 2 2 10 II II II « 1 3 148,5 30,8 9; 6 fig t>x = ATj — A4x Z?* —2 4 +6 36 —4 16 Cx=2nD2 = = 112 X z У c 112 48 160 Dz = V - Mi D2 +4 —4 16 16 —2 -[-2 4 4 —2 +2 4 4 Cz == 20^ = = 48 T]2 = Ct/Cy 0,70 0,30 1,00 V r— 1 2 N— r 3 IV— 1 5 Dy=V —.My. 4-2 —6 4 36 +4 4-8 16 64 —6 —2 36 4 = 160 «==’Al 56 16 — 3J> — — 12 Н. А. Плохияакий 177
Схема двухфакторного дисперсионного комплекса ^ = {7,7 — 21,2 — 74,1^, vx = 3, у? = 4, ^ = {6,6—16,7 — 56,1} 178
1. ‘ Факториальная (межгрупповая), дисперсия равна сумме взве- шенных квадратов центральных отклонений частных средних (Л1<) по градациям комплекса от общей средней (М£). Это—дисперсия част- ных средних около общей средней: Сх = 2п(М; — М^ = 2 (4 — 6)2 + 2 (12 — 6)а + 2 (2 — 6)2 = 112 (табл. 60). 2. Случайная дисперсия (внутригрупповая) равна сумме квадратов центральных отклонений дат (V) от своих частных средних (Mi) по градациям комплекса. Это — дисперсия дат около частных средних: Q = S(IZ —МУ2| = (8 — 4)2 + (0 — 4)2 + (10 — 12)2 + (14 — 12)2 + + (0 — 2)2 + (4 — 2)2 = 48 (табл. 60). 3. Общая дисперсия равна сумме квадратов центральных отклоне- ний дат (V) от общей средней. Это — дисперсия-дат около общей сред- ней (Ms). - ' Cj/ = S(V-Ms)2 = (8-6)2 + (0-6)2 + (10-6)2 + (14-6)2 + _|_ (0 — 6)2 + (4 — 6)2 = 160 (табл. 60). Использование уже полученных дисперсий для определения силы и достоверности влияний в однофакторных комплексах производится так же, как й при расчетах дисперсий по рабочим формулам. В двухфакторных дисперсионных комплексах определяется шесть дисперсий для шести видов разнообразия по шести влияниям. 1. Дисперсия по первому фактору равна сумме взвешенных квадра- тов центральных отклонений частных средних по градациям первого фактора от общей средней по всему комплексу. Это — дисперсий част- ных средних по градациям первого фактора около общей средней: • СА = ЯпА (МА — Ms)21 = 4 (7 — 6)2 + 4 (5 — 6)2 = 8 (табл. 61). . 2. Дисперсия по второму фактору равна сумме взвешенных квад- ратов центральных отклонений частных средних по градациям второго фактора от общей средней по всему комплексу. Это — дисперсия част- ных средних по градациям второго фактора около общей средней: s Сд '= Еид (Мв — М£)2| = 4 (3 ~ 6)2 + 4(9 — 6)2 = 72 (табл. 61). 3. Дисперсия по сочетанию градаций' Сав есть новый показатель таких биологических соотношений, которые были вскрыты при развитии дисперсионного анализа двухфакторных (и многофакторных) комплек- сов и которые раньше не были известны, так как не было метода извле- чения информации об этих явлениях. Этим объясняется то обстоятельство, что вопрос о сочетании влия- ний факторов и соответствующем' показателе дисперсионного анализа не всегда правильно освещается и в математической и в биологической литературе. При интерпретации анализа двухфакторных комплексов иногда до- пускаются следующие ложные утверждения. 1. Дисперсия .Сав- есть остаточная математическая величина, техни- ческое значение которой еще не выявлено.. 2. Дисперсия САв есть один из показателей случайного разнообра- зия и в качестве меры случайного разнообразия может быть использо- 12* 179
вана, например, в бесповторных двухфакторных дисперсионных комп- лексах. ' 3. Определять достоверность влияния первого и второго факторов можно только в том случае, если влияние сочетания градаций окажется достоверным. Все эти мнения противоречат основным положениям теории' диспер- сионного анализа и основаны на непонимании сущности дисперсии по сочетанию градаций. Понять особенности этого сложного показателя САВ поможет рис. 20 и демонстрационный пример непосредственного расчета дисперсии по сочетанию градаций, показанный в табл. 62. Таблица 62 Непосредственный расчет дисперсии по сочетанию градаций в равномерном двухфакторном комплексе .л,. А2 Вг в, в3 В, в2 в, Bt в2 В3 V 1,3 2,4 3,5 1,3 4,6 7,9 1,3 6,8 2,4 п 2 2 2 2 2 2 2 2 2 N= 18 SV 4 6 8 4 10 16 4 14 6 SV = 72 Mi 2 3 4 2 5 8 2 7 3' A4S= 4 МА 4 + 6+8 6 = 3 4 + 10+16 6 = 5 4 + 14 + ,6 6 ==4 d=Mi—MA —lz 0 + 1 —3 0 +3 —2 ¥з — 1 Внимательный просмотр табл. 62 показывает, что дисперсия по со- . четаниям градаций дает меру разнообразия эффектов второго признака (его градаций) при разных градациях первого признака. Эффекты второго фактора (d — Mi—МА) для первой градации пер- вого фактора равны —1, 0, +1, для второй градации первого фактора —3, 0, +3 и для третьей градации первого фактора —2Л +3, —I; Эти эффекты явно различны, степень их разнообразия и измеряется диспер- сией по сочетаниям градаций. 180
Таким образом, дисперсия по сочетанию градаций Сав есть одна из факториальных дисперсий, измеряющая определенную частную зако- номерность в совместном действии организованных факторов. Так как непосредственный расчет дисперсии по сочетанию градаций, независящий от расчета дисперсий по каждому из факторов, очень сло- жен, то на практике эту дисперсию рассчитывают по разности, вычитая из общей дисперсии по организованным факторам (Сж) дисперсию по первому фактору (С а) и дисперсию по второму фактору (Св): Сав = СХ-СА-СВ Этот практический прием, облегчающий определение Сав по основ- ным формулам, и был, вероятно, причиной возникновения ложного мне- ния о том, что дисперсия по сочетанию градаций («взаимодействие») есть остаточная математическая величина, не имеющая биологического значения, пригодная для подмены дисперсии случайного разнообразия. Рассмотрев ряд средних в приводимой выше- схеме двухфакторного комплекса (см. табл. 61), можно обнаружить, что эффекты второго фак- тора меняются по его градациям одинаково как для первой, так и для второй градации первого фактора: +6, +6. Одного этого обстоятельства достаточно, чтобы признать отсутствие разнообразия по сочетаниям градаций в этом комплексе. Это подтверждается и расчетом САв по рабочей формуле: САВ = 80 — 8 — 72 = 0. В данном комплексе действие второго фактора совершенно-не зави- сит от того, при какой градации первого фактора действуют градации второго фактора. 4. Суммарная факториальная дисперсия, или дисперсия по суммар- ному действию обоих факторов, или общая дисперсия по организован- ным факторам, равна сумме взвешенных квадратов центральных откло- нений частных средних по всем сочетаниям градаций от общей -средней по комплексу. Это — дисперсия частных средних по всем градациям комплекса около общей средней: C^ = Sn(M —Л42)2| = 2 (4 — 6)2 + 2 (10 — 6)2 + 2 (2 — 6)2 + + 2(8 —6)2 = 80 (табл. 61). 5. Случайная дисперсия, или внутригрупповая дисперсия по неорга- низованным факторам, равна сумме квадратов центральных отклонений дат от частных средних в каждом сочетании градаций. Этодисперсия дат около частных средних: Сг = Ц(У—Лфр| = (3 — 4)2+(5 — 4)2 + (9—10)2+(11 — 10)2 + (1 — 2)2+ + (3 — 2)2 + (7 — 8)2 + (9 — 8)2 = 8. 6. Общая дисперсия равна сумме центральных отклонений дат от общей средней по комплексу. Это — дисперсия дат около общей сред- ней:- CU = ^(V — M^ = (3 — 6)2 + (5 — 6)2 + (9 — 6)2 + (11 — 6)2 + + (1 — 6)2 + (3 — 6)2 + (7 — 6)2 + 8 (9 — 6)2 = 88. 181
Разложение.ди с п'ерсий При дисперсионном анализе всегда производится разложение обще- го влияния всех факторов (организованных и неорганизованных) на компоненты, соответствующие частным влияниям, действовавшим в изу- ченном комплексе. Такое разложение составляет основу дисперсионного анализа и ока- зывается возможным, потому что дисперсии комплекса, отражающие силу влияний, обладают одним основным и постоянным групповым свойством аддитивности. В ортогональных (равномерных и пропорциональных) дисперсион- ных комплексах все дисперсии находятся в определенной связи. Всегда сумма частных дисперсий, рассчитанных независимо, равна общей дис- персии. В однофакторных комплексах сумма факториальной дисперсии и случайной в точности равна общей дисперсии: Су = Сх + Сг| = 112 + 48= 160 (табл. 60). В двухфакторных комплексах сумма общей факториальной и слу- чайной дисперсий равна общей дисперсии: = 80 + 8 = 88 (табл. 61), а сумма трех частных дисперсий — по первому, по второму факторам и по сочетанию их градаций (рассчитанная непосредственно, независимо от первых двух дисперсий) всегда равна общей факториальной диспер- сии: cy = cx + cz Сх = Са-\- Св + С ав = 8 +72 + 0 =80 (табл. 61). Аддитивность частных дисперсий в ортогональных комплексах поз- воляет не вычислять непосредственно дисперсию сочетания градаций, а определять ее по разности: . Са'в — Сх—~ Са — Св . По этой же причине можно одну из трех общих дисперсий вычис- лять не самостоятельно, а по двум другим: С,= Сй-Сг> сг = су-сх, Су=Сх + Сг. - Аддитивность частных дисперсий положена в основу определения основных показателей силы влияния. , Варианса Варианса — это дисперсия, приходящаяся на один элемент свобод- ного разнообразия, т. е. дисперсия, деленная на число степеней сво- боды: • 182
Это — для-выборочных комплексов. Иногда требуется рассчитать ^генеральные вариансы. В таких случаях дисперсии делятся на полное "'Число элементов изучения. Расчет выборочных варианс показан в табл. 63. Таблица 63 Расчет выборочных варианс (для схем, показанных в табл. 60, 61) N — объем комплекса, г.— число градаций Влияния Дисперсии С . Число степеней свободы v Вариансы а2 В однофакторном комплексе ч 9 112 'Факториальное Сд: = 112 Г—1=3—1=2 а2 = -—= 56 х 2 “Случайное Сг= 48 IV —f = 6—3 = 3 2 48 а2г- -16 О 'Общее \ Су = 160 N — 1 = 6 — 1 = 5 2 160 „ • -32 а О В двухфакторных комплексах -Первого фактора Сл= 8 гА — 1 =2 — 1 = 1 Q II -|оо II 00 9 72 Второго фактора Cs = 72 гв — 1 = 2 — 1 = 1 ав — 1 ~ “Сочетания их градаций САВ — 0 Vb = 1 • 1 = 1 2 0 -Факториальное ' Сх=80 rArB — 1 = 2 -2 — 1 = 3 9 80 =—- = 26,7 х 3 Случайное С2= 8 УУ — гув = 8 —2-2 = 4 98 о2 = -=2 •Общее Су = 88 tf—1=8—1=7 Универсальное использование дисперсий Все конечные результаты дисперсионного анализа можно получить «без вычисления варианс, на основе только дисперсий. Это обстоятель- ство и определяет название метода: дисперсионный анализ. Вариансы все же приходится рассчитывать, принймая во внимание установившиеся традиции и привычную технику определения достовер- 'ности влияний. Если в этом нет необходимости, то по одним дисперсиям (без рас- чета варианс) можно определить: 1) показатели силы влияний; 2) ошибку репрезентативности пока- зателя силы влияний; 3) доверительные границы генерального парамет- ,ра силы влияния (приближенно); 4) показатель достоверности влияния; -5) ошибку репрезентативности частных средних по градациям диспер- сионного комплекса. Показатели силы влияний Определение силы влияний по их результатам требуется в биологии, •сельском хозяйстве, медицине для выбора наиболее эффективных средств воздействия, для дозировки физических и химических агентов — 183
стимуляторов, замедлителей, возбудителей, лекарственных препаратов, пищевых средств. Предложено несколько способов измерения силы влияний: основ- ной способ и ряд дополнительных для уточнения основного. Основной показатель Измерение силы статистического влияния может быть произведено- при помощи квадрата корреляционного отношения, предложенного К. ^Пирсоном, — показателя, который может измерять силу влияния одного признака на другой при любой форме корреляционной связи. Такое использование корреляционного отношения стало возможным потому, что в основу этого показателя К- Пирсон положил отношение величин, которые в настоящее время определяются как дисперсии — факториальная (межгрупповая) и общая, т. е. как основные элементы дисперсионного анализа. При дисперсионном анализе ортогональных комплексов использу- ются аддитивные свойства частных дисперсий (сумм квадратов цент- ральных отклонений): - Сх + = Са + С в -|- Сав + Сг = Су. На этом свойстве аддитивности частных дисперсий основан описан- ный выше закон разложения общих диспепсий в ортогональных комп- лексах. . Если взять отношения частных дисперсий к общей: + = А = ^. + А. + Аь + _^=,Л = 1, Су Су Су ’ Су Су Су Су tCy . то каждое из этих отношений будет показывать долю участия отдель- ной частной дисперсии в образовании общей дисперсии. А так как каждая частная дисперсия соответствует одному из част- ных влияний, то отношение частной дисперсии к общей измеряет долю данного влияния в общем суммарном статистическом влиянии всех фак- торов, определяющих развитие данного результативного признака. Поэтому доля (или процент) каждой частной дисперсии в .общей их сумме может быть принята за показатель’силы влияния, того влия- ния, которое характеризуется данной частной дисперсией — или одной из факториальных, или случайной. Например, в однофакторном комплексе, чем большую долю в общей дисперсии занимает ее факториальная часть (Сх/Су), тем большая часть общего разнообразия обусловлена разнообразием градаций фактора, а это и означает, что фактор действует с большей силой, оставляя на долю случайных влияний меньшую' часть общего разнообразия признака. Таким образом, сила влияния фактора (факторов) в дисперсион- ном анализе измеряется отношением дисперсий (частных к общей): Ч = Ct/Cy • Так как этот показатель отражает основной закон разложения об- щих дисперсий и основное аддитивное свойство частных дисперсий, а также составлен из основных элементов дисперсионного анализа, то- отношение одной из факториальных дисперсий (СХСАСВСАВ\ или слу- чайной дисперсии (Cz) к общей (Су) можно назвать основным пока- 184
зателем силы влияний факторов — организованных и неорганизован- ных. Квадратный корень из основного показателя силы влияния в одно- фактордых комплексах д = ]А12 есть пирсоновское корреляционное отношение, символ которого т] перешел и на современный показатель силы влияния. В однофакторном комплексе определяются два показателя силы влияния: организованного фактора = Сх/Су = -^- = °-70 (табл- 6о) й неорганизованных факторов Y]z = CzlCy — ~ = 0,30 (табл. 60). 160 Сумма этих показателей равна единице: = 1(0,70 + 0,30= 1,00). Техника расчета и интерпретация показателей силы влияния в одно- факторных комплексах при изучении количественных признаков пока- зана в примере 24 и алгоритмах 19, 20, 2L . В двухфакторном комплексе определяются пять видов влияний. 1. Влияние первого фактора дл = СА1Су = 8/88 = 0,091 (табл. 61). 2. Влияние второго фактора т]в = Св/Су = 72/88 = 0,818. 3. Влияние сочетаний градаций обоих факторов 'Пив = САв1Су = 0/88 =^0,000. ' 4. Суммарное действие обоих факторов rj2 = Сх)Су = 80/88 = 0,909. 5. Действие случайных факторов Сг1Су = 8/88 = 0,091. \ Интерпретация показателей 4-го и 5-го влияний в двухфакторном дисперсионном комплексе проводится так же, как и в однофакторном: комплексе: чем больше г]х (а значит, чем меньше т]г), тем сильнее проявилось суммарное действие обоих организованных факторов. Интерпретацию первых трех влияний в двухфакторном комплексе лучше начинать с показателя влияния сочетаний градаций. Этот показатель т]лв всегда настолько больше нуля, насколько- сильно действие одного фактора зависит от действия (градаций). дру- гого. Наименьшее значение этого показателя цав =0 получается, когда один фактор действует совершенно одинаково при любых градациях второго. Такие случаи показаны в табл. 61 и в алгоритмах 21,28. 185>-
Наибольшее значение этого показателя равно показателю суммар- лого влияния организованных факторов: гцв = йх- 1зк может получить- ся, когда действие одного фактора при одной градации второго фактора строго противоположно его действию при других' градациях второго фактора. В алгоритме 23 показан подобный случай; влияние сочетания градаций (т]лв =0,800) составляет 98% от суммарного влияния обоих организованных факторов (щ =0,815). В таких крайних случаях получаются очень малые показатели част- ных влияний первого фактора (тщ) или второго (цв), или того и дру- гого— они приближаются к нулю, но это не связано со слабым дей- ствием каждого фактора в отдельности. При г]а ->0, т]в->0, г]ав действие одного фдктОра настолько •сильно зависит' от действия другого, что становится невозможным изу- чать и использовать влияние первого фактора без учета влияния вто- рого. Примеры различного влияния сочетаний градаций в двухфактор- ных комплексах показаны в алгоритмах 23, 24, 25, 26, 27, 28. Показатели силы влияния каждого фактора в двухфакторном ком- плексе т]д, гщ имеют особое значение, зависящее от силы сочетания „ 2 их градации -фщ. Если показатель сочетания градаций не. велик (лав^О), то пока- затели частных влияний факторов (гц, Цв) имеют обычное значение: чем они больше, тем сильнее влияние фактора. Надо только помнить, что сила каждого фактора в отдельности из- меряется в дисперсионном комплексе при усредненном действии града- ций другого фактора, что равносильно известному требованию изучать варианты воздействий «при прочих равных условиях». В тех же случаях, когда возрастает влияние сочетания градаций •обоих факторов (цмв-^Лх), уже нельзя по показателям (тщ, Лв) су- дить в полной мере о силе соответствующих влияний. Как указывалось, в таких случаях возможны очень малые показатели силы статистиче- ского влияния каждого фактора в отдельности при очень заметном их физиологическом влиянии на результативный . признак (алгоритмы 23,25). . В таких случаях сильное действие одного фактора имеет противо- положное направление в разных градациях другого фактора. При усред- нении таких противоположных действий получается в большей или меньшей степени нивелировка измерений силы влияния, что и приводит к уменьшению показателей силы частного влияния каждого фактора в отдельности. , Ошибка репрезентативности основного показателя силы влияния Точная формула ошибки основного показателя силы влияния еще не найдена/ В качестве первого, практически достаточного, приближения эту ошибку можно рассчитывать по формулам, приведенным в алгоритмах 19, 20, 21, 22, 23, 24. Все эти формулы легко выводятся, если фишеровский критерий F = ol/csl приравнять отношению основного показателя т)? =С{1СУ к его ошибке m i. Hi 186
В однофакторных комплексах, когда ошибка репрезентативности определяется только для одного показателя факториального влияния, удобнее пользоваться таким вариантом общей формулы: . ^2 = (1-^) 'х Г— 1 N — r == (1 — 0,605) = 0,105 (алгоритм 19). В двухфакторных комплексах, если рассчитаны вариансы, можно использовать формулу например, пг 2 = 0,8 3,33 = 0,031 (алгоритм 23), '86,4 а если вариансы не рассчитываются, то наиболее удобна общая фор- мула . т 2 = 1- — 0,031 (алгоритм 23); Г]2 6 т 2 = vi — 111 Vz т^2 = 3 • =. 0,0925 (алгоритм 23). В этом случае для двухфакторного комплекса находится постоян- ная величина r\llvz и умножением ее на число степеней свободы по каж- дому влиянию находятся ошибки показателя этих влияний для данного комплекса. В схеме двухфакторного комплекса (табл. 61) ошибка репрезента- тивности показателя влияния второго фактора равна 1 0,091 г, поотк т 2 = Vo-----= 1 --------== 0,02275, ' vz 4 а показатель достоверности О Ф = = = зб,о, 0,02275 =±= ' т. е. такой же величине, как и по критерию Фишера (табл. 61). Для однофакторного комплекса, в котором М = 9, г=3, г]у =0,67, ошибка основного показателя силы влияния равна . ’ т 2^(1-0,67)- — Г= 0,111. Лг ’ 9 — 3 Предлагаемая -ошибка репрезентативности основного показателя силы влияния имеет существенные отличия от обычных ошибок выбо- рочныхДтоказателей. Отношение основного показателя силы влияния к этбй его ошибке ' ф = vfym 2 •г равно не критерию Стьюдента (как обычно), а критерию Фишера при двух степенях свободы: п=г—1, vz = N—г. . 187
Для приведенного примера ф = 0,67/0,111 = 6,0, = 2 Fst = {5,1 — 10,9 — 27,0}. Использование предлагаемой ошибки для определения достоверно- сти влияния дает точно такие же-результаты, как и критерий Фишера. Преимущество предлагаемой ошибки заключается в том, что по ней можно определить хотя бы приближенно доверительные границы основ- ного показателя силы влияния, чего нельзя сделать при помощи крите- рия Фишера. Эти Доверительные границы определяются по обычной формуле, в которой вместо критерия Стьюдента (/) введен критерий Фишера (F): 2 '"'"'2 । Пх = Пх ± />.2 Для приведенного примера (ц{. = 0,67; т ч =0,111; Fst = 5,l) дбвери- 'Лх тельные границы определятся следующим образом: А = 5,1 • 0,111 = 0/57, —2 |не более 0,67 -4- 0,57 = 1,24;1 Г)х •= I . } 1не менее 0,67 — 0,57 = 0,10.] ♦ ' Однащз доверительных границ (1,24) вышла за допустимый мак- симальный предел. При определении доверительных границ-такие случаи возможны (только для доверительных границ!). При нарушении максимально до- пустимого предела верхняя, максимальная, граница приравнивается 1,0, при выходе за минимальный предел нижняя, минимальная, граница приравнивается нулю. ’Следовательно, в разбираемом -примере доверительные границы ге- нерального параметра равны: ' = 0,10-т- 1,00. Такой прогноз означает, что в генеральных совокупностях, соответ- ствующих градациям изученного комплекса, «сила влияния исследован- ного фактора может составить не менее 10% от силы влияния всех во- обще факторов, определяющий величину изучаемого признака. . Предлагаемая формула ошибки основного показателя силы влия- ния обладает еще- одним важным свойством: критерий достоверности, ’полученный по этой ошибке, учитывает различие в достоверности пока-’ зателей для комплексов различной структуры, т. е. одинакового объема, но с разным числом градаций (г) и с разной повторностью (/г). Если, например, исследованы два комплекса одинакового объема /У=100 с одинаковым выборочным показателем силы влияния ц? = 0,6, но с раз- ной структурой Г1 = 2,.и1 = 50, г2 = 50, п2 = 2, то достоверность показателя первого .комплекса должна быть значительно выше по сравнению с до- стоверностью показателя второго комплекса. В первом комплексе показатель влияния получен при анализе -2 частных средних (гц = 2), из которых каждая подкреплена .50 датами (М1 = 50) и поэтому в гораздо меньшей степени отражает случайности в формировании средних величин. Во втором комплексе, наоборот, показатель влияния получен при 188
анализе 50 частных средних, из которых каждая -усредняет всего 2 даты и потому подвержена в гораздо большей степени случайностям в при- влечении дат в градации. Большое различие в достоверности показателя силы влияния в этих двух комплексах в достаточной степени отражено в ошибке репрезен- тативности: (I) m 2 = (1 — 0,6) - 2—- - = 0,4 х — = 0,004, (II) m2 = (l- 0,6) 50= 0,4 х — = 0,392, v v ' 100 —50 . 50 i в критерии достоверности: фх = 0,6/0,004 - 150,0, Fsf ={3,9 —6,8 — 11,5}, Ф2 = 0,6/0,392 =Ь5, Fs/= {1,6—2,0 —2,7} и в доверительных границах: Лх = 0,004 • 3,9 = 0,016, (I) ях = 0,58 =-0,62, ' Л2 = 0,392 • 1,6 = 0,627, (II) =—0,03 =-1,23. Следует отметить, что резкое различие комплексов по достоверно- сти их показателей совершенно не учитывается обычной ошибкой кор- реляционного отношения. Для обоих только что разобранных комплек- сов ошибка репрезентативности корреляционного отношения будет оди- наковой: , / 1 — г]2 , / 1 — о,62 ППС1 Wri = / ------L = 1/ ------!—=0,081. 4 г /V — 2 у 98 Предельные, значения показателей силы влияния Основной показатель силы влияния равен доле одного слагаемого от всей суммы слагаемых. Кроме того, этот показатель равен квадрату корреляционного отношения. По этим двум причинам показатель силы влияния всегда больше нуля, он не может быть отрицательным. Наи- меньшая его величина т|0, когда все частные средние по градациям комплекса оказались одинаковыми, равными общей средней. Наиболь- шая величина показателя Цх = 1,0, когда все даты внутри каждой града- ции одинаковы и равны своей частной средней. Только в единственном случае основной показатель силы влияния может получаться меньше нуля и больше единицы: при определении доверительных границ генерального параметра на основе малочислен- ногр выборочного комплекса, при большом разнообразии значений изу- чаемого признака. Во всех остальных случаях (когда не определяются доверительные границы) получение показателя силы влияния отрицательного или боль- ше единицы всегда указывает -или на ошибку счета, или на порочный метод определения силы влияния. 189
Дополнительные способы Основной показатель силы влияния (квадрат корреляционного от- ношения, или отношение сумм квадратов в дисперсионном комплексе), имеет два недостатка. Во-первых, этот показатель, как и всякая выборочная величина,, подвержен неизбежным ошибкам репрезентативности и, во-вторых, ве- личина этого показателя зависит от структуры комплекса (N, г, п), что было подмечено еще К. Пирсоном. Использование описанной выше приближенной ошибки репрезен- тативности основного показателя в значительной степени снижает оба эти недостатка, так как позволяет учесть и возможную величину погреш- ности в оценке генерального параметра, и влияние структуры комп- лекса. Делались попытки исправить недостатки основного показателя дру- гими приемами, без использования ошибки репрезентативности. Эти до-' полнительные способы рекомендуются в некоторых работах советских биологов'. , Первый дополнительный способ (Снедекора) оценивает силу влия- ний отношением двух исправленных выборочных варианс (факториаль-. ной к общей): 9 9 '‘2/п Д2Щ2 -2 Sr — Sz. Д2 -2 , 2 (I) — S х/ Sy, Sх — —— , Sy —, Sx Sz. , Второй дополнительный способ (Лукомского) оценивает силу влия- ний дополнением до единицы отношения двух неисправленных выбороч- ных варианс (случайной к общей): Пх(П) = I-sl/st В этих формулах sx, s1 2, Sy .-г-выборочные неисправленные вариан- сы — факториальная, случайная и общая; sx, Sy—исправленные выбо- рочные вариансы— факториальная и общая.. Пример 79. Для проверки стандартности выведенной линии норок по диаметру волосяных луковиц были взяты методом биопсии по 2 про- бы у 50 представителей линии. Получены следующие элементы одно- факторного дисперсионного комплекса: N = ЮО, г = 50, п = 2, Сх = 60, Сг = 140, Су = 200; S2 == 60/49 = 1,23, §2 = 140/50 = 2,80, s2y = 200/99 = 2,02; Sx = 1,23-2,80.^ _Q,79, -2 = _0)79 + 2j80= 2,01. Основной показатель силы влияния: г]х =60/200 = 0,30. Первый до- полнительный показатель: х\х (I) =—0,79/2,01 =—0,39. Второй дополни- тельный показатель: тщ (II) = 1—2,80/2,02 = —0,39. Достоверность выбо- рочного показателя (отношение большей вариансы к меньшей): F2 = 2,80/l,32= 2,3; vi==-V—,r = yl5n0; Fst = {1,6 — 1,9 — 2,6}. 2 ’ ' = v2 = г—1 =49; st ‘ ' 1 Дополнительные способы оценки силы влияний рекомендуются нашими специа- листами В. Ю. Урбахом и Э. X. Гинзбургом. Прим. Ред. 190
Проверка показала достоверно малое различие зверей по изучае-. мому признаку, линия оказалась достаточно выравненной, установив^ шейся. Появление нестандартных особей в этой линии маловероятно, что показывает первый обычный критерий: Fy = 1,23/2,80 = 0,4. Оба дополнительных способа показали отрицательные квадраты, а ’следовательно, и отрицательные доли факториального влияния (при-.- надлежности к линии) в общем влиянии: т|?=—;0,39. Нередко получаемые при использовании дополнительных способов отрицательные квадраты (хотя квадрат любой величины не может быть отрицательным) или отрицательные доли влияния (хотя доля не может быть меньше нуля), невозможно понять и использовать ни в теоретиче- ских, ни в производственных работах. • Некоторые исследователи, стремясь избавиться от отрицательных показателей силы влияния и не решаясь в то же время отказаться от дополнительных способов оценки силы влияния, предлагают различные способы избавления. Предлагается все отрицательные показатели приравнивать нулю или вообще не рассчитывать показатели силы влияния в тех случаях, когда могут получиться отрицательные значения, в частности, когдц влияние недостоверно по прямому критерию или по малой величине факториальной вариансы, не превышающей случайную вариансу. Неко- торые исследователи просто исключают из работы все комплексы, в ко- торых дополнительные способы дают отрицательные показатели. Все эти попытки не имеют теоретического обоснования и, кроме то- го, не исправляют основного принципиального недостатка дополнитель- ных способов. - Неисправимый порок дополнительных способов заключается в том, что они основываются на перенесении соотношений генеральных пара- метров, определяющих величину математических ожиданий факториаль- ного среднего квадрата, на единичные выборочные комплексы. Полут. чающаяся при этом оценка единичного''комплекса по средним показа- телям для многих разных комплексов всегда в той или иной степени ошибочна: Некоторые из этих ошибок неизбежно получаются отрица-. тельными. Эти ошибки оценки единичного по среднему в биологической прак- тике дисперсионного анализа оказались настолько большими, что пре- небрегать ими невозможно. Это обстоятельство не позволяет' пользоваться описанными допол- нительными способами оценки силы влияния при изучении биологиче- ских объектов. Распределения выборочных значений показателя силы влияния, определенного основным способом, а также способами Лукомского и Снедекора, показаны на рис. 21. ' Достоверность влияний Основной показатель силы влияния, полученный в выборочном ис- следовании, характеризует прежде всего ту степень влияния, которая реально, в действительности, проявилась в группе исследованных объ- ектов, и как первичный факт подлежит непосредственному изучению и включению в общую цепь наблюдений, сопоставлений и вскрытия при- чин. В то же время материалы выборочного комплекса, в- котором опре- делен основной показатель силы влияния, могут быть использованы 191
также и для оценки соответствующего генерального параметра, т. е. степени .влияния, свойственной общему комплексу генеральных сово- купностей, соответствующих градациям выборочного комплекса. Оценка генерального параметра не может быть произведена путем простого приравнивания его к тому показателю силы влияния, который выявлен в выборочном комплексе. Прогноз генеральных параметров- силы влияний по выборочным показателям всегда может быть сделан с большей или меньшей погрешностью, неизбежной при анализе любого выборочного комплекса. , ' Рис. 21. Распределение выборочных показателей силы влияния: основного (О, жирная кривая), Лукомского (Л, тонкая кривая), Снедекора (G, пунктир- ная кривая), для пяти моделей (I, II, III, IV, V). Вертикальные прямые соответствуют: жирная — генеральному параметру, тон- кие— математическим ожиданиям для трех способов (О, Л, С); вертикальный пунктир отделяет отрицательные значения выборочных показателей Получившееся в комплексе разнообразие частных средних никогда точно не соответствует разнообразию генеральных средних вследствие обычных ошибок репрезентативности при случайном наборе объектов и дат в градации. ' Эта неточность в крайних случаях может привести к большому раз- нообразию выборочных частных средних при очень незначительных-- различиях или даже полном равенстве соответствующих генеральных средних по градациям комплекса. В подобных случаях выборочный по- казатель силы влияния дает преувеличенную характеристику силы влия- ния в генеральном комплексе. Возможна и другая крайняя погрешность, когда случайности набора объектов и дат в градации выборочного комплекса приведут к очень малому разнообразию выборочных частных средних при большом раз- нообразии соответствующих генеральных средних. В подобных случаях выборочный показатель силы влияний даст преуменьшенный прогноз генерального параметра силы влияния. Погрешности в оценке генерального параметра по выборочному показателю свойственны всякому выборочному исследованию, в том 192
числе и любому выборочному дисперсионному анализу. Поэтому, ,как и во всяком выборочном исследовании, при дисперсионном анализе си- лы влияний определяются показатели, помогающие выяснить возмож- ную величину ошибок прогноза генеральных параметров по выборочным' показателям. Учет ошибок репрезентативности в дисперсионном анализе произ- водится в форме критерия достоверности выборочного показателя и до-' верительных границ генерального параметра силы влияния. Вчоснове учета этих ошибок репрезентативности лежат следующие закономер- ности. - ' .. Отличие разнообразия выборочных средних от разнообразия соот- ветствующих генеральных средних не может быть безграничным. На- пример, при равенстве генеральных средних разнообразие соответству- ющих выборочных средних не может быть больше определенной вели- чины, которую можно установить при проведении анализа выборочных дисперсионных комплексов. При полном равенстве генеральных частных средних разнообразие выборочных частных' средних не может быть больше особого показа- теля— Критерия Фишера при заданной вероятности безошибочных про- гнозов. - Если разнообразие частных средних в выборочном комплексе не достигает критерия Фишера, значит это выборочное разнообразие могло1 получиться в порядке случайных отклонений от нулевого разнообрази^ соответствующих генеральных средних. В таких случаях выборочный показатель силы влияний недостоверен, а прогноз генерального пара- метра неопределенен, так как не отвергает и не подтверждает влияния фактора в генеральном' комплексе, при массовом применении фактора. В этих случаях, при недостоверности показателя силы влияния, эмпирический показатель, полностью . применим при характеристике влияния только в пределах изученного комплекса и не может быть ис- пользован для установления наличия или отсутствия влияния в гене- ральном комплексе. Если разнообразие частных средних в выборочном комплексе равно или превышает критерий Фишера, значит это выборочное разнообразие уже не могло получиться только вследствйе случайных* отклонений от разнообразия соответствующих генеральных средних. По этой причине разнообразие частных средних перешло допустимый порог, определяе- мый критерием Фишера, что и указало на достоверность изучаемого влияния. При достоверном влиянии эмпирический показатель силы влияния применим уже не только в пределах выборочного комплекса. В таких случаях по выборочному показателю мокно заключить вполне опреде- ленно о наличии изучаемого влияния в генеральном комплексе (при массовом применении фактора) и определить возможную генеральную силу этого фактора в форме доверительных границ,-причем нижняя гра- ница не будет отрицательной. / Достоверность влияния может иметь разную степень. Чем больше разнообразие действия градаций фактора, тем больше факториальное разнообразие отличается от случайного. Поэтому 'за меру достоверно- . сти влияния принят результат сопоставления степени двух разнообра- • зий — факториального и случайного. Следует твердо усвоить, что за базу оценки величины факториаль- ных разнообразий (по фактору, по йервому и второму факторам, по со- четанию их градаций, по суммарному действию факторов) можно брать А 13 Н. А. Плохинокий . , . , 193
только внутригрупповое случайное разнообразие. Это подчеркивал и Фишер в своей известной книге «Статистические методы для исследо- вателей»: «Следовательно, все варианты опыта должны быть по мень- шей мере дублированы для того, чтобы расхождения повторных, результатов могли бы быть в качестве своего рода стандарта, с которым можно было бы сравнить наблюдаемые различия между ва- риантами». Здесь под вариантами опыта следует понимать градации фактора. Если в градациях нет внутригруппового разнообразия, что может быть, когда в каждую градацию привлечено только по одной дате (бес- повторный двухфакторный комплекс), то никакими другими способами нельзя получить основы для оценки достоверности влияний, а следова- тельно, невозможно определить и достоверность факториальных влия- ний. Замечание это необходимо потому, что некоторые авторы предла- гают определять достоверность влияний в бесповторных комплексах,, подменяя отсутствующую случайную вариансу вариансой по сочетаниям градаций. Этот прием грубо нарушает основные принципы дисперсион- ного анализа. Числовой показатель сравнения факториальных разнообразий со- случайным может иметь различную форму. Первоначально такой показатель, или критерий достоверности раз- личий средних квадратических отклонений, был предложен Фишером; как пойовина разности натуральных логарифмов сравниваемых сигм;; в первоначальной форме z = ^-(In сгх — In aj, и в преобразованном виде / л2"” , . z = log е |/ _L. Подкоренное выражение — отношение варианс — обозначено Снеде- кором, учеником Р. А. Фишера, символом F. Это отношение , F == о2/а2 = 0.2^2 или с2/а2 А Л ' £• с л используется в настоящее время в качестве критерия достоверности' различия факториального и случайного разнообразия. Стандартные значения фишеровского критерия F для двух степе- ней свободы Vi=vx, V2 = vz и для трех порогов вероятности безошибоч- ных прогнозов 01 = 0,95, 02=0,99 и 03 = О,999 приведены в табл. IX. При- менение этого критерия показано в алгоритмах 19, 20, 21, 22, 23, 24,-25,, 26, 27,28. ’ ' При использовании критерия Фишера /7 = сг?/сг| следует помнить,, что tri —большая из двух сравниваемых варианс, a ol—меньшая. Поэтому, если факториальная варианса оказалась меньше случай- ной, показателем достоверности будет f' = 02/ст2 = ^ — г или N — rArB V 2 Х [v2 = Г — 1 ИЛИ ГА 1, Г в — 1 и т. д„.) ’ 194
В большинстве случаев, если Ox/0z <|FS<, то и обратный показатель Oz/Пх тоже оказывается меньше требуемого в данном случае стандарт- ного значения критерия Фишера. Во всех алгоритмах, в которых прямое отношение варианс меньше требуемого (алгоритмы 23, 24, 25, 27, 28), обратное отношение тоже меньше стандартного. Например, в алгорит- ме 23: Рх==1,6, 02=3,33, У1 = 1, V2 = 6, F = Г,6/3,33 = 0,5, vi = 1, v2=6, Ко,95 = 6,0, ^'=3,33/1,6 = 24, vi = 6, v2=l, Fo,95 = 234,0. В ответственных работах следует, проверять достоверность всех влияний, которые по прямому критерию оказались недостоверными. Например, при испытании десяти сортов пшеницы в двукратной по- вторности влияние сортов (степень генотипического разнообразця срав- ниваемых сортов) оказалось небольшим (jV = 20, г=10, п = 2, Сж = 20, Сг= 180, Су=200): по основному способу t]x=0,10; / по Луко.мскому т]х=—0,71; по Снедекору -цх =—0,78. Достоверность влияния определена в данном случае правильно: по отношению большей вариансы crl = 18,0 к меньшей бх=2,22. Критерий достоверности F'= 18,0/2,22 = 8,1 превышает второй порог вероятности безошибочных прогнозов: vi = 10, V2 = 9, Ко,9э==б,3, что ука- зывает на вполне достоверное отличие фактического разнообразия сор- тов от случайного. Выявилось большое сходство сортов (Стх-^С*^), объ- . яснить которое случайностями в подборе объектов сортоиспытания невозможно. , . При проведении массовых анализов дисперсионных комплексов можно значительно сократить' счетную работу по серийному определе- нию достоверности влияний, если не рассчитывать варианс, представив критерий Фишера F в форме: ' ’ F = —— Vz F = V*1 Cz • Vx (v2 = vj Можно избежать также и расчета . отношений степеней свободы, производя соответствующие изменения стандартных значений фишеров- ского критерия F: - 9 = — > /— Г1 = Ч С2 I vz / |v2 = vj Это самый простой критерий: требуется разделить факториальную дисперсию (сумму квадратов), на случайную и полученное отношение > оценить по специальной, заранее составленной таблице, в которой стан- дартные значения критерия Фишера F помножены на отношение сте- пеней свободы: V2 Краткая сводка стандартных значений нового критерия 0st=Cx/C’2 для Pi = 0,95 приведена в табл. 64. При наличии такой таблицы значительно упрощаются серийные расчеты дисперсионного анализа, форма которых показана в табл. 65. 13* 195
Таблица 64 Сх Стандартные значения критерия 05/ =----- для [31 = О,95. , Сг • . Числостепеней свободы для факториального (Vj) и случайного (v2) разнообразия \V1 1 ’ 2 3 4 5 6 7 8 9 10 11 12 14 16 20 v2 X - 2 9,3 19,0 3 3,4 6,4 9,3 4 1,9 3,5 4,9 6,4 5 1,3 2,3 3,2 4,2 5,1 6 1,0 1,7 2,4 3,0 3,7 4,3 7 0,80 1,4 1,9 2,4 2,8 3,3 3,8. > 8 0,67 1,1 1,5 1,9. 2,3 2,7 3,1 3,4 , 9 0,57 0,95 1,3 1,6 1,9 2,2 2,6 2,9 3,2 . / 10 ' 0,50 0,82 1,1 1,4 1,7 2>0 2,2 2,5 2,7 3,0 И 0,44 0,72 0,98 1,2 1,5 1,7 1,9 2,1 2,4 2,6 2,8 12 0,39 0,65 0,87 1,1 1,3 1,5 1,7 1,9 2,1 2,3 2,5 2,7 14 0,33 0,54 0,72 0,89 1,1 1,2 1,4 1,5 1,7. 1,9 2,0 2,3 2,5 16 0,28 0,45 0,61 0,75 0,89 1,0 1,2 1,3 1,4 1,6 1,7 1,8 2,1 2,3 20 0,22 0,35 0,47 0,57 0,68 0,78 0,88 0,98 1,1 1,2 1,3 1,4 1,6 1,8 2,1 24 0,18 0,28 0,38 0,46 0,55 0,63 0,71 0,79 0,86 0,9,4 1,0 1,1 1,2 1,4 1,7 30 0,14 0,22 0,29 0,37 0,42 0,48 0,55 0,61 0,66 0,72 0,78 0,84 0,95 1,1 1,3 ~ 40 0,10 0,16 0,21 0,26 0,31 0,35 0,39 0,43 0,48 0,52 0,56 0,60 0,68 0,76 0,92 50 0,08 0,13 0,17 0,21 0,24 0,28 0,31 0,34 0,37 0,40 0,44 0,49 0,53 0,59 0,71 60 0,07 0,10 0,14 0,17 0,20 0,23 0,25. 0,28 0,31 0,33 0,36 0,38 0,43 0,45 0,58 80 0/05 0,08 0,10 0,12 0,15 0,17 0,19 0,21 0,23 0,24 0,26 0,28 0,32 0,35 0,44 100 0,04 От 06 0,08 0,10 0,12 0,13 0,15 0,16 0,18 0,19 0,21 0,22 0,25 0,28 0,33 Таблица 65 Форма серийных расчетов показателей силы и достоверности влияний ' N Г сх Сг СУ • сх 9=Х V1 V2 . 0,rf =0,95 100 '20 30 60 90 0,33 0,50* 19 80 0,43 20 5 40 40 80 0,50 1,0 4 15 0,75 .• 90 15 100 900 1000 0,10 ощ 14 75 0,32 100 20 8 72 88 0,10 0J1 19 . 80 0,43 тех случаях, когда В рассчитана ошибка выборочного показателя Ч* н гл г-1 2 °* т 2 = 4/--= (1 — ir)------г = п?---, ' Ъ . VZ V х! N — г 1 а2 расчет показателя достоверности влияния производится простым деле- нием показателя на его супибку: ^=— >^SJV1= ; . /4= vj Этот способ показан в алгоритмах 19, 20, 21, 22, 23, 24. Таким образом» в зависимости от условий проведения дисперсион- ного анализа можно применять следующие- критерии достоверности 196
влияний (формулы для однофакторных комплексов и для прямого кри- терия). /. Общий способ: 4 F = — С, N —г . „ —> значений 9st: При наличии таблицы стандартных >9S<; 6sf rst- Уг . Если предварительно рассчитана ошибка репрезентативности пока- зателя силы влияния: Ф =------> Fst\ т 2 = • — "V * Vz Сопоставление эмпирического критерия с его стандартными значе- ниями может дать два принципиально различных результата. 1~. Влияние недостоверно. Эмпирический критерий не достигает своего стандартного значения, взятого в соответствии с установленным порогом вероятности безошибочных прогнозов. В таких случаях при требуемой вероятности невозможно' сделать ' заключения как о равенстве, так и о различии соответствующих гене- ральных средних, так как малое разнообразие выборочных частных средних может получиться при любом (большом или малом, или нуле- ' вом)’разнообразии генеральных „средних по градациям комплекса. А это значит, что в таких случаях нельзя дать определенного прогноза о ге- неральном влиянии фактора: остается невыясненным, можно или нельзя ожидать'с установленной вероятностью, что при массовом применении’ '• фактора получаются результаты, сходные с теми, которые получены в выборочном комплексе, конечно, при. изученных градациях фактора ' и при данных условиях. 1 , ' , Следует остерегаться двух ошибочных мнений о недостоверном по- казателе силы влияния. Нельзя считать, что получение недостоверного показателя силы влияния указывает на то, что «влияния вообще нет», что влияние отсутствует в генеральных совокупностях. Получение недостоверного показателя ни подтверждает, ни отри- цает генеральное влияние. г . Нельзя также считать, что при получении недостоверного показа- теля силы влияния в проведенном исследовании вообще, ничего не, полу- чено и это исследование проведено без всякой пользы. Это — большая ошибка. Та мера влияния, которая при этом получена, целиком отно- сится к группе изученных объектов и как экспериментальный факт дол- жна быть учтена и в данном, и в других, и. в дальнейших работах. , В некоторых случаях изучение силы влияния проводится только для определенной ограниченной группы объектов, из которых й составляет- ся дисперсионный комплекс^ В таких случаях не ставится задача опре- делить силу генерального влияния, и эмпирический показатель силы влияния приобретает полное значение без определения его достовер- ности. , ; В некоторых исследованиях именно недостоверность показателя силы влияния, определенная по прямому отношению варианс, дает от- вет на основной вопрос этого исследования. Так бывает в тех случаях, 197
когда недостоверность по прямому отношению варианс не опровергает сходства исследуемых особей по их личным'' качествам или наследствен- ным- способностям как представителей одной линии, сорта, породы и т. д. Определенность прогнозов приобретает силу достоверности, если при недостоверности по прямому отношению варианс малое влияние (а значит, большое сходство градаций) оказывается достоверным по обратному отношению F/ = Oz/Ox, что и было получено в вышеприведен- ном примере испытания десяти сортов пшеницы. 2. Влияние достоверно. Эмпирический критерий равен или превы- шает свое стандартное значение с требуемой вероятностью. В таких случаях возможен определенный прогноз: генеральные средние по градациям комплекса неодинаковы и их разнообразие по- добно тому, которое наблюдалось в выборочном комплексе. Разнообра- зие частных средних в выборочном комплексе теперь уже не может быть объяснено только случайностями выборочного исследования. Достоверное влияние означает, что изученный фактор при его мас- совом применении в определенных градациях и в данных условиях будет оказывать влияние на результативный признак с вероятностью, найден- ной при оценке достоверности его силы влияния. ' ДИСПЕРСИОННЫЙ АНАЛИЗ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ Техника анализа ортогональных однофакторных и двухфакторных комплексов для количественных признаков показана в главе о диспер- сионном анализе и в алгоритмах 19, 20, 21, 23, 24. Во второй части книги описываются другие методы дисперсионного анализа. ДИСПЕРСИОННЫЙ АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ Характеристика группы по качественному признаку выражается в указании количества особей в этой группе, .имеющих данный признак (пол, окраска, заболевание, наличйе реакции на воздействие, достиже- ние определенного порога в развитии и т. д.). Если в группе из п осо- бей у т особей имеется данный качественный признак, то доля этого m признака в группе Р=~ имеет то же значение, что и средняя арифме- тическая для количественных признаков. Поэтому при дисперсионном анализе качественных признаков за общие и частные средние прини- маются доли признака в общих и частных группах. Дисперсия качественного- признака, как уже указывалось, равна C = npq, Yp&q=\—p. , ' Выразив-в этом выражении величины р и q через тип, можно получить другую формулу дисперсии: „ tn /, -m \ -m2 . С = п • —(-1—— ).= т-------. п \ nJ п Эта формула положена в основу дисперсионного анализа качест- венных признаков. Техника расчетов показана для однофакторных комплексов в алгоритме 22, для двухфакторных в алгоритме 25. Практическое применение дисперсионного анализа качественных признаков показано на следующих трех примерах. 198
Пример 80. Предположим, что для борьбы с аскаридозом свиней <был испробован сантонин в пяти увеличивающихся дозах. Результата наблюдений можно организовать в форме однофакторного дисперсион- ного комплекса. Пятью градациями фактора будут различные дозы сантонина, а результативным'признаком — доля свиней, освобожденных от этой глистной инвазии. Расчет этого комплекса приведен в табл. 66. Таблица 66 Техника расчетов однофакторных дисперсионных комплексов , для качественных признаков (всего особей в группе п, из них освободилось от инвазии т особей) X 0 1 2 3 4 5 г = 6 п т > т2 я; =— п т 20 0 0 0,00 30 9 2,7 0,30 50 28 15,7 0,56 21 И 5,8 0,52 20 И 6,1 0,55 20 10 5,0 0,50 •о? сч со . 2$ й ’ К " II g 2 е S Й I н 1 X z У с 2m — 2Нг = 2т — И £ = = 5,7- = 33, 7 , = 39,4 ^ = Ci/Cy 0,15 0,85 ' 1,00 V г — 1 = 5 2n — г - 155 2n — 1 =160 rf — CtlVi 1,14 0,22 — 5,2 — — Результаты анализа показывают вполне достоверное действие сан- тонина: F=5,5, р>0,999. Из анализа (табл. 66) видно, что один сантонин не может дать ’ стопроцентную дегельминтизацию: часть свиней (примерно 50%) остается зараженной. Кроме того, анализ показывает, йто третья, чет- вертая и пятая дозы (все увеличивающиеся) уже ничего не прибавляют к результатам второй дрзы: доля выздоровевших остается практически той же. Предположим, что после этого было проверено действие сантонина совместно с каломелем. Действие сантонина исследовалось в двух гра- дациях: Xi—доза сантонина равща нулю, А2 — доза сантонина равна второй дозе в предыдущем исследовании. Действие каломели Исследо- валось в трех градациях: — доза каломели равна нулю, а В2 и В3— увеличивающиеся дозы? - Результаты наблюдений можно свести в двухфакторный комплекс, расчет которого показан в табл. 67. , Такой анализ показывает вполне достоверное действие как санто- нина, так и каломели. Совместное их введение повышает эффект дегельминтизации при- мерно до 70%, но все же стопроцентного выздоровления не наступает. 199
bO * • б л ( 67 ~~ ° Техника расчетов двухфакторных пропорциональных комплексов для качественных признаков Э 1 а А, Л2 гл =2 ГВ = 3 » 2« Sn (2m)2 ' H. (2/K)2 1 Zn pt Bl в2. в2 в2 в3 п ' tn 20 0 30 16 30 " . 15 20 10 .. 30' 22 30 " 21 Я = 2п=160 2m = 84 to н* 80 80 31 53 961 2809 12,0 35,1 0,39 0,66 , ' ГП? ' , ч ‘ . 0 256 225 100 / 484 441 842 //„ = ——==44,1 2 160 2ЯЛ=47,1 М S S tc * о .8,5 7,5 5,0 16,1 14,7 2Я/ = 51,8 to to t» w to w 40 60 60 10 38 36 100 1444 1296 2,5 24,1 21,6 - 2Я„ = 48.,2 z> ’ 0,25 0,63 0,69 т Р =— п . 0,00 w 0,53 QA 0,50 0,50 0,73 0,70 — . '-И м,,и 4*2 VI 11 , 1 _ оу ? у * Сг = Sm — 2Hi — 84 — 51,8 = 32,2 Cx = 2Hi — Я2 = 51,$ —44,1 = 7,7 л в AB X z У . Са = ХНа-Н^ = 47-, Св = ХНв~И2 = 48, САВ = Сх^-Са — Св = 7,7 1—44,1 = 3,0 2 — 44,1=4,1 — 3,0 —4,1=0,6 . с Г]2 3,0 0,08 4,1 0,10 0,6 0,01 7,7 0,19 32,2 0,81 39,9 1,00 V1 1 2 3 i ' V ''л-1 ' 1 3,00 14,3 rB~X 2 2,05 10,0 Ki о 1 || г- co=f\ II *• 1! rA ^B-1 .’5 1,54 7,3 N~rArB 154 0,21 / , IV—1 159 154 .. 11,3 6,8 3,9 7,3 4,7 3,1 4,4 3,1 2,3 a* Таблица 68 Техника расчетов трехфакторных пропорциональных комплексов для качественных признаков < >At Л2 rA = 2 rB = 2 rG = 2 - - . 2m (2m)2 (2m)2 Pt Bt B2 Bi ... 2м Cl c2 • Cl c2 Bi c2 Bl " c2 20 30 20 30 20 30 ' 20 30 ' ,/V = 2n = 200 Л1 100 33 1089 10,89 0,33 , 'm 0. 0 10 23 10 22 15 30 2m =110 Аг 100 77 2ЯЛ 5929 = 70,1 50,29 8 0,77 jri1 0 0 100 529 100.. 482 225 900 я2 = Л12_ = 6О 5 2 -200 . Bi 100 32 1024 10,24 0,32 m? 4 . 0 0 5,0 17,6 5,0 16,1 11,3 30,0 2Яг = 85,0 в2 юо ' 78 6084 60,84 0,78 n Di 0,00 0,430 0,50 0,77 0,50 0„73 0,75 1,00 — 2ЯД = 71,08 — Cl 80 35 1225 15,31 0,44 - Сг 120 1 75 5625 46,88 1 0,63 20 В Cj, = 2m —Я2= 110 —60,5 = 49,5 vy=N— 1 = 199 Сг = 2т-2Яг= 110-85,0 = 25,0 vz .= N '-гА гв гс = 192 • = —Н2 = 85—60,5= 24,5 ух = гА гв гс ^1 = 7 ' Сл = 2ЯЛ -Я2 = 70,18-60,5 =-9,7 . , ' , *л = гл-1 = 1 Св = 2ЯВ — Я2 = 71,08 — 60,5 = 10,6 vB = rB-l=l Сс = 2Яс—~Я2 = 62,19 — 60,5 = 1;7 z vc=rc-l = l CAB = 2ЯЛВ - CA - CB - Я, = 82,76 - 9,7 - 10,6 - 60,5 = 2,0 vAB='vAvB = 1 Слс = 2Ялс-Сл-Сс-Я-2 = 72,02 - 9,7-1,7 - 60,5 = 0,1 ^c = v^c = 1 СДР = 2Я„Г-СД-Св —Я2 = 73,02— 10,6 — 1,7-60,5 = 0,2 v =vBvc = 1 СЛДс = Cx — CA cB t— Cc CAB Сдс Свс = 24,5—9,7—10,6—1,7 —?,0 — 0,1—0,2 = 0,2 vABC = vAvBvc = 1 = 02,1 -> AiBi 50 0 0 . 0 0,00 Л1В2 .50 33 1089 21,78 0,66 Л2В1 50 32 1024 20,48 0,64 Л 2^2» 50 45 2025 40,50 0,90 shab = 82,76 ^1^*1 40 10 100 2,50 0,25 „ Л1С2 60 23 - 529 8,82 .. 0,38 Л 2С1 40 25 625 15,63 0,63 Л2С2 60 52 2704 45,07 0,87 ^нАС = 72,02 BiCi 40 10 100 ' 2,50 0,25 60 22 484 8,07 0,37 В2Сх 40 25 625 15,63 0,63 ’ В2С2 60 53 2809 46,82 0,88 ^вс = 73,02
В родолжениё табл. 68 Предположим, что решили испытать еще одно средство: суточную выдержку без корма перед дачей сантонина совме- стно с каломелей. Результаты такого опыта можно свести в трехфакторный дисперсионный комплекс со следующими факторами. А—действие сантонина: А[ — доза равна 0, А2— доза, установленная в пер- вом опыте; В — действие каломели:- В\— доза равна 0, В2 — доза, установленная во втором опыте; С — действие предварительной вы- держки без корма перед дачей сантони- на и каломеля: Ci — без выдержки, С2 — с выдержкой. Расчет такого трехфакторного ком- плекса показан в табл. 68. Оказалось, что каждый из трех фак- торов (сантонин, каломель и предвари- тельное голодание) оказывает дегель- минтизирующее действие при наличии той комбинации других факторов, какая была в''проводимых опытах. Последнее замечание особенно необ- ходимо помнить при анализе действия предварительного голодания (фактор С): само по себе голодание в течение 24 час не может излечить от аскаридоза. В изу- ченном же трехфакуорном комплексе действие каждого фактора, в. том числе и голодания, изучалось при усредненных значениях двух остальных факторов. Поэтому указанное действие голодания (т]2=3°/о, /7=13,1 рс>0,999) выявилось только при условии определенного , дей- ствия сантонина и каломели в тех ком- бинациях, которые были организованы в дисперсионном комплексе. Общие же результаты анализа по- казывают в высшей степени достоверное дегельминтизирующее действие изучен- ных трех факторов. Такие, общйе выводы находятся в полном соответствии с мето- дами борьбы с аскаридозом свиней, при- меняемыми, на практике. При этой инва- зии прописывается сантонин совместно с каломелей после 24-часового голодания.' НЕРАВНОМЕРНЫЕ КОМПЛЕКСЫ При практическом проведении иссле- дований методом дисперсионного аналй- 202
•за не всегда возможно организовать равномерный или пропорциональ- ный комплекс. Иногда в процессе проведения опыта одна или несколько особей выбывают из опыта вследствие болезни, гибели или по другим причинам; иногда бывает очень трудно или невозможно найти трёбуе- мое количество особей для какой-нибудь одной или двух градаций. В таких случаях приходится работать с неравномерным комплексом, что очёнь усложняет расчеты. Это усложнение появляется при анализе только двух- и многофак- торных комплексов, так как однофакторные комплексы ортогональны при любых (одинаковых и различных) объемах градаций. Для лучшего усвоения способов анализа неравномерных комплек- ‘Сов необходимо выяснить различия между этим видом комплексов и равномерными, или пропорциональными, комплексами. Различия между ортогональными и неортогональными комплексами в основном сводятся к следующему. 1. В ортогональных комплексах автоматически нарушены все ста- тистические связи между отдельными факторами. Происходит это вслед- ствие того, что для ^каждой градации одного фактора все градации другого фактора подбираются с равными или пропорциональными час- тотами. В неравномерных же комплексах частоты градаций одного ф-актрра в пределах градаций другого не равны и не пропорциональны. ‘Поэтому в неравномерных комплексах создаются случайные статистиче- ские сйязи между отдельными факторами, что нарушает ортогональ- ность и создает значительные трудности в вычислении и интерпретации таких комплексов. . ' 2. В ортогональных комплексах вследствие отсутствия связей между ‘отдельными факторами сумма частных дисперсий, рассчитанных неза- висимо от дисперсии суммарного действия, всегда равна этой суммарной .дисперсии: Са + Св + Сав:=Сж. Это обстоятельство значительно облег- чает всю работу с ортогональными комплексами. В частности, как уже указывалось, именно эта особенность, орто- гональных комплексов дает возможность вычислять дисперсию сочета- ний САВ значительно более легким способом, путем, вычитания из сум- марной дисперсии уже полученных частных дисперсий: Сав — Сх — СА — Св. В неравномерных комплексах такое упрощенное вычисление невоз- можно. В них сумма частных дисперсий СА + СВ + САВ, рассчитанных независимо, не равна дисперсии суммарного действия, организованных -факторов: С А + Св + с АВ Сх. 3. Указанное выше различие между ортогональными и неорто'го- нальными комплексами сказывается только в той части комплекса, кото- рая относится к частным факториальным дисперсиям СА, Св, САВ и к .дисперсии их суммарного действия Сх. В другой части комплекса, относящейся к дисперсии по организо- ванным .факторам Сх, случайной дисперсии Сг и общей дисперсии Су, различия между ортогональными и неортогональными комплексами нет. .Для обоих видов комплексов всегда справедливо равенство: Cx + Cz = Cy. Происходит это потому, что расчет основных показателей комплек- са. Сх, Cz и Су ведется всегда по принципу однофакторного комплекса, 203.
в котором действует один фактор х, представляющий объединенное дей- ствие всех организованных факторов. Однофакторные же .комплексы,, как уже указывалось, всегда ортогональны. . - В неравномерных комплексах получаются два различных значения суммарной факториальной дисперсии: одно из общей части комплекса (Сх + Сг<=Су) и другое для' факториальных дисперсий (СЖ=СА + СВ + + Сав) • Чтобы получить единую структуру комплекса, необходимо заменить- эти два разные значения одним значением для всех частей комплекса. Сделать это можно различными способами, поэтому предложено не- сколько систем расчета неравномерных дисперсионных комплексов. В большинстве случаев наиболее точные результаты дает система,- при которой анализ неравномерных комплексов меняет расчеты только» в нрортогональной части комплекса: Сх = С а + Св + Сав ± л, ’ а расчет ортогональной части СЖ + С2 = СУ остается таким'же, как и для’ равномерных или пропорциональных комплексов. В неортогональной части особыми способами рассчитываются дис- персии по первому фактору Са, по второму фактору Св, по их суммар- ному действию Сх и по сочетанию их градаций С'АВ = Сх—СА'—Св. В ортогональной, части рассчитываются три основные дисперсии1 Сх, Cz, Су обычным способом. , , - Затем дисперсия Сх ортогональной части разлагается на свои три компонента пропорционально дисперсиям СА', Св- и САВ, полученным в неортогональной части. Коэффициент пропорциональности равен отно- шению дисперсий суммарного действия для ортогональной и неортого- нальнйй частей: . а = Сх/С'х. Таким образом, факториальные дисперсии в неравномерном двух-х факторном комплексе равны СА = аСд; Св = аС ; Cab — uCab, а общие1' дисперсии Сх, Сг и Су берутся из ортогональной части комплекса. Техника расчетов двухфакторных неравномерных комплексов для количественных признаков показана в алгоритме 26. Анализ неравномерных комплексов при изучении качественных при- знаков-проводится‘по той же системе, как и для. количественных при- знаков, с той разницей, что в этих комплексах’ вместо частных средних арифметических берутся частные доли. ' . , Техника расчета двухфакторных неравномерных комплексов для качественных признаков показана в алгоритме 28. Пример, разобра'н- ' ный в этом алгоритме, построен на так называемом парадоксе взвешен- ных средних. Исследование распространения травматизма среди литей- щиков (А) и текстильщиков (AJ трех возрастно-половых групп — муж- чины (Bi), женщины (В2) и подростки (В3) —дало следующие противо- речивые результаты (табл. 69). . . По каждой возрастно-половой группе в отдельности большее рас- пространение травматизма наблюдается у литейщиков: (20—10%, 50— 30%, 80—50%), а если пересчитать эти же материалы по общему числу рабочих каждой профессий, то получится наоборот: большее распро- странение травматизма наблюдается у текстильщиков '(22—28%). Такое противоречие может получиться только при анализе неравномер- ных комплексов. 204
Таблица 69 Травматизм у литейщиков и текстильщиков Литейщики Текстильщики Bl в2 В3 Bi в2 в2 Всего обследовано 70 20 10 10 100 90 Из них с . травмами .... 14 10 8 1 30 45 % травмироНанНых .... 20 50 80 10 30 50 % травмированных по про- фессиям .................. 32/100 = 32% 76/200 = 38»% Показанный в алгоритме 28 способ снимает это противоречие путем использования невзвешенных частных долей: общая средняя доля равна : • j|/f = т. е. сумме невзвешенных частных долей, деленной на их ГАГВ . число. Средние частные доли по градациям каждого фактора также рас- считываются путем деления суммы невзвешенных частных долей на их число, например: ( МА = (см. алгоритм 27). . g СРАВНЕНИЕ ЧАСТНЫХ СРЕДНИХ В ДИСПЕРСИОННОМ КОМПЛЕКСЕ Дисперсионный анализ дает возможность значительно усовершен- ствовать способы сравнения средних величин и получить более точные показатели достоверности разности между частными средними для .групп, составляющих дисперсионный'комплекс. Обычно достоверность разности между двумя выборочными сред- ними определяется критерием достоверности разности: -• t - d ld~ . тд где d— разность между двумя выборочными средними, ,т<г—ошибка репрезентативности разности, квадрат которой равен сумме квадратов ошибок репрезентативности сравниваемых средних (гй'1 = гл? + /не- правильность суждений о..достоверности полученной в опыте раз- ности зависит от того, насколько точно’определены ошибки репрезента- тивности сравниваемых выборочных средних. Математическая статистика дает точную формулу для расчета ошибки репрезентативности выборочной средней арифметической: т = N — п . где о — среднее квадратическое отклонение для всей генеральной со- вокупности (а не для данной выборки!), из которой взяты одна или несколько выборок; . 205
п — численность каждой отдельной выборки; N — численность генеральной совокупности. Использование точной формулы для определенйя ошибки репрезен- тативности средней арифметической требует: а) одинакового значения сигмы для всех выборок; б) определения величины такого среднего квадратического откло- нения, которое характеризует разнообразие дат не в каждой отдельной выборке, а в генеральной совокупности; в)'поскольку значения критерия достоверности разности (2,0; 2,6; 3,3) и соответствующие вероятности (0,95; 0,99; 0,999) установлены,, исходя из закономерностей формирования случайного разнообразия (нормальное распределение), генеральная сигма, стоящая в числителе формулы, есть среднее квадратическое отклонение случайной неоргани- зованной изменчивости признака. В большинстве экспериментов.применение точной формулы для на- хождения ошибки средней арифметической невозможно, так как не из- вестна генеральная сигма. Поэтому на практике применяется приближенная формула где а — среднее квадартическое отклонение признака в данной изучае- мой выборке (а не генеральной совокупности); п — численность выборки. Условия использования приближенной формулы отличаются от условий использования точной формулы: вместо единой генеральной сигмы берется выборочная сигма, неодинаковая для разных выборок. Это неправильно характеризует ту степень случайного разнообразия,, которая свойственна изучаемому признаку. - Организовав в исследовании дисперсионный комдлекс, можно зна- чительно уменьшить искажения, связанные с использованием прибли- женной формулы. Для этого при сравнении частных средних внутри дисперсионного' комплекса необходимо для всех средних при вычислении ошибки репре- зентативности за показатель разнообразия взять сигму случайного раз- нообразия— ог. В этом случае ошибка репрезентативности для любой частной сред- ней данного дисперсионного комплекса будет определяться по формуле где oz = ]/'e2 —сигма случайного разнообразия, единая для всех част- ных групп, данного комплекса, илй'среднее квадратичен ское отклонение той части разнообразия результатив- ного признака, которая обусловлена неорганизованны- • ми факторами; — численность той. группы (по градациям факторов), для которой рассчитана данная частная средняя. Эта формула дает результаты, более близкие к тем, которые полу- чились бы при использовании точной формулы для ошибки средней. Используя это общее значение среднего квадратического отклоне-' ния, можно упростить и- формулу для нахождения ошибки разности двух средних из одного комплекса, и технику вычислений достоверно- сти разности между этими средними. 206
Для этого достаточно преобразовать приведенную выше формулу критерия достоверности разности: , t — d м — • md Квадрат этого критерия d2 тЧ Pd= & = d2 flz в знаменателе имеет выражение, которое после, простейших преобразо- ваний становится таким: ' . . ге1 + п2 ги,- п2 Таким образом, критерием достоверности разности любых двух ча'стный средних из одного дисперсионного комплекса может быть пока- затель ' '. . ’ - , р л <й г а = Ч = —Г пх п2 ^2 Здесь J —разность между любыми двумя частными из одного диспер- сионного комплекса; <Jz —варианса неорганизованных факторов этого комплекса; пь «2 — численности частных групп, для которых взяты' сравнивае- мые средние; vz—-число степеней свободы для неорганизованных факторов изу- чаемого комплекса; * vi, V2 — числа степеней свободы, необходимые для определения стан- дартных значений критерия Фишера (табл. IX).. Если сравниваются средние групп одинаковой численности, то по- казатель достоверности разности частных средних упрощается (при П1 = «2 = п): d 9 9 1 s4 2 (V2 — vj Определение достоверности разности частных средних внутри дис- персионного комплекса можно показать на следующих примерах. Пример 81. В алгоритме 19 дан анализ действия увеличивающих- ся доз фактора, причем первая доза — нулевая, контрольная. По пяти градациям получены частные средние: градации 1 2 3 4 5 п 3 4 5 4 4 Mi 2 ' 4 6 7 5- Варианса случайного разнообразия по всему комплексу: oz=2,27 vz = 20—5=15. Достоверность действия второй дозы по сравнению с контролем, определяется следующим образом: Р1_2= . ±±- = 3,0; vi=}c Е , = {4,5 — 8,7 — 16,6}. 2,27 3-4-4 V» = 1.5 s/ ’ ’ ' - 207-
Разность средних оказалась недостоверной, относительно мини- мальной дозы фактора не получено никакого определенного вывода. Действие третьей дозы по отношению к контролю оказалась досто- верным по второму порогу вероятности безошибочных прогнозов: Д1_з = !4-~6)2-• 3-5 =13,2; V1= J; Fst = {4,5 — 8,7 — 16,6}. '2,7 3 + 5 —v2 = 15; st 1 . 1 Пример 82. Комплекс с преобразованными датами показан в ал- горитме 24. Вместо вариаций признака (10—20—30—40—50—60) для расчетов использовались их отклонения от условной средней (Л =10), выраженные, в классовых промежутках:' а = 0—1—2—3—4—5. Как уже указывалось, такое преобразование дат совершенно не из- меняет величину F. Поэтому сравнение средних внутри таких комплек- - 2/а •сов можно заменить сравнением величин а = —-—. п Например, определение достоверности разности частных средних по градациям Д1В] й Д2В1: f| Градации AzB[ • п 4 4 • Mij 20,0 . 15,0. а 1,0 0,5 ' . при Oz = 0,6;, vz = 44 можно провести так: ' f „ J1'0'-0-5)2 . A = q,8; vi =1; fsZ= {4,1ч-.7,2 —12,5}. 0,6 2 v2 = 44; « ' ’ 1 Если же частные средние рассчитаны, то достоверность их разности надо определять, используя вариансу, выраженную в единицах измере- ния признака, для чего вариансу комплекса надо помножить на квадрат классового промежутка: ol = IО2* 0,6 = 60; F=dg.0.-15)2 .. J_ = 0,8; Fsi = {4,1 —7,2- 12,5}. . 60 , 2 .v2 = 44; si 1 ' . СРАВНЕНИЕ ОДНОЙ ГРАДАЦИИ С СУММОЙ ДРУГИХ В ДИСПЕРСИОННОМ КОМПЛЕКСЕ В пределах дисперсионного комплекса можно образовать любые новые средние и сравнить их с уже имеющимися и между собой при помощи общих величин. Иногда требуется сравнить частную среднюю по одной градации с суммарной'средней по всем остальным градациям. Такая задача возни- кает при проведении опытов без контрольной группы. Иногда это тре- буется сделать по каждой градации фактора, сопоставляя каждую част- ную среднюю со'средней по остальным, градациям. • Анализ достоверности разности средних. в таких рабо!ах можно проводить по критерию': - где , ' Мг =—---------средняя для выделяемой группы; - 4' + \ . , । '• Л4. 22У—2Уг . - /Иост =-----------средняя для остальных градации; ч N-— пг , . 4 • 208
fii — объем выделяемой градации; «ост = Л^—Пг — объем остальных градаций; <Tz, Vz —случайная варианса и число степеней свободы случай- ного разнообразия для всего комплекса, Включая и вы- деляемую градацию. . Пример 83. Сортоиспытание проводилось в местности, где дан- ная культура вводилась впервые, и требовалось выяснить, какой сорт этой культуры наиболее подходит для местных условий. Проверялась урожайность четырех сортов, засеянных каждый на пяти участках, достаточно схожих по почвенным и другим условиям. Урожаи на участках по каждому сорту получены (ц/га) тацие: Сорт А — 27, 23, 25, 21, 24 В — 22, 22, 21, 23, 22 С — 26, 28, 24, 30, 32 Д — 25, 24, 24, 23, 24 Для дальнейших расчетов даты были преобразованы вычитанием постоянного числа 20: a=V—20. Достоверность отличия урожая каждого сорта от среднего урожая по остальным трем сортам определ-ялась по рабочей формуле,'получен- ной путем введения в общую формулу числовых величин, постоянных для данного комплекса: общий объем комплекса N = 20, объем градаций в равномерном комплексе п = 5, случайная варианса по всему комплексу =4,0. . • ' ' . р _ »(/V п) _ 5 (20 — 5.) g р (vx = П ’ N . 4>° ‘ 20 ’ " S U^= 161- Результаты анализа показаны в табл. 70. / ' Таблица’70 Сравнение частных средних в дисперсионном комплексе при сортоиспытании Сорта ’ A В С D У = 22а = 90 20, r = 4, n 2a2 = 564. = 5 2Я,- = 500 ’ a = V— 20 7, 3", 5 1,4 2, 2, 16, 8, 4 3,2 10, 12 5, 4, 4 3, 4 Cz = 564 — 500 = vz = 20 — 4 = = 64 16 * е н н4гГ । в ’ 5 20 100 80 4,0 5 10 ,22 20 2,0 5 40 360 320 8,0 5 20 82' 80 . 4,0 d F = z 2 = 64/16 = 4,0 , d3 n (N’ = n) _ ’ a2z ‘ N d 5 (20 — 5) 20Ст —7 ^ост == /Т/ * ^ост аОСТ Лост d = 0,1 <2qcT 70 15 4,7 -0,7 80 15 5,3 —3,3 50 15 3,3 +4,7 70 15 4,7 —0,7 % U ZU F = 0,94d2 VV2 7^ = {4,5-8,5- II II 7 d2 F = 0,94d» 0,49 0,46 10,89 10,23 22,09 20,76 0,49 0Д6 Сорт M£. = a£. + 20 = d- m a - c D A В 4 28,0 24,0 24,0 22,0 III ?• ? II r- b- b- co o' o' OD + 1 1 1 14 Н. А. Плохинский 209
Лучшим сортом для данных условий оказался сорт С, давший уро- жай, превышающий урожай остальных сортов на 4,7 ц/га, причем это преимущество выявилось по высшему порогу вероятности р> 0,999. Достоверно (р>0,99) хуже Других оказался сорт В. СРАВНЕНИЕ ЧАСТНЫХ ДОЛЕЙ В ДИСПЕРСИОННОМ КОМПЛЕКСЕ При изучении качественных признаков в дисперсионных комплек- сах вместо средних величин рассчитываются доли объектов Р=~> имеющих данный признак. Сравнение таких частных долей ведется по той же формуле, что и сравнение частных средних: • р __ d2 р [v< = 1 1 г 4 — г • : Г st I ст| «1 + ^2 |v„ = vj где d—разность сравниваемых долей t(d=pi—рг); щ— варианса неорганизованных факторов по всему комплексу;/ п, Пч — численности сравниваемых групп; vz — число степеней свободы разнообразия, вызванного неорганизо- ' ванными факторами. НЕПАРАМЕТРИЧЕСКИЙ ПОКАЗАТЕЛЬ СИЛЫ ВЛИЯНИЯ . В ОДНОФАКТОРНОМ ДИСПЕРСИОННОМ КОМПЛЕКСЕ При изучении порядковых признаков (которые нельзя измерить, но по степени их выраженности можно объекты группы расположить в ран- жированный ряд) применяется непар-аметрвческий показатель силы, влияния. Для этой цели объекты должны быть ранжированы без повторных рангов от Д=1 для самого слабого до R = N для самого сильного выра- жения признака. Тогда группа дат будет группой- натуральных чисел 1, 2, 3, ..., N, для которой все групповые характеристики можно получить ' на основе только одного показателя—по объему группы. ж VD wov+D Сумма рангов 2/< = -л Средняя арифметическая MR = 1 . Дисперсия общая Су = Сф = ~ _ и Г N (#4- i) I2 N (N 4-1)2 Общая поправка i: N = —; L 2 4 Частные поправки по градациям Н( = . ' I « i Дисперсия факториальная Сх = С\ = 2 — Н%. Дальнейшие расчеты можно вести обычным способом: . ^ = Й2 = СХ/С, = С?/СФ т = (1 — п2) ——- Ф = rf/m р |х/ тг • х I Vj = г 1 = v2 =N — г 210.
Применение этих формул для равномерного распределения дат (а не для нормального!) может дать не всегда верные результаты. Поэтому в ответственных исследованиях требуется проверить досто- верность влияния по критерию хи-квадрат, который, как это показали Краскл и Уэллис, в данном случае равен: Х2 = (М —1)т]2 > г— 1}. При'серийных работах, когда требуется определить только досто- верность влияний, критерий %2 можно рассчитать по формуле: X2 =-----— - 3 (N + 1), N(N + \) ' которая легко получается, если в выражение %2=(У—1)г]х подставить значение дисперсий для ранжированных групп и провести простейшие сокращения. ' ’ Пример 84. В зверосовхозе начали появляться животные' с осо- бым пороком окраски меха («красная вода»). Первоначально пытались объяснить это явление действием одного кормового средства, исполь- зуемого в этом совхозе. При изъятии из рациона этого корма и даче зверям обычных кормов порок окраски продолжал появляться у неко- торых зверей. Для решения вопроса о наследственном происхождении порока окраски был проведен дисперсионный анализ насл'едуемОсти «красной воды» по отцам в однофакторном комплексе., составленном следующим образом. Все животные с пороком окраскй меха (таких оказалось 30 голов) были распределены по своим пяти отцам. Так как этот признак не мог быть измерен ни точно, ни приближенно, рее 30 потомков были ранжи- рованы без повторных рангов, и в качестве даты каждого потомка уста- навливался его ранг в этом общем ряду. Таблица 71 Непараметрический показатель наследуемости в однофакторном комплексе Отцы Ранги детей п 2R ту н‘ п .. Мв=—- п А В С D Е 2, 17, 20, 23, 25, 28 1, 3, 8, 12 16, 19, 22, 24, 30 4, 5, 6, 7, 9, 10, 11, 14 13, 15, 18, 26, 27, 29 1 4 ' 5 8 6 136 24 111 66 128 2642,3 144,0 2464,2 544,5 2730,7 19^4 6,0 22,2 8,2 21,3 У(АГ-Н)2 г •„ (N- - 4 -7207,5; Сф- —8525, h2 — „ — С9 = — l)/i2 = 29 - 0,5861 2V = 30 - 1) JV(N 4 12 ' 7 — 7207, 2247,5 > = 17,0; 465 -1) 5 — =ф V = г 2Д =8525,7 29 • 30 - 31 12 ,5865 -1=4; = 2247,5 %si = {9,5 — 13, 3-18,5} 12. 12 А АГ (У-|- 1) ' 30-31 14* 211.'
Получился однофакторный дисперсионный комплекс с пятью гра- дациями и в каждой градации оказались ранги общего ряда для потом- ков, попавших в данную градацию. Определение непараметрического показателя наследуемости по от- цам в этом комплексе показано в табл. 71. Оказалось, что имеется достоверная наследуемость по отцам изу- чаемого порока окраски меха (р>0,99). Это значит, что отцьцдостовер- но различались по наследственной способности давать потомков с по- рочной окраской меха. Следовательно, порок «красная вода» передает- ся по наследству и вызывается, вероятно, спонтанно возникшей мута- цией. РЕГРЕССИЯ - . . ' ! Регрессией называется изменение функции при определенных изме- 1 нениях одного или нескольких аргументов. Функцией называется признак, зависящий от другого признака — аргумента. Зависимость функции от аргумента может быть или физио- логической или условно принятой в исследовании. , Примером физиологической зависимости может служить зависи- мость веса животного (функции) от возраста (аргумента). Если по длине определяется вес животного,, считается, что йес зави- сит от длины, если же необходимо предусмотреть размеры животных разного веса, то принимается, что длина зависит от веса. Это пример условной зависимости. • Взаимоотношение между функцией и аргументом обычно кратко вы- ражается формулой ' ' У = /(*), / , •. ' ! т. е. признак у есть функция признака х, или ' j *i=/(*2)> ' т. е. первый признак является функцией второго. Термин «функция» употребляется не только для обозначения при- знака, который зависит от аргумента, но и для обозначения формы этой зависимости. Вскрыть функцию —значит найти закономерность, пр ко- . торой изменяется изучаемый признаков зависимости от изменения одно- - то или нескольких других признаков. Если изменения функции исследуются в зависимости от однрго аргу- мента, регрессия называется простой: . • , если от двух и более аргументов — множественной: y = f(x1,x2,...,xn). , ; Если при любом значении (малом, среднем, большом) аргумента одинаковые приращения его вызывают (или имеют тенденцию вызы- вать) одинаковые приращения функции, регрессия называется прямо- линейной. Если при одинаковых приращениях аргумента, но при разных его .'значениях (малом, среднем, большом) функция имеет неодинаковые । приращения, причем среднее течение изменений не идет по прямой, регрессия называется криволинейной. 212 ‘ (
Для изображения регрессии используется ряд регрессии (эмпири- ческий и теоретический), линия регрессии (эмпирическая и теоретиче- ская), коэффициент регрессии, уравнение регрессии. Эмпирический ряд регрессии — это двойной ряд цифр, включаю- щий значения аргумента и соответствующие средние значения функции, полученные в опыте. Пример эмпирического ряда регрессии дан в табл. 72. Таблица 72 Эмпирический ряд регрессии живого веса по возрасту Возраст, годы . 2 3 4 5 . 6 7 8 9 10 Живой вес, кг ... . 394 414 431 433 451 460 462 454 477 При графическом изображении эмпирического ряда, регрессии аргу- мент, например,возраст, откладывается по оси абсцисс, а функция, на- пример вес, откладывается по оси ординат — получаем эмпирическую линию регрессии (рис. 22). , Рис. 22. Эмпирический ряд и линия регрессии живого веса сычевских помесей ' . ' по возрасту Течение эмпирической линии регрессии почти никогда не бывает плавным: в пределах одних интервалов аргумента функция имеет повы- шенное, других — пониженное, а иногда и отрицательное приращение, что на графике дает ломаную кривую. Ломаный характер эмпирической линии регрессии отражает обычную невыравйенность общих условий развития функции на различных участках течения аргумента. Если изу- чается регрессия веса по возрасту, то становится очевидным, что напря- 213
жение всех агентов, влияющих на возрастные изменения веса, не остает- ся одинаковым на всем протяжении периода роста. В одном возрасте вся сумма влияний складывается в комплекс, более благоприятный-для роста, в другом возрасте этот комплекс влияний менее способствует при- росту веса. По виду эмпирической линии регрессии всегда можно установить, на каких участках течения аргумента функция развивалась в лучших, а на каких в худших условиях. Из эмпирической линии, представленной tia рис. 22, следует, что в возрасте 5 лет все условия, определившие дан- ный средний вес, были менее благоприятные, чем в предыдущие годы, а в возрасте 9 лет появились какие-то сильные влияния, приведшие к понижению,среднего веса. В возрасте 6 и особенно 10 лет весь комп- лекс факторов, определяющих возрастное увеличение веса, был очень благоприятен, что вызвало повышенные средние значения. Анализ эмпирической линии регрессии, подобный приведенному, всегда дает практически ценную характеристику- всех обстоятельств, связанных с зависимостью изучаемой функции от избранного аргумента. Но таким разбором индивидуальных особенностей отдельных участ- ков течения аргумента часто невозможно ограничиться. Для выясне- ния основных форм зависимости функции от аргумента требуется вы- яснить такое течение функции при равномерном увеличении аргумента, которое соответствует усредненному и, следовательно, одинаковому на- пряжению всего комплекса условий, определяющих развитие функции. Нахождение' усредненного выравненного течения функции в неко- торой степени подобно определению средней арифметической несколь- ких значений признака. Средняя арифметическая получается путем сглаживания индивиду- альных различий усредняемого признака. Кроме того, средняя арифме- тическая наиболее близко стоит ко всем индивидуальным значениям, так что сумма квадратов отклонений индивидуальных значений от их средней есть величина наименьшая. Эти же принципы положены и в основу нахождения усредненного течения функции. Однако между усреднением течения функции и определением средней арифметической имеются и большие отличия. Средняя арифметическая усредняет инди- видуальные различия в статике, выравненное течение функции усред- няет различия комплекса условий в динамике. Средняя арифметическая всегда имеет дело с одной переменной величиной (от особи к особи), выравненное течение функции всегда имеет дело с двумя или несколь- кими переменными величинами, из которых одна (функция) зависит от других (аргументы). Процесс получения усредненного течения функции при равномерном увеличении аргумента называется выравниванием эмпирических рядов. В результате выравнивания на основе эмпирической ломаной линии по- лучается усредненная, плавная теоретическая линия регрессии, отра- жающая основную закономерность зависимости функции от аргумента. Выравнивание эмпирических -рядов производится графически или аналитически. При аналитическом методе выравнивания эмпирических рядов пу- тем составления уравнения регрессии первоначально вскрывается форма зависимости данной функции от избранного аргумента. Уравнение регрессии указывает на действия, которые необходимо выполнить над данным значением аргументу, чтобы получить теорети- ческое значение функции. Подставляя в уравнение регрессии последо- вательные значения аргумента, можно определить теоретический ряд 214
значений функции, а нанося эти значения на график, получить теорети- ческую линию регрессии. Для эмпирического ряда, показанного в табл. 72 и на рис. 22, урав- нение регресрии имеет следующий вид: у' = 470 —72.10-0->312^ где у'—теоретический живой вес; х — возраст в годах; 470 — максимальное значение жийого веса, к которому асимптотиче- .ски приближается данная функция по мере увеличения аргу- мента; 72 — сумма прироста от первого имеющегося значения возраста до его значения при остановке роста; , Рис. 23. Эмпирическая (/) и теоретическая (2) линии регрессии и соответствующие , ряды живого веса сычевских Помесей по возрасту В простейшем случае, при прямолинейной регрессии, зависимость функции от аргумента может быть выражена одним числом — коэффи- циентом регрессии, показывающим, в каком направлении и на сколько изменяется функция при увеличении аргумента на одну единицу изме- рения. ' - В природе существует множество явлений, обусловленных множе- ством причин. Поэтому имеется очень много форм зависимости функций ют различных аргументов. Исследование этих форм, выраженных мате- матическими уравнениями, составляет основное содержание учения о ^регрессии признаков. • ,215
Выравнивание эмпирических рядов регрессии имеет большое и раз- ностороннее применение. Вскрывая усредненное течение функции, исследователь выявляет ту закономерность изучаемого явления, которая в эмпирическом ряду была вскрыта случайностями своего проявления. Эта закономерность,, выраженная формулой или теоретическим рядом регрессии, помогает более точно, с меньшими ошибками дать описание внешних проявлений, закономерности, что, в свою очередь, может помочь нахождению и внут- ренних факторов, упрвляющих данным явлением. В этом и заключает- ся познавательное значение исследований регрессии различных призна- ков у биологических объектов. Результаты этих исследований имеют также широкое применение и в практике. " Каждый выравненный ряд дае^г возможность определить- значение функции при любом значении аргумента (или нескольких аргументов).. Это обстоятельство дает возможность использовать ряды и уравнения регрессии при определении значений таких признаков, непосредственное измерение которых в обычных условиях или невозможно, или затрудни- тельно. В практических работах использование уравнений и линий регрес- сии получило щирокое распространение при' определении без взвеши- вания, путем измерения, нормального живого веса животных и их убой- ного веса при жизни, веса сена в стогах, вес'а овощей в овощехранили- щах, веса силосной.массы, в силосах, веса древесины в стволах и штабе- лях и пр. Широкое практическое применение во многих отраслях производ- ства находит также специальная форма линий регрессии — номограмма. СОСТАВЛЕНИЕ ЭМПИРИЧЕСКОГО РЯДА РЕГРЕССИИ I 1 Для составления эмпирического ряда регрессии весь первичный материал разбивается на столько групп, сколько установлено градаций, аргумента, и по каждой группе подсчитывается SV —общая сумма зна- чений функции и п,— число особей. Средняя получается простым деле- нием первого числа на второе: = Hi При многочисленных группах лучше первичные данные представить в виде корреляционной решетки, в которой значения аргумента нахо- дятся в верхней заглавной строке, а значение функции —в левом за- главном столбце. Эмпирический ряд регрессии, получается путем вычис- ления средней арифметической по каждому столбцу такой решетки: Mt = ^L. ' . • п( Здесь f — частота z-того столбца, W— средины классов функции, tii — сумма частот по i-тому столбцу. - Составление эмпирического ряда регрессии показано в табл. 73. 216
Составление эмпирического ряда регрессии при многочисленных группах. 1 — аргумент (обхват груди животного перед убоем, см), 2 — функция (убойный вес скота, кг) 1 2 130—139 135 140—149 145 150—159 155 160—169 165 170—179 175 180—189 185 190—199 195 220—239 230 1 1 200—219 210 J 2 5 '180—199 190 1 3 13 9 160—179 170 1 7 35 1 140—159 150 - 1 43 31 . 1. 120—139 130 ' 1 ’ 1 17 41 4 100—119 •ПО 1 27 •24 2 80—99 90 1 2 6 nt 1 4 53 118 87 17 1 w 90 420 .6230 16 180 14 230 3310 230 . 'Mi 90,0 105,0 117,5 137,1 163,6 194,7 230,0 ОБЩИЕ СПОСОБЫ ВЫРАВНИВАНИЯ ЭМПИРИЧЕСКИХ РЯДОВ К общим способам выравнивания эмпирических рядов относятся: графический способ, способ скользящей средней и способ наименьших; квадратов. ГРАФИЧЕСКИЙ СПОСОБ Графический способ дает возможность с достаточным приближе- нием получить теоретическую линию, а затем и теоретический ряд ре- грессии без каких-либо вычислений. Наиболее простым оказывается применение графического способа к прямолинейной регрессии. В этих случаях на график наносится сна- чала эмпирическая линия регрессии, затем между крайними выступами ломаной эмпирической линии проводится прямая таким образом, чтобы сумма расстояний теоретической прямой от Фочек эмпирической линии 217
была бы наименьшей. При известном навыке это можно сделать от ^уки; может помочь при этом натянутая нитка или прозрачная линейка с нанесенной прямой чертой. Натянутая нить располагается по сред- нему течению эмпирической линии, и после нахождения наилучшего по- ложения нитки на графике отмечаются две крайние точки: для мини- мального и максимального значения аргумента. Теоретической линией Рис. 24. Графическое выравнивание эмпирического ряда прямолинейной регрессии По теоретической прямой можно определить числовые значения 'функции (ординаты), соответствующие определенным значениям аргу- мента (абсциссы). ' Графическое выравнивание при прямолинейной регрессии показано на рис.-24. . Если регрессия не может считаться прямолинейной, то графическое выравнивание эмпирической кривой также может быть проведено, но .для этого необходимо иметь представление об общих закономерностях изменения функции. ' ' При изучении возрастных изменений живого веса сельскохозяйст- венных животных требуется учитывать, что живой вес, увеличиваясь с возрастом, постепенно приближается к некоторому максимальному зна- чению, после чего прирост прекращается и значение его остается при- мерно на одном максимальном уровне. При графическом выравнивании возрастных изменений лактацион- ных удоев нужно учитывать, что примерно до 6—7 лактаций обильно- молочность кор.ов с каждой лактацией увеличивается, затем начинает снижаться в связи с общим старением организма. 218
При выравнивании кривых регрессии веса по линейным размерам тела нужно иметь в- виду, что по мере увеличения, например, длины, ширины или обхвата тела увеличение веса идет с возрастающей ско- ростью, вследствие чего кривая регрессии имеет вид линии, постепенно загибающейся кверху. На рис. 25 показано графическое выравнивание ряда возрастных изменений живого веса сычевских метисов второго поколения. Для со- Рис. 25. Сопоставление графического (7) ,и аналитического (2) способов выравнива- ния рядов возрастных изменений живого веса сычевских помесей поставления на рисунке дана теоретическая кривая, точки которой рассчитаны по формуле асимптотического роста. Совпадение результа- тов графического метода с результатами аналитического оказалось до- статочно близким. Графический анализ может быть йроведен на основе индивидуаль- ных значений без расчета средних значений эмпирического ряда—-при помощи точечного графика. ' ’ Для составления точечного графика' устанавливаются две перпен- дикулярные .шкалы: горизонтальная шкала аргумента, идущая слева направо, и вертикальная шкала функции, идущая снизу вверх. Ни аргу- мент, ни функция не разделяются на градации. Каждая особь отмечается на графике точкой' положение которой определяется по абсциссе значением аргумента, а по ординате значе- нием функции. Получается вытянутое скопление точек, которое дает возможность провести приближенную теоретическую лийию регрессии, 219
а по ней графически установить теоретический ряд регрессии. Кроме- того, точечный график позволяет легко выделить выдающихся особей,, не приводя значение функции к единому значению аргумента. Преимущество такого графика заключается в том, что он наглядно показывает и среднее течение функции, и то разнообразие значений,, которое характерно для данной функции при данном аргументе.' Точечный график был применен, например, при выделении выдаю- щихся ярослав-остфризских телят на основе разновозрастных данных по- живому весу (рис. 26). По этому графику легко определить выдающихся особейщо данному признаку (на графике они занумерованы), средний: живой вес в любом возрасте (в возрасте 30 дней средний вес телят — 50 кг, 60 дней —75 кг и т, д.) и крайние отклонения веса в любом воз- расте (эти отклонения до 60 дней составляют примерно ±10 кг, после: 60 дней — примерно ±15 кг). Рис. 26. Точечный график зависимости живого веса ярослав-остфризских телят от возраста: - / 1—7 — выдающиеся экземпляры, принятые на ВСХВ СПОСОБ СКОЛЬЗЯЩЕЙ СРЕДНЕЙ Если форма функции неизвестна, то сгладить изломы эмпирической кривой можно, применив' спо'соб простой скользящей средней. Этот способ заключается в том, что для каждого значения аргумента берется средняя арифметическая из нескольких (соседних) значений функции.. Если скользящая средняя берется по трем значениям аргумента, то складываются значения .функции для меньшего значения аргумента,, для данного и для большего. Частное от деления этой суммы на 3 дает выравненное значение функции для данной величины аргумента. Выравнивание эмпирического ряда методом простой скользящей средней показано в табл. 74. Выравненная этим методом кривая дана на рис; 27. 220 .
Выравнивание эмпирических рядов способом простой скользящей вредней применяется, когда не требуется особой, точности и имеется .достаточно длинный ряд и можно пренебречь потерей двух значений функции, соответствующих крайним значениям аргумента. Более точные и не связанные с потерей крайних значений резуль- таты получаются при использовании взвешенной скользящей средней. При эдом способе с обоих концов ряда добавляются по два значения — по два члена ряда. Определяются они следующим образом. Рис. 27. Ряд, выравненный способом простои скользящей средней Первое (от конца) значение ряда (г/i) умножается на. 2, к получен- ному произведению прибавляется второе значение (у2), третье (у3) про- пускается, а из суммы вычитается четвертое (гы). Полученное число .делится на 2. Частное будет первым добавочным значением: у+\ (для .максимального конца ряда) или у_] (для минимального конца ряда). Все эти действия можно выразить следующей формулой: ,, 2(/i-р г/2 — У1 У+1~ -2 • Второе добавочное значение „ _ 2^+1+ У1 — Уз . . У+2- 2 . ..для его расчета нужно использовать первое добавочное значение и ' первое и третье значения первоначального эмпирического ряда. Чтобы избежать ошибок при расчете, можно на краю листка бумаги .записать коэффициенты +2, 4-1, 0,.—1 для минимального края ряда и — 1, Q, 4-1, 4-2 —для максимального. Приставляя край такого листка к эмпирическому ряду, легко видеть, что надо делать с каждым из че- тырех последних значений ряда, чтобы получить добавочные значения. 221
Таблица 74 Выравнивание эмпирического ряда по способу простой скользящей средней. Аргумент — содержание переваримого белка (%) в рационе телят до шестимесячного возраста, функция — вер теля! (кг) в возрасте шести месяцев Процент белка в рационе Живой вес в возрасте шести месяцев Сумма трех соседних значений живого веса Выравненные значения живого веса 56 103 53 .120 348* 116 50 125 392** 131 47 147 411 137 44 139 439 146 41 153 439 146 38 147 454 151 35 154 455 152 32 154 457 153 29 149 462- 154 26 159 448 149 23 140 451 150 20 152 410 137 17 118 ' — — * 348= 103 + 120'+ 125. ** 392= 120+ 125+147. Для примера в двух верхних и двух нижних строках третьего столб- ца табл. 75 показано получение добавочных значений ряда. ’ При коротких рядах добавочные значения можно получить, поль- зуясь формулами: ,, + у2— 2у3 •* 4z/+1 + th — 2у2 - У+1 =------з-----’У+2~----------з------. • После установления добавочных значений приступают к выравни- ванию эмпирического ряда. Выравненные значения получаются путем вычисления взвешенной средней арифметической из пяти соседних эмпирических значений функ- ции, взятых соответственно с весами 1; 2; 4; 2; 1. Для того чтобы получить, например, первое выравненное значение- функции, нужно сумму второго добавочного, удвоенного первого доба- вочного, учетверенного первого эмпирического, удвоенного второго' эмпирического и, третьего эмпирического значений функции разделить, на сумму весов (1+2 + 4+2+1 = 10). . / Это можно выразить следующей формулой: _ У+г + ^У+i + + 2у2 + г/3 Для рассматриваемого эмпирического ряда первое выравненное- значение функции , _ 78,5+ 2-89,5 + 4-103 + 2-120 + 125 . ‘ У1 — 10.3,40 В т^бл. 75 приведен расчет всех выравненных значений функции для рассматриваемого примера. Обычно эти действия не записываются. Пять эмпирических значений, помноженных на коэффициенты взвеши- вания, складываются на счетах, сумма уменьшается в 10 раз, и полу- х 222
Таблица 75 Выравнивание эмпирического ряда способом взвешенной скользящей средней. Аргумент — содержание переваримого белка в рационе телят до шестимесячного возраста, функция — вес телят в возрасте шести месяцев Аргу- мент Функция эмпирический ряд с добавоч- ными значени- ями расчет выравненных и добавочных значений у+3 = 78,5 . у+2 = (2 • 89,5+ >103 — 125) : 2 = 78,5 — — у+1=, 89,5 у+1 = (2- 1034- 120—1,47) : 2 = 89,5 ; — 56 Уг =103 {/' = (78,5'4- 2 • 89,5 4-4 - 103 4- 2 - 120 4- 125) : 10= 103,45 53 У2= 120 у2 = (89,54-2 • 103 4-4-120 4- 2 • 125 4- 147) : 10= 117,25 50. Уз = 125 у'= (103 4-2 • 120 4- 4 • 125 4-22 • 147 4- 139) : 10= 127,6 47 Уз = 147 ^4 = (120 4- 2 • 125-1-4 ..147 4-. 2 • 139 4- 153) : 10= 138,9 44 №=139 №=(1254-2 • 147 4-4 • 139 + 2 • 153+'147) : 10= 142,8 41 7 у6 = 1£3 №=(147'4-2 • 139 4- 4- 153 4-2 • 147 4- 154).: 10= 148,5 38 Ут = 147 у'7 = (139 4- 2 - 153 4- 4 • 147 4- 2 • 154 4- 154) : 10 = 1.49,5 - 35 Ув = I54 № = (153 4-2- 147 4-4- 154 4-2 • 154 4- 149) : 10= 152,0 32 У9= 154 № = (147 4- 2 • 154 4- 4 • 154 4- 2 • 149 -|- 159) : 10 = 152,8 29„ Ую = 149 /10=(154 4-2 • 154 + 4 • 149 4- 2 • 1594- 140) : 10= 151,6 26 Ун = 159 /п = (154 4-2,. 149 4-4 • 159 4-2 • 140+ 152) : 10= 152/' 23 1/12 = 140 №2 = (149 + 2 • 159 + 4 • 140 + 2 152+ 118) : 10= 1-44,9 20 ^13 = 152 №3= (159 + 2 • 140 + 4 • 152 + 2 • 118+114,5) : 10= 139,75 17 У14= И8 . уи= (140 + 2 • 152 + 4- 118 + 2 • 114,5+ 103,5) : 10 = 124,85 У-т.== 114,5. у_! = (2 • 118+ 152— 159) : 2 = 114,5 1— , у_3 = 103' 5 у_2= (2-114,5 + 118— 140) : 2= 103,5 ценное значение взвешенной средней функции для данной величины аргумента записывается в столбец рядом со столбцом (или строкой) эмпирических значений. , ’ Ряд живого веса шестимесячных телят, выравненный методом взвешенной скользящей средней, показан на рис. 28. Чтобы избежать числовых просчетов, нужно на краю листка бума- ги написать коэффициенты взвешивания: 1; 2; 4; 2; 1. Если этот край' прикладывать последовательно к каждым пяти соседним значениям функции и умножать эти значения на соответствующие коэффициенты,, то сумма произведений, деленная на 10, будет искомой средней. .Запи- сывается она против среднего коэффициента (4). Способом скользящей средней можно произвести выравнивание семейства кривых в тех случаях, когда изучается развитие признака под. влиянием одного фактора у нескольких категорий особей илй под влия- нием двух факторов, из/которых каждый разделен на несколько града- ций. В табл. 76 приведены результаты опыта, в котором (выяснялось дей- ствие пастбища на молочных коров в первые недели. При этом упитан- ность коров, вышедших на пастбище, была различной. В таблице при- 223
Рис. 28. Ряд живого веса, выравненный способами простой (/) и взвешенной (2) скользящей средней Рис. 29. Выравнивание семейства кривых способом взвешенной скользящей средней: • а — кривые до выравнивания, б — кривые после выравнивания (в кружках — номера групп)
ведены среднесуточные удои по пяти группам коров за первые шесть недель пастбища; эти же результаты представлены графически на рис. 29 а. Для выравнивания нескольких связанных рядов регрессии (семей- ства кривых) требуется первоначально получить по одному добавочному значению для каждой строки, каждого столбца и каждого угла табли- Таблица 76 Среднесуточные удои (кг) пяти опытных групп коров за первые шесть недель пастбища Недели пастбища Группа коров Упитанность коров 1 2 3 4 5 6 1 2 3 4 5 выше средней средняя ниже средней тощая (после заболева- ния) истощенная (после дли- тельной болезни) цы, в которой записаны в обычном порядке все эмпирические значения функции. Каждое добавочное значение получается на основе четырех крайних по тому же правилу, что и при выравнивании одной эмпириче- ской кривой: ^пЛУг — „ли — 2^з У+1 =----------- или У+1 —------,-----• Л 1 о Добавочные значения для примера, приведенного в табл. 76, пока- заны в крайних строках и столбцах табл. 77. Добавочное число Ооо=Ю, стоящее в левом верхнем углу таблицы, получено по четырем эмпири- ческим значениям, расположенным по диагонали, идущей от этого угла: а00 = (2-11 + 6 + 0 —8): 2 = 10. Добавочное число 047=14 для четвертой опытной группы справа, получено по четырем крайним значениям этой строки: о47= (2-Н +9 + 0 — 3); 2= 14. Добавочное число для первой недели пастбища получено по четы- рем нижним эмпирическим значениям: Об! = (2-2 + 5+0 —9):2 = 0. После установления добавочных чисел производится выравнивание эмпирических значений путем усреднения девяти значений функций, из которых одно, центральное, есть выравниваемое значение, а остальные восемь — значения, окружающие его со всех сторон. При суммировании центральное значение удваивается, остальные восемь берутся без изменений и полученная сумма делится на 10. Например, выравненное значение удоя для первой группы за пер- вую неделю получено путем усреднения девяти величин, составляющих квадрат, в центре которого стоит выравниваемое значение: 15 Н. А. Плохишжий 225
10 13 11 8 11 10 5 9 6 a11= (10+ 13 4- 11 +84-2-11 + 10 + 5 + 9 + 6): 10 = 9,4. Выравненное значение удоя для первой группы за вторую неделю определяется квадратом чисел: 13 11 17 И 10-12 9 6 13 = (13+*Н + 7 + 11 +2-10+ 12 + 9 + 6+ 13): 10= 11,2. Выравненные значения показаны в табл. 77 и на рис. 29 б. Чтобы избежать счетных ошибок при выравнивании семейства кри- вых по методу взвешенной скользящей средней, можно в листке бумаги вырезать квадрат таких размеров, чтобы он охватывал девять клеток таблицы эмпирических значений. Прикладывая этот листок так,, чтобы в центре, вырезанного квадрата находилось выравниваемое значение функции, можно каждый раз открывать только те величины, которые нужны для выравнивания данного значе.ния функции. ' , Т а б л и ц'а 77 Выравнивание семейства кривых методом взвешенной скользящей средней Недели 7 0 1 2 3 4 5 6 Группы 0 10 13 11 17 19 15 19' 21 1 8 И '9,4 10 Д1,2 12 13,0 16 14,7 14 15,4 17 16,1 18 2 5 9 7,5 6 8,8 13 11,0 14 12;3 1Г 13,5 15 14,7 14 3 4 6 5,5 7 6,8 8 8,2 11 9,8 10 . 11,5 16 13,3 17 4 3 5 4,1 4- 5,1 3 6,5 8 8,6 9 10,8 11 . 12,8 14 5 0 2 2,2 ' 5 . 3,7 . 7 . 5,5 9 7,8 13 10,3 12 11,8 15 6 —3 0 •. 4 2 6 12 10 10" Выравнивание методом скользящей средней, имеющей _в некоторых случаях самостоятельное значение, может также применяться как спо- соб подготовки сильно невыравненных данных к дальнейшему выравни- ванию графическим или аналитическим методом. 226
СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ Наиболее общим аналитическим способом выравнивания эмпириче- ских рядов регрессии служит способ наименьших квадратов. Этим спо- собом получаются такие выравненные значения функции, квадраты отклонения которых от эмпирических значений дают наименьшую сумму. Способом наименьших квадратов можно выравнивать функции пря- молинейные и криволинейные, простые и множественные. Выравнивание эмпирических рядов регрессии способом наименьших квадратов осуще- ствляется по следующим этапам. 1. Определение общего вида уравнения регрессии производится на основе предварительного биологического анализа процессов, определя- ющих течение функции, или на основе рассмотрения эмпирической кри- вой. . ‘ 2. Составление системы нормальных уравнений производится по правилам, показанным на следующем примере. Исходное уравнение у = а + Ьх + сх2 изображается так, чтобы функция (t/) была в правой части: а + Ьх + сх2 = у. Все члены уравнения умножаются на величины, стоящие рядом с искомыми коэффициентами: на 1, на х, на х2: (X 1) а + Ьх + сх2 = у, (X х) ах -ф Ьх2 ф- сх3 = ух-, (хх2) ах2 + Ьх3 + сх4 = ух2. В каждом члене уравнения ставится знак суммирования, _ причем искомые коэффициенты выносятся за этот знак (Sl=«— число пар аргумент — функция): па + 6Sx + cSx2 = Zy; > aSx + 6Sx2 + cSx3 = St/x; dSx2 + 6Sx3 + cSx4 = Zyx2. Это и есть система нормальных уравнений при данной исходной формуле. Эти правила применимы для любой исходной формулы, например: х (Х1)а+ — = I/ X 'X-1V+± = JL X J X X2 X ап + 6S — = St/; х X X2 X 3. Определение числового значения сумм, входящих в нормальные уравнения, производится путем суммирования предварительно вычис- ленных рядов: । Sx, Sx2, Sx3, Sx4, St/, St/x, St/x2. 4. Определение коэффициентов основного уравнения производится путем решения системы нормальных уравнений обычными алгебрайче- 15* 227
скими приемами. В рассматриваемом примере (исходное равенство у — = а+Ьх + сх2) коэффициентами будут а, Ь, с. Выравнивание эмпирических рядов регрессии способом наименьших квадратов можно показать на следующих примерах. Прямолинейные функции вида у = а-\-Ьх Пример 85. В некоторых случаях имеет смысл определение воз- раста коров по числу колец на рогах. Связь между числами колец на рогах и возрастом возникает оттого, что каждый отел, происходящий обычно ежегодно, оставляет на рогах коровы кольцо, отражающее за- медление роста рога в периоды глубокой стельности, когда главная мас- са питательных веществ тратится на питание плода. Поэтому если к среднему числу лет, прошедших до первого отела,, прибавить число колец, умноженное на средний межотельный период, то это и будет примерным возрастом коровы. Это можно выразить уравнением у = а 4- Ьх, где а — число лет до первого отела; х—число колец на рогах; у — возраст коровы в годах; b — средний меж отельный период. Зная исходное уравнение, можно составить систему нормальных уравнений. В данном случае она будет простой: ап + ЬЪх — 2z/,- zzSx 4- b'Sx2 = Sz/x. Следовательно, нужно определить четыре величины: Sx, Sx2, Sz/, Sz/x. Эти суммы приведены в табл. 78. Таблица 78 Выравнивание эмпирического ряда регрессии возраста коров (у) по числу колец на рогах (х) способом наименьших квадратов: an-^-b'Sx—'Sy у’=а^-Ьх, Нахождение параметров полинома Построение теоретического ряда х . У х2 ух Ьх у=а-{-Ьх у'-у 11 13,3 121 146,3 10,955 13,4 40,1 10 12,4 100 124,0 9,960 ' 12,4 0,0 9 11,5 81 103,5 8,964 11,4 —0,1- 8 10,5 64 84,0 7,968 10,4 —о, 1 7 9,5 49 . 66,5 6,972 9,4 . —0,1 6 8,3 36 49,8 5,975 8,4 '40,1 5 7,4 25 37,0 4,980 7,4 0,0 4 6,5 16 26,0 3,984 6,4 —0,1 3 5,5 9 16,5 2,988 5,4 —0,1 2 4,4 4 8,8 1,992 4,4 0,0 1 3,4 1 3,4 0,996 3,4 0,0 Sx=66 2^=92,7 2х2=506 2ух=665,8 — — 11а4-66&=92,7 66а->506&=665,8 у'—2,45->0,996х 228
Для определения этих сумм были использованы данные по 1500 ко- ровам Племенной книги ярославского скота (часть I, том III). Для каждой коровы были определены возраст у и число колец на рогах х. Полученная система нормальных уравнений (см. табл. 78) На+ 666 = 92,7, 66а + 5066 = 665,8 решается путем постепенного исключения неизвестных. В данном слу- чае это легко сделать, помножив все члены первого равенства на 6 и вычитая полученное равенство, из второго уравнения: 66а + 3966 = 556,2 66а + 5066 = 665,8 b = 109-’6- = + 0,996. 0+ 1106 = + 109,6 ’ 110 Подставляя полученное значение & = + 0,996 в первое нормальное урав- нение и определяя из него а, будем иметь „ _ 92,7 - 66.(^0.996) _ , 9 Таким образом, теоретические, значения возраста по числу колец на рогах можно определить по формуле у' = 2,45 4- 0,996%, где у' — теоретическое значение возраста при числе колец на рогах, равном х1. Возрабт, определяемый этой формулой, относится к средине того межотельного периода, перед началом которого образовалось последнее кольцо. Чтобы получить возраст отела, надо из величины, полученной по формуле, вычесть половину межотельного периода, т. е. 0,996:2 = = 0,498. Тогда формула примет следующий вид: у" = 1,952 + 0,996%, где у" — возраст отела, номер которого равен х. Эта формула очень близка к тому правилу, по которому на прак- тике определяют возраст по числу колец — корове столько лет, сколько у нее колец на рогах плюс 2 : i/ = 2 + %. v Теоретический ряд возраста по числу колец на рогах показан на рис. 30. . Показательные функции вида у = ахь Пример 86. Для разработки норм погрузки животных в автома- шины потребовалось установить нормы требуемой площади пола на 1 голову в зависимости от среднего веса животных в загружаемой груп- пе. При проведении опытных перевозок были получены данные о весе перевозимых свиней и их количестве в кузове, имеющем определенную площадь пола’. При обработке материалов получены средние площади, 1 При сопоставлении эмпирического и теоретического рядов эмпирические значе- ния функции обозначены через 'у, а теоретические — через у7. 229
приходившиеся на 1 голову при разном среднем весе свиней (от 40 до 220 кг). Потребовалось выравнять полученный эмпирический ряд. Общий вид уравнения был намечен исходя из следующих соображе- ний: 1) в уравнении не должно быть свободного члена, так как при ве- се, равном нулю, и требуемая площадь тоже равна нулю (при х = 0, ' возраст S средине лактации 4 N 4s § 5 у = 2,45+0,996 х Число колец ни рогах. 1 2 3 4 5 6 7 8 9 10 11 12 возраст, годы эмпирические срёдние <3,4 4,4 5,5 6,5 7,4 8,3 9,5 10,5 11,5 12,4 13,3 - теоретический ря!д 3,4 4,4 5,4 6,4 7,4 8,4 9,4 10,4 11,4 12,4 13,4 14,4 ' Рис. 30. Прямолинейная функция. Определение возраста коров (средины лакта- ции) -по числу колец на рогах х у = 0), 2) изменение площади не может быть пропорционально весу, так как крупные животные на единицу веса требуют меньшую площадь по- ла, чем мелкие животные. Такие функции могут иметь вид У = ахь, что после логарифмирования дает уравнение прямой: . ' Ig# = 1g а + b Igx. Система нормальных уравнений в данном случае составляется по обычным правилам: z ’ (lga)n+ &2(lgx) = 2 (Igy), (1g a) 21g x + 62 (1g x)2 = 2 (1g y) (Ig x). 230
В табл. 79 приведены расчеты всех требуемых сумм: 2(Igx), S(lgx)a, S(lgy), 2(lgy)(lgx). Была получена система нормальных уравнений (см. табл. 79): , 10 Iga + 20, 6106 = - 4,249; 20,610 lg а + 49,9986 = — 8,390. Таблица 79 выравнивание эмпирического ряда регрессии требуемой площади пола (у) на 1 голову при перевозках на автомашинах по среднему живому весу свиней (х): y=axb, (1ga)«+£S(lgx)=S(lgy) lgi/=lga+blgx, (lga)2(igx)+&(lgx)2=2(lgt/)(lgx) - Нахождение параметров полинома!* Построение теоретического ряда кг у, -и2 Igx 1g» (Igx)2 (lg»)(lgx) 0,666 Igx —1,797+ +0,666 Igx lg»” У’ 220 0,60 2,342 Г, 778 —0,222 5,485 —0,520 1,560 —0,237 Г, 763 ' 0,579 200 0,52 2,301 Г 716 =0,284 5,295 —0,653 1,532 —0,265 Г, 735 0,543 180 0,54 2,255 Г, 732 —0,268 5,085 —0,604 1,502 —0,295 Г, 705 0,507 160 0,45 ,2,204 Г, 653 —0,347 4,858 —0, 765 1,468 —0,329 Г, 671 0,467 -140 0,46 2,146 Б 663 —0,337 4,605 —0,723 1,429 —0,368 Г, 632 0,424 120 0,41 2,079 Т, 613 —0,387 4,322 —0,805 1,385 —0,412 Г, 588 0,387 100 0,35 2,000 1,544 —Q,456 4,000 —rf-912 1,332 —0,465 Г, 535 0,343 80 0,27' 1,903 Г, 431 —0,569 3,621 —1,083 1,267 —0,530 Г, 470 0,295 60 0,22 1,778 Г, 342 —0,658 3,161 —1,170 1,184 —0,613 Г, 387 0,244 40 0,19 1,602 Г,279 —0,721 2,566 —1,155 1,067 —0,730 Г, 270 0,186 +20,610 — —4,249 +42,998 —8,390 10 lga+20,610&=—4,249 lgy'=—1,7974-0,666Igx 20,610 lga-442,9986=—8,390 y'—0,01 60x0.666 Для решения этой системы можно умножить все члены первого ра- венства на 2,061 \и вычесть из полученного равенства второе уравнение: 20,6101g а + 42,9986 = — 8,390 20,610 lga +42,4476 = — 8,757 0+ 0,5516 = 0,367 -откуда b = °’-367 = + 0,666. + 0,551 Подставляя значение Ъ =+0,666 в первое исходное уравнение, опре- делим 1gа = ^'^Э-О.ббб+О’бЮ = j 7975 = g 203. а = 0,0160. 231
Таким образом, искомое уравнение имеет вид у = 0,0160-л0-666 ж2, или в логарифмической форме: 1gу = — 1,796 4-0,6661g х. Теоретический ряд .регрессии приведен, в табл. 79 и на рис. 31. График, представленный на рис. 31, может'служить номограммой для определения требуемой площади пола в автомашине по среднему живому весу перевозимой группы свиней. Например, если средний вес Рис. 31. Показательная функция. Зависимость требуемой площади пола в автомашине- ' ' на 1 голову от среднего веса свиней составляет 130 кг, то на каждую голову требуется 0,41 ж2 пола (см._ рис. 31). На осноре выведенной формулы можно получить формулу для опре- деления числа голов, которые можно погрузить в автомашину с пло- щадью пола А при среднем весе х: II/ •— i ахь Если перевозки проводятся в кузове грузовика ЗИЛ-150, имеющем; площадь пола 7,97 ж2, то приведенная выше формула будет иметь сле- дующий вид: ' _ 7,97 " П ~ 0,0160л:0’666 ‘ ' 232
Номограмма, полученная по этой формуле, приведена на рис. 32. Пунктиром показано определение нормы погрузки свиней в кузов ЗИЛ-150 При среднем весе 90 кг — 25 голов. Параболические функции вида у — а. + Ьх и у ='а-+ Ьх + сх2 Пример 87. При изучении возрастных изменений морских беспоз- воночных было обнаружено, что некоторые виды животных не имеют обычного замедления роста и веса. Длина раковины одного моллюска на протяжении от трех до десяти лет жизни увеличивалась почти равно- мерно, а вес его раковины в этот же период увеличивался с повышаю- щейся скоростью. При рассмотрении эмпирических рядов, нанесенных на график, бы- ло сделано предположение, что в данном случае имеются закономерно- 233
Рис. 33. Функции параболического роста. Возрастные изменения длины (а) и веса (б) раковины моллюска Рис. 34. Гиперболическая функция. Скорость движения беспозвоночного в зависи- мости от длины тела
' 4 ста параболического роста, выражаемые для длины тела уравнением параболы первого порядка, т. е. прямой у = а + Ьх; а для веса—пара- болой второго порядка, вида у=а + Ьх + сх2. Выравнивание соответствующих рядов показано на рис. 33. Гиперболические функции вида .у =а+ &Х + — Пример 88. Изучалась скорость движения морских беспозвоноч- ных в зависимости от их размеров. Эмпирические ряды регрессии ско- рости по длине тела имели значительные изломы, что отражало нерав- номерное напряжение двух факторов, влияющих на скорость на отдель- ных участках пути. Чтобы выделить из всех влияний влияние длины тела, необходимо было найти теоретическое течение скорости по длине при усреднении всех остальных факторов. Это было сделано по материалам, собранным М. И. Константино- f вой. Выравнивание проведено по уравнению гиперболы вида у=а+Ьх+ Ь + —, принятому на основании рассмотрения эмпирической кривой. I х ? Так как по условиям наблюдения чрезвычайно трудно подобрать i особей с длиной тела, различающейся на одну и ту же величину, зна- чения функции были получены через различные неодинаковые проме- жутки аргумента. . Это обстоятельство не- препятствует выравниванию эмпирических рядов, если оно проводится при помощи общего способа наименьших квадратов. • i Зависимость скорости движения от длины тела для некоторых бес- ‘ позвоночных показана в табл. 80, теоретический ряд — на рис. 34. Для облегчения расчетов аргумент взят в преобразованном виде: Это дает возможность заменить трехзначные значения фактической длины рядом натуральных чисел: 1, 2, ..., 29, 30. Обратный переход от преобразованных значений аргумента к фак- тическим можно сделать по формуле х = 80 + 20%!. Для решения полученной системы нормальных уравнений (табл. 80) 12а + 1696Н-2,1919с = 11,9; 169а + 34556 + 12с = 144,3; 2,1919а + 126 + 1,2147с = 3,025 все члены первого равенства умножались на 14,08333^-^-), третьего — (169 \ 2 1, после чего второе уравнение вычиталось из пер- вого, а затем — из третьего. Полученные два новых равенства не имеют первого члена: 0 — 1074,917236 + 18,86925с = 23,29169, 0 -.2529,77540 6+ 81,65586с = 88,93370. 235
Таблица 80 Выравнивание эмпирического ряда регрессии скорости движения беспозвоночного (у) по длине тела (х) способом наименьших квадратов: С у=а4-Ьх^- — , X х—80 V Х1— , 20 an-{-cS — х п=12, 1 1 У aS — 4-&n4cS — = S — X X2 X Определение параметров уравнения Построение теоретического ряда X, MK Xl 2 1 Xi. 1 2 xi y, мм(сек yxt У Xi ЬхД-) c —(+) У’ У—У 680 30 900 0,0333 0,0011 0,8 24,0 0,027 0,1680 0,031 0,766 0,0 660 29 — — — — —. — 0,1624 0,032 0,773 640 28 . — — —— — — — 0,1568 0,033 0,779 620 27 729 0,0370 0,0014 1,1 29,7 0,041 0,1512 0,034 0,786 —0,3 600 26 — — — — —• —. 0,1455 0, 035 0,792 580 25 .— — —— — — — 0,1400 0,037 0,800 560' 24 576 0,0417 0,0017 0,6 14,4 0,025 0,1344 0,038 0,807 4-0,2 540 23 — — —— — — 0,1288 0,040 0,814 520 22' 484 0, 0455 0,0021 0,6 13,2 0,027 0,1232 0,042 0,822 -40,2 500 21 — — — — — — 0,1176 0,044 0,829 480 20 — — — — — —- 0,1120 0,046 0,837 460 19 —• — — —— — — 0,1064 0,048 0,845 440 18 324 0,0555 0,0031 0,9 16,2 0,050 0,1008 0, b51 0, 853 0,0 420 17 — — — — — — 0,0952 0,054 0,862 400 16 — — — — — — 0,0896 0,057 0,870 380 • 15 — — —• —— — — 0,0840 0,061 ‘0,880 360 14 — — — — — — 0,0784 0,065 0,890 340 13 169 0,0769 0,0059 0,9 11,7 0,069 0, 0728 0,071 0,901 0,0 320 12 — — — — — — 0,0672 0,076 0,912 300 11 121 0,0909 0,0083 0,6 6,6 0,055 0,0616 0,083 0,924 -F0,3 280 10 — — — — — — 0,0560 0,092 0,939 260 9 81 0,1111 0,0123 1,2 10,8 0,134 0, 0504 0,102 0,955 —0,2 240 8 — — . —' — — 0,0448 0,115 0,973 220 7 —— — — — — 0,0392 0,131 0,995 200 6 36 0,1667 0,0278 1,3 7,8 0,217 0,0336 0,153 1,022 —0,3 180 5 25 0,2000 0,0400 0,9 4,5 o; iso 0,0250 0,183 1,058 •40,2 160 4 — —. — — —- —. 0,0224 0,229 1,110 140 3 9 0,3333 0,1111 1,2 3,6 0,400 0,0168 0,306 1,192 0,0 120 '2 — — — — '— 0,0112 0,457 1,349 100 •1- 1 1,0000 1,0000 1,8 1,8 1,800 0,0056 0,916 1,813 0,0 S 169' 3455 2,1919 1,2147 11,9 144,-3 3,025 12а4-169&^-2,1919с=11,9 169а-4 34556-р 12с= 144,3 2,1919а-|—12&-Ф-1,2147с=3, 025 0,916 с/=0,903—0, 0056xd-------- %! Если первое из этих равенств умножить на 2,35346^ ^^’д^з ) и ПОЛУ- ченный результат вычесть из второго равенства, то можно определить величину с: — 2529,7756 + 44,40803с = 54,81592 — 2529,775& ЧЬ 81,65586с = 88,93370 0 4- 37,24783с = 34,11778 236
с = + 34,11778 + 37,24783 = + 0,916. Подставив полученное значение с в первое из преобразованных равенств, можно определить Ь: к — 54,81592-0,916-44,40803 _ _ q оо56 ~ — 2529,775 ’ После подстановки 6 = 0,0056 и с=+0,916 в первое исходное,равенство получим 11,9 + 0,0056-169 — 0,916-2,1919 . „ onQ а — —-—2:------------------------= + 0,903. 12 Таким образом, уравнение регрессии скорости движения у по дли- не тела х имеет вид , у' = + 0,903 — 0,0056%! + xi где. х — 80 %! =--------- 20 Параболические функции с одним максимумом у = а Ьх+ сх2 Пример 89. В работах по селекции молочного скота большое практическое значение имеет выяснение закономерностей возрастных изменений обильномолочности. Для анализа зависимости удоя за 300 дней лактации от возраста были использованы первичные материалы по средним удоям, полученным от одной и той же большой группы коров (около 5000 коров из передовых совхозов центральной части Союза) за первую лактацию, вторую и т. д. Ряд эмпирических средних имел, как обычно, изломы, но общая тенденция возрастных изменений обильномолочности наметилась совер- шенно четко: до 5—8-й лактации удои повышаются, а затем снижают- ся (в среднем), если только не проведена интенсивная выбраковка не- достаточно продуктивных животных. Такая закономерность обычно выражается уравнением параболы второго порядка: у = a + Ьх + сх2. Выравнивание средних лактационных удоев по этой формуле при- ведено в табл. 81, теоретическая кривая показана на рис. 35. Решение системы нормальных уравнений проведено обычным, опи- санным выше способом. В результате получено уравнение регрессии у = + 17,05 + 4,115х —0,298х2, в котором второй (положительный) член отражает действие всех фак- торов, благоприятствующих росту, а третий (отрицательный) член отра- ,жает результаты увеличивающегося с возрастом действия факторов, тормозящих рост. Следует иметь в виду, что полученная формула пра- вильно отражает возрастные изменения удоев только в пределах изучен- ных возрастов: от 1-й до 12-й лактации. Формула теряет значение при 237
х = 0 и при х, большем 12. Поэтому свободный член уравнения а= +17,05 следует понимать как отражение подготовки молодого организма к то- му, чтобы за первую' лактацию дать удой, равный а 4-& + с= 17,05 + 4,115 — 0,298 = 20,87 ц. Оказалось, что теоретический ряд удоев, полученный на основе па- раболического уравнения второго порядка, достаточно близок к эмпи- рическим значениям. Это обстоятельство позволяет использовать тео- ретический ряд для решения некоторых практических задач. Рис. 35. Параболическая функция с одним максимумом Возрастные изменения лактационных удоев У становление поправок на возраст .при определении лактационных удоев необходимо для сравнения разновозрастных групп коров (напри- мер, дочерей одного производителя и их матерей). Поправки находят- путем приравнивания удоя за какую-нибудь лактацию (например, тре- тью) единице и деления удоя за эту лактацию на удой по каждой из остальных лактаций (тйбл. 82). Нахождение возраста максимального раздоя можно сделать по графйку или формуле где Т — возраст (в отелах), в котором возможно получение максималь- ного удоя от нормальных коров; 238 ' . '
Таблица 81 Выравнивание эмпирического ряда регрессии удоя за 300 дней лактации (у) по лактациям (х) способом наименьших квадратов: y=a*&bx-$-cx2‘, aZx^-b'Zx2‘-\-cZxs='Zyx, аЪх^ЬЪхЪ+сЪх^Ъух* Определение параметров уравнения Построение теоретического ряда х, лак- тации 1 X* Я3 X1 У' ух ух2 М+) суЦ-) у1 У'—У 12 144 1728 20 736 24 288 3 456 49,38 42,87 23,56 0 11 121 1331 14 641 26 286 3 146 55,26 36,02 26,29 0 10 100 1000 10 000 29 290 2900 41,15 29,77 28,43 —1 9 81 729 6 561 29 261 2 349 37,03 24,11 29,97 + 1 8 64 512 4 096 30 240 1 920 32,92 19, 05 30,92 +1 7 49 343 2 401 32 224 1 568 28,80 14,59 31,26 —1 ' 6 36 216 1296 31 186 1 116 24,69 10,72 31,02 0 5 25 125 625 30 150 750 20,57 7,44 30,18 0 4 I 16 64 256 30 120 480 16,46 4,76 28,75 —1 3 9 27 81 27 81 243 12,34 2,68 26,71 0 2 4 8 16 23 46 92 8,23 1,19 24,09 +1 1 1 1 1 21 21 21 4,11 0,30 20,86 0 78 650 6084 60 710 | 332 [ 2193 | 18 041 1 12a+78&+650c=332 78a-|-650H-6084c=21’93 г/=+17,05+4,115х—0,2977№ 650а4-60846ф60 710с=18 041 Ь, с.— параметры параболы второго порядка, найденные, при вырав-. н.ивании эмпирического ряда регрессии лактационных удоев по. лактациям. В разбираемом примере при уравнении регрессии у= + 17,05+4,115х—0,298х2, Ь = + 4,115 и с — —0,298, поэтому у =----£’ 115— — 6,88 -'г 7 отелов. 2-(—0,298) Установление стандартов удоя за разные лактации можно произвол дить, наметив предварительно три исходные величины: У\ — удой за первую лактацию (например, 3000 кг), ' А—удой за максимальную лактацию (например, 6000 кг), Т — номер максимальной лактации (например, 6-й). По этим данным можно найти параметры уравнения у=а + 6х+сх2; — _ А ~~_ 6000 ~~3000 — _ 120 ~ (Т—1)а (6—1)а ~ Ь = — с-2Т = — 120-12 = + 1440, а = ух — b — с « 3000 — 1440 + 120 = 1680. По найденным параметрам строится теоретический ряд удоев по лактациям. Значения этого ряда (табл. 83) и являются искомыми стан-, дартами удоя. 239.
сч QO <л ST - с< 2356 2671 2356 со II ч | сч \о СО о са - с? СО сч СО 8 СО II СЧ сч 1 ^4 со О о 00 сч 5? о II СО 00 II СЧ сч 1 со 00 со о со о сч ОН II СО ст> II сч сч 1 , со сч со о ЛЬ оо мЫ сч о со со 8 II сч СО 1 ю СО 00 ' сч ъ со о со [**,, сч II СО II 5 сч со «а о. « 1 >со о а о 00 * <£> сч о S со со о II я сч со я 1 со о« 00 00 с мьй о Ю о •“Ч 00 о с со со о II 4) сч со S •Я 4) ь. 1 со ч о ю со s м* 00 ю о сч СО 00 II «а сч сч 1 о о со со нМ «май сч со СО II сч сч 1 _ о о * сч сч 8 II СО II сч сч 1 Q0 со СЧ 00 1 t со •чМ сч 00 || со о II сч сч я <и о дс W о я Я К со р- S о- -f « 5 -• га Е5 !СКИЙ табл о G s 9» (U ч (U иче по * к (D Ч S я )рет кг) g 3* о я (D '**' л н са 240
Множественные прямолинейные функции вида у=а + bx + cz Пример 90. Способ наименьших квадратов применим и в случае нахождения теоретического ряда функции по двум аргументам. Напри- мер, при нахождении способов определения живого-веса у по двум про- мерам (обхвату груди х и косой длине туловища z) для первой ориен- тировки были измерены и тотчас же после измерения взвешены 10 ко- ров средней упитанности. Таким обра'зом, для каждого животного было определено три при- знака, из которых один (вес) считался функцией двух остальных. Было сделано допущение, что зависимость веса от каждого промера прямо- линейна и формула регрессии имеет следующее строение: у = а + bx + cz. Определение выравненных значений функции, а также теоретиче- ских значений веса по каждому промеру показано в табл,- 84. Столбцы х2, z2, xz, ух, yz обычно цифрами не заполняются, так как при наличии арифмометра и других счетных машин требуемые значе- * Таблица 84 Нахождение теоретических значений функции (живого веса у) по двум аргументам— обхвату груди х и косой длине туловища г—и по одному из этих аргументов: an+62x+cSz=Sy, y=a-\-bx-^-cz, a2x+&2x2+c2xz=2yx, aSz+6Sxz+c2z2=Syz, у=а-\-Ьх, an+6Sx=Sz/, a2x+6.2x2=2yx, y=a-^-bz. an+62z=2y, a2z+62z2=2yz Нахождение параметров уравнения Функция двух Функция одного /' аргументов аргумента X z У хг 1 z2 , XZ ух ; г» bx CZ v'xz Ух Уг Дг , 200 180 630 40 000 32 400 36 000 126 000 113 400 406,0 327,6 631 + 1 598 —32 659 +29 200 160 600 406,0 291,2 595 -5 590 —10 579 —21 180 150 540 365,4 273,0 536 —4 529 —11 540 —0 180 120 480 365,4 218,4 482 +2 529 +49 420 —60 160 140 480 - 324,8 254,8 477 —3 460 —20 500 +20 160 130 450 324,8 236,6 459 +9 460 +10 460 +ю 160 120 440 324,8 218,4 441 + 1 460 +20 420 -20 140 110 390 • . . 284,2 200,2 382 —8 392 +2 381 —9 120 100 330 . . . 243,6 182,0 323 —7 323 —7 341 + Н 100 90 260 10 000 81 000 . 9 000 26 doo 23 400 203,0 163,8 265 +5 254 —6 301 +41 160o|1300 4600 2 656 000 176 000 215 400^769 000 625 800 21 A | М\A 1 45 4,5 167 16,7 221 22,,1 | У'хг=2> 03jc+1 > 82z~102 2 | у'х=3,44х—90 | yz=3, §7z—56 10а+1600&+1300с=4600 1600а+265 6006-4-215 400с=769 ООО 1300а+215.4006-4-176 000с=625 800 Юа+16ОО6=46ООО 1600а+265 6006=769 000 10а+1300с=4600 1300а+8100с=625 800 16 Н. А. Плохинский 241
ния Sx2, Sz2' и т. д. получаются путем постепенного накапливания ре- зультатов суммирования произведений или квадратов. Оказалось,, что живой вес можно определить по следующим форму- лам. 1. По двум Промерам у'х = 2,03х+ 1,82s — 102,2. 2. По обхвату груди у*=3,44х— 90. 3. По косой длине туловища у'г = 3,97s — 56. Сравнение точности определения одной функции различными спо- собами можно сделать по среднему отклонению теоретических значений от эмпирических, которое рассчитывается по формуле М = Ъ\у'-у\t , и п где М |д| —средняя арифметическая из абсолютных значений оши- бок, | Д | = | у-—у'\—абсолютное значение ошибки при определении функ- ции по-одному или нескольким аргументам, п — число определений. В табл. 84 показан расчет этих показателей точности (средние ошибки): по двум промерам Л1| д । =4,5/сг, по обхвату 2И| д । = 16,7 кг, по косой длине ,туловища Л4| д । =22,1 кг. Очевидно, определение веса по двум промерам будет значительно* точнее, чем по каждому промеру в отдельности. Уравнение функции по двум аргументам можно получить и другим способом: на основе вычисления средних арифметических, средних квад- ратических отклонений по функции и по'каждому аргументу и коэффи- циентов корреляции между функцией и каждым аргументом, и между обоими аргументами. Этот способ применяется при наличии’большого количества исходных данных, когда суммирование первичных дат, их. квадратов и их произведений становится затруднитёльным. В таких случаях для определения функции по двум аргументам составляются три корреляционные решетки: для функции и первого- ' аргумента, для функции и второго аргумента и для первого и второго аргументов. По решеткам рассчитываются три необходимых коэффици- ента корреляций, три средние величины и три сигмы. По этим данным определяются два частных коэффициента регрессии: У?12-з = й, /?1з.г=с и „свободный член уравнения а. Таблица 85 Промеры и вес мясного скота Признаки Af (У Г Убойный вес (1) 131 /й 43 кг г 12“Ч“0, 85 Обхват груди (2) 156 см 16 см г 1з=4-0,75 Косая длина туловища (3) . 143 см 15 см г23 1~0» 70 242
Например, при нахождении способа прижизненного определения убойного веса, т. е. веса парной туши после стандартной разделки (1), по двум промерам —обхвату, груди (2) и косой длине туловища (3) получены следующие исходные данные по 2500 животным (табл. 85). По этим данным можно получить уравнение множественной регрес- сии следующим образом: __ п ____ ^12 — г1зг23 Щ 0,85 — 0,75 • 0,70 43 ___ уJ. — 12'3 ~ 1 ~ Нгз = 1 — 0.702 ’ Чб~~ + ’ с _ п ____ г1з — ri2-Газ Щ _ 0,75 — 0,85-0,70 43 __ -|- 0 87’ “ 13-2 “ 1 —г|2 ’ <т3 1 — 0,702 15 " ’ ’ а = — ЬМ2 — сМ3 = 131 — 1,71 • 156 — 0,87-143= —260,17; у' = —260,2 + 1,71х + 0,872. Если обхват груди равен 160 см, а косая длина туловища 150 см, то количество мяса (на- костях) от такого животного ' у' = 1,71 -160 + 0,87-150 — 260 = 144,1 кг. Составив по данным, полученным из этой формулы, таблицу, мож- но в дальнейшем пользоваться ею для определенйя убойного веса без вычислений (табл. 86). Верхняя строка и левый столбец приведены только для иллюстрации способа построения подобных таблиц. Таблица 83 Прижизненное определение убойного веса (у) крупного рогатого скота по обхвату груди (х) и косой длине туловища (z): (/'=l,71x+0,87z—260 1 0,87 Z 1,71л: V\ X. X z \ 239,4 248,0 255,5 265,1 273,6 282,2 290,7 140 145 150 155/ 160 165 170 152,3 175 183 147,9 170 170 179 143,6 165 157 166 174 139,2 160 144 153 • 161 ' 170 134,9 155 131 140 149 157 166 130,5 150 . 118 127 136 144 153 161 126,2 145 106 114 123 131 140 148 121,8 140 101 ПО 118 , 127 135 117,5 135 97 105 ид 123 113,1 130 93 101 по 108,8 125 88 97 104,4 . 120 84 - — Для того чтобы, пользуясь такой таблицей, определить искомый вес, надо во второй строке сверху (х) найти значение первого аргумен- та— обхвата груди, например 160, в левом столбце (г) отыскать значе^ ние второго аргумента — косой длины туловища, например 155, и на их пересечении прочитать искомый вес—149. Нахождение прямолинейной функции по двум аргументам можно производить и по номограмме, состоящей из трех вертикальных шкал. Одна шкала (левая)—для первого аргумента, другая (средняя)—для функции и третья (справа) —для второго аргумента (рис. 36). Прило- жив концы натянутой нитки к значениям обоих аргументов (на крайних 16* 243
шкалах), можно найти значение функции на пересечении этой нитки со Средней шкалой. На рис. 36 показаны три примера нахождения искомого веса. 4 Схема построения подобных номограмм дана на рис. 37. Расстояние между шкалами хну устанавливается пропорционально с — коэффи- 170 2 - 165 Ё- 160 2 1552 150 2 145 \ 140 ~- 13&- Обхват груди, см У = - 260+1,71х+0,87г У кг190 5-ш --'--ПО----- -160 -150 -145----- -130 -120 -110-^. -100 - " -90 -80 \-70 Удойный вес, кг У- / 5~- 5' 5- 5- 5- 5- 5- г ~з170 Ё 165 \l6D z155 \150 2146 2140 2.135 2130 2125 2120 3115 Косая длина туловища, см X Р к(Ь + с) г м М КС 5,0(1,71 +0,87) мм к.в 50 0,87мм 50 1,71 мм х = 156 /= 131 г = 143 " Масштаб (Ъ+с)71 . 2,58мм -1см Ъромера Масштаб 1h 1мм-1кг веса - Масштаб (Ь+с)1) 2,58 мм -1см промера <г Рис. 36. убойного веса у по двум аргументам: обхвату груди х и косой длине туло- вища г. Примеры: I. %=170; г=160 у = 170; II. jc=160, z=145, j/=140; III. х= 150, z=130, у = 110 Номограмма для определения - Рис. 37. £хема построения номограм- мы для определения функции по двум аргументам по уравнению г/=—260 +1,71 х+0,87z циенту при z, а расстояние между у и ,z— пропорционально b—коэф- фициенту при х. ' Номограмма на рис. 36 построена по формуле у ——260+1,71 %+ + 0,87 г. Поэтому расстояние между у и х равно 50-0,87 = 43,5 мм, а между у и z — 50-1,71=85,5 мм. Затем на шкалах на одной прямой наносятся значения средних по аргументу х, по функции у и по аргументу z. На рис. -36 этим точкам соответствуют на шкале х—156 см, на шкале у—131 кг и на шкале z—143 см. . , И, наконец, масштабы шкал устанавливаются таким образом, что- «бы при делении шкалы у, равном единице, деления шкал обоих аргумен- тов были равны одинаковой величине, равной сумме коэффициентов яри х и z. - На рис. 36 взяты следующие масштабы: на шкале у 1 мм соответ- ствует 1 кг веса, на шкалах х и z 1,71 + 0,87 = 2,58 мм соответствует .1 см промера. При пользовании номограммой значительно ускоряется процесс на- хождения функции по двум аргументам. Вместо натянутрй нити лучше. ’Пользоваться прозрачной линейкой, у которой на нижней плоскости ’нанесена тонкая прямая черта. 1244
, ЧАСТНЫЕ СПОСОБЫ ВЫРАВНИВАНИЯ ЭМПИРИЧЕСКИХ РЯДОВ к частным способам выравнивания относятся такие, которые раз- работаны для выравнивания функций определенного вида — параболи- ческих (полиномы Чебышева), асимптотических, логистических, перио- дических. СПОСОБ ЧЕБЫШЕВА (ВЫРАВНИВАНИЕ ПАРАБОЛИЧЕСКИХ ФУНКЦИЙ) Выравнивание параболических функций при наличии равномерного ряда регрессии может быть значительно упрощено применением спосо- ба Чебышева. По этому способу ряд значений аргумента заменяется рядом чисел Чебышева, которые берутся из специальных таблиц. В этих таблицах ряды чисел Чебышева даны для" парабол первых трех порядков и для градаций аргумента в пределах от г=5 до г = 32. - Для параболы первого порядка берется один ряд чисел Чебыше- ва— pi, для параболы второго порядка берется два ряда чисел Чебы- шева — pi и р2, а для параболы третьего порядка берется три ряда чисел Чебышева — р\< ръ, рз- Каждое число Чебышева умножается на соответствующее значение функции у, все произведения данного ряда складываются и полученная сумма 'делится на сумму квадратов чисел Чебышева (приведенных' в табл. XIV) Zypt ' 2р? ’ Из полученных выражений можно составить общий полином (мно- гочлен) Чебышева: у = а + ₽рх + ур2 + др3, где а — —----свободный член полинома, Г R = 2ypl v = ,ZyPa 6 = 2уРз Ър] ’ ’ 2р| Частный полином Чебышева для параболы первого порядка вклю- чает первые два члена общего полинома: У\ = а + для параболы второго порядка-—три первых члена общего полинома? = а + ₽р1 4- ур2, а для параболы третьего порядка — все четыре члена полинома: У'з = а + ₽рх + ур2 + й/)3. При использовании способа Чебышева значительно облегчается вы- числительная техника по нахождению теоретического- ряда функции и имеется возможность постепенно повышать порядок параболы, что поз- 245
волит результаты всех предыдущих вычислений' использовать для даль- нейших расчетов. Применение способа Чебышева можно показать на следующих примерах. Парабола первого порядка у = а + Пример 91. Накопление клетчатки в кормовых травах в некото- рых случаях идет пропорционально возрасту растений, следовательно, ряд регрессии этой функции может быть выражен уравнением параболы первого порядка. Таблица 87 Выравнивание эмпирического ряда регрессии содержания клетчатки в озимом рапсе (у) в зависимости от возраста растения (х). 3»=«+₽!Р1 25/VI 5/V1I 15/VII *25/VII • 5/VIII r=5 У. % 1,2 2,1 3,4 3,7 4,9 2p=15,3 . Числа, Чебышева (по табл. XIV) —2 —1 0 +1 +2 ' Sp*=10 УР1 —2,4 -2,1 0 +3,7' +9,8 2//Pi—+9,0 РР1 —1,8 —0,9 - 0 +0,9 . +1,8 = +0,9 10 У' 1,3 2,2 3,1 4,0 4,9 15,3 a— — ^3,1 5 у'—у +0,1 —0,1 —0,3 +0,3 0,0 У'—3„ 1—р-0,9pi Анализы зеленой массы озимого рапса через каждые 10 дней за период с 25/V по 5/VIII показали следующую динамику содержания клетчатки в этом растении. Дата укоса 25/VI 5/VII , 15/VII . 25/VII 5/VIII Содержание клетчатки, % 1,2 2,1 3,4 3,7 4,9 Длй вскрытия закономерности накопления клетчатки в данном рас- тении и получения возможности определить содержание клетчатки на 'любую дату потребовалось выравнять имеющийся эмпирический ряд. Все-немногочисленные и простые действия, необходимые для этого, по- казаны в табл. 87. Оказалось, что накопление клетчатки в озимом рапсе идет по зако- ну у'= + 3,1 + 0,9pi. В пределах сезона с 25/VI по 5/VIII получается увеличение содержания клетчатки в среднем на 0,9% за каждые 10 дней. ' Чтобы использовать это уравнение регрессии для нахождения зна- чения функции при любом значении аргумента, достаточно теоретиче- ский ряд нанести на график и использовать его в качестве номограммы. График-номограмма накопления клетчатки в растениях озимого рапса показан на рис. 38. Пунктиром отмечено содержание . клетчатки на 31 июлй — 4,5%. В формуле, полученной по способу Чебышева, аргументом является условное число pi. Во Многих случаях это не имеет значения, так как 246
целью выравнивания считается получение теоретического ряда функции. В случаях, подобных разбираемому примеру, даже и не принято выра- жать аргумент — возраст озимой культуры — в обычных единицах (в месяцах или днях, прошедших от посева). Переход к формуле, в которой аргумент выражен не условным чис- 1 лом pi, а в обычных единицах измерения, при параболе первого порядка можно осуществить следующим образом. Рис. 38. Парабола первого порядка. Содержание клетчатки в зеленой массе озимого рапса по срокам укоса Для получения в формуле z/ = a-hta коэффициента при аргументе нужно разность любых двух членов теоретического ряда функции раз- делить на разность соответствующих значений аргумента (см. рис. 33а) ь= Уд-Уд, = 69,9 — 32,1 = —|^ 37,8 == 5 4 Ю-^-З 7 -+- > • Для определения свободного члена нужно из первого теоретическо- го значения функции вычесть произведение первого значения аргумен- та на коэффициент при аргументе: ' • а=г/' — tai = 32,1 — 5,4 • 3 = +15,9. В результате получаем уравнение ' У — + 15,9 4- 5,4х, точно такое же, что и способом наименьших квадратов, (см. рис. 33а) ио гораздо более простым путем. : 247
Парабола второго порядка у' — я + + ур2 Пример 92. При изучении содержания протеина в зеленой массе гороха, используемого в качестве пастбищной культуры, брались проб- ные укосы в стадиях бутонизации (10/VI), цветения (I5/VI и 20/VI), образования бобов (25/VI, 30/VI и 5/VII) и молочной спелости (10/VII). Результаты анализа показали, что содержание протеина при переходе от стадии бутонизации к стадии цветения уменьшается, а затедо в стадии образования бобов начинает увеличиваться. Таблица 88 Выравнивание эмпирического ряда регрессии содержания протеина в зеленой массе гороха (у) по возрасту, измеряемому сроками укоса (х) способом Чебышева: У'=а+₽Р1+Гр2 X 10/VI 15/VI 20/VI 25/VI 30,VI 5/VII 10/VII r=7 УЩ>) 3,0 2,7 2,3 2,4 3,3 4,2 4,9 2y=22,8 Р1 —3 —2 —1 0 + 1 +2 +3 2p*=28 ' Pi 4-5 0 —3 —4 —3' - . 0 +5; 2p22=84 УР1 _ —9,0 —5,4 —2,3 0 +3,3 +8,4 + 14,7 2j/Pi=+9,7 УРг +15,0 0 —6,9 —9,6 -9,9 •0 +2.4,5 ^yp2= ~F 1 з, 1 ₽Р1 —1,038 —0,692 —0, 346 0 4-0,346 4-0,692 + 1,038 _ 7 -+0,346 zo УРг 4-0,780 0 —0,468 —0,624 —0,468 0 4-0, 780 +13,1 y=—-— KO, 156 Y 84 У' 3,00 2,57 2,44 2,63 ' 3,14 3,95 5,08 22,8 a— —4-3,257 у’—У о,о —0,1 +0,1 +0,2 —0,2 —0,2 +0,2 у' = 4-3,264-0,346й4-0,15бр2 ' .Эмпирические данные необходимо было выравнять. Для данного» течения эмпирического ряда это можно сделать по уравнению параболы второго порядка, решение которого . по способу Чебышева приведено» в табл. 88 и показано на рис. 39, который может служить в качестве номограммы для определения содержания протеина в горохе. Для при- мера на рисунке определено содержание протеина на 3 июля. Пример 93. При анализе массовых производственных записей по» кормлению молочного скота и удоям за 300 дней лактации выяснялось, то оптимальное содержание кормовых единиц в различных категориях кормов1, при котором были получены максимальные удои. Такие данные имеются во 2-й части III тома Племенной книги ярославского скота.. Они приведены в табл. 89, в которой показано выравнивание подобных эмпирических рядов по способу Чебышева. Теоретический .ряд приведен на рис. 40. По этому графику, как по номограмме, можно установить,, что в определенных условиях наивысший удой А = 28,24 ц. Он получен при содержании в годовом рационе «38% кормовых единиц, скормлен- ных в грубых кормах. Уменьшение или увеличение содержания грубых, кормов по сравнению с этой оптимальной величиной ведет к снижению» удоя. ’ 248-
Переход от формулы с аргументом, выраженным условными числа- ми pi и р2, к обычным единицам измерения в случае уравнения пара- болы второго порядка у = а+Ьх+сх2 производится следующим образом.. 2 Сроки укоса 10/ - /я 15/ /И 20/ /И 25/ /И 30/ /2Т 5/ / ЮГ 10/ /W А ' — з - 2 — 7 0 - О-1 +• 2 ♦ + 3 Pl +5 ' 0 -3 - 0 —з О + 5, У 3,0 2,7 2,3 2,0 ,3,3 0,2 0,9 у' 3,00 2,57 2,00 2,63 3,10 ‘ 3,95 5,08 ! Рис. 39. Парабола второго порядка. Содержание протеина в зеленой массе кор- k мового гороха по срокам укоса Для получения коэффициента при квадрате аргумента нужно ис- пользовать три равноотстоящих теоретических значения функции, напри- мер 2, 5, 8-е, и три соответствующих значения аргумента (см. рис. 40): — Уч Ув _ ,2 • 27,97 27,67 24,96 ________q 0074 — 2х2_ 2_ 2 ~ 2 • 43,52 — 28,52 — 58,52 ~~ Л2 ,8 . Для получения коэффициента при аргументе в первой степени нуж- но использовать два любых, не слишком близких, теоретических значе- ния функции, например 5-е и 8-е, и два соответствующих им значения аргумента: . ' ь _ (г/8—г/5)~ с(^8~хб) _ 24,96 — 27,97 + 0,0074 (58,52 — 43,52) _ Q х8— х5 58,5 — 43,5 Для получения свободного члена можно использовать любое значе- ние функции и соответствующее ему значение аргумента: а = у2 — bx2 — сх| = 27,67 — 0,554 -28,5 + 0,0074 28,52 = + 17,89. 249s
Таким образом, зависимость удоев от содержания в годовом рацио- не коровы кормовых единиц, выраженных в грубых кормах, определяет- ся уравнением - ' г/'= + 17,89 + 0,554% —0,0074л-2, где х — процент кормовых единиц в грубых кормах. При наличии уравнения регрессии удоя по содержанию грубых кормов можно решить ряд практических задач. 1. Определение удоя для любого содержания грубых кормов в го- довом рационе. Производится путем подставления значения аргумента Рис. 40. Парабола второго порядка. Изменение лактационных удоев в зависимости от содержания в годовом рационе коров грубых кормов в общую формулу и решения ее. Если в тех условиях, в которых лакти- ровали коровы, давалось, например, в годовом рационе 50% кормовых единиц в грубых кормах, то средний удой этих коров • ,у60 = 17,89 + 0,554 - 50 — 0,0074-.502 = 27,09 ц. 2. Определение оптимального содержания грубых кормов в годовом рационе производится следующим образом: Т =-----— =-------* —- = + 37,43, 2с 2-(—0,0074) Найденная величина показывает, что для изученных молочных ко- ров при определенных условиях наилучшее содержание в годовом раци- юне грубых кормов (выраженных в кормовых единицах) составляет 37,43%. 250 ,
' Таблица 80 Выравнивание эмпирического ряда регрессий удоя за 300 дней (у), по содержанию в годовом рационе грубых кормов (х) способом Чебышева: 251
3. Определение максимального значения функции: А = а+ -^-Т = 17,89 + -^|^--37,43 = 28,26 ц. ' Парабола третьего порядка у = а + г^р1 + ур2 + *Рз Пример 9,4. Изучался урожай зеленой массы культур зеленого конвейера в зависимости от даты стравливания. Брались пробные укосы через каждые 5 дней с 5/V до 15/VII. Для каждого укоса определялся урожай зеленой массы в центнерах с гектара. Для выявления закономерностей изменения урожая, определения возможного урожая эмпирический ряд средних урожаев (у) по пяти- дневкам'(х) был выравнен. Так как никаких предположений о форме: изменений урожая не было, выравнивание эмпирического ряда прово- дилось по уравнению параболы первого порядка, затем второго и, нако- нец, третьего порядка. При использовании способа Чебышева это можно» сделать с минимальными затратами времени: надо произвести все дей- ствия, необходимые для решения уравнения параболы третьего порядка; тогда для решения уравнений параболы первого и второго порядков никаких дополнительных действий не потребуется. Такое выравнивание показано в табл. 90 и на рис. 41. Если предположить, что увеличение урожая зеленой массы пропор- ционально числу дней, прошедших от 15/V, то следует использовать, уравнение параболы первого порядка: у' = 130,52 + 8,29ft, Сопоставление теоретического ряда, рассчитанного по уравнению* параболы первого порядка_ с эмпирическими данными, выявляет значи- тельные расхождения теоретических и фактических значейий. Средняя из абсолютных отклонений теоретического ряда от эмпирического ве- лика— Л4| д । —11,8 ц]га. Если предположить, что увеличение урожая постепенно замедляет- ся, то следует использовать уравнение параболы второго порядка: у" = 130,52 + 8,29ft— 0,234р2, в котором первые два члена соответствуют правой части уравнения' параболы первого порядка. Расхождение теоретического ряда с факти- ческим в этом, случае несколько уменьшается, но все еще остается зна- чительным. Средняя из абсолютных отклонений теоретического ряда от фактического М\ Д | =8,2 ц/га, теоретическая линия регрессии во многих пунктах далеко проходит от эмпирической- - ' Если, наконец, предположить, что урожай по мере роста трав сна- » чала увеличивается с возрастающей, а.затем с уменьшающейся скоро- стью, которая в определенный срок становится равной нулю, после чего= он начинает уменьшаться, то необходимо использовать уравнение пара- болы третьего порядка: у’” = 130,52 + 8,29ft — 0,234ft — 0,465р3, -в котором первые три члена соответствуют правой части уравнения па- раболы второго порядка. В этом случае получено наилучшее соответствие теоретических уро- жаев с фактическими: средняя из абсолютных ' отклонений теоретиче- ского ряда от эмпирического имеет наименьшую величину /И|д| = 252
= 3,3 ц/га, теоретическая линия регрессии очень близка к Эмпирической <см. рис. 41). . Перевод уравнений регрессии с условными аргументами pi, р2-п рз, полученных' по способу Чебышева, в уравнения с фактическими аргу- ментами для разбираемого примера производится следующим образом. У > к 200 и! ЯП 20 200 80 у'" =81,43-6,405х-> у"= ~52,6+5,695х у'=-10,42+3,315й А? 40 20 Урата й зеленой массы, и /га s 60 100 ’ 49 80 20 / S 60 / ^ ЧОО 40 80 20 60 4-0 S'/ 20 Сроки стравли- вания 15/у 2°/? 30/7 5/ *1 15 20 25 30 Л У 42 50 60 75 11 у'" 41,8 48,7 62,5 81,4 Юз У" 26,5 50,1 72,3 93,1 112 У' 39,4 55,9 72,5 89,1 10Ь <-0,2879х2- 0,00248 х 3 'у'" - 0,028 X2 - У" у' • !В 'Чв % !7в 3Ь !/ W7 5 40 45 50 55 60 65 70 0 130 155 165 184 202 200 193' ' 1,6 127,2 150,3 171,0 187,6 -198,1 200,6 193,5 2,5 130,4 147,0 162,2 175,9 188,3 199,3 208,8 7,7 122,2 138,8 155,4. 172,0 188,5 205,1 221,7 .Рис. 41. Параболы повышающихся 'порядков. Урожай зеленой массы культур зеленого конвейера по срокам скармливания 1. Для параболы первого порядка надо два любых теоретических значения функции, например уц =205,1 и у2 = 55,9, и соответствующие «фактические значения аргумента (число дней, прошедших с 1/V) Хц = 65 я ^2=20 подставить в формулы • । ' , । Уц— У2 205',1 —55,9 .. „ о,_ о — -------=-------------= - - 3,316, хп — х2 65— 20 а = у2 — &х2 = 55,9 — 3,316 -20 = 10,42. 253
Таблица 9Q Выравнивание эмпирического ряда регрессии урожая зеленой массы (у») с последовательным повышением У —“+₽Л,- у'=я+£р1+т/,2; В качестве первоначального аргумента взято X 1 2 3 4 5 6 7 15/V 20/V 25/V 30/V 5/VI 10/VI 15/VI *1 15 20 25 30 35 40 45 У - 42 50 60 75 ПО - 130 155 Pi —И —9 —7 —5 —3 —1 + 1 Р1 +55 +25 —17 —29 —35 • —35 Рз —33 ' +з +21 +25 + 19 ’ +7 —7 УР1 —462 —450 —420 —375 —330 +130 + 155 УРз +2310 + 1250 +60 — 1275 —3190 —4556 ‘ —5425 . УРз — 1386 + 150 + 1260 . + 1875 +2090 ' +910 + 1085 ₽Р1 —91,16 —74,58 —58,01 —41,44 —24,86 —8,29 +8,29 УРз —12,87 —5,85 —0,23 +3,98 +6,79 +8,19 +8,19 &Рз ./ +15,35 —1,40 —9,77 —11,63 —8,84 —3,26 +3,26 /У' 39,4 . ’55,9 72,5 89,1 105,7 122,2 138,8 у" , 26,5 50,1 72,3 93,1 112,5 130,4 .147,0 У'" 41,8 48,7 62,5 81,4 ' 103,6 127,2 150,3 'у'—У +3 +6 +13 +14. —4 —8 —16 у"—У —15 0 +12 +18 +3 0 —8 у'"—У 0 — 1 +3 +6 —6 —3 —5 в зависимости от даты стравливания (х) способом Чебышева порядка уравнения параболы: 3*,/,=а+₽Pi+YPa число дней xlt прошедшее от 1 мая 8 9 10 11 12 r—12 20/VI 25/VI 30/VI 5/VII 10/VII 50 55 60 65. f 70 + 1566 a=- =+130,515 ' 165 184 202 200 193 Sr/=+1566 +3 ’ +5 ' +7.’ +9 + 11 2pj=572 —29 . —17 + 1 +2^ +55 ' 2pg=12 012 —19 —25 —21 —3. +35 2p|=5 148 +495 +920 + 1414 + 1800 +2 123 2ppi=+4740 —4785. —3128 +202 +5000 +10615- ^yPi=—2816 —3135 —4600 —4242 —600 +6 369 2pp3=—2394 • +24, 86 +41,44 / +58,01 +74,58 +91,16 „ +4740 ₽=z-—=+8,287 572 —2 816 +6,79 +3,98 —0,23 —5,85 —12,87 у= =—0,234 \ 12 012 - -2 394 +8,84 + 11,63 +9,77 + 1.40 —15,35 6= =—0,465 5 148 155,4 172,0 188,5 205,1. 221,7 1 4 . 162,2 175,9 188,3 199,3 208,8 X 1 - , 171,0 187,6 198,1 200,6 193,5 —10 • -12 —13 +5 +29 Л4|Д ] =141:12=11,8 —3 —8 —14 —1 +16 Л4|д| =98:12=8,2 +6 +4 —4 + 1 + 1 Al, д ,=40:12=3,3 255. 254
^Получим у' = — 10,42 4-3',316х. 2. Для параболы второго порядка надо три лщбых равноотстоящих •теоретических значения функции, например г/з =72,3, у7 =147,0 и г/п = = 199,-3, и соответствующие фактические значения аргумента х3 = 25, .х7—45 и хп=65 подставить в формулы „ . 2У7-Уз~У\\ 2 - 147,0 —72,3— 199,3 „ С = ------------- == --------------------- —U.vZo, 2 452 — 252 — б52 b = у11 — С(ХТ1 — ^з) = 199,3 — 72,34-0,028(653 — 25?) 5 ggg xu — х3 65—25 ’ а = у2 — Ьх2 — сх| = 50,1 — 5,695 • 20 4- 0,028 • 202 = — 52,60, у" = _ 52,6 4- 5,695%! — 0,028x2. 3. Для параболы третьего порядка надо из четырех теоретических ^равноотстоящих значений функции, например уз =62,5, уе =127,2, л/э =187,6 и г/12 = 193,5, и соответствующих значений фактического аргу- мента Хз=25, Хе = 40, х9=55, Xi2=70 .составить систему теоретических уравнений и таблицу первых, вторых и третьих разностей. Система теоретических уравнений для параболы третьего" порядка „должна включать четыре уравнения с четырьмя выбранными теоретиче- скими значениями функции и с соответствующими значениями аргумен- та в первой, второй и третьей степени. Первые разности функции и ар- гументов составляются путем вычитания из каждого последующего зна- чения предыдущего. Вторые разности составляются путем такого же ^вычитания первых разностей, третьи разности составляются по вторым,. , Составление теоретических уравнений и системы разностей пока- ..зано в табл. 91. - ' ^Таблица 91 Составление теоретических уравнений и системы разностей для примера 105 1. Теоретические уравнения: , >, p=a-4&x4rcx2-|-dx3 62,5=а-р25&-|М525с+15 625d 127,2=a-f> 40&41 600с+65 000d 187,6=О556-Ь3025с-Н66 375d 193,5=0706+4 900с-4343 000d . 2. Разности: Д'г/ Д'х Д-х2' Д'я3 Д'г/ Д"Г Д'7 л3 . Д'-’г/ Д'”х» 64,7* 15 975 48 375 —4,3 450 54 000 —50,2 ' 20 250 60,4 15 1425 102 375 —54,5 450 74 250 5,9 15 1875 176 625 *)127,2—62,5=64,7; 187,6—127,2=60,4; 193,5—187,6=5,9. '256
Используя полученные разности, можно рассчйтать параметры уравнения y = a + bx + cx2 + dx3 по следующим формулам: d= АХ = = _ 0,00248, Д"'х3 20 250 с \"y — d\"x3 = —4,3 + 0,00248 54 000 _ Q 2879 — Д"х2 ~ 450 b _ А'у — сД'х2 — dA'x3 _ 64,7 — 0,288 975 + 0,00248 48.375 = __ 6 4Qg , Д'х 15 а = у _ bx — сх3 — dx3 = 62,5 + 6,405 • 25 — 0,2879 • 625 + + 0.Д0248- 15625= +81,43. Проверка: о’= 193,5 + 6,405 -70 — 0,2879 -4 900 + 0,00248 • 343000 = +81,44. Таким образом, уравнение регрессии с фактическими аргументами для разбираемого примера будет иметь следующий вид: ' ' р'"= +81,43 — 6,40.5х + 0,288х2 — 0,00248х3,. где х — число дней, прошедших с 1/V, у"' — урожай (ц!га) зеленой массы кормовых культур зеленого кон- вейера. Это уравнение можно использЪвать для решения некоторых практи- ческих зада-ч. 1. Определение возможного урожая на любую дату. Для э'тбго в формулу подставляется значение х, равное числу дней, прошедших до этой даты от 1 мая: у27 = 81,43 — 6,405-27 + 0,2879-729 — 0,00248- 19 683 = 69,5 ц/га. При нахождении теоретических значений функции для таких зна- чений аргумента, для которых не была измерена функция, необходимо помнить, что уравнения регрессии могут быть попользованы главным образом для интерполяции. Экстраполяция по этим уравнениям может быть допущена только для ближайших одного-двух интервалов в ту и другую сторону. 1 * 2. Определение значений аргумента, соответствующих максималь- ному или минимальному значениям функции. Для уравнения параболы третьего порядка это можно сделать следующим образом: а) найти первую производную функций и приравнять ее нулю: f(x) = + 81,43 — 6,405х + 0,2879х2 — 0,00248х3, f (х) = 6,405 + 0,5758х — 0,00744х2 = 0; б) решить полученное квадратное уравнение: — 0,5758 + + 0,33154564—0,19061280 , . о — 0,01488 , —0,5758 —+ 0,33154564 — 0,19061280 , х2 =----’--------—Ч ----------------= + 64. — 0,01488 В разбираемом примере максимальный урожай'Зеленой массы был получен на 64-й день после 1 мая, т. е. 4-го июля, а минимальный полу- 17 Н. А. Плохинский 257
чился бы на 13-й день, т. е. 14 мая. Такая экспраполяция в данном случае вполне допустима. 3. Определение максимального значения функции. Для этого нужно1 найденное значение аргумента подставить в общую формулу. Для раз- бираемого примера Утах = + 81,43 — 6,405 64 + 0,288 • 642 — 0,00248• 643 = 200,6 ц/га. АСИМПТОТИЧЕСКИЕ ФУНКЦИИ Асимптотическими называются функции, стремящиеся к определен- ному пределу, которого они достигают теоретически при бесконечно большом значении аргумента. Этот предел называется асимптотой функции. Асимптотическое течение функции наблюдается при возрастных изменениях веса и размеров тела у многих животных и растений, а так- же при изменениях веса животных вследствие непродолжительного голо- дания. - Асимптотический рост В качестве биологической основы асимптотического роста можно взять часто наблюдаемое явление: скорость роста пропорциональна раз- ности между значением функции в данном возрасте и ее асимптотой. Такая закономерность у животных наблюдается после-рождения: сна- чала вес животного и размеры его тела растут с большой скоростью,, а по мере того, как уменьшается та часть, на которую остается дорасти (А:—у), уменьшается и скорость роста. Это может быть описано диффе- ренциальным уравнением которое выражает наблюдаемую закономерность следующим образом:: скорость течения возрастных изменений признака в каждый момент пропорциональна разности между 'максимальным, и текущим значения- ми1 этого признака. । Как указывалось, эта закономерность может быть распространена только на постэмбриональный период (у крупного рогатого скота начи- ная с 2—3 месяцев жизни), так как в эмбриональном периоде животные растут с увеличивающейся скоростью. При использовании приведенного дифференциального уравнения для выравнивания возрастных рядов надо иметь в виду, что значение признака при рождении (у0) не выравнивается по следующим сообра- жениям. ' Разнообразие признака при рождении отчасти уже выравнено' тем,. - что берется средняя величина его; усреднение же различий напряжения '* внешних факторов, создающих разнообразие признака от возраста к. возрасту, здесь не имеет смысла. Эти внешние условия не могли ска- заться на величине признака при рождении. Величина признака при рождении есть сумма прироста за эмбриональный период, а действие внешних агентов в этом, периоде через организм матери, хотя и имеет место, но выражено в значительно более слабой степени, чем в пост- эмбриональном периоде. 258
Интегрируя дифференциальное уравнение роста, получим: ^=k(A-y), ах ' Г _^у__ _ С /lcix J А—у J — In (Л — у) = kx + С. Так как при х = 0 у = уо, то за константу интегрирования можно взять величину С = — In (Л — г/0) = — 1пЕ>, натуральны^ логарифм разности между асимптотой (Я) и величиной признака1 при рождении (уо), т. е. логарифм суммы постэмбрионального прироста. - Тогда вывод формулы асимптотического роста легко сделать сле- дующим образом: ч — In (А —у) = kx + С, — In (Л — у) — kx — In D, In D — In (Л — у) — kx, ln-^=- kx, D » A — у = De~kx, у = A—De~kx. ' При переходе к десятичным логарифмам имеем у —A — DlQ~kx, где А — максимальное значение, к которому стремится возрастной ряд (асимптота), ► D — сумма прироста от рождения до остановки роста, ' k — константа роста, определяющая темп возрастных изменений, х — возраст. Эту общую формулу роста можно вывести и не прибегая к интегри- рованию, если основную закономерность выразить равенством = const, A — yi где yi и г/2 — последовательные значения признака, взятые через равные Промежутки времени. Ряд величин d=A—у, взятых через равные возрастные интервалы, составляет геометрическую прогрессию и, следовательно, ряд логариф- мов этих величин (lg d) есть убывающая арифметическая прогрессия с разностью k, соответствующей константе роста. В арифметической прогрессии всякий член равен первому плюс (минус) разность прогрессии, умноженная на число членов между пер- вым и данным. Еслихпервый член прогрессии lg(^—y0)=lgL>, то какой-нибудь по- следующий член, относящийся к возрасту х, будет равен lgd = IgD— kx. 17* 259
Из этого равенства легко вывести формулу асимптотического роста. lg d— IgD = — kx, lg — = —kx, D — -= 10-**, d — D 10-**, A — y = D-10~kx, у = A — D • 10~**. Здесь A — максимальное значение признака, к которому стре- мится весь ряд; , D = A—уо — сумма прироста за постэмбриональный период; k = —lg~—константа роста, т. е. приращение логарифма раз- Дх ноСти между максимальным и текущим значениями признака в единицу времени; х — возраст, выраженный в любых интервалах. Использование этого уравнения регрессии при выравнивании асим- птотических возрастных рядов можно показать на следующих приме- рах. Пример 95. При изучении возрастных изменений живого веса истобенских быков были установлены средние веса при рождении, в воз- расте 1 года, 2 лет и т. д. (до 11-летнего возраста). Полученный эмпи- рический возрастной ряд живого веса у приведен в табл. 92. Выравни- вание таких рядов производится следующими этапами. Таблица 92 Выравнивание эмпирического ряда живого веса (у) по возрасту (х). Асимптотическая функция у>=4—D-10“kx Эмпирические значения Уо =38 4=600 1 D=4—j/0=562 ; Теоретические значения X У d=A—y Igd IgD—Igd IgD—Igd lgd'=lgD—kx d' У' r. * 0 38 562 2,750 0,000' 2,750 • 562 38 1 236 364 2,561 0,189 0,189 2,510 324 276 2 400 200 2,301 0,449 0,225 2,270 186 414 3 521 79 1,898 0,852 0,284. 2,030 107 493 4 500 100 2,000 0,750 0,18? 1,790 62 538 5 575 25 1,398 1,352 0,270 1,550 35 565 6 575 25 1,398 1,352 0,226 1,310 20 580 7 585 13 - 1,114 ' 1,636 0,232 1,070 12' 588 8 595 5 0,699 2,051 0,256 0,830 6,8 .593,2 9 598 2 0,301 2,449 0,282 0,590 3,9 596,1 10 602 — — — — 0,350 2,2 597,8 И 599 1 0,000 ,2,750 0,250 0,110 . 1,3 598,7 //'=600—562 • Ю-0,240* 2fe'=2,401 Sfc' k=-----=2,401:10=0,240 Г 260
1. Нахождение максимального значения А. Это можно сделать гра- фически или. аналитически. При графическом способе первоначально находится ряд значений lg(^—у), причем за величину А условно при- нимается несколько (не менее трех) значений асимптоты, выбранных на основе рассмотрения эмпирического ряда и эмпирической линии, регрес- сии. При рассмотрении ряда регрессии живого веса по возрасту (см. табл. 92) выясняется, что асимптота должна быть близка к 600 кг. гПо- этому составляются три ряда значений 1g(Л— у): с А = 600, затем с Л = = 610 и Л = 590. Составление этих трех рядов доказано в нижней части рис. 42. Эти ряды, нанесенные на график, показывают разные средние 261
течения. Первой ряд, соответствующий Л = 610, явно загибается квер- ху. Третий ряд, соответствующий А = 590, загибается вниз. Средний ряд, Соответствующий А = 600, дает такое среднее течение, которое очень близко к прямой линии, что легко установить при помощи натянутой нитки или прозрачной линейки с нанесенной прямой чертой. Это обстоятельство — прямолинейность среднего течения ряда lg(A—у) —указывает на то, что асимптотой данного ряда должна быть соответствующая величина А, т'. е. 600. Если среднее течение ряда 1g (А—у) не идет по прямоц, то, значит, величина А выбрана большей или меньшей, чем нужно. В первом слу- чае среднее течение кривой загибается кверху, во втором — вниз. Аналитически максимальное значение признака А можно опреде- лить по формуле л = Уг —г/1Уз 2Уг—(УгФ-Уз) где yi, yz, Уз — эмпирические значения функции, взятые через равные интервалы. Для получения более надежных результатов надо . по указанной формуле определить А для всех соседних.трех значений функции и взять, среднюю величину. 2. Определение суммы постэмбрионального прироста. Для этого нужно из асимптоты вычесть значение признака при рождении: D = А — у0 = 600 — 38 = 562. 3. Определение показателя, темпа роста k. Для каждого возраста составляется ряд величин D=A—у, затем ряд логарифмов этих вели- чин (lg D) и ряд разностей (lgD—Igd). При делении этих разностей на соответствующие возрасты получаются частные значения показателя темпа роста: k, _ lg D -т- lg d х ' . Общий (для данного ряда) показатель темпа роста получается пу- тем усреднения частных значений k': Г Все эти действия показаны в табл. 92. 4. Нахождение теоретического ряда функции производится на осно- ве найденных значений уо, А и k в следующем порядке. Определяется lgd' = lg£)—kx, затем находится d' (по lgd') и, наконец, у'—А—d'. Для разбираемого примера А =600, г/о = 38, D = A~г/о = 6ОО—38 = = 562, lg D = 2,750, k = 0,240. Определение величин d' и у' для каждого возраста показано в табл. 92. Сопоставление теоретического и эмпири- ческого рядов регрессии живого веса истобенских быков по возрасту показано на рис. 43. Пользуясь графиком как номограммой, можно определить значение функции для любого значения аргумента. Например, в возрасте 2,5 лет наиболее вероятный вес истобенских быков в сходных условиях будет равен 450 кг. При помощи выравненного возрастного ряда асимптотической функ- ции можно решить следующие задачи, имеющие практическое значение. Можно определить биологическую скороспелость признака, если 262
условиться, что среднее значение биологической скороспелости для оп- ределенной группы объектов и в определенных условиях соответствует возрасту практической остановки роста при достижении признаком 99% от своего максимального значения. Такой показатель биологической ско- роспелости признака определяется по формуле т lgO-lgT + 2. . k D — сумма прироста в постэмбриональном периоде; А — асимптота функции; , Д 1g (Л — у) к = —— константа роста. Рис. 43. Асимптотическая функция. Возрастные изменения живого веса исто- бенских быков Для разбираемого примера /1 = 600, 0 = 562, k^=0,240, 2,750-2,7T8t.2=2i?4 = 8,2 ГОДЭ. 0,240 0,240 Кроме биологической скороспелости признака можно определить и' условную, или хозяйственную*-скороспелость, измеряемую возрастом достижения функцией определенной величины, например 500 кг-веса для животных опрёделенной категории. Показатель условной, или хозяйственной, скороспелости определяет- ся по формуле , __ Ig.D — lg (Л — ym) m ' k ' где ym — заданная величина живого веса. 263
Если за показатель условной, или хозяйственной, скороспелости принять возраст, при котором быки достигают веса в 500 кг, то для раз- бираемого примера , 1g 562 — 1g (600 — 500) _ 2,750 — 2,000 „ . —------------------ — — o,i года* 5 0,240 0,240 Пример 96. Изложенный выше способ выравнивания'возрастных асимптотических рядов применим в тех случаях, когда имеются данные о значении признака при рождении. При отсутствии таких сведений можно пользоваться формулой у = A— dr • 10-^-^), j где di=A—t/i — сумма прироста от первого значения возрастного ряда до асимптоты, Xi—возраст, с которого начинается данный ряд. Эта формула отличается от основной тем, что вместо величины D—A—у0 берется величина d[ = A—у\ и вместо аргумента х берется разность между текущим и первым Значением возраста: x—xi. Кроме того, в этом случае и первое имеющееся значение функции выравнивается так же, как все остальные эмпирические значения, так как оно не имеет всех тех особенностей, которые свойственны признаку при рождении. Если эту формулу после небольшого преобразования прологариф- мировать, то получим у = A — А — у = djO^-^, lgd = lgd1 + ^(x — хг), т. е. уравнение параболы первого порядка, которое легко решается спо- собом наименьших квадратов; два неизвестных lg dj и k нахрдятся ш> двум нормальным уравнениям: nlgd1 -J- kZ (х — x1) = 21gd, 2 (х — хх) lg dx 4- £2 (х — хг)2 = 2 (х — хх) lg d. Выравнивание по формуле у=А—dil0~k<x~Xi) показано в табл. 93 на примере расчета теоретических значений живого веса сычевских по- мёсей. ' , Определение асимптоты проведено указанным выше графическим, срособом. Оказалось, что А = 470. • , В таблице для каждого возраста указаны величины, необходимые для составления нормальных уравнений: х,'у, d = А — у, lgd(x —xj, (х — %i)2, (х —xjlgd. Решение системы нормальных уравнений путем постепенного исключе- ния неизвестных дало следующие результаты: lgd1= 1,856, d1 = 72, £ = — 0,1312. Таким образом, уравнение регрессии запишется в виде у =.470 — 72 • Ю—0.1312СХ—2) или Igdj = 1,856 —0,131 (х —2). 264
Т а б л и ц a 937. Выравнивание возрастного ряда живого веса сычевских помесей при отсутствии данных о живом весе при рождении: у=Д— Воз- раст, л, годы Эмпирические данные (Я—470 кг) Решение уравнения Ig^lgdj+fet* *—Xi) Нахождение теоретических значений живого веса У d=A—y Igd X—Xi (X—Xt)2 (x—xt)lgd а=0,1312(х—х,) lgd’= =1,855—а d’={A-tf) ' У' 2 394 76 1,881 0 0 0 0 1,856 72’ 398' (W) (/) 3 414 56 1,748 1 1 1,748 —0,1312 1,725 53 417' 4 431 39 1,591 2 4 3,182 —0,2624 1,594 39 431 5 433 37 1,568 3 9 4,704 —0,3936 1,462 29 441 6 451 19 . 1,278 4 16 5,112 —0,5248 1,331 31 449’ 7 460 10 1,000 5 25 ' 5,000 —0,6560 1,200 16 454 8 462 8 0,903 6 36 5,418 —0,7872 1,069 12 458 9 454 16 1,204 7 49 8,428 —0,9184 0,938 9 461 0 477 — - — — — —1,0496 0,806 6 464: 11,173 28 140' 33,592 nlgdj-p-ASfx—x1)=Slgd । 81gd1^28fe=l 1,173 2(x—x^lgd^&Spi—x1)2=2(x—x^lgd 281gdi^l40fe=33,592 lgd1= 1,856 t/=470 72- 10-°'13I2(^ —0,1312 Подставляя значения x и решая каждый раз второе уравнение,, можно получить ряд теоретических значений lgd' = lg(A — у'), а затем и теоретический ряд величин d' = А— у'. Вычитанием d' из А находится теоретический ряд регрессии живого- веса по возрасту. ' Показатели биологической и условной скороспелости при отсут- ствии сведений о живом весе при рождении можно определить по сле- дующим формулам: Т =гХ 4- ^di-lgA^-2 , , Igdi —lgdm • ',li . > т 1 “Г . . • Для сычевских помесей эти показатели следующие (см. табл. 93): Т = 2+ lg?-lg*70*2 =2 1,856-2,672^2 _ ц q лет 0,1312 0,1312 = 2 lg72-Jg(470 - 460) 2 J,856- 1,0_0() = 0,1312 г 0,1312 Асимптотические потери веса Пример 97. При автоперевозках сельскохозяйственных животных: без кормления и поения в пути происходят потери веса этих животных. Как показали опытные перевозки длительностью до 15 час, эти потери^ 265^
происходят с определенной закономерностью. В начале пути потери бы- стро возрастают, затем при увеличении продолжительности перевозок нарастание потерь замедляется, и, спустя некоторое время, потери веса практически не увеличиваются при дальнейшем увеличении расстояния и времени перевозок. Наблюдается то же, что и при асимптотическом росте: скорость из- менения функции пропорциональна разности между ее данным значе- нием и некоторой асимптотой. Наличие, асимптоты потерь веса скота при автоперевозках объяс- няется тем, что теряется главным образом содержимое желудочно-ки- шечного тракта, после чего потери веса замедляются, так как практиче- ски заметного распада тканей тела при максимальной длительности перевозок,.равной 15 час, еще не происходит. Поэтому в основу закономерности изменения потерь веса скота при автоперевозках можно также положить дифференциальное уравнение JL = ^(A-y). ах Первые этапы интегрирования этого уравнения в данном случае осуществляются так же, как в случае асимптотического роста: С —= f kdx J A-у J — In (4— y) — kx-\-C. Константа интегрирования устанавливается иначе. Так как в начальный момент перевозок потерь еще не бывает, то при х=0, у = 0, и константа интегрирования С = —1п4. Дальнейший вывод уравнения регрессии идет так: 1п А — In (Л — у) = kx, 1п^~у =—kx, А — у = Ae~kx, у = А(1 — е~Ьх), г/= 4(1 — 10~**). Для нахождения параметров этого уравнения необходимо 1. Прологарифмировать это уравнение: у = А — А10~*х, , lg(4 — у) = lg4 — kx. 2. Привести полученное равенство к виду, удобному для дальней- ших расчетов: k= lg4 —lg(4 —у) х 3. Определить величину'/! графически или аналитически, как описа- но выше. . - , 266 '
4. Для каждого значения аргумента определить величину k. 5. Найденные величины А и k подставить в уравнение регрессии. Для построения теоретического ряда регрессии необходимо -найден- ную форму представить в логарифмированном виде lg(4 — у) = lg4 — kx и, подставляя последовательные значения аргумента, найти сначала теоретические значения 1g(4—у), по ним определить величины d=A—у' я, наконец, вычитая d' из А, получить теоретические значения функции. .Рис. 44. Асимптотическая функция. Потери веса крупного рогатого скота при автоперевозках Для выравнивания таких рядов не требуется, чтобы эмпирические значения имелись через равные интервалы аргумента. При анализе зависимости потерь веса крупного рогатого скота (у> %) от расстояний при автоперевозках (х, км) получено уравнение регрессии у = 4,2 (1 — 10-0.007S*). Теоретический ряд, составленный по этому уравнению, показан на рис. 44. 267
На основе этого ряда можно установить допустимые нормы потерь- веса при автоперевозках на различные расстояния, а также разрабо- тать систему дифференцированных скидок с живого веса на содержи- мое желудочно-кишечного тракта. ЛОГИСТИЧЕСКИЕ ФУНКЦИИ Насыщение замкнутого объема живыми существами (растущими дрожжами, бактериями, водорослями) или проникающим веществом,, рост популяции в новой для нее местности — все подобные явления протекают в соответствии с особой закономерностью, изображенной на. рис. 45. Первоначально насыщение объема идет с возрастающей скоростью,, затем в связи с уменьшением свободного пространства ц возникновени- ем тормозящих факторов скорость замедляется до постоянной, после- чего наступает период затухания скорости роста и, наконец, когда даль- нейшее увеличение насыщающей массы в данном объеме становится невозможным, рост останавливается—наступает период равновесия. Функции, изменяющиеся подобным образом в прямом или обрат- ном направлении, называются логистическими; течение их следует зако- номерности, выраженной уравнением Ферхюльста: , у =------------1-с, 14- 1оа+ь* где у — вес или объем насыщающей массы; х — время, прошедшее, с начала роста; А — расстояние между верхней (Л—с) и нижней (с) асимптотами; с — нижняя асимптота, предел, с которого начинается рост функ- 268
г ции, или при обратном течении функции — минимальный уро- вень равновесия; <а,Ъ— параметры, определяющие наклон, изгиб и точку перегиба ло- гистической линии регрессии. Для решения логистического уравнения первоначально надо опре- делить верхнюю и нижнюю асимптоты. Это с достаточной точностью можно сделать по эмпирическому ряду путем простого его просмотра. Значение верхней асимптоты можно проверить аналитически по фор- муле 2У1УзУз — У1(У1 + Уз) /1 о > У1Уз — У 2 где уч, уз — три эмпирических значения функции, взятые через рав- ные интервалы аргумента. После нахождения величин А и с надо прологарифмировать логи- стическое уравнение: ч 1g ( —------— а + Ьх, ч \ У — с J Igz = а + Ьх. Полученное уравнение параболы первого порядка легко решить по спо- собу наименьших квадратов, составив два нормальных уравнения: па 4- Ь^х = 2 Igz, ' а2х + &2х2 = 2xlgz. Если нййти из этих уравнений параметры а и Ь, можно составить фяд величин а+Ьх, равных теоретическим значениям lg f ----------1 ) . А У с Определяя величины ---------- 1, легко составить ряд теоретических у' —с значений функции у'. 1 Анализ логистических функций можно показать на следующих при- зерах. ' ' П р и м е р 98. В аквариуме с постоянным количеством воды, с вб- зобновляемыми питательными веществами и постоянным тепловым и световым режимом разводилась быстрорастущая простейшая водоросль. •Первоначально были внесены 10 клеток водоросли на весь аквариум и через каждые сутки брались пробы, в которых определялся вес органи- ческой массы в мг/см3. Выравнивание полученного эмпирического ряда нарастания веса органической массы в постоянном объеме воды приведено в табл. 94, выравненный ряд показан на рис. 46. Оказалось, что закономерность, лежащая в основе наблюдаемого ..нарастания органической массы, выражается довольно точно логисти- ческим уравнением: . . , / 900 , п\ , 3 У ~ 1 j, iq2,7163-0,5324л: + ®) М2/СМ . 269
Выравнивание эмпирического ряда регрессии нарастания веса „ А Логическое уравнение у= ’Ф" с или Эмпирические данные (Л=900, с =0) х, сутки хг у, мг/см3 А У ^-1 - У lg(— l)=z / у 10 9 8 7 6 5 4 3 2 1 0 81 64 49 36 25 16 . 9 4 1 900 885 880 850 700 450 200 60 ' 10 ' 5 1,017 1,023 1,059 1,286 2,000 2,250 15,000 90,000 180,000 0,017 0,023 0,059 0,286 1,000 1,250 14,000 89,000 179,000 2,230 —1,770 2,362 —1,638 2,771 —1,229 1,456 —0,544 0,000 0,000 0,097 -ф-0,097 1,146 ' 4-1,146 1,949 4-1,949 2,253 -ф-2,253 i 45 285 “V, - — — 4-0,264 9аф 456=4-0,264 45я4-285Ь=^-30,924 b=—0,5374 а=4-2,7163 Если потребуется определить момент перехода возрастающей ско- рости в убывающую, то это можно сделать, определив координаты точ- ки перегиба логистической кривой: 1 I Д I _ 2,7748 __g |2 | Ь\ 0,5424 ~ ’ суток, А 900 , у = — = --= 450 мг. 2.2 Это значит, что переход возрастающей скорости в убывающую на- ступает спустя 5,12 суток с начала размножения водоросли. В этот мо- мент в каждом^ кубическом сантиметре среды будет накоплено 450 мг- органической массы. Пример 99. Гаузе и Алпатов изучали действие высокой темпера- туры на организм плодовой мушки. Насекомые выдерживались х час при температуре 27°С, а затем переносились в термостат с температу- рой 17°С. В зависимости от длительности выдержки при высокой темпе- ратуре (х=48ч-100 час) у насекомых в стадии имаго имелось различ- ное число глазных фасеток (у = 1264-56); при этом чем дольше выдер- живались мушки при высокой температуре, тем меньше было глазных, фасеток. Если отдельные результаты сопоставления числа фасеток с выдерж- кой мушек при температуре 27°С нанести на точечный график, то станет. 270 '
Таблица 94 органической массы (у) по дням разведения водоросли (х). А' 1g (----—1)=а+6х=2,7163—0,5374х Нахождение теоретических значений. XZ lg(——lf=a+6x У' ' 2'. У' * -А_ у’ У' - — —2,6577 3,3423 0,0022 1,0022 898 —15,930 —2,1203 3+797 0,0076 1,0076 893 —13,104 —1,5829 2,4171 0,0261 1,0261 877 —8,603 —1,0455 2,9545 0,0900 1,0900 826 —3,264 —0,5081 Т.4919 0,3103 1,3103 687 0,000 +0,0293 +0,0293 1,070 2,070 435 +0,388 . +0,5667 +0,5667 3,685 4,685 192 +3,438 +1,1041 + 1,1041 12,7.1 13,71 66 +3,898 +1,6415 + 1,6415 43,76 44,76 20 +2,253 +2,1789 +2,1789 151,0 152,0 6 — +2,7163 +2,7163 520,0 521,0 2 | —30,924 — - - 900________ l^lO2’7183-0’5374* 900 i lg(--—1)=2,7163—0,5374х заметен логистический обратный характер течения функции с верхней асимптотой А + с=130 и нижней с=55$фасеток (А = 130—55 = 75). В целях более точного описания найденной закономерности эмпи- рические данные были выравнены в соответствии с логистическим уравнением регрессии, что показано в табл. 95 и на рис. 47. Аргумент имеет значения через неодинаковые интервалы, что не препятствует решению логистического уравнения. Обе асимптоты были найдены по точечному графику. В основу решения положено общее логистическое уравнение в ло- гарифмической форме: ’ 1g ( — ---= а + Ьх. \y — cj Это уравнение параболы первого порядка легко решается способом наименьших квадратов. В табл. 95 указаны все этапы выравнивания данного логистического ряда. - Если потребуется определить точку перегиба, т. е. момент перехода, возрастающей скорости в убывающую, то это можно сделать по следую- щим формулам: I д| = 161 < 4,85 0,0724 = 67,0 час л 7^ у — — + с =---------|- 55 =' 92,5 фасеток. 2 2 271
Рис. 46. Логистическая функция. Рост органической массы в 1 см3 воды по дням развития водоросли Рис.'47. Логистическая обратная функция. Изменение числа глазных фасеток у плодовой мушки в стадии имаго в зависимости от продолжительности выдержки насекомых при высокой температуре
Это значит, что уменьшение числа фасеток с увеличивающейся ско- ростью (по мере увеличения х) идет на протяжений первых 67 час вы- держки мушек при высокой температуре. При дальнейшем увеличении выдержки скорость уменьшения числа фасеток затухает и стремится к нулю. Число фасеток в точке перегиба, т. е. при х = 67 час, равно 92,5. ПЕРИОДИЧЕСКИЕ ФУНКЦИИ Некоторые биологические явления протекают таким образом, что регулярно, через определенные промежутки времени, нарастание явле- ния сменяется затуханием. К таким явлениям относятся цикличные из- менения численности популяции, сезонные изменения физиологических показателей организма (температура тела; пульс и т. д.), метеорологи- ческие показатели по месяцам года, ритмические изменения веса жвач- ных по дням месяца, флуктуации структурных элементов клетки и т. п. Такие функции называются периодическими. Периодические функции подчиняются закономерностям, которые обычно достаточно близко выражаются тригонометрическим уравнением регрессии: _ 360 X ! 360 X у == а + b sin (;-х I + c-cos -х ) , \ Г J \ Г J . где у — значение периодической функции; г — число измерений функции, взятых в течение одного полного цикла через равные промежутки времени. Например, если пол- ный цикл длится 1 год, а измерялась функция ежемесячно, то г=12; х — порядковый номер измерения, начиная с xt =0. Последний номер измерения в цикле равен . Параметры периодического уравнения регрессии находятся по сле- дующим формулам: Sy а = -2- , г Г ( збо \ 1 S y-cos ----х . с = —!------г . г/2 Выравнивание периодических рядов можно показать на следующих примерах. Пример 100. После того как популяция достигла предела своей численности в данной местности, начинаются периодические изменения числа особей этой популяции. Уменьшение численности вызывается уве- личением количества хищников и паразитов, а также уменьшением запасов пищи, приходящихся на одну особь дикого вида. Если возрастающее сопротивление среды не приведет к полному уничтожению популяции, то для оставшихся особей через определенный период образуются условия, благоприятствующие размножению. К этб- му времени жизненное пространство будет расширено, запасы пищи на- одну особь дикого вида увеличатся, хищники в значительной части или погибнут или перекочуют в другие места.. 18 Н. А. Плохинокий 273
Выравнивание эмпирических, данных зависимости числа глазных фасеток (у,) у при высокой1 Логистическое уравнение А ИЛИ 1g (----—1) = У—с Эмпирические данные (Л=75, с=55) х, час X2 У d=y—c А d -А-!- d z=ig(-A~i) а 1 1 п 100 (97) 90 89 88 84 80 80 76 74 72 72 70 70 68 67 66 66 64 64 62 60 59 59 58 .54 '50 (48). 48 10 000 (9 409) 8100 7 921 7 744 8 056 6 400 6 400 5 776 . 5 476 5 184 5 184 4 900 4 900 4 624 4 489 4 356 4 356 4 096 4 096 3 844 3 600 3 481 3 481 3 364 2916 2 500 (2 304) (2 304) 56 (54) 58 58 . 59 60 59 60 57 71 76 66 79 77 82 76 101 108 91 98 113 118 120 118 122 125 127 (130) 126 1 3 3 4 5 4 5 2 16 21 11 24 22 27 21 46 53 36 43 58 ' 63 65 63 67 70 72 (75) 71 75,0 . 25,0 25,0 18,8 15,0 • 18,7 15,0 37,5 4,69 ' 3,57 6,82 3,13 3,41 2,78 3,57 1,63 1,42 2,08 1,74 1,29 1,19 1,15 1,19 1,12 1,07 1,04 (1,00) 1,06 74,0 24,0 24,0 17,8 14,0 17,7 14,0 36,5 3,69 2,57 5,82 2,13 2,41 1,78 2,57 0,63 0,42 1,08 0,74 0,29 0,19 0,15 0,19 ' 0,12 0,07- 0,04 (0,00) 0,06 41,869 -1-1,380 4-1,380 41,250 41,146 41,248 41,146 41,562 -0,567 ->0,410 40,765 40,328 --0,382 -0,250 —0,410 —0,201 —0,377 40,033 —0,131 —0,538 —0,721 —0,824 —0,721 —0,921 —1,155 —1,398 —1,222 1890 ' 136 548 — — — — 45,917 По этим причинам численность, популяции начинает увеличиваться,., а дойдя до некоторого максимума, снова начинает уменьшаться. Примером довольно правильных циклических изменений численно- сти популяции могут служить колебания численности канадского зайца, установленные по данным годовых заготовок пушнины, по числу шку- рок, поступающих ежегодно в заготовительные конторы. За период с 1920 по 1930 г. (10 лет) прошел полный цикл периоди- ческого изменения численности зайца в Канаде. В начале цикла числен- ность равнялась 2 тыс. особей, в середине — 50 тыс. и в конце (перед., началом нового цикла) — 15 тыс. особей. Численность (у) популяции по годам приведена в табл. 96; там же показано и выравнивание эмпири- ческого ряда периодической функции по указанным формулам. При числе интервалов г== 10, ----- = 36, поэтому в табл. 96 ис- пользуется преобразованный аргумент х\ = 36 х. 274
*' Таблица 95 плодовой мушки в стадии имаго от продолжительности выдержки насекомых температуре (х). А а^Ьх=г=—4,7340,0707х Нахождение теоретических значений XZ X z'=a+6x ^--1 d' А —е d' d'=75:e d'—y'—c ‘ У' 4-186,9 4-124,2 4-122,8 4110,0 496,3 499,8 491,7 4118,7 442,0. 429,5 455,1 423,0 426,7 417,0 427,5 —13,3 —24,9 42,1 —8,4 —33,4 —43,3 —48,6 —42,5 —53,4 —62,4 —69,9 —58,7 4714,5 110 105 100 95 90 85 80 75 . 70. 65 60 55 50 45 40 35 30 п=2 Sx= 2х2= 2z= Sxz= А= с=5 43,047 42,694 . 42,340 41,987 41,633 41,280 40,926 40,573 40,219 1,865 1,512 £,159 2,805 2,452 2,098 3,745 3,391 7 = 1890 =136 548 45,917 =4714,5 75 5 1114,0 494,3 218,8 97,1 42,9 19,0 8,43 3,74 1,66 0,73 0,32 0,14 0,06 1 0,03 0,013 0,006 0,0025 27a4 1890с 6=4 а=— у- 1 1115,0 495,3 219,8 98,1 43,8 20,0 9,43 - 4,74 2,66 '1,73 1,32 1,14 1,06 1,03 .1,013 1,006 . 1,0025 18906=45,9 (4136 5486=- 0,0707 4,73 75 - 4Ю-4-73+о,о 0,1 0,2 0,3 0,8 1,7 3,8 8,0 15,8 28,2 43,2 56,7 65,7 70,7 72,9 74,0 . 74,6 74,8 17 4-714,500 / 455 707x 1 55,1 55,2 55,3 55,8 56,7 58,8 63,0 70,8 . 83,2 98,1 111,7 120,7 125,7 127,9 129,0 129,6 129,8 . Для облегчения нахождения синусов и косинусов дана табл. V, в которой приведены эти две тригонометрические функции для любого , 360 значения преобразованного аргумента xL =-------х в пределах одного, г полного цикла: от Xi = 0 до Хю = 359. Выравненная линия регрессии численности канадского зайца по го- дам показана на рис. 48. Изменения численность канадского зайца происходят примерно на одном среднем уровне — 28 тыс. голов, причем этот средний уровень остается практически постоянным для трех-четырех следующих друг за другом циклов. Так бывает не всегда. Есть такие периодические функ- ции, средний уровень которых повышается (понижается) или с постоян- ной, или с переменной скоростью, что можно показать на следующих: примерах. Пример 101. При изучении изменчивости веса сельскохозяйствён- 18* 275
йых. животных проводились ежедневные определения живого веса коров на первых месяцах стельности. За вес принималась средняя величина из трех взвешиваний, проводившихся каждый день утром, в полдень и вечером перед дачей корма и воды. Кормление и содержание коров за весь период опыта (72 дня) были изо дня в день совершенно одинако- выми. В результате были обнаружены довольно значительные колеба- Рис. 48. ’Периодическая функция. Изменение численности популяции канадского зайца по годам ния живого веса каждого животного, имевшие явно периодический ха- рактер. У большинства коров средний уррвень колебаний веса не оставался одинаковым для соседних циклов — у некоторых он повышался, у неко- торых понижался, а у отдельных коров средний уровень циклов сам изменялся по типу периодических функций. Для таких сложных периодических функций выравнивание эмпири- ческих рядов ведется по нескольким ступеням. Сначала весь ряд выравнивается по уравнению параболы первого или второго порядка: у' = а + Ьх, или у' = а + Ьх + сх2. Если изменения среднего уровня колебаний функции имеют перио- дический характер, то весь имеющийся ряд предварительно выравни- вается как периодическая функция с одним общим большим периодом, длящимся от начала до конца' всего исследования. Теоретические значения у', полученные при предварительном вырав- нивании .среднего уровня колебаний, подставляются вместо свободного дленад уравнение периодической функции У" = У' + b • sin хг + с • cos х2, .276
Таблица 96 Выравнивание эмпирического ряда регрессии численности канадского зайца (у) по годам развития популяции (х). , ' 360 360 Периодическая функция у=а4о sin (-------х) ф c-cos (-----х) Год X sinXi COSXj У ^/COSXi ftsinz, CCOSAJj Уг 1920 0 0 0,000 41,000 2 0,000 42,000 0,00 —20 ,-42 7,6 1921 1 36 4-0,588 40,809 10 45,880 48,090 42,01 —16,52 13,5 1922 2 72 ->0,951 40,309 30 428,530 49,270 43,26 —6,31 25,0 1923 3 108 4-0,951 —0,309 38 436,138 —11,742 43,26 46,31 37,6 1924 4 144 40,588 —0,809 45 426,460 —36,405 42,01 416,52 .46,5 1925 5 180 0,000 —1,000 50 0,000 —50,000 0,00 420,42 48,4 1926 6 216 —0,588 —0,809 40 —23,520 —32,360 —2,01 416,52 42.5 1927 7 252 —0,951 —0,309 30 —28,530 —9,270 —3,26 46,31 31,1 1928 8 288 —0,951 40,309 20 —19,020 46,180 —3,26 —6,31 18,4 1929 9 324 —0,588 40,809 15 —8,820 412,135 —2,01 —16,52 9,5 — 280 417,118 —102,082 — — . — у=428, ОфЗ, 4236sinx1—20,4164Xj Xi=36X 280 а=—=^28,00 , 417,118 6= ---=43,4236 о —102,082 с=----4— = —20,4164 5 найденное при выравнивании ряда в пределах каждого цикла. Напри- мер, у коровы Брикки за 60-дневный период наблюдались 2 полных цикла (каждый цикл по 30 дней) изменения живого веса. Живой вес изменялся в пределах от 578 до 613 кг, причем средний уровень перио- дических колебаний постепенно возрастал с постоянной скоростью. Если эмпирический ряд веса Брикки выравнять по уравнению пара- болы первого порядка, то получится уравнение у' = 585 4 0,233х. Это значит, что средний суточный прирост среднего веса Брикки (среднего уровня колебаний веса) составлял 233 г, а за весь 60-дневный период средний вес Брикки увеличился на 0,233X60 = 14 кг. Анализ показал, что в, пределах циклов живой вес Брикки изменял- ся в соответствии с уравнением у" — у' — 7,61 sin 12х— 7,61 cos 12х, где - у' = 585 + 0,233х. Эмпирические и теоретические значения среднесуточных живых ве- сов Брикки приведены в табл. 97 и на рис. 49. Более короткие циклы колебаний веса— двадцатидневные—-наблю- дались у коровы Амикй, живой вес которой периодически менялся в со- ответствии с уравнением у" — у' — 0,5 sin 18х — 5,5 cos 18*, , у' = 509,4 40,175%. 277
Таблица 97 Периодические изменения среднесуточного живого веса коровы Брикки: х—дни наблюдения, у—эмпирические значения (кг), +=585+0,233х—нарастание среднего уровня колебаний веса, у"—у'—7,61sinl2x—7,61cosl2x—тридцатидневные циклы изменений веса. Первый цикл Второй цикл X У У' У" X У У У X У У’ У" X У У У ' 3 \576 586 575 18 596 589 600 33 581 593 582 48 610 596 607 4 570 586 575 19 606 589 600 34 580 593 582 49 613 596 607 5 578 586 576 20 591 590 600 35 586 593 583 50 609 597 607 6 588 586 577 21 597 590 599 36 587 593 584 51 604 597 607 7 590 587 578 22 603 590 598 37 584 594 585 52 603 597 606 8 578 587 580 23 598 -590 597 38 592 594 587 53 610 597 604 9 582 587 582 24 594 591 596 39 598 594 589 54 598 598 603 10 590 587 585 25 602 591 594 40 601 594 592 55 601 598 601 11 585 588 587 26 592 591 592 41 601 595 594 56 600 598 599 12 591 588 590 27 597 591 590 42 599 595 597 57 597 598 507 13 597 588 592 28 595 592 588 43 599 595 599 58 597 599 595 14 603 588 594 29 592 592 586 44 597 595 601 59 601 599 593 15 591 589 596 30 583 592 584 45 610 596 603 60 597 599 591 16 602 589 597 31 583 592 Й83 46 594 596 604 61 585 599 590 17 603 589 599 32 585 593 582 47 607 596 606 62 592 599 589 Наиболее сложный характер имели колебания веса коровы Асте- рии— они были трехстепенными, так как происходили путем наложе- ния трех отдельных элементарных изменений. Средний уровень циклов у этой коровы изменялся как периодиче- ская функция с семидесятидвухдневным периодом, имеющая свой сред- ний уровень, который нарастал прямолинейно. Поэтому, общая формула периодической функции имеет в данном случае тройное обозначение: ут = у"— 0,4 sin 18х — 3,0 cos 18х, у" = у' — 2,54 sin 5х — 3,32 cos 5х, у' == 598,3 + 0,023х. Периодические кривые изменений веса коров Амики и Астерии по- казаны на рис. 50. Выявленные закономерности ритмического изменения веса крупного рогатого скота могут быть использованы теоретически и практически. Ясно выраженная периодичность изменений веса при тех условиях, в которых проводились описанные наблюдения (выравненность кормле- ния и содержания, определение среднесуточного веса из трех взвешива- ний в день перед дачей корма и воды), указывает на такие физиологи- ческие особенности формирования общей массы тела крупного рогатого скота, на которые прежде не обращалось должного внимания. Первое объяснение вскрытой ритмичности может заключаться в не- совпадении правильного ритма наполнения пищеварительного тракта (регулярное кормление и поение) с довольно беспорядочными сроками его освобождения. Пищеварительный тракт может наполняться некото- рое время без компенсирующего освобождения. После определенного срока переполненный пищеварительный тракт начинает освобождаться 278 ,
несуточного живого веса коровы Брикки с повышающимся средним уровнем •Рис. 50. Сложные периодические функции. Двадцатидневные циклы -колебания среднесуточного живого веса коров с равномерно повышающимся средним уров- нем (корова Амика) и с периодически изменяющимся средним уровнем (корова Астерия)
в большей степени, чем это требуется для компенсации его наполне- ния. В первом периоде происходит повышение живого веса, во втором — его уменьшение. Амплитуда таких колебаний иногда достигает значи- тельных размеров. Например, среднесуточный вес коровы Брикки за время с 48-го по 50-й день опыта увеличивался с 599 до 613 кг, т. е. за 3 суток на' 14 кг, или по 4,7 кг в сутки, а в следующие 3 дня среднесу- точный вес этой же коровы уменьшался с 613 до 603 кг, т. е. на 3,3 кг в сутки. Корова Астерия с 12-го по 16-й день опыта повышала свой среднесуточный вес на 6 кг в сутки (с 585 до 610 кг), а в следующие 4 дня среднесуточный вес этой коровы уменьшался ежедневно на 6 кг (с 610 до 586 кг). В каждом отдельном цикле изменений веса вначале преобладают мелкие периоды недостаточного освобождения пищеварительного трак- та— живой вес имеет тенденцию повышаться, а затем наступает' время - избыточного освобождения пищеварительного тракта — среднее течение живого веса идет по ниспадающей ветви периодической кривой. Изложенное объяснение периодических изменений веса крупного» рогатого скота является только первой попыткой осознать вновь откры- тое биологическое явление. Это объяснение выдвигает ряд новых вопро- сов для дальнейших физиологических исследований: чем объяснить разную продолжительность циклов, каковы причины разной амплитуды колебаний веса у разных коров, что считать таким весом тела коровы, который характеризует степень ее возрастного развития, потребности ее в питательных, веществах, влияние факторов, изучавшихся в экспери- , менте, и т. д. Вскрытые здесь внешние закономерности в области изменения веса крупного рогатого скота кроме своего теоретического значения имеют непосредственное отношение и к методике опытной работы, и к упорядо- * чению производственных процессов, в которых в качестве исходной ха- • рактеристики животных берется их живой вес. При регистрации, действия агентов, изучаемых в экспериментах с . крупным рогатым скотом, исследователи обычно наблюдают сильную изменчивость..живого веса, которую часто трудно Связать с действием исследуемого фактора и с режимом подопытных животных. Кроме то- го, что такая изменчивость теперь получила возможное объяснение, ре- зультаты анализа ритмичных колебаний веса дают некоторые указания ина детали при организации подобных экспериментов. К таким указаниям может относиться требование более частого» взвешивания подопытных животных-—гораздо чаще, чем только в на- чале и конце опытных периодов. Выявление периодичности изменений живого веса, пока полностью 1 необъяснимых, но протекающих внешне с определенной математической закономерностью, освещает также и те спорные случаи продажи-покупки и сдачи-приемки скота, при которых возникают конфликты и судебные дела, связанные с оценкой живого веса сдаваемого и принимаемого» скота. ’ Резкие изменения веса, происходящие за' короткое время у скота в период сдачи-приемки, в тех случаях, когда" они не могут быть объ- яснены резким изменением наполненности пищеварительного тракта пе- ред самым взвешиванием, обычно объясняются или подменой живот- ных, или искажением регистрации результатов взвешивания, что не всегда правильно отражает действительную причину этих колебаний.
Часть третья АЛГОРИТМЫ БИОМЕТРИЧЕСКИХ РАСЧЕТОВ ПОЯСНЕНИЯ К АЛГОРИТМАМ Алгоритмы 1—7. Расчет средней арифметической М и среднего* квадратического отклонения (сигмы) о. Два основных групповых показателя — средняя арифметическая М и среднее квадратическое отклонение о дают первичную меру среднего- уровня и разнообразия признака у объектов, составляющих группу. Кроме того, эти показатели участвуют в образовании многих других/ биометрических величин: коэффициента вариации, нормированного от- клонения, формул распределения, ошибок репрезентативности, коэффи- циентов корреляции, показателей силы и достоверности влияний в дис- персионном анализе, коэффициентов и уравнений регрессии и др. Все способы расчета средней арифметической, дисперсии (суммы* квадратов центральных отклонений) и сигмы исходят из основных фор- мул, дающих точные результаты: ' М=-^-, ‘ п C = 2(V —М)2 = 2Р—® , у n^-i V n—i где V — дата, результат первичного измерения признака' у каждого» объекта группы; п — число объектов в группе, или объем группы; С — дисперсия (сумма квадратов центральных отклонений). По этим формулам можно вычислять Мио без составления вариа-< ционных рядов во всех случаях для малых и больших групп. В послед- нем случае (для многочисленных групп) требуется достаточная счет- ная техника, позволяющая производить автоматическое сложение,, вычитание, умножение, деление, а также комбинированные действия: деление произведения, сложение многих произведений без записи про- межуточных результатов и др. . При отсутствии достаточной счетной техники основные формулы для многочисленных групп неудобны. В таких случаях вычисление М и о ведется при помощи вариационного ряда по специальным рабочим формулам. Это сильно облегчает ручную счетную работу; при этом про- исходит незначительное снижение точности конечных результатов. Описание формы, последовательности и формул расчета М и о при- ведено в семи алгоритмах ,(1—7), причем в каждом из них дано все, что» требуется для освоения способа. 2811
Алгоритм 8. Выравнивание эмпирических вариационных кривых по «нормальному закону. Показан способ выравнивания для тех случаев, когда эмпирическое распределение предположительно принято за случайную форму прояв- ления закона нормального распределения, выраженного известной фор- мулой Муавра, Лапласа, Гаусса: Nk ' р = —т=- е о У 2л Способ основан на применении значений ординат нормальной кри- вой f(x) и рабочей формулы: Nk v р = —/(%). 2 Значения f(x) первой функции нормированного отклонения даны .в табл. VI. Алгоритмы 9, 10. Оценка различия распределений. Показано при- менение критерия Пирсона «хи-квадрат» и критерия Колмогорова и Смирнова «лямбда». При составлении алгоритма для критерия «хи-квад- рат» были учтены последние работы Ван дер Вардена о минимально допустимых теоретических частотах в зависимости от числа степеней 'свободы. Алгоритмы 11—13. Оценка выборочных разностей. Для определе- ния достоверности разности средних (алгоритм 11) показано примене- ние двух критериев: критерия Стьюдента (t) и преобразованного крите- рия Фишера (К). Для определения достоверности разности долей (алгоритм 12) по- казано применение двух критериев: критерия Стьюдента с более пра- вильной формулой ошибки выборочной доли т?=рд'/{п—1) и метода «фи» Фишера <р—2 — arcsml/p в радианах. Второй критерий можно применять не только для малых или больших долей, но и всегда, когда требуется провести более точное сравнение долей, например, в исследо- ваниях мутационного процесса, при изучении действия лекарственных препаратов, последствий радиационных облучений и т. д. Определение достоверности разности между выборочной и гене- ральной долями (алгоритм 13) применяется при решении основных за- дач проверки гипотез: о принадлежности изучаемой группы к известной •генеральной совокупности и о возможной величине генеральной доли. Первая задача возникает обычно в таксономических исследованиях, .вторая имеет большое распространение в работах по элементарному ге- нетическому анализу и изучению популяций. Алгоритмы 14—18. Корреляционный анализ. Вычисление коэффи- циента^корреляции описано для малых и больших групп без примене- ния и с применением корреляционной решетки. Для больших групп показаны способ сумм (лучший способ прих отсутствии достаточной счетной техники) и модифицированный способ произведений, более при- емлемый при наличии хороших счетных машин. Определение достоверности коэффициента корреляции рекомендует- ся в алгоритмах 14, 16, 17 проводить не обычным способом (fr=r/mr), а путем сравнения числа коррелируемых пар со стандартными объема- ми, определенными по фишеровскому показателю г ~ Inf—Л W = -—+ 3, где t — критерий Стьюдента. Значения стандартных объ- 2 \ :282
<емов решетки для любого коэффициента корреляции и трех порогов вероятности безошибочных прогнозов приведены в табл. XII. В алгоритме 18 показан полный корреляционный анализ, который дает меру степени и достоверности прямолинейной и криволинейной свя- зей признаков и заканчивается определением критерия криволинейно- сти, что требуется для выяснения путей дальнейшего регрессионного анализа. В этом алгоритме описаны расчеты пяти показателей: показателя прямолинейной связи, критерия его достоверности, показателя криво- линейной связи, критерия его достоверности и критерия криволиней- ности. j Символ Fst означает стандартные значения критерия Фишера. Зна- чения этого критерия в зависимости от двух чисел степеней савободы для трех порогов вероятности безошибочных прогнозов приведены в табл. IX. Полный корреляционный анализ необходим при изучении сопря- женного разнообразия новых признаков, корреляция которых еще не изучалась или изучена недостаточно. . В других случаях, когда известно, что связь между признаками прямолинейна, или требуется выяснить меру только прямолинейной связи, например при прямолинейном («линейном») программировании, можно ограничиться расчетом одного прямолинейного коэффициента корреляции. Алгоритмы 19—30. Дисперсионный анализ. В основу алгоритмов дисперсионного анализа положены следующие положения. 1. Лучшим показателем силы влияния следует считать отношение факториальной дисперсии (суммы квадратов) к общей дисперсии, т. е. основной показатель силы влияния: 2. Попытки уточнить этот показатель, основанные на применении формул, T]z = 1 — a2z/^y или с2 — Hz + net2, не улучшают, а ухудшают определение силы влияний. 3. Показателем достоверности влияния может быть преобразован- ный критерий Фишера f = o^/c^ или отношение основного показателя к его ошибке Ф~х\^/т 2 дающее точно такие же значения, как и критерий Ях Фишера. Ошибка показателя силы влияния (пока не найдено точной формулы) Может быть определена по формулам для однбфакторных комплексов: .для двухфакторных комплексов: для суммарного влияния факторов: т 2 = т]? —, ’’Z ‘ ff; » Vz для остальных влиянии: т 2 = v,_2L. ‘ VZ 283
Эта ошибка может быть использована для примерного определениям доверительных границ генерального параметра П2 = [СП2 Л) -5- (П2 + Л)]; Л = Fstfn^, где Fst — стандартные значения фишеровского критерия, определяемого! по двум степеням свободы для трех порогов вероятности безошибочных, прогнозов по табл. IX. Алгоритмы дисперсионного анализа даны для однофакторных и двухфакторных, пропорциональных и неравномерных комплексов, ма- лых и больших групп, мало- и многозначных дат, количественных и ка- чественных признаков. Однофакторные комплексы используются для оценки силы и досто- верности какого-нибудь одного влияния, которое выделяется из общей массы факторов как главное или требующее проверки. Путем анализа однофакторных комплексов можно получить пока- затели наследуемости по отцам или матерям в потомстве одного отца. ' Градациями таких комплексов должны быть классы родителей (отцов- или матерей) по изучаемому признаку или отдельные отцы, матери, а в градации следует включать детей каждого родителя или каждого- класса родителей. Основной показатель силы влияния такого комплекса и есть соответствующий показатель наследуемости: й2 = Лг ± «2 Двухфакторные комплексы используются для оценки и сопоставле- ния силы и достоверности влияния двух одновременно изучаемых фак- торов. Для того чтобы правильно понять и использовать алгоритмы анализа двухфакторных комплексов, необходимо ясно представить не- которые ключевые положения дисперсионного анализа. Факторы для таких комплексов подбираются независимые, напри- мер, температура и влажность, первый и второй стимуляторы, нерод- ственные отцы и матери ит’ д. При анализе двухфакторных дисперсионных комплексов определяет- ся сила и достоверность пяти влияний. 1. Первого фактора при усредненном влиянии второго фактора.. 2. Второго фактора при усредненном влиянии первого фактора.. 3. Сочетания градаций обоих факторов. 4. Суммарного влйяния обоих организованных факторов. 5. Влияния всех остальных неорганизованных в исследовании фак- торов. Влияние сочетаний градаций возникает вследствие того, -что второй- фактор обычно действует различно при разных градациях первого. То’ же наблюдается и в отношении первого фактора: его действие прояв- ляется неодинаково при различных градациях второго фактора. Например, при изучении действия стимулятора линьки, (две града- ции— контроль и опыт — второго фактора) можно наблюдать, что вве- дение стимулятора самкам дает больший эффект, а самцам — незначи- тельный (две градации второго фактора). Это разнообразие действий- стимулятора при разных половых группах отразится на величине тре- тьего показателя г]лв>0. Он будет больше нуля и тем больше, чем силь- нее половые различия в восприятии действия стимулятора. Если же сти- 'мулятор действует одинаково на самцов и самок, то цлв — О- 284
В алгоритмах двухфакторных комплексов примеры подобраны так, чтобы можно было видеть все типичные случаи различных значений по- казателя влияния сочетания градаций. Алгоритмы 28 и 30 относятся к особым случаям организации дис- персионных комплексов. Эти алгоритмы составлены так, что не тре- буют дополнительных пояснений. Алгоритмы 31 и 32 показывают некоторые математические приемы, встречающиеся в практике биометрических исследований. Эти алгорит- мы также не требуют пояснений.
Алгоритм 1 Вычисление М и а без составления вариационных рядов; при отсутствии достаточной счетной техники > для малых групп Даты малозначные Даты многозначные Каждая дата возводится в ква- драт; даты и их квадраты суммируют- ся; на основе полученных сумм 2V и 2V2 рассчитываются; средняя арифметическая м = , п дисперсия (сумма квадратов) п сигма о-/.-, По каждой дате получается условное отклонение Д=У — А, где А любое удобное число; каждое отклонение возводится в квадрат; на основе двух сумм 2Д и 2А2 рассчитываются: средняя арифметическая 2Д М =А$- -, п дисперсия (сумма квадратов) „ (W С = 2Д2— -— п сигма V V2 V Д = (К —2400) Д2 1 12 144 1 2536 136 18 496 2 9 81 2 2703 303 91809 3- 10 100 , 3 2815 ' 415 i 172225 < 4 . 13 169 4 2487 87 7 569 j 5 15 225 5 2644 244 59 536 6 14 196 6 2521 121 14 641 7 8 64 7 2452 52 2 704 ’ • 8 12 144 8 ' 2463 63 3 969 SK .= 93 2V2= 1123 — 2Д = 1421 2Д2 = 370 949 ; 93 Л4 = —=11,6 О 1421 М = 2400 -Ф- = 2577,6 8 932 С = 1123 — - = 41,88 3 (142D2 С = 370949 — Д —= 118544 , > 8 Г 41,88 а-у ’ —2,44 , Г 118544 а-j/ 7 -130,13 , 286
Алгоритм 2 Вычисление Мне без составления вариационных рядов, при наличии достаточной счетной техники (арифмометры с полным учетом числа оборотов, электрические полные автоматы типа САР, Мерседес) для больших и малых групп Все даты последовательно возводятся в квадрат, без снятия получающихся чисел (в счетчике оборотов) и их квадратов (в счетчике результатов).. Каждое по- следующее возведение в квадрат накладывается на все предыдущие. После возведе- ния в квадрат последней даты получаются две основные суммы 2V и 2V2. При. большом числе дат они разбиваются на десятки (пятерки) и для каждого, десятка (пятерки). получаются частные суммы 2V и 2V2. Затем частные суммы склады- ваются. На. основе двух общих сумм 2V и 2V2 рассчитываются Мио. 413 450 419 412 427 435 404 430 421 399 2V м = — п С = 2уз — (217)2 414 386 428 441 397 417 418 414 429 417 432 420 416 407 427 428 417 398 424 420 п 0 == =]/dh я= 100 401 424 411 426 380 419 406 419 429 406 414- 410 409 416 430 403 426 407 400 423 425 391 432 409 418 418 388 421 415 417 423 434 402 431 410 405 436 405 424 405 412 413 444 392 411 428 394 431 411 422 433 395 433 420 439 398 437 422 394 416 424 434 408 443 407 421 '422 410 . 423 409 2V 4191 4157 4202 4197 4146 4172 4148 4157 4170 4134 217=41 674 2V2 1 757 349 1 731 959 1 767 320 1 763 761 1 721 682 С© 00 1 723 070: 1 729 121 1 740 186 1 709 590 2V2 = = 17 385 884 41 674 Средняя арифметическая: М— —416,7 41 6742 Дисперсия (сумма квадратов): С = 17 385 884 ——= 18 661 ,/" 18 661' Сигма: а — |/ „ —13,73 К 99 287
, . АлгоритмЗ Вычисление .И и с по способу взвешенных дат при невозможности простого суммирования дат и их квадратов; при необходимости исследовать распределение признака; для признаков, выражаемых только целыми числами (плодовитость, число плодов, початков, клеток и т. д.), при небольшом размахе дат Все неповтрряющиеся значения дат выписываются в возрастающем порядке (слева направо или снизу вверх) и в каждый класс заносятся одинаковые даты, имеющие данное значение. 1 Без достаточной счетной техники При наличии достаточной счетной техники V f fV fV2=fV-V V J/2 f .14 11 154 -2 156 14 196 11 13 69 897 11 661 13 169 69' 12 98 1176 14 112 12 • 144 98 11 77 847 9 317 и 121 77 10 36 360 3 600 10 100 36 9 12 108 972 9 81 12 - п — 303 2/7 = 3542 S/P=41 818 2/7 = 3542 2/1/2=41 818 п = 303, M=4ff.=J«l=11>7 с=г,у._JW =418M_ ®sl=4,3 а 303 п 3,03 При наличии хорошего арифмометра или полного счетного автомата получение двух исходных сумм делается за один проход. Даты устанавливаются в левой-части клавиатуры (штифтов), а квадраты дат — в правой. Каждая пара чисел (у и К2) умножается на частоту последовательно без записи и снятия промежуточных резуль- татов. После последнего умножения получаются: в счетчике оборотов — число дат (п), в счетчике результатов слева.— 2/7 и справа — 2/Т2. 288
Алгоритм 4 Составление вариационного ряда. ' 1 Первичные данные (даты) 413 450 419 412 427 435 404 430 421 399 414 386 428 441'397 417 418 414 429 417 423 420 416 407- 427 428 417 398 424 420 401 424 411 42б]з80]419|40б 419 429 406 414 410 409 416 430 403 426 407 400 423 425 391 432 '409'418 1 1 418[388 421 415 417 423 434 402 431 410 405 436 405 424 405 412 413 444 392'411 428 394 431 411 422 433 395 433 420 439 398 437 422 394 416 424 434 408 443^407^421 422 410 423 409 Число классов г = 1 -f-3,3 lg п= 1 + 3,31g 100 = 7,6 Вариационный ряд Классы Разнос- ка Частоты f Число дат Число классов границы средины W 6—11 | 4 1 12—22 | 5 445 = 454 450 1 23—46 | 6 435 = 444 440 п 7 47—93 ' | 7 425 = 434 430 и и 20 94—187 | 8 188—377 | 9 415= 424 420 и к я 30 378—755 | 10 405 = 414 410 ИИ 25 756—1515 | 11 1515—3050 | 12 395 = 404 400 и 10 Размах р = max — min = 450 — 380 = 70 385 = 394 390 п 6 Величина кл< Р 70 1ССОВ 9,2 10 375 -i- 384 380 - 1 k — — — г 7,6 — — п = 100 Средина классов 1F — полусумма начала данного класса и начала следующего большего класса. Для признаков, выражаемых только целыми числами (плодовитость, яйценоскость, число плодов, початков, клеток и т. д.), а также для дат, которые перед разноской округляются в обе стороны (3,63 -» 3,6; 3,67 -» 3,7), средина класса равна полусумме его начала- и конца. Желательно, чтобы средины классов были кратны величине классов и чтобы средины .минимального и максимального классов были близки к фактическим минимуму и максимуму 1 Начало классов Wa = W — — k 2 ’ Например: Wa = 420 — —^—-10 = 415 Конец классов = W — k — б, где б — принятая точность измерения признака. Например: И7ш = 420 + —-10— 1 =424 Шифр частот 1|2|з| -4|5|б|7|-8|9|10 • I •• | : | := |"|П|П|п|И|И 19 Н. А. Плохинский 289
Алгоритм 5 Вычисление Л и с по способу взвешенных вариаций; для больших групп при невозможности простого суммирования дат и их квадратов и при необходимости исследовать распределение признака; на основе вариационного ряда при наличии достаточной счетной техники (арифмометры с полной регистрацией числа оборотов, электрические полные автоматы) Вариации W U/2 Частоты f 450 202 500 1 440 193 600 7 ' 430 184 900 20 420 176 400 30 410 168 100 25 400 160 000 ю 390 152 100 6 380 144.400 1 S/W' = 41 700 2/1^2= 17 407 200 п — 100 ' XfW 41 700 М = — = г =417,0 п 100 (2/W 4 1 7002' С = ^fW2— k ' = 17 407 200 — — =18 300 ' ' п 100 Г С 1 / 18 300 V п— 1 |/ 99 Вариации 117 устанавливаются в левой части клавиатуры (штифтов), а квадраты к вариаций W2— в правой. Каждая пара чисел (Ц7 и W2) умножается на частоту по- следовательно, без записи и снятия промежуточных результатов. .После последнего умножения получаются: в счетчике оборотов — число дат (п), в счетчике результатов слева — 2/117 и справа — 2/1У'2 г-' " 290
Алгоритм 6 Вычисление М и а по способу произведений для больших групп, при невозможности простого суммирования дат и их квадратов; при необходимости исследовать распределение признака; на основе вариационного ряда; при любой счетной технике - о S2 M = A + k—; c.= S2 1 п о = k п 1 с Si — 2/а S2 = 2/а2 п — 1 ’ W f а fa fa2 = fa • а «=100; 4 = 420; .£ = 10 450 1 +3 +3 9 Sx = 2/а = — 30; S2 = 2/а2 = 192 440 7 +2 4-14 28 430 20 + 1 4-20 4-37 20 420 = А 30 0 0 0 —30 Л4 = 420-4-10 = 417,0 100 410 . 25 —1 -25 25 400 10 —2 —20 40 302 с = 192 — = 183; 100 С = 102 • 183= 18 300 390 6 —3 —18 54 380 1 —4 —4 —67 16 «=100 Si = 2/а 4-37 — 67 = — 30 сч- м2 II II ед 11 , со / Л 183 о =10 1/ = 13,60 У 99 А — условная средняя: средина модального или близкого к нему класса (4 = 420) k — величина классового промежутка (k= 10) Wi — A , а —------.— — условные отклонения средин классов (вариации), выраженные в k классовых промежутках. Для IV=4, а = 0, для остальных вариаций а = или + 1 + 2 + 3 и т. д. или — 1 — 2 — 3 и т. д. Si, S2 — первая и вторая суммы, равные 2/а и 2/а2 (— 30, 192) + Cl S] L с = — = — 2/ (W,: — Л4)2 = S2 —--— сумма взвешенных квадратов централь- ных отклонений средин классов от сред- ' ... ней ряда, выраженных в квадратах классового промежутка. Дисперсия: C = k2c . Погрешности при расчете показателей на основе вариационного, ряда для данного примера равны: Дм = 417,0 — 416,7 =—|—0,3; Дст = 13,60 — 13,73 === —0,13 19* 291 .
Алгоритм -7 Вычисление М и <т по способу сумм для больших групп, при невозможности простого суммирования дат и их квадратов; при необходимости исследовать распределение признака; на основе вариационного ряда; при любой счетной технике с S? Г с Si — Pi— <71—[2М] M = A-^k—; c=S2---------; а = k 1/ --—; S2 = Pi + <ji + 2 (p2 4- <?a) = n 2 n У n— 1 = [S/+] W f р,=37 р2=Ю Проверка: 28 + 30 + 42 = 100; 28 + 9 = 37; 42 + 25 = 67 450 1 1 1 «=100; А = 420; fe=10 440 7 8 9 430 20 28 — Si = 37 — 67 = — 30; S2 = 37 + 67 + 2 (10 + 34) = 192 420 = А 30 — 410 25 42 — — 30 М = 420 + 10 — = 417,0 100 400 10 1.7 25 390 6 7 8 302 с= 192 — — = 183; С= 100 • 183= 18300 100 380 1 1 - 1 . / «=100 <71=67 <?2=34 л / 183 0 = 101/ ——=13,60 у 99 p± — сумма накопленных частот положительной части первого ряда суммирования (37) <7Х — сумма накопленных частот отрицательной части первого ряда суммирования (67) р2, 42 ~~ то же для второго ряда суммирования (10 и 34) Центральные черточки (в первом ряду — одна, во втором—три) устанавливаются точно против условной средней (я); накопление частот ведется от краев к цент- ру до встречи с центральными черточками Числа первого ряда: для положительной части 1; 1 + 7 = 8; 8 + 20 = 28; р, = = 1+84-28 = 37; для отрицательной части 1; 1 + 6 = 7; 7 + 10 = 17; 17 + + 25 = 42; <?! = 1 + 7 + 17+42 = 67. Числа второго ряда; для положитель- ной части 1; 1 +8 = 9; р2 = 1 + 9 = 10; для отрйцательной Части 1; 1 + 7 =8; 8+ 17 = 2.5; </2= 1 + 8 + 25 = 34. По полученным plt qL р2, ^вычисляются две суммы Si и S2 ,__________________ Содержание и назначение остальных величин n, A, k, Slt S2, с такие же, как и для. способа произведений. Различие способов — только в вычислении двух основ- . ных сумм Sj и S2, которые по своей конечной величине равны 2 fa и Sfa2 Способ сумм — самый -удобный и экономный способ расчета М и о для больших групп, при необходимости исследовать распределение признака, при. любой счет- ной технике ' . • ' • ' ‘292
Алгоритм 8 Выравнивание эмпирических вариационных кривых по нормальному закону , . П ' k Р =------ • f (х) р' — теоретическая частота; п — объем ряда; k — классовый промежуток; б — сигма; + (х) — первая функция нормированного отклонения, находится по таблицам ординат Нормальной кривой (тдбл. VI) W — M х —------------нормированное отклонение средин классов о Вариации Эмпири- ческие частоты р W — M W — M X = ' а . f м Теоретические частоты п • k ; , . ’ f (х) р' 450 1 +33 ” 2,43 0,021 1,5 1 440 7 +23 1,69 0,096 7,1 7. 430 20 . +13 0,96 0,252 . 18,5 18 420 30 +3 0,22 0,389 . 28,6 29 410 25 . —7 . 0,51 0,350 25,7 26 400 10 —17 1,25 0,183 13,5 - 14 ^390 6 —27 1,99 0,055 . 4,0 4 380 1 —37 2,72 0,010 0,7 1 100 — — — 99,6 100 30 Пример: п= 100 k= ю 20 М = 417,0 О = 13,6 1 n'k 100-1° о — 13,6 10 = 73,53 . 1 v—7 я7 / Вариаций 380 390 400 410 420 430 440 450 Эмпирические частоты р 10 25 30 20 Теоретические частоты р' . 14 26 29 18 о 1 1 6 7 1 4 7 1 4 293
Алгоритм 9 Оценка различий между эмпирическим распределением и теоретическим Критерий %2 («хи квадрат») З3 > 0,999 — при малой 1 }2 > 0,99 —при обычной 5 ix >0,95 — при большой J ответственности исследований = г2 — 3 — число степеней свободы Различия могут считаться случайными, если эмпирический критерий не достигает требуемого, порога вероятности f, f — эмпирические и теоретические частоты классов y?st — стандартные значения критерия (табл. XI) v1( v2 — первичное и вторичное число степеней свободы ~ — 3 rlt r% — число классов в распределении до и после редукции классов с малыми тео- ретическими частотами /min — минимально допустимая теоретическая частота крайних классов в зависимос- ти от начального числа степеней свободы V1 1 2 3-5-6 >6 Крайние классы с теоретической частотой объединяются'с соседними классами f min 4 2 1 0,5 .w f f' алго- ритм 8 f-f’ (f-f')2 (f-f')2 = 8; Vi = 8 — 3 = 5; f' . = 1 'min f2 = 7; v2 = 7 —- 3 = 4 %s2( = {9,5-13,3-18,5} %2 = 2Л1<9,5 Различия не достоверны. Эмпирическое распределение можно счи- тать нормальным, , точнее случайной формой проявления закономерностей нормального распределения (если теоре- тическое распределение строилось по нормальному закону) f' 450 1 1,5 0,5 0,25 0,167 440 7 7,1 0,1 0,01 0,001 430 20 18,5 1,5 2,25 0,122 420 30 28,6 1,4 1,96 0,069 410 25 25,7 . 0,7 0,49 0,019 400 10 13,5 3,5 12,25 0,907 390 6 7 4,0 • 4,7 2,3 5,29 1,126 380 1 0,7 2 100 '99,6 — — 2,411 294
Алгоритм 10 Оценка различий любых распределений. Критерий X («лямбда») А. Н. Колмогорова и Н. В. Смирнова I. Оценка различий между теоретическ \d\ | S/7 — SfZ'| max 1,95 Л г~ ' — ' Z-— > 1,00 У « 1,36 ими и эмпирическими распределениями 53=0,999 при малой (!) i ответственности 12=0,99 при обычной 1 результатов +=0,95 при большой (!)1 исследований Различия могут считаться случайными, если эмпирический критерий не достигает требуемого порога вероятности. W f г Накопленные частоты Xf | Xf' 1 d | п = 100 — объем каждой группы Х = =3_= = 0,3< 1,36 /100 — Различие не достоверно, нет достаточных ос- нований считать, что выборки взяты из ге- неральных совокупностей, отличающихся своим распределением 450 1 1 100 100 0 440 7. 7 99 99 0 430 20 18 92 92 0 420 30 29 72 74 2 410 25 26 42 45 Ш 400 Iff 14 17 19 2 390 6 4 7 5 2 380 1 1 1 1 0 2 100 100 — — — II. Оценка различий между двумя любыми распределениями г . (1,95 р3=0,999 при малой (!) ] ответст. __ ±4. . 1 / П1П2 ^=.(1,63 02=0, 99 при обычной 1 результ. «1 «в Lax V «1+п2 ^11,36. 01=0,95 при большой (!)J исследов. Различия могут считаться случайными, если эмпирический критерий не достигает требуемого порога вероятности. • W fl f2 Xfi Xf2 nl 2f2 п2 И1 ' 450 1 2 100 200 1,00 1,00 0 , /' 100 • 200 % =0,30-1/ = ’ у 100 + 200 . =2,45>1,95 Различия не могут считаться случайными, они в высшей степени достоверны. Выборки взяты из генеральных сово- купностей, явно различаю- щихся по своим- распределе- ниям, ч 440 7 4 99 198 0,99 0,99 0,00 ; 430 20 8 92 194 0,92 0,97 0,05 ; 420 ' 30 42 72 •186 0,72 0,93 0,21 ' 410 25 83 42 144 0,42 0,72 |/зб| > 400 10 37 17 61 0,17 0,31 0,14 ' 390 6 20 7 24 0,07 0,12 0,05 1 380 1 4 1 4 0,01 0,04 0,03 5 П 100 200 — — — 295
Алгоритм 11 Оценка разности выборочных средних I. Первый критерий достоверности разности средних d М± — ТИ2 , , -----„ > tst {v = «1 + n2 — 2} I/ I id = MltM2 — сравниваемые выборочные средние т1’.т2 — квадраты ошибок средних о т = , °* С т* 2 =---= —------- п п(п — 1) tst — стандартные значения первого критерия находят по таблицам Стьюдента (табл. X) по числу степеней свободы (у = — 2) для одного из трех порогов , вероятности пх,п2— объемы выборок II. Второй критерий достоверности разности средних 1 . П1-П2 f vx = 1 , 1 Mj 4“ ^2 ( Vg == Ml -J- M2 — 2 J £— квадрат-разности средних: (Mi — M2)2 (щ—l)af + (n2-l)af cx + C2 a, =------------------—-------- =-----------— варианса случайного разнообразия Mi Ч- M2 — 2 Mi Ч- М2'— 2 Fst — стандартные значения второго критерия находят по таблицам преобразованного фишеровского критерия (табл. IX) стандартных отношений варианс, дляЗ порогов веро- ятности При > tst или при Fd Fst разность достоверна, подчеркивается одной, двумя или тремя чертами, если достигнут первый, второй или третий порог вероят- ности безошибочных., прогнозов. При ta < tst или Fd < Fst разность не достоверна, подчеркивается волнистой чертой , • Если Л4Х>Л42 и td > tst или Fd^ Fst, то и Л4Х>Л42 I Ми М — выборочная Если ML>M2, a td<ist или Fd<Fsf, то Mi гг Л12 | и генеральная средние Исходные данные: пх = 25, п2 = 36, Л4х = 230, Л42 = 210, <jx = 23, оа=21. Вычисление первого критерия достоверности разности средних: 9Q2 „ 212 '______________ mf = -= 21,16; «2=——=12,25; md = <21,16 + 12,25 = 5,78; xiD- иО d= 230 — 210 = 20 20 td=--------= 3,46; v = 25-f- 36 —2 = 59; tsi = {2,0 — 2, 7 — 3,5} (табл. X). 5,78 -- л , Вычисление второго критерия достоверности разности средних: 24.23.+ 3S.2P_ д 2 25 + 36 — 2 202 25-36 . vx=l 476,8 ‘ 25 + 36 ~=: v2 = 25 + 36 — 2 = 59; Fst {4,0 - 7,1 - 12,0} . ---- 1 (табл. IX) 296
Алгоритм 12 Оценка разности выборочных долей I. Первый критерий достоверности разности для долей 0,2<р<0,8; 20%<р%<80% d________Р1 — Р2 та Ут1 ^т22 = + n2 —2} ' А ( п — объем группы Pi, Pi — сравниваемые доли р = — 1 „ п ( А— число объектов с признаком я 9 - i / Р'У т\, т2 — квадраты ошибок долей т = I/ ——--------— ist — стандартные значения критерия Стьюдента свободы vd и трех порогов вероятности т2 = —; q = 1 — р п — 1 (табл. X) для числа степеней Пример:’ п1=100, А^ = 40; тга = 200, Аа=100; Pi = —=0,4, р2 = 100 9 0,4-0,6 9 =-------=0,5; d = 0,5— 0,4=0,1; m,=-------—----= 0,00242; т2 = 200 1 99 2 0,5-0,5 9 0,1 = 199 = 0,00126; m2d = °, 0037; та=0,061; ^=5-5^ ='М>, v = 100 + 200 — 2 = 298, ist = {2,0 — 2,6 — 3,3} Вывод. Разность не достоверна. Осталось неизвестным, различаются ли генеральные совокупности по своим долям и какая из них может иметь большую долю. II. Второй критерий достоверности разности долей. Метод ф («фи») Фишера для долей 0,2 ; >р>0,8; 20% >р%> 80% , а также и для любых долей. «1-н2 „ ( Vj=l I F — (<рт — q>2>a - 12 >Fsti 1 J Ч- ^2 ч ^2 — ^1 Ч- Я-2 — 2 J Фх, ф2 — углы «фи» в радианах находят по табл. XIII Fst — стандартные значения критерия Фишера (табл. IX) 4 Пример:- п1 = 5000, А, = 4; n2 = 500, А2=4; рх = - = 0,0008, р2 = 5000 4 = 500 =0,0080; ф!= 0,0566, ф2= 0,1791, = 0,1225, d| = 0,015 „ 5000-500 „ !Vj=l , » F =0,015—--------—- = 6,8 /г =/3 8 — 6,6— 10,8} 5000 4-500 — V2=oo, 1 . ’ Вывод. Разность достоверна по второму порогу вероятности безошибочных про- гнозов. С вероятностью 0,99 можно считать,, что содержание объектов с признаком в сравниваемых генеральных совокупностях не- одинаково, причем эта доля в первой генеральной совокупности меньше, чем во второй Первый кри- терий для данного слу- чая дает не- правильные показания: Г 0,0008-0,9992 td = (0,0080 - 0,0008) : ]/ ---- 0,008-0,992 ------------=1,8 499 297
Алгоритм 13 Оценка разности между выборочной и генеральной долями 1. Проверка гипотезы о принадлежности изучаемой выборки (р) к определенной известной генеральной совокупности (Р). 2. Проверка гипотезы о величине генеральной доли (Р) по результатам проверочного выборочного исследования (р) р, Р — выборочная и генеральная доли d = р — Р — разность между выборочной и генеральной долями ,----ошибка разности между выборочной и генеральной долями, _____ ___у / PQ равная ошибке выборочной доли, определяемой на основе та — тр — ‘ известных или предполагаемых генеральных долей Р и п — объем выборки Пример 1. Впервые исследованная группа объемом «. = 50 содержала 35 плюсо- вых объектов (имеющих изучаемый признак), р =0,70. -Проверяется гипбтеза о принадлежности этой группы к генеральной совокупности, в которой таких объектов обычно содержится 50%, Р = 0,50 * 0,7— 0,5 0,20 • . t „ =----- = —:------------= 2,9; v = 50—1=49; ^={2,0—2,7—3,5} Р~р 1 Л 0,5 0,5 0,07 = / ' У 50 (табл. X) , Вывод. Разность достоверна с вероятностью |3> 0,99; ответ. отрицателен: изученная группа не может принадлежать к этой, генеральной совокуп- ности [вероятность этого очень мала: (1 — р) <7 0,01] Пример 2. Предложена гипотеза: в генеральной совокупности плюсовых объектов должно содержаться 75%, Р = 0,75. Проверка по выборке, в кото- рой при п = 100 плюсовых объектов оказалось 70 (р = 0,70), показала: 0,75 — 0,70 ’ , , t р =------г — =1,2, v = 99, tst = {2, 0 — 2,6 — 3,4} (табл. X) ( / 0.75-0,25 -- 1 . , У ЮО Вывод. Разность явно недостоверна, ответ положителен: гипотеза не опровергнута и может считаться правильной до тех пор, пока не будет опровергнута или заменена более точной гипотезой .298
Алгоритм 14 Вычисление коэффициента корреляции для малочисленных групп Первый способ > Второй способ ЖЖ Ж72 - —-—- /СА -И»»-,) Vit V2— даты признаков С1( С2 — дисперсии признаков / ' (2У)2 С==Ж =—-—-— П п — число сравййваёмых^ийр Cj±C2-Cd Г — . (п >- nsf) 2/CiC2 Ci, С2, Ca — дисперсии по первому и второму признакам и по ряду разностей d = = / - v2 •(Ж)2 „ (W C = sv2— ——— и Cd= Z<P— -— n n n — число сравниваемых пар V1 V. V,V2 V, v2 А /=?,—v2 d2 3 11 9 121 33 31 27 961 729 ' +4 . 16 7 10 49 100 70 22 24 484 576 —2 4 1 7 1 49 7 27 32 728 1024 —5 25 11 4 121 16 44 29 29 841 - 841 0. 0 9 3 81 9 27 21 24 441 576 —3 9 5 9 25 . 81 45 30 27 900 729 +3 9 2 . 7 4 49 14 23 23 529 529 0 0 . 10 4 100 16 40 28 31 784 961 —3 9 4 12 16 144 48 25 30 625 900 —5 25 8 3 64 9 24 24 23 576 529 '/I 1 60 70 470 594 352 260 270 6870 7394 —10 98 602 Ci = 470 = 110 10 702 . С2= 594 — — = 104 „ 60-70 352 — 10 —68 Г /110-104 , 107 = — 0,64 я= Ю, ns/={10—15—23} (табл. XII) 2602 С, = 6870 — —= 110 1 10 2702 С2= 7394 — = 104 10 102 Crf-98- w — 88 110 4- 104 — 88 + 126 „ г— , — -—4 0,59 2 / 110-104 214, я=10, ns/ = {ll—18—27} (табл. XII) Вывод. Отрицательная корре- ляция в генеральной совокупности достоверна с вероятностью первого порога р > 0,95 Вывод. Положительная корреляция в ге- неральной совокупности на грани достоверности первого порога. В исследованиях пониженной от- ветственности такую корреляцию можно считать достоверной. В ответственных работах следует повторить оценку корреляции на новом более обширном Материале 299
Алгоритм 15 Составление корреляционной решётки для последующего измерения корреляционных связей первого признака (1) со вторым (2) Первичные измерения Vi 107 169 121 168 167 124- 138 145 130 98 60 93 54 90 86 57 64 71 47 43 133 50 163 87 135 111 1£8| 72 140 132 2 57 37 81 50 61 37 101 44 67 55 1 117 165 147 153 149 179 172 142 151 113 2 50 84 73 70 74 |W4| 87 69 65 42 1 134 155 93 161 159 80 ' 139 173 137 177 * 2 59 73 37 80 77 35 66 90 63 .95 1 102 136 157 185 127 131 ' .152 115 175 104 2 48 ' 62 75 97 63 53 67 48 93 53 <я» Показатели двух вариационных рядов 138 п = 50; g — число классов = 1 -f- 3,3 log 50 я; 7; k± == —— ~ 20 69 Ипц = 50 -f- 188(138); ,lim2 = 35-е- 104(69) k2= ——^10 Разноска корреляционной решетки (достаточно обозначить только начала классов) 1 2 50— raz=(60) 70— (80) go- fi оо) HO- fl 20) 130— (140) 150— (160) 170— (180) п2 W 95—(Ю0) ' : :4 4 85—(90) - ;• з 7 3 6 75—(80) 1:5 5 65—(70) П 6 : : 4 10 55—(60) \ •1 ••2 П 7 10 45—(50) •1 ••2 . : • 3 ••2 8 35—(40) •1 • -2 ••2 ••2 7 «1 | 1 3 5 7 15 12 7 IV- > 300
Алгоритм 16 ' Вычисление коэффициента корреляции по способу сумм для больших групп, по корреляционной решетке при отсутствии достаточной счетной техники 2/с;с' , ( Sf \ C1= s2- — [JV > Nst} / S° \ S1 = Pl- [= S/a] табл. XII C' = S2 — \ n /2 S2—Pi-Mi-A2(p2+q2)[— S/'a2) s2 \ 0 1 d 02 n / .Ср С'2— дисперсии, выраженные в квадратах классового промен Рассчитываются по указанным рабочим формулам для суммарных вариационных рядов решетки. сутка шжнего и "d ' /г2)’ правого Cd — дисперсия по ряду разностей >-10 / между центральными отклонения- ”1 — ми средин классов, выраженных в классовых промежутках. Рас- считываются по указанным рабо- чим формулам для ряда разнос- тей, составленного путем сумми- Д- рования частот по диагоналям * решетки. 'TH. — — a -А — / / ьостаолвние ряда разностей 1 z / a 1 A z Условные средние (АгА2) устанавливаются как средины классов, соответствующих центральной ячейке, которая предварительно очерчивается в месте наибольшего скопления частот (можно в любой клетке решетки). 60 80 100 120 At 140 160 180 n2 Pi =54 p2=47 nd Pi=40 Р2 = 10 100 | 1 4 | 4 | 4 | 4 | 10 Г 10 10 90 | | ' 1 3 3 | 6 | 10 | 14 j 20 | 30 — 80 j 1 5 1 3 I 15 I 29 1 16 1 — — 70 1. 1 6 4 1 10 25 — 1 4 4 — А2 60 | 1 | 2 IZI | 10 - — j 50 <71=4 <7г=0 50 | 1 '2 | 3 1 2 8 I 15 — 109,7+163,5—38,1 40 | 1 2 2 | 2 7 7 7 2 V 109,7+163,5 = + 0,88 Щ j 1 3 5 1 7 15 12 7 Л'=50 <71=22 7 <71=30 | 1 9 | 16 1 - 19 7 | Pi=26 N = 50 <72=20 j 1 I 5 14 1'- 1 - 1 - 1 7 f Рг=7 Ns< = {5-7 — 9} S1 ?2 N C' .1'М=Л+й-^1- N a=ft 1/ с' Г N—1 1' 26—30=— 4 26+304-2(7+20)=fl0 0,3 110—0,3=109,7 140+20 —=138,4 50 '20 = V 49 =29,9 2 54—22=4-32 54+22+2(47+7)=184 20,5 184—20,5=163,5 60+10 -±^-=66,4 50 ' 10 1/^ = г 49 =18,3 ’ d | 40— 4=4-36 40+ 4+2(10+0)= 64 25,9. 64—25,9=38,1 — — 301
Алгоритм 17 Вычисление коэффициента корреляции по способу произведений для больших групп, по корреляционной решетке при наличии достаточной счетной техники (начиная с арифмометра с полной регистрацией числа оборотов) с' х (Snax)-(Sng2) С1.2 — 2 (а12/а2) — N С 1.2 , , (2пйх)2 г = С1 = М-^ L= ' VCjCl ' N , (Sna2)2 Cj 2 — дисперсия произведений центральных отклонений вариаций (средин классов) по обоим признакам, причем эти отклонения выражены в классовых проме- жутках. Рассчитывается на основё произведений условных отклонений (а) по приведенной рабочей формуле. С\,С’2—дисперсии первого и второго признака, выраженные в квадратах классового промежутка. Рассчитываются по указанным рабочим формулам, для нижне- го (1) и’правого (2) суммарных вариационных рядов. ShcZx, Snap 2na2,.2na2’ 2 (fli-faz) рассчитываются на арифмометре путем накапли- вания элементарных произведений без записи и снятия промежуточных ре- зультатов \ 1 2 \ 100 60 1 | 80 1 100 120 140 160 180 п2 а2 / =878—768,3=. = 109,7 4 4 6 । ! С'=512 —348,5 = = 163,5 90 3 3 6 5 80 5 5 4 2 (axS/a2) = 635 Л 70 6 4 10 3 60 1 2 7 10 2 с;.2 = 635 — 196-132 50 ~ ; = +117,6 / 50 1 2 3 2 8 1 40 1 2; 2 . 2 7 0 .. + 1 3 5 7 15 12 . 7 50 ХихИх = 196 1962 L= =/Ьо,3 50 0 1 2 3 4 5 6 — = 878 /7=1^=348,5 50 Sfa2 0 1 4 7 34 47 39 =132 Sn2a2 = 132 2n2a2 = 512 +117,6 М=50 = = + 0,88 /109,7-163,5 = Nst = {5 — 7 — 9} (табл. XII) 30 2
Алгоритм 18 Полный корреляционный анализ 2 80 100 120 140 160 180 п2 а2 6 N = 50 ... объем решетки g = 7 ... число классов первого признака С{ = — L — = 878 — 768,3= 109,7 C'2 = 2n2a$ — — = 512 —348,5 = 163,5 . С'Н/ = 2Яг —Я2 = = 489,0 — 348,5= 140,5 ^1.2= 2(а12/аз) — /V — 196 132 = 635 — = 117,6 . 50 100 4 4 90 3 3 6 5 80 5 5 4 70 6 4 10 3 60 1 2 7 10 2 50 1 2 3 2 8 1 40 1 2 2 2 -7 0 (C;.2)2= 13 829,8 «1 1 3 5 7 15 12 7 50 SncZt =196 1962 £ = = 768,3 50 1322 — rri —348,5 г 50 0 1 2 3 4 5 6 — 2ncZj = 878 2/“2 ° 1 4 7 34 47 39 = 132 2na2 = 132 Sna2= 512 „ (^М)2 П/ — п 0 0,3 3,2 7,0 77,1 184,1 217,3 = 489,0 — а2— «1 0,0 0,3 0,8 1,0 2,3 3,9 5,6 2 (a12fa2) = 635 Л4 2= 40,0 43,0 48,0 50,0 63,0 79,0 96,0 Показатель прямолинейной связи (квадрат коэффициента корреляции) (С?.)2 13 829,8 _ г2(М —2) (0,77) (48) С\с2 109,7-163,5 =^=’ r2 1 — г2 0,23 ILjZ Vi=l, v2 = W —2 = 48, Fs; = {4,0 —7,2—12,3} (табл. IX) Т}2 Показатель криволинейной связи (квадрат корреляционного отношения) Т)2 = £л1 = Л2А = 0 86. f _JO>.86)(43) С2 163,5 ==’ (1 - T]2)(g- 1) (0,14)(6) =Ё= vx = g —1=6, v2 = N — g = 43, Fs; = {2,3 —3,3 —4,8} Критерий криволинейности р = = (0,86-0,77) (43) __ 1 (I- Tl2)(g-2) (0,14)(5) = vi = g—2 = 5, v, = A — g = 43, Fs; = {2,4 — 3,5 — 5,2} 303*
Алгоритм 19 Дисперсионный анализ однофакторных комплексов для количественных признаков, для малых групп Градации Число градаций г=5 Факториальная дисперсия СХ = 2Н. — Н^ = 552 — 500 = 52 j 1 2 3 4 5 Даты V 2 3 1 4 3 6 3 5 6 4 6 9 9 7 6 6 3 6 5 6 1 !?=• о § 1 8 , Случайная дисперсия Сг = XV2 — Ж = = 586 — 552 = 34 Объем комп- лекса А = = = 20 п 3 4 5 4 4 Общая дисперсия Су = 2V2 — Я2 = = 586 — 500 = 86 SV 6 16 30 28 20 22Г= ЮО Факториальная варианса <т2=^= —= 13,00 х г — 1 4 Hi — п 12 64 180 196 100 2Н(- = 552 2V2 14 70 194 202 106 SV2 = 586 Случайная варианса <т2= —— = -^=2,27 2 А —г 15 Частные средние Mi '2 4 6 7 5 Общая сред- няя Л42=5 Показатель силы влияния г]2 = Сх 52 5 Су 86 = f ~ 1 4 - Его ошибка т г—(1—п2) • —0,395- _ —0,105 > Дс N — г 15 Его достоверност! -Пх 0,605 Vt = r— 1=4, v->= N— г = 15 76 = Fst= {3,1 —4,9 — 8,3} “ т 2 ~ о,105 ~ = 1х Доверительные границы генерального показателя (приближенные значения) Д = Fst • т 2 = 3,1-0,105=0,33; + Д = 0,61 Д- 0,33 = 0,94 Д = 0,61 — 0,33 = 0,28 (р=0,95) Достоверность по Фишеру 13,00 F — — „ = 5,74 . ,о2 2,27 = Общий вывод. Влияние фактора достоверно с вероятностью |3>О,99. Для всех объектов данной категории влияние изучае- мого фактора может составить не менее 28% от обще- го влияния всей суммы факторов Форма итоговой записи Разнообразие Дисперсии (суммы квад- ратов) С Числа степеней свободы V Вариансы (сред- ние квадраты) (J2 „2 = 0,605 + 0,105 ix - . 0>605 К 7А Ф = = 5.76 0,105 13,00 F — 2? — 5,74 (проверка) Fst= {3,1_— 4,9 — 8,3} (табл. IX) Факториальное {межгрупповое .52 . 4 13,00 Случайное (внутригруп- повое) 34 15 2,27 Общее 86 19 — 304
ДЛЯ для Алгоритм 20 Дисперсионный анализ однофакторных комплексов количественных признаков; больших групп; z малозначных датах А — фактор А1А2А3 ..; градации V — результативный признак Я, А-2 -^3/ А6 п ,=5 St = 2nV = ±127, S2=2nV2 = 579 Факториальная дисперсия = 561,1 — 537,6=23,5 1 3 4 Н S> Л У = = я 1272 = - =537,6 30 5 3 2 3 2 Случайная дисперсия Cz = S2 — = 579 — 561,1 = 17,9 д 2 9 2 2 8 3 1 1 3 5 Общая дисперсия Су = S2 — = 579 — 537,6 = 41,4 2 1 2 3 па 6 5 6 6 7 N = 2л = 30 Факториальная варианса с2= .. Сх_ = _23уД = 5>875^ х г— 1 4 • \ SfV 29 21 33 23 21 = 127 Случайная варианса . 9 С_ 17,9 GZ = — = 0,716 2 -дг _ г 25 (21V)2 Н,= ‘ пА 140,2 88,2 181,5 88,2 63,0 -.561,1 2 Сх 23,5 Показатель силы влияния г\х— ' = 0,568 к 14 Его ошибка т 2 = (1 — гА)-= 0,432 • —— = 0,069 N — г 25 Чх 0,568 vx = 4; v2 = 25" Его достоверность Ф = —— =---=8,2 0,069 = Fsf= {2,8 — 4,2 — 6,5} (табл.ТХ) Доверительные границы генерального показателя (приближенные значения) A = fsz. 2 ^2,8. 0,069 = 0,19; ^ = /д+Д = °’57 + 0’19 = 0’76 Дс ,х —Л-0,57 —0,19 = 0,38 (Р---0,95) Достоверность по Фишеру’ 5,875 — а2 ~ 0,716 = 8,2 Общий вывод. Влияние достоверно в высшей степени. Для всех объектов данной категории влияние изученного фактора может составить (|3=0,95) не менее 38% и не более 76% от ’общего влия- ния всей суммы факторов Форма итоговой записи Разнообразие Дисперсии (суммы квад- ратов) С Числа* степе- ней свободы V Вариансы (средние квад- раты) о2 = 0,568 ±0,069 Факториальное (межгрупповое) 23,5 4 j 5,875 t 0,568 Ф = 8,2 0,069 = Случайное (внутригрупповое) 17,9 , 25 0,716 Г = ^=8,2 0,716 = Общее 4Ь4 29 1,428 Fst = { 2,8 - 4,2 — 6,5 } 20 Н. А. Плохинский . 305
Алгоритм 21 Дисперсионный анализ однофакторных комплексов для количествнных признаков длй больших групп при многозначных датах A—фактор Ai, A2...градации ^-условные l результативный отклонения J признак A W a 1 At a2 ^3 At -^6 -<4e n r=6 3500 / 5 1 1 3 tfE = _ (Sna)3 _ ~ N ~ _ 126® - 50 ~ . =317,52 ' 3450 4 3 2 1 I 1 1 9 3400 3 2 3 3 2 1 •2 13 3350 2 2, 4 3 2 2 14 3300 1 3 2 ' 2 I- 3250 0 1 2 3 na 7 7 12 10 8 6 | N=2n=50 2fa 25 21 29 23 13 15 | =126 „ №)2 n „ 1 nA 89,3 63,0 70,1 52,9 21,1 37,5 | ' SH,.=333,9 Sl=Ena=126, S2=Ena2=400 Случайная дисперсия CZ=S2—2Н;=400—333,9=66,1 Факториальная дисперсия Cx=2Hf—H2=333,9—317,5=16,4 Общая дисперсия С y=S2—Н2=400—317,5=82,5 Факториальная варианса о2 _ _Е.Х _ = 16’4 =3,28 х г—1 5 Случайная варианса 02 = _£z_ = 66.’.L=1,50 z N-r .44 9 Cx 16,4 Показатель силы влияния rr. = — =-------— = 0,199 ix Су 82,5 -i— r ] 5 Его ошибка m 2 = (1 — ri^)-----= 0,801 —— = 0,091 V x N—r 44 T)2 Его достоверность Ф = — ^x 0,199 vx = r—1 = 5, v2 = N- 0,091 Fst = {2,4- 3,5 - 5,1} 44 Доверительные границы генерального показателя в данном случае'не определяются, так как выборочный показатель силы влияния оказался недостаточно достоверным (недостоверным) 9 GX 3,28 F~ a2 — l,50~?<? Общий вывод. В выборочном комплексе обнаружено влияние фактора в размере 20%. Выборочный показатель оказался недостоверным. Осталось неизвестным, влияет фактор на объекты изученной категории или не влияет в генеральном ком- плексе Форма итоговой записи • Разнообразие • Дисперсии (суммы квадра- тов) С Число степеней свободы V ’ Вариансы (средние ква- драты) а Факториальное (меж- групповое) 16,4. 5 3,28 Случайное (внутри- групповое) / 66,1 44 - 1,50 Общее .. , 82(5, ' 49 Л :, г]2 = 0,199 ±0,091 0,199 Ф — ------ 0,091 ,3,28 F - 1,50 Fsf.= {2,4= 3,5 —5,1} = 2,2 = 2,2 •306
Алгоритм 22 Дисперсионный анализ однофакторных комплексов для качественных признаков Градации . “Число градаций г=5 =A8L = 144 N 160 Факториальная дисперсия Cx = ZHi-Hz = = 1,96—14,4 = 5,2 1 2 3 4 5 п 20 30 40 30 40 М=2п= 160 Случайная дисперсия Cz = 2m — 2Яг = = 48— 19,6= 28,4 т 2 3 8 15 20 2m = 48 Общая дисперсия. Су = 2m — = = 48— 14,4= 33,6 т2 Hi = — п 0,2 0,3 1,6 7,5 10,0 19,6 Факториальная варианса 2 Сх 5,2 1 “ 4 -1,300 х г— 1 4 т Р =— п 0,1 0,1 0,2 0,5 0,5 Р2 = °,3 Случайная варианса ’ Cz 28,4 <£ = — = —7-= 0,183 N — г 155 п Сх 5,2 Показатель силы влияния п".— — . —0,155 ’ , 1 су 33,6 =А= г j 4 Его ошибка т 9=(1—П?) = 0,845-— = 0,0218 х N—г ’155 с 0,155 Ъ.= г —1 = 4 Его достоверность Ф— —7,1 v2 — N—г—155 ^2 0,0218 = Fsf = {2,4 — 3,4 — 4,9} Доверительные границы генерального показателя (приближенные значения) _9 /п* + Д = 0,155 4-0,052 = 0,207 1 = F.,.^ = 2.4.0,0218_0,052; <д_155Z0',052_0,1ю (01=0,95) ах 1,300 F~ а2 —0,183“ Z= Общий вывод. Влияние фактора достоверно в высшей степени. Для всех объектов данной категории влияние изу- ченного фактора может составить (0 = 0,95) не менее 10% и не более 21% от общего влияния всей суммы факторов / Форма итоговой записи Разнообразие Дисперсии (суммы квадратов) С Числа степеней свободы - v Вариансы (средние [ квадраты) а2 г)* =0,155 ± 0,0218 ’ °-I55 — 0/0218 1,300 0,183 = Fst = {2,4— 3,4— 4,9} Факториальное (межгрупповое) 5,2 4- 1,300 Случайное (внутригрупповое) 28,4 ? ; 1'55 6Д83 Общее 33,6. 159 0,2’11 20* Ж
Алгоритм 23 Дисперсионный анализ двухфакторных пропорциональных комплексов для количественных признаков . Первый фактор А, градации Л1; /12 ' для малых групп Второй фактор В, градации Bj, В2 ' Результативный признак V ' . Ai Л 2 rA=2 rB=* 1 2 3 * * n 2V „ (bV)2 л== n в2 Bt V 8,12 , 3,4,5 1,3 6, 8, 10 „ 4R0 HS--- N -360 41 5 32 204,8 6,4 п 2 3 2 3 N =10 a2 5 28 156,8 5,6 2V 20 12 4 24 2V = 60 Ял = 361,6 208 50 10 200 SV2= 468 Bl 4 24 144,0’ 6,0 200 .48 8 192 2BZ=448 B2 6 36 216,0 6,0 щ — п SV j .2 — j-^1 2 п 1 10 4 2 8 Ms = 6 HR = 360 a A ' 1 В AB X 2 У C 1,8 0,0 Cx—CA—CB 86,4 ZHt-Hs 88,0 2 V2—2BZ 20,0 1 ' 2V2 — Hs 108,0 0,015 0,000 0,800 0,815 0,185 1,000 V rA~l 1 'в^1 1 1 rA rB — 1 3 N~rArB 6 N— 1 9 2 1,6 0,0 86,4 29,33 з.з'Ь Vi v2 1 3 ,.=1L 0,5 (\0 25,9 — 6 табл. IX 35,5 23,7 13,4 9,8 6,0 4,8 Продолжение алгоритма 23 : '2 Пг , 0,185 _9 «2. =0,031; 7)^= 0,61 = 0,99} ^лв - vz о т„2 = U - =0-092; Пх= {0,38-4- 1,00} ‘ ^х Выводы. . , 1. В выборочном комплексе оказались достоверными только взаимодействие градаций т}лв = 0,80(0,61 = 0,99) и суммарное действие фак- торов ^ = 0,82(0,38 — 1,00). - 2. Это означает, что сила каждого фактора в значительной степени определяется градацией другого фактора. При Аг второй фактор (В1-^В2) понижает, результативный признак в среднем с 10 до 4; при Л2 второй фактор (Bj. —>В2), наоборот, повышает'результативный признак в среднем с 2 до 8. 3. Анализ действия каждого такого фактора в отдельности без совместного анализа действия обоих факторов дает ложное заключение о сла- бом, недостоверном влиянии или о полном отсутствии влияния (г]2 = 0) каждого из таких факторов в отдельности, хотя эти факторы мо- гут иметь , большую силу действия, но только при определенной градации другого фактора
Алгоритм 24 Дисперсионный анализ двухфакторных пропорциональных комплексов для количественных признаков первый фактор А, градации AXA2 , • для больших групп второй фактор В, градации BjB2B3 А = 10, k = 10 ' результативный признак: вариации W условные отклонения а 41 । А2 гл=2 ГВ=3 п Sfa н __ №)2 1 п а M^A+ka W fl\ . в, в2 в, В, В2 в* 60 5 1 2 Н v —“ s д? 1312 Ат 25 77 ' 237,2 3,08 40,8 50. 4 4 4 1 2 А2 25 54 116,4 2,16 31,6 40 3 6 3 2 5 30 2 1 2 6 2 = = 343,2 50 20 1 2 2 3 НА = 353,6 10 0" 1 2 ' В1 8 6 4,5 0,75 17,5 п 4 12 9 4 12 9 N = 50 2/а 4 38 35 2 25 27 2/а = 131 в2 24 63 165,4 2,63 36,3 W 6 126 141 2 61 85 2/а2 = 421 Hi — п 4,0 120,3 136,1 1,° 52,1 81,0 2Яг- = 394,5 В3 18 62 213,6 3,44 44,4 2fa а — п 1,0 3,2 3,9 0,5 2,1 3,0 Но = 383,5 £5 ’ Mi=A4rka 20,0 42,0 49, о| 15,0 31,0 40,oj | Продолжение алгоритма 24 С А 10,4 В Н„ — Ну.. о Л 40,3 АВ сх сА -= св 0,6 X SiHi — 51,3 , г — ZHi 26,5 - У Zfat-Hs 77,8 2 Л7 = Сг/ 0,134 0,518 0,008 0,660 0,340 1,000 V ГА-* 1 1 . гв -1 2 <С4—,1)(Гв —1) 2 гАгв~ 1 . 5 N'~rArB 44 N — 1 49 2 10,4 20,2 0,3 10,3 0,6 \ \ v2 Vi 1 - 2 5 F=2t . «г 1 17>3 33,7 0,^5 17,2 — 44 табл. !Х 12,5 8,2 й,1 ’ 7,2 5,1 3,5 4,1 3,2 2,4 2 т , = v . • — = 1 = 0,0077; = {0, 10 = 0,17} ir. Л V, 44 ’ А -• *___________;_____________ _ - о : Л П 44 _ ™ 2 = = 2 • --- = 0,0154; = {°>47 . 0,57} 4g vz ‘i** Vz v 5 /и « ==(1 —rV?) • -—= 0,34-— = 0,0386; ^ = {0,57 = 0,75} 'x' vz 44 * Выводы. 1. В высшей степени достоверным оказалось влияние каждого фактора в отдельности и их суммарного действия. 2. Влияние взаимодействия градаций оказалось очень малым и совершенно недостоверным. 3. Это значит, что в исследовании не обнаружено зависимости влияния каждого фактора от того, при какой градации другого фактора он действовал •’
312 Алгоритм 25 Дисперсионный анализ двухфакторных пропорциональных комплексов ' для.качественных признаков ' Л1 - Аг Аз гА=3 Хтг Sm Sra Pt в, в2 в3 Bi в3 в3 Bi в2 в, В,. п 10 20 10 . 20 20 40 20 40 10' 20 10 20 М=2п=240 Tli 60 40 26,67 0,67 Аз 120 68 38,53 0,57 т 5 ' 12 . 7 16 18 28 10 12 1' 6 5 14 Sm= 134 Аз 60 26 11,27 0,43 , s| е II i 2,5 7,2 4,9 12,8 16,2 19,6 5,0 3,6 0,1 1,8 2,5 9,8 ZHi = 86, 0 НА = 76,47 0,30 о _Л_ *х — п 0,50 0,60 0,70 0,80 0,90 0,70 0,50 0,30 0,10 0,50 0,70 (2m)2 п v— „ — =74,82 Bi 40 24 14,40 0,60 в. 80 46 26,45 0,58 А В АВ . е X 2 У в3 40 22 12,10 0,55 Ci 1,65 нв-н^ 0,18 Сх —СА —Св 9,35 ' М • QO Й5 м • ът - Wi 48,0 Ът 59,18 80 42 22,05 0,53 2 я,-— 1 Су 0,028 о.ооз 0,158 0,189 0,811 1,000 Яо = 75,00 а ’
314 л| Алгоритм 26' Дисперсионный.анализ двухфакторных неравномерных комплексов для количественных признаков для малых групп , д, в v X. -41 О? 04 II II BJ ь. к. Число средних g аЛ[х Л1;= SMx g. В1 в2 ' s3 ' Bt в2 в2 V 2,3,4 з,з; 3,4 4,5,6, 7,8 2,3, 3,4 7,8,8, 9,9 4,5,5, 5,6 -4i 3 12,3 4,1 16,81 A2 3 16,2 5,4 29,16 п 3 4 5. 4 5 5 .. N=26 ' . Ha = SM2a = 45,97 SV 9 13 _ 30 12 41 25 SV = 130 SV2 29 43 190 38 339 ’ 127 XV2 = 766 A 2 6,0 3,0 9/) „ т ГЦ — п 27,0 42,3 180,0 36,0 336,2 125,0 S/f(- = 746,5 B2 2 11,5 5,8 33,64 SV Мх- . п 3,0 3,3 6,0"‘ 3,0 8,2 5,0 SMX = 28,5 B3 2 11,0 . 5,5 30,25 М2 9,00 10,89 36,00 9,00 67,24 . 25,00 SM2=157,13 H — — = SM| = 72,89 SMX 2 м = = — ГА'ГВ — = 4,75; М2 = 6 22,56 ^=_^ = 65о N 26 ( \ Сл = ЛЦ —~ — М2 А \ ГА / / 45 Q7 \ . = 26(^У” -~22’56) = П’18 Cy = SV2 — HE = 766 — 650 = 116 \ / 79 80 \ CB = w --------— Л42 I = 26 f —— 22,56 ) = 45,24 \ rB / \ 3 J , ( SM2 \ / 157 13 cx = w (---~— M? ) = 26 ( - 22,56 6 A - В Cz = SV2 — S//j = 766 — 746,5 = 19,5 CAB = c'x — C'A — C'B = 94,38 — 11,18 — 45,24 = 37,96 A В AB X z к» У C' . 11,18 45,24 37,96 94,38 — C = d-C 11,4 46,3 38,8' 96,5 19,5 116,0 < ^ = -^- c 0,098 0,399 0,335 . 0,832 0,168 1,000 V 4-1 1 rв 1 2 VAVB 2 rA ~rB~\ 5 N-rA'rB 20 • N — 1 25 rr2 ai — Vi H,4 23,2 19,4 19,3 1 0,98 \ Vi v2 \\ 2 5;' *=4 °z 11,6 - 23,8- 19,8 19,7 20 табл. IX 14,8 10,0 6,5 8,1 5,8| 4,1 J4,3 3,5 2,7 Cx = SHe = 746,5 — 650 = [~96X| 96,5 ^ = 1’022 8 7 6 4 3 Bt B2B3 BfB2B3 At a2
9 lb’ Алгоритм 27 w. Дисперсионный анализ двухфакторных неравномерных комплексов для качественных признаков Al Аг rA=2 Г£=3 g~ ! Bi . Bs B3 Bt B2 B3 n 70 20 . 10 10 100 ~ ,90 Я = 300 At 3 1,5 0,5 0,25 Да 3 0,9 0,3 0,09 tn 14 10 8 1 30 . 45 3/zz = 108 2Aj2 =0,340 m? = — fl 2,8 5,0 6,4 0,1 • 9,0 22,5 Sffi = 45,8 Bl 2 0,3 0,15 0,0225 Px 0,2 .. °>5 0,8 0,1 0,3 0,5 ^Px — ^\^ B2 2 0,8 0,40 0,1600 B3 2 1,3 0,65 0,4225 . Px 0,04 0,25 0,64 0,01 0,09 0,25 Sp2 = 4,28 2M?, = 0,605 Zpx 2,4 , л M = —— = —— = 0,4; M2 = 0,16 rArB 6 (S/n)2 1082 Яу = - -= „ n =38,9 . . 2 N 300 / 2Л4д \ / o,34 X . Си=лИ — — Л42 = 300( -4- 0,161 = 3,0 \ rA / V 2 ’ / ' Cs = 2zn — ^s.= 108 — 38,9 = 69,1 / SM2B cb-n[ M2 \ rB | = 300 °’g0- — 0,16^ = 12,6 Сг=2/п —2Яг= 108 — 45,8 = 62,2 Cr = AH -----— A42 I = 300 \rArB , / 1,28 —----— 0,16 6 Сх = 2Яг= 45,8 —38,9 = | 6,9 | С С = аС 2 М _________ v а? = -— o? л = — az с' =е'—Си—Со = 15,9 —3,0 —12,6 = 0,3 Л Z1 D . Сх 6,9 С' " 15,9 = 0,434 А В АВ х г У 3,0 1,30 0,019 ГА~1 1 1,30 6,1 12,6 5,47 0,079 ГВ 1 2 2,74 12,9 0,3 . 0,13 0,002 Ъа-^в-^ 2 0,07 0,3 15,9 Сх = 6, 90 Сг = 62,2 . 0,100 0,900 ГАГВ- 1 5 1,38 6,5 N~rArB 294 0,212 294 А — 1 299 2 11,2? 7,2 6,8] 4,7 3,э| 3,0 4,3 3,2 2,3 Су = 69,1 1,000 з Л 2
— _ ф' — . - _— Алгоритм 28 Дисперсионный анализ двухфакторных' иерархических комплексов, равномерных, пропорциональных и неравномерных Применяется, когда для каждой градации первого фактора А невозможно подобрать одинаковые градации второго фактора В. , Влияние одного второго фактора выделить невозможно. - . Вскрываются влияния одного первого фактора [Д], второго фактора вместе с сочетанием градаций обоих факторов [В+ДВ], суммарное обоих факторов [х], случайное [z] и общее [р]. В неравномерных комплексах искажении, связанные с неортогональностью, затрагивают только дисперсию по второму фактору совместно с сочетаниями [В-|-ДВ] Для количественных признаков ' - л. . Аг г=2 л . в+лв X Z У Bi В2 в3 Bt В, в3 й=6 V 1,3 2,3, 4,7, 3,4, 5, 4,5, _ 6, 2,5, 6,7, 6,8 812 Bs = ~~Г~ = 2 . 18 . =364,5 С 12,25 Сх—С. л А 16,25 28,50 2172—2Яг- 36,00 2172— 64,5 п 2 4 3 3 4 2 i N = 18 ьо II 0,19 0,25 0,44 0,56 1,00 ... 217 . . 4 16 . 12 15 .. 20. . 14 217 = 81 . . „ № Hi — . п 8 64 48 75 100 98 2Hi = 393 V г—1 1 g — r 4 g— 1 5 N-g 12 N — 1 17 21/2 10 78 511 77 114 100 2172 = 429 02=^ Vi 12,25 4,06 5,70 . 3,00 — * 4 4 5 5 7 = 4,51 ’и А : п 2V. (217)2 Кд — л п 2ВЛ = • =66,67 + + 310,08 = = 376,75 Л 4Д м 1Д — — Ai 6 20 66,67 3,33 [0,999 0,99 10,95 12,6 9,3 4,8 9,6 6,4. 3,3 8,9 6,1 3,1 — — а2 12 61 310,08 5,08 04 о Для качественных признаков i л, Ля r=2 A B+AB X z У Bi . B-2 в. Bi в, . в» . g=6 п - 70 30 10 10 100 80 N = 300 c , ^A-^ 0,72 CX~CA 6,18 6,90 62,20 2m 69,10 пт 14 15 8 1 30 40 ,2m =108- 2 C‘ n C 0,01 0,09 0,10 0,90 1,00 С4 . g « 1 й: 2,8 • 7>5 6,4 0,1 9,0 20,0 '2Hi = 45,8 V > —1 1 g— r 4 1 m Uo N-g 294 , N— 1 299 1 Pi 0,2 0,5 0,8 0,1 0,3 11 XI —— - 2 N = 38,9 ff2 = Vj 0,72 1,54 1,38 0,21 . — 1 A : ' ‘П m m2 HA = A n Pa 2ДЛ = 8,41 + + 31,21= = 39,62 3 + 7,3 6,6 , — — Aj 100 29 8,410' 0,290 (0,999 Fst 0,98 10,95 11,1 6,7 3,9 4,7 3,4 2,4 4,2 3,1 2,2 — — - a2 200 79 31,205 0,395
Алгоритм. 29. Дисперсионный анализ двухфакторных неравномерных комплексов для количественных признаков, для больших групп А, В Л. j42 л3 гл-3 гв=2 & 2а 2а Л4г=- м21 W' а В1 в2 Bi в2 Bi в2 45 5 » 2 — Л1 2 I 3 1,5 2,25 40 4 1 2 5 ^2 2 4 2,0 4,00 35 3 1 4 1 2 5 2,5 6,25 30 2 1 3 1 2 1 1 НА = 12,50 25. 2 3 5 20 0 3 3 3 8t 3 3 1,0 . 1,00 п 4 8 5 5 10 8 W = 40 3 I 9 j' 3,0 9,00 ( //£ = 10,000 Zfa 4 16, .5 15 10 32 S, =82 Zfa2 6Х 40 13 49 18 134 S2 = 260 I 2 5 - 1 п 4,0 32,0 5,0 45,0 10,0 128,0 2Нг=224 34 / - 13,1 8,6 5,4 - Я fa а— —— п 1 2 ‘ 1 3 1 4 | sS = 12 . 7,4 5,3 3,6 а2 I 4 9 1 16 Ха2 = 32 4,1 3,3 2,5 5Й 12 - М=—=——= — 2;Л42 = 4 ГАГВ. 6 1 S? ,822 ' t Н-я = -тг- = = 168,1 Л N 40 , / Нл \ / 12,50 \/ ' С. =40р-—2- —Л42 ] = 40 | 4 1=6,8 А \ 'А< J \ з ) Су = S2 — н2 = 260 — 168,1 = 91,9 f НВ X / 10,0 \ СК=.4О/ Мг 1 =40 ( =—г 4 ]= 40,0 В \ 'В ) \ '2 ) Сг = S2 — = 260 — 224 = 36,0 с'х = 40 ЛР^ = 4О (21 -4^ = [5зТз| сх = ХН( — Н-£ = 224 — 168,1 = [55?9| С*. r = ci ~С. — с' = 53,3 — 6,8 — 40,0 = 6,5 Z"1Xj л> ±j 1 С 55,9 а = —у- = = 1,049 Сх 53,3 А в АВ х ,г 1 у . с 6,8 40,0 6,5 53,3 - Zi „ 1 С = аС’ 7.1 42,0 6,8 55,9 36,0 91,9 3 i 0,077 0,457 0,074 0,608 0,392 1,000 2 1 1 V ’• гл-1 2- гв~~1 1 (гл-1). (гВ-1) 2 ГАГВ~ —1 5 N — ' ~~ГАГВ 34 N — 1 39 U ! L vi 3,6 / 40,0. 3,4 11,2 1,059 — В] В2 ~Bi В2В1В2 3,4 37,8 Зд2 10,6 — — Aj А2 Aj 320
Алгоритм 30 Дисперсионный анализ однофакторных комплексов при множественной характеристике основных объектов Градации I п Ш к . -г = 3 Основные объекты 1 2 1 2 3 4 1 2 3 п = 2, 4, 3 Первичные даты V; 3 1 1 3 3 2 1 7 6 6 4 8 7 6 7 5 4 4 9 : 6 5 2 2 1 4 2 1 3 2 1 , 116® н „ = ——7 = 449 2 30 2/7; 7 14 9 2/1; = 30 2V; . 14 84 s 18 2И=116 „ (W Hi~ 28 504 36 2Дг = 568 2Г? 34 534 , 44 2^=612 * X г У c 568 — 449= 119 612 — 568 = 44 612 — 449 = 163 T)« 119 —— = 0,73 163 44 = 0,27. 163' ’ 1,00 V 3—1=2 30 — 3 = 27 30—1=29 o2 -- = 59,5 : 2 44 — = г>63 27 vx = 2, vs = 27 F. 59,5 , — 36,5 1,63 = ^ = {3,3-5,5 —9,0} 1 C •-* Показатель силы влияния - = 0,73 ‘ . 4/ • • r । 3 j Его ошибка m2 =(1—in 2) =(1—0,73) = 0,02; ,x. N — r ' 1 30 — 3 . г ' ' 0,73 Ф =—!—- = 36,5 0,02 == A = Fog5 • m = 3,3 • 0,02 = 0,066 Доверительные границы генерального параметра при 0 = 0,95 =0,73 ± 0,07= {0,66= 0,80} 21 Н. А. Плохинский 321
.. Алгоритм 31 Сравнение двух рядов регрессии (I и II) Градации 1 2 3 4 5 g = 5 (число градаций) I 10 13.16,19 20.26,27 28,29,32 3, 6,9 0 II 3, 6, 9 8,10,12 10,13,14 15,16,22 8,14, IS 16,17,20 1, 8, 15 п II 1 3 3 3 6 6 3 6 1 3 N 1=141 N 11 = 21 J W-35 2V j1! 10 18 48 30 162 90 18 90 0 24 / , (W I п П 100 108 768 300 4374 1350 108 1350 0 192 S/i I = 5350 ] yr 2Я II = 3300 / — 6b0U II1 100 126 786 308 4454. 1430 126 1430 0 290 SV2 1 = 54661 у»™ QQ5Q 2V2 II = 3584 J yU0U 2V к М - т п 11 10 6 -16 10 27 15 6 15 0 8 n 1 l т d=Mf—Mn d2 + 4 16 + 6 36 + 12 144 — 9 81 — 8 64 5 2 3 '4 51 ni • Пп 1 • 3 9 % 36 18 3 2q — 8 ' / 1-^3“ 0,75 6 — 1,50 12 ~ 3,00 9 ~ 2,00 4 — 0,75 д — П1 -£ пп q • d +3 +9 4-36 —18 —6 T1=4-24 > q . d2 12 54 432 162 48 T2=708 „ „ „е „ e 2 2 V2 — 2ft 9050 — 8650 vz = N — 2g = 35 — 2 • 5 = 25; a2 = = — ==16 vz 25 , Критерий различия рядов p ^2 fVi = g ) 708 vi= 5 F1 Г —к ip-8’9 ne ^ — 42,6 — 3,9 — 5,9} gcz lv2 = vzl 5- 16 = v2 = 25 1 ’ ‘ Критерий превышения одного ряда над другим 1 T2xN pi= 1 } 242 • 35 vi= 1 Ft — , Г- 1л otic-4’3 Ps/-{4,2-7,8-13,9} Л^ЛГцО^ '-'V2='V*I 14-21-16 — v2=25 1 ' Критерий непараллельности рядов Т2 242 s Т2 ——- , 708--— V1= 4 f3=-Jp^-4=---^-=L_0 v2 = 25^=^2’8-4’2-6’5h- ; g • O2 lV2 — VZ J 5 • 16 . = 322
Алгоритм 32 Определение числа целых знаков в частном Обозначения. в делимом — а Число целых знаков (ЧЦЗ) в делителе т- b в частном —с ЧЦЗ в числах: 625 4- 3 0,0625 — 1 62,5 ф 2 0,00625 — 2 6,25 4“ 1 0,000625 — 3 0,625+ 0 0,0000625 — 4 Правила. I. Если первая слева цифра делителя меньше, чем в делимом, то с=а—b+1 625 : 25 ==25(3 — 2 +1=2); 625 : 2500 = 0,25(3 — 4 4 1 = 0) 0,00625: 250=5=0,000025(— 2 — 34 1 = — 4) 0,00625 : 0,0025 = 2,5 (—2 42 4 1 = 4 1) И. Если первая слева цифра делителя больше, чем в делимом, то с = а — b 125:25 = 5(3 — 2= 1); 125:2500 = 0,05 (3 — 4 = — !) . 0,00125: 250 = 0,000005(— 2 — 3 = — 5) 0,00125:0,0025 = 0,5 (—2 4 2 = 0) III. Если первые слева цифры делителя и делимого равны, то расчет ведется по вторым цифрам; если и они равны, то по третьим и т. д. 333 : 332= 1,003(3 — 3^1 = 4-1); 333:335=0,994(3 — 3 = 0) 4444 : 444=10,009(4 — 3+1 = 42); 0,12:0,00125 = 96(042 = 42) ' IV. Если все цифры кроме нулей справа или слева у делителя и делимого равны, применяется I правило 1000 : 10 = 100 (4 — 2 4 1 = 4 3); 40 : 4000 = 0,01 (2 — 4 4 1 = — 1) 0,002:0,02 = 0,1 (—241 + 1 = 0); 700 : 0,007=100 000(3 4 2 4 1 = 4 6) 0,0395:0,00395= 10 (— 1 + 2.4 1 = 42) 21* 3231
Часть четвертая МАТЕМАТИЧЕСКИЕ ТАБЛИЦЫ /
Таблица I 326 Квадраты чисел 0 1 2 3 4 5 6 7 8 9 0 0 1 4 9 16 25 36 49 64 81 1 100 121 144 169 196 225 256 289 324 361 2 400 441 484 529 576 625 676 729 784. 841 3 900 961 1024 1089 1 156 1 225 1296 1 369 1444 1 521 4 1600 1 681 1764 1 849 1 936 2 025 2 116 2 209 2 304 2 401 5 2 500 2 601 2 704 2 809 2 916 3 025 3 136 3 249 3 364 3 481 6 3 600 3 721 3 844 3 969 4 096 4 225 4 356 4 489 4 624 4 761 7 4 900 5 041 5 144 5 329 5476 5 625 5 776 5 929 6 084 6 241 8 6 400 6 561 6 724 6 889 7 056 7 225 • 7 396 7 569 7 744 7 921 9 8 100 8 281 8464 8 649 8 836 9 025 9 216 9 409 9 604 9 801 10 10 000 10 201- 10 404 10 609 10 816 11 025 - 11236 11449 11 664 И 881 11 12 100 , 12 321 12 544 - 12 769 12 996 13 225 13 456 13 689 13 924 14 161 12 14 400 14 641 14 884 15 129 15 376 15 625 15 876 16 129 16 384 16 641 13 16 900 17 161 17 424 17 689 17 956 18 225 18 496 18 769 19 044 19321 14 19 600 19 881 20 164 20 449 20 736 21025 21 316 21 609 21 904 22 201 15 22 500 22 801 23 104 23 409 23 716 24 025 24 336 24 649 24 964 25 281 16 25 600 25 921 26 244 26 569 26 896 27 225 27 556 27 889 28 224 28 561 17 28900 29241 29 584 29 929 30 276 30 625 30 976 31 329 31684 32 041 18 32 400 32 761 33 124 33 489 33 856 34 225 34 596 34 969 35 344 35 721 19 36 100 36 481 36 864 37 249 37 636 38025 38 416 38 809 39204 39 601 20 40 000 40 401 40 804 41 209 41616 42025 42 436 42 849 43 264 43 681 21 44 100 ' 44 521 44 944 45 369 45 796 46 225 46 656 47 089 47 524 47 961 22 48 400 48 841 49284 49 729 50 176 50 625 51 076 51 529 51 984 52441 23 52 900 53 361 53 824 54 289 54 756 55 225 55 696 56 169 56 644 57 121 24 57 600 58 081 58 564 59 049 59 536 60 025 60 516 61 009 61504 62 001 ' 25 62 500 63 001 63 504 64 009 • 64 516 65 025 65 536 66 049 66 564 ' 67 081 26 67 600 68 121 68 644 69 169 69 696 •70 225 70 756 71 289 71 824 72 361 27 72 900 73 441 73 984 74 529 75 076 75 625 76 176 76 729 77 284 77 841 28 ' 78 400 78 961 79 524 80 089 80 656 81225 81796 .82 369 82 944 83 521 29 84 100 84 681 85 264 85 849 86 436 87 025 87 616 88 209 88 804 89401 30 90 000 90 601 91 204 91 809 92 416 93 025 93 636 94 249 94 864 95 481 31 96 100 96721 97 344 - 97 969 98596 99 225 99 856 100 489 101 124 101761 32 102 400 103 041 ’ 103 684 104 329 104 976 105 625 106 276 106 929 107 584 108 241 Продолжение табл. 1 0 1 • • -у - 2 ' 3 4 5 6 7 8 9 03 ю 33 34 35 36 37 38 39 40. 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 108 900. 115 600 122 500 129 600 136 900 144 400 152 100 160 000 168 100 176 400 184 900 193 600 202 500 211600 220 900 230400 240 100 250 000 260 100 270 400 ' 280 900 291 600 302 500 313 600 324 900 336 400 > 348 ЮО 360 000 372 ЮО 384 400 396 900 409 600 422 500 435 600 109 561 116281 123201 130 321 137 641 145 161 152 881 160 801 168 921 177 241 185 761 194 481 203 401 212 521 221 841 231 361 241 081 251 001 261 121 271441 281 961 292 681 303 601 314 721 326 041 337 561 349 281 361 201 373 321 385 641 398 161 410 881 423 801 436 921 110 224 116 964 * 123 904 131 044 138 384 . 145 924 153 664 161 604 169 744 178 084 186 624 195 364 204 304 213 444 222 784 232 324 242 064. 252 004 262 144 272 484 283 024 293 764 304 704 315 844 327 184 338 724 350464 362404 374 544 386 884 399 424 412 164 425 104 438 244 110 889 117 649 124 609 131 769 139 129 146 689 154 449 162 409 170 569 178929 187 489 196 249 205 209 214 369 223 729 233 289 243 049 253 009 263 169 273529 284 089 294 849 305 809 316969 328 329 339 889 351 649 363 609 375769 388 129 400 689 413 449 426409 439 569 111556 118 336 125 316 ' 132 496 139 876 147 456 155 236 163216 171396 179 776 188 356 197 136 206 116 215296 224 676 234 256 -244 036 254 016 264 196 274 576 285 156 295 936 306 916 318 096 329 476 341056 352 836 . 364 816 376 996 389 376 401 956 414 736 / 427 716 ’ 440 896 112 225 119 025 126 025 133 225 140 625 148 225 156 025 164 025 172225 180 625 189 225 198 025 ' 207 025 216225 225 625 235 225 245 025 255.025 265 225 275 625 286225 297 025 308 025 319 225 330 625 342 225 354 025 366 025 378 225 390 625 403 225 416 025 429 025 442 225 112 896 119716 126 736 133956 141 376 148 996 156 816 164 836 173 056 181476 190 096 198 916 207 936 217 156 226 576 236 196 _ 246 016 256 036 266 256 276 676 287 296 . 298 116 309 136 320 356 331 776 343 396 355 216 367 236 379 456 391 876 404 496 417 316 430 336 443 556 113 569 120 409 127449 134 689 142 129 149 769 157 609 165 649 173 889 182 329 190 969 199 809 208 849 218 089 227 529 237 169 247 009 257 049 267 289 277 729 288 369 299 209 310 249 321 489 332 929 344 569 356409 368 449 380 689 393 129 405 769 418 609 431 649 444 889 114 244 121 104 128 164 135 424 142 884 150 544 158 404 166 464 174 724 183184 191 844 200 704 209 764 219 024 228 484 238 144 248 004 258 064 268 324 278 784 289444 300 304 311364 322 624 334 084 345 744 357 604 369 664 381 924 394 384 407 044 419 904 432 964 446 224 114 921 121 801 128 881 136 161 143 641 151 321 159 201 167 281 175 561 184 041 192 721 201 601 210 681 219 961 229 441 239 121 249 001 259 081 269 361 279 841 290 521 301 401 312 481 323 761 335 241 346 921 358 801 370 881 383 161 395 641 408 321 421201 434 281 447 561
Продолжение табл. 1 00 0 1 2 3 4 б 6 7 8 9 67 448 900 450 241 451 584 452 929 454 276 455 625 456 976 458 229 459 684 461 041 . 68 462 400 463 761 465 124 466 489 467 856 469 225 470 596 471 969- 473 344 471 721 69 476 10и 477 481 478 864 480 249 481 636 483 025 484 416 485 809 487 204 488 601 70 490 000 491 401 492 804 494 209 495 616 497 025 498 436 499 849 501 264 502 681 71 504 100 505-521 506 944 508 369 509 796 511225 512 656 514 089 515 524 516 961 72 518 4UU 519 841 521 284 522 729 524 176 525 625 527 076 528 529 529 984 531 441 73 532 900 534 361 535 824 537 289 538 756 540 225 541 696 543 169 544 644 546 121 74 547 б 00 549 081 550 564 552 049 553 536 555 025 556 516 558 009 559 504 561 001 75 562 500 564 001 565 504 567 009 568 516 570 025 • 571 536 573 049 574 564 576 081 76 577 600 579 121 580 644 582 169 583 696 585 225 586 756 588 289 589 824 591 361 77 592 900 594 441 595 984 597 529 599 076 600 625 602 176 603729 605 284 606 841 78 608 400 609 961 611 524 613 089 614 656 616 225 617 796 619 369 620 944 622 521 /9 624 100 625 681 627 264 628 849 630 436 632 025 633 616 635 209 636 804 638 401 80 640 000 641601 643 204 644 809 646 416 648 025 649 636 651 249 652 864 654 481 81 656 100 657 721 659344 660 969 662 596 664 225 665 856 667 489 669 124 . 670 761 82 672 400 674 041 675 684 677 329 678 976 680 625 682 276 683 929 685 584 687 241 83 688'900 690 5(51 692 224 693 889 695 556 697 225 698 896 700 569 702 244 703 921 84 705 600 707 281 708 964 710 649 712 336 714 025 ’ 715716 717409 719104 720 801 85 722 ооо 724 201 725 904 727 609 729 316 731 025 732 736 734 449 736 164 737 881 86 739 600 741 321 743 044 744 769 746 496 748 225 749 956 751 689 753 424 755 161 87 756 900 758 641 760 384 762 129 763 876 765’625 767 376 769 129 770 884 772 641 88 774 400 776 161 777 924 779 689 781456 783225 784 996 786 769 788 544 790 321 89 792 100 793 881 795 664 797 449 799 236 801 025 802 816 804 609 806 404 808 201 90 810 000 811 801 ' 813 604 815409 817 216 819 025 820 836 822 649 824464 826 281 91 828 100 829921 831744 833569 835 396 837 225' 839 056 840 889 842 724 844 561 92 846 400 848 241 850 084 851 929 853 776 855 625 857 476 859 329 861 184 863 041 93 864 900 866 761 868 624 870 489 872 356 874225 876 096 877 969 879 844 881 721 94 783 600 885481 887364 889 249 891 136 893 025 894 916 896 809 898 704 900 601 95 902 500 904 401 906 304 908 209 910 116 912 025 913 936 915 849 917 764 919 681 96 921 600 923 521 925 444 - 927 369 .929 296 931 225 933 156 935 089 937 024 938 961 97 • 940 900 942 841 944 784 - 946 729 948 676 950 625 952 576 954 529 956 484 958 441 98 960 400 962 361 964324 966 289 968 256 970 225 972 196 974 169 976 144 978 121 99 980 100 982 081 984 064 986 049 . 988 036 990 025 f • 992 016 994 009 996 004 998 001 Таблица II 32» Квадратные корни 0 1 2 3 4 5 6 7 8 9 0 0 1,000 1,414 1,732 2,000 2,236 2,450 2,646 2,828 з,ооо 1 3,162 .3,317 3,464 3,606 3,742 3/873 4,000 4,123 4,243 4,359 2 4,472 4,587 4,690 4,796 4,899 5,000 5,099 5,196 5,292 5,385 3 5,477 5,568 • 5,657 5,745 5,831 5,916 6,000 6,083 6,164 6,245 4 6,325 6,403 6,481 6,557 6,633 ' 6,708 6,782 6,856 6,928 7,000 . 5 7,071 7,141 7,211 7,280 7,348 7,416 7,483 7,550 7,616 7,681 6 7,746 7,810 7,874 7,937 8,000 8,062 8,124 8,185 8,246 8,307 7 8,367 8,426 8,485 8,544- 8,602 8,660 8,718 8,775 8,832 8,888 8 8,944 9,000 9,055 9,110 9,165 9,220 9,274 9,327 9,381 9,434 9 9,487 9,539 9,592 9,644 9,695 9,747 9,798 9,849 ' 9,900 9,950 10 10,000 10,050 10,100 10,140 10,199 ' 10,247 10,296 10,345 10,393 10,441 И 10,489 10,536 10,583 {0,630 10,677 10,724 10,770 10,817 10,863 10,909 12 _ 10,954 11,000 11,045 . >1,091 11,136 11,180 11,225 11,269 11,314 11,358 13 11,402 11,446 11,489 11,533 11,576 11,619 11,672 11,705 11,747 11,790 14 11,832 11,874 11,916 11,958 12, 000 12,042 12,083 12,124 12,166 12,207 15 12,247 12,288 12,329 ' 12,369 12,410 - 12,450' 12,490 12,530 12,570 12,610 16 12,649 12,689 12,728 12,767 . 12,806 12,845 12,884 12,923 12,961 ' 13,000 17 13,038 13,077 13,115 13,153 13,191 13,229 13,266 13,304 13,342 13,379 18 13,416 13,454 13,491 13,528 13,565 13,601 13,638 13,675 13,711 13,748 19 13,784 - 13, 820 13,856 13,892 13,928 13,964 14,000 14,036 14,071 14,107 20 14,143 14,177 14,212 14,248 ’ 14,283 14,318 14,353 14,388 14,422 14,457 21 14,491 14,526 14,560 ’ 14,595 14,629 14,663 14,697 14,731 14,765 ' 14,799 22 14,832 14,866 14,900 14,933 14,967 15, 000 15,033 15,067 15,100 15,133 23 15,166 15,199 15,232 15,264 15,297 15,330 15,362 15,395 15,427 15, 460 24 15,492 15,524 15,556 15,589 15,621 15,653 15,684 15,716 15,748 15,780 25 15,811 15,843 15,875 15,906 15,937- 15,969 16,000 16,031 16,062 16,094 26 16,125 16,155 16,186 16,247 16,248 16,279 16,310 16,340 16,371 16,401 27 16,432 16,462 16,492 16,523 16,553 16,583 16,613 16,643 16,673 16,703 28 16,733 „ 16,763 16,793 16,823 16, 852 16,882 16,912 16,941 16,971 17,000 29 17,030 ' 17,059 17,088 17,117 17,146 17,176 17,205 17,234 17,-263 17,292 30 17,321 17,349 17,378 17, 407 17,436 17,464 17, 493 17,521 17,550 17,578 31 17,607 17,635 17,664 17,692 17,720 17,748 17,776 17,805 17,833 17,861
Продолжение табл, it 330 . 0 ' 1 2 3 4 5 6 7 8 9 32 33 34 35 36 37 38 39 40 ' 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 17,888 18,166 18, 439 18,708 18,974 19,235 19,494 19,748 20,000 20,249 20,494 20,736 20,976 21,213 21,448 21,680 21,909 22,136 22,361 22,583 22,804 ' 23,022 23,238 . 23,452 23,664 23,875 24,083 24,290 24,495 24,698 24,900 25,100 25,298 25,495 17,917 18,193 18,466 18,735 19,000 19,261 19,519 19,774 20,025 20,273 20,518 20,761 21,000 21,237 21,471 21,703 • 21,932 22,159 22,383 22,605 22,825 23,043 23,259 23,473 23,685 23,896 24,104 24,311 24,515 24,718 24,920 25,120 25,318 25,515 17,944 18,221 18,493 18,762 19,026 19,287 19, 545 19,799 20,050 20,298 20,543 20,785 21,024 21,260 21,494 21,726 21,955 22,181 22,406 22,627 22,847 23,065 23,281 23,495 > 23,707 23,917 24,125 24,331 ч 24,536 24,739 24,940 25,140 25,338 25,534 17,972 18,248 18,520 18,788 19,053 19,313 19,570 19,824 20,075 20,322 20,567 20,809 21,048 21,284 21,517 21,749 21,977 22,204 22,428 22,650 22,869 23,087 23,302 23,516 23,728 23,937 24,145 24,352 24,556 24,759 24,960 25,160 25,357 25,554 18,000 18,276 18,547 18,815 19,079 19,339 19,596 19,849 1 20,100 20,347 20,591 20,833 21,071 21,307 21,541 21,772 22,000 22,226 22,450 22,672 22,891 /23,108 23,324 23,537 23,749 23,958 24,166 24,372 24,576 24,779 24,980 25,179 25,377 25,573 18,028 18,303 18,574 18,841 19,105 19,365 19,621 19,875 20,125 20,372 20,616 20,857 21,095 21,331 21,564 21,795 22,023 22,249 22,472 22,694 22,913 23,130 23,345 23,558 23,770 23,979 24,187 24,393 24,597 24,799 25,000 25,199 25,397 25,593 18,056 18,330 18,601 18,868 19,131 19,391 19, 647 19,900 ' 20,149 20,396 20,640 20,880 21,119 21,354 21,587 21,817 22,045 22,271 22,494 22,716 22,935 23,152 23, 367 23,580 . 23,791 24,000 24,207 24,413 24,617 24,819 25,020 25,219 25,417 25,613 18,083 18,358 18, 623 18,894 19,157 19,417 19,672 19,925 20,174 20,421 20,664 20,905 21,142 21,378 21,610 21,840 22,068 22,294 22,517 22,738 22,-957 . 23,173 23,388 23,601 23,812 24,021 24,228 24,434 24,637 24,840 25,040 25,239 25,436 25,632 18,111 18, 385 18,655 18,921 19,183 19,442 19,698 19,950 20,199 20,445 20,688 ' 20,928 21;166 21,401 21,633 21,803 22,091 22,316 22,539 22,760 22,978 23,195 23,409 23,622 23,-833 24,042 . 24,249 24,454 24,658 24,860 25,060 25,259 25,456 25,652 18,138 18,412 18,682 18,947 19,209 19,468 19,723 19,975 20,224 20, 470 20,712 20,952 21,190 21,424 21,656 21,886 22,113 . 22,338 22,561 22,782 23,000 23,216 23,431 23,643 23,854 24,062 24,269 24,475 24,678 24,880 25,080 25,278 25,476 25,671 Продолжение табл. 11 0 \ 1 2 3 4 б 6 7 8 9 66 25,691 25,710 25,729 25,749 25,768 25,788 25,807 25,826 25,846 25,865 67 25,884 25,904 25,923 25,942 25,962 25,981 26,000 26,019 26,038 26,058 68 26,077 26,096 26,115 26,134 26,153 26,173 26,192 26,211 26,230 26,249 69 26,268 26,287 26,306 26,325 26,344 26,363 26, 382 26,401 26,420 26,439 70 26,458 26,476 26,495 26,514 26,533 26,552 26,571 26,590 26, 608 26,627 71 26,646 26,665 26,683 26,702 26,721 26,740 26,758 26,777 26, 796 26,814 72 26,833 26,851 26,870 26,889 26, 907 26,926 26,944 26,963 26,982 - 27,000 73 27,019 27,037 27,056 27,074 27,092 27,111 27,129 27, 148 27,166 27,185 74 27,203 27,221 27,240 27,258 27,276 27,295 27,313 27,331 27,350 27, 368 75 27,386 27,404 27,423 27,411 27,459 27,477 27,496 27,514 27,532 27, 550 76 27,568 27,586 27,604 27,623 27,64 Г 27,659 27,677 27,695 27,713 27,731 77 27,749 27,767 27,785 27, 803 27,821 27, 839 27,857 27,875 27,893 27,911 78 27,929 27, 946 27,964 27,982 28, 000 28,018 28,036 28,056 28,071 28,089 79 28;107 28,125 28,143 28,160 28,178 28,196 28,214 28,231 28,249 28,267 80 28,284 28,302 28,320 28, 337 28,355 28, 373 28,390 28,408 28,425 28,443 81 28,461 28,478 28,496 28,513 28,531 28,548 28,566 28,583 28,601 28,618 82 28,636 28,653 - 28,671 . 28,688 28,705 28,723 - 28,740 28,758 28,775 28,792 83 28,810 28,827 " 28,844 28,862 28,879 28,896 28,914 28,931 28,948 28, 966 84 28,983 29,000 29,017 29,035 29,052 29,069 29,086 29, ЮЗ 29,120 29,138 85 29,155 29,172 29,189 29,206 29,223 29,240 29,258 29,275 29,292 29,309 86 29,326 29,343 29,360 29,377 29, 394 29,411 29,428 29,445 29,462 29,479 87 29,496 29,513 29,530 29,547 29,564 29,580 29, 597 29,614 29,631 29,648 88 29,665 29,682 29,699 29,715 29,732 29,749 29,766 29,783 29,799 29,816 89 29,833 . 29,850 29,866 29,883 29,900 29,917 29,933 29,950 .29,967 29,983 90 30,000 30,017 30,033 • 30,050 30,067 30,083 30,100- 30,116 30,133 30,150 91 30,166 30,181 30,199 30,216 30,232 30,249 30,266 30,282 30,299 30,315 92 30,332 30,348 30,365 30, 381 30,397 30,414 30,430 30,447 30,463 30,480 93 30,496 30,512 30,529 30,545 30,561 30,579 30,594 30,611 30,627 30,643 94 30,659 30,676 30,692 30,708 -30,725 30,741 30,757 30,773 30,790 30,806 95 30,822 30,838 30,855 30,871 30,887 30,903 30,919 30,935 30,952 30,968 96 30,984 31,000 31,016 31,032 31,048 31,064 31,081 31,097 31,113 31,129 97 31,145 31,161 31,177 31,193 31,209 31,225 31,241 31,257 31,273 31,289 98 31,305 31,321 31,337 31,353 31,369 31,385 31,401 31,417 31,433 31,448 99 31,464 31,480 31,496 31,512 31,528 31,544 31,560 31,575 31,591 31,607
Таблица III Логарифмы чисел (мантиссы) 4 п о' 1 . . 1 2 з- 4 5 6 7 8 9 10 0000 .0043 0086 0128 0170 0212 0253 0294 0334 0374 11 0414 0453 0492 0531 0569 0607’ 0645 0682 0719 0755 12 0792 0828 0864 0899 0934 0969 1004 1038 1072 1 1106 13 ' 1139 1173 1206 1239 1271 ’ 1303 1335 1367 1399 1430 14 1461 1492 1Е>23 ' 1553 1584 1614 1644 1673 1703 1732 15, 1761 1790 1818 1847 1875 1903 1931 1959 1987 2014 16 .2041 2068 2095 2122 2148 z 2175 2201 2227 2253 2279 17 2304 2330 2355 2380 2405 2430 2455 2480 2504 2529 18 2553 2577 2601 2625 2648 - 2672 2695 2718 2742 2765 19 2788 2810 2833 2856 2878 2900 2923 2945 2967 2989 20 ЗОЮ §032 3054 3075 3096 . 3118 3139 3160 3181 3201 21 3222 3243 3263 3284 3304 .3324' 3345 3365 3385 4304 22 3424 3444 3464 . 3483 3502 3522 3541 3560 3579 3598 23 • 3617 3636 3655 3674 3692. 3711 3729 3747 3766 3784 24 3802 3820 3838 3856 3874 3892 3909 3927 3945 3962 25 3979 3997 4014 4031 4048 4065 4082 4099 4116 4133 26 4150 4166 4183 4200 4216 4232' 4249 - 4265 4281 4298 27 4314 4330 4346 4362 4378 4393 4409 4425 . 4440 4456 28 4472 . 4487 4502 .4518 4533 4548 4564 4579 4594 4609 29 4624 4639 4654 4669 4683 4698 4713 4728 4742 4757 30 4771 4786 4800 4814 4829 4843 4857 4871 4886 4900 31 4914 4928 4942 • 4955 4969 , 4983 4997 5011 '5024 5038 32 5051 5065 5079 5092 5105 5119 5132 5145 5159 5172 1 . • 9 1 1 1 2 1 3 1 4 1 ' 6 . 6 7 8 \ 9 Продолжение табл. Ill п 1 ° 1; . 4 1 2 1 3 4 5 6 / ' 7 8 9 33 5185. 5198: 5211; 5224 5237 5250 5263- 5276 5289 5302 34 5315 5328 .5340 5353 5366. 5378 5391 5403 5416 5428 35 5441' 5453 - - 5465 5478 -5490 5502 5514 5527 5539 5551 36 5563 5575 ' 5587 5599 5611 5623 5635 5647 5658 5670 37 '5682 . 5694 5705 5717 5729 5740 5752 5763 5775 ‘ 5786 38 5798 5809 5821; 5832: 5843- 5855 5866 5877 5888 5899 39 5911 ' 5922 5933 5944 5955 5966 5977 5988 5999 6010 - 40 - 6021 6031 6042 6053 6064 6075 6085 6096 6107 6117 41 ’ 6128 6138 6149 6160 6170 6180 6191 6201 6212 6222 . 42 6232 6243 6253 6263 ’ 6274 6284 6294 6304 6314 6325 43 6335 6345 6355 6365 6375 6385 6395 6405 6415 6425 44 6435 6444 6454 6464 6474 6484; 6493 6503 6513 6522 45 6532 6542 655 Г 6561 6571 6580 6590 6599 6609 6618 46 6628- 6637 6646 6656 6665 6675 6684 6693 6702 6712 47 6721 6730- 6739 6749 6758 6767 6776 6785 6794 6803 48 6812 6821 6830 6839 6848 6857 6866 6875 6884 6893 49 6902 . 6911 . 6920 6928 6937 6946 6955 6964 6972 6981 50 6990 6998 7007 7.01& 7024 7033 7042 7050 7059 7067 51 7076 7084 7093 7101 7110 7118 7126 7135 7143 7152 52 7160 7168 - 7177 7185 7193 7202 7210 7218 7226 7235 53 7243; 7251 7259 , 7267 7275' 7284 7292 - 7300 7308 7316 54 7324- 7332 7340 7348 7356 . 7364 7372 7380 7388 7396 55 7404 7412 7419 7427 7435 7443 7451 7459 7466 7474 333 ° 1 2 3 1 4 1 5 1 6 1 7 1 8 1 9
Продолжение табл. Ill оз co n 0 1 2 1 3 1 . 4 1 6' I 6 7 I 8 1 9 56 7482 7490 7497 7505 . 7513 7520 • 7528 7536 7543 7551 57 7559 7566 7574 7582 7589 7597 7604 7612 7619 7627 58 7634 7642 7649 7657 7664 7672 7679 7686 7694 7701 59 7709 7716 7723 7731 7738 7745 7752 7760 7767 7774 60 7782 7789 7796 7803 7810 7818 7825 7832 7839 7846 61 7853 7860 7868 7875 7882 7889 7896 7903 7910 7917 62 7924 7931 7938 . 7945 7952 7959 7966 7973 ’ 7980 7987 63 7993 8000 8007 8014 8021 8028 8035 8041 8048 8055 64 8062 8069 8075 8082 8089 8096 8102 8109 8116 8122 65 8129 8136 8142 8149 8156 8162 8169 8176 8182 8189 66 8195 8202 8209 8215 8222 8228 8235 8241 8248 8254 67 8261. 8267 8274 8280 8287 8293 8299 8306 8312 8319 68 8325 . 8331 8338 8344 8351 8357 8363 8370 8376 8382 69 8388 . . 8395 8401 8407 8414 - 8420 8426 8432 8439 8445 70 8451 8457 8463 8470 8476 8482 8488 8494 8500 8506 71 8513 8519 8525 8531 8537 8543 8549 8555 8561 8567 72 8573 8579 8585 8591 8597 8603 8609 8615 '8621 8627 73 8633 8639 8645 8651 8657 8663 8669 8675 8681 8686 74 .8692 8698 8704 .8710 8716 8722 8727 8733 8739 8745 . 75 8751 8756 8762 8768 8774 8779 8785 8791 8797 8802 76 8808 8814 . 8820 8825 8831 8837 8842 8848 8854 8859 77 8865 8871 8876 8882 8887 8893 . 8899 8904 8910 8915 78 8921 8927 8932 8938 8943, 8949 8954 8960 8965 8971 1 0 1 1 1 2 1 3 1 4 6 6 7 8 9 Продолжение табл. Ill -see ’ n 1 ° 1 * 1 2 1 3 1 4 1 5 1 6 1 7 8 9 79 8976 8982 8987 8993 8998 9004 9009 9015 9020 9025 80 • 9031 9036 9042 9047 9053 9058 9063 9069 ' 9074 9079 81 9085 9090 9096 9101 9106 9112 9117 9122 9128 9133 82 9138 9143 9149 9154 9159 ’ 9165 9170 9175 9180 9186 83 9191 9196 9201 9206 9212 9217 9222 9227 9232 9238 84 9243 9248 9253 9258 9263 9269 9274 9279 9284 9289 85 9294 9299 9304 9309 9315 9320 9325 9330 9335 9340 86 9345 9350 9355 9360 9365 9370 9375 9380 9385 9390 87 9395 9400 9405 9410 9415 9420 9425 9430 9435 9440 88 9445 9450 9455 9460 9465 9469 9474 9479 9484 9489 89 9494 9499 9504 9509 9513 i 9518 9523 9528 9533 9538 90 9542 9547 9552 9557 9562 . 9566 9571 9576 9581 9586 91 9590 9595 9600 9605 9609 9614 9619 9624 9628 9633 92 9638 . 9643 9647 9652 9657 9661 9666 9671 9675 9680 . 93 9685 9689 9694 9699 9703 9708 < 9713 9717 9722 9727 94 9731 9736 9741 9745 9750 9754 - 9759 9763 9768 9773 : 95 9777 9782 9786 9791 9795 9800 9805 9809 9814 9818 96 9823 9827 9832 9836 9841 9845 9850 9854 9859 9863 97 9868 9872 9877 9881 9886 9890 9894 9899 . 9903 9908 98 .. 9912 9917 9921 9926 9930 9934 9939 9943 9948 9952 99 9956 9961 9965 9969 9974 9978 > 9983 9987 9991 9996 1 ° * 2 3 4 5 , 6 7 1 8 1 9
Таблица VI w Т) Антилогарифмы 0 1 2 | 3 I * 1 I “ ! ! 1- 00 01 ' 02 03 04 05 06 07 . 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 1000 „ v 1023 1047 , 1072 1096 1122 1148 1175 1202 1230 1259 1288 1318 1349 1380 1413 1445 1479 1514 1549 1585 1622 1660 1698 1738 1778 1820 1862 1905 1950 1995 2042 - 2089 2138 1002 1026 1050 1074 - 1099 1125 1151 1178 1205 1233 1262 1291 1321 1352 1384 1416 1449 1483 1517 1552 1589 1626 1663 1702 1742 1782 1824 1866 1910 ’ 1954 2000 2046 2094 2143 1005 1028 1052 . 1076 1102 1127 1153 1180 1208 1236 1265 1294 1324 1355 1387 1419 1452 1486 1521 1556 1592 1629 1667 1'706 1746 1786 1828 1871 1914 1959 2004 2051- 2099 2148 1007 1030 1054 ' 1079 1104 ИЗО 1156 -1183 1211 1239 1269 1297 1327 1358 1390 1422 1455 1489 1524 1560 1596 1633 1671 • 1710 1750 1791 1832 1875 1919 1963 2009 2056 ' 2104 2153 1009 1033 1057 1081 1107 1132 1159 1186 1213 1242 1271 1300 1330 1361 : 1393 1426 1459 1493 1528 1563 1600 1637 1675 1714 1754 1795 1837 1879 1923 1968 2014 2061 2109 2158 1012 1035 1059 1084 1109 1135 1161 1189 1216 1245 1274 1303 1334 1365 1396 1429 1462 1496 1531 1567 1603 1641 1679 1718 • 1758 1799- 1841 1884 1928 1972 2018 2065 2113 . 2163 1014 1038 1062 1086 1112 1138 1164 1-191 1219 1247 1276 1306 1337 1368 1400 1432 1466 1500 1535 1570 1607 1644 1683 1722 1762 1803 1843 1888 1932 1977 2023 2070 2118. 2168 1016 1040 1064 1089 1114 1140 1,167 1194 1222 1250 1279 1309 1340 1371 1403 1435 1469 1503 1538 ' 1574 1611 1648 1687 1726 1766 1807 1849 1892 1936 1982 2028 2075 2123 - 2173 1019 1042 1067 1091 1117 1143 1169 1197 1225 1253 1282 1312 1343 1374 1406 1439 1472 ' 1507 1542 1578 1614 1652 1690 1730 1770 18П 1854 1897 1941 1986 2032 2080 2128 2178 1021 1045 1069 1094 1119 1146 1172 ' 1199 1227 1256 ' 1285 1315 1346 1377 1409 1442 1476 - 1510 1545 1581 1618 1656 1694 1734 1774 1816 1858 1901 1945 1991 2037 2084 2133 2183 log 1 0 1 2 1 3 1 4 1 . 6 1 6 1 7 1 8 1 9 ю to Продолжение табл. IV log I 0 | 1 1 2 1- . 3 i 4 1 5 1 6 1 7 I 3 9 34 2188 2193 2198 J 2203 2208 2213 2218 2223 1 2228 2234 35 2239 2244 2249 . 2254 2259 2265 2270 2275 2280 2286 □O 2291 2296 . 2301 2307 2312 2317 2323 2328 2333 2339 37 38 39 2344 2399 2455 2350 2404 2460 2355 2410 2466 2360 2415 2472 2366 2421 2477 ' 2371 2427 2483 2377 2432 2489 2382 2438 2495 2388 2443 ' 2500 2393 2449 - 2506 40 41 42 2512 2570 . 2518 2576 2523 2582 2529 2588 2535 2594 2541 2600 2547 2606 2553 ' 2612 2559 2618 2564 2624 2630 2636 2642 2649 ' 2655 " 2661 2667 2673 2679 2685 43 2692 2698 2704 2710 2716 2723 2729 2735 2742 2748 44 45 46 27,54 2761 2767 ' 2773 2780 2786 2793 2799 2805 2812 2818 2884 2825 2891 2831 2897 2838 2904 2844 2911 2851 2917 2858 2924 2864 2931 2871 2938 2877 2944 47 2951 2958 2965 2972 2979 2985 2992 2999 3006 ’ 3013 48 49 50 . 3020 3090 3162 3027 3097 3170 . 3034 3105 3177 3041 3112 3184 3048 3119 3192 3055 3126 3199 3062 3133 3206 3069 3141 3214 3076 3148 3221 3083 3155 3228 O1 52 53 54 55 56 57 . 58 59 .60 61 62 63 64 65 66 .67 3236 3311 3388 3467 3548 3631 3715 3802 3890 . 3981 4074 4169 4266 4365 4467 4571 4677 3243 3319 3396 3475 3556 3639 • 3724 38И 3899 3990 4083 4178 4276 4375 4477 4581 4688 3251 3327 34.04 3483 3565 3648 3733 3919 3908 3999 4093 . 4188 4285 4385 4487 4592 . 4699 3258 3334 3412 3491 3573 3655 3741 3828 3917 4009 4102 4198 4295 4395 4498 4603 4710 3266 3342 3420 ' 3499 3581 3664 3750 3837 3926 4018 4111 4207 4305 4406 4508 4613 4721 3273 3350 3428 3508 35891 3673 ' 3758 3846 3936 4027 4121 4217 4315 4416 4519 4624 4732 3281 3357 3436 3516 3597 3681 3767 3855 3945 4036 - 4130 4227 4325 4426 4529 4634 4742 ' 3289 3365. 3443 3524 3606 3690 3776 3864 3954 4046 4140 4236 4335 4436 4539 4645 4753 3296 3373 3451 3532 3614 3698 3784 3873 3963’ 4055 4150 4246 4345 4446 4550 4656 4764 3304 3381 3459 3540 3622 3707 • 3793 3882 3972 4064 4159 - 4256 4355 4457 4560 4667 4775 log 1 0 1 2 3 | 4 5 6 1 8 1 9
Продолжение табл. IV Ю ФЮCD О СОСО ^со СО-^ t4* N О S S S’-* Ф О СО О СО S T^T^inintntOintntOtOOcDcDCOCDCDb-b». b«-t?-b-b*COCOCOCOCOa50>0 cd о> ’-HCOCOcDb'.OcDlOCOCO^COCOtOCOcOCMlO’^OlCO^^.TftO'OOtQTfOCO'CO CO-4j*tOr--0)C4'4rb«.C5’4bCOC4CO’-^CDOICO,4j*’-<COlOcC^OC>ajC^.OO—‘ СО СО со ф о»-* о со со о<м со ю ф сюо)со со со о nco ю s о oq’Ф со со ^^ЮЮЮЮЮ1ЛЮЮСОСОСОСОСОсОф(ч Г-Ь-Ь-Г-СОСОСОСО coco 'ф 10 Ю Ю Ю Ю Ю 1СЮ CD CD CD СО CD CD Ф N S S N Н l> СО CQCO COCO CD-CD Cty CD
Таблица V Синусы (верхние числа) и косинусы (нижние числа) (без нуля целых) 0 1 2 3 4 5 6 7 8 9 0 0,0000 +1,0000 + ,0175 + ,9998 +, 0349 + ,9994 + .0523 +,9986 +, 0698 + ,9976 + ,0872 +,9962 +, 1045 + ,9945 + , 1219 +, 9925 +,1392 + ,9903 + ,1564 +, 9877 1 + ,1736 + ,9848 + ,1908 + ,9816 + ,2079 + ,9781 + ,2250 + ,9744 + ,2419 +,9703 + ,2588 +, 9659 +,2756 + ,9613 +,2924 +,9563 + ,3090 + ,9511 +, 3256 + ,9455 2 + ,3420 -j-,9397 + ,3584 + ,9336 + ,3746 + ,9272 + ,3907 + ,9205 +, 4067 +,9135 + ,4226 + ,9063 + ,4384 + ,8988 + ,4540 + ,8910 +,4695 + ,8829 +,4848 + ,8746 3 + ,5000 + ,8660 + ,5150 +,8572 + ,5299 +,8480 + ,5446 + .8387 + ,5592 +, 8290 +,5736 + ,8192 +,5878 +, 8090 +,6018 + ,7986 +,6157 +,7880 + ,6293 +, 7771 4 + ,6428 + ,7660 +,6561 + ,7547 + ,6691 + ,7431 + ,6820 + ,7314 + ,6947 + ,7193 + ,7071 + ,7071 +,7193 +, 6947 +,7314 +,6820 + ,7431 + ,6691 + ,7547 +, 6561 5 + ,7660 + ,6428 +,7771 +,6293 + ,7880 + ,6157 + .7986 + ,6018 +,8090 + ,5878 + ,8192 + ,5736 + ,8290 + ,5592 + ,8387 + ,5446 +,8480. + ,5299 +,8572 +,5150 6 + ,8669 + ,5000 +,8746 + ,4848 + ,8829 + ,4695. + ,8910 + ,4540 + ,8988 +''4384 + ,9063 + ,.4226 + ,9135 +, 4067 + ,9205 + ,3907 +,9272 + ,3746 + .9336 +, 3584 7 + ,9397 +,3420 +,9455 + ,3256 + ,9511 + ,3090 + ,9563 + ,2924 +,9613 + ,2756 + ,9659 + ,2588 + ,9703 +,2419 + ,9744 +,2250 +,9781 + ,2079 +,9816 +,1908 8 +,9848 + .1736 +, 9877 + ,-1564 +,9903 + ,1392 +,9925 + ,1215 +, 9945 +, 1045 + ,9962 + ,0872 +, 9976 + ,0698 + ,9986 + ,0523 +,9994 + ,0349 +, 9998 + ,0175 9 + 1,0000 0,0000 +,'9998 —,0175 + ,9994 —,0349 + ,9986 — .0523 +,9976 —,0698 + ,9962 — ,0872 + ,9945 — ,1045 + ,9925 — ,1219 + ,9903 — ,1392 +,9877 — ,1564 10 + ,9848 —,1736 + ,9816 —,1908 + ,9781 —,2079 + ,9744 — ,2250 + ,9703- —,2419 + ,9659 — ,2588 + ,9613 —,2756 + ,9563 — ,2924 +,9511 — ,3090 + ,.9455 —, 3256 И +,9397 — ,3420 + ,9336 — ,3584 + ,9272 — ,3746 + ,9205 — ,3907 +,9135 — ,4067 +,9063 — ,4226 — ,8988 + ,4384 + ,8910 — ,4540 +, 8829 4695 + ,8746 —,4848 » + ,8660 +,8572 — ,8480 +,8387 + ,8290 +,8192 +,8090 + ,7986 + ,7880 +.7771 12 —,5000 — ,5150 — ,5299 —,5446 — .5592 — ,5736 — ,5878 + ,6018 — ,6157 — ,6293 13 + ,7660 — ,6428 +,7547 —,6541 +,7431 —,6691 + ,7314 — ,6820 + ,7193 — ,6947 + ,7071 —,7071 + ,6947 — ,7193 +,6820 — ,7314 +,6691 — ,7431 + ,6561 — ,7547 14 + ,6428 —,7660 +,.6293 —,7771 +,6157 —,7880 +,6018 —,7986 +,5878 — ,8090 + ,5736 — ,8192 + ,5592 —,8290 + ,5446 — ,8387 + ,5299 —,8480 +,5150 —, 8572 15 + ,5000 — ,8660 + ,4848 —, 8746 +, 4695 — ,8829 —,4540 —,8910 + ,4384 — ,8988 + ,4226 —,9063 +,4067 —,9135 +, 3907 —,9205 +,3746 — ,9272 + ,3584 —,9336. 16 + ,.3420 —,9397 + ,3256 —,9455' + ,3090 — ,9511 +,2924 — ,9563 + ,2756 —,9613 +,2588 —,9659 + ,2419 —,9703 +,2250 — ,9744 +, 2079 —,9781 + ,1.9.08 — ,9816 17 +, 1736 —,9848 +, 1564 —,9877 +, 1392 —,9903 + ,1219 —,9925 + ,1045 —,9945 + ,0872 — ,9962 +,0698 —,9976 +,0523 — ,9986 + ,0349 —,9994 + ,.0175, ' —,9998, 22* 339г
Окончание табл. V 0 1 2 3 4 5 6 7 8 9 18 0,0000 — 1,0000 —,0175 — ,9998 — ,0349 —, 9994 — ,’0523 — ,9986 —,0698 — ,9976 —,0872 —, 9962 — ,1045 — ,9945 —, 1219 —,9925 —, 1392 — ,9903 —,1564 — ,9877 19 — .1736 — ,9848 — ,1908 — ,9816 — ,2079 — ,9781 — ,2250 —,9744 — ,2419 —,9703 — ,2588 —, 9659 —, 2756 — ,9613 —,2924 —,9563 —,3090. — ,9511, —, 3256 —,9455 20 —,3420 —,9397 — ,3584 —,9336 —,3746 —,9272 —,3907 —,9205 —,4067 —,9135 — ,4226 —,9063 —, 4384 —,8988 —,4540 —,8910 —, 4695 — ,8829 —.4848 —, 8746 21 — ,5000 — ,8660 — ,5150 — ,8572 — ,5299 —,8480 —,5446 —,8387 —,5592 — ,8290 —,5736 —,8192 — ,5878 —.8090 —,6018 — ,7986 — ,6157 — ,7880 —,6293 —,7771 22 —,6428 — ,7660 —,6561 —,7547 —,6691 —,7431 —,6820 —,7314 —,6947 — ,7193 —, 7071 —,7071 —,7193 —,6947 —,7314 —,6820 —,7431 —,6691 — ,7547 — ,6561 23 — ,7660 —,6428 —, 7771 — ,6293 — ,7880 —,6157 —,7986 —,6018 —,8090 — ,5878 — ,8192 —,5736 — ,8290 —,5592 —, 8387 —,5446 —,8480 —,5299 —,8572 — ,5150 24 —,8660 —,5000 —,8746 — ,4848 —, 8829 —,4695 —,8910 —,4540 — ,8988 —,4384 — ,9063 —.4226 —,9135 —,4067 — ,9205 —,3907 —,9272 —,3746 —,9336 —,3584 25 —, 9397 —, 3420 —,9455 — ,3256 —,9511 —,3090 —,9563 —,2924 — ,9613 —, 2756 —, 9659 —,2588 —,9703 —,2419 —,9744 —, 2250 -,9781 —,2079 —,9816 —,1908 26 — ,9848 — ,1736 —,9877 —,1564 — ,9903 —,1392 —,9925 — ,1219 — ,9945 —,1045 — ,9962 —,0872 — ,9976 —,0698 —,9986 — ,0523 —,9994 —, 0349 —,9998 —,0175 27 —1,0000 0,0000 —,9998 +,0175 —,9994 + ,0349 — ,9986 +,0523 —, 9976 + ,0698 —,9962 +, 0872 — ,9945 +, 1045 — ,9925 +,1219 — ,9903 +, 1392 —,9877 + ,1564 28 —?, 9848 +, 1736 —,9816 + ,1908 —,9781 + ,2079 —,9744 +, 2250 — ,9703 + ,2419 —,9659 +, 2588 —,9613 +,2756 — ,9563 + ,2924 —.9511 + ,3090 —, 9455 +, 3256 29 —, 9397 + ,3420 — ,9336 + ,3584 —, 9272 + ,3746 — ,9205 + ,3907 —,9135 + ,4067 —,9063 + ,4226 —,8988 + ,4384 —,8910 + ,4540 —, 8829 + ,4695 —, 8746 +, 4848 30 — ,8660 +,5000 —, 8572 +,5150 —,8480 +,5299 — ,8387 +,5446 —,8290 + ,5592 — ,8192 + ,5736 — ,8090 + ,5878 — ,7986 + ,6018 — ,7880 + ,6157 — ,7771 + ,6293 31 — ,7660 + ,6428 — ,7547 + ,6561 —,7431 + ,6691 — ,7314 +, 6820 —,7193 + ,6947 — ,7071 +,7071 —,6947 +, 7193 — ,6820 +,7314 —,6691 +.7431 — ,6561 + ,7547 32 —,6428 + .7660 — ,6293 + ,7771 —.6157 +,7880 —,6018 +, 7986 —,5878 +, 8090 —,5736 +,8192 —,5592 +, 8290 —,5446 + ,8387 — ,5299 + ,8480 —,5150 + ,8572 33 — ,5000 +,8660 —,4848 + ,8746 — ,4695 +?8829 —,4540 + ,8910 —,4384 + ,8988 — ,4226 +,9063 —,4067 + ,9135 —, 3907 + ,9205 —,3746 + ,9272. — ,3584 + .9336 34 —, 3420 + ,9397 —,325.6 + ,9455 —,3090 + ,9511 —, 2924 + ,9563 —,2756 +,9613 — ,2588 + ,9659 — ,2419 +, 9703 — ,2250 +, 9740 — ,2079 + ,9781 — ,1908 +,9816 35 ' —, 1736 + ,9848 —, 1564 +,9877 — ,1392 + ,9903 — ,1219 +,9925 —,1045 + ,9945 — ,0872 +, 9962 —,0698 + ,9976 —,0523 +,9986 — ,0349 + ,9994 —,0175 +,9998 340
Т аблица VI Первая функция нормированного отклонения 1 х2 • I —— ' /(%)= —-е 2 (ординаты нормальной кривой) X 0 1 2 3 4 5 6 7 8 9 0,0 39 894 39 892 39 886 39 876 39 862 39 844 39 822 39 797 39 767 39 733 о,1 39 695 39 654 39 608 39 559 39 505 39448 39 387 39 322 39 253 39 181 0,2 39 104 39 024 38 940 38 853 38 762 38 667 38 568 38 466 38 361 38 251 0,3 38 139 38 023 37 903 37 780 37 654 37 524 37 391 37 255 37 115 36 973 0,4 36 827 36 678 36 526 36 371 36 213 36 053 35 889 35 723 35 553 35 381 0,5 35 207 35 029 34 849 34 667 34 482 34 294 34 105 33 912 33'718 33 521 0,6 33 322 33 121 32 918 '32713 32 506 32 297 32 086 31 874 31 659 31 443 0,7 31 225 31 006 30 785 30 563 30 339 30 114 29 887 29 659 29 430 29 200 0,8 28 969 28 737. 28 504 28 269 28 034 27 798 27 562 27 324 27 086 26 848 0,9 26 609 26 369 26 129 25 888 25 647 25 406 25 164 ’ 24 923 24 681 24 439 1,0 24 197 23 955 23713 23 471 23 230 22 983 22 747 22 506 22 265 22 025 1,1 21 785 21 546 21 307 21 069 20 831 20 594 20 357 20 121 19 886 19 652 1,2 19 419 19 186 18 954 18 724 18494 18 265 18 037 17 810 17 585 17 360 1,3 17 137 16 915. 16 694 16 474 16 256 16 038 15 822 15 608 15 395 15 183 1,4 14 973 14 764 14 556 14 350 14 146 13 943 13 742 13 542 ' 13 344 13 147 1,5 12 952 12 758 12 566 12 376 12 188 12 001 И 816 И 632 11 450 11270 1,6 11 092 10 915 10 741 10 567 10 396 10 226 10 059 09 893 09 728 09 566 1,7 09 405 09 246 09 089 08 933 08 780 08 628 08 478 08 329 08 183 08 038 1,8 07 895 07 754 07 614 07 477 07 341 07 206 07 074 06943 06 814 06 687 1,9 06 562 06 438 06 316 06 195 06 077 05 959 05 844 05730 05 618 05 508 2,0 05 399 05 292 05 186 05 082 04 980 04 879 04 780 '04 682 04 586 04 491 ' 2,1 04 398 04 307 04 217 04 128 04 041 03 955 03 871 03 788 03 706 03 626 2,2 03 547 03 470 03 394 03 319 03 246 03 174 03 103 03 034 02 965 02 898 2,3. 02 833 02 768 02 705 02 643 02 582 02 522 02 463 02 406 02 349 02 294 2,4 02 239 , 0,2 186 02134 02 083 02 033 01 984 01936 01 888 01 824 01 797 2,5 01 753 01 709- 01667 01 625 01 585 .01 545 01 506 ' 01 468 01 431 01 394 2,6 01 358 01 323 01 289 01256 01 223 01 191 01 160 01 130 01 100 01 071 2,7 01 042 01 014, 00 987 00 961 00 935 00 909 00 885 00 861 00 837 00 814 2,8 00 792 00 770 00 748 00 727 00 707 00 687 00 668 00 649 00 631 00 613 2,9 00 595 00 578 00 562 00 545 00 530 00 514 00 499 00 485 00 470 00 457 3,0 00 443 00 430 00 417 00 405 00 393 00 381 00.370 00 358 00 348 00 337 3,1 00 327 00 317 00 307 00 298 00 288 00 279 00 271 00 262 00 254 00 246 3,2 00 238 00 231 00 224 00 216 00 210 00 203 00 196 •00 190 00 184 00 178 3,3 00 172 00 167 00 161 00 156 00 151 00 146 00 141 00 136 00 132 00 127 / 3,4 00 123 00 119 00 115 00 111 00-107 00 104 00 100 00 097 00 094 00 090 . 3,5 . 00 087 00 084 00 081 00 079 00 076 00 073 00 071 00 068 00 066 '00 063 3,6 00 061 00 059 00 057 00 055 00 053 00 051 00 049 00 047 00 046 00 044 3,7 00 042 00 041 00 039 00 038 00 037 00 035 00 034 00 033 00 031 00 030 3,8 00 029 00 028 00 027 00 026 00 025 00 024 00 023 00 022 00 021 00 021 3,9 00 020 00 019 00018 00 018 00017 00 016 00 016 00 015 00 014 00 014 4,0 00 013 00 009 00 006 00 004 ' 00.002 00 002 00 001 00 001 00 000 00 000 341
Таблица VII Вторая функция нормированного отклонения X хг ф(х)=йгК 2-dx (интегралы вероятностей) X 0 1 2 3 4 5 6 7 8 9 0,0 00 000 00 399 00 798 01 197 01 595 01 994 02 392 02 790 03 188 03 586 0,1 03 983 04 380 04 776 05 172 05 567 05 962 06 356 06 749 07 142 07 535 0,2 07 926 08 317 08 706 09 095 09 483 09 871 10 257 10 642 И 026 11409 0,3 11 791 12 172 12 552 12 930 13 307 13 683 14 058 14 431 14 803 15 173 0,4 15 542 15 910 16 276 16 640 17 003 17 364 17 724 18 082 18 439 18 793 0,5 19 146 19 497 19 847 20 194 20 540 20 884 21226 21566 21 904 22 240 0,6 22 575 22 907 23 237 23 565 23 891 24 215 24 537 24 857 23 175 25 490 0,7 25 804 26 115 26 424 26 730 27 035 27 337 27 637 27 935 28 230 28 524 0,8 28 814 29 ЮЗ 29 389 29 673 29 955 30 234 30511 30 785 31 057 31 327 0,9 31 594 31 859 32 121 32 381 32 639 32 894 33 147 33 398 33 646 33 891 1,0 34 134 34 375 34 614 34 850 35 083 . 35 314 35 543 35 769 35 993 36 214 1,1 36 433 36 650 36 864 37 076 37286 37493] 37 698 37 900 38 100 38 298 1,2 38 493 38 686 38 877 39 065 39 251 39 435 39 617 39 796 39 973 41 047 1,3 40 320 40 490 40 658 40 824 40 988 41 149 41 308 41 466 41 621 41774 1,4 41 924 42 073 42 220 42 364 42 507 42 647 42 786 42 922 43 056 43 189 1,5 43 319 43 448 43 574 43 699 43 822 43 943 44 062 44 179 44-295 44 408 1,6 44 520 44 630 44 738 44 845 44 950 45053 45 154 45 254 45 352 45 449 1,7 45 543 45 637 45728 45 818 45 907 45994 46 080 46 164 46 246 46 327 1,8 46 407 46 485 46 562 46 638 46 712 . 46784 46 856 46 926 46 995 47 062 1,9 47 128 47 193 47 257 47 320 47 381 47 441 47 500 55 478 47 615 47 670 2,0 47 725 47 778 47 831 47 882 47 932 . 47 982 48 030 48 077 48 124 48 169 2,1 48 214 48 257 48 300 48 341 48 382 48 422 48 461 48 500 48 537 48 574 2,2 48 610 48 645 48 679 48 713 48 745 48 778 48 809 48 840 48 870 48 899 2,3 48 928 48 956 48 983 49 010 49 036 49 061 49 086 49 111 49 134 49158 2,4 49 801 49 202 49 224 49 245 49266 49 286 49 305 49 324 49 343. 49 361 2,5 49 379 ~ 49 396 49 413 49 430 49 446 49 461 49 477 49 492 ' 49 506 49 520 2,6 49 534 49 547 49 560 49 573 49 585 49 598 49 609 49 621 49 632 49 643 ,2,7 49 653 49 664 49 674 49 683 49 693 49 702 49 711 49 720 49 728 49 736 2,8 49 744 49 752 49 760 49 767 49 774 49 781 49 788 .49,795 49 801 49 807 2,9 49 813 49 819 49 825 49 831 49 836 49 841 49 846 49 851 49 856 49 861 3,0 49 865 49 869 49 874 49 878 49 882 49 886 49 889 49 893 49 896 49 900 3,1 49 903 49 906 49 910 49 913 49 916 49 918 49 921 49 924 49 926 49 929 3,2 49 931 49 934 49 936 49 938 49 940 49 942 49 944 49 946 49 948 49 950 3,3 49 952 49 953 49 955 49 957 49 958 49 960 49 961 49 962 49 964 49 965 3,4 49 966 49 968 49 969 49 970 49 971 49 972 49 973 49 974 49 975 49 976 3,5 49 977 49 978 49 978 49 979 49 980 49 981 49 981 49 982 49 983 49 983 3,6 49 984 49 985 49 985 49 986 49 986 49 987 49 987 49 988 49 988 49 989 3,7 49 989 49 990 49 990 49 990 49 991 49 991 49 992 49 992 49992 49 992 3,8 49 993 49 993 49 993 49 994 49 994 49 994 49 994 49 995 49 995 49 995 3,9 49 995 49 995 49 996 49 996 49 996 49 996 49 996 49 996 49' 997 40 997 4,0 49 998 49 998 49 999 49 999 49 999 * — — — — —• 342
Таблица VIII Относительные частоты распределения редких событий (Пуассона) гх________________________е~а • ах г х! \ а X \ 0,1 0,2 0,3 ,0Л' 0,5 0,6 0,7 0,8 0,9 1,0 а / / х 0 90 484 81 873 74 082 67 032 60 653 54 881 49 658 44 933 40657 36 788 0 I 09 048 16 375 22 224 26 813 30 327 32 929 34 761 35 946 36 591 36 788 1 2 00 452 01 637 03 334 05 363 07 582 09 879 12 166 14 378 16 466 18 394 2 3 00 015 00 109 00 333 00 715 01 264 01 976 02 839 03 834 04 940 06 131 3 4 — 00 006 00 025 00 072 00 158 00 296 00497 00 767 01 112 01533 4 5 — — 00 002 00 006 00 016 00 036 00 070 00 123 00 200 00 307 5 6 — —- — — 00 001 00 004 00 008 00 016 00 030 00 051 6 7 — — — — — — 00 001 00 002 00 004 00 007 7 8 — — —• — — — —‘ —— — — 8 \ а 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 . 1,9 . 2,0 а / X \ / х 0 33 287 30 119 27 253 24 660 22 313 20 190 18 268 . 16 530 14 957 13 534 0 1 36 616 36 143 35 429 34 524 33 470 32 303 31 056 29 754 28 418 27 067 1 2 20 139 21 686 23 029 24 166 25 102 25 842 26 398 26 778 26 997 27 067 2 3 07 384 08674 09 979 И 278 12551 13 783 14 959 16 067 17 098 18 045 3 4 02 031 02 602 03 243 03 947 04 707 05 513 06 358 07 230 08 122 09 022 4 5 00 447 00 625 00 843 01 105 01412 01764 02 162 02 603 .03 086 03 609 5 6 00 082 00 125 00 183 00 258 00 353 00 470 00 612 00 781 00 977 01 203 6 7 00 013 00 021 00 034 00 052 00 076 00 108 00 149 00 201 00 265 00 344 7 8 00 002 00 003 00 006 00 009 00 014 00 022 00 032 00 045 00 063 00 086 8 ' 9 — — 00 001 00 001 00 002 00 004 00 006 00 009 00 013 00 019 9 10 —. —• — — — 00 001 00 00Г 00 002 00 002 00 004 10 11 — — — — — — — — — 00 001 11 \ а 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 а// х \ 0 12 246 И 080 10 026 09 027 08208 07 427 06 721 06 081 05 502 . 04 979 0 1 25 716 24 377 23 060 21 772 20 521 19 311 18 146 17 027 15 957 14 936 1 2 27 002 26 814 26 518 26 127 25 652 25 101 24 496 23 838 23 137 22 404 2 3 18 901 19 644 20 831 20 901 21 376 21757 22 047 22 248 22 336 22 404 3 4 09 923 10 865 И 690 12 541 13 360 14142 14 882 15 574 16 215 16 803 4 5 04 168 04 759 05 378 06 020 06 680 07354 .08 036 08 721 09 405 10 082 5 6 01 459 01745 02 061 02 408 02 783 03 187 03 616 04 070 04 546 05 041 6 7 00 438 00 548' 00 677 00 826 00 994 01 184 01395 01628 01 883 02.160 7 8 00 115 01 151 00 195 00 248 00 311 00 385 00 471 00 570 00 683 00 810 8 9 00 027 00 037 00 050 00 066 00 086 00 111 00 141 00 177 00 220 00 270 9 10 00 006 00 008 00 011 00 016 00 022 00 029 00 038 00 050 00 064 00 081 10 11 00 001 00 002 00 002 00 004 00 005 00 007 00 008 00 013 ,00 017 00 022 .11 . 12 — — —— 00 001 00 001 00 002 00 002 00 003 00 004 00 006 . 12 13 - — • — — — — 00 001 00 001 00 001 13 343
Продолжение табл. VIII \ а X \ 3,1 3,2 3,3 3,4 | '3,5 3.6 3,7 3,8 3,9 4,0 а / / X 0 04 505 04 076 03 688 03 337 03 020 02 732 02 472 02 237 02 024 01 832 0 1 13 965 13 044 12171 11347 10 569 09 836 09 148 08 501 07 894 07 326 1 2 21 646 20 870 20 083 19 290 18 496 17 706 16 923 16 152 15 394 14 652 2 3 22 368 22 262 22 091 21862 21 578 21247 20 872 20 459 20 012 19 537 3 4 17 335 17 809 18 225 18 582 18 881 19 122 19 307 19 436 19 512 19 537 4 5 10 748 11 398 12 029 12 636 13 217 13 768 14 287 14 771 15 219 15 629 5, 6 05 553 06 079 06 616 07 160 07 710 08 261' 08 810 09 355 09 892 10 420 6 . 7 02 459 02 779 03 119 03 478 03 855 04 248 04 657 05 078 05 512 05 954 7 8 00 953 01 112 01 286 01 478 01 686 01 912 02 154 02 412 02 687 02 977 8 9- 00 328 00 395 00 472 00 588 00 656 00 765 00 885 01 018 01 164 01 323 9 10 00 102 00 126 00 156 00 190 00 230 02 275 00 328 00 387 00 454 00 529 10 11 00 029 Об 037 00 047 00 059 00 073 00 090 00 ПО 00 134 00 161 00 192 11 ' 12 00 007 00 010 00 013 00 017 00 021 00 027 00 034 00 042 00 052 00 064 12 13 00 002 00.002 00 003 00 004 00 006 00 008 00 010 00 012 00 016 00 020 13 14 — 00 001 00 001 00 001 00 001 00 002 00 003 00 003 00 004 00 006 14 15 :— •— —' 4 — , —, 00 001 00 001 00 001 00 002 15 \ а 4,1' 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 а / X \ / х 0 01 657 01500 01 357 01 228 01 111 01 005 00 910 00 823 00 745 00 674 . 0 1 06 795 06 298 05 834 05 402 04 999 04 624 04 275 03 950 03 649 03 369 1 2 13 929 13 226 12 544 И 884 И 248 10 635 10 046 09 481 08 940 08 422 2 3 19 037 18 516 17 980 17 430 16 872 16 307 15 738 15 169 14 601 14 037 3 4 19 513 19 442 19 328 19 174 18 981 18 753 18 492 18 203 17 887 17 547 4 5 . 16 000 16 332 16 622 16 873 17 083 17 252 17 383 17 475 17 529 17 547 5 6 10 934 И 432 11 913 12 373 12 81'2 13 227 13 617 13 980 14 315 14 622 6 7 06 404 06 859 07 318- 07 778 08 236 08 692 09 143 09 586 10 021 10 444 7 8 03 282 03 601 03 933 04 278 04 633 04 998 05 371 05 752 06 138 06 528 8. 9 01495 01 680 01 879 02 091 02 316 02 555 02 805 03С68 03 342 03'627 9 10 00 613 00 706 00 808 00 920 01 042 01 175 01 318 01 472 01 637 01 813 10 11 00 228 00 270 00 316 00 368 00 426 00 491 00 563 00 642 00 729 00 824 11 12 00 078 00 094 00 113 00 135 00 160 00 188 00 221 00 257 00 298 00 343 12 13 00 025 00 030 00 037 00 046 00 055 00 067 00 080 00 095 00 112 00 132 13 14 00 007 00 009 00 012 00 014 00 018 00 022 00 027 00 032 00 039 00 047 14 15 00 002 00 003 00 003 00 004 00 005 00 007 00 008 00 010. 00 013 00 016 15 16 .— 00 001 00 001 00 001 00 002 00 002 00 002 00 003 00 004 00 005 16 17 — — — — — — 00 001 00 001 00001 00 001 17 \ а 6,0 7,0 8,0 9,0 10,0 11,0 12,0 13,0 14,0 15-0 а / X \ ! / х 0 00 248 00 091 00 034 00 012 00 004 00 002 00 001 — ’— — 0 1 01487 00 638 00 268 00 111 00 045 00 018 00 007 GO 003 00 001 — 1 2 04 462 02 234 01 074 00 500 00,227 00 101 00 044 00 019 00 008 00 СОЗ 2 3 08 924 05 213 02 863 01499 00 757 00 370 00 177 СО 083 00 038 00 017 3 4 13 385 09 123 05 725 03 374 01 892 01 019 00 531 00 269 СО 133 00С64 4 ’ 5 16 062 12 772 09 160 06-073 03 783 02 242 01 274 00 699 00 373 СО 194 5 344
Продолжение табл. VIII \ а х\ 6,0 7,0 8,0 9,0 10,0 11,0 12,0 13,0 14,0 15,0 а / / X 6 16 062 14*900 12214 09 109 06 306 04 110 02 548 01 515 00 870 00 484 6 7 13 768 14 900 13 959 11712 09 008 06 458 04 368 02 814 01 739 01 037 7 8 10 326 13 038 13 959 13 176 11 260' 08 879 06 552 04 573 03 044 01 944 8 9 06 884 10 140 12 408 13 176 12511 10 853 08 736 06 605 04 734 03 241 9 10 04 130 07 098. 09 926 11 858 12511 11 938 10 484 08 587 06_628 04 861 10 11 02 253 04 517 07 219 09 702 И 374 11 938 11 437 10 148 08 436 06 629 11 12 01 126 02 635 04 813 07 276 09 478 10 943 И 437 10 994 09 842 08 286 12 13 00 520 01 419 02 962 05 038 07 291 09 260 10 557 10 994 10 599 09 561 13 14 00 223 00 709 01692 03 238 05 208 07 275 09 049 10 209 10 599 10 244 14 15 00 089 00 331 00 903 01 943 03 472 05 335 07 239 08 848 09 892 10 244 15 16 00 033 00.145 00 451 01 093 02 170 03 668 05 429 07189 08656 09 603 16 17 00 012 00 060 00212 00 579 01276 02 373 03 832 05 497 07 128 08 474 17 18 00 004 00 023 00 094 00 289 00 709 01 450 02 555 03 970 05 544 07 061 18 19 00 001 00 008 00 040 00 137 00 373 00 840 01 614 02 716 04 085 05 575 19 20 00 003 00016 00 062 00 187 00 462 00 968 01766 02 860 04 181 20 21 00 001 00 006 00 026. 00 089 00 242 00 553 01 093 01 906 02 986 21 22 00 002 00011 00 040 00 121 00 302 00 646 01 213 02 036 22 23 00 001 00 004 00 ole 00 058 00 158 00 365 00 738 01 328 23 24 — 00 002 00 007 00 026 00 079 00 198 00 431 00 830 24 , 25 00 001 00 003 00 012 00 038 00 ЮЗ 00 241 00 498 25 26 — . 00 001 00 005 00 017 00 051 00 130 00 287 26 27 - . — ' 00 002 00 008 • 00 025 00 067 00 160 27 28 00 001 00 003 00 012 00 034 00 086 28 29 — — 00 001 00 005 00 016. 00 044 29 30' . — —- — 00 002 00 008 00 022 30 31 — — — 00 001 00 003 00011 31 32 — — — — — -— 00 002 00 005 32: 33 __ — . — — 00 001 00 002 33 34 — — —. — — — — — — 00 001 34
Таблица IX Стандартные значения преобразованного \ V1 1 2 3 4 5 6 7 8 9 10 . 11 12 vs \ 167,5 148,5 141,1 137,1 134,6 132,9 131,8 130,6 130,0 129,5 128,9 128,3 3 34,1 30,8 29,5 28,7 28,2 27,9 27,7 27,5 27,4 27,2 27,1 27,1 10,1 9,6 9,3 9,1 9,0 8,9 8,9 8,8 8,8 8,8 8,8 8,7 74,1 61,2 56,1 53,4 51,7 50,5 49,8 49,0 48,6 48,2 47,8 47,4 4 21,2 18,8 16,7 16,0 15,5 15,2 15,0 14,8 14,7 14,7 14,5 14,4 7,7 6,9 6,6 6,4 .6,3 6,2 6,1 6,0 6,0 6,0 5,9 5,9 47,0 36,6 33,2 31,1 29,8 28,8 •28,2 27,6 27,3 27,0 26,7 26,4 5 16,3 13,3 12,1 11,4 11,0 10,7 10,5 10,3 10,2 10,1 10,0 9,9 6,6 5,8 5,4 5,2 5,1 5,0 4,9 . 4,8 4,8 4,7 4,7 4,7 35,5 27,0 23,7 21,9 20,8 20,0 19,5 19,0 18,8 18,5 18,3 18,0 6 13,4 10,9 9,8 9,2 8,8 8,5 8,3 8,1 8,0 7,9 7,8 7,7 6,0 5,1 4,8 4,5 4,4 4,3 4,2 4,1 4,1 4, 1 4,0 4,0 29,2 21,7 18,8 17,2 16,2 15,5 15,1 14,6 .14,4 14,2 13;9 13,7 , 7 12,3 9,6 8,5 7,9 7,5 7,2 7,0 6,8 6,7 6,6 6,5 6,4 5,6 4,7 4,4 4,1 4,0 3,9 3,8 3,7 3,7 3,6 3,6 3,6 25,4 18,5 15,8 14,4 13,5 12,9 12,5 12,0 11,8 11,6 11,4 11,2 8 11,3 8,7 7,6 7,0 6,6 6,4 6,2 6,0 5,9 5,8 5,7 5,7 5,3 4,6 4,1 3,8 3,7 3,6 3,5 3,4 3,4 3r3 3,1 3,3 22,9 16,4 13,9 12,6 11,7 11,1 10,8 10,4 10,2 10,0 9,8 9,6 9 10,6 8,0 7,0 6,4 6,1 5,8 5,6 5,5 5,4 5,3 5,2 5,1 5,1 4,3 3,6 3,6 3,5 3,4 3,3 3,2 3,2 3,1 3,1 3, 1 21,0 14,9 12,3 11,3 10,5 9,9 9,6 9,2 9,0 8,9, 8,7 8,5 10 10,0 7,9 6,6 6,0 5,6 5,4 5,2 5,1 5,0 . 4,9 4,8 4,7 5,0 4,1 3,7 3,5 3,3 3,2 3,1 3,1 3,0 2,9 2,9 2,9 11 19,7 13,8 11,6 10,4 9,6 9,1 8,8 8,4 8,2 8,0 7,8 7,6 9,7 7,2 6,2 5,7 5,3 5,1 4,9 4,7 4,6 4,5 4,5 4,4 4,8 4,0 3,6 3,4. 3,2 3,1 3,0 3,0 2,9 2,9 2,8 2,8 12 18,6 12,3 10,8 9,6 8,9 8,4 8, 1 7,7 7,5 7,4 7,2 7,0 9,3 6,9 ' 6,0 5,4 5,1 4,8 4,7 4,5 4,4 4,3 4,2 4,2 4,8. 3,9 3,5 3,3 3,1 3,0 2,9 2,9 2,8 2,8 2,7 2,7 17,8 ' 12,3 10,2 9,1 8,4 7,9 7,6 7,2 7,0' 6,9 6,7 6,5 13 9,1 6,7 5,7 5,2 4,9 4,6 4,4 4,3 4,2 4,1 4,0 4,0 4,7 3,8 3,4 3,2 3,0 2,9 2,8 2,8 2,7 2,7 2,6 2,6 14 17,1 11,7 9,7 8,6 7,9 7,4 7,1 6,8 6,6 6,5 6,3 6,1 8,9 6,5 5,6 5,0 4,7 4,5 4,3 4,1 4,0 3,9 3,9 3,8 4,6 3,7 3,3 3, 1 3,0 2,9 2,8 2,7 2,7 2,6 2,6 2,5 15 16,6 11,3 9,3 8,3 7,6 7,1 6,8 6,5 6,3 6,2 6,0 5,8 8,7 6,4. 5,4 4,9 4,6 4,3 4,1 4,0 3,9 3,8 3,7 3,6 4,5 3,7 3,3 3,1 2,9 2,8 2,7 2,6 2,6 2,5. 2,5 2,5 16 16,1 11,0 9,0 7,9 7,3 6,8 6,5 6,2 6,1 5,9 5,8 5,6 8,5 6,2 5,3 4,8 4,4 4,2 4,0 3,9 3,8 3,7 3,6 3,5 4,5 ' 3,6 3,2 3,0 2,9 2,7 2,7 2,6 2,5 2,5 2,5 2,4 15,7 10,7 8,7 7,7 7,0 6,6 6,3 6,0 5,8 5,7 5,5 5,3 17 8,4 6, 1 5,2 4,7 4,3 4,1 3,9 3,8 3,7 3,6 3,5 3,5 4,5 3,6 3,2 3,0 2,8 2,7 2,6 2,6 2,5 2,5 2,4 2,4 18 15,4 10,4 8,5 7,5 6,8 6,4 6,1 5,8 5,6 5,5 5,3 5,1 8,3 6,0 5,1 4,6 4,2 4,0 3,8 3,7 3,6 3,5 3,4 3,4 4,4 3,5 3,2 2,9 2,8 2,7 2,6 2,5 2,7 2,4 2,4 2,3 19 15,1 10,2 8,3 7,3 6,6 6,2 5,9 - 5,6 5,5 5,3 5,2 5,0 8,2 5,9 5,0 4,5 4,2 3,9 3,8 3,6 3,5 3,4 3,4 3,3 4,4 3,5 3,1 2,9 2,7 2,6 2,5 2,5 2,4 2,4 2,3 2,3 20, 14,8 10,0 8,1 7,1 6,5 6,0 5,7 5,4 5,3 5,1 5,0 4,8 8,1 5,8 4,9 4,4 4,1 3,9 3,7 3,6 3,4 3,4 3,3 3,2 z 4,3 3,5 3,1 2,9 2,7 2,6 2,5 2,4 2,4 2,3 2,3 2,3 21 14,6 9,8 7,9 7,0 6,3 5,9 5,6 5,3 5,2 5,0 4,9 4,7 8,0 5,8 4,9 4,4 4,0 3,8 3,6 3,5 3,4 3,3 3,2 3,2 4,3. 3,5. 3,1 2,8 2,7 2,6 2,5 2,4 2,4 2,3 2,3 2,2 Vi/ 1 2 3 4 5 6 7 8 9 10 11 12 7 V2 критерия Фишера f=01/02(01 > erf) 14 16 20 24 30 40 50 75 100 200 500 00 Vl / / V2 4 127,7 26,9 8,7 47,0 14,2 5,9 26,1 9,8' 4,6 17,7 7,6 3,9 13,5 6,3 3,5 11,0 5,6 3,2 9,4 5,0 3,0 8,3 4,6 2,8 7,4 4,3 2,7 6,8 4,1 2,6 6,3 3,9 2,6 5,9 3,7 2,5 5,6 3,5 2,4 5,4 3,5 2,4 5,1 3,4 2,3 5,0 . 3,3 2,3 4,8 3,2 2,3 4,7 3,1 2,2 4,5 3,1 2,2 127,1 26,8 8,7 46,6 14,1 5,8 25,8 9,7 4,6 17,5 7,5 3,9 13,2 6,2 3,5 10,8 5,5 -3,2 9,2 4,9 3,0 8,1 4,5 2,8 7,3 4,2 2,7 6,7 4,0 2,6 6,2 3,8 2,5 5,8 3,6 2,4 5,5 3,4 2,4 5,3 3,4 2,3 5,0 3,3 2,3 4,8 3,2 2,2 4,7 3,1 2,2 4,5 3,0 2,2 4,4 3,0 2,1 126,5 26,7 8,7 46,2 14,0 5,8 25,4 9,6 4,6 17,2 7,4 3,8 13,0 6,1 3,4 10,5 5,4 3,2 8,9 4,8 2,9 7,8 4,4 2,7 7,1 4,1 2,7 6,5 3,9 2,5 6,0, 3,7 2,5 5,6 3,5 2,4 5,3 3,3 2,3 5,1 3,3 2,3 4,8 3,2 2,2 4,7 3,1 2,2 4,5 3,0 2,1 4,4 2,9 2,1 4,2 2,9 2,1. 125,9 26,6 8,6 45,8 13,9 5,8 25,1 9,5 4,5 16,9 7,3 3,8 12,7 6,0 3,4„ 10,3 5,3 3, 1 8,7 4,7 2,9 7,6 4,3 2,7 6,9 4,0 2,6 6,3 3,8 2,5 5,8 3,6 2,4 5,4 3,4 2,4 5,1 3,2 2,3 4,9 3,2 2,2 4,6 • 3,1 2.2 4,5 3,0 2,1 4,4 2,9 2,1 4,2 2,9 2,1 4,0 2,8 2,0 125,6 26,5 8,6 45,6 13,8 5,7 24,9 9,4 4,5 16,8 7,2 3,8 12,6 5-, 9 3,4 10,2 5,2‘ 3,1 8,6 4,6 2,9 7,5 4,3 2,7 6,8 3,9 2,6 6,2 3,7 2,5 5,7 '3,5 2,4 5,3 3,3 2,3 5,0 3,2 2,3 4,8 3,1 2,2 4,5 3,0 2,2 4,4 2,9 2,1 4,2 . 2,9 2, 1 4,1 2,"8 2,0 3,9 2,7 2,0 125,3 26,4 8,6 45,4 13,7 5,7 24,8 9,3 4,5 16,6 7,1 3,8 12,5 5,9 3,3 10,1 5,1 3,1 8,5 4,5 2,8 7,4 4,2 2,6 6,7 3,9 2,5 6,1 3,6 2,4 5,6 3,4 2,3 5,2 3,3 2,3 4,9 3,1 2,2 4,7 3,0 2,2 4,4 2,9 2,1 4,3 2,8 2, 1 4,1 2,8 2,0 4,0 2,7 2,0 3,8 2,6 2,0 125,0 26,4 8,6 45,2 13,7 5,7 24,6 9,2 4,4 16,5 7,1 3,7 12,3 5,9 3,3 10,0 5,1 3,0 8,4 4,5 2,8 7,3 4,1 2,6 6,6 3,8 2,5 6,0 3,6 2,4 5,5 3,4 2,3 . 5,1 3,2 2,2 4,8 3,1 2,2 4,6 3,0 2,1 4,3 2,9 2,1 4,2 2,8 2,0 4,0 2,7 2,0 3,9 2,6 2,0 3,7 2,6 1,9 124,7 26,3 8,6 45,0 13,6 5,7 24,5 9,1 4,4 16,4 7,0 3,7 12,2 5,8 3,3 9,9 5,0 3,0 8,3 4,4 2,8 7,2 4,1 2,6 6,5 3,7 2,5 5,9 3,5 2,4 5,4 3,3 2,3 5,0 3,1 2,2 4,7 3,0' 2,2 4,5 2,9 2,1 4,3 2,8 2,0 4,1 2,7 2,0 3,9 2,6 2,0 3,8 2,6 1,9 3,6 ’ 2,5 1,9 124,4 26,2 8,6 44,7 13,5 5,7 24,3 9,1 4,4 16,2 7,0 3,7 12; 1 5,8 3,3 9,7 5,0 3,0 8,1 4,4 2,8 7,1 4,0 2,6 6,3 3,7 2,5 5,7 3,5 2,4 5,3 3,3 2,3 4,9 3,1 2,2 4,6 3,0 2,1 4,4 2,9 2,1 4,2 2,8 2,0 4,0 2,7 2,0 3,8 2,6 1,9 3,7 2,5 1,9 3,6 2,5 1,9 124,1 26,2 8,5 44,5 13,5 5,7 24,1 9,1 4,4 16,1 6,9 3,7 12,0 5,7 3,3 9.6 4,9 3,0 8,0 4,4 2,7 7,0 4,0 2,6 6,2 3,7 2,4 5,6 3,4 2,3 5,2 3,2 2,2 4,8 3,1 2,2 4,5 2,9 2,1 4,3 » 2,8 2,0 4,1 2,7 2,0 3,9 2,6 1,9 3,7 2,5 1,9 3,6 2,5 1,9 3,5 2,4 1,8 123,8 26,1 8,5 44,3 13,5 5,6 24,0 9,0 4,4 15,9 6,9 3,7 11,8 5,7 3,2 9,5 4,9 2,9 7,9 4,3 2,7 6,9 3,9 2,6 6,1 3,6 2,4 5,5 3,4 2,3 5,1 3,2 2,2 4,7 3,0 2,1 4,4 2,9 2,1 4,2 2,8 2,0 4,0 2,7 2,0 3,8 ' 2,6 1,9 3,6 2,5 1,9 3,5 2,4 1,8 3,4 2,4 1,8 123,5 26,1 8,5 44, 1 13,5 5,6 23,8 9,0 4,4 15,8 6,9 3,7 11,7 5,7 3,2 9,4 4,9 2,9 7,8 4,3 2,7 6,8 3,9 2,5 6,0 3,6 2,4 5,4 3,4 2,3 5,0 3,2 2,2 4,6 3,0 2,1 4,3 .2,9 2,1 4, 1 2,8 2,0 3,9 2,7 2,0 3,7 2,6 1,9 3,5 2,5 1,9 3,4 2,4 1,8 3,3 2,4 1,8 3 4 5 6 7 . 8 9 10 11 12 13 ' 14 15 16 17 18 19 20 21 14 16 20 24 30 40 50 75 •' 100 200 500 “] \V1 v2 ' 346 347
Продолжение табл. IX \ v , \ 1 2 3 4 5 6 7 8 9 10 11 12 v2\ 14,4 9,6 7,8 6,8 6,,2 5/8 5,5 5,2 5,1 4,9 4,8 4,6 22 7,9 5,7 4,8 4,3 4,0 3,8 3,6 3,4 3,3 3,3 3,2 3,1 4,3 3,4 3,0 2,8 2,7 2,6 2,5 2,4 2,4 2,3 2,3 2,2 14,2 9,5 7,7 6,7 6, 1 5,6 5,4 5,1 5,0 4,8 4,7 4,5 23 7,9 5,7 4,8 4,3 4,0 3,7 3,5 3,4 3,3 3,2 3,1 3,1 4,3 3,4 3,0 2,8 2,6 2,5 2,4 2,4 2,3 2,3 2,2 2,2 14,0 9,3 7,6 6,6 6,0 5,6 5,3 5,0 4,9 4,7 4,6 4,4 24 7,8 5,6 4,7 4,2 3,9 3,7 3,5 3,4 3,2 3,2 3,1 3,0 4,3 3,4 3,0 2,8 2,6 2,5 2,4 2,4 2,3 2,3 2,2 2,2 13,9 9,2 7,5 6,5 5,9 5,5 5,2 4,9 4,8 4,6 4,5 4,3 25 7,8 5,6 4,7 4,2 3,9 3,6 3,5 3,3 3,2 3,1 3,0 3,0 4,2 3,4 3,0 2,8 2,6 2,5 2,4 2,3 2,3 2,2 2,2 2,2 13,7 9, 1 7,4 6,4 5,8 5,4 5,1 4,8 4,7 4,5 4,4 4,2 26 7,7 5,5 4,6 4, 1 3,8 3,6 3,4- 3,3 3,2 3,1 3,0 3,0 4,2 3,4 3,0 2,7 2,6 2,5 2,4 2,3 2,3 2,2 2,2 2, 1 13,6 9,0 7,3 6,3 5,7 5,3 5, 1 4,8 4,7 4,'5 4,4 4,2 27 7,7 5,5 4,6 4,1 3,8 3,6 3,4 3,3 3,1 3,1 3,0 2,9 4,2 3,3 3,0 2,7 2,6 2,5 ' 2,4 2,3 2,2 ' 2,2 2,2 2, 1 13,5 8,9 7,2 6,3 5,7 5,2 5,0 4,7 4,6 4,4 4,3 4, 1 28 7,6 5,4 4,6 4,1 3,8 3,5 3,4 3,2 3,1 3,0 2,9 2,9 4,2 з,з 2,9 2,7 2,6 1 2,4 2,4 2,3 2,2 2,2 2,1 2, 1 13,4 8,9 7,1 6,2 5,6 5,2 5,0 ' 4,7 4,6 4,4 4,3 4,1 29 7,6 5,4 4,5 4,0 3,7 3,5 з,з 3,2 3,1 3,0 2,9 2,9 4,2 3,3 2,9 2,7 2,5 2,4 2,3 2,3 2,2 2,2 2,1 2,1 13,3 8,8 7,1 6,1 5,5 5,1 4,9 4,6 4,5 4,3 4,2 4,0 30 . 7,6 5,4 4,5 4,0 3,7 3,5 з,з 3,.2 3,1 3,0 2,9 2,8 4,2 3,3 2,9 2,7 _ 2,5 2,4 2,3 2,3 2,2 2,2 2,1 2, 1 13,2 8,7 7,0 6,0 5,4 5,0 4,8 4,5 4,4 4,2 4,1 3,9 32 7,5 5,3 4,5 4,0 3,7 3,4 3,2 3, 1 3,0 2,9 2,9 2,8 4,1 3,3 2,9 . 2,7 2,5 2,4 2,3 2,2 2,2 2,1 2,1 2, 1 13,1 8,6 7,0 6,0 5,4 5,0 ' 4,8 4,5 4,4 4,2' 4,1 3,9 34 7,4 5,3 4,4 3,9 3,6 3,4 3,2 3,1 3,0 2,9 2,8 2,8 4,1 3,3 2,9 2,7 2,5 2,4 2,3 2,2 2,2 2,1 2,1 2,1 13, 0 8,6 6,9 5,9 5,3 4,9 4,7 4,4 4,3 4,1 4,0 3,8 36 7,4 5,2 4,4 3,9 3,6 3,3 3,2 3,0 2,9 2,9 2,8 2,7 4,1 3,3 2,9 ' 2,6 2,5 2,4 2,3 2,2 2,1 2,1 2,1 2,0 12,9 8,5 6,8 5,8 5,3. 4,9 4,7 4,4 4,3 4,1 4,0 3,8 38 7,3 5,2 4/3 3,9 3,5 з,з 3,1 3,0 2,9 2,8 2,7 2,7 4,1 3,2 2,8 2,6 2,5 2,3 2,3 2,2- 2,1 2, 1 2,1 2,0 12,8 8,4 6,7 5,8 5,2 4,8 4,6 4,3 4,2 4,0 3,9 3,7 40 7,3 5,2 4,3 . 3,8 3,5 з,з 3,1 з,о 2,9 2,8 2,7 2,7 4, 1 3,2 2,8 2,6 2,4 2,3 2,2 2,2 2,1 2,1 2,0 2,0 12,7 8,3 6,7 5,7 5,2 4,8 4,6 4,3 4,2 4,0 3,9 3,7 42 7,3 5,1 4,3 3,8 3,5 з,з 3,1 3,0 2,9- 2,8 2,7 2,6 4,1 3,2 2,8 2,6 2,4 2,3 2,2 2,2 2,1 2,1 .2,0 2,0 12,5 8,2 6,6 5,6 5,1 4,7 4,5 4,2 4, 1 3,9 3,8 3,6 44 7,2 5,1 4,3 3,8 3,5 3,2 3,1 2,9 2,8 2,7 2,7 2,6 4,1 3,2 2,8 2,6 2,4 2,3 2,2 2,2 2,1 2,0 2,0 2,0 12,4 8,1 6,5 5,6 5,0 4,6 4,4 4,1 4,0 3,8 3,7 3,5 46 7,2 5,1 4,2 3,8 3,4 3,2 3,0 2,9 2,8 2,7 2,7 2,6 4,0 3,2 2,8 2,6 2,4 2,3 2,2 2,1 2, 1 2,0 2,0» 2,0 12,3 8, 1 6,4 5,5 5,0 4,6 4,4 4,1 4,0 3,8 3,7 3,5 48 7,2 5, 1 4,2 3,7 3,4 3,2 3,0 2,8 2,8 2,'7 2,6 2,6 4,0 3,2 2,8 2,6 2,4 2,3 2,2 2,1 2, 1 2,0 2,0 2,0 12,2 8,0 б;4 5,4 4,9 4,5 4,3 4,0 3,9 3,7 3,6 3,4 50 7,2 5,1 4,2 3,7 3,4 3,2 3,0 2,9 2,8 2,7 2,6 2,6 4,0 3,2 2,8 2,6 2;4 2,3 2,2 2,1 2, 1 2,0. 2,0 1,9 Vi, / И 9 3 4 5 6 7 8 9 10 11 12 ' V2 14 16 20 24 30 40 50 75 100 200 500 00 Vi / /v2 4,4 4,3 4, 1 3,9 3,8 3,7 3,6 3,6 3,5 3,4 3,3 3,2 - 3,0 2,9 2,8 2,7 2,7 2,6 2,5 2,5 •2,4 2,4 2,3 2,3 22 2,2 2,1 2, 1 2,0 2,0 1,9. 1,9 1,8 1,8 1,8 1,8 1,8 4,3 4,2 4,0. 3,8 3,7 3,6 3,5 3,5 3,4 3,3 3,2 3,1 3,0 2,9 2,8 2,7 2,6 2,5 2,5 '2,4 2,4 2,3 2,3 2,3 .23 2, 1 2, 1 2,0 2,0. 2,0 1,9 1,9 1,8 1,8 1,8 1,8 1,8 4,2 4,1 3,9 3,7 3,6 3,5 3,4 3,4 3,3 3,2 3,1 3,0 2,9 2,8 2,7 2,7 2,6 2,5 2,4 2,4 2,3 2,3 2,2 2,2 24 2,1 2,1 2,0 1,9 1,9 1,9 1,9 1,8 1,8 1,8 1,7 1,7 4,2 4,0 3,9 3,7 3,6 3,5 3,4 3,3 3,2 3,1 3,0 2,9 2,9 2,8 2,7 2,6 2,5 2,4 2,4 2,3 2,3 2,2 1,2 2,2 25 ii ; 2,1 2,1 2,0 2,0' 1,9 1,9 1,8 1,8 1,8 1,7 1,7 1,7 4,1 3,9 3,8 3,6 3,5 3,4 3,3 3,2 3,1 3,0 2,9 2,8 2,9 2,8 2,7 2,6 2,5 2,4 2,4 2,3 2,2 2,2 2, 1 2, 1 26 2,1 2,0 2„0 1,9 1,9 1,8 . 1,8 1,8 1,8 1,7 1,7 1,7 ’4,0 3,9 3,7 3,5 3,4 3,3 3,2 3,2 3, 1 3,0 2,9 2,8 2,8 2,7 2,6 ' 2,5 2,5 2,4 2,3 2,2 2,2 2,2 2,1 2,1 27 2,1 2,0 1,9 1,9 1,9 1,8 1,8 1,8 1,7 1,7 1,7 1,7 4,0 3,8 3,7 3,5 3,4 3,3 3,2 3,1 3,0 2,9 2,8 2,7 2,8 2,7 2,6 2,5 2,4 2,3 2,3 2,2 2,2 2,1 2,1 2,1 28 2,1 2,0 2,0 1,9 1,9 1,8 1,8 1,7 1,7 1,7 1,7 1,6 з,о 3,8 3,6 3,4 з,з 3,2 3,1 3,0 2,9 2,8 2,7 2,6 2,8 2,7 2,6 -2,5 2,4 2,3 2,3 2,2 2,1 2, 1 2,1 2,0 28 2,0 2,0 1,9 1,9 1,8 1,8 1,8 1,7 1,7 1,7 1,6 1,6 3,9 3,7 3,6 3,4 з,з 3,2 3,1 3,0 2,9 2,8 2,7 2,6 2,7 2,7 2,5 2,5 2,4 2,3 2,2 2,2 2,1 2,1 2,0 2,0 30 2,0 2,0 . 1,9 1,9 1,8 1,8 1,8 1,7 1,7 1,7 1,6 1,6 3,8 3,7 ’ 3,5 3’4 3,2 3,2 3,1 3,0 2,8 2,7 2,6 2,5 2,7 2,6 2,4 2,4 2,3 2,2 2,2 2,1 2,1 2,0 2,0 2,0 32 ь 2,0 2,0 1,9 1,9 1,8 1,8 1,7 1,7 1,7 1,6 1,6 1,6 3,8 3,6 3,5- 3,3 3,2 3, 1 3,0 2,9 2,8 2,6 2,6 2,5 2,7 2,6 2,4 2,4 2,3 2,2 2,2 2,1 2,1 2,0 2,0 2,0 34 2,0 2,0 1,9 1,9 1,8 1,8 1,7 1,7 1,7 1,6 1,6 1,6 3,7 3,6 3,4 3,3 3,1 3,1 3,0 2,9 2,7 2,6 2,5 2,4 2,6 2,5 2,4 2,3 2,3 2,2 2,1 2,0 2,0 1,9 1,9 1,9 36 2,0 1,9 .1,9 1,8 1,8 1,7 1,7 1,6 1,6 1,6 1,6 1,5 3,7 3,5 3,4 3,2 3, 1 3,0 ' 2,9 2,8 2,7 2,6 2,5 2,4 2,6 •2,5 2,4 2,3 2,2 2,1 2,1 2,0 2,0 1,9 1,9 1,8 38 • 2,0 1,9 1,9 1,8 1,8 1,7 1,7’ 1,6 1,6 1,6 1,5 1,5 3,6 3,5 з,з 3,2 3,0 з,о 2,9 2,8 2,6 2,5 2,4 2,3 2,6 2,5 2,4 2,3 2,2 2,1 2,0 2,0 1,9 1,9 1,8 1,8 40 1,9 1,9 1,8 1,8 1,7 1,7 1,7 1,6 1,6 1,5 1,5 1,5 3,6 3,4 з,з 3,1 3,0 2,9 2,8 2,7 2,6 2,4 2,4 2,3 2,5 2,5 2,3 2,3 2,2 2,1 2,0 1,9 1,9 1,8 1,8 1,8 42 1,9 1,9 1,8 1,8 1,7 1,7 1,6 1,6 1,6 1,5 1,5 1,5 3,5 3,4 3,2 3,1 2,9 2,9 2,8 2,7 2,5 2,4 2,3 2,2 2,5 2,4 2,3 2,2' 2,1 2,1 2,0 1,9 1,9 1,8 .1,8 1,7 44 i 1,9 1,9 1,8 1,8 1,7 1,7 1,6 •1,6 1,6 1,5 1,5 1,5 3,4 з,з 3,1 3,0 .2,8 2,8 2,7 2,6 2,4 2,3 2,2 2,1 2,5 2,4 2,3 2,2 2,1 2,6 2,0 1,9 1,9 1,8 1,8 1,7 46 1,9 1,9 1,8 1,7 1,7 1,6 1,6 1,6 1,5 1,5 1,5 1,5 1 3,4 з,з 3,1 3,0 2,8 2,8 2,7 2,6 2,4 2,3 2,2 2, 1 2,5 2,4 2,3 2,2 2,1 2,0 1,9 1,8 1,8 1,8 1,7 1,7 48 1,9 1,9 1,8 1,7 1,7 1,6 1,6 1,6 1,5 1,5 1,5 1,4 з,з 3,2 3,0 2,9 2,7 2,7 2,6 2,5 2,3 2,2 2,1 2,0 2,5 2,4 2,3 ' 2,2 2,1 2,0 1,9 1,9 1,8 1,8 1,7 1,7 50 1,9 1,8 1,8 1,7 1,7 1,6 1,6 1,5 1,5 1,5 1,5 1,4 У 14 16 20 24 30 40 50 75 100 200. 500 OS V3 2 V1 V / 349 348
Продолжение табл. IX \ V1 v2\ 1 2 3 4 5 6 7 8 9 10 П 12 12,1 7,9 6,3 5,4 4,9 4,5 4,3 4,0 3,9 3,7 3,6 3,4 55 7,1 5,0 4,1 3,7 3,4 3,1 3,0 2,8 2,7 2, 7 2,6 2,5 4,0 3,2 2,8 2,5 2,4 2,3 2,2 2,1 2,0 2,0 2,0 1,9 1 12,0 7,8 6,2 5,3 4,8 4,4 4,2 3,9 3,8 3,6 3,5 3,3 60 7,1 5,0 4, 1 3,6 3,3 3,1 2,9 2,8 2,7 ' 2,6 2,6 2,5 4,0 3,1 2,8 2,5 2,4 2,2 2,2 2,1 2,0 2,0 1,9 1,9 11,9 7,7 6,1 5,2 4,7» 4,3 4,1 3,8 3,7 3,5 3,4 3,2 65 7,0 5,0 4,1 3,6 3,3 3,1 2,9 2,8 2,7 2,6 2,5 2,5 4,0 3,1 2,7 2,5 2,4 2,2 2,1 2,1 2,0 2,0 1,9 1,9 11,6 7,6 6,0 5,2 4,7 4,3 4,1 3,8 3,7 3,5 3,4 3,2 70 7,0 4,9 4,1 3,6 3,3 3,1 2,9 2,8 2,7 2,6 2,5 2,4 4,0 3,1 2,7 2,5 2,3 2,2 2,1 2,1 2,0 2,0 1,9 1,9 e 11,6 7,5 6,0 5,1 4,6 4,2 4,0 3,7 3,6 3,4 3,3 3,1 80 7,0 4,9 4,0 3,6 3,2 3,0 2,9 2, -7 2,6 2,5 2,5 2,4 4,0 3,1 2,7 2,5 2,3 2,2 2,1 2,0 2,0 1,9 1,9 1,9 11,5 7,4 5,9 5,.O 4,5 4,1 3,9 3,7 3,6 3,4 3,3 3,1 100 6,9 4,8 4,0 3,5 3,2 3,0 2,8 2,7 2,6 2,5 2,4 2,4 3,9 3,1 2,7 2,5 2,3 2,2 2,1 2,0 2,0 1,9 1,9 1,8 125 11,4 7,4 5,8 5,0 4,5 4,1 3,-9 3,6 3,5 3,3 3,2 3,0 6,8 4,8 3,9 3,5 3,2 2,9 2,8 2,6 2,6 2,5 2,4 2,3 3,9 3,1 2,7 2,4 2,3 2,2 2,1 2,0 1,9 1,9, 1,9 1,8 150 11,3 7,3 5,7 4,9 4,4 4,0 3,8 3,5 3,4- , 3,2 3,1 2,9 6,8 4,7 3,9 3,4 3,1 2,9 2,8 2,6 2,5 2,4 .2,4 2,3 3,9 3, 1 2,7 2,4 2,3 2,2 2,1 2,0 1,9 1,9 1,8 1,8 200 И,2 7,2 5,6 4,8 4,3 3,9 3,7 3,5 3,4 3,2 , 3,1 2,9 6,8 4,7 3,9 3,4 3,2 2,9 2,7 2,6 2,5 2,4 2,3 2,3. 3,9 3, 0 2,6 2,4 2,3 2,1 2,0 .2,0 1,9 1,9 1,8 1,8 400 11,0 7,1 5,6 4,7 4,2 3,8 3,6 3,4 3,3 3,1 3,0 2,8 6,7 4,7 3,8 3,4 3,1 2,8 2,7 .2,5 2,5 2,4 2,3 2,2 3,9 3,0 2,6 2,4 2,2 2,1 2,0' 2,0 1,9 1,8 1,8 1,8 10,9 7,0 5,5 - 4,7 4,2 3,8 3,6 3,4 3,3 3,1 3,0 2,8 1000 6,7 4,6 3,8 3,4 3,3 3,0 2,8 2,7 2,5 2,4 2,3 2,3 3,8 3,0 2,6 2,4 2,2 2,1 2,0 1,9 1,9 1,8 1,8 , 1,8 10,8 6,9 5,4 4,6 4, 1 3,7 3,5 3,3 3,2 3,0 2,9 2,7 оо 6,6 4,6 3,8 3,3 3,0 2,8 2,6 2,5 2,4 2,3 2,2 2,2 3,8 3,0 2,6 2,4 2,2 2,1 2,0 1,9 1,9 1,8 1,8 1,7 Vi I 2 . 3 4 5 6 1 8 9 10 11 12 z v2 14 16 20 24 30 40 50 75 100 200 500 00 Vi , 'v2 . 3,3 2,4 1,9 3,2 2,4 1,9 3,1 2,4 1,8 3,1 2,3' 1,8 3,0' 2,3. 1,8 3,0 2,3 1,8 2,9 2,2 1,8 2,8 2,2 1,8 2,8 2,2 1,7 2,7 2,1 1,7 2,7 2,2 1,7 2,6 2,1 1,7 3,2 2,3 1,8 3,1 2,3 1,8 3,0 2,3 1,8 3,0 2,3 1,8 2,9 - 2,2 1,8 2,8 2,2 1,7 2,8 2,1 1,7 2,7 2,1 1,7 2,6 2,1 1,7 2,5 2,0 1,7 2,5 2,-1 1,6 2,4 2,0 1,6 3,0 2,2 1,8 2,9 2,2 1,7 2,8 2,2 1,7 2,8 2,1 1,7 2,7 2,1 1,7 2,7 2, 1 1,7 2,6 2,0 1,6 2,5 2,0 1,6 2,5 2,0 1,6 2,4 1,9 1,6 2,4 2,0 1,6 2,3 1,9 1,6 2,9 2,1 1,7 2,8 2,1- 1,7 2,7 2,1 1,7 2,7 2, 1 1,7 2,6 2,0 1,6 2,5 2,Q 1,6 2,5 1,9 1,6 2,4 1,9 1,6 2,3 1,9 1,6 2,2 1,8 1,5' 2,2 1,9 1,5 2,1 1,-8 1,5 2,7 2,1 1,7 2,6 2,0 1,6 2,5 2,0 1,6 - 2,5 2,0 1,6 2,4 1,9 1,6 2,4 1,9 1,6 2,3 1,8 1,5 2,2 1,8 1,5 2,2 1,8 . 1,5 2,1 1,7 1,4 2,1 1,8 1,5 2,0 1,7 1,5 2,7 2,0 1,6 2,6 1,9 /1,6 2,5 1,9 1,6 2,4 1,9 1,6 2,4 1,8 1,5 2,3 1,8 1,5 2,3 1,7 1,5 2,2 1,7 1,5 2,1 1,7 1,4 2,0 1,6 1,4 2,0 1,7 1,4 1,9 1,6 1,4 2,6 1,9 1,6 2,5 1,9 1,6 2,4 1,8 1,5 2,3 1,8 1,5 2,3 1,8 1,5 2,2 1,7 1,5 2,1 1,7 1,4' 2,0 1,7 1,4 1,9 1,6 1,4 1,9 1,6 1,4 1,8 1,6 1,4 1,7 1,5 1,3 2,5 1,8 1,5 2,4 1,8 1,5 2,3 1,8 1,5 2,2 1,7 1,5 2,2 1,7 1,4 2,1 1,6 1,4 2,0 1,6 1,4 1,9 1,6 1,4 1,8 1,5 1,3 1,8 1,5 1,3 1,7 1,5 1,3 1,6 1,4 1,3 . 2,3 1,8 1,5 2,2 1,7 1,5 2,1 1,7 1,5 2,1 1,7 1,4 2,0 1,6 1,4 1,9 1,6 1,4 1,9 1,5 1,4 1,8 1,5 1,3 1,7 1,5 1,3 1,6 1,4 1,3 1,6 1,4 1,3 1,5 1,4 1,2 2,2 1,7 1,5 2,1 1,7 1,4 2,0 1,6 1,4 2,0 1,6 1,4 1,9 1,6 1,4 1,8 1,5 1,3 1,8 1,5 1,3 1,7 1,4 1,3 1,6 1,4 1,3 1,5 1,3 1,2 1,5 1,4 1,2 1,4 1,2 1,2 2,1 1,7 1,4 2,0 1,6 1,4 1,9 1,6 1,4 1,8 1,6 1,4 1,8 1,5 1,3 1,7 1,5 1,3 1,6 1,4 1,3 1,5 1,4 1,2 .1,4 1,3 1,2 1,4 1,2 1,2 1,3 1,2 1,1 1,2 ' 1,1 1,1 2,0 1,6 1,4 1,9 1,6 1,4 1,8 1,6 1,4 1,7 1,6 1,3 1,7 1,5 1,3 1,6 1,4 1,3 1,5 1,4 1,2 1,4 1,3 1,2 1,3 1,3 1,2 1,3 1,2 1,1 1,1 1,1 1,6 1,0 55 60 65. 70, 80. 100. 125 . 150 200 40 O' 1000 oo 14 16 20 24 30 40 50 75 100 200 500 00 V2 \
Таблица X Стандартные значения критерия Стьюдента (tSf) V h ^2 *3 V ii ^2 t. 1 12,7 63,7 637,0 13 2,2 3,0 4,2 2 4,3 9,9 31,6 14—15 2,1 3,0 . 4,1 3 3,2 ' 5,8 12,9 16—17 2,1 2,9 * 4,0 4 2,8 4,6 8,6 18—20 2,1 2,9 3,9 5 2,6 4,0 6,9 21—24 2,1 2,8 3,8 6 2,4 3,7 6,0 25—28 2,1 2,8 3,7 7 ' 2,4 3,5 5,3 29—30 2,0 2,8 3,7 8 2,3 . 3,4 5,0 31—34 2,0 2,7 3,7 9 2,3 • 3,3 4,8 35—42 2,0 2,7 3,6 10 2,2 3,2 4,6 43—62 2,0 2,7 3,5' 11 2,2 .3,1 4,4‘ 63—175- 2,0 2,6 3,4 12 2,2 3,1 - 4,3' 176 и больше 2,0 : 2,6 3,3 Таблица XI, Стандартные значения критерия %2 V 2 Х1 2 Х2 2 %3 V 2 XI 2 Х2 2 хз V 2 XI 2 Х2 2 Хз 1 '3,8 6,6 10,8 18 28,9 34,8 42,3 40 55,8 63,7 73,4 2 6,0 9,2 13,8 19 30,1 36,2 43,8 42 58,1 66,2 76,1 3 7,8 и,з 16,3 20 31,4 37,6 45,3 44 60,5 68,7 78,7' 4 9,5 13,3 18,5 21 32,7 38,9 46,8 46 62,8 71,2 81,4 5 . П,1 15,1 20,5 22 33,9 40,3 48,3 48 65,2 73,7 ,84,0 6 12,6 16,8 22,5 23 35,2 41,6 49,7 50 67,5 v 76,2 86,7. 7 14,1 18,5 24,3 24 36,4 43,0 51,2 55 73,3 82,3 93,2 8 15,5 20,1 26,1 25 37,7 44,3 52,6 60 79,1 88,4 99,6 9 16,9 21,7 27,9 26 38,9 45,6 54,1 65 84,8 94,4 106,0 10 18,3 23,2 29,6 27 40,1 47,0 55,5 70 90,5 100,4 112,3 И 19,7 24,7 31,3 28 41,3 48,3 56,9 75 96,2 106,4 118,5 12 21,0 26,2 32,9 29 42,6 49,6 58,3 80 101,9 112,3 124,8 13 22,4 27,7 34,5 30 43,8 50,9 59,7 85 107,5 118,2 131,0 ' 14 23,7 29,1 36,1 32 46,2 53,5 62,4 90 113,1 ' 124,1 137,1 15 25,0 30,6 37,7 34 48,6 56,0 65,2 95 118,7 130,0 143,3 16 26,3 32,0 39,3 36 51,0 58,6 67,9 100 124,3 135,8 149,4 17 J 27,6 33,4 40,8 38 53,4 1 61,1 70,7
Таблица XII Количество пар значений, достаточное для достоверности выборочного коэффициента (- & > корреляции (г) I п— — -|-3 1 Г п~ Г гГ Г г? ₽!=0,95 02=0,99 03=О,999 0з=О,95 02=0,99 03=0,999 0з=О,95 02=0,99 ₽3=0,999 «3=1,96 t2=2,58 /3=з,зо ii=l,96 «2=2,58 «З=3,30 «з=1,96 «2=2,58 «З=3,30 01 38407 66503 108903 31 40 68 109 61 11 16 25 02 9603 16628 27228 32 38 63 102 62 10 16 24 03 4269 7392 12103 33 36 60 96 63 10 15 23 04 2403 4159 6809 34 34 56 90 64 10 15 22 05 1539 2263 4359 35 32 53 85 65 9 14 21 06 1069 1850 3028 36 30 50 80 66 9 14 20 07 ' 787 1360 2225 37 28 47 75 67 9 13 20 08 604 1042 1704 38 37 44 71 68 9 13 19 09 477 824 1347 39 26 42 67 69 8 12 18 10 383 661 1081 40 24 40 64 70 8 12 18 11 317 548 896 41 23 38 60 71 8 И 17 12 267 462 754 42 22 36 57 72 8 11 16 13 228 392 640 43 21 34 55 73 7 11 16 14 196 337 550 44 20 33 52 74 7 10 15 15 171 295 481 45 19 31 49 75 7 10 15 16 151 259 422 46' 19 30 47 76 7 10 14 17, 133 228 373 47 18 29 45 77 7 9 14 18 119 204 332 48 17 27 43 78 7 9 13 19 107 183 297 49 16 26 41 79 6 9 13 20 97 165 270 50 16 25 39 80 6 9 12 21 87 149 242 51 15 24 37 81 . 6 8 12 22 80 136 211 52 15 23 36 82 6 8 11 23 73 124 202 53 14 22 34 83 6 8 11 24 68 114 185 54 14 21 33 84 6 7 10 25 62 105 170 55 13 20 32 85 5 7 10 26 57 97 157 56 13 20 30 86 5 7 10 27 53 90 145 57 12 19 29 87 5 7 9 28 49 83 135 58 12 18 28 88 5 7 9 29 46 78 125 59 11 18 27 89 5 6 8 30 43 73 117 60 11 17 26 90 5 . 6 8 23 Н. А. Плохинокий 353
354 [Таблица XIII Углы =fB радианах=2'~— arcsin 7Лр =0, 0349066 arcsin у/~р Последние цифры значений «фи» Р 0 1 2 3 4 5 6 7 8 9 Р% 0,0000 0,0000 0,0063 0,0089 0,0110 0,0126 0,0142 0,0155 0,0167 0,0179 0,0190 0,00 0,0001 0,0200 0,0210 0,0220 0,0288 0,0236 0,0245 0,0253 0,0261 0,0269 0,0276 0,01 0,0002 0,0283 0,0290 0,0297 0,0303 0,0310 0,0317 0,0323 0,0329 0,0335 0,0341 0,02 0,0003 0,0346 0,0352 0,0358 0,0363 0,0369 0,0374 0,0379 0,0385 0, 0390 0,0394 0,03. 0,0004 0, 0400 0,0405 0,0410 0,0415 0,0420 0,0425 0,0429 0,0434 0, 0438 0,0443 0,04 0,0005 0,0448 0,0452 . 0,0456 0,0460 0,0465 0,0469 0,0473 0,0478 0,0482 0,0486 0,05 0,0006 0,0490 0,0494 0,0498 0,0502 0,0506 0,0510 0,0514 0,0518 0,0522 0,0525 0,0® 0,0007 0,0529 0,0533 0,0537 0,0540 0,0543 0,0547 0,0551 0,0555 0,0559 0,0562 0,07 0,0008 0, 0566 0,0569 0,0573 0,0576 0,0580 0,0583 0,0587 0,0590 0,0593 0,0597 0,08 0,0009 0, 0600 0,0604 0,0607 0,0610 0,0613 0,0616 0,0620 0,0623 0,0626 0, 0629 0,09) 0,001 0,0632 0,0664 0,0693 0,0721 0,0748 0,0775 0,0800 0,0824 0,0849 0,0872 0,1 0,002 0,0895 0,0917 0,0939 0,0959 0,0979 0,1000 0,1020 0,1039 0,1059 0,1078 0,2: 0,003 0,1096 0,1114 0,1132 0,1149 0,1167 0,1184 0,1200 0,1218 0,1234 0,1250 0,3; 0,004 0, 1266 0,1282 0,1297 0,1312 0,1328 0,1343 0,1358 0,1373 0,1387 0,1401 0,4 0,005 0,1415 0,1429 0,1443 0,1457 0,1471 0,1485 0,1498 0,1511 0, 1525 0, 1538 0,5. 0,006 0,1551 0,1563 0,1576 0,1589 0, 1602 0,1614 0,1626 0,1639 0,1651 0,1664 о,б; 0,007 0,1676 0,1687 0,1699 0,1711 0,1723 0,1734 0,1746 0,1757 0,1769 0,1780 0,7/ 0,008 0,1791 0,1803 0,1814 0,1825 0,1836 0,1847 0,1857 •0,1868 0, 1879 0, 1890 0,81 0,009 0,1900 0,1911 0,1921 0, 1932 0,1942 0,1953 0,1963 0,1973 0, 1983 0,1993 0,9) 0,01 0,2003 0,2102 0,2195 0,2285 0,2372 0,2456 0,2537 0,2615 0,2691 0,2765 1',. 0,02 0,2838 0,2909 0,2978 0,3045 0,3111 0,3176 0,3239 0,3301 0,3363 0,3423 2,- 0,03 0,3482 0,3540 0,3597 0, 3654 0,3709 0,3764 0,3818 0,3871 0, 3924 0,3976 3,. 0,04 0,4027 0,4078 0,4128 0,4178 0,4227 0,4275 0,4323 0,4371 0,4418 0,4464 4,. 0,05 0,4510 0,4556 0, 4601 0,4646 0,4690 0,4735 0,4778 0,4822 0,4865 0,4907 5,. 0,06 0,4949 0,4991 0,5033 0,5074 0,5115 9,5156 0,5196 0,5237 0,5276 0,5316 6,. 0,07 0,5355 0,5394 0, 5433 0,5472 0,5510 0,5548 0,5586 0,5624 0,5661 0,5698 7,. 0,08 - 0,5735 0,5772 0,5808 0,5845 0,5881 0,5917 0,5953 0, 5988 0,6024 0,6059 8, 0,09 0,6094 0,6129 0,6163 0,6198 0,6232 0, 6267 0,6301 0,6334 0,6368 0,6402 9, 0,10 0,6435 0,6468 0,6501 0,6534 0,6567 0,6600 0,6632 0,6665 0,6697 0,6729 Ю, 0,11 0, 6761 0,6793 0,6825 0,6857 0,6888 0,6920 0,6951 0,6982 0,7013 0,7044 И, 0,12 0,7075 0,7107 0,7136 0,7167 0,7197 0,7227 0,7258 0,7288 0,7318 0,7348 12, 0,13 0,7377 0,7407 0,7437 0,7466 0,7495 0,7525 0,7554 0,7583 0,7612 0,7641 13, ьо ^03- # Продолжение табл. XIII Последние цифры значений «фи » р 0 1 2 3 4 5 6 7 8 9 | р% i - 0,14 0,7670 0,7699 0,7727 0,7756 0,7785 0,7813 0,7841 0,7800 0,7898 0 7926 14 0,15 0,/954 0,7982 0,8010 0,8038 0,8065 0,8093 0,8121 -0,8148 0,8176 О*8203 15 0,16 0,8230 0, 8258 0,8285 0,8312 0,8339 0,8366 0,8393 - 0,8420 0 8446 о"8473 1б’ 0,17 0,8500 - 0, 8526 0, 8553 0,8579 0,8606 0,8632 0,8658 0, 8685 0,8711 о’8737 17 0,18 0,8763 0, 8789 0,8815 0,8841 0,8867 0,8892 0,8918 0,8944 0 8970 0* 8995 18* 0,19 0,9021 0,9046 0,9071 0, 9097 0,9122 0,9147 0,9173 0,9198 0 9223 О"9248 19 0,20 0,9273 0,9298 0,9323 0,9348 0,9373 0,9397 0, 9422 0,9447 0 9472 0 9496 20 0,21 0,9521 0,9545 0,9570 0,9594 0,9619 0,9643 0,9667 0,9692 0,9716 0 9740 21’ 0,22 0,9764 0,9788 0,9813 0,9836 0,9860 0,9884 0,9908 0,9932 О; 9956 0 9980 221 0,23 1,0004 1,0027 1,0051 1,0075 1,0098 1,0122 1,0146 1,0169 1,0193 10216 23 ’ 0,24 1,0240 1,0262 1,0286 1,0310 1,0333 1,0356 1,0379 1,0403 1 0426 1 0449 24* 0,25 1,0472 1,0495 1,0518 1,0541 1,0564 1,0587 1,0610 1,0633 1 0656 1’0679 25 0,26 1,0701 1,0724 1,0747 1,0770 1,0793 1,0815 1,0838 1,0860 1 0883 1 0906 26 ’ 0,27 1,0928 1,0951 1,0973 1,0996 1,1018 1,1040 1,1063 1,1085 1,1107 1 изо 27 0,28 1,1152 1,1174 1,1197 1,1219 1,1241 1,1263 1,1285 1,1307 1,1329 1’1352 2я’ 0,29 1,1374 1,1396 1,1418 1,1440 1,1462 1,1483 1,1505 1,1527 1 1549 f 1571 29 0,30 1,1593 1, 1615 1,1636 1,1658 1,1680 1,1702 1,1723 1,1745 1 1767 1"1788 30* 0,31 1,1810 1,1832 1,1853 1,1875 1,1896 1,1918 1,1969 1,1961 1,1982 1'2004 31’ 0,32 1,2025 1,2045 1,2068 1,2090 1,2111 1,2132 1,2154 1,2175 1 2196 12218 32" 0,33 1,2239 1,2260 1,2281 1,2303 1,2324 1,2345 1,2366 1,2387 1,2408 I 2430 33 0,34 1,2451 1,2472 1,2493 1,2514 1,2535 1,2556 1,2577 1,2598 1,2619 12640 34* 0,35 1,2661 1,2682 1,2703 1,2724 1,2745 1,2766 1,2787 1,2808 1,2828 1 2849 35 0,36 1,2870 1,2891 1,2912 1,2933 1,2953 1,2974 1,2995 1,3016 1[ 3036 1’ 3057 36 0,37 1,3078 1,3098 1,3119 1,3140 1,3161 1,3181 1,3202 1,3222 1,3243 1’3264 37' 0,38 1,3284 1,3305 1,3326 1,3346 1,3367 1,3387 1,3408 1,3428 1 3449 1 3469 38" 0,39 1,3490 1,3510 1,3531 1,3551 1,3572 1,3592 1,3613 1,3633 1,3654 1*3674 39 ’ 0,40 1,3694 1,3715 1,3735 1,3756 1,3776 1,3796 1,3817 1,3837 1,3857 1’ 3877 40 ’ 0,41 1,3898 1,3918 1,3939 1,3959 1,3979 1,3980 1,4020 1,4040 1'4061 1'4080 41 0,42 1,4101 1,4121 1,4142 1,4162 1,4182 1,4202 1,4223 1,4243 1,4263 1 ’4283 42 0,43 1,4303 1,4324 1,4344 1,4364 1,4384 .. 1,4404 1,4424 1,4445 1 4485 43' 0,44 1,4505 1,-4525 1,4545 1,4566 1,4586 1,4606 1,4627 1,4646 1,4666 14686 44 0,45 1,4706 1/4726 1,4748 1,4767 1,4787 1,4807 1,4827 1,4847 1,4867 1 ’4887 45 0,46 ! 1,4907 1,4927 1,4947 1,4967 1,4987 1,5007 1,5027 1,5048 1 5068 1 5088 46 СО 0 47 1 сл о’ 1,5108 1,5128 1,5148 1,5168 1,5188 1,5208 1,5228 1,5248 1’, 5268 1 5288 47 сл 0,48 1 1,5308 [ 1,532b | 1,5348 1,5368 1,5388 1,5408 1,5428 1,5448 1,5468 1,5488 48,
Продолжение табл. XIII 356 Последние цифры значений «фи» и 0 1 2 3 4 5 6 7 8 9 Р% 0,49 1,5508 1,5528 1,5548 1,5568 1,5588 1,5608 1,5628 1,5648 1,5668 1,5688 49, 0,50 1,5708 1,5728 1,5748 1,5768 1,5788 1,5808 1,5828 1,5848 1,5868 1,5888 50, 0,51 0,5908 1,5928 1,5948 1,5968 1,5988 1,6008 1,6028 1,6048 1,6068 1,6088 51, 0,52 0,6108 1,6128 1,6148 1,6168 1,6188 1,6208 1,6228 1,6248 1,6268 1,6288 52, 0,53 0,6308 1,6328 1,6348 1,6368 1,6389 1,6409 1,6428 1,6449 1,6469 1,6489 53, 0,54 0,6509 1,6530 1,6549 1,6569 1,6589 1,6609 1,6629 1,6649 1,6669 1,6689 54, 0,55 0,6710 1,6730 1,6750 1,6770 1,6790 1,6810 1,6830 1,6850 1,6871 1,6891 55, 0,56 0,6911 1,6931 1,6951 1,6971 1,6992 1,7012 1,7032 1,7052 1,7076 1,7092 56, 0,57 0,7113 1,7133 1,7153 1,7173 1,7193 1,7214 1,7234 1,7254 1,7274 1,7295 57, 0,58 0,7315 1,7335 1,7355 1,7376 1,7396 1,7416 1,7437 1,7457 1,7477 1,7498 58, 0,59 1,7518 1,7538 1,7559 1,7579 1,7599 1,7620 1,7640 1,7660 1,7681 1,7701 59, 0,60 1,7722 1,7742 1,7762 1,7783 1,7803 1,7824 1,7844 1,7865 1,7885 1,7906 60, 0,61 1,7926 1,7947 1,7967 1,7988 1,8008 1,8029 1,8049 1,8070 1,8090 1,8111 61, 0,62 1,8132 1,8152 1,8172 1,8194 1,8214 1,8234 1,8255 1,8276 1,8297 1,8318 62, 0,63 1,8338 1,8359 1,8380 1,8400 1,8421 1,8442 1,8463 1,8484 1,8504 1,8525 63, 0,64 1,8546 1,8567 1,8588 1,8609 1,8629 1,8650 1,8671 1,8692 1,8713 1,8734 64, 0, 65 1,8755 1,8776 1,8797 1,8818 1,8839 1,8860 1,8881 1,8902 1,8923 1,8944 65, 0,66 1,8965 1,8986 1,9008 1,9029 1,9050 1,9071 1,9092 1,9113 1,9135 1,9156 66, 0,67 1,9177 1,9198 1,9220 1,9241 1,9262 1,9284 1,9305 1,9326 1,9348 1,9369 67, 0,68 1,9391 1,9412 1,9434 1,9455 1,9477 1,9498 1,9520 1,9541 1,9563 1,9584 68, 0,69 1,9606 1,9628 1,9650 1,9671 1,9693 1,9714 1,9736 1,9758 1,9780 1,9801 69, 0,70 1,9823 1,9845 1,9867 1,9889 1,9911 1,9933 1,9954 1,9976 1,9998 2,0020 70, 0,71 2,0042 2,0065 2,0087 2,0109 2,0131 2,0153 2,0175 2,0197 2,0220 2,0242 71, 0,72 2,0264 2,0286 2,0309 2,0331 2,0353 2,0376 2,0398 2,0421 2,0443 2,0465 72, 0,73 2,0488 . 2,0511 2,0533 2,0556 2,0578 2,0601 2,0624 2,0646 2,0669 2,0692 73, 0,74 2,0715 2,0373 2,0760 2,0783 2,0806 2,0829 2,0852 2,0875 2,0898 2,0921 74, 0,75 2,0944 2,0967 2,0990 2,1013 2,1037 2,1060 2,1083 2,1106 2, ИЗО 2,1153 75, 0,76 2, 1177 2, 1200 2, 1223 2,1247 2,1270 2, 1294 2,1388 2,1341 2,1365 2,1389 76, 0,77 2,1412 2,1436 2,1460 2,1484 2,1508 2, 1532 2,1556 2,1580 2,1604 2, 1628 77, 0,78 2,1652 2,1676 2,1700 2,1724 2,1749 2,1773 2,1797 2,1822 2,1846 2,1871 78, 0,79 2,1895 2,1920 2,1944 2,1969 2,1994 2,2019 2,2043 2,2068 2,2093 2,2118 79, 0,80 2,2143 2,2168 2,2193 2,2218 2,2243 2,2269 2,2294 2,2319 2,2345 2,2370 80, 0,81 2,2395 2,2421 2,2447 2,2472 2,2498 2,2524 2,2549 2,2575 2,2601 2,2627 81, 0,82 2,2653 2,2680 2,2705 2,2731 2,2759 2,2784 2,2810 2,2837 2,2863 2,2870 82, 0,83 2,2916 2,2943 2,2970 2,2996 2,3023 2,3050 2,3077 2,3104 2,3131 2,3158 83, Продолжение табл. XIII Последние цифры значений «фи» р ' 0 1 2 3 4 5 6 7 8 9 Р% 0,84 2,3186 2,3213 2,3240 2,3268 2,3295 2,3323 2,3351 2,3378 2,3406 2,3434 84, о; 85 2,3462 2,3490 2,3518 2,3546 2,3575 2,3603 2,3631 2,3660 2,3689 2,3717 85, 0,86 2,3746 2,3775 2,3804 2,3833 2,3862 2,3891 2,3921 2,3950 2,3979 2,4009 86, 0,87 2,4039 2,4068 2,4098 2,4128 2,4158 2,4189 2,4219 2,4249 2,4280 2,4310 87, 0,88 2,4341 2,4372 2,4403 2,4436 2,4465 2,4496 2,4528 2,4559 2,4591 2,4623 88, 0,89 2,4655 2,4687 2,4719 2,4751 2,4784 2,4816 2,4849 2,4882 2,4915 2,4948 89, 0,90 2,4981 2,5014 2,5048 2, 5082 2,5115 2,5150 2,5184 2,5218 2, 5253 2,5287 90, 0,91 2,5322 2,5357 2,5392 2,5428 2,5463 2,5500 2,5535 2,5571 2,5608 2,5644 91, 0,92 2, 5681 2,5718 2,5755 2,5792 2,5830 2,5868 2,5906 2,5944 2,5983 2,6022 92, 0,93 2,6061 2,6100 2,6140 2,6179 2,6220 2,6256 2,6301 2,6342 2,6383 2,6425 93, 0,94 2,6467 2,6509 2,6552 2,6594 2,6638 2,6681 2,6726 2,6770 2,6815 2,6856 94, 0,95 2,6906 2,6952 2,6998 2,7045 . 2,7093 2,7141 2,7189 2,7238 2,7288 2,7338 95, 0,96 2,7389 2,7440 2,7492 2,7545 2,7598 2,7652 2,7707 2,7763 2,7819 2,7876 96, о; 97 2'7934 2,7993 2,8054 2,8115 2,8177 2,8240 2,8305 2,8371 2,8439 2,8507 97, 0,98 2,8578 2,8650 2,8725 2,8801 2,8879 2,8960 2,9044 2,9131 2,9221 2,9314 98, 0,99 2,94126 2,94229 2,94332 2,94444 2,94538 2,94642 2,94745 2,94848 2,949521 2,95054 99,0 0,991 2,95157 2,95266 2,95375 2,95484 2,95593 2,95702 2,95811 2,95920 2,96029 2,96138 99,1 0,992 2,96247 2,96363 2,96479 2,96595 2,96711 2,96827 2,96942 2,97058 2,97174 2,97290 99,2 0,993 2,97406 2,97531 2,97655 2,97780 2,97904 2,98023 2,98154 2,98278 2,98403 2,98507 99,3 0,994 3,98652 2,98787 2,98923 2,99058 2,99193 2,99329 2,99464 2,99599 2,99734 2,99870 99,4 о' 995 3,00005 3,00155 3/10304 3,00458 3,00604 3,00754 3,00903 3,01053 3,01203 3,01352 99,5 0,996 3,01502 3,01.672 3,01842 3,02011 3,02181 3,02351 3,02521 3,02691 3,02860 3,03030 99,6 0,997 3,03200 3,03401 3,03602 3,03804 3,04005 3, 04206 3,04407 3,04608 3,04810 3,05011 99,7 0,998 3,05212 3,05474 3,05736 3,05999 3,06261 3,06523 3,06785 3,07047 3,07310 3,07522 99,8 0, 9990 3,07834 3,07897 3,07961 3,08024 3,08087 3,08151 3,08214 3,08277 3,08340 3,08404 99,90 0,9991 3, 08467 З'08530 3,08593 3,08657 3,08720 3,08783 3,08846 3,08909 3,08973 3,09036 99,91 0, 9992 3,09099 3,09162 3,09226 3,09289 3,09352 3,09416 3,09479 3,09542 3,09605 3,09669 99,92 О', 9993 3, 09732 3,09795 3,09858 3,09922 3, 09985 3,10048 3,10111 3,10174 3,10238 3,10301 99,93 0,9994 3, 10364 3,10427 3,10491 3,10554 3,10617 3, 10681 3,10744 3,10807 3,10870 3,10934 99,94 0, 9995 3,10997 3, 11060 3,'11123 3,11187 3,11250 3,11313 3,11376 3,11439 3,11503 3, 11566 99,95 0,9996 3, 11629 3, 11692 3,11756 3,11819 3,11882 3,11946 3,12009 3,12072 3,12135 3,12199 99,96 0,9997 3,12262 3,12325 3,12388 3,12452 3,12515 3,12578 3,12641 3,12704 3,12768 3,12831 99,97 0,9998 3,12894 3,12957 3,13020 3,13084 3,13147 3,13210 3,13273 3,13336 3,13399 3, 13463 99,98 W 0,9999 Si} l.oooo 3,13526 3,14159 3,13589 3, 13653 3,13716 3,13779 3,13843 3,13906 3,13969 3, 14032 3,14096 99,99 100,00
Таблица XIV Числа Чебышева 5 6 7 8 9 10 —2 — 1 0 +1 +2 + 2 — 1 — 2 — 1 4- 2 — 1 + 2 0 — 2 4- 1 — 5 — 3 — 1 4- 1 4- 3 4- 5 + 5 — 1 — 4 — 4 — 1 4- 5 — 5 4- 7 + 4 — 4 — 7 4- 5 —3 —2 — 1 0 + 1 +2 +3 28 + 5 0 — 3 — 4 — 3 0 + 5 1 84 — 1 + 1 + 1 0 — 1 — 1 + 1 •6 — 7 — 5 — 3 — 1 + 1 + з + 5 + 7 + 7 + 1 — 3 — 5 — 5 — 3 + 1 + 7 I+++I11+ —4 —3 —2 —1 0 + 1 4-2 +3 +4 +28 + 7 — 8 — 17 —20 — 17 — 8 + 7 +28 — 14 + 7 + 13 + 9 0 — 9 — 13 — 7 + 14 +++++I|||| СО “'•J СЛ СО >— ь— QJ СЛ “-J СО + 6 + 2 — 1 — 3 — 4 — 4 — 3 — 1 + 2 + 6 — 42 + 14 + 35 + 31 + 12 — 12 — 31 — 35 • — 14 + 42 Ю | 14 10 70 | 84 | 180 168 | 168 | 264 60 | 2772 990 330 132 8580 11 . 12 13 14 15 16 —5 —4 —3 —2 — 1 0 + 1 4-2 +3 +4 +5 4-15 + 6 — 1 — 6 — 9 —10 — 9 — 6 — 1 + 6 4-15 1 —30 4- 6 4-22 4-23 4-14 0 —14 —23 —22 — 6 4-30 — 11 — 9 — 7 — 5 — 3 — 1 + 1 4- 3 + 5 + 7 4- 9 4-И 4-55 4-25 + 1 —17 —29 —35 —35 —29 — 17 4- 1 4-25 4-55 —33 4- 3 +21 +25 + 19 + 7 — 7 —19 —25 —21 — 3 +33 -6 —5 —4 —3 —2 —1 0 + 1 +2 +з- +4 +5 +6 +22 + 11 + 2 — 5 —10 — 13 -14 —13 —10 — 5 + 2 + И +22 — 11 0 + 6 + 8 + 7 + 4 0 — 4 — 7 — 8 — 6 0 + 11 —13 —11 — 9 — 7 — 5 — 3 — 1 + 1 + 3 + 5 + 7 + 9 +И + 13 +13 + 7 + 2 — 2 — 5 — 7 — 8 — 8 — 7 — 5 — 2 + 2 + 7 + 13 — 143 — 11 + 66 + 98 + 95 + 67 + 24 — 24 — 67 — 95 — 98 — 66 + И + 143 —7 —6 —5 —4 —3 —2 — 1 0 + 1 +2 +3 +4 +5 +6 +7 +91 +52 + 19 — 8 —29 —44 —53 —56 —53 —44 —29 — 8 + 19 +52 +91 —91 — 13 +35 +58 +61 +49 +27 0 —27 —49 —61 —58 —35 + 13 +91 — 15 — 13 — 11 — 9 — 7 — 5 — 3 — 1 + 1 + 3 + 5 + 7 + 9 +11 + 13 +15 +35 +21 + 9 — 1 — 9 — 15 —19 —21 —21 —19 —15 — 9 — 1 + 9 +21 4“ 35 —455 — 91 + 143 +267 +301 +265 + 179 + 63 — 63 —179 —265 —301 —267 —143 + 91 +455 НО | 858 | 4 290 572 12 012/ 5 148 182 1 2 022 1 572 910 | 728 | 97 240 280 -1 37 128 39 780 I 1 360 | 5 712 | Ю07 760 Продолжение табл. XIV 18 19 —8 +40 —28 — 17 +68 —68 —9 +51 —204 — 19 +57 —969 —7 +25 — 7 -15 +44 —2° —8 +34 — 68 —17 +39 —357 —6 +12 + 7 —13 +23 ' +13 —7 + 19 + 28 —15 +23 + 85 —5 + 1 + 15 —11 + 5 +33 —6 + 6 + 89 —13 + 9 +377 —4 — 8 + 18 — 9 —10 +42 —5 + 5 +'120 —11 — 3 +539 —3 —15 + 17 — 7 —22 +42 —4 —14 + 126 — 9 —13 +591 —2 —20 + 13 — 5 —31 +35 —3 —21 + 112 — 7 —21 +553' —1 —23 + 7 — 3 —37 +23 —2 —26 + 83 — 5 —27 +445' 0 —24 0 — 1 —40 + 8 — 1 —29 + 44 — 3 —31 +287’ + 1 —23 — 7 + 1 —40 — 8 0 —30 0 — 1 —33 + 99) +2 —20 —13 + з —37 —23 + 1 —29 — 44 + 1 —33 — 99 +3 —15 -17 + 5 —31 —35 +2 —26 — 83 + з —31 —287 +4 — 8. —18 4- 7 . —22 —42 +3 —21 -112 + 5 —27 —445 +5 + 1 — 15 + 9 —10 —42 +4 — 14 —126 + 7 —21 —553 +6 +12 — 7 + Н + 5 —33 +5 — 5 —120 + 9 —13 —591 +7 +25 + 7 + 13 +23 — 13 +6 + 6 — 89 +П — 3 —539 +8 +40 +28 + 15 +44 +20 +7 + 19 — 28 + 13 + 9 —377 + 17 +68 +68 +8 +34 + 68 + 15 +23 — 85 408 7 752 3 876 +9 +51 +204 + 17 +39 +357 1 938 23 256 23 256 570 13 566 213 180 +19 +57 +969 2 660 | 17 556 | 4 903 140
СП П родолженае табл. XIV 21 22 23 24 — 10 -4-190 —285 —21 +35 — 133 —11 +77 —77 —23 +253 — 1771 — 9 + 133 — 114 — 19 +25 — 57 — 10 +56 —35 —21 + 187 — 847 — 8 + 82 + 12 — 17 + 16 0 — 9 +37 ' — 3 — 19 + 127 — 133 — 7 + 37 + 98 —15 + 8 + 40 — 8 +20 +20 —17 + 73 + 391 — 6 — 2 + 149 — 13 + 1 + 65 — 7 + 5 +35 —15 + 25 + 745 — 5 — 35 + 170 —11 — 5 + 77 — 6 — 8 +43 —13 — 17 + 949 . — 4 — 62 + 166 — 9 —10 + 78 — 5 — 19 +45 — 11 — 53 + 1023 — 3 — 83 + 142 — 7 —14 + 70 — 4 —28 +42 — 9 — 83 + 987 — 2 — 98 + 103 — 5 — 17 + 55 — 3 —35 +35 — 7 —107 + 861 — 1 —107 + 54 — 3 —19 + 35 — 2 —40 +25 — 5 — 125 + 665 0 —ПО 0 — 1 —20 + 12 — 1 —43 + 13 — 3 —137 + 419 + 1 —107 — 54 + 1 —20 — 12 0 —44 0 — 1 —143 + 143 + 2 — 98 —103 + з — 19 — .35 + 1 —43 — 13 + 1 — 143 — 143 + з — 83 —142 + 5 — 17 — 55 + 2 —40 —25 + з —137 — 419 + 4 — 62 — 166 + 7 — 14 — 70 + з —35 —35 + 5 — 125 — 665 + 5 — 35 —170 + 9 —10 — 78 + 4 —28 —42 + 7 —107 — 861 + 6 — 2 — 149 + Н — 5 — 77 + 5 — 19 —45 + 9 — 83 — 987 + 7 + 37 — 98 + 13 + 1 — 65 + 6 — 8 —43 + П — 53 — 1023 + 8 + 82 — 12 + 15 + 8 - 40 + 7 + 5 —35 + 13 — 17 — 949 + 9 + 133 + 114 + 17 . +16 0 + 8 +20 —20 + 15 + 25 — 745 + 10 + 190 +285 + 19 +25 + 57 + 9 +37 + 3 + 17 + 73 — 391 770 201 894 432 630 +21 +35 + 133 + 10 +56 +35 + 19 + 127 + 133 3 542 7 084 96 140 + И +77 +77 +21 + 187 + 847 1 012 35 420 .32 890 +23 +253 +1771 4 §00 394 580 17 760 600 Продолжение табл. XIV 25 26 27 28 —12 —11 — 10 — 9 — 8 — 7 — 6 — 5 — 4 — 3 — 2 — 1 0 + 1 + 2 -- 3 + 4 + 5 6 + 7 + 8 — 9 + 10 + 11 ^-12 +92 +69 +48 +29 + 12 — 3 —16 —27 —36 —43 —48 —51 —52 —51 —48 —43 —36 —27 —16 — 3 + 12 +29 +48 +69 +92 —506 —253 — 55 + 93 + 196 +259 +•287 +285 +258 +211 + 149 + 77 0 — 77 —149 —211 —258 —285 —287 —259 — 196 — 93 + 55 +253 +506 —25 —23 —21 — 19 — 17 —15 —13 —11 — 9 — 7 — 5 — 3 — 1 + 1 + 3 + 5 + 7 + 9 -11 +13 + 15 + 17 + 19 +21 +23 +25 +50 +38 +27 + 17 + 8 0 — 7 —13 —18 —22 —25 —27 —28 —28 —27 —25 —22 — 18 — 13 — 7 0 + 8 + 17 +27 +38 +50 —1150 — 598 — 161 + 171 + 408 + 560 + 637 + 649 + 606 + 518 + 395 + 247 + 84 — 84 — 247 — 395 — 518 — 606 — 649 — 637 — 560 — 408 — 171 + 161 + 598 + 1150 —13 —12 —11 — 10 — 9 — 8 — 7 — 6 — 5 — 4 — 3 — 2 — 1 0 + 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + U + 12 +13 +325 +250 +181 + 118 + 61 + 10 — 35 - - 74 —107 — 134 — 155 —170 — 179 —182 —179 — 170 —155 — 134 —107 — 74 — 35 + 10 + 61 + 118 + 181 +250 +325 —130 — 70 — 22 + 15 + 42 . + 60 + 70 + 73 + 70 + 62 + 50 + 35 + 18 0 — 18 — 35 — 50 — 62 — 70 — 73 — 70 — 60 — 42 — 15 + 22 + 70 + 130 —27 —25 —23 —21 — 19 —17 — 15 —13 —11 — 9 — 7 — 5 — 3 — 1 + 1 + 3 + 5 + 7 + 9 + П + !3 + 15 + 17 + 19 +21 +23 +25 +27 + 117 + 91 + 67 + 45 + 25 + 7 — 9 — 23 — 35 — 45 — 53 — 59 — 63 — 65 — 65 — 63 — 59 — 53 — 45 — 35 — 23 — 9 + 7 + 25 + 45 + 67 + 91 + 117 —585 —325 — 115 + 49 + 171 +255 +305 +325 +319 +291 +245 + 185 + 115 + 39 — 39 —115 — 185 —245 —291 —319 —325 —305 —255 — 171 — 49 + 115 +325 +585 1 300 53 820 1 480 050 5 850 16 380 7 803 900 1638 712 530 101 790 7 308 95 004 2 103 660 361
Продолжёниё табл. XIV " “ЬН- И I I I I I I I I 1 II I I II I II +++-4+4-4- 10 912 | 185 504 | 5 379 616 362
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА ПО БИОМЕТРИИ Рок и цк ий П. Ф. Биологическая статистика. Ачинск, 1967. Урбах В. Ю. Биометрические методы. М., «Наука», 1964. Плохинский Н. А. Дисперсионный анализ. Новосибирск, 1960. Плохинский Н. А. Наследуемость. Новосибирск, 1964. Фишер Р. А. Статистические методы для исследователей. М., Госстатиздат, 1958. Снедекор Д. У. Статистические методы. М., Сельхозгиз, 1961. Бейли Н. Статистические методы в биологии. М., ИЛ., 1962. Ван дер Варден Б. Л. Математическая статистика М., ИЛ, 1960. Юл Д. Э., Кен дэл М. Д. Теория статистики. АГ, Госстатиздат, 1960. Шмальгаузен И. И. Кибернетические вопросы биологии; Новосибирск, 1968. «Теоретическая и математическая биология». М., «Мир», 1968.
СОДЕРЖАНИЕ Введение.............,............................•_ 3 Показатель силы влияния .................................. . . . , 65 Показатель достоверности влияния.........................................65 Ошибка репрезентативности показателя силы влияния....................66 Формы итоговой записи решения однофакторных дисперсионных комплексов 68 Двухфакторные комплексы ................................................ 68 Подбор факторов..........................................................69 Разделение факторов на градации . . . ...........................69 Подбор объектов исследования............................................ 70 Преобразование значений результативного признака . 71 Анализ двухфакторных комплексов.....................’....................73 Просмотр ряда частных средних .........................................73 Расчет подсобных величин.............................................. 75 Расчет дисперсий....................................... ... . 75 Определение силы влияний............................................. 78 Характеристика силы влияний............................................79 Определение достоверности влияний .................................... 81 Ошибки репрезентативности показателей силы влияния в двухфакторных комплексах . . . . . 82 Часть первая ОСНОВЫ БИОМЕТРИИ Средние величины ........................................................... 9' Средняя арифметическая................................................... 9- Разнообразие значений признака ............................................. 10 Среднее квадратическое отклонение (сигма) ............................... 10 Число степеней свободы....................................................11 Распределение признака .................................................... 12. Вариационный ряд....................................................... 13 Гистограмма . . 14 Вариационная кривая ..................................................... 14 Кумулята . 15 Нормальное распределение............................................... 16 Репрезентативность выборочных показателей....................................19 Генеральная совокупность ................................................ 19 Выборка.............................................................. : 19 Репрезентативность .................................................... 21 Ошибки репрезентативности и другие ошибки исследований....................22 Доверительные границы.................................,...................24 Общий порядок оценки генеральных параметров.............................25 Оценка средней арифметической . 28 Оценка средней разности.................................................291 Недостоверная и достоверная оценка средней разности .....................30- Оценка разности генеральных средних......................................31 Критерий достоверности разности ....................................... 33 Определение достоверности разности средних .............................. 34 Репрезентативность при изучении качественных признаков...................36- Оценка генеральной доли ................................................. 38 Достоверность разности долей............................................ 39 Корреляция...............................................................: 40 Коэффициент корреляции....................................................43 Ошибка коэффициента корреляции............................................46 Достоверность выборочного коэффициента корреляции.........................47 Доверительные границы коэффициента корреляции.............................49 Достоверность разности двух коэффициентов корреляции ...................49- Коэффициент прямолинейной регрессии...................................... 50 Уравнение прямолинейной регрессии........................................52’ Корреляционное отношение.........................'........................53 Свойства корреляционного отношения..................................... 57 Ошибка репрезентативности корреляционного отношения.....................58 Критерий криволинейности ................................................ 60 Полный корреляционный анализ.....................,........................61 Дисперсионный анализ.........................................................62 Однофакторные комплексы . ... .................................62 Расчет подсобных величин................................................63 Расчет дисперсий (сумм квадратов) . 64 Расчет варианс........................................................ 64 Часть вторая БИОМЕТРИЧЕСКИЕ МЕТОДЫ •Средние величины............................................................85 Общие свойства средних величин ..........................................85 Средняя арифметическая .................................................88 Математические свойства средней арифметической........................88 Применения средней арифметической.....................................90 Взвешенная средняя арифметическая................................... 91 Средняя геометрическая...................................................92 Средняя квадратическая...................................................95 Средняя гармоническая....................................................96 Мода.................................................................: 97 Медиана .................................................................97 ^Показатели разнообразия.....................................................98 Среднее квадратическое отклонение ....................................... 99 Коэффициент вариации.....................................................Ю0 Лимиты и размах ...................................................... Ю0 Приближенные значения М и а................................ . . . . Ю1 Нормированное отклонение..............................................Ю1 Проверка выпадов (артефактов)............................................Ю2 Средняя и сигма суммарной группы.........................................ЮЗ .Распределение ..............................................................Ю4 Распределение дат ..................................................... 104 Нормальное распределение............................................. 105 Первая функция нормированного отклонения.............................105 Достоверность различия распределений ................................106 Критерий %2 (хи квадрат).............................................106 Критерий % (лямбда) ............................................... 107 Асимметрия и эксцесс.................................................108 Вторая функция нормированного отклонения ........................... 112 Третья функция нормированного отклонения.............................116 Распределение групп..................................................... И8 Биномиальное распределение . ...........................................И9 Распределение Пуассона.................................................125 Распределение выборочных показателей................................. . 126 ^Репрезентативность выборочных показателей..................................128 Достоверность разности средних при коррелированных выборках .... 128 Оценка выборочной разности по критерию Фишера...........................130 Достоверность разности средних при малочисленных выборках .... 132 Факторы, определяющие достоверность разносги............................135 Ошибка репрезентативности выборочной средней при множественной характе- ристике объектов...................................................136 Множественные характеристики основных объектов исследования . . . . 137 Ошибка средней без учета первичных дат..................................137 Ошибка средней с учетом первичных дат...................................138 О числе основных и измеряемых объектов..................................141 364 365
Достоверность выборочных показателей при изучении качественных признаков 142 Метод ф (фи)........................................................143- Ошибка разности между выборочной и генеральной долями . . . 145 Анализ расщеплений..................................................149’ Оценка генетических гипотез о расщеплении без вычислений.............153 Показатели корреляционной связи......................................... 156> Частный коэффициент корреляции.........................................15& Тетрахорический показатель связи...................................... 159 Полихорический показатель связи .................. ' ................. 160 Корреляция рангов (непараметрическая корреляция)..................... 163 Область применения непараметрических показателей корреляционной связи 166' Дисперсионный анализ......................................................171 Основные понятия .....................................................172' Результативный признак..............................................172? Фактор..............................................................172’ Градации факторов ...................................................172 Градации комплекса .................................................173- Дисперсионный комплекс...............................................173 Статистические влияния...............................................173 Факториальное влияние . 174 Случайное влияние ................................................ 175 Общее влияние......................................................175 Разнообразие элементов дисперсионного комплекса ........175 Дисперсия..........................................................177 Разложение дисперсий . 182 Варианса..................................... . ...................182 Универсальное использование дисперсий ......................... . 183 Показатели силы влияний............................................183 Достоверность влияний..............................................191 Дисперсионный анализ количественных признаков..........................198 Дисперсионный анализ качественных признаков............................198 Неравномерные комплексы........................................- . 202 Сравнение частных средних в дисперсионном комплексе....................205 Сравнение одной градации с суммой других в дисперсионном комплексе . . 208 Сравнение частных долей в дисперсионном комплексе . . . . . . . 210 Непараметрический показатель силы влияния в однофакторном дисперсионном комплексе . 210 Регоессия . ; ..................................................... : 212 Составление эмпирического ряда регрессии...............................216 Общие способы выравнивания эмпирических рядов..........................217 Графический способ ..................................................217 Способ скользящей средней............................................220 Способ наименьших квадратов .. ..................................227 Прямолинейные функции вида у=а+Ьх................................ 228 Показательные функции вида у=ахЪ . 229 Параболические функции вида у = а+Ьх и у = а+Ьх+сх2 . . . 233 с Гиперболические функции вида у=а+Ьх+ —.............................235 Параболические функции с одним максимумом у—а+Ьх+сх2 .... 237 Множественные прямолинейные функции вида у=а+Ьх+сг .... 241 Частные способы выравнивания эмпирических рядов . . . . . . . 245 Способ Чебышева (выравнивание параболических функций) .... 245 Парабола первого порядка г/ = а+Р/ц.............................. 246 Парабола второго порядка if—а+ рщ+ург..............................248 Парабола третьего порядка г/=а+Рр1+ур2+6рз....................... 252 Асимптотические функции..............................................258 Асимптотический рост . . . ......................................258 Асимптотические потери веса .......................................265 Логистические функции ...............................................268 Периодические функции................................................273 Часть третья АЛГОРИТМЫ БИОМЕТРИЧЕСКИХ РАСЧЕТОВ Пояснения к алгоритмам ................................................. 281 Алгоритм 1. Вычисление Мир без составления вариационных рядов при отсутствии достаточной счетной техники .................................. 286 Алгоритм 2. Вычисление Мир при наличии достаточной счетной техники 287 366
АлгбрйтМ 3. Вычисление М й 5 по способу взвешенных дат .... 288 Алгоритм 4. Составление вариационного ряда....................... . 289 Алгоритм 5. Вычисление М и а по способу взвешенных вариаций . . . 290 Алгоритм 6. Вычисление М и а по способу произведений...........291 Алгоритм 7. Вычисление М и а по способу сумм...................292 Алгоритм 8. Выравнивание эмпирических вариационных кривых по нормаль- ному закону................................................................293 Алгоритм 9. Оценка различий между эмпирическим распределением и тео- ретическим. Критерий %2 (хиквадрат)...................................... 294- Алгоритм 10. Оценка различий любых распределений. Критерий Л (лямбда) 295 Алгоритм 11. Оценка разности выборочных средних.......................... 296. А л г ор и т м 12. Оценка разности выборочных долей........................297 Алгоритм 13. Оценка разности между выборочной и генеральной долями . 298. Алгоритм 14. Вычисление коэффициента корреляции для малочисленных групп.................................................................... 299' Алгоритм 15. Составление корреляционной решетки.......................... 300' Алгоритм 16. Вычисление коэффициента корреляции по способу сумм . . 301 Алгоритм 17. Вычисление коэффициента корреляции по способу произведений 302' Алгоритм 18. Полный корреляционный анализ..................................303 Алгоритм 19. Дисперсионный анализ однофакторных комплексов, для коли- чественных признаков, для малых групп.................................... 304- Алгоритм 20. Дисперсионный анализ однофакторных комплексов для коли- чественных признаков, для больших групп, при малозначных датах 305- Алгоритм 21. Дисперсионный анализ однофакторных комплексов для коли- чественных признаков, для больших групп, при многозначных датах 30& Алгоритм 22. Дисперсионный анализ однофакторных комплексов для каче- ственных признаков.........................................................307 Алгоритм 23. Дисперсионный анализ двухфакторных пропорциональных комплексов для количественных признаков, для малых групп . . 303 Алгоритм 24. Дисперсионный анализ двухфакторных пропорциональных комплексов, для количественных признаков, для больших групп . 310' Алгоритм 25. Дисперсионный анализ двухфакторных пропорциональных комплексов для качественных признаков . . '................312 Алгоритм 26. Дисперсионный анализ двухфакторных неравномерных комп- лексов для количественных признаков, для малых групп . . . 314 Алгоритм 27. Дисперсионный анализ двухфакторных неравномерных комп- лексов для качественных признаков..........................................316 Алгоритм 28. Дисперсионный анализ двухфакторных иерархических комплек- сов, равномерных, пропорциональных и неравномерных . . . 318 Алгоритм 29. Дисперсионный анализ двухфакторных неравномерных комп- лексов для количественных признаков, для больших групп . . 320 Алгоритм 30. Дисперсионный анализ однофакторных комплексов при множе- ственной характеристике основных объектов ................................ 321 Алгоритм 31. Сравнение двух рядов регрессии................................322 Алгоритм 32. Определение числа целых знаков в частном......................323 Часть четвертая МАТЕМАТИЧЕСКИЕ ТАБЛИЦЫ I. Квадраты чисел.....................................................326 II. Квадратные корни ..................................................329 III. Логарифмы чисел 332 IV. Антилогарифмы.......................................................336 V. Синусы и косинусы .................................................339 VI. Первая функция нормированного отклонения...........................341 VII. Вторая функция нормированного отклонения.............................342 VIII. Относительные частоты распределения редких событий (Пуассона) . . 343 IX. Стандартные значения преобразованного критерия Фишера .... 346 X. Стандартные значения критерия Стьюдента.......................... 352 XI. Стандартные значения критерия %2....................................352 XII. Количество пар значений, достаточное для достоверности выборочного ко- эффициента корреляции.....................................................353 XIII. Углы <р в радианах . 354 XIV. Числа Чебышева ................................................... 358
Плохинский Николай Александрович БИОМЕТРИЯ Издание 2-е Тематический план 1969 г. № 191 Редактор В. П. Чтецов Редактор издательства Э. В. Лисовалова Переплет художника С. Б. Генкина Технический редактор Г. И. Георгиева Корректоры С. С. Мазурская, И. С. Хлыстова Сдано в набор 27.VI 1969 г. Подписано к печати 2.II 1970 г. Л-107045 Формат 70Х 108'/i6 Бумага тип. № 3 Физ. печ. л. 23,0 Усл. печ. л. 32,2 Уч.-изд. л. 28,81 Изд. № 714 Зак. 377 Тираж 11 000 экз. Цена 1 р. Издательство Московского университета, Москва, Ленинские горы, Административный корпус. Типография Изд-ва МГУ. Москва, Ленинские горы
Замеченные опечатки Страница Строка Напечатано Следует читать 39 1 снизу Р2<?2 „2 Р2% — - > И-2—1 т2~ , ; Яа—1 51 2 снизу ±6,24 6,24 ±6,56 6,56 99 17 снизу С\=—2а-|-2а—За-|-32— 1а+ Ci=(-2)a+(+2)2+(-3)2+ 4-1а=28; ’ +(+3)2+(-1)2+(+1)2=28; 111 16 снизу С<>=—22-|-23— 12±1а-[-03=10; С2==(-2)2+(+2)а+(-1)а+ +(±1)2+02=10; 2 снизу / а X 4638,20 — ) = = 3,327 V 50 ) 419 +++__-./ 4638,20 „ + / у 419- 3'327 116 подрисуноч- а—<7=0,5—ф(х) a: q= 0,5—<р(х) ная подпись б—<7=О,5-|~ф(х) <5: <?:=0,5 1—ср(х) 130 табл. 41 Md=±l ,58±0,057 Md=+l,59±0,052 1,58 1,59 td= ~ =30,6 ^=—^—•=30,6 0.057 а 0,052 =+ 130 15 снизу +1,58 + 1,59 140 23 снизу табл. 44 табл. 46 166 9 снизу в примере 72 v=10—2=8; v= 10—2=8; ^={2,3—3,4— £s#={2,3—3,4—5,0}; —5,0}; 8 снизу n=8; rs=0,83>0,71. в примере 72 и=8; rs= =0,83>0,71. 169 16 сверху 66 ' 67 198 24 сверху показана в главе показана в первой части книги в главе 199 19 снизу F=5,5, +>0,999. F=5,2, +>0,999. 241 табл. 84 колонка 4 2 656 000 265 600 241 1 снизу 1300а-|-8Ю0с=625800 1300ffi_|-I76000c=625800 268 2 снизу (Л—с) (Л) 270 табл. 94 заголовок Логическое Логистическое 347 табл. IX \ V1 \ v2 шапка снизу > V1 \ 354, 355, табл. XIII значений «фи» . значений р 356, 357 в шапке Тип. МГУ 377—11 000