Text
                    MODERN APPLIED
MATHEMATICS
PROBABILITY—STATISTICS—OPERATIONAL-
RESEARCH
J. C. TURNER, M. Sc., F. S.FS.
Principal Lecturer in Mathematics
Leeds Polytechnic
The English Universities Press Ltd
1970

Д. ТЁРНЕР ВЕРОЯТНОСТЬ, СТАТИСТИКА И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ Перевод с английского Е. 3. Демиденко, В. С. Занадворова ПОД РЕДАКЦИЕЙ А. А. РЫВКИНА Москва «Статистика» 1976
Г. 17.8 135 БИБЛИОТЕЧКА ИНОСТРАННЫХ КНИГ ДЛЯ ЭКОНОМИСТОВ И СТАТИСТИКОВ Издательство «Статистика» выпускает на русском языке серию книг иностранных авторов по статистике, рассчитанных на круг читателей, нуждающихся в пополнении своих мате- матических и статистических знаний. Задача книг — озна- комить статистиков и экономистов не на очень сложном ма- териале с современными методами, которые за рубежом при- меняются в экономическом анализе и в различных хозяйст- венных расчетах. В серию включаются как книги по общим вопросам ста- тистики, так и книги, посвященные статистическому анализу в отдельных областях экономики. Издательство старается подбирать работы, не перегруженные сложными теоретиче- скими изысканиями, но такие, которые подводят к примене- нию теоретических достижений на практике. Уже вышли из печати книги: 1. М. Б р о у д и. О статистическом рассуждении. 2. А. Б е р н с т е й н. Справочник статистических ре- шений. 3. У. Дж. Р е~й х м а н. Применение статистики. 4. X. Крыньский. Математика для экономистов. 5. С. Д а й м е н д. Мир вероятностей. 6. А. X ь ю т с о н. Дисперсионный анализ. 7. С. Л и з е р. Эконометрические методы и задачи. 8. Эм. Борел ь, Р. Дельтейль, Р. Юрон. Вероятности, ошибки. 9. Статистические методы исследования корреляций в экономике. 10. Л. С т о л е р ю. Равновесие и экономический рост. 11. Я. О к у н ь. Факторный анализ. 12. С. С и р л, У. Г о с м а и. Матричная алгебра в экономике. 13. Е. Г р е н ь. Статистические игры и их применение Подготавливается к изданию: Э. К е й н. Экономическая статистика и эконометрия. Редколлеги я Л. С. Кучаев, П. П. Маслов, Л. Е. Минц, И. С. Пасхавер, Г. Г. Пирогов, 3. А. Сумник, Е. М. Четыркин, Р. М. Энтов т 10805<-155 117 76 008(01)-76 ’ Второй индекс 10803. © перевод на русский язык, «Статистика», 1976 4 АлквЯеОД { аамиввх’’ че^®а и.ч, . ,а зутц ПР ВШ> ..,1
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ Книга Д. Тёрнера задумана как руководство практически по все- му курсу математики. Первая часть книги посвящена изложению ряда понятий классической математики, она позволяет читателю овладеть навыками работы с аппаратом, развитым в теории множеств и матрич- ной алгебре. Исключительно важны для высококвалифицированного практика методы статистического анализа, базирующиеся на совре- менных достижениях теории вероятностей и математической статисти- ки. Эти методы содержатся в наиболее объемной второй части книги. И только последняя, третья ее часть относится непосредственно к за- дачам, имеющим сугубо прикладную направленность. Изложение материала иллюстрируется в книге большим числом удачно подобранных примеров, благодаря чему читатель постоянно ощущает стремление автора помочь ему в активном усвоении получен- ных знаний. Вместе с тем, познакомившись с первыми двумя частями книги, читатель вряд ли составит себе правильное представление о том классе задач, ради решения которых собран весь этот, по сути дела, подготовительный материал. Поскольку автор не снабдил свою книгу достаточно подробным вве- дением, объясняющим конечную цель всего курса, мы несколько опередим события и постараемся заглянуть вперед, чтобы выяснить на конкретных примерах содержание прикладного математического исследования. Мы увидим, как в реальной ситуации возникает целый комплекс математических задач. С многими из них читатель встретится при работе с книгой Д. Тёрнера, с некоторыми познакомится при чте- нии других книг или на практике. Объединяет эти задачи общность их возникновения — все они появились как задачи, в которых требует- ся принять наилучшее решение в той или иной реальной ситуации. Представьте себе производство листового проката. Нагретый в пе- чах металл поступает вначале на слябинг, где производятся прямо- угольные бруски—слябы. Эти бруски снова нагреваются в печах и про- катываются на листопрокатном стане до нужных размеров. Завод имеет определенный портфель заказов — месячную программу. Прокат различных марок требует разного времени обработки на слябинге и на листопрокатном стане. В одних случаях быстрее справляется со своей работой слябинг, в других—прокатный стан. Когда слябинг работает с опережением, то готовые слябы либо ожидают своей оче- 5
реди в печах, либо, если в печах уже нет свободного места, остывают и требуют впоследствии больших затрат времени на разогрев. Инженер, составляющим программу работы всей линии, стремится установить такую очередность, чтобы иа выполнение всего задания цепочкой агрегатов было затрачено минимальное время. Он учитывает и такое обстоятельство, как необходимость определенного расхода времени на переналадку при переключении линии с изготовления од- ного сорта проката иа другой. Для некоторых размеров листа время работы слябинга и прокат- ного стана либо сбалансировано, либо почти сбалансировано, т. е. разность производительностей агрегатов незначительна. Инженер бу- дет стремиться к производству такой продукции максимально больши- ми партиями без переналадок. Если же расхождения во времени за- грузки основных агрегатов становятся достаточно большими, то осу- ществление маневра, связанного с переналадкой, оказывается оправ- данным. В этом случае инженер попытается расставить заказы в оче- реди таким образом, чтобы чередовать продукцию, требующую боль- шей загрузки первого агрегата, с продукцией, более трудоемкой для второго. Нагревательные печи — промежуточный агрегат — должны выполнять в этом случае роль «склада» и иметь некоторый запас мощ- ностей. При более интенсивной работе слябинга запас полуфабрикатов будет накапливаться в печах. Этот запас должен обеспечить равно- мерную загрузку прокатного стана при переключении слябинга на производство следующей партии, более для него трудоемкой. Распределяя месячную программу по дням, инженер может обна- ружить, что загрузка прокатного стана оказывается более интенсив- ной, чем загрузка слябинга. Тогда он постарается включить в програм- му выполнение заказов на прокатку слябов для другого прокатного стана или же для создания страхового запаса на случай выхода сля- бинга из строя. При обратной ситуации страховой запас слябов будет постепенно расходоваться. Так возникает одна из типичных производ- ственных задач — задача составления расписания. Однако, работая в течение длительного времени, инженер, состав- ляющий расписание, может заметить, что слябинг систематически имеет запас производственных мощностей по сравнению с прокатным станом, а использовать этот ресурс полностью не удается. Тогда он может поставить вопрос о реконструкции производственной линии. Напри- мер, слябинг может быть модернизирован с тем, чтобы у него появилась возможность в случае необходимости брать на себя часть работы про- катного стана, уменьшая толщину выпускаемых слябов. Инженер может обратить внимание и на ограниченную мощность печей, которая не позволяет осуществить достаточный маневр при чередовании в рас- писании продукции различных размеров. С его стороны поступит пред- ложение о расширении этого узкого места за счет постройки дополни- тельной печи. Все эти предложения должны подвергнуться экономическому ана- лизу со стороны администрации завода. Во-первых, нужно выяснить, окупятся ли затраты, связанные с реконструкцией (в том числе нужно учесть и возможную остановку производства), эффектом, полученным 6
в результате ее осуществления. Во-вторых, сопоставить этот эффект с эффектом от других мероприятий в рамках завода, также требующих финансирования. В-третьпх, выяснить возможности финансирования извне, и если такие возможности имеются, то обратиться с соответ- ствующими предложениями. Так появляются задача «расшивки» узких мест и более общая задача составления плана развития всего предприятия. Вышестоящая организация, получив от предприятия соответствую- щую заявку, также постарается сопоставить возможный экономический эффект на этом предприятии с другими вариантами расходования имеющихся у нее ограниченных средств. Возможно, просьба предприя- тия о дополнительном финансировании не будет удовлетворена, од- нако проведенные предприятием расчеты позволят улучшить проекты вновь строящихся заводов по производству проката. Принимая свое решение, вышестоящая организация решает задачу размещения име- ющихся у нее ресурсов. Приняв решение о строительстве нового объекта или о реконструк- ции действующего, вышестоящая организация поставит тем самым се- рию задач перед исполнителями. Нужен будет четкий план последо- вательного проведения необходимых для этого работ. Все работы долж- ны быть обеспечены рабочей силой, механизмами, материалами. Для проведения последующих работ должны быть выполнены все подгото- вительные операции, закончены все связанные с ними предшествующие работы и т. д. Составление проекта, предусматривающего все взаимо- связи между отдельными работами, распределение имеющихся мате- риальных ресурсов, а также ресурса времени, и есть задача сетевого планирования. В гл. 3.4 книги Д Тёрнера изложены основные понятия теории решения таких задач. Усвоив их, читатель сможет уверенно работать с более подробными книгами. Вернемся к нашему предприятию. Оно имеет отдел, занимающий- ся реализацией готовой продукции. В распоряжении этого отдела на- ходится склад. Хранение продукции на складе также требует расходов, и поэтому отдел реализации будет побуждать производственников изготавливать продукцию как можно ближе к сроку, установленному заказчиком. Но мы уже видели, что для производственников могут оказаться выгодными более крупные партии. Между двумя отделами возникает противоречие, и каждый старается разрешить его в свою пользу. Именно такого рода противоречия и- ведут к появлению мате- матических задач. Администрация должна выступить здесь в роли ком- петентного арбитра и разрешить это противоречие с максимальной выгодой для всего предприятия в целом. Так возникают задача опре- деления оптимального размера партии и задача управления запасами. Конечно, гл. 3.5 книги охватывает лишь несколько простейших ва- риантов постановки подобных задач. Однако все существенные эле- менты такой постановки проиллюстрированы, и читатель, вероятно, легко сможет сам сформулировать аналогичную задачу управления запасами полуфабрикатов, сырья и т. п. Можно говорить также о запасе производственной мощности того или иного агрегата. В цепочке сля- бинг — печи — прокатный стан нагревательные печи являются наибо- 7
лее дешевым агрегатом. Поэтому их пропускная способность должна быть несколько выше пропускной способности прокатного стана. Но возникает вопрос—насколько выше? Чтобы ответить на него, при- дется сопоставить расходы, связанные с дополнительными капитало- вложениями и дополнительными издержками топлива, с возможно- стями, открывающимися как при маневрировании находящимся в пе- чах запасом горячих полуфабрикатов, так и при использовании холод- ного запаса, имеющегося на складе. В первом случае запас обеспечивает выигрыш во времени в результате выбора разумного расписания, ко- гда партии, требующие большей загрузки слябинга, чередуются с пар- тиями, для которых необходима более интенсивная работа прокатного стана. Во втором случае запас холодных полуфабрикатов на складе позволяет компенсировать сбои в работе слябинга, который время от времени может выходить из строя. Если есть возможность реализо- вать избыток полуфабрикатов, то возникает вопрос, какой их запас имеет смысл хранить. Вероятно, предполагается, что при выходе из строя прокатного стана избыток продукции со слябинга поступает на склад. Если же простаивает слябинг, то холодные слябы со склада (они требуют большего времени на их нагревание) загружаются в печи. Чтобы определить оправданную величину страхового запаса на складе, нужно измерить частоту и продолжительность простоев сля- бинга. С этой целью в течение достаточно длительного промежутка времени придется наблюдать за его работой. Допустим, собранные измерения позволяют сказать, что в среднем остановка слябинга на 10— 20 мин происходит 2 — 3 раза в сутки, остановка на 20 — 40 мин — 1 раз в двое суток, а более чем на 40 мин — 1 раз в неделю. Если ре- жим работы слябинга останется таким же и впередь, то собранные дан- ные дадут возможность рассчитать уровень запаса на складе холодных полуфабр и катов. Но какова степень нашей уверенности в том, что в будущем не произойдет что-либо непредвиденное, совсем не похожее на то, что мы наблюдали при регистрации работы слябинга? Здесь на помощь приходит теория вероятностей. Применить ее мы сможем лишь в том случае, если наблюдавшийся отрезок работы принципиально не отли- чался от последующих—расположен достаточно близко по времени, агрегат после наблюдений не подвергался реконструкции и не имел серьезных повреждений, загрузка его была примерно равномерной и т. п. Приняв такого рода гипотезы, мы можем оценить степень уве- ренности в наступлении того или иного события в будущем, основы- ваясь на сделанных наблюдениях. Например, можно указать такое число, что продолжительность наибольшего ожидаемого простоя сля- бинга в течение недели имеет 95 шансов из 100 не превысить этого чис- ла, но имеет 5 шансов оказаться большей. Ясно, что такое число — хороший ориентир именно в силу разбиения всех шансов на две группы, это не верхняя оценка, а наиболее удачная из возможных точных оце- нок. Конечно, можно задать вопрос о степени нашей уверенности и в этой оценке. Математическая статистика, основанная на понятиях те- ории вероятностей, позволяет ответить и на этот вопрос.. 8
Чтобы овладеть, пусть даже в самом небольшом объеме, аппаратом теории вероятностей, чтобы научиться формулировать на математиче- ском языке практические задачи, нужны навыки и в некоторых областях математики, не являющихся прикладными. Чтобы перевести задачу с обычного языка на математический, нужно этот математический язык знать. Автор предлагаемой книги не ставил перед собой цели научить своего читателя многому и дать ему глубокую систему знаний по всем затронутым в книге вопросам. Цель была иной —* ввести чита- теля в круг идей и понятий современной прикладной математики, помочь ему приобрести необходимые навыки в использовании мате- матического аппарата, дать тот минимум сведений, который позволяет продолжать самостоятельное изучение тех теорий, начала которых содержатся в книге. Автор акцентирует внимание на тех моментах, которые очень полезны на практике. Сложные теоремы формулируются в несколько упрощенном виде с тем, чтобы подчеркнуть главные со- держательные моменты и опустить дополнительные предположения, важные для доказательства, но мешающие создать интуитивную кар- тину того факта, о котором идет речь. Трудные доказательства либо не приводятся, либо намечены в самых общих фразах. Все это делает книгу полезной и доступной не только для студен- тов экономических вузов, но и для тех, кто получил образование в прошлом, долгие годы был далек от применения в своей работе ма- тематических методов и теперь ощутил потребность в овладении фор- мальными и численными приемами решения практических задач. Книга печатается с незначительными сокращениями. А. А. РЫВКИН
ПРЕДИСЛОВИЕ В последние десятилетия появилось много новых методов, приме- няемых в научных и прикладных исследованиях, ври разработке про- ектов в промышленности, для изучения деятельности коммерческих систем и управления ими. Базируясь на математических идеях, эти методы в большинстве своем предусматривают использование вычис- лительных машин. Их развитие привело к значительному росту ак- тивности в некоторых областях прикладной математики, в первую оче- редь это относится к статистике, и даже к появлению нескольких со- вершенно новых разделов, например, теории очередей, теории восста- новления, теории надежности и математического программирования. Каждое из направлений стало объектом серьезного математического изучения, выявило свою специфику и оказалось достаточно плодот- ворным. Эти новые и энергично растущие области удачно объединяет термин «современная прикладная математика». Развитие и усложнение промышленных, экономических и социаль- ных организаций приводит к необходимости знать и использовать воз- можности новых методов при управлении деятельностью этих орга- низаций. Сегодня начинающий менеджер не может считаться образо- ванным до тех пор, пока он не имеет достаточного представления о при- менении этих методов. Признавая это, колледжи.и университеты из- меняют учебные программы и все чаще предлагают темы дипломов и специальных курсов по новым разделам. Эта книга представляет собой введение в курс современной при- кладной математики, содержащее необходимые сведения о множествах, матрицах, сведения из теории вероятностей и математической стати- стики и начала нескольких разделов исследования операций. Уровень математической подготовки, требуемый от читателя этой книги, не высок, и можно утверждать, что ее содержание в основном будет доступно выпускникам средней школы. Каждая тема излагается с азов и подкрепляется многими несложными упражнениями с тем, чтобы помочь студенту быстро усвоить новые идеи и терминологию. Автор считает, что большинство книг, адресованных первокурсникам университетов и колледжей, не включает достаточного числа легких вопросов, непосредственно связанных с содержанием; они не предусмат- ривают элементарных упражнений, так необходимых каждому начи- нающему изучать новый предмет. Простые вопросы, собранные в книге', помогут студенту приобрести необходимую уверенность и побудят его при чтении постоянно обращаться к карандашу и бумаге. 10
В конце второй части приведено много вопросов, предлагавшихся первокурсникам на экзаменах по теории вероятностей и статистике. Студенты (а возможно, и лекторы) смогут успешно пользоваться ими на завершающей стадии курса. Эти вопросы использовались в экза- менационной практике университетов Шеффилда, Бирмингема, Лан- кастера, Лидса и Лондона, и автор благодарен советам этих универси- тетов за разрешение их воспроизвести. Книга разделена на три части. В первой из них приводятся сведения общего характера, необхо- димые для изложения последующего материала. Подробнее об этом сказано во вводных замечаниях к первой части. Вторая часть содержит основы курса теории вероятностей и мате- матической статистики. Идеи теории вероятностей развиты на базе по- нятия случайного эксперимента с использованием при этом теоретике множественного подхода. По мнению автора, это лучший способ ввести читателя в сущность предмета. Понятия и законы теории вероятностей служат основой математической статистики и широко применяются в исследовании операций. Они слишком важны, чтобы можно было ограничиться лишь поверхностным изложением,, как это принято в большинстве книг по элементарной статистике. В третьей части анализируются важные приложения теории ве- роятностей и рассматриваются модели очередей, основывающиеся на матричной трактовке конечных цепей Маркова. Дано также введение в разделы линейного программирования, сетевого планирования и уп- равления запасами. В конце многих глав приведены рекомендации по дальнейшему чтению, а общая библиография дана в конце книги. Д ТЁРНЕР
ЧАСТЬ НЕКОТОРЫЕ ПОНЯТИЯ ПЕРВАЯ СОВРЕМЕННОЙ МАТЕМАТИКИ ВВОДНЫЕ ЗАМЕЧАНИЯ Когда студенты начинают знакомиться с современной прикладной математикой, они сразу же сталкиваются с многими новыми понятиями, необходимыми для описания изучаемых ими ситуаций. Эти понятия, а также термины и величины, используемые при их определении, должны быть усвоены прежде, чем станет доступен для понимания весь процесс логического построения новой области исследований. К своему огорчению, студенты постоянно сталкиваются с тем, что используемые при таком построении математические идеи и опе- рации оказываются для них совершенно непривычными. В результа- те начальный период изучения становится трудным вдвойне. Средние школы мало-помалу изменяют математические программы, включая в них начала современной математики, и в дальнейшем это принесет известное облегчение, однако сейчас большинство студентов встреча- ются с ними впервые в университете или политехническом институте, поэтому все лекторы должны хорошо помнить, что теория множеств, к примеру, не может быть изучена за день. Пять глав первой части задуманы как введение (или же уточнение и закрепление того, что изучалось по новым программам в средней школе) к тем областям современной математики, которые особенно важ- ны при последующем изложении прикладной математики. В гл. 1.1 объяснены основные идеи и законы теории множеств, а предлагаемые упражнения помогут студенту овладеть символикой и правилами действий над множествами. В гл. 1.2 кратко рассказывается о свойствах оператора суммиро- вания. Этот математический символ используется при суммировании чисел, соответствующих элементам заданного множества. Он часто встречается в математической статистике, и по этой единственной причине следует внимательно изучить главу, проработав все примеры и упражнения. Едва ли лектор, читающий курс, найдет время для подробного обсуждения смысла и свойств этого оператора. К сожале- нию, он не имеет такой возможности, и это вполне оправданно — сту- дент должен самостоятельно овладеть необходимыми навыками. За те небольшие усилия, которые при этом потребуется приложить, он будет вознагражден с лихвой. В гл. 1.3 рассматриваются разделы теории матриц, связанны^ с их обращением и решением систем линейных уравнений. Матрицы используются затем в третьей части книги при изложении основ теории марковских цепей. 12
Гл. 1.4 посвящена неравенствам. Системы линейных неравенств, которым посвящен параграф 1.4.8, предназначены как введение к главе о линейном программировании, помещенной в третьей части. В гл. 1.5 дано введение к весьма привлекательному предмету, известному как теория графов. Большинство понятий этой теории лег- ки для усвоения, имеют многочисленные обобщения и приложения. Многие сложные системы, изучаемые специалистами по исследованию операций, описываются в виде сетей некоторого типа, и теория графов обеспечивает естественную топологию при изучении их основных структур. Автору кажется, что курс теории графов должен предшест- вовать (или даваться параллельно) всем курсам исследования опера- ций. Его важность в операционных исследованиях все возрастает.
1.1 ГЛАВА ТЕОРИЯ МНОЖЕСТВ А. ОСНОВНЫЕ ИДЕИ И ОПРЕДЕЛЕНИЯ 1.1.1. ОПИСАНИЕ МНОЖЕСТВА В математике понятие множества фундаментально, и элементар- ное знание теории множеств необходимо для понимания многих областей современной математики. Обычное употребление слова «множество» в словосочетаниях типа «множество стрелок» или «множество книг» слишком узко по срав- нению с математическим понятием множества. Множество есть простая совокупность различных объектов любого типа. Чтобы задать множе- ство, достаточно каким-либо образом описать или определить его эле- менты. Отдельный элемент часто называют членом или точкой мно- жества. Приведем несколько примеров множеств. Примеры (1) Буквы алфавита: а, Ь, с, г. (2) Первые пять нечетных чисел: 1, 3, 5, 7, 9. * (3) Люди, чей рост выше двух метров. Множество можно описать одним из следующих двух способов: 1) В виде списка или таблицы, все элементы множества непосред- . ственно перечисляются (см. примеры (1), (2)). 2) Указанием способа конструирования множества', задается опре- деленное правило, обычно выражаемое словами, математическими уравнениями, неравенствами, в соответствии с которым осуществляет- ся выбор элементов, образующих множество. Элементом множества из примера (3) будет любой человек, чей рост выше двух метров. Ясно, что рассмотрение такого множества небессмысленно, хотя практически невозможно одновременно измерить всех людей на земле и зарегистрировать каждого столь высокого человека. 1.1.2. ОБОЗНАЧЕНИЯ МНОЖЕСТВА Для обозначения множеств обычно используют прописные буквы А, В, X, Y и т. д., а элементы соответствующего множества заключают ., в фигурные скобки. 14
Примеры* (1) Запись А = {1, 2, 7, 8} означает, что множество А состоит из четырех элементов 1, 2, 7, 8. (2) Запись X = {х : х является человеком выше двух метров} означает, что множество X состоит из элементов х, таких, что х обо- значает человека, чей рост больше двух метров. Символ «:», исполь- зующийся в этом примере, заменяет слова «таких, что». (3) Запись Y = {у ' у означает, что Y — множество всех чисел, больших чем три. а) Принадлежность элемента множеству. Символ £ используется для обозначения принадлежности элемента множеству. Например, в множестве Y из примера (3) число 8 является элементом этого мно- жества, что кратко записывают 8 f У и читают: «число 8 принадлежит множеству У». Аналогично: 19 6 У, ЮЗ Е У ит. д. Отрицание принад- лежности к множеству обозначается символом (£. Так, выражение 2 (£ Y означает, что 2 не является элементом множества Y, и читается: «число 2 не принадлежит множеству У». Замечание. Важно четко различать элемент и содержащее его множество. В частности, ошибка может произойти, когда множество состоит лишь из одного элемента. Например, если множество А содержит только один элемент, А — {а}, нужно уяснить, что а£А, но {о} А. 1.1.3. КОНЕЧНЫЕ И БЕСКОНЕЧНЫЕ МНОЖЕСТВА Говорят, что множество конечно (имеет конечное число элементов), если его элементы могут быть пересчитаны (по крайней мере теорети- чески) и пересчитывание оканчивается определенным целым п. В противном случае множество имеет бесконечное число элементов и говорят, что оно бесконечно (см. примечание к слову «счетность» на с. 87). Примеры (1) F = {а, Ь, с, d}, F — конечное множество, имеющее четыре эле- мента. (2) Р = {х : х является книгой в Британском музее}. Хотя в Бри- танском музее много книг, без сомнения, Р является конечным мно- жеством. (3) R = {х : х есть натуральное число } = {1, 2, 3, ...}; R—бес- конечное множество. Упражнение 1.1.1 1. Укажите способ конструирования множества {а, е, i, о, и}. 2. Запишите в табличной форме множества (х : х является множителем числа 6}. 3. Если А = {3, 5, 8, 9}, то выразите символами: * Множество А из примера (1) записано в табличной форме; для множеств X и У из следующих двух примеров указан способ их конструирования. — Примеч. ред. 15
(a) 8 принадлежит множеству А; (б) 4 не принадлежит множеству А. 4. Установите, какие из следующих множеств конечны, а какие бесконечны: (а) А = {х, у, р, q, 5, 7}; (б) {х : х является песчинкой в Европе}; (в) С = {х : х кратно 3}; (г) D = {х : х является числом между 0 и 1}. 1.1.4. ПОДМНОЖЕСТВА: ОТНОШЕНИЕ ВКЛЮЧЕНИЯ Подмножество множества А есть множество, содержащее некото- рые (а возможно, и все) элементы множества А. Само множество А будет своим подмножеством. Чтобы выразить тот факт, что В — под- множество А, пользуются обозначением В сг А, которое называют отношением включения1. Его следует читать: «В содержится в А». Заметим, что если х — элемент множества В, а множество В со- держится в множестве А, то, очевидно, что х будет элементом множест- ва Л. В сокращенной записи это утверждение записывается так: «если В сА и х Е В, то х Е А». Примеры (1) Множество В = {а, е, i, о, и} есть подмножество множества букв латинского алфавита А ~ {а, Ь, с, d, .... г}. (2) Множество планет {Земля, Марс} представляет собой подмно- жество множества всех планет Солнечной системы. (3) Множество чисел {4 , 8, 26, 102} является подмножеством мно- жества всех четных чисел. Бесконечное множество непременно содержит бесконечное под- множество. Например, множество всех четных чисел бесконечно; оно содержит в качестве подмножества множество всех чисел, кратных 4, которое также бесконечно. Отрицание включения обозначают символом ф. Сравните его с сим- волом (£, предназначенным для отрицания принадлежности элемента множеству (см. 1.2.2). Таким образом, ВфА означает, что В не яв- ляется подмножеством множества А. Вполне возможно, что несколько точек множества В, но не все, принадлежат одновременно и множест- ву Л. В этом случае множество В не будет подмножеством множе- ства Л. Чтобы оно стало подмножеством, Л должно содержать все точки множества В. По определению, включение Л с А справедливо для всех множеств Л. Если В cz Л и множество Л содержит точки, не принадлежащие В, то говорят, что множество В есть собственное подмножество мно- жества Л. 1.1.5. НЕПЕРЕСЕКАЮЩИЕСЯ МНОЖЕСТВА Два множества называются непересекающимися, если они не имеют общих элементов. , 1 Некоторые авторы это отношение обозначают символом G. Они сохраняют символ с для указания «строгого включения»; множество В строго включено в А, если оно состоит из некоторых (но не всех) элементов множества Л. I 16
Примеры (1) Множества {1, 3, 5, 7, 9} и {2, 4, 6, 8} непересекающиеся. (2) Множество гласных и множество согласных букв не пересе- каются . 1.1.6. ПУСТОЕ МНОЖЕСТВО Удобно ввести специальный символ для множества, не имеющего элементов. Такое множество называется пустым множеством и будет обозначаться символом 0. Иногда его называют нулевым множеством. Примеры (1) {х : х является женатым холостяком). (2) {х : х есть действительное число, квадрат которого равен —1}. (3) {х : х — ящерица, живущая на Луне). Сразу видно, что в каждом из этих множеств нет ни одного элемен- та и к каждому применимы термин «пустое множество» и обозна- чение 0. Важно различать множества 0, {0}, {0}. Второе и третье мно- жества не пустые, каждое из них содержит по одному элементу. Второе служит примером множества, элементы которого представляют собой также множества (см. 1.1.8). Замечание. Пустое множество будет подмножеством всякого множества, т. е. 0 с X для любого множества X. Эта мысль, воз- можно, несколько трудна для усвоения, однако ясно, что все элементы пустого множества будут также и элементами множества X, поскольку множество 0 вообще не имеет элементов. 1.1.7. РАВЕНСТВО МНОЖЕСТВ Если два множества имеют в точности одни и те же элементы (т. е. если каждый элемент одного множества есть также элемент другого множества и обратно), то говорят, что эти два множества равны между собой. Замечание. Если множества А и В равны, пишут А = В. Если же множества А и В не равны друг другу, то пишут А В. а) Условия равенства множеств. Ясно, что если оба утверждения Лс~В и В<^А справедливы, то А — В. Это следует из определений отношений равенства и включения. Примеры (1) {1, 2, 3, 4} = {4, 3, 2, 1). Следует обратить внимание, что мно- жество не изменится при изменении порядка его элементов. (2) {1, 2, 3, 4} = {1, 1, 2, 2, 4, 4, 4, 3). Оба множества содержат лишь четыре различных элемента, а именно 1, 2, 3, 4. На практике никогда не следует записывать это множество так, как записано справа. Повторяющиеся элементы, если они даже беспрестанно встречаются, не играют роли в операциях над множествами, и потому нет необходи- мости их записывать. (3) {д, а, с) = {х : х — буква в слове «сад»}. 17
Упражнение 1.1.2 1. Даны множества: А — {1, 3, 5, 7}; В = {3, 5}; Е = {2}; Е) — {5, 7, 9}. Укажите среди следующих утверждений истинные и ложные: (а) В С А; (б) Е CZ В; (в) В с= D; (г) D с= А; (д) В £ А; (е) 0 £ В\ (ж) 0CB; (з) 0 £ £>; (и) Е (Д В; (к) множество А конечно; (л) D не является подмножеством множества А. 2. Среди следующих множеств укажите пары непересекающихся множеств: А = {х, у, г}; В = {1, 2, 4, t/}; С — {а, Ь, с, 2); D = {1, х, а}; Е = 0; F = {2, 3, Ь, с}. 3. Выбрать пустые множества: X = {х : х есть решение уравнения х2 — 0}; У = {у : у является замужней старой девой); Z = {0}; 1У = {х : х является человеком, чей возраст превосходит 200 лет). 4. Среди следующих множеств укажите равные: А = {1, 2, а, 6}; В = {1, 0, 2, а, &}; С = {Ь, Ь, 2, 1, a, a); D — {1, 2, 3, а, 6). 1.1.8. КЛАССЫ МНОЖЕСТВ Нам уже встречались множества, элементами которых были также множества (см. пример (3) в 1.1.6). Примером может служить и мно- жество всех возможных подмножеств данного множества. В таких слу- чаях, чтобы избежать неуклюжих выражений типа «множество мно- жеств», обычно говорят класс множеств или иногда семейство множеств. Слова «класс» и «семейство» следует воспринимать как синонимы сло- ва «множество». Все определения, относящиеся к множествам, точно так же применяются к классам1 и семействам. Пример. Множество .А = {{1, 2, 3), {9, 10}, {3, 4}} представ- ляет собой класс множеств. Каждый из его элементов есть множество. Будет ли множество 0 элементом этого класса? Ответ. Нет* *. 1.1.9. ДИАГРАММА ВЕННА Простой и очень полезный способ изображения множеств — это рисунки, известные как диаграммы Венна (по имени английского фи- лософа Джона Венна, 1834 — 1883). Конечное множество может быть представлено как совокупность точек, отмеченных на бумаге и окруженных подходящей фигурой типа круга, квадрата или треугольника. Расположение точек внутри фи- гуры несущественно. Обычно не указывают все точки внутри фигур, так как наибольшую информацию о соотношениях между множествами дает расположение границ. В случае бесконечного множества может быть нарисована только граница фигуры; часть плоскости внутри нее будет изображением множества. 1 Для описания кл ассов множеств общепринято пользоваться рукописными . прописными буквами, такими, как Ji, Si, SB и т. д. * Полезно обратить внимание, что хотя 0 с Ji, тем не менее 06 Ji (см. замечание в 1.1.6). — Примеч. ред. 18
Примеры (1) Включение. Рассмотрим множества Р = {a, b, с, d, е, /} и Q = {с, f}. Множество Р изобразим шестью точками внутри треуголь- ника, a Q — двумя точками внутри круга. Тот факт, что множества Q и Р связаны соотношением QczP, будем иллюстрировать следующим образом: точки с и f используются только один раз, круг содержит только эти две точки и лежит внутри треугольника (рис. 1). Рис. 2. Диаграмма Венна: непересе- кающиеся множества Рис. 1. Диаграмма Венна: вклю- чение QczP (2) Непересекаемость. Напомним, что два множества не пересека- ются, если они не имеют общих элементов. Это наглядно изображается диаграммой, на которой соответствующие множествам фигуры не пе- рекрываются. Например, если S = {х, 1, 2} и Т — {3, у, 4, 5}, то с по- мощью круга для S и квадрата для Т получаем диаграмму, изображен- ную на рис. 2. Рис 3. Диаграмма Венна: пе- ресекающиеся множества (3) Пересекающиеся множества. Рассмотрим множества А = = {1, 2, 3, 4}, В — {3, 4, 5, 6}. Изображая А квадратом, а В — кру- гом, получим две частично перекрывающиеся фигуры. Общая часть этих фигур будет содержать точки 3, 4, принадлежащие множествам А и В одновременно (рис. 3). (4) Соотношения между тремя множествами. Рассмотрим множе- ства А — {1, 2, 3, 4, 5}, В = {1, 2} и С = {2, х, у}. Изобразив А квад- ратом, В — треугольником, С — кругом, с помощью диаграммы Вен- на (рис. 4) можно отразить различные соотношения между ними. а) Соотношения между несколькими множествами. Ясно, как можно распространить применение диаграмм для иллюстрации соотношений между несколькими (более чем тремя) множествами. Часто границы фигур обозначают разными цветами или затеняют различные части диаграммы штриховкой в разных направлениях. 19
б) Число элементов множества. Элементы конечного множества можно сосчитать. Число N элементов множества X будет обозначаться N (X). Так, в примере (4) из 1.1.9 получаем JV (Л) = 5, N (В) = 2 и N (С) = 3. Иногда, когда это не приводит к двусмысленности, этими числами помечаются фигуры (круг, квадрат, треугольник и т. д.) на диаграмме. Упражнение 1.1.3 (смешанные задачи) 1. Дано множество А = {1, {2, 3}, 4}. Можно ли описать множество А как класс? Справедливы или ложны следующие утверждения: (1) {2, 3} Q А; (2) {{2, 3}} <= А; (3) {2, 3} <= А; (4) 3 $ А; (5) 0 С А; (6) 0 Ф А; (7) 4 £ А? 2. Запишите множества в табличной форме: (1) (х : х2 — 4 = 0, х — 2 = 0}; (2) {х : х является буквой слова «отсутствующий»); (3) (х : х является одной из цифр семизначного числа 3064505); (4) {х : х есть нечетное число, меньшее 7). 3. Запишите множества, указывая способ их конструирования: (1) {2, 4, 6, 8, 10}, (2) {м, и, с, п}; (3) {1, 3, 5, 7,...}; (4) {красный, оранжевый, желтый, зеленый, синий, индиго, фиолетовый}. 4. Установите, конечны или бесконечны следующие множества: (1) множество слов в английском языке; (2) множество слов во всех живых языках; (3) множество всех комбинаций букв алфавита; (4) множество точек на отрезке; (5) множество прямых, проходящих через точку (1,1); (6) множество всех атомов во Вселенной; (7) множество решений уравнения sin х = 0; (8) множество всех прямоугольных треугольников; (9) множество травинок на крикетном поле. 5. Постройте диаграммы Венна для изображения следующих множеств: (1) А = {5, 6, 8, 2, 4}; В = {1, 2, 3, 4, 5}; (2) Р = {х, у, 5, 6}; Q = {у, 5, 6}; R = {5, 6, 7}; (3) X = {х : х есть гласная буква}; Y = {у ". у является буквой слова «голос»}; Z = {г : г является буквой алфавита}. (4) Из 12 студентов 8 носят очки, 5 студентов курят, а 3 студента курят и носят очки. 6. В каждой из следующих задач укажите равные между собой множества: (1) {а, Ь, с}, {а, а, Ь, с, с, с}, {с, Ь, а, 6}, {Ь, а}; (2) совокупность букв п, s, i, {х : х является буквой слова «sin»}; {у : у является буквой слова «innings», кроме буквы g}, буквы, составляющие слово «inns»; (3) 0, {0}, {0}. 7. Какие из множеств 0, {0}, {0} могут быть описаны как класс множеств? 8. Выпишите все подмножества каждого из следующих множеств: (1) {х : х является гласной буквой}; (2) {у : у есть четное число между 1 и 7}; (3) {г : г2 = 9}. 9. Перепишите следующие утверждения, используя операции над мно- жествами: 20
(1) S есть подмножество S; (2) х принадлежит множеству Р; (3) множество Y не является подмножеством множества X; (4) множество S — подмножество множества Т; (5) z не принадлежит множеству Z; (6) X является подмножеством множества St). 10. Нарисуйте диаграмму Венна для иллюстрации отношений между сле- дующими множествами: А = {0, 1, 2, 3, 4, 5}; В = {2, 3, 4, 5, 6, 7, 8}; С = {2, 3, 4, 5, 6}; D — {3, 4}. Завершите формулировку следующих утверждений, вставляя вместо точек правильные символы (<z, £ и т. д.): (1) 3 ...А; (2) 2 ... £>; (3) С ... D; (4) С ... В; 0 ... D. Какие из множеств А, В, С, D могут равняться множеству X, если известно, что: (1) X и D не пересекаются; (2) X с С и X =£ С; (3) X С {у : у > 1). Выпишите класс всех подмножеств множества точек, принадлежащих В, но не принадлежащих ни А, ни С, ни D. Б. ОПЕРАЦИИ НАД МНОЖЕСТВАМИ: ОСНОВНЫЕ ЗАКОНЫ 1.1.10. УНИВЕРСАЛЬНОЕ МНОЖЕСТВО Обычно в приложениях теории множеств ограничиваются рассмот- рением элементов одного типа. Например, в геометрии интересуются множествами точек, но не занимаются множествами бананов или людей. Множество всех объектов, относящихся к отдельной прикладной зада- че, называется универсальным множеством, или областью исследова- ния. (В теории вероятностей и статистике оно называется множеством исходов, или выборочным пространством.) Универсальное множество мы будем обозначать символом S. Примеры (1) В эксперименте с бросанием кости областью исследования будет множество S = {1, 2, 3, 4, 5, 6}. Оно представляет собой совокуп- ность возможных исходов и универсально для этого эксперимента. (2) Рассматривая всевозможные футбольные команды, мы в качестве универсального множества должны принять множество всех футбо- листов; из этого множества мы можем как угодно выбирать подмно- жества. (3) В геометрии на плоскости (планиметрии) универсальное множе- ство представляет собой множество всех точек плоскости. 1.1.11. ДОПОЛНЕНИЕ МНОЖЕСТВА Рассматривая универсальное множество S и его подмножество А, мы, вообще говоря, можем найти элементы из S, которые не принадле- жат множеству А. Определение. Совокупность элементов, принадлежащих универсальному множеству S, но не принадлежащих подмножеству А, 21
называется дополнением множества А. Мы обозначим его через А' («Л штрих»). Таким образом, Л' = {х :х f S, х (£ Л }. Заметим, что Л и Л' — непересекающиеся множества и оба пред- ставляют собой подмножества множества S. Примеры Пусть S — множество, составленное из первых семи букв англий- ского алфавита, т. е. S = {a, b, с, d, е, f, g}. Тогда, если Л = {а, Ь, с, d}, то дополнением Л будет множество А’ = {е, f, g}. С помощью диаграммы Венна мы можем представить область иссле- дования рассмотренного примера прямоугольником, включающим в себя все элементы и подмножества (рис. 5). Рис. 5. Дополнение множества А Замечание. Из определения дополнения множества следует что дополнение дополнения множества Л есть множество Л, т. е. (ЛТ = Л. Упражнение 1.1.4 1. Пусть S = {1, 2, 3, 4, 5, 6}, А = {1, 3, 5}, В = {2, 4, 6}, С = {1}, D = {4, 5). Покажите, что: (1 ) А' = {2, 4, 6} = В; (2) В' = А; (3) С = {2, 3, 4, 5, 6}; (4) D' = {1, 2, 3, 6}; (5) (£>')' = {4, 5} = £>; (6) (С')' = {1} = С; (7) £' = {—} = 0. Нарисуйте диаграммы Венна, чтобы проиллюстрировать каждую из этих операции дополнения. 2. Если S есть множество всех целых положительных чисел, то каково до- полнение множества О = (1, 3, 5..)? 3. Покажите, что для любого универсального множества S S'= 0 и 0'=S. 1.1.12. ОПЕРАЦИИ НАД МНОЖЕСТВАМИ Давайте остановимся ненадолго на понятиях суммы, разности-и про- изведения, столь фундаментальных в обычной алгебре. Мы можем взять любые два числа а и b и образовать из них новые числа посредством операций суммирования, вычитания и умножения. Так: «£+ Ь,‘ а — Ь, а b 22
есть три числа, которые, вообще говоря, отличны от а и Ь. Знаки «Ц-», «—» и «-» символизируют три бинарные операции для комбинирования чисел и алгебраических выражений. (Замечание. Слово «бинарный» относится к комбинации двух чисел при выполнении некоторой операции.) Множества также могут быть скомбинированы различными спосо- бами. Имеются три основные бинарные операции над множествами, а именно операции объединения, разности и пересечения-, их мы и опре- делим. К сожалению, символы для этих операций полностью не стандар- тизованы. Операции над множествами мы будем обозначать следую- щим образом: (J (объединение), — (разность) и f) (пересечение). Таким образом, если А и В есть два множества из одной и той же об- ласти исследования, то A (J В, А — В, A (~| В обозначают резуль- таты операций объединения, разности и пересечения над множествами А и В соответственно. Сейчас эти три операции будут точно определены. а) Объединение (Л IJ В). Объединением двух множеств А и В на- зывается множество всех элементов, принадлежащих или множест- ву А, или множеству В (или обоим сразу). Таким образом, Л U В — {х : х £ А или х С В}. Примеры (1) А = {барабан, кукла, солдат}; В = {яхта, барабан, книга, пугало}. Объединением множеств А и В будет множество A U В = {ба- рабан, кукла, солдат, яхта, книга, пугало}. (Заметьте, что «барабан» записывается только однажды, хотя он встречается как в А, так и в В.) (2) А = {1, 2, 3, 4,}; В = {3, 4, 5, 6}; A U В = {1, 2, 3, 4, 5, 6} (3, 4 записываются только один раз). Диаграмма Венна, иллюстрирующая пример (2), изображена на рис. 6. Замечание. Перечислим следствия из определения объеди- нения множеств: 1) А 2) А А = Л; S = S; U и 3) A U 0 = Л; 4) Л U А' = S; 5) A U В = В U А. Упражнение 1.1.5 1. Найдите объединение множеств А и В в следующих случаях (рекомен- дуем нарисовать диаграмму): (1) А = {собака, кошка}, (2) А = {1, 2}, (3) А = {5, 10, 15}, (4) А = {х : 0 < х < 1}, (5) А ~ {х : 0 < х t 1}, В = {корова, собака, коза}; В = {6, 7, 8}; В = {10, 11, 12, 13, 14, 15}; В = {х : 1/2 < х < 3/2}; В = {х : 1/2 < х < 1}; 23
(6) рассмотрим группу студентов: А — множество студентов, умеющих пла- вать, В — множество студентов, не умеющих плавать. 2. Пусть S = {1, 2, 3, 4, 5, 6} и А ~ {1, 2}. Найдите А'. Покажите, что A U А' = S. 3. Пусть А = {1, 2, 3, 4} и В = {1, 3}. Найдите A (J В. 4. Пусть S = {х : — 1 х 1}, Т = {х : 0 < х < 1}. Найдите S U Т. 5. Рассмотрите результаты задач 3 и 4. Чему будет равно A (J S, если Рис. 6. Объединение множеств А и В Рис. 7. Разность множеств А и В б) Разность (4 — В)1. Разностью двух множеств А и В будет множество всех таких элементов множества А, каждый из которых не принадлежит множеству В. Таким образом: А — В = {х : х £А , X В}. Читать лгу запись будем так: «Л минус В». Примеры (1) Пусть А = {а, Ь, с, d}, В = {с, d, е, f}. Тогда А — В = {а, Ь} (рис. 7). (2) Пусть А = {х : 3 С х 6}, В = {х : О С х -С 4}. Тогда А — В = {х : 4 < х С 6} (рис. 8). С в □ С я □ ------------------------ ------------tfHtfHtfHHHfHiimmtHHf -7 О 7 2 3 4 5 6 7 ( я-в □ Рис. 8 Замечание. Из определения разности следует: (1) А - А = 0; (2) S - А = А'. 1 Некоторые авторы обозначают разность множеств А и В через А \ В (иногда А / В или А ~ В). 24
Упражнение 1.1.6 1. Для каждого из примеров (1) — (6) задачи 1 из упражнения 1.1.5 найдите разности Л — В. 2. Пусть А = {1, 2, 3} и В = {4, 5, 6}. Найдите А — В. В общем случае если А и В не имеют общих элементов, то каково будет мно- жество А — В? 3. Верно ли, что А — В = В — А? Если вы считаете, что в общем случае это неверно, то можете ли вы указать частный пример, когда это утверждение все-таки верно? Или же это утверждение всегда ложно? 4. Для любого множества А что представляет собой А -— А'? 5. Если А С В, то каково А — В? (Нарисуйте диаграмму.) и) Пересечение (4 Я В). Пересечением двух множеств А и В бу- дет множество всех элементов, принадлежащих и множеству А и мно- жеству В. Таким образом: А (] В = {х : х Е А и х Е В}. Примеры (1) Если А — {а, е, I, о, и}, В = {е, t, о}, то A f] В — {<?, о} рис. 9). Рис. 9. Пересечение множеств А н В (2) Пусть А = {х : 0 < х С 5}; В = {х : — 1 < х < 2}. Тогда A f| В — {х : 0 < х < 2} (рис. 10). С в ) ( л 3 ---------HHIHHHHIIHHMHHH------------------------— -7 0 7 23 45 Ь ( АП В ') Рис. 10 (3) На плоскости заданы два множества: А — единичный квадрат с центром в точке (0,0), В—единичный квадрат с центром в точке (1у/2> ^г)- Тогда множество А f) В есть квадрат со стороной 1/2, как показано на диаграмме Венна, изображенной на рис. 11. 25
Рис. 11. Пересечение множеств А и В Замечание. Из определения пересечения следует: 1) А П А ---- А; 3) A f] S -= А; 2) А П 0 = 0; 4) А П А' = 0; 5) А П В = В П А. Упражнение 1.1.7 I- 1. Для каждого из примеров (1) — (6) задачи 1 из упражнения 1.1.5 найдите пересечение множеств Лий. i 2. Заштрихуйте площади, изображающие множество Л р В на каждой из диаграмм Венна, изображенных на рис. 12, а, б, в, г, д. Рис. 12 3. С помощью диаграммы Венна на рис. 12, в покажите, что если Л ZD В, то Л П В = В. 4. Если Л сг В, то каково Л Р й? 5. Пусть Л = {0, 2, 3, 4,5}; В = {1, 3, 5, 7}; С = {0, 2, 4, G}. Выпишите множества: (1) Л П й; (2) В П С; (3) С Р А; (4) С р й; (5) Л П (В П С); (6) (Л П В) р С (сравните с (5)). Упражнение 1.1.8 1. Дано универсальное множество S = {а, b, с, d, е, f, /} и его подмноже- ства Р = {а, Ъ, с, d}, Q = {а, е}, R = {6, d, е, /}. Выпишите элементы, образу- . ющие следующие множества. В тех случаях, когда результат будет одинаковым,'; 26
посмотрите, нельзя ли вывести общий закон, обеспечивающий соответствующее равенство: (1) Р Г) (Q и R)> (3) р U (Q А R); (2) (p П Q) U (P П R); (4) (P U Q) П (p U R); (5) (Р A Q) U R- (7) (р и Q) П R; (6) (P U R) П (Q U R); (3) (P A R) U (Q A R); (9) SDP- (io) sn(PUR); (П) sn(PUQ); (13) з и (Q A R); (15) (Q U R) U 8; (17) (QUR)U0; (19) QU (PAR); (21) р n (Р U 0); (23) R и (Р Л R); (25) R и (R А 0); (27) (0UR) Л [(SUP)O(QUR)1; (29)(rnQ)'; (31) R'UQ'; (33)P'f]Q'; (35) (P U Q)-(PUR); (12) (8 n P) U (s A Q); (14) (8 и Q) A (S U R); (16) (P U S) и R; (18) Q U (R U 0); (20) (Q U P) A (Q U R); (22) p и (P A Q); (24) 8 П (R U 8); (26) Q A (P U 0); (28) p' и Q'; (30) (RnQ)'; (32) (PUQ)'; (34) p и (Q-R); (36)[(PUQ) UR]'; (37) (P—Q)—R; (39) (P—Q) U (Q-P); (38) (P-R)-(Q_R); (40) (PUQ)-(PAQ)- 2. Выполните задание 1 для 8 = {1,2, 3, 4, 5, 6), Р = {1,2, 3}, Q= {1,3,5}, R = {2, 4, 6}. 3. Выполните задание 1 для 8 = {х : 0 х ; 10}, Р = {х : I < х < 6}, Q = {х : 4 < х J 10}, R = {х : 0 х < 1}. 1.1.13. КЛАССЫ ПОДМНОЖЕСТВ (МОЩНОСТЬ МНОЖЕСТВА; РАЗБИЕНИЕ) В 1.1.8 введено понятие класса, или семейства, множеств. Определим два типа классов, которые играют важную роль в тео- рии множеств, а именно множество подмножеств и разбиение. (а) Множеством подмножеств называется класс всех подмножеств множества 8. Его часто обозначают З5 (8): (8) = {X : X cz 8}, Примеры (1) 8 = {0, 1, 2}. SP (3) = {0, {0}, {1}, {2}, {0, 1}, {0,2}, {1, 2}, {0, 1, 2}}. (2) 8 = {Ь, а, /}. & (3} = {0, {&}, {а}, {/}, {Ь, а}, {Ь, /}, {а, /}, {Ь, а, /}}. 27
(б). Разбиения. Рассмотрим Множество S и = {С\, С2, .... С\} — класс непустых подмножеств 5, обладающих следующими свойст- вами: 1. Для любых двух подмножеств Ct, Cj из класса 4S либо С, = Q, либо Ci П Cj = 0. (Это означает, что <ё — класс непсресекающихся множеств.) 2. Объединение всех подмножеств равно S, т. е. G и С2 U - U Ck = S. Тогда называется разбиением множества S. Примеры (1) S = {0, 1, 2, 3}. Подмножества: Сг = {0}, С2 = {1}, С3 — {2, 3}. Класс = = {Ci, С2, С3} есть разбиение S, так как каждое Сг непусто, каждые два множества С,-, Cj не пересекаются и Ci и С2 и С3 — S. (2) S = {а, Ь, с, d, е, f}. Подмножества: Сг = {а, е}, С2 = {b, с, d, /}. Класс ’ё = {G, С2} есть разбиение множества S, так как каждое Ct непусто, 1 Ci П С2 = 0 и С^ U С2 = S. Упражнение 1.1.9 1. Найдите (S) множества S={a} (вспомните, что 0 представляет собой подмножество каждого множества). 2. Найдите (S) множества S = {а, b}. 3. Найдите SB (S) множества S — {а, Ь, с}. 4. Сколько подмножеств имеет множество S = {а, b, с, <:/}? 5. Покажите, что конечное множество, состоящее из п элементов, имеет мно- жество подмножеств, состоящее из 2П элементов. 6. Покажите, что = {Сь С2, С3}, где Cj = {1, 3}, С2 = {4, 6}, С3 = {2,5}, есть разбиение множества S = {1, 2, 3, 4, 5, 6}. 7. Пусть S = (р, q, г, s, t, и). Укажите среди следующих классов подмно- жества такие, которые составляют разбиение: (1) Pi = {р, s, /}, = {<7. г}, Д3 = {б «}}: (2) {Si = {р}, В2 = {?}. В3 = {г, и}, В, = {s, /}}; (3) {Cj = {р, q, /}, с2 = с;}; (4) { {г, S, /}, {р, q}, {«}, 0}; (5) {{р, q, г, s, t, и}}. 8. Покажите, что если А есть любое непустое собственное подмножество множества S, то класс '2? = {Л, А'} составляет разбиение множества S. . 9. Пусть S — множество натуральных чисел {1, 2, 3, ...}. Покажите, что класс {CJt С2, С3}, где Сх = {х : х = Зп, п = 1, 2, 3, ...}, С2 — {х х = 3 п — 1, п = 1, 2, 3, ...} и С3 ~ {х : х= 3 п — 2, п=1, 2, 3, ...}, составляет разбиение множества S. 10. Найдите все возможные разбиения множества S = {0, 1,2, 3} (их всего пятнадцать). 28
1.1.14. ОСНОВНЫЕ ЗАКОНЫ АЛГЕБРЫ МНОЖЕСТВ Приведем сводку основных свойств операций над множествами (законы алгебры множеств); S обозначает универсальное множество; А, В, С — любые подмножества множества S. Основные законы алгебры множеств 1. Идемпотентные законы A (J А = А ЛрЛ = Л 2. Законы тождества ли0=л 71l)S = S Лр8 = Л Лр0=0 3. Законы дополнения ЛиЛ' = 5 (А')' = А ЛПЛ' = 0 8' = 0 и 0' = S 4. Законы коммутативности лив=В1М лрв=врл 5. Законы ассоциативности (Zue)UC=^U(BUC) (ЛрВ)р С = Лр (ВрС) 6. Законы дистрибутивности _ ЛЦ (ВрС) = (Лрй)Р (ЛИС) Лр (В11С) = (ЛрВ) и (ЛрС) 7. Законы де Моргана (ЛиВ)' = Л'Пв' (ЛрВ)' = Л'иЯ' Если читатель полностью выполнил упражнение 1.1.8, то он сам мог убедиться в верности этих свойств. Очень важно понять их и уметь свободно пользоваться. Успех в этом достигается долгой прак- тикой. Упражнения, помещенные в конце главы (см. упражнение 1.1.13 на с. 33), дадут читателю возможность приобрести необходимый опыт. Прежде чем перейти к доказательству законов алгебры мно- жеств, проиллюстрируем последние два из них на отдельном примере. Пример Универсальное множество: <S = {a, b, с, d, е, f, g}. Его подмножества: А = {a, b, с, d}, В = {с, d, е, f}, Cj= {b, с, f, g}. (1) Законы дистрибутивности для операций объединения и пере- сечения. (a) A U (В Г) С) = (Л U В) П И U С). Это равенство непосредственно проверяется в результате последо- вательного формирования множеств, стоящих в левой и правой части. Л. Ч. (левая часть равенства) П. Ч. (правая часть равенства) Л врс ли (В.РС) лр£ лис (AUC) {а, Ь, с, d) {с. 0 {а, Ь, с, d, f} {а,6,с, d.e.f} {a,b,c,d,f,g} {a, b, c, d, f} А 1 t л. ч.=п. ч. 29
Рис. 13. Иллюстрация с помощью диа- граммы Венна Соответствующая диаграмма Венна изображена на рис. 13. (б) А П (В и С) = (А р В) и И A Q. Равенство иллюстрируют таблицы: Л. Ч. А вис ЛП (BUC) {а, Ь, с, d) {b,c,d,e,f,g} {Ь, с, d} П. Ч. лрв ЛПС (ЛПВ)и(ЛПС) {c,d} {ь, с} {b, с, d) Л. ч.=п. ч. Соответствующая диаграмма Венна изображена на рис. 14. Рис. 14. Иллюстрация с помощью диаграм- мы Венна (2) Законы де Моргана. (а) (Л U В)' = А' Л В'. 30
Равенство правой и левой частей иллюстрируют таблицы: Л. ч. п. ч. 71UB (ЛОВ)' [а, Ь, с, d, е, Д (4 А' В' Л'ЛВ' {«, f, g} {a, b, g} U} л. ч. = п. ч. (б) (Л п ву = Л' U в'. Равенство правой и левой частей иллюстрируют таблицы: Л. Ч. П. Ч. лрв (ЛИВ)' {a, b, е, f, g) А' В' A'UB' {е, f, g} {о. b, g} {“> b, е, f, g} л. ч. = п. ч. Упражнение 1.1.10 Продемонстрируйте справедливость всех основных законов алгебры мно- жеств на примере S = {1, 2, 3, 4, 5, 6, 7}, А = {1, 2, 3, 4}, В = {3, 4, 5, 6}, С — {2, 3, 6, 7}, действуя указанным способом. Чтобы проиллюстрировать каж- дый закон, нарисуйте диаграммы Венна. 1.1.15. ДОКАЗАТЕЛЬСТВО МЕТОДОМ СРАВНЕНИЯ ЭЛЕМЕНТОВ Приведенные иллюстративные примеры не доказывают законов алгебры множеств. Они только показывают их справедливость в каж- дом отдельном случае. Эти законы могут быть доказаны в общем слу- чае с помощью метода сравнения элементов. Проиллюстрируем применение этого метода на втором законе де Моргана. Закон: (Л Л В)’ = Л' (J В'. Доказательство. Равенство любых двух множеств Р и Q следует из одновременного выполнения соотношений Р с. Q и Q с Р (см. 1.1.7). Поэтому закон де Моргана будет установлен, если доказать, что (л п ву <= Л' U В'-, Л' U В' <= (Л л ву. (1) (2) 31
Для доказательства соотношения (1) рассмотрим произвольный элемент х, принадлежащий множеству (Л f| В)', расположенному слева, и покажем, что в этом случае он должен принадлежать и мно- жеству A' U В'. Итак, предположим, что х Е (А f| В)’. Тогда х $ (А П В). Это значит, что либо х & А, либо х £ В, т. е. либо х Е А', либо х Е В'. Следовательно, х Е A' J В'. Это справедливо для всех элементов из (A Q В)', а потому (А П В)’ с A' U В', и тем самым установлено соотношение (1). Рассмотрим теперь произвольный элемент х из множества A' J В'. Тогда либо х Е А', либо х Е В'. Это означает, что либо х А, либо х В, т. е. х не принадлежит как множеству А, так и множеству В, поэтому х (£ (А П В). Следовательно, х Е (А f) В)'. Это справедливо для всех элементов из множества A' J В', а потому A' U В' с (А П В)', и тем самым установлено соотношение (2). Доказательство второго закона де Моргана полностью завершено. Упражнение 1.1.11 Примените рассмотренный метод для доказательства следующих теорем: 1. (А')' = А. (Если х£(А')’, то х Е А', поэтому х Е А. Следовательно, (А')' с А. Если х А, то х Е А', поэтому х Е (А')'. Следовательно, А с: (А')'.) 2. А (1 S = А. (Если х Е АП5, то х Е А (и х Е S). Следовательно, A f)ScA. Если х Е А, то х Е А П S (х Е S, так как S — универсальное множество). Следо- вательно, А с А П S.) 3. А П 0 = 0. 4. (А — В) П А = (А — В). 5. А — В = А П В'. 6. В — А = А' () В. 7. (А — В) П В= 0. 8. A U (А П В) = А. 9. Приведите доказательства всех теорем из таблицы основных законов. 1.1.16. ПРИНЦИП ДВОЙСТВЕННОСТИ Символы U и f| и символы S и 0 называются двойственными друг другу. Если в некоторое выражение (или равенство), записанное для множеств, входят только операции объединения, пересечения и допол- нения, то, заменив каждый из символов (J , f|, S и 0 на двойственный ему, получим выражение (или равенство),1двойственное первоначаль- ному. Предлагаем читателю обратиться к таблице основных законов, в которой двойственный каждому из них появляется как другой основ- ной закон (он приводится на той же строке). 32
Примеры (1) Законы тождества: A U 0 = А; А П 5 = Л, (2) Законы коммутативности: A U В = В (J А; А Г) В = В П А. (3) Законыде Моргана: (Л J В)' = A' f] В'; (Л П В)' =А' U В'. (4) Закон дополнительности: (Л')' = Л; (Л')' = Л — равенства, по изменяющиеся при подобной замене, называются двойственными С( бе. Мы можем теперь установить очень важный принцип. Принцип двойственности. Если Т — какая-либо теорема о мно- жествах, выраженная в терминах (J , ,' и выведенная из указанных основных законов, то утверждение, двойственное Т, также будет тео- ремой, выводимой из этих законов. В самом деле, если Т доказывается определенной последова- тельностью шагов, то доказательство утверждения, двойственного Т, состоит из последовательности двойственных шагов. Пример Теорема (Л Г) В')'U В=Л'U-6- Доказательство (Л ПВ')Ч)В =(Л'ив)ив = л'и (в и в) = л'ив Двойственная теорема (лив')'пв = л'пв. Доказательство (двойственные шаги) (Л U В')' Г) В = (Л' f) В) П В (закон де Моргана) = Л' П (В Г) В) (закон ас- социатив- ности) = Л'[~|В (закон идемпо- тентности) Когда принцип двойственности применяется к математическим структурам, то он приводит к плодотворному обмену идеями между двойственными системами. Любая теорема, доказанная в одной системе, немедленно вызывает другую теорему (с полным доказательством) в двойственной. Если математическая структура представляет собой модель некоторой реальной (т. е. физической) системы, то двойствен- ные теоремы, полученные таким образом, могут привести к весьма не- ожиданным дополнительным соотношениям между физическими пере- менными. Упражнение 1.1.12 1. Для каждого из следующих выражений выпишите двойственное ему: (1) (Л П В)' П S; (2) (A’ U0)lWUS); (3) (Sn PY U (Q П В); (4) (ЛПВ) и(СП0)и(5ПЛГ)В); (5) S и [(Д л В') Л 012 (6) (Д Л С) и В и S- 2 Зак. 973 33
2. Докажите приведенные тождества, затем выпишите двойственные тож- дества и докажите их: (1) PU(P'nQ)=PUQ; (2) (Р U S) Л (Р Л 0)=0; (3) РЛ(Р UQ)=P; (4) (Р П Q) U (Q П Р)=(Р'ПР')'ПС- Упражнение 1.1.13 (смешанные задачи) 1. Установите, какие из следующих множеств всегда пусты: (I) (Л и В) Г) (Л' и В'У, (2) (Л п В) П (С П Л'); (3)(ЛПВ)-В; (4)B-(W); (5) (ли В) П (Л'UP'). 2. Определите, какие из следующих пяти множеств равны: (1) А Л (В U С); (2) (B-C)U(C-B); (3) (С U В) (С Л В)'-, (4) (Л n С) U (Л л Р); (5) (Л Л Р Л С') U (Л П Р' П С) и (л' Л л Р Л С') U (Л' Л в' Л С). 3. Для каждой из следующих пар множеств определите, является ли одно подмножеством другого: (1) В, (В Л Л); (2) (Л Л В'). (В Л Л'); (З)Л-Р, В—Л; (4) Л'ЛР', (ЛОР)'. 4. Покажите, что (1) (Л Л Р) U (В' Л Л) = Л; (2) л и р=(Л л Р) U (л Л р') и1(Л'Л Р); (3) л л (л и Р)=л л (Л'Л р')'=Л; (4) л и (л'Л в) = л и (л U р')'=л и В- 5. Выпишите двойственные тождества для каждого из соотношений (1) — (4) задачи 4. 6. Какие из следующих уравнений справедливы для всех множеств Л, В, С (S — универсальное множество): (1) л л (в UО = (л Л в) U(л ПО; (2) (лпв) U (Л' Л в) U (л л в')=5; (3) л л (л ив) = л; (4)л'ив'=(л и в)'; (5) Л U (Л'ЛВ) = Л U В; (6)лил'=5; (7) Л и (Л Л В) = Л; (8) (Л U В) Л (Л' U С) = (Л Л С) U (Л' Л В); (9) (Л'Л В') U (Л'Л В) и (Л Л В') =5; (10) (Л Л В)'= Л'Л В'. 7. Упростите следующие выражения: (1) [Л'л (В и С)]'; (2) [(Л Л В) и (Л' л В) и (Л л В')]'; (3) (Л и В') л (Л' и С) л (В и с'); (4) (Л Л В) и (Л' ЛС)и(ВЛС). 8. Покажите, что Л П (Л' U В) (J В (1 (В U С) (J В = В. 9. Покажите, что Л U (Л' 0 В) = Л (J В. 10. Покажите, что (Л (J В (J С)' = Л' П В' П С'. 11. Покажите, что [(Л Л В) U (Л Л С) и (Л' Л х' л У)] П [(Л Л В' Л С) U (Л' Л X' л У') U (Л' Л в Л У)Г = (Л л В) U М' Л в' Л X' Л У). 12. Покажите, что (л U В) Л (С и о)=(С Л Л) и (С Л В) и (В Л Л) и (В Л В). 34
(Замечание. Эта формула называется «разложением на множители».) 13. Разложите (Л Г) В) U (С П D) на линейные множители. (Решение: (С (J A) f) (С U В) f| (D (J Д) f) (D (J В).) 14. Разложите на линейные множители (как в задаче 13); (1) A U (В' П С); (2) (X П Y) U (С n D); (3) А и в n (С и £>); (4) (Д DB')U А' п (В и Q. 15. Сведите каждое из следующих выражений к одному множеству (т. е. к одному символу): (1) Д Г1 В' П Д' Г) В'; (2) (Д П В) и (Д п В’) и (А' п В) и (А' П В')-, (3) (Д П С')ЩД П В П С) и (А Л С); (4) Д'иВ'иС' и(ЛГ)ВПС); (5)(д'ив)П(ли5); (6) [Д U М П В) U И Г) в П С)1 П [И и в и Q1; (7) [(ДГ)В')и(Д'ЛВ)]' П(ИПВ)иИ' Г)в')]'. 16. Для каждого из тождеств в задачах 8, 9, 10 и11 выпишите двойственные. Замечание. Мы специально не оговариваем, что упражнения размещены в разных частях главы. Цель этих упражнений—совершен- ное овладение читателем символами, операциями и законами алгебры множеств; повторение должно помочь ему ускорить этот процесс. 1.1.17. РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА Мы уже отмечали, что без знания теории множеств невозможно обойтись при изучении современной математики. Это не только инте- реснейший предмет сам по себе, он дает мощные средства и методы во многих областях исследования. В этой книге теория множеств наиболее широко применяется при изложении теории вероятностей (во второй и третьей частях). Она также необходима при изучении теории графов и линейного программирования. Для дальнейшего чтения читателю рекомендуется работа [11 (ее уровень примерно такой же, как и у этой книги).
к2 ОПЕРАТОР ГЛАВА СУММИРОВАНИЯ 1.2.1. ВВОДНЫЕ ЗАМЕЧАНИЯ Во многих приложениях современной математики переменные, определенные на дискретных множествах, таких, как {х1г х2, ..., хп} или {лу, х2, ...}, употребляются чаще, чем переменные, определенные на непрерывных множествах, таких, как {/ : 0 / < оо}_ Например, описйвая эксперимент с бросанием кости, мы находим, что возможные исходы эксперимента образуют дискретное множество {1, 2, 3, 4, 5, 6}. Изучая же схему поступления требований на обслу- НепрерыВная функция (опреде- ленная на множест- ве [х: тжхрб}) Рис. 15 х2 х3 Х Дискретная функция ( опреде- лённая на множест- ве {х,,х?,х3}) Рис. 16 живающий прибор (ситуация очереди), в качестве множества возмож- ных интервалов времени между последовательными поступлениями требований мы должны взять множество {t:O^t<_T}, где Т — некоторый реальный верхний предел, например 60 мин. (В большинстве случаев, рассматриваемых в теории очередей, принимают Т неогра- ниченным сверху.) При решении задач, связанных с функциями, определенными на непрерывных множествах, часто приходится выполнять операцию ин- тегрирования (j dx). В аналогичных же задачах, связанных с функция- ми, определенными на дискретных множествах, выполняется операция суммирования (S). Чтобы получить «сумму» значений функции на ее области опре- деления, мы берем (1) J у dx в непрерывном случае (рис. 15) и (2) у у + t/2 + у3 в дискретном случае (рис. 16). Суммы дискретных величин очень часто встречаются в этой книге. В данной главе мы хотим показать читателю, как можно оперировать 36
такими суммами с помощью оператора суммирования, обозначаемого греческой буквой 2. Свободное владение этим оператором требуется, например, для понимания теории математической статистики. 1.2.2. ИНДЕКСНЫЕ ОБОЗНАЧЕНИЯ Элементы множества, состоящего из трех различных объектов, могут быть обозначены некоторыми символами, например хъ х2, х3; числа 1, 2, 3 называются в этом случае индексами. Мы можем представить п различных объектов символами хг, х2, ..., xn_lf хп, а произвольный объект из этого набора обозна- чить символом хт, где индекс г «пробегает» множество целых чисел 1, 2, ..., п — 1, и. Например, мы можем для обозначения пяти масс, размещенных на плоскости, воспользоваться символами mlt m2, m3, mit m5 и, рассмат- ривая любую из них, писать mr, где г = 1,2, 3, 4 или 5. Мы можем, далее, ввести координаты (xlt t/j массы тъ а в общем случае говорить о массе тг с координатами (хг, уг), где г = 1, 2, 3, 4, 5. 1.2.3. ОПЕРАТОР СУММИРОВАНИЯ Заглавная греческая буква 2 (сигма) служит символом операции суммирования. Рассмотрим, например, сумму хг + х2 + хз- Ее можно записать з как ]рхг; знак перед хг указывает, что все значения хТ должны быть Г=1 просуммированы. Числа, стоящие под знаком 2 и над ним, называются пределами суммирования и указывают наименьшее и наибольшее зна- чения индекса суммирования, между которыми расположены его про- межуточные значения. Примеры 7 7 (1) «Раскрывая» V.xr, получаем ^Хг = х4 + хй4 х6 + х7. г = 4 г=4 п п (2) «Раскрывая»2-4, получаем Vxr = х0 -I- Xj-)-... -|- хп_г + хп. г=0 г=0 (3) «Раскрывая» ^х,., получаем V xr=-xm 4-xnl+j 4- ... 4-x„_14-xn. r=m r~m Замечания а) Переменный индекс г может принимать только целые числовые значения. б) Значение У. хг не изменится, если использовать не г, а другой Г индекс (поэтому индекс суммирования г часто называют немым индек- сом). Наряду с г в качестве индексов суммирования наиболее часто употребляются бувы i, j, k. в) Выражение, стоящее после знака суммы, называется элементом суммирования, пли слагаемым-, например, в^хг слагаемым будет хТ. 37
г) Очень часто, если пределы суммирования не вызывают сомнений, индекс при слагаемом опускается и пределы суммирования не указы- п ваются. Например, Vx часто пишут как сокращение для Использование знака S можно продемонстрировать на следующих примерах. Примеры 1. Раскройте следующие выражения: 3 7 8 4 (1) Vxr+Vxfc; (2) £/; (3) r=l k=4 г—4 г=2 3 1 2 4 (4) 2 —; (5) 2 (6) £ а г=1 Хг г = 0 г 2 Решения (1) хх + х2 + х3 +ух4 - Ь х5 + хв + х7; (2) 4 + 5 + 6 + 7 + 8; (3) 3 + 4 4- 5; (4) 1/хг + 1/х2 + 1/х3: (5) хг + х2 -I- х3; (6) 22 + З2 + 42 = 4 + 9 + 16 = 29. 2. Перепишите следующие выражения с помощью оператора сум- мирования: (1) хг + х2 + х3 + х4; (2) 22 + 23 + 24; (3) х2 + -^з х4 — Xq х? х3, (4) Vз 1/0 + /27 /gi* Решения (i) 2^; (2) 2^ <3) 2*~2^ (4) £(-1)г+ 3~г. r=l r = 2 i = 2 ft=6 г = 1 Упражнение 1.2.1 1. Выпишите следующие суммы в развернутом виде 6 5 6 9 (1) У, хг; (2) У, xft; (3) V, хг+ 2 r = 3 k-‘2 r=3 k=7 3 4 3 6 3 (4) У, *ь + У, xf, (5) У xk — У xf, (6) 2 (хг+лун); k.— \ j=2 k=\ z = 4 r=l 4 3 1 1 (7) 2 r’ (8) 2 — •> (9) 2 (f2+2r); r=l r=l xr r=l 4 4 2 (10) V (-l)'x-'; (11) V (-iyyi- (12) 2 (-l)fe2fc/xfe. r= 2 Z.= 0 k = 0 2. Перепишите следующие выражения с помощью оператора суммирования: (1) хх + х2 4- х3 + ... 4“ Xn-i 4“ хп\ (2) 1 4 2 4- 3 — (4 + 5 4- 6); (3) х3 4- х4 + хъ + х6 + х7; (4) х2 + х3 + х4 + xu + Xj2 + х13 + х14; 38
(5) х1 + хз + х1 + хь> (6) “+ —1-+ ~+ ~~ ’> х6 Л7 Лд (7) 1 4 9 16 —+ —+ —+ —; х2 хз 1 х4 х6 1 1 1 (8) 1+т+т+т= 2 3 4 5 (9) 33+43 + 5^ + 6®; (10) —+ —+ — + — • 3 4 5 6 1.2.4. НЕКОТОРЫЕ ВАЖНЫЕ ТОЖДЕСТВА Следующие тождества легко проверить, раскрывая операторы сум- мирования в обеих частях каждого равенства (предполагается, что индекс суммирования «пробегает» произвольное множество последо- вательных целых чисел): О V(xr + i/r)=yxr + 2(//. 2) V ^хг == С V xr, С—константа; п 3) У^а = па\ Г=1 п п — k 4) У Хт = 2 xr+h > r = fe г = 0 2 %г= 2 г» г=0 г=0 6) ^Хг = Хп + 2 хг= V хг+х0. г=0 г=0 г = 1 п Тожество 3 следует из того, что 2й = й й + ••• + а, где г=1 п п в правой части а берется /г раз. В частности, V 1 = пи 2 1 = п m+ 1. Г=1 г—ш Тождество 4 легко понять, если положить п и k равными некоторым числам; разложения (3) и (4) из приводимого далее примера 1 подтверж- дают это тождество. Примеры 1. Следующие разложения иллюстрируют приведенные тождества: 5 5 5 (1) V (4хг + 7уг) = 4 2 *г + 7 2 Уг = 4(х2 + ^з + ^Тл:б) + г = 2 г—2 г=2 + 7(У2+Уз+у4 + у^, 4 4 4 (2) 2 (З-'-г + 2) — 3 2 хг Н- 2 2 — 3 (хх + х2 + х3 + х4) + 8; Г=1 Г=1 Г = 1 6 (3) У^Хг^Х;^ Х4+ Х-0 + Хб-, г=3 3 (4) 2 Хг+з = Л:о+з + х1+3 + х2+з + хз+з = х3 + х4 + х5 + хе( (3)). г=0 39
4 (5) у, хт = х„ + Aj + х2 + х3 + х4; г = 0 4 (6) У, Х4-г = А4 О + А'4—1 + Х4—2 + А4-3 + Х4-4 ~ Х4 + Х3 ' i Х2 + г = 0 + х1 + -^о( —(5)). п 2. (а) Покажите, что V (xr~xr-i) = хп~хо- г—1 (б) Получите выражение для суммы первых п целых чисел. Решения п п п (а) 2 ^xr xr—i) 2 — 2 xr—i г=1 Г=1 Г=1 (по тождеству 1)= п— 1 п ==л'п_1_ 2 Хг —2 хт—1 Г=1 Г=1 (по тождеству 6)= п — 1 п — 1 =хи+ 2 Хг~ 2 хт (по тождеству 4) = г=1 г=0 n—1 п—I = *п + 2 Хг—2 хг—хо (по тождеству 6) = Г=1 Г=1 — хп Х0- (б) Имеем: л л п 2 г~ 2 r = 2 (п—г< (по тождеству 5) = г=1 г=0 г=0 1 п п = 2 г + 2 («~г) = z Lr = O r=0 1 п = —- 2 п (по тождеству 1) = 2 г=0 (по тождеству 2) = =т('г+1) Упражнение 1.2.2 Выпишите в развернутом виде следующие суммы: 1. 2 ''('•-!)• 2. 2 (/'+1 2)аг. 3. 2 (-1)гт2. г=1 г—1 Г=1 2п 4. 2 (1+(-1)Э- г = 0 40
Выразите следующие суммы с помощью знака S: 5. 1-4 + 2- 5+ 3- 6+ ...,п членов. 6. 1 — 2 + 3 — 4 -| .... 20 членов. 7. 1/л3 + 1/(п + IIs + 1(«+ 2)3 + ... + 1/(2п)3. 8. 1 + 3 + 5 + 7 +-.., 10 членов. 9. 1-2 + 3- 4+ 5-6 + 7- 8+ ..., п членов. 48 48 ______ 10. (1) Упростите у [/ (г + 1) — / (г)]. (2) Вычислите у [ J г + 1 — [+]. г=1 г=1 1.2.5. ПРИМЕНЕНИЕ ОПЕРАТОРА СУММИРОВАНИЯ Рассмотрим несколько примеров с оператором а) Математические ряды. Читатель, возможно, знаком с разло- жением в ряд некоторых элементарных функций. В примерах (1) — (3) верхним пределом для г будет оо (бесконечность). Это означает, что процесс суммирования ведется неограниченно долго, причем г «про- бегает» все натуральные значения. (Для бесконечных рядов возникает важный вопрос о их сходимости, который здесь не затрагивается.) Примеры разложения в ряд некоторых элементарных функций: (1) у—- = ! + %+— + ... (экспонента ех). 00 х2г +1 X3 X5 (2) у ==х + 'зГ+'5|”,_’” (гипеРболический СИНУС> shx). 00 х2г х2 х4 (3) 2 1 + — + — + ... (гиперболический косинус, ch х). И / Н \ / ft \ (4) У g"-rpr=gn+ 1?n-lpl + ... + pfl г =0 \ Г ) \ 1 ! (биномиальный ряд; разложение (д + р)п, когда п — целое число). п \ nl г / (п—г)!г! Замечание. , эти выражения обычно обозна- чаются как Сгп и называются биномиальными коэффициентами. б) Умножение векторов. Вектор-строка есть строка элементов /Уг\ (хх, х2, л'з), вектор-столбец есть столбец элементов lya I. +з/ В векторной алгебре скалярное произведение вектора-строки на вектор-столбец определяется следующим образом (на примере трех- мерных векторов): (1Л\ 3 (х1; х2, х3) у2 = Xi yr + х2 у2 + х3 у3 = у Xi yt. \Уз/ i==1 41
Числовой пример /2х (3, 1, 2)1 4 1 = 3-2+ 1.4 + 2-6 = 22. \6/ Читатель встретит умножение такого типа в гл. 1.3, посвященной теории матриц. Скалярное произведение также рассматривается при изучении конечных цепей Маркова (см. гл. 3.1). в) Выбор рчные характеристики. Здесь мы немного забежим вперед и изложим некоторые статистические понятия из материала второй части книги. Допустим, что эксперимент осуществляется п раз и каждый раз результат фиксируется в виде некоторого числа; в итоге возникает множество, состоящее из п чисел. Это множество называется выборкой объема п, и его элементы обозначаются символически хг, х9, хп. Арифметическое среднее выборки определяется как п У хг -=Х1+х2+хз+...+хга или - = п п Это число служит мерой «центрального» значения всех результатов, которые можно было бы получить, если бы число экспериментов было неограниченно. Среднее значение случайной величины называют мате- матическим ожиданием. Чтобы измерить рассеяние (разброс) значений случайной величины около математического ожидания, пользуются выборочной диспер- сией п 2 (хг—х)2 Г=1 п Пример Кость бросают пять раз, и результаты образуют выборку {6, 1, 1, 4, 3}. Найдите арифметическое среднее и дисперсию выборки. Арифметическое среднее равно Б “ r?iXr 6+1+ 1 + 4+3 „ л —• -' ' —----------— о. 5 5 Выборочная дисперсия равна 5 2 (*г-Э2 г=1 3* + (—2)2+(—2)2+12 + 02 42
Упражнение 1.2.3 1. Покажите, что sbx + ch х = ех, пользуясь разложениями этих функций в ряд, указанными в 1.2.5, (а). 2. Раскройте следующие суммы: 3 / О \ 4 (О 2 (2) 2 r = 0\r 1 /=0 (3) qe~kpk. ( 6 k k Вычислите каждую сумму при р = 1/2, р = 1/4, р = 3/4; q = 1 — р. 3. Вычислите следующие скалярные произведения: (1 2 3 / 0 \ / 1 ; (2) (-1, -1,0) ( 3 ]; (3) (2, -1, 0, 4) ® \ 4 J \ о 4. Представьте следующие скалярные произведения векторов в виде сумм как с помощью знака 2, так и подробно выписывая их: (1) (s0, si, s2, s3) 5. Найдите среднее арифметическое и дисперсию для каждой из следующих выборок: (1) {3, 5, 1, 2, 4, 3}; (2) {1, 2, 3, 4, 5}; (2) {—1, 0, —1, 4, 3}; (4) {8, 7, 6, 3}. 6. Покажите, что для любой выборки объема п выполняются соотношения: (1) 2(х—х) = 0; (2) 2 (х—х)2=2х2— пх2, где х=---- • 7. Рассмотрим множество значений х : {х1( х2, х3, х4}. Предположим, что каждому хг соответствует некоторое число (мы будем называть его частотой). " "г Выпишите в развернутом виде ^rXr> ^PfrXr. г=1 г=1 Вычислите эти суммы в каждом из следующих случаев: Значения х 5 10 15 20 Частоты 3 5 10 2 А + dr, где А — постоянная Значения х 3 5 7 9 Частоты 14 8 7 8. Покажите, что если 2/r = N и хг = величина, то 2fr xr = 2frdr + N • А. 43
1.2.6. ДВОЙНОЕ СУММИРОВАНИЕ Часто для указания двойной классификации удобны два индекса при дискретной переменной. Например, возьмем выборку объемом в тридцать школьников (школьники отбираются случайным образом) и будем группировать школьников по двум признакам: полу (мальчик, девочка) и цвету волос (темный, каштановый, белокурый, рыжий). Результаты группировки приводятся в следующей таблице с двумя входами: 1 Цвет волос Т К Б Р Итого М Пол Д 5 8 12 3 7 3 1 16 14 Итого 8 15 4 3 30 Числа в клетках таблицы соответствуют численности школьников в различных группах. Так, величина, стоящая в первой клетке (в ле- вом верхнем углу), равная пяти, означает, что в выборке есть пять мальчиков с темными волосами; из содержимого следующей клетки известно, что есть восемь мальчиков с каштановыми волосами, и т. д. Мы обозначим частоты в клетках таблицы символами Хц\ индексы i, j указывают, что клетка находится на пересечении i-й строки и /-го столбца. В нашем примере i равняется! ,2 (соответствует М и Д); / равняется 1, 2, 3, 4 (соответствует четырем цветам волос: Т, К, Б, Р). Элементы верхней строки: — 5, х12 = 8, х13 = 1, х14 = 2; элементы ниж- ней строки: ха1 = 3, х22 = 7, х23 = 3, х24 == 1. Сумма элементов первой строки равна 4 У xi} = + х12 + х13 + х14 = 5 -р 8 + 1 + 2 = 16; /=1 сумма элементов второй строки равна 4 У1 , x2j = х21 + х22 + х28 + х24 = 3 + 7 + 3 + 1 = 14. i=i Чтобы получить общий итог, мы воспользуемся оператором S дважды. 4 2 Общий итог = 2 2^ = (-41 + -41) + (-4.2 + Х22) + (Л'13 + Л'23) + / = И=1 + (Х14 + %24)- Это означает, что сначала х1} суммируется по i (т. е. получены сум- мы по столбцам), а затем суммы по столбцам суммируются по /. Таким - 44
образом: 4 2 4 2 2 X‘i= 2 /=1/=1 /=1 = У (сумма по /-му столбцу) = / = общий итог. Очевидно, что порядок, в котором выполняется двойное суммиро- вание, не влияет на результат. Мы установим это как общую теорему. Теорема. Пусть на пересечении i-й строки и j-го столбца таблицы размером т X п стоит значение xiS. Тогда пт т п У 2 Хц= 2 2 хч- 7=1 z = l z=i/=i п т п Доказательство, у у xi} = у (х1}- + ... + хт]) = /=! /=1 /=1 = J -4j4~--- + У Мш = (^114_Л'124_"-4_Л:1п)4_"-4_(Л'т14_Л:?п24‘'...4-Л:тп)- Г=1 /=1 Убрав скобки, перегруппируем слагаемые и расставим скобки по- новому; получим: С^’11 4~ ••• 4~ ^ml) 4 (-^12 4" ••• 4~ ^ms) 4~ ••• 4~ (М.п 4- 4" т т т = 2 Л'14- У xi2 4-... 4- У xin — i=i z=i »=i = Z Uii4-xi24-...4-xin)= V | У хгд i==l i=l \/=l / Отсюда вытекает: п m m n 1 V хи= 2 2 x‘i- /=i/=i z=i/=i Примеры Следующие примеры показывают, как выполняются операции над переменными с двойными индексами. 1. Образуйте общую таблицу с двумя входами для х^ при t = 1,2 и / = 1, 2, 3. Решение J = 1 / = 2 /=3 S xij J —1 04 II II Xll X21 X12 X22 X'13 Хцз Ri R2 Sx0 Ci C2 c3 i i 45
3 Через Rt обозначена сумма по f-й строке: Rt = Яхц. i=x 2 Через Cj обозначена сумма по /-му столбцу: С} = у х;;. «=1 3 2. Напишите в развернутом виде суммы (1) 2xi} и «=1 (2) /=2 Л Решения (1) Хц + х2} + х3}. (2) xi2 4- xl3 + xit. 2 3 3. Напишите в развернутом виде у xt (xt + #/)- /=1 1X1 Решение 2 2 [*1 (Х1 + У]) + Х2 (,Х2 4“ У)} + х3 (х3 + у})] ~ /=1 2 = 2 + Х* + + <Х1 + *2 + *з) У}] = 7=1 2 = 2 (х* + х2 + х2) + (%1 + х2 4- х3) 2 tjj = /=i = 2 (х2 4- %2 + Х2) + (Х1 + х2 4- Х3) (уг 4- у2). С другой стороны, 2 2 Х‘ (Xi + У?> =22 (Xi + Xi У}) = i=4=i z=iz=i 9 4 9 4 = 2 2** + 2 2ЗД= /=i(=i f=i i=i 2 3 = 2(x|4-x2 4- x2)4- 2 У] 2 х^ = i = l Z = 1 = 2 (x? 4- x2 4- x2) + 4- y2) (Xj 4- x2 4- XJ). При известной практике двойные суммы такого типа могут быть выписаны очень быстро. Упражнение 1.2.4 1. Напишите таблицу с двумя входами (см. пример 1), обозначая через yTS содержимое rs-й клетки таблицы, где г == 1, 2, 3 и s = 1, 2, 3, 4. Выпишите суммы по строкам, суммы по столбцам, а также полную сумму с помощью знака S. 2. При Rr = 8, Хц = 1, х12 = 4 и j = 1, 2, 3 найдите х13. 3. При Сг = 12, х12 = 4, х32 = 8 и i = 1, 2, 3 найдите х22. 4. Напишите в развернутом виде следующие суммы: 5 4 3 2 (1) (2) 2 Уг^, (3) 2 xip i—1 s = 0 , 46
2 4 2 3 4 2 (4) У У yrs', (5) У У, х1}\ (6) у У Уг&, Г=\а=Ъ i=\ j=\ S = Qr=\ 2 2 4 (7) У У (2xi;-+3)x0; (8) У aij.bjh- 7=17=1 /=1 5 2 3 i (9) У Prs'4st> (Ю) у у 2 • s=l 7=17=1 ХЦ 5. С помощью результатов, полученных в предыдущем задании, покажите, что (3) = (5) и (4) = (6). 6. Покажите, что х?/—т-п-х2, где mt 1 I i i j = 1,..., n. Следующее задание познакомит читателя с употреблением многоиндексных величин. 7. Раскройте следующие суммы: 2 3 2 4 (1) У У (Ч?+М); (2) У У /=17=1 7=17=1 2 2 12 (3) У У al}-b}h-, (4) У У 2(777^+1); 7=17=1 / = 0 7=1 1 4 2 7 а (5) У У xt (2хг-5х;); (6) у У -----; 7=0 7 = 2 7=17 = 6 1—07/ 2 2 2 3 2 1 (7) У 2 У хиь; (8) у У У №-1).
1.3 ГЛАВА МАТРИЦЫ В этой главе мы кратко изложим алгебру матриц. Она оперирует математическими объектами, представляющими собой блоки чисел, или элементов. Алгебра матриц и матричное исчисление применяются во многих практических задачах; некоторые из них упомянуты в 1.3.2; в большей мере мы будем пользоваться матрицами во второй и третьей частях книги. 1.3.1. ОПРЕДЕЛЕНИЕ Определение 1. Матрицей называется прямоугольная таб- лица чисел. Отдельные числа (или символы, заменяющие их) называют- ся элементами матрицы. Таблица обычно заключается в квадратные (или круглые) скобки. Примеры 4. D = [3 5 1/2 1]. Замечания (1) Обычно для обозначения матриц пользуются заглавными бук- вами, а соответствующими малыми буквами обозначают их элементы. (2) Общий элемент матрицы А записывается в виде а:р, он распо- лагается на пересечении i-й строки и /-го столбца матрицы. Благо- даря этому матрицу можно записать так: А = 1аг>], i = 1, ..., т, j = 1, ..., п, где т—число строк и п—число столбцов в матрице (см. пример 3). Определение 2. Говорят, что матрица имеет порядок т X п (читается «т на п»), если она содержит т строк (горизонталей) и п столбцов (вертикалей). 48
Если т = п, то матрица называется квадратной. Матрица порядка 1 X п называется вектором-строкой, а матрица порядка тX 1 — вектором-столбцом. Примеры 1. Матрица 3 6 5 2 3 0 Л = имеет две строки и три столбца. Это — матрица порядка 2x3. 2. Матрица В = 5ц ^21 512 ^22 _ квадратная матрица порядка 2 X 2, или просто матрица второго по- рядка. 3. С = [2 3 4 5 6] — вектор-строка порядка 1 X 5. Г 0=3 — вектор-столбец1 порядка 3x1. 5 Матрица R = Г1 — 2 41 имеет порядок 2x3; О 3 6 4. 5. гп — 1 (пересечение 1-й строки и 1-го столбца); г-12 = — 2 (пересечение 1-й строки и 2-го столбца); г13 = 4 (пересечение 1-й строки и 3-го столбца); r2i = 0 (пересечение 2-й строки и 1 -го столбца) и т. д. Определение 3. Матрица, все элементы которой равны нулю, называется нулевой матрицей и обозначается 0. Квадратная матрица порядка п, у которой все элементы главной диагонали1 2 равны 1, а все остальные элементы равны 0, называется единичной матрицей. Например, единичная матрица четвертого поряд- ка есть 10 0 0 0 10 0 0 0 10 0 0 0 1 Единичная матрица обозначается буквой I. 1 Иногда удобнее записывать вектор-столбец горизонтально, при этом он заключается в фигурные скобки. Например, ' 1 ' {13 5}= 3 . 5_ 2 Главная диагональ идет из верхнего левого угла матрицы в ее правый нижний угол. 49
Мы увидим, что нулевая и единичная матрицы1 играют такую же роль в алгебре матриц, как 0 и I в обыкновенной алгебре. Упражнение 1.3.1 1. Дана матрица 3 —5 2 6 4 5 — 1 0‘ [3 1 —6 11 Установите ее порядок, выпишите элементы /и, /2з. ^зг» Йза> бз- 2. Выпишите отдельно три вектора-строки и четыре вектора-столбца мат- рицы Т из предыдущего примера. Определите порядок каждого вектора. 3. Установите порядок каждой из матриц, приведенных в примерах после определения 1. 4. Выпишите полностью квадратную матрицу S = [s,j] третьего порядка, считая, что = 2j при i = 1, j = 1, 2, 3; Sjj = 3 j при i = 2, j = 1, 2, 3; все остальные s;y равны нулю. 5. Выпишите квадратную матрицу Р = четвертого порядка, полагая, что ptj = 1 при i = /, ptj = (i + /) при i < j и ptj = — (i + j) при i > j. 6. Выпишите нулевые матрицы, имеющие порядок 2 X 2 и 3 X 4, а также нулевые векторы, порядок которых 1 X 3 и 5 X 1. 7. Выпишите единичные матрицы, имеющие порядок 3 X 3 и 5 X 5. 8. Какое существует соотношение между индексами I и / у элементов, стоя- щих на главной диагонали матрицы [ayl? 1.3.2. ПРИЛОЖЕНИЯ АЛГЕБРЫ МАТРИЦ Прямоугольные таблицы чисел встречаются в разнообразных математических ситуациях. Ими можно оперировать как самостоятель- ными математическими объектами. Формализация операций над мат- рицами привела к созданию алгебры матриц. В этой главе мы дадим элементарное введение в алгебру матриц, определим основные действия с матрицами и рассмотрим некоторые их следствия. Вначале мы коротко остановимся на нескольких прикладных за- дачах, чтобы дать читателю минимальное представление об исполь- зовании этих алгебраических понятий. а) Системы линейных уравнений. Рассмотрим следующую систему < линейных уравнений: 3x + 2// + 4z= 1; —х +у + 2z = —5; (1) х —2/y + 3z = 2. Мы можем составитьпрямоугольную таблицу чисел из коэффициен- тов при переменных х, у, г: 2 1 4 2 3 1 1 Матрицы будут обозначаться заглавными буквами латинского алфавита, векторы-столбцы или векторы-строки — малыми, полужирным шрифтом. Для нулевой и единичной (тождественной) матриц будут использоваться специальные символы О и I. 50
Такая таблица называется матрицей коэффициентов системы. Далее мы представим переменные х, у, г и свободные члены уравнений сис- темы в виде двух векторов-столбцов: Теперь систему уравнений можно записать таким образом: или короче: 3 2 4 — 1 1 2 1 —2 3 Ах = п. (2) (3) Мы покажем позже, что умножение и равенство матриц определены таким образом, что системы (1), (2), (3) эквивалентны. Кроме того, может быть найдена матрица Л-1 (называемая обратной1 к Л и та- кая, что А-1 Л = Г), позволяющая решить матричное уравнение (3): Ах = п умножением обеих его частей на Л-1: Л-1 Ах = Л-1 и. Умножение вектора х на Л-1 Л оставляет его неизменным (сравните с умножением на 1 в обычной алгебре). Поэтому х = Л-1 п. Итак, мы видим, что с помощью матриц можно решить систему линейных уравнений так же, как решается одно уравнение типа ах = b в обычной алгебре. Преимущества такого метода очевидны. Конечно, для получения численного решения системы выражение Л-1« должно быть некоторым образом вычислено; иногда это довольно трудоемкий процесс. Однако в теоретических работах не приходится выходить на численный уровень; в них оперируют матричными урав- нениями и получают решения в общей матричной форме. Такие решения исследуют качественными методами, не обращаясь при этом к конк- ретным числовым значениям. б) Транспортные издержки. Предположим, что компания имеет два завода (Л и В) и три склада (7?, S, Т). Продукция заводов должна ежедневно перевозиться на склады. Необходимо так выбрать маршруты перевозок продукции заводов на склады, чтобы общие затраты на пере- возки были как можно меньше. Задачи такого типа называются транс- портными, они представляют собой объект изучения теории исследо- вания операций (см. гл. 3.3). 1 Не всякая матрица имеет обратную. Вопрос обращения матриц рассмат- ривается в 1.3.10. 51
Для решения этой задачи необходимо как можно точнее определить затраты на перевозки грузов по шести различным маршрутам. Эти величины удобно расположить в виде матрицы: Склады к S Т 3 а в А Си с12 с13 о Д ы В С21 С22 с23 Матрица затрат Элемент сг1 равен затратам на перевозку единицы продукции с завода Л на склад /?; элемент с12 равен затратам на перевозку единицы продук- ции с завода А на склад S и т. д. в) Матрицы перехода. В гл. 3.1 излагается теория конечных цепей Маркова, в которой стохастические матрицы играют основную роль. (Матрицы, элементы которых являются вероятностями, называются стохастическими.) Этот тип матриц мы рассмотрим на очень простом примере. Предположим, что погода на некотором острове в Море Математики может ежедневно меняться. Она будет либо дождливой (Д), либо сол- нечной (С). Результаты ежедневных наблюдений за погодой в течение длительного периода времени записаны в виде последовательности С, С, Д, Д,Д, С, Д, С, ... При анализе этой последовательности в изменени- ях погоды была обнаружена следующая статистическая регуляр- ность: (1) за дождливым днем следует дождливый день в три раза чаще, нежели солнечный; (2) за солнечным днем следует солнечный день в два раза чаще, нежели дождливый. Замеченные закономерности могут быть выражены в терминах вероятностей перехода1, образующих следующую матрицу: Погода на второй день Д С Погода в первый день Д С 3/4 1/4 1/3 2/3 Первая строка матрицы указывает, что дождливый день следует за дождливым с вероятностью 3/4, а солнечный день следует за дожд- ливым с вероятностью х/4. Эти вероятности находятся в отношении 3 : 1 (в соответствии с замеченной закономерностью (1)), и их сумма 1 Мы полагаемся на интуитивное представление читателя о вероятности. Ма: тематическая теория вероятностей излагается в гл. 2.1. 52
равна 1 (как и должно быть, так как заранее известно, что погода на второй день будет либо солнечная, либо дождливая). Они стоят в клетках таблицы (Д, Д) и (Д, С) соответственно. Во второй строке стоят вероятности того, что за солнечным днем следует дождливый, и того, что за солнечным днем следует солнеч- ный день. С помощью этой матрицы переходов мы можем ответить на неко- торые вопросы, имеющие вероятностный характер и касающиеся по- ведения погоды на острове. Теперь мы вернемся к описанию основных правил матричной ал- гебры. 1.3.3. РАВЕНСТВО МАТРИЦ Определение. Две матрицы равны между собой, если (1) они имеют одинаковый порядок и (2) их соответствующие элементы равны. В принятых обозначениях это определение выглядит так: матрица А = равна матрице В = если: (1) матрицы А и В имеют одинаковый порядок; (2) Ojj = btj для каждой пары i, j. Примеры 3 4 5 6 (1) 3 4 . /g) 1 л: 14 5 6J’ V 0J ” .8 О Из равенства матриц (2) следует, что х = 4 и у = 8. 1.3.4. СЛОЖЕНИЕ МАТРИЦ Определение. Пусть матрицы А = [с,;] и В = [6 гу] имеют одинаковый порядок. Тогда суммой матриц А и В будет матрица А + В = [ т. е. суммой матриц А и В является матрица, каждый элемент которой равен сумме соответствующих элементов матриц А и В. Сложение матриц разных порядков не определено. Примеры ! [2 31 , 1 4 ' [1 2J 12 2. 1 2 3, 2 0—14 —2 2+1 3 + 4 = 3 7 1+1 2+2 2 4 1 61 = Г 3 3 9 0 —1 —2 —1 3 3. Если С и D — матрицы порядка 2 X 2, то lcij] + Mij] — Сц + (11г С21 + С12 4" ^12 ^22 + ^22 53
4. 3 4 —2 3 4 —2 3 4 —2 О О О О о о + 1 5 2 1 5 2 1 5 2 О О О О О О 5. Рассмотрим дгу? матрицы: 1 2 3 4 3 2 1 1 — 1 2 Сумма их не определена, так как матрицы имеют разный порядок. Упражнение 1.3.2 Найдите (когда это возможно) матрицы Л + В, В + >4, В г С, С + В, С А, А + С, С + D, D + С, D + Е', Е + D, А + О, В + О, С+ О, О + + В, О + Е. Г х 2х 3x1 Г 2х у О 2. Сложите матрицы и L у — х 4yJ L 2У х Зу 3. Определите значения х, у и г, если X 1 2 ' 2—х 1 2 5 У 0 = 5 2у-1 0 4 3 Z 4 3 l+4z Законы сложения. Пользуясь определениями равенства и сло- жения матриц, легко показать, что если А, В, С и О:— матрицы одного порядка, то (1) А + (В + С) = (Л + В) + С, и, следовательно, мы можем написать в обеих частях просто А + В + С. (2) А + В = В + А. (3) А + О = О + А = А. Из (1) и (2) видно, что сложение матриц подчиняется законам ас- социативности и коммутативности. Закон (3) является законом тож- дества, роль нейтрального элемента (нуля) играет нулевая матрица. 54
1.3.5. УМНОЖЕНИЕ НА СКАЛЯР Когда мы говорим об умножении матрицы на скаляр, мы подразу- меваем умножение на действительное число (или на символ, его пред- ставляющий). Определения (1) Если т — некоторый скаляр и А = [аг;] — матрица, то т • А = [mai}], т. е. чтобы умножить матрицу на скаляр, надо каждый элемент мат- рицы умножить на этот скаляр. (2) mA = Ат. Примеры а) Вычитание матриц Определения (1)-Л =(-1)Л; (2) А — В = А + (—1) В (Л и В имеют одинаковый порядок). б) Теоремы об умножении на скаляр. Рассмотрим какие-либо две матрицы А и В, имеющие одинаковый порядок, т, п — скаляры. Тогда: (1) (тп) А = т (пА~)-, (4) 1А = А, ОД — О; (2) т (Л + В) —,тА + тВ\ (5) А + (--Д) = (—Д) 4- А = О; (3) (т + ri) А = mA 4- nA-, (6) 2Д = А 4- А, ЗА = А 4- А 4- А и т.д. Эти теоремы следуют из определений, приведенных в 1.3.3— 1.3.5. Упражнение 1.3.4 Г1 — П г0,3 0,6] 1. Вычислите: (1) 6 ; (2) — 10 0 —1 L2 10,2 0,5) 1 (5) 100 8 0 10 0 0 1 —6 4-2 о 1 0 0 0 1 0 0 0 1 о о 1 о о о 1 55
2. Докажите теоремы (1) — (6) об умножении на скаляр. 3. Найдите значения v, w, х, у из матричного уравнения 1x21 Г 1 У 1 Г 0 0 1 3 _2 J = I I 1 v j l 2 J j 0 0 J 4. Вынесите скалярный множитель из матриц: 1 (1) 40 4 0 16 12 0 8 1.3.6. УМНОЖЕНИЕ МАТРИЦ Мощность матричных методов и широта их применения основы ваются на операции умножения матриц. Без сомнения, это замеча- ние покажется читателю очень странным, однако при небольшом прак- тическом знакомстве, а затем и более глубоком изучении приложений его недоумение вскоре рассеется. Мы начнем с определения произведения двух векторов (т. е. двух однолинейных матриц). а) Произведение вектора-строки на вектор-столбец. Пусть даны вектор-строка а = [бд а2 ... ап] и вектор-столбец Определение. Произведением векторов а и b называется п = 4д£д + а2/)2-'г ... + anbn = i=i Замечания (1) произведение векторов есть скаляр; (2) обычно оно называется скалярным произведением-, (3) векторы а и b должны иметь одинаковое число элементов; для векторов с различным числом элементов скалярное произведение не определено Примеры 1. Если а = [3 4 5] и Ь = 1 то а-Ь = [3 4 5] = 3-1 + 3 + 4-2+ 5-3 = 26. 2. с = [2 6], d = cd = 2(—-1) + 6-4 = 22. 56
Упражнение 1.3.5 1. Пусть даны векторы: а=[3 4 5], b=[—1 0 —8], с = — 1 2 —2 Найти: (1) а - с; (2) а - Ь; (3) b e; (4) b - d; (5) а . (с + d); (6) b - (с + d); (7) (а + Ь) • с; (8) (а + Ь) • d. Показать, что а • (с + d) = а с + а • d; b - (с + d) = b • с + b • d; (а + b) • с = а • с + b • с; (а + Ь) • d = а • d + + b • d. 2. Пусть а — вектор-строка и Ь — вектор-столбец, имеющие одинаковое число элементов, а т, п — скаляры. Покажите, что выполняются следующие равенства: (1) (ma) - b = т (а Ь); (2) (та) (nb) = (т/г) (а • Ь) = та (пЪ) = = a (mnb). б) Произведение двух матриц. (1) Матрицы порядка 2x2. Сна- чала мы рассмотрим умножение квадратных матриц второго порядка, затем мы определим умножение матриц в общем виде. Пусть 'А В ' С D а b с d Определение. Произведением матриц S и Т (обозначим его через ST) является ’ А В a b~ ~Аа-\-Вс AbJ-Bdl CD cd Са-\-De Cb + Ddj Покажем, как образуется это произведение. Представим себе, что мат- рица S (левый множитель) состоит из двух векторов-строк, т. е. И BJ1 ги/ [С £)]] [R2_ а матрица Т (правый множитель) состоит из двух векторов-столбцов °1 Р с d — [Ci С2]. Тогда каждый элемент матрицы ST есть скалярное произведение век- торов R; • Су, т. е. R.-Q Ra‘ Ci Ri-C2 r2c2 Например, элемент, стоящий на пересечении 1-го столбца и 1-й строки, равен RrC1 = [/4 В] = Аа -| - Вс. 57
Обратив внимание на индексы у элементов матрицы ST, можно вы- вести следующее правило. Правило умножения матриц. Элемент, стоящий на пересечении t-й строки и j-ro столбца матрицы ST, будет скалярным произведением i-й вектора-строки матрицы S и j-ro вектора-столбца матрицы Т. Пример Я S [2 3 4 5 1 3 2 4 Т = ST = '2 3 4 5 1 2’ 3 4 12 3]’ .14 5]. [2 3] [4 5] [2 3] [4 5] '2-1+3-3 2-2 + 3-4 4-1+5-3 4-2 + 5-4 Г11 161 19 28 Упражнение 1.3.6 1. Вычислите следующие матричные произведения, выписывая подробно каждый шаг: О 1 ° 1 1 ] ’ скалярные произве- 3. Попытайтесь вычислить произведение матриц 2 3 1 1 1 J 4 5 О 1 6 3 с помощью скалярного произведения левых векторов-строк па правые векторы- столбцы. Почему нельзя найти это произведение? (2) Общее правило умножения матриц. Сформулируем условия существования произведения матриц и правило его вычисления. Пусть Л — матрица порядка г X s, а В — матрица порядка т х п. Тогда: (а) Произведение матриц А и В определено, если s = т, т. е. если • число столбцов матрицы А равно числу строк матрицы В. Если s #= т, то матрицы будут несогласованными и их произведение не определено. 58
(б) Если s = т, то матрица-произведение АВ имеет порядок г X В. (в) Если произведение матриц определено, то элемент, стоящий на пересечении i-ii строки и j-ro столбца матрицы АВ, равен скаляр- ному произведению i-й вектор-строки матрицы А на j-й вектор-стол- бец матрицы В (это правило уже было сформулировано раньше). Таким образом, если А и В — матрицы порядка г X s и т X п соответственно и s = т, то их произведение может быть записано в виде п. Пример (1) А и В — матрицы порядка 2 X 3 и 3 X 3 соответственно, ус- ловие s = т (3 = 3) выполняется, следовательно, их можно умно- жать. (2) Матрица АВ имеет порядок 2x3. Следующая схема указывает, как можно определить порядок матрицы-произведения: (rXs) • (sx п) -> (г X п). I 1 (3) АВ = '2 3 4' 1 2 3 1 2" 1 2 2 1 2-1 + 3-2+4-2 2-1 + 3-I+4-2 2-2 + 3-2-1-4-1 1-1 + 2-2 + 3-2 1-1 + 2-1 + 3-2 1-2 + 2-2 + 3-1 16 13 14 11 9 9 Упражнение 1.3.7 (1) Установите, для каких пар матриц определено их произведение (пары рассматривать в данном порядке): А, В; В, А; А, С; С, A; A, D; D, А; А, Е; Е, A, A, F; F, А; С, D; D, С; С, Е; Е, С; С, F; F, С; D, Е; Е, D\ D, F; F, D. (2) Для каждой из согласованных пар определите порядок матрицы-произ- ведения. (3) Вычислите произведение матриц для каждой из согласованных пар. 59
2. Вычислите произведение матриц: j (дистрибутивные законы); Найдите произведения: Al, 1А, AJ, J А, АК, КА, AL, LA. Внимательно следите за результатами этих операций. в) Теоремы об умножении матриц. Для различных комбинаций сумм и произведений матриц можно доказать справедливость следующих теорем: (1) (ЛВ) С — А (ВС) (ассоциативный закон); (2) А (В + С) = АВ + АС (3) (В + С) А = В А + СА (4) т (АВ) = (mA) В = А (тВ)„ где т — скаляр. Читатель должен был заметить, что умножение матриц не комму- тативно, т. е., вообще говоря, АВ В А. Действительно, часто одно произведение (скажем, АВ) существует, а другое (ВЛ) не определено. Примеры ЛВ=Н=ВЛ. О 1 2 [Г* 7 Q -1 „ ' ° , а В А не определено. 2 и т I Упражнение 1.3.8 Проверьте справедливость теорем об умножении на примере этих матриц и ска- ляра т. Покажите также, что АВ =А В А, ВС СВ, С А АС. 1.3.7. ТРАНСПОНИРОВАННАЯ МАТРИЦА Определения (1) Матрицей, транспонированной к матрице 60
^12 ••• ^ln A = &21 ^22 ••• ^2П _^тп1Кт2 — ^mn— называется матрица ^11 ^21 • %*. A a12 a22 • am2 _ й1п ^2?» • • • ^mn — Таким образом, чтобы получить транспонированную матрицу, надо строки и столбцы исходной матрицы поменять местами. (2) Если А = А', то матрица А называется симметрической,. (3) Если А = — А', то матрица А называется кососимметрической. Примеры 1. 2. ГЗ 41 А "2 А = 3 4 41 следовательно, — симметрическая матрица. 3. А ’ 0 2 3' — 2 0 4 — 3 —4 О — З- — 4 О следовательно, матрица А — кососимметрическая. Л = 1 О 2 1 3 О 5 А 5 1 А 3 1 4 2 2 3 4 О 1 3 О 5 4 5 1 Упражнение 1.3.9 Г1 0 8—1“] 1. Транспонируйте матрицу 2 3 1 6—1 О 4 2 2. Покажите, что (Л'}' = A; mA’ = (т А)'; (Л + В)' = Л' + В’. 3. Покажите, что симметрическая матрица должна быть квадратной. 4. Покажите, что если Л — симметрическая матрица, то ац — ац для всех I, j. 5. Покажите, что если Л — кососимметрическая матрица, то (1)а,у = = — ац для всех i, j и (2) все элементы ац главной диагонали должны быть рав- ны нулю. 1.3.8. ОПРЕДЕЛИТЕЛЬ МАТРИЦЫ Каждой квадратной матрице А можно поставить в соответствие некоторое число, называемое определителем матрицы А; обозначим его | А |. Определитель матрицы вычисляется по ее элементам. 61
а) Определитель матрицы второго порядка. Определение. Пусть дана квадратная матрица второго по- рядка А — й11 °12 _#21 #22. Ее определителем называется число И1 = #11 #12 #21 ®22 — йц • #22 #21' ^12- 3. Процесс получения значения определителя можно изобразить в виде диаграммы: I a b I ,т2> , , I# d I c'-'-~d~ + a ' d ~ c ‘ b. Упражнение 1.3.10 Вычислите определители следующих матриц: ГЗ 21 Г—1 21 Г1 01 ГО 11 1. . 2. -3. .4. [2 1] [ -3 2j |0 1J [1 О] Га dl Г1 *1 Га-|-Ь а—Ь] Г Ю 111 5. . 6. .7. . 8. - [с b j 1.x 1J \а— Ь a+Z>J [ 12 13J б) Определитель квадратной матрицы третьего порядка. Каждому элементу квадратной матрицы (порядок которой больше или равен 3) можно поставить в соответствие два числа, называемые минором и алгебраическим дополнением. Мы покажем, как они вычисляются, а затем дадим формулу для вычисления определителя матрицы. Начнем с примера. Рассмотрим квадратную матрицу а b с 2 1 0 3 2 4 С каждым элементом верхней строки мы сопоставим определенную матрицу, получаемую из матрицы А мысленным вычеркиванием стро- ки и столбца, на пересечении которых стоит рассматриваемый элемент. Определитель полученной матрицы называется минором соответству- ющего элемента. 62
Минор элемента а равен минор элемента b равен минор элемента с равен = 4; = 8; = 1. 2 О 3 4 2 1 3 2 Каждый элемент квадратной матрицы имеет минор. Определим общую процедуру нахождения миноров. Определение. Минором элемента ац квадратной матрицы А = [а,;] (любого порядка) называется определитель матрицы, получаемой из матрицы А вычеркиванием строки и столбца, на пере- сечении которых стоит элемент Пример. В матрице а I) с 2 1 О 3 2 4 элемент а22 = I; он стоит на пересечении второй строки и второго столб- ца. При вычеркивании этих строки и столбца остается матрица а с 3 4 а с 3 4 3 : 4 следовательно, минор элемента п22 равен а с 3 4 = 4а — Зс. Определение. Алгебраическим дополнением элемента ац на- зывается минор элемента а^, умноженный на (—1)‘+Л Обозначив минор и алгебраическое дополнение через Мц и соответственно, мы можем написать = (—1)‘+7 • Мц. Примеры Рассмотрим матрицу 1 2 3 2 1 О 3 2 4 63
Выпишем несколько элементов и вычислим их миноры и алгебраические дополнения. Элемент >+/ Минор Алгебраическое дополнение #11 ~ 1 4+1=2 1 ° =4 2 4 (—I)2.4 = 4 #23 “ Ч 2 + 3 = 5 1 2=-4 3 2 ( —1)5-( —4) = 4 #31 = 3 3 + 1=4 23=-з 1 0 (-1)4.(-3) = -3 #32 = 2 3 + 2 = 5 1 з = —о 2 0 (-!)«.(-6) 6. Очевидно, что алгебраическое только знаком от соответствующего минора. Знаки алгебраических дополнений элементов лицы (на пересечении элемента ац): дополнение элемента отличается матрицы А i-й строки = leZjj] расположены в виде таб- и /'-го столбца стоит знак Atj для Упражнение 1.3.11 1. Вычислите миноры для всех элементов матриц: (1) ’ 2 1 О 3 1 4 —12 5 О Г 3 —1 2 4 2 Г 5 6 1 2 2. Вычислите алгебраические дополнения для всех элементов матриц из предыдущей задачи. Теперь мы в состоянии вычислить значение определителя третьего порядка. Определение. Пусть А — некоторая матрица третьего порядка °11 й12 °13 #21 #22 #23 ’ #31 G32 #33 а Ди, Д12, Д13 — алгебраические дополнения элементов аи, й12, а13 соответственно. Тогда определитель матрицы А равен з I | = С1ц Дц -|~ С12 ^12 + #13 -^13 = —J <hj ^lj‘ i=i 64
Замечание. В этом определении определитель вычисляется по элементам первой строки и их алгебраическим дополнениям. Можно показать, что если вычислить определитель по элементам и алгебраи- ческим дополнениям любой строки или столбца, то мы получим тот же результат. Например, если мы решим вычислять определитель по эле- ментам третьего столбца, то значение определителя получается сле- дующим образом: з | А | = О13 Л13 -|- 4723 ^23 @3'3 = — fli3^i3- I = i (Читатель должен проверить этот факт, раскрыв полностью оба выражения для определителя, — подставить вместо алгебраических до- полнений их выражения через элементы матрицы и показать равен- ство полученных таким образом сумм.) Примеры Найдем определитель матрицы 1 А= 2 2 3 1 О 2 4 3 тремя различными способами: (1) с помощью разложения по первой строке: (2) разложением по второй строке: 2 3 2 4 2 2 М| = -2 = __4—5 —0= —9; (3) разложением по второму столбцу: 1 3 2 0 |Л|=-2 3 4 4 = —16—5+ 12 = —9. Упражнение 1.3.12 1. Вычислите определитель матрицы из предыдущего примера по элементам и алгебраическим дополнениям (1) третьей строки, (2) первого столбца, (3) тре- тьего столбца. 2. Вычислите всеми возможными способами определители матриц: (1) 3 2 Г — 12 0 0 1 3 (2) —1 0 3' 1 0 4 0 1 2 (3) 0 —1 3 2 0 1 0 —2 I 3. Установите справедливость следующих теорем, пользуясь указаниями: (1) Если заменить строки матрицы столбцами с соответствующими номерами или же ее столбцы строками, то значение определителя не изменится. ia b I I а с и с dl \b d 3 Зак. 973 65
(2) Если в матрице поменять местами любые две строки или два столбца, то определитель новой матрицы будет равен определителю исходной матрицы с противоположным знаком. I a b I I с d I Сравните: С нс I с dl |а Ь | b а d с (3) Если в матрице какие-либо два столбца собой, то ее определитель равен 0. или две строки равны между a b I I а а Вычислите: , I a b I I с с 3 3 3 1 2 3 3 3 3 3 4 5 \ 3 4 5. 1—11 / (4) Если каждый элемент какой-либо строки или столбца матрицы умножить на скаляр, то определитель новой матрицы будет равен определителю исходной матрицы, умноженной на этот скаляр. (Чем это отличается от умножения мат- рицы на скаляр?) а b с d авните значения определителей: т та mb с d a mb I а /Л с md me md\ (5) Если каждый элемент какой-либо строки или столбца матрицы умножить на скаляр и сложить с соответствующими элементами любой другой строки или столбца, то определитель новой матрицы равен определителю исходной матрицы. авните значения определителей: a-j-mc b j-md| c d | ’ a fe-|-3a c d-\-3c а b с d Замечания. Эти теоремы справедливы для определителей любого по- рядка. Их применение может сильно упростить процесс вычисления определителя. 4. Вычислите определитель 1 2 3 2 4 7 3 5 2 руководствуясь следующими указаниями: (1) Умножим элементы первого столбца на —2 и прибавим их к соответствую- щим элементам второго столбца. Определитель преобразуется в такой: 1 0 3 2 0 7 3 —1 2 По теореме (5) из задачи 3 значение определителя не изменится. (2) В новом определителе умножим элементы первого столбца па —3 и сло- жим их с соответствующими элементами третьего столбца. (3) Вычислите полученный определитель разложением по первой строке. (Проверьте результат, вычислив определитель исходной матрицы в соответствии с определением.) а b с 5. Рассмотрим матрицу def g h i Пусть алгебраические дополнения элементов первой строки равны соответствен-- но А, В, С; для элементов второй строки—D, Е, F и т. д. Покажите, что aD + ЬЕ + cF = 0 и аВ + dE + gH = 0. Найдите еще де- сять аналогичных выражений, равных нулю. Для этого рассмотрите матрицы, - 66
состоящие из элементов а, b, с, d, е, f, g, h, i и имеющие две одинаковые строки или два одинаковых столбца. Определитель каждой из этих матриц есть выра- жение указанного вида. 6. Вычислите следующие определители, пользуясь методом задачи 4: (1) 2 1 4 3 5 1 1 3 4 1 3 2 2 4 6 1 5 2 (2) (в примере (2) для второй матрицы сначала поменяйте первый и второй столбцы местами); (3) 2 3 5 2 1 4 1 0 4 (поменяйте местами первую и третью строки). в) Общий случай: определитель матрицы «-го порядка. Определение, данное для определителей третьего порядка, можно очевидным обра- зом обобщить. Определение. Пусть А — квадратная матрица «-го порядка; А = [«/;]; Au — алгебраическое дополнение элемента ац. Тогда определитель матрицы А равен п | | = «11 Лц + «12 Л12 + -Ь«1п'^1П== «11-^11- /=1 Результат не изменится, если при вычислении определителя взять произвольную строку или столбец и их алгебраические дополнения. Пример Пусть А = "1 2 1 0 0 0 2 1 2 1 0 о г о 2 1 По первой строке элементов получим их алгебраическим дополнениям и 2 0 1 2 0 0 1 о о 2 |Л|= + 1 2 0 2 —0 1 0 о 2+2 122—1 120 1 0 1 0 1 0 1 0 1 1 0 1 0 Вычислив четыре определителя третьего порядка, получим значение определителя | А |. Упражнение 1.3.13 1. Вычислите до конца определитель матрицы А в предыдущем примере. 2. Вычислите | А | в предыдущем примере по элементам и алгебраическим дополнениям элементов (1) второй строки, (2) третьей строки, (3) четвертой строки, (4) второго столбца, (5) четвертого столбца. 3* 67
1.3.9. ПРИСОЕДИНЕННАЯ МАТРИЦА Из любой квадратной матрицы можно получить некоторую другую матрицу, называемую присоединенной к матрице А. Мы опишем процедуру нахождения присоединенной матрицы третьего порядка; обобщение на матрицы п то порядка очевидно. Пусть 4ZU й12 О13 Л = О21 ^23 _с:зп а32 a3S _ Тогда (1) заменим каждый элемент ац матрицы А его алгебраическим дополнением АТаким образом мы получим матрицу алгебраических дополнений С = Лц А12 Л13 Л21 Л22 Л23 Л31 Л32 Л33_ (2) Транспонируем матрицу С; результат транспонирования на- зывается матрицей, присоединенной к А'. Мы будем обозначать ее через Лц -^21 Л31 Adj (Л) = С = Л12 Л22 Л32 Л13 Л23 Л33_ (Ясно, что на практике шаги (1) и (2) могут быть сделаны одновременно.) Пример '3 1 О' л = 0 2 2 1 3 0 -- 2 2 0 2 0 2 (1) Аг = + 3 0 — -—6; Л12 = 1 0 = 2; Л13= + 1 3 = —2; 1 0 3 0 3 1 /121 ~~~ = 0; Л22 = + = 0; Л23 = — = —8; 3 0 1 0 1 3 Л31 == -j- 1 0 -= 2; Л32 = . 3 0 ——6; Л33 = 4- 3 1 = 6. 2 2 0 2 0 2 Матрица алгебраических дополнений — 6 2 — 2 О 0—8 2—6 6 68
(2) Транспонируем матрицу С. Получаем Adj^A) = С' = —6 0 2 2 0—6 -2 —8 6 Общее определение присоединенной матрицы. Описанная про- цедура мо?кет быть обобщена на матрицы п-го порядка. Определение. Пусть А — матрица п-го порядка, А — latjl. Тогда матрицей алгебраических дополнений С = [AfJ называется матрица, элементами которой являются алгебраические дополнения соответствующих элементов матрицы А. Матрица, при- соединенная к А, равна матрице, транспонированной к С: Adj (А) = с = ад. Упражнение 1.3.14 1. Составьте матрицы алгебраических дополнений к матрицам (!) , [3 2 1 (2) [-141 (3) Г1 01 /1=1 ; о = ; 7 = I I: L1 4 J [о 2J [о 1] (4) 2 1 5' р= —320 2 0 1 (5) [—2 4 1 F = 0 3 2 0 1 0 (6) G = “1 0 1 О' 0 10 1 1 1 0 1 -1 0 1 0. 2. Выпишите матрицы, присоединенные к А, В, I, Е, F, G. 1.3.10. ОБРАЩЕНИЕ МАТРИЦЫ В поле действительных чисел для каждого ненулевого числа а мы можем найти число Ь, такое, что а • b = 1. Например, если а ~ 3, то b = Vg; если а = л, то b = 1/л и т. д. Число b называется обратным к а, и часто пишут b = а~г. Естественно выяснить, какая матрица А может иметь обратную матрицу А-1, такую, что А • А^ = I (единичная матрица). В этом параграфе мы установим, при каких условиях матрица имеет обрат- ную, и покажем, как вычисляется обратная матрица (при выполнении этих условий). Сначала рассмотрим числовой пример. Возьмем матрицу второго порядка Требуется найти матрицу В = а b с d такую, что АВ = I (т. е. В = А-1). 69
Другими словами, мы ищем значения a, b, с, d, при которых 2 Г 'а 3 4] [с dj 1 О О I Перемножим матрицы, стоящие в левой части этого матричного урав- нения. В результате получаем матрицу 2а + с 2b + d За + 4с 3b + Ad а уравнение преобразуется в следующее: 2а + с 2b + d 10 За + 4с 3b + 4d 0 1 В соответствии с определением равенства матриц получаем четыре уравнения: 2а + с = 1; (1) За + 4с = 0; (2) 2b + d = 0; (3) ЗЬ + 4d = 1. (4) Решая совместно уравнения (1) и (2), находим а = 4/5, с = —3Л>> а решая совместно уравнения (3) и (4), получаем Ъ = —d = f/5. Следовательно, А~1 = В = 4 5 2 5 Проверка-. '2 Г 3 4 5 2 5 2Д 5 2 5 АА-1^ Упражнение 1.3.15 1. Покажите, что в предыдущем примере произведение АА~г равно I. 2. Найдите обратную к каждой из матриц: (1) 13 21 (2) Г4 11 (3) Г—1 31 (4) Г4 61 [г г]’ [з г]’ [—2 г]’ [б з] 3. Покажите, что для каждой из матриц задачи 2 выполняется А~1А = = I = АА-1. 4. Для каждой из матриц задачи 2 определите: (1) | А |; (2) Adj ( А ); (3) (1/ | А |) Adj (Л), сравните результаты с обратными матрицами, найденными в задаче 2. 70
Условия существования обратной матрицы. Формулы для вычис- ления обратной матрицы. Сформулируем без доказательства условия, при которых можно обратить матрицу (т. е. найти ей обратную). За- тем мы дадим формулу для ее вычисления. (1) Условия: матрица имеет обратную тогда и только тогда, когда: (а) она квадратная; (б) ее определитель не равен нулю. (Замечание. Квадратная матрица называется вырожденной, если ее определитель равен нулю; таким образом, только квадратные невырожденные матрицы имеют обратные.) (2) Формула для вычисления обратной матрицы. Чтобы обратить квадратную невырожденную матрицу, надо присоединенную к ней матрицу умножить на 1/|А|, т. е. А~г — (1/|А|) Adj (А). Примеры 1. Рассмотрим числовой пример из 1.3.10 и найдем обратную к А матрицу по указанной выше формуле: А = 2 Г 3 4 А-1=-А-Аб//(А) = = 1/5 2 3 — 11 2 4 —Г — 3 2 4 —3 1 1 4 2. Найти обратную к матрице 1 о 2 4 3 0 0 1 1 А = Решение 4 3 0 0 1 1 1 |А|= 0 2 Следовательно, А-1 = 11; Adj{A) = Adj(A) = -4- —4 1 8 3 —4 2 — 6 3 2 — 6 4 — 1 3 1 1 8 4 — 1 3 1 4 0 Проверка: АА-1 = 0 3 1 -1/11 —4 1 8 2 0 1 3 2 — 6 4 — 1 3 = 1/11. 11 о о 0 11 0 0 0 11 = 7. 71
Заметьте также, что 1/11 Вообще говоря, можно показать, что если АВ = /, то и BA = /. Следовательно, если матрица В — обратная к матрице А, то и мат- рица А — обратная к матрице В. (Это совсем не очевидно: вспомните, что умножение матриц некоммутативно.) Упражнение 1.3.16 1. Найдите матрицы, обратные к матрицам задачи 1 из упражнения 1.3.14. В каждом из случаев, покажите, что АЛ-1 — I = Л-1Л. 2. Дана матрица Ь е М = а d .g h с f i Найдите произведение М Adj (Л4). Каждый элемент этого произведения есть выражение типа аА + ЬВ + сС; воспользуйтесь результатами задачи 5 из уп- ражнения 1.3.12 и покажите, что матрица М • Adj (М) равна ~|/И| 0 0 ' О \М | О О 0 | М| Покажите, что М М-1 = I. 3. Найдите обратные матрицы: 1 0 2 2 3 0 1 0 1 (1) Г1 °] | 2 з] 1 02 Г 2 3 0 0 10 10 0 2 2 1. 4. Матрица называется треугольной, если все элементы над главной диаго- налью (или под главной диагональю) равны нулю. Найдите обратные для сле- дующих матриц: 1 0 0 (1) а 0'1 с dj (2) Га Ь] [О d]’ (3) Г1 2 Г (4) (5) 12 3 4 0 10 2 0 0 2 1 .0 0 0 1. 0 1 2 0 0 1 2 2 0 4 1 3 1.3.11. РЕШЕНИЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ В заключение этой главы покажем, как алгебра матриц приме- няется при решении системы п линейных уравнений с п неизвестными. Рассмотрим систему уравнений: 72
a х2+ ... +aln хп = Ьр, х2 + ... + а2л хп = Ь2; (1) "4~ апп хп — ^п- Коэффициенты ац и свободные члены—известные числа, xlt хг, ..., хп — неизвестные. Коэффициенты системы могут быть записаны в виде матрицы Д = [а,;], неизвестные образуют вектор-столбец х, а свободные члены образуют вектор-столбец Ь. Тогда систему уравнений можно очень просто записать в матричной форме: Дх = Ь, (2) где Д — квадратная матрица n-го порядка. Мы знаем, что она имеет обратную тогда и только тогда, когда | Д | 0. Можно показать, что это условие в точности совпадает с условием существования един- ственного решения системы линейных уравнений с п неизвестными. После всего изложенного это не слишком удивит читателя. Итак, если у системы существует единственное решение, то мы мо- жем найти обратную матрицу для Д. Умножив обе части уравнения (2) на А~\ получаем (Д-М)х = Д-1Ь, что приводит к решению х = Д-1Ь (так как А"1 Ах = 1х = х). Примеры 1. Решить систему уравнений с помощью матричного метода: (Зх + у = 7; (2х—«/ = 3. Решение. Запишем систему в матричной форме: ’ 7 ' 3 ’ '3 Г 2 —1 x \_У J т. е . Дх = Ь. (Читатель должен проверить, что матричное уравнение эквивалентно исходной системе двух уравнений.) Тогда Д"1 = Adj (Д) = — I Г — 1 —1 — 2 3 LU Следовательно, х = 2 и 1 Г-1 5 —2 5 — 1 Г7 3 3 и х = Д-1 b, 2 1 2. Решить систему: у = 1. (Проверка: Зх + у = 6 + 1 = 7.) х + у — z = 1; у + г = 2; х — у = О матричным методом. 73
Решение 1 О 1 А = 1 1 — 1 Следовательно, х — 1, у = 1, г = 1 + 1 - 1 = 1) = 1. (Проверка: х + у — г = Упражнение 1.3.17 Решить системы линейных уравнений с помощью матричного метода: 1. 4. Зх—у= 1; *4-2у=5; 2х—p+z = 3; 2y-z=l; 2. Is— 2/= — 3; (3s+/=—2; 5. (х+у+г=3; j у—2z«f — 1; I х—у—z=* —1; 3. I 2%+3w—6=0; t x—4a<+8 = 0; 6. [3p |-4?+5r=ll; < p+<7—r = 3; l29+r = 4.
1.4 ГЛАВА НЕРАВЕНСТВА 1.4.1. ВВОДНЫЕ ЗАМЕЧАНИЯ В повседневной жизни нам приходится постоянно что-либо срав- нивать — людей или некоторые объекты. Мы мысленно их упорядо- чиваем в соответствии с такими характеристиками, как сообразитель- ность, ловкость, красота, значимость и т. д. Сравнение двух объектов по каким-либо параметрам — одна из основных математических опе- раций. Существенной частью научной деятельности является сопостав- ление либо чисел, либо математических выражений, которые могут принимать числовые значения. Операциями над математическими вы- ражениями, содержащими неравные величины, занимается теория не- равенств. В этой главе мы рассмотрим отношения порядка между действи- тельными числами, докажем теоремы о неравенствах. Мы покажем, что неравенства с одним или большим числом неизвестных определяют множества чисел или точек. 1.4.2. УПОРЯДОЧЕНИЕ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ Известно, что действительные числа можно упорядочить: если даны два числа а и Ь, то имеет место одно из трех: либо а равно числу Ь, либо оно больше числа Ь, либо меньше его. Мы определим понятие упо- рядочения чисел, опираясь на более простое понятие положитель- ности числа. а) Понятие положительности числа. Множество действительных чисел может быть разбито на три множества, а именно множество поло- жительных чисел, множество {0} и множество отрицательных чисел. Множество положительных чисел полностью описывается следующими аксиомами. 1. Если а — действительное число, то верно только одно из ут- верждений: а — положительное число; а равно 0; (—с) — положительное число. 2. Если а и b — два произвольных положительных действительных числа, то их сумма и произведение будут также положительными дей- ствительными числами. б) Отношение порядка. Пользуясь понятием положительного чис- ла, мы можем ввести отношение «больше» на множестве действитель- ных чисел. 75
Определение. Если разность {а — Ь) есть положительное число, то а больше, чем Ь. Если разность (а — Ь) есть положительное число или нуль, то либо а больше, чем Ь, либо а равно Ъ. Замечание. Символ > означает «больше», символ означает «больше или равно». Таким образом, выражение а> b читается: «а больше Ь», выражение а~^Ь читается: «о больше или равно Ь». Кроме того, существуют символы <; и а < Ъ («а меньше Ь»), т. е. Ь> а\ а Ъ («а меньше или равно &»), т. е. Ъ а. Отношения порядка обозначаются знаками неравенств: <Z, sC, > и ^г. (Отношения порядка > и < называются строгими неравен- ствами.) Примеры 1. Так как (3 — 2) — положительное число, то мы можем напи- сать 3 > 2 или 2 <Z 3. 2. Если х — произвольное действительное число, то (х — 2)2 — либо положительное число, либо нуль. Поэтому мы можем написать (х — 2)2 > 0 или 0 < (х — 2)2. 3. Так как разность (—2) — (—5) есть положительное число, то можем написать — 2 > — 5 или —5 < — 2. 4. Поскольку разность между нулем и отрицательным числом есть число положительное, то можно написать 0 > (отрицательное число), например 0 > — 4. 5. Выражение х 4 означает, что х — действительное число, которое больше или равно 4. 1.4.3. ПРОСТЫЕ ДЕЙСТВИЯ НАД НЕРАВЕНСТВАМИ Действия над неравенствами основаны на следующих теоремах. Теоремы. Пусть a, b, с, d — действительные числа. (1) Если а> b nb>c, то а > с. (Отношение «больше» транзи- тивно.) (2) Если а >6, то а-]-с>Ь-\-с. (Прибавление действительного числа к обеим частям неравенства не изменяет его смысла.) (3) Если а > b и с > 0, то ас > Ьс. (Умножение обеих частей не- равенства на одно и то же положительное действительное число не изменяет смысла неравенства.) (4) Если а > b и с<0, то ас < Ьс. (Умножение обеих частей не- равенства на одно и то же отрицательное действительное число изме- няет знак неравенства на противоположный.) (5) Если a>bnc>d,ma + c>b + d. (Это справедливо и при с d.) Если в теоремах (1) — (5) отношения > и < всюду заменить на и соответственно, то получим пять новых теорем. Доказательства. Укажем основные моменты доказатель- ства теорем (1) — (5). 76
(1) Разность а — с = (а — Ь) + (Ь — с). Она является положи- тельным числом, так как оба выражения, заключенные в скобки, положительны. Следовательно, а > с. (2) Так как (а + с) — (Ь + с) = а — Ь > 0, то а + с > Ь + с. (3) ас — Ьс = (а — Ь) с\ произведение, стоящее в правой части, имеет знак множителя с, поскольку а —Ь положительно. Следова- тельно, при О 0 ас > Ьс. (4) Выражение ас — Ьс отрицательно при с < 0 в силу соображе- ний, приведенных при доказательстве предыдущей теоремы. Следо- вательно, — (ас — Ьс) — Ьс — ас > 0, так что Ьс > ас. (5) (а — Ь) + (с — d) > 0, так как оба выражения в скобках по- ложительны. Перегруппировав члены, получим (а + с) — (b + d) > > 0. Следовательно, а 4- с > b + d. Читатель должен обратить особое внимание на теорему (4), в ко- торой говорится, что при умножении или делении неравенства на от- рицательное число смысл неравенства меняется на противоположный. Примеры 1. (1) Неравенство 5>3 перейдет в неравенство 9 > 7, если к обеим его частям прибавить 4; оно перейдет в неравенство —2 > —4, если из обеих частей вычесть 7. (2) Неравенство 6 > 3 перейдет в неравенство 18 > 9, если обе его части умножить на 3; оно перейдет в неравенство —12 < —6, если обе части его умножить на —2. (3) Неравенство 4^1 перейдет в неравенство — 4/3 4/ — 1/3, если обе его части разделить на —3. 2. Если х > 2 и у > 3, то, рассматривая всевозможные пары (х, у), определите наибольшее число, меньшее чем 2х + 3 у. Решение. По теореме (3) мы имеем 2х>4пЗу>-9. Тогда по тео- реме (5) 2 х + 3 у > 4 + 9 — 13. Это значит, что наибольшее число, меньшее чем 2 х + 3 у, равно 13. 3. Если х < 4 и у 4/ 5, то каково наименьшее число, большее чем 3 х + 4у? Решение. По теореме (3) 3 х < 12 и 4у 4/ 20; тогда по теореме (5) 3 х + 4 у < 32. Следовательно, 32 есть наименьшее число, большее чем 3 х + 4 у. 4. Если х 2 и у 4, то каково минимальное значение выра- жения 5 х + 2 у? Решение. По теореме (3) мы имеем 5 х 10, 2 у 8; тогда по тео- реме (5) 5 х + 2 у 18. Следовательно, минимальное значение выра- жения 5 х + 2 у равно 18. 5. Если х > 2 и у < 4, то каково наибольшее число, меньшее чем Зх — 7у? Решение. Мы имеем 3 х > 6 и —7у > — 28. Складывая эти два не- равенства, получаем 3 х — 7 у > —22. Следовательно, наибольшее число, меньшее чем 3 х — 7 у, равно — 22. 77
Упражнение 1.4.1 1. Выпишите неравенства, получающиеся из неравенства х > 5, если его (1) умножить на 4, (2) разделить на 6,(3) умножить на—3, (4) разделить на—5 и (5) разделить на —3/4. 2. Если х > 4 и у > 5, найдите наибольшее число, меньшее чем 5 х т 6 у. 3. Если х < 2 и у < 9, найдите наименьшее число, большее чем 4 х + 2 у. 4. Если х > 1 и у 4, найдите наибольшее число, меньшее чем 7 х + 8 у. 5. Если х х 3 и у < 8, найдите максимальное значение выражения 2 х+ 10 у. 6. Если х <Z 4 и у > — 2, найдите наименьшее число, большее чем 3 х — бу. 7. Если x^3hj ’С 7, найдите минимальное значение выражения Зх-—8 у. 8. Покажите, что если 0 < а <С Ь, то 1'а 1/Ь. (При обращении обеих ча- стей неравенства, связывающего положительные величины, знак неравенства меняется на противоположный.) 1.4.4. ДВОЙНЫЕ НЕРАВЕНСТВА Определение. Выражение а С Ъ < с означает, что как а < Ь, так и b < с. Аналогично а sC b с означает, что одновременно a b и b с; выражение а < b с означает, что а < b и b с. 1.4.5. интервалы Определения. Пусть а и b — действительные числа, при- чем а < Ь. Тогда множество всех действительных чисел х, удовлет- воряющих неравенству a<Zx<Zb, называется интервалом от а до Ь; множество всех действительных чисел х, удовлетворяющих неравен- ству а х Ь, называется отрезком от а до Ь; множества всех дей- ствительных чисел х, таких, что а < х b или а х < Ь, называются полуинтервалами (или полуотрезками). Точки а и b называются концами интервала или отрезка. Заметим, что концы интервала не принадлежат множеству точек интервала; концы отрезка принадлежат множеству точек отрезка; в полуинтервал входит один из его концов и не входит другой. Множество действитель- ных чисел х, удовлетворяющих неравенству х < а (или х > а), назы- вается открытой полупрямой, а множество чисел, удовлетворяющих неравенству х а (или х а), называется замкнутой полупрямой (иногда эти множества называют бесконечными интервалами}. Обозначения. Интервал {х:а<_х<.Ь} можно коротко обозначить через или просто (а, Ь). Множество точек отрезка {х : а х sgC b } можно обозначать через а х Ь, или [а, Ь]. Полуинтервалы можно записать в виде неравенств а < х Ь, а^ х < b (или (а, &], [о, Ь) соответственно). Иногда пользуются другими обозначениями, а именно:. 1а, &[, 1а, &], [а, Ь{ — для интервала, отрезка и полуинтервала соответственно. Примеры На рис. 17 изображены рассмотренные выше типы множеств на прямой. 78
2(х<5 (интервал) ---------— 2(.х<5 (отрезок) ----•---j--- 2<х£.5 (полуинтервал)----•--- 2^х<5 (полуинтервал)--*------ Полупрямые -е—~—£— ——» s х<2 Х(.2 х>2 XJ.2 Рис. 17 Упражнение 1.4.2 Изобразите следующие множества на действительной прямой: 1. 3<х < 8; 2. 4 < х < 9; 3. — 5 < х < 0; 4. — 1 < х < 2; 5. х > 6; 6. х > — 6; 7. х < — 1; 8. х «С 3; 9. —4 < х; 10. —3 < х < 4. 1.4.6. НЕРАВЕНСТВА СО ЗНАКОМ МОДУЛЯ Определения. Символ | х| читается как модуль х и опреде- ляется следующим образом: х, если х 2>0; —х, если х<0. |х | также называется абсолютной величиной х. Примеры 1. 13| = 3; 2. 2 | = 2; 3. |—0,13 | = 0,13. Запись |х| < k, где k > 0, равносильна двойному неравенству— —k<ix<Zk. Аналогично формула |х] k, kZ^O, равносильна двой- ному неравенству — k <1 х si k. Примеры 1. Запись |х| < 4 равносильна неравенству — 4 < х < 4. 2. Запись |х| 3 равносильна неравенству — 3 =С х 3. 3. | х21 = х2, если х — действительное число (так как х2— всегда неотрицательное число). 4. Неравенство — 4 <х ф 2< 4 может быть записано как |х + 21 <4. 5. Запишите неравенство —4 < х < 6, пользуясь знаком модуля. Решение. Так как —4 < х, то —5 <; х — 1, а так так х < 6, то х — 1 < 5. Поэтому —5 < х — 1 < 5, а это неравенство может быть записано в виде |х — 1 | < 5. 1.4.7. ОДИН ИЗ СПОСОБОВ ДОКАЗАТЕЛЬСТВА НЕРАВЕНСТВ Известно, что квадрат любого действительного числа всегда неот- рицателен. Это свойство лежит в основе доказательства многих нера- венств. Покажем это на примерах. 79
Примеры 1. Докажите справедливость неравенства (х2 4- 2х + 4) 3 для всех действительных значений х. Решение, х2 + 2х + 4 = (х + I)2 + 3, а так'как (х + I)2 О для всех действительных значений х, то (х2 4~ 2 х 4- 4) 3. 2. Показать, что для всех действительных значений х и г/х2 + г/2 > 2 ху. Решение, (х — у)2 0 для всех действительных значений хну. Поэтому х2 — 2 ху + у2 0 и, следовательно, х2 + У2 2 ху. 3. Для каких значений х справедливо неравенство х2 + 6х—16<0? Решение. Выделив в левой части неравенства полный квадрат, получим (х + 3)2—25 < 0, т. е. (х + З)2 < 52. Из этого следует, что | х-[-31 < 5, т. е. —5 < х 4- 3 < 5, или —8 < х < 2. Следова- тельно, неравенство х2 + 6х — 16 < 0 справедливо для значений х, удовлетворяющих неравенству — 8 < х < 2. Упражнение 1.4.3 1. Запишите следующие неравенства с помощью знака абсолютной величины: (1) — 1 < х + 1 < 1; (2) — 5 < х + sin х < 5; (3) 1 < х < 4; (4) — 3 < х < 6; (5) — 2 < х + 1 < 5; (6) а < х < Ь. 2. Покажите, что для произвольных действительных чисел а и Ь верны сле- дующие утверждения: (1) I а | 0, причем Ы = 0 тогда и только тогда, когда а = 0; (2) — |а| < а с|а|; (3) | ab | = | а |-| b |; (4) | a-\-b | < | а Ц-1 b |; (5) |а+б | >|а|—|Ь|; (6) |а+Ы > ||а|-|6||. 3. Запишите следующие неравенства в виде двойных неравенств: (1) |х|<5; (2)———<3; (3) | х | > 3 (используйте (2)); (4) |х—1|<^; | х | 2 I 1 I 1 I 1 I 1 (5Т+т|<т: (6)Нт|>т- 4. Докажите неравенства: (1) а + b 2 ~\/ab (рассмотрите выражение (~|/а — V*)2). (2) а2 + 62 + с2 ab + be 4" са. 5. Для каких значений х справедливо неравенство | 3 х — 1 | > 4? 6. Для каких значений х справедливо неравенство х2 + 4х + 1 >0? 1.4.8. ЛИНЕЙНЫЕ НЕРАВЕНСТВА Неравенства вида ах + b > 0, а Ф 0 (а также ах 4- b < 0, ах + b 0, ах + b 0) называются линейными неравенствами, или неравенствами первой степени. Линейные неравенства могут вклю- чать более чем одно неизвестное, например Зх 4- 4 у 2. Такие неравенства играют важную роль в теории линейного про- граммирования (см. третью часть книги). Мы введем основные понятия, необходимые для изложения этой теории. ео
а) Неравенства с одним неизвестным, (1) Одно неравенство. Рассмотрим неравенство Зх + 6 > 0; это линейное неравенство с одним неизвестным х. Множество значений х, для которых неравенство справедливо, называется множеством ре- шений неравенства. Легко видеть, что множеством решений неравен- ства Зх + 6 > 0 будет множество {х : х > — 2}; это открытая полу- прямая (см. 1.4. 5), изображенная на рис. 18. t Множество решений неравенства __1___ЕГ-2 21 / 2 Z / z1 И 2 2 I/ 2 21 2 2 я 2 -3-2-7 О 1 г з 4 Действительная ось Рис. 18 В общем случае неравенство ах + b > 0 определяет открытую полупрямую —Ыа, если <х>0, и открытую полупрямую x<Z—Ыа, если а < 0. Нестрогое неравенство ах + b 0 определяет замкнутую полу- прямую хДь—b/а, если а>0, и замкнутую полупрямую —Ыа, если а < 0. (2) Два или более неравенств. Два неравенства вида: ( Зх + 6>0; ( х— 1 < 0, (1) (2) относительно которых ставится вопрос об отыскании их общих ре- шений, образуют систему неравенств первой степени с одним неизве- стным. Множество решений первого неравенства есть {х : х > — 2}, в то время как множество решений второго неравенства — {х : х< 1}. Эти множества могут быть изображены на числовой прямой, как по- казано на рис. 19. Все точки, принадлежащие их пересечению, удов- летворяют обоим неравенствам. Таким образом, множеством решений системы неравенств (1) и (2) будет интервал (—2<х < 1). /Множестворешений неравенства Vе зх+е>о ' -34 -2 ~7 О у 2 3 4 Действительная ось Множество решений неравенства х-7 < О Рис. 19 Аналогично решением системы, состоящей из трех неравенств: Зх + 6>0; х— 1 < 0; 2х+1>0, (1) (2) (3) 81
будет интервал (—V2 < х < 1), который получается пересечением трех полупрямых: х > —2, х < 1 и х > —г/2. Каждая из полупрямых изображает множество решений первого, второго и третье! о неравенств соответственно. В общем случае решение системы п линейных неравенств с одним неизвестным есть интервал, представляющий собой пересечение п множеств решений отдельных неравенств. (Заметим, что пересечение может оказаться пустым множеством, например нет таких значений х, которые бы удовлетворяли как неравенству х — 2 > О, так и неравен- ству х — 2 < 0.) Упражнение 1.4.4 1. Изобразите интервалы, определяемые следующими неравенствами: (1) —х+2>0; (2) —х + 2>0; (3) ~х—3<0; (4)—-^-х—3<0; (5) —8x4-11 >0. 2. Найдите решения следующих систем неравенств: (1) (х>0; |х—3 < 0; (3) [х>0; <х—3 < 0; (х —1 > 0. (5) /х—1>0; (х— 1 <0; (7) !-2х+4<0; (2х —10 ' 0; (2) (х>0; |х — 3 < 0; (4) /х —1 >0, ]х—1 <0; (6) /х —1 > 0; 1х—1 0; 1 — *4~4<°; — х-|-3>0; х+1 > 0. б) Неравенства с двумя неизвестными. (1) Одно неравенство. Рассмотрим линейное неравенство х+у> 1. Множеством решений этого неравенства будет множество всех упо- рядоченных пар (х, у), таких, что х + у > 1. Геометрически оно может быть изображено как множество точек на декартовой плоскости, ле- жащих выше прямой, задаваемой уравнением х 4* 1/ = 1 (рис. 20). Покажем, что все точки, лежащие выше прямой, принадлежат множеству решений и никакая точка, лежащая ниже, не принадлежит ему. Рассмотрим вначале произвольную точку Р (х, у), расположенную над прямой (как показано на рис. 20). Ее ордината пересечет прямую х + у = 1 в некоторой точке Q (х, у'), причем у' < у (по определению точки Р). Тогда ху > х-'гу' =1, и, следовательно, точка Р принад- лежит множеству решений неравенства. Рассмотрим теперь произвольную точку Р (х, у"), лежащую ниже прямой. Мы имеем у" < у', и, следовательно, х 4- у" < х у' = 1. Таким образом, точка Р не принадлежит множеству решений нера- венства X 4- у > 1. Вообще прямая ах by = с определяет три множества точек на декартовой плоскости, а именно: 82
(1) полуплоскость, точки которой лежат под прямой; (2) множество точек прямой; (3) полуплоскость, все точки которой лежат над прямой. Следовательно, линейное неравенство с двумя неизвестными опре- деляет какую-либо полуплоскость (если неравенство строгое). Если не- равенство нестрогое ( либо либо s^), то оно определяет полупло- скость, объединенную с множеством точек прямой. (Уравнение прямой задается соответствующим равенст- вом.) От коэффициентов а, Ь, с зависит, какую полуплоскость определяет не- равенство. В отдельных случаях по- луплоскость легко определить, про- верив, удовлетворяется ли неравен- ство в начале координат (т. е. в точ- ке с координатами (0,0)). Если нача- ло координат удовлетворяет нера- венству, то содержащая его полупло- скость будет искомым множеством рис 2о решений. Если неравенство не удов- летворяется в начале координат, то искомой будет полуплоскость, не содержащая его в качестве одной из своих точек. Когда прямая проходит через начало координат, то можно проверить другие удоб- ные точки, например точку (0, 1). II римеры 1. Изобразите множество решений неравенства 2 х + у < 1. Решение показано на рис. 21. Замечания (1) Начало координат (0,0) удовлетворяет неравенству (так как 2 • 0 + 0 *< 1), следовательно, искомым множеством будет полупло- скость, содержащая точку О. (2) Неравенство строгое, поэтому точки прямой 2х + у — 1 не включаются в множество решений. 2. Изобразите множество решений неравенства —Зх 2у 6. Решение показано на рис. 22. Рис. 21 Множество реше ний неравенства -Зх + 2уь6 \- Множество реше-/ ний неравенства Прямая -Зх*2у=6 (точки Включены в множество ре- шений) Рис. 22 83
Замечание. Начало координат не удовлетворяет неравенству, поэтому множеством решений неравенства будет полуплоскость, не содержащая точку О. Упражнение 1.4.5 Изобразите множество решений каждого из следующих неравенств: (1) — х + у > 1; (2) — х + у < 1; (3) 2х — 3 у < 6; (4) х — 5у > 10; (5) — х — Чу < 6 (2) Система двух или более неравенств. Рассмотрим систему двух линейных неравенств с двумя неизвестными: I х —z/>0. (1) (2) Это система неравенств первой степени с двумя неизвестными. На рис. 23 показаны полуплоскости, определяемые каждым из неравенств. Двойной штриховкой изображено пересечение этих полуплоскостей. Точки плоскости, принадлежащие пересечению, удовлетворяют как первому, так и втором;? неравенству (т. е. это пересечение изобра- жает множество решений нашей системы неравенств). В общем случае система п линейных неравенств типа aiX-^biy^Ci, i = 1, 2, ...., п определяет некоторую область на плоскости ху. Эта область является пересечением п множеств решений отдельных нера- венств, (пересечением п_ пол у плоскостей). Примеру Изобразите множество решений системы трех неравенств: Решение. Искомое множество решений есть объединение множества точек, лежащих внутри треугольника А ВС (рис. 24), и точек отрезка АВ (исключая точки А и В). 84
Упражнение 1.4.6 1. Изобразите множество решений каждой из следующих систем неравенств: (1) (x + z/>2; |х + 41/>4; (3) fx-+-t/<2; 1x4-4// < 4; (5) 1x4-1/>2; {х-]-4у < 4; Ь>0; (2) . (х+у < 2; 1x4-41/>4; (4) . fx4- У > 2; 1х4-4{/<4; (6) 1 Гх4-1/<2; x-f-4y < 4; [х>0, у > 2. Покажите, что следующие системы неравенств несовместны (т.е. что множество решений каждой из них пусто, так как нет ни одной точки, удов- летворяющей одновременно всем неравенствам системы): (1) х+у > 1; х—у< 0; .х4-2у<1; (2) 2х—у > 3; х-Н 21/ < 4; 2х—у < —2. в) Система неравенств с тремя и большим числом неизвестных. Изложенные идеи можно обобщить на действия с линейными неравен- ствами, содержащими более двух неизвестных. Конечно, при трех или более неизвестных графическое представление множества реше- ний неравенств становится трудным или невозможным. Тем не менее мы продолжаем пользоваться геометрическими терминами и в этом, более общем, случае. Обобщая понятие прямой на плоскости на много- мерный случай, можно ввести понятие гиперплоскости, которое ока- зывается весьма полезным для решения возникающих при этом новых задач. Определение1 (1) Упорядоченное множество п чисел (х1т х2, ..., хп) называется точкой х в п-мерном пространстве. Числа xlt х2, ..., хп называются координатами точки х. (2) Множество точек «-мерного пространства, координаты которых удовлетворяют линейному уравнению /34X1 4~ ct2x2 4“ называется гиперплоскостью. (Заметьте, что при п = 2 это уравнение будет уравнением прямой-, при п = 3 это уравнение определяет пло- скость в трехмерном пространстве.) (3) Линейное неравенство типа «Л 4- а2х2 4- ... 4- апхп < b определяет область в n-мерном пространстве, называемую полупро- странством. Эта область состоит из тех и только тех точек х = (xlt х2, ..., хп), координаты которых удовлетворяют неравенству. 1 Понятия «-мерного вектора, «-мерного пространства очень глубоки. Чи- татель, встречающийся с ними впервые, несомненно, будет с трудом воспринимать приведенные короткие определения. Это означает, что к этому материалу следует вернуться в процессе усвоения теоретических основ линейного программиро- вания для повторного чтения и углубленного изучения. Эти замечания относят- ся также к последующим параграфам, излагающим понятие выпуклости. 85
1.4.9. ВЫПУКЛОСТЬ Очень важным понятием (играющим большую роль в теории мате- матического программирования) является понятие выпуклости. Сна- чала мы определим его для множества точек в двумерном пространстве (т. е. на плоскости); позже мы укажем, как определяется выпуклость в пространстве п измерений. а) Определение. Множество точек называется выпуклым, если от- резок прямой, соединяющий две произвольные точки множества, целиком принадлежит этому множеству. Замкнутым выпуклым множеством называется такое выпуклое множество, которое содержит все свои граничные точки. (Заме- чание. Обратите внимание, что пустое множество, как это следует из определения, выпукло.) Примеры и контрпримеры Заштрихованные области на рис. 25 представляют собой выпуклые множества. В каждом из случаев отрезок, соединяющий пару произ- вольных точек Р и Q выпуклого множества, целиком лежит в заштри- хованной области. Внутренность круга Пересечение двур полуплоскостей Внутренность многоугольника (сравните с контр- примером, приведенным r г на рис. 26) Рис. 25 Читателю нетрудно будет найти для каждой из областей, изобра- женных на рис. 26, принадлежащие ей точки Р и Q, через которые нельзя провести отрезок, целиком лежащий в этой области. Заштрихованные на рис. 26 области не выпуклы, так как прямо- линейные отрезки PQ не лежат целиком внутри областей. б) Пересечение выпуклых множеств. Мы докажем простую теорему о выпуклых множествах. На основе этой теоремы получены весьма глубокие результаты, играющие важную роль в теории линейного программирования. Теорема. Пересечение двух или более выпуклых множеств является выпуклым множеством. 86
Доказательство. Пусть А и В — два произвольных вы- пуклых множества. Их пересечение обозначим I = А Г| В (на рис. 27 изображен двумерный случай). Мы хотим показать, что I — выпуклое множество. Пусть Р и Q — две произвольные точки из /. Тогда, так как А — выпуклое множество, все точки отрезка PQ принадлежат множеству А. С другой стороны, так как В — выпуклое множество, все точки отрез- ка PQ принадлежат множеству В. Следовательно, все точки отрезка PQ принадлежат как множеству А, так и множеству В\ следовательно, отрезок PQ целиком принадлежит пересечению множеств А и В, т. е. множеству 1. Таким образом, I — выпуклое множество. Невыпуклая Внутренность многоугольника Рис. 26 По индукции можно доказать, что пересечение любого счетного1 * * * * * * В наоора выпуклых множеств есть также выпуклое множество. Обобщение. При переходе к и-мерному пространству нагляд- ные геометрические представления должны быть выражены в алге- браических терминах. В определении выпуклости в n-мерном случае ключевым моментом является обобщенное алгебраическое определение отрезка. Читатель, несомненно, знаком с его определением для случая двух измерений (т. е. декартовой плоскости). Мы повторим это определение и предлагаем читателю в виде упражнения распространить его на п-мерный случай. Определение. Отрезком, соединяющим две точки Р (хп г/J и Q (х2, г/J, называется множество всех точек (х, у), координаты которых вычисляются по формулам: х = mxl +J1 — т) х2; 1 Слово «счетный» употребляется в специальном математическом смысле. Говорят, что совокупность объектов счетна (в нашем случае совокупностью бу- дет класс выпуклых множеств), если можно установить взаимно-однозначное соответствие между этими объектами и элементами ряда натуральных чисел 1, 2, 3, ..., п. Такая совокупность может быть конечной (объекты можно сосчи- тать и занумеровать с помощью п натуральных чисел) или бесконечной (процесс нумерации не может быть завершен; рассмотрите, к примеру, множество нату- ральных четных чисел {2, 4, 6, ...}). Если взаимно-однозначное соответствие между элементами множества и эле- ментами натурального ряда установить невозможно, то множество несчетно. В качестве примера несчетного множества можно привести множество точек от- резка [0, 1] на действительной числовой оси. 87
у = ту1А (1 — tn) y2, где параметр m удовлетворяет условию О tn 1. Пример ' Д® Пусть точка Р имеет координаты (1, 3), а точка Q— координаты (4,1). На рис. 28 отрезок PQ выделен жирной чертой; координаты всех его точек удовлетворяют уравнениям: х = т • 1 + (1 — т) • 4 = 4 — 3 т; у = т • 3 Т (1 — т) • 1 — 1 + 2 т, параметр т «пробегает» все значения из отрезка 10, 1]. Например, при tn = 1 уравнения дают нам точку с координатами х = 1, у = 3, т. е. точку Р; при zn = 0 полу- чаем точку Q. Любое другое значение т из отрезка 10,11 соответствует толь- ко одной точке, лежащей на прямой между точками Р и Q. «ч Замечание. Два уравнения, связывающие координаты точки и па- раметр т, называются параметрическими уравнениями прямой PQ. Упражнение 1.4.7 1. Получите уравнение прямой PQ в координатах х, у, исключив параметр т из параметрических уравнений. 2. Составьте параметрическое уравнение для точек отрезка, соединяющего точки Р (2, 5) и Q (—1, 4); найдите значение параметра т, соответствующее середине отрезка, и вычислите координаты его середины. 3. Выпишите параметрическое уравнение для координат (xb х2, ..., хп) точек отрезка, соединяющего точки А (щ, а2, .., «„) и В (bi, Ь2, .... Ьп) в п-мерном пространстве (т. е. обобщите определение отрезка на n-мерное пространство). Дадим алгебраическое доказательство теоремы, которая геомет- рически очевидна. Теорема. Полуплоскость есть выпуклое множество. Доказательство. Пусть ах -Т by < с — неравенство, определяющее полуплоскость, и пусть Р (х1, z/J, Q (х2, z/2) — две про- извольные точки на полуплоскости. Тогда координаты как точки Р, так и точки Q удовлетворяют данному неравенству: ахг + by у < с; (1) ах2 + Ъу2 < с. (2) Пусть, далее, 0 tn 1. Умножим неравенство (1) на т, а не- равенство (2) на 1 — т и сложим полученные неравенства: а[тх1 4- (1 — т) х21 + b 1ту± + (1 — tri) у2] < тс + + (1 — tri) с — с. (3) 88
Коэффициенты при а, Ъ в неравенстве (3) будут координатами (х, у) произвольной точки отрезка PQ; следовательно, все такие точки удов- летворяют неравенству. Другими словами, все точки отрезка принад- лежат полуплоскости. Это значит, что полуплоскость есть выпуклое множество 154]. Упражнение 1.4.8 1. Докажите, что полуплоскость, определяемая линейным неравенством Й1Х1 + агх2 + ... + ап хп < Ьп, есть выпуклое множество. 2. Докажите, что решение системы т линейных неравенств: °и х1+й12 х2+ • • • -pain хп <Z by, а21 Х1Ч-О22 Х2-р . . . хп < by, ат1 Х1~Ьйт2 X2 + •. • + amn xn есть выпуклая область точек в n-мерном пространстве.
1.5 ГЛАВА ТЕОРИЯ ГРАФОВ 1.5.1. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ Рис. 29. Кёнигсбергская система мо- стов У многих слово «граф» ассоциируется с вычерчиванием по точкам (х, t)) графика на декартовой плоскости. В действительности существует обширная математическая теория графов, которая представляет собой нечто значительно большее, чем простое нанесение точек на график, и исключительно богата идеями и изящными теоремами. Более того, обнаружилось, что она служит основным инструментом во многих раз- делах науки и техники; ее тео- ремы и методы нашли успешное применение в теории информа- ции, промышленном планирова- нии, на транспорте, в линейном программировании, в теории се- тей, статистической механике и генетике. Можно сказать, что первое исследование графов, выполненное Л. Эйлером (1707— 1783), заложило основы тополо- гии, играющей большую роль в современной математике. Простейшим образом граф можно описать как набор точек, опреде- ленные пары которых соединены линиями. Слово «сеть», пожалуй, лучше, чем «граф», передает читателю общее представление о природе системы, с которой имеет дело теория графов. Действительно, слово «сеть» часто употребляется в качестве синонима слова «граф». Приведем два примера простых систем, исследование которых пол- ностью сводится к рассмотрению графов. Пример 1. Задача о кёнигсбергских мостах. Река Прегель те- чет через город Кёнигсберг (в настоящее время Калининград); посере- дине реки расположены два острова. Семь мостов соединяют острова с берегами и друг с другом, как показано на рис. 29. Жители города могли бы задуматься о возможности найти непре- рывный маршрут между берегами и островами, который проходил бы по каждому из мостов ровно один раз. В 1736 г. Эйлер (превосходный математик, один из наиболее плодовитых гениев в истории математики) занялся этой задачей и сумел доказать, что найти такой путь невоз- можно. 90
Система мостов может быть сведена к графу следующим образом. Берега обозначим точками (вершинами) Л и С, а острова—вершинами В и D (рис. 30). Возможные пути между берегами и островами становятся линиями (ребрами), соединяющими пары вершин. П р и м е р 2. Теория графов была применена к проблемам орга- нической химии (например, к перечислению изомеров химического сое- динения). Молекула этилена (C2HJ) предстает в форме графа, изобра- женного на рис. 31. Рис. 30. Граф кё- нигсбергской систе- мы мостов В одной короткой главе невозможно описать достаточно полно яр- кий образный язык теории графов и упомянуть все ее приложения. Однако, если эта глава даст читателю некоторое знакомство с основ- ными идеями и обозначениями и откроет для него огромное потенциаль- ное значение этой теории в изучении реальных систем, цель будет достигнута. Применения к задачам исследования операций рассматриваются в гл. 3.5. В частности, там решается задача планирования для комплек- сного объекта. При этом множество различных родов деятельности по выполнению проекта представляется в виде некоторого графа. Упражнение 1.5.1 1. Возьмите карандаш и, начиная с любой вершины, попытайтесь начер- тить непрерывающийся маршрут по графу кёнигсбергской системы. Задача со- стоит в том, чтобы пройти каждое ребро один (и только один) раз и вернуться в исходную точку. 2. Кёнигсбергская задача может быть поставлена для любого замкнутого графа. Срисуйте графы, изображенные на рис. 32, и попытайтесь затем пройти по ним кёнигсбергским способом, проходя каждое ребро только один раз. 3. Назовем вершину нечетной, если число ребер, сходящихся к ней, нечет- но, и четной, если число ребер четно. Для каждого из графов задачи 2 выпишите таблицу, показывающую (1) число нечетных вершин, (2) число четных вершин и (3) можно или нельзя пройти граф кёнигсбергским способом. Отметьте звездоч- кой случаи, когда можно вернуться к исходной вершине. Эйлер обнаружил, что граф такого типа может быть пройден с возвратом к исходной точке тогда и только тогда, когда в графе нет нечетных вершин. Он показал, что если в графе присутствуют две (и только две) нечетные вершины, то обход возможен, но без возвращения к исходной точке. В таком графе обход должен начинаться в одной нечетной вершине и заканчиваться в другой. Проверьте теоремы Эйлера для каждого из графов задачи 2 упражнения 1.5.1. 91
Рис. 32 Часто рассматривают множества, в которых отношения внутри дан- ной пары элементов односторонние (т. е. направленные, или ориенти- рованные). Нштример, в генеалогическом дереве отношение между от- цом и сыном—это одностороннее отношение происхождения. Мы можем показать направление родственной связи на графе, поместив стрелку на ребро между точкой, обозначающей отца, и точкой, обозначающей сына: О Если стрелки стоят на всех ребрах графа (т. е. каждое ребро на- правлено), то про весь граф говорится, что он направлен. Мы сначала будем иметь дело с ненаправленными графами, т. е. с графами, все ребра которых не направлены. Обозначения и определе- ния теории графов еще не стандартизированы в достаточной степени; мы будем придерживаться терминологии Саати [3]. 1.5.2. НЕНАПРАВЛЕННЫЕ ГРАФЫ а) Основные термины. (1) Множество X. Мы будем предполагать, что множество X объек- тов задано и каждый объект можно представить точкой на плоскости. Примеры таких множеств: совокупность городов (точки на карте), де- тали электроаппаратуры (точки иа схеме сети), группа людей, проис- ходящих от одного и того же предка (точки на генеалогическом дереве). (2) Вершины и ребра. Если два объекта из множества X каким-то образом связаны между собой, то связь может быть указана линией, соединяющей две точки, обозначающие эти два объекта. Таким образом, связь е между объектами и п v может быть обозначена так: ____Л и е Точки и, v называются вершинами, а линия е называется ребром. 92
Ребро е Называется инцидентным по отношению к вершинам и, V. Вершины и п v называются концевыми точками е. Концевые точки ребра называются смежными вершинами. Два ребра et и е2 называются смежными ребрами, если у них есть хотя бы одна общая концевая точка. Если для них общими будут обе концевые точки, то они называются параллельными ребрами. (3) Петли. Ребро, обладающее только одной кон- цевой точкой (рис. 33), называется петлей. Петля — это ребро, которое дважды инцидентно по отношению к одной и той же концевой точке. (4) Изолированная вершина. Если вершина не явля- ется концевой точкой какого-либо ребра, то она назы- вается изолированной. Рис. 33. Пет- ля к Пример. На рис. 34 изображен граф, для которого множество V вершин (представляющее собой множество объектов X) имеет вид V = {vlt и2, va, vt, t/5, v6, v7, 08}. Множество E ребер (представляющее собой отношения между па- рами объектов) выглядит следующим образом: Е — {<?!, с2, е3> ^5» ^б> Точки vj и и4 — концевые точки ребра е3; е4 инцидентно v4 и v5; eg— петля; v3—изолированная вершина; ег и е2—параллельные ребра; е8 и ев — смежные ребра. Упражнение 1.5.2 1. Запишите множество V вершин и множество Е ребер графа, изображен- ного на рис. 35. Определите (1) изолированную вершину, (2) концевые точки е4, (3) ребро, инцидентное v2 и v3, (4) петлю, (5) пару параллельных ребер, (6) ребра, смежные с е3, и (7) вершины, смежные с е3. 2. Начертите графы (1), (2) и (3) по следующим наборам данных: (1) Множество вершин V = {с,, и2, и3, и4}; множество ребер Е — {ех, е2, е3, е4, erJ; ех и е3 — петли с концевыми точками v2, v4 соответственно; е2 инцидент- но их и ei инцидентно vt и v2; v2 и v4 — концевые точки для е5. (Присутст- вуют ли здесь изолированные вершины? Присутствуют ли параллельные реб- ра? Можно ли достичь любой точки, выходя из Пх?) (2) Множество вершин V = {пх> uz> из> г4, и5}; множество ребер Е = {ех, е2, е3, е4, е3, ее, е7}; ребро ех имеет концевые точки vlt п4; е2, е3, е4 — парал- лельные ребра; е5 инцидентно v3 и п4; е6 инцидентно v3 и и6; v4 — концевая точка ребра е4; е7 — петля, инцидентная п5; изолированные вершины отсутствуют. (3) Множество вершин V = {их, v2, v3, и4}; множество ребер Е = 0 (т. е. пустое множество). (Замечание. Граф может иметь вершины и не иметь ребер, но не наоборот; графы, у которых Ё = 0, называются вырожденными.) 93
3. Начертите граф: V = {vx. v2, v3, u4, v5, u6}; E = {ex, e2, es, e4, e5}; е1 об- ладает концевыми точками v±, vz; e2 имеет концевые точки v2, v3; e3 инцидентно »2, e4 имеет концевые точки vs, v5; e5 инцидентно v3, v4. Можно ли провести путь от V! к любой другой вершине? Можно ли построить путь от произвольной вер- шины до любой другой вершины? Возможно ли пройти от одной вершины к любой другой одним путем, а возвращаться другим? Граф этой задачи — пример дерева с корнем vt. Деревья будут обсуждаться более подробно далее. б) Формальное определение ненаправленного графа. (1) Определение графа. Ненаправленный граф состоит из: (а) непустого множества V, его вершин; (б) множества Е (возможно, пустого), его ребер, все концевые точки которых являются элементами V. Таким образом, граф G полностью определен, если заданы два мно- жества V и Е. Мы можем написать G = (V, Е). (2) Конечные графы. Если как V , так и Е состоят из конечного числа элементов, то G называется конечным графом. В противном случае граф G бесконечен. 1.5.3. СООТНОШЕНИЯ МЕЖДУ ЧИСЛОМ ВЕРШИН И ЧИСЛОМ РЕБЕР а) Обозначение | X |. Символом | X | будет обозначаться число эле- ментов множества X. Например, на рис. 36 изображен граф с 5 верши- нами и 7 ребрами. Мы можем написать G — (V, Е) и | V | = 5, | Е | = 7. С помощью этих обозначений можно так записать определение ко- нечного графа: G = (V, Е) представляет собой конечный граф, если | V | < оо и|Е|<оо; в противном случае он бесконечен. б) Степень вершины 6 (v). Рассмотрим граф, приведенный на рис. 37. Вершине щ инцидентны три ребра и одна петля. Сосчитав эту петлю дважды, мы можем сказать, что вершина обладает 5 инцидентными ей ребрами; это число называется степенью vt. Степень вершины v обозначим символом б (и). Таким образом, в этом графе б (щ) = 5, б (о2)" =2,6 (о3) = 3.. Вершина будет нечетной, если ее степень — нечетное число, и четной, если ее степень — четное число; она изолированная, если б (о) = 0. Упражнение 1.5.3 1. Напишите числа | V |, | £ | и степени всех вершин для каждого из графов (а), (б), (в) на рис. 38. 2. Для каждого из графов (а), (б), (в) на рис. 38 определите величину суммы V6 (и) и сравните ее с | £ ]. v£V Установите закономерность, связывающую эти два числа. 3. Проверьте в графах задачи 1 (и во всех других, встречавшихся ранее гра- фах), что число нечетных вершин всегда четно. в) Две теоремы о степенях вершин. Сформулируем и докажем две простые теоремы. 94
Теорема 1. Для любого графа G~ (V, Е) сумма степеней вер- шин равна удвоенному числу ребер, т. е. 2 6(v) = 2|£|. об V Доказательство. Предположим, что ребро е имеет две раз- личные концевые точки и, v. Тогда его вклад в б (и) и в б (v) равен 1. Если ребро е является петлей, инцидентной и, то его вклад в б (о) равен 2. Отсюда в любом случае вклад ребра е в сумму степеней всех вершин равен 2. Поэтому удвоенное число ребер равно сумме степеней, что и требовалось доказать. Теорема 2. В конечном графе число нечетных вершин четно. Доказательство. Пусть Ve — множество всех четных вер- шин, a Vo — множество всех нечетных вершин. Тогда, очевидно, Vo U Ve = V и Vo Г) Ve = О ; таким образом: 2б(п)+ 2 6(о)= ^б(о). (1) t>ev« »eve Далее, суммы J]6 (у) и ^б (и) обе четные (первая по теореме 1, а вторая г?6Г потому, что она представляет собой сумму конечного числа четных чи- сел). Отсюда разность б (и) и V б (и) также четна. Следовательно, согласно (1) получаем, что 2 6Д) (2) кек» четно. Наконец, если бы | Vo | было нечетным, то сумма у, б (о) была бы t>er0 суммой нечетного числа нечетных чисел и поэтому была бы нечетной, что противоречит (2). Отсюда | Vo| должно быть четным, что и требова- лось доказать. 95
Упражнение 1.5.4 J3 P <5 .S 1. В каждом из графов (а), (б) и (в) на рис. 39 обозначьте вершины и опре- делите множества V, Vo, Ve и Е. Вычислите величины I Е | (V), X б(и) И veV vc-Vo (v). Проверьте в каждом случае, что V 6 (v) = 2| Е ( (теорема 1) и что veVe veV | Vn| четно (теорема 2). 2. Добавьте ребра к каждому из графов задачи 1 и установите, как изменятся различные величины, которые были использованы в двух теоремах. Попытайтесь так добавить ребра и вершины, чтобы получился граф с нечетным | Уо |. 3. После решения задач 1 и 2 прочтите еще раз доказательства теорем 1 и 2. 4. Граф на рис. 40 представляет часть карты, на которой изображены дороги, соединяющие города А, В, С, D и Е. Рис. 39 (1) Сколько здесь различных дорог, соединяющих города (чему равно I £1)? (2) Можно ли пройти из данного города в любой другой только по указан- ным дорогам? (3) Обозначьте дороги и запишите все маршруты, соединяющие город А с городом С. (Запишите их в виде последовательности ребер, например е2, е3, ... Не используйте данные ребра более одного раза в одном маршруте.) (4) Назовем длиной маршрута число ребер в последовательности. Определите длину каждого из маршрутов, полученных в примере (3). 1.5.4. НЕПРЕРЫВНЫЕ ПУТИ ПО ГРАФАМ Рассмотрим граф, изображенный на рис. 41. Пусть вершины — это города, а ребра — дороги. Последовательность ребер еъ е2, еб, ес со- ставляет непрерывный маршрут из города vr в v5: Последовательность е2, es, е2, еу составляет непрерывный маршрут из города v3 в город и2, далее — в город v3, затем обратно в у2 и к городу v4. Последовательность е5, ев, е4 задает кольцевой маршрут из города v3 через v4 и v5 и обратно к начальной точке v3. Из этого примера ясно, что можно выделить различные типы.движе- ний по графу, рассмотрение которых приводит к возникновению поня- тий и идей, имеющих основополагающее значение в теории графов. С их помощью удается классифицировать графы па несколько типов, важных при формулировке большинства задач. Приведем соответствующие определения. 96
а) Цепи. Цепью называется любая последовательность ребер ег, с2, е3, еп, обладающая тем свойством, что для каждого ребра, кроме первого и п-го, одна из его вершин является общей с предыдущим реб- ром, а вторая -— с последующим. Цепь называется простой, если каждое ребро встречается не более одного раза, в противном случае цепь сложная. Число ребер п называется длиной цепи. Примеры 1. В графе на рис. 42 последовательность е4, е2, е3, е4 представ- ляет собой простую цепь, идущую от v4 к п4. 2. В следующем графе на рис. 43 elt е2, еа, еБ — простая цепь, дли- на которой равна 4 и которая идет от ог к ц6; еъ ее, е4, е3, ев — сложная цепь, длина которой равна 5; е2, es, е6 — простая цепь, идущая от v2 к v2. б) Циклы. Рассмотрим последовательность ребер (цепь), начинаю- щуюся в вершине v0 и кончающуюся в вершине vn. Если и0 и vn — различные вершины, то последовательность назы- вается открытой. Если и0 = ип (т. е. последовательность начинается и кончается в ц0), то последовательность называется замкнутой. Замкнутая цепь называется циклом. Замкнутая простая цепь называется простым циклом. Замкнутая сложная цепь называется сложным циклом. Если каждая вершина в цикле (в цепи) встречается только один раз (кроме первой вершины в цикле), то цикл (цепь) называется элементар- ным (элементарной). Примеры 1. На рис. 44 изображен граф, па котором ег, еъ, е6, е2 — это простой цикл с вершинами plf v2, v3, v4, vv Так как никакая вершина (кроме ог) не повторяется, то это пример элементарного цикла. 2. еъ е4, е5, ев, е2 — простой цикл с вершинами v2, v2, vs, v4, v4. Он не элементарен, так как v2 встречается дважды в последовательно- сти вершин. 3. е7, е8, es, е4, еБ, ев, е7 — сложный цикл (он замкнут, и е7 — повто- ряющееся ребро). Упражнение 1.5.5 Для графа, изображенного па рис. 45, найдите следующее: 1. Простую цепь, соединяющую ut и и4. 2. Простую цепь, идущую от vx, к v5 через v7. 4 Зак. 973 97
3. Сложную цепь, соединяющую vt и v4. 4. Сложную цепь, соединяющую ц, и v2. 5. Простой цикл, начинающийся в и имеющий длину 6. 6. Сложный цикл, начинающийся в и имеющий длину 9. 7. Элементарный цикл, начинающийся вц и имеющий длину 5. 8. Покажите, что последовательность е7, ез, е5, е4, е10 не является цепью. Вставьте мысленно в эту последовательность одно ребро так, чтобы получилась цепь. Будет ли полученный результат простой или сложной цепью? 9. Классифицируйте последовательности: е7, е3, е4, е5, е6, е4, elt е1г, et, ее; еь е2, е8, е10, ев, е2; е2, ев, е10, ев; е2, ее, е10, es, е8; е7, е3, еи, еи, ее (т. е. устано- вите, являются ли они цепями или циклами, простыми, сложными или элемен- тарными). 10. Составьте цепь, идущую от v2 к и7 и проходящую через и6. Будет ли эта цепь простой или сложной? 11. Найдите элементарный цикл, который будет одновременно и простым циклом; найдите простой цикл, который не элементарен. Докажите, что элемен- тарный цикл всегда будет простым, но обратное выполняется не всегда. Пока- жите, что элементарный цикл не содержит петель. 1.5.5. ПОДГРАФЫ Рассмотрим граф G = (V, £), показанный на рис. 46; часть его об- ведена пунктирной линией. Множество вершин = {п3, v4, у5, р6} и множество ребер Е4 — = {е4, еБ, е9, е10} составляют графС4 = (Vj, Ег). ГрафС4 будем назы- Рис. 46 вать подграфом графа G. Вообще будем говорить, что GT =(V1,£1) представляет собой подграф графа G~- (V, Е), если: х (1) l\c V и £\с £; (2) каждое ребро в Ег имеет те же самые концевые точки в G, которые оно имеет в 6\; (3) концевые точки каждого ребра из £j лежат в Г1. 1.5.6. СВЯЗНЫЕ ГРАФЫ а) Определение. Граф называется связным, если для каждой пары- различных вершин существует по крайней мере одна цепь, их соединяю- щая. В противном случае граф называется несвязным. ’ , . 98
Примеры. На рис. 47 изображены графы (а), (б) и (в). Из них графы (а) и (б) связны; граф (в) несвязен. б) Связные компоненты. Рассмотрим граф на рис. 48, сначала не обращая внимания на пунктирные линии. Этот граф несвязен; в нем нет, например, цепей, соединяющих и п13. Однако он может быть раз- делен на три подграфа, каждый из которых связен (на чертеже подгра- фы окружены пунктирными линиями). Связный подграф называется компонентой исходного графа. Ясно, что любой конечный граф может быть разделен на компонен- ты следующим образом: 1. Выберем произвольную вершину v в V. Определим все вершины, которые могут быть соединены с v цепью. Множество этих вершин, содержащее вершину v, обозначим Ух. Тогда подграф, определяемый множеством Уъ будет компонентой. (Заметим, что если v изолирована, то ({и}, 0) есть компонента.) 2. Выберем произвольную вершину и, принадлежащую V, но не принадлежащую Пусть У2 — множество всех вершин, соединяе- мых с и какой-либо цепью (iz включается в 1/2). Тогда У2 определяет другую компоненту. 3. Будем повторять процедуры 1 и 2 до тех пор, пока в V не оста- нется вершин, не принадлежащих одному из множеств V2, ... Так как V конечно, то последовательность компонент должна быть ко- нечной. Обозначим последнее множество вершин Vh. То гда множество компонент, определяемых Уь У2, ..., Vh, дает раз- биение графа G на связные компоненты. Пр и м е р. Вернемся к графу, изображенному на рис. 48. Начнем процесс разбиения с выбора вершины vB. После этого видим, что вер- шины v7, ve и п10 могут быть соединены с vB цепью. Следовательно, V, = = {v7, v8, tzg, u1(1) определяет компоненту (обведенную на чертеже пунк- тиром). Выбрав далее v3 в качестве вершины из V, не принадлежащей Ух, находим, что V2 = {пъ v2, v3, v.lt v6, tze}. Компонента, определяемая множеством V2, на чертеже также обведена пунктиром. Остаются лишь вершины vn, v12, v13. А они могут быть соединены цепью, поэтому V3 = {ии, v12, о13} определяет третью компоненту. 4* 99
В V больше йет вершин, которые не входили бы в V2 или V3, нет также и ребра, которое не принадлежало бы одной из этих компо- нент. Формально читателю следовало бы доказать такую теорему. Теорема. Если граф G = (V, Е) обладает k компонентами и Vlt V2, Vk есть множества вершин, определяющие эти компоненты, то Vi, V2, ..., Vh задает разбиение V, т. е.: (1) Vt=£0, i = 1, 2, ..., k; (2) УгПУ;=0, i^i- (3) U Vt = V. Рис. 49 Рис. 50 Упражнение 1.5.6 1. Рассмотрите граф на рис. 49. (1) Связен ли он? (2) Останется ли граф связным, если убрать ребро е/? (3) Останется ли граф связным, если убрать ребро е3? (4) Останется ли граф связным, если убрать ребра eJt е2 и е4? (5) Покажите, что граф остается связным при удалении из него некоторого ребра тогда и только тогда, когда это ребро содержится в некотором цикле. 2. Определите компоненты графов, изображенных на рис. 50. 3. Докажите, что граф связен тогда и только тогда, когда он обладает лишь одной компонентой. 4. Докажите, что в каждом связном графе порядка п IE I п — 1. 5. Если граф связен и является элементарным циклом, что можно сказать о степенях его вершин? 6. Что можно сказать о степенях вершин связной элементарной цепи? 1.5.7. ДЕРЕВЬЯ а) Определение. В процессе изучения сетевых задач можно выде- лить тип графа, обычно называемый деревом. Пр и м е р. На рис. 51 изображено дерево. Заметьте следующее: (1) G связен и не имеет циклов; (2) |Е| = | V| — 1. Вопросы. Можно ли добавить ребро, не добавляя вершину, так, чтобы цикл не образовался? Сколько циклов можно образовать 100
добавлением одного ребра? Можно ли удалить ребро так, чтобы граф остался связным? Существует ли пара вершин, которые можно соеди- нить более чем одной цепью? Ответы на приведенные вопросы наводят на мысль, что можно дать несколько эквивалентных определений дерева. Мы объединим шесть определений в форме теоремы. Каждое, начиная со второго, выводится из предыдущего, а первое следует из шестого. Доказательства этих утверждений можно найти в книге Бержа [2]. Теорема. Пусть G — конечный граф порядка п > 1. G является деревом, если верно любое из следующих утверждений: (1) G связен и не имеет циклов; (2) G не имеет циклов и содержит п — 1 ребро; (3) G связен и содержит п — 1 ребро; ДереВо: 6 {У.Е). , £={е,,ег,...,еп} Циклов нет Рис. 51 (4) G не имеет циклов и, если добавить ребро, соединяющее две не- смежные вершины, то образуется ровно один цикл; (5) G связен, но становится несвязным при удалении любого ребра; (6) каждая пара вершин соединяется одной и только одной цепью. Если читатель возьмет некоторое дерево (например, граф, изобра- женный на рис. 51) и проверит на нем каждое из этих утверждений, он скорее усвоит рассмотренные понятия и идеи. б) Первые простые приложения. В этой книге речь о деревьях бу- дет идти только в связи с задачами теории вероятностей; однако, как уже было отмечено, они имеют гораздо большее значение в рамках об- щей теории сетей. Мы приведем здесь два простых примера, иллюстри- рующих использование деревьев в качестве диаграмм. П р и м е р 1. Проводится теннисный турнир с двумя участниками А и В. Победителем считается игрок, выигравший два матча подряд или просто три матча. Определить число возможных результатов тур- нира. Решение. Дерево на рис. 52 показывает все возможные результаты, каждая цепь (или, скорее, последовательность вершин в ней) соответст- вует некоторому варианту развития турнира. Вершины указывают по- бедителей в отдельных играх. Каждая цепь прерывается в случае, когда игрок победил в двух последних матчах или когда он победил в трех играх на протяжении всей цепи. Существуют десять различных вариантов исхода турнира, а именно: АА, ABAA, ABB, ABABA, АВАВВ, BAA, ВВ, ВАВАА, BABB, ВАВАВ. 101
Пример 2. В два учреждения (Л, В) надо Назначить одного ИЗ двух администраторов (Е, F), и они должны выбрать себе по одному сек- ретарю из трех имеющихся кандидатов (R, S, Т). Сколько существует различных комбинаций (администратор, учреждение, секретарь)? Решение. Ответ дается набором цепей, проходящих по дереву, изо- браженному на рис. 53, от корня до кончиков ветвей. Он содержит все возможные комбинации. Возможные комбинации : Рис. 53 (Е.А.ВУ (Е,А,3) (Е.Л.Г) (E.B.R) (E.B.S) (ЕВ. Г) (F.A.R) (F.A.S) (ЕА.Г) (ЕВ. В) (F.B.S) (ЕВ, Г) Упражнение 1.5.7 1. Найдите прямое произведение множеств А В С, где А = {3, 5}, В = = {2, 6}, С = {1, 4, 7}. Замечание. Прямое произведение есть множество всех точек (х, у, г), таких, что {x£A,y£B,z£ С}. 2. Определите прямое произведение множеств {1, 2, 3} {4, 5, 6} {5, 7}. Сколько имеется точек (х, у, г), таких, что х + у + г есть четное число? 3. Придумайте более простой способ ответа на вопрос 2, неж.ели полный перебор элементов произведения множеств. Воспользуйтесь деревом, каждая вершина которого отмечена буквой Н (нечетно) или Ч (четно), и укажите для каждой вершины число четных или нечетных результирующих сумм на каждом этапе. Примените ваш метод для нахождения числа четных сумм х + у+г+а' для точек из множества {1, 2}-{3, 5, 7) {9, 10} {2, 8, 12}. 4. С помощью диаграмм-деревьев найдите все перестановки: (а) букв R, S, Т\ (б) букв слова CART, где букве С не разрешается следовать за А. 5. В теннисном турнире с двумя участниками победителем считается тот, кто первый выиграет три партии. Определите с помощью дерева число возможных последовательностей исходов игр в турнире. Каково максимальное возможное число йгр? 6. В шахматном матче с двумя участниками победителем считается первый выигравший две партии подряд или выигравший всего три партии. В случае трех последовательных ничьих турнир объявляется закончившимся вничью. Каково число возможных различных течений матча? Сколько из них заканчиваются ничейным результатом? 7. Четыре мальчика А, В, С, D бросают друг другу мяч по следующим пра- вилам: (1) А никогда не бросает мяч С и D; (2) В никогда не бросает А и С; (3) С никогда не бросает В; (4) D никогда не бросает В; (5) никто из мальчиков, бросив мяч, не ловит его сам. Предположив, что мяч первоначально находится у А, начертите дерево- диаграмму,чтобы показать возможные пути мяча в течение первых пяти бросков.„ Предположим, что D никогда не бросает ни В, ни С, покажите, что С никогда" не получает мяч. 102
1.5.8. НАПРАВЛЕННЫЕ ГРАФЫ В предыдущих параграфах мы имели дело с графами, ребра кото- рых не были ориентированы. В огромном числе приложений существуют отношения внутри пары объектов (вершин), которые могут быть пока- заны стрелкой на линии, соединяющей пару точек. Например, граф может изображать систему городских улиц с односторонним движением, а стрелки будут показывать направление движения транспорта. Пример. На рис. 54 изображен направленный граф. Рис. 54. Направленный граф Многие понятия, требующиеся для описания структуры направ- ленных графов, аналогичны понятиям, которыми пользуются, когда речь идет о неориентированных графах, однако введение направлений усложняет ситуацию и требует некоторых изменений в определениях и обозначениях. Здесь мы не будем пытаться изложить полностью эти идеи и понятия. Следующая таблица дает сокращенные определения дуги, графа, пути и цикла и сравнивает их с аналогичными понятиями для неориенти- рованных графов: Ненаправленный граф Направленный граф Ребро G=(V, £) Цепь Цикл Дуга: ориентированное ребро G=(V, А): А—множество дуг Путь: открытая последовательность дуг (к концу одной примыкает начало другой) Цикл: замкнутая последовательность дуг 1.5.9. РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА В книгах [2] и [3] содержатся отличное введение в теорию графов и ее многочисленные и разнообразные приложения.
ЧАСТЬ ВТОРАЯ ВЕРОЯТНОСТЬ И СТАТИСТИКА 2.1 ГЛАВА ТЕОРИЯ ВЕРОЯТНОСТЕЙ э 2.1.1. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ а) Эксперименты со случайным исходом. Теория вероятностей изу- чает эксперименты со случайным исходом (случайные эксперименты). Для разъяснения этого понятия рассмотрим два простейших примера. Эксперимент А. Бросание игральной кости и регистрация числа выпавших очков. Эксперимент В. Наблюдение за продолжительностью ожидания пассажиром автобуса па остановке. Хотя описания этих экспериментов сведены к минимуму, осуществ- ление их нетрудно себе представить. Далее объясняется, почему эти эксперименты называются случайными. б) Описание эксперимента. Каждый эксперимент состоит из выпол- нения некоторого действия и наблюдения за его результатом. Предме- том наблюдения может быть некоторый процесс, его часть или же дей- ствующая система. Осуществление намеченного действия и его резуль- тат будем называть экспериментом. Полученный результат (наблюде- ние) называется исходом эксперимента. Эксперимент будет случайным (эксперимент со случайным исхо- дом), если его результат (исход) нельзя точно предсказать до его осу- ществления. Потребуем также, чтобы эксперимент можно было повто- рять при первоначальных неизменных условиях неограниченное число раз (по меньшей мере теоретически, если такое повторение практически невозможно). Например, в эксперименте А с игральной костью невоз- можно предсказать выпадающее число очков, так как результатом тако- го эксперимента может быть любое число от 1 до 6. Строго говоря, прак- тически невозможно повторять этот эксперимент при первоначальных неизменных условиях неограниченное число раз, так как в конце кон- цов углы кости сотрутся и первоначальные условия эксперимента из-' менятся. Таким образом, в эксперименте с игральной костью исход нельзя точно предсказать, т. е. эксперимент будет случайным и его можно повторять (теоретически) неограниченное число раз. В эксперименте В время ожидания также невозможно угадать аб« солютно точно (за исключением тех случаев, когда автобусы ходят с постоянным интервалом времени, что неосуществимо с абсолютной точностью). Можно возразить, что этот эксперимент нельзя повторить. 104
Действительно, после того как ожидающий пассажир сел в автобус, эксперимент будет окончен. Из этого положения можно найти, напри- мер, следующий выход. Будем наблюдать то же лицо в другие дни. Можно также измерять время ожидания автобуса разными лицами. Очевидно, зарегистрированное время ожидания зависит от точности измерения, от уровня обслуживания на этом маршруте, от оживленно- сти уличного движения. Таким образом, при определенных условиях эксперимент В можно считать случайным. в) Необходимость вероятностной меры. Как правило, эксперимент предпринимается для изучения некоторых свойств интересующего нас физического процесса. Каждую ситуацию, которую можно наблюдать и которая может возникнуть в результате эксперимента, будем назы- вать событием. Результаты эксперимента (или последовательности экс- периментов) позволяют ответить на некоторые вопросы относительно частот появления событий. Любое утверждение о событиях, связанных со случайным экспе- риментом, следует принимать с некоторой долей сомнения. Например, лицо, бросающее кость (эксперимент Л), может утверждать, что ожидае- мое число очков будет больше единицы, однако мы должны учесть воз- можную ошибку такого предположения. Если кость правильная, то выпадение единицы докажет несправедливость этого утверждения. Таким образом, появляется потребность в измерении степени уверен- ности в наступлении данного события. Эта потребность и привела к по- явлению понятия вероятности. Когда бросающий игральную кость говорит, что на 90% он уверен в выпадении числа, большего единицы, он принимает величину 90% в качестве меры уверенности в правиль- ности своего высказывания*. Величина, которая служит для этой цели, называется вероятностью. Цель теории вероятностей — вычисление вероятностей событий, их комбинаций и изучение свойств вероятностей. г) Построение модели. Построение математической модели экспе- римента начинается с описания: 1) возможных исходов, 2) событий и 3) вероятностей наступления этих событий. Это описание должно быть выполнено так, чтобы обеспечить воз- можность вычисления вероятностей комбинаций событий. С помощью абстрактной модели физического процесса можно по- лучить некоторые его численные характеристики. При этом не надо за- бывать, что вводимые математические понятия представляют собой в не- котором роде идеализацию соответствующих аспектов реальности. Поэтому выводы, полученные из абстрактной модели, могут в точности не соответствовать поведению реального двойника. Они должны быть проверены экспериментально. * Девяностопроцентная уверенность в выпадении числа очков, большего единицы, выступает здесь как субъективная вероятность. Если предположить, что кость правильная, то имеется 5 шансов из 6, что единица не выпадет. Таким образом, объективная вероятность рассматриваемого события равна 5/6. В даль- нейшем в книге рассматриваются только объективные вероятности, т. е. вероят- ности, не связанные с представлениями субъекта об изучаемом процессе. — Примеч. ред. 105
В следующих параграфах изучается аксиоматический метод по- строения математических моделей случайных экспериментов. В его основе лежит теория множеств, и соответствующие главы книги пред- полагаются изученными. Примеры применения теории вероятностей приводятся почти в каждом параграфе, так что читатель будет знако- миться с различными идеями этой теории на большом числе эмпири- ческих ситуаций, к которым возможно ее применение. Дальнейшие приложения, содержащие вероятностные модели, можно найти в треть- ей части книги, посвященной исследованию операций. Практически в любой области знания можно указать многочисленные приложения тео- рии вероятностей. Однако следует отметить необходимость тщательной проверки правомерности таких приложений. Вместе с тем нет сомне- ний в том, что методы и теоремы теории вероятностей — одно из наи- более мощных средств в арсенале современной науки. 2.1.2. ПРОСТРАНСТВО ИСХОДОВ Результаты случайного эксперимента будем называть исходами. Слова «исход», «случайный», «эксперимент» неопределяемы. Разумеется, для придания смысла этим понятиям читатель может привлекать свою интуицию, призывая в некоторых случаях на помощь предваритель- ные замечания (см. 2.1.1). При аксиоматическом изложении тео- рии эти понятия будут элементарными. К сожалению, в приложениях теории вероятностей употребляются различные термины для обозна- чения одних и тех же понятий. В этой книге читатель также встретит большое количество синонимов, и он должен быть готов к этому с самого начала. Например, слова «случай», «выборочная точка», «элементар- ное событие», «состояние» обозначают одно и то же понятие «исход». Множество всех возможных исходов случайного эксперимента на- зывается пространством исходов. Обозначим его символом Sx (или S). Это пространство относится к эксперименту X. Мы будем пользоваться способами описания множеств, изложенными в первой части книги. Примеры (1) Эксперимент А: X — «число очков, выпавших при бросании игральной кости»: Sx = {1, 2, 3, 4, 5, 6}. В эксперименте может наблюдаться любое целое число от единицы до шести. Совокупность этих чисел определяет пространство исходов эксперимента А. (2) Эксперимент: X — «выпадение герба или решетки при бросании монеты»: Sx = {Н, Т}, где Н — выпадение герба, Т — выпадение решетки. Если предположить, что монета может встать на ребро, то необхо» димо включить и это состояние в пространство исходов эксперимента. Тогда Sx = {//, Т, Ребро}. 106
Из рассмотренного примера читатель может заметить, что простран- ство исходов эксперимента не всегда очевидно и единственно. Может существовать целый набор таких пространств. Окончательный выбор пространства исходов зависит от экспериментатора. Существенно, од- нако, чтобы все практически осуществимые исходы были приняты во внимание и включены в пространство исходов исследуемой модели. Вы- воды и прогнозы, полученные по модели, основанной на неправильно сформулированном пространстве исходов, могут оказаться ложными. (3) Эксперимент В: X — «наблюдение за продолжительностью ожи- дания пассажиром автобуса на остановке». Если интервал движения автобусов не больше М минут, то в качестве пространства исходов можно взять S = {t:t 6 [О, /И]}. Если Л1 неизвестно, то его значение необходимо взять достаточно боль- шим, чтобы охватить все практически интересные ситуации. Упражнение 2.1.1 Напишите пространство исходов каждого из следующих экспериментов, опи- сав множество его элементов. 1. Наблюдение пола новорожденного. 2. Наблюдение числа разбитых бутылок в доставленном ящике, содержащем 12 бутылок. 3. Определение расстояния от центра мишени до точки попадания пули. 4. Наблюдение числа выпадений герба при бросании двух монет. 5. Наблюдение числа автомобильных происшествий в данном городе за не- делю. 6. Наблюдение времени сгорания топлива в двигателе ракеты. а) Дискретные и непрерывные пространства. Пространство исходов может быть дискретным или непрерывным. К первым обычно относят пространства, имеющие счетные множества исходов. Ко вторым — все остальные. Следующие примеры иллюстрируют эти понятия. Примеры (1) Пространство эксперимента А содержит 6 исходов. Эти исходы можно пересчитать; таким образом, пространство исходов будет дис- кретным. (2) Для эксперимента В S = {t'.t Е [О, Л4]}. Отсюда следует, что воз- можным исходом эксперимента может быть любое действительное число от 0 до М. Как доказывается в теории действительных чисел, между элементами такого множества и множеством натуральных чисел 1, 2, 3, ... нельзя установить взаимно-однозначное соответствие. Можно сказать, что множество S будет несчетно, а пространство исходов экс- перимента В — непрерывно. (3) Рассмотрим эксперимент, в котором происходит бросание моне- ты до первого появления герба (число бросаний в этом эксперименте фиксировано). Пространство исходов S — {0, 1, 2, 3, ...}, где 0—«герб ни разу не выпал», т. е. {7, Т, ...}; 1 — «герб выпадает при первом бросании монеты», т. е. {//}; 107
2 — «герб выпадает при втором бросании монеты», т. е. {Т, Н}\ 3 — «герб выпадает при третьем бросании монеты», т. е. {У, Т, Н} и т. д. Описанный эксперимент может быть представлен в виде последова- тельности более простых экспериментов, осуществляемых до первого появления герба./ Поскольку имеется принципиальная возможность, что герб никогда пс выпадет, модель будет охватывать все возможные ситуации лишь в случае, если пространство исходов не ограничено. Оно счетно, поскольку исходы, как было показано, можно перенуме- ровать, и, следовательно, дискретно. Понятно, что против моделей реальных явлений с неограниченным числом исходов практики могут выдвинуть возражение. Однако в том случае, когда применение таких моделей упрощает математическое ис- следование и не ведет к выводам, сильно отличающимся от эксперимен- тальных результатов, этими возражениями можно пренебречь. б) Произведение пространств. Иногда сложный эксперимент может быть разбит на последовательность более простых, независимых экспе- риментов, или серий. В этом случае будем говорить, что такая после- довательность экспериментов определяет составной эксперимент. Проиллюстрируем это понятие на примере. Эксперимент X: «одновременное бросание монеты и игральной кости; наблюдение выпавшей стороны у монеты и числа очков на кос- ти». Очевидно, что этот эксперимент можно рассматривать как два экспе- римента (скажем, Лг и Х2), осуществляемые последовательно. Посколь- ку в составном эксперименте X делаются два наблюдения, для их запи- си необходимо ввести два символа. Обозначим результат первого экспе- римента Хг через х19 а результат второго эксперимента Х2 — через х2. Тогда исход эксперимента X можно записать в виде пары исходов (xlt х2). Таким образом, пространство исходов составного эксперимента X состоит из всевозможных упорядоченных пар исходов, в которых пер- вый элемент взят из пространства S, эксперимента Хг, а второй — из пространства S2 эксперимента Х2. Найдем теперь пространство исхо- дов для составного эксперимента X. Для этого можно воспользоваться стрелочной диаграммой (рис. 55 (а)) или двустрочной таблицей (рис. 55(6)). Оба эти метода должны быть освоены читателем; они будут применяться в упражнениях. Заметим, что результат эксперимента Х2 никоим образом не влияет на результат эксперимента Хг и наоборот. В таких случаях будем говорить, что эксперименты Хг и Х2 независи- мы. Дальнейшее обсуждение этого важного понятия читатель найдет в 2.1.6. Как видно из рис. 55, пространство исходов для составного экспери- мента X будет S = {(Я/), ..., (Н6), (ТТ), ..., (Тб)}. Пространства, построенные по такому образцу, называют прямым произведением пространств. Определение. Пусть пространства Sx и S2 заданы. Простран- ство S, состоящее из всех упорядоченных пар (хь х2), таких, что лу есть элемент из Slt а х2 — элемент из S2, называется прямым произве- дением пространств Sx и S2. 108
Пространство Пространство Пространство исходов S1 исходов 5г исходов S (НТ) (Н2) (ИЗ) (И4) (Ив) (Ив) (П) (Г2) (ГЗ) Правый конец ветви определяет упорядоченную пару (Г4) (Т5) (Тб) Рис. 55. Диаграмма пространства исходов составного эксперимента (б) Двустрочная таблица Обозначение:5 = 51Х S2, Таким образом, S = X S2 ~ {(М, У 2)- ^"1 С ^i> ^2 £ Идея прямого произведения пространств может быть легко обоб- щена на случай эксперимента, состоящего из последовательности боль- ше двух экспериментов. В случае трех испытаний пространство исходов будет состоять из всех упорядоченных троек (лу, х2, х8) и будет обозна- чаться как 5Л X Sg X S3. Упражнение 2.1.2 Запишите пространства исходов для приведенных экспериментов. Восполь- зуйтесь стрелочной диаграммой и (или) двустрочной таблицей. 1. Наблюдение пола двух первых детей одной женщины. 2. Наблюдение выпавших сторон при бросании трех одинаковых монет. (Замечание. Это эквивалентно бросанию одной монеты три раза подряд и наблюдению тройки полученных результатов.) 3. Наблюдение верхних граней двух брошенных игральных костей (одна из костей красная, другая — зеленая). Мы обсудили основное (неопределимое) понятие исхода случайного эксперимента. Описание пространства исходов — первый шаг в по- строении модели физического эксперимента. Все вопросы об экспери- менте должны быть сформулированы в терминах элементов пространст- 109
ва исходов. В этих же терминах будут получены и ответы на постав ленные вопросы. Для дальнейшего развития модели нео’бходимо ввести понятие события. •л 2.1.3. СОБЫТИЯ И ПОЛЕ СОБЫТИЙ а) События. Понятие «событие» — одно из центральных в теории вероятностей. Следующие определения уточняют смысл понятий «со- бытие» и «появление события». Для обозначения события будем поль- зоваться буквой Е. Определение I. Событием называется любое подмножество пространства исходов. Определение II. Будем говорить, что событие Е произошло, если результат (исход) эксперимента принадлежит Е. Таким образом, если х — наблюдаемый исход эксперимента и при этом х £ Е, то мы го- ворим, что событие Е произошло. Утверждение относительно исхода Соответствующее событие Исход (а) словесная формулировка события (б) список элементов события (1) число 5 (2) четное число (3) нечетное число (4) число меньше 4 (5) число меньше 10 (6) отрицательное число Е1= «исход—число 5» Еа= «исход—положительное четное число меньше семи» Е3= «исход—положительное нечет- ное число меньше шести» Et=«исход—целое число между еди- ницей и тройкой (включитель- но)» Е6 = «исход—целое число между единицей и шестеркой (вклю- чительно)» Ев = «исход—число, которого нет на кости» {2, 4, 6} {1, 3, 5) {1, 2, 3} {1, 2, 3, 4, 5, 6} = S {“}=0 Поясним смысл этих определений в применении к случайному эксперименту на примере с бросанием игральной кости (экспери- мент А, пространство исходов которого S= {1, 2....6}). В таблице приводятся шесть утверждений (высказываний), которые могут быть сделаны относительно предполагаемого исхода. Каждое высказывание определяет некоторое событие. Соответствующие события описываются сначала словесно, а в последнем столбце приведена их запись в виде подмножеств множества S. Рассмотрим высказывание (2) из этой таблицы. Оно будет верным тогда и только тогда, когда выпадет одно из чисел 2, 4 или 6. Если ис- ход эксперимента обозначить через х и если х £ {2, 4, 6}, то событие Ег произошло и содержащееся в высказывании утверждение подтверди- лось. Под событием Е2 можно понимать множество истинности соот- ветствующего высказывания. Таким образом, для проверки справедли- во
вести некоторого высказывания относительно эксперимента необходимо этот эксперимент выполнить и проверить, будет ли его исход входить в перечень элементов для соответствующего события. На таком языке удобно как задавать вопросы, так и формулировать утверждения. Любой из рассматриваемых нами вопросов об эксперименте может быть связан с появлением (или непоявлением) некоторого события Е, заданного списком множества его элементов. Изучая это событие со- вместно с остальными элементами пространства исходов, можно ответить на вопрос: насколько вероятно наступление события Е? Полезно уяснить себе, что любое подмножество множества S можно всегда представить как некоторое событие. Читатель должен по воз- можности избегать эмоциональной окраски, которую он зачастую свя- зывает с наступлением события. Например, если игрок, играющий в вист или бридж, имеет на руках одни «пики», то такое «событие» может привести к обвинению этого игрока в шулерстве. Это непра- вильно. С точки зрения теории вероятностей любой набор карт, полу- ченных игроком, необходимо рассматривать как событие некоторого эксперимента. При этом любой возможный набор (быть может, и не- интересный) будет исходом эксперимента, который можно определить как событие с одним исходом. После введения понятия события мы можем заняться обсуждением специальных событий, а также различных соотношений, которые можно установить между событиями. При этом большую роль будут играть понятия и символы теории множеств. б) Специальные события. А. Элементарные (или простые) события. События, содержащие только один исход, называются элементарными (или простыми) со- бытиями. Б. Невозможные и достоверные события. Все утверждения (вы- сказывания) о случайном эксперименте можно разделить на три класса: (1) утверждения, которые не могут осуществиться; (2) утверждения, которые всегда верны; (3) утверждения, не входящие ни в класс (1), ни в класс (2). Примеры класса (1): (а) выпавшее число при бросании игральной кости равно 85; (б) следующая карта, взятая из колоды игральных карт, будет 15 пик; (в) результат бросания двух монет будет (Н, Н, И). При исследовании соответствующего пространства исходов для каждого из этих утверждений мы обнаружим, что оно не содержит ни одного элемента, при котором утверждение было бы верным. Таким об- разом, в каждом из этих случаев «множество истинности» будет пустым, и утверждение эквивалентно наступлению невозможного события, которое иногда обозначают {—}. Очевидно, такое событие никогда не может наступить, поэтому утверждение не может осущест- виться. Определение. Любое событие, совпадающее с пустым мно- жеством, называется невозможным событием. 111
Примеры класса (2): (а) выпавшее число очков при бросании игральной кости будет меньше 10; (б) время жизни .^которого лица будет больше или равно нулю; (в) выпавшая сторона при бросании обыкновенной монеты будет или гербом, или решеткой. Для каждого из этих утверждений множеством истинности будет все пространство исходов S. Л поскольку хотя бы один исход из S должен наступить, то при этом наступает и все событие S. Таким об- разом, утверждение будет всегда верным. Определение. Любое событие, совпадающее с пространством исходов, называется достоверным событием. Очевидно, что истинность любого утверждения из классов (1) и (2) может быть определена до выполнения соответствующего эксперимен- та. Множество истинности этих утверждений равно либо 0, либо X, т. е. сами утверждения соответствуют либо невозможным, либо досто- верным событиям. Что касается утверждений, принадлежащих к классу (3), то здесь неопределенность существует до тех пор, пока соответствующий экспе- римент не выполнен. В этом случае, прежде всего, и возникает необхо- димость в теории вероятностей. Если событие ни невозможно, ни досто- верно, то его наступление будет возможным, но неопределенным. Воз- никает вопрос: какова неопределенность наступления этого события? Цель теории вероятностей состоит в получении шкалы, с помощью кото- рой можно количественно измерять неопределенность наступления дан- ного события. Способы достижения этой цели будут описайы в следую- щих параграфах. В. Противоположные события. Рассмотрим в эксперименте с иг- ральной костью появление двух событий: первое — «выпадение нечет- ного числа», второе — «выпадение четного числа». На языке теории множеств эти события можно записать как Е = {1,3, 5}и77= {2,4,6}. Ясно, что при выполнении эксперимента должно наступить либо Е, либо F, поскольку вместе эти события охватывают все пространство исходов S. Очевидно, что оба события не могут наступить одновременно. Такие пары событий называются противоположными (дополнительны- ми). Как и в теории множеств, дополнение к событию Е будем обозна- чать Е', тогда F равно Е'. Определение. События Ей Г называются противоположными, если Е наступает, когда не наступает F, и наоборот. Упражнение 2.1.3 1. Нарисуйте диаграмму Венна для любой пары противоположных событий £ и Г на некотором пространстве исходов S. Покажите, что Е U F = S и Е П F = 0. 2. Прочтите заново параграф, посвященный дополнительным множествам в гл. 1.1. 3. Выпишите события в эксперименте А, которые будут противоположны {2}, {1, 3, 4}, {2, 5, 6}, 0, S, «число больше 3». 112
Г. Взаимно несовместимые события. Любые два события, не имею- щие общих исходов, называются взаимно несовместимыми. Такие пары событий не могут произойти одновременно; появление одного исключает появление другого. Если Е и F—взаимно несовместимые события, то Е П F = 0, т. е. их пересечение пусто. в) Комбинации событий. Читатель, наверное, уже заметил, что со- бытия трактуются нами точно так же, как множества в первой части. Все правила включения, операции объединения, разности, пересе- чения совместно со всеми основными законами алгебры множеств будут применяться без изменений и к событиям. Рекомендуем читателю про- смотреть соответствующие параграфы гл. 1.1 и усвоить следующие оп- ределения, показывающие, как «язык событий» преобразуется в «язык множеств». (1) Е [J F — событие, соответствующее объединению событий, на- ступает при наступлении хотя бы одного события Е или F и только при этом. (2) Е — F, или EF', — событие, соответствующее разности собы- тий, наступает при одновременном наступлении Е и ненаступлении F и только при этом. (3) EF — событие, соответствующее произведению событий, насту- пает при одновременном наступлении Е и F и только при этом. Важное замечание. В последующих параграфах, посвя- щенных теории вероятностей, символ пересечения f| опускается. Это общее правило в теории вероятностей. Пересечение событий выражает- ся последовательной записью символов, обозначающих эти события. Например, EFG обозначает пересечение трех событий Е, F и G. (4) Е с F — событие, соответствующее включению; F наступает, если наступает Е. Основные понятия и законы алгебры событий те же, что и для ал- гебры множеств (см. гл. 1.1). Упражнение 2.1.4 1. Для событий эксперимента А, описанных в таблице на с. 111 найдите: (а) дополнения к событиям от Ех до Е6; (б) объединение, разность и пересечение пар событий Е\Е2, Е2Е3, E3Es, EtE3, Е3Ее, E2Eit Е2Е3, Е2Е3, (в) дополнения всех событий, найденных в (б). Попытайтесь дать ответ не только описанием соответствующего подмножест- ва, но и получить его в рамках словесных формулировок. 2. Пусть Е, F и G—три события пространства S исходов эксперимента. Вы- разите следующие события на языке теории множеств: (а)Е и F наступают оба, a G не наступает; (б) F наступает, а Е и G—нет; (в) наступает только G; (г) насту- пает хотя бы одно из Е, F, G; (д) наступает только одно из событий; (е) наступают по крайней мере два события; (ж) наступают все три события; (з) наступают точ- но два события; (и) наступает не больше двух событий; (к) наступают меньше чем два события; (и) наступают Е или F (но не вместе), а событие G не наступает. г) Поля событий. Мы говорили, что все подмножества пространства исходов S называются событиями. Если S конечно, то класс (см. с. 27) всех подмножеств множества S может быть построен с помощью опе- раций дополнения и объединения элементарных событий, что иллюстри- руется следующей таблицей: ИЗ
Возможные события в эксперименте с пространством исходов {а, Ь, с} Подмножество Построение Событие, не содержащее исходов Элементарные события (простые исходы) События, состоящие из двух исходов События, состоящие из трех исходов {-}=0 {«} и. м {ab}, {fee}, {са} {abc} — S S' даны {ч}и{^} ИЛИ {с}' ИТ. д. {а}и(Ь}Щс} В среднем столбце таблицы приведены все восемь подмножеств, ко- торне могут быть получены из S. Эти события образуют полный класс событий, участвующих в построении и применении модели этого экспе- римента. При построении вероятностной модели эксперимента мы должны, во-первых, определить пространство исходов этого эксперимента и, во-вторых, класс событий, которые, собираемся рассматривать. Для конечных пространств исходов будем пользоваться классом всех под- множеств множества S. Пример построения такого класса был приве- ден ранее. Если S непрерывно, то класс всех подмножеств слишком велик для того, чтобы с его помощью можно было ввести понятие ве- роятности простым и естественным способом. Поэтому мы ограничим- ся наименьшим классом событий, который обладает следующими свойствами: (1) пустое множество 0 принадлежит этому классу; (2) если событие Е принадлежит классу, то и его дополнение Е' принадлежит этому классу; (3) если каждый элемент счетной последовательности событий Еъ Е2, Е3, ... принадлежит классу, то и объединение событий El U E2UE3U ••• принадлежит этому классу. На приведенных замечаниях и соответствующих допущениях чита- телю не следует заострять свое внимание. Будет достаточно, если он усвоит тот факт, что эти предположения позволяют ограничить класс всех возможных событий, определенных на S, до некоторого подкласса событий. Семейство событий, обладающих свойствами (1), (2) и (3) ока- зывается достаточным для описания любого физического явления, воз- никающего в результате случайного эксперимента. Класс подмножеств пространства исходов, используемый в теории, вероятностей и удовлетворяющий свойствам (1), (2) и (3), известен как поле событий. Мы будем обозначать поле событий символом &. При описании дискретных или непрерывных пространств исходов чи- татель может встретить соответственно названия булевское поле, боре- левское поле. Эти названия даны по именам математиков Дж. Буля (G. Boole, 1815—1864) и Е. Бореля (Е. Borel, 1871—1956), которые исследовали структуру и свойства таких классов подмножеств. 114
Упражнение 2.1.5 1. Выпишите все события для эксперимента «наблюдение верхней стороны монеты при ее бросании» (т. е. найдите поле событий). 2. Найдите поле событий для эксперимента с игральной костью (экспери- мент Л). 3. Покажите, что число событий в поле, построенном на пространстве исхо- дов, состоящем из п элементов, равно 2П. У Казани е. Покажите, что это число будет равно затем рассмотрите разложение бинома (1 + 1)п. 2.1.4. ВЕРОЯТНОСТНАЯ МЕРА а) Обсуждение проблемы. Мы возвращаемся к проблеме построения правил количественного измерения неопределенности появления собы- тий и их комбинаций. Прежде чем непосредственно переходить к ре- шению проблемы, рассмотрим снова события £ъ Е2, Е5 и Ев из экспери- мента А. Напомним, что в эксперименте с бросанием игральной кости S = {1, 2, 3, 4, 5, 6}; событие £х — «выпадение 5» = {5}; событие Е2 — «выпадение нечетного числа очков» = {1, 3, 5}; событие Ей — «выпадение числа очков меньше 0» = {—}= 0; событие Еа — «выпадение числа очков меньше 10» = {1, 2, 3, 4, 5, 6} = = 5. Будем считать, что невозможное событие имеет вероятность, равную нулю, достоверное событие — вероятность, равную единице, а все остальные события имеют в качестве вероятности числа от нуля до еди- ницы. Таким образом, получаем Р (£5) = Р (0) = 0 и Р (£е) = Р (S) = 1, где символом Р (X) обозначается «вероятность того, что событие X произойдет». Выясним теперь, что следует понимать под Р (£), когда событие £ не является ни невозможным, ни достоверным. Интуитивно мы вправе ожидать, что при правильной игральной кости выпадение любой сторо- ны имеет одинаковый шанс. У нас, таким образом, появляется искуше- ние приписать каждому элементарному событию {1}, {2}, {3}, {4}, {5}, {6} вероятность 1/6. Принимая такое решение, мы должны сознавать, что оно основано на нашей интуиции, а не на логике — мы не можем доказать правильность или ошибочность выбора этой вероятности. Мно- жество вероятностей {1/6, 1/6, 1/6, 1/6, 1/6, 1/6}, приписываемых элементарным событиям, будет основным и последним необходимым условием построения вероятностной модели, описываю- 115
щей эксперимент с бросанием игральной кости. Правилен ли выбор этого множества или нет, будет исключительно зависеть от соответствия выводов, полученных из модели, и результатов экспериментов с броса- нием КОСТ . Итак, основываясь на интуитивных соображениях, мы видим, что Р (Ех) = 1/6. Что теперь можно сказать о значении Р (Е2), т. е. вероятности вы- падения нечетного числа очков? Рассматриваемое событие содержит три исхода, наступление каждого из которых ведет к наступлению события Е2- Учитывая это, можно оправдать такое определение вероятности: Р(Б2)=Р({1,3,5}) = Р({1}) + Р({3}) + Р({5}) = 44--^ + 4=4-. о о о 2 Это — так называемое правило сложения вероятностей, и оно пред- ставляет собой фундаментальное правило при отыскании вероятностей для комбинаций событий (см. аксиому III в следующем параграфе). Показав на примерах основные свойства вероятности, рассмотрим некоторые общие положения и правила использования вероятностей в математических моделях. б) Общие положения. (1) Мы предполагаем, что шкала измерения вероятностей нахо- дится на действительной оси и вероятность — действительное число между 0 и 1 включительно. (Иногда вероятность указывается в процен- тах между 0 и 100% включительно.) (2) Каждому событию, относительно которого с уверенностью можно утверждать, что оно не произойдет в данном эксперименте, в качестве его вероятности приписывается число 0, каждому достоверному собы- тию приписывается число 1. (3) Вероятности любых других событий — числа между 0 и 1. Такое правило сопоставления основано на интуиции и результатах простых экспериментов, выполненных ранее. Итак, число, приписываемое со- бытию Е в поле &, назовем вероятностью события Е и обозначим Р (Е). (4) Вероятности, приписываемые событиям, удовлетворяют следую- щим правилам (аксиомам). Аксиомы вероятности Аксиома I. Е (Е) 0 для любого события Е поля событий 2F. Аксиома II. Р (S) = 1 для достоверного события S. Аксиома III. Если Еъ Е2, .... Еп, ... — любая счетная после- довательность взаимно несовместимых событий на поле &, то вероят-' ность события, являющегося их объединением, равна сумме вероят- ностей отдельных событий, т. е. Р (Ej и Е2 и ... и Еп и ...) = Р (EJ + Р (Е2) + ... + Р (Еп) + ... Аксиомы I и II утверждают, что все вероятности неотрицательны и что вероятность достоверного события равна 1. Аксиома III постули- рует интуитивно ясное и естественное требование, в силу которого ве- роятность объединения событий можно получить суммированием ве- роятностей составляющих событий при условии, что эти события взаим- но несовместимы. 116
При желании читатель может представлять себе Р (•) как функцию, определенную на поле и принимающую значения на отрезке [0, 1]. Итак, каждому событию Е в поле & приписывается некоторое число между 0 и 1, которое обозначается Р (£). в) Первые результаты. Первые шаги в построении нашей модели закончены. На пространстве исходов S было построено поле событий &. На этом поле мы определили вероятность (удовлетворяющую аксиомам I, II, III) с помощью функции вероятностей Р на $•. Тройку (S, $, Р) будем называть вероятностным пространством случайного экспери- мента. Читателя необходимо предупредить, что нет непогрешимых правил построения подходящего вероятностного пространства для любого данного эксперимента. Исследователю могут потребоваться практи- ческие навыки, развитая интуиция и немалые затраты труда, чтобы правильно выбрать 5 и Р для изучаемого эксперимента. Сделав свой выбор, он должен быть готов к тому, что после предварительного экс- периментирования он столкнется с необходимостью модификации выбранных S и Р. Определив вероятностное пространство, мы можем развивать теорию вероятностей дальше. Следующие четыре теоремы показывают, как это можно сделать. Некоторые пункты доказательства читатель, когда это представляется возможным, может проверить с помощью диаграмм Венна. Теорема 1. В (0) = 0. Доказательство. Так как S С F, то S' = 0 также при- надлежит $. Однако S и 0 взаимно несовместимы и потому (аксиома III) Р (5 U 0) = Р (5) + Р (0); поскольку S U 0 = S, то Р (S) = Р (S) + Р (0), откуда Р (0) = 0. Теорема 2. Р (Е) = Р (EF) + Р (EF)'. Доказательство. Из диаграммы Венна для пересекающих- ся множеств Е и F следует, что Е = (EF) U (EF'), причем EF и EF' взаимно несовместимы. Утверждение теоремы следует из аксиомы III. Теорема 3. (Вероятности противоположных событий.) Р (Г) = 1 — Р (F). Доказательство. Заменяя в теореме 2 событие Е на S, по- лучим: Р (S) = Р (SF) + Р (SF'), 1J7
т. е., на основании аксиомы II, 1 = Р (F) + Р (F'), что и завершает доказательство. Теорема 4. (Вероятности объединения событий.) Р (Е U Д) = Р (Е) + Р (F) — Р (EF). Доказательство. Событие Е U F, которое означает «насту- пает или Е, или F (или же Е и F одновременно)», может быть записано как объединение двух взаимно несовместимых событий Е и E’F. Про- верьте это с помощью диаграммы Венна. Таким образом, Р (Е U F) = Р (Е (J (E'F)) = Р (£) Д Р (E'F) (аксиома III) = = Р (£) + Р (F) — Р (EF) (теорема 2). Заметим, что когда Е и F взаимно несовместимы, т. е. EF — 0, теоре- ма 4 превращается в аксиому III. Упражнение 2.1.6 1. Покажите, что Р (EF) < Р (£) < Р (Е IJ F) < Р (£) + Р (F). 2. Пусть, £, F и G — три произвольных события в JT. Обобщите теорему 4 и покажите, что Р (Е U F (J G) = Р (£) + Р (F) + Р (G) - Р (EF) — Р (FG) — Р (GE) + + Р (EFG). 2.1.5. МЕТОДЫ ЗАДАНИЯ ВЕРОЯТНОСТЕЙ Наиболее трудная задача математического моделирования реаль- ных явлений состоит в правильном задании множества вероятностей. Как было указано в 2.1.4, исследователь на этом этапе должен проявить весь свой опыт и интуицию. Далее даны два наиболее общих метода получения вероятностей1. В прошлом веке этими способами пользо- вались, пытаясь определить значения вероятностей в терминах эмпи- рических понятий. Сейчас установлено, что это, вообще говоря, не- возможно, однако имеет смысл применять эти способы для определения вероятностей в аксиоматических моделях. а) Вероятности и относительные частоты. При изучении некоторого события Е случайного эксперимента X вероятность Р (Е), приписывае- мая этому событию, может быть получена следующим образом. Выполним эксперимент многократно (скажем N раз) и подсчитаем, сколько раз событие Е произошло. Обозначим это число через пЕ- От- ношение iieIN назовем относительной частотой появления события Е в N испытаниях. Это отношение может быть полезным для оценки Р (Е) 1 В этой главе далее рассматриваются эксперименты только с дискретными пространствами исходов. Вопрос задания вероятностей в непрерывных прост- ранствах затрагивается в гл. 2.4. Определения условной вероятности и незави- симости, данные в 2.1.6, распространяются на любые вероятностные простран- ства. 118
Ч О 10 20 30 4Д 50 N Число бросаний Рис. 56. Относительная частота выпа- дений герба в N бросаниях монеты Справедливость такого способа основана на гипотезе о существова- нии константы (обозначим ее Р (Е)), около которой группируются от- носительные частоты nE/N, вычисленные по N различным сериям экс- периментов. Если N брать достаточно большим, то относительные часто- ты будут все ближе группироваться около этой константы. На рис. 56 показано, как.пЕ1М изменяется при увеличении N для эксперимента с бросанием обыкновенной монеты. И хотя доказать справедливость гипотезы невозможно, практика показывает, что такой способ приемлем. В действительности этой ги- потезой пользуются в большинстве приложений теории вероятностей при построении математических мо- делей реальных явлений. При выполнении следующих экспериментов для читателя будет полезно воспользоваться таким способом определения вероятности. Эксперименты (1) Бросьте монету N раз (7V = 10, 20, 30 и т. д.) и подсчитайте число выпадений герба. Найдите относительную частоту Н и нане- сите это число вместе с N на диаг- рамму. Заметьте, как все ближе группируются точки около некоторого числа лежащего между 0 и 1. Оцените Р (Я). (2) Бросьте две кости N раз (N = 10, 20, 30 и т. д.) и подсчитайте, в скольких из них сумма выпавших очков Т = 5. Относительную часто- ту и N нанесите на график. Оцените Р (Т = 5). б) Пространства с равновозможными исходами. Во многих прило- жениях теории вероятностей (например, случайные игры) простран- ство исходов может быть описано как конечное множество исходов, наступления которых можно считать «равновозможными». Если мы предполагаем, что каждый из п исходов в S имеет одинаковый шанс для его наступления, то мы должны приписать каждому из них вероятность, равную Мп. Таким образом, Р ({х}) = Мп для любого х Е S. Это соотношение известно как вероятностная функция Лапласа, по имени математика и философа, чья книга «Theorie analytique des probabilites» (1812) сделала так много для превращения теории вероят- ностей в математическую дисциплину. Поскольку любое событие, определенное на конечном пространст- ве исходов, может быть представлено как объединение элементарных событий, то вероятность его наступления можно найти с помощью функции Лапласа и аксиомы III. Таким образом, если Е {xlt х2, ..., хг} — {xj (J {х2} U ... U {хг}, то Р (Е) = Р ({хх}) + Р ({х2}) + ... + Р ({хг}) (аксиома III) — = Мп 4- Мп + ... + Мп = г/п. 119
Принято число исходов в Е обозначать через N (Е). Поскольку для конечного пространства исходов N (S) = п, то, предположив, что N (Е) = г, можно записать: Р(Е) = -ЛЮ. = _£_. ' JV(S) п Это соотношение часто называют классическим определением вероят- ности события. Примеры (1) Бросание игральной кости. Найти вероятность того, что выпа- дет четное число очков. Решение. Пространство исходов S = {1, 2, 3, 4, 5, 6}, событие Е = = {2, 4, 6}. Поэтому р (£) = ЛЮ. = А v ' JV(S) 6 в предположении, что исходы равнозначны. (2) Бросание двух игральных костей. Найти вероятность того, что сумма выпавших очков равна 5. Решение. Пространство исходов S = {(1,1), (1,2), ..., (6,6)} (см. 1.2.3 о произведении пространств), событие Т = {(1,4), (2,3), (3,2), (4,1)}- Поэтому Р(Т\= Л?(Г) _ 4 V ' M(S) 36’ (3) Бросание двух монет. Найти вероятность того, что появится только один герб. Решение. Пространство исходов S = {(ТЕ), (НТ), (TH), (НН)}, событие Е = {(НТ), (TH)}. Поэтому Р (£) = ЛЮ. = _L v ' JV (S) 4 в) Комбинаторные задачи. Итак, если вероятности заданы способом, описанным в п. б), то задача вычисления вероятности события сводится к подсчету числа элементов множества исходов события, числа элемен- тов пространства исходов и к вычислению отношения этих чисел. Во многих задачах возможно отыскание нужных величин без непосредст- венного составления списка элементов множеств Е и S или их описа- ния. Однако в любом случае необходимо дать точное определение этих множеств и указать способ их построения. При подсчете числа элемен- тов множеств Е и S очень часто пользуются приведенными далее че- тырьмя формулами. Читатель, наверное, уже знаком с ними. Он мог встретить их при первом знакомстве с комбинаторикой, и поэтому детали в объяснениях будут опускаться. 120
Формула 1. Если некоторое задание может быть выполнено т спо- собами, а другое задание — п способами, то число различных способов выполни ния двух заданий равно тп. Пример. Директор школы (мужчина) и заведующая учебной частью (женщина) выбираются из группы кандидатов, состоящей из четырех мужчин и пяти женщин. Сколько существует различных воз- можных способов такого выбора? Решение. Директор школы может быть выбран четырьмя способами, заведующая учебной частью — пятью способами. Таким образом, чис- ло различных возможных пар равно 4-5 = 20. Формула 2 (размещения). Если из п различных предметов сделана выборка объема г и предметы расставлены в соответствии с порядком их выбора, то число возможных различных упорядоченных выборок равно п (п — 1)...(« — г + 1). Это число может быть записано через факториалы и обозначено Лп или пРг. Итак, Агп = пРг = п (п— 1)... (п—г-|-1) = nl (« — 'В ' Отметим, что каждый предмет может быть выбран только один раз. Окончательная выборка называется размещением г объектов, и го- ворят, что выборка производилась без повторений или без возвращения выбранного предмета. Формула 3. Если выборка в формуле 2 производится с повторением или с возвращением (т. е. каждый выбранный предмет записывается и кладется обратно, прежде чем выбирается следующий предмет), то число различных возможных упорядоченных выборок равно пп...п = = пТ. Формула 4 (сочетания). Если число различных объектов равно п и производится выборка объема г без возвращения выбранного предме- та на место, то число возможных различных выборок при условии, что порядок не играет роли, равно A=_el_. г! г! (п—г) ! Такие выборки называют сочетаниями. Число сочетаний из п элемен- тов по г обозначают Ch, или пСг, или Оно совпадает с соответству- ющим биномиальным коэффициентом. Примеры (1) Урна содержит 4 цветных шара (красный, белый, синий, зе- леный), из нее производится выборка объема 2: (а) упорядоченная без возвращения шаров в урну, (б) упорядоченная с возвращением, (в) неупорядоченная без возвращения. Найдите число возможных выбо- рок в каждом случае. 121
Решение. (а) Список всех размещений из 4 шаров по 2 будет следующим: л== (кб), (кс), (кз), (бс), (бз), (сз) 1 (бк), (ск), |3к), (сб), (зб), (зс) J ’ таким образом, N (Л) — А\ = 4Р2 = 12. (б) Теперь выборка производится с возвращением, поэтому список будет таким: В = A U {(кк), (бб), (сс), (зз)}, таким образом, N (В) = 42 = 16. (в) Список сочетаний из 4 шаров по 2 будет следующим: С — {(кб), (кс), (кз), (бс), (бз), (сз)}. Сравним это множество с А. Очевидно; что множество выборок из А, для которых порядок не имеет значения, совпадает с С. Таким образом, - ДГ(С) = С2 = Р ) = 6. (2) Предположим, что шары в урне из примера (1) хорошо переме- шаны. При различных условиях этого примера (а), (б), (в) будем выби- рать из урны пару шаров (такой выбор называется случайной выбор- кой). Найти в каждом случае вероятность того, что выбранная пара содержит по крайней мере один белый шар. Решение. Пространствами исходов для соответствующих экспери- ментов будут множества А, В и С с соответствующими множествами событий: для А {(кб), (бк), (бс), (сб), (бз), (зб)}; для В {(кб), (бк), (бс), (сб), (бз), (зб), (бб)} для С {(бк), (бс), (бз)}. С помощью вероятностной функции Лапласа отсюда легко найти соот- ветствующие вероятности. Ими будут числа 6/12, 7/16, 3/6. Чтобы научиться уверенно и успешно пользоваться этими форму- лами, необходима практика. Читателю полезно будет проделать упраж- нения, предложенные в конце этого параграфа. Другие задачи подоб- ного рода он сможет найти в книгах по комбинаторике или теории ве- роятностей. В дальнейшем читатель увидит, что всякий раз, когда со- ставление списка пространства исходов возможно, такая процедура окажется весьма полезной для преодоления тех неясностей и неопреде- ленностей, которые еще долго будут возникать в подобных задачах. Упражнение 2.1.7 1. В таблице на с. 123 приводятся описания различных экспериментов. Для каждого эксперимента определяются два события (Е и F). (а) Составьте список элементов пространства исходов событий Е и F. (б) Опишите (словами и (или) с помощью списка элементов множества) собы- тия Е', F'. E (J F, (Е (J F)', EF, (EF)', (Е — F). (в) Найдите вероятности всех событий из (а) и (б), применяя вероятностную функцию Лапласа. 122
Эксперимент (выбор случаен, без возвращения, кроме особо оговоренных случаев) Событие Е Событие F 1. Бросается одна игральная кость 2. Бросаются две игральные кости 3. Выбираются две карты из ко- лоды 52 перетасованных карт 4. Из урны, содержащей 2 зеле- ных и 4 синих шара, выбира- ются 2 шара 5. Эксперимент 4 выполняется с возвращением 6. Три карты выбираются из ко- лоды 52 перетасованных карт 7. Из урны, содержащей 9 биле- тов, занумерованных от 1 до 9 включительно, выбираются 3 би- лета 8. За круглый стол случайным образом садятся двое мужчин и две женщины 9. Бросаются 3 монеты 10. Из ящика, содержащего 6 крас- ных, 2 синих и 8 желтых нос- ков, выбираются 2 Появление числа, большего 2 По крайней мере од- но число равно 4 По крайней мере од- на карта туз Оба шара будут си- ними То же Все карты будут ту- зами Выбранные билеты будут иметь номера меньше 5 Мужчины сидят ря- дом Выпадение по край- ней мере одного гер- ба Оба носка одного цвета Выпадение четно- го числа Сумма выпавших чисел равна 10 Обе карты будут пиковыми По крайней мере один шар будет синим То же Одна карта туз пик, а остальные меньше девятки Все выбранные билеты будут не- четными числами Слева и справа от мужчин сидят женщины Выпадение не бо- лее одного герба Оба носка желтые 2. В лотерее имеются 20 билетов. 8 из них помечены словом «выигрыш», ос- тальные — пустые. Найдите вероятность вытащить «выигрыш» (по крайней мере один), если (а) покупается один билет, (б) покупаются два билета, (в) покупаются три билета. 3. В колоде 52 хорошо перетасованные карты. Из нее случайным образом вынимаются две карты без возвращения извлеченной карты в колоду. Найдите вероятность того, что (а) обе карты будут тузами, (б) обе карты черные, (в) только одна карта красная, (г) одна карта туз пик, (д) ни одна карта не будет тузом пик, (е) выбранные карты составляют последовательную пару одной масти, например, дама и валет, девятка и восьмерка и т. д., (ж) карты составляют последовательную пару разной масти, (з) выбранные карты будут старшими, т. е. валетом, дамой, королем или тузом. 4. В колоде 52 хорошо перетасованные карты. Из нее случайным образом без возвращения вынимаются четыре карты. Найдите вероятность того, что (а) все карты короли, (б) три карты короли, (в) две карты короли, (г) все карты крас- ные, (д) три карты красные, (е) две карты красные, (ж) выбранные карты будут девяткой, валетом, дамой и королем одной масти, (з) десяткой, валетом, дамой и королем разных мастей, (и) все карты одной масти, (к) карты образуют две пары (например, два короля и две десятки, два валета и две шестерки и т. д.). 5. Производится случайная перестановка чисел 1, 2, ..., п. Найдите вероят- ность того, что числа (а) 1 и 2; (б) 1, 2 и 3 будут расположены в естественном по- рядке. 6. Производится случайный выбор трех цифр из множества {0, 1, 2, ..., 9} с повторениями. Найдите вероятность того, что (а) будет 2 повторения (т. е. три цифры будут одинаковыми), (б) будет 1 повторение (т. е. две цифры будут одина- ковыми), (в) не будет повторений. 123
7. Чему равна Вероятность того, что среди 5 случайных цифр (а) не будет цифры 9, (б) не будет цифры 1, (в) не будет ни 9, ни 1, (г) будет хотя бы одна из цифр 9 или 1, (д) не будет хотя бы одной из цифр 9 или 1? Обозначим через Е и F события, соответствующие (а) и (б). Выразите остальные события через Е и F. i 2.1.6. УСЛОВНАЯ ВЕРОЯТНОСТЬ: СТОХАСТИЧЕСКАЯ НЕЗАВИСИМОСТЬ а) Определения. Рассмотрим еще два понятия, играющие фунда- ментальную роль в теории вероятностей. Прежде всего дадим определе- ния и проиллюстрируем их на примерах. В конце параграфа приведены упражнения, так что некоторые дополнительные сведения читатель может приобрести самостоятельно. Пусть Е и F — два события некоторого случайного эксперимента. Определение 1. Условная вероятность. Условная вероят- ность события Е при наступлении события F определяется по формуле P(E/F) = ^ff, причем Р (F) Ф 0. (Если Р (F) = 0, то условная вероятность не опре- делена.) Определение 2. Независимость. События Е и F называются стохастически независимыми (или просто независимыми), если Р (E/F) = Р(Е). Другими словами, если наступление события F не изменяет вероят- ность наступления события Е, то Е будет независимо от F. Легко до- казать*, что событие F также будет независимо от Е. Примеры Рассмотрим множество студентов, сидящих в одной аудитории: Число студентов.....................20 (множество S) Число курящих студентов............. 8 (подмножество Е) Число студентов в очках ...........12 (подмножество F) Число курящих студентов в очках .... 6 (подмножество EF) Эта таблица может быть графически изображена в виде диаграммы Венна (рис. 57, с. 125); студенты обозначаются крестиками. Дважды заштрихованная область соответствует подмножеству EF. Рассмотрим следующий эксперимент. Занумеруем всех студентов числами от 1 до 20. Пользуясь случайными числами или системой ло- терейных билетов, выберем одно число между 1 и 20. Студента под вы- бранным номером мысленно удалим из комнаты. Является ли этот сту- дент курящим и носит ли он очки? Пусть S будет пространством исходов, а Е, F и EF — событиями, определенными на S. С помощью функции вероятностей Лапласа можно легко определить следующие вероятности: * Воспользуйтесь одновременно формулами из определений 1 и 2. — При- меч. ред. 124
Р (Е} = = — • ' f N(S) 20’ P(F)=^=”-, ' A/(S) 20 P(EF) = -{Er> = — v ' JV(S) 20 (1) (2) (3) Эти вероятности приписываются событиям до того, как студент ото- бран и вышел из аудитории. Предположим теперь, что, когда студент выходил за дверь, мы за- метили ца немочки. В таком случае наверняка можно утверждать, что он принадлежит к подмножеству F, хотя мы пока и не знаем, курит он или нет. Очевидно, что такая до- полнительная информация изме- нит характер эксперимента и при- писываемые событиям вероятности должны быть пересмотрены. N(S) = 20 N(E) = 8 N(F)—12 N(EF) = 6 Рис. 57. Диаграмма Венна. Подмно- жество Е соответствует курящим сту- дентам, подмножество F— студентам, которые носят очки Легко согласиться с тем, что Р (F) = 1 и множество F для но- вого измененного эксперимента можно взять в качестве нового про- странства исходов. Так как в F есть только 6 курящих (обозначим это множество Е*), то ясно, что вероятность того, что студент курит, будет равна 6 ' ' N (F) 12 (4) Это и будет условной вероятностью события E/F. Объединяя описания первоначального и измененного эксперимента, из уравнений (2), (3) и (4) находим: P{E/F)=N-^ = ^ = 4 ’ N(F) N(F) __(EF) N (S) ___ p (ef). 1 N (S) ' N (F) V ' P (F) ‘ Эти формулы полностью совпадают с формулами из определения 1. Разобранный пример в некоторой степени мотивирует определение условной вероятности, и читатель много выиграет от его внимательного изучения. Короче говоря, вероятность, приписываемая событию,Изменяется тем больше, чем больше информации получено о случайном эксперимен- те. Наконец, если мы имеем полную информацию, эксперимент пере- стает быть случайным экспериментом. В действительности все вероят- ности вычисляются при заданном пространстве исходов; таким образом, все события будут условными и мы должны их записывать как Р (E/S), Р (F/S) и т. д. Новая информация, вообще говоря, заставляет нас из- 125
менить пространство исходов модели; при этом необходимо пересмот- реть и вероятности, приписываемые событиям. Рассмотрим теперь вопрос'о независимости событий «студент ку- рит» и «студент носит очки». Естественно считать, что ношение очков и курение — две совершенно не связанные вещи. С другой стороны, мо- жет случиться, что многолетнее и страстное увлечение курением по- влияет на остроту зрения у таких курильщиков. Для того чтобы пол- ностью ответить на этот вопрос, необходимо было бы провести полное статистическое обследование, которое включало бы проверку зрения у большого числа людей и исследование некурящих, непостоянно и постоянно курящих. Для ситуации в нашем простом эксперименте мы воспользуемся определением независимости и посмотрим, что это нам даст. Мы можем легко вычислить: (1) вероятность того, что студент окажется курящим, для случая, когда вся группа студентов рассматривается как пространство исходов. Таким образом, Р (£) = 8/20 = 4/10 (уравнение (1)); (2) вероятность того, что студент окажется курящим, для случая, когда во внимание принимаются только студенты, носящие очки. Тогда Р (E/F) = 6/12 = 5/10 (уравнение (4)). Как видим, Р(Е) Р (E'F); в соответствии с определением 2 мы должны сказать, что события Е и F не независимы. Мы должны остере- гаться от обобщения этого утверждения па подобного рода предположе- ния относительно всех студентов. Утверждение имеет место только в рамках нашего очень простого эксперимента. Вопросы обобщения выводов, полученных из статистических экспериментов, исследуются в теории статистических выводов, которая будет обсуждаться в даль- нейшей главе. Упражнение 2.1.8 1. Для описанного эксперимента укажите содержание событий Е', F', Е' F', Е U F, (Е U FY, (Е — F), F/E, E/F', (Е (J F)/F, (Е U F)’/E. Найдите вероят- ности для каждого события. 2. Оперируя результатами решения задачи 1, проверьте следующие утверж- дения: р (FE} (1) P(FIE) = -~r (заметим, что Р (FE) = P (EF)) - Р (Е) (2) £(£') = !-£.(£); (3) Р (Е (J F) = Р (Е) + Р (F) — Р (EF); (4) Р (F) =/= Р (F/Е) (отсюда следует, что F не независимо от Е); (5) Р((Е (J F)') = Р (Е'F') (воспользуйтесь правилом Де Моргана). 3. Повторите задания 1 и 2 из этого упражнения для следующего эксперимен- та. Случайным образом выбирается лицо из группы, состоящей из четырех муж- чин и восьми женщин. Известно, что в этой группе имеются три супружеские пары, остальные в браке не состоят. Е — событие «выбранное лицо — женщина»; F — событие «выбранное лицо состоит в браке». 4. Повторите задания 1 и 2 из этого упражнения для следующего эксперимен- та. Бросается правильная игральная кость. Е — событие «выпавшее число очков нечетное»; F — событие «число очков меньше 3». 5. Докажите, что если Р (E/F) = Р (Е), то Р (F/E) = Р (F). 126
6. Докажите, что если Р (E/F) = Р (Е), то Р (E/F') = Р (£). 7. Докажите, что если Р (E/F) = Р (£), то Р (EF) = Р (Е)-Р (£). (Опреде- ление независимых событий дается часто с помощью этой формулы.) 8. Докажите, что Р (E'/F) =1 — Р (E/F). 9. Если £ С F, то покажите, что Р (E/F) = Р (Е)/Р (£). 10. Если F С £, то покажите, что Р (E/F) = 1. И. Бросают игральную кость до первого появления 1. Предположив, что 1 нс появилась в первых двух бросаниях, найдите вероят- ность того, что для появления 1 потребуется больше 4 бросаний. 12. Бросают две игральные кости. Найдите условную вероятность того, что одна кость показывает 6, при условии, что другая показывает 4. 13. С помощью диаграммы Венна покажите, что £= (££')U (££), и, таким образом, покажите, что Р (£) = Р (EF') + Р (EF). 14. Воспользуйтесь заданием 13 и определением условной вероятности, чтобы показать, что _______£(£/£)•£ £(£/£)£(£) +P(EIF')-P(F'y Замечание. Это простейшая форма знаменитой теоремы, известной как теорема Байеса. 15. Предположим, что вероятность для мужчины дожить до 30 лет равна 4/5, а вероятность его жены дожить до 30 лет равна 5/6. Найдите вероятность того, что до 30 лет доживут (а) оба, (б) только мужчина, (в) только женщина, (г) ни мужчина, ни женщина, (д) хотя бы один из них. (П 2.. 1.7. ВЕРОЯТНОСТИ НА ПРОИЗВЕДЕНИИ ПРОСТРАНСТВ В 2.1.2, б) мы объяснили, как исходы последовательности экспери- ментов можно представить точками произведения пространств. Зай- мемся теперь обсуждением проблемы вычисления вероятностей на та- ких пространствах. Для иллюстрации этого метода вновь рассмотрим эксперимент, опи- санный в 2.1.2, б). Этот эксперимент состоял из последовательного «бросания монеты» и «бросания кости». Пространство исходов для всего эксперимента будет S1XS2, где = {Д, Т}, a S2 = {1, 2, 3, 4, 5, 6}, т. е. оно со- стоит из множества точек {(/И), (Д2), (ДЗ), (Н4), (Н5), (Н6), (Т1), (Т2),(ТЗ), (Т4), (Тб), (Тб)}. Какие вероятности необходимо придать этим точкам? Можно ответить, что для этой цели подойдет любое мно- жество вероятностей, которое удовлетворяет аксиомам I, II и III из 2.1.4, б). С математической точки зрения этот ответ годится для любого выборочного пространства. Однако мы выберем такое множество, кото- рое дает право определить его для «последовательности независимых испытаний». Этот выбор будет тем лучше, чем больше он будет соответ- ствовать эмпирическим экспериментам и чем полнее он отразит интуи- тивный смысл понятия независимых испытаний, описанного в 2.1.2, б). Рассмотрим событие {(Д/)} в выборочном пространстве S1xS2. Заметим, что {Н} будет событием в S15 а {1} — событием, определенным на Х2. Определим вероятность {(Д/)} какР[{(Д/)}1 = Р [{Д}]-Р [{1}]. Таким же способом можно определить вероятность для каждой точки из S2. Итак, если (х, у) — точка в X S2, ее вероятность опреде- ляется как р [<(х, I/)}] = Я{х}1 . Р [{//}]. 127
Это определение вероятности обеспечивает выполнимость трех ак- сиом. Оно соответствует нашему интуитивному представлению о неза- висимых экспериментах и связано с определением независимых собы- тий, которое приведено в предыдущем параграфе. Последнее утверж- дение мы проиллюстрируем на примере. Дальнейшую аргументацию можно найти, например, в [15]. I) Определение вероятности удовлетворительно*. Вероятность для каждой точки 5гХ52 не меньше нуля, так как она является произве- дением двух вероятностей. Сумма вероятностей всех точек равна 1, поскольку P[S1Xs2]= 2 2 Д К*}] Д [{*/}] = х е Si у esa - S ^[{х}] 2 Р [{//}] = *es, y^s3 = 1-1 = 1. Для иллюстрации этого факта вновь рассмотрим эксперимент с моне- той и игральной костью. Покажем, что двойная сумма вероятностей, соответствующих каждой точке, разбивается на две различные суммы, каждая из которых равна 1 (вероятность события {х} мы сокращенно будем обозначать Р (х)): Р [S1XS2] = Р (Н)-Р (1) + Р (Н)-Р (2) + ... + Р (Н)-Р (6) + + Р (Т)-Р (1) + Р (Т)- Р(2) + ... + Р (Т)-Р (6) = = [Р (И) + Р (Т)] •[ Р (1) + Р (2) + ... + Р (6)] = = 1-1. 2) Связь с интуитивным понятием независимых испытаний. Для иллюстрации рассмотрим пример двух событий, определенных на про- странстве исходов S1X<S2. Положим, Ег — «монета показывает Н, а игральная кость — любое число» и Е2 — «выпадает Н или Т, а кость показывает 3». Таким обра- зом, Ег — множество точек {(Д1), (Д2), (ДЗ), (//4), (Д5), (Д6)}, а Е2 — множество {(ДЗ), (ТЗ)}. События Е} и Е2 будут независимыми в рассмотренных эксперимен- тах. В интуитивном смысле это очевидно: событие Ег не влияет на число очков, выпадающих при бросании игральной кости, а событие Е2 не влияет на результат при бросании монеты. Убедимся в их статистической независимости формально. Пере- сечение событий, т. е. «одновременное наступление Ег и Т2», будет соответствовать {(ДЗ)}. Таким образом, Р (ЕгЕ2) = Р [(Д3)1. Учи- тывая, что р (Дт) = р (Нур (1) + ... + Р (Н)-р (6) = = Р (Н)-[Р (1) + Р (2) + ... + Р (6)] = Р(Н) * Удовлетворительно с точки зрения тех интуитивных требований, которые мы предъявляем на основе первого определения вероятности. — Примеч. ред. 128
и Р (£2) = Р (1Г)-Р (3) + Р (Т)-Р (3) = = [р (//) + Р (Т)]-Р (3) = Р (3), получим Р (Е^) = Р [(/73)] = Р (Н)-Р (3) = Р (EJ-P (£2), т. е. события Е} и £2 статистически независимы. Аналогично можно убедиться в независимости любой пары событий Ег и £2, определенных на SjXS2. Этот параграф мы закончим определением последовательности не- зависимых экспериментов. Определение. Допустим, случайные эксперименты X и Y имеют выборочные пространства Sx и S2; одноточечное событие {х} в X происходит с вероятностью рх, а одноточечное событие {у} в Y — с ве- роятностью ру. Тогда последовательность экспериментов (X, Y), т. е. Y следует за X, имеет выборочное пространство SiXSz, и эта по- следовательность независима, если вероятность для каждого одноточеч- ного события {(х, у)} в (X, Y) равна Я{(х, у)}1 = px-pv. Это определение очевидным образом обобщается на случай трех и большего числа экспериментов. Как определить вероятность Р [{(х, г/)}], если рассматриваемые эксперименты не являются независимыми? Задача удовлетворительного определения вероятностей на произве- дении пространств для зависимых экспериментов будет обсуждаться в гл. 3.1, посвященной марковским цепям*. Упражнение 2.1.9 Определите вероятности точек для каждого пространства исходов упраж- нения 2.1.2. Упражнение 2.1.10 (смешанные задачи) 1. При изучении группы из 270 студентов оказалось, что 90 студентов пре- успевают в математике, 90 — в музыке, 90 — в спорте. Кроме того, было обна- ружено, что 30 студентов преуспевают как в математике, так и в музыке, 30 — как в музыке, так и в спорте, 30 — как в математике, так и в спорте. И только 10 студентов преуспевали сразу в трех областях. Найдите для г = 0, 1, 2, 3 число студентов, преуспевающих (1) точно в г, (2) не более чем в г, (3) по меньшей мере в г областях. Предположим, что из группы в 270 человек студент выбирается случайным образом. Определите вероятность того, что он преуспевает (1) точно в двух облас- тях, (2) более чем в одной области. 2. Докажите, что N (A L) В (J С) = N (А) + N (В) -|- N (С) — N (АВ) — N (ВС) — N (СД)+ + N (АВС), где N (А) означает «число элементов множества Л», и т. д. * Дальнейшие свойства вероятности читатель может изучить по книгам [41], [44], [45], [42]. — Примеч. пер. 5 Зак. 973 129
\ 3. Из переписи была взята группа в 500 человек со следующими данными: пол, состоит ли в браке, имеет ли машину. При этом оказалось, что в этой группе 300 мужчин, 290 человек состоят в браке, 415 имеют машину, 200 мужчин жена- ты, 250 человек состоят в браке и имеют машину, 250 мужчин имеют машину, 190 мужчин женаты и имеют машину. Покажите, что число человек в разных категориях не соответствует друг другу. 4. В ящике находятся 94 хороших и 6 плохих болтов. Из ящика случайным образом выбрано пять болтов. Найдите вероятности того, что (1) пи один болт не будет плохим, (2) все плохие, (3) хотя бы один болт плохой. Дайте два ответа: один — для случая выбора с возвращением, другой — для выбора без возвраще- ния. 5. Случайным образом из телефонной книги выбираются два номера теле- фонов. Какова вероятность того, что числа в последнем разряде каждого номера будут (1) различными, (2) одинаковыми? 6. Из большой связки галстуков, в которой зеленый, красный и желтый цвет находятся в пропорции 5:3:2, трое мужчин случайным образом выбирают по цвет- ному галстуку. Какова вероятность того, что они выберут галстуки одинакового цвета? 7. Игрок бросает две игральные кости — одну белую, а другую красную. (1) Какова вероятность того, что суммарное число очков будет равно 8? (2) Какова вероятность, что суммарное число очков будет между 5 и 8 вклю- чительно? (3) После бросания кости игрок видит, что белая кость показывает 3, но не видит числа очков, выпавших на красной кости (закатилась под бумаги). Чему равна вероятность того, что суммарное число очков равно 8? 8. Четыре лица случайным образом выбираются из группы, состоящей из 4 англичан, 3 шотландцев и 2 ирландцев. Найдите вероятности того, что (1) точно 2 выбранных человека будут англичанами, (2) в выбранную группу входят 2 ир- ландца, (3) в выбранной четверке есть человек каждой национальности. 9. Два человека по очереди бросают две игральные кости. Выигрывает тот, кто первый при одном бросании наберет 8 очков. Покажите, что шансы выиграть для начинающего игру относятся к шансам другого как 36:31. 10. Два человека бросают поочередно кости, как в задаче 9. Каждый бро- сающий имеет р попыток. Покажите, что вероятность выиграть для игрока, на- чинающего игру, равна р (1 -|- г/2 |- с/4 ...), а вероятность выиграть для второ- го игрока равна pq (1 -р д2 + q9, + ...), где q = 1 — р. Убедитесь, что шанс выиграть для начинающего игру равен 1/(2 — р), а отношение шансов выигрыша равно l:q. 11. Три человека по очереди бросают монету. Выигрывает тот, у которого раньше выпадет решетка. Покажите, что шансы выиграть находятся в отношении 4:2:1 в соответствии со стартовым номером. 12. В шляпе содержится b синих и w белых билетов. Производится случайный выбор п = х + у билетов без возвращения, где х (<J6) — число синих билетов, у (<Jw) — число белых билетов в выборке. gi Покажите, что вероятность получения такого результата равна 13. Из ящика, содержащего 8 зеленых и 4 синих шара, случайно без возвра- щения выбираются шесть шаров. Найдите вероятность того, что число зеленых шаров в выборке превосходит число синих шаров больше чем на два. 14. Из колоды в 52 карты вытаскивается черная карта. Из оставшихся 51 карты случайным образом выбираются 13 карт, причем оказывается, что все они одного цвета. Покажите, что условная вероятность того, что они красные, равна 2/3. 15. В гардеробе на вешалке висят десять шляп (занумерованные от 1 до 10). С вешалки случайным образом снимают три шляпы. Найдите вероятность того, что (1) наименьший номер из снятых шляп равен 6, (2) наибольший номер равен 5. 130
16. Три урны А, В и С содержат цветные шары в следующем составе: А (3 белых и 2 черных), В (2 белых и 1 черный), С (2 белых и 4 черных). Из каждой урны производится случайный выбор одного шара. Найдите вероятность того, что среди трех вынутых шаров (1) 2 будут белыми и 1 черным, (2) по крайней мере 2 белых, (3) больше будет черных, чем белых. 17. Известно, что Р (Л) = 0,3, Р (В') = 0,6, Р (А/В) = 0,32. Найти вероят- ности: Р (Л U В). Р М П В), Р (A/В'), Р (В/A), Р [(Л U В)'], Р [(Л П В)Т- 18. (1) Сколько различных наборов можно выбрать из обычной колоды карт при игре в бридж* **? (2) Какова вероятность получить в наборе карт при игре в бридж 3 туза? (3) Какова вероятность получить в наборе карт при игре в бридж 2 короля? (4) При раздаче карт по ошибке одна карта перевернулась и оказалась тузом. Какова вероятность (условная) того, что в этом наборе карт будет 3 туза? 19. Пусть вероятность рождения мальчика равна 1/2. Найдите вероятности того, что в семье из четырех детей будет (1) только один мальчик, (2) больше чем один мальчик, (3) два мальчика и две девочки, (4) только три девочки. 20. Для стрелка вероятность попасть в буйвола при каждом выстреле равна 0,6. Найдите наименьшее число выстрелов, которое он должен сделать, чтобы ве- роятность убить по меньшей мере трех буйволов была больше 0,7. 21. Вероятность попасть в буйвола при каждом выстреле равна 0,6. При ус- ловии, что при пяти выстрелах стрелок убил трех буйволов, найти вероятность того, что уже первый его выстрел достиг цели. 22. Предположим, что случайно выбранный экзаменующийся отвечает на тест, выбирая ответ из пяти данных альтернатив. Вероятность того, что экзаме- нующийся знает ответ, равна 2/3, а вероятность того, что он будет отвечать, вы- бирая случайным образом одну из пяти альтернатив, равна 1/3. (Если он знает ответ, то из списка возможных ответов он выбирает правильный.) Определите условную вероятность того, что экзаменующийся знал ответ, при условии, что из списка возможных ответов он выбрал правильный. Покажите, что если р — вероятность того, что экзаменующийся знает ответ, и имеется п альтернатив, то эта условная вероятность равна пр /(1 + (п— 1)р). (Ук а з а н и е. Воспользуйтесь теоремой Байеса, см. задачу 14 из упражнения 2.1.8) 23. Две урны А и В содержат цветные шары в следующем составе: А (5 зе- леных и 7 красных), В (4 зеленых и 2 красных). Найдите вероятность вытащить зеленый шар, если (1) сначала случайно вы- бирается урна и затем вынимается из нее шар, (2) шары из двух урн перекла- дываются в третью и шары вынимаются из нее. 24. Предположим, из урн А и В в задаче 23 случайно выбирается одна урна и затем из нее вытаскивается шар. Чему равна вероятность того, что выбрана урна А, если извлеченный шар оказался красным? 25. Урна содержит 4 зеленых и 8 красных шаров. Из нее извлекается шар и фиксируется его цвет. Этот шар вместе с еще двумя шарами того же Цвета возвра- щается в урну, и все шары перемешиваются. Если из урны снова извлекается шар, то найдите вероятность того, что (1) второй шар будет зеленым, (2) первый и вто- рой шар будут оба красными, (3) первый шар будет красным, а второй зеленым. * Знак ' означает здесь дополнение.—Г1римеч. пер. ** При игре в бридж раздаются 52 карты. Каждый из четырех участников получает набор из 13 карт. — Примеч. ред. 131
22 ВВЕДЕНИЕ В СТАТИСТИКУ: глава РАСПРЕДЕЛЕНИЕ ЧАСТОТ 2.2.1. ВВОДНЫЕ ЗАМЕЧАНИЯ В процессе работы каждый инженер, менеджер или научный работ- ник непременно сталкивается со статистическим исследованием, будь то при сборе данных с производственной линии, при изучении спроса или анализе результатов эксперимента и т. п. Он может получить зада- ние написать отчет, который пойдет на рассмотрение руководству. В этом отчете может потребоваться выяснить, как изменяется выпуск продукции или как экспериментальные данные подтверждают некото- рую теорию, подлежащую проверке. Свои соображения исследователь должен аргументировать с помощью таблиц, диаграмм, графиков. От- четы по возможности должны быть достаточно наглядными и убедитель- ными, чтобы служить основой для принятия решений на будущее. Все эти вопросы входят в область исследований, известных под наз- ванием «статистика». 2.2.2. СТАТИСТИЧЕСКАЯ ПРОЦЕДУРА Даже в беглом описании статистической работы можно различить три этапа, присутствующие в любом приложении статистических мето- дов. Обсудим их вкратце. 1) Сбор данных. Множество, возникшее при измерении некоторою процесса или при проведении серии экспериментов, называется вы- боркой. Это множество содержит, как правило, небольшое число наблю- дений по сравнению со всеми возможными наблюдениями, которые мож- но осуществить над всей совокупностью и которые были бы возможны, если бы исследуемый процесс был непрерывным, а наблюдения прово- дились бы очень длительное время. В статистике слово «совокупность» употребляется для описания любого множества объектов (подсчетов, измерений и т. п.) , из которого делаются выборки. Прежде чем приступить к статистическому исследованию, необхо- димо ответить на целый ряд вопросов. Например, надо решить, какие из- мерения необходимо провести, в каком количестве и с какой точностью они должны быть осуществлены. Когда применяется анкетный опрос, как это делается при переписи населения или исследовании качества 132
обслуживания в магазине, ответы должны быть тщательно проанализи- рованы, чтобы исключить неправильную интерпретацию и возможную двусмысленность ответов и тем самым избежать смещения собранной информации. Смещения возникают в том случае, когда выборка участников опроса не случайна, т. е. они подбираются определенным образом. Например, если имена людей выбирались случайно по теле- фонному справочнику, то собранная информация имела бы смещение в сторону лиц, имеющих телефон. Необходимо тщательно проверить, являются ли полученные на- блюдения действительно типичной выборкой из исследуемого процес- са. Если выборка нетипичная и мы не знаем каково ее смещение, то любой вывод о процессе, который мы делаем на основе этой выборки, скорее всего будет неправильным. 2) Описательные статистики — запись в сокращенной форме. Прежде всего необходимо всю массу рядов наблюдений записать в виде таблиц, которые помогли бы выявить закономерности в колеба- ниях и тенденцию изменений. Можно также нарисовать графики, схемы и рисунки. Все это делается с той целью, чтобы полученные наблюде- ния представить наглядным образом и достаточно было одного взгляда, чтобы увидеть характерную особенность эксперимента или процесса, над которым велись наблюдения. Из наблюдений могут быть получены некоторые числа, известные как вычисляемые статистики или параметры. Каждое из этих чисел помогает описать один аспект процесса. Например, простое среднее, которое можно легко вычислить, определяет значение «середины» со- вокупности. Вокруг среднего группируются все измерения процесса. Другие параметры дают информацию о том, как сильно будут разбро- саны измерения по обе стороны от среднего значения. Некоторые пара- метры говорят о том, можно ли ожидать скоса в совокупности. Говорим, что совокупность скошена, если существует достаточная уверенность в том, что наблюдение будет находиться на большем расстоянии по одну сторону от среднего, чем по другую. В этом случае совокупность будет скошена в одну сторону, т. е. эта сторона будет более пологая. Оформление наблюдений в таком виде, из которого были бы видны тренды и характерные особенности совокупности, использование при этом графиков и рисунков, вычисление параметров — все эти вопросы относятся к области «описательных статистик». 3) Статистические выводы — прогнозы и решения. Этот раздел ста- тистики, наверное, один из наиболее важных. Выборка наблюдений несет сравнительно немного информации об изучаемом процессе. По выборке наблюдений статистик пытается сде- лать определенные выводы о всем процессе. Он мог бы вычислить пре- делы, в которых, как ему кажется, будет протекать процесс при нор- мальном развитии в будущем. Если бы статистику удалось обнаружить устойчивое изменение процесса, подлежащего прогнозу (назовем это трендом), то он мог бы внимательно изучить это обстоятельство в своем докладе. Если статистик решит, что выборка наблюдений недостаточ- на для формулирования надежных выводов, то он предпримет попытки для получения дополнительных наблюдений. 133
Для иллюстрации различных видов принятия решения в таких си- туациях мы ограничимся простым примером. Рассмотрим работу за- водского контролера качества, производящего выборку из некоторой товарной продукции. Предположим, в час производится 100 единиц то- вара, а контролер может проверить только 5 из них, которые он выби- рает в конце каждого часа. Возможно, контролер не имеет времени проверить большее количество товаров, возможно также, что такая проверка связана с порчей товаров, поэтому увеличивать число обсле- дуемых единиц бессмысленно. По выборке из 5 единиц товара он хочет установить, будут ли оставшиеся 95 единиц удовлетворять стандарту (т. е. лежать в границах определенной длины, качества и т. д.) и можно ли продолжать их производство. Контролер тщательно обследует выборку из 5 единиц и затем от- вечает на поставленные вопросы. Для этого он скорее всего будет при- менять графические методы, известные как схемы контроля качества; эти схемы основаны на математической» теории выборки. Было бы неплохо обратить внимание читателя на некоторые выводы при принятии решения. Это будет сделано на примере контроля ка- чества продукции. Прежде всего, контролер никогда не может быть уверенным в том, что он прав. Основываясь на одной выборке, никогда нельзя быть уверенным в правильности выводов, распространенных на всю сово- купность. Цель статистической теории заключается в том, чтобы помочь лицу, принимающему решение, как можно чаще делать правильные выводы или по крайней мере определить, насколько велика опасность ошибиться при принятии решения. Контролер на поставленный вопрос может ответить двояко; в случае, когда его решение неправильно, выводы (хотя и разные по смыслу) мо- гут дорого обойтись фирме. Он должен быть уверен в том, что долго- срочные издержки фирмы, связанные с неправильными выводами, долж- ны быть сведены к минимуму. Например, если качество каждой из 5 единиц в выборке хотя и находится в пределах установленных границ, но очень близко к ним, то контролер должен выбрать между двумя дей- ствиями; (а) остановить и демонтировать производство товаров, (б) продолжить выпуск, например, до следующего часа. Если качество товаров находится слишком близко к установленным границам (это может быть в том случае, когда механизм, производящий товары, мед- ленно изнашивается),™ решение (б) было бы неправильным,-Следующие 100 шт. товаров содержали бы очень много бракованных единиц, а это было бы невыгодно для фирмы, так как все их пришлось бы выбросить пли по меньшей мере индивидуально проверить и отобрать хорошие и плохие. С другой стороны, если бы в действительности 5 единиц това- ров оказались близкими по качеству к установленному пределу толь- ко из-за случайности в отклонении качества при их производстве, то решение (а) было бы неверным. Выборка может быть просто «неудач.- ной», и следующие 100 единиц будут вполне нормальными. В этом слу- чае остановка и демонтирование производства товаров, связанные с большими расходами, не будут оправданными. Таким образом, прежде чем принимать решение, контролер должен все внимательно обдумать. 134
На этом мы закончим описание работы статистика и того, как она помогает изучению различных процессов, среди которых могут быть и научные эксперименты, и промышленные операции. В следующем параграфе будут описаны первоначальные шаги, необходимые при изу- чении рядов наблюдений. 2.2.3. ПРИМЕРЫ ТАБЛИЦ С РЯДАМИ НАБЛЮДЕНИЙ Результаты, полученные экспериментально или из наблюдения про- цесса, прежде всего записываются в прямоугольные таблицы. Все необходимые сведения об эксперименте должны быть зафиксированы во время его осуществления рядом с таблицей. Такая информация, как число измерений, лабораторные условия (влажность, температура и т.п.), день, месяц и т. д.,играет большую роль при анализе; если эта информация не записана вовремя, она может быть забыта и получить ее снова окажется невозможным. Далее приводятся примеры записи рядов наблюдений. Пример 1 Производство фирмой некоторой модели радиоприемников (сстни штук за квартал) Год 1960 1961 1962 1963 Квартал 1 18 30 41 45 2 12 28 35 36 3 22 25 30 28 4 33 35 36 38 Пример 2 Число голосов (округлено до ближайшей 1000) Лейбористы 25 000 Выборы в парламент; Консерваторы 15 000 город X, население Либералы 8 000 70000 чел., Прочие 2 000 июнь 1967 г Пример 3 Число кроликов, появившихся за один помет 5355647456 20 пометов голландских 6453654565 кроликов; каждой самке 2 года, третий помет в мае Пример 4 Оценки, полученные на экзамене по математике 30 55 44 60 43 72 47 65 67 40 Оценки по 100-балльной системе; 59 58 14 32 58 46 41 35 68 50 50 студентов, средняя школа—У, 59 21 42 45 41 48 28 47 77 60 III ступень, июнь 1967 г. 30 57 45 49 33 48 47 52 38 61 54 42 54 42 49 51 39 60 61 53 135
2.2.4. ИЛЛЮСТРАТИВНОЕ ИЗОБРАЖЕНИЕ При изучении большого количества рядов наблюдений полезно представить их в виде некоторых рисунков или графиков. При изучении процессов многие важные особенности, которые нельзя очевидным об- разом получить из массы наблюдений, часто можно сразу увидеть на рисунке. По данным, приведенным в предыдущем параграфе, мы проиллю- стрируем различные виды диаграмм и графиков, известных под наз- ваниями «временной ряд», «круговая диаграмма», «прямоугольная диа- грамма», «частотный многоугольнику и «гистограмма». Эти виды на- глядных изображений применяются наиболее часто. а) Временные ряды. Временной ряд есть множество наблюдений над процессом, осуществленных в определенной временной последова- тельности. Рассмотрим, например, производство радиоприемников за четырехлетний период. Количество произведенных за квартал прием- ников образует последовательность шестнадцати наблюдений, соответ- ствующих концу каждого квартала с 1960 по 1963 г. Временной ряд обычно наносится на график, на горизонтальной оси которого откладывается время, как показано на рис. 58. Кварталы и годы Рис. 58. Временной ряд. Число радиоприемников (в сотнях), произведенных за квартал Замечания: 1) Производство радиоприемников каждый год' падает до минимума во втором и третьем кварталах, затем вновь под- нимается в четвертом и первом кварталах. Эти колебания называются сезонными. 2) Как видим, ежегодное производство приемников устой- чиво увеличивается. Такой тренд будем называть направленным вверх. б) Круговые диаграммы. Данные примера 2 о числе голосов на выборах можно хорошо изобразить на круговой диаграмме, как будет показано далее. Каждой политической партии будет соответствовать некоторый сектор круга, причем площадь сектора будет пропорцио- нальна числу голосов, отданных за эту партию. Это означает, что центральные углы при секторах также будут пропорциональны числу голосов. Поскольку число голосов, отданных различным партиям. 136
находится в пропорции 25:15:8:2, то и секторы должны быть выбраны в такой же пропорции. Лейбористы получают 25/50 (л радиан), кон- серваторы — 15/50 (0,6 л радиан) и т. д. (см. рис. 59). Часто секторы раскрашивают в разные цвета. Для того чтобы яс- нее различать секторы, их можно заштриховать под разным наклоном. город X, население 70 000 человек в) Прямоугольные диаграммы. Данные, которые можно изобра- зить с помощью круговой диаграммы, можно с успехом изобразить и на прямоугольной диаграмме. Прямоугольники могут быть горизонталь- ными (рис. 60 (а)) или вертикальными (рис. 60(6)). Каки в предыдущем случае, площадь прямоугольников пропорциональна числу голосов на выборах. Партия Голоса Лейбористы 7. /, 7//,\25000 Консерваторы '///.А 15000 Либералы Т7\ 8000 Прочие Л^ОО (aJ Голоса (Р/ cornu t) Рис 60. (а) Горизонтальная прямоугольная диаграмма, (б) Вертикальная прямоугольная диаграмма г) Частотный многоугольник. Рассмотрим данные примера 3, т. е. число кроликов в помете на одну самку. Как видим, для наблюдаемых 20 кроликов число новорожденных кроликов в одном помете колеблется между 3 и 7. Мы можем подсчитать, сколько раз появляется данное число кроликов в данном помете. Например, число 3 появляется дважды, приплод из 4 кроликов появляется четыре раза и т. д. Подсчи- тывая, сколько раз появляется некоторое наблюдение (х), будем назы- вать полученное число (/) частотой х. Частоты различных значений можно занести в частотную таблицу. Таблица частот данных о числе кроликов в приплоде Число кроликов в приплоде х 3 4 5 6 7 Частота f 2 4 8 5 1 137
Заметим, что суммарное число частот должно быть равно общему числу наблюдений. В нашем примере 2-|-4+8Ц-5+1 = 20. Всего было рас- смотрено тоже 20 пометов. Если мы нанесем на график частоты f для соответствующих х со шкалой х по горизонтали и соединим точки прямыми линиями, то мы получим частотный многоугольник (рис. 61). С помощью частотного многоугольника легко можно установить, как выборка для значений х из 20 пометов распределена на интервале от 3 до 7. Изменение частот называется распределением частот выбор- ки. 8 г 6 - ДВухеодовалЬ/е ' кролики 20 Наблюдений О 012365878 Число кроликоВ 6 одном приплоду Рис. 6]. Частотный многоугольник. Размер приплода голландских кроли- ков Рис. 62. Гистограмма. Размер при- плода голландских кроликов д) Гистограммы. Форму распределения частот можно отчетливо увидеть из другого типа диаграмм, известного как гистограмма. Для того чтобы нарисовать гистограмму, надо для каждого значения х по- строить колонку или прямоугольник. Площадь прямоугольника долж- на быть пропорциональной соответствующей частоте. Как правило, берутся прямоугольники одинаковой ширины, поэтому их высоты бу- дут пропорциональны частотам. Для данных о кроликах мы получим гистограмму, изображенную на рис. 62. Заметьте, что каждое значе- ние х будет серединой основания прямоугольника. е) Виды данных. Существуют четыре вида данных, различающихся по тому, как наблюдаемый объект измеряется или описывается. Эти виды с соответствующими примерами приводятся в следующей таблице: Вид Примеры 1. Данные классификации (но- минальные) 2. Ранжированные (ординарные) 3. Данные измерения на интер- вальной шкале 4. Данные измерения на отно- сительной шкале Лица, классифицированные по националь- ности, цвету кожи или по месту в спор- тивной команде Девушки, ранжированные по красоте. Ли- ца, ранжированные по социальным груп- пам Измерение температуры объекта (шкала имеет произвольные нулевую и единичную точки) Измерение веса, высоты, объема и т. д. (шкала имеет произвольную единицу, но фиксированную нулевую точку) 138
ж) Выбор диаграммы и графика. Иногда тип диаграммы для дан- ного случая определяется видом анализируемых данных. Чаще, одна- ко, возможно использование нескольких различных типов диаграмм и предстоит осуществить выбор. Читатель в таком случае должен руко- водствоваться практикой, личным вкусом, сроком и т. п. Его цель должна всегда заключаться в том, чтобы предложить такую иллю- страцию, которая несет как можно больше информации об изучаемом процессе, естественно, в ясной и удовлетворительной форме. Следует добиться уверенности в том, что передаваемое впечатление не окажется недоброкачественным или неправильным в любом смысле. Это может произойти при неправильной или неестественной шкале, при недоста- точном выделении названий, при опускании без объяснений экстре- мальных результатов и т. д. 2.2.5.. ГРУППИРОВКА ДАННЫХ При работе с большим множеством данных измерения приходится группировать, чтобы получить достаточно наглядную картину колеб- лемости распределения частот. Под группировкой будем понимать раз- биение шкалы х па определенное число интервалов и подсчитывание числа наблюдений, попавших в каждый интервал. Число попаданий в данный интервал называется частотой данного интервала. Для ил- люстрации этой процедуры рассмотрим данные примера 4 из 2.2.3. Наблюдения представляют собой оценки 50 студентов на экзамене по математике. Взглянув на эти оценки, мы сразу определим, что наи- меньшая из них равна 14, а наивысшая — 77. Возьмем семь одинако- вых интервалов 10—19, 20—29, ..., 70—79 и подсчитаем, сколько оце- нок попадут в каждый из них. Результаты этой процедуры показаны в следующей таблице сгруппированных частот: Г раницы группы 1 Пределы группы 2 Среднее группы 3 Единицы счета 4 Частота h 5 Кумулятивная частота Fi 6 9,5—19,5 10—19 14,5 7 1 1 19,5—29,5 20—29 24,5 77 2 3 W 77 29,5—39,5 30—39 34,5 ( 777 7 7 7 7/77 1 I ! 1 г г г г Тт 7 10 39,5—49,5 40—49 44,5 1W+ 111 18 28 49,5—59,5 50—59 54,5 Ш ///// 12 40 77 59,5—69,5 60—69 64,5 77W- 777 8 48 69,5—79,5 70—79 74,5 77 2 50 • Итого 50 — 139
Замечание. Если бы у нас было большее число данных, мы возможно взяли бы и большее число интервалов. Выбор числа интер- валов оказывает влияние на получаемые значения частот. Если после подсчета частот оказалось, что в несколько групп вовсе не попадали частоты или попало их очень мало, то целесообразно взять меньшее число интервалов. Приблизительно в таких процедурах можно взять от 6 до 15 интервалов, число которых зависит от того, насколько много имеется данных. а) Объяснение таблицы. (1) Колонки 1 и 2. Колонка 2 показывает пределы, которые опреде- ляются интервалами по шкале х. Очень важно, чтобы соседние группы не пересекались. Например, если бы первые две группы были 10—20 и 20—30, они бы пересекались для оценки х — 20. В таком случае Рис. 63. Пределы и границы группы невозможно было бы определить, в какую группу входит оценка 20. Если наблюдения представляют собой измерения на непрерывной шка- ле, то обычно берут интервалы с открытым правым концом, т. е. [10— [20—) и т. д. Колонка 1 определяет границы группы. В гистограмме концы осно- ваний прямоугольников совпадают с границами группы (см. 2.2.4,д). Середина прямоугольника должна совпадать со средней точкой груп- пы. Это иллюстрируется на рис. 63. Расстояние между парой границ группы называется шириной группы. (2) Колонка 3. В эту колонку входят средние оценки групп. Они могут быть найдены делением суммы пределов группы на два. В ранее приведенном примере для первой группы ю + ю 2 Для второй группы х2 = ху + ширина группы = 14,5 + 10 = 24,5. (3) Колонка 4. Это колонка единиц счета. Просматриваем последо- вательно все множество данных и в колонке 4 напротив группы, в кото- рую входит соответствующее наблюдение, ставим 1. Для простоты под- счета пятерки единиц перечеркиваем горизонтальной чертой, как пока- зано в таблице. ПО
Многоугольник кумулятивных частот Рис. 64. Данные оценок по математике. 7V=5O (4) Колонка 5. Единицы в колонке единиц счета суммируются, и ре- зультат записывается в колонку 5. Полученные суммы называются частотами групп\ они будут обозначаться буквой f. (5) Колонка 6. Числа, входящие в эту колонку, называются кумуля- тивными частотами и обозначаются буквой/Г Они получаются из чи- сел в колонке f. Каждое число этой колонки равно числу наблюдений, которые имеют значения, меньшие или равные значению верхней гра- ницы х' соответствующей группы. Так, для примера с оценками по ма- тематике: Fr — \, число студентов с оценкой, меньшей или равной 19,5; F2 = 1 + 2 = 3, число студентов с оценкой, меньшей или рав- ной 29,5; Fs — 1 + 2 + 7 = 10, число сту- дентов с оценкой, меныней или равной 39,5, и т. д. Множество кумулятивных частот, отнесенных к верхнему значению гра- ниц группы (F на х'), называется кумулятивным частотным многоуголь- ником или многоугольником кумуля- тивных частот. Если по вертикаль- ной шкале отложить (100/7М)% и кривую выровнять по точкам, то полученный график называется про- центной огивой. Гистограмма и диа- грамма кумулятивных частот для примера с оценками по математике приводятся на рис. 64. б) Обозначение S. В статистической работе очень часто пользуются знаком 2 (означающим суммирование). Подробности применения этой операции, примеры и упражнения даны в гл. 1.2. Очевидно, сумма частот всех групп (т. е. сумма всех чисел колонки 5) должна быть равна N —общему числу наблюдений. Таким образом, мы можем написать: ft fi + fz + = где k равно числу групп; r-я кумулятивная частота может быть запи- сана как 2— ft — fl Т А Г • • • + fr Pf = 1 Полезной проверкой может служить тот факт, что последняя кумуля- тивная частота должна быть равна 141
Упражнение 2.2.1 1. Для иллюстрации следующих множеств наблюдений сделайте соответст- вующие рисунки. Дайте названия рисункам, обозначьте все оси. Если будет возможно, то для каждого случая нарисуйте несколько диаграмм и сравните ре- зультаты. (а) Доля дорожных происшествий со смертельным исходом (на 100 млн. км, при- ходящихся на средства передвижения) для двух стран Год 1955 1956 1957 1958 1959 1960 1961 1962 1963 Страна А 4,6 4,8 3,6 4,2 4,1 3,4 3,5 3,3 4,0 Страна В 5,0 3,1 3,2 3,9 3,2 3,1 2,9 2,6 3,2 (б) Ежегодное количество осадков (в мм) на гидрометеорологической станции X Год 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 Количество осадков 116 84 173 90 165 171 138 146 149 183 105 (в) Налоговые поступления в процентах за 1956 г. (страна У) Источник поступлений Подоходный налог 31 Налог на земельные угодья 10 Таможенные пошлины и акцизы 40 Дополнительный налог 8 Почтовые поступления 3 Другие налоги 8 (г) Число дефектных товаров, обнаруженных : в 36 выборках (каждая объемом 10 единиц), ВЗЯТЫХ 1 случайно с производственной линии 0 0 1 0 2 0 1 2 1 0 0 0 0 0 3 1 0 0 0 0 0 2 0 0 1 1 0 0 0 1 1 0 1 0 1 1 (д) Импорт (Im) и экспорт (Ех) для страны, млн, фунтов стерлингов Год 1960 1961 1962 1963 1964 Квартал Im Ех Im Ех Im Ех 1m Ех Im Ех 1 261 163 192 103 147 90 164 105 177 92 2 230 141 190 96 149 85 170 101 154 94 3 225 137 191 94 156 93 169 105 150 86 4 240 130 223 100 175 99 201 112 170 95 2. Наименьшее из 100 измерений равно 4,6ж, а наибольшее — 50,1 м. Найди- те подходящие пределы групп в случаях, когда для построения распределения частот используются (а) 6, (б) 8 и (в) 10 групп. В каждом случае найдите (1) мно- жество границ групп, (2) ширину группы, (3) среднюю оценку 4-й группы, (4) верхнюю границу 5-й группы, (5) нижний предел 3-й группы, (6) нижнюю границу 2-й группы. 3. Ответьте на все вопросы в задаче 2 для случая 50 весовых измерений, наименьшее из которых равно 3,51 кг, наибольшее -— 12,38 кг. 4. Для каждой из приведенных таблиц выполните следующие упражнения: (1) найдите наибольшее и наименьшее наблюдения; (2) определите оптимальное число групп и найдите их ширину; (3) постройте таблицу частот с колонками, по- казывающими границы группы, пределы группы, средние значения, единицы счета, частоты и кумулятивные частоты; (4) нарисуйте гистограмму, частотный многоугольник и относительный частотный многоугольник; (5) нарисуйте много- угольник кумулятивных частот и процентную огиву. 142
(а) Веса 50 новорожденных мальчиков 1 (с точностью до одной унции) 148 154 148 151 144 177 168 153 133 151 150 161 150 167 152 167 130 164 142 134- 135 132 166 158 140 155 149 125 166 152 169 150 143 142 163 161 131 162 143 121 143 159 155 151 163 136 152 121 175 168 (б) Веса 40 шарикоподшипников (в унциях) 6,64 6,40 6,67 6,53 6,44 6,39 6,30 6,54 6,43 6,41 6,66 6,51 6,42 6,85 6,57 6,58 6,31 6,46 6,35 6,68 6,64 6,73 6,57 6,40 6,15 6,41 6,50 6,30 6,32 6,50 6,63 6,70 6,61 6,68 6,53 6,44 6,45 6,31 6,55 6,69 (в) Диаметры 40 шарикоподшипников (в микронах) 853 859 851 840 859 841 846 857 862 845 851 846 855 861 868 852 843 840 841 854 854 847 853 855 843 847 859 863 856 857 842 ( 858 860 852 856 856 860 854 861 868 (г) Продолжительность работы 30 электрических лампочек (в часах X1/Ю) 51 56 69 31 56 49 51 53 74 51 63 48 53 51 64 50 59 84 55 82 55 72 70 54 (д) Скорость автомобилей 51 77 98 на некотором участке 62 дороги 73 (в км/ч) 58 41 41 29 15 41 43 42 34 41 30 23 48 50 36 35 46 28 46 50 41 55 27 43 53 48 47 34 35 29 42 30 35 38 41 36 38 45 59 44 43 5. Для каждого из множеств, приведенных в задании 4, определите: (1) процент наблюдений, попавших в 3-ю группу; (2) процент наблюдений, значения которых меньше, чем нижняя граница 3-й группы; (3) процент наблюдений, значения которых больше, чем верхняя граница 3-й группы; (4) сумму процентов, найденных в (1), (2), (3); (5) численное значение (веса, диаметра, продолжительности работы и т. д.), для которого число не превышающих его наблюдений составляет 50%. (Это зна- чение определите из процентной огивы. Такая величина называется медианой выборки.)
ГЛАВА ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ 2.3.1. ОПИСАТЕЛЬНЫЕ НАИМЕНОВАНИЯ И ПАРАМЕТРЫ Когда для некоторого множества наблюдений нарисована гисто- грамма или частотный многоугольник, тем самым задана картина рас- пределения и разброса наблюдений по шкале х. Чтобы облегчить изучение распределений, некоторым стандартным формам распределений, часто употребляемым в статистических иссле- дованиях, даются свои наименования. В главе также будут рассмотре- ны способы описания и измерения специальных свойств и характерис- тик форм распределений. а) Некоторые стандартные формы распределений. (л) Нормальное колоколосбразное, симметричное, одновершинное I б) Ншмодрльнор (£) Мультимодальное двухвершин- мнбёбВеришн=~ ное ! \ ное (г) J-обрагное (djj-образное (е) U-образное б) Некоторые свойства. (1) Число вершин. Значение х, соответствующее вершине кривой, называется модой. Распределения с одной вершиной называют унимо- дальными. Распределения, имеющие вид (б) и (в), называются бимодаль- ными и три- или мультимодальными соответственно. 44
(2) Величина разброса (или дисперсия). Распределение может либо близко группироваться к некоторому центральному значению, либо быть сильно разбросанным по обе стороны от этого значения. Два возможных случая изображены на рис. 66. (3) Симметрия или асимметрия. Кривые типа нормальной (см. рис. 65(a)), часто встречающиеся на практике, симметричны относи- тельно вертикальной прямой, проходящей через моду. Иног- да одна сторона распределения более пологая, чем другая (име- ет хвост). В таком случае гово- рим, что распределение асимме- трично (или скошено). Направ- ление хвоста обозначается зна- Небольшой Большой разброс пазброс ком асимметрии (-]- или —). Рис. 66 Возможные случаи показаны на рис. 67. (4) Величина островершинности. Эта характеристика вида распреде- ления известна под названием эксцесса. Если вершина унимодального распределения плоская, то такое распределение называется туповер- Симметрия Положитель- Отрицательная относительна ОБ ниц асиммет- асимметрия рия Рис. 67 шинным (с эксцессом меньше нормального), в обратном случае — островершинным (с эксцессом больше нормального). Нормальное распределение называется нормальновершинным (с нормальным эксцессом). Все возможные типы распределений показаны на рис. 68. ГупоВершинное ОстроВершинное НормальноВер- шинное Рис. 68 в) Параметры. Если значение некоторой величины вычисляется по множеству наблюдений и это число дает определенную информацию о некоторой характеристике распределения, то такую величину назы- вают параметром распределения. Например, среднее значение мно- жества наблюдений определяет область расположения центра распреде- ления. В принципе мы могли бы определить центр распределения через его среднее. Существует большое количество параметров, несущих ин- 145
формацию о середине или о других специальных свойствах вида рас- пределения. Эти параметры позволяют также измерять величину раз- броса, асимметрии и эксцесса совокупности. В этой книге мы приведем определения и описания вычислений наиболее употребительных пара- метров. i 2.3.2 ЦЕНТРАЛЬНЫЕ ПАРАМЕТРЫ ИЛИ СРЕДНИЕ Наиболее употребительны три измерения центра распределения: мода, медиана и арифметическое среднее. а) Мода. Это понятие уже встречалось (см. 2.3.1, б)). Если распреде- ление имеет только одну вершину, то значение х, для которого эта вер- Оценки по математике (показаны только Рис. 69. Оценивание моды распределения шина достигается, назы- вается любой. Часто мода обозначается символом х (читается «х с крышеч- кой»). Очевидно, если рас- пределение не очень асим- метрично, то мода будет хорошим приближением «центра» совокупности. Если мода распределе- ния оценивается по мно- жеству группированных данных, то для нахожде- ния моды необходимо оп- ределить группу с наи- большей частотой. Эта группа называется модаль- ной группой. За оценку моды х берется среднее значение этой группы. Как показано на рис. 69, эту оценку можно улучшить с помощью простого дополнительно- го построения на гистограмме. Исходные данные — оценки на экза- мене по математике, взятые из примера 4 (см. 2.2.3). Из рисунка видно, как по пунктирным линиям построения нахо- дится новая оценка моды, лежащая правее среднего значения модаль- ной группы. Упражнение 2.3.1 Найдите модальную группу, грубую и улучшенную оценки моды совокуп- ности для каждого из распределений в задании 4 упражнения 2.2.1 (с. 142). б) Медиана. Значение х, для которого 50% множества наблюдений (пли совокупности) меньше этого значения, а 50% больше его, назы- вается медианой. Это значение обозначается х (читается «х с волной»). Вычисление этого значения в различных ситуациях иллюстрируется на численных примерах. 146
П р и ме р 1 Найти медиану выборки {9, 3, 5, 8, 4, 11, 13}. Решение. Вначале упо- рядочим наблюдения вы- борки. Получим 3, 4, 5, 8,9, 11, 13. Поскольку в выборке семь наблюдений, четвертое по порядку бу- дет иметь значение боль- шее, чем первые три, и меньшее, чем последние три наблюдения. Таким образом, четвертое наблю- дение будет медианой вы- борки. В нашем примере значение медианы набра- 100 Г 7. 70 -35 30 50 —25 10 - 5 - D Кумулятивный частотный многоугольник Оценки по мате- матике (пункти- ром показоно построение медианы ) О'— О 29,5 39,5/495 59,5 х Оценки Рис. 70 но полужирным шрифтом; ее значение будет равно 8. Пример 2. Найти медиану выборки {20, 9, 13, I, 4, 11}. Решение. Упорядочим выборку: 1, 4, 9, 11, 13, 20. Теперь, поскольку имеется всего 6 наблюдений, мы будем иметь две середины. Эти значе- ния набраны полужирным шрифтом. Так будет происходить всегда, когда число наблюдений в выборке четно. В таких случаях медиану определяем как полусумму этих серединных значений. Для нашего примера это дает x = 9-±ll = 10. 2 Упражнение 2.3.2 Найдите медианы для следующих выборок: 1. {5 1, 3, 8, 8, 2, 6}; 2. {2,7,9, 2, 4, 5}; 3. {2,4; 7,5; 6,7; 9,1; 5, 8}; 4. {8,0; 7,3; 7,1; 2,6; 1,6; 0,3; 5,8; 3,1}; 5. {8, 3, 10, 25, 112, 16, 83, 9}. Пр и м е р 3. (Вычисление х для группированных данных). Найти медиану (т. е. оценить медиану совокупности) для данных из таблицы сгруппированных частот (см. 2.2.5, с. 139). Решение. Так как выборка содержит 50 наблюдений, нам требуется найти значение х, для которого 25 наблюдений его не превосходят. В колонке 6 находим, что кумулятивная частота — 28. Отсюда сле- дует, что 25-е из упорядоченных наблюдений лежит в 4-й группе. Та- ким образом, значение медианы будет некоторой точкой четвертого интервала (39,5 — 49,5) но шкале х. Оценим положение этой точки методом линейной интерполяции на этом интервале. Эту процедуру легче усвоить с помощью многоугольника кумулятивных частот (см. 2.2.5, а)). Воспроизведем нужную нам часть рис. 64 в увеличенном масштабе с тем, чтобы на ней были изображены 4-я группа и две со- седних (рис. 70). 147
Взяв для построения пунктирные линии, мы видим, что медиана приближенно равна 48. Значение медианы можно вычислить следующим образом: x — OlEm, где А — точка нижней границы 4-й группы, величина т может быть вычислена в силу подобия заштрихованного треугольника и треуголь- ника CDE. Получаем отношения: т _CD_ 49,5—39,5 25—10 ~ 28—10 ’ откуда т = 15- — = 8,33. 18 Итак, х = 39,5+ 8,33 = 47,83. Этот пример показывает, как на основе линейной интерполяции может быть выведена общая формула для вычисления медианы. Чита- тель при желании может проверить, что верно следующее соотношение ~ / N/2—F \ \ г — г ] где L — нижняя граница медианной группы, N — число наблюдений в выборке, g — ширина медианной группы, F и F' — кумулятивные частоты медианной группы и предшествующей ей. Упражнение 2.3.3 Оцените медианы совокупностей по сгруппированным данным для каждого из примеров задания 4 из упражнения 2.2.1. в) Арифметическое среднее. Арифметическое среднее множества из N наблюдений получается суммированием всех значений множества и делением этой суммы на N. Эту величину обычно называют просто средней и обозначают буквой т или х (читается «х с чертой»), В симво- лической форме х — Zx/N. Примеры 1. Найдите среднее для множеств (1) {3, 5, 9, 4} и (2) {3, 3, 4, 9, 5, 4, 3, 9, 3}. Решение. (1) х = 3 5 9 — 4 = 5,25; (2) х = 3+3+4+9-|-5+4-|-з+9+3 __ 4 yg 2. Вычисление по данным частотной таблицы. Если данные пред- ставлены в виде частотной таблицы, то поступаем следующим обра- зом. 148
Воспользуемся вторым множеством из предыдущего примера. Это множество может быть перегруппировано следующим образом: {3, 3, 3, 3, 4, 4, 5, 9, 9} и записано в виде частотной таблицы: X 3 4 5 9 f 4 2 1 2 „ - 34-34-3+3 + 44-4+5 + 94-9 Теперь х=------------------------- что совпадает с предыдущими расчетами. Очевидно, это можно переписать и так: 4.3+2.4+1.5 + 2.9_4|78 9 Из частотной таблицы получим: ~ fl *1 + /:2*2+/з*з+/:4Х4 fl + ^ + fs + fa Отсюда следует, что общую формулу вычисления средней для таблицы с k значениями х и их частотами можно записать в виде k S fixi _ - _ fl xlPf2X2 + ... +fhXfc _ t =1 _ 2_fx ~ fi+/2+-+k N N (в последней записи опущен индекс суммирования). 3. Приближенное вычисление х. Вычислим среднюю распределения математических оценок по таблице частот (см. 2.2.5). Решение. Воспроизведем столбцы 3 и 5 частотной таблицы вместе с новым столбцом, обозначенным fx: Среднее группы X Частота f fx 14,5 1 14,5 24,5 2 49,0 34,5 7 241,5 44,5 18 801,0 54,5 12 654,0 64,5 8 516,0 74,5 2 149,0 Итого 2/; = 50 2+= 2425,0 Значения третьего столбца получают умножением частоты f на соответствующую среднюю оценку х. 149
Вычислим теперь среднее по формуле, предложенной в предыдущем примере. Необходимые для этого значения сумм S/ и Sfx получают суммированием второго и третьего столбца. Таким образом, ~ S Д = 2425 г Отметим, что полученный результат не абсолютно точен, поскольку ис- пользование этой формулы основано на предположении о совпадении каждого наблюдения в группе со средним значением этой группы, что, конечно, неверно. С другой стороны, нетрудно заметить, что получен- ные таким способом ошибки имеют тенденцию к взаимопогашению, так как в общем случае одни наблюдения группы будут иметь значения, которые больше средней, а другие наблюдения — меньше. Поэтому приближение, основанное на агрегировании элементов группы, как правило, бывает достаточно хорошим. Вычисление х для группированных данных по методу сечения будет изложено в 2.3.5. Упражнение 2.3.4 1. Вычислите х для каждой из следующих выборок: (1) {62, 13, 54, 60, 38}; (2) {5,2; 4,6; 7,3; 1,8}; (3) {2, 4, 6, 8, 10, 12}; (4) {а, а + d, а + 2d, .... а + + (п — l)d}; (5) {20 фунтов стерлингов, 25 фунтов стерлингов, 15 фунтов стерлингов, 18 фунтов стерлингов, 122 фунта стерлингов}. Будет ли х типичным значением для последнего множества? Допустим, элементы этого множества — жалования пяти служащих, тогда х как средняя заработная плата может привести к неудобной интерпретации. Предложите для этого случая другой, лучший спо- соб определения средней. 2. Вычислите х р,пя каждого из распределений задания 4 из упражнения 2.2.1 (с. 139). г) Взаимосвязь между модой, медианой и средним. Очевидно, что, если распределение симметрично, мода, медиана и средняя совпадают. Таким образом, для симметричного распределения х = х = х. Для унимодального и не очень асимметричного распределения су- ществует полезная приближенная формула, связывающая три вида средней: средняя — мода « 3-(средняя — медиана). Рис. 71 иллюстрирует эту формулу. Положительная Отрицательная асимметрия асимметрия X X Рис. 71 150
2.3.3. ДРУГИЕ ПОЛЕЗНЫЕ ПАРАМЕТРЫ РАСПРЕДЕЛЕНИЯ В 2.3.2, б) мы видели, что медиана делит совокупность (или выбор- ку наблюдений) на две части: 50% наблюдений имеют значения, кото- рые меньше медианы, 50% — больше. Можно найти три значения х, которые делили бы совокупность на четыре части, обладающие аналогичными свойствами. Эти значения называются квартилями распределения и обозначаются Qx, Q2, Q3. Заметим, что Q2 совпадает с медианой (рис. 72). Таким же способом мы можем найти девять значений х, которые раз- бивают совокупность на десять равных частей. Эти значения х назы- ваются декатилями и обозначаются Dlt D2, .... Da. Qi называется нижней квартиль » Q3 называется У125%|верхней квартилью Y.57^ * __I___i__I______ Qi Qz Q3 Рис. 72. Квартили При желании можно разбить совокупность значений х на сто рав- ных частей. Эти значения называются персентилями и обозначаются А. Р2, ..., Pas. Заметим, что Qj = Р№, Q3 = Р75. Квартили, декатили и персентили могут быть оценены по много- угольнику кумулятивных частот, как это было сделано при нахожде- нии медианы в 2.3.2, б). Для них также может быть получена общая интерполяционная формула. Для иллюстрации оценивания некоторых из этих параметров мы вновь вернемся к примеру с распределением оценок по математике из 2.2.5 (рис. 73). Упражнение 2.3.5 Оцените квартили, а также Р1в,Р4В,РВо для каждого из распределений из за- дания 4 упражнения 2.2.1. 2.3.4. ИЗМЕРЕНИЕ РАЗБРОСА а) Вариация. В качестве простейшей меры разброса множества наблюдений можно взять разность крайних значений. Таким образом, если хтах — наибольшее значение в данном множестве, a xmin — наи- меньшее значение, то вариация = хтах — хт1п. Пример. Множество наблюдений {8, 3, 1, 20, 15, 5, 12). Для этого множества находим: вариация = 20 — 1 = 19. 151
Вариация легко вычисляется, и ею часто пользуются при работе с малыми выборками. Например, этой величиной часто оперируют при контроле качества, состоящем в проверке величины отклонений разме- ров массовой продукции от определенных границ. Поскольку при вы- числении вариации необходимы только два крайних значения множест- ва наблюдений, можно предложить более эффективные меры разброса, опирающиеся на все наблюдения. Одна из таких мер разброса предла* гается в следующем параграфе. Упражнение 2.3.6 Найдите вариации выборок {8, 3, 20, 1}; {9,1; 2,3; 4,6; 13) и {4, 8, 35, 2, 17, 6, 28). б) Стандартное отклонение. (1 ) Отклонение от средней. Рассмотрим выборку X = {1, 5, 8, 6}. Ее средняя равна х — 20/4 = 5. На рис. 74 значения выборки обозна- чаются темными кружками на шкале х. Рис. 74 Для каждого наблюдения вычисляются величины (х— х), которые также отмечены на рис. 74. Эти величины называются отклонениями от средней. Иногда для обозначения отклонения мы будем пользоваться символом d. Рассчитаем отклонения от средней (множество D) для рас- сматриваемой в качестве примера выборки X: D = {-4,0, + 3, + 1}. Очевидно, что чем больше будет разброс в множестве наблюдений X, тем больше будут отклонения в D. Таким образом, для измерения рас- сеяния наблюдений мы можем использовать некоторый вид средней для множества отклонений. Такая мера рассеяния и будет введена. Упражнение 2.3.7 г' 1. Найдите множество D отклонений от средней для каждой из следующих выборок: {2, 3, 4, 5, 6); {2, 8, 3, 7, 11, 6, 5}; {1,2; 8,7; 2,4; 6,5; 6,2}. 2. Найдите сумму отклонений для каждого множества D в задании 1. Про- комментируйте полученные результаты. Можно ли взять арифметическое среднее отклонений выборки как меру разброса? (2) Стандартное отклонение. Мера рассеяния, известная как стан- дартное отклонение, обозначается s и вычисляется следующим образом: определяется множество отклонений от средней (D); каждое отклонение возводится в квадрат ({с?2}); находится сумма квадратов и делится на п (ZdVri)', 152
наконец, извлекается квадратный корень. Таким образом, Эту величину часто обозначают через S.D.(x) или просто S.D. Квадрат стандартного отклонения, полученный на третьем шаге, называется дисперсией, которую мы будем обозначать Var (х). S.D. и дисперсия играют важную роль в статистической работе, поэтому формулы для их вычисления должны быть хорошо усвоены. Приведем иллюстри- рующий пример. Пример. Найдите стандартное отклонение множества наблюде- ний X = {4, 8, 6, 3, 7, 2}. Решение. Средняя равна х = 5, а множество отклонений D = {—1, 3, 1, —2, 2, —3}; множество отклонений в квадрате (или квадратов отклонений) будет {d2} = {1, 9, 1, 4, 4, 9}; сумма квадратов, деленная на п, равна 2 42 28 . —= V (/г=6)’ п 6 это и будет дисперсией; квадратный корень из дисперсии равен стандартному отклонению: S.D. (х) = ]/у=2.16. Формулу для вычисления стандартного отклонения можно запомнить из его определения: «S.D. равно квадратному корню из арифметичес- кой средней квадратов отклонений». Дисперсия равна арифметической средней квадратов отклонений, и S.D. есть квадратный корень из нее. Упражнение 2.3.8 1. Найдите стандартное отклонение выборок из упражнений 2.3.2, 2.3.4(за- дание 1), 2.3.6 и 2.3.7 (задание 1). 2. Покажите, что арифметическое среднее множества отклонении для любой выборки равно нулю. Отсюда следует, что эта величина не подходит для измере- ния разброса. 3. Покажите, что s2 = 2 (х — х)г1п можно записать в виде 2х2/п —х. (Раз- ложите по степеням (х — х)2 и просуммируйте члены. Примите во внимание, что 22хх = 2x2 х и 2х2 = пх2.) 4. Воспользуйтесь формулой из предыдущего задания для вычисления s выборки {4, 3, 5, 7, 9, 11}. Снова найдите s с помощью обычной формулы. Сравни- те затраты времени, необходимые для соответствующих вычислений. 5. Запомните формулу из задания 3. Воспользуйтесь ею для вычисления стандартных отклонений выборок из задания 1. 153
(3) Вычисление для группированных данных. Далее приводится про- стейший пример таблицы частот группированных данных. С помощью этих данных иллюстрируется вычисление стандартных отклонений по основной формуле. С помощью методов, излагаемых в 2.3.5, можно уменьшить затраты времени для таких расчетов. Среднее значение X Частота f (X—X) (JC—Х)3 f (х-х^ 10 5 —9,5 90,25 451,25 20 11 0,5 0,25 2,75 30 4 10,5 110,25 441,00 Всего 20 — —- 895 Величины в последнем столбце для каждой группы равны произведению частоты на квадрат отклонения. Таким образом, сумма величин в столб- це совпадает с 2/ (х — х)2. Соответствующая формула для вычисления стандартного отклонения имеет вид д2 2f (*~*)2 п где п — общее число наблюдений, и суммирование происходит по всем группам. Для данных примера получим: т. е. s2 = —= 44,75, 20 s = 6,7. Читатель должен был заметить, что полученный результат яв- ляется приближенным, так как вместо действительных наблюдений мы пользовались средним значением группы (см. замечания в 2.3.2, в) после вычисления х по группированным данным. Как правило, это приближение довольно хорошее. Группировка данных ведет к неболь- шому увеличению значения s2; в некоторых случаях необходима допол- нительная корректировка этой величины. Можно сомневаться или не сомневаться в пользе применения такой корректировки, однако в этой книге эта формула разбираться не будет. в) Формулы для s2. Приведем в табличной форме все формулы для вычисления s2, которые встречались нам раньше, вместе с их альтер- нативными записями. 154
s2, вычисленное по всем наблюдениям s2, вычисленное по группированным данным Определения (суммирование по выборке) 2(х —х)2 п (суммирование по группам) Zf(x — xjz п Альтернативная форма записи 2 X2 -2 п _~2 п Все эти формулы очень важны и поэтому должны быть выучены. В задании 3 упражнения 2.3.8 предлагалось получить одну из аль- тернативных формул. Приведем ее вывод. 2 £f(x—x)2 2f (х2—2хх-рх2) s ~ п ~ п " _ ЗЛ _ + 7 - 2х-Х + *1 = ?, п п п п п п что и требовалось доказать. Упражнение 2.3.9 Вычислите дисперсию выборки, для которой: (1) 2х = 80, Sx2 = 640, п = 20; (2) 2х = 40, Sx2 = 400, п = 8; (3) 2 f = 80, 2/х = 4 400, 2fx2 = 250 000; (4) 2f = 50, 2fx = 360, 2/х'2 = 2856,5. 2.3.5. ПРЕОБРАЗОВАНИЯ ПАРАМЕТРОВ а) Средняя и S.D. Применение следующего метода резко сокращает затраты труда, связанного с вычислением различных статистических величин. Этот метод мы проиллюстрируем на частотном распределении: Среднее значение X 8,5 18,5 28,5 38,5 48,5 Частота 8 12 20 15 5 Гистограмма этого распределения показана на рис. 75, под шкалой х проведена другая шкала у. Как видим, средние значения групп неудобны для вычислений, так как они представляют собой десятичные дроби со знаками после запя- 155
Той с шагом, равным 10. Отметим на шкале у число десятков, отделяю* щих среднее соответствующей группы от среднего всей совокупности. Очевидно, зависимость между значениями х и у будет линейной и равной х = Юг/ + 28,5. (1) Читатель может легко проверить, что если у принимает значения —2,—1, 0, 1,2, то х, найденный по уравнению (1), принимает значения 8,5; 18,5; 28,5; 38,5 и 48,5, которые и требовалось получить. Общее правило записи уравнения преобразования можно сформу- лировать следующим образом. Выберем в качестве начала отсчета (ну- ля) на шкале у середину интервала распределения. Обозначим ее через М. (Часто за М берут среднее значение модальной группы.) Тогда уравнение будет таким: x = gy^M, [‘2) где£ — ширина группы по шкале х, т.е. х = (ширина группы) у + (среднее значение, у = 0). (2') Отнесем теперь частоты распределения, заданного на шкале х, к соответствующим интервалам шкалы у. Вычислим среднюю у и S.D. (у).' Стандартные отклонения, найденные для разных шкал, мы будем обо- значать sK и sy. Если у и sy известны, то х и могут быть найдены с помощью сле- дующих формул: ~x = gy + M; (3) ^x=gSy. (4) Доказательство этих формул приводится далее в п. в) этого пара- графа. Для данных гистограмм вычисления выполняются следующим об- разом. Составляется таблица со столбцами, обозначенными х, f, у, fy и т. д. Последние три колонки используются только для проверки, их назначение будет объяснено далее. 156
Среднее значение X Частота 1 У fy fy’ W-l f (H-1) f (s+i)! 8,5 8 —2 —16 32 —1 —8 8 18,5 12 —1 —12 12 0 0 0 28,5 20 0 0 0 1 20 20 38,5 15 1 15 15 2 30 60 48,5 5 2 10 20 3 15 45 Всего 60 — —3 79 — 57 133 Перепишите первые два столбца таблицы х и f, а остальные вычисле- ния попытайтесь проделать самостоятельно, пользуясь в качестве ин- струкций заголовками соответствующих столбцов. Вы обнаружите, что необходимые вычисления проходят очень легко. Обратите внимание, что для получения fy2 достаточно fy умножить на у. По итоговой сумме четвертого столбца найдем: у = ^!-= — = — 0,05, п 60 после чего можем легко рассчитать S2 = —~yz= И-----0,0025 = 1,314. п 60 Наконец, принимая во внимание формулы (3) и (4), мы получим: Х-= 10у +28,5 = 28,0; = 10sy = 10 V1.314 = 11,5. Итак, распределение имеет среднюю 28 и S. D. = 11,5. б) Использование проверочных столбцов (проверка Чарли). С по мощью сумм 2f (г/+1) и 2/ (у + I)2 (последние значения предпослед- него и последнего столбца таблицы) проверяют суммы 2/, 2/у и 2/ц2 прежде, чем ими пользуются для вычисления у и sy. Для выполнения этих проверок мы воспользуемся следующими тождествами: 2/ (у + 1) = Vfy + 2/ и 2/ (у + I)2 = 2fz/2 + 22/г/ + 2f. (Читатель сможет доказать эти тождества самостоятельно.) Таким образом, для примера из 2.3.5, а) выполнимость равенств 57 = —3 + 60 и 133 = 79 + 2(—3) + 60 говорит о том, что все сум- мы вычислены правильно. При расхождении результатов все вычисления необходимо последо- вательно повторять до тех пор, пока не будет найдена ошибка. Хотя эта проверка требует дополнительных расчетов, она в большинстве случаев бывает полезной. 157
в} Доказательство формул преобразования. 1) Доказательство формулы (3). Для каждого наблюдения выборки х — ёУ + М. Суммируя по выборке и деля сумму на п, получим сле- дующее уравнение: 2// , 2Л4 ----ст —— -4------. из которого немедленно следует (3). 2) Доказательство формулы (4). Имеем: х = ёУ + м-, X=gy + М. Вычитаем из первого уравнения второе и возводим в квадрат обе час- ти: (х—x)2 = g2(y—'iy)2. Просуммируем обе части полученного уравнения по выборке и разде- лим сумму на п, получим s2 = g2Sy. Упражнение 2.3.10 1. Вычислите средние и стандартные отклонения (S.D.) по следующим табли- цам частот. Воспользуйтесь подходящим преобразованием для каждого случая. (1) Длина заготовок х в мм; 6,5 8,5 10,5 12,5 14,5 16,5 Частота f: 2 4 18 15 8 3 (2) Предельное растяжение р в мм: 7,2 7,3 7,4 7,5 7,6 7,7 7,8 Частота /': 1 5 8 20 17 12 7 (3) Точка плавления Т °C: 89,8 89,9 90,0 90,1 90,2 90,3 90,4 Частота f: 5 7 12 33 25 15 3 (4) Диаметр заклепок d в мм: 9,7 9,8 9,9 10,0 10,1 10,2 Частота/': 1 0 8 25 14 2 (5) Оценка s на экзамене: 15 25 35 45 55 65 75 85 Частота f: 1 3 9 15 44 22 5 1 2. Вычислите S.D. для каждого множества данных задания 4 упражнения 2.2.1. 2.3.6. ПОЛЕЗНОЕ СООТНОШЕНИЕ, СВЯЗЫВАЮЩЕЕ х, s И РАСПРЕДЕЛЕНИЕ Значение х грубо указывает, где расположен центр распределения, а значение s несет определенную информацию о его разбросе около х. С помощью этих величин можно вывести два очень полезных прави- ла, которые приблизительно выполняются для большинства унимодаль- ных распределений. Вот они: (1) 95% распределения лежит между значениями х—2s и x + 2s; (2) более чем 99% распределения заключено между х—3s и x4-3s. Эти приближенные границы совокупности иллюстрирует рис. 76. 158
Пример. Для распределения, рассмотренного в 2.3.5, среднее равно 28, a S.D. = 11,5. Поэтому приближенные 95%-ные и 99%-ные границы распределения будут равны 28+23 и 28±34,5 соответственно. Упражнение 2.3.11 Для каждого из распределений задания 1 упражнения 2.3.10 получите 95%-ные и 99%-ные границы совокупности. Набросайте гистограмму и отметьте получен- ные границы для разных масштабов. Выполняются ли в этих случаях правила (1) и (2) — см. рис. 76. Рис. 76. (а) За пределами интервала x±2s (в сред- нем) лежит менее одного наблюдения выборки из 20. (б) За пределами интервала x+3s (в среднем) лежит менее одного наблюдения выборки из 100 2.3.7. ИЗМЕРЕНИЕ АСИММЕТРИИ ПО ПИРСОНУ Рисунки в 2.3.2, г) показывают связь средней, медианы и моды. Из этих рисунков следует, что для распределений с положительной асим- метрией средняя х будет больше моды х. Для распределения с отрица- тельной асимметрией х будет меньшех. И чем больше будет асимметрия, тем больше будет разность между этими двумя величинами. Это поз- воляет рассматривать величину (х—х) как меру асимметрии. Для то- го чтобы эту меру сделать безразмерной, можно разделить ее на стан- дартное отклонениеs. Полученный параметр известен как первый коэф- фициент асимметрии Пирсона. Второй коэффициент Пирсона прибли- женно эквивалентен первому, при расчете его вместо моды берут ме- диану (см. формулу в 2.3.2, г)). Эти меры таковы: (1) 1-й коэффициент асимметрии Пирсона равен х ; (2) 2-й коэффициент асимметрии Пирсона равен-------------. Оба коэффициента равны нулю, если распределение симметрично. Они положительны или отрицательны в зависимости от того, имеет ли распределение положительную или отрицательную асимметрию. Для каждого из коэффициентов величина, большая 1 или меньшая— 1, указывает на значительную асимметрию. Упражнение 2.3.12 1. Найдите меру асимметрии по Пирсону для распределений в упражнении 2.3.10. 2. Сравните асимметрию в распределениях А, В и С для следующих значений параметров: для А: средняя = 4, мода = 3, S.D. — 1,5; для В: средняя = 5, медиана = 4, дисперсия = 36; для С: медиана = 22, мода = 20, S.D. = 3. 159
2.4 РАСПРЕДЕЛЕНИЕ ГЛАВА ВЕРОЯТНОСТЕЙ 2.4.1. ВВЕДЕНИЕ Как следует из первой главы, распределения вероятностей могут быть либо дискретными, либо непрерывными1. В этой главе будут даны определения соответствующих понятий и рассмотрены примеры. Мы об- судим также некоторые функции, которые получаются из распределе- ний вероятностей и очень полезны в статистике. а) Дискретные распределения. Если случайный эксперимент имеет выборочное пространство2 X = {хг, х2, ..., хл}, а величины plt р2. ..., рп — вероятности элементарных событий {хД, ..., {хп}, то мы гово- рим, что для эксперимента определено дискретное распределение вероят- ностей. В силу данного определения выборочное пространство для дис- кретного распределения счетно, в частности, оно может быть конечным. Функция р (X), принимающая значения р1т ..., рп, когда X принимает значениях!, ...,хп, называется функцией вероятности X. Примеры 1. Эксперимент. Наблюдается выпавшая сторона при бросании монеты. Вероятности определяются в предположении, что герб и ре- шетка — равновозможные события. Выборочное пространство: S = {Н, Т} ) Дискретное распределение Функция вероятности: р (S)~ {1/2, 1/2}J вероятностей Замечание. Часто каждой точке выборочного пространства приписывается действительное число. Например, в эксперименте с мо- нетой мы можем исходу И приписать 0, а исходу Т—число 1. Полу- ченное распределение будет иметь вид: Х = {0, 1} Переменная X, определенная на выборочном пространстве S, — простейший пример так называемых случайных переменных. Вообще, любая действительная (т. е. имеющая значения в области действитель- 1 Распределения смешанного типа (одна часть которых непрерывна, а дру- гая дискретна) довольно редко встречаются в приложениях. Распределения та- кого типа в этой книге рассматриваться не будут. 2 Выражение «выборочное пространство» — синоним выражения «простран- ство исходов». 160
них чисел) функция, определенная на выборочном пространстве, на- зывается случайной (или стохастической) переменной. 2. Эксперимент. Монету бросают до тех пор, пока не появляется ре- шетка (Т). Выборочное пространство. Выборочное пространство для этого экс- перимента обсуждалось в 2.1.2, а). Предположим, что рассматриваемое выборочное пространство счетное. Оно описывается следующим обра- зом: S = {(7'), (НТ), (ННТ), ...}; (Ill I р (S) = {-g- , , -g- , [ — соответствующие вероятности. Заметим, что сумма вероятностей равна 1, поскольку эти вероят- ности образуют бесконечную геометрическую прогрессию со знамена- телем 1/, и с суммой- V2 / (1—1/2). Чтобы задать случайную переменную на исходах этого эксперимен- та, можем каждому исходу поставить в соответствие число бросаний, необходимых для его наступления. Это приводит нас к дискретному распределению: действительная функция на S: X — {1, 2, 3, ...} /v4 ( 1 1 1 1 функция вероятности: р (л) = <-g- , -j- , -у , ... j . б) Свойства функции вероятности. Поскольку значения р (X) — вероятности, то непременно 0<р(х)<1. (1) Поскольку объединение всех элементарных событий равно S, мы получим SpW=1. (2) s Вероятность любого события Е может быть найдена по формуле Р(Е) = ^.р(х), Е где суммирование происходит по всем точкам из Е. Любая функция, удовлетворяющая условиям (1) и (2), бу дет функ- цией вероятности. На практике стремятся выбрать функцию вероятно- сти, принимающую значения, близкие (при повторении эксперимента большое число раз) значениям относительных частот. Рассмотрим, на- пример, эксперимент, состоящий в бросании двух монет и наблюде- нии выпавших сторон. Для этого эксперимента выборочное простран- ство будет S = {*!, х2, *з}> гДе хг — исход «выпадение двух гербов», или {Н, И}-, х2 — исход «выпадение герба и решетки», или '{Н,'Т}\ х3 — исход «выпадение двух решеток», или {Т, Т}. Для задания дискретной функции вероятности мы должны опреде- лить только вероятности каждого из событий {xj, {х2}, {х3}, удовлетво- ряющие условиям (1) и (2). Вот некоторые возможные функции ве- роятности для этого эксперимента: 1) р(Х) = {0, 0,1}; 2)р(Х) = 1±, -1 6 Зак. 973 (3) 161
3) Р (X) - СА, VJ, 4) р (X) = {0,22; 0,50; 0,28}. Если принять функцию 1, то окажется, что события {(//, И)} и {(//, Т)} невозможны, а событие ((Г, Г)} достоверно. Другими слова- ми, первые два исхода не наступят никогда, а третий исход появляется при любом испытании. Возможно ли это? С математической точки зре- ния у нас нет причин для отказа от этой функции, так как каждая ве- роятность лежит между 0 и 1 включительно и 0 + 0 + 1 = 1. На прак- тике это также могло иметь смысл в том случае, когда обе монеты с двух’сторон имели бы решетки! Однако, если мы обнаружили, что обе монеты имеют и герб и решетку, то мы не можем ни одному исходу аргументированно припи- сать вероятность, равную нулю. Поэтому необходимо выбрать функ- цию, например, имеющую вид 2, 3 или 4. Но какую? Предполагая, что появление х2 и х3 равновозможно, необходимо выбрать функцию 2, которая каждому элементарному событию приписывает вероятность, равную 1/3. На первый взгляд, это может показаться обоснованным; даже некоторые великие математики на заре возникновения теории ве- роятностей совершали такую ошибку, беря для рассматриваемого экс- перимента эту функцию вероятности. Однако достаточно выполнить хотя бы небольшое число испытаний, чтобы увидеть, что такое задание вероятностей ошибочно. Для проверки этого факта мы советуем читате- лю проделать этот эксперимент самостоятельно. Возьмем две монеты и бросим их 60 раз, запишем частоту появления (НН), (НТ) и (ТТ). Мы найдем, что отношения этих частот равны не 1 : 1 : 1, а близки к 1 : 2 : 1 *. Поэтому частоты будут приближенно равны 15, 30 и 15 соответственно. Таким образом, получается, что для рассматриваемого эксперимента лучше выбрать функцию 3. ъ С другой стороны, допустим при 60 бросаниях монет частоты исхо- дов эксперимента оказались равными 13, 30 и 17 соответственно. Не будет ли в этом случае предпочтительнее функция 4? Очевидно, на дан- ном этапе мы не знаем, функция 3 лучше или хуже, чем функция 4. Функция 3 будет более подходящей, если обе монеты правильно сба- лансированы (такие монеты будем называть правильными)', если же монеты неправильные (например, сторона герба у каждой более во- гнута и при этом чаще выпадает решетка), выбор функции 4 был бы более оправдан. Проверьте это последнее утверждение путем вы- числения функции вероятности в предположении, что для каждой монетм р (Т) = 0,53. Выбор между функциями 3 и 4 можно сделать только после много- кратного бросания монет и выяснения, какая из этих функций наиболее подходящая в длинной серии испытаний. Если мы осуществим такую проверку, то, скорее всего (а в действительности — наверняка!), обна- ружим, что ни одна из предложенных функций не будет «наилучшей», и построим другую функцию, основанную на большом числе бросаний. * Читателю станет яснее такое распределение вероятностей, если он не- сколько изменит эксперимент и будет бросать монеты поочередно. Легко заме- тить, что два исхода (НТ) и (TH), равновероятные для правильных монет исходам (ТТ) и (НН), были объединены в один исход эксперимента. — Примеч. ред. 162
pm Р(х) Д Р'х) pm А 0,50 2 х, хг х3 (3) X, х2 x3 (Ч Л, хг х3 х, хг х3 (Г) (2) S=[x,,x2, х3), где х, =(НН), хг= (НТ), х^(ТТ) Рис. 77. Распределение вероятностей для эксперимента с бросанием двух монет частот, которые рассматривались в вероятнос- Этот пример обсуждался довольно подробно, частично как допол- нение к содержанию 2.1.5, частично для демонстрации читателю того факта, что практическое задание вероятностей является не только ма- тематической, но и эмпирической проблемой. Суммируем сказанное: (а) любую функцию р (х), такую, что (х)< 1 и (х)= 1, s можно использовать в качестве функции вероятности (ф. в.); (б) выбирая ф. в. для практических задач, следует ее проверить, повторяя ис- пытания эксперимента; при необходимости выбранную ф. в. можно заменить. Очень часто в вопросах задания ве- роятности интуиция оказы- вается ложной. в) Графики функций ве- роятности. Между распреде- лениями вероятностей и рас- пределениями относительных гл. 2.2, имеется тесная связь. Под распределением тей можно понимать предельную форму распределений относительных частот при неограниченном увеличении числа наблюдений. Такое рас- пределение принято называть истинным распределением вероятностей совокупности данного эксперимента. Выборки из этой совокупности образуют распределения относительных частот, представляющие собой приближенную форму истинного распределения вероятностей. Распределения вероятностей можно изобразить графически, при- меняя для этого такие способы, как прямоугольные диаграммы или гис- тограммы, которые уже использовались при построении распределений относительных частот. Графики на рис. 77 иллюстрируют распределе- ния (1), (2), (3) и (4) для рассмотренного эксперимента с бросанием двух монет. Упражнение 2.4.1 1. Выборочное пространство X = {0, 1, 2, 3}, а функция вероятности р (х) = С/(2+х). Определите значение С и нарисуйте прямоугольную диаграмму для распределения. Найдите вероятности событий: (1) х=3, (2)х<3, (3)х£{2, 3} (т. е. х либо 2, либо 3). 2. Какая из следующих функций более подходящая как функция вероят- ностей для выборочного пространства X = {0, 1, 2, 3}? (1) 1/х, (2) 1/8 (l/2-f-x), (3) С/х, (4) (х2-3)/2, (5) С/(1 + х). 3. Для функций в задачах 1 и 2, которые могут быть использованы в качестве функций вероятности, нарисуйте прямоугольные диаграммы (в случае необходи- мости найдите константу С). Для каждого случая найдите вероятности событий: (а) х нечетное; (б) х четное; (в)х£{0, 1} (т. е. х либо 0, либо 1); (г) х меньше 1; (д) х больше 1. 4. Для счетного выборочного пространства X = {0, 1,2, 3, ...} соответст- вующая функция вероятностей будет р (х) = е~г.(1/х1), где е — основание на- туральных логарифмов. Покажите, что Sp (х) = 1, и нарисуйте прямоугольную X диаграмму для этого распределения. 163
2.4.2. НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ (1) ОСр(х}~Всюду Мы возвращаемся к проблеме задания вероятностей в непрерывных выборочных пространствах. В дальнейшем мы будем предполагать, что выборочное пространство есть множество или подмножество действи- тельных чисел. Если выборочное пространство некоторого эксперимента X несчет- но, то мы не можем каждому элементарному событию, как это делалось для дискретных пространств, приписать ненулевую вероятность, так как в противном случае, сум- мируя все вероятности, мы по- лучили бы в результате беско- нечность вместо необходимой единицы. Чтобы обобщить поня- тие вероятности для событий на несчетных выборочных про- странствах, мы введем функцию плотности вероятности (ф. п. в.), соответствующую случайно- му эксперименту X, которую, будем обозначать р (х). Приве- денные далее свойства этой функции постулируются. ,, а) Свойства функции плот- ности вероятности (ф. и. в.). Прежде всего потребуем, чтобы р(х)^0, — оо <;%<; +оо (1) и ft J р (х) dx = 1. (2) 7 О 7 2 3 X Выборочное пространство — все действи/пельнь/е числа р(х}- Сообщал площадь=фр(х)дх=1 Р1*) Площадь fi пп././ (3) Событие £,= “xto' Р(£,)=£р(Х)дх Событие "at, хс, Ъ " Р<Рг)-/р(£)дх Рис. 78 О а Ь к Необходимо также, чтобы для любого события Е из. поля- событий эксперимента (см. 2.1.3, г)) можно было вычислить интеграл j' р (х) dx. Е Любое событие Е можно представить как некое подмножество действи- тельных чисел; число, выраженное этим интегралом, назовем вероятно- стью Е. Итак, Р (Е) — J р (х) dx. (3) Е Если задана ф. п. в., обладающая указанными свойствами, будем го- ворить, что для данного эксперимента X определено непрерывное рас- пределение вероятностей, а X определяет непрерывную случайную пе- ременную. Графики на рис. 78 иллюстрируют свойства функции плотности ве- роятностей. Читатель заметит много г схожего между дискретными_и_непрерыв- ными функциями плотности вероятности. Их роли почти во всех во- 164
нросах одинаковы; знак 2 для дискретных распределений в любых ситуациях соответствует знаку f в непрерывных пространствах. Очень важно отметить, что в непрерывном случае р (х) не будет вероят- ностью в обычном смысле этого слова. Только если эту величину умно- жить на дифференциал dx, мы под результатом можем понимать вероят- ность события, которое определяется как событие «х принадлежит интервалу, обозначенному через dx». На- глядно эту ситуацию можно отождествить с разбиением на части некоторого стержня с заданной функцией плотности d. В таком слу- чае не имеет смысла говорить о «массе точки» тела, однако при рассмотрении малого объе- ма бV произведение d 6V уже имеет смысл, под которым и понимаю!' массу взятой части тела. Поэтому при использовании непрерывного распределения вероятностей для некоторого эксперимента X относительно вероятностей предполагаются выпол- ненными следующие условия: Р (X = х) = 0 для любого одноточечного события {х}; (1) Р (аС х С b) ~ Р (а х <Z b) = Р (а < х й) = = Р {а <х < Ь). (2) Для моделей, применяемых на практике, эти условия, как правило, выполняются. Некоторые замечания в конце примера 1, рассматривае- мого далее, также указывают на то, что условие (1) довольно есте- ственное. Примеры 1. Эксперимент. На вертикальной оси свободно вращается хорошо отрегулированная стрелка. В плоскости, перпендикулярной оси, под стрелкой помещается круглый диск. На всем периметре этого диска находится равномерная шкала с отметками от 0 до 10. Стрелка приво- дится во вращение, и после ее остановки записывается значение (х), которое соответствует показанию стрелки (рис. 79). Необходимо подобрать для этого эксперимента подходящее распре- деление вероятностей. Выборочное пространство X. Поскольку стрелка может остановить- ся против любого числа между 0 и 10, то это множество и будет выбороч- ным пространством X. Функция плотности вероятности р (х). Если стрелка хорошо сба- лансирована, то интуитивно ясно, что вероятность попадания стрелки в любую точку некоторого интервала будет пропорциональна длине этого интервала. Таким образом, для любого интервала (я, Ь) в множест- ве (0, 10) необходимо, чтобы Р (хб (а, Ь))=С [длина (а, Ь)], где С— некоторая константа. Это означает, что ф. п. в. должна быть констан- 165
той С. А поскольку суммарная вероятность равна единице, то ю ю J р (х) dx = J Cdx = 1; 6 о отсюда находим С = — ю График ф. п. в. для этого эксперимента показан на рис. 80. Полное описание р (х) выглядит следующим образом: 1 „ • если 0 х 10 (х — действительное число), 0 в других случаях. х Рис. 80. Прямоугольное распределение на (0,10) Последняя строчка «0 в других случаях» часто совсем опускается из описания ф. п. в., если выборочное пространство, представляющее собой подмножество действительных чисел, полностью определено. Замечания. Допустим, нас интересует вероятность того, что стрелка остановится против х = 3. Вопрос может быть поставлен в сле- дующей форме: когда стрелка может остановиться против х = 3? Если бы конец стрелки можно было рассмотреть в микроскоп, мы бы заметили, что стрелка никогда не показывает точно 3. Мы также не в состоянии абсолютно точно указать, где находится по шкале отметка 3. Мы ограничены степенью остроты нашего зрения и несовершенством измерительных приборов. Единственное, что мы можем сделать, это указать малый интервал, на который показывает стрелка и в котором находится отметка 3. Даже длину интервала мы можем измерить только приближенно. Таким образом, в действительности при работе с данными, представ- ляющими собой результаты измерений, мы можем лишь наблюдать, что результаты проводимого эксперимента принадлежат некоторому интервалу, быть может и очень маленькому. Далее, нетрудно согласиться с тем, что вероятность для стрелки ука- зать на меньший интервал меньше вероятности указать на интервал, больший по длине. И чем меньше рассматриваемый интервал, тем мень- ше будет соответствующая вероятность. Какой необходимо взять ин- тервал, который включал бы только одну точку х = 3? Легко пока- зать, что любой интервал, даже достаточно малый, содержащий х = 3, содержит также несчетное число других точек, соседних с 3. Если бы мы попытались продолжать разбиение интервала до тех пор,, 166
пока в нем останется только х = 3 и не останется других точек, то такой процесс будет продолжаться, пока интервал не исчезнет вовсе. Это произойдет, когда мы достигнем интервала длиной, равной нулю (если только это возможно). Таким образом, на практике мы никогда не спрашиваем, чему равна вероятность Р (х = 3), а пытаемся отве- тить, например, на такой вопрос: чему равна вероятность Р (х£ (2,95, 3,05)) или Р (х£ (2,995, 3,005))? Если же мы хотим найти вероятность одноточечного события в модели с непрерывными’’дан- ными, то, очевидно, такую вероятность мы должны положить равной нулю. 2. Случайная переменная X имеет следующую функцию плотности вероятности: р(х) = с (4—2х), 0<-х<2, 0 в других случаях. 1) Найдите значение с. 2) Нарисуйте распределение. 3) Найдите вероятности событий £, = «х < 1», £а = «х < 2», £3 = «1/2 < х 7/8», Ец - «х = 1/4», Еъ = «х^ 2», Ев = «х ле- жит между 1 и 2 при условии, что это значение больше 1/2» = «1 < х < 2»/«х > 1/2». Решение 1) Суммарная вероятность должна быть равна единице, поэтому 2 |’с (4—2 х) dx = 1, откуда получаем с = 1/4. о 2) График ф. п. в. приведен на рис. 81. 1 0 1 1 з 3) Р(Е1) = Р(х< 1) = J p(x)dx= J 0dx+ [(4 — 2x)dx= — . — оо —оо О Замечание. Интегралы, для которых р (х) = 0, в дальней- ших преобразованиях опускаются. 2 £(£2) = £(х<2) = J p(x)dx= 1; — оо 167
Р(ЕЛ) —Р^х = = J p(x)dx = O^ х = -^- —событие с 1/4 одним исходом); Р (Еб) = P(X^2) = J р (х) dx = 0; 2 (см. в 2.1.6, а) формулу условной вероятности) (поскольку интервал (1, 2) есть пересечение интервалов (1, 2) и (1/2,оо) J Р (*) dx 1 ОО J p(x)dx 1/2 Упражнение 2.4.2 1. Найдите ф.п.в. для непрерывного прямоугольного распределения на ин- тервале (2, 5) и равного нулю в других случаях. Нарисуйте распределение и най- дите вероятность событий: (1) «х <£ 1», (2) «х < 3», (3) «2 < х < 3», (4) «х > 3», (5) «х = 2Х/3», (6) «х = 2х/2 или х= 3», (7) «х< 3 и х> 2», (8) «х £ (4, 5) при условии X 2> 3». 2. Нарисуйте распределение с ф.п.в. ф о < X < 2, о в других случаях. Найдите значение С. Рассмотрите события Е = «х <Z 1», F = «х £ (1/2, 1)», Q = «х>1/2». Найдите вероятности событий: (1) Е, (2) F, (3) G, (4) EF, (5) FG, (6) GE, (7) E/F, (8) F/G, (9) G/E, (10) Е (J F, (11) F U G, (12) G U Е. 3. Нарисуйте график распределения, для которого ф.п.в. равна [ Се-ах, о 0x2, в других случаях. Найдите значение С и вероятности событий (I)—(12) из предыдущего зада- ния с чтим распределением вероятности. 1Q8
2.4.3. КУМУЛЯТИВНАЯ ВЕРОЯТНОСТЬ Функция плотности вероятности р (х) (она может быть как дискрет- ной, так и непрерывной) порождает кумулятивную функцию распре- деления (к. ф. р.) F (х) = Р (X < х), которая каждому значению х из выборочного пространства ставит в соответствие вероятность того, что случайная переменная X окажется не больше х.] « ГТ. । Us Кумулятивная функция распределения вычисляется по формулам: 1) F (0*=0 = У, р (х) в дискретном случае; / t 2) F (/) = Р (X 0 = (' р (х) dx в непрерывном случае. Значения к. ф. р. F (х) и соответствующие значения х можно на- нести на график; в таком случае мы получим кумулятивную вероятно- стную огиву. Такие огивы аналогичны кумулятивным огивам относи- тельных частот, построенным по выборкам и описанным в гл. 2.2. Оги- ву к. ф. р. можно считать огивой совокупности, тогда соответствующая огива выборки будет ее оценкой. Примеры 1. Дискретное распределение вероятностей. Выборочное пространство X = {0, 1, 2, 3}. ( I Функция плотности вероятности р (х) = 1 -у , 1 3 Ч Т ’ Тб ’ 16 J • Как легко видеть, кумулятивная функция распределения будет иметь вид: 0, если X < 0, I п - 1 — , если 0 si х < 1, 4 1 , 1 3 . -------= — , если 1 х < 4 2 4 1 , 1 ,13 15 , q ~ —I----р — — - , если 2 4 ; 2 16 16 _L + _L + A+_L = i, ecJ 4 2 16 16 График F (х) изображен на рис. 82. F(x) = 15 3, 7 - ____- г 7 - -— 1 2 1 ---- 0 7 2 3 x Рис. 82. График к. ф. р. Дискретный случай 169
Заметим, что F (х) определена для всех действительных значений х; в некоторых точках х происходит скачок (разрыв) значений функции F (х), равный величине р (х). 2. Непрерывное распределение вероятностей (прямоугольное). Выборочное пространство X — интервал (0, 4). Ф. п. в. р(х)=-|-, 0<х<4. К. ф. р. F(x)= ( p(x)dx, откуда если х < О, если 0<х<4, если х^>4. График F (х) показан на рис. 83. Рис. 83. График к. ф. р. Непрерывный случай Заметим снова, что F (х) определена для всех вещественных значений хот — оо до + 00 • В графике к.ф. р. для непрерывных распределе- ний разрывы отсутствуют*.) Замечания. Мы видели, как к. ф. р. можно получить из ф. п. в. Возможна и обратная операция: заданная к. ф. р. определяет ф. п. в. Таким образом, для задания распределения вероятностей можно ис- пользовать либо ту, либо другую функцию. В элементарной статистике чаще всего используют ф. п. в., а в более серьезных курсах, как пра- вило, имеют дело с к. ф. р. Упражнение 2.4.3 1. Найдите кумулятивную функцию распределения для эксперимента «бро- сание правильной игральной кости и наблюдение выпавшей грани» и нарисуй- те ее график. 2. Найдите к. ф. р. для эксперимента с функцией плотности вероятности. р (х) = */3 р/гх + 1), 0<х<2и нарисуйте ее график. По этому графику опре- делите вероятности следующих событий: (1) «х < 1», (2) «х В/а», (3) «1 < х < <В/а»,(4) «х > 3/4». Найдите значение х. для^которого Р (X < х) = 1/2. ___________ g * Смешанные распределения, как было уже отмечено в тексте, не рассмат- риваются в этой книге. — Примеч. ред. 170
2.4.4. МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ Напомним, что в главе, посвященной описательным статистикам, для характеристики некоторых свойств распределения относительных частот мы вычисляли значения таких величин, как среднее и дисперсия; при этом мы пользовались наблюдениями выборки. Сейчас мы опре- делим аналогичные величины для распределения вероятностей. Рассмотрим случайную переменную X с функцией плотности веро- ятности р (х). Если значения X дискретны, то р (х) представляет собой счетное множество чисел; в том же случае, когда значения X непрерыв- ны, р (х) будет плотностью вероятности, определенной на несчетном множестве*. Поэтому мы дадим параллельные определения, одно—для дискретного случая с использованием знака S, а другое—для дискрет- ного случая с использованием знака f. В обоих случаях 5 будет вы- борочным пространством для X. Любое обсуждение для одного случая с небольшими изменениями может быть перенесено на другой случай. а) Математическое ожидание X. Математическое ожидание X обозначается Е (X) и определяется как (1) E(X) = Sx-p(x) s о или (2) Е (X) = (' х • р (х) dx. s Таким образом, для получения значения Е (X) мы берем каждое значение х, умножаем его на соответствующее значение р (х) и сум- мируем по всем точкам из X. Тесная связь между средней х выборки объема N и математическим ожиданием Е (X) совокупности может быть обнаружена в результате сравнения двух определений. Если в выборке значения хх, ха, ..., X}, появляются с частотами f2, ... fk и Sf = N, то k У fi*i X = ----= — xx + — x2 + ... + — xh. N N 1 N 2 N h Коэффициент при хг в дискретном случае будет оценкой ft/N, со- ответствующей вероятности для всей совокупности. При больших зна- чениях N мы получим: х « р (Xj) х, + р (х2) х2 + ... + р (xfe) xft ж Е (X). Отсюда следует, что в качестве Е (X) можно взять среднее совокуп- ности, из которой производится выборка. Обычно среднее совокупно- сти обозначают греческой буквой р. (В дальнейшем в большинстве слу- чаев для параметров совокупности будут взяты греческие буквы, а для жвивалентных параметров выборки — латинские.) * Эти утверждения справедливы в рамках определений дискретного и не- прерывного распределения, приведенных в 2.4.1, 2.4.2, — Примеч. ред. 171
К интерпретации Е (X) можно подойти и с несколько иной точки зрения: эта величина определяет координату х центра «формы» р (х). Говорят также, что Е (X) есть первый момент распределения. Примеры w 1. Найти Е (X) для эксперимента «бросание правильной игральной кости и наблюдение выпавшей грани». Решение Выборочное пространство X = {1, 2, 3, 4, 5, 6}. Функция плотности вероятности р (Х) = {1/6, 1/6, 1/6, 1/6, 1/6, 1/6}. Тогда р = Е (X) = 1 • 1/6 + 2 • 1/6 + 3 1/6 4-4- 1/6 4-5- •1/64-6-1/6 = 3,5. 2. Некое лицо держит пари о появлении (или непоявлении) события Е, шанс наблюдения которого равен 25%. Лицо платит 1 фунт стерлин- гов в случае, если событие Е появляется, и получает 2 фунта стерлин- гов, если оно не появляется. Требуется найти ожидаемый выигрыш. Решение Выборочное пространство (возможные выигрыши в фунтах стер- лингов) X = {2, — 1}. ( 1 3 1 Функция вероятностей р (X) = j J . Тогда Е(Х) = 2-4- + (-1)~=—Г’ 4 4 4 Эта величина может служить мерой справедливости пари. Мы говорим, что пари справедливое, если Е (X) = 0. Если для некоторой азартной игры Е (X) > 0, то игру называем «выигрышной». Результат этого примера можно интерпретировать следующим об- разом. Если лицо будет заключать такое пари много раз, то его проиг- рыш составит в среднем 0,25 фунта стерлингов на одну игру. Очевидно, что такая игра не будет «выигрышной». 3. Случайная переменная X имеет ф. п. в. р (х) = 3/8 (5—4х 4-х2), 1 х 3. Нарисуйте график распределения и найдите Е (X). Решение. Распределением будет часть параболы (рис. 84). Из симметричности распределения очевидным образом следует, что Е (X) = 2. С другой стороны, по определению найдем: Е (X) = С хр (х) dx = — \ х (5—4х + х2) dx = 2. i 8 i ' 172
Упражнение 2.4.4 Найдите E (X) для следующих распределений вероятностей: (1) X = {1, 2, 3, 4}, ( 1 1 1 1 ] Р(Х)=|Т’ Т’ Т' (2) X = {л:х С (1.2)}. 2 / 9 \ pW=T7-2«. ’ < х < 2- О \ Z / б) Математическое ожидание Хг. Через Е (Хг) мы обозначим мате- матическое ожидание r-й степени X; определим его как (1) ^хг р{х) s или (2) j" xr p (x) dx. s Эту величину можно назвать r-м моментом распределения. Мы уже рассматривали случай г = 1, т. е. Е (X). Очень часто нам будет требо- 1 ваться вычислить Е (X2). в) Математическое ожидание любой функции X. Аналогично мож- но определить математическое ожидание любой функции f (X). Положим: (1) £[f(X)J = Sf(x)p(x) S или (2) £[f(X)] = J/(x)p(x)dx. з В частности, определив математическое ожидание функции f (X) ~ = (X — р)2, где р = Е (X), мы получим величину, которая назы- вается дисперсией. Эту величину обозначим Var (X). Таким образом: Var (X) = Е [ (X — р)2] = у (х — р)2 р (х)* (дискретный случай), Var (X) = [ (х — р)2р (х) dx (непрерывный случай), з Отметим тесную связь между этой величиной и выборочной диспер- сией з2, определенной в гл. 2.3. Значение з2 дает меру разброса наблю- дений выборки около среднего х, a Var (X) будет мерой разброса всей совокупности около среднего р. Для Var (X) часто будет употребляться символ о2. Квадратный ко- рень из Var (X) называется стандартным отклонением совокупности. Итак, S. D. (X) = VVar(X) = cr. 173
Теорема. Var (X) = Е [(X — р)* 2] = Е (X2) — р2. Доказательство (непрерывный случай): Е [(X—р)2] = j (х—р)2 р (х) dx = J (х2—2рх + р2) р (х) dx = S S = Jx2p(x)dx — 2р J xp(x)dx + p2y p(x)dx = £(X2)— 2р-р + s s s + р2-1=£(Х2) — р2. Доказательство для дискретного случая аналогично, при этом ис- пользуется операция S. Примеры 1. Для распределения вероятностей X = {0, 1, 2}, р (X) = {-у , , 4}най™ (2)£(*2). (3) Е [(Х-р) ] и (4)£[(Х—р)21. Решение (1) £(Х) = 2х.р(х) = 0-4+1-4 + 2-4-=Т( = И)' (2)£(X2) = Sx2.p(x) = 02-4 + l2~ + 22-T = T- (3) Е [(Х-р)] = S (х-р) р (х) = ( - AV _L + _|_з + \ О / Z о о (Замечание. Е ! (X — р) 1 = Е (X) — Е (р) = р — р = 0.) (4) Е [(Х-р)2] =.S (х-р)2 р (х) = -g-. А. + ±-.А + 121 1 _ 31 64 ’ 8 — 64 (Замечание. По теореме Е [ (X — р)2] = Е (X2) — р2 = - 25 _ 31 \ 64 ~ 64 • ) 2. Для случайной переменной с ф. п. в. р (х) = -у(-у х + 1) , 0 < х < 2, найдите (1) Е (X), (2) Е (X2), (3) Var (X), (4) S. D. (X). Решение (1) Е(X) = f хр(х) dx = (4 х2 + x'j dx = t) О i) \ S 0 2 (2) £(X2)=4^4x3 + x2)dx = 4-. 0 174
(3) Var(X) = E(X^ = ^-4|L = ^-( = o2). (4) S. D. (X) = V'Var(X) = 1/ — --= 0,845 (= a). Упражнение 2.4.5 1. Для распределений вероятностей (а) X = {0,1}, (б) X = {0,1}, (в) X = {0, 1, 2}, ПИ 1131 11111 ₽М=(?т): ₽(X)=U’7}’’ pW=|??i| найти (1) Е (X) = р, (2) Е (X2), (3) Е [(X — р)2] = о2, (4)5 (X3). 2. Непрерывная случайная переменная X имеет функцию плотности вероят- ности, равную константе С на интервале 1 < х < 4 и нулю—вне его. Нарисуйте график распределения и найдите значение С. Найдите также (1) Е (X), (2) Е (X2), (3)о2. Вычислите (4) Р (х < 3) и (5) Р (2 < х < 4). 3. Значения непрерывной случайной величины X лежат на интервале 0 < <~х < 2. Ее ф.п.в. равна С (2х + 1). Нарисуйте график распределения и найди- те значение С. Определите (1) Е (X), (2) Е (X2) и (3) Var (X). 4. Продавец мороженого в солнечный день может заработать 6 фунтов стер- лингов, а в дождливый день — 2 фунта стерлингов. Чему равна ожидаемая вы- ручка от дневной продажи мороженого, если вероятность того, что день окажется дождливым, равна 0,35? 5. Вычислите среднее, дисперсию и S.D. для каждого распределения в за- даниях 1—4 упражнения 2.4.1. 6. Вычислите среднее, дисперсию и S.D. для каждого распределения в зада- ниях 1—3 упражнения 2.4.2. 7. Покажите, что для любого распределения (1) Е (сХ) = »Е (X), (2) Е [cf (X)] = сЕ[ f (X)], (3) Е ЦаХ + &)] = аЕ (X) + Ь, (4)5 [(X - р)3) = = 5 (X3) — Зр5 (X2) + 2р3 (а, Ь, с — константы). 8. Из урны, содержащей 6 синих шаров и 4 красных, случайным образом вы нимают 3 шара. Пусть X — случайная переменная, которая равна общему числу синих шаров, содержащихся в одной выборке. (а) С помощью прямоугольной таблицы выпишите распределение вероятно- стей для X в случаях, когда: (1) шары вынимаются без возвращения; (2) выборка производится с возвращением. (б) Вычислите среднее, дисперсию и S.D. для каждого из распределений, най- денных в (а). 9. Выполните задание 8 в предположении, что урна содержит: (1) 3 синих шара и 7 красных; (2) 5 синих и 5 красных. 10. Случайная переменная X имеет распределение вероятностей Х={0, 1}, р(Х)={9, р}. Покажите, что р = р, о2 = pq, Е (Хг) — р, 5 [(X — р)3] = pq (q — j»). 11. Рассмотрим случайную переменную X со средним р и S.D. = о. Величи- на Z = (X — р)/о называется стандартизированной случайной переменней. Пока- жите, что 5 (Z) = 0, Var (Z) = 1. 2.4.5. НЕКОТОРЫЕ СТАНДАРТНЫЕ РАСПРЕДЕЛЕНИЯ Статистики, а фактически все исследователи, работа которых тре- бует применения теории вероятностей, сталкиваются с большим много- образием вероятностных распределений. Они встречаются при исполь- 175
зовании уже изученных статистических тестов, а также при разработке новых, при экспериментальном изучении случайных переменных или при подборе подходящей вероятностной модели. Существует небольшое число распределений, возникающих в уди- вительно большом числе ситуаций. Функции этих распределений, их графики и свойства будут впоследствии нами изучены. В табл. 1 приведены названия и функции плотности вероятности трех наиболее часто встречающихся дискретных распределений. В этой же таблице даны их средние и дисперсии. За таблицей идут упражнения, помогаю- щие ближе познакомить читателя с формами распределений и их свой- ствами. Далее, в табл. 2, таким же образом приведены три наиболее важных непрерывных распределения. Более детальное обсуждение биномиального и нормального распре- делений — в 2.4.6. а) Важнейшие дискретные распределения Таблица 1 Три дискретных распределения Название Функция плотности вероятностей р(х) Параметры и возможные значения Среднее Е(Х) Дисперсия Var(X) Биномиальное (”) pxqn~x, х = 0.1,..., п 0 в других случаях (? = 1—р) п (1, 2, ...) р (0<р<1) пр пр<7 Пуассоновское е~к —, х = 0,1, ... х! 0 в других случаях X (Х>0) к к Г еометрическое р-9*~*, х = 1,2,... 0 в других случаях (9= 1—Р) р (0 < р < 1) 1 р q pi Упражнение 2.4.6 Замечание. Для некоторых из следующих заданий читателю буд^т очень полезно воспользоваться таблицей логарифмов факториалов. 1. Для биномиального распределения (а) Напишите функции плотности вероятностей для случаев: (I) п=3, р=~; (2) п=б, р = ~; о 2 (3)п=15, (4)П=1О, Р = (б) Для случаев (1) и (2) вычислите значения функции плотности вероятности для всех возможных значений х (т. е. для х = 0, 1, 2, 3 в (1) и х = 0, 1, .... 6 в (2)). В каждом случае проверьте, что Sp (х) = 1. Нарисуйте прямоугольную диаграмму для этих двух распределений вероят- ностей. Вычислите среднее и дисперсию в соответствии с их определениями; проверь- те ваши результаты значений средних и дисперсий по формулам, приведенным в табл. 1. 176
(в) Вычислите значения р (х) при х = 0, 6, 9, и 14 для случаев (3) и (4). Найдите по формулам среднее и дисперсию распределения. (г) Для случаев (3) и (4) напишите отношение р (х + 1)/р (х) и по возможности упростите полученный результат. Воспользуйтесь результатами и вероятностями, найденными в (в) для получения значений р (х) при х = I, 7, 10 и 15. (д) Найдите общую формулу для р (х + 1)/р (х). (е) Разложите биномы по степеням: (1) (3) (р+д)”- Сравните члены разложений (1) и (2) с вероятностями, найденными в (а). Как вы думаете, почему биномиальное распределение назвали именно так? п (ж) С помощью результатов задания (е) докажите, что У, р (х) = 1 для всех х=0 допустимых в биномиальном распределении значений вероятности. 2. Для пуассоновского распределения (названо в честь С. Д. Пуассона (S.D. Poisson), французского математика, 1781—1840) (а) напишите функцию вероятностей для случаев; (1) X = у, (2) Л = 3, (3) Л = 1,5; (б) получите формулу для р (х + 1)/р (х) в случаях (1)—(3) из (а); найдите общую формулу для этого отношения; (в) найдите первые шесть членов в каждом случае из (а). Сравните их с соот- ветствующими членами распределений (1), (2) и (3) задачи 1 (а). Нанесите эти зна- чения на один график. (Заметим, что для любой пары сравниваемых распределе- ний пр = X.); ОО (г) выпишите несколько первых членов ряда 2 р (х). Покажите, что значение х = 0 этого ряда равно ё~откуда и следует, что суммарная вероятность равна 1 для любого Л; (д) проверьте, что в общем случае р = 2хр (х) — 'k. 3. Для геометрического распределения (а) вычислите несколько первых членов распределения, для которого: 1113 (1)р=—, (2)р=—, (3)р=у, (4) р = — . ОО Нарисуйте график распределения. В каждом случае найдите Sp (х); Х=1 оо (б) в общем случае покажите, что 2р (х) = 1; 4 х=1 (в) проверьте формулу для среднего и дисперсии в общем случае; d ( s \ (Замечание. — | --------1 = 1 + 2s + 3s2 + ...) as \1 —s / (г) правильная игральная кость бросается до тех пор, пока не появится шес- терка. Пусть х —число необходимых для этого бросаний (считая и бросание, в ко- тором выпала шестерка). Покажите, что геометрическое распределение представ- ляет собой подходящую вероятностную модель для этого эксперимента. Найдите среднее и дисперсию необходимого числа бросаний. 177
б) Важнейшие непрерывные распределения Таблица 2 Гри непрерывных распределения Название Функция плотности вероятности Р (X) Параметры и возможные значения Среднее Диспер- сия Равномерное или прямо- угольное Ь—а ’ а<х<Ь’ 0 в других случаях a, b‘t (а, Ь) — любой интервал на оси действи- тельных чисел а-|- 6 2 (6—а)2 12 Экспонен- циальное •Ке~Кх, х>0 0 в других случаях X (7.>0) 1 X 1 7.2 Нормальное Или гаус- совское 1 I 1 / *—н\2 j oV-2SeXP| - 2\ а )]’ ОО X <С4~ оо pt, и, — ОО у -|- оо О>0. О2 Упражнение 2.4.7 1. Для равномерного распределения (а) нарисуйте график распределения для случаев: (1) а = 1, b = 3; (2) а = —1, 6 = 3; (3)о = 0, 6 5. Найдите в каждом случае среднее и дисперсию; ' (б) проверьте формулу для вычисления среднего и дисперсии в общем слу- чае. Вычислите Е[(Х — р)8] и Е[(Х — р)4|; (в) на стол с радиусом г падают капли дождя. Пусть х — расстояние от места падения капли до центра стола. Найдите удовлетворительную ф.п.в. для вели- чины х. 2. Для экспоненциального распределения (а) вычислите значение р (х) для х = 0, 1, 2, 3 в следующих случаях: (1) X = 1/2, (2) X = 1, (3)2. = 10. Нарисуйте график этих трех распределений. Определите среднее и дисперсию для каждого случая; (б) чему равен максимум значения р (х) и где он достигается? Покажи гй, что на этой кривой нет точки перегиба; (в) проверьте общую формулу для среднего и дисперсии. 3. Для нормального распределения (а) исследованием ф.п.в. установите, что кривая симметрична относительно прямой х = р; (б) напишите ф.п.в. для случая р = 0, о = 1. Эта функция известна’как стандартная нормальная ф.п.в. С помощью следующей таблицы с ординатами стандартной нормальной кривой постройте ее график: X 0,0 0,2 0,4 0,6 0,8 1,0 1,5 2,0 р(х) | 0,40 0,39 0,37 0,33 0,29 0,24 3 0,13 0,05 (в) следующий интеграл очень важен, его следует запомнить: СО Р / 22 \ __ I exp I — — I dz= Д/2л. 178
С помощью этого интеграла проверьте, что р, и о2 действительно будут средним и дисперсией в общем случае; (Замечание. Воспользуйтесь стандартизирующим преобразованием 2 = (Х — Ц)/О.) (г) приравнивая нулю вторую производную р (х), покажите, что на кривой имеются две точки перегиба х = ±о. в) Полезное обозначение для функций плотности вероятности. Как уже заметил читатель, функции плотности вероятности могут со- держать параметры. Форма и расположение распределения зависят от их конкретных значений. Если такую зависимость от параметров необходимо подчеркнуть и чтобы выделить случайную переменную, удобно пользоваться следующим обозначением для функции плотно- сти вероятности: X сп р (х; а, Ь, с, ...). Эта запись означает, что X «распределено» с ф. п. в. р ( ), перемен- ной является х, а параметрами будут а, Ь,с, ... Параметры распределе- ния записывают буквами после точки с запятой. Часто вместо буквы р для обозначения ф. п. в. употребляют другую, более подходящую по смыслу букву. То же относится и к кумулятивной функции распре- деления. Примеры 1. Биномиальная случайная переменная X cv> b (х; п, р). 2. Пуассоновская случайная переменная X се р (х; X). 3. Нормальная случайная переменная X N (х; р, о2) или просто N (р, о2). 2.4.6. БИНОМИАЛЬНОЕ И НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ а) Биномиальное распределение. Это распределение часто возни- кает при решении практических задач. Иногда его называют также распределением Бернулли (по имени Якоба Бернулли, который открыл его в конце XVII в.). Это распределение возникает естественным образом как вероятно- стный закон последовательности независимых испытаний Бернулли. Испытание Бернулли—это эксперимент, имеющий только два возмож- ных исхода. Как правило, их обозначают буквами S (успех) и F (не- успех). Такие последовательности экспериментов нам уже встречались в гл. 2.1 при определении вероятностей на произведениях пространств. Следующий пример поможет читателю выяснить некоторые важные детали. П р и м е р. Правильную игральную кость бросают 3 раза. Пока- зать, что вероятность получения х = 0, 1, 2, 3 шестерок при трех ис- пытаниях подчиняется биномиальной ф. п. в. (ЗУ. I 1 V / 5 V-* гъ- / 1 V /' 5 ( J (?) (?( ИЛЙ С5 (?) (?) • 179
Решение. Обозначим через S выпадение шестерки в одном испыта- нии, а через F — непоявление шестерки (т. е. F означает выпадение 1, 2, 3, 4 и 5). Выборочным пространством для каждого испытания будет U = {S, F); функция вероятностей р (U) = {1/6, 5/6}. С помо- щью стрелочной диаграммы мы сейчас попытаемся на каждом шаге проиллюстрировать все возможные результаты и соответствующие ве- роятности для трех испытаний (рис. 85). Каждый из восьми объединенных результатов (SSS), (SSF) и т. д. будет точкой произведения пространств Us — U X О X U', поэтому соответствующая вероятность получается умножением вероятностей на каждой ветви, приводящей в точку произведения пространств. Таким образом, Р {(SSS)} = 1/6 • 1/6 • 1/6 = (1/6)3, Р {(SSF)} = (1/6)2х X (5/6)1 и т.д. Исследуем теперь число успехов х, появившихся в трех ис- объеди- Испытания ценный первое второе третье результат Рис. 85 Вероят- выпаданий ность шестерок х 3 РМ’ 2 I'M 2 ('/оУР/вУ 7 Г/вУР/в)' 2 ('/вУР/б)г 7 У/вУР/вР 7 W3 О пытаниях. Как видим, х — 3 только в том случае, когда появляется со- бытие {(SSS)}. Таким образом, Р (х = 3) = Р {(SSS)} = (1/6)3. Собы- тие же х = 2 наступает только при появлении одного из соЗытнй {(SSF)}, {(SFS)} и {(FSS)}. Каждое из этих одноточечных событий имеет вероятность, равную (1/6)2 (5/6)1. Применяя правило сложения- вероятностей, получаем: Р (х = 2) => 3 (1/6)2 (5/6)1. Аналогично най- дем: Р (х = 1) = 3 (1/6)1 (5/6)2 и Р (х = 0) = (5/6)3. Как уже, наверное, читатель заметил, что вероятности будут члена- ми биномиального распределения, которые получаются при разложе- нии бинома (1/6 + 576)3. Упражнение 2.4.8 Для каждой из предлагаемых задач нарисуйте стрелочную диаграмму и вы- числите необходимые вероятности. 1. Правильная монета бросается 6 раз. Чему равны вероятности получить (1) ровно 2 герба, (2) меньше чем 2 герба, (3) больше чем 2 герба, (4) не меныпё чем 2 герба, (5) по крайней мере 2 герба? 2. Шанс А выиграть в одной игре с В равен 2/3. Найдите шанс А выиграть у В в матче из 5 партий (1) ровно 1 раз, (2) по крайней мере 2 раза, (3) ровно 3 ра- за, (4) больше чем 3 раза. I Для решения следующих задач примените формулу биномиального распреде- ления. 180
3. Из колоды 52 хорошо перетасованных карт случайным образом с возвра- щением вынимаются восемь карт. Найдите вероятность того, что среди выбран- ных карт будет 6 червей. 4. Одновременно бросают восемь правильных монет. Покажите, что вероят- ность получения по крайней мере шести гербов равна 37/256. 5. 20% болтов, производимых машиной, оказываются дефектными. При ус- ловии, что случайным образом выбираются 4 болта, найдите вероятности того, что дефектными окажутся (1) 0, (2) 1, (3) 2 или больше болтов. 6. Чему равна вероятность при семи бросаниях пары игральных костей полу- чить в сумме 7 очков (1) дважды, (2) по меньшей мере один раз, (3) больше чем 3 раза. 7. Имеются 200 семей, в каждой по 4 ребенка; каково ожидаемое число се- мей, имеющих (1) трех мальчиков, (2) двух мальчиков и двух девочек, (3) одну девочку, (4) двух пли трех мальчиков? (Примите, что вероятность рождения мальчика равна 1/2.) 8. Вероятность для стрелка, стреляющего по мишени, попасть в «яблочко» равна 1/4. Если стрелок делает 5 выстрелов, найдите вероятности попасть в «яб лочко» (1) 3 раза, (2) больше чем 3 раза, (3) по крайней мере 1 раз. 9. Известно, что для некоторой группы людей 20% из них имеют голубые глаза. При условии, что делается случайный отбор 10 человек, найдите вероят- ности того, что в выборке окажется (1) 4, (2) не меньше 1, (3) по крайней мере 2, (4) меньше чем 3 человека с голубыми глазами. 10. Найдите среднее и дисперсию для каждого из биномиальных распределе- ний в задачах 1—9. ОБЩИЕ РЕЗУЛЬТАТЫ (1) Пусть выполняются п независимых испытаний Бернулли с Р (S) = р, Р (F) = q, р + q = 1 для каждого испытания. Тогда вероятность получения х .успехов и п — х неуспехов в п испытаниях равна Ь(х\ п, р)=~-^П^рх qn~x, х = 0, 1,..., п. Доказательство. Выборочное пространство для каждого испытания будет U — {S, /’}, а каждый возможный результат в п ис- пытаниях является точкой в произведении пространств Un = U X X U X ... X U. Каждая точка из этого пространства имеет вид (SSFS... SF), т. е. каждая координата равна либо S, либо F. Событие Е = «появление х успехов» есть подмножество точек из Un, которое содержит ровно х букв S и и—х букв F. Число таких точек равно числу способов распределения букв S средн п координатных по- зиций. Таким образом, событие Е содержит точек в произведении пространств Un. Предположим, что (SSFS... SF) представляет собой точку этого подмножества. Поскольку испытания независимы, то вероятность, ко- торую мы приписываем этой точке, равна Р (S) Р (S) • Р (F) X X Р (S) • ... • Р (S) • Р (F) = р • р • q - р • ... • р q = рх • qn~x. Каждая точка в Е имеет эту же вероятность; по правилу сложения вероятностей мы получим: Р(Е)= (n^pxqn~x = b(x; п, р). 181
(2) Члены биномиального распределения являются коэффициентами при t разложения производящей функции вероятности (q + pf)n. Доказательство. Раскладывая функцию по биномиально- му закону, получим: (g+ pt')n = qnp°t° + ( J'T"-’ Plfl+ ••• + n X q'l-x pxtx+ ...-\-q°pntn. Как видим, коэффициент при tx для х = 0, 1, 2, п будет ра- вен b (х; п, р). Замечание. Это первый пример с производящей функцией. Эти функции играют большую роль в более серьезных курсах теории. (3) Среднее и дисперсия биномиального распределения равны соот- ветственно пр и npq. Доказательство. Эти результаты можно получить с по- мощью производящей функции вероятности следующим образом: п н= 2 х-р (х) = [-4(9 + рОп1 L at Jt = l о2= у х2-р(х)— р2 = /• —+ —п1 p2----npq. dt j J г = i Читатель может применить метод дифференцирования рядов для проверки результатов, полученных в (2). Упражнение. С помощью метода производящей функции покажите, что Е [(X — р)3] = npq (q — р). Отсюда следует вывод о симметрии распределения при р = q. б) Нормальное распределение. Это распределение наиболее важное как в статистической теории, так и на практике. Распределения боль- шинства случайных переменных реальных экспериментов хорошо при- ближаются к нормальной кривой. Такими хорошо известными экспе- риментами, например, будут: рост людей, ошибки в наблюдениях при экспериментальном измерении, измерения большинства характеристик живых организмов. Результат, известный под названием центральная предельная теорема, помогает объяснить, почему это распределение так часто появляется в статистической работе. Этот результат говорит о том, что многие распределения при определенных условиях прибли- женно такие же, как и нормальное распределение. Эта теорема, а также следствия из нее кратко обсуждаются в гл. 2.6. (1) График стандартной кривой. Общая нормальная ф. п. в. была дана в 2.4.5 (см. табл. 2). Если переменная X имеет среднее р и диспер- сию о2, то »<*<+»• 182
Выразим переменную в стандартных единицах, используя для этого преобразование1 z = (х — р)/о. Мы получим стандартное нормальное распределение с ф. п. в. *и“Йехр(_1г')’ — оо < г < ф-оо. Небольшая таблица значений этой функции была дана в задании 3 упражнения 2.4.7. Нанеся значения z и ф (г) в прямоугольной системе координат, мы получим график этого распределения (рис. 86). Заметим, что вершина, через которую прохо- дит ось симметрии кривой, находит- ся в точке z = 0. (2) Площади под стандартной кривой. Если случайная перемен- ная X подчиняется нормальному закону, то вероятность события «X лежит между а и 6» определяется площадью под кривой между дву- мя значениями координат х = а и х = Ь. Нам часто в статистической работе будет нужно находить та- кие площади; для этого мы будем Рис. 86. График стандартной нор- мальной кривой пользоваться таблицей интегралов нормальной ф. п. в. Следующие величины полезно помнить для практического приме- нения, соответствующие границы показаны на графике, приведенном на рис. 86. (а) 68,3% нормального распределения лежит между — 1 и + 1. (б) 95,4% распределения лежит между — 2 и 4-2. (в) 99,7% распределения лежит между — 3 и 4- 3. Интеграл оо J ехр ——-'j dz=V2n — оо также необходимо запомнить* *. (3) Моменты нормального распределения. Первый момент распре- деления равен его среднему [г. 1 Это преобразование выбирается в результате приравнивания р (х) dx и р (z) dz, при этом dx = adz. z * Таблицы составляются для значений интеграла 1/ ]/2л j ехр (—х2/2) dx, о которые в дальнейшем обозначаются ф (г). Если с помощью этих таблиц необ- ходимо найти площадь под кривой, проходящей над точкой г = 0, то соответ- ствующий интеграл разбивается на сумму двух интегралов (см. пример 1).— Примеч. ред. 183
ПосколькуТраспределепне симметрично относительно х = ц, все нечетные моменты, подсчитанные относительно р, будут равны нулю. Для четных моментов, вычисленных относительно среднего, можно воспользоваться интегрированием по частям, которое приводит к сле- дующей рекуррентной формуле: р2п = (2 п — 1) о2 • р2я-2- Подставляя п = 1, 2, 3 и т. д., получим все четные моменты. Теперь приведем примеры вычислений, связанных с нормальным распределением и таблицами интегралов. Примеры 1,1. Было обнаружено, что оценки, полученные на экзамене большой группой студентов, подчиняются приближенно нормальному закону. Среднее распределения оказалось равным 58, а стандартное отклоне- ние — 10. Рис. 87. Нормальная кривая относительных частот оценок л:=58, s=10 (а) По данной информации нарисуйте график распределения. (б) Переведите следующие оценки в стандартные единицы: 63,41, 58. (в) Переведите следующие стандартизированные оценки в первона- чальные: 2,9; —1,5; 0. (г) При условии, что из группы случайным образом выбирается один студент, найдите вероятность того, что его оценка будет (1) в точности 68, (2) меньше чем 63, (3) больше 41, но меньше 63. Решение. (а) Нам известно, что распределение приблизительно совпадает с нормальным, поэтому оно будет симметричным относительно ор- динаты среднего х = 58. Практически все оценки будут лежать между ординатами х = х — 3s и х = х + 3s, т. е. между х = 28 и х — 88. График кривой оценок показан на рис. 87. (б) Для перевода реальных оценок в ^стандартизированные мы воспользуемся преобразованием z = (х — x)/s. На приведенном гра- фике шкала стандартизированных оценок показана под шкалой реальных оценок. Указанные в задании оценки после преобразова- ния будут равны: 63 —58 п г- Z. =-------= 0,5; 1 10 184
41—58 , _ z2 = —— = — 1,7; 2 10 58—58 n z4 ----------- 0. 3 10 (в) Для обращения стандартизированных оценок в реальные мы должны произвести обратное преобразование, т. е. х = х + s • z: х2 = 58—15 = 43; х3 = 58 4- 0 = 58. (г) (1) Если бы данные были действительно непрерывными, то ве- роятность получить оценку, в точности равную 68, была бы равна нулю. Однако оценки обычно берутся на дискретной шкале 0, 1, 2, ..., 100 и непрерывное нормальное рас- пределение будет только ап- проксимацией истинного ди- скретного распределения, оп- ределенного на этой шкале. Таким образом, Р (х = 68) приближенно можно выра- зить площадью под нормаль- ной кривой между значения- ми координат х = 67,5 их — 68,5, как показано на рис. 88. Для того чтобы вычислить эту вероятность, необходимо сначала перевести по- лученные пределы в стандартные единицы; они легко находятся и бу- дут равны 0,95 и 1,05. Тогда Р (х = 68) » Р (0,95 1,05) = Ф (1,05) — Ф (0,95) = 0,3531 — — 0,3289 - 0,0242. Замечание. В случае, когда исходные данные дискретны или когда непрерывные данные были округлены, пределы для вычисления интеграла вероятности должны быть найдены таким же образом. (2) Требуемая вероятность будет численно равна площади под нор- мальной кривой между — оо и 63,5 (обратите внимание на верхний предел,’ смЛрис. 89). Преобразуя эти пределы в стандартные единицы с помощью таблицы нормального интеграла, (мы найдем,'^что интере- сующая нас площадь будет равна 0,5 + Ф (0,55) = 0,7088, таким образом, Р (х С 63) « Р (z < 0,55) = 0,7088*. * Обратите внимание, что] Р (г С 0) = G,5, поэтому Р (г < 0,55) = Р (г < 0) Т Ф (0,55) == 0,5 + 0,2088 = 0,7088. — Примеч. ред. 185
(3) На этот раз нам необходимо найти площадь в пределах х = 40,5 их — 63,5 (рис. 90). Переводя эти пределы в стандартные единицы, получим, что они равны соответственно — 1,75 и 0,55. Далее имеем Р (41 С х С 63) « Р ( — 1,75 С г С 0,55) = Ф (0,55) + Ф ('— 1,75) Таблицы дают значения Ф (г) только для г > 0. Однако легко видеть, что в силу симметрии кривой ф ( _ г) = ф (г). Поэтому необходимая вероятность будет равна Р (41 < 63) = Ф (0,55) + Ф (1,75) = 0,2088 + 0,4599 = 0,6687. 2. Средний рост 1000 солдат равен 1,81 м со стандартным отклоне- нием 50 мм. Измерения производились с точностью до 10 мм. Предпо- Рис. 90 ложив, что рост подчиняется нормальному распределению, оцените число солдат в группе, рост которых (1) больше или равен 1,87 м, (2) лежит между 1,72 м и 1,80 м. Решение (1) Поскольку измерения были округлены (до ближайших 10 мм), нам требуется найти число солдат, рост которых равен 1,865 м и больше. Переводя 1,865 м в стандартные единицы, мы получим: t 1,865—1,81 . . г =----------=1,1. ' 0,05 Из рис. 91 видим, что доля солдат с ростом не меньшим чем 1,87 м будет равна 0,5 — Ф (1,1) = 0,5—0,3643 = 0,1357. Таким образом, среди 1000 солдат ожидаемое число солдат с инте- ресующим нас ростом будет равно 0,1357 • 1000 « 136. (2) Доля солдат с ростом между 1,72 м и 1,80 м численно будет рав- на площади под нормальной кривой между 1,715 м и 1,805 м (рис. 92). Стандартизированные пределы равны — 1,9 и — 0,1, а искомая шки щадь показана на графике. Таким образом, доля солдат с ростом меж- ду 1,72 м и 1,80 м будет равна Ф (1,9) — Ф (0,1) = 0,4713—0,0398 = 0,4315. ’86
Число солдат в группе с ростом между указанными пределами (если их распределение по росту нормальное) будет равно 0,4315 х X 1000 « 432. Рис. 92 Упражнение 2.4.9 1. Распределение оценок на экзамене по математике приближенно совпадает с нормальным распределением со средним 50 и стандартным отклонением 12. (а) Нарисуйте кривую распределения, (б) Стандартизуйте следующие оцен- ки: 25, 73, 41, 50, 62 и 38. (в) Переведите следующие стандартные оценки в реаль- ные: 1; 3,2; —0,5; —0,75; 0 и 2,2. (г) С помощью таблиц найдите вероятность того, что студент получит (1) меньше 40 баллов, (2) больше 56, (3) его оценка будет лежать между 50 и 60 баллами, (4) равна 45. (Замечание. Прежде чем пользоваться таблицами, читателю рекомен- дуется нарисовать от руки график распределения, найти и заштриховать необ- ходимую площадь.) 2. В нормальном распределении со средним 5 и S.D., равным 2, найдите (а) значение х, для которого 40% значений не превышают его, (б) значение х, такое, что вероятность попасть в интервал (4, х) равна 0,53, (в) значение х, для кого рого площадь над интервалом (х, 6) равна 0,58. 3. Было установлено, что длина среднего пальца руки мужчины для некото- рой группы людей подчиняется нормальному закону со средним 60 мм и стандарт- ным отклонением 3 мм. Измерения проводились с точностью до 1 мм. Предполо- жив, что в группе 800 человек, найдите, у скольких из них средний палец (а) длиннее 62 мм, (б) короче 57 мм, (в) длиной между 60 мм и 66 мм, (г) длиной 58 мм. 4. Допустим, измерения нормально распределены. Чему равен процент из- мерений, отличающихся от среднего (а) больше чем на одну четверть стандарт- ного отклонения, (б) меньше чем на половину стандартного отклонения? 5. Нормальное распределение имеет среднее 15 и S.D., равное 3. Найдите площади под кривой между следующими парами координат: (а) х = 15 и х = 16; (б) х = 13 и х = 15; (в) х = 12,6 и х = 16,4; (г) х = 9 и х = 21. 6. В нормально распределенной совокупности 15% значений х меньше 12 и 40% значений х имеют значения, большие 16,2. Найдите среднюю и стандарт- ное отклонение распределения. 7. При условии, что 49% значений нормально распределенной совокупности лежит между средним, равным 83, и значением х = 99, найдите стандартное от- клонение совокупности. . 8. Коробки с шоколадом упаковываются автоматически; их средний вес равен 1,06 кг. Если только 5% коробок имеют вес меньше 1 кг, найдите стан- дартное отклонение, предполагая, что вес коробок распределен нормально. 187
2.4.7. СВЯЗЬ МЕЖДУ БИНОМИАЛЬНЫМ , ПУАССОНОВСКИМ И НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЯМИ Существует несколько замечательных соотношений (очень полез- ных на практике), связывающих между собой биномиальное, пуас- соновское и нормальное распределения. Можно показать, что при не- которых условиях на пир пуассоновское распределение представимо предельной формой биномиального распределения, а нормальное рас- пределение получается из каждого из этих двух распределений. а) Получение пуассоновского распределения из биномиального. Покажем, что биномиальная функция вероятностей b (х; п, р) стремит- ся к пуассоновской функции вероятностей р (х; X) при неограниченном увеличении п и одновременном стремлении р к нулю, причем пр остает- ся постоянным числом (равным X). Так как пр = X, то , , . । п\ г/. х п (п—1).. .(п—х-р 1)/X \* , . X о(х; п, р) = рл(1—р) = — -----------— ---------- — 1 —— I \ х ) х! \ П J \ П J (подстановка р = X/n, X — константа). Правую часть последнего равенства можно представить в виде Устремляя п к бесконечности, мы видим, что первый член в произве- дении стремится к е~\ второй остается постоянным и равным Х-*7х! (х — считается фиксированным целым), а все оставшиеся сомножите- ли (их конечное число) стремятся к 1. Таким образом, предел b (х; п, р) равен е~к Х*/х1, а это и есть р (х; X). Пуассоновская функция вероятностей вычисляется в общем слу- чае значительно легче; проще ею оперировать и с математической точки зрения. Поэтому важно установить условия, при которых вмеЬго биномиальной функции можно приближенно рассматривать пуас- соновскую. Положительный ответ будет в случае, если р достаточно мало (на- пример, меньше чем 0,1), а п достаточно велико (скажем, больше 50), откуда пр 5, т. е. при этих условиях вместо биномиальной функции приближенно можно рассматривать пуассоновскую (с X = пр). Эти условия, разумеется, не являются абсолютно точными, однако если они выполняются, то приближение будет очень хорошим. Вместе с тем в зависимости от специфических целей исследования можно вос- пользоваться такой аппроксимацией и для п < 50. Чтобы оценить, насколько хороша будет аппроксимация в случае достаточно редких событий (т. е. когда р мало), сравните значения функций b (х\ 20; 0,05) и р (х; 1) в табл, на с. 189. б) Получение нормального распределения из биномиального (и пуассоновского). Пусть X будет биномиальной случайной перемен- ной с параметрами п и р. Можно показать, что если п достаточно вели- ко и ни р, ни (1 — р) не очень малы, то распределение X хорошо ап- 188
X Распределения X Распределения биномиальное /9=0,05, н —20 пуассоновское Х=1 биномиальное р=0,05, п — 20 пуассоновское К = 1 0 0,3585 0,3679 5 0,0133 0,0153 1 0,3774 0,3679 6 0,0022 0,0031 2 0,1887 0,1839 7 0,0003 0,0005 3 0,0596 0,0613 8 0,0000 0,0000 проксимируется нормальным распределением, имеющим стандартизи- рованную переменную Z = (X — np)P/npq. Этот результат представ- ляет собой одну из форм центральной предельной теоремы; доказатель- ство этого утверждения можно найти в [13]. С увеличением п аппрокси- мация улучшается и в пределе она становится абсолютно точной. В качестве практического руководства можно сказать, что если и пр, и п (1 — р) больше 5, то соответствующая нормальная функция будет очень хорошим приближением к биномиальной. Наконец, поскольку пуассоновское распределение может быть по- лучено из биномиального (см. 2.4.7, а) ), то между пуассоновским и нормальным распределением также существует аналогичная взаимо- связь. В самом деле, можно показать, что если X — пуассоновская переменная с параметром X, то при X -> оо распределение X будет стремиться к нормальному распределению, имеющему стандартизи- рованную переменную Z = (X — X)/VX. Примеры I. Некоторая сложная система состоит из 100 взаимосвязанных компонент. При условии, что каждая компонента имеет вероятность выйти из строя, равную 0,03, требуется найти вероятность того, что ровно четыре компоненты сразу выйдут из строя. Решение. Разыскиваемая вероятность определяется значением функ- ции b (х; п, р) при х = 4, п — 100, р = 0,03. Таким образом, Р [число вышедших из строя компонент равно 4] = ^4^ ' (0,03)4 (0,97)96 = = 0,171. Поскольку р < 0,1, и > 50 и пр </ 5, мы можем восполь- зоваться пуассоновским распределением как аппроксимацией к ис- ходному. Поэтому X4 Р [число вышедших из строя компонент равно 4] л; е~3 • = = 0,168, где X = пр = 3. 2. Предположим, что вероятность для некоторого орудия попасть в танк при одном выстреле равна 1/2. Требуется найти вероятность того, что при 10 выстрелах из орудия будут поражены ровно 4 танка. При этом используйте (а) биномиальное распределение, (б) нормаль- ную аппроксимацию. Полученные два результата сравните. Решение. При каждом выстреле вероятность успеха р = 1/2. 189
(а) биномиальное распределение: /10\ /1 V / 1 \6 Р [при 10 выстрелах будут подбиты ровно 4танка]=( 4 I I ~ I 1~1 = = 0,2051. (б) Нормальная аппроксимация. Нормальная кривая с р = пр = 5 и ст2 = npq = 2,5 показана на рис. 93. Мы будем рассматривать пло- щадь под этой кривой в промежутке между Хх=3,5 и х2 = 4,5 в качест- ве аппроксимации к биномиальной вероятности Ь (4; 10, 1/2).' Стандартизированные значения х будут следующими: 21 = .3’^ = —0,9486 и z2- 4,5Z.5 = —0,3162. /2.5 2 1/2,5 1 2 3 't 5 S 7 8 S JO X Числе подбитых танков Рис. 93 Поэтому Р [ровно 4 танка будут подбиты] ж Ф (z2) — Ф (zj = = 0,2038. Найденные значения очень близки, несмотря на небольшое значе- ние и, равное 10. Упражнение 2.4.10 _ 1. Некоторое произведете выпускает детали, 10% из которых дефектны. Производится случайная выборка 20 деталей. Найдите вероятности того, что в данной выборке окажутся бракованные детали: (1) 1, (2) 2, (3) меньше 4. Восполь- зуйтесь (а) биномиальным распределением, (б) его аппроксимацией пуассоновским распределением, (в) нормальным распределением. Сравните ваши результаты,- 2. Известно, что в среднем 3% электрических лампочек, производящихся некоторой фирмой, бракованные. Найдите вероятности того, что в выборке из 30 обследуемых лампочек будут бракованными (1) 0, (2) 1, (3) 2 лампочки. Эти вероятности вычислите с помощью биномиальной функции и соответствующего приближения пуассоновским распределением. Результаты сравните. 3. С помощью аппроксимации биномиального распределения нормальным найдите вероятности того, что в 80 бросаниях правильной монеты (1) будет точно 39 гербов, (2) число решеток будет лежать между 35 и 50 включительно, (3) будет меньше 30 гербов, (4) будет больше 44 решеток. 4. Для заданий 3, 4, 6 и 9 из упражнения 2.4.8 вычислите соответствующие вероятности с помощью аппроксимации биномиального распределения нормаль- ным. Сравните ваши результаты с точными значениями вероятностей. 190
2.5 ГЛАВА ВЫБОРКА 2.5.1. ЦЕЛЬ ВЫБОРКИ Если исследователь повторит эксперимент несколько раз, он полу- чит выборку измерений или наблюдений явления, которое он изучает. Предположим, по результатам этой выборки он хочет сделать общие выводы об этом явлении. При этом исследователь понимает, что каж- дое наблюдение содержит ошибку1, которая может возникнуть, на- пример, из-за погрешностей в лабораторных приборах или же из-за присутствия случайных помех в самом явлении. Например, если изме- рять изменение в длине металлического бруска в соответствии с из- вестным изменением его температуры, то измерения будут несколько отличаться от эксперимента к эксперименту. Эти отличия могут быть объяснены либо несовершенством измерительных приборов, либо не- равномерностью температуры бруска, либо изменением влажности и давления воздуха в лаборатории, либо, наконец, неоднородностью материала. Если будет возможно, исследователь, конечно, попытается устра- нить случайные помехи и изменить эксперимент так, чтобы в конце исследования явления можно было определить суммарный эффект та- ких колебаний или случайностей. Случайности, для которых это можно сделать, называются оцениваемыми помехами. В каждом эксперименте всегда присутствуют помехи, которые вызывают колебание результатов эксперимента. Отдельное наблюде- ние, как правило, принадлежит некоторой гипотетической неограни- ченной совокупности, которая организована в соответствии с некото- рым законом, называемым распределением совокупности. Каждое наблюдение, производимое исследователем, дает дополнительную ин- формацию о расположении и виде распределения. Итак, цель повторения наблюдений (т. е. получения выборки), как видим, состоит в том, чтобы иметь возможность сделать определенные утверждения о распределении совокупности. На основе информации, полученной из выборки, можно прийти к заключению о величине ее параметров. Обычно в оценивании нуждаются такие параметры рас- пределения, как среднее, дисперсия, коэффициенты асимметрии и эксцесса. 1 Слово (ошибка» в статистике понимается в смысле «отклонение» или «раз- брос» около истинного значения. 191
Для того чтобы быть уверенным в правильности наших оценок и выводов, надо быть уверенным в том, что наша выборка является репрезентативной (представительной) выборкой всей совокупности. Очевидно, чем больше наблюдений в нашей выборке, тем больше мож- но доверять сделанным на ее основе выводам. Теория выборки занимается такими вопросами, как установление репрезентативности выборок совокупности, изучение видов выборок, которые можно получить из данной совокупности, эффект изменения размера (объема) выборки, определение наилучших способов оценива- ния параметров совокупности, определение степени уверенности в по- лученных выводах. Это краткое введение в теорию выборки мы закончим некоторым довольно занятным (гипотетическим) примером, на котором будет вид- но, насколько выводы, сделанные по выборке, могут отличаться от истины. Предположим, что марсианский космический корабль впервые приземлился в центре Африки. Приземлившись в районе диких джунг- лей, экипаж марсианского космического корабля производит наблю- дение за растительным миром в этой окрестности, записывает состав, температуру, влажность и давление атмосферы, обследует пойманных трех детей пигмеев. Возвратившись на Марс, исследователи несколько недель анализируют собранные данные и по результатам анализа де- лают доклад. Основные выводы будут следующими: Земля покрыта непроходимыми джунглями, атмосфера Земли плотная с высокой тем- пературой, Земля населена голыми людьми с черной кожей, средний рост которых равен 1 м. Можно возразить, что ни один ученый, принимающий участие в кос- мическом полете, не будет делать подобных скоропалительных выводов. Может быть, это и так. Однако, к сожалению, некоторые бизнесмены, политики, генералы, инженеры и даже ученые, которые не знакомы с теорией выборки, зачастую еще делают подобные преждевременные заключения. А потом они удивляются тому, что прогнозы, получен- ные на основе этих выводов, расходятся с результатами дальнейших проверок и экспериментов. 2.5.2. ВИДЫ ВЫБОРОК Проблеме получения наилучшей выборки из данной совокупности посвящена обширная литература. Производя выборку, необходимо продумать целый ряд вопросов. Прежде всего должен быть определен объем выборки, который зависит не только от суммарной информации выборки и удовлетворительной степени уверенности в получаемых выводах, но зависит также и от затрат на процесс построения выборки. Многие проверки при контроле качества ведут к порче товара, из которого производится выборка. Например, при исследовании распре- деления времени безотказной работы нового типа телевизионных тру- бок (или лампочек, детских моторчиков и т. д.) необходимо сделать выборку, каждый элемент которой работает при нормальных усло- виях£до выхода из строя. Такие тесты,’очевидно, сопряжены с боль- 192
шими затратами времени производителя, поэтому размеры выборки, производящейся для проверки качества с порчей исследуемого то- вара, должны быть по возможности сведены к минимуму. Вопрос определения размера выборки нами будет рассматриваться позднее. Коротко остановимся на аспектах организации выборки. Как мы в действительности решаем, какие из элементов совокупности должны быть взяты для нашей выборки? При изучении некоторого явления исследователь при контроли- руемых условиях многократно выполняет эксперимент, и последова- тельность наблюдений образует его выборку. Например, контролер качества продукции, исследуя производство, на котором за час каждая машина выпускает, скажем, 200 единиц товара, может в конце каждого часа с каждой машины брать для проверки по десять единиц товара. Менеджер по продаже некоторого вида товара при обследовании рын- ка с целью получения информации о продаже исследуемого товара имеет гораздо более широкий выбор методов обследования. Делать ли выборку обследуемых людей по телефонному справочнику и зада- вать соответствующие вопросы по телефону? Может быть, лучше адре- са людей выбрать по избирательным спискам и анкеты посылать по почте? Или послать помощников на улицу и прямо задавать вопросы прохожим? Эти проблемы осложняются еще и тем, что выборка может охватывать либо всю страну в целом, либо быть региональной, либо локальной. Кроме того, целью выборки может быть как обследование определенной социальной группы, так и обследование нескольких групп. Каков бы ни был план получения выборки, первым, самым главным условием должно быть требование, чтобы выборка давала по возмож- ности наиболее правильную картину всей совокупности, из которой эта выборка производилась. Все элементы выборки должны получать- ся на основе случайного отбора по некоторым объективным правилам; экспериментатор не должен доверяться своей интуиции и на основе этого производить выборку, которая, как он думает, будет несмещен- ной. Например, контролер качества, производя самостоятельно вы- борку производимого товара (скажем, 15-миллиметровых болтов), мог бы интуитивно выбирать только подозрительные болты, полагаясь на свою интуицию. В таком случае его выборка содержала бы относи- тельное чисто плохих болтов, большее, чем во всей совокупности, а ру- ководители производства беспричинно решили бы произвести ремонт машин, выпускающих эти болты. Опишем два метода выборки, обеспечивающие случайность и гаран- тирующие репрезентативность выборки. а) Простая случайная выборка. Простейшей формой выборки бу- дет выборка, которая состоит из элементов, отобранных из совокупно- сти таким образом, что каждый элемент совокупности имеет одинако- вый шанс попасть в выборку. Выборка, получаемая таким способом, называется простой случайной выборкой. Один из способов получения простой случайной выборки из конеч- ной совокупности заключается в том, что каждому элементу совокупно- сти ставят в соответствие билет с номером (т. е. лотерейный билет); 7 Зак. 873 193
все билеты помещают, например, в шляпу, трясут ее и выбирают тот элемент совокупности, который соответствует извлеченному билету. Вместо билетов и шляп чаще используют таблицу случайных чисел, состоящую из цифр от 0 до 9, расположенных таким образом, что любая цифра имеет одинаковый шанс появиться на случайно выбранном мес- те таблицы. С помощью такой таблицы, как показано в примере, мо'ж- но легко получать случайную выборку из занумерованной совокуп- ности. Пример. Произвести простую случайную выборку объема 5 из группы в 30 студентов. Предположим, что студенты по журналу зану- мерованы от 1 до 30. Решение. Обратимся к таблице случайных чисел. Выберем первое число (для того чтобы обеспечить случайность выбора, можно, напри- мер, закрыть глаза и определить это число методом «тыка»). Предпо- ложим, что, читая по строке (или по столбцу), начиная с этого места, мы обнаружим следующие числа: 01, 53, 25, 73, 49, 82, 35, 15, 10, 32, 97, 08, ... В последовательности выбранных чисел отберем лежащие между 1 и 30, а остальные не будем принимать во внимание. Числа, которые подходят нашей задаче, подчеркнем. Таким образом, выбранные сту- денты будут под номерами: 1, 25, 15, 10 и 8. Упражнение 2.5.1. 1. Возьмите любую книгу, относящуюся к художественной литературе, и оп- ределите в ней число страниц. С помощью случайных чисел произведите из этой книги выборку объемом 20 страниц. 2. Поставим себе задачу исследовать распределение числа слов в предложе- ниях, употребляемых автором книги, о которой говорится в задании 1. На каждой из 20 страниц случайно выберите одно предложение следующим способом. С по- мощью случайных цифр выберите строку на странице, возьмите предложение в этой строчке или первое предложение, которое начинается в ней. Подсчитайте число слов в выбранных 20 предложениях; вычислите среднее и дисперсию выбор- ки. 3. Повторите задания 1 и 2 из этого упражнения для (1) научно-технической книги, (2) книги по истории. Сравните ваши результаты для трех случаев. 4. Произведите случайную выборку объемом 20 фамилий из телефонного справочника следующим образом. Сначала выберите 20 страниц, а потом на каж- дой странице выберите строчку. б) Стратифицированная случайная выборка. Часто бывает возмож- но разбить элементы совокупности на страты (группы) соответственно по некоторым характеристикам. Например, при обследовании спроса на некоторый товар исследуемую совокупность желательно разбить на группы, различающиеся по величине дохода, социальной принад- лежности или же по географическому местоположению. Если произведена подобная разбивка совокупности и случайная выборка производится отдельно из каждой группы, то полученное множество наблюдений называется стратифицированной случайной выборкой. 194
Предположим, имеется k групп, причем число элементов в этих группах равно соответственно Nlt N2, Nh. Если nt, n2, nh—- число наблюдений соответствующих групп, то общее число наблюде- ний будет равно и = гц + п2 + ... + nk. Можно показать, что для большинства целей наиболее эффектив- ным будет такой способ отбора, при котором числа пъ п2, , nh выб- раны так, что «1 П2 __ П/> __ п /\Ц ~ N2 Nh ~N‘ Если эти числа подобраны именно таким образом, то выборку назы- ваем пропорциональной стратифицированной выборкой. Для оценивания стратифицированные выборки значительно эф- фективнее, чем простые выборки; усилия, необходимые для страти- фикации совокупности, окупаются потом хорошими результатами. Упражнение 2.5.2. Рассмотрим совокупность, состоящую из людей одного из городов с фамилия- ми Браун, Хилл, Джонс, Джексон, Тёрнер, имеющих собственный телефон. По телефонной книге получите из этой совокупности пропорциональную стратифи- цированную выборку объема 50 (разбиение на группы производите по соответст- вующим фамилиям). 2.5.3. ВЫБОРКА МЕТОДОМ МОНТЕ-КАРЛО Для сложных процессов часто бывает невозможно получить доста- точное количество выборок. Это может происходить из-за больших затрат на осуществление таких выборок или же при невозможности повторения процесса. Тогда на помощь может прийти раздел матема- тики, изучающий теоретические аспекты многошаговых процессов. С помощью метода, позволяющего получить моделированную вы- борку, соответствующие процессы можно выполнять многократно «на бумаге» и таким способом быстро и точно накопить большое коли- чество ценной информации об их результатах. Этот метод основывается на предположениях о распределении ве- роятностей для переменных, участвующих на различных ступенях изучаемого процесса. После этого применяют таблицы случайных чисел, обеспечивающие репрезентативность выборок из принятого в качестве гипотезы распределения. В итоге возникают различные чис- ленные реализации процесса, совместное рассмотрение которых дает возможность изучить его особенности. Такой метод получения выбо- рок сложных процессов называется методом Монте-Карло. Далее описан метод получения репрезентативной выборки из пространства с заданным вероятностным законом. а) Метод получения случайной выборки. Пусть случайная перемен- ная X имеет кумулятивную функцию вероятности F (X). Тогда пере- менная х может быть случайным образом получена из выборочного пространства путем осуществления следующих шагов: 7* 195
1) Нарисуем график кумулятивной вероятности F (х). Эту кривую часто называют огивой. 2) Выберем непосредственно по таблице случайных чисел случай- ную десятичную дробь у (с необходимым числом разрядов) из равномер- ного распределения на интервале [0, 1] (см. 2.5.2, а)). 3) С помощью огивы определим значение х, соответствующее деся- тичной дроби у. Таким образом, найдем*: х — F-1 (у). Это значение х возьмем в качестве значения выборки. Рис. 94 иллюстрирует этот шаг 4) Повторяем шаги 2 и 3 Рис. 94 столько раз, сколько это не- обходимо. Полученная сово- купность значений х и будет случайной выборкой из дан- ного распределения. б) Проверка метода. Для оправдания метода, изложен- ного в 2.5.3, а), необходимо показать, что значения х, найденные таким образом, подчиняются распределению, соответствующему выбранно- му вероятностному закону. Все рассуждения будут произведены для дискретной функции вероятности, пространство исхода в которой со- держит только три точки. Обобщение доказательства на пространст- во с п исходами очевидно. Пусть распределение вероятностей имеет следующий вид: X = {хъ х2, х3}, р (X) = {рг, р2, р3}. Кумулятивная функция распределения изображена на рис. 95. Ясно, что длины отрезков ОА, АВ, ВС равны соответственно ръ р2, р3. Если случайным образом выбирается десятичная дробь у, то вероят- ность ее попадания в отрезок О А равна р±. Но когда у попадает в О А, то соответствующим элементом выборки будет xt. Таким образом, Р (выборочное значение X = хг) = Р (у попадает в^О/1) = рг, что и требовалось доказать. Аналогично, можно показать, что Р (X = х2) = р2 и Р_(Х = х3) = р3. Для непрерывных распределений с ф. п. в. f (х) и к. ф. р. F (х) до- казательство выглядит следующим образом (рис. 96): Р (выборочное значение х лежит в интервале (х, х -j- dx)) = Р (у попадает в dy) = = р (у) dy — dy (поскольку**/? (у) = 1) = dF (х) = / (х) dx (поскольку dF (x)/dx = f (х)). Таким образом, выборочные значения имеют ф. п. в. / (х), что и требовалось доказать. * 77-1 обозначает функцию, обратную функции F. Так как функция F мо- нотонна, то у нее существует обратная, т. е. значение х = F-1 (у) будет единст- венным. — Примеч. ред. ** Значения десятичных дробей распределены на отрезке [0, 1] равномерно с плотностью р (у) = 1. — Примеч. ред. 196
в) Применение таблиц. Использование случайных чисел. Чтобы про- извести случайную выборку из равномерного (прямоугольного) рас- пределения, определенного на интервале от х = а до х — Ь, мы посту- паем следующим образом: 1) производим выборку случайных десятичных дробей по таблице случайных чисел; 2) умножаем каждую дробь на (Ъ — а) и к полученному результату прибавляем а. Числа, полученные по такому способу, образуют выборку с требуе- мыми свойствами. Упражнение 2.5.3 • 1. Покажите правильность сформулированного выше метода построения равномерно распределенной на интервале (а, Ь) случайной выборки с помощью преобразования х = (Ь — а)у -|- а, где у — десятичная случайная дробь. (Най- дите отсюда выборочное пространство и ф.п.в. для х). 2. Примените этот метод для получения случайной выборки объемом 20 из прямоугольного распределения, заданного на (1) интервале (—1, -pl), (2) интер- вале (4, 8). Нарисуйте график, найдите среднее и стандартное отклонение полученных выборок.Сравните ваши результаты со средним и S.D. распределения совокуп- ности. Использование случайных нормальных отклонений. С помощью таблиц в конце книги сразу определяются значения случайной выборки, произведенной из стандартного нормального распределения. Эти значения называют случайными нормальными отклонениями. Поскольку они соответствуют совокупности с нулевым средним и S. D., равным единице, с помощью простого преобразования из них можно получить выборку для совокупности со средним (г и S. D., равным о. Это можно сделать следующим способом: 1) производим выборку случайных нормальных отклонений из стандартной таблицы; 2) умножаем каждое значение на о и прибавляем к полученному результату р. Множество чисел, построенное по такому способу, будет случайной выборкой из интересующего нас распределения. Пример Известно, что точки попадания пуль при стрельбе по мишени из некоторого оружия распределены по двумерному нормальному закону. Имеется такая информация: 1) цель представляет собой квадрат площадью 100 мм2. Воображае- мые оси координат расположены в его центре, как показано на рис. 97; 197
2) горизонтальные отклонения точек попадания в цель (х) нормаль- но распределены со средним 40 мм и S. D. = 40 мм. Среднее х = 40 означает, что либо стрелок неправильно целится (берет правее), либо Рис. 97. Рассеяние пуль на мишени прицельные приспособления ружья смещены вправо. Возможно также, что на стрельбу оказывают влия- ние некоторые внешние условия (например, ветер, смещающий нор- мальную траекторию пули); 3) вертикальные отклонения точек попадания пуль (у) нормаль- но распределены со средним 0 и S. D., равным 30 мм; 4) х и у распределены незави- сима. Для получения моделированной выборки десяти выстрелов по мише- ни следует воспользоваться таблицей случайных нормальных отклоне- ний. Найти долю выстрелов, попадающих в цель. Решение. Каждая точка попадания определяется своими координа- тами (х, у), где хиг/ распределены, как указано в п. 2) и 3). ~ х — 40 у — 0 Когда и = —эд— и v — - Зр- будут независимыми нормальными стандартными отклонениями. Из таблиц выберем десять пар случай- ных нормальных отклонений, которые соответствуют десяти точкам (ц, и). Каждая из выбранных пар переходит в пару (х, у) при преобразо- вании х = 40 и + 40, у = 30 V. Так можно построить моделированную выборку десяти точек попадания. Точка попадания будет лежать внутри квадратной мишени, если одновременно — 50 х 50, — 50 <1 у 50; с помощью этих не- равенств легко проверить, какой из моделированных выстрелов пора- зит цель. Далее в таблице приводятся возможный вариант выборки и соот- ветствующее ей решение. Выстрел Пара случайных нормальных отклонений Координаты точек попадания Результат выст- рела (попадание в цель или непопадание) и 1 X 1 « 1 —2,761 —0,923 —70,44 —27,69 Нет 2 0,440 0,318 57,60 09,54 Нет 3 0,210 0,624 48,40 18,72 Да 4 —0,996 —2,841 00,16 —85,23 Нет 5 — 1,693 0,281 —27,72 08,43 Да 6 —1,463 —0,631 —18,52 — 18,93 Да 7 —0,058 0,582 37,68 17,46 Да 8 —0,913 —0,713 03,48 —21,93 Да 9 —0,494 0,631 20,24 18,93 Да 10 — 1,447 —0,182 — 17,88 —05,46 Да Доля попадания в цель равна 0,7. 198
Упражнение 2.5.4 1. С помощью метода Монте-Карло произведите случайную выборку объемом 10 из следующих совокупностей: (1) нормальная со средним 0 и S.D. = 3; (2) нормальная со средним 3 и S.D. = 1; (3) нормальная со средним —2 и S.D. = 4; (4) нормальная со средним 1,5 и S.D. = 10; (5) прямоугольная на интервале [3,81; (б)прямоугольная на интервале [—2,1]; (7) пуассоновская со средним 1 (с помощью таблицы случайных чисел, пуас- соновской огивы или таблицы кумулятивного распределения); (8) пуассоновская со средним 3; (9) экспоненциальная с ф.п.в. 2е—2(, 0 < t < +<xj (нарисуйте огиву); (10) экспоненциальная с ф.п.в. 0 < t < +°°; (11) биномиальная с п = 4 и р = 1/2; (12) биномиальная с п = 6 и р = 1/4. 2. Покупатели в универсальном магазине подходят к кассе таким образом, что время между двумя последовательно подходящими покупателями подчиняет- ся экспоненциальному распределению со средним 1. Если ожидающих нет, то покупатель обслуживается сразу, в противном случае он становится й очередь. Время обслуживания покупателей подчиняется экспоненциальному распре- делению с ф.п.в. 2e~2t. Используя случайную выборку, найденную в заданиях 1(9) и 1(10), смоде- лируйте очередь и ее обслуживание для десяти покупателей. Составьте таблицу, содержащую время подхода каждого покупателя к кассе, время начала и оконча- ния его обслуживания, продолжительность ожидания в очереди, общее время на ожидание и обслуживание. Нарисуйте график числа людей в очереди в зависимости от времени t. Вы- числите среднее время, которое тратит покупатель (1) на ожидание в очереди, (2) на обслуживание у кассы, (3) на ожидание и оплату покупки. 3. Выполните предыдущее задание, используя случайные выборки: найден- ную в задании 1(9) — для времени подхода покупателей ив 1(2) — для времени обслуживания (если появится отрицательное число, возьмите t = 0). 4. Выполните задание 2, взяв для времени обслуживания случайную выбор- ку, найденную в задании 1(10). 5. Предположим, что распределение времени безотказной работы телевизион- ных трубок нормально со средним 24 месяца и S.D., равным 6 месяцам. Если вы покупаете новый телевизор и пользуетесь им десять лет, сколько в среднем вам надо будет купить трубок за этот период? Проследите за работой десяти (или более) телевизионных приемников за 10- летний срок, пользуясь таблицей случайных нормальных отклонений или мето- дом огивы. Усредните полученные результаты. 6. Было найдено, что время службы шин автобусов городского транспорта до их изнашивания подчиняется распределению вероятностей, определяемому по следующей таблице: Время до изнаши- вания шин (в меся- цах) <6 8 10 12 14 16 18 20 22 24 Кумулятивная веро- ятность 0,01 0,06 0,18 0,33 0,53 0,76 0,91 0,95 0,98 1 Оцените число замен шин, необходимых для 10 автобусов за двухлетний пе- риод, при следующих условиях: (1) вначале автобус имеет все четыре шины новые; (2) временем отказа автобуса пренебречь; (3) износ одной шины не зависит от других. (Это «плохое» предположение в том случае, если шины заменяются не одинаково часто.) 199
26 ВЫБОРОЧНЫЕ ГЛАВА РАСПРЕДЕЛЕНИЯ 2.6.1. ВЫБОРОЧНЫЕ СТАТИСТИКИ С помощью значения х, принадлежащего некоторой выборке (хх, х2, ..., хп) из совокупности, мы хотим получить информацию о всей совокупности в целом. Например, нас может интересовать центр рас- пределения, и для этого целесообразно взять выборочное среднее х в ка- честве оценки соответствующего среднего значения совокупности р. Аналогично для оценивания дисперсии всей совокупности о2 мы можем воспользоваться выборочной дисперсией s2. Значения х и s2 представляют собой функции наблюдаемых значе- ний хъ х2, ..., хп; подобные функции называются выборочными статис- тиками. Неизвестные параметры всей совокупности, такие, как среднее, ме- диана, дисперсия и коэффициент асимметрии, должны оцениваться с по- мощью выборочных статистик, которые с ними тесно связаны.. Выбор подходящей оценки для некоторого параметра совокупности — одна из проблем теории статистического оценивания. Чтобы удовлетвори- тельно решить эту проблему, необходимо исследовать взаимосвязь между выборочными статистиками и параметрами совокупности, из которой производится выборка. 2.6.2. ВЫБОРОЧНЫЕ РАСПРЕДЕЛЕНИЯ Чтобы ввести важное понятие выборочного распределения, читате- лю предлагается рассмотреть (а лучше выполнить самостоятельно) следующий эксперимент. Эксперимент. Четыре правильные игральные кости бросают пять раз, каждый раз записываются числа, появляющиеся на верхней грани костей. Затем вычисляют среднее для каждой выборки из четырех чисел. Результаты. Результат отдельного эксперимента будет следую- щим: Выборка: Среднее х 1, 5, 4 6, 4 200
Значения пятидесяти выборок 5 12 4 3 6 4 4 4 2 3 3 1 1 24 2 4 4 4 6 1 42 6 2 1 3 24 2 4 3 3 2 3 3 4 1 А 3 5 6 5 4 6 2 16 4 4 5 3 6 4 1 3 5 2 2 3 4 2 4 3 2 1 1 6 3 4 2 13 3 4 5 3 5 4 6 5 4 5 4 4 6 3 1 4 4 4 1 3 4 5 5 3 5 3 4 1 3 2 4 3 2 6 4 4 4 3 3 3 4 5 5 5 6 3 44 3 2 6 5 3 4 4 1 5 4 6 3 6 4 5 1 42 5 1 1 4 3 4 5 2 4 6 2 5 6 4 1 44 4 5 4 4 3 15 6 3 3 34- 3 2 4 з| 6 2 3 2 2 1 6 3 11 4 5 3 3 3 1 6 15 2 4 2 1 1 2 4 2 4 1 4 4 6 2 4 3 4 5 5 3 3 34 2 2 5 4 6 1 44 5 6 5 1 42 2 4 2 4 4 5 3 5 4 1 4 3 6 4 3 44 6 15 4 1 3 24 5 2 5 4 2 6 4 2 4 1 4 4 3 6 ' 4 5 6 2 1 44 4 а) Обсуждение. Функциях = (хх + х2 + х3 + х4)/4 будет выбороч- ной статистикой; каждый раз, получая выборку результатов бросания четырех костей, а именно (х1( х2, х3, х4),мы можем вычислить значение этой функции. Очевидно, если результат хг случаен и подчиняется ве- роятностному закону для одной кости, то функция х также будет слу- чайной величиной с собственным распределением вероятностей. Рассмотрим, как связано распределение вероятностей для индиви- дуального значения х со значением х. Выясним также, как значение х влияет на значение х. Для ответа на эти вопросы обратимся к численным результатам вы- борки, приведенным ранее. Таблица группированных частот для мно- жества из пятидесяти значений х выглядит следующим образом: 201
b * ’ J1/2> 2> 21/2, 3, 3i/2, 4, 4V2, 5, 5V2. I pynna x P/4 1зд 2Ч4 2з/4 3V« 33/4 4»/4 4з/4 5l/4 6 Частота f 0056 10 10 11701 Относительная часто- 0 0 0,10 0,12 0,20 0,20 0,22 0,14 0 0 02 та /7 50 На рис. 98 показана гистограмма экспериментального выборочного распределения х. Рис. 99 иллюстрирует распределение для одного бро- сания кости, т. е. для значения х. б) Сравнение двух распределений. Распределение х отличается от первоначального распределения. (Вспомним, что первое было получено экспериментально и приближенно показывает, как выглядит истинное выборочное распределение среднего.) Экстремальные значения х, такие, как 1 или 1Ч4 и 53/4 или 6, появ- ляются значительно реже, чем средние значения х: 3, ЗЧ2 или 4. Это аметно расходится с исходным распределением, в котором все значе- ия х имеют одинаковую вероятность. Приняв во внимание способ об- ‘ I Средние в выборках объема 4 О.2О - 0,10 - о.оо L 0 Результат однократного бросание кости Рис. 99. Прямоугольное распреде- ление вероятностей для правиль- ных костей Рис. 98. Выборочная гистограмма (50 выборок) разования выборочного среднего, легко показать, почему экстремаль- ным значениям соответствуют небольшие вероятности. Например, что- бы получить значениех, равное 1, каждая из игральных костей должна показать 1, т. е. возможна лишь одна выборка (1, 1, 1, 1), для которой X =1. Вместе с тем получить значение в середине можно при многих различных выборках. Например, к х = 3 нас приведет или (3, 3, 3, 3), или (2, 3, 4, 3), или (3, 1, 6, 2) и т. д. Читатель может самостоятельно подсчитать, сколько всего имеется таких выборок. Распределение выборочного среднего ближе группируется к своему центру, чем это происходит в исходной совокупности, т. е. значения х имеют меньший разброс, чем значения х. Это верно для любых распре- делений; средние имеют меньший разброс, чем исходные совокупности. Более того, величина уменьшения разброса зависит от объема произ- водимой выборки. Чтобы уяснить это, рассмотрим вычисление среднего при бросании шести костей. Получить значение среднего х = 1 у нас имеется только один шанс, соответствующий выборке (1, 1, 1, 1, 1, 1), а для получения значения х = 3 появляется гораздо больше способов, чем прежде. 202
Таким образом, чем больше объем производимой выборки, тем мень- ше разброс выборочного распределения среднего. Этот вывод уточняет- ся в теореме 1, которая формулируется далее. Что можно сказать о центре выборочного распределения? Как он связан с центром исходной совокупности? В нашем примере с играль- ными костями, очевидно, ожидаемое значение х будет равно 3,5 и сов- падает со средним совокупности. Число выборок, для которых х = 3,25 будет равно числу выборок с х = 3,75, а число выборок со средним х = 3 равно числу выборок со средним х = 4 и т. д. до х = 1 и х = 6. Мы видим, что выборочное распределение х симметрично около х = = 3,5. В общем случае можно показать, что для любого исходного рас- пределения и выборок любого объема Е (х) = р. Сейчас без доказательства мы приведем теорему, связывающую средние и дисперсии двух рассмотренных распределений. Теорема 1. Если случайная выборка объема п производится из большой совокупности {гипотетически бесконечной), которая имеет среднее р и стандартное отклонение ст, то теоретическое выборочное распределение х имеет среднее р и стандартное отклонение ст Vп. Эта теорема вместе с результатом теоремы2 (с. 188) часто применяет- ся в статистике. Она утверждает, что среднее выборочного среднего равно среднему исходной совокупности. Появляется также возможность точно установить связь между раз- бросом выборочного распределения среднего и разбросом исходного распределения. Мы видим, что стандартное отклонение выборочного распределения можно быстро вычислить, зная, что величина разброса изменяется обратно пропорционально квадратному корню из объема выборки. Например, если мы бросаем четыре игральные кости, то раз- брос среднего уменьшится вдвое; если наша выборка состоит из 16 кос- тей, то величина разброса будет четвертью разброса исходной совокуп- ности. Определение. Сгандартное отклонение выборочного распре- деления будем называть стандартной ошибкой рассматриваемой выбо- рочной статистики. Таким образом, = ст/Vn — стандартная ошибка х. Упражнение 2.6.1 1. Из большой пачки письменных экзаменационных работ по математике производятся случайные выборки. Известно, что оценки всех работ в пачке имеют среднее 53, a S.D., равное 12. Найдите среднее и S.D. выборочного распределе- ния среднего в производимых выборках. Объем выборок равен 9. 2. Содержание азота в некотором сплаве измеряется с помощью бромтри- флористого реагента. Известны среднее и S.D. процентного содержания азота в сплаве, которое составляет 0,027 и 0,011. Определите среднее и стандартную ошибку выборочного распределения среднего для выборок из 25 сплавов. 3. При условии, что выборочное распределение х для выборок объема 16 имеет дисперсию 8, найдите, чему будет равно S.D. для исходной совокупности. 4. Для приведенных ранее результатов бросаний четырех игральных костей вычислите среднее и S. D. распределения частот х. Найдите также среднее и S.D. для исходного прямоугольного распределения. Соответствуют ли ваши результаты теореме 1? 203
5. Получите выборки объема 9, выполняя эксперимент с игральной костью (или смоделируйте его с помощью таблицы случайных чисел). Для выборочного среднего нарисуйте график относительных частот. Выполните задание 4 для этого эксперимента и сравните ваши результаты. 6. Вычислите размах w выборки из 50 бросаний четырех костей (с. 184). Объедините результаты в таблицу группированных частот и нарисуйте гисто- грамму. Найдите среднее и S.D. для распределения выборочного размаха в этом эксперименте. Будет ли поведение выборочного размаха таким же, как и поведение выбо- рочного среднего? Предположим, объем выборки результатов бросаний игральных костей равен 100; чему будут равны приближенно вероятности событий w = 1, w = 2, ..., w = 6 в таких выборках? Набросайте форму распределения. Что случится со средним распределения w если п увеличивать? в) Форма выборочного распределения. Мы видели, как можно по- лучить среднее и S. D. выборочного распределения среднего из со- ответствующих параметров исходной совокупности. Теперь нам пред- ___ стоит выяснить связь между формами /У/\ 7S.D=4 этих двух распределений. / Если мы посмотрим на график / । средних выборок четырех бросаний / игральной кости, то увидим, что фор- \//л х. _ ма этого распределения унимодаль- 53 57 ^*~х на, а относительные частоты быстро уменьшаются по обе стороны от сред- р,ис- 100 него. Мы можем задаться вопросом, как близко это распределение к тео- ретической кривой нормального распределения с теми же значе- ниями среднего и S. D. Замечателен тот факт, что независимо от формы распределения исходной совокупности (имеющей конечную дисперсию) выборочное распределение средних будет хорошо аппроксимироваться соответст- вующим нормальным распределением, если объем выборки достаточно велик. Этот факт формулируется в следующей теореме. Теорема 2 (центральная предельная тео- рема). Теоретическое выборочное распределение х при большом п мо- жет быть хорошо аппроксимировано соответствующим нормальным распределением. Замечание. Если исходное распределение нормально, то х бу- дет нормальной величиной независимо от п. Эта теорема может быть доказана при весьма слабых ограничениях на исходное распределение. Математики уделяли ей много внимания. Простейший вариант теоремы был установлен П. Лапласом в начале XIX в. Точно указать, для каких п выполняется теорема 2, довольно слож- но. Однако мы уже видели, что при малых значениях п, равных 4, и исходном прямоугольном распределении экспериментальное выбороч- ное распределение х выглядит приближенно как нормальное. Таким образом, для достаточно больших выборок (скажем, для п 30) теоре- му можно применять с большой уверенностью. Для п < 30 в зависимо- сти от различных ситуаций необходимо дополнительное исследование, 204
если не известно, что исходное распределение само хорошо аппрокси- мируется нормальным. Пример. Для оценок по математике из задания 1 упражнения 2.6.1 найти вероятность того, что при объеме выборки, равном 9, среднее значение будет лежать между 53 и 57. Решение. Дано р, = 53 и сг = 12. Тогда для выборки объемом 9 распределение х будет иметь среднее Е (х) = 53 и стандартную ошибку а- = сг/1/9 = 4 (на основании тео- ремы 1). Более того, по центральной предельной теореме распределение х будет приближенно нормальным. Поэтому мы можем ответить на пос- тавленный вопрос, вычисляя площадь А под нормальной кривой, сред- нее которой равно 53, a S. D. равно 4 (см. рис. 100). Приведя 53 и 57 к стандартным нормальным значениям zr и г2, получим z± — (53—53)/4 = 0 и z2 = (57—53)/4 = 1. Из таблиц стандартного нормального распределения мы найдем, что А = 0,3413. Таким образом, вероятность получить выборку из девяти работ так, чтобы среднее их оценок лежало между 53 и 57, приближенно равна 0,34. Упражнение 2.6.2 1. Из нормальной совокупности со средним 18,1 и S.D., равным 2,3, про- изводится выборка объемом 9. Найдите вероятности получить: (1) выборку, среднее которой меньше 16; (2) выборку, среднее которой лежит между 15 и 17; (3) выборку, среднее которой меньше 16 и больше 19. 2. Выполните задание 1 для выборки объемом 25. 2.6.3. ВЫБОРОЧНОЕ РАСПРЕДЕЛЕНИЕ ДЛЯ СУММЫ И РАЗНОСТИ Пусть имеются две случайные переменные X и У, осуществляются два независимых выбора — один из совокупности X, а другой из сово- купности У. Под независимым выбором мы подразумеваем следующее: выбираемое значение х не должно влиять на выбор из совокупности У и обратно. Предположим также, что обе совокупности достаточно вели- ки, так что повторяющийся выбор не оказывает влияния на распреде- ление вероятностей; другими словами, предположим, что исходные со- вокупности бесконечны. Рассмотрим теперь две новые переменные, которые назовем суммой (S) и разностью (О) X и У. Каждый раз, производя выбор х и у, мы по- лучаем значения s = к-[ у и d = х — у для величин S и D соответст- венно. Очевидно, S и D будут случайными переменными со своими собст- венными выборочными распределениями. Определим, как связаны сред- ние и стандартные отклонения этих величин с соответствующими зна- чениями для X и У. Результат будет приведен без доказательства (доказательство требует знания свойств совместных распределений случайных величин). 205
Теорема 3. Если X uY — две независимые случайные перемен- ные со средними р,ж и р;/ и дисперсиями о| и of, то случайные перемен- ные S = X -| У и D — X — Y имеют средние и дисперсии, равные Их = Рх + Ру, Var (S) = а* + ст* и pD = р,х — Рл,, Var (D) = а2 + ст|. Мы видим, что для получения дисперсии как суммы, так и разности X и Y необходимо сложить соответствующие дисперсии. Другими сло- вами, Var (S) = Var (X) + Var (У) = Var (D). Пример. Последовательно бросают две игральные кости, выпа- дающие числа записывают в виде пары (х, у). Определите среднее и S. D. распределений (a) х = х + у, (б) d = х — у. Решение. Для каждой кости имеем р = 3,5 и о2 = 2,92 (исходная совокупность рассмотрена в 2.6.2, а) — рис. 99; для проверки этих значений воспользуйтесь стандартными формулами среднего и дис- персия). Таким образом: (а) рх = рж + Pj, = 2 • 3,5 = 7, Var (S) = ст£ + ст| = 2 • 2,92 = 5,84, следовательно, S. D. для суммы S будет равно cts = VW=2,42; (б) Р'О — Рж Ру — О, oD = VVar (Х) + Var (K) = cts = 2,42. Упражнение 2.6.3 1. Возьмите две кости (красную и зеленую) и бросьте их пять раз. При каж- дом бросании запишите значения S = R С и D = R — G, где R соответст- вует числу очков, выпавших па красной, a G — на зеленой кости. Найдите рас- пределение относительных частот для S и Л и вычислите их средние и S.D. Соот- ветствуют ли ваши результаты теореме 3 и приведенному ранее примеру? 2. Две независимые случайные переменные X и Y имеют распределения со средними 52 и 41 и дисперсиями 9 и 16 соответственно. Определите среднее и S. D. распределений S = X + У н D = X — Y. 3. Из совокупности X и из совокупности У (см. задание 2) производятся случайные выборки объемом 25; при этом вычисляются их средние х и у. Найдите среднее и S. D. выборочных распределений случайных перемен- ных S = Х+У и Р = Л — у. 4. Обобщите естественным образом теорему 3 (для сумм п независимых случайных переменных); с помощью полученных результатов докажите тео- рему 1. (Если S=X14-X'2+... + Xn, то Ps=2Bxi. Var (S) = 2 Var (Л,). Если предположить теперь, что все переменные выбираются из общей (бес- конечной) совокупности, то %!, ..., хп можно рассматривать как выборку объе- S мом п из этой совокупности, а отношение — будет средним х.в выборке, Е> 206
Отсюда |ii = — [is = — («Г) = И. ra Var W = ~ VarL(S) = —- X X n n n2 ti2 02 X (ИО2) = --, n что и доказывает теорему 1.) 2.6.4. РАЗНОСТИ СРЕДНИХ Следующая теорема применяется в проверках на равенство средних двух различных генеральных совокупностей. Допустим, случайная выборка объемом /ц произведена из совокуп- ности со средним р.хи стандартным отклонением S. D. = о,., предполо- жим также, что из другой совокупности со средним и S. D. = <зу произведена независимая случайная выборка объемом /г2. Таблица свойств важнейших выборочных распределений Выборочная статистика Свойства выборочного распределения среднее S.D. (стандартная ошибка) замечания Среднее X И- = Р а — ° х Распределение нормально, если исходная совокупность распре- делена нормально, и близко к нормальному, если п > 30 и исходная совокупность не яв- ляется нормальной Медиана X L'Med = Г Распределение очень близко к нормальному, если п > 30. Фор- мула для оМе<! абсолютно точ- на, если исходная совокупность распределена нормально. Фор- мула для cMed верна, если совокупность симметрична, л =3,141 Доля Р Ир = 6 Распределение приближенно нормально при /г>30. 6 —доля в совокупности Стандартное отклонение S P'S О’ Распределение очень близко к нормальному при п>100. Фор- мула для оЕ будет точной толь- ко для нормально распределен- ной исходной совокупности Разность средних О=(Х—У) Ро = Рх Ру /~ 9 2 1 / Gx G.. Г Hi И2 Выборки независимы и произ- водятся из двух разных рас- пределений. Распределение D приближенно нормально, если nj и п2>30 207 I
Рассмотрим случайную величину D = X — У, т. е. разность сред- них двух выборок. Теорема 4. D имеет выборочное распределение со средним ро = Рх — Рг/ 11 дисперсией о2 о2 Var(D) = — П1 п2 Доказательство следует непосредственно из теорем 1 и 3. 2.6.5. ЗАМЕЧАНИЯ И ВЫВОДЫ Результаты этой главы — основные в теории статистики. Содержа- щиеся в ней идеи и теоремы должны быть хорошо изучены и усвоены; они составляют основу теории статистических выводов, которой пос- вящена гл. 2.7. Важнейшие свойства и теоремы для общего случая выборочных распределений (включая также те, на которых мы не останавливались) приведены в таблице на с. 207. Упражнение 2.6.4 1. Совокупность состоит из шести элементов: 1, 2, 4, 5, 7, 8. Выпишите все возможные выборки объемом 2, которые можно из нее про- извести с возвращением (1,1), (1,2), (1,4), ..., (2,1), (2,2), (2,4) и т. д. Вычислите: (а) среднее р и стандартное отклонение о совокупности; (б) среднее каждой возможной выборки и среднее этих средних; эта вели- чина будет равна среднему выборочного распределения средних выборок объе- мом 2; (в) стандартную ошибку средних. Покажите, что р- = р и о~=о/1/« (и=2). 2. Выполните задание 1 для выборок объемом 3, производимых из совокуп- ности 2, 4, 6. 3. Что случится со стандартной ошибкой выборочного среднего, если (а) размер выборки возвести в квадрат, (б) размер выборки увеличить с 16 до 144? 4. Проверьте, что среднее, вычисленное по выборке объемом 64, надежнее для оценивания р, чем медиана, найденная по выборке объемом 100. (Сравните их стандартные ошибки.) 5. Сравните стандартную ошибку медианы в выборке объемом 25 со стан- дартной ошибкой среднего для выборки объемом 16. Какая из величин для дан- ных выборок будет лучшей оценкой для р. (среднее или медиана)? 6. Из нормально распределенной совокупности со средним р = 73 и S. D. = = 110 осуществлена случайная выборка объемом 100. Найдите: (а) вероятность того, что среднее выборки лежит между 60 и 78, (б) вероятность того, что медиана лежит между 60 и 78. (Указание. Воспользуйтесь свойствами выборочных распределений и таблицей величины площади под нормальной кривой.) 7. Найдите вероятность того, что при 64 бросаниях правильной монеты (а) число выпавших решеток будет от 20 до 45% числа бросаний, (б) число гер- бов будет меньше, чем 3/8 общего числа бросаний. (Указание. Воспользуйтесь свойствами выборочного распределения доли Р, описанными в итоговой таблице.) 8. Известно, что в очень большой группе людей 35% курящих. При усло- вии, что производится случайная выборка 100 человек из этой группы, найдите вероятность того, что из них более 40 курят. 208
9. Две компоненты Л и В соединены в линию последовательным образом. Длины компонент А и В представляют собой случайные величины со средним 3 мм и S. D. = 0,1 мм для компоненты А и со средним 6 мм и S. D. = 0,03 мм для компоненты В. До соединения две компоненты выбираются из соответст- вующих совокупностей независимо друг от друга. Чему равны среднее и S. D. комбинированной компоненты, если предположить, что соединение не увеличивает и не уменьшает длину компонент? 10. Вес плиток шоколада имеет распределение со средним 1 и S. D. = 0,01 единицы веса. Случайным образом выбирают четыре плитки и складывают в один пакет. Найдите среднее и S. D. веса пакета, если вес бумаги пакета распределен со средним 0,1 и S. D. = 0,003 единицы веса. 11. При измерении двух железных прутов оказалось, что длина первого составляет 2 м, а второго — 1,5, причем стандартная ошибка для первого из- мерения была 11 мм, а для второго — 9 мм. Вычислите среднее и S. D. для (а) суммы длин и (б) разности длин. 12. Некоторый кандидат набрал на выборах 45% голосов. Чему равна ве- роятность того, что разность между долями голосов, поданных за этого канди- дата, и Р2 в двух выборках окажется больше 0,05? __ (Указание. Измените формулу, данную в таблице для D = X — У, на соответствующую для D == 1\— Р2, затем воспользуйтесь таблицей нор- мального распределения.)
27 СТАТИСТИЧЕСКИЕ ГЛАВА ВЫВОДЫ В предыдущих главах мы видели, что любая статистика, вычислен- ная по наблюдениям выборки, сама может рассматриваться как случай- ная величина. В некоторых случаях нами была установлена связь между выборочным распределением статистики и распределением со- вокупности, из которой производилась выборка. В следующих главах мы рассмотрим фундаментальную статистичес- кую проблему извлечения информации о совокупности в целом по на- блюдениям выборки. Этот раздел статистики называется статистиче- ские выводы-, теория выборочного распределения играет в этой области огромную роль. К этой проблеме можно подойти в основном двумя путями. Первый путь заключается в том, чтобы найти выборочную статисти- ку, которая была бы подходящей оценкой соответствующего парамет- ра совокупности. Например, выборочное среднее х может служить оценкой среднего р совокупности. Для этого можно воспользоваться и выборочной медианой х. Спрашивается, какая из этих оценок р будет лучше? Можно ли найти другую выборочную статистику, в некотором смысле лучшую, чем и х и х? Решение этих вопросов составляет основу так называемой теории статистического оценивания. Второй путь заключается прежде всего в формировании гипотез относительно совокупности. Затем с помощью наблюдений выборки проверяют, являются ли выдвинутые гипотезы удовлетворительными или нет. Например, мы выдвигаем гипотезу о том, что среднее совокуп- ности равно нулю (т. е. р = 0). Если мы затем получаем случайную выборку из этой совокупности, выборочное среднее которой равн£» х = = 3, то что можно сказать о выполнении или невыполнении нашей ги- потезы? Верна она или нет? Изучением таких проблем занимается раз- дел статистики, известный под названием статистическая теория проверки гипотез. В этой главе мы познакомим читателя с важнейшими идеями, ле- жащими в основе статистического оценивания и теории проверки гипо- тез. Эти понятия и идеи в той или иной форме встречаются практически на любом этапе статистического исследования. Мы надеемся, что за деталями формул и тестов, предлагаемых далее, читатель будет видеть соответствующие идеи и принципы. В большинстве случаев мы будем иметь дело с так называемой теорией больших выборок, т. е. со случаями, когда объем выборки 210
превосходит 30 (приближенно). Поэтому выборочные распределе- ния, используемые в различных тестах, будут нормальными или по крайней мере близкими к нормальным, что позволяет пользовать- ся таблицами. Как правило, тесты остаются верными и для п, лежащих между 15 и 30; однако для п 15 они должны быть модифицированы. Этот случай исследуется в теории малых выборок. 2.7.1. ТЕОРИЯ СТАТИСТИЧЕСКОГО ОЦЕНИВАНИЯ а) Точечное оценивание. Выборочная статистика, применяемая для получения оценки соответствующего параметра совокупности, называется точечной оценкой. Примеры 1. х может служить оценкой для ц. 2.3с может служить оценкой для ц. 3. s2 может служить оценкой для дисперсии совокупности о2. Замечания 1. На практике, как правило, для обозначения параметров сово- купности употребляют буквы греческого алфавита, а соответствую- щими латинскими буквами обозначают их оценки. Например, если буквами р и о обозначают среднее и стандартное отклонения совокуп- ности, то буквами т и s будут обозначаться их оценки. 2. Существует другой способ обозначения оценки, соответст- вующей некоторому параметру: для оценки выбирают ту же букву, что и для параметра, только с крышечкой наверху (хч). Например, р означает оценку р; о2 — оценку о2. б) Свойства оценок. Для данного параметра совокупности может существовать много выборочных статистик, которые вполне подхо- дящи для того, чтобы служить оценками. Например, любая из ста- тистик — среднее, медиана, мода — может показаться вполне при- емлемой для оценивания среднего совокупности р. Чтобы решить, какая из статистик в данном множестве предлагаемых оценок «наи- лучшая», необходимо определить некоторые желаемые свойства та- ких оценок. Три важнейшие из них — несмещенность, эффектив- ность и состоятельность. 1. Несмешанные оценки. Пусть р — некоторый параметр сово- купности, а выборочная статистика b = f (хъ .... х„) — оценка этого параметра. Статистика b имеет свое выборочное распределение, кото- рое, в свою очередь, имеет среднее (или математическое ожидание) Е (Ь) и стандартное отклонение S. D. (Ь) (эту величину часто называют стандартной ошибкой Ь). Определение. Если Е (Ь) = р, то b называется несмешанной оценкой р. В других случаях говорят, что оценка смещена. Очевидно, несмещенность — очень важное свойство, обладание которым желательно для любой оценки. Это свойство означает, что если мы пользуемся несмещенной оценкой, то в одних случаях может случиться, что мы завышаем искомый параметр совокупности, в дру- гих — мы его занижаем. Однако в среднем мы будем «попадать в цель». 211
На рис. 101 и 102 показано выборочное распределение двух оценок (/«! и т2) для среднего р некоторой совокупности. Истинное распре- деление совокупности обозначено пунктиром и изображено на той же шкале. Поскольку Е (trij) = р, статистика т1 будет несмещенной оценкой р. С другой стороны, т2 есть смещенная оценка, поскольку в среднем значение этой оценки превосходит р, т. е. Е (т2) > р. Примеры 1. х есть несмещенная оценка р. (Е (х) = р, гл. 2.6, теорема 1.) 2. х также будет несмещенной оценкой р, если выборка произ- водится из совокупности с симметричным распределением. о о 2 (х—х)2 9 3. s2 = ———- = смещенная оценка о , поскольку £(s*) \ п ) В среднем s2 дает заниженную оценку дисперсии совокупности. Рис. 101. Распределение Рис. 102. Распределение оценки mi оценки т2 Л *5 / ч \ 9 2 (х х) 9 4. о2=|---- sz= —--------несмещенная оценка о2 \п—1 ' п—1 е " -1 2 (*—х)2 5. о= 1/ —------- — смещенная оценка о. V п— 1 2. Эффективные оценки. В общем случае желательнее выбирать несмещенную оценку, чем смещенную. Однако часто встречаются ситуации, когда для некоторого параметра существует больше, одной несмещенной оценки. Тогда проблема выбора возникает вновь. В качестве основы сравнения оценок, т. е. определения меры эф- фективности оценивания, можно взять их выборочные дисперсии. Очевидно, что наилучшей будет оценка с наименьшим разбросом вы- борочного распределения. Численные значения, которые определяют- ся такой оценкой, будут наиболее близки к истинному значению параметра совокупности по сравнению с оценками, имеющими боль- шую дисперсию. Будем говорить, что оценка более эффективна, если она имеет меньшую выборочную дисперсию. Определения а) Если Ьг и Ь2 — две несмещенные оценки параметра р и Var (t>x) < Var (b2), то br — более эффективная оценка, чем Ь2. 212
б) Рассмотрим семейство всех возможных несмещенных оценок параметра. Оценка с наименьшей дисперсией из этого семейства называется наиболее эффективной, или наилучшей, оценкой. Осталь- ные оценки иногда называют неэффективными оценками. П ример. При выборке из нормально распределенной совокуп- ности среднее х и медиана х будут несмещенными оценками средней р совокупности. Как было показано в гл. 2.6, Var (х) =— , Var (х)=—• — . п 2 п Таким образом, х имеет меньшую выборочную дисперсию, поэтому х будет и более эффективной оценкой для р, чем х. Более того, можно показать, что среди всех несмещенных оценок р, оценка х обладает наименьшей дисперсией. Таким образом, х бу- дет наиболее эффективной оценкой. 3. Состоятельные оценки. При использовании той или иной оценки желательно, чтобы точность оценивания увеличивалась с возрастанием объема производимой выборки. Предельная точность будет достигну- та в том случае, когда численное значение оценки будет совпадать со значением параметра для любой производимой выборки. Это озна- чало бы, что оценка является несмещенной и что ее выборочная дис- персия равна нулю. Однако такое положение дел невозможно на прак- тике1, хотя точность большинства оценок стремится к этому идеаль- ному случаю при неограниченном увеличении объемов выборки. Та- кие оценки будем называть состоятельными. Определение. Если выборочная статистика b представляет собой несмещенную оценку параметра совокупности и выборочная дисперсия Var (Ь) зависит от объема выборки таким образом, что Var (£>)-> О при п -> оо , то b называется состоятельной оценкой |3. Примеры - -о2 1. х есть несмещенная оценка р. Далее, Var (х) = —, откуда Var (х) -> 0 при п -* оо . Итак, х — состоятельная оценка р. 2. При выборке из нормально распределенной совокупности х будет зт несмещенной оценкой р, а ее выборочная дисперсия • — стремится к нулю при неограниченном увеличении п. Таким образом, медиана будет состоятельной оценкой среднего совокупности. 3. $2 = 2 (*—*) есть несмещенная оценка ст2. Можно показать, п— 1 1 / п—3 \ что ее дисперсия равна Var (s2)= ~ I р4 — фДф I н ПРИ стремлении п к бесконечности она стремится к нулю. Таким образом, s2 будет состоятельной оценкой о2. 1 Если бы это произошло, то исследуемая переменная перестала бы быть случайной. Вся ее вероятность концентрировалась бы в одной точке, и это значе- ние всегда можно было бы точно указать. 213
4. Итоговая таблица свойств оценок с примерами выглядит сле- дующим образом: Несмещенность Эффективность Состоятельное ть. Определения Ь — несмещенная оценка, если £(6) = Р Ь — наиболее эффек- тивная оценка, если она несмещена и Var (Ь) — минимальная Ь — состоятельная оценка, если она несмещена и Var (b) 0 при П->оо Примеры х — несмещенная оценка р х — несмещенная оценка р (для нор- мально распределен- ном совокупности) s2(/z—1 в знаменате- ле) — несмещенная оценка о2 s — смещенная оценка о х — наиболее эффек- тивная оценка х — неэффективная оценка s2 — эффективная оценка s — неэффективная оценка х — состоятельная оценка х — несостоятель- ная оценка* s2 — состоятельная оценка s — несостоятель- ная оценка* * Обычно для состоятельности оценки не требуют, чтобы она была несме- щенной. В таком случае оценки х и s будут состоятельными. — Примеч. пер. При выборе оценок необходимо принимать во внимание перечис- ленные свойства. Могут быть изучены и другие полезные свойства оценок (например, важное свойство достаточности), их обсуждение можно найти в более полных курсах статистического оценивания. Следует учитывать и такое немаловажное обстоятельство, как отно- сительная простота вычислений и затраты на получение выборки. Нередко выбирается неэффективная оценка только на том основании, что ее вычисление намного проще, чем вычисление соответствующей эффективной. Например, при контроле качества продукции часто мерой разброса совокупности служит выборочный размах, исполь- зуемый вместо более сложной и более эффективной оценки —выбороч- ного стандартного отклонения. При оценивании на основе малого числа наблюдений различие в эффективности невелико, если к тому же необходимо быстро получить много оценок, то затраты времени на вычисление оценки становятся решающим фактором. 5. Оценки, основанные на объединении выборок. Предположим, из большой совокупности со средним р и дисперсией о2 производятся две. случайные выборки объемом /ц и п2. Предположим также, что оценки хг и х2 величины р и оценки sf и s2 величины о2, полученные по этим выборкам, являются несмещенными. Возникает проблема комбинации пар этих оценок для получения несмещенных оценок р и о2. Соответ-* ствующий процесс, использующий две или больше выборки, называет- ся объединением. 214
Чтобы получить объединенные несмещенные оценки среднего и дис- персии, следует воспользоваться формулами: среднее дисперсия «1+«2—2 Легко показать, что Е (р) = р, Е (о2) = ст2. Формулы (1) и (2) легко обобщить на случай k выборок. Численные примеры 1. Предельная нагрузка для выборки из 5 стальных стержней равна соответственно 16, 13, 11, 14, 16 усл. единиц. Известно, что совокупность подчиняется нормальному закону. (а) Дайте несмещенную и эффективную оценку средней предельной нагрузки совокупности стальных стержней. (б) Дайте несмещенную и неэффективную оценку среднего сово- купности. (в) Получите смещенную и несмещенную оценки дисперсии сово- купности. (г) С помощью несмещенной оценки о2 получите смещенную оценку ст. Ответы (а) х = — — несмещенная и эффективная оценка р. По выбороч- 70 . . ным данным получим: х = -у = 14. (б) Выборочная медиана х будет несмещенной оценкой р. По данным выборки находим х = 14. (в) Смещенная оценка о2: ~2 2(х-х)2 22 + 12+324-02+22 18 ст, =-------=------------------——-—о,о. п 5 5 Несмещенная оценка ст2: ~2= S(x-x)2 18 5 п — 1 4 Обратим внимание на различие двух оценок. Смещение первой оценки вправо наиболее заметно при малых значениях п. (г) ст = Vo2 = 1/4,5 = 2,12 — смещенная оценка. 2. Вторая выборка из 7 стержней в условиях примера 1 дала сле- дующие несмещенные оценки: р = 15 и о2 = 5,2. Найти объединен- ную несмещенную оценку для среднего и дисперсии совокупности. 215
Ответ. По формулам (1) и (2) й ответам 1 (а) и 1 (в) получим сле- дующие значения для объединенных оценок: ^=5114+7115 б 5+7 а2±+5±б±,2=4 4 + 6 Упражнение 2.7.1 1. Для наблюдений каждой из шести случайных выборок получите оцен- ки среднего совокупности, которые (а) несмещены, эффективны, состоятельны, (б) несмещены, неэффективны, состоятельны, (в) смещены, неэффективны и не- состоятельны, (г) найдите смещенную и несмещенную оценки дисперсии сово- купности. Предполагается, что либо распределение нормально, либо оно приб- лиженно нормально. (1) Выборка 5 сопротивлений: 0,32; 0,28; 0,31; 0,30; 0,29 Ом. (2) Диаметры шести шаров в шарикоподшипниках: 2,01; 1,99; 2,00; 2,00; 2,01; 1,98 мм. (3) Оценки на экзамене по физике: 43, 64, 55, 59, 80, 46, 61, 72, 53, 47. (4) Увеличение частоты пульса солдат после проверки физических данных: 10, 13, 6, 8, 12, 8, 7, 10, 12, 14 ударов. (5) Процентное содержание витамина С в выборке витаминных драже: 14,3; 15,2; 16,3; 14,8; 12,9. (6) Увеличение быстроты чтения у детей, отстающих в развитии, после спе- циальных занятий: 35, 27, 40, 45, 38, 39, 41, 38 слов/мин. 2. В каждом из экспериментов задания 1 была произведена повторная вы- борка. По полученным данным были вычислены несмещенные оценки х~ и s2. Объемы выборок и значения х и s2 приведены далее. Найдите объединенные не- смещенные оценки среднего и дисперсии каждой совокупности. (1) Сопротивления: х = 0,30 Ом; s2_= 10-4; п = 9. (2) Шары в шарикоподшипниках: х = 2,00 см; s2 = 6,4 , 10~5; п = 8. (3) Оценки по физике: х = 53; s2 = 100; п = 10. (4) Увеличение частоты пульса: х — 9 ударов; s2 — 4; п = 11. (5) Процентное содержание витамина С: х = 14,0; s2 = 0,25; п = 7. (6) Увеличение быстроты чтения: х = 36 слов/мин; s2 = 21; п — 12. 3. Покажите, что (1) оценки ц и ов для объединенных выборок (см. 2.7.1, б)) несмещены и (2) оценка, образованная как взвешенная средняя несмещенных оценок некоторого параметра (веса могут быть любые), сама является несмещен- ной оценкой этого параметра. 4. Обобщите формулы (1) и (2) из 2.7.1, б) на случай k выборок. 5. Из большой совокупности со средним р и дисперсией о2 произведены три выборки объема 9,13 и 17, которые дали средние 10,1; 11,3 и 14,2 и диспер- сии (п — 1 в знаменателе) 4,1; 6,3 и 5,4 соответственно. Найдите объединенную несмещенную оценку среднего и дисперсии совокупности. ' в) Интервальное оценивание. Вас попросили определить (т. е. оценить) возраст некоторого человека. Допустим, после некоторых колебаний вы сказали, что ему 35 лет. В таком случае вы произвели точечное оценивание, т. е. назвали единственное число без уточнения меры уверенности в том, что ему именно столько лет. Однако возможен и другой ответ в виде интервала, которому принадлежит возраст, данного человека. Например, можно ответить: ему от 32 до 38 лет или между 30 и 40 годами. При этом можно определить и меру уверенности в правильности данного ответа. Например, некто может сказать: 216
Рис. 103. Выборочное распределение оценки Ь\ среднее р. (Как правило, хоро- шо аппроксимируется нормальным рас- пределением; значение Р находится из таблиц) «Наверняка его возраст лежит между 20 и 50 годами» или «Мне ка- жется, ему от 30 до 40 лет» или «Его возраст должен быть между 32 и 35 годами, но я в этом не уверен». Очевидно, чем больше длина ин- тервала, тем скорее этот интервал будет содержать значение оцени- ваемой величины и поэтому тем больше уверенность в том, что оцени- ваемая величина будет принадлежать этому интервалу. Приведенный пример хорошо иллюстрирует идеи, лежащие в основе методов, известных под названием доверительного интервального оценивания. Сейчас мы покажем, каким образом вычисляются дове- рительные интервалы для пара- метров совокупности и как для этих интервалов строятся меры доверия. Общие принципы построе- ния доверительных, интервалов. Предположим, что доверитель- ный интервал отыскивают для некоторого параметра р сово- купности и в качестве точечной оценки этого параметра берут несмещенную выборочную ста- тистику b = f (лу, х2, хп). Оценка b должна иметь выборочное распределение со средним Е (b) = Р и стандартным отклонением S. D. (Ь) = сгь. Установим прежде всего, что нам известно и что предстоит найти. Параметр р неизвестен, наша цель состоит в его оценке. Однако имеет- ся некоторая информация о совокупности, полученная в предыдущих экспериментах. Чтобы получить представление о выборочном рас- пределении оценки Ь, мы рассмотрим ее вместе с данными выборки и при построении доверительного интервала для р воспользуемся вы- борочным распределением. Замечателен тот факт (см. центральную предельную теорему и замечания к ней в 2.6.2, в)), что большинство выборочных статистик на практике имеют нормальное или близкое к нормальному выбороч- ное распределение. Этот результат позволяет с помощью вероятностей для нормального распределения найти такой интервал (Р — d, Р + d), в котором лежит значение Ь, вычисленное по данной выборке (рис. 103). Можно решить и обратную задачу — по данной величине вероят- ности отыскать значение d. Например, для вероятности, равной 0,95, из таблиц стандартного нормального распределения найдем d/ub = = 1,96. Другими словами, вероятность того, что значение Ь, опре- деленное по выборке, лежит в интервале [р — 1,96 оь, р-|- 1,96 аь] равна 0,95. Это можно записать следующим образом: Р [р — 1,96 аь < b < р + 1,96 сгь1 = 0,95. Неравенства в квадратных скобках могут быть записаны в другой эквивалентной форме lb •— 1,96 иь Р «С Ь + 1,96 сгь 1 (вычитаем b + Р из каждой части и умножаем неравенство на — 1, при этом знак 217
неравенства изменится на противоположный). Таким образом, можно сделать следующее вероятностное утверждение: Р[Ь — 1,96 оь < р < b + 1,96 оь] = 0,95. Это приводит нас к 95%-ному доверительному интервалу для р, т. е. к интервалу [Ь — 1,96 сть, b + 1,96 оь]. В общем случае доверительный интервал выражается в виде [Ь — — z<yb, b + zob], где z — число, полученное из таблиц выборочного распределения Ь. Это число выбирается исходя из желаемого доверия, выраженного в процентах, которое приписывается интервалу, и на- зывается коэффициентом доверия, доверительным коэффициентом или, иногда, критическим значением. Граничные точки доверитель- ного интервала называются соответственно нижним и верхним дове- рительными пределами. Пример. Случайная выборка измерений роста 100 студентов- юношей с шестого семестра колледжа дала следующие результаты: средний рост равен х = 1,73 м, а выборочная дисперсия (несмещенная) s2 = 0,00245. Найти (а) 95%-ные, (б) 99%-ные доверительные границы для среднего совокупности студентов-юношей исследуемого колледжа. Решение (а) Нужно оценить среднее р совокупности. Выборочное среднее х = 1,73 м может быть использовано в качестве несмещенной точеч- ной оценки р. Нам известно, что х имеет распределение, близкое к нормальному, со средним Е (х) = р и стандартным отклонением _ о S. D. (х) = , где о — стандартное отклонение всей совокупности, Vn , а и = 100. Поэтому 95%-ный доверительный интервал для р будет следующим: Для вычисления границ этого интервала нам известно все кроме ст. Можно показать, что для п > 30 (ориентировочно) замена ст вы- х — 1,96 > х + 1,96 борочным стандартным отклонением s = _ не изменяет п—1 уровня доверия интервала. Таким образом, приближенные 95%-ные доверительные пределы для р равны: — s I нижняя граница — х — 1,96 ~zz = 1,73—1,96 • 0,00495 = 1,720 м; . |/ п — S верхняя граница = х 1,96 = 1,73 Д- 1,96 • 0,00495= 1,740 м; •_ 95%-ный доверительный интервал будет [1,720; 1,740]. (б) Для определения 95%-пого интервала мы воспользовались коэф- фициентом доверия z — 1,96. Если мы хотим обеспечить нашему оце- ниванию большую уверенность, мы должны построить более широкий интервал. Для 99%-ного интервала из таблиц нормального распреде- ления находим, что доверительный коэффициент будет равен г = 2,58. (Здесь читателю будет полезно вернуться к 2.4.6 и повторить свойство 218
нормального распределения.) Итак, приближенные 99%-ные дове- рительные пределы для р будут следующими: _ s нижняя граница — х — 2,58 —— — 1,73—2,58 • 0,00495 = 1,717 м; у п _ S верхняя граница = х + 2,58 = 1,73 -ф 2,58 • 0,00495 = у п = 1,743 м; 99%-ный доверительный интервал будет [1,717; 1,743]. Вывод ы. Чтобы определить доверительный интервал для пара- метра р, необходимо сначала найти несмещенную выборочную оценку Ь, для которой известны выборочное распределение и стандартное отклонение сть. Тогда 100 Р%-ный доверительный интервал будет равен b ± гоь, где доверительный коэффициент z выбран так, что Р [Ъ — z • сгь С Р С b + z • оь1 = Р. Иногда значение сть известно из полученной ранее информации о совокупности. В противном случае в больших выборках вместо зна- чения оь можно подставить оценку sb, вычисленную по наблюдениям выборки. Такой способ ведет, как правило, к незначительному из- менению степени доверия. Вероятностное утверждение, содержащееся в доверительном ин- тервале, необходимо правильно интерпретировать. При чтении записи Р [а <1 р bl — Р мы не должны думать, что Р есть случайная переменная, лежащая с вероятностью Р между а и Ь. Параметр р — константа, нам не известная, принимающая фиксированное значение, и поэтому относительно Р вероятностные утверждения не допускают- ся. А вот верхний и нижний пределы а и b будут случайными перемен- ными. Любой интервал [а, Ь], найденный по выборке, можно рассмат- ривать как элемент интервалов соответствующей совокупности. Та- ким образом, доверительный интервал имеет свое выборочное распре- деление. Поэтому утверждение Р [а р <2 й] — Р означает, что для данного интервала, выбранного из совокупности интервалов, вероят- ность содержать значение р равна 100 Р%. Другими словами, если бы мы рассмотрели большое число выбо- рок и каждый раз вычисляли бы интервал [cz, bl, то приближенно 100 Р% из них содержали бы значение р. В таком смысле и нужно понимать степень доверия интервала. Упражнение 2.7.2 1. Вычислите (а) 95%-ный и (б) 99%-ный доверительные пределы для среднего совокупности в каждом из следующих случаев: Измерение Выборочные наблюдения S.D. сово- купности (известно) а X Число сигарет, выкуренных за день 12 144 4 Число слов в предложении 27 225 7 Длина предплечья 18,1 единицы 100 0,82 Диаметр мускульной мышцы 17,1 » 625 3,4 Длина антенны 37,2 » 324 4,5 219
2. Найдите точный доверительный коэффициент для (а) 90%-ного, (б) 60%-ного, (в) 99,9%-ного и (г) 50%-него доверительного интервала при усло- вии, что соответствующее выборочное распределение нормально. 3. Получите (а) 90%-ный и (б) 50%-пый доверительные интервалы для сред- них совокупностей из задания 1. Замечание. 50%-ный доверительный интервал часто исполь- зуется в экспериментальных работах по физике, астрономии и т. д. Половину длины интервала (=0,674 о) называют вероятной ошибкой оценивания. Точечное оценивание и доверительные интервалы для некоторых параметров. Наиболее часто точечные и интервальные оценки тре- буется определять для средних, отношений, разностей двух средних и стандартных отклонений. Необходимые для этого оценивания фор- мулы приведены в таблице. Стандартная запись доверительного интер- вала b ± zob является наиболее общей. Параметр совокупности (fS) Точечная оценка (Ь) Доверительный интервал (для Р) Выборочные оценки (для оь) Среднее р. Доля л Разность сред- них (pi—р2) Стандартное отклонение о X р (Xi—Xz) S X i zox Р ± 2Ор (*1— Х2) ±2-0^^) s ± zas х Д/ п ‘ п(п—1) - Рд-Р) °Р V п а(71-72)=8‘|Л где s определяется по формуле (2) для объеди- ненной оценки дисперсии (см. 2.7.1,б), с. 215) Os-l/2n Замечания (1) Формулами из таблицы следует оперировать в случаях, когда выборка случайная. Формулы для разности средних основаны на предположении, что выборки независимы. (2) В некоторых случаях сть известно из априорной информаций о совокупности. Тогда соответствующая выборочная оценка не при- нимается во внимание. (3) Для каждой формулы доверительных интервалов и для любого уровня доверия коэффициент z может быть найден из таблиц нормаль- ных интегралов. Этот путь приведет к точному результату, если со- вокупность, из которой производится выборка, имеет нормальное распределение; в другом случае получающаяся ошибка будет мала при достаточно большом п (п > 30). 220
Приведем несколько значений z: Уровень доверия, % 50 90 95 99 99,7 Доверительный коэффициент 0,674 1,645 1,96 2,58 3,00 Примеры 1. Для предварительного опроса населения некоторого города в связи с избирательной компанией была произведена случайная вы- борка 400 участников. 160 человек заявили, что они проголосуют за кандидата лейбористов. Получите точечную оценку и 95 %-ный доверительный интервал доли избирателей данного города, которые отдадут предпочтение на выборах кандидату-лейбористу. Решение (см. формулу 2 в таблице). Доля отдавших предпочтение партии лейбористов в выборке р = 160/400 = 0,4. Это число и будет нашей точечной оценкой л — доли голосов в городе за кандидата этой партии. Оценка S. D. выборочного распределения р в выборке объема 400 будет равна а -1/|/21±£^=0,0245. р V п V 400 Отсюда получаем, что 95 %-ный доверительный интервал для л будет следующим: р + 1,96 ир =0,4 + 1,96 • 0,0245 = 0,4 ± 0,048, т. е. [0,352; 0,448]. 2. Почва двух участков земли была тщательно проанализирована и оказалась одинаковой по составу. На этих участках была посеена пшеница одного сорта. На участок А внесено удобрение, а на участок В нет. Через месяц со дня посева пшеницы с каждого участка была произведена случайная выборка 50 растений, при этом измерялась их длина. Средние значения и выборочные дисперсии (несмещенные), вычисленные по полученным данным, оказались равными: хл=323мм, хв = 297 мм, si = 441, si = 529. Оцените разность средних рл — рв (эту величину можно при- нять за меру эффекта воздействия удобрения на рост пшеницы). Най- дите также для разности средних 99%-ный доверительный интервал. Решение (см. формулу 3 в таблице на с. 220). Точечная оценка для Ра — Рв будет равна ха — хв = 323—297 = 26 мм. Нам необходимо оценить стандартную ошибку этой величины. Прежде всего найдем несмещенную оценку дисперсии этой оценки. s2 =-------------------=(см. формулу (2) из 2.7.1, б) = 49-4414-49-529 485 504-50 — 2 221
Это число можно назвать внутренней дисперсией. Тогда стандартная ошибка переменной (хА — хв) будет следующей: o=s-i/ — ± J_=V485.|/—=4,4. |/ пА ПВ |/ 50 Окончательно с помощью доверительного коэффициента z — 2,58 мы получим 99%-ные доверительные пределы для цА— которые будут равны (хА~хв) ±20=26 ± 2,58-4,4=26 ± 11,35 мм. Итак, мы нашли 99%-ный интервал (14,65; 37,35). Упражнение 2.7.3 1. В 100 бросаниях копейки герб выпал 63 раза. Найдите 90%-ные довери- тельные границы доли бросаний, при которых появляется герб, при большом числе бросаний монеты. Замечание. Найденный интервал определяет доверительные границы (приближенЯЬ1е) Для вероятности Р (И), где событие Н означает, что выпал герб. Можно ли иа основании выборки и вычисленных границ сказать, что монета неправильная? 2. Из урны, содержащей синие и зеленые шары в неизвестной пропорции, производится случайная выборка 64 шаров (с возвращением). Оцените долю л зеленых шаров в урне, если 16 шаров в выборке оказались зелеными. Найдите (а) 95%-ные и (б) 99%-ные доверительные пределы для л, (в) вероятную ошибку оценивания. 3. С производственной линии, производящей сигареты, было отобрано 900 сигарет, 45 из них оказались бракованными. Оцените долю дефектных сига- рет во всей совокупности л и найдите 90%-ные доверительные границы для этой величины. 4. Какой объем выборки с производственной линии надо взять в предыду- щем пример6 для того, чтобы со степенью доверия (а) 95%, (б) 99,7% можно было утверйДать> что зх не отличается от выборочной доли р более чем на 5%. (При вычисЛ6НИИ °р возьмите л = 45/900.) 5. Были произведены выборки из пяти различных совокупностей, для каж- дой выборки были вычислены средние и S. D. Для каждого из множеств выбороч- ных данных, приводимых далее, найдите: (а) 95%-ные и 99%-ные доверительные интервалы для средних' каждой совокупности- (б) 90%-ные и 99,7%-ные доверительные интервалы для стандартных от- клонений совокупностей (в условных единицах): Измерения Выборочное среднее х S.D. получено на основе s2 Объем выборки п Скорость чтения Предельная нагрузка на прут Вязкость нефти Урожай зерна, удобрение А Добыча парафина из торфа (в %); рас- творитель А по 7,4 4,600 43 5,3 12 0,1 0,012 5 2,1 100 49 65- 30 40 6. После изменения некоторых условий экспериментов из предыдущего задания выбоРки были повторены. При этом вычислялись значения средних и S. D. Результаты представим в виде таблицы (в условных единицах): 222
X S п Скорость чтения после специальных упражнений 130 14 81 Предельная нагрузка на прут после химической обработки 8,2 0,11 54 Вязкость нефти с добавлением примеси 4,721 0,013 70 Урожай зерна, удобрение В 40 4,5 45 Добыча парафина из торфа с примене- нием растворителя В 6,4 2,4 50 (а) По данным таблицы вычислите 95%-ные и 90%-ные доверительные интер- валы для средних новых совокупностей. (б) Для каждого эксперимента сравните выборочные характеристики с соот- ветствующими характеристиками из задания 5. В каждом случае вычислите раз- ность выборочных средних. Можно ли сказать, что полученные разности отража- ют истинные изменения в совокупностях или же эти расхождения полностью объ- ясняются только случайностью выборок — они могли возникнуть в силу имеющегося разброса выборок. Найдите 95%-ные доверительные интервалы для каждой раз- ности средних. Помогут ли вам эти интервалы ответить на вопрос о характере расхождений между выборками? Что делать, если выборки небольшие? В этой книге мы не даем полного изложения теории малых выборок, а ограничиваемся лишь несколькими практическими советами. Прежде всего, очевидно, что чем меньше выборка, тем меньше будет степень доверия, соответст- вующая оцениваемому интервалу. И обратно, при заданном уровне доверия ширина интервала для малых выборок будет больше, чем для выборок большего объема. Учесть это обстоятельство можно, обеспе- чив зависимость доверительного коэффициента от п. Учитывающий эту зависимость доверительный коэффициент обозначают в отличие от z буквой /. Естественно, что соответствующие формулы будут совпа- дать с формулами для больших выборок, только вместо z будет стоять t. Далее приводятся формулы вычисления доверительных интервалов для среднего совокупности р и для разности средних двух совокупно- стей. Доверительный интервал Степень свободы (v) Среднее р Разность рх—1'а X ± /-О'- X (Х1-Х2)±/О-- - (Л-1 —Л-2) л-1 ПХ-1-Л2--2 Выборочные оценки для о- и о- умножаются на истинное значение t, получаемое из таблиц так называемого /-распределения Стьюдента. Значение t для данного уровня доверия определяется не 223
по объему выборки, а по числу, которое известно под названием степень свободы. Эту величину будем обозначать греческой буквой v. Для предлагаемых в книге задач приведенной сокращенной таб- лицы значений t будет достаточно. Таблица значений t Степень свободы 3 4 5 7 9 10 15 20 25 30 Доверитель- 90% 2,35 2,13 2,02 1,89 1,83 1,81 1,75 1,72 1,71 1,70 ные 95% 3,18 2,78 2,57 2,36 2,26 2,23 2,13 2,09 2,06 2,04 уровни 99% 5,84 4,60 4,03 3,50 3,25 3,17 2,95 2,85 2,79 2,75 Пример. Рассмотрим данные экспериментов (1) — (6) из зада- ний 1 и 2 упражнения 2.7.1. Первое множество наблюдений пред- ставляет собой выборку сопротивлений; измерения сопротивлений дали следующие результаты: выборка 1 : 0,32; 0,28; 0,31; 0,30; 0,29 Ом; выборка 2: известно, что х = 0,30 Ом, s2 = 10-4, п = 9. (а) Найти границы 95%-ного доверительного интервала для сред- него совокупности по данным выборки 1. (б) Вторая выборка была произведена месяцем позже первой. В те- чение этого промежутка времени значения сопротивлений могли изме- ниться. Найти границы 99%-ного доверительного интервала для изменения средних всей совокупности сопротивлений в течение месяца. Решение (а) Для выборки из пяти измерений вычисляем х = 0,30 Ом и s = = 0,0158 (по смещенной оценке s2). Для 95%-ного уровня доверия из таблицы значений t при 4 сте- пенях свободы найдем доверительный коэффициент t = 2,78. Таким образом, искомые границы доверительного интервала будут равны х + t -^==0,30 + 2,78--в’0*58 =0,30 + 0,0197 Ом. ~ 1 — ’ у-5 (б) Разность средних двух совокупностей по истечении одного ме- сяца можно оценить как хх — х2 = 0,30—0,30 = 0, т. е. выборочное среднее не изменилось. Но мы должны помнить, что хх — х2 есть слу- чайная переменная и обе выборки малы. Рассматриваемые совокупно- сти на самом деле могли иметь разные средние, хотя разность выбо- рочных средних и оказалась равной нулю (это могло произойти чисто случайно). Однако по выборочным данным можно оценить доверитель- ный интервал, с помощью которого найдем границы доверительного интервала изменения среднего, предполагая, что такое изменение произошло. 224
Сначала оценим сг _ — стандартное отклонение выборочного распределения хх — х3. Объединяя наблюдения двух выборок, получим: где s2 Qi-1) sl + Oz —l)s^ 4-0,00025+8-10-4 Л1+Л2 — 2 5+9 — 2 поэтому s = 0,0122. Таким образом, ст- - = 0,01221/ — =0,0068. *i-*2 I/ 45 Для 99% степени доверия и при 12 степенях свободы доверитель’ ный коэффициент будет равен t = 3,05. Отсюда следует, что границы искомого доверительного интервала для цх — ц2 будут равны (хх—Хо) -4- t<5- - = 0 + 3,05 • 0,0068 = 0 + 0,021 Ом. Итак, если в течение месяца изменение среднего произошло, то мы можем быть уверены на 99% в том, что величина этого изменения лежит в интервале [ — 0,021; + 0,021]. Упражнение 2.7.4 1. Для каждого из экспериментов (2) — (6)-заданий 1 и 2 упражнения 2.7.1 выполните вычисления, аналогичные предыдущему примеру. В каждом случае найдите 95%-ные и 99%-ные доверительные границы изменения средних. На основе полученных доверительных интервалов ответьте на вопрос, произошло ли изменение в действительности. Замечание. Если нуль входит в интервал, то, очевидно, мы должны допустить, что цх — |12 = 0, т. е. изменения на самом деле не произошло. Если нуль не принадлежит интервалу, то можно сделать вывод, что налицо некоторый сдвиг в значениях средних совокупностей. Более аргументированный ответ на этот вопрос будет дан в следующем параграфе. 2. Химик делает шесть измерений концентрации серной кислоты и обнару- живает, что средняя концентрация равна 9,234 со стандартным отклонением 0,12. Проводя опыты с кислотой из другой бутылки, он делает одиннадцать из- мерений, для которых средняя концентрация равна 8,86, а стандартное откло- нение — 0,21. Найдите границы (а) 90%-ных, (б) 95%-ных, (в) 99%-ных довери- тельных интервалов разности средних величин концентрации кислоты в двух 'бутылках. Были ли наполнены бутылки одной и той же кислотой? 3. С помощью случайной выборки, состоящей из 16 витаминных драже, исследовалось содержание витамина Е. Среднее значение содержания витамина Е оказалось равным 18,1 весовой единицы, а стандартное отклонение — 7,2 (вычисленное по несмещенной оценке а2). Найдите границы 95%-ного доверитель- ного интервала среднего содержания витамина Е во всей совокупности вита- минных драже. 4. Выборка лампочек некоторого сорта Л исследовалась на продолжитель- ность свечения. Время непрерывного свечения выбранных лампочек (в условных единицах): 21, 32, 28, 14, 30, 27, 30. 8 Зак. 973 225
Исследование выборки лампочек другого сорта В дало следующие резуль- таты: 27, 35, 29, 16, 25, 28, 29, 34, 18, 30. (а) Найти границы 99%-ного доверительного интервала для средней про- должительности безотказной работы лампочек каждого сорта (рл и р5). (б) Найти границы 95%-ного доверительного интервала для разности Рд — Ид средней продолжительности работы лампочек двух сортов. 5. Покрышки, произведенные на заводе А, исследовались на износ (в км пройденного пути). При этом оказалось, что средний пробег равен 25 000 км, s = 1200. При тех же условиях испытывались покрышки, изготовленные на заводе В. Средний пробег равен 23 500 км, а в = 1000. Найти 99%-ный доверительный интервал разности средних для покрышек, изготовленных на двух заводах. 2.7.2. ТЕОРИЯ СТАТИСТИЧЕСКИХ РЕШЕНИЙ Рассмотрим второй подход к проблеме статистического вывода, известного как принятие решений. Соответствующие методы тесно связаны с методами доверительных интервалов и вместе с тем содер- жат новые идеи, такие, как мощность критерия и проверка гипотез. а) Статистические решения. Информация, полученная на основе выборки из некоторой совокупности, может быть использована для формулировки некоторых утверждений обо всей совокупности. На- пример, приступив к выпуску нового вида покрышек для автомоби- лей, мы отберем некоторое число этих покрышек и подвергнем их определенным тестам. Полученные результаты должны послужить основой для вывода о том, являются ли новые покрышки лучше ста- рых или нет, и для решения о целесообразности их производства. Подобные решения называются статистическими решениями. Очень важен их вероятностный характер, благодаря которому мы всегда в состоянии вычислить вероятность того, что принимаемое ре- шение будет ошибочным. Основное достоинство теории принятия статистических решений состоит в возможности объективного измере- ния в рамках вероятностных категорий степени риска, соответствую- щего тому или иному решению. б) Статистические гипотезы. Осуществляя эксперимент броса- ния монеты, будем записывать результаты в виде Н (герб) или Т (ре- шетка) в порядке их появления. На основании полученных наблюде- ний мы хотим сделать вывод, является монета правильной или нет. Предположим вначале, что монета правильная. Затем исследуем ре- зультаты наблюдений для выяснения, согласуются они со сделанным предположениями или нет. Мы отвергнем (примем) наше предполо- жение, если результаты не соответствуют (соответствуют) принятой гипотезе. Вообще говоря, исходное предположение должно быть переформу- лировано как предположение относительно одного или нескольких параметров совокупности. Например, в эксперименте с бросанием монеты предположение о правильности монеты равносильно тому, что вероятность р выпадения герба при каждом бросании равна 0,5. Зная р, мы получаем возможность найти распределение вероятностей числа выпадений герба при п бросаниях, т. е. соответствующее бино- миальное распределение. 226
Предположения такого рода называются статистическими ги- потезами. Очень часто они формулируются как предположения о не- изменности того или иного параметра совокупности, об отсутствии его смещения или же относительно характера изменения параметра в нескольких совокупностях. Одно из таких предположений выби- рается в качестве исходного; оно называется нулевой гипотезой и обозначается символом Нп. Например, для обозначения гипотезы «монета правильная» мы запишем Но: р = 0,5. Наряду с нулевой гипотезой рассматривают и другие возможно- сти — альтернативные гипотезы. Таким образом, процедура про- верки гипотез, представляющая собой основание статистического решения, может быть выполнена довольно точно. В случае экспери- мента с монетой альтернативной гипотезой будет р 0,5 или, воз- можно, р > 0,5. Альтернативную гипотезу будем обозначать Н1. в) Проверка гипотез. После того как нулевая гипотеза сформу- лирована, можно выяснить, какого рода выборку мы вправе ожидать при ее выполнении. Если произведенная случайная выборка заметно отличается в некотором смысле от той, которую мы ожидаем, то мы говорим, что наблюдаемое различие значительно и вправе отвергнуть нулевую гипотезу и принять альтернативную. Если наблюдаемое раз- личие невелико, то мы можем принять нулевую гипотезу или же об- ратиться к дополнительным статистическим данным, прежде чем прий- ти к окончательному выводу. Однако где проходит линия между значимостью и незначи- мостью, принятием и отвержением гипотезы /Д? Хотя в силу присут- ствия в эксперименте случайных колебаний эта граница не может быть проведена абсолютно точно, можно рассмотреть возможность опреде- ления вероятностного уровня значимости. Далее читатель увидит, каким образом принимаемое решение в проверке гипотез зависит от случайной переменной, известной как статистика критерия (теста). Примерами таких статистик, с помощью которых находят доверительные интервалы, могут служить коэффициенты доверия г и /. В общем случае также можно определить критическое значение соот- ветствующей статистики, которым пользуются не только для выясне- ния, значима ли выборочная разность или нет, но также и для оценки величины этой значимости. Для объяснения основных принципов значимости тестов мы снова рассмотрим эксперимент с бросанием монеты. На этом же примере мы обсудим некоторые важные детали. г) Принципы значимости тестов. Пример. На основании результатов бросаний мы хотим опре- делить, является монета правильной или нет. Решение этой задачи разобьем на следующие шаги. Шаг 1. Формулировка нулевой и альтернативных гипотез. В экс- перименте с монетой мы можем принять следующие гипотезы: нулевая гипотеза Но : р — 0,5 (монета правильная); альтернативная гипотеза /Дгр^-ОД (монета неправильная); эквивалентная гипотеза : р <_ 0,5 или р > 0,5; такая гипотеза называется двусторонней альтернативой. 8* 227
Шаг 2. Выбор соответствующего уровня значимости. Допустим, наше первоначальное решение состояло в отклонении нулевой гипо- тезы -— монета неправильная; тогда можно найти вероятность того, что это решение ошибочно. Уровнем значимости критерия назовем вероятность ошибочного отклонения нулевой гипотезы. Для обозначения этой вероятности, как правило, употребляют греческую букву а. Прежде чем выпол- нять эксперименты, выберем значение а. В статистике наиболее упот- ребительны следующие значения: 0,05; 0,01 и 0,001. Для эксперимента с монетой возьмем а = 0,05. Это означает, что мы должны выполнить такую процедуру проверки, при которой в 5 случаях из 100 мы приходим к выводу о неправильности монеты, хотя на самом деле она правильная. Шаг 3. Определение объема выборки п. Определение объема про- изводимой выборки зависит от таких условий, как затраты экспери- ментирования; время, необходимое на получение выборки; соблю- дение статистически неизменных условий; величина случайных коле- баний, присутствующих в эксперименте; возможность принятия не- правильного решения. Дальнейшее обсуждение проблемы определе- ния объема выборки потребовало бы более полного изучения теории проверки гипотез*. Для эксперимента с монетой выбор значения п может быть осу- ществлен в достаточно широких границах, поскольку затраты можно считать несущественными — каждое бросание и запись результата занимают немного времени. Очевидно, что если монета неправильная, то чем больше значение п, тем ярче результаты эксперимента будут подтверждать этот факт. Поэтому мы выберем п по возможности до- статочно большим — это позволит более эффективно установить ее смещение, если оно невелико. Шаг 4. Выбор тестовой статистики критерия. (Выборочное рас- пределение этой статистики в предположении /Д должно быть из- вестно.) При п бросаниях монеты число появлений герба (х) имеет биномиальное распределение вероятностей со средним пр и дисперсией пру (см. 2.4.5, а)). Известно, что если п велико и р не близко к значе- ниям 0 или 1, то биномиальное распределение может быть аппрокси- мировано нормальным с тем же средним и той же дисперсией. Величиной х мы будем пользоваться в качестве тестовой статисти- ки (статистики критерия). Информация о ее выборочном распределе- нии потребуется на следующем шаге. Шаг 5. Вычисление критической области и области принятия гипотезы. Предполагая, что пулевая гипотеза верна, а значения п и а выбраны, вычислим область значений тестовой статистики, позво- ляющую принять гипотезу Н0. Значения х, лежащие вне ее, назовем критической областью. Область значений х, позволяющая принять гипотезу /70, выбирается таким образом, что если значение тестовой * Раздел статистики, занимающийся этими вопросами, называется планиро- ванием экспериментов. — Примеч. пер. 228
статистики, полученной по данным выборки, не попадает к нее, то выполнимость предположения Нп подвергается сомнению. Для эксперимента с монетой //0 : р = 0,5 и а = 0,05. На рис. 104 показано, как нормальное распределение аппроксимирует биномиаль- ное выборочное распределение числа выпадений герба в п бросаниях. На этом же рисунке видно, как надо выбирать критические значения хг и х2 с тем, чтобы вероятность попадания значений х выборки вне интервала [хх, х2] была равна а. В нашем эксперименте нет оснований для выбора несимметричной области, поскольку нет предварительной информации, позволяющей определить направление смещения, если оно существует на самом де- ле. Герб может появляться чаще, чем решетка, и наоборот. Мы отверг- ли бы гипотезу /70, если бы число выпадений герба было бы очень мало, точно так же мы отвергли бы эту гипотезу при очень большом числе появлений решетки. Рис. 104. Выборочное распределение числа выпа- дений герба в п бросаниях. Среднее рав- но пр, S.D.—^npq В подобных ситуациях мы будем применять так называемый дву- сторонний тест, процедура которого подразумевает возможность существования смещения в обоих направлениях. (Пример односторон- него теста будет приведен далее.) Возможность ошибочно отвергнуть гипотезу Но возникает в силу того, что выборочное значение может случайно попасть в критическую область. Это произойдет, когда значение х окажется на одном из «хво- стов» распределения. Принимая во внимание симметричность области принятия гипотезы, мы приписываем каждому «хвосту» вероятность, равную а/2 (вероятность попадания х в критическую область равна а). Величина а и есть заданный уровень значимости. Для эксперимента с монетой из таблиц нормального распределения мы находим, что приблизительно для 95% выборок объемом п число выпадений герба будет лежать между хг = (пр—1,96 V npq) и х2 = (flP + 1,9бУ пр<?). Эти значения х будут критическими, они оп- ределяют границы области принятия гипотезы Но. Для их вычисления мы воспользуемся значением п, установленным для данного экспери- мента на третьем шаге, а величину р найдем из определения нулевой гипотезы (т. е. р = 0,5). Читатель, наверное, уже заметил большое 229
сходство предыдущей формулы и формул определения доверительных интервалов доли выпадения гербов в совокупности при многократ- ном бросании монеты. Очень важно подчеркнуть, что к тому же самому интервалу мы подошли с других позиций, хотя область принятия ги- потезы и доверительный интервал совпадают. Для того чтобы оконча- тельно понять сходство и различие изложенных подходов, необходи- мы большая практика в их применении, внимательное изучение этих вопросов по более полным курсам статистики. В общем случае у нас имеется тестовая статистика х, выборочное распределение которой известно и определяется с помощью некоторых параметров, например, таких, как р, и сг. Значения этих параметров определяются в условиях нулевой гипотезы Но. Критические зна- чения хг и х2 находятся из интегральных таблиц выборочного рас- пределения с тем, чтобы Р [%! < X < Х2] = 1 — а- Интервал хг < х < х2 определяет область, обеспечивающую про- верку нулевой гипотезы с соответствующим уровнем значимости (а). Как правило, предполагают, что стандартизированная величина z = либо нормальна, либо по крайней мере является прибли* женно нормальной, поэтому критическое значение коэффициента z может быть найдено из таблиц нормального распределения. Соот- ветствующие значения х находятся затем с помощью линейного пре- образования. Шаг 6. Формулировка правила проверки гипотезы. Общее правило проверки гипотезы может быть сформулировано следующим образом: а) Гипотеза Но при заданном уровне значимости а отвергается, если выборочное значение х попадает в критическую область (т. е. лежит вне интервала [xlt х2]). В таком случае принимается альтернативная гипотеза б) Гипотеза Но принимается, если выборочное значение принад- лежит области принятия гипотезы [xj, х21. (В некоторых случаях, особенно при небольшом объеме выборки, а также для значения х, близ- кого одному из критических значений хх или х2, решение о принятии гипотезы Но откладывается до момента, когда будет собрана допол- нительная информация.) Шаг 7. Выполнение эксперимента и проверка гипотезы. Выполним п испытаний эксперимента и на основе полученных результатов най- дем значение выбранной тестовой статистики. Затем применим пра- вило проверки гипотезы, сформулированное на предыдущем шаге. Замечание. Прежде чем выполнять эксперименты, необхо- димо тщательно сформулировать все процедуры статистической про- верки гипотез. До начала работы с полученными наблюдениями вы- борки нужно выбрать тестовую статистику, уровень значимости, ре- шить вопрос об использовании одностороннего или двустороннего критерия. Изменение условий проверки гипотез на основе интуитив- ных соображений, как правило, ведет к неверным вероятностным выводам. 230
Окончательное решение примера. Проверка монеты на смещение. Шаг 1. Гипотезы: Но: р = 0,5; Т/i: р 0,5. Шаг 2. Уровень значимости: а = 0,05. Шаг 3. Объем выборки: предположим, мы решили монету бро- сать 100 раз, т. е. п — 100. Шаг 4. Тестовая статистика: х — число гербов, выпавших в 100 бросаниях. В условиях гипотезы Но х имеет приближенно нормальное рас- пределение со средним 100 • 0,5 = 50 и стандартным отклонением V100 • 0,5 • 0,5 = 5. Шаг 5. Область принятия гипотезы и критическая область. Критическими значениями х (в предположении, что измерения непрерывны) будут следующие: хг=пр—1,96 V пр</=40,2 и х2=пр + 1,96 l/np<7=59,8. Областью принятия гипотезы будет множество целых чисел, лежащих между 41 и 59 включительно. Критической областью будут множества целых чисел между 0 и 40 и между 60 и 100 включительно. Шаг 6. Правила проверки гипотезы. а) Гипотеза Но (монета несмещенная, т. е. правильная) должна быть отвергнута при 5%-ном уровне значимости, если число появле- ния герба в выборке принадлежит одному из множеств критической области. б) Гипотеза Но должна быть принята (или же ее принятие отло- жено), если наблюдаемое число появлений герба лежит в области принятия гипотезы, т. е. между 41 и 59 включительно. Шаг 7. Выполнение эксперимента и проверка гипотезы. Чита- тель может самостоятельно выполнить этот эксперимент, т. е. взять монету и подбросить ее 100 раз, записав при этом число выпадений герба. На основании этого эксперимента необходимо решить, являет- ся монета правильной или нет. Для обсуждения процесса проверки гипотезы мы рассмотрим сле- дующие три возможных результата: 1) х = 38, 2) х = 46, 3) х = 58. Результат 1. х = 38 принадлежит левому множеству критиче- ской области. Мы отвергаем гипотезу Но и делаем вывод о том, что мо- нета смещена в сторону выпадения решетки по сравнению с выпаде- нием герба. Сделанный вывод может оказаться неверным в 5% слу- чаев. Результат 2. х = 46 лежит внутри области принятия гипоте- зы, поэтому мы принимаем Но. Поскольку значение 46 далеко от гра- ниц критических значений, у нас нет оснований подозревать смещение у монеты. ?3|
Результат 3. х = 58 находится внутри области принятия гипо- тезы, хотя и близко к правому критическому значению. Можно было бы принять гипотезу Но, основываясь на правиле (б). Однако целе- сообразнее на этом этапе не принимать никаких решений. У нас мо- жет возникнуть подозрение в том, что в монете имеется смещение, которое ведет к тому, что герб выпадает чаще, чем решетка. В таком случае желательно получить вторую выборку и провести проверку ги- потезы о подозреваемом смещении с помощью одностороннего теста. Альтернативной гипотезой будет Нх : р > 0,5. Недопустимо пользоваться теми же данными выборки (х = 58) для повторной проверки. Если бы мы пошли на это, то укрепились бы в подозрении о существовании смещения в монете; изменился бы и ко- эффициент г, соответствующий 5 %-ному уровню значимости. Упражнение 2.7.5 1. Проверяется правильность обыкновенной игральной кости. В S00 бро- саниях наблюдалось 140 выпадений шестерки. Проверьте нулевую гипотезу о правильности игральной кости. Воспользуйтесь двусторонним тестом для уровней значимости (а) 0,05 и (б) 0,01. 2. Урна содержит большое число цветных шаров, про которые известно только, что они двух цветов — черные и белые. Какое решение можно принять относительно следующих гипотез, если в случайной выборке объемом 100 (с возвращением) 57 шаров оказались белыми? (1) Н :р = 0,5; (2) Н : р = 0,45; (3) И : р = 0,6; (4) И : р = 0,7. Каждое утверждение запишите на языке нулевой гипотезы; определите полные двусторонние альтернативные гипотезы. Для каждой проверки возьмите а = 0,05, р — доля белых шаров в урне. 3. Некто утверждает, что 5% выпускаемых с производственной линии то- варов бракованные. В качестве нулевой гипотезы рассмотрите Но : р = 0,05 и сформулируйте правило принятия решения при ее проверке с 1%-ным уровнем значимости, предполагая альтернативную гипотезу двусторонней. Объем произ- водимой выборки п = 400. ₽** Каково будет ваше решение относительно гипотезы если в произведен- ной выборке окажется 26 бракованных единиц? Пример односторонней проверки. За ряд лет рассматривается уровень результатов сдачи вступительных экзаменов по математике в высшую школу. Средний процент сдавших экзамены за этот проме- жуток времени оказался равным 55%. В 1968 г. из экзаменовавшихся 100 абитуриентов экзамены по математике выдержали 62 человека. Проверьте гипотезу о том, что это довольно высокий процент, т. е. 1968 г. был «удачным годом» в области математики для этого колледжа. Возьмите а = 0,01. Решение. Под рассматриваемой совокупностью мы подразумеваем результаты сдачи абитуриентами экзаменов по математике за все годы. Пусть р будет долей абитуриентов в этой совокупности, успешно вы- державших экзамен по математике. Процедура проверки гипотезы будет такой. Шаг 1. Гипотезы: Но : р = 0,55; П1 : р > 0,55 (односторонняя проверка). 232
Альтернативной гипотезой будет утверждение, состоящее П том, что доля успешно сдавших экзамен по математике в 1968 г. была больше обычной доли сдающих этот экзамен. Шаги 2 и 3. а = 0,01; п = 100. Шаг 4. Доля Р абитуриентов, успешно сдавших экзамен, в груп- пе^из 100 человек будет случайной переменной; эта величина имеет приблизительно нормальное распределение со средним р и дисперсией Мы можем в качестве тестовой статистики выбрать Р. Шаг 5. Область принятия гипотезы. Для этого примера требует- ся найти только одно критическое значение Р, поскольку мы интере- Рис. 105. Выборочное распределение Р (ап- проксимировано нормальным распределением) суемся смещением лишь в одну сторону от нормы. На рис. 105 показа- но выборочное распределение Р, область принятия гипотезы и кри- тическая область. Из таблиц нормального распределения находим критический ко- эффициент’г = 2,33 для одностороннего 1%-ного уровня значимости. Итак, критический уровень доли Р будет: /\=р + 2,33 |/ =0,55 + 2,33 ]/ °;5150°’45 =0.666. Поэтому областью принятия гипотезы будет интервал [0; 0,66]. Шаг 6. Правило проверки гипотезы. а) Если выборочная доля сдавших экзамены в 1968 г. больше чем 0,66, то гипотеза Но о том, что подготовка абитуриентов по математике в 1968 г. значительно превышает средний уровень, должна быть от- вергнута при 1%-ном уровне значимости. б) В других случаях До не отвергается. Шаг 7. Выполнение проверки. Выборочное значение Р равно 0,62. Это недостаточно большое значение для Р, чтобы можно было отверг- нуть гипотезу Но. Таким образом, при 1%-ном уровне значимости мы не можем сделать вывод о том, что абитуриенты 1968 г. имеют лучшую по сравнению с предыдущими годами подготовку по математи- ке. 233
Упражнение 2.7.6 1. В случайной выборке, состоящей из 900 человек с темными волосами, 150 имеют голубые глаза. Предположим, что доля голубоглазых людей среди всего населения известна и равна 0,25. Проверьте гипотезу о том, что доля тем- новолосых людей с голубыми глазами меньше, чем доля голубоглазых среди всего населения. Возьмите а = 0,05. 2. Известно, что 5% всех застраховавших свою жизнь умирает но достиже- нии 60 лет. В группе из 1000 человек этого возраста, работающих в строитель- стве, умерло 68. Проверьте гипотезу о том, что застрахованные люди, работаю- щие в строительстве, чаще умирают в 60 лет, чем все остальные застрахованные. 3. Считается, что завод, производящий за неделю 1000 единиц некоторого вида продукции, работает удовлетворительно, если в среднем доля бракованных изделий при контроле качества не превышает 3%. Допустим, в течение некоторой педели контролером было забраковано 38 изделий. Стоит ли директору завода провести более полную проверку качест- ва изделий производственной линии или же следует отнести высокий процент дефектной продукции этой недели на счет случайных изменений в условиях производства? Воспользуйтесь односторонней проверкой гипотезы с 5%-ным уровнем значимости. На примерах, в которых для тестовой статистики применялось биномиальное распределение, мы познакомили читателя с основ- ными принципами проверки гипотез. При других тестовых статистиках и распределениях проверка гипотез осуществляется аналогично. Далее будут рассмотрены три основные задачи, состоящие в про- верке гипотез о средних; их решение иллюстрируется на примерах. Эти проверки применяются в большинстве статистических исследова- ний; читателю следует внимательно изучить их и хорошо запомнить. После каждого примера следуют упражнения. Большое число различ- ных задач приводится в конце этой главы; решение этих задач поможет читателю проверить способность правильно выбирать ту проверку, которая требуется для конкретной ситуации. Для удобства приведем короткую таблицу значений критического- коэффициента z для случая, когда тестовая статистика имеет нормаль- ное распределение. Уровень значимости (а) 0,05 0,01 0,001 Критический коэффициент г Односторонняя проверка 1,65 2,33 3,08 Двусторонняя проверка 1,96 2,58 3,27 д) Проверка гипотезы о среднем совокупности. Пусть из нормаль- ной совокупности с неизвестным средним р и известным S.D. о про- изведена случайная выборка объема п. Задача состоит в том, чтобы проверить гипотезу Но: р = р', т. е. проверить предположение о ра- венстве среднего всей совокупности значению р'. Если гипотеза Но верна, то величина z = имеет стандарт- ов/п 234
ное нормальное распределение. Поэтому z (или х) может служить тестовой статистикой. Пример. Предположим, фирма, производящая электрические лампочки, гарантирует, что среднее время безотказной работы лампо- чек мощностью 60 Вт равно по меньшей мере 800 ч со стандартным от- клонением 120 ч. Из некоторой партии шестидесятиватных лампочек производится случайная выборка 25 лампочек, для которой выбороч- ное среднее времени работы лампочек оказалось равным 750 ч. Можно ли на основании этого сказать, что исследуемая выборка лампочек не удовлетворяет гарантии? Решение. Пусть р — среднее партии лампочек. Шаг 1. Нулевая гипотеза Но : р = 800. Альтернативная гипотеза Нг : р < 800 (односторонняя проверка; нас интересует, будет ли среднее меньше гарантированного миниму- ма). Шаги 2 и 3. п — 25 (дано); выбираем а = 0,05. Шаг 4. Если х — выборочное значение среднего, то х—800 г—--------- 120 1/25 есть стандартная нормальная (возможно, приближенно) величина при условии, что Но верна. Величиной г мы будем оперировать в ка- честве тестовой статистики. Шаг 5. При 5%-ном уровне значимости для односторонней про- верки наименьшее значение, при котором /70 еще не отвергается, как следует из таблиц нормального распределения, будет г = — 1,65. Таким образом, область принятия гипотезы — интервал — будет [— 1,65; + оо). Шаг 6. Правило проверки гипотезы. а) Партия лампочек не удовлетворяет гарантии, если значение z, вычисленное по выборке, меньше чем — 1,65. б) В других случаях считаем, что партия удовлетворяет гарантии. Шаг 7. Выполнение проверки. По выборочным данным находим, что У 25 Вывод. Исследуемая партия лампочек должна быть забрако- вана, поскольку — 2,83 < — 1,65. Время безотказной работы лампо- чек в партии значительно расходится с гарантированным временем работы 800 ч и более. Это решение будет неверным менее чем для 5% всех случаев. 235
Упражнение 2.7.7 1. В выборке, состоящей из 625 болтов, средняя длина болтов оказалась равной 20,05 мм. Можно ли эту выборку считать случайной выборкой из сово- купности болтов со средней длиной 20 мм и S. D., равным 0,1 мм? Примите а = 0,001. 2. Известно, что одна химическая реакция при производстве некоторого вещества дает в среднем 220 кг этого вещества; S. D. = 12 кг. После некоторых изменений в производственном процессе каждая химическая реакция в среднем стала давать 225 кг вещества с тем же самым отклонением от средней. Проверьте нулевую гипотезу о том, что изменения в технологическом про- цессе не привели к значительному увеличению производства (а) при уровне зна- чимости 0,05, (б) при уровне значимости 0,001. 3. Предельная сила натяжения некоторого вида прядильной нити в сред- нем равна 8 г. Выборку этого вида прядильной нити из 64 мотков обработали некоторым химическим составом. После просушки была заново измерена пря- дильная сила натяжения нитей, в среднем она оказалась равной 8,5 г. I Предполагая, что S. D. предельной силы натяжения равно 2 г до и после обработки химическим составом, проверьте гипотезу о том, что эта обработка не увеличила предельной силы натяжения нити. (Сделайте проверку при уровне значимости 0,05 и 0,01. Подумайте, нужна ли здесь односторонняя или двусто- ронняя проверка.) е) Критерии сравнения. Пример. Группе из 10 школьников младших классов был дан стандартный тест на проверку скорости чтения. Затем со школьника- ми был проведен специальный курс занятий, после чего детям дали второй тест. Скорость чтения оценивалась в баллах, результаты пер- вого и второго тестов таковы: Школьники 123456789 10 Первый тест Второй тест 7568387824 6798677947 Можно ли сказать, что занятия по увеличению скорости чтения дали пользу? Предполагается, что оба теста сравнимы по трудности и соответствуют нормальному распределению баллов. Решение. Как видим, для каждого теста имеется заметное разли- чие скорости чтения от школьника к школьнику. Эти колебания не дают возможности определить «на глаз», произошло ли увеличение баллов после курса занятий. Чтобы обойти это препятствие, можно рассмотреть для каждого школьника только изменения в баллах; таким образом, если занятия не принесли эффекта, то среднее измене- ний будет равно нулю. Наблюдения, в которых результаты экспериментов объединены в пары и каждая пара представляет собой самостоятельную экспери- ментальную единицу, можно исследовать, применяя критерии срав- нения. Каждая пара дает одно сравнение, которое определяет меру эффекта некоторого действия (в нашем случае курса занятий). Обозначим через d разность результатов данной пары; d будет иметь нормальное распределение со средним р и S.D. — о (в этом при- 236
мере оба параметра известны.) Значения величин для баллов за чте- ние представлены следующим образом: Школьники 1 23456789 10 d = 2-й— 1-й балл —1 2303 —1 012 3 Шаг 1. Нулевая гипотеза Но : р = 0 (т. е. курс занятий не при- вел к увеличению скорости чтения). Альтернативная гипотеза Нг: р, > 0 (т. е. занятия способствовали беглости чтения). Нг — односторонняя гипотеза, поэтому мы должны применить одностороннюю проверку. Шаги 2 и 3. Поскольку тесты предназначались для десяти детей, то п = 10. Возьмем а — 0,05. d—0 Шаг 4. Величина z = — стандартная нормальная перемен- ная, она может служить тестовой статистикой, если значение о из- вестно из предыдущих экспериментов. В нашем случае о не дано, оно должно быть оценено по выборочным наблюдениям. В качестве тесто- d—0 вой статистики рассмотрим величину t = ~ (см. 2.7.1, в)), которая sFVп имеет /-распределение Стьюдента с п — 1 степенями свободы. Шаг 5. Область принятия гипотезы. Критическое значение t при уровне значимости 0,05 (односторонний тест) равно верхнему 90 % -ному доверительному коэффициенту (см. с. 224). Для 9 степеней свободы это значение равно 1,83. Отсюда находим, что область приня- тия гипотезы будет представлять собой все множество от — оо до 1,83. Шаг 6. Правило проверки гипотезы. а) Если значение t, вычисленное по данным выборки, больше чем 1,83, то мы можем сделать вывод, что курс занятий, направленных на увеличение скорости чтения, принес значительный эффект. б) Если значение t 1,83, то мы не можем отвергнуть (при 5%-ном уровне значимости) гипотезу о том, что наблюдаемое среднее увеличе- ние баллов связано только со случайными колебаниями в результатах тестов. Шаг 7. Выполнение проверки. Из данных выборки имеем 2d = 12 и 2d2 = 38. Затем находим . 12 , „ 2 Td2—nd2 38 — 14,4 d—----= 1,2 и s2=-----------=-------'— — 10 п — 1 9 Поэтому 9,34, s И0,262 w 237
Вывод. Поскольку 2,34 > 1,83, мы утверждаем, что при 5 %-ном уровне значимости занятия заметно увеличили скорость чтения школьников. Замечания. Мы привели пример применения так называемой теории малых выборок; малое число наблюдений для оценивания S.D. = <т приводит в случае проверки гипотез к Z-статистике. Теория малых выборок коротко обсуждалась в 2.7.1, в). Другие способы проверки гипотез читатель найдет в специальных курсах статистики. Приведенные здесь критерии сравнения помогут в усвоении изложенных в этих курсах идей. Упражнение 2.7.8 1. Два химика анализируют ежедневный выпуск некоторого вида химичес- кой смеси. Каждый производит случайную выборку из дневной партии и опре- деляет процентное содержание воды в этой выборке. Результаты, полученные в течение 8 дней, следующие: День 1 2 3 4 5 6 7 8 Химик А 53 46 55 53 48 45 50 52 Химик В 50 47 53 53 47 46 45 50 Следует ли из этих данных, что методы анализа, применяемые химиками, существенно различаются между собой? Выполните проверку этой гипотезы: (а) оценивая а по различию в данных, (б) предполагая, что а — 1,23. В каждом случае возьмите rf = 0,05. Можно ли объединить данные в пары? Какого рода колебания взаимопогашаются при таком объединении? Какую проверку сле- дует применить — одностороннюю или двустороннюю? 2. Тридцать студентов выполняли контрольную работу до и после спе- циальных занятий по математике. Для каждого студента записывалась разница полученных оценок (из оценки, полученной по второй контрольной работе, вычиталась первая оценка). Среднее и S. D. этих разностей оказались равными соответственно: d= 6,1 и s = 2,3. Были ли проведенные занятия эффектив- ными? (Замечвние. Поскольку выборка большая, величина t будет хорошо аппроксимироваться нормальным распределением, поэтому вместо о можно под- ставить ее оценку s.) 3. Для исследования на растяжимость некоторого вида резины после хи- мической обработки было отобрано и перенумеровано шесть мотков резины. Каждый отобранный моток был разделен пополам, одна половина подвергалась химической обработке, другая — нет. Затем с помощью прибора, измеряю- щего растяжение материала, было замерено растяжение (в %) двенадцати кус- ков резины. Результаты представлены в таблице: Исследуемый кусок 1 2 3 4 5 6 Обработанная половина Необработанная половина 18,1 16,3 17,3 17,0 19,1 18,4 18,4 17,6 17,2 17,0 16,7 16,2 Увеличила ли химическая обработка растяжимость резины? 238
ж) Разность двух средних. Следующий критерий очень часто встре- чается в статистических расчетах. Пример. Студенты последних семестров двух высших школ сдавали экзамены по физике. В вузе А, где экзаменовались 30 сту- дентов, средняя оценка оказалась равной 52. Во втором вузе В—36 студентов и их средняя оценка оказалась равной 47. Стандартное от- клонение оценок на экзаменах по физике, вычисленное для нескольких тысяч студентов, равно <т = 12. Подготовлены ли студенты вуза А по физике лучше, чем студенты вуза В, или нет? Решение. Как видно из данных, студенты из вуза А подготовлены по физике в среднем лучше, чем студенты из вуза В. Для студентов, о которых имеются данные, это бесспорно. Однако мы можем рассмотреть этот вопрос более широко: можно ли утверждать, что вуз А дает лучшую подготовку по физике, чем вуз В. После установления этого факта можно было бы выяснить причины лучшей подготовки студентов в вузе А. Возможно, при этом оказалось бы, что в вузе А лучше лабораторное оборудование, сильнее препода- вательский состав по физике. Более хорошая подготовка могла быть следствием и того, что в вузе А было проведено больше занятий по физике, чем в вузе В, и т. д., и т. п. Изучение причин подобного ре- зультата не является предметом статистического исследования, кото- рое в основном ограничивается лишь демонстрацией значимой раз- ницы между двумя выборочными средними. Проверка гипотезы состоит в следующем. Шаг 1. Обозначим через р,д и р,в средние совокупности оценок по физике для студентов вузов А и В соответственно. Нулевая гипотеза Но-. р.д = рв (рл — рв = 0). Альтернативная гипотеза Н-Ц. рл > рв- Поскольку нас интересует только, лучше ли подготовлены сту- денты вуза А, чем студенты вуза В, то мы пользуемся односторонней альтернативной гипотезой. Шаги 2 и 3. Па = 30 и пв = 36 (дано). Возьмем а — 0,05 — уро- вень значимости. Шаг4. Тестовая статистика. У нас нет другой информации, кроме двух выборочных средних. Если бы мы даже имели индивидуальные результаты студентов, мы не могли бы применить парный критерий сравнения, так как для объединения в пары у нас нет объективных причин. Разность средних хд—Хв представляет собой меру сравнения подготовки студентов вузов А и В. Эта величина распределена при- ближенно нормально со средним рд— рд и стандартным отклонением Поэтому в качестве тестовой статистики мы можем взять.стандартную нормальную величину 239
(хл-Хд)-(рл-р.д) о' Если Но истинна, то — цд = 0, поэтому тестовая статистика в этом случае превращается в такую: Z = *А~ХВ о' Шаг 5. Область принятия гипотезы. Критическое значение z при 5 %-ном уровне значимости для односторонней проверки гипотез равно 1,65. Поэтому областью принятия нулевой гипотезы будет множество значений z, не превосходящих 1,65. Шаг 6. Правило принятия гипотезы. а) Если выборочное значение z> 1,65, то делаем вывод, что вуз Л дает подготовку по физике лучше (при 5%-ном уровне), чем вуз В. б) Если z < 1,65, то заключаем, что общая подготовка по физике в вузах А и В практически одинакова. Шаг 7. Выполнение проверки. Значение о дано и равно 12. Поэтому Таким образом, выборочное значение тестовой статистики будет: z ХА~ХВ 52—47 2,96 ^1,69. О Вывод. Подготовка по физике студентов из вуза А значительно лучше, чем подготовка студентов из вуза В при 5%-ном уровне зна- чимости. Преподавателям из вуза В было бы полезно установить при- чину различия в качестве подготовки студентов по физике. Упражнение 2.7.9 1. С целью ускорения производства некоторого товара производственная линия подверглась модификации. Для исследования эффекта от этой модифика- ции было зафиксировано время изготовления каждой из 50 единиц товара при старом и новом процессе. Для немодифицированного процесса среднее время из- готовления одной единицы товара оказалось равным 35 с, а для процесса, под- вергшегося модификации — 33 с. Стандартные отклонения времени изготовле- ния товаров для первого и второго процессов можно приблизительно считать одинаковыми. Вычисленное значение объединенной оценки S. D. равно 1,5 с. Можно ли сделать вывод, что скорость изготовления товаров при модифи- цированном процессе больше? 2. Выборка из 50 стальных пружин исследовалась на растяжение. При этом оказалось, что среднее растяжение при нагрузке в 1 кг равно 3,8 мм. Другую вы- борку, состоящую из 40 таких же пружин, подвергли горячей обработке и измерили среднее их растяжение при той же нагрузке. Выборочное среднее растяжение оказалось равным 4,0 мм. Общее стандартное отклонение растяже- ний для одной пружины можно положить равным 0,5 мм. Можно ли утверждать, что горячая обработка значительно увеличила растяжимость пружин? 240
3. Для проверки эффекта нового лекарства были отобраны две случайные группы страдающих гриппом по 60 человек в каждой. Одной группе давали таблетки, не содержащие никакого лекарства, другой группе давали по внеш- нему виду такие же таблетки, но содержащие новый вид лекарства от гриппа. В первой выборке люди выздоровели в среднем через 7 дней, тогда как во второй — в среднем через 6 дней. Стандартное отклонение для продолжитель- ности лечения гриппа (для одного человека независимо от того, принимал или не принимал он лекарство) можно положить равным 2 дням. Можно ли на основании полученных результатов сказать, что новое лекарство существенно ускоряет выздоровление от гриппа? Упражнение 2.7.10 (смешанные задачи) 1. Сельскохозяйственный эксперимент показал, что 50 участков, засеян пых некоторым сортом пшеницы, дали в среднем урожай, равный 76,3 х X 103 м3/км2, со стандартным отклонением, равным 5,2 103 м3/км2. Найдите границы (а) 95%-ного и (б) 99%-ного доверительных интервалов для среднего урожая с одного участка при посеве данного сорта пшеницы. 2. На том же поле (см. задание 1) выбрано еще 50 участков, которые засея- ны другим сортом пшеницы. Средний урожай на участках с этим сортом оказался равным 80,1 • 103 м3/км2, a S. D. = 7,5 • 103 м3/км2. Будет ли средний урожай этого сорта пшеницы значимо превосходить,, средний урожай пшеницы пер- вого сорта. Предположите, что все условия двух экспериментов совпадают. Возьмите а = 0,05. 3. Предположим, что при выполнении эксперимента в задании 2 выбира- лось небольшое поле из 25 участков. Каждый участок был разделен на две рав- ные части: случайным образом выбиралась одна половина и засеивалась первым сортом пшеницы, другая часть засеивалась другим сортом. Урожай измерили и записали разность урожаев для каждого участка (урожай пшеницы второго сорта минус урожай пшеницы первого сорта). Выборочное среднее разности урожаев оказалось равным 3,5 • 103 м3/км2, а подсчитанная дисперсия — 16 х X 103 м3/км2. (а) Дает ли второй сорт пшеницы существенно больший урожай, чем пер- вый? (б) Проверьте гипотезу о том, что разность средних урожаев больше чем 5 • 103 м3/км2. (в) Получите границы 95%-ного доверительного интервала для совокуп- ности разностей средних урожаев. (г) Что можно сказать о планировании экспериментов в этом задании и в заданиях 1 и 2? 4. В школе случайным образом отобрали 40 мальчиков и 40 девочек. Каж- дый из отобранных учеников получил один и тот же тест для выявления умст- венных способностей. Результаты теста: Мальчики Дерочки Средний балл Стандартное отклонение 71 5 76 6 Проверьте при уровне значимости 0,05 гипотезу о том, что опрошенные девочки более способны, чем мальчики. Получите границы 99%-ного доверительного интервала для разности сред- них двух рассмотренных совокупностей (среднее для девочек минус среднее для мальчиков). 5. Фирма, производящая новый вид лекарства, объявила, что оно излечи- вает от гриппа менее чем за 4 дня и его эффективность равна 95%. В случайной выборке из 300 человек, заболевших гриппом и принимавших это лекарство, 241
272 поправились менее чем за 4 дня. Было ли заявление фирмы состоятельным? (Примените односторонний критерий с 1%-ным уровнем значимости.) 6. Было произведено 10 измерений диаметра оси пропеллера. При этом ока- залось, что среднее х = 6,20 мм, а стандартное отклонение s = 0,05 мм (ис- пользовалась несмещенная оценка). Найдите границы (а) 95%-ного и (б) 99%-ного доверительных интервалов истинной величины диаметра. Поскольку выборка мала, примените /-статистику. 7. Пропеллер из задания 6 поместили в условия с высокой температурой и произвели еще 7 измерений диаметра его оси. Среднее на этот раз оказалось равным 6,25 мм, а стандартное отклонение — 0,05 мм. Можно ли из этого сде- лать вывод, что диаметр оси пропеллера существенно увеличивается (при 5%-ном уровне значимости) в пространстве с высокой температурой? 8. Проведено шесть измерений времени реакции насекомого на некоторый возбудитель: 0,20; 0,22; 0,19; 0,21; 0,20; 0,21 с. Найдите границы (а) 95%-ного и (б) 99%-ного доверительных интервалов среднего времени реакции для всей совокупности измерений. 9. Автомобиль имеет четыре покрышки, каждая наполовину сделана из ре- зины сорта А, а наполовину — из резины сорта В. Все колеса автомобиля вра- щаются с одинаковой скоростью, поэтому можно считать, что они находятся в одинаковых условиях. После 10 000 км пути покрышки были исследованы на износ, результаты исследования (в баллах) приводятся в таблице: Покрышка 1 2 3 4 Износ резины А Износ резины В 32 25 40 28 36 27 35 26 Сделайте проверку односторонней гипотезы о том, что резина В больше изнашивается, чем резина А. Возьмите а = 0,05.
28 ГЛАВА ПАРНЫЕ (ДВУМЕРНЫЕ) ЭКСПЕРИМЕНТЫ 2.8.1 ПРИМЕРЫ ПАРНЫХ ЭКСПЕРИМЕНТОВ В экспериментах, рассматриваемых до сих пор, при каждом испы- тании проводилось только одно измерение. Очень часто выполняются такие эксперименты, в которых измеряют две или более наблюдаемые характеристики. Подобные эксперименты называются многомерными. В приведенной таблице даются примеры объектов измерения и их ха- рактеристики, полученные в результате случайных экспериментов: Объекты измерения И змеряемые характеристики 1 2 3 1. Солдат 2. Пенни 3. Студент 4. Образец сплава металлов 5 Сеянец 6 Яйцо кукушки 7. 11-летний школь- ник Вес Время обращения Математические способности Твердость Возраст Диаметр Средний школь- ный балл Рост Вес Способности в других областях Прочность на растяжение Высота Объем Годы пребывания в школе Вес Принадлежность родителей к соци- альной группе В каждом из экспериментов 1—5 над объектом производится два измерения; такие эксперименты называются двумерными, или парными. Эксперименты 6 и 7 содержат три измеряемые характеристики; их можно назвать трехмерными. 2.8.2. ПОНЯТИЕ СТАТИСТИЧЕСКОЙ ЗАВИСИМОСТИ Цель проведения парных экспериментов заключается в выясне- нии, существует ли зависимость между полученными в результате переменными. Если такая зависимость существует, то можно вычислить меру этой зависимости и найти математическое уравнение, более или менее точно ее отражающее. Для иллюстрации различного рода зави- симостей, которые мы будем в дальнейшем обсуждать, рассмотрим не- которые числовые примеры парных экспериментов. 243
а) Иллюстративные примеры. Эксперимент 1. Случайным образом были отобраны десять детей, для каждого ребенка измерили его рост и вес. Результаты измерений: Ребенок 1 2 3 4 5 6 7 8 9 10 Рост, м 0,62 0,58 0,54 0,59 0,60 0,65 0,58 0,62 0,58 0,60 Вес, унция 150 120 100 120 130 170 ПО 140 130 140 Эксперимент 2. Из большого мешка, содержащего монеты оди- накового достоинства, случайным образом отобрали десять монет. Каждая из них была взвешена и для каждой был определен ее возраст. Результаты полученных наблюдений: Пенни 1 2 3 4 5 6 7 8 10 Время обращения, лет Вес, унция/100 9,41 9 9,50 14 9,33 17 9,34 23 19,31 31 9,26 35 9,22 42 9,30 46 9,15 50 9,08 Эксперимент 3. Из старшего класса некоторой школы случайно отобраны десять учеников. Данные об их среднегодовых оценках по математике и другим дисциплинам (по стобалльной системе в %): Ученик 1 2 3 4 5 6 7 8 9 10 Математика, % 80 48 62 53 45 72 60 41 53 57 Другие дисциплины, % 53 61 56 72 48 51 45 58 50 46 Обсуждение. Каждый из приведенных экспериментов со- стоит в получении случайной выборки десяти объектов измерения из некоторой совокупности; для каждого объекта измеряются две харак- теристики. Таким образом, все три эксперимента будут парными, . а объем выборки в каждом случае равен десяти. Чтобы выявить зависимость (или связь) между двумя соответствую- щими парами переменных, мы должны изучить множества результа- тов наблюдений. Однако, прежде чем приступить к выполнению этой задачи, полезно обсудить некоторые предварительные идеи. Какого рода зависимости мы можем получить? Будет ли тяжелый по весу маль- чик высоким? Будет ли старая монета меньше весить, чем новая? 244
Если ученик имеет хорошие оценки по математике, будет ли он иметь хорошие оценки и по другим дисциплинам? Очевидно, что на эти вопросы нельзя дать однозначные, абсолют- но точные ответы, однако мы можем аргументированно на первые два вопроса ответить «да, в среднем» и «не знаем» — на третий. Наши наблюдения помогут нам решить, является ли ответ «да» правильным, и позволят найти способ уточнить ответ «не знаем». б) График рассеяния. Как всегда, когда наблюдения представле- ны в таблицах, первый шаг в анализе процесса состоит в построении различного рода графиков и диаграмм, с помощью которых можно было бы исследовать его основные характеристики и направление Рис. 106 развития. Наиболее простую иллюстрацию парных наблюдений дает график (или диаграмма) рассеяния. Любые два измерения объекта можно рассматривать как упорядоченную пару чисел и изобразить ее точкой на плоскости в прямоугольной системе координат. Таким образом, каждому наблюдаемому объекту соответствует точка на плоскости. Множество этих точек образует график рассеяния экспери- мента. На рис. 106 изображены графики рассеяния для трех экспери- ментов из 2.8.2, а). Замечание. Для простоты численная разметка шкал опуще- на; разумеется, при практической работе с данными такое упрощение нецелесообразно. 245
Упражнение 2.8.1 1. Изучите графики на рис. 106 и ответьте на следующие вопросы: (1) Всегда ли ребенок данного роста весит больше, чем ребенок меньшего роста? (2) Будет ли в среднем менее высокий ребенок чаще весить больше, чем ре- бенок высокого роста? (3) Легче ли старая монета более новой? (4) Приведите возможные причины этой зависимости. (5) Отличается ли зависимость в росте и весе мальчиков от зависимости возраста и веса для монет? Если да, то попытайтесь объяснить это различие. (6) Интересуется ли студент, успешно занимающийся математикой, дру- гими предметами больше, чем студент, который не выделяется математически- ми способностями. Подтверждается ли ваш ответ графиком рассеяния? (7) Можете ли вы сказать, что между ростом и весом ребенка существует определенная связь? Если это так, опишите эту связь. (8) Существует ли зависимость между величинами возраста и веса монеты? Если это так, то дайте словесное описание этой зависимости. (9) Связаны ли математические способности с успехами в других дисцип- линах? Если да, то опишите эту зависимость. 2. Вновь нарисуйте приведенные выше графики, пользуясь осями коорди- нат с разметкой шкал. После этого ответьте на следующие вопросы. (1),Известно, что рост ребенка из совокупности эксперимента 1 оказался равным 0,6 м; как выдумаете, чему будет равен его вес? (Для аргументированной оценки воспользуйтесь графиком рассеяния.) (2) Известно, что вес другого ребенка оказался равным 100 унциям; как вы думаете, чему равен приблизительно его рост? (3) Если у вас есть монета выпуска 1940 г. (эксперимент 2), то сколько (приблизительно) она будет весить? Считайте, что эксперимент проводится в 1976 г. (4) Если ученик на экзаменах по другим дисциплинам (кроме математи- ческих) получил 85 баллов (эксперимент 3), получит ли он хорошую оценку на экзамене по математике? Попытайтесь предсказать его оценку по матема- тике (по стобаллыюй системе). 3. Для каждого из следующих множеств данных определите подходящим способом термины «эксперимент», «совокупность», «выборка», «объект измерения», «переменные» и установите объем выборки. Нарисуйте графики рассеяния и опишите любые зависимости между переменными, которые могут быть выявлены; (1)____________________________________________________ Возраст 1 6 1 7 9 10. 1 10 1 11 Тестовый балл 1 1 1 5 11 30 1 25 1 32 (2) Сила яда 1 30 1 35 | 40 1 45 1 50 Число погибших 1 ° 1 3 1 7 1 9 1 10 (3) Балл до тренировки 1 9 18 17 | 10 15. 21 Балл после тренировки 1 12 15 26 24 | 16 18 27 (4) Кровяное давление 115 118 122 129 135 132 150 Длина руки 6,0 5,5 6,3 5,8 6,1 6,4 5,9 246
которое выражено YA (К Рис. 107. (а) Сильная корреляция (па- раболическая). (б) Переменные не кор- релируют. (в) Слабая отрицательная кор- реляция (возможно, линейная), (г) Сильная положительная линейная кор- реляция в) Описание зависимостей. Теперь попытаемся объяснить чита- телю, что нужно понимать под словами зависимость между переменны- ми. В многомерных экспериментах, когда говорят о статистической зависимости, обычно пользуются словом корреляция. Таким образом, для эксперимента 1 соответствие большого веса высокому росту, маленького веса — небольшому росту ребенка, в приближенно линейной фор- ме, может быть описано как положительная линейная корреляция. В эксперименте 2 с мо- нетами переменные, которы- ми являются измерения воз- раста и веса монет, показы- вают сильную линейную за- висимость, но в противопо- ложном направлении. В та- ком случае будем говорить о высокой отрицательной ли- нейной корреляции. Оценки математических способностей и способностей по другим дисциплинам по- казывают очень малое соот- ветствие, т. е. эти перемен- ные некоррелированы. Если все пары значений из парного эксперимента удовлетворяют некоторому уравнению абсолютно точно, что рассматриваемые переменные полностью коррелированы (функцио- нально связаны). В других случаях существует некоторая меньшая степень корреляции, зависящая от того, насколько близко точки на графике рассеяния приближаются к некоторой кривой. Если точки рассеяны по плоскости беспорядочно, не группируясь друг с другом, то мы говорим, что переменные некоррелированы. На рис. 107 показаны различные виды зависимостей, которые могут возникнуть на практике. то в таком случае мы говорим, 2.8.3. ИЗМЕРЕНИЕ КОРРЕЛЯЦИИ Мы видели, что две переменные могут быть коррелировапы в Мень- шей или большей степени. Направление в расположении точек на гра- фике рассеяния может характеризовать либо линейную, либо нелиней- ную зависимость. Перейдем теперь от анализа парных экспериментов на уровне графиков к дальнейшему исследованию вопроса корреляции. Для этого нам надо решить некоторые задачи: 1) получить численную меру степени корреляции; 247
2) пойытаФься ВыяйниТь, возникает ли наблюдаемая корреляция вследствие эффекта случайности в выборке; 3) выбрать наилучшую функциональную связь (математическое уравнение, связывающее X и Y) для использования ее при описании корреляционной зависимости. При этом мы должны всегда помнить, что совокупность в целом может намного отличаться от картины, полученной на основе выборки, особенно, если объем выборки мал. Полное решение этих задач лежит за пределами нашей книги. Здесь будут затронуты лишь некоторые понятия и разобраны методы, кото- рые применяются в простейшем случае, когда график рассеяния ука- зывает на линейную корреляцию. Прежде всего мы дадим формулу вычисления статистики, представ- ляющей собой численную меру корреляции между двумя переменными, в предположении существования между ними линейной связи. Затем мы обсудим критерий значимости для этой статистики и границы до- верительных интервалов для соответствующего параметра совокуп- ности. Далее мы рассмотрим проблему регрессии, т. е. перейдем к на- хождению функциональной связи между наблюдениями. а) Коэффициент корреляции. Пусть выборочные наблюдения со- стоят из п пар измерений (хъ yt), i = 1, ..., п. Соответствующей мерой степени линейной зависимости между пе- ременными X и Y будет статистика 1 л ~ 2 (Xi—x) (yt—y) п 1=1 г =------1--------------, sx'sy где sx — стандартное отклонение множества значений х, a sy — стан- дартное отклонение значений у. Статистика г называется коэффициентом произведения моментов линейной корреляции, или просто коэффициентом корреляции. Числитель в формуле для г есть среднее произведение соответст- вующих отклонений х и у от их выборочных значений (отсюда название произведение моментов). Эту величину называют выборочной ковариа- цией X и Y и обозначают sxy. С помощью этого обозначения коэффи- циент корреляции можно переписать следующим образом: г 5 ХУ Sx'Sy Позже мы покажем, почему эта статистика будет хорошей мерой линейной корреляции. Сначала найдем значение г для двух простых случаев. (Замечание. Другие способы вычисления г приводятся в 2.8.3, в).) Пример 1 Наблюдения: х 2 4 6 8 у 2 5 7 10 248
График рассеяния показан на риС- 108- Вычисление г: х = 5; У—У 16+1 + 1 + 16 4 (—3) (—4) + ( —1) ( —D +1 1 + 3 4 1 3 1 4 _________26/4 У'2б~ ]/34~ 2 2 =0,997. ю - 8 - 6 - 4 - УК 10 - • в - 6 - 4 - 2 - • __i—i—।—।—।— О 2 4 6 8 10 X __I--1--1—1--L—>. О 2 4 6 8 10 X Рис. 108 Рис. 109 Пример 2 Наблюдения: х 2 4 6 8 у 10 7 5 2 График рассеяния показан на рис. 109. Вычисление г: х = 5; У = 6. (-3)4+(-1)1 + 1(-1) + 3-(-4) 3 —4 26 4~ 1/20~ . ~|/34~ 2 2 = -0,997. В обоих примерах абсолютная величина г одна и та же и равна 0,997, но отличается по знаку. Любому множеству данных, у которых гра- фик рассеяния имеет отчетливое линейное направление, будет соот- 249
ветствовать значение г, близкое по абсолютной величине к 1; оно будет положительным, когда обе переменные одновременно либо воз- растают, либо убывают, и отрицательным, когда одна переменная воз- растает, а другая убывает. Упражнение 2.8.2 Нарисуйте график рассеяния и вычислите г для каждого из следующих множеств наблюдений. Сравните коэффициенты1корреляции и графики рассеяния. (1) X 1 2 3 4 5 (2) X 1 2 3 4 5 У 1 2 3 4 5 У 2 1 3 3 6 (3) X 1 2 3 4 5 (4) X 1 2 3 4 5 [У 4 3 1 2 0 У 1 -1 1 —1 1 б) Свойства коэффициента корреляции. Из определения коэффи- циента корреляции г следуют его свойства: 1) г — число, лежащее между — 1 и + 1 включительно; 2) если г = + 1 (или — 1), то точки выборки лежат на одной пря- мой; 3) если значение г близко к + 1 (или — 1), то существует сильная линейная зависимость между переменными; 4) если г мало (близко к нулю), то корреляция между переменны- ми слабая, даже в том случае, если график рассеяния указывает на некоторую нелинейную зависимость между переменными; 5) г — безразмерная величина; опа не зависит от единиц измерения Хи У йот выбора начала координат (см 'цания 6 и 7 из упражнения 2.8.3). Коэффициент корреляции будет хорошей мерой тесноты линейной связи двух переменных. в) Формула для вычисления. Как показано в п. а), коэффициент корреляции может быть вычислен непосредственно по формуле Sxy/iSxSy). Однако вычисления значительно упростятся, если восполь- зоваться следующей формулой для нахождения sxy: s =^-—ху. (1) п Читателю рекомендуется проверить эквивалентность этой формулы определению sxy = 1/лЕ (х —х) (у — у)Л (Раскройте скобки и просуммируйте все члены.) Аналогичные формулы могут быть записаны и для дисперсий: а Sx2 ~2 Sx=-------х. (2) п С помощью формул (1), (2), (3) и при необходимости линейного пре- образования переменных (г не изменяется при таких преобразованиях) вычисление г становится сравнительно простой^процедурой. 250
Примерь! 1. (Пример 1 из п. а).) Данные: Решение X2 У2 ху 2 4 6 8 2 5 7 10 X = 5; y — 6. 4 16 36 64 4 25 49 100 4 20 42 80 Sx2= 120 Sy2= 178 Sxi/= = 146 s2=- 120 4 -25 = 5; s£=- 178 -36= 17 . 4 2 146 13 sxy 4 —30= ~ 2 ’ 13 =0,997, как и раньше. х У 2. (Данные эксперимента 1 из 2.8.2, а).) X и Y предварительно под- вергаются линейному преобразованию. Вычисления удобно записы- вать в столбцы, из которых находятся пять сумм Sh, Sv, St/2, Sv2 и Stzv, необходимых для вычисления г. X у и V Vя UV 0,62 150 8 5 64 25 40 0,58 120 4 2 16 4 8 0,54 100 0 0 0 0 0 0,59 120 5 2 25 4 10 0,60 130 6 3 36 9 18 0,65 170 11 7 121 49 77 0,58 ПО 4 1 16 1 4 0,62 140 8 4 64 16 32 0,58 130 4 3 16 9 12 0,60 140 6 4 36 16 24 Всего 56 31 394 133 225 Преобразование: и — 100х — 54, v = 0,1л/ — 10; [s2 = 0,lSu2 — ua = 8,04, s? = 0,1 Sv2 — v = 3,69; Suo = 0.1S (uv) — и • v = 5,14. 251
1/8,04-3,69 из множеств данных, пользуясь схемой (2) х 1 2 3 4 5 </21336 (4) х 1 2 3 4 5 а 1—1 1—1 1 Таким образом, г r suv _ 5,14 гху—' UV— — 5 и Sv Упражнение 2.8.3 1. Найдите значения г для каждого примеров 1 и 2: (1) х 1 2 3 4 5 1/ 1 2 3 4 5 (3) х 1 2 3 4 5 у 4 3 1 2 О 2. Вычислите г для множеств данных из задания 3 упражнения 2.8.1. 3. Вычислите г для данных о монетах из 2.8.2, а), эксперимент 2. 4. Вычислите г для данных об учениках из 2.8.2, а), эксперимент 3. 5. Покажите, что для вычисления г можно воспользоваться формулой r _ sxy_______________________nXxy—jZx) (Sy)________ ' sxsy ~ V[nSx2—(Sx)2] [nSy2-(Sy)2] 6. Рассмотрите множество данных X I 2 3 4 5 у 2 1 3 3 6 (1) Составьте новое множество данных, умножая каждое значение х на 2 и прибавляя к результатам 3, каждое значение у умножая на 3 и вычитая из ре- зультата 1 (эти операции будут линейными преобразованиями переменных). (2) Нарисуйте график рассеяния и вычислите г для нового множества данных. (3) Сравните полученный график и найденное значение г с результатом, полученным для этих же данных без линейного преобразования. (4) Пусть над переменными X и Y произведены линейные преобразования и = ах + b, v — су + d. Покажите, что Syp --- acsxy't Sy — csy. Докажите, исходя из этого, что rxy — ruv. г) Значимость г. Возвратимся к проблеме получения выводов о величине корреляции, существующей в двумерной совокупности, из которой производятся выборки. Предположим, из двумерной совокупности производится слу- чайная выборка объема п пар значений (xif уг). Например, в экспери- менте 2 из 2.8.2, а) мы имели десять пар значений, полученных по де- сяти монетам (время обращения, вес). Эту выборку можно рассматри- вать как случайную выборку объемом 10, полученную из большой со- вокупности таких пар, соответствующих большому числу (допустим, миллиону) подобных монет. Предположим далее, что выборочные данные привели к значению коэффициента корреляции, равному г, а данные всей совокупности (если бы они были собраны) дали бы значение, обозначаемое греческой буквой р. Основная цель эксперимента заключается в том, чтобы по данным выборки определить, чему равна корреляция во всей совокупности, 252
т. е. получить оценку р. Разумеется, в качестве оценки р можно взять г, однако мы должны отдать себе отчет в том, насколько хороша эта оценка. Это главный вопрос в любой статистической работе, исполь- зующей статистические выводы. Каждый раз, когда, производя выборку из совокупности, мы можем вычислять значения г, причем эти значения будут отличаться друг от друга, коэффициент корреляции будет случайной переменной со своим собственным выборочным распределением. Очевидно, что форма и рас- положение этого распределения зависят от формы распределения сово- купности и значения р, а также от объема выборки. Поэтому для того, чтобы ответить на вопрос, насколько хорошо г оценивает р, мы должны иметь информацию о выборочном распределении г и о его связи с р и п. В 1915 г. английский математик Р. А. Фишер (R. A. Fisher), за- ложивший основы современной статистической теории, нашел точное выборочное распределение у для нормального случая. Исследованием этой функции было установлено, что форма распределения г значи- тельно изменяется для различных значений р и (или) п. Методы про- верки значимости г, основанные на выборочном распределении, очень громоздкие и требуют использования различных таблиц значе- ний рассматриваемой пары (р, п). В том случае, когда выборочное распределение статистики (такой, как г) имеет сложную форму, пытаются преобразовать эту величину в новую переменную, выборочное распределение которой проще. Решая проблему таким способом, Р. Фишер нашел, что преобразова- 1 14-/* ние г — у In (= arth f) обладает тем свойством, что новая случайная переменная имеет приближенно нормальное распределе- ние. Чем больше объем выборки, тем больше точность вычислений. Среднее распределения равно arth р, а дисперсия 1/(п — 3) не зави- сит от р. Таким образом, переменная г подходит для целей построе- ния критерия значимости. Таблицы th х и arth х приводятся в большинстве справочников ста- тистических таблиц. д) Использование z-преобразования. Проверка гипотезы о р осно- вана на точно той же идее, что и проверка гипотезы относительно р, описанная в начале гл. 2.7. Мы рекомендуем читателю вспомнить со- держание этой главы, прежде чем приступать к изучению проверки гипотезы относительно р. Мы проиллюстрируем на примерах некоторые аспекты приме- нения ^-преобразования. Проверка гипотезы Н : р = р0. Пример. Случайная выборка объема 39 из двумерной нормаль- ной совокупности дала значение г — 0,8. Проверим гипотезу Но: р === 0,6 (т. е. мы проверяем, могла ли быть получена наша выборка из совокупности с коэффициентом корреляции, не превышающим 0,6. Альтернативная гипотеза р > 0,6). Решение. Сначала преобразуем значение г и гипотетическое зна- чение р. Получим; z - arth г = arth 0,8 = 1,099; 253
pz = arth p = arth 0,6 = 0,693. Если гипотеза истинна, то z распределено приближенно нормально со средним р,2 = 0,693 и дисперсией о2 — 1/(39 — 3) = 1/36. Поэтому величина и = ——— есть стандартная нормальная величина (среднее cz 0 и дисперсия 1). Ее значение в этом случае будет равно и = 1,099 —0,693 о /1О1 “ 0,167 ~ 2,461 ’ 0.05 Рис. 110 Гипотеза Н принимается Применяя односторонний критерий при уровне значимости 0,05, мы отвергаем гипотезу, только если и будет больше 1,64 (рис. ПО). Поскольку и = 2,431 > 1,64, мы отвергаем Н: р = 0,6. Таким образом, при заданном уровне значимости мы можем утверждать, что коэффициент корреляции со- вокупности больше, чем 0,6. Проверка различия между двумя коэффициентами кор- реляции. Пример. По двум не- зависимым выборкам объе- мом п1 = 53 и п2 — 40 бы- ли вычислены коэффициен- ты корреляции г} = 0,6 и г2 = 0,4. Имеется ли в коэф- фициентах значительное отличие? (Другими словами, можем ли мы отвергнуть гипотезу о том, что выборки взяты из совокупностей с одинаковым коэффициентом корреляции.) Решение. Гипотеза, подлежащая проверке, И: р, — р2 = 0. Для ее проверки мы воспользуемся выборочным распределением — г2 следующим образом. Преобразование гг и г2 приведет нас к 1.М и 1 Гипотеза Н отвергается zt = arth 0,6 — 0,693; z2 — arth 0,4 = 0,424. Если H истинна, то величина z± — z2 будет нормальной переменной с нулевым средним и дисперсией о2х= Var (zl—z2)= —1---р -—1— =0,047*. 53—3 40—3 Применяя двусторонний критерий (поскольку в альтернативной гипотезе мы должны рассмотреть обе возможные ситуации: Pi < р2 и Рг < Pi)> мы отвергаем гипотезу р, — р2 = 0, если величина = |д— z2|/o оудет больше 1,96. Как видим, „=lW-0.<24| = 0,217 * Известно, что если выборки независимы, то любые статистики, построен- ные на их основе, также будут независимыми. Поэтому из независимости Г1 и г2 следует независимость Zi и z2, т. е. Var (z, —z2) = Var (Zj) -f- Var (z3). — Примеч. nep. 254
Поскольку и = 1,24 < 1,96 (критический коэффициент при 5%-ном уровне значимости), мы не отвергаем гипотезу о том, что выборки взя- ты из совокупностей с одинаковым коэффициентом корреляции. Доверительный интервал для р. Коэффициент корреляции выборки (и z-преобразование) может быть использован для вычисления доверительных границ, в которых с не- которой вероятностью будет лежать коэффициент корреляции совокуп- ности. Эти границы определяют доверительный интервал для р. Пр и м е р. Коэффициент корреляции, вычисленный по выборке объемом 28, оказался равным г = 0,71. Найти 95%-ный доверительный интервал для коэффициента корреляции р всей совокупности. Решение. Величина (г — p2)/crz имеет приближенное стандартное нормальное распределение. Поэтому р[— 1,96 < fг—’М <+ 1.9б1 «0,95. L \ щ / J Преобразуя выражение в квадратных скобках, получим Р \z — 1,96стг < р,г < z + 1,96ст21 « 0,95. Отсюда Р [arth г--*'86_ < arth р < arth г 4- - ] « 0,95. [ Ул—3 Ул—3 J В нашем примере г = 0,71 и п = 28, поэтому Р [arth 0,71---< arth р< 0,71 +-ЬШ —0,95, ! 5 5 J т. е. Р (0,495 < arth р < 1,279] « 0,95. Таким образом, приближенный 95%-ный доверительный интервал для arth р будет равен (0,495; 1,279). С помощью таблицы гиперболиче- ского тангенса окончательно получим 95%-ный доверительный интер- вал для р: (0,46; 0,86). Упражнение 2.8.4 1. Найдите значение г-преобразования следующих величин: 0,2; 0,8; 0,63; 0,41; 0,88. При необходимости воспользуйтесь таблицами гиперболического тангенса или таблицами натуральных логарифмов. 2. Случайная выборка объема 33, произведенная из двумерной нормальной совокупности, дала значение г =0,41. Проверьте следующие гипотезы: (1) Коэффициент корреляции для совокупности равен нулю против аль- тернативной гипотезы р + 0 (двусторонний критерий). (2) Но -р = 0 против альтернативной гипотезы Нг : р > 0 (односторонний критерий). (3) р меньше 0,22. (4) р меньше — 0,1. (5) р больше 0,55. (6) р больше 0,88. Сделайте все проверки при уровнях значимости 0,05 и 0,01. 255
3. Выполните задание 2 для следующих пар значений: (1) г = 0,62; п = 52; (2) г = 0,88; п = 103; (3) г = — 0,36; п = 12; (4) г = — 0,71; п = 124; (5) г = 0,00; п =228; (6) г = 0,13; п = 24. Замечание. При проверке гипотез «меньше» или «больше» в каждом случае необходимо делать одностороннюю проверку альтернативной гипотезы. 4. Найдите доверительные границы при 95%-ном и 99%-ном уровнях зна- чимости для коэффициента корреляции всей совокупности в каждом из шести случаев задания 3. 5. Случайная выборка 21 пары чисел из двумерной нормальной совокупно- сти дала значение коэффициента корреляции, равное г — 0,55. Вторая выборка объемом 30, произведенная на следующей неделе, привела к результату г — 0,48. Говорят ли эти результаты об изменении коэффициента корреляции совокупности за прошедшую неделю? Чему будет равно при 5%-ном уровне зна- чимости (а) наибольшее значение г, (б) наименьшее значение г, которое могло получиться при второй выборке и не указывать на значительное изменение в р? 6. Выполните задание со следующими выборочными данными: 1-я выборка 2-я выборка (1) г = 0,62; п = 52; (2) г = 0,36; п = 28; (3) г = 0,71; п = 19; (4) г = — 0,88; п = 103; (5) г = — 0,41; п = 12. г = 0,88; п = 60; г = 0,41; п = 33; г = 0,62; п = 28; г = — 0,71; п = 84; г = — 0,62; п = 19. 2.8.4. РАНГОВАЯ КОРРЕЛЯЦИЯ Очень часто наблюдения представлены не в виде измерений, а в форме рангов. Например, десять солдат могут быть поставлены в линию в порядке их роста. Число 1 будет присвоено самому высокому сол- дату, 2 — следующему и т. д., десятый получит номер 10. Числа от 1 до 10, приписываемые каждому солдату (соответственно их росту), называются рангами солдат..Та ко го рода упорядочение возможно, когда невозможно выполнить действительные измерения. Например, в кон- курсах красоты или конкурсах качества (где могут участвовать дети, девушки, кабачки, шиншилловые кролики и т. п.) судья оценивает качественно каждого из участников соревнования И приписывает им числа 1, 2, 3, ... соответственно его решению, какой из всех участни- ков будет наилучшим, вторым за наилучшим, третьим и т. д. Другими словами, он ранжирует участников конкурса. Часто бывает возможным ранжировать объекты эксперимента по двум или более характеристикам, откуда и возникает вопрос о корре- ляции. Например, представленные на конкурс кабачки могут быть ранжированы по размеру и сочности. Возникает вопрос, существует ли связь между размером кабачка и его сочностью. а) Коэффициент ранговой корреляции. Предположим, что п объек- тов эксперимента, ранжированные по уровню качества, привели к па- рам рангов (хг, pi). Требуется найти статистику для измерения степени корреляции между двумя переменными. В качестве такой статистики можно воспользоваться формулой произведения моментов (т. е. коэффициентом корреляции), предназна- ченной для данных измерения (см. 2.8.3, а)); для рангов эта формула упрощается (вместо г будем теперь употреблять обозначение R):-. 256
6 У 2 = 1 п(п2— 1) где dj = xt — yt — разность рангов для i'-го объекта эксперимента. R называется коэффициентом ранговой корреляции Спирмана (Spearman’s coefficient of rank correlation). Этой формулой очень легко пользоваться. Более того, если в дву- мерном эксперименте получен большой объем данных измерения, имеет смысл сначала ранжировать их и вычислить по полученным рангам R. Это значение R может служить аппроксимацией значения г; точность теряется из-за того, что при ранжировании исчезает важная информация о численном значении величины, а учитывается лишь ее порядок, однако существенное сокращение затрат при вычислении коэффициента ранговой корреляции компенсирует этот недостаток. Проверку на значимость, предложенную для г в 2.8.3, д), строго говоря, нельзя перенести на коэффициент Спирмана, однако эта про- цедура все же будет полезной для получения грубых значений границ доверительных интервалов. Дальнейшее знакомство с анализом ран- жированных данных читатель может продолжить по работе [17]*. Пример. Восемь кабачков ранжированы по размеру и сочности следующим образом: Кабачки 1 2 3 4 5 6 7 8 Ранг размера (хг) 8 3 1 4 О 7 5 6 Ранг сочности ({//) 3 5 6 7 8 4 1 2 Разность рангов (di) 5 —2 —5 —3 -6 3 4 4 Вычислить разности в рангах и найти коэффициент Спирмана ран- говой корреляции R. Следует ли из данных, что между размером и соч- ностью кабачков имеется некоторая зависимость? Решение. Разности di вычислены в третьей строке таблицы. Для формулы R нам необходимо вычислить 2d? = 25 + 4 + 25 + 9 + 36 + 9 + 16 + 16 = 140. Таким образом, n(/l2—1) , 6-140 . = 1---------, (n=8) 8-63 = —0,67. * Рекомендуем также читателю недавно переведенную на русский язык книгу: М. К е н д э л. Ранговые корреляции. М., «Статистика», 1975.-— Примсч. пер. 0 Зак !173 ?57
Даже если учесть небольшой объем выборки, значение R указывает на обратную зависимость между размером и сочностью кабачка. Это говорит о том, что больший кабачок, как правило, будет менее сочным и наоборот. (Замечание. Данные этого примера условны.) (3) Десять детей были ранжированы по двум тестам. Один тест проверял языко- вые способности (v), другой — общий кругозор (s). Результирующие пары (v, s) оказались следующими: (2,1), (3,6), (8,5), (1,4), (4,3), (7,2), (9,8), (10,7), (6,9), (5,10). Можете ли вы сказать, что существует связь между общим кругозором и языковыми способностями у детей? 2. Возьмите множество данных из задания 3 упражнения 2.8.1 и для каж- дого случая проранжируйте объекты эксперимента по рассматриваемым харак- теристикам. Затем для каждого множества вычислите значение R. Сравните по- лученное значение со значением г, вычисленным ранее (задание 2 упражнения 2.8.3). 3. Какова будет связь между рангами xi и у, i-го наблюдения, если между этими переменными существует точная линейная зависимость. Покажите, что в этом случае R — 1. 4. Если ранги двух характеристик соответствуют точно противоположно- му порядку, то для каждого объекта эксперимента xi + yt = п Д 1. Получите отсюда следствие, в силу которого все точки на графике рассеяния будут лежать на прямой линии с отрицательным наклоном, т. е. в этом случае R = — 1. 258
2.8.5. ПРЕДУПРЕЖДЕНИЕ: КОРРЕЛЯЦИЯ И СЛУЧАЙНОСТЬ Предупреждение заключается в опасности спутать понятия ста- тистической зависимости с более фундаментальным понятием причин- ной связи. Очень часто коэффициент корреляции неправильно интер- претируется; если значение г оказывается близким к 4-1 или —1, то отсюда делается вывод, что существует тесная зависимость между переменными. Для того чтобы понять, какого рода опасности могут встретиться при интерпретации двумерных наблюдений, рассмотрим следующие примеры. Допустим, что в течение некоторого промежутка времени, число книг, издаваемых за год в некоторой стране, неуклонно росло; также росло число покупок телевизионных приемников; предположим так- же, что в течение этого времени происходил рост преступлений. Если для этих величин построить соответствуюгцие графики и вычислить коэффициенты корреляций, то с большой вероятностью окажется, что на данном отрезке времени количества проданных книг и телеви- зоров имели положительную корреляцию, количество проданных те- левизоров положительно коррелировало с числом преступлений, а число преступлений имело положительную корреляцию с количеством проданных книг. Какой вывод можно сделать из существования этих трех положи- тельных, возможно, высоких корреляций? Оказывает ли влияние про- смотр телевизионных передач на рост преступности? Возможно. Покупают ли преступники больше телевизоров, чем честные люди? Наверняка нет. Ведет ли просмотр телевизионных передач к тому, что зритель становится более просвещенным и начинает покупать новые книги? Может быть, имеется другой способ объяснения этого фено- мена? А каким образом продажа книг влияет на рост преступности? Очевидно, между такими переменными, как продажа книг и рост преступности, нет действительной причинной связи. Корреляции, в которых данные показывают высокое значение г, в то время как между переменными нет разумной связи, называют ложными корреляциями. Этим примером мы хотели показать, что, после того как между дву- мя переменными установлена статистическая зависимость, необходимо провести дальнейшее исследование этой зависимости, прежде чем сде- лать вывод о существовании между ними реальной связи*. * Читателю, безусловно, следует с осторожностью относиться к резуль- татам статистического исследования. Однако вряд ли точные математические формулы могут в большей мере претендовать на отражение причинно-следствен- ных связей, чем корреляционные зависимости. Даже в формулировках физиче- ских законов, вызывающих неизменно большую долю доверия по сравнению с эм- пирическими зависимостями в экономической и социальной жизни, как правило, нельзя указать направленность причинно-следственного механизма. Поэтому, говоря об условности статистического исследования, следует, прежде всего, иметь в виду целенаправленность интерпретации полученных результатов. Не исключено, что зависимость между количеством купленных телевизоров и числом преступлений может оказаться вполне пригодной для прогностической модели, если только будет найден соответствующий причинно-следственный механизм, объясняющий (пусть даже косвенным образом) подобную корреляцию. — Примеч. ред. 9* 259
2.8.6. РЕГРЕССИЯ Если точки (х,-, tjt) на графике рассеяния близко располагаются к не- которой кривой, то естественно попытаться найти математическую за- пись у = f (х) кривой, приближающей кривую рассеяния. Такая кри- вая называется линией (кривой) регрессии, она может быть использо- вана для целей предсказания. Например, рассмотрим в качестве пере- менных твердость X и предел прочности на разрыв Y некоторого сорта стали. Предположим, что эксперименты показали высокую корреля- цию между X и Y. Тогда в последующих экспериментах предел проч- ности на разрыв бруска из данного вида стали можно легко и довольно точно оценить, измеряя сначала твердость стали X и затем вычисляя Y по уравнению регрессии, связывающему X и Y (непосредственное измерение Y ведет к разрушению материала). Общая проблема подгонки математической кривой к статистическим данным в целях прогнозирования решается регрессионным анализом. По этому вопросу имеется обширная литература; здесь мы рассмотрим только простейшие примеры и случаи. Слово регрессия было впервые употреблено Фрэнсисом Гальюном (Francis Gallon, 1822 — 1911), который также открыл коэффициент корреляции, при анализе двумерных данных, представляющих собой рост отцов и сыновей. Он обнаружил, что сыновья высоких отцов в среднем ниже, чем их отцы, и назвал это регрессией посредственности. а) Линии регрессии. Предположим, что корреляция между пере- менными X и Y линейная. Пусть также эксперимент позволяет ото- брать наблюдения с некоторым значением X, определенным заранее, и измерить соответствующие значения Y. Например, можно исследо- вать эффект, оказываемый различными дозами (переменная X) неко- торого средства от насекомых. Мы можем отобрать определенный вид насекомых и проверять на них действие доз заранее фиксированной концентрации; затем мы можем найти число насекомых, погибших от этой дозы (переменная Y)*. Такая ситуация называется задачей чистой регрессии. При этом X будет независимой или объясняющей переменной, a Y— статистически зависимой переменной. Хотя для большинства реальных ситуаций такая задача является только приближением, излагаемые далее методы допускают широкую область применения. Предположим, для задачи чистой регрессии имеется множество выборочных наблюдений и мы хотим «подогнать» прямую к точкам на графике рассеяния. На рис. 111 показано множество точек и четыре возможные прямые А, В, С и D, которые проходят через эти данные. Очевидно, что и Л и В будут «плохими» регрессиями. Эти прямые плохо приближают данные, и ни одна из них не может быть описанием зависимости между X и Y, как бы мы ни ставили задачу. Однако пря- мые С hD уже нельзя отвергнуть по этому принципу. Если нескольким людям раздать карандаши и линейки и попросить провести прямую, «наилучшим» образом подогнанную к нашим данным, то одни провели бы прямую, близкую к С, другие—кО, а третьи, возможно, построили * То же самое повторяется для других значений переменной -X, в резуль- тате чего возникает график рассеяния. — Примеч. ред. 260
бы прямую, отличающуюся заметно и от С, и от D. Как определить, какая из прямых «наилучшая» и в каком смысле «наилучшая»? Ясно, что чисто субъективный способ подгонки линии регрессии «на глаз» не выдерживает критики; для решения этой задачи требуется некоторый объективный метод. Наиболее обоснованным методом, име- ющим в своей основе строгую аргументацию (мы не будем обсуждать ее в этой книге), является так называемый метод наименьших квад- Рис. 111. Прямые на графике рассеяния, проведенные «на глаз» ратов. Этот метод указывает систематическую процедуру построения прямой, проходящей через множество точек, и будет лучшим в теоре- тическом смысле. б) Метод наименьших квадратов. Рассмотрим график рассеяния п точек (хг, у,) (рис. 112). Предположим, что при отсутствии случайных отклонений в пере- менной Y все точки графика лежали бы на некоторой истинной линии регрессии. Таким образом, если изобра- женйая на графике прямая будет истин- ной линией регрессии, то величины dlt d2, ..., dn — случайные отклонения от этой прямой. Основа метода наименьших квадратов состоит в том, чтобы по имею- щимся данным выбрать из всего множе- ства прямых па плоскости прямую, ко- торой соответствует наименьшее зна- чение суммы квадратов отклонений от нее до точек графика рассеяния. Други- Рис. 113 ми словами, мы ищем прямую у — а'х Ь', такую, X = d\ -f- dl -f- ... 4- dn имеет наименьшее возможное значение. что Для ее отыскания запишем уравнение прямой в общем виде: у = ах 4 Ь, вычислим соответствующее ей значение X и с помощью методов диффе- ренциального исчисления найдем значения а и Ь, минимизирующие выражение для X. Прямая, найденная таким способом, будет наилуч- шей оценкой истинной линии регрессии. Ордината i-й точки (xf, </;) на прямой у — ах 4 b соответствует точке (хг, axt 4 Ь). Отсюда следует, что dt = yt — (axt 4 b) (рис. 113). Поэтому X = d® 4 4 dn = 2dt = 2 [yt — (ах^ 4 &)I2. (1) 261
Вспомним теперь, что х; и г/г — фиксированные числа (данные выборки), а в качестве переменных мы рассматриваем параметры а и Ь. Таким образом, S рассматривается как функция параметров S (а, Ь). Значения а и Ь, минимизирующие S, будут решением системы уравнений: dS п dS „ „ , , да ~ ’ дЬ ~ Дифференцируя первое уравнение по а и Ь, прирав- нивая результаты нулю, получим: — = 22 (t/f — axt—b)(—1)=0 и —=22 —axt—b) (—Xt)=0. Эти уравнения называются нормальными уравнениями регрессии', несложным преобразованием их можно свести к более простому виду: 2t/z = а 2х; -ф bw, ^XiPi = ci2>Xi + b 2хг. (2) (3) Решением системы уравнений (2), (3) будет пара чисел (а', Ь'). Прямая у = а'х + Ь' называется прямой «наилучшей подгонки» к точ- кам на графике рассеяния. Эта прямая называется также регрес- сией Y на X. Если бы мы предположили, что случайные возмущения присутствуют только в переменной X, мы минимизировали бы сумму квадратов отклонений, которые бы измерялись параллельно оси X- В таком случае мы бы пришли к новому уравнению регрессии — рег- рессии X на Y. Вообще, если нам необходимо предсказать значение у по данному значению х, мы воспользуемся регрессией Y на X; для предсказания х по данному у мы рассматриваем регрессию X на Y. Примеры 1. Методом наименьших квадратов найдите (а) регрессию Y на X, (б) регрессию X на Y. X 1 2 3 4 5 6 7 1/ 2 3 1 4 6 7 5 х = 4; // = 4. 262
Решение (а) регрессия Y на X X У X» V* ху 1 2 1 4 2 2 3 4 9 6 3 1 9 1 3 4 4 16 16 16 5 6 25 36 30 6 7 36 49 42 7 5 49 25 35 Сумма 28 28 140 140 134 2х = 28 = Si/; Sx2 = 140 = Sj/2; Хху = 134. Подставляя полученные суммы в нормальные уравнения (2) и (3), получим: 28 = а • 28 + b • 7; 134 = а • 140 + 6-28. Решением этой системы будут числа а' — и/14, Ь' = ®/7. Итак, по- лучена прямая регрессия, найденная методом наименьших квадратов: у = и/и х + ®/7, или 14г/ = Их + 12. б) Регрессия X на Y. На этот раз мы должны минимизировать квадра- ты отклонений от х. Нормальные уравнения в этом случае получаются из уравнений (2) и (3) простой подстановкой у вместо х и наоборот. Таким образом, если уравнение регрессии в общем виде будет х = су + d (для ясности вместо ранее использованных букв а и b возь- мем новые буквы с и d), то нормальные уравнения выглядят следую- щим образом: 2х = сХу + dn (2') и 2хр = с Уу2 + dXy. (3') Подставляя значения сумм из таблицы, получим: 28 = с 28 + d • 7 и 134 = с 140 + d • 28. Таким образом, регрессия X на Y будет иметь вид 14х = 11г/ + 12. (Замечание. Совпадение коэффициентов в уравнениях регрес- сии X на Y и Y на X — это особый случай. В общем случае система нормальных уравнений (2) и (3) отличается от системы (2') и (3')-) 263
2. Нарисуйте график рассеяния наблюдений для примера 1 и по- стройте обе линии регрессии. Обратите внимание на тот факт, что обе прямые проходят через точку (х, у) = (4,4); это имеет место для любой регрессии. Заметьте также, что две прямые имеют разные направления. Вообще, чем ближе друг к другу расположены линии регрессии У на X и X на Y, тем сильнее линейная зависимость между переменными (рис. 114). 3. В эксперименте из примера 1 известно значение х, равное ЗУ3. Предскажите соответствующее значение у с помощью уравнения рег- рессии. (Найденное значение у будет наилучшей оценкой истинного значения.) Решение. Рассмотрим регрессию У наХ(ее график или уравнение). Предсказываемое значение у будет равно: II 7 . 6 101 У=------------—----- . 14 2 7 28 Рис. 114. График разброса и прямые регрессий (пример 1) начальный коэффициент b 4. В эксперименте из примера 1 значение у известно и равно 6. Предскажите по этому значению у значение х. Решение. Для решения этой задачи воспользуемся регрессией — X на У. Предсказываемое значение х следую- щее: X==_1L.6+_L=_39_, 14 7 7 в) Формулы для вычислений. 1) Систему нормальных уравнений для получения коэффициентов регрессии у = — ах-\-Ь легко запомнить. Однако чита- телю может понадобиться окончатель- ная формула для вычисления а и Ь. Они выглядят следующим образом: коэффициент наклона а= nZxy—(Zx) (St/) . raSx2 —(Sx)2 ’ (St/) (Sx2)-(Sx) (Sxt/) иХх2—(Sx)2 Аналогичные формулы для регрессии X на Y могут быть получены подстановкой х вместо у и наоборот. 2) Упростить вычисление коэффициента наклона а можно с помощью линейного преобразования X и Y. При этом необходимо обратить вни- мание на следующий факт. Если си d — подходящим образом выбран- ные числа и формула подсчета коэффициента наклона применяется к переменным u = x-\-cmv—y-\-d, то значение а будет тем же, что и для переменных х и у. Однако полное линейное преобразование и = ех + с и и = fx + d не может быть использовано кроме случая, когда е = f. (Покажите, что если е #= Д то формула коэффициента на- клона приведет не к значению, равному а, а к значению fa/e.) Когда а найдено, для отыскания b может оказаться полезным урав- нением у = а х + Ь. 264
Пример. Найдите прямую регрессии Y на X для точек выбор- ки (1,5; 2,1), (3,1; 2,7), (3,8; 3,0), (4, 3; 5, 4). Решение 1) Непосредственное использование формул X У X* У* ху 1,5 3,1 3,8 4,3 2,1 2,7 3,0 5,4 2,25 9,61 14,44 18,49 4,41 7,29 9,00 29,16 3,15 8,37 11,40 23,22 Сумма 12,7 13,2 44,79 49,86 46,14 4-46,14—(12,7) (13,2) _ 184,56 — 167,64 _ 16,92 4-44,79 —(12,7)2 ~ 179,16—161,29 17,87 2) Использование линейного преобразования. и = 10х -|- 30 и и = 10(/ + 35 (Замечание. Коэффициенты при х и у одинаковы.) X У и V иг о* UV 1,5 3,1 3,8 4,3 2,1 2,7 3,0 5,4 —15 1 8 13 —14 —8 —5 19 225 1 64 139 196 64 25 361 210 —8 —40 247 Сумма ч- ’«! 12,7 13,2 7 ОО 1 1- А 459 646 409 Применяя те же формулы, но подставляя значения для и и и, по- лучим: 4-409 —7 (—8) 1 692 — 4-459—72 ~ 1 787 ’ что совпадает с предыдущим результатом. Поскольку х— 12^*7 =3,175 и у= -З^*2 = 3,3, находим & из урав- нения у = ах + Ь. Отсюда Ь=у—ах=3,3—-3,175=0,293. 3) Формулы, связывающие прямую регрессии и коэффициент кор- реляции. Прямая регрессии может быть записана следующим образом: а) регрессия Y на X : у' = гх'\ б) регрессия X на Y : х' = гу', 265
1ще г—коэффициент корреляции между х* и у1, а х'и у*— стайдартй- зированные переменные: X'=(X-X)lsx- Y'=(Y-Y)/sy. Таким образом, если начало координат перенести в центр графика рассеяния и за единицы измерения масштаба взять стандартные откло- нения, то прямая регрессии, как следует из формул, будет очень простой. В качестве упражнения мы предлагаем читателю доказать, что эти уравнения полностью эквивалентны предыдущим. (Это упраж- нение очень полезно, и читатель многое уяснит в процессе его выпол- нения.) Упражнение 2.8.6 1. Имеются следующие результаты тестирования (в баллах) 10 студентов. Первый тест проверяет память (X), второй — способности к логическому мыш- лению (У). Оценка за тест по проверке памяти (X): 5, 8, 7, 10, 4, 7, 9, 6, 8, 6. Оценка за тест по проверке способности к логическому мышлению (У): 7, 9, 6, 9, 6, 7, 10, 7, 6, 8. (а) Нарисуйте график рассеяния. (б) Найдите коэффициент корреляции между X и У. (в) Примените каждый из методов, описанных в 2.8.6, в), для нахождения регрессии методом наименьших квадратов. (г) Нарисуйте линию регрессии на графике рассеяния. (Заметьте, что точ- кой пересечения будет (х, у)). 2. Для каждого из следующих множеств данных выполните задание 1 этого упражнения. (Для упрощения вычислений данные можно преобразовать к стан- дартизированным переменным.) Упругость (X) и процентное содержание никеля (У) в восьми образцах сплавов стали (1) Упругость (X) 36 41 42 43 44 45 47 50 Процент никеля (У) 2,5 2,7 2,8 2,9|3,0 3,2 3,3 3,5 Оценка за тест по способностям (X) шести продавцов-практикантов и первый год работы (У) в сотнях фунтов проданного товара (2) Оценка за тест по способностям (X) 25 42 33 54 29 36 Первый год работы (У) 42 73 50 90 45 48 Твердость (X) и предельная нагрузка (У) 10 образцов сплавов легких металлов (3) Твердость (X) 53 56 60 63 66 67 70 72 75 80 Предельная нагрузка (У) 10,1 10,4 12,3 13,8 13,9 14,1 14,0 15,1 15,4 16,5 3. Постройте следующие прогнозы с помощью графиков и (или) уравне- ний, полученных в задании 2. (1) Упругость образца стали, процентное содержание никеля в которой равно 3,1. Процентное содержание никеля в стали, упругость которой равна 38. (2) Возможное число фунтов товара, проданного продавцом-практикантом за первый год, если его оценка за тест по способностям равна 48. (3) Твердость образца сплава легких металлов, предельная нагрузка ко- торого равна 12,0. Предельная нагрузка образца, твердость которого равна 73. 4. Покажите, что регрессии У на X и X на У можно записать так: (1) у-у=~-(х-х), sx 266
(2) х—х=-^~ (у—у), sy где sxy, s2, s2 — выборочная ковариация, дисперсия х и дисперсия у соответ- ственно. Величины Say/s® и sXyls2 называют коэффициентами регрессии. 5. Покажите, что квадратный корень из произведения коэффициентов рег- рессии равен коэффициенту корреляции. 6. С помощью методов из 2.8.3, д) найдите границы (а) 95%-ного и (б) 99%-ного доверительных интервалов для коэффициента корреляции р всей со- вокупности в каждом из экспериментов заданий 1 и 2. Для каждого множества данных выполните проверку гипотезы Нв: р = 0,8 против соответствующей односторонней альтернативной гипотезы при уровне значимости 0,05. 7. Объясните значение фраз «высокая положительная корреляция» и «низкая отрицательная корреляция». Приведите примеры и графики, иллюст- рирующие эти понятия. Численные значения снашивания и твердости резины пяти выборок равны: Выборка 1 Снашивание 21 Твердость 5 2 3 4 5 15 12 22 5 6 7 4 8 (а) Нарисуйте график рассеяния; найдите и нарисуйте на этом графике две линии регрессии. (б) Вычислите коэффициент корреляции г и получите границы 99%-ного доверительного интервала для р. (в) Предскажите снашивание резины для выборки резины, твердость ко- торой равна 6,4. 8. Докажите, что для п пар (х;, у,) из двумерного распределения: (a) S(x—х) (у—у)=^ху—пху, (б) 2 (х-\-у)2 = п (x+y)2-)-n (s* + 2sxy+s2). 9. Две переменные X и Y функционально связаны уравнением ах + by + + с = 0. Покажите, что коэффициент корреляции между переменными будет равен + 1, если а и b имеют разные знаки, и — 1, если знаки одинаковые. 10. Предполагается, что для множества п наблюдений (х<, у;) регрессия будет представлять собой параболическую кривую у = ах2 + Ьх + с. С помощью метода наименьших квадратов найдите формулы для определения а, b и с. (За- ме ч а н и е. Возьмите сумму квадратов отклонений S=2 [у—(ах2 + Ьх + с)]2. „ 5S SS 3S приравняйте —, —, — нулю и получите систему нормальных уравнении.) да дЬ дс 2.8.7. ДАЛЬНЕЙШАЯ РАБОТА В этой главе мы рассмотрели понятия корреляции и регрессии в двумерных распределениях. За этими понятиями в курсе статистики следуют вопросы, связанные с вычислениями коэффициентов корреля- ции и регрессии для группированных данных, затем теория выборок получает дальнейшее развитие (изучаются отклонения от линии рег- рессии, границы доверительных интервалов для коэффициентов урав- нения регрессии и т. д.), предлагаются методы проверки соответствия многочленов выборочным данным. Теория может быть обобщена на случай, когда рассматриваются две или более независимые переменные. Изучение многомерных рас- пределений требует определения частных и множественных корреля- ций, развития методов по нахождению плоскости регрессии (или по- верхности) по выборочным данным. 267
2.9 ЗАДАЧИ КО ВТОРОЙ ГЛАВА ЧАСТИ Следующие задачи1 предлагались в письменных экзаменационных рабо- тах последних лет в университетах Шеффилда, Бирмингема, Ланкастера, Лидса и Лондона на присуждение степени бакалавра наук (экономических). 1. (а) Сформулируйте три фундаментальные аксиомы теории вероятностей. С помощью этих аксиом докажите, что для любых двух событий: (1) Р (АВ') = Р (Л) — Р (АВ)-, (2) Р (Л1)В) = Р (Л) + Р (В) — Р (А В); (3) Р(Л)<Р(ЛиВ). (б) Пусть Л, В и С — произвольные события. В терминах Р (Л), Р (В), Р (С), Р (АВ), Р (ЛС), Р (ВС) и Р (АВС) найдите вероятность наступления хотя бы одного из событий Л, В и С. (в) 60 банок с фруктами не могут быть проданы в магазине из-за того, что этикетки на этих банках перепутаны. Директор магазина случайным обра- зом выбирает каждую банку и дает ее одному из трех своих помощников. Из- вестно, что И банок содержат персики, а остальные банки — груши. Чему равна вероятность того, что каждый помощник директора магазина получит по край- ней мере одну банку персиков? 2. (а) Сформулируйте и докажите теорему о полной вероятности. Выве- дите из нее теорему Байеса. (б) Три урны содержат соответственно 5 черных и 7 белых шаров, 12 черных и 10 белых шаров, 8 черных и 8 белых шаров. Случайным образом выбирается урна и шар из нее. Найдите вероятность того, что (1) шар будет белым, (2) шар взят из i-й урны, если известно, что он белый (i = 1, 2, 3). 3. (а) Покажите, как эксперимент получения выборки из некоторой сово- купности, содержащей два вида объектов, ведет к гипергсомстрическому рас- пределению. Покажите, что это распределение при некоторых условиях может быть аппроксимировано биномиальным распределением. (б) Объясните, как биномиальное распределение возникает в эксперименте, состоящем из п независимых испытаний. Получите аппроксимацию биномиаль- ного распределения пуассоновским. (в) В универсаме имеется 180 бутылок молока, 60 из которых датированы предыдущим числом, а остальные — свежие. Покупатель случайным образом покупает 6 бутылок молока. Чему равна вероятность (найдите ее с точностью до 3 значащих цифр), что по крайней мерс две бутылки будут датированы предыду- щим числом? Приведите аргументы для оправдания использованной вами ап- проксимации. 4. (а) Определите производящую функцию моментов для непрерывной слу- чайной переменной X. Найдите производящую функцию моментов при условии, что X нормально распределено со средней р и стандартным отклонением ст. По- лучите распределение X — Y, где X и Y — независимые нормально распре- деленные случайные величины со средними р1я р2 и дисперсиями о|, ст|. 1 Все вопросы и задачи приводятся без изменений, поэтому для решения некоторых задач необходимы сведения, отсутствующие в этой книге. Читателю следует самостоятельно найти их в более полных руководствах по статистике. (Рекомендуем читателю книги [49] и [50]. — Примеч. пер.) 268
(б) На конвейере штифт и муфта подбираются случайно. Диаметры штифтов и муфт имеют нормальное независимое распределение со средними 14,985 мм и 15,011 мм и стандартными отклонениями, равными 0,05 мм и 0,012 мм соответ- ственно. Какова в среднем доля штифтов, которые войдут в муфту? 5. (а) Подробно объясните, что означает: (1) случайная выборка из еско- печной совокупности, (2) выборочное распределение статистики. (б ) Из нормально распределенной совокупности со средним р и дисперсией о2 производится случайная выборка объемом п. Покажите, что выборочное сред- нее х имеет нормальное распределение со средним р. и дисперсией о^/п. Про- анализируйте, как изменится выборочное распределение х, если выборку про- изводить из совокупности со средним р и дисперсией о2, имеющей распределе- ние, отличное от нормального. (в ) Известно, что в среднем 5% некоторого вида электропредохранителей, изготовляющихся производственной линией, дефектны. Чему (приближенно) равна вероятность того, что в случайной выборке из 400 таких электропредохра- нителей 6% окажутся дефектными? 6. (а) Кратко объясните смысл следующих терминов: (1) нулевая гипотеза, (2) значимость критерия, (3) мощность критерия. (б) Исследуются два производственных процесса изготовления поршневых рычагов. В выборке из 100 поршневых рычагов, изготовленных с помощью пер- вого процесса, оказалось 5 дефектных, а в выборке из 150 рычагов, изготовлен- ных с помощью второго процесса, оказалось 9 дефектных. Найдите 95%-ный доверительный интервал для разности между истинными долями дефектных единиц для этих процессов. Есть ли значимое различие между этими долями? (Используйте 5%-ный уровень значимости.) 7. (а) Из двух нормальных совокупностей N (pij, о2) и N (р.2> °!) произво- дятся две независимые случайные выборки объемом и п2, причем общая дис- персия о2 неизвестна. Постройте процедуру проверки двусторонней гипотезы Но'- Вт ~ Ва- (б) Двумя лабораториями А и В исследовалось содержание никотина в че- тырех видах табака; результаты исследования представлены в таблице (в услов- ных единицах): Содержание никотина лаборатория А лаборатория В 16 18 14 21 13 18 17 19 Предполагая, что обе совокупности имеют нормальное распределение с оди- наковой дисперсией (которая неизвестна), проверьте гипотезу о том, что резуль- таты исследования двух лабораторий не отличаются друг от друга при 5%-ном уровне значимости. 8. (а) Обозначим через р парный коэффициент корреляции между X и Y-. Покажите, что (1) — 1 р < 1, (2) р не зависит от масштаба и начала отсчета. (б) Объясните смысл коэффициента корреляции и напишите формулу для его вычисления. (в) Величина X равномерно распределена на ( — 1,1) и Y = X2. Покажите, что X и Y некоррелированы*. * Можно доказать, что X и У будут зависимы. Этот пример показывает, что случайные величины могут быть одновременно некоррелируемы и стохастически зависимы. С другой стороны, если переменные независимые, то они обязательно некоррелируемые. — Примеч. пер. 269
9. Дайте объяснение следующим четырем понятиям: (а) статистическое мо- делирование выборки, (б) центральная предельная теорема и ее применение в статистической проверке гипотез, (в) коэффициент ранговой корреляции, (г) метод наименьших квадратов в регрессивном анализе. 10. (а) Десять участниц конкурса красоты были ранжированы тремя судь- ями следующим образом: Судья II 6 5 10 Судья II 3 5 8 4 Судья III 6 4 9 8 3 2 4 9 7 8 7 10 2 1 6 9 1 2 3 10 5 7 С помощью коэффициента ранговой корреляции найдите пару судей, оцен- ки которых наиболее близко соответствуют друг другу. (б) Лаборант ставит ряд экспериментов по определению связи между коли- чеством растворившегося в воде химического вещества и температурой воды. Получены следующие результаты: Температура С® (х) 10 20 30 40 50 60 70 80 Количество химического ве- щества (у) (в условных еди- ницах) ‘ 48 60 63 71 72 84 89 90 Для приведенных данных подгоните прямую у = а + Ьх и нарисуйте ее на графике. Оцените ожидаемое количество химического вещества, которое раст- ворится в воде, при температуре 35° С. Найдите для этой величины 95%-иый доверительный интервал. 11. Для исследования вопроса о том, имеют ли жители двух островов в юж- ной части Тихого океана одинаковое расовое происхождение, антропологом были выполнены необходимые измерения черепов жителей и проведено сравне- ние полученных индексов. Антропологом было обследовано 6 черепов жителей первого острова и 6 черепов жителей второго острова. Результаты получились следующие: Первый остров 72,4 78,9 75,4 73,5 74,7 81,1 Второй остров 71,8 74,6 72,0 73,5 70,2 75,9 (а) При 2%-ном уровне значимости проверьте предположение, что диспер- сии двух совокупностей, из которых производились выборки, в действитель- ности равны. (б) Предполагая истинность гипотезы (а) при 5%-ном уровне значимости, проверьте, будет ли различие между выборочными средними совокупностей значимым. Исходную совокупность можно считать приблизительно нормально рас- пределенной. Можно ли на основе этих наблюдений сказать, что жители двух островов имеют одинаковое расовое происхождение? 12. Из таблицы случайных чисел получите 100 выборок, в каждой из ко- торых по десять случайных чисел от 0 до 99. Для каждой выборки из десяти чисел найдите частоту х чисел, делящихся на 10 (0 делится на 10). Найдите ожи- даемые биномиальные частоты для этого распределения и сравните их с полу- ченными значениями из выборок. Результат объясните (не прибегая к статисти- ческой проверке). Сравните также наблюдаемые и ожидаемые значения среднего и дисперсии. Подберите к полученным данным наиболее подходящее пуассоновское рас- пределение и проанализируйте, будет ли это распределение хорошей альтерна- тивой. 13. (а) Правильная монета подбрасывается дважды. Пусть А — событие выпадания герба при первом бросании, а В — событие выпадания решетки при втором бросании. (1) Будут ли события А и В взаимно противоположными? 270
(2) Будут ли события А и В независимыми? Аргументируйте ваши ответы. (б) Три случайные переменные X, Y и Z одинаково и независимо распре- делены. Объясните, что это означает. (1) Определите, будут ли следующие вероятностные утверждения истин- ными или нет: Р (X > 0/У > 0) = Р (У > 0), Р (X < х, Y < у) = [Р (Z < z)l2; Р (X + У < х + у) = Р (X < х) + Р (У < у). Аргументируйте ваши ответы. (2) Предположим далее, что переменные X, У и Z непрерывны. Одно на- блюдение над этими переменными привело нас к значениям х, у иг. Чему равна вероятность того, что х, у, z не удовлетворяют ни одному из неравенств х > у > , z или х < у < z? 14. Дайте объяснение понятию условной вероятности. Некоторый вид биологической клетки подвергается воздействию. При этом воздействии клетка погибает с вероятностью, равной 1/4, и делится на две клет- ки того же вида с вероятностью 3/4. Клетки реагируют на воздействие незави- симо друг от друга, и умершая не оживает. Обозначим через X] число живых клеток после воздействия на одну клетку, Х2 — число живых клеток после воздействия на Хх клеток, Х3 — число живых клеток после воздействия на Х2 клеток. Найдите: (1) Р (Ха = 0); (2) Р (Хл = 0/Х2 = 0); (3) Р (Х3 > 0). 15. (а) Найдите условия, при которых события Bit В2, и В3 удовлетворяют условию Р (А) = Р (A/В,) Р (BJ + Р (А/В2) Р (В2) + Р (А/В3) Р (В3) при любом событии А. (б) Число X случайным образом выбирается из чисел 1, 2 и 3. Затем из того же множества целых чисел случайно выбирается другое число У, большее или равное первому. Обозначим Z = X + У. Требуется найти: (1) функцию распределения вероятностей У; (2) функцию распределения вероятностей Z; (3) среднее и дисперсию Z. 16. (а) X и У — независимые нормально распределенные величины. X имеет среднее 1 и дисперсию 16, а У имеет среднее 3 и дисперсию 9. С помощью таблиц найдите вероятность того, что обе величины X и У положительны и мень- ше 9. Найдите также вероятность того, что X превосходит У. (б) Два небольших завода Вх и В2 производят некоторый товар. Количества товара Хх и Х2, производимого соответственно заводом Л, и Л2 за неделю, рас- пределены независимо и можно считать, что они имеют приближенно нормаль- ное распределение. Хх имеет среднее, равное 6000, и дисперсию 900, а Х2 имеет среднее 15 000 и дисперсию 3600. Товар, производимый на заводе Flt приносит прибыль 3 пенса в расчете на единицу, а товар, производимый на заводе К2, — 2 пенса. Предполагая, что сумма издержек производства заводов Fx и К2 составляет 100 фунтов стерлингов, найдите вероятность того, что за некоторую неделю суммарная чистая прибыль заводов А, и F2 будет больше, чем 100 фунтов стерлингов. 17. Объясните, что надо понимать под «независимыми испытаниями Бер- нулли». Два игрока в теннис Рг и Р2 играют один круг, который состоит из 5 се- тов. Для каждого игрока шансы выиграть в одном сете равны, причем результа- ты сетов взаимно независимы (ничьих не бывает). 271
Пусть X обозначает число сетов, выигранных Р,. Нарисуйте график рас- пределения X. Пусть Y обозначает разность сетов, выигранных первым игроком Рх и вто- рым Р2. Найдите среднее и дисперсию Y. Нарисуйте график Р (Y < у). Чему равна вероятность того, что первый игрок выиграет у второго? 18. Приведите формулировку центральной предельной теоремы. Случайная переменная X имеет равномерное распределение на отрезке а < х < а + 2, где а — неизвестный параметр. Нарисуйте кривую плотности вероятности для X. Над X производится одно наблюдение х'\ с помощью этого значения най- дите 90%-ный доверительный интервал для а. Известно, что дисперсия X равна 1/3; найдите приближенные 90% ные до- верительные границы для а, используя среднее х п. независимых наблюдений X. Найдите такое п, при котором 90%-ный доверительный интервал имеет длину меньше 0,2. 19. Бросают пять монет. Некто подозревает, что в этой пятерке есть моне- ты с гербом с двух сторон (двугербовые). Известно, далее, что монета может быть либо правильной, либо двугербовой. (а) С помощью следующей проверки проверяется нулевая гипотеза о том, что все монеты правильные: нулевая гипотеза принимается, если при одном бро- сании пять монет выпадают меньше, чем четыре монеты, в других случаях она отвергается. (1) Найдите вероятность ошибки первого рода. (2) Чему равна вероятность отвергнуть нулевую гипотезу, если в пяти мо- нетах 1, 2, 3, 4, 5 из них будут двугербовыми: (б) Альтернативная проверка следующая: отобрать случайным образом одну монету из данных пяти, бросить ее три раза и отвергнуть нулевую гипоте- зу, если гербы выпадут во всех трех бросаниях. Повторите для этого критерия вопросы (1) и (2) и сравните предложенные проверки гипотез. 20. В доме отдыха были случайным образом отобраны 100 человек и запи- сан их возраст. Полученные данные были сведены в частотную таблицу: Возраст группы 2,5—7,5 7,5—12,5 12,5—17,5 17,5—22,5 22,5—27,5 Частота 5 16 35 42 2 среднее — мода Обсудите использование величины w = --------------------------- как меру стандартное отклонение симметричности распределения и вычислите w для приведенных данных. Найдите также медиану и среднее отклонение для предложенных данных. 21. Длительное наблюдение за производственным процессом изготовления химической смеси привело к заключению, что величину выпуска можно считать приближенно нормальной со средней 250 единиц и стандартным отклонением 50 единиц. Производственный процесс подвергся модификации, которая не из- менила стандартное отклонение. При 5%-ном уровне значимости проверяется нулевая гипотеза о том, что выпуск продукции стал меньше 250 единиц, против альтернативной гипотезы, что выпуск продукции увеличился. (1) Найдите критическую область при 25 наблюдениях. (2) Известно, что число наблюдений равно 25, а модификация процесса при- ’ вела к увеличению выпуска продукции до 260 единиц. Найдите в этом случае вероятность отвергнуть нулевую гипотезу. ’ (3) Найдите такое число наблюдений, которое необходимо взять, чтобы вероятность отвержения нулевой гипотезы при условии, что произошло увели- чение выпуска продукции до 260 единиц, была бы не меньше 0,9. 22. Игрок подозревает, что некоторые две игральные кости неправильные. Для проверки своего предположения он подбрасывает их 360 раз и записывает сумму очков, выпадающих при каждом бросании. Полученные наблюдения следующие: Сумма 23 4 5 6 7 8 9 10 11 12 Число наблюдений суммы 11 13 24 34 48 63 51 42 36 24 14 272
Нарисуйте гистограмму для этих данных и сравните полученные ЧастотЫс тео- ретическими. Для этих данных примените критерий подгонки Оправдано ли подозрение игрока? 23. Новая техника изготовления резиновых трубок проверяется следующим образом. Пара трубок (одна из которых изготовлена по старому методу, а вто- рая — по новому) обрабатывается различными видами кислот. Данные о сроке службы трубок (в годах) следующие: 1 Новый метод 1,7 Старый метод 1,2 Тип кислоты 2 3 4 5 4,6 3,7 3,9 2,8 4,4 3,1 4,0 2,4 6 7 8 9 10 3,1 2,4 4,2 3,6 3,3 2,7 2,6 3,7 3,5 3,0 Проверьте, улучшает ли новая техника качество изготовления резиновых тру- бок, предполагая, что (1) обе величины распределены нормально, (2) распреде- ление не нормальное и неизвестно. 24. К показаниям двух приборов, измеряющих кровяное давление, подби- рается прямая. Обозначим показание прибора 1 через у, а соответствующее по- казание прибора 2 — через х. Методом наименьших квадратов для приведенных данных постройте прямую регрессии у на х при условии, что прямая проходит через начало координат. х: 1,5 1,7 1,8 1,9 2,3 2,4 2,5 2,6 2,9 у: 1,4 1,8 1,7 1,9 2,3 2,3 2,5 2,4 2,8 Sx2 = 44,46; 2р2 = 42,13; Ъху = 43,25. Нарисуйте полученную прямую и нанесите на этот же график точки наблю- дений. Проверьте гипотезу о том, отличается ли коэффициент регрессии от еди- ницы. 25. Для исследования растворимости некоторого вещества (на единицу веса) было проведено два независимых эксперимента при пяти различных тем- пературах t (измерение в абсолютной шкале). Результаты оказались следующими: х: 3,9 1,32 3,8 1,20 3,7 1,09 3,6 0,81 3,5 0.64 У- 1,42 1,26 1,03 0,83 0,60 2 (у — у)* = 0,746; Sy = 10,20, где х = 1000/? — величина, обратно пропорциональная температуре. (1) Постройте прямую регрессии растворимости на величину, обратную температуре. (2) Будет ли зависимость между у и х на самом деле линейной? 26. В терминах вероятностей пересечения событий А, В, С, D, Е найдите вероятность наступления ровно двух событий. Из таблицы случайных чисел выбираются двухразрядные числа до тех пор, пока не получатся пять четных чисел: нечетные числа не принимаются во вни- мание. Найдите вероятность того, что последние цифры выбранных чисел будут в точности тремя из следующих цифр: 0, 2, 4, 6, 8. 27. X и Y — случайные переменные с совместной функцией плотности ве- роятности f (х, у) = k (ху + t/2) для 0<х<2, 0<у<2. Найдите значение k. Чему равна Р (х + у < 2)? Найдите коэффициент корреляции между X и У (ответ дайте с тремя верными знаками). 28 Найдите производящую функцию моментов для геометрического распределения f (х) = (1 — а) а*-1 (х = 1, 2, 3...). Определите среднее и дисперсию х. Найдите Е [(х — а)2]. 29. Сформулируйте условия, при которых нормальное распределение мо- жет служить аппроксимацией к биномиальному. 273
Игральная кость бросается 30 000 раз. Найдите вероятность того. Что число выпадения шестерки (а) будет меньше 4770, (б) будет лежать между 5100 и 5200. Найдите п, для которого вероятность того, что число выпадений шестерки заключено между 4900 и п, равна 0,5. 30. (а) Дайте определение несмещенной оценки и покажите, что ns2/ (и — 1) есть смещенная оценка ст2, где s2 — дисперсия выборки объема п. (б) х и у — независимые случайные переменные и г = х + у. Покажите, что дисперсия г равна ст2 = ст2 + ст2. Покажите также, что £ (ху) = Е (х) Е (у). (в) Выборка 25 значений из большой совокупности имеет дисперсию 5, а повторная выборка 20 значений имеет дисперсию 4. Найдите 95%-ный довери- тельный интервал для р.ж — р?/ при условии, что выборки производились из двух различных нормальных совокупностей с одинаковой дисперсией и со сред- ними |гк и р.у соответственно. 31. Сформулируйте основные математические свойства Р (£) — вероятно- сти события £. Дайте определение статистически независимым событиям. А, В, С — статистически независимые события. Вероятность наступления А и ненаступления В и С равна а. Вероятность наступления только события В равна Ь, вероятность наступления только события С равна с. Покажите, что а b с Р(А) = ———; £(£)=——; Р(С)=——, a-f-x о-|-х с-|-х где х — корень уравнения (а + х) (Ь + х) (с + х) = х2. 32. Из физического колледжа была произведена случайная выборка 16 сту- дентов; была также произведена случайная выборка 16 студентов университета. Для каждого студента был определен индекс подготовки по физике. Результаты оказались следующими. Университет Физический кол- ледж Выборочное Несмещенная оцен- среднее ка дисперсии совокупности 84 81 90 49 Проверьте гипотезу о том, что уровень знания физики у студентов физичес- кого колледжа выше, чем у студентов университета. При этом сделайте необ- ходимые предположения. Как можно раскритиковать подобный эксперимент? 33. Докажите, что если А и В — два случайных события, то Р (А) + Р (В) = Р (АВ) + Р (AЦВ). Докажите теорему Байеса: если Blt В2, ..., Вп — непересекающиеся события, объединение которых дает все выборочное пространство, то 2 P(A/B})P(Bj) 1=1 Известно, Что события А, В, С таковы, что Р (В) = 3/5, Р (А/В) = 3/4, Р (С) = = 1/2, Р (А/В') = 1/2, Р (А/С’)=2/3, Р (АС'/В') = 1/4. Найдите Р (А), Р (А/С), Р (А В'С) и покажите, что Р (ВС/А) = 1/3. 34. «Все научные гипотезы являются нестатистическими гипотезами, а все статистические гипотезы являются научными». Прокомментируйте это заявле- ние, обращая особое внимание на роль нулевой гипотезы при проверке ста- тистических гипотез. 35. В случайной выборке объемом 10, взятой из большой совокупности лю- дей, было обнаружено, что два лица поддерживают политику государства. Проверьте гипотезу о том, что доля людей, поддерживающих политику прави- тельства, равна 0,5, с помощью (а) биномиального распределения, (б) нормаль- ного распределения. . 274
Покажите, что в данном случае последнее распределение будет хорошей ап- проксимацией первого. F 36. Случайная переменная х имеет распределение Пуассона с парамет- ром X, т. е. 1 Р(х) = е~х--------- (х = 0, 1,2, ...). х! Найдите среднее и дисперсию х. На некотором заводе были обследованы рабочие, получцВШие на производ- стве незначительные увечья. За 52 недели результаты обсл^лования были сле- дующие: Число рабочих, по- лучивших увечья за неделю О 1 2 3 4 и более Число недель, в течение которых увечья получили х рабочих 31 17 3 1 О Предполагая, что эти данные можно адекватно аппРСк с соновским распределением с параметром л, оцените это таблицы. С помощью вычисленного значения найдите теоЪрТнцрг1.ир " г.„рт,, числа недель, в течение которых будет 0, 1, 2 и 3 увечья. 37. Одновременно бросают две игральные кости и монету рсли выпадает герб, то значение х получается суммированием очков, выпц:вщих на nBVXK0 стях. В том случае, когда выпадает решетка, число х по^уЧают вычитанием большего числа очков выпавших костей из меньшего. у Составьте таблицу возможных значений х с их соответст^ ющими вероятно- стями. Чему равны среднее, мода, медиана х? Покажите, что вероятность полу- чить значение х < 2 больше, чем вероятность получить зна^р^ > у 3 38. В приведенной таблице W означает вес в ньютона^ Некот* - хими. ческого вещества, растворяющегося в воде при ТС. г Т W т W т W 5 42 20 53 35 10 43 25 56 40 ля 15 47 30 60 45 71 Найдите уравнение регрессии, которое необходимо дл^ оценивания спел- него значения W для данного значения Г. Оцените средне^ w если т =28 Вычислите коэффициент корреляции между У и IF. ’ 39. Случайная переменная X со средним р. имеет прои^ Лункпию моментов, равную mx (Z) = Е [ехр (АЧ)]. При условии, что Y пДоверьте, что ту (/) = е тх (/). Покажите, что среднее X равно п ’ известно’ что X имеет биномиальное распределение с параметрами п и /если Y = X * — пр, докажите, что тогда ту (t) = (qe-pt+pe4t)n- 40. Для каждого из следующих случаев найдите пр еде.о г роятностью 95% будут лежать значения R: , к рь (a) R есть число бактерий в выборке объемом 1 мм3 про-;.. ич „ППП111О прпр мешанной смеси, содержащей в среднем в 1 мм3 50 бактерий . р (б) R есть чИСЛО выигранных вбрасываний капитаном ^рикетной комаНды в серии из 100 вбрасывании; г (в) R есть процент выигранных вбрасываний капитаном В серии из 200 вбрасываний. Аргументируйте ваши ответы. брикетной команды 275
ЧАСТЬ ТРЕТЬЯ ПРИКЛАДНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ и исследование ОПЕРАЦИЙ 3.0 ВВЕДЕНИЕ 3.0.1. МОДЕЛИРОВАНИЕ Общим для всех научных исследований является построение мо- делей реальной действительности. Слово «модель» используется здесь в более широком смысле, чем обычно, когда оно употребляется в связи с моделью судна, моделью автомобиля, моделью аэроплана и т. д., моделью, вырезанной из обыч- ного дерева или же любовно изготовленной из кусков бальсовой дре- весины, бумаги и клея. Говоря о моделировании, мы предполагаем охват этим понятием действий гораздо более общих. Мы моделируем всякий раз, когда представляем в уме то, что пытаемся сделать или понять, когда рисуем планы проекта, когда с помощью одной уже из- вестной ситуации описываем другую, похожую на нее (т. е. пользуемся аналогией), а также выражая наши мысли письменно, с помощью ри- сунка, скульптуры, символов или в иной форме. Ученый при столкновении с некоторой системой или явлением при- роды, не поддающимся объяснению в рамках существующих теорий, попытается построить несколько различных моделей. Он начнет с на- копления довольно-таки неопределенных идей и мысленного их обду- мывания, с проверки различных взаимосвязей и разных функцио- нальных соотношений и будет это делать до тех пор, пока его модель не начнет приобретать более или менее законченную форму. Тогда появляется возможность перейти к некоторой конкретной форме мо- делирования, т. е. попытаться представить систему или как физическую модель, или в виде схем, или с помощью каких-либо символов. Могут быть выделены три «чистых» типа моделей. 1) Иконической называют модель, точно повторяющую объект. Например, модель автомобиля (в уменьшенном масштабе) и модели химических молекул (в увеличенном масштабе) представляют собой модели, точно повторяющие объект. 2) Аналоговой моделью называется модель, свойства которой оп- ределяются законами, аналогичными законам изучаемой системы. Например, соотношение между током и напряжением в электрической сети при некоторых условиях аналогично соотношению между грузом и растяжением пружины. И следовательно, когда изучаемая система 276
содержит нагруженные пружины, представляется возможным исполь- зовать электрическую цепь как аналоговую модель. Манипулирование напряжением, прикладываемым к цепи, дает информацию о соотно- шениях напряжения и силы тока в электрической системе; тогда (если модель хороша для наших целей) прямая трансформация этих резуль- татов приведет к новым знаниям о системах с нагруженными пружи- нами. 3) Символической называют модель, в которой используются сим- волы, например х, у, 0, чтобы представить физические величины, такие, как расстояния, углы, напряжения и т. д. Тогда соотношения между величинами описываются (т. е. моделируются) посредством ал- гебраических или дифференциальных уравнений, связывающих сим- волы. Вообще, модель системы может быть комбинацией двух, а возмож- но, и трех чистых типов моделей. Цель построения модели заключается в изучении и, как следствие, в более глубоком понимании представляемой физической системы. Фундаментальный процесс, известный как научный метод, состоит в формулировании модели системы, в манипулировании моделью и по- лучении с ее помощью определенных выводов, в перенесении этих вы- водов на физическую систему, в постановке экспериментов для про- верки правдивости этих выводов, и, наконец, в переформулировании модели в свете результатов такой проверки. Непрерывное взаимодей- ствие идей, возникающее при попытках построения физической и схе- матической моделей, хорошо согласующихся с результатами наблю- дений за реальной системой, ведет к более глубокому проникновению в сущность изучаемых взаимосвязей. Постановки новых экспериментов, новые объекты для изучения, новые области знаний и приложений воз- никают на каждой стадии научного исследования. Процесс добывания знаний—это важнейший факт, понимание которого невозможно пере- оценить. В связи с необходимостью более или менее точного согласо- вания с реальными системами объяснения дальнейших эксперименталь- ных результатов модели непрерывно проверяются, отбрасываются или модифицируются, упрощаются или становятся более сложными. Дальнейшая полезная классификация моделей состоит в подраз- делении их на детерминированные и стохастические. (Многие модели являются смесью этих двух типов, т. е. они включают в себя как детер- минированные, так и стохастические элементы.) Детерминированной моделью называется модель, в которой могут быть установлены точные соотношения между входящими в нее величинами. В стохастической модели величины следуют статистическим законам. Например, для описания системы нагруженных пружин целесообразно использовать детерминированную модель, так как интересующие нас соотношения между грузом и растяжением пружины подчиняются точному закону. При описании дорожного движения прибытие автомобилей в систему будет, вообще говоря, носить статистический характер; следовательно, применяемая модель должна быть стохастической. 277
3.0.2. ПЛАН ТРЕТЬЕЙ ЧАСТИ КНИГИ Во второй части книги было введено понятие вероятности и ука- зано, какую важную роль оно играет в развитии методов статистиче- ского анализа. В третьей части будет показано, как теория вероят- ностей применяется при изучении многих физических систем. Всякий раз, когда для представления системы берется стохастическая модель, привлекаются вероятностные понятия и законы. Сначала они исполь- зуются при формулировании модели, а затем при манипуляциях с нею для объяснения соотношений между переменными и получения новых знаний о системе. Во всех областях науки происходит быстрое развитие направлений, связанных с применением стохастических моделей. Огромная роль этих моделей в изучении природных явлений становится очевидной всякому, кто осознает, что фактически все (или почти все) соотношения между реальными величинами на некотором уровне но- сят скорее стохастический, чем детерминированный характер. Главу 3.1 мы начинаем с описания и анализа некоторых последо- вательностей экспериментов. В этих последовательностях возможные результаты одного эксперимента связаны с результатами предыдущего эксперимента некоторыми «вероятностями перехода». Мы имеем дело с простейшими последовательностями этого типа. Они называются конечными цепями Маркова. Знакомство с ними поможет читателю ус- воить многие идеи, необходимые для более глубокого изучения случай- ных процессов. В гл. 3.2 изучаются основные моменты теории очередей (теории мае сового обслуживания), рассмотрены модели нескольких различных типов очередей, показано применение метода Монте-Карло. Надеемся, что эта глава будет полезна читателю во многих отно- шениях, а именно: 1) он узнает, как строится символическая модель и как она может изменяться при согласовании с различными физиче- скими ситуациями; 2) получит представление о том, как вероятностные идеи применяются в моделировании; 3) познакомится с содержанием одной из наиболее интересных областей исследования операций. В трех следующих главах читатель знакомится с такими разделами исследования операций, как линейное программирование, сетевое пла- нирование, управление запасами. 3.0.3. ИССЛЕДОВАНИЕ ОПЕРАЦИЙ Уместно сказать здесь несколько слов о том, что такое исследование операций. За последние полвека масштабы и сложность созданных че- . ловеком организаций чрезвычайно возросли. Тенденция к увеличению размеров имеется фактически во всех образованных человеком системах: на национальном и международном уровнях, в предпринимательской деятельности, в военном деле, в образовании ит. д. Рост сложности си- стем неизбежно сопровождается соответствующим увеличением как количества возникающих задач управления, так и их сложности. Ко- гда требуется принимать решения относительно больших объемов ка- питальных ресурсов, причем каждое решение сказывается на много- 278
Численных работниках, число управленческих ошибок должно быть минимальным. Продолжается развитие методов изучения систем, призванных помочь управляющим органам в процессе принятия ре- шений и дать им возможность поддерживать вверенные им организации на высоком уровне. Совокупность теорий и методов, применяемых для построения моделей систем и последующего их изучения, сформиро- валась после второй мировой войны и получила название исследования операций. Новая наука черпает идеи из многих других наук, но наиболее тесно она связана с математическими методами; действительно, мно- гие важные ветви прикладной математики возникли при изучении раз- личных экономических систем. Много математических методов было развито при решении вопросов, связанных с экономикой. Программирование, теория очередей, сетевое планирование, уп- равление запасами, теория надежности и теория восстановления — наиболее интересные разделы исследования операций. Каждый раздел находит собственное применение в промышленности. Каждому соот- ветствуют свои типы моделей и разнообразные математические методы. В этой книге мы обрисуем лишь контуры идей из первых четырех раз- делов. Обобщая, можно сказать, что операционные исследования пред- ставляют собой попытку применить научные методы к сложным си- стемам. Необходимо заменить старые, «высосанные из пальца» управ- ленческие методы объективными способами решения, основанными на количественных методах системного анализа. Коротко их можно назвать «количественным здравым смыслом».
3.1 ГЛАВА ЦЕПИ МАРКОВА А. ОСНОВНЫЕ ИДЕИ И ОПРЕДЕЛЕНИЯ 3.1.1. ВВОДНЫЕ ЗАМЕЧАНИЯ Марковские процессы получили свое наименование по имени рус- ского математика А. А. Маркова (1856 — 1922), который впервые сфор- мулировал соответствующие определения и изучил свойства этих про- цессов. С тех пор теория марковских процессов широко развивалась и нашла применение в таких областях науки, как ядерная физика, педагогическая психология, экономика, эпидемиология и т. д. Об- ласть ее применения расширяется по мере развития теории. 3.1.2. ОСНОВНЫЕ ИДЕИ а) Два примера случайных процессов. С идеями теории марковских процессов мы познакомимся, обсудив два очень простых эксперимента. Эксперимент 1. Правильную монету бросают шесть раз, и каждый раз фиксируют выпадение герба (Н) или решетки (Т). Эксперимент 2. Человек сидит на среднем стуле в ряду из пяти стульев (обозначим их А, В, С, D, Е слева направо). Он перемещается шесть раз со своего стула на соседний стул, причем его перемещения каждый раз определяются бросанием правильной монеты, по сле- дующим правилам: (1) Если он не на крайнем стуле, то он движется вправо, когда вы- падает герб (Я), и влево, когда выпадает решетка (Т). (2) Если он на крайнем стуле, то он должен на нем оставаться в лю- бом случае, т. е. независимо от выпадения герба или решетки. Пусть последовательность занимаемых стульев записывается. Обсуждение. Оба эти эксперимента состоят из шести шагов (или испытаний), результат каждого шага определяется вращением монеты. Любой результат фиксируем буквами Н и Т в эксперименте 1 и буквами А, В, С, D или Е в эксперименте 2. Таким образом, конеч- ный результат каждого Из этих экспериментов есть последовательность из шести букв. Например, возможными последовательностями будут Н, Т, И, Н,Т, Н и Н, Н, И, Т, Т, Т для эксперимента 1 и С, D, С, В, А, А, А (начальный стул плюс шесть «движений») и С, D, Е, Е, Е, Е, Е — для эксперимента 2. 280
Можно предположить, что одни последовательности будут для нас более интересными, чем другие, и рассмотреть их. Например, рассмат- ривая вторую последовательность в эксперименте 2, мы видим, что че- ловек направился сразу в сторону крайнего стула, расположенного справа от него, и остался на этом стуле. Возникает вопрос: с какой вероятностью это может случиться? Также интересно знать вероят- ность, с которой человек, прежде чем попадет в «ловушку», т. е. на стулья, обозначенные А и Е, совершает несколько движений между средними стульями В, С, и D. На вопросы, возникающие в аналогич- ных ситуациях, можно ответить с помощью таких моделей вероятно- стных процессов, как марковские цепи. Результаты очень многих экспериментов в науке, технике, коммер- ческой деятельности могут быть записаны в виде некоторой последо- вательности букв или цифр. Удобно рассматривать их как процессы или цепи событий, в которых на каждом шаге происходит переход из одного состояния в другое. Обычно нельзя точно предсказать, каким путем процесс будет развиваться на произвольном шаге, и можно лишь оценить вероятности для каждого возможного направления. Например, в эксперименте 1 на каждом шаге процесс попадает в одно из двух со- стояний (Н, Т). Поскольку в опыте бросают правильную монету, то разумно считать, что процесс попадает в Н с вероятностью 1/2 и в Т — с вероятностью 1/2. Математическое представление (или модель) процесса, в описании пошагового развития которого участвуют вероятности, называется случайным процессом. Слово «случайный» — синоним слова «вероят- ностный». В понятие случайного процесса существенным образом вхо- дят как множество состояний, так и множество вероятностей перехода из состояния в состояние. Также необходимо знать начальное состоя- ние или по крайней мере вероятностное правило для его определения. б) Пространство состояний процесса. Множество всех возможных состояний, которые может принимать процесс, называется простран- ством состояний. Примеры (1) В эксперименте 1 пространством состояний будет множество {Н, Т}. (2) В эксперименте 2 пространство состояний есть множество {Л, В, С, D, Е}. Пространство состояний может быть конечным, как в рассмотрен- ных примерах, или бесконечным (счетным или несчетным). В этой главе будут рассмотрены процессы только с конечным пространством состояний. Обозначения. Символами s1( ..., sn будут обозначаться п состояний (точек) в данном пространстве состояний. Запись s, -> s} будет означать, что процесс переходит из i-ro состояния в /-е состоя- ние. Упражнение 3.1.1 1. Человек может вернуться с работы домой тремя разными маршрутами. Придумайте разумный набор условий, при которых последовательность марш- 281
рутов, выбранная для заданного числа дней, может быть описана как случайный процесс. Каково его пространство состояний? . 2. Предположим, что в конце каждого учебного года студента можно либо исключить, либо потребовать, чтобы он повторил пройденный курс, либо пере- вести его на следующий курс (либо он вообще оканчивает учебное заведение). Допустим, что каждый такой случай происходит с определенной фиксированной вероятностью. Тогда продвижение студента может быть описано как случайный процесс. Найдите подходящее пространство состояний, предполагая, что учеб- ная программа рассчитана минимум на три года. в) Одношаговые вероятности перехода. Вероятность P(si -> Sy) есть условная вероятность того, что процесс, находясь в состоянии sit перейдет из состояния st в состояние Sj за один шаг. Ее можно обо- значить через ptj. Она называется одношаговой вероятностью пере- хода. Если такие вероятности известны для любой пары состояний, то они могут быть расположены в виде квадратной матрицы. Получен- . ная матрица называется матрицей переходов. Обозначим ее Р, Р = = Ipfjl. Где pij есть элемент, стоящий на пересечении i-й строки и /-го столбца. Примеры (1) В эксперименте 1 есть только четыре возможных случая. Процесс может перейти из состояния Н в состояние Н, из Я — в Т, из Т — в Т или из Т — в И. Обозначим Sj = Н s2 = Т, тогда мат- рица перехода будет такой: 1 1 ’ 2 2 А Р=В С D Е так как Р (Н Н) = Р(Н -э- Г) = 1/2, Р (Т Т) = Р (Т Н) = = ~ и каждый шаг определяется бросанием монеты. (2) В эксперименте 2 возможных случаев гораздо больше. Пять имеющихся состояний определяют 5 • 5 = 25 вероятностей перехода. Матрица выглядит следующим образом' А В С D Е “ 1 0 0 0 0 “ 1/2 0 1/2 0 0 0 1/2 0 1/2 0 0 0 1/2 0 1/2 0 0 0 0 1 Вероятности Р (А -> Л) = 1 = Р (Е -> £), так как человек остается на стуле А или стуле Е, однажды его достигнув. Вероятность Р (В -> С) равна вероятности того, что при бросании монеты выпа- дает герб, т. е. 1/2; аналогично Р (В -+ Д) = 1/2. Поскольку правило перемещения человека (если только он не на крайнем стуле) состоит в том, что он должен двигаться либо направо, либо налево, то вероят- ность остаться ца том же самом месте равна нулю, т. е. ?8?
Р (В В) = 0. Читатель может проверить, что другие элементы мат- рицы найдены правильно. Замечания (1) Все элементы матрицы есть вероятности, и, следовательно, они представляют собой числа от 0 до 1 включительно. (2) Сумма элементов матрицы по любой строке равна единице, п т. е. S pi} — 1 для каждого i. Это действительно так, потому что если /=1 процесс находится в состоянии s;, то на следующем шаге он должен перейти точно в одно из п достижимых состояний. Это достоверное со- бытие, вероятность которого равна 1. Состояние sit конечно, включают в множество достижимых состояний, так как, вообще говоря, процесс может сохранять любое из своих прежних состояний, — в этом случае Ра > 0. (3) Матрицы, в которых все элементы неотрицательны и суммы элементов по строкам равны единице, называются стохастическими матрицами. (4) До сих пор неявно предполагалось, что ptj одинаковы на каждом шаге процесса. Если это предположение выполняется, то говорят, что это процессы со стационарными вероятностями перехода. Упражнение 3.1.2 1. Пусть в задании 1 упражнения 3.1.1 три маршрута помечены буквами А, В и С. Предположим, что вероятность того, что человек при выборе маршрута предпочитает маршрут предыдущего дня, всегда равна вероятности, что он выбе- рет какой-нибудь из оставшихся маршрутов и что отдельные вероятности двух других маршрутов равны. Запишите матрицу переходов для этого процесса. 2. В задании 2 упражнения 3.1.1 предположим, что вероятность исключе- ния студента равна г, вероятность повторения курса есть s, а вероятность пе- ревода на другой курс (или завершения учебы) есть t. Запишите матрицу пере- ходов для этого процесса. г) Начальный вектор вероятностей. Первое состояние, из которого процесс начинается, может быть либо известно (как в эксперименте 2), либо оно определится по некоторому вероятностному правилу (как в эксперименте 1). Для любого процесса должен быть задан начальный вектор вероятностей а = (ах, ..., ап), где элемент есть вероятность того, что начальное состояние процесса есть s,-. Для эксперимента 1 начальный вектор есть а = (1/2, 1/2), для эк- сперимента 2 — это вектор а = (0, 0, 1, 0, 0), так как известно, что процесс начинается с того, что человек сидит на стуле С. д) Вероятность произвольной, наперед заданной последователь- ности. Рассмотрим последовательность Н, Т, Н, И, Т, Н, полученную в эксперименте 1. Исходя из определения произведения пространств (см. 2.1.7, с. 127) получаем вероятность появления этой последователь- ности: Р (И, Т, Н, И, Т, Н) = Р(Н) . Р (Т) • Р (Я) • Р (Я) • Р (Г) Р (Н) = = 1/2 - 1/2 1/2 • 1/2 - 1/2 • 1/2 = 1/64, так как испытания независимы. 283
Невозможно применить это правило к последовательности, полу- ченной в эксперименте 2. В этом случае переходные вероятности на каждом шаге зависят от конкретного стула, на котором сидит человек, бросающий монету. Другими словами, испытания не будут незави- симыми. Ясно, что считать испытания независимыми и применять для определения вероятности выпадения заданной последовательности правило перемножения вероятностей можно тогда и только тогда, когда все строки матрицы перехода идентичны. Для тех процессов, у которых строки матрицы различаются, естественно обобщить правило перемножения вероятностей следующим образом. Рассмотрим выборочную последовательность sj, sh, sm в экс- перименте, для которого известны начальный вектор вероятностей и матрица перехода. Тогда вероятность последовательности опреде- ляется по формуле Р (Sj, SR, Sm) — P(Sj) • P (Sj —> Sft) • P (sk —> sm) = = dj • pjh • Pkm- Ясно, как распространить это правило на случай последователь- ностей с любым числом шагов (п шагов). Можно показать, что эта про- цедура согласованным образом приписывает определенные вероят- ности каждой из всех возможных последовательностей; для любого значения п сумма соответствующих вероятностей равна единице. Процессы, к которым применимо это правило, называют марков- скими. Для таких процессов вероятность направления следующего шага зависит лишь от текущего состояния процесса и не зависит ни от одного из состояний, достигнутых ранее. Примеры (1) В эксперименте 1 испытания независимы, и процесс является марковским лишь в самом тривиальном смысле. Цепное правило впол- не применимо, но в силу равенства pi} = as для каждого i оно вырож- дается в обычное правило перемножения вероятностей. (2) Вероятность последовательности С, D, С, В, А, А, А в экс- перименте 2 равна Р (С, D, С, В, А, А, А) = Р(С) Р(С -> О) ... = I - 1/2 - 1/2 . 1/2 • 1/2 • 1 • 1 = 1/16. Упражнение 3.1.3 1. Определить вероятности следующих последовательностей: (1) Эксперимент 1: И, Н, И, Н, Н, И; Н, Т, И, Т, Н, Т; Т, Т, Т, Н, И, И (2) Эксперимент 2: С, В, С, В, А, Л, A; D, С, В, Л, А, А, А; С, В, С, D, Е, Е, Е. 2. Пусть человек в эксперименте 2 производит лишь два перемещения. Каж- дая возможная последовательность содержит тогда три буквы. Выпишите все возможные последовательности, определите соответствующие им вероятности и покажите, что суммарная вероятность равна единице. е) Определение стационарной конечной марковской цепи. Стацио- нарная конечная марковская цепь полностью определена, если задано: (1) конечное пространство состояний; 284
(2) матрица Р = [ро] стационарных одношаговых вероятностей перехода; (3) начальный вектор вероятностей а. Цепное правило, описанное в 3.1.2, д), применяется для определения вероятностей выборочных последовательностей. Когда эти характеристики заданы или удовлетворительно оце- пены, можно ответить на целый ряд вопросов, касающихся поведения процесса. Упражнение 3.1.4 Следующие упражнения помогут читателю поближе познакомиться с идея- ми теории марковских цепей и укажут на разнообразие ситуаций, в которых эта теория может применяться. Необходимо, однако, понимать, что большая часть практических примеров идеализирована и упрощающие предположения могут затруднить объяснение полученных выводов и даже сделать такое объяс- нение невозможным. Тем не менее даже очень простые модели часто применяют- ся при изучении реальных процессов. 1. Предположим, что в эксперименте 2 человек для определения своих перемещений каждый раз бросает игральные кости и поступает следующим образом: (1) если он сидит не на крайнем стуле, то: (а) перемещается налево при выпадении 1 или 2; (б) перемещается направо при выпадении 3 и 4; (в) остается на том же месте при выпадении 5 или 6. (2) Если он сидит на крайнем стуле, то: (а) возвращается на стул С, когда выпадает нечетное число; (б) остается на том же месте при выпадении четного числа. Выпишите матрицу переходов в соответствии с новыми правилами. Подсчитайте вероятности следующих последовательностей: С, D, Е, С, D, А, С; С, В, D, Е, Е, А; С, В, А, А, С, D; С, D, Е, С, Е, С. Теперь предположим, что начальное состояние не зафиксировано, а опре- деляется бросанием монеты. Если при бросании монеты выпадает герб (//), то стартовой точкой будет стул В, а если выпадает решетка (Т), то — стул С. Вы- пишите новый начальный вектор вероятностей. Подсчитайте теперь вероятности ранее приведенных последовательностей, а также вероятности следующих последовательностей: В, С, D, С, В, А; В, A, A, C,D, Е; В, С, D, В, Е, С; В, А, С, D, Е, Е. 2. В следующем эксперименте со стульями предположим, что условия те же, что и в эксперименте 2, за исключением того, что крайние стулья не являют- ся «ловушками». Если человек сидит на крайнем стуле, то на следующем шаге он должен переместиться на стул В. Выпишите новую матрицу переходов и выпол- ните предыдущее задание. 3. Рассмотрим снова эксперимент 2; изменим правило (2) следующим об- разом: «Если человек сидит не на крайнем стуле, то на следующем шаге он дол- жен переместиться на ближайший внутренний стул». Стулья А и Е действуют как отражающие стенки, и человек возвращается в игру всякий раз, когда он достигает какого-либо конца ряда. Выпишите новую матрицу переходов и выполните задание I этого упраж- нения. [1 — г г 1 . Если эта матрица стохастическая, s 1 — sj то каковы пределы изменения г и s? 5. Предположим, что имеются только три воскресные газеты: «Корабль», «Чепуха», «Чемпион» и что все люди покупают только одну из них. Пусть в среднем люди стремятся поменять газету (т. е. подписаться на какую-либо другую) не более одного раза в год и вероятности таких изменений постоянны. Задано следующее процентное соотношение: (1) 80% читателей возобновляют 285
Подписку на ту же самую газету в следующем году; (2) 15% читателей «Корабля» подписываются на «Чепуху»; (3) 10% читателей «Чепухи» подписываются на «Чемпиона»; (4) 8% читателей «Чемпиона» подписываются на «Корабль». Выпишите матрицу переходов. Определите вероятности следующих после- довательностей, считая, что выбор первой газеты каждый раз происходит с вероятностью 1: «Корабль» — «Чепуха» — «Чемпион»; «Чемпион» — «Че- пуха» — «Корабль»; «Чепуха» — «Корабль» — «Чемпион». 6. Рассмотрим следующий эксперимент. Первый шаг. Выбрать и записать случайное однозначное число (т. е. выб рать наугад одну из цифр 0, 1, ..., 9). Второй шаг. Выбрать случайным образом еще одну цифру и сложить ее с первой. Если результат будет меньше десяти, то записать его. Если результат больше или равен десяти, то записать только число " единиц. g Например, последовательность выбранных чи- —>— сел 6, 7. Последовательность записанных чисел С будет 6, 3, так как 6 + 7 = 13. Третий шаг. Повторить второй шаг, только при рис 115 этом выбранное число суммируется со вторым за- писанным числом. Например, последовательность выбранных чисел 6, 7, 8. Последовательность за- писанных чисел будет 6, 3, 1, так как 3 |- 8 = И, и т. д. для последующих шагов. Определите пространство состояний и матрицу переходов. Будет ли этот процесс марковской цепью? (См. пример (1) из 3.1.2, д).) 7. Более интересным, чем в предыдущем задании, получается процесс, если случайные числа перемножать, а не суммировать, и записывать число еди- ниц результата. Учитывая это изменение, выпишите матрицу переходов, ис- пользуя (1) пространство состояний {0, 1...9} и (2) пространство состояний {si, s2, s3, s4}, где Sj = {fl}, s2 = {5}, s3 = {2, 4, 6, 8}, s4 = {1, 3, 7, 9). В случае пространства (1) каковы вероятности последовательностей 3, 4, 5, 5, 0; 2, 4, 6, 5, 0, 0; 9, 6, 5, 3, 4; 8, 8, 8, 8, 8, 0; 6, 5, 6, 5, 6, 5? В случае пространства (2) каковы вероятности последовательностей s3, s2, s2, s3, S4, s3; S4, s3, s3, s2, s2, Sjj S4, s4, s3, s2, s$? 8. В городе три местных супермаркета X, Y, Z конкурируют между собой, и относительно их фирма по изучению рынка подметила некоторые факты. На 1 августа каждый магазин имел равное число покупателей. За предыдущие шесть месяцев в среднем за месяц: (1) магазин Л' сохранил 80% своих покупателей и получил 10% покупате- лей магазина Y и 2% покупателей магазина Z; (2) магазин Y сохранил 70% своих покупателей и получил 14% покупателей магазина X и 8% покупателей магазина Z; (3) магазин Z сохранил 90% покупателей, получил 6% покупателей мага зина X и 20% покупателей магазина Y. Составьте матрицу перехода для средних ежемесячных изменений. Если предположить, что общее число покупателей в городе постоянно, то какую долю от их числа имеет каждый магазин на 1 сентября, считая, что составленная мат- рица перехода верна в течение августа. 9. На окружности расположены шесть точек, равноотстоящих друг от дру- га. Процесс движется из точки в точку следующим образом. Из данной точки он перемещается в одну из ближайших соседних точек с вероятностью 1/4 или в диа- метрально противоположную точку с вероятностью 1/2. Выпишите матрицу перехода для этого процесса. 10. Два корабля стреляют друг в друга одновременно и через равные промежутки времени. При каждом обмене выстрелами корабль А поражает корабль В с вероятностью 1/2, а корабль В поражает корабль А с вероятностью 3/8. Предполагается, что при любом попадании корабль выходит из строя. Рас- сматриваются результаты серии выстрелов. Составьте пространство состояний и матрицу перехода, если состояниями цепи будут комбинации кораблей, ос- тавшихся в строю. 11. На рис. 115 показана группа из трех параллельных выключателей. 286
Ток пойдет, если по крайней мере один из выключателей будет включен. Пусть р вероятность того, что выключатель срабатывает на каждой стадии процесса, и q = 1 — р есть вероятность отказа. Предположим, что все выключатели при- водятся в действие независимо и что если выключатель отказывает, то он от- казывает постоянно. Пусть пространство состояний есть { О, Л, В, С, АВ, ВС, СА, АВС}, где 0 означает, что никаким выключателем нельзя пользоваться; А означает, что можно пользоваться только выключателем Л, и т. д. Процесс таков, что ток должен идти дискретными интервалами. Ясно, что вероятность того, что ток вообще пойдет, зависит от состояния системы. Опре- делите матрицу переходов. 3.1.3. ВЕРОЯТНОСТИ МНОГОШАГОВЫХ ПЕРЕХОДОВ а) Эргодическая цепь: «-шаговые переходы На рис. 116 изображен график выборочной последовательности некоторой марковской цепи, имеющей пять состояний А — Е. Состояния цепи отмечены на верти- кальной оси; номера шагов отмечаются точками на горизонтальной оси, расположенными на равных интервалах друг от друга. 1 1 ।_।__।_।—i—।—।—।—।—।— t 7 2 3 4 5 6 7 8 9 10' 11 72 Номера шагов Рис. 116-. Движение марковской цепи от состояния к состоянию Замечания (1) В течение двенадцати шагов все возможные состояния были процессом пройдены и ни одно из них не оказалось для него «ловуш- кой», как это было в эксперименте со стульями (см. с. 280). Отдельные состояния, которые могут «ловить» процесс, называются поглощающими состояниями. Эти и другого рода состояния будут рассмотрены на с.291. Изображенная на рисунке цепь не имеет поглощающих состояний. (2) Если при тех же условиях блуждание происходит неопределен- но долго, то процесс все время будет двигаться среди пяти своих со- стояний, покидая каждое из них и время от времени снова возвращаясь в него. Такой процесс называется эргодической цепью. Другие типы цепей будут определены на с. 292. (3) В выборочной последовательности, показанной на диаграмме на рис. 117, переход В -> С встречается три раза" (а) В С; (б) В -> Е С; (в) В А D Е С. Ясно, что путь из В в С (и между любыми двумя состояниями) может быть совершен за произвольное число шагов: число шагов— переменная величина. Теоретически важно знать, какова вероятность перехода из одного данного состояния в другое за п шагов. 267
Определение. Вероятность перехода процесса из состояния Si в состояние sj в точности за п шагов называется п-шаговой вероят- ностью перехода и обозначается рц\ Квадратная матрица, образован- ная из всех таких вероятностей р<"\ называется п-шаговой матрицей вероятностей переходов. Теорема 1. Если Р есть одношаговая матрица вероятностей перехода стационарной конечной марковской цепи, то Рп есть и-шаго- вая матрица вероятностей пере- хода. Доказательство. Ясно, что pi}’ = Pij, где ро— элемент матрицы Р. Вероят- ность р};’ есть вероятность пе- рехода из sL в Sj точно за два шага. Рассмотрим пути, по ко- торым может быть совершен этот переход. На рис. 117 иллю- стрируется полное множество допустимых т состояний ₽ S. Есть т взаимно исключающих Начальное Второе Третье состояние состояние состояние Рис. 117. Переходя,—*Sj за два шага друг друга возможных путей, а именно: >sx—>sj, s, —s2 —> s}, Si -> Ss-^S; и т. д. Вероятности этих путей, вычисляемые по цепному правилу, есть Рп ' Ри> Ра ’ P2J и т- А- Таким образом, вероятность события я,- -> sj в точности за два шага есть сумма этих вероятностей, т. е. т РФ = ^Pir Pri- Но по определению умножения матриц сумма справа есть элемент матрицы Р2, стоящий на пересечении j-ro столбца и i-й строки. Следо- вательно, матрица Р2 совпадает с матрицей Проводя в точности такие же рассуждения, можно показать, что рСи+П _ ^pir . р^. Итак, по индукции теорема верна для любого Г=1 целого п. Пример. В эксперименте 2 вероятности того, что человек бу- дет сидеть на стульях А, В, С, D или Е точно после двух шагов, могут быть получены умножением соответствующей матрицы Р (см. 3.1.2, в)) на себя. А В С D Е О 1 4 О I 4 О о о О — 4 — о 2 о — 4 о о О" о 1 4 1 2 1, 288
Поскольку известно, что перемещения начинаются со стула С, то требуемые вероятности находятся в третьей строке, т. е. Р (С^А) = 1/4; Р (С^В) = 0; Р(С-> С) = 1/2; Р (С -> D) = 0; Р (СЕ) = 1/4. б) Полные вероятности. Вероятность того, что п-е состояние про- цесса есть Sj, обозначим через а(р*. Она называется полной (или безусловной) вероятностью. Аргументируя так же, как и при доказательстве теоремы 1, можно . . т . показать, что щ1' = 2 су рг" где аг — вероятности начальных г—1 состояний (см. 3.1.2, г)). Каждый член суммы есть произведение веро- ятности того, что начальное состояние есть sr, на вероятность перехода из состояния sr в состояние Sj за первые п — 1 шагов. Ясно, что есть /-й элемент в вектор-строке, полученной умножением вектора а на матрицу Рп~г. Это доказывает следующую теорему. Теорема 2. Если ап есть вектор-строка (с(п)), то ап = а Рп~1, и > 1 . («] = «). Пример. Предположим, что в эксперименте 2 вектор начальных вероятностей равен (1/2, 1/8, 1/8, 1/8, 1/8). Тогда вероятности того, что человек сидит на произвольном стуле после двух перемещений, вычис- ляются так: I I 1 1 1 1 \ п2 / 19 1 1 1 7 \ —> ’—> —, —, — -Р = —, —, —-, •—, -— . V 2 8 8 8 8 / \ 32 16 16 16 32 7 Таким образом, вероятность, что после двух перемещений человек л 19 сидит на стуле А, равна и т. д, •J.Z Упражнение 3.1.5 1. Даны следующие переходные матрицы и векторы начальных вероятно- стей для марковских цепей: (1) S1 ° 1 1 (2) si 0,5 0,51 s2 0,3 0,7j «2 . 0 1 J а = (0,5, 0,5) а = = (0,3, 0,7) (3) si 1 0 о - (4) ’ 0 0,5 0,5 s2 0,2 0,1 0,7 «2 0 1 0 S3 0,4 0,5 0,1 S3 0,2 0,6 0,2 7— — I \ а = \ 4 ’ 2 ' — 1 а = 4 ' -(0,1, 0,4, 0,5) Определите векторы а2 и а3 для каждой цепи. Какова вероятность, что цепь (4) не будет в состоянии s3 после двух пере- ходов? 2. Погода на некотором острове через длительные периоды времени ста- новится то дождливой (It7), то сухой (F), вероятности ежедневных изменений * Здесь начальное состояние считается первым, а не нулевым. — Примеч. ред. 10 Зак. 973 289
заданы матрицей Р: W F „ W ГО,7 0,3' F [0,4 0,6. (1) Если в среду погода дождливая, то какова вероятность, что она будет дождливой в ближайшую пятницу? (2) Если в среду ожидается дождливая погода с вероятностью 0,3, то какова вероятность, что она будет дождливой в ближайшую пятницу. Б. КЛАССИФИКАЦИЯ СОСТОЯНИЙ И ЦЕПЕЙ 3.1.4. ВВЕДЕНИЕ Чтобы познакомиться с некоторыми аспектами теории марковских процессов, потребуется рассмотреть различные классы состояний. Тогда, выяснив, к какому классу относятся состояния, встречаемые в данной цепи, можно классифицировать цепь и изучить ее специфиче- ские свойства. Для подготовки к пониманию дальнейших определений читателю полезно выполнить следующие простые упражнения. Упражнение 3.1.6 Приведенные далее четыре стохастические матрицы представляют собой Матрицы переходов для четырех различных марковских цепей. Для каждой из этих цепей нарисуйте график нескольких возможных последовательностей, т. е. начиная с любого состояния st, двигайтесь в какое-нибудь состояние Sj, для которого вероятность перехода р;; — не нуль. Каждый раз продолжайте ри- совать график не менее чем для десяти шагов. Чтобы проконтролировать, что на каждом шаге ptj > 0, все время следует обращаться к матрице перехо- дов. Каждую новую последовательность начинайте в различных состояниях. Другим полезным упражнением будет изображение дерева, каждая ветвь которого представляет возможное состояние. Дерево следует рисовать до тех пор, пока не станет ясно, что начинаются повторения. Каждый раз дерево на- 290
Отличительные особенности каждой цепи скоро станут очевидными, и чю татель должен обратить внимание на такие моменты, как поглощение цепи в од- ном или нескольких состояниях (существование «ловушек»), регулярные коле- бания, невозможность возвратиться в состояния, которые были однажды поки- нуты. а) Определения (1) Эргодические состояния. Пусть Е — подмножество пространства состояний S (или само S), и Е' — его дополнение до S. Если каждое состояние множества Е может быть достигнуто из лю- бого другого состояния множества Е, а в состояние множества Е’ нельзя перейти ни из одного состояния множества Е, то множество Е называют эргодическим множеством. Однажды попав в эргодическое множество, процесс не может покинуть его, и с этого времени переме- щения происходят среди состояний этого множества. Эргодическое состояние есть элемент эргодического множества. (2) Неустойчивые состояния. Пусть Т есть подмножество S и Т' — его дополнение. Если произвольное состояние множества Т может быть достигнуто из любого другого состояния этого множества и имеется возможность перейти по крайней мере из одного состояния, принадлежащего Т, в состояние из Т', то множество Т называют неустойчивым множеством. Неустойчивое состояние есть элемент неустойчивого множества. (3) Поглощающие состояния. Если эргодическое множество состоит из одного состояния, то это состояние называется поглощающим. Однажды попав в это состояние, процесс остается в нем. Замечание. Можно показать, что любая конечная марков- ская цепь должна иметь по крайней мере одно эрогодическое множест- во. Их может быть два или больше. С другой стороны, неустойчивых множеств может совсем не суще- ствовать. В соответствии с другими критериями возможна дальнейшая клас- сификация состояний (см. работу [221). Примеры. Рассмотрим марковские цепи, заданные матрицами (а) — (г) в упражнении 3.1.6. Их состояния можно классифицировать. Мы советуем читателю самостоятельно проверить классификацию на графиках. (a) {sj,, s3} и {s2} — два эргодических множества; s2 — поглощаю- щее состояние. (б) sT—поглощающее состояние; {s2} и {s3}—два неустойчивых множества. (Замечание. Поскольку невозможно перейти из s2 в s3, то {s2, s3} не будет неустойчивым множеством.) (в) есть неустойчивое состояние; {s2, s3} есть эргодическое мно- жество. Здесь необходимо отметить, что после попадания в эргодическое множество {s2, s3} движение становится периодическим. Переме- щение s2->s2 (и $3-> s3) всегда совершается за два шага. Это при- мер циклического эргодического множества. (г) Произвольное состояние может быть достигнуто из любого дру- гого. Следовательно, {fij, s2, s3} есть простое эргодическое множество. 10* 291
Упражнение 3.1.7 1. Проверьте следующие утверждения: (1) Если si — поглощающее состояние, рц = 1. (2) Если Si £ Е, a sj £ Т, то pW = 0 для любого п. (3) Если sj и sj принадлежат Е, то pW > 0 для каждого п. (4) Пересечение Е и Т пусто. 2. Классифицируйте состояния из эксперимента 2 (см. 3.1.2, а). б) Классификация цепей. Наряду с определениями, данными в 3.1.4, а), можно провести другую весьма полезную классификацию марковских цепей. Более детальную классификацию можно найти в работе [22J. Ясно, что цепи могут быть разделены на те, которые имеют неустой- чивые состояния, и те, которые таких состояний не имеют. Число и ти- пы эргодических множеств в каждой цепи могут служить критериями для классификации их. Здесь будут охарактеризованы только два класса цепей. Значительная часть теории марковских цепей посвящена изучению этих двух классов. I. Поглощающие марковские цепи. Это цепи, устойчивые состояния которых поглощающие. (Процесс из эксперимента со стульями пред- ставляет собой такую цепь, только состояния А и Е — устойчивые состояния.) II. Эргодические цепи. Цепь, состоящая из единственного эргодиче- ского множества, называется эргодической цепью. Можно выделить два типа этих цепей. (1) Циклическая цепь, в которой каждое состояние может’ прини- маться через определенные периодические интервалы (см. пример (в) из 3.1.4, а)). (2) Регулярная цепь, которая является непериодической эргоди- ческой цепью. Упражнение 3.1.8 Классифицируйте состояния и цепи во всех примерах упражнения 3.1.4. 3.1.5. ВОПРОСЫ, ВОЗНИКАЮЩИЕ В ТЕОРИИ МАРКОВСКИХ ЦЕПЕЙ Может быть сформулировано много вопросов, касающихся движения цепи в ее множестве состояний. Здесь мы определим лишь несколько величин: (1) вероятность того, что цепь, выйдя из состояния sit через п шагов попадет в состояние sp, (2) ожидаемое число посещений процессом данного неустойчивого состояния; (3) среднее значение и дисперсия числа шагов, требующихся для перехода из состояния s, в состояние sp, (4) вероятность попасть в данное эргодическое множество, выйдя из данного неустойчивого состояния; 292
(5) среднее значение и дисперсия числа шагов, сделанных процессом перед попаданием в эргодическое множество. В данной книге невозможно детально ответить иа широкий круг вопросов, мы приведем лишь несколько результатов для регулярных и поглощающих марковских цепей, позволяющих продемонстрировать мощность матричных методов. 3.1.6. РЕГУЛЯРНЫЕ МАРКОВСКИЕ ЦЕПИ Повторим определение из 3.1.4, б): марковская цепь регулярна, если она является непериодической эргодической цепью. Такая цепь не имеет ни неустойчивых, ни поглощающих состояний, она движется среди всех состояний в пространстве состояний, попадая в любое дан- ное состояние через неопределенное число непериодических интервалов времени. Матрицу переходов регулярной марковской цепи мы будем называть регулярной матрицей переходов. Рис. 118 Рис. 119 Примеры I. Показать, что следующие стохастические матрицы регулярны: (а) Решение (а) Матрица цепи с двумя состояниями и s2. Мы можем нарисо- вать диаграмму переходов ( рис. 118). Ясно, что ни одно из состояний системы не является поглощающим, т. е. цепь (а следовательно, и матрица) регулярна. (б) Пространство состояний для этой цепи есть {slt s2, s3}, диаграмма переходов изображена на рис. 119. Всегда имеется возможность перейти из одного состояния в любое другое, и перемещения не будут периодическими. Итак, цепь и мат- рица регулярны. 293
2. Показать, что следующие матрицы не регулярны: (а) 1 4 £ £ 4 £ 3 £ 4 О О г 1 о о О 1 0_ Решение (а) Диаграмма переходов для цепи изображена на рис. 120. Можно видеть, что после п шагов цепь (с вероятностью, приближающейся к 1 при п -> оо) попадает либо в состояние s2, либо в состояние ss. Однажды попав в одно из этих двух состояний, цепь никогда не вер- нется в Sv Следовательно, sx есть неустойчивое состояние, и поэтому цепь не регулярна; {s2, s3} есть эргодическое множество. (б) Диаграмма переходов изображена на рис. 121. Цепь движется с периодом 3 через циклические множества {si}> fe}, К}- Следовательно, эта цепь циклическая эргодическая, а не регулярная. Упражнение 3.1.9 1. Установите любым способом, регулярны ли следующие матрицы: (и) 1 3 (б) Г) 1 2~ (в) 1 Л 1 8 8 2 и 3 3 2 и 2 Г) _1_ 1 1 1 0 0 » Л 1 1 и 2 2 л 1 3 и 2 •2 0 0 1 и 4 4 _ 1 1 л _ 2 2 и (Г) ~ 1 0 1 ~ (д) - 1 1 0 0 (е) 1 о 2 2 2 2 2 2 1 1 1 0 1 0 2 0 1 Л 1 3 4 4 2 3 3 0 0 1 и 4 4 п 3 1 1 1 1 1 2 Л 1 и 4 4 _ _ 4 4 4 4 _ _ 3 и 3 _ 294
2. В некотором городе погода ежедневно регистрируется следующим спо- собом: дождь — ft, сухо и пасмурно — D, сухо и солнечно — S. Найдено, что для некоторых длительных периодов года ежедневные перемены погоды имеют следующие вероятности: P(P-.P) = -i-; P(ft- 1 1 »D)=—; P(D-P)=—; P(D^D) = ~; P(S- О ^ft) = ~; P(S-»D)=-^~. o 2 Выпишите матрицу переходов для цепи и нарисуйте диаграмму. Регулярна ли матрица? а) Фундаментальная теорема о регулярных марковских цепях. Фундаментальная теорема для регулярных марковских цепей устанав- ливает, что независимо от начального состояния процесса вероятность быть в данном состоянии регулярной цепи стремится к некоторой по- стоянной величине при увеличении числа шагов. Например, пусть в регулярной цепи с тремя состояниями началь- ная точка есть sv Тогда вероятности, что цепь находится в состояниях si> s2, 5з после п шагов, равны «-шаговым переходным вероятностям Pii> Pi2’ Pis соответственно (см. 3.1.3, а)). Теорема утверждает, что при п —оо р<”) стремится к постоянной вероятности (обозначим ее ^i), ^2, Р1з ^з- -Мы можем записать (рЩ, р<"2>, р<".>) -> (Ьъ b2, Ь3) при п -> оо; Ьг, Ь2, Ь3 — вероятности и b} + b2 + b3 = 1. Предположим теперь, что начальная точка есть s2, вероятности того, что цепь будет в состояниях s15 s2, s3 через п шагов, есть элемен- ты вектора (p<2">, р^, р^)- Теорема утверждает, что этот вектор также приближается к (blt b2, Ь3) при п, стремящемся к бесконечности. Аналогично, если начальное состояние будет ss, то вектор (РЙ, РЙ- РЙ) стремится к (Ьи Ь2, Ь3). Короче мы можем записать: Р"~+В при п->оо, где В = 'Ьг К Ь1 &2 ^2 Ь% ь3~ ьз ь^_ Вероятностный вектор b = (Ь±, Ь2, Ь3) называется предельным век- тором, или стационарным распределением марковской цепи. Пример. Рассмотрим регулярную матрицу 1 1 2 2 2 1 2 О 295
Рассмотрим последовательные степени матрицы Р: - 1 1 1 - - 1 3 з - - 3 5 5 ~ * — . ч— 1 II — 2 4 4 4 8 8 8 16 16 Р2 = _1 1_ 1 ; Р3 = 3 J 3_ ; Р4 -= _5_ _3_ _5_ 4 2 4 8 4 8 16 8 16 1 1 1 3 3 1 5 5 3 — — — ' I 1 — — — ГТ" _ 4 4 2 _ _ 8 8 4 _ _16 16 8 _ и т. д. Заметим, что вероятности стабилизируются; действительно, они все приближаются к предельному значению 1/3. Мы покажем, что это верно для элементов главной диагонали. Легко показать, что доя и 3 каждый элемент ведущей диагонали можно представить в виде р<«) = (1/2)з[2+1-+(-!)"• (-Г'7 Внутри квадратных скобок члены, начиная со второго, образуют геометрическую прогрессию со знаменателем (—1/2); при п->- оо ряд 1 г- стремится к -j— . Следовательно, при п -> оо J 1 1/2 1 3 ’ Читателю предоставляется каждого элемента матрицы Р. Таким образом, самому показать, что это верно для при п->оо. Стационарное распределение цепи есть вектор b = (Ч3, Ч3, Ча). Это значит, что после достаточно большого числа шагов цепь с вероят- ностью 1/3 может быть в любом из трех имеющихся состояний.' Упражнение 3.1.10 Составив формулы для членов матрицы Рп и перейдя к пределам, получите стационарные распределения для регулярных цепей, задаваемых матрицами: 296
(a) (б) О 1 4 О 2 О 1 2 £ 2 д 4 1 Сформулируем без доказательства фундаментальную теорему для регулярных марковских цепей. Теорема. Если Р есть регулярная матрица переходов размер- ности т X т, то: (1) степени Рп стремятся при rw ос к стохастической матрице В; (2) каждая строка матрицы В есть вектор b = (Ьъ ..., Ьт), где т Ьг, Ьт — вероятности и У b, = 1. i=\ Можно показать, что скорость сходимости Рп к В очень высокая, такая же, как скорость сходимости геометрической прогрессии со знаменателем, меньшим единицы. Во многих примерах приближение Ръ ~ В считается очень хорошим. б) Предельные полные вероятности. Напомним читателю (см. 3.1.3, б)), что если а = (а1У ат) — начальный вектор вероят- ностей, то полные (безусловные) вероятности того, что система после п — 1 шагов находится в каком-либо из состояний, равны элементам вектора: ап = (4°) = а • Р-~Р Следующая теорема показывает, что этот вектор стремится к ста- ционарному распределению (вектору Ь) при ц оо. Теорема. Если Р, В и b те же, что и в предыдущей теореме, а — начальный вектор вероятностей цепи, то а Рп~х -> b при 11 -> оо. Доказательство: lim a-P'll~ lima-P'1- а- lim Р11 П~>оо Ц—><х> П->оо а-В=Ь. (Замечание. Чтобы понять последний шаг, рассмотрите цепь Р1 с тремя состояниями (с1, a2, а3) ^з\ b2 ba I и вспомните, что Ь SJ fli + с2 + Оз — 1 •) Эта теорема доказывает, что в случае регулярной цепи полные вероятности попадания в различные состояния не зави- сят от начального состояния при условии, что сделано достаточно большое число шагов. в) Метод отыскания стационарного распределения. Следующая теорема дает очень простой метод отыскания стационарного распре- деления для любой регулярной цепи. 297
Теорема. Если Р — регулярная матрица переходов и b — стационарное распределение, то b — единственный^вероятностный вектор, такой, что b Р = Ь. Доказательство. Поскольку Рп В при п -> оо, то и Рп-1 Р-^-В. Но Д”-1 • Р также стремится к В • Р при п оо, так как —> В. Следовательно, В. Р = В. Любая строка этого матричного урав- нения дает b • Р = Ь. Теперь покажем, что есть только один вероятностный вектор, удовлетворяющий уравнению b • Р = Ь. Мы сначала допустим про- тивное, т. е. предположим, что есть другой вероятностный вектор с, такой, что с • Р = с. Тогда с • Р = с, с • Р2 — с, с • Р3 = с • Р2 ~ с и т. д. до с • Рп = с. Переходя к пределам, получим lim с • Р'1 = — с • lim Рп = с В = Ь. Но с • В = с. Следовательно, с = Ь. Та- П—>-оо ким образом, доказано, что стационарное распределение есть единст- венное решение уравнения b • Р = Ь. Примеры Найти стационарные распределения для регулярных цепей, име- ющих следующие матрицы перехода: з (а) Г-* 1 1 " 2 2 2 3 1 1 1 4 4 2 1/3 2/3 1/4 3/4 = {bi, bz). Решения. В каждом случае мы ищем решение уравнения b • Р = Ь. Мы действуем следующим образом: (а) (Ьи Ь2) Следовательно: 1/3 bi + 1/4 b2 = Ь^, 2/3 bi + 3/4 b2 = Ь2, а также bi + b2 = 1. Решая уравнения относительно blt b2, получаем b = (3/11, 8/11). (Замечание. Мы оперировали только 1-ми 3-м уравнениями, а затем проверили решение, подставив его во 2-е уравнение.) 298
о J____1_- 2 2 1 3 (б) (blf Ь2, Ь3) О — 3 j____1_ 4 2 — (^1> ^2> ^з)’> J-&2 + ± 63 = ь1: «J т: ~ “ Ь3 ~ Ъ2\ -L ^4-—- Ь2 + —• Ъ3 — Ь3 Я О и, кроме того, t>i + b2 + Ь3 — 1. Решая уравнения, получаем b = (&г, Ь2, Ь3) — (8/37, 9/37, 20/37). Упражнение 3.1.11 я 1. Покажите регулярность стационарные распределения: каждой из матриц и найдите соответствующие (а) 2 2 2 4 2 2 з 4 (б) (Д) 2 з 2 2 2 4 2 2 £ 2 (е) 2 8 3 4 2 4 о 2 3 о 2 4 о где риг — вероятности. 2. Некто совершает случайные блуждания между четырьмя точками на круге {si, s2> «з. s«}> двигаясь в соответствии с правилом: из любой данной точ- ки он движется к другой по часовой стрелке с вероятностью р и против часовой стрелки — с вероятностью q = 1 — р (рис. 122). Покажите, что одношаговая матрица переходов такова: 0 р 0 q q 0 р 0 0 q 0 р р 0 q 0 299
Регулярна ли эта матрица? Найдите стационарные распределения для случаев: (а) Р=— > (б) Р = "^’ (в) Р = Р = Р (обЩий слУчай)- Какова вероятность того, что некто, начиная двигаться из состояния slt попадает в состояние s3 после десяти шагов? 3. Покажите, что если регулярная матрица переходов Порядка т представ- ляет собой двойную стохастическую матрицу (т. е. сумма элементов как по стро- кам, так и по столбцам равна 1), то стационарное распределение таково: Ь = (Ц 1 т Ьт) — ( \ т 4. Человек либо ходит на работу пешком, либо при- езжает на автомашине. Если он идет пешком один день, то вероятность, что он поедет на автомобиле на следующий день, равна 0,6. Вероятность, что он и на следующий день снова поедет на автомобиле, равна 0,7. Составьте матрицу переходов для его ежедневных способов попадания на ра- боту. Если он идет пешком в понедельник, то какова ве- роятность, что он поедет на автомобиле: (а) в среду, (б) в пятницу, (в) в следующий вторник, (г) в понедельник шестью неделями позже? (Предполагаем, что в рабочей неделе пять дней и что выходные дни в конце недели не влияют на переходные вероятности). 3.1.7. ПОГЛОЩАЮЩИЕ МАРКОВСКИЕ ЦЕПИ а) Определения и примеры. В 3.1.4, б) поглощающая марковская цепь определялась как некоторая цепь, пространство состояний 'ко- торой состоит только из неустойчивых и поглощающих состояний. Примеры 1. Цепь экспериментов получена в соответствии со следующими правилами: (1) подбрасывается монета (эксперимент С) и фиксируется выпав- шая сторона; (2) если в результате (1) выпал герб, то монета подбрасывается снова; (3) если в результате (1) выпала решетка, то бросаются кости (эк- сперимент D); (4) после того, как кости брошены, они бросаются опять. Последовательность экспериментов, обозначенных С и D, опреде- ляется повторным применением этих правил. Пространством состояний цепи будет множество {С, D) (т. е. монета или кости); матрица перехода такова: С D сП _L Р= 2 2 О 0 1 Начальный вектор вероятностей — вектор (1,0). 300
Типичные выборочные последовательности следующие: CCDDDD..., CCCDDDDD ..., CDDD ... Все последовательности начинаются с С (подбрасывание монеты), и С будет членом последовательности до тех пор, пока не встретится D (бросание костей). После этого все члены одинаковы, а именно D. С будет неустойчивым состоянием, a D — по- глощающим. 2. Предположим, что три мальчика А, В, С перебрасываются мя- чом и что матрица вероятностей перехода мяча от одного к другому равна АВС л Г— — —~ 3 3 3 Р В о 1 о . т. е. Р (мальчик А бросает мяч в воздух и ловит опять) = Р (А —Л) = = Vs; Р (мальчик Л перебрасывает мяч мальчику В) = Р (Л В) — и т. д. Состояния А, В, С соответствуют событиям «Л имеет мяч», «В имеет мяч», «С имеет мяч»; каждый бросок приводит к изменению состояния. Заметьте, что, когда мальчик В поймает мяч, а это в конце концов произойдет, если они достаточно долго перебрасываются, он прекра- щает броски и оставляет мяч у себя. Другими словами, цепь в конечном счете «ловится» в состоянии В. Следовательно, это состояние будет поглощающим состоянием, а цепь будет поглощающей. б) Каноническая форма матрицы переходов. Развивая теорию по- глощающих марковских цепей, удобно пользоваться матрицами пере- ходов в так называемой канонической форме. Чтобы привести матрицу к канонической форме, ее строки и столб- цы надо переставить таким образом, чтобы поглощающим состояниям отвечали первые строки и столбцы. Их переходные вероятности появ- ляются вместе в верхней левой части матрицы с единичными элемен- тами на главной диагонали. Тогда строки и столбцы, соответствующие неустойчивым состояниям, разместятся (в другом порядке) в остав- шихся частях матрицы Р. Три простых примера поясняют этот про- цесс. Пример, ческой форме: Приведите каждую из следующих матриц к канони- S1 S2 (й) - 2 2 S3 0 1 «2 0 S3 1 " 2 (% А 3 S2 1 3 S3 1 3 «4 0 1 0 «2 0 1 0 0 1 3 1 Q 1 1 4 4 4 2 4 Д _0 0 0 1 301
Решения. (Пунктирные линии показывают разбиение матриц на подматрицы, эти разбиения будут полезны в дальнейшем.) s S2 Sj (a) s2[~ 1 ; О j _ 2 I 2 S2 Sj «3 82 84 83 81 (б) S2 -1; о 0 ~ (в) s2r - 1 0 1 0 0 " Sj 0 i 0 11 0 0 12 2 Q 1 Л 1 1 1 1 «3 -I о 3 S3 и 4 1 2 4' -4 ! 4 J 81 1 Ojl 1 1 Обычно переобозначают состояния цепи (когда матрица уже при- ведена к каноническому виду) так, чтобы первая строка соответство- вала вновь обозначенному состоянию Sj, вторая — новому состоянию s2 и т. д. Обозначение состояний произвольно; по существу, движение цепи среди состояний не зависит от их нумерации. В общем случае если имеется s поглощающих состояний и t неустой- чивых состояний, то каноническая форма матрицы переходов будет такова: s t s<r;J£ где I — единичная матрица размерности s X s; О — матрица, состоя- щая из нулевых элементов, размерности s X t, R — матрица размер- ности t X s, относящаяся к переходам из неустойчивых состояний в поглощающие. Q есть /-мерная квадратная матрица переходов из не- устойчивых состояний в неустойчивые. Пример. Для случая (в) из примеров, приведенных ранее, матрицы /, О, R, Q будут следующими: С помощью подматриц Р и Q можно получить формулы для неко- торых характеристик поглощающих марковских цепей. Упражнение 3.1.12 Приведите следующие матрицы переходов для поглощающих цепей к кано- ническому виду: 302
(a) 1 Ji 4 4 0 1 (б) 1 0 1 3 8 £ 3 o £ 2 (в) 3 3 1 3 4 4 0 0 3 0 8 0 0 1 0 0 0 0 1 в) Некоторые характеристики поглощающих цепей. При изучении марковских цепей представляют большой интерес следующие ве- личины: (1) среднее значение и дисперсия общего числа случаев попадания цепи в некоторое состояние Sj, при условии, что начальным было не- устойчивое состояние 8,-; (2) среднее значение и дисперсия общего числа случаев попадания цепи в некоторое неустойчивое состояние s,-; (3) вероятность того, что процесс будет «пойман» в поглощающем состоянии Sj, при условии, что он начинается в неустойчивом состоя- нии Sj. Перед тем как выводить формулы для этих величин, введем понятие фундаментальной матрицы для поглощающей цепи. Определение. Если Q есть /-мерная квадратная подмат- рица канонической переходной матрицы для поглощающей цепи (см. 3.1.7, б)) и / есть /-мерная квадратная единичная матрица, то фундаментальной матрицей цепи называется матрица N = (/ — Q)-1. Теперь мы готовы привести формулы для вычисления интересую- щих нас величин. Формулы I. Обозначим через п} общее число попаданий поглоща- ющей цепи в неустойчивое состояние Sj (включая начальное положение). Мы ищем среднее значение и дисперсию п} при условии, что процесс начинается в неустойчивом состоянии s, (заметим, что он может начать- ся и в Sj). Обозначим эти величины через Et (пф) и Var, (tij) соответ- ственно. Тогда (a) Et (nj) есть элемент, стоящий на пересечении i-й строки и j-ro столбца матрицы N, (б) Var,- (nJ есть аналогичный эле- мент матрицы М2, где N2 = /V (2Ndg - Z) - Nsq. Замечание. Если N = [° *], то Ndg = [« °] и Nsq = *’] . Пример. Мальчик передвигается среди четырех камней, рас- положенных в круге, в соответствии со следующей матрицей переходов: 303
Si S2 s3 s4 Пусть мальчик стартует от точки s4. Найдите среднее значение и дисперсию числа случаев его попадания (а) в состояние ss, (б) в состоя- ние $4, прежде чем произойдет остановка в s, или в s2. Решение. По формулам I (а), I (б) ответы можно получить прямо из матриц N и N 2. Они вычисляются следующим образом: Тогда если мальчик начинает двигаться из состояния s4, то: (а) среднее число попаданий в состояние ss равно £4(н3) = 4/3 (элемент матрицы N, стоящий на пересечении строки, соответствую- щей s4, и столбца, соответствующего ss); дисперсия Var4 (ц3) = 20/9 (элемент на пересечении строки для s4 и столбца для s3 матрицы Л/2); 304
(б) аналогично, если п4есть число попаданий мальчика в состояние s4, то Е4 (п4) = 2 и дисперсия л4 равна Var4 (п4) = 2. Формулы II. Обозначим через t время (число шагов) пребывания поглощающей цепи среди неустойчивых состояний (включая и началь- ное положение), прежде чем опа попадает в одно из поглощающих со- стояний. Полагая, что цепь начинается из неустойчивого состояния s;, обозначим среднее значение и дисперсию t через Е; (/) и Уагг (I) со- ответственно. Тогда (а) Е; (I) есть i-й элемент вектор-столбца т = (g -— вектор, составленный из единиц, имеющий соответствующую размер- ность); (б) Var, (f) есть i-й элемент вектора-столбца т2 = (2 N — 7) т — Tsg. Пример. Вспомнив пример с мальчиком, движущимся по точ- кам круга (с. 303), определите среднее значение и дисперсию времени пребывания мальчика среди состояний {ss, s4} до попадания в s4 или s2 при условии, что его начальное состояние (a) s3, (б) s4. Решение. (Ответы получают с помощью векторов-столбцов т,т2 по формулам II.) Проделаем следующие вычисления: В среднем мальчику понадобится примерно три шага на поглощаю- щее множество {s3, s4}, прежде чем он будет «поглощен». Заметьте, что в это число включено и его начальное положение. Заметьте также, что дисперсия в каждом случае довольно велика: принимая во внима- ние, что среднеквадратическое отклонение S.D. (/) меньше трех, мы можем сказать, что мальчик возможно потратит даже 9 шагов (т. е. среднее значение + удвоенное S.D. приближенно), прежде чем попадет в состояние s4 или s2. Формула III. Пусть Ьи — вероятность того, что поглощающая цепь попала в поглощающее состояние Sj при условии, что движение нача- 305
Лось из неустойчивого состояния s4. Тогда Ьц есть элемент, стоящий на пересечении i-й строки и /-го столбца матрицы В — NR. Пр и м е р. Рассмотрим опять пример с мальчиком, совершающим случайные блуждания по четырем точкам круга. (а) Предполагая, что мальчик стартует из точки з3, найдите веро- ятность, что он остановится («будет поглощен») в (1) Sj, (2) s2. (б) Предполагая, что он стартует из точки s4, найдите вероятность, что он остановится («будет поглощен») в (1) sn (2) s2. Решение. Требуемые вероятности есть элементы матрицы В — NR. Вычислим ее: B=NR = Тогда: (а) если мальчик начинает движение из s3, то он остановится в s4 или в з2 с вероятностью 1/2 в обоих случаях; (б) если мальчик начинает двигаться из s4, то вероятность, что он остановится в s1, вдвое больше вероятности остановиться в s2. Сводка результатов Матрицы и векторы Фундаментальная матрица-. N — [I — Q] х. М2 = М (2Ndg - /) - Nsg. т = Mg. та = (2М — /) т — rsg. В = NR. Формулы: I. Et (tij}, Var; (п}) представляют собой элементы матриц М и М2 со- ответственно, стоящие на пересечении i-ой строки и /-го столбца. • II. Е( (/), Varz (/) представляют собой i-e элементы векторов т, т2 соответственно. III. btj есть элемент матрицы В. Пример. Студент проходит трехгодичный курс обучения для получения диплома. Каждый год он держит экзамен, на котором решается, прошел он годовой курс или нет. Если экзамен сдан,- то студент переходит на следующий курс (или покидает колледж в кон- це третьего года). Если студент проваливается на экзамене, то он повторяет годовой курс. Вероятности его успеха при сдаче различ- ных экзаменов таковы: (1) 0,8 — на первом году обучения, (2) 0,7 — на втором году и (3) 0,5 — на третьем. Пусть 8Ъ s2, s3, s4 представляют следующие состояния: «1-й год обу- чения», «2-й год обучения», «3-й год обучения», «окончание колледжа». 306
(а) Выпишите матрицу переходов для ежегодных передвижений студента. Приведите ее к канонической форме. Эта матрица регуляр- ная или поглощающая? (б) Определите вероятность, что студент находится в состоянии s2 после второго экзамена. (в) Определите среднее значение и дисперсию числа лет, которые студент проводит в колледже (воспользуйтесь матрицей переходов). /1\ (г) Покажите, что В — NR = 1 , и интерпретируйте результаты. Решение (а) Матрица переходов такова: 84Г0,2 S2 S3 S4 0,8 0,3 0 0 0 0,7 0,5 0 О О 0,5 1 О О О Ее каноническая форма: s4 «1 S2 S3 ~ 1 О о 0,5 О 0,2 0 0 0 0,8 0,3 0 О О 0,7 0,5 Р — поглощающая матрица (s4 — поглощающее состояние, Si, s2, s3 — неустойчивые состояния). (б) Студент начинает учиться с первого года, так что начальный вектор вероятностей равен (0, 1, 0, 0). Вероятность его нахождения в sa после двух экзаменов дается элементом второй строки и третьего /О \ /081 столбца матрицы а • Р2. Этот элемент равен (0; 0,2; 0,8; 0) I 0’3 I = \о’ / = 0,4. Следовательно, в 40% случаев студент на третьем году обучения в колледже будет все еще проходить второй курс. (в) Обозначим через t число лет, проведенных студентом в коллед- же. Тогда t будет числом лет, прошедших прежде, чем цепь остановится в s4. Мы ищем Ег (/) и Var4 (t). Эти величины являются первыми элемен- тами векторов т, та соответственно (формулы II, с. 305). Найдем сначала фундаментальную матрицу: 0,8 0 0 —0,8 0 Я"1 0,7 —0,7 = 0 0,5_ 307
и Тогда О 1 X 4 О '4,7\ 3,4 I 2 / (приближенно) т2= (2N— I) т—xsg = 1,5 2,9 т=Л^ = /24,9\ I 14,5 I \ 6 / (приближенно). Следовательно, Er (t) ~ 4,7; Уагх (/) ~ 24,9. Это означает, что сту- денту может потребоваться пять лет, прежде чем он завершит образо- вание в колледже. Обратите внимание, что дисперсия еще больше. (г) Матрица B=NR— q это говорит нам, что с вероятностью 1 студент будет «поглощен» в s4 (т. е. он, несомненно, покинет колледж, что и так очевидно). 3.1.8. БИБЛИОГРАФИЧЕСКИЕ ЗАМЕЧАНИЯ С более полной матричной трактовкой марковских цепей, с более глубокими результатами и подробными доказательствами читатель может познакомиться в работе [22]. С некоторыми другими аспектами теории марковских цепей чита- тель может познакомиться в работах [12], [46], [48]. Упражнение 3.1.13 1. Даны следующие матрицы переходов для поглощающих марковских цепей: 308
(1) 81 1 0 " (2) si 1 3 «2 4 4 S2 S3 1 0 0 - (3) 8Х 1 1 S2 0 2 2 1 1 1 S3 — —— — 4 4 2 ’— s4 1 0 0 0 _ 0 1 0 0 л 1 1 1 и 2 4 4 1 Л 1 1 3 и 3 3 (а) Для каждой цепи составьте фундаментальную матрицу N, матрицы N2 и В, векторы т и т2. (б) Каковы среднее значение и дисперсия числа посещений цепями (2) и (3) состояния s3 до остановки (поглощения) при условии, что движение начи- нается из состояния s3 ? (в) Каковы среднее значение и дисперсия числа неустойчивых состояний (включая и первое), в которых побывали цепи (2) и (3) перед поглмцением (при условии, что движение в обоих случаях начиналось из состояния ss). (г) Для цепи (3) определите веро- ятность поглощения в sx при условии, ] ------- что начальная точка s3. 2. Мышь может передвигаться 1 X X . . между двумя смежными комнатами A fl В МышеЛовка и В без какого-либо риска. Если она 1 покинет комнату А через наружную дверь, то ее поймает кошка, тогда как---------------L----- если мышь покинет комнату В через „ . о наружную дверь, то она попадет в мы- 1ИС' шеловку (рис. 123). Исходное положе- ние — мышь в комнате А. Предположим, что каждую минуту она передвигает- ся следующим образом: из комнаты А в комнату В с вероятностью 3/4; из ком- наты В в комнату А с вероятностью 7/8; причем мышь никогда не остается в одной комнате больше, чем одну минуту. Найдите: (а) вероятности, что мышь поймана (1) кошкой, (2) мышеловкой; (б) среднее значение и дисперсию числа минут, оставшихся мыши до гибели. 3. Si, s2, ss, sa — четыре точки на круге; мальчик шагает от одной точки к другой в соответствии со следующей матрицей переходов: si 10 0 0 s2 р 0 q 0 s3 0 р 0 q s4 0 0 0 1 (а) Опишите его движение, предполагая, что он начал двигаться из точки s2. (б) Определите матрицы N, N2, векторы т, т2. (в) Если s2 — начальная точка, то каковы: (1) среднее значение и дисперсия числа посещений мальчиком точки ss; (2) среднее значение и дисперсия числа шагов, сделанных перед посеще- нием точки Sa или s^, (3) вероятность, что мальчик остановится («поглотится») в точке s4? (г) Вычислите значения величин из (в) прцр = 1/4. 4. Предположим, что а — начальный вектор вероятностей поглощающей цепи. Через а обозначим вектор, состоящий из последних t компонент вектора а' (т. е. начальных вероятностей неустойчивых состояний). Показать, что если Еа (ti.) — ожидаемое число посещений состояния sy., то Еа (п.) будет j-м эле- ментом вектора n'-N. Аналогично показать, что Еа (Z) равно а'т, где t — число состояний цепи, пройденных перед поглощением. 309
3.2 НЕКОТОРЫЕ МОДЕЛИ ГЛАВА ТЕОРИИ ОЧЕРЕДЕЙ 3.2.1. ВВЕДЕНИЕ Каждый знает, что такое очередь. Всюду можно наблюдать цепочк ожидающих клиентов. Люди стоят у прилавков, изделия на конвейер стоят у обслуживающих точек, машины скапливаются у светофоров самолеты ждут, когда освободится взлетная полоса. Вопрос самой жизни может быть сформулирован в терминах очереди—все мы ждем, пока смерть не придет за нами. Неотъемлемой частью некоторых систем является образование очереди; в других системах желательно либо совсем не иметь очереди, либо держать ее в определенных границах. Где бы ни образовалась очередь, при ее изучении возникают каждый раз определенные задачи. При решении этих задач следует рассмотреть такие вопросы: какова максимально допустимая длина очереди? с какой скоростью должны обслуживаться клиенты? сколько обслуживающих устройств должно быть установлено? Для того чтобы ответить на эти вопросы, необхо- димо построить математическую модель ситуации. Экспериментируя с моделью, можно ответить на поставленные вопросы; тогда данные наблюдений реальных систем могут быть использованы для проверки качества модели. Датский математик А. К. Эрланг в 1909, а затем в 1917 г. опубли- ковал важные результаты, полученные им при изучении теоретических моделей телефонных систем. В эти модели были включены многие'из характеристик стандартной очереди. Его результаты были обобщены, дальнейшую теорию развили другие математики. В настоящее время существует обширная литература по системам обслуживания. Предла- гаемые модели и методы, разработанные для их изучения, насыщены математическими идеями. Они находят приложение во многих областях, начиная с контроля над приземлением самолетов и кончая теорией управления запасами, от исследований, связанных с ростом бакте- рий, — до составления больничных графиков. С помощью математи- ческой теории очередей можно проанализировать любые ситуации, в которых возникают очереди. Цель этой главы состоит в том, чтобы познакомить читателя с ос- новными понятиями теории очередей, а на примере простых четырех моделей очередей — с различными методами их изучения. Надеемся, что это даст читателю некоторое представление о символическом мо- 310
делировании, о символических моделях (см. введение к этой части). Он, без сомнения, обнаружит, что применяемые математические методы несколько необычны, но это скорее должно привлечь внимание, нежели обескуражить. Исследование операций — новая наука, быстро разви- вающаяся и непрерывно требующая новых идей и технических разра- боток. Для описания очередей будут'использованы: (1) детерминированная модель очереди; (2) представление в виде дискретной марковскою-цепи, к которой может быть применена теория, рассмотренная в гл. 3.1; (3) стохастическая (т. е. вероятностная) модель, анализируемая с помощью имитации; (4) однолинейная система обслуживания, для которой найдены и решены дифференциально-разностные уравнения. Сначала мы дадим общее описание системы обслуживания, указав ее основные компоненты и некоторые характеристики, которые должны быть изучены. 3.2.2. ОБЩЕЕ ОПИСАНИЕ ОЧЕРЕДИ а) Основные компоненты. В любой простой системе обслуживания на обслуживающее устройство прибывают некоторые объекты (требо- вания). Они присоединяются к ожидающей очереди, если она есть, или обслуживаются в некотором порядке, если прибор доступен, а затем покидают систему. Основные компоненты в модели очереди следующие: (1) описание входящего потока требований; (2) описание способа, которым выполняется обслуживание (т. е. описание дисциплины обслуживания); (3) описание дисциплины очереди, т. е. каким образом из ожидаю- щей очереди выбираются клиенты на обслуживание: «первый пришел—- первый обслужен», «последний пришел — первый обслужен», «прио- ритеты, данные некоторым типам требований» и т. д. Для более сложных систем обслуживания, включающих несколько обслуживающих устройств, необходимо эти понятия детализировать. При конструировании модели очереди первоочередной задачей является символическое представление основных компонент, после чего изучаются соотношения между ними. Неадекватность математического представления реальной системы, включающего много идеализированных понятий, неизбежна. Так обстоит дело в случае применения математики к изучению реальных процессов, и мы должны критически воспринимать результаты, полу- ченные из модели, и если возможно, проверять их экспериментально. б) Основные характеристики систем массового обслуживания. Принципиальный интерес представляют следующие характеристики: (1) длина очереди в различные моменты времени; (2) общая продолжительность нахождения требования в системе обслуживания (т. е. время, потраченное на ожидание в очереди, плюс собственное время обслуживания); 311
(3) доля времени, в течение которого обслуживающий прибор был свободен. Обычно исследование системы обслуживания проводится с целью уменьшения суммарных перегрузок обслуживающего прибора или приборов. Это может быть достигнуто увеличением числа обслуживаю- щих приборов или увеличением скорости обслуживания, или же уве- личением допустимой длины очереди. С другой стороны, уменьшение перегрузок обычно приводит к увеличению общей стоимости системы. Например, если в супермаркете поставить дополнительно несколько обслуживающих устройств (кассовых аппаратов), то для этого надо не только выделить место для них, но и нанять дополнительно касси- ров. Из сказанного ясно, что надо найти равновесие между очень боль шими перегрузками, малой пропускной способностью и раздражением клиента, с одной стороны, и высокой стоимостью обслуживающих то- чек, с другой стороны. Мы сейчас опишем простую очередь и построим ее математическую модель. 3.2.3. ДЕТЕРМИНИРОВАННАЯ ОЧЕРЕДЬ а) Основные предположения. Рассмотрим систему обслуживания, имеющую один источник требований, проходящих через единственный обслуживающий прибор. Относительно потока требований и их обслу- живания сделаем следующие предположения: (1) Входящий поток требований. Требования поступают через оди наковые интервалы времени, каждый интервал длиной в а единиц. (2) Распределение времени обслуживания. Требования обслужива- ются за одинаковые интервалы времени, каждый длиной в b единиц. Как только закончится обслуживание одного требования, прибор готов к обслуживанию следующего требования. (3) Дисциплина очереди. «Первый пришел — первый обслужен», т. е. ожидающие требования образуют очередь, и когда прибор осво- бодится, на обслуживание поступает требование, имеющее большее время ожидания. Замечание. Принято определять длину очереди как общее число требований, находящихся на обслуживании и ожидающих в очереди. На рис. 124 изображена общая схема модели очереди. Поступающие требования Обслуживаю - щее устройство Обслуженные требования Рис. 124. Схема модели очереди. б) Формальный анализ. Поведение системы зависит от того, как связаны между собой Ь и а : (1) b > а, (2) b = а, (3) b < а. Разберем по очереди каждый из этих случаев. 312
(1) b > а. Это значит, что скорость обслуживания 1/Ь меньше, чем скорость поступления требований 1/с, т. е. требования обслужи- ваются и покидают систему медленнее, чем прибывают. Ясно, что в этом случае должна образоваться очередь и она будет неопределенно возрастать. (2) b = а. Если в очереди нет требований, то первое поступившее требование сразу начинает обслуживаться. Его обслуживание закон- чится в тот же самый момент, в который поступит второе требование. И следовательно, не будет ожидающих требований. Если первоначально есть очередь, то ее длина (т. е. число требо- ваний, ожидающих обслуживания, плюс число обслуживаемых) будет оставаться постоянной. (3) b < а. Это значит, что скорость обслуживания больше, чем ско- рость поступления требований; следовательно, какое бы ни было на- чальное число ожидающих требований, длина очереди, несомненно, будет сокращаться до 1 или 0. Мы в дальнейшем подробнее рассмотрим эту ситуацию. Пусть в начале процесса число требований в очереди г (г 2; если первоначально есть только одно требование (т. е. г = 1), то оно будет обслужено прежде, чем поступят следующие требо- вания, и в очереди никого не будет). Численный пример. Предположим, что b — 1 мин, а = 4 мин, г = 12. Для обслуживания всех 12 требований нужно 12 • 1 = 12 мин. В течение этого времени поступят дальнейшие 12/4 = — 3 требования и станут в очередь; им вместе потребуется 3 • 1 = = 3 мин на обслуживание. В течение этих 3 мин не поступит ни одного требования (так как 3 < а), т. е. требованиям, которые в дальнейшем поступят в систему, не придется ждать обслуживания. Следовательно, общее число требований в системе равно 12 + 3 = = 15 требованиям (сюда включено и первое из 12 требований — его обслуживание началось, как только начался процесс). Упражнение 3.2.1 * 1. Определите общее число требований, стоящих в очереди, для каждого из следующих случаев: (а) а = 5, 6 = 2, г = 20; (б) а = 3, b = 1, г = 50; (в) а = 6, b = 3, г = 30. Вычислите также время, необходимое для обслуживания всех требований, стоя- щих в очереди. 2. Покажите, что если b ан перед началом процесса обслуживания име- ется г требований, стоящих в очереди, то за время обслуживания первых г тре- [г6~1 rb , [ rb 1 j b \1 — новых требований. II далее, + — -—— 1 a J a L a J \ a /J Г rb o требований поступит за время обслуживания новых - требований и т. д. С по- мощью этих формул проверьте ваши результаты при выполнении первого зада- ния упражнения. Замечание, [х] обозначает наибольшее целое число, меньшее или рав- ное х, — целую часть числа х. Например, [3,621 = 3. * В упражнении имеется в виду система обслуживания, описанная в п. а).— Примеч. пер. 313
3. Перед началом процесса обслуживания имеется г требований, стоящих в очереди. Обозначим через Л! число требований, поступавших после начала процесса до тех пор, пока сохраняется очередь. Покажите, что (N + 1)-е требование поступит после того,, как первые (г + N) требований пройдут обслуживание, т. е. покажите, что a (N + 1) > (г + N) Ь. Выведите, что W= rb—а а — b + 1. 4. Найдите с помощью предыдущей формулы время, необходимое для об- служивания всех ожидающих требований, которое можно вычислить так: 5. С помощью формул, полученных в заданиях 3 и 4 этого упражнения, проверьте ответы первого задания. в) Вывод функции времени ожидания W(/). Введем некоторую функцию, которая часто изучается в теории очередей, — функцию вре- мени ожидания обслуживания. Обозначим ее через W (/); она равна времени, которое затратит на ожидание требование, поступившее в мо- мент времени t (t = 0 соответствует началу процесса). Чтобы упростить рассуждения, мы будем предполагать, что в нашей модели а — целое число, кратное Ь, и что требования поступают в моменты времени а, 2а, За, .... а их обслуживание заканчивается в моменты времени Ь, 2 Ь, ЗЬ, ... Прежде чем устанавливать общую формулу, рассмотрим численный пример. Пример а = 3, & = 1,г = 5. Требования поступают в систему обслуживания в моменты времени 3, 6, 9, ...; в момент времени t = 0 пять требований стоят в очереди; обслуживание каждого очередного требования начинается в моменты времени 0,1, 2, 3, ... Мы хотим определить суммарное время, потраченное на ожидание обслуживания требованиями, поступающими в моменты времени t = 3 и, где п — целое число. Предположим, что требование X, поступая в систему обслуживания, застает там х требований, уже ожидающих обслуживания, и одно тре- бование, как раз поступившее на обслуживающий прибор. Ясно, что требованию X придется ждать время (w + 1) b, прежде чем сможет начаться его обслуживание. Задача состоит в том, чтобы определить значение w для каждого значения t. График на рис. 125 пояснит дальнейшие рассуждения. Если требование поступает в момент t, то число требований, стоя- щих перед ним в очереди, равно общему числу поступивших требова- ний (включая и начальную очередь) за вычетом требований, прошедших обслуживание в период от 0 до t. Рассмотрим для примера два требования, а именно 3-е и 6-е, если считать от начала исходной очереди. 314
(1) 3-е требование. Перед ним в очереди два требования, так что ему придется ждать 2-1=2 единицы времени, прежде чем начнется его обслуживание. (2) 6-е требование. При его поступлении в момент времени t = 3 ситуация будет сле- дующей. Из пяти требований начальной очереди три требования прой- дут обслуживание (в момент t = 3 как раз закончится обслуживание третьего по очереди требования). •< 4= S й 7 - 6 - Длина очереди как функция бремени 4 3 2 1 g S g Обслуживающий при- бор здесь пуст ( он про - стаивает 2/з времени) Моменты окончания обслуживания требований Время Поступление ’5 требований {Начальная очередь ) 0 1 23456789 10 11 Бремя о1 о2 оЗ о4 о5 об о7 1 I I I__________1----1---И. 2 3 4 5 6 7 8 6 9 10 8 7 L— Время ожидания обслуживания для 6-го требования О 1 Рис. 125 Следовательно, требование, поступившее в момент t = 3, будет ждать, пока пройдут обслуживание (5 — 3) + 0 = 2 требования (т. е. 2 единицы времени), прежде чем само поступит на обслуживающий прибор. Упражнение 3.2.2 1. Для рассмотренного ранее численного примера определите, сколько тре- бований стоит впереди (1) 2-го, (2) 5-го, (3) 7-го, (4) 9-го, (5) 10-го требования. 2. (а) а = 2, b = 1, г = 6. (б) а = 4, b = 2, г = 10. В каждом случае определите время ожидания для 1-го, 3-го, 6-го, 8-го, 10-го и 12-го требований. Вспомните, что временем ожидания требования является время его пребы- вания в очереди до поступления на обслуживание. Общая формула для W (t) (в случае, когда а = nb и требования по- ступают в моменты времени а, 2а, ...). (1) Рассмотрим с-е требование в начальной очереди. Тогда впере- ди него (с—1) требований, для обслуживания которых необходимо (с — 1) • b единиц времени. 315
Следовательно, если через W (0) обозначить время, затраченное на ожидание с-м требованием начальной очереди, то имеем: W (0) = (с— \)Ь. (2) По формуле, найденной в задании 4 упражнения 3.2.1, вычис- ляется момент времени, когда система обслуживания впервые станет свободной от требований. Это время равно Т = b • Г—~ И Тогда [а — b J требование, поступившее в момент времени t^T — b, найдет сис- тему обслуживания пустой или только что освободившейся. Требо- ваниям, поступившим в моменты времени tZ^T — b, совсем не при- дется стоять в очереди. Пример. В примере с а — 3, й = 1, г = 5 мы нашли, что Т =\ =7 единиц времени. Читатель увидит из графика, что в момент времени t = 7 как раз закончится обслуживание 7-го требования и не будет ни одного тре- бования, стоящего в очереди. При поступлении 8-го, 9-го и последу- ющих требований система обслуживания окажется пустой. Все тре- бования, поступающие в моменты времени t 7—1 = 6, имеют ну- левое время ожидания. (3) Л1ы можем найти общую формулу для W (/) при 0 < t Т—Ь, взяв примеры в качестве некоего ориентира. Требование, поступившее в момент времени t Т — Ъ, найдет впереди себя (г — t/b) + {На — 1) требований, стоящих в очереди, причем первое из них в этот же момент поступит на обслуживающий прибор. Это число получается следующим образом: (начальная (число требований, (число поступ- очередь) — обслуженных к + лений) = моменту времени /) Следовательно, время ожидания для этого требования равно W(t)= Г( г-+ -------1)1&=(г—!)•&—Y | \ b / \ a JJ \ а ) Пример. Рассмотрим моменты поступлений требований I = 3 и t — 6 для 6-го и 7-го требований из рассмотренного примера. С по- мощью этой формулы найдем, что (а) время ожидания 6-го требова- ния (оно поступило в момент t = 3) равно W (3) — (5— 1) • 1 —3 X X (3 — 1)/3 — 2 единицы времени; (б) время ожидания 7-го требо- вания равно F (6) = (5 — 1) • 1— 6(3 — 1)/3 = 0. Суммируя результаты пунктов (1), (2), (3), мы получим следую- щую функцию времени ожидания-. Г(/) = о, (г—!)&—/ (с-\)-Ь, t^T—b; 0<t^T—b; t=(Y 316
где с — номер с-го элемента начальном очереди; требования посту- [га — 61 а— b J Эта функция полностью описывает время ожидания для всех по- ступающих требований. С ее помощью, если потребуется, мы можем определить размер очереди в любой момент времени. Упражнение 3.2.3 1. В каждом из случаев постройте функцию времени ожидания: (а) а = 3, b = 1, г = 8; (б) а = 4, Ь = 2, г = 12; (в) а = 6, Ь = 3, г = 7. С ее помощью определите время ожидания 4, 7, 9, 12 и 15-го требований. 2. Предположите, что в задании 1 требования поступают в моменты 1/2 а, 3/2а, 5/2а и т. д. и что моменты окончания обслуживания равны 6, 26, 36... Нарисуйте график зависимости длины очереди от времени для каждого случая и определите из него время ожидания для 3, 6, 9, 10 и 15-го требований. Определите функции времени ожидания. 3. В рассмотренной в тексте модели обслуживания изменилась дисциплина очереди — она стала следующей: «последний пришел — первым обслуживает- ся». Учитывая это изменение в модели, нарисуйте график зависимости длины очереди от времени для случаев: (а) а — 3, 6 = 1, г = 6; (б) а = 8, 6 = 2, г = 20; (в) а = 8, 6 = 4, г = 15. Определите время ожидания для 3, 7, 10 и 16-го требований в каждом слу- чае. Составьте функции времени ожидания. 3.2.4. МОДЕЛЬ ОЧЕРЕДИ, ИСПОЛЬЗУЮЩАЯ МАРКОВСКУЮ ЦЕПЬ В системе обслуживания, рассмотренной в 3.2.3, зная время, в ко- торое начинается процесс обслуживания, можно предсказать все, что будет происходить с каждым требованием. Сначала можно узнать вре- мя поступления любого отдельного требования, а затем можно вычис- лить для него время ожидания и число требований, стоящих впереди него в очереди. Такие системы называются детерминированными. Большинство систем обслуживания не принадлежит к этому типу; обычно одна или более переменных, участвующих в описании системы, подчиняются вероятностному закону. Модели, построенные для та- ких систем обслуживания, должны включать случайные величины. Эти модели называют стохастическими. В качестве первого примера недетерминированной системы обслу- живания мы рассмотрим очень простую систему, представимую в виде марковской цепи. а) Основные компоненты. Предположим, что очередь может со- держать 0, 1 или 2 требования (но не больше). Требования поступают и покидают систему, подчиняясь следующим правилам: (1) Требования поступают и покидают систему в дискретные мо- менты времени Zx, t2, t3,... 317
(2) При наличии требования, ожидающего в очереди (в том чис- ле только что поступившего), обслуживание завершается в каждый момент с вероятностью р2. Иначе продолжается до поступления оче- редного требования. (3) В каждый момент времени требование поступает с вероят- ностью ру. Если в момент его поступления в систему в очереди нахо- дится менее чем два требования (при этом по правилу (2) обслуживае- мое требование покидает систему и очередь передвигается), то оно присоединяется к ним. В противном случае оно покидает систему, не обсл уживаясь. (4) В любой данный момент времени может поступить не более од- ного требования и не более чем одно требование может покинуть сис- тему. (5) Моменты поступления требований в систему и моменты ухода из нее статистически независимы. Предполагаем, что процесс обслуживания начинается в момент времени t = и сначала в очереди нет требований. б) Математическая модель. Очевидно, что марковская цепь с тре- мя состояниями полностью описывает эту систему обслуживания. Компоненты модели следующие: (1) множество состояний s0, slt s2, где состояние s, соответствует присутствию i требований в очереди в любой момент времени; (2) в начальный момент времени в очереди нет требований, так что начальный вероятностный вектор таков: а = (1, 0, 0); (3) одношаговая матрица переходов будет следующей: «о Р= IPiJ = si S2 s0 sx <71 Pl 41 P2 (Pl P2 + <71 41) . 0 P2 41 «2 0 Pl 42 (4142+ P1P2+ P142) где <7i = 1 — pi и <y2 =1 p2- Мы объясним, как получается только один элемент матрицы — рп. Читатель может проверить, правильно ли получен каждый из ос- тальных элементов. Элемент ри есть вероятность того, что процесс переходит в некоторый момент времени из состояния «одно требова- ние стоит в очереди» в состояние «одно требование стоит в очереди»; т. с. остается в состоянии $х на следующем шаге. Это может случиться, если либо (а) одно требование поступило и одно требование покинуло систему (вероятность рх • р2), либо (б) ни одно требование не поступало и не покидало систему (вероятность qy q2). Эти возможности взаимно исключают друг друга, так что пе- реходная вероятность равна Ри ~ Р1Р2 + 4i4i- в) Анализ модели. В модели нет поглощающих состояний, и каж- дое состояние может быть достигнуто из любого другого. Читателю предлагается вспомнить (см. 3.1.4, б)), что марковские цепи такого ти- па называются регулярными. Следовательно, при анализе этой сисле- 318
ми обслуживания мы можем пользоваться аппаратом теории регуляр- ных марковских цепей. Покажем на примере возможности такого подхода. Пример. Пусть система обслуживания определена так же, как в п. а), причем = 1/2, р2 = 1/4. Тогда а = (1, 0, 0) и Р = (1) Вероятности того, что через п шагов в очереди стоит 0, 1 или 2 требования, даются компонентами вектора а • Рп. Например, если п = 2, этот вектор равен (1, 0, 0) 1 1 о CO | oo t-~ i 00 —1 | CM — | CM — | 00 — 1 CM — i 00 О 1 1 1 1 О 00 1 >— to j н- oo | — to | — tO | oo | *M 00 | cx> о —, —, o ') (2 2 ) 2 1 8 0 1_ 2 ’ 1 _3 2 8 1 7 8 8 т. е. в момент времени t = ts в очереди не будет требований с вероят- ностью 5/16, будет одно требование с вероятностью 1/2, и будут два требования с вероятностью 3/16. (2) После достаточно большого числа шагов система обслужива- ния войдет в стационарный режим, и вероятности того, что в очереди будет 0, 1 или 2 требования, равны соответствующим компонентам вектора Ь. Вектор b есть решение уравнения b • Р — b (см. 3.1.6, в)). Мы получаем Ь следующим образом: -_1_ _1 2 2 0 (blt b2, bs) — (bi, b2, b3). _7 8 _1^ 8 0 319
Следовательно, V bi + ~ Ь2 = Ь1\ Z о Y ^3 = fe2‘> 4 b2+^ba^b3, о о а также Ьг + b2 + b3 = 1. Разрешая систему относительно blt b2,b3, получаем b = (Ьъ b„, Ь3) = (1/17, 4/17, 12/17). После длительного функционирования системы обслуживания в очереди будет 0, 1 или 2 требования с вероятностями, равными 1/17, 4/17, 12/17 соответственно. Упражнение 3.2.4 1. Составьте матрицы для систем обслуживания, во всем аналогичных рас- смотренной в этом параграфе, за исключением ограничения длины очереди: (а) не более чем одно требование и (б) не более чем три требования могут находить- ся в очереди. 2. Положив начальный вектор вероятностей для модели 1 (а) (предыдущее задание) равным а = (0,3; 0,7) и pt = 0,4, р2 = 0,5, найдите вероятность того, что в очереди не будет требований после трех шагов. Найдите также стационар- ное распределение вероятностей для длины очереди. 3. Для модели системы обслуживания 1 (б) найдите стационарные вероят- ности того, что в очереди будет 0, 1, 2 или 3 требования, считая, что рг = 1/2 =р2- 4. Положив pt = р = р2, найдите общий вид стационарного распределе- ния вероятностей для модели с тремя состояниями, описанной в этом параграфе. Вычислите среднее значение и дисперсию длины очереди в стационарном режи- ме. Оцените эти величины при р = 0,2. 3.2.5. СТОХАСТИЧЕСКИЕ МОДЕЛИ — ИМИТАЦИЯ В гл. 2.5 показано, как можно получить случайную выборку для любого распределения с помощью имитационных методов при усло- вии, что известна кумулятивная функция распределения или просто функция распределения у = F (х). Этот метод называется методом Монте-Карло. Он состоит в следующем. Берется п случайных десятич- ных дробей d (при этом пользуются таблицей случайных чисел); с по- мощью обратной функции х — F 1 (d) они преобразуются в п случай- ных чисел х. Полученное множество значений х и есть случайная вы- борка объемом п из данного распределения. Весь процесс нахождения выборки может быть запрограммирован на ЭВМ. Выборку можно по- лучить и вручную, используя для обращения график функции рас- пределения. Имитационные методы часто бывают очень полезны при изучении сложных систем. Аналитическими методами можно исследовать толь- ко простейшие системы обслуживания, так что при исследовании во- просов, касающихся перегрузок реальных систем обслуживания, при- ходится прибегать к имитационной технике. 320
На следующем примере мы покажем, как можно проимитировать движение десяти требований через однолинейную (т. е. с одним обслу- живающим прибором) систему обслуживания. Ситуации, встречаю- щиеся на практике, конечно, всегда оказываются более сложными; кроме того, для получения достаточно точных оценок интересующих нас величин мы должны увеличить объем выборки. В работе [25] при- ведены задачи и методы моделирования систем обслуживания. Численный пример. Система, описываемая далее, пред- ставляет собой систему обслуживания с регулярным поступлением требований и экспоненциальным временем обслуживания; требова- ния обслуживаются по принципу «первый пришел — первым обслу- жен». Мы просим читателя проимитировать работу других систем, приведенных в последующих упражнениях. а) Основные компоненты. (1) Входящий поток требований. Требования поступают по одному в моменты времени 2, 4, 6,... мин. (2) Обслуживающий поток. Время обслуживания имеет экспонен- циальное распределение с функцией плотности вероятностей f (s) = (3/4)e-3S/4, s>0. Кумулятивная функция распределения равна F (s) = 1—е-35/4. График этой функции показан далее. (3) Дисциплина очереди. «Первым пришел — первым обслужен», т. е. требования обслуживаются в порядке их поступления. Предпо- ложим, что вначале в очереди требований нет. б) Имитация работы системы. Следующая таблица почти не тре- бует разъяснений. В столбцах указывается время поступления тре- бований, время обслуживания (выбранное по методу Монте-Карло), время ожидания для первых десяти требований. Ясно, что время ожидания обслуживания требованием равно нулю, если оно поступило после того, как предыдущее требование покинуло систему. Или же, вычитая время поступления требования из времени, в которое покидает систему предшествующее требование, получаем время ожидания обслуживания требованием в очереди. Номера требований Время поступления t Время обслу- живания 5=Г‘ (d) Время, в которое тре- бования покидают систему Время ожидания W Выбранная десятичная дробь (J) 1 2 0,7 2,7 0 0,41 2 4 0,9 4,9 0 0,49 3 6 1,9 7,9 0 0,77 4 8 0,2 8,2 0 0,13 5 10 1,9 11,9 0 0,77 6 12 4,3 16,3 0 0,99 7 14 3,0 19,3 2,3 0,91 8 16 1,4 20,7 3,3 0,65 9 18 0,23 20,93 2,7 0,17 10 20 1,2 22,13 0,93 0,59 И Зак. 973 321
Первое —. выбран- \ ное де- o/tl антич- ное число О F'(d) Рис. 126 Случайно выбран- ное время обслу- живания [по мето- ду Монте-Карло) F(s)=1-e 3/ifS s Упражнение 3.2.5 1. Продолжите таблицу, имитировав поступление еще 20 требований в сис- тему обслуживания. 2. По результатам 30 требований вычислите среднее время ожидания для требования. 3. Определите долю простоев обслуживающего прибора за весь период. 4. Выполните процесс имитации для 20 требований в каждой из следую- щих ситуаций (во всех случаях дисциплина обслуживания — «первым пришел — первым обслужен»). Вычислите время ожидания обслуживания для каждого требования и среднее время ожидания обслуживания. Оцепите среднее время простоя, приходящееся на одно обслуженное требование. (1) Требования регулярно поступают в моменты времени 3, 6, 9...; время обслуживания распределено экспоненциально с функцией плотности вероятнос- тей / (s), равной f (s) = 1/2 е—s/2 ; предполагается, что в момент времени / = 0 в очереди стоят два требования. (2) Интервалы между поступлениями требований распределены экспонен- циально с функцией плотности вероятностей, равной 0,4 e~0,4t (первое требова- ние поступает в момент t =0, второе выбирается по методу Монте-Карло и т. Д.), время обслуживания постоянно и равно одной секунде для каждого требования. (3) Длины интервалов между последовательными поступлениями требова- ний имеют экспоненциальное распределение с функцией плотности вероятностей 0,4 е—0,4i, первое требование поступает в момент t = 0. Время обслуживания также имеет экспоненциальное распределение с плотностью вероятностей 0,6 е~°-6s. Этот тип систем обслуживания обозначается символом М/М/1 и будет рассмотрен в 3.2.6. (4) Требования поступают регулярно в моменты времени 2,4, 6,... Время обслуживания имеет нормальное распределение со средним значением 1,5 и среднеквадратичным отклонением, равным 1/3. В момент t = 0 в очереди стоит одно требование. С помощью таблиц нормальных интегралов постройте график функции распределения. 5. В среднем пациенты заходят в кабинет врача каждые 2 мин, и известно, что интервалы между посещениями распределены экспоненциально (с плотно- стью распределения, равной 1/2 Количество времени, затрачиваемое врачом на осмотр пациента, представляет собой нормально распределенную случайную величину со средним значением, равным 1,5 мин, и среднеквадра- тичным отклонением 1/2 мин. Имитируйте прохождение 20 пациентов через систему обслуживания, пред- полагая, что первый пациент входит в кабинет в момент / — 0. Определите сред- нее время ожидания для пациента; найдите долю времени, в течение которого врач «простаивает». 6. Посетители подходят к раздаточным окнам в заводской столовой в слу- чайные моменты времени, распределение интервалов времени между последо- вательными посетителями имеет функцию плотности вероятностей f (/) = = 3/4e~3^4t (t — измеряется в минутах). 322
Как только посетитель получает первое блюдо, он переходит ко второму Окну для получения второго блюда, а затем переходит к кассе. На выдаче первых блюд обслуживают в среднем трех человек в минуту, при этом время обслуживания имеет экспоненциальное распределение. Выдача вто- рых блюд занимает точно четверть минуты на каждого клиента. Кассир может посчитать общую стоимость блюд и получить деньги за т минуг, где число т име- ет нормальное распределение со средним 0,4 мии и среднеквадратичным откло- нением, равным 0,1 мин. Проследите движение 30 посетителей через эту систему обслуживания, считая, что в момент времени t 0 в столовой нет очереди. Вычислите время ожидания каждого блюда и общее время, потраченное на ожидание и получе- ние блюд, приходящееся на каждого посетителя. Оцените среднее общее время ожидания блюд, среднее время, проведенное в системе, среднюю длину очереди (т. с. число людей, находящихся в системе, усредненное по времени). 3.2.6. СИСТЕМЫ ОБСЛУЖИВАНИЯ М/М/1 Далее мы рассмотрим системы обслуживания, которые могут быть проанализированы математическими методами и встречаются во мно- гих прикладных задачах. Системы обслуживания часто коротко описываются фразой «пуассоновский входящий поток, экспоненци- альное время обслуживания, один обслуживающий прибор» или сим- волическим представлением М/М 1, введенным Д. Г. Кендэлом. Далее будут объяснены оба эти способа описания. а) Основные компоненты. (1) Входящий поток. Требования поступают случайно. Это не зна- чит, что они поступают случайно в обычном смысле этого слова. Пра- вильнее было бы сказать, что они поступают в соответствии с опреде- ленным вероятностным законом, который выводится из так называе- мой вероятностной гипотезы. Это может быть осуществлено следую- щим образом. Требования поступают так, что для любых малых интервалов вре- мени (/, t + б /) верны следующие вероятностные соотношения: (а) Р [не поступает ни одного требования] =1—% б/ -[- о (б/); (б) Р [поступило одно требование] = X б/ + о (б^); (в) Р [поступило два или больше требований] = о (б/), где А — константа и символ о (6t) обозначает величину, которая при б/, стремящемся к нулю, становится пренебрежимо малой по сравне- нию с б/. Другими словами, безотносительно к тому, в какой момент времени рассматривается система обслуживания, вероятность того, что тре- бования поступят в следующий малый интервал времени б/, равна лб/ (плюс величины меньшего порядка, чем б/) и вероятности того, что в этом интервале времени поступят 2, 3 пли более требований, яв- ляются бесконечно малыми величинами более высокого порядка, чем б/. Приняв сформулированную вероятностную гипотезу, можно по- казать, что число поступлений требований в произвольный интервал времени длины Т (Т фиксированно) подчиняется пуассоновскому за- кону распределения с параметром XT, т. е. вероятность того, что в те- 11* 323
чейис временного интервала Т поступят п требований, равна Р (п) ^Т)Пе~КТ1 п = 0, 1, 2... Среднее число требований, поступивших за единицу времени, равно Е (п) /Т — КП Т = К Таким образом, параметр X представ- ляет собой среднюю скорость потока требований, входящего в систе- му. Из вероятностной гипотезы также следует, что время между по- следовательными поступлениями требований имеет экспоненциаль- ное распределение с параметром X, т. е. если переменная t обозначает длину промежутка между последовательными поступлениями требо- ваний, то ее функция плотности вероятностей равна Хе~Л/, t 0. Легко показать, что средняя длина промежутка между двумя после- довательными моментами поступления требований равна X-1. Заметим, что пуассоновское и экспоненциальное распределения рассматривались в гл. 2.4. Упражнение 3.2.6 1. Вернитесь к описанию пуассоновского и экспоненциального распреде- лений, данного в гл. 2.4. Пользуясь приведенными выше функциями плотности вероятностей для числа поступлений требований за время Т и для времени между последовательными поступлениями требований, покажите, что средняя ско- рость входящего потока и средняя длина промежутка между поступлениями требований равны X и 1/Х соответственно. 2. Вычислите вероятности и постройте график функции распределения для числа требований, поступивших за фиксированное время Т, при условии, что ХТ = 1/4. Если Т = 1 мин, то какова средняя длина промежутка между лю- быми двумя последовательными поступлениями требований? Чему равно сред- неквадратическое отклонение длины промежутка между поступлениями требо- ваний? 3. Если X = 3, то каково ожидаемое число поступлений требований за про- межуток времени длиной в 6 мин? Какова дисперсия числа требований за шести- минутный период? 4. Нарисуйте графики функции распределения длины промежутка между любыми двумя последовательными поступлениями требований при X = 1/2, 1, 2, 5. Вычислите среднее значение и дисперсию этих распределений. (2) Механизм обслуживания. Для задания механизма обслужива- ния вероятностная гипотеза используется следующим образом. Пусть в момент времени t обслуживается некоторое требование; тогда вероятность, что его обслуживание закончится в интервале (/, t + б/), равна рб/ До (б/), где р—константа. Вероятность того, что в течение этого временного интервала обслуживается более чем одно требование, равна о (6/). Из этой гипотезы следует, что время обслуживания требований имеет экспоненциальное распределение. Можно вычислить среднюю скорость обслуживающего потока, ко- торая будет равна р (рассматриваются только те периоды времени, когда обслуживающий прибор не пуст), и среднее время обслужива- ния — оно равно 1 /р. 324
(3) Дисциплина очереди. Предполагается, что действует правило «первый пришел — первый обслужен». Требования поступают на об- служивающий прибор сразу же, как только он освобождается. На длину очереди ограничений нет. б) Система обозначений Кендэла. В работе Д. Г. Кендэла, опуб- ликованной в 1953 г., предложен удобный метод классификации сис- тем обслуживания. Он обозначал символом М пуассоновское распре- деление, полученное из вероятностной гипотезы, и рассмотренная выше модель получила сокращенное обозначение М/М/1. Буквы ука- зывают типы распределения интервалов между моментами поступле- ний требований и длительностью обслуживания соответственно; еди- ница указывает на то, что число обслуживающих приборов равно 1. Системы M/G/3 и G/EK/\ в обозначениях Кендэла расшифровывают- ся так: первая является системой обслуживания с пуассоновским вхо- дящим потоком, общей функцией распределения времени обслужива- ния, тремя приборами, обслуживающими одну очередь; вторая пред- ставляет собой систему обслуживания с общим входящим потоком, обслуживающий поток — эрланговый поток порядка k, в системе имеется один обслуживающий прибор. Эта система обозначений широко применяется в литературе. в) Уравнения системы обслуживания. Если п есть число требова- ний в очереди в момент времени t (т. е. число требований, ожидающих обслуживания, плюс число обслуживающихся), то теоретически п может быть любым целым числом от нуля до бесконечности; п — случайная величина. Мы будем обозначать через Рп (t) вероятность того, что в момент времени t в очереди находится п требований. Л1ножество вероятностей {Ро (t), Рг (/),...} называется распределе- нием длины очереди в момент t. Выведем систему уравнений, которым должны удовлетворять эти вероятности. (а) Уравнение для Ро (/). Рассмотрим состояние системы обслужи- вания в моменты времени t и (/ + 8t). В момент (/ + б/) в очереди не будет требований (т. е. п = 0), если произойдет какое-либо из следу- ющих событий: Ег = «п = 0 в момент /ив интервале (/, t + 6/) требования не посту- пали»; Е2 = т—1 в момент /; новые требования не поступали и в интер- вале (/, t -j- б/) закончилось обслуживание одного требования». (За- метим, что любые другие возможные варианты имеют вероятности, порядок которых меньше, чем б/; поэтому нет необходимости их рас- сматривать). Событие Е1 имеет вероятность Р (Ед = Ро (/) [1 — X 6Z + о (б/)]. Событие Е2 имеет вероятность Р (Е2) =Pt (t) [(1 - X • 6Z + о (б/)) (н • б/)]. Вероятность, что п = 0 в момент времени (t + б/), равна вероят- ности объединенного события <1Е1 или £2»; Ег и Е2—взаимно исклю- 325
Чаклциё события. Следовательно, Ро {t + 6/) = Р (£J + Р (Е2) = Ро (/) [1 - к 6/ + о (6Ж + 4 Рг (t) • 1(1 — Л • б/ 4- о (8t)) (рб/)1. Вычитаем Ри (t) из обеих частей уравнения, делим на б/и, перегруп- пировав члены, получаем Ро(^Ч б/) — P0(t) 1 П U\ I П I ZS.-Z4 ------г,------~= - - (0 + (t) + ° (&0, or символ о (б/) обозначает величину, стремящуюся к нулю при б/, стремящемся к нулю. Читатель видит, что предел левой части этого уравнения при б/, стремящемся к нулю, есть производная dP0(f)!dt. Мы обозначим ее Рп (tY Тогда, устремив 8t к нулю в обеих частях уравнения, мы полу- чим в пределе уравнение Ро (f) = —- YP0 (t) + р/\ (t). Это уравнение связывает Ро (t), Ро (/) и Рг (/). Уравнения такого типа называются дифференциально-разностными уравнениями. (б) Уравнения для Рп (/), п = 1, 2... При составлении общих уравнений для Рп (t) мы должны рассмотреть все возможные события, в результате которых в момент (I + б/) длина очереди будет равна п. Мы можем исключить из рассмотрения события, состоящие более чем из одного поступления, и события, состоящие в обслуживании более чем одного требования в интервале б/, а также комбинации этих собы- тий (это возможно, так как их вероятности равны о (8f), т. е. стремят- ся к 0 при б/, стремящемся к 0). Суммируя вероятности этих событий и осуществляя предельный переход, аналогичный предпринятому в пункте (а), мы получаем: Л. (0 = Y Рп_г (0 - (% + р) Рп (0 + р • Р„+1 (/), п = 1, 2... (В упражнении 3.2.7 читателю предлагается вывести это уравнение самостоятельно, предварительно составив уравнения для РЛ (t) и Л Ш Бесконечная система дифференциально-разностных уравнений, составленных в пунктах (а) и (б), и есть уравнения системы обслужи- вания типа М/М/1. Можно решить эти уравнения и получить множест- во вероятностей {Ро (t), Рг (/) зная это множество, можно вы- числить некоторые характеристики системы обслуживания. Метод решения требует довольно сложной математической техни- ки, и окончательная форма решений содержит бесконечные суммы функций Бесселя. Полное решение, таким образом, выходит далеко за рамки этой книги. Однако частное решение, описывающее поведе- ние системы обслуживания в стационарном режиме, можно легко получить. Далее мы найдем стационарное решение и рассмотрим не- которые его свойства. 326
Упражнение 3.2.7 1. Составьте дифференциально-разностное уравнение для Р± (/), рассмат- ривая возможные случаи: (а) п = 0 в момент I; в интервале (/, t + 6/) поступило одно требование; (б) п = 1 в момент I; в интервале (t, t + 6/) ни одно требование не поступи- ло и ни одно требование не покидало систему; (в) п = 2 в момент /; требования не поступали, одно требование покинуло систему в интервале (t, t + 6Z). (Есть ли другие возможности для п быть равным 1 в момент (I + 6/), которые бы имели непренебрежимую вероятность?) 2. Составьте уравнения для Р2 (t), действуя так же, как в предыдущем за- дании. 3. Составьте общее уравнение для Рп (/), п = 1, 2,... г) Стационарное решение для системы обслуживания типа М/М, 1. Если средняя скорость входящего потока X меньше, чем средняя ско- рость обслуживания р, то система обслуживания со временем войдет в стационарный режим. После достаточно большого количества вре- мени, прошедшего от начала процесса, распределение длины очереди станет стационарным, т. е. независимым от t. До тех пор, пока сис- тема не войдет в этот режим, она будет находиться в переходном ре- жиме. Мы обозначим символом Рп стационарную вероятность того, что в очереди находятся п требований. Тогда Рп (/) стремится к Рп при увеличении t при условии, что X < р. Множество вероятностей {Рп, Plt...} называется епшционарным распределением вероятностей для длины очереди (сравните со стационарным распределением для состоя- ний регулярной марковской цепи). Дифференциально-разностные уравнения, составленные в 3.2.6, в), остаются верными и в стационарном режиме, но все производные по времени Р„ (f) обращаются в нуль, так как Рп (/) = Рп — const для каждого п. Таким образом, уравнения для стационарных вероятно- стей будут следующие: О = — X • Ро + р • Рр О = Л. • Рп_! — (X. ь р) Рп + р • Рп+1, п = 1, 2,... Из первого уравнения мы немедленно получаем Р1-— Ро- Р Последовательно используя второе уравнение вместе с этим ре- зультатом, получаем: Р.= — Р1= ( — Г- Ро. Р \ и ) Р___ . р_( V. р г3-- ------- I * О р \ р / и Т. Д. В общем виде мы имеем Рп=(—Ч-Ро. n=0, 1, 2, ... \ р / 327
(Упражнение. Докажите эту формулу методом индукции). Таким образом, мы получили решение для Рп, причем в формуле присутствует Ро. Воспользовавшись тем, что сумма всех стационар- ных вероятностей должна равняться единице, можно получить окон- оо нательное решение. Поскольку У Рп = 1, п = 0 оо то 5j (^/в)п Л>==1> и отсюда л=0 (Сумма бесконечной геометрической прогрессии со знаменателем X/jr). Окончательно мы получаем Рп==(1-"7) (Т')"’ п=0>1’2-- . Отношение = срсд,,яя СК°Р°СТЬ .входящего потока часго называют р. средняя скорость обслуживания нагрузкой системы и обозначают греческой буквой р. Подставляя ее вместо Х/р, получаем Рп — (1—р) Р", п = 0/1, 2, ... Как уже упоминалось, зная стационарные вероятности Рп, мож- но вычислить много интересных характеристик, относящихся к рабо- те системы обслуживания в стационарном режиме. Далее они приво- дятся без доказательства в табличной форме. д) Таблица некоторых характеристик системы обслуживания Характер нстика Формула 1. Доля простоев обслуживающего прибора. Фактически это вероятность Ро того, что обслуживающий прибор свободен 2. Средняя длина очереди Е (л) (л—общее число требований в системе) 3. Среднее время ожидания обслуживания для требования Е (w) (ш—время ожидания для требования) 4. Средняя длина очереди, ожидающей обслуживания 5. Среднее время, проведенное требованием в системе Ро=1-Р £(«)= г=-р р £(^-р(1-р) Р2 1—р 1 н(1—Р) 328
Проиллюстрируем применение этих формул на трех практических примерах. Пример 1. Требования поступают на обслуживающее устрой- ство супермаркета случайно, причем средний промежуток времени между поступлениями требований равен 0,5 мин. Время обслужива- ния распределено экспоненциально со средним значением, равным 0,25 мин. Определите (а) среднее число требований в системе обслу- живания; (б) среднее время ожидания обслуживания для требования; (в) среднее время, проведенное требованием в системе; (г) долю вре- мени, в течение которого обслуживающий прибор простаивает. Решение. Средняя скорость входящего потока X представляет со- бой величину, обратную к средней длине промежутка между двумя последовательными поступлениями требований, т. е. X = 1/0,5 = 2 требованиям в минуту. Средняя скорость обслуживания р равна 1/0,25 = 4 обслуженным требованиям за минуту. Следовательно, на- грузка р = Мр = 1/2. Поскольку р < 1, то через достаточно боль- шое время, прошедшее с начала процесса, система обслуживания вой- дет в стационарный режим. Конечно, мы предполагаем, что характер поступления требований и их обслуживания остается постоянным. С помощью формул из таблицы мы находим: (а) среднее число требований в очереди Е(п) =—— — 1 требование; 1-р (б) среднее время ожидания обслуживания для требования E(w)=^=-------=1/4 мин; ' Р(1-Р) (в) среднее время, проведенное требованием в системе, ------= 1/2 мин; Р(1—Р) (г) долю простоев обслуживающего прибора Ро = 1 — р = 1/2. Пример 2. Рассмотрим снова обслуживающее устройство су- пермаркета из примера 1. Предположим, управляющий решил, что он должен будет установить другой обслуживающий прибор, если среднее время ожидания обслуживания превысит 1,5 мин. Как должна измениться средняя скорость входящего потока, чтобы возникла по- добная ситуация? Какой тогда будет доля простоев обслуживающего прибора? Решение. Если Е (ш) = 1,5 мин, то с помощью формулы 3 из таб- лицы на с. 328 получаем 1>5= —Е----=—Р—, Ml-Р) 4(1-р) так как р = 4. Решая уравнение, получаем р = 6/7 = Z/р. Следовательно, сред- няя скорость входящего потока должна быть равна 329
X = 4 • (6/7)»3,4 требования в минуту, чтобы среднее время ожи- дания достигло полутора минут. При этой скорости поступления тре- бований доля времени, которое обслуживающий прибор будет простаи- вать, равна (1 — р) = 1/7. П р и м е р 3. Человек, ремонтирующий стиральные машины, обнаружил, что они поступают в его мастерскую в соответствии с пу- ассоновским законом, при этом среднее число поступлений за день равно 3. Затраты времени на ремонт машин подчиняются экспонен- циальному закону со средним временем ремонта, равным 2 ч. Маши- ны ремонтируются регулярно 8 ч в день. Вычислите (а) среднее число машин в мастерской, (б) среднее вре- мя, проведенное машиной в мастерской перед началом ремонта, (в) среднее время в течение дня, в которое нет машин, ожидающих ремон- та. Решение. Стиральные машины могут рассматриваться как требо- вания, поступающие в ремонтную мастерскую на обслуживание. Средняя скорость входящего потока равна 3 машинам в день (= X). Обслуживание машин производится со средней скоростью 4 машины в день ( = р). Следовательно, нагрузка системы р = 3/4. Теперь с помощью формул из таблицы на с. 328 получаем требуемые ответы следующим образом: (а) среднее число машин в мастерской равно £(«) р __ з / J_ 1—р 4/4 (б) среднее время, в течение вания, равно которого машина ожидает обслужи- Е (w) Р Р(1 —Р) 2 4 (т. е. 6 ч, так как ночь не принимается в расчет). (в) в течение доли рабочего времени, равной Ро = 1 — р = 1/4, нет машин для ремонта; т. е. в среднем человек не работает 2 ч в день. Упражнение 3.2.8 1. Автомобили прибывают на бензозаправочную станцию, при этом проме- жутки времени между двумя последовательными прибытиями машин имеют экспоненциальное распределение со средним значением, равным 1/2 мин. На об- служивание автомобиля требуется в среднем 1/3 мин, время обслуживания эк- споненциально распределено. Определите (а) среднее число автомобилей, ожи- дающих обслуживания, (б) среднее число автомобилей в очереди (т. е. ожида- ющие обслуживания плюс те, что обслуживаются), (в) долю времени, в течение которого заправочная станция бездействует. 2. Пациенты входят в кабинет врача в соответствии с пуассоновским зако- ном со средней скоростью входящего потока, равной 1 человеку в каждые 2 мин. Врач в состоянии уделить каждому из них некоторое время, которое имеет экс- поненциальное распределение, со средним временем обслуживания, равным 5/3 мин. Определите (а) среднее число пациентов, ожидающих у кабинета, (б) среднее время, затраченное пациентом как на ожидание, так и на лечение у вра- ча, (в) вероятность, что пациенту совсем не придется ждать, когда он подойдет к кабинету. 330
3. Кассир банка тратит на обслуживание посетителя в среднем 3 мин, и вре- мя обслуживания экспоненциально распределено. Клиенты подходят к нему по пуассоновскому закону со средней скоростью, равной 1 клиенту в 4 мин. Найдите (а) вероятность, что по крайней мере один клиент стоит в очереди, (б) вероятность, что в очереди есть более чем два клиента, (в) вероятность, что пе- ред окном кассира вообще нет посетителей, (г) среднее время, проведенное кли- ентом в банке. 4. С какой средней скоростью кассир банка, упомянутый в задании 3, дол- жен обслуживать клиента, чтобы его время ожидания уменьшилось вдвое. 5. Показать, что если w — время ожидания, прежде чем требование попа- дет на обслуживание, то функция распределения для w равна (Ро = 1—р, ш=0; (Р0 Х-е(?~ |1) ®>0. Замечание. Вероятность того, что время ожидания w находится в ин- тервале (ю, w + 6ш), равна вероятности совместного осуществления событий: {непосредственно перед поступлением требования в системе находится п требо- ваний}, {(/г — 1)-е требование обслужено за время ш} и {1-е требование об- служено за время 6ю}, п изменяется от 1 до оо . Вероятность первого события равна (1 —р) р'1; второго — [(pay)п/п 1 ] и третьего —рбил Перемножим вместе эти вероятности и просуммируем по п. Заметьте, что это верно при п > 1; п ри п — 0 поступающее требование не ждет обслуживания. 6. С помощью р (w) из задания 5 покажите, что общая вероятность равна 1, и вычислите Е (ш) и Var (ay). 7. Рассмотрим систему обслуживания типа М/М/2. В этой системе одна оче- редь требований обслуживается двумя приборами. Дисциплина обслуживания следующая: как только один из обслуживающих приборов освободится, первое из стоящих в очереди требований поступает на него и немедленно начинается его обслуживание. Прибытие требований и обслуживание случайны, средняя скорость входящего потока — X, а средняя скорость обслуживания на каждом приборе — р. Покажите, что стационарные уравнения для вероятностей того, что в сис- теме п требований, следующие: (1) О = ХРо-рР1; (2) 0=ХРо-(Х+р)Р1+2рР2; (3) 0 = ХРп„2-(Х+2р)Рп-1+?рРп, « = 3,4, ... (Стационарный режим возможен, если X < 2 р). 8. Покажите, что следующее решение удовлетворяет уравнениям (1), (2), (3) из задания 7: Рп — ~ГРпРо, « = 0,1; п! Рп =------— р" Ро, п = 2, 3, ... , где р =— 2п~1 р 9. Предполагая, типа М/М/2 что S Рп = 1, покажите, что для системы обслуживания Ро 2-Р 2 + р- 10. Покажите, что для системы обслуживания типа М/М/2 среднее число требований в системе равно Е (п) = 2р/(4 — р2). Можно показать, что среднее время ожидания для требования в системе об- служивания типа М/М/2 равно Е (ьу) = р2/[р (4—р2)]. 331
11. (а) В парикмахерской одно рабочее кресло; поступление клиентов и время их стрижки случайны. Это система обслуживания типа М/М/1. Предположим, что средняя скорость входящего потока — 4 клиента в час, а среднее время стрижки — 10 мин на клиента. Вычислите (1) среднее время ожидания, (2) среднее число человек в па- рикмахерской, (3) ожидаемое количество минут в час, в течение которых парик- махер не работает. (б) Предположим, что в парикмахерской два рабочих кресла и два парик- махера, т. е. система описывается моделью обслуживания типа M/M/2. С по- мощью формул из заданий 8, 9 и 10 определите (1) среднее время ожидания обслуживания клиентом, (2) среднее число человек в парикмахерской, (3) ожи- даемое число минут простоя парикмахера в течение часа. Сравните результаты случаев (а) и (б). 3.2.7. ЗАКЛЮЧЕНИЕ В настоящее время изучены различные системы обслуживания и опубликовано большое число научно-исследовательских работ. Они рассматривают разнообразные типы распределений для входящего и обслуживающего потоков, различные дисциплины очереди, после- довательные и параллельные очереди, сети очередей. В развитии математических методов, применяемых при изучении систем обслуживания, достигнуты значительные успехи. Одн ако в большинстве практических ситуаций, в которых встречаются не- сколько взаимосвязанных очередей, приходится прибегать к имита- ционным методам. Мы рекомендуем работы [23]. [24] как превосходное введение в математическую теорию очередей (в теорию массового обслужива- ния)*. См. также [51 ] и [53].
3.3 ГЛАВА ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ 3.3.1. ВВЕДЕНИЕ Во многих ситуациях, которые могут встретиться в промышлен- ности, при выборе стратегии ведения боевых операций, в экономичес- кой деятельности требуется максимизировать или минимизировать некоторую количественную величину при определенных ограниче- ниях. Например, бизнесмен хочет максимизировать свою прибыль, одна- ко при этом он ограничен общим числом имеющихся у него машин, наличием людей, капиталом, который он может инвестировать, и ря- дом других экономических факторов. Точно так же командир танко- вой дивизии, сражающейся с врагом, желает захватить как можно больше территории и оборудования, взять в плен наибольшее коли- чество солдат вражеской армии. При этом он ограничен числом тан- ков и людей своей дивизии. Разумеется, любая из возможных стра- тегий ведет к различного рода потерям и выигрышам. Для того что- бы выбрать оптимальную стратегию, командир дивизии должен точно оценить все возможные последствия ее применения. Оба эти примера можно назвать оптимизационными задачами. Другие примеры читатель встретит позднее. При некоторых обстоятельствах величины, которые необходимо максимизировать или минимизировать, и все ограничения, входящие в задачу, могут быть записаны как линейные уравнения и неравенст- ва. Сейчас мы приведем два простых примера, позволяющих это сделать. П р и м е р 1. Мебельная фабрика производит стулья двух ви- дов— А и В. На изготовление одного стула вида А требуется 8 чел.-ч (т. е. для того чтобы сделать 1 стул, необходимо, чтобы 1 человек ра- ботал 8 ч или чтобы 2 человека работали 4 ч и т. д.). На изготовление стула вида В требуется 5 чел-ч. Стоимость материалов для изготов- ления стула вида А равна 4 фунтам стерлингов; стоимость материа- лов для изготовления стула В равна 5 фунтам стерлингов. Прибыль за один стул А равна 1 3/4 фунта стерлингов, за стул типа В — 1 1/2. Производство стульев ограничено следующими обстоятельствами: 1) по контракту мебельная фабрика за неделю должна сделать по меньшей мере 15 стульев вида А и 10 стульев вида В; 333
2) на производство стульев может быть затрачено не больше 320 чел.-ч в неделю; 3) еженедельные затраты материалов на изготовление стульев не должны превышать 200 фунтов стерлингов. Задача. Найти такое число стульев каждого вида, которое необ- ходимо производить за неделю, чтобы прибыль была максимальной. Пр и м е р 2. Бизнесмен имеет два завода и два склада в разных частях страны. Каждый месяц заводы производят некоторое количест- во продукции, которое можно измерить в одинаковых единицах. Вся продукция, производимая заводами, должна быть отправлена на склады. Предполагается, что склады имеют постоянную вместимость, а ежемесячный выпуск продукции заводов неизменен. Далее, пред- полагается, что суммарный выпуск заводов в точности равен общей вместимости складов. Эти, вообще говоря, неестественные предполо- жения в дальнейшем могут быть ослаблены. Задача. Необходимо решить, какое количество продукции и с ка- кого завода надо направить на каждый склад с тем, чтобы ежемесяч- ные издержки этой операции были минимальны. Подобные задачи называются транспортными задачами. Они име- ют большое применение в промышленности. Численный пример. Необходимые численные значе- ния для решения задачи можно представить таблицей, в которой при- водятся выпуски заводов, вместимости складов и издержки пере- возок для транспортной задачи, ci7- — издержки транспортировки единицы продукции с завода F; на склад Wj. Например, стоимость перевозки единицы продукции с завода Fr на склад 1Р2 равна с12 = = 5. Во всех таблицах, где используются два индекса типа ij, первый индекс i соответствует i-й строке, a j — j-му столбцу. Это стандарт- ная запись прямоугольных массивов чисел. Склады U7t WZ2 Выпуск завода F1 Заводы 4 5 3 7 4 7 Вместимость склада 6 5 3.3.2. МАТЕМАТИЧЕСКАЯ ПОСТАНОВКА ЗАДАЧИ Исследуем предложенные задачи более подробно с тем, чтобы вы- делить в них основное и записать эти задачи на математическом языке. Пример 1. Решение директора мебельной фабрики состоит в выборе количеств изготавливаемых стульев вида А и вида В. Эти величины являются неизвестными задачи, их мы обозначим соответ- ственно через х и у. Принимая во внимание ннсЬормацпю, которая со- 334
держится в условии задачи, мы можем последовательно записать сле- дующие выражения: Выражение (1) 8 х+5 у (человеко-часов) (2) 4х-ф5р (фунты стерлингов) 13 3 (8) l^x+2!/ Р (Фунты стер- лингов) Объяснение О инее количество человеко-часов, необхо- димое для изготовления всех стульев Суммарные затраты на материал Общая прибыль Р — функция х и у, она называется целевой функцией. С помощью найденных выражений относительно х и у мы можем в терминах неравенств записать условия соглашения о поставках стульев мебельной фабрикой, наличии человеко-часов и материала. На х и у надо наложить и другие естественные ограничения. Теперь можно привести все множество ограничений, которые записываются в виде неравенств. Неравенство Ограничение (1)х> 15, у 10 Ог раничение (2) 8 х + 5 у 320 Ограничение (3) 4 х + 5 у 200 Ограничение (4) х и у — неотри- цательные целые числа Объяснение Соглашение о поставке стульев должно быть выполнено На изготовление стульев можно затратить не более 320 чел.-ч в неделю Затраты на материалы не должны превы- шать 200 фунтов стерлингов Очень часто выпуск товаров выражается целым числом. Дробные значения выпуска при этом оказываются бессмысленными Эти неравенства представляют собой основу формулировки сле- дующей задачи. Задача. Найти значения х и у, которые максимизируют целевую функцию Р = 7/4х + 3/2// и удовлетворяют приведенным неравен- ствам. Пример 2. Математическая формулировка второй задачи еще более простая. Ограничения в этом случае записываются в виде урав- нений, а переменными будут количества продукции, которые необхо- димо отправлять по данному маршруту. Обозначим их через хп, х12, х2ъ х22- Таким образом, ли означает то количество продукции, которое перевозится из Гг в Wlt х1а — количество, которое перево- зится из в IF2, и т. д. Как и в предыдущей задаче, мы сначала запи- шем все ограничения и целевую функцию, а потом сформулируем задачу. Уравнение Ограничение (1) Хц4-Х12=4 Ограничение (2) х21 -J-x22=7 Ограничение (3) Хц-|-х21=6 Ограничение (4) х12 + х22=5 Ограничение (5) каждое хц — неотрицатель- ное целое число Объяснение Общий выпуск завода Fj Общий выпуск завода F2 Вместимость склада W± Вместимость склада W2 Перевозится целое число еди- ниц продукции 335
Целевая функция С = 4 хи + 5х12 + Зх21 + 7х22 (С — суммар- ные затраты на перевозку продукции с заводов на склады). Задача. Найти значения переменных Хц, которые минимизируют С и удовлетворяют ограничениям. / Как видим, в каждом примере задача может быть записана в видё некоторого множества алгебраических уравнений и неравенств с целевой функцией, которую необходимо максимизировать или мини- мизировать. Все ограничения и целевая функция линейны по рас- сматриваемым переменным, т. е. все переменные, входящие в некото- рое выражение, имеют степень, равную единице. По этой причине Эта- кие задачи называют линейными, а поскольку мы ищем план или про- грамму, которая приводила бы к оптимальному результату, то юво- рим, что нам задана задача линейного программирования, а соответст- вующие методы решения этих задач называются методами линейного программирования. Таким образом, основные условия задач подобного рода будут следующими: 1) должна быть задана целевая функция, которую необходимо оптимизировать; 2) такие ресурсы, как капитал, занятые, машины и материал, долж- ны быть некоторым образом ограничены; 3) целевую функцию и ограничения можно записать в виде линей- ных уравнений или неравенств относительно множества переменных. Задача будет заключаться в том, чтобы выбрать такие значе- ния для множеств переменных, при которых целевая функция оп- тимизируется. Упражнение 3.3.1 1. Для каждой из следующих задач запишите целевую функцию и множест- во линейных ограничений. Задачи должны формулироваться ясно, как показа- но в рассмотренных примерах. (1) Владелец гаража хочет закупить несколько автомобилей новых марок. Предположим, он может выбирать автомобили двух моделей — А и В. Предпо- ложим также, что автомобиль модели А стоит 300 фунтов стерлингов, а авто- мобиль модели В — 500. Известно, что в гараже может поместиться не больше 20 новых машин, а на закупку машин ассигновано 7000 фунтов стерлингов. Ожидаемая прибыль от эксплуатации одной машины модели А равна 100 фун- там стерлингов, а от эксплуатации машины модели В — 140. Какое количество автомобилей каждой марки должен купить владелец гаража, чтобы общая при- быль была как можно больше? (2) Фермер имеет два хранилища с картофелем — Sx и S2, в которых нахо- дятся соответственно 20 и 12 т продукта. Фермер получает заказы от трех поку- пателей — С1г С2 и С3 на 8, 10 и 14 т картофеля соответственно. Расстояния от картофелехранилищ до заказчиков (в км) указаны в таблице: Покупатели Ci с2 с3 «1 Хранилища 2 3 5 •$2 6 2 4 336
Предполагается, что затраты на перевозку 1 т картофеля на 1 км пути по- стоянны. Каким образом необходимо распределить перевозки картофеля из кар- тофелехранилища к покупателям, чтобы минимизировать транспортные из- держки? 2. Рассмотрите ограничения в задаче из примера 1. Интерпретируйте символы а, Ь, с, d, е, f. С и М в следующих неравенствах: (1) х > а, у > 6; (2) сх + dy < Л4; (3) ex + fy < С. 3. Для практики записи задач линейного программирования запишите за- дачи 2, 4, 5, 6 и 7 из упражнения 3.3.8. 3.3.3. РЕШЕНИЕ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Один из способов решения задач линейного программирования состоит в том, чтобы рассмотреть все множество возможных наборов значений переменных (в задаче о стульях это будет множество пар (х, у)), которые удовлетворяют линейным ограничениям, вычислить значение целевой функции для каждого набора и выбрать такую сово- купность значений переменных, которая приводит к оптимуму (т. е. минимуму или максимуму), — эту процедуру удобно было бы реали- зовать на ЭВМ. Для простейших задач линейного программирования, наподобие рассмотренных нами, такой способ был бы вполне эффек- тивным. Однако на практике задача может иметь достаточно большое число переменных и ограничений и на такое решение задачи «в лоб» потребовалось бы чрезвычайно много времени. Более того, если чис- ло переменных задачи очень велико, то такой метод может оказаться вообще неприемлемым из-за ограниченных возможностей вычисли- тельных машин. Для сокращения вычислений при решении задач линейного про- граммирования математиками было предложено большое число ме- тодов (алгоритмов), которые отыскивают решение шаг за шагом. Наиболее эффективный алгоритм, который известен под названием симплексный метод (или симплекс-метод), был предложен в 1947 г. Дж. Данцигом (G. В. Dantzig). Прежде чем начать изложение этого метода, мы обсудим графическое решение задач линейного програм- мирования, которое применяется в случае, когда в задачу входят толь- ко две переменные. Это поможет читателю лучше понять смысл мето- дов линейного программирования. Мы также остановимся на одном простейшем методе, который применяется для решения транспортных задач. 3.3.4. ГРАФИЧЕСКОЕ РЕШЕНИЕ а) Множество точек, порождаемое линейным неравенством. Преж- де чем продолжить чтение, мы советуем читателю освежить в памя- ти главу из первой части, посвященную неравенствам. Рассмотрим неравенство ах + by с, где а, b и с неотрицатель- ны. Все точки, удовлетворяющие этому неравенству, должны либо лежать на прямой ах + by = с, либо принадлежать одной из по- луплоскостей, на которые разбивается плоскость. Нетрудно догадать- ся, которая из полуплоскостей удовлетворяет неравенству. Для этого надо проверить, какая из них содержит точку (0,0). Поскольку 337
О < с, то, очевидно, начало координат удовлетворяет неравенству, поэтому это и будет допустимой точкой. Отсюда следует, что требуе- мой полуплоскостью будет та полуплоскость, которая содержит на- чало координат. На рис. 127 показаны прямая и соответствующая полуплоскость, которая в свою очередь разбивается на четыре части, каждая из ко- торых обозначена буквой А. Все точки этих областей и точки, лежа- щие на прямой, удовлетворяют неравенству; это множество (пря- мую и соответствующую полуплоскость) мы назовем допустимым мно- жеством, задаваемым неравенством. Черточками НИ обозначена по- луплоскость, не являющаяся допустимой. б) Множество точек, порождаемое системой неравенств. Рассмот- рим следующие три неравенства: ах + by s'l с; х 0; У > 0. Для каждого неравенства мы можем построить на графике соот- ветствующее допустимое множество (рис. 128). Прямые для второго и третьего неравенств, очевидно, будут координатными осями. Как видим, множеством точек, которые одновременно удовлетво- ряют всем трем неравенствам, будет множество точек, лежащее в пер- вом квадранте и находящееся ниже прямой АВ. Таким образом, точ- ки, лежащие внутри треугольника О АВ или принадлежащие его сто- ронам, удовлетворяют всем неравенствам. Любая точка, лежащая вне этого треугольника, не удовлетворяет ни одному из неравенств. Заметим, что найденное множество точек треугольника будет сов- падать с пересечением допустимых множеств для трех неравенств. Упражнение 3.3.2 1. Покажите на графике допустимые множества, которые порождаются следующими неравенствами: (1) х+ 2у <- 1; (2) Зх |- у > 2. 2. Покажите на графике множество точек, которые одновременно удовлет- воряют следующим неравенствам: (1) х+у <1; х > 0; у > 0; (2) 2х-рг/<3; х-\-у < 2; х > 0; у > 1/2. 338
всеми огра- лежащая в пересечении ограничениями задачи, допустимых называется Рис. 129. Графическое решение задачи о двух видах стульев в) Допустимые решения задачи линейного программирования. Очевидно, что при отыскании решения задачи линейного програм- мирования мы должны исследовать только те точки, которые принад- лежат пересечению допустимых множеств, порождаемых ничениями в виде неравенств пли уравнений. Определение. Точка, множеств, порождаемых всеми допустимым решением. Таким образом, задача линейного программирования заключается в том, чтобы найти такую точку (или точ- ки), которая принадлежала бы множеству допустимых решений и давала бы опти- мальное значение целевой функции. Легко показать, что для любой задачи линейного про- граммирования множество до- пустимых решений будет вы- пукло (см. 1.4.9). Если в за- дачу входит больше чем две переменные (скажем, п пере- менных), то множество допустимых решений нужно рассматривать как выпуклое «тело» в /i-мерном пространстве. В этом пространстве каждое ограничение-уравнение будет определять некоторую гипер- плоскость. Упражнение 3.3.3 Найдите область допустимых решений для задачи 1(1) из упражнения 3.3.1 г) Оптимальное решение задачи линейного программирования. Для случая размерности второго порядка довольно просто найти до- пустимое решение, оптимизирующее целевую функцию. Чтобы пока- зать, как это делается, мы рассмотрим задачу, стоящую перед руко- водителем предприятия, из примера 1, связанную с выбором решения об изготовлении различных видов стульев. Прежде всего нарисуем все прямые, соответствующие ограниче- ниям, и найдем область допустимых решений, которая будет пред- ставлять собой многоугольник. На рис. 129 этот многоугольник обо- значен ABCD. Затем нанесем на график прямую, которая пройдет через нача- ло координат и будет соответствовать нулевой прибыли Р. Эта пря- мая определяется уравнением 7/4х -ф 3/2 у — 0; на графике эта пря- мая изображена пунктиром и обозначена как прямая нулевой прибыли. Советуем читателю положить карандаш па эту прямую и рассмот- реть множество точек, которое она определяет. Любая точка на этой прямой задает некоторую комбинацию стульев видов А и В, произ- 339
водство которых ведет к тому, что прибыль будет равна нулю. В дей- ствительности на этой прямой имеется только одна точка, которая имеет смысл для этой задачи, а именно (0, 0). Другие точки не под- ходят, потому что нет смысла говорить об отрицательном количестве стульев. Теперь если читатель начнет двигать карандаш в направлении многоугольника до тех пор, пока карандаш не примет положение, ко- торое на рисунке соответствует второй пунктирной линии, то он за- метит, что карандаш при этом в положительном квадранте «заметает» некоторое множество точек, которое представляет собой треугольник. Каждая точка с целочисленными координатами на этой прямой оп- ределяет некоторую возможную комбинацию изготовления стульев. Причем точки, лежащие над карандашом, будут соответствовать ком- бинациям стульев с большей прибылью, а точки, лежащие под каран- дашом, т. е. принадлежащие треугольнику, соответствуют меньшей прибыли. Очевидно, для того чтобы найти оптимальное решение, мы долж- ны двигать карандаш в том же направлении до достижения области допустимых решений. Двигаясь по этой области дальше, мы должны дойти до такого места, когда карандаш целиком (за исключением од- ной точки) будет лежать вне области допустимых решений. Эта «последняя» точка из области допустимых решений и будет соответ- ствовать такой комбинации производства стульев, которая приведет к максимальной прибыли. Читатель легко определит, что последней допустимой точкой бу- дет точка, обозначенная буквой С. Эта точка имеет координаты (30, 16)*, что означает: для того чтобы прибыль была максимальна, ме- бельной фабрике необходимо еженедельно выпускать 30 стульев вида Л и 16 стульев вида В. Эта комбинация удовлетворяет всем ограничениям и приводит к прибыли Р = ’/4 • 30 + 3/2 • 16=761/2 фунта стерлингов. Таким образом, решением этой задачи будет следующая комби- нация стульев: 30 стульев вида А; 16 стульев вида В с Лпах = 76г/2 фунта стерлингов. Замечания (1) Иногда прямая, соответствующая некоторому ограничению, может не участвовать в определении границы множества допусти- мых решений. Тогда это ограничение не влияет на решение задачи и им можно пренебречь. (2) Задача может не иметь конечного оптимального решения. Это произойдет в том случае, когда прямую прибыли можно двигать до * Эти значения получают в результате решения системы линейных урав- нений, соответствующих второму и третьему ограничениям (с. 335).—Примеч. пер. 340
бесконечности и она никогда не достигнет последней точки, принад- лежащей множеству допустимых решений. (3) Оптимального решения может вообще не существовать. Этот факт легко установить, нарисовав все прямые, соответствующие ог- раничениям. Тогда, если пересечение допустимых множеств будет пус- то, то соответствующих всем ограничениям решений не существует. Это означает, что два или более ограничения противоречат друг другу. (4) Может существовать много решений. Действительно, если прямая прибыли будет параллельна прямой, которая составляет пос- леднюю границу множества допустимых решений, то все точки этой прямой будут показывать максимальную прибыль. Следующее упражнение содержит разнообразные задачи линейно- го программирования, которые охватывают все возможные случаи, поэтому от читателя требуется определенная внимательность. Упражнение 3.3.4 Следующие задачи линейного программирования решите графически. На- рисуйте прямые ограничений и найдите область допустимых решений. Нарисуй- те также прямую с нулевой прибылью и найдите точку (или точки), которая оп- тимизирует данную целевую функцию. Для каждого случая найдите опти- мальное значение целевой функции. Точки следует выбирать только с целыми координатами. 1. х > 0; у > 0; х -р Зу < 90; 10х -р 7у < 440. Максимизируйте функции = х -р у и Р2 = х -р Зу (по отдельности). 2. t > 5; z > 5; t + 2z < 41; 8t + 5 г < 185. Максимизируйте Р = 2t -р 3z. 3. х < 15; у > 20; 6х -р у > 60; 4х -р Зу < 180; 4х -р lit/ < 990. Минимизируйте Р — 2х -р у. Ту же функцию максимизируйте. 4. s > 12; 13s 4- 50/ < 1300; s + 2/ > 60; 5s + 2t < 130. Минимизируйте P = 2t -p s. 5. у < 7; 15x -j- 4y > 60; 20x -p 3y < 60. Максимизируйте P = 3x -p y. 6. w > 0; p > 0; 2w -p p > 20; 2ю -p 3p > 30. Максимизируйте P = Зю -p 2p. Эту же функцию минимизируйте. 7. S < 40; Т < 15; 13S + ЮТ < 540; S ~Р 5 Т > 50; 4S + 5Т > 80; S -р 6Т > 30. Максимизируйте Р = 2Т -р S. 8. 6 < Q < 30; 5Р + 2Q < 100; 6Р ~Р Q > 30; Р + 2Q > 20. Максимизируйте Рх = 2Р -р Q. Минимизируйте Р2 = Р -р 2Q. 3.3.5. ТРАНСПОРТНАЯ ЗАДАЧА а) Два завода и два склада. В задаче о заводах и складах (см. 3.3.1, пример 2) рассматриваются четыре переменные, а именно л'ц, х12, х21 и х22- Однако, удовлетворяя условиям задачи, они не мо- гут оставаться независимыми друг от друга. Задачу можно преоб- разовать так, что останется только одна независимая переменная. Чтобы показать, как это делается, положим х = х1г и укажем при этом все возможные распределения товара по складам в следующей таблице; 341
1^1 w2 Fi X 4 — х f2 6—X 7— (6—х) = 1+х Объяснение х12 = 4 — х, поскольку общий выпуск завода Fj равен 4; х21 = 6 — х, поскольку вместимость склада равна 6; х22 должен быть таким, чтобы выпуск F2 был равен 7. По данным транспортным издержкам мы найдем, что суммарные транспортные затраты для такого размещения будут равны С = 4х + 5 (4 — х) + 3 (6 — х) + 7 (1 + х) = 45 + Зх. Ограничения допустимых решений Рис. 130 Поскольку не имеет смысла говорить об отрицательном количестве товара, мы получим следующие четыре неравенства: 4 — х > 0, 1 + х > 0; 6 — х >- 0; х 0; — ограничения (см. рис. 130). Легко видеть, что множество допустимых решений будет {х : 0 х 4}. Итак, С минимизируется при х — 0. Размещение продукции в этом случае будет следующим: Поскольку С линейна по х, то минимальное значение получается подстановкой х = 0, тогда как максимальное значение получается при х = 4. В обоих случаях один из складов не используется вообще. Обобщение этого факта, установленного для задачи с 2 заводами и 2 складами, приводит к тому, что по крайней мере один из складов 342
не будет участвовать в оптимальном размещении. Этим результатом пользуются при построении итеративных методов решения задач большой размерности. Упражнение 3.3.5 1. В следующих задачах найдите размещение, которое минимизирует сум- марные транспортные издержки: cij Склады (2) cij Склады Заводы 2 4 3 6 5 8 Заводы 6 15 И 12 8 9 6 7 10 7 cij Порты (4) СЧ Электро- станции Корабли 9 5 6 8 6 10 У гольные шахты 7 12 5 10 4 8 9 7 5 7 2. Докажите, что для транспортной задачи 2 X 2 в оптимальном размеще- нии отсутствуют перевозки хотя бы по одному пути. б) Два завода и три склада. Рассмотрим более сложную задачу о двух заводах и трех складах. Мы рассмотрим численный пример и да- дим два метода его решения. Первый метод будет заключаться в све- дении задачи к двумерной задаче линейного программирования, ко- торую, как показано в гл. 3.4, можно решить графически. Второй метод — более общий; с помощью этого метода можно решать большие задачи. Задача Издержки cq Склады IFi W2 W3 Выпуски заводов Заводы 1\ f2 5 2 1 3 3 4 10 15 Вместимости складов 8 10 7 343
1. Сведение к двумерной задаче. Пусть х озна- чает количество единиц продукции, которое отправляется с завода Fj на склад Wlf ay — с завода Fr на склад 1Ка. Тогда, как легко ви- деть, таблица перевозок должна выглядеть следующим образом: 1Г1 W2 w3 fl X У 10 —(x-pi/) Fa 8 — x Ю-i/ (x+i/)—3 Каждый из элементов таблицы больше нуля или равен ему, по- скольку отрицательное число единиц продукции не имеет смысла. Итак, мы приходим к шести ограничениям: (1) х 0, (2) х 8, издержек Рис. 131. R— область допустимых решений. Прямая затрат сдвигается параллельно прямой 5х+2р=0 (3) У 0, (4) у 10, (5) х + у <1 10, (6) х + у 3. Общие затраты на перевозки составляют С = 5х + 2у + 10 — (х + у) + 3 (8 — х) + + 3 (10—у) + 4 (х + у) — 12 = 5х + 2у + 52. С представляет собой функцию х и у и будет целевой функцией нашей задачи. Графическое решение этой задачи приводит к точке А (0,3) (рис. 131). Wz w3 Fi 0 3 7 Fa 8 7 0 Cmln = 58 344
Упражнение 3.3.6 1. С помощью графического метода решите пример (2) задачи 1 из упраж- нения 3.3.1. 2. Некоторые идеи решения задачи в общем виде (задача т X п). Прежде чем описывать общий метод решения транспортных задач, мы остановимся на следующих понятиях: 1) прямоугольные цепи, 2) независимые расположения, 3) подходя- щие решения. 1) Прямоугольные цепи. Если у нас имеется некоторое допустимое решение, причем известно, что оно не минимизирует общую стои- мость перевозок, то, очевидно, это решение необходимо изменить. Яс- но, что любое изменение перевозок некоторого количества продукции на одной из дорог ведет к изменению общей суммы в строке и столбце таблицы; первоначальное значение этих сумм должно быть восстанов- лено изменением количества перевозимого товара на других дорогах. Необходимое «восстановление» при изменении плана перевозок мо- жет быть наглядно изображено с помощью прямоугольной диаграм- мы или цепи, которая связывает четыре клетки таблицы перевозок (рис. 132). Рис. 132 Иногда мы будем пользоваться более сложной цепью, например, такой, как на рис. 133. Легко видеть, что эта цепь эквивалентна сум- ме перемещений, которые можно выразить в виде цепей, изображен- ных на рис. 134. Рис. 134 Очевидно, что любое множество допустимых изменений плана пе- ревозок (т. е. изменений, которые сохраняют значения сумм по стол- бцам и строкам) должно быть эквивалентно серии прямоугольных цепей. 2) Независимые расположения. Будем говорить, что клетки матри- цы перевозок, определяющей допустимое решение, расположены не- зависимо, если любая прямоугольная цепь, содержащая эти клетки матрицы, имеет хотя бы одну нулевую клетку. 345
3) Подходящие решения. В методе, который здесь рассматривает- ся, мы будем стараться найти последовательность таких допустимых решений, которые имеют следующие свойства: (а) матрица перевозок каждого решения содержит ровно (т -}- ~Т п — 1) ненулевых клеток; (б) клетки матрицы независимо расположены. Решения, которые удовлетворяют свойствам (а) и (б), называем подходящими решениями. Мы опишем способ нахождения последо- вательности подходящих решений, для которых транспортные издер- жки будут постоянно уменьшаться до тех пор, пока не будет достиг- нуто оптимальное решение с минимальными затратами. 3. Применение метода на примере задачи размерности 2X3. Следующий метод может применяться в самых общих случаях. Мы покажем его применение на примере за- дачи с 2 заводами и 3 складами. Шаг I. Первое допустимое решение. Метод северо-западного угла. Прежде всего запишем в виде таблицы матрицу 2x3, показывающую выпуски .заводов и вместимости складов. 1. Начальная таблица ^1 w2 1Г3 Выпуски Fi 10 f2 15 Вместимости 8 10 7 Начиная с «северо-западного угла», составим план перевозок та- ким образом, что с завода Fr перевозится на склад WZj столько продук- ции, сколько позволяет вместимость этого склада; оставшуюся часть перевозим на склад W2 и т. д. до тех пор, пока вся продукция с заво- да F] не будет размещена по складам. В нашем примере на склад мы можем перевести с завода 8 единиц продукции (это количест- во равно вместимости склада), затем оставшиеся 2 единицы размес- тим на складе W2. Таким образом, верхняя строка первого решения будет состоять из 8, 2, 0. Для второй строки х21 должен быть равен 0, так как склад ITj полностью заполнен продукцией с завода Ft. На склад W2 со второго завода можно еще направить 8 единиц продукции, а оставшиеся 7 единиц перевезем на склад W3. Таблица перевозок будет теперь выглядеть следующим образом: 346
2. Первое решение Wy Г2 Г3 м 8 2 0 1 1 F2 0 1 1 8 7 Заметим, что таблица содержит ровно (2 + 3 — 1) — 4 ненулевых клетки, а любая прямоугольная цепь этой таблицы будет содержать по крайней мере одну нулевую клетку. Отсюда следует, что такое размещение продукции будет подходящим. Рис. 135 Шаг /I. Вычисление транспортных затрат. Составим снова матри- цу транспортных издержек ci} и вычислим суммарные затраты на перевозку продукции, которые соответствуют ранее полученной мат- рице перевозок: Wi r2 1^3 м 5 2 1 f2 3 3 4 Затраты: Ci 8-5-Р2-2/ 8-3-J-7 4 96единиц Минимальны ли затраты Сх? Может быть, размещая некоторое ко- личество единиц продукции завода 1\ на складе W 3, мы сможем уменьшить общие затраты на перевозку? Чтобы проверить это, мы переадресуем единицу продукции с одного склада на другой, восполь- зовавшись прямоугольной цепью, которая пунктиром изображена в таблице первого решения. Изменение размещения продукции на складах можно отразить на графике (рис. 135). Итак, мы берем единицу продукции из х23 и добавляем ее к х13; то же самое делаем с х12 и х22- Изменение в общей сумме затрат будет равно с13 — с2з Ч- ^22 Чг — 1 4'3 2 2. 347
Это означаем, что затраты При этом уменьшаются Па 2 единицы. Другими словами, изменение размещения продукции по этой цепи улучшает план перевозок. Исследование всех возможных перемещений продукции в таблице перевозок и вычисление соответствующих затрат заняло бы много времени. Существует метод, который позволяет очень быстро иссле- довать все изменения. Этот метод использует так называемые тене- вые затраты tit и v}. Эти затраты находят следующим образом. 3. Таблица теневых затрат (значок * означает, что соответствующая клетка первого решения ненулевая) Wi Юз Ul Fi * * (1,3) 0 То (3,6) * * 1 vj 5 2 3 Рассмотрим только ненулевые клетки (со стоимостью c;j-) в первом решении. Эти клетки обозначены в таблице звездочкой. Найдем те- невые затраты ut для каждой строки и Vj для каждого столбца, такие, что Сц = щ + Vj. для каждой клетки таблицы. Это делается довольно просто: (1) произвольно выбираем up, положим щ = 0; (2) тогда vL должно быть равно 5, так как Сц = 0 + 5 = 5; (3) v2 должно быть равно 2, чтобы с12 = 2; (4) тогда и2 должно быть равно 1, поскольку с22 — 3; (5) наконец, v3 должно быть равно 3, для того чтобы с23 = 4. (Замечание. Теневые затраты могут быть отрицательны- ми — это допускается.) Теневые цены позволяют исследовать эффект изменения плана пе- ревозок по предложенной схеме. Это изменение в суммарной стои- мости перевозок может быть записано в виде С'13 — с23 + с22 с12 = схз (и2 + v3) + (и2 v2) — («1 + v2) = с13 — (цх + Ц3). Таким образом, если для нулевых клеток таблицы, которые мы хо- тим сделать ненулевыми, вычислить суммарные теневые затраты uL + vs и сравнить их с истинными затратами с13, то мы сразу же увидим, уменьшают ли эти изменения общие затраты или нет. Если с13 < {щ. + Пз). то общие затраты при таком перемещении уменьша- ются. 348
Ё табл. 3 показаны парк затрат (ci}, ut + Vj) ДЛЯ каждой нулевой клетки первого решения. В каждом случае теневые затраты больше истинных, поэтому если бы данная таблица не указывала на необхо- димость изменения матрицы перевозок, то найденное решение было бы оптимальным. На практике обычно выписывают только таблицу истинных за- трат, а разности — (t/; -J- v}) пишут в углу соответствующей клетки. После проверки решения должны быть зачеркнуты, а для следующего решения вычисляются новые разности затрат. Шаг III. Преобразование матрицы перевозок. Как было показано в шаге И, имеются две возможности /тл преобразования матрицы перевозок: адресовать часть продукции с К2 на склад или же с F± на склад zS Ws. Выберем первую возможность, так как 621 соответ- 'ч--' ствует большее уменьшение затрат. Однако для этого ' ри случая мы сначала рассмотрим перевозку FL Ws, этот выбор будет объяснен позже. Заметим, что каждый раз мы можем использовать только одну новую перевозку, которая при- водит к экономии затрат. Для преобразования матрицы перевозок рассмотрим прямоуголь- ную цепь и все возможные соответствующие ей перемещения. Мы мо- жем перемещать максимум 2 единицы, поскольку перемещение более 2 единиц сделает верхнее левое значение клетки цепи отрицательным (рис. 136). После перемещения мы получим второе улучшенное допустимое решение. 4. Второе решение W], if2 IF3 Fl 8 0 2 f2 0 10 5 После этого мы должны вычислить новые теневые затраты, для каждой нулевой клетки исследовать разности и проделать даль- нейшие перемещения, если хотя бы одна из окажется отрица- тельной. Окончательное решение. Осуществляя последовательно, шаг за шагом описанную процедуру, мы можем найти оптимальное решение, при этом будут получены четыре допустимых решения, последнее из которых оптимальное. Теневые затраты записываются справа и вни- зу таблицы; в правом верхнем углу каждой нулевой клетки таблицы приводятся 6fj-. Мы рекомендуем читателю переписать эти решения и обвести карандашом каждую цепь, которая используется в решении, а также самостоятельно получить uit Vj и проверить 6fJ-. 349
Отметим устойчивое снижение суммарных затрат. В последнем решении все положительны, что указывает на оптимальность ре- шения. Истинная таблица затрат на перевозки 5 2 1 3 3 4 Затраты: Сг = 92 единицы 350
Третье решение Четвертое решение (оптимальное) Вырождение. На некотором шаге может оказаться, что число используемых перевозок меньше, чем т -J- п—1. Такой слу- чай называется вырожденным. При этом невозможно вычислить все теневые затраты и процесс улучшения плана не может быть продол- жен. Эту трудность можно обойти следующим образом. Увеличим ис- кусственно вместимость каждого склада на незначительную величину х, а выпуск одного из заводов — на пх (п — число складов). Тогда процесс можно продолжить; в окончательном решении значение х бу- дет равно нулю. Пр и м е р. Вырождение в нашем примере возникает в том слу- чае, если на первом шаге перемещения перевозок мы начнем изменять перевозки Тогда 351
Второе решение Wi r2 wa Hi F1 0 10 0 ? 7'2 8 0 7 ? vi ? ? ? Затраты: С2 = 72 единицы Теперь у нас имеются только три ненулевые клетки и поэтому теневые затраты не могут быть вычислены. (Читатель может попытать- ся это проверить.) Увеличим фиктивно вместимость каждого склада на х, а выпуск завода У2 — на Зх. Тогда таблица перевозок и тене- вых затрат будет следующей: Модифицированное второе решение Вместимости Выпуски IFi (8+x)2 if2 (10+x) 1^3 (7+x) fl (10) 0 3 10 ° —2 0 f2 (15+3x) 8-J-x X 7+x 1 v] 2 2 3 Затраты: Cz=72+10x Поскольку 613 отрицательно, мы пересылаем 7 + х в клетку F\W :1- Тем самым мы приходим к третьему допустимому решению. Затраты: С3=58-[-8х 352
Все в нулевых клетках теперь положительны, поэтому даль- нейшие изменения матрицы перевозок излишни. Полагая х=0, прихо- дим к оптимальному решению: It7! 1Р2 IF3 Л 0 3 7 f2 8 7 0 Затраты: Cmin=58 единиц Упражнение 3.3.7 1. Сделайте необходимое дополнение и найдите матрицу оптимальных пе- ревозок в следующих задачах: Вырожденное реше- ние (1) (2) (3) Задачи 3X3 Таблица затрат 2 4 6 2 1 2 3 3 1 4 0 0 2 0 0 0 2 5 (4) _________________________ 0 0 2 3 4 0 0 0 3 4 6 3 2 2 1 1 4 3 2. В трех гаражах а, Ь, с имеется следующее количество автобусов: в гараже а — 1 автобус, b — 8, в с — 7. Эти автобусы нужны] на трех вокза- лах — А, В, С, причем на вокзале А нужно 2 автобуса, на В — 5, на С — 9. Расстояние (в км) от гаражей до вокзалов приводятся в таблице: a b c A 6 10 15 В 4 6 16 С 12 5 8 12 Зак. 973 353
Как надо распределить поездки, чтобы общее расстояние, пройденное все- ми автобусами, свести к минимуму? 3. Компания имеет четыре склада а, Ь, с и d. Продукцию с этих складов необходимо поставить трем заказчикам — А, В и С. Склады имеют следующие запасы продукции: а •— 15 единиц, b — 16 единиц, с — 11 единиц, d — 13 еди- ниц. Затраты на транспортировку единицы продукции со складов а, Ь, с и d за- казчикам А, В к С приведены в следующей таблице. Затраты на единицу продукции (в фунтах стерлингов) Склады abed Заказчики А 8 9 6 3 В 6 И 5 10 С 3 8 7 9 Найдите вариант распределения поставок, удовлетворяющих заказчиков, который сводит транспортные издержки к минимуму. Мы описали графические методы решения двумерных задач и да- ли численный метод решения транспортных задач общего вида. Раз- мер рассмотренных задач был довольно мал, однако уже на этих зада- чах читатель смог познакомиться с основными этапами решения задач линейного программирования — запись задач в виде системы нера- венств и последовательное, шаг за шагом, отыскание их оптимального решения. На практике задачи линейного программирования могут быть очень большими. Например, была успешно решена транспортная за- дача для распределения поставки угля приблизительно с 800 уголь- ных шахт 200 электростанциям, причем транспортировка могла осу- ществляться автотранспортом, по железной дороге, по морю или по каналам. Задачи с очень большим числом переменных со всеми их модификациями трудно бывает решить сразу, однако если возмож- но разбиение задачи на отдельные части, то ее решение, как правило, приводит к значительному уменьшению транспортных издержек. Сейчас мы рассмотрим метод, который может быть применен к ре- шению задач линейного программирования любого вида и размера. Этот метод удобен и при работе с вычислительными машинами. Впер- вые он был описан Дж. Данцигом в книге: «Activity Analysis of Production and Allocation» (J.Wiley & Sons, 1951), вышедшей под ре- дакцией T. Купманса. 3.3.6. СИМПЛЕКС-МЕТОД Рассмотрим применение симплекс-метода на примере решения простой задачи линейного программирования. Наша цель состоит в том, чтобы на простейшем примере познакомить читателя с алго- ритмом метода. Некоторые тонкости, которые могут возникнуть при решении задач, мы на время оставим в стороне и не будем подробно останавливаться на их обсуждении. Такое введение ₽ основы метода
позволит читателю разобраться в более подробных работах, посвя- щенных строгому изложению теории и применению этих методов на практике. Задача. Рассмотрим задачу руководителя мебельной фабрики (см. пример 1 из 3.3.1). Мы несколько упростим задачу, изменив условия соглашения о поставке стульев. Прежде всего не будем требовать, чтобы х и у были целыми числа- ми. Таким образом, несколько изменяются график и ограничения. Итак, задача заключается в том, чтобы максимизировать Р = = 7/4х + 3/2// при условии, что х и у — неотрицательные числа, причем: 8х + 5у < 320; (1) 4х + 5у < 200. (2) Эту задачу мы будем решать симплекс-методом. Решение разобьем на шаги. Шаг /. Введение дополнительных переменных. Введя новые неот- рицательные переменные г и s, неравенства (1) и (2) можно превратить в равенства следующим образом: 8х + Бу -|- г = 320; (3) 4х + Бу + s = 200, (4) где г и s называются дополнительными переменными', они, как лег- ко видеть, не изменяют значение прибыли Р. Шаг II. Составление таблицы коэффициентов и прибылей. Соста- вим таблицу, в которой показывались бы коэффициенты при всех пе- ременных и их вклад в общую прибыль. Для рассматриваемого при- мера имеем следующую таблицу. Таблица 1 (Первое решение) q 7 4 3 2 0 0 р X У Г S *г 8 5 1 0 320 *s 4 5 0 1 200 р _7 4 _3 2 0 0 0 Строка, помеченная q, содержит коэффициенты целевой функции; строки *г и *s — коэффициенты уравнений-ограничений (3) и (4); строка р содержит элементы строки q с противоположными знаками. Шаг III. Первое опорное допустимое решение. Так же как и в транспортной задаче, мы сначала найдем допустимое решение, прове- рим, оптимальное ли оно, и если нет, то улучшим его. 12* 355
В задаче имеются четыре переменных — х, у, г, s и два уравнения. Будем искать решение, которое содержит ровно 4—2 = 2 перемен- ные, равные нулю. Такое решение назовем опорным, а ненулевые пере- менные назовем опорными переменными. В нашем примере (как и в других задачах линейного программи- рования этого вида) опорное решение сразу получается введением дополнительных переменных. Таким образом, первое опорное реше- ние будет следующим: л; = 0, у = 0, г = 320, s = 200. Опорные переменные входят в левый столбец каждой таблицы. В табл. 1 эти переменные обозначаются звездочкой. Шаг IV. Выбор неопорной переменной, которую необходимо увели- чивать. Поскольку г и s не дают прибыли, мы имеем Рг = 0. Очевидно, мы можем увеличить прибыль, увеличивая х и (или) у. Процедура вы- бора неопорной переменной выглядит следующим образом. Наибольшее отрицательное значение в строке р равно — 7/4. Оно находится в столбце х; это означает, что прежде всего необходимо увеличивать х. Сделаем х как можно большим, удовлетворяющим ог- раничениям (3) и (4); при этом автоматически мы получим, что г и s окажутся равными нулю. Для нахождения этого значения (которое будет соответствовать второму допустимому опорному плану и при котором х станет опор- ной переменной, а одна из переменных г или s — неопорной) раз- делим элементы столбца, обозначенного Р, на соответствующие эле- менты столбца х. Результатом деления будет столбец > кото- рый показан в скобках рядом со следующей таблицей. На практи- ке его вообще не записывают. Разреша- ющая строка Таблица 2 X У Г 5 р Г 8 5 I 0 320 5 4 5 0 1 200 р _3 2 0 0 0 Шаг V. Выбор разрешающей строки и разрешающего элемента. Изучая столбец, найденный на предыдущем шаге, мы замечаем, что наименьшее положительное значение в этом столбце равно 40 и что оно соответствует строке г. Поэтому для получения улучшенного ре- шения мы должны заменить г на х (т. е. мы полагаем г равным 0 и де- лаем эту переменную неопорной). Назовем строку г разрешающей строкой. Она пересекает столбец х в элементе 8, который в табл. 2 набран полужирным шрифтом. Этот элемент называется разрешаю- щим элементом. Разделим все элементы разрешающей строки на разрешающий элемент. Получим следующую таблицу. 356
Таблица 3 X У Г S р Г 1 5 8 £ 8 0 40 S 4 5 0 1 200 р 7 4 _3 2 0 0 0 Шаг VI. Подстановка г вместо х. Теперь с помощью разрешаю- щей строки прообразуем две остальные строки таким образом, чтобы все элементы столбца х, за исключением разрешающего, стали равны- ми нулю. Это может быть сделано следующим способом: 1) вычтем из строки г строку s, поделенную на 4; 2) прибавим к строке г строку р, умноженную на 7/4. Обозначая верхнюю строку через х, придем к следующему резуль- тату. Таблица 4 (Второе решение) - X У Г S р X 1 5 8 1 8 0 40 S 0 5 2 2 1 40 р 0 13 32 7 32 0 70 «— Прибыль Р2 Шаги IV, V, VI приводят нас ко второму допустимому решению. Из таблицы находим, что х = 40, s = 40 (и у = 0, г = 0) является реше- нием, причем замечаем, что это будет опорным решением. Прибыль, соответствующая этому решению, равна Р2 = 74 х = 70; это значе- ние находится на пересечении строки р и столбца Р. Шаг VII. Получение оптимального решения. Исследуем элементы строки р. Отрицательное значение элемента этой строки показывает, насколько увеличится прибыль, если в решение включить единицу соответствующей переменной. Аналогично положительное значение свидетельствует об уменьшении прибыли. Если бы все элементы стро- ки р были положительны (или равны нулю), то это говорило бы о том, что невозможно получить увеличение прибыли, изменяя значения пе- ременных. Таким образом, для получения оптимального решения мы должны найти последовательность опорных решений и процесс про- должать до тех пор, пока все элементы строки р не станут неотрица- тельными. Способ нахождения опорного решения дан в описании ша- 357
гов IV, V и VI. Эти процедуры следует повторять до получения опти- мального решения. Следующие таблицы приводят к оптимальному решению нашей за- дачи. Каждую таблицу мы советуем читателю тщательно проверить. (1) Нахождение разрешающей строки и разрешающего элемента Таблица 5 Разреша- ющая стро- ка X У Г S р | столбец Р столбец у / 64 j Наимень- ший по- <— ложи- 1 1 £• тельный 10 элемент 2240 \ 1з 1 X 1 5 8 1 8 0 40 S 0 5 2 1 2 1 40 р 0 13 32 7 32 0 70 (2) Деление строк на разрешающий элемент Таблица 6 X I 5 8 1 8 0 40 S 0 1 1 5 2 5 16 р 0 13 32 7 32 0 70 (3) Приравнивание всех элементов строки к нулю (за исключе- нием разрешающего') Таблица 7 X 1 0 1 4 _1 4 30 «—Прибыль РШах У 0 1 _1 5 2 5 16 р 0 0 11 80 13 80 7б1 2 Теперь все элементы строки р неотрицательны, поэтому мы не мо- жем увеличить найденное значение прибыли. Таким образом, оптимальным будет решение: х = 30, у — 16 щ г = 0, s = 0) с Ртах = 76 х/2 фунтов стерлингов. 358
Упражнение 3.3.8 1. Следующие задачи решите с помощью симплекс-метода. Некоторые из них содержат три переменные. Осуществляя описанные в тексте шаги, читатель не встретит трудностей при решении этих задач. (1) Ограничения: х, у > 0; х + 2у < 41; 8х + 5g, < 185. Функция прибыли: Р = 2х + Зу. Максимизируйте Р. (2) Ограничения: s, t > 0; s + 2t < 4; 5s + 2t < 10. Функция прибыли: P = s -j- t. Максимизируйте P. (3) Ограничения: p, q > 0; p + q ’< 10; 5p | 9g < 70. Функция прибыли: Z. = 3p + 4g. Максимизируйте Z. (4) Ограничения: x > 3; у > 0; 15x + 8y C 20; 4x + 5y < 40. Функция прибыли: M = x + у. Максимизируйте М. (5) Максимизируйте функцию Р = 2х + у + За при следующих ограни- чениях: х, у, z > 0; х + 2у < 10; 2у + г < 12; Зх + у + 2г < 30. (6) Максимизируйте функцию Q = 2и f- 5о + 3w при следующих огра- ничениях: и, v, w > 0; Зи + v + 2w < 25; и + 2v + 3 w < 40; 2и + 3v + w < 20. (7) Максимизируйте функцию S = р + 4g + 5г при следующих огра- ничениях: р, д, г > 0; р + 2g + г < 100; 2g + Зг < 120; 2р + g С 80; 2. Руководитель предприятия имеет в наличии три машины — А, В, С, которые производят три различных товара — Р, Q, В. В таблице приведено время, необходимое для изготовления каждой машиной единицы"товара: Машинное время, ч Товар А В С Р 3 2 0 Q 0 1 2 В 2 1 3 Прибыль единицы каждого товара Р, Q, R, равна приблизительно 10, 15, 20 фунтам стерлингов. Время изготовления товаров для каждой машины в течение недели ограни- чено следующим образом: машина А может работать не более 41 ч; машина В может работать не более 35 ч; машина С может работать не более 30 ч. (а) Напишите множество линейных ограничений и функцию прибыли для данной системы. (б) С помощью симплекс-метода определите число различных товаров, ко- торое следует производить каждую неделю, с тем чтобы прибыль была макси- мальной. 3. Применяя симплекс-метод, решите задачи 1, 2 и 3 из упражнения 3.3.4. 4. Некоторая фирма производит два вида продуктов — I и II. Для изго- товления каждого вида необходимо применение машин А, В и С. Единица про- дукта вида I требует 2 ч работы на машине А, 1 ч иа машине В, 6 ч на машине С, тогда как единица продукта вида II требует 2, 5 и 2 ч работы на машинах А, В и С соответственно. В рассматриваемый период машину А можно использо- вать в течение 24 ч, машину В — в течение 44 ч, а машину С — в течение 60 ч. Прибыль за единицу продукта вида I равна 6 фунтам стерлингов, а за единицу продукта вида II —- 9. Какое количество каждого продукта необходимо произ- водить, чтобы прибыль была максимальной, а использование машины удовле- творяло бы необходимым условиям? 5. Рацион некоторого животного должен в день содержать 3000 единиц углеводов и 80 единиц протеина. Для составления рациона имеются четыре ос- 359
иовных вида продукта. Продукт I стоит 0,2 фунта стерлингов на 1 единицу, про- дукт II — 0,1, продукт III — 0,25, продукт IV — 0,3 фунта стерлингов. Продукт I содержит 600 J и 2 единицы протеина. Продукт II » 50 » 8 » » Продукт III » 500 » 10 » » Продукт IV » 800 » 3 » » Определите самую дешевую комбинацию продуктов, которая удовлетворя- ла бы необходимым ограничениям. 6. Компания по изготовлению игрушек производит куклы двух видов; ос- новной вариант—куклы Неусложненный вариант — куклы В. На изготов- ление одной куклы вида В требуется в два раза больше времени, чем на изготов- ление куклы А. Компания может произвести в день максимум 2000 кукол, ес- ли будет изготавливать куклы только основного варианта. Поставка пластмас- сы позволяет изготовить только 1500 кукол вдень (варианты А и В вместе). Производство кукол усложненного варианта требует дополнительных украше- ний, которые можно изготовить не больше чем для 600 кукол В за один день. Сколько кукол каждого вида должна производить в день компания, для того чтобы максимизировать прибыль, если известно, что за одну куклу вида А и вида В компания получает прибыль в 0,15 и 0,25 фунта стерлингов соответст- венно? 7. Фабрика выпускает два вида твида. Изготовление 1 м твида А требует 0,8 весовых единиц серой шерсти, 0,25 — красной шерсти, 0,2 — зеленой шерсти, тогда как производство 1 м твида В требует 1,0 — серой, 0,1 — крас- ной, 0,4 весовых единиц зеленой шерсти. На данный промежуток времени в наличии имеются 8000 весовых единиц серой, 2000 — красной и 3000 весовых единиц зеленой шерсти. Оба вида мате- риала изготовляются на одинаковых машинах и скорость изготовления их оди- накова — 12 м в час. На данный промежуток времени фабрика располагает 750 машинными часами. Прибыль с 1 м твида А равна 0,1, а твида В — 0,2 фунта стерлингов. (а) Какое количество каждого вида материала должна изготавливать компа- ния, чтобы максимизировать прибыль, если по соглашению с другой фирмой эта компания обязуется выпускать не меньше 3000 м твида Л? (б) Насколько увеличится прибыль компании, если соглашение о выпуске не меньше 3000 м твида А игнорировать? а) Другие варианты и модификации. Решение задач линейного программирования может содержать некоторые модификации и до- бавления. Различные варианты методов решения можно рассматри- вать как соответствующие модификации симплекс-метода. Например, в неравенства ограничений могут входить отрицательные коэффици- енты. Отыскивание первого спорного решения может оказаться более трудной задачей. Осложнения могут, в частности, возникнуть при выборе разрешающего элемента. Изучение различных вариантов симплекс-метода лежит за преде- лами этой книги. Как правило, для ответа на подобные вопросы дос- таточно бывает изменить симплекс-метод или сделать к нему некото- рое добавление. 3.3.7. ОБЩАЯ ТЕОРИЯ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Г[а) Стандартная задача. В общих терминах реформулируем стан- дартную задачу и обсудим фундаментальную теорему линейного про-- граммирования — теорему двойственности. 360
Определения (1) Стандартная задача линейного программирования заключает- ся в отыскании таких неотрицательных чисел xlt х2,..., хп, которые максимизируют (или минимизируют) данную линейную функцию С = сх xt + С2 Х2 Ч- ... 4- Сп Хп = S Ci Xi (1) Z=1 при условии выполнения системы неравенств: + ••• ~Ь &п1 %п ^1» 012 Xi + ... 4 (2) ••• ~Ь fl/im Хп d,n- Данная система неравенств может быть записана коротко как п S а(] Xi^dj, j — 1,..., т. i= 1 (2) Функция С называется целевой функцией, а неравенства (2) называются ограничениями задачи. (3) Любое множество чисел {х,}, удовлетворяющее (2), называется допустимым решением. (4) Допустимое решение, которое максимизирует (или миними- зирует) целевую функцию, называется оптимальным решением. (5) Число Сшах (или Cmin) называют значением оптимального ре- шения задачи линейного программирования (или просто значением). (6) Запись {ху} С' будет обозначать соответствие решения {xj значению целевой функции С'. Большинство из только что введенных понятий употреблялись нами ранее. Пример Переменные: xlt х2 — неотрицательны. Целевая функция: С — хг + х2. Ограничения: хг + Зх2 90; 10хх + 7х2 440. Задача. Максимизировать С. Этот пример взят из одного упражнения на применение графичес- кого метода отыскания решения. Читатель может легко найти, что решением этой задачи будут числа хх = 30 и х2 = 20 и Сшах = 50. Сейчас мы введем понятие двойственности и используем его для исследования вопроса о проверке решения на оптимальность. На основе этого мы сформулируем фундаментальную теорему линейного программирования. б) Двойственность. На основе стандартной задачи максимизации некоторой линейной функции при заданных ограничениях можно по- строить другую стандартную задачу линейного программирования, в которой минимизируется линейная функция, коэффициенты которой получены из ограничений первой задачи. 361
Пример I. Первая задача (см. 3.3.7, а)) лу, х2 — неотрицательны. 1X1 + Зл'2 90; 10хг + 7х2 440. Максимизировать С = lay + 1х2. П. Вторая задача у1г У2 — неотрицательны. 1У1 + Юу2 > 1; ЗУ1+ 7у2>1. Минимизировать D = 90z/r + 440л/2 . Мы советуем читателю проследить, как коэффициенты при хг и х2 в первой системе ограничений перешли в коэффициенты при у± и у2 во второй системе. Как видим, значения, стоящие в правой части ог- раничений одной задачи, являются коэффициентами целевой функции другой задачи. Задачи линейного программирования, связанные таким образом, называются двойственными друг другу. Сейчас мы дадим полное опре- деление двойственных задач. Определение. Следующие стандартные задачи линейного программирования называются двойственными. I. Первая задача II. Вторая задача Ограничения Все xt 0; Все tj] 0; П tn 2 OijXi^dj, j = l, ...tm. 2 i = l,..., n z=i /=i Целевая функция n tn C= 2 Cl Xi- D— 2 djyj. /=i /==i Задача Максимизировать С. Минимизировать D. Упражнение 3.3.9 Для каждой из следующих систем выпишите двойственную задачу. 1. 4хх + х2 < 3; 2xi + Зх2 < 2, Максимизируйте С — хг + х2. 2. 2xi + Зх2 < 6; 3xi + 2х2 < 6. Максимизируйте С = 4xi + 5xg. 3. 14xi + бх2 С 70; 10xi + 8х2 < 80. Максимизируйте С = 5xi + 6х2. 4. 2х2 + xs > 5; Xi + 2х2 > 4; 7хг + Зх3 > 21. Минимизируйте D = [= Х1 + х2 + х8. 5. Xi + Зх2 + х4 < 4; 2xi + х2 < 3; х2 + 4хя + х4 < 3. Максимизируй- те С = 2xi + 4х2 + х3 + х4. в) Критерий оптимальности. Многие из фундаментальных резуль- татов теории линейного программирования могут быть получены изучением взаимосвязи между решениями двойственных задач. Для иллюстрации наиболее важных соотношений между решениями двой- ственных задач мы воспользуемся предыдущим примером. Затем обобщим эти взаимосвязи и докажем общую теорему. 362
Двойственные задачи I. Первая задача 11. Вторая задача Ху + Зх2 90; у у + 10//2 1; 10хг + 7х2 440. Ъуу + Чу2 1. Максимизировать С = Ху + х2. Минимизировать D = 90z/j + 440z/2 Графическим или другим методом читатель может проверить, что оптимальным решением для задачи I будет = 30, х2 = 20, Стах = = 50; для задачи II решением будет ух = s/23, у2 = 2/23, Drriln = = 50. Как видим, оптимальное значение целевой функции в задаче мак- симизации С будет равно оптимальному значению целевой функции в двойственной задаче. Докажем, что если для системы и двойствен- ной системы решение существует, причем соответствующие значения задач равны, то найденные решения будут оптимальными. Прежде чем переходить к основному доказательству, нам потре- буется следующая лемма. Лемма. Рассмотрим системы I и II, записанные при определе- нии двойственных задач (см. 3.3.7, б)). Пусть {xj = {х1э..., хп) будет допустимым решением задачи I и {z/j } = 0/1» > Ут} — допустимым решением задачи II. Предположим, что целевые функции С и D для этих решений при- нимают значения, равные соответственно С и D'. Таким образом, {хг}->С' и {уД-^D’. Тогда I i Доказательство. Поскольку {х,} представляет собой допустимое решение задачи I, то все ограничения этой задачи бу- дут выполнены, т. е. п 2 ai} xt dj, j = 1,... ,т. /=1 Следовательно, 2 У] 2 atJxt^ 2 djyj = D'. i^\ /=1 /=1 Две суммы в левой части последнего неравенства можно записать под общим знаком суммирования: 22 аих1 XJ *^D'. i i Аналогичным образом в соответствии с ограничениями задачи II можно прийти к неравенству > С- i / Теперь мы можем доказать общую теорему, известную как крите- рий оптимальности. Теорема. Если для стандартной задачи максимизации суще- ствует допустимое решение {х;}->С', а для двойственной задачи — допустимое решение {уД -> D' и С = D', то эти решения будут опти- мальными для соответствующих задач. 363
Доказательство. Пусть {%/} будет другим допустимым решением задачи максимизации, причем {xt}-»-C". Как следует из леммы, С" ^D'. Однако известно, что D' = С, поэтому С" С'. Отсюда вытекает, что {хД должно быть оптималь- ным решением задачи максимизации. Соответственно если {//}} будет другим допустимым решением для двойственной задачи и {y'j}-+D'', то по лемме D" > С'. Отсюда D" ~^D' и {t/j} будет оптимальным решением. Упражнение 3.3.10 1. С помощью графического метода найдите оптимальные значения целевых функций для задач 1, 2 и 3 из упражнения 3.3.9 и двойственных им. (Заме- чание. Значения х и у не обязательно целые.) 2. Для проверки того, что (xlf х2, х3, xt) = (1,1, 1/2,0) и (ylt yz, ys) = = (11/10, 9/20, 1/4) есть оптимальные решения задачи 5 из упражнения 3.3.9 и двойственной ей, воспользуйтесь теоремой о необходимом условии оптималь- ности. г) Основная теорема линейного программирования. Возможно обращение приведенной выше теоремы, однако ее доказательство на- много труднее. Этот результат известен как основная теорема двой- ственности; мы сформулируем ее следующим образом. Теорема. Если стандартная задача линейного программиро- вания и двойственная ей имеют допустимые решения, то они имеют и оптимальные решения. Более того, оптимальные значения целевых функций для этих задач совпадают. Если одна из задач не имеет до- пустимого решения, то другая задача не будет иметь оптимального решения. Результат этой теоремы верен для любой задачи линейного про- граммирования. Интересующихся доказательством этой теоремы и дальнейшим изложением общей теории линейного программиро- вания мы отсылаем к книгам [26] и [27].
34 СЕТЕВОЕ ГЛАВА ПЛАНИРОВАНИЕ 3.4.1. ВВЕДЕНИЕ Сложную систему можно представить сетью или графом, при этом узлы графа, возможно, будут соответствовать отдельным блокам, а дуги, соединяющие эти узлы, будут указывать на связи или зависи- мости между блоками. Изучение правильно выбранной сетевой модели очень часто по- могает составить достаточно ясное представление о системе и ее функ- ционировании. Общее изучение систем на основе сетевого анализа приобретает все возрастающее значение. Непрерывно разрабатыва- ются новые математические методы в теории графов. Все большее внимание математиков привлекают модели, основанные на сетях. Этим, в частности, можно объяснить включение в первую часть кни- ги главы, посвященной графам. Здесь будут рассмотрены некоторые методы, достаточно успешно применяемые при осуществлении государственных и деловых прог- рамм. Сетевое планирование при реализации сложных проектов увели- чивает эффективность работ и способствует уменьшению затрат. В книге мы сможем дать лишь краткое введение в теорию, оставаясь па уровне, когда все применяемые методы допускают чисто «математи- ческое» описание. Однако определенное знакомство с этими вопроса- ми необходимо любому работнику в области исследований операций. Дальнейшее изучение сетевых методов приведет заинтересованного читателя к более сложным областям математики. 3.4.2 ПОСТРОЕНИЕ ПЛАНОВ План может быть разбит на множество подпланов, называемых работами. При этом оценивают время завершения каждой из этих работ, может быть также сделана попытка определения последователь- ности, в которой они должны выполняться. Подобные действия, на- правленные на выполнение проекта вовремя и с максимальной эффек- тивностью, называются построением проекта. Сетевые методы, применяемые для этих целей, просты, объектив- 365
ны, высокоэффективны и очень полезны для успешного выполнения соответствующих функций управления. 3.4.3. ИСТОРИЯ СЕТЕВОГО ПЛАНИРОВАНИЯ До середины 50-х годов не наблюдалось серьезных применений те- ории сетей для решения задач планирования, пока группа по иссле- дованию операций при Central Electricity Generating Board (Англия) не предложила метод построения программы работы электростанций. Примерно в то же время американская группа из U. S. Navy Special Projects office разработала аналогичный метод, который нашел свое применение в создании снарядов типа «Поларис». Обе группы отме- тили, что эти методы значительно экономят время при составлении программ. После публикации преимущества сетевого планирования стали известны всему миру. Сетевые методы планирования начали применять в промышленно- сти. Применение их расширялось с невероятной быстротой в области строительства мостов, эксплуатации заводов, организации больниц, проектирования домов, в области космических полетов. Любая про- грамма, большая или малая, от взятия пробы лунного грунта до чист- ки пары ботинок может быть успешно проанализирована с помощью сетевой модели. Новым методам давали различные названия: PERT (Programme Evaluation and Review Technique — составление программ и обзор методов), СРМ (Critical Path Method — метод критического пути), CPA (Critical Path Analysis — анализ критического пути), РЕР, SPERT и т. д. Каждое название описывает одну из систем, вообще говоря, отличающихся друг от друга некоторыми деталями; вместе с тем они имеют и много общего. Далее будут рассмотрены элементар- ные методы анализа критического пути (СРА). Общий метод анализа критического пути может быть разбит на три стадии: стадия планирования, стадия анализа и стадия управ- ления. 3.4.4. СТАДИЯ ПЛАНИРОВАНИЯ а) Определение работы. Первый шаг в построении сложного пла- на (или программы) заключается в разбиении его на подпланы, кото- рые будем называть работами. Следующий шаг состоит в опоеделе- нии того, как эти работы связаны между собой во времени. Таким об- разом, если а, и aj — две различные работы, то необходимо выяснить, выполняются ли ai и а; одновременно или же одна работа должна быть закончена прежде чем начнется другая. Примеры 1. Задание. Вскипятить чайник с водой. Множество работ плана ау — наполнить чайник водой; а2 — поставить чайник, наполненный водой, на плиту, включить газ и ждать, пока он ни закипит. 366
Ясно, что работа ах должна быть закончена прежде чем начнется работа п2. 2. Задание. Приготовить чашку растворимого кофе с молоком. Множество работ плана а± — вскипятить воду (как в задании 1); п2 — вскипятить молоко (эта процедура аналогична nJ; а3 — положить в чашку ложечку растворимого кофе; п4 — добавить одновременно соответствующее количество молока и воды. В этом плане последовательность работ во времени не так очевид- на, как в первом случае. Если мы предположим, что существуют две газовые конфорки, то работы «вскипятить молоко» и «вскипятить во- ду» можно выполнять одновременно. Если же в наличии имеется толь- ко одна конфорка, то эти работы необходимо выполнять последо- вательно. Работу а3 можно выполнять только после того, как и моло- ко и вода вскипят; очевидно также, что работа а4 не может быть на- чата до тех пор, пока все работы аг, а2 и а3 не будут окончены. Замечания (1) В общем случае разбиение плана на множество работ не един- ственно. Например, работы «вскипятить воду» или «вскипятить мо- локо» могут быть разбиты при желании на более мелкие работы. Вы- бор множества работ для некоторого плана зависит от необходимого уровня анализа. Очень часто первое подразделение бывает грубым, при этом ориентируются на основные действия процесса. Дальнейшее разбиение направлено на выявление зависимостей внутри групп ра- бот, соответствующих более низкому уровню деятельности. (2) Работа может соответствовать заданию, выполнение которого сопряжено с определенными усилиями; наоборот, работа может быть бездеятельной, например ожиданием чего-то, что должно произойти (для рассмотренного примера это будет ожидание кипения воды). (3) Иногда в множество работ полезно включить фиктивную рабо- ту. Это работы, которые не занимают времени и для которых не ис- пользуются никакие ресурсы (см. пример 3.4.4, в)). (4) Имеется несколько специальных случаев, зависимостей меж- ду работами, которые должны быть рассмотрены при построении се- тевых моделей (например, параллельное выполнение работ, зависи- мость одной работы от нескольких предшествующих работ и т. п.). Под- робное обсуждение этих вопросов читатель найдет в книгах [28] и [29]. 6) События. Слово событие в сетевом планировании используется специальным образом. Оно означает точку во времени, которая отде- ляет различные стадии осуществления плана. Пример В плане «вскипятить чайник воды» мы можем выделить три точки времени, которые называются событиями: 1) время начала выполнения задания; 2) время, когда мы ставим чайник на газ после завершения рабо- ты «наполнить чайник», 367
3) время начала кипения, характеризующее конец выполнения задания. в) Графическое изображение событий и работ. Работы будем изоб- ражать стрелками (т. е. направленными дугами) графа. Описания работ при желании могут записываться вдоль стрелок. События долж- ны быть занумерованы. Как правило, вершины графа обозначаются некоторыми геометрическими фигурами (например, кружочками). Внутри этих фигур проставляется соответствующий номер. Описание события может быть тоже записано внутри кружочка. Рис. 137 Сеть Наполнить чайник водой Поставить чайник на огонь и начать кипятить Рис. 138 План — вскипятить чайник воды Рис. 139. План — приготовить чашку кофе Работа должна быть выполнена в течение времени между двумя событиями, обозначенными своими номерами в концах соответствую- щей стрелки. Событие, соответствующее началу стрелки, называется начальным (или предшествующим') событием-, конец стрелки называют конечным (или последующим) событием. Любая работа может быть оп- ределена своими числами, которые соответствуют начальным и конеч- ным событиям. На рис. 137—139 иллюстрируются графические изображения сетей. Замечания (1) Фиктивные работы (время выполнения равно нулю) необходи мы для изображения параллельных работ. Три параллельные работы — «вскипятить воду», «вскипятить молоко», «положить в чашку кофе» —имеют одни и те же начальные и конечные события; для боль- шей ясности события 2 и 3 (которые соответствуют событию 4) пока- 368
замы на графике. Фиктивные работы 2—4 и 3—4 обозначены пунк- тиром. (2) Длина стрелок и расположение дуг не имеют значения. (3) Желательно придерживаться следующих правил: (а) время изменяется слева направо; (б) конечным событиям всегда присваиваются большие номера, чём соответствующим начальным событиям. (Числа не обязательно должны подчиняться естественному порядку 1, 2, 3, ... На практике часто используются числа с промежутками между ними, например' в сетевой модели «Приготовить чашку кофе» этими числами могли быть 1, 5, 6, 7, 10.) Рис. 140 г) Основная работа и отношения между событиями. При состав- лении сети необходимо принимать во внимание следующее: (1) событие нельзя считать наступившим (или достигнутым), ес- ли все работы, ведущие к этому событию, не окончены; (2) работа не может быть начата до тех пор, пока начальное собы- тие не наступило. Например, в сети на рис. 140 мы находим, что событие 8 не может быть достигнуто, пока не будут достигнуты события 4 и 5 и обе работы 4—8 и 5—8 не будут окончены. Далее, как видим, работа 8—9 не мо- жет быть начата, пока событие 8 не будет достигнуто. д) Продолжительность работы. После того как конечное множе- ство работ задано и сеть проекта нарисована, необходимо оценить продолжительность выполнения каждой работы, которая должна быть подписана под соответствующей стрелкой. Продолжительность работы есть время ее выполнения. Заметим,. что это не то же самое, что время между начальным и конечным собы- тием. Например, начальное и конечное события некоторой работы мо- гут происходить в 3-й и 7-й день соответственно, тогда как продол- жительностью работы может быть только один день; в таком случае' мы говорим, что работа имеет резерв в три дня. Вопросы резерва ра- бот будут рассмотрены далее. Пример Задание. Покрасить дверь (один маляр и один помощник). Список работ (в скобках указана их продолжительность в мину- тах): аг — счистить старую краску (75); 369
а2 — прошкурить дверь (Зб); оа—открыть банку и размешать краску (4); д4 — приготовить кисти (5); а5 — вытереть дверь (4), сделать до ав; а6 — покрасить дверь (15); а7 — вычистить кисти и собрать инструменты (6). Сетевая модель этого проекта изображена на рис. 141. Упражнение 3.4.1 Для каждого из следующих планов нарисуйте свою сеть. Множество ра- бот (не обязательно в правильном порядке) задано, в скобках указана их про- должительность. 1. Почистить пару ботинок. Счистить грязь с ботинка А (2 мин); счистить грязь с ботинка В (1,5); нанести крем на ботинок В (1); растереть крем на бо- тинке А (1); растереть крем на ботинке В (1); натереть А (1/2); натереть В (1/2). 2. Отослать письмо. Продиктовать письмо секретарю (5 мин); секретарь печатает письмо на машинке (10); конверт вручается клерку (3); клерк наклеи- вает на конверт марку (1); письмо отправляется на почту (4); клерк кладет письмо в конверт и отсылает (1). 3. Сделать деревянный ящик (один человек). (а) Разместить доски в соответствии с размерами ящика (15 мин); разре- зать доски (12); склеить части ящика (40); прибить к крышке ящика петли (8); подождать, пока ящик высохнет, и вытереть его (15); петли (с крышкой) прибить к ящику (10). (б) Работу «склеить части ящика» можно разбить на более мелкие. Составь- те список работ и нарисуйте сетевой график; определите продолжительность работ. 4. Заменить колесо машины (работу выполняют два человека). Достать из багажника домкрат и инструменты (40 сек); снять диск колеса (30); освободить колесо (50); поставить домкрат под машину (26); поднять машину (20); из ба- гажника взять запасное колесо (25); снять гайки и колесо (20); установить за- пасное колесо на ось (10); завинтить (не сильно) гайки на оси (15); опустить ма- шину и собрать домкрат (25); поставить домкрат обратно в багажник (10); за- винтить гайки на оси до конца (12); положить плохое колесо и инструменты в багажник (40); поставить на место диск колеса (10). 3.4.5. СТАДИЯ АНАЛИЗА Разбиение проекта на множество работ и определение связей меж- ду работами во времени — задача весьма трудоемкая. Ее решение помогает выявлению промежуточных целей и направления действий, которым должен следовать руководитель. Это дает возможность решить, какие работы должны быть выполнены для осуществления различных подпроектов, позволяет правильно распределить все работы. После 370
построения сетевой модели ход действий становится ясным и можно приступить к выполнению проекта; другими словами, сетевое плани- рование предусматривает выработку некоторой стратегии действий. При решении задачи планирования может быть извлечена допол- нительная информация из сетевой модели самого плана. Это приводит нас к стадии анализа, в котором такие понятия, как критический путь и резерв времени работы, играют ключевую роль. а) Критический путь. Первый шаг в анализе графа работ заклю- чается в нахождении критического пути (или путей) сети. Для опре- деления этого понятия мы рассмотрим простейшую сеть, изображен- ную на рис. 142. Замечания. В наших примерах мы не будем обсуждать ре- ального смысла работ, как это делалось в упражнении 3.4.1. Как пра- вило, вся символика будет той же, что на рис. 142. Символом v (вершина) обозначаются собы- тия; пара (vit Vj) определяет рабо- ту ац', число, стоящее около каж- дой стрелки, означает время выполнения соответствующей ра- 6°™- Рис. 142 Если читатель хочет познако- миться с «реальными» ситуациями (например, если бы он захотел применить методы сетевого планиро- вания в промышленности), мы отсылаем его к книге К. Г. Локкера, которая содержит большое число задач с решениями (К. G. Lockyer, С. Р. A. Problems and Solutions, Pitman, 1966). В сети на рис. 142 означает начало проекта, a v7 — его оконча- ние. Заметим, что от вершины v7 к вершине v7 можно пройти по сети четырьмя различными путями; для каждого пути мы можем опре- делить его временную продолжительность — длину пути, т. е. сумму продолжительностей последовательных работ, образующих путь. Пути и их продолжительности будут следующими. Путь Продолжительность Vj — — v5 — щ 4 + 1 + 4 = 9 vi — ^2 — Ve — 4 + 1 + 3 = 8 Uj — v3 — ve — v7 3 + 2 + 3 = 8 t’l — v4 — — V7 2 + 5 + 3=10 Определения (1) Максимальное значение в множестве продолжительностей всех путей (оно может достигаться на нескольких путях) называется пол- ным временем осуществления проекта. Это значение определяет наи- кратчайшее время, за которое может быть выполнен весь проект. (2) Любой путь, длина которого равна полному времени осуществ- ления'проекта, называется критическим путем. В приведенном примере максимальная продолжительность пути равна 10. Невозможно закончить все работы сети до истечения 10 еди- 371
ниц времени, если отсчет начинается со времени свершения события vx. Отсюда следует, что полным временем осуществления проекта бу- дет 10, а критическим путем щ — vi — ve — v7. Чтобы уменьшить полное время осуществления проекта, необходи- мо сократить продолжительность работ, лежащих на критическом пути. Уменьшение продолжительности работы, не принадлежащей критическому пути, не отразится на изменении полного времени осу- ществления проекта. Упражнение 3.4.2 Для всех сетей, изображенных на рис. 143, выпишите все возможные пути и вычислите их продолжительности. Определите для каждой сети полное время осуществления проекта и укажите критические пути. б) Метод определения критического пути. Нахождение критичес- кого пути может быть выполнено с помощью методов, требующих ин- формации, которая исполь- зуется на последующих стадиях анализа. Эти ме- тоды легко применимы при счете вручную, и могут быть запрограммированы на ЭВМ. На практике для большой сетевой модели, тем более, если анализ должен повторяться через определенные интервалы времени, применение ЭВМ значительно упрощает за- дачу. Процедура отыскания критического пути состоит в следующем. Прежде все- го, составляется список всех событий в той после- довательности, в которой они должны выполняться, т. е. по сети слева напра- Рис. 143 Рис. 144 372
во. Затем для каждого события вычисляются так называемые ранний срок (Е) и поздний срок (L) свершения события. Если отыскание кри- тического пути выполняется вручную, то эти значения можно запи- сать сразу на графике. Тогда любой путь, такой что для всех собы- тий, входящих в него, Е= L, будет одним из возможных критических путей (см. и. 3 этого подпараграфа). Для иллюстрации описанной процедуры рассмотрим следующую простейшую сетевую модель, представленную на рис. 144 (критичес- кий путь обозначен жирной линией). Все объяснения ланы на графике и в таблице. Событие (г) Ранний срок Е (г) Поздний срок L (v) V1 0 0 3 = (0 + 3) 3 = (7 —4)* и3 4 (0 + 4) 5 (7-2) vt 5= (3 + 2) 6- (7-1) vb 7 = (3+4)* 7 Значения, помеченные звездочкой, требуют специальных поясне- ний (см. далее (5) и (8)). 1) Нахождение раннего срока свершения события Е (ц). (1) Предположим (произвольно), что событие щ происходит в мо- мент времени, равный нулю. (2) Для нахождения Е (о2) прибавим к раннему сроку свершения события Е (щ) продолжительность работы а12. Получим Е (о2) = Е (i'i) + (продолжительность <з13) = 0 + 3 = 3. Это говорит нам о том, что событие и2 не может наступить раньше, чем пройдет три единицы времени с момента начала проекта. (3) Аналогично Е (vs) — Е (щ) + (продолжительность й13) = 0 + 4 = 4 и Е (+) = Е (f2) + (продолжительность ам) = 3 + 2 = 5. (4) Для каждого из рассмотренных событий характерно, что к не- му ведет только одна стрелка (работа). В таком случае Е (vj) = Е (Vi) + (продолжительность агД где atj — единственная работа, ведущая в Vj. (5) Если к событию v} ведут более одной стрелки, то ранний срок свершения события Е (гу) вычисляется так, как показано далее. В модели нашего примера три стрелки-работы из v2, vs, v4 ведут в Os? Поэтому необходимо рассчитать три момента времени и выбрать из них наиболее поздний. Таким образом. Е (ц2) + (продолжительность a2S) =3 + 4 = 7*; Е (<+) + (продолжительность а35) = 4 + 2 = 6; 373
E (d4) + (продолжительность д45) = 5+1=6. Первое значение наибольшее, оно и будет равно Е (v5). Итак, Е (п5) = 7; событие v5 не может наступить раньше чем с начала проекта пройдет 7 единиц времени. Отсюда следует, что полным вре- менем осуществления проекта будет 7 единиц. Если следовать сете- вой модели, проект не может быть выполнен раньше чем через 7 еди- ниц времени. 2) Нахождение позднего срока свершения событии L (и). (6) Возможный наиболее поздний срок выполнения всего проек- на стрелка, которая ведет к v ния этого события будет равно та по определению равен полному сроку выполнения проекта, т. е. I- (^оконч) Е (^оконч)" (7) Произведем теперь процеду- ру вычисления раннего срока свер- шения события в обратном поряд- ке, для этого будем двигаться по сети справа налево. Таким обра- зом, если из выходит только од- j, то время позднего срока сверше- L (vt) = L (vj) — (продолжительность ai}). Для сети нашего примера L (п4) = L (v5) — (продолжительность ai5) = 7 —1 = 6 и L (п3) = L (п5) — (продолжительность й35) = 7—2 = 5. Последнее значение говорит нам о том, что, если мы хотим закон- чить проект максимум за 7 единиц времени, событие v3 должно про- изойти не позже чем через 5 единиц времени с начала осуществления проекта. (8) Если из события ведут более одной стрелки, например, как для п2,<то необходимо вычислить все множество значений «позднего» вре- мени и выбрать из него наименьшее. Таким образом, L (п4) — (продолжительность «24) = 6-—2 = 4, и L (п5) — (продолжительность а25) = 7—4 = 3*. Значение, помеченное звездочкой, будет наименьшим, т. е. L (и2) = 3. 3) Нахождение критического пути {путей). Любой путь от исход- ного события до завершающего, такой, что (1) Е (и) = L {v), для всех входящих в него событий v, будет критическим путем, причем (2) время продолжительности каждой работы равно разности между вре- менем конечного и начального события. (Оба критерия (1) и (2) долж- ны быть проверены для каждого события и работы.) 374
Упражнение 3.4.3 1. Перерисуйте сеть, приведенную на рис. 145,и для каждой вершины най- дите ранний и поздний сроки свершения события. Исходя из этого, определите полное время для всего проекта и критический путь этой сети. 2. Для каждой из восьми сетей упражнений 3.4.1 и 3.4.2 определите зна- чения Е и L. Запишите полное время проекта и найдите критические пути. в) Резерв времени работы. Если та или иная работа не принад- лежит критическому пути, то мы имеем возможность увеличить вре- мя ее продолжительности без увеличения полного времени осуществ- ления проекта. Эту возможность иногда полезно использовать. В та- ком случае, например, можно было бы людские ресурсы переключить на выполнение других работ, увеличив таким способом общую эффек- тивность. Однако увеличение продолжительности любой работы, не Рис. 146 входящей в критический путь, имеет определенный максимум. Слиш- ком большое увеличение приведет к возникновению нового критичес- кого пути'и увеличению полного времени осуществления проекта. > Чтобы правильно спланировать использование ресурсов, т. е. рас- пределить их по различным работам наиболее эффективным образом, необходимо найти некоторые величины, так называемые резервы вре- мени. Имеется три вида резервов, соответствующие работам; они на- зываются соответственно общими, свободными и независимыми. Каж- дый из этих видов мы проиллюстрируем на блоке некоторой сетевой модели (рис. 146). Предположим, что единица времени равна одному дню. 1) Полные резервы. Для работы имеем: поздний срок свершения события ve = 15-й день; ранний срок свершения события = 4-й день; максимум существующего времени = 11 дней; продолжительность работы — 5 дней, полный резерв = 6 дней. Это означает, что если v4 наступит как можно раньше и если ve наступит как можно позже, то работа а4в может быть выполнена в любое время в промежутке 11 дней, т. е. имеется 6 резервных дней. Это хорошо иллюстрируется на графике с временной осью (рис. 147). Замечание. Отрезок АВ может быть расположен в любом месте, лишь бы он лежал в заданном интервале длиной 11. 375
Полный резерв работы может быть использован на стадии плани- рования или на стадии выполнения проекта. Использование резерва одной работы может изменить (уменьшить) резервы последующей или предыдущей работы. Для исследования этой возможности необхо- димо найти значения двух других видов резервов. Резервное время — Продолжатель ность выполне- 15 Время /дни) Резервное время ния работы Рис. 147 Упражнение 3.4.4 Покажите, что полный резерв работы пв8 равен 7 дням. 0 4 13 Время /дни) свободный’у' / '— Свободный резерв /- продолжатель- резерв ность выполне- ния рабств/ Рис. 148 2) Свободные резервы. Для работы а№ имеем: ранний срок свершения события ив = 13-й день; ранний срок свершения события v4 = 4-й день; разность = 9 дней; продолжительность работы = 5 дней; свободный резерв = 4 дня. Это означает, что начало работы а4в можно отодвинуть от самого раннего срока не больше чем на 4 дня, не влияя на наступление ран- него срока свершения события ve. Поступая таким образом, мы умень- шаем полный резерв времени работы авв. Как видим, свободный резерв времени работы является той частью ее полного резерва, которая мо- жет быть использована без изменения резерва последующих работ. Использование свободного резерва времени на стадии планирования уменьшает резервы времени предшествующих работ. График с временной осью изображен на рис. 148. 876
Упражнение 3.4.5 Покажите, что свободный резерв времени работы аев равен 5 дням. 3) Независимые резервы. Иногда продолжительность времени ра- боты может быть увеличена на некоторую величину без изменения ре- зервов времени как последующих, так и предшествующих работ. Это возможное увеличение времени работы и называется независимым ре- зервом времени работы. На примере работы а4е эта величина вычисляется следующим обра- зом: ранний срок свершения события ve — 13-й день; поздний срок свершения события v4 = 7-й день; разность = 6 дней; продолжительность работы = 5 дней; независимый резерв = I день. Таким образом, продолжительность работы а4е может быть увеличе” на до 5 + 1 = 6 дней без изменения резерва времени любых других работ проекта. В некоторых случаях эту возможность целесообразно использовать. Создатель проекта должен найти независимые резервы всех работ с тем, чтобы при необходимости использовать их. Он мо- жет перебросить ресурсы (например, рабочих или материалы) на кри- тические работы или работы, близкие к ним, и таким образом умень- шить полное время осуществления проекта. Замечание. В некоторых случаях при вычислении независи- мых резервов могут получиться отрицательные числа: полагаем тог- да их равными нулю. Рис. 149 Упражнение 3.4.6 1. Покажите, что независимый резерв времени работы св8 равен 3 дням. 2. Составьте список работ. Вычислите полные, свободные и независимые резервы времени для каждой из сетей на рис. 149. 377
4) График на временной оси трех видов резервов. На примере ра- боты aie покажем, как все три вида резервов можно изобразить на графике с временной осью (рис. 150). Замечание. Теоретически резервы могут располагаться в любой части интервала: в начале, в конце или в середине работы. Упражнение 3.4.7 1. Обозначим через d/y продолжительность работы ау; покажите тогда, что для работы ац верны следующие соотношения: (1) полный резерв времени = [L (ьу) — Е (t/)J — dip. ______L— --1--1— О Полный резерв Свободный резерв Независимый резерв Е^ Z-4 Еб Le | , I , , I I . I > 4 7 13 15 Время /дни) Полный резерв ^уработа^/у/, Свободный резерв -k. Независимый резерв Рис. 150 (2) свободный резерв времени =[£ (оу) — Е (о/)] — вц; (3) независимый резерв времени = [£ (ну)— L (г,)] — dij. 2. Покажите, что все работы критического пути имеют нулевой резерв. г) Ранний и поздний сроки выполнения работ. Для каждой.рабо- ты, как правило, вычисляют четыре величины времени. Способ вычис- ления этих величин мы покажем на примере работы ам. (1) Ранний срок начала работы. Ея. Работа а№ не может начать- ся раньше наступления события о4. Поэтому наиболее раннее время начала работы будет равно Es = Е (о4) = 4 дня, начиная с нуля. В общем случае Ея совпадает с Е (и;), т. е. Es = Е (vj. (2) Ранний срок окончания работы Es. Очевидно, что наиболее раннее время окончания работы ai} равно сумме продолжительности времени работы и раннего срока начала работы. Таким образом, Ef = Es dij. 378
(3) Поздний срок окончания работы Lf. Если мы не хотим изме- нить полное время выполнения проекта, то должны стремиться окон- чить работу aij не позднее последнего срока для события Vj. Поэтому Lf = L (Vf). (4) Поздний срок начала работы Ls. Поскольку продолжитель- ность работы равна d!}, мы должны начинать работу ai} не позднее чем в момент времени Lf — для того чтобы успеть окончить ее к моменту Lf. Отсюда Ls — Lf — dy. Пример. Для примера с работой aie последовательно находим: Es = Е =4; Ef = Ея + d4e = 4 + 5 = 9; Lf = L (v6) = 15; Ls = Lf — d№ = 15 — 5 = 10. Упражнение 3.4.8 1. Покажите, что следующие соотношения между временем работ и резер- вов верны: (1) полный резерв — Lf — Ef = Ls — Es; (2) свободный резерв = Е (оу) — Ef, (3) независимый резерв = [Е (vj) — L (г?/)] — [Ef — Es]. 2. По соотношениям из задания 1 вычислите резервы рабств задании 2 уп- ражнения 3.4.6. д) Табличная запись результатов. Для любой сети все работы мож- но записать в виде списка с указанием четырех значений времени для работ и их резервов. Один из возможных вариантов такой записи при- веден в следующем примере: Работа Продол- житель- ность Время начала Время окончания Резервы Ч Ч ч Ч полный сво- бодный незави- симый Vl — V2 4 0 0 4 4 0 0 0* V1—Оз 2 0 7 2 9 7 0 0 V2 — О4 3 4 13 7 16 9 0 0 02 — 0# 8 4 4 12 12 0 0 = 0* Оз —0# 3 2 9 5 12 7 7 0 о4—о0 2 7 16 9 18 9 9 0 0#—0, 6 12 12 18 18 0 0 0* 379
Полное время осуществления проекта равно 18, критический путь будет щ — v2 — vs — ve. Звездочкой в последней колонке помечены величины, которые соответствуют работе, принадлежащей критичес- кому пути. Упражнение 3.4.9 1. В только что приведенном примере работа o2a не принадлежит крити- ческому пути. (1) Предположим, что d24 было увеличено до 6 единиц времени. Какой эффект окажет это изменение на резерв работ я12 и с4в? (2) До какой величины может быть увеличено d2i, прежде чем я24 станет критической работой (т. е. прежде чем некоторый путь, содержащий о24, не станет критическим)? (3) Положим d24 равным значению, которое делает эту работу критической. Пересчитайте время Е и L и резервы работ. 2. Проанализируйте каждую из восьми сетей упражнений 3.4.1 и 3.4.2 и со- ставьте таблицы, которые давали бы всю информацию (см. приведенный при- мер). е) Составление проектов. После того как сеть проекта построена, найден критический путь и определены все резервы времени, адми- нистрация должна решить, является ли план, изображаемый сетью, допустимым. Если проект оказывается удовлетворительным, то необ- ходимо закончить его составление, указав количество необходимых материалов и специального оборудования, а также организовать пе- ревозку людей к месту строительства и т. д. Кроме того, должны быть определены плановые сроки завершения работ. Если вышестоящая организация обнаруживает, что предложен- ный план не удовлетворяет имеющимся ограничениям, то необходи- мо выполнить дальнейший анализ сетевой модели, который помог бы его улучшить. Внимание составителя проекта, прежде всего, должно быть на- правлено на критические работы или работы, близкие к критическим, с тем чтобы уменьшить их продолжительность. Затем можно принять- ся за исследование других работ. Далее плановик должен ответить на следующие вопросы: какова цель работы, каковы сроки выполне- ния работы (нельзя ли ее выполнить раньше или позже), можно ли работу выполнить лучше, в более короткий срок, применяя другие методы, привлекая других людей. Вообще говоря, первоначальная сеть дает только базовый план; этот план необходимо систематически изучать с целью построения нового плана, где лучше используются имеющиеся трудовые ресурсы, машины и материалы; при этом к минимуму сводились бы продолжи- тельность работ и величина издержек. Изменение плана прекратится тогда, когда администрация решит, что все работы укладываются в необходимые сроки, а заключенные контракты с большой вероят- ностью будут выполнены; ориентиром при пересмотрах, как прави- ло, является увеличение прибыли. Окончательный вариант плана на- носится на график; получившаяся сеть и построенный план представ- ляют собой стратегию, которой фирма должна придерживаться. После того как проект построен, начинается стадия управления. 380
3.4.6. СТАДИЯ УПРАВЛЕНИЙ Целью этой книги не является детальное обсуждение методов уп- равления. Достаточно сказать, что после начала осуществления проек- та возникает множество непредвиденных трудностей, таких, как нех- ватка рабочей силы, отсутствие предложения и субподрядчиков, вме- шательство местных властей и т. д. Отсюда следует, что первоначаль- ный план должен периодически пересматриваться в свете текущего развития проекта. Методы сетевого планирования позволяют выпол- нять эту задачу легко и эффективно. В конце каждой недели или ме- сяца с помощью ЭВМ можно сравнить плановые сроки завершения работ с действительными; такое сравнение дает возможность пере- оценить всю ситуацию. Это означает, что некоторые сроки в сети мо- гут быть изменены, а стратегия действий переформулирована. Для дальнейшего чтения по сетевому планированию читатель мо- жет обратиться к работам [28] и [29]. Многие интересные усовершенствования простейших сетевых мо- делей могут быть описаны математически и изучены. Скорее всего, наиболее очевидным развитием модели будет допущение о случайном характере продолжительности работ. Вместо того, чтобы для каждой работы рассматривать определенную численную оценку ее продолжи- тельности, можно для этой величины задавать свое распределение вероятностей. Теоретическая разработка подобных моделей и мно- гих других изложена в обширной литературе.
~ R УПРАВЛЕНИЕ 0.0 глава ЗАПАСАМИ Фирмы делают самые различные запасы. Они хранят сырье, заго- товки, части машин, предназначенные для сборки, материалы для те- кущего расходования в цехах заводов и в различных учреждениях, готовую продукцию, предназначенную для продажи. Совокупность подобных предметов, представляющих собой временно не используе- мые экономические ресурсы, называют запасами некоторой фирмы. Запасы могут создаваться в силу различных причин. Нельзя быть уверенным в том, что товары поступят на склад именно в тот момент времени, когда они понадобятся. Если на некоторой стадии процесса производства потребуется какой-то вид деталей и этих деталей не ока- жется в запасе, т. е. образуется дефицит, то процесс производства может задержаться или вообще остановиться. Очевидно, что таких ситуаций необходимо по возможности избегать; на складе всегда должно быть нужное количество данного вида деталей. Однако если запасы увеличить, то соответственно возрастет и плата за их хране- ние. Задача управления запасами состоит в том, чтобы выбрать ком- промиссное решение среди двух других решений. Часто большая часть доходов компании тратится на содержание запасов; не управляя процессом их образования, можно прийти к то- му, что производство товаров сократится, возникнут трудности в сбы- те, в отдельных случаях это может стать даже причиной банкротства фирмы. Таким образом, у администрации имеются достаточные сти- мулы для выработки специальной стратегии управления запасами. 3.5.1. ОСНОВНЫЕ ТИПЫ ПРИНИМАЕМЫХ РЕШЕНИЙ Независимо от того, какого рода систему управления запасами имеет фирма, основные решения, которые может принимать управлякь щий орган, состоят в следующем: (1) какое количество товара должно находиться в запасе; (2) в какое время производить пополнение запаса. В обширной литературе по исследованию операций приводятся различные попытки описания принятия подобных решений для раз- личных систем управления запасами. Возможно, что эти исследова- 382
ния составляют одну из самых плодотворных областей в теории ис- следования операций. В этой главе мы не охватим всех вопросов, связанных с управ- лением запасами, а познакомим читателя лишь с элементарными по- нятиями, используемыми при описании различных систем. Будут рас- смотрены три простейшие математические модели. 3.5.2. ГРАФИК ИЗМЕНЕНИЯ ЗАПАСОВ Основным предметом нашего изучения является связь между ко- личеством Q запаса, имеющегося на складе, и временем t, для кото- рого рассматривается этот запас. Таким образом, мы исследуем функ- цию Q = f (/), соответствующую величине запаса в момент времени /. График этой функции называется графиком изменения запаса. Рис. 152. Пример графика изменения запасов Под Q мы всегда будем понимать товары только одного вида; при необходимости мы будем рассматривать непрерывное расходование запасов и непрерывное их поступление. Сделаем несколько элемен- тарных замечаний по поводу функции изменения запасов. (1) Если на товар поступает заявка, то он отпускается и значение Q падает. В моделях, которые будут далее обсуждаться, мы будем предполагать, что величина спроса непрерывна во времени. (2) Если Q = 0, то имеет место дефицит. (3) Если товары поступают на склад (т. е. запасы пополняются), то значение Q увеличивается. Сначала мы предположим, что попол- нение запасов происходит мгновенно; затем улучшим модель, допус- тив, что пополнение происходит непрерывно в течение некоторого ин- тервала времени. На рис. 152 показан пример графика изменения за- пасов. Упражнение 3.5.1 1. Начальный запас некоторого вида заготовок равен 750. Производствен- ной линии требуется 150 заготовок в день, которые поставляются со склада не- прерывно и равномерно. Как только на складе возникает дефицит, со склада другого завода ночью поступает новый запас в количестве 750 заготовок. зез
Нарисуйте график изменения запаса в течение 15 дней. Замечание. Этот процесс будет циклическим. График между двумя соседними дефицитами называется циклом изменения запаса. 2. В течение 10 дней наблюдалась следующая картина изменения запасов: (1) Первоначальный запас равен нулю; в следующие двое суток товары по- ступали на склад непрерывно и равномерно по 500 шт. в день; расходования за- пасов не происходило. (2) В следующие четыре дня спрос на имеющиеся в запасе товары был не- прерывным и равномерным, он равнялся 250 шт. (в день); пополнения запасов не происходило. (3) В следующие четыре дня потребность в товарах изменилась до 200 шт. в день; с целью удовлетворения спроса и пополнения запасов ежедневно на склад доставлялось 300 шт. товаров (поставки на склад н со склада происхо- дили равномерно и непрерывно). (а) Нарисуйте график изменения запасов для 10-дневного периода. (б) Определите величину запасов на складе к концу периода. (в) Вычислите средний уровень запасов для всего периода (т. е. найдите от- ношение общей площади под графиком к общему времени, в течение которого рассматривается процесс). 3. Рассмотрим следующую систему хранения запасов. В начале производственного периода на пустой склад доставляется партия некоторого вида деталей в количестве 1000 шт. Производственная линия равно- мерно в течение 5 дней расходует ежедневно по 200 деталей. (а) Нарисуйте график изменения запасов в течение 5-дневного цикла. (б) Вычислите средний уровень запасов. 4. Предположим, что в задании 3 этого упражнения нас интересуют из- держки, связанные с запасами. Допустим также, что: (1) затраты на возобновление цикла составляют в общей сумме 100 фунтов стерлингов. Эти затраты называют издержками на организацию запасов (издерж- ки на подготовительно-заключительные операции, оформление и доставку зака- зов); (2) издержки на содержание и хранение запасов (затраты на содержание помещения, амортизация запасов и т. д.) составляют 5 пенни в день на единицу товара. Найдите полные издержки за 5-дневный период по формуле (затраты на \ /общие издержки \ организацию I + I содержания ) . запасов / \ запасов / 3.5.3. ЗАТРАТЫ, СВЯЗАННЫЕ С ЗАПАСАМИ В упражнении 3.5.1 читатель мог познакомиться с основными’мо- ментами построения простейших графиков изменения запасов. В этом же упражнении (в задании 4) он встретился с вопросами вычисления издержек, связанных с запасами. Далее мы рассмотрим ситуации, в которых издержки, связанные с запасами, могут быть объяснены независимо друг от друга. (1) Организационные издержки — расходы, связанные с оформле- нием и доставкой товаров, необходимых для каждого цикла склади- рования. Эти затраты связаны с подготовительно-заключительными операциями при поступлении товаров и подаче заявок. Если запасы необходимо пополнить, то на склад завозится очередная партия; издержки, связанные с поставкой, называются организационными. Ко- личество товара, поставляемое на склад, называется размером ‘партии. (2) Издержки содержания запасов — затраты, связанные с хране- нием. Эти расходы возникают из-за таких факторов,^как рента скла- 384
дарования и амортизация в процессе хранения (товары могут пор- титься, устаревать, их количество может уменьшаться и т. п.). (3) Издержки, связанные с дефицитом (штрафы), — если поста- вка со склада не может быть выполнена (это допускается в моделях с дефицитом товара), то возникают дополнительные издержки, свя- занные с отказом. Это может быть реальный денежный штраф, упла- чиваемый лицу, делающему заявки на товар, или же ущерб, не осязае- мый непосредственно (например, ухудшение бизнеса в будущем и по- тери потребителей). Любая математическая модель, которая применяется для изуче- ния данной ситуации в управлении запасами, должна учитывать все факторы рассмотренных издержек. Как и в большинстве работ по ис- следованию операций, цель построения этих моделей заключается в том, чтобы найти такую политику управления запасами, при кото- рой суммарные издержки, связанные с запасами, стали бы минималь- ными. Рассмотрим простейшую модель, представляющую собой первую попытку удовлетворить выдвинутым требованиям. 3.5.4. ОСНОВНАЯ МОДЕЛЬ УПРАВЛЕНИЯ ЗАПАСАМИ — ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОГО РАЗМЕРА ПАРТИИ Рассматриваемые в модели величины, их обозначения, принятые относительно этих величин предположения, сведены в следующую таб- лицу: Величина ’ Обозначе- ние Единица измерения Пре дполо жени я Интенсивность спроса d Единицы товара в год Спрос постоянен и непреры- вен; весь спрос удовлетворяет- ся О рганизационные издержки S Фунты стерлингов за одну партию Организационные издержки постоянны, не зависят от раз- мера партии Стоимость товара . с Фунты стерлингов за единицу товара Цена единицы товара постоян- на; рассматривается только один вид товара Издержки содер- жания запасов h Фунты стерлингов за единицу това- ра в год Стоимость хранения единицы товара в течение года постоян- на Размер партии q Единицы товара в одной партии Постоянная величина; поступ- ление происходит мгновенно, как только уровень запаса становится равным нулю 13 Зак. 973 385
Задача управления: определить значение q, при котором миними- зируются годовые затраты. а) График изменения запасов. Если задача управления запасами удовлетворяет всем приведенным предположениям, то график изме- нения запасов будет выглядеть так, как на рис. 153. Замечания (1) Чтобы полностью удовлетворить годовой спрос d при размере поставки, равном q, необходимо сделать djq поставок за год. (2) Средний уровень запасов равен q площадь под графиком за цикл 2 продолжительность цикла (3) Термин партия мы обычно будем употреблять как синоним слова поставка. б) Уравнение издержек. Уравнение издержек, связанных с за- пасами, сделанными в течение года (в фунтах стерлингов), может быть записано следующим образом: (общие оргаии- \ / \ / \ зационные из- | Ч ( стоимость товаров | + ( бщие издержки j держки / \ / ^содержания запасов^ = Сг + С2 + С3 = = s4 + cd + Ч z За исключением q все величины в правой части уравнения по- стоянны и известны. Поэтому мы можем считать q переменной и определить ее оптимальное значение. ш в) Оптимальное значение q. Чтобы найти значение q, обраща- ющее С в минимум, положим dC/dq равным нулю. Получим: ££ + о + —=о. dq q^ 2 386
Решая последнее уравнение относительно q, найдем: (2) Величина q* называется оптимальным размером партии. Уравне- ние (2) иногда называют формулой оптимального заказа; впервые она была получена в 1915 г. Ф. Харрисом (F. Harris). Эта формула станет более понятной, если изобразить графически изменение отдельных составляющих величины С в зависимости от изменения: Сг = sd/q — общие организационные издержки; С2 ~ с • d — стоимость товаров; С3 = hq/2 — общие издержки содержания запасов. На рис. 154 показаны графики этих функций (пунктиром) и их сумма С = Сх + С2 + С3. Как следует из рисунка, увеличение q ве- дет к резкому снижению Сг, при этом С3 увеличивается с постоянной скоростью, равной hl?.. При малых значениях q издержки С падают ДО Cmin в точке q*; при дальнейшем увеличении q величина С прибли- жается к функции С2 + С3. Пример. Предположим, интенсивность равномерного спроса составляет 2000 единиц товара в год (поступления со склада непре- рывные). Организационные издержки для одной партии составляют 20 фунтов стерлингов, цена единицы товара равна 1 фунту стерлин- гов, а издержки содержания запаса равны 0,1 фунта стерлингов за единицу товара в год. Найдите оптимальный размер партии, предполагая, что система описывается основной моделью. Решение. По условию имеем: d =s 2000, s = 20, с = 1, h = 0,1. Общие издержки в течение года равны C=C1 + Ca + C3=Ul+cd+-^ = ^+ 2000 +—. q 2 q 20 13* 387
Тогда dC = 40000 1 dq q- 20 Итак, q* будет решением уравнения 40 000 _ J_. ~ 20 ’ e. q*= V800 ООО « 894 единицы товара в партии. Теперь мы можем определить число поставок за год и вычислить продолжительность каждого цикла. Имеем: 2000 7* 365 продолжительность цикла t* = — яа 163 дня. число поставок п* 2,24; Упражнение 3.5.2 1. Система управления запасами некоторого вида товара строго подчини' ется условиям модели из 3.5.4. Каждый год с постоянной интенсивностью по* ступает спрос на 15000 единиц товара, издержки на организацию поставки со- ставляют 10 фунтов стерлингов за одну партию, цена единицы товара — 3 фунта стерлингов, а издержки на ее хранение равны 0,75 фунта стерлингов в год. Най- дите оптимальный размер партии. 2. Каковы будут (а) продолжительность цикла и (б) число поставок за год, если стратегия управления запасами в задаче из предыдущего задания отвечает оптимальному размеру? 3. Фирме по строительству судов требуется 20000 штук заклепок в год, рас- ходуемых с постоянной интенсивностью. Организационные издержки состав- ляют 30 фунтов стерлингов за партию, цена заклепок — 1,5 фунта стерлингов за штуку. Издержки на хранение одной заклепки в течение года оценены в 12,5% ее стоимости. Найдите оптимальный размер партии поставки, оптимальную продолж' - тельность цикла и оптимальное число поставок за год. 4. Докажите формулы оптимальной продолжительности цикла и числа по- ставок в течение года: /* = 365 1/ —s. дней, п* = 1/ поставок в год. г dh г 2s 5. Торговец имеет стабильный спрос на некоторый товар в количестве 50 единиц за единицу времени. Товар он покупает у поставщика по цене 6 фунтов стерлингов за шгуку, причем издержки на оформление поставки и другие под- готовительные операции составляют в каждом случае 10 фунтов стерлингов. Как часто торговец должен пополнять свой запас товаром, если затраты на хра- нение равны 20% общей стоимости запаса. г) Замечание к формуле оптимального размера партии. Очевидно, что модель’управления запасами, рассмотренная в этом параграфе, для большинства ситуаций, встречающихся в реальной жизни, ока- зывается сильным упрощением. Однако уже эта модель позволяет понять основные моменты зада- чи управления запасами. Прежде всего, нами было обнаружено, что оптимальная величина уровня запасов пропорциональна квадратному 388
корню из величины спроса. Очень часто этот вывод не принимается во внимание органами, принимающими решение о величине запаса. С помощью уравнения издержек можно исследовать чувствитель- ность общих издержек при отклонении величины q от оптимального значения. Например, предположим, что вместо оптимального значе- ния q* = J/2 sd/h величины поставок (формула (2)) было выбрано его приближенное значение, равное 1/2 оптимального. Таким образом, размер поставки был равен 1/2 ]/2sd/h. Тогда из уравнения (1) най- дем: (С — cd) =sd -р/"V 2s(//i (для случая q*)\ (С—cd) — 2sdl/ — + — -i/^—=—y2sdh (для случая l/2q*). I/ 2sd 4 1/ Л 4 Как видим, управление запасами при размере’поставки, равном 1 /2 (вместо q*), ведет к тому, что общие издержки на содержание запасов и организацию поставки увеличиваются на 25% по сравне- нию с оптимальными. Упражнение 3.5.3 Покажите, что если оцененное значение издержек на хранение запасов бы- ло в два раза больше истинного, а размер партии равен оптимальному, то сум- марные полные издержки на хранение запасов и организацию поставок возрас- тают примерно на 6% по сравнению с оптимальной для этого случая величиной. 3.5.5. МОДЕЛЬ ПРОИЗВОДСТВЕННЫХ ПОСТАВОК В основной модели мы предполагали, что поступление товаров на склад происходит мгновенно. Эта модель описывает случай, когда то- вары поступают на склад от поставщика партией и эта партия достав- ляется на склад в течение одного дня. В случае, когда готовые товары доставляются на склад непосред- ственно с производственной линии, поступление не будет уже мгно- венным. Модифицируем основную модель, рассмотренную в 3.5.4, приняв допущение о непрерывности поступления заказов. Модель с таким свойством будем называть моделью производственных поста- вок. Предположения, которые мы будем делать, остаются такими же, как в таблице 3.5.4, за исключением тех, которые касаются поступ- лений продукции. Эта величина теперь будет определяться скоростью производства, которую обозначим через р, пусть она равна количест- ву товаров, выпускаемых производственной линией за год. За каждый цикл изменения запасов на склад поступает q единиц товара. Это количество доставляется с производственной линии, ра- ботающей со скоростью, равной р. В течение года спрос постоянен и его интенсивность равна d. Как только уровень запасов упадет до ну- ля, с производственной линии начнет поступать следующее количест- 389
во товаров. Величина q называется размером партии, т. е. означает количество товара в одной поставке (партии). Как и прежде, задача управления состоит в определении значения q, минимизирующего общие затраты. а) График изменения запасов. График изменения запасов, удов- летворяющих перечисленным условиям, показан на рис. 155. Заме- тим, что эффективная скорость пополнения запасов в течение вре- мени поставки запаса равна р—d. б) Уравнение издержек. Общие издержки в течение года равны, как и прежде, 'общие затраты \ на организацию) + , запасов / стоимость товаров (общие затраты па хранение запасов Рис. 155 Для Сг. Спрос равен d товаров в год. Поэтому если одна поставка содержит <7 товаров, то за год необходимо сделать п — dlq поставок. Поэтому <7 Для С2. Стоимость товаров С2 = cd. Для Cs. Общие затраты на хранение запасов равны С8 = (средний уровень запасов) • /г. Для получения среднего уровня запасов мы воспользуемся сле- дующими фактами: (1) максимальный уровень RT = (р — d) t\ (2) pt — q (количество товаров в одной производственной поставке равно pt). Тогда средний уровень запасов = 1/2 (максимальный уровень запа- сов) = lEziAl. ’ 2р Окончательно C=^ + cd+^p-d'>^. (Г) <7 2р 390
в) Оптимальный размер партии. Приравнивая dC/dq нулю, полу- чим: __(p—d)h _q <72 2р Из этого уравнения находим оптимальный размер партии для дан- ной модели: Пр и мер. Предположим, спрос составляет 2000 единиц това- ра в год, которые поставляются равномерно и непрерывно со склада. Допустим организационные издержки составляют 20 фунтов стерлин- гов за одну партию, цена товара равна 1 фунту стерлингов, а издерж- ки хранения равны 0,1 фунта стерлингов в расчете на единицу товара в год. Запасы на складе пополняются с некоторой производственной линии, которая работает со скоростью 4000 единиц товара в год. Производственная линия начинает действовать, как только уровень запасов на складе становится равным нулю, и продолжает работу до тех пор, пока не будет произведено q единиц товара. Нарисуйте график изменения запасов. Найдите размер партии, который минимизирует все затраты. Вычислите число поставок в те- чение года, время, в течение которого продолжается поставка, про- должительность цикла, максимальный уровень запасов и средний уровень запасов при условии, что размер поставки оптимален. Решение. Данная модель является моделью производственных по- ставок со следующими параметрами: d = 2000, s = 20, h = 0,1, с = 1, скорость производства р = 4000. (1) Нарисуем график изменения запасов (рис. 156). (2) Число партий в течение года п = d/q = 2OOO/9. Продолжительность поставки t = q/p = 7/4000. Продолжительность цикла I = 1/п = qld. Максимальный уровень запасов RT = (р — d) t = 2000 X х 9/4000 = 1/29. Средний уровень запасов 1/2 RT = IM9. Отсюда следует, что годовые затраты будут составлять С = sn + cd + \/bqh= +2000+ q 40 Приравняем d&dq нулю, получим: 0= - 40000 1 “ <?’- ' 40 ’ т. е. 9*= 1 600000 » 1265. Итак, для того чтобы общие затраты свести к минимуму, за каж- дую поставку необходимо доставлять на склад 1265 единиц товара. /т-I ж * I /2 • 4000 • 20 • 2000 , (По формуле 9* = у -----2000 - 07!-- = 1265) 391
(3) Подставляя оптимальный размер партии в выражения, най- денные в (2), получим: п —--------- яй 1,6 поставок: 1265 t*=--------365 я^ 115 дней; 4000 (средний уровень запасов) = ~ (максимальный уровень запа- . 1265 О1£. сов) = —— = 316 единиц товара. Эти значения можно сравнить с аналогичными результатами, по- лученными в примере из 3.5.4 (рассматривалась та же самая ситуа- ция, за исключением правил пополнения запасов). Упражнение 3.5.4 1. Система управления запасами описывается моделью производственных поставок и имеет следующие значения параметров. Спрос равен 1500 единицам в год, цена равна 2, издержки хранения единицы товара в течение года равны 0,2, организационные издержки равны 10 (все в фунтах стерлингов); в течение года может быть произведено 4500 единиц товара при полной загрузке производ- ственной линии. Нарисуйте график изменения запасов; вычислите оптимальный размер пар- тии, продолжительность поставки, продолжительность цикла и средний уровень запасов. 2. Интенсивность спроса в модели производственных поставок составляет четверть скорости производства, которая равна 20 000 единиц товара в год. Ор- ганизационные издержки для одной партии равны 150, а издержки хранения единицы товара в течение года составляют 0,3 (все в фунтах стерлингов). Оп- ределите оптимальный размер партии. 3. Некий продукт продается со средней скоростью 45 единиц в день, а про- изводится со скоростью 450 единиц в день. Затраты на организацию и доставку товара составляют 1000 фунтов стерлингов за партчю, издержки хранения за- пасов равны 20% стоимости запаса. Стоимость товара складывается следующим образом: заработная плата обслуживающего персонала составляет 0,4, расходы на материалы — 0,5, накладные расходы — 0,6 (фунты стерлингов за единицу товара; для каждой единицы товара эти значения суммируются). Найдите оп- тимальный размер партии и минимальные общие затраты, связанные с обра- зованием запаса (в расчете на единицу товара в течение года). Примите, что в году 300 рабочих дней. 392
4. Продукция на склад поступает партиями; величина полных затрат (ор- ганизационные издержки + издержки хранения запасов) составляет 20% сто- имости единицы товара. Чему будет равно увеличение полных затрат на еди- ницу товара, если размер партии по сравнению с оптимальным будет (а) увели- чен вдвое, (б) равен половине? 5. С помощью частных производных покажите, что если значения pud из- вестны точно, а при оценивании s и h их значения были завышены на 40% и 1% соответственно, то оптимальный размер партии будет завышен на 1,5%. 6. Сформулируйте модель производственных поставок, используя вместо переменной q переменную п, равную числу поставок за год. Найдите зна- чение п, которое минимизирует С, покажите, что полученное значение п* опре- деляет тот же самый оптимальный размер партии q*. 7. При отыскании оптимального размера партии величина dC/dq прирав- нивалась нулю. Исследуйте производную второго порядка cPC/dq2 для каждого случая и покажите, что значение q* на самом деле оптимальное. 8. Модифицируйте модель производственных поставок для случая, когда допускаются дополнительные издержки хранения запасов, которые подчиняют- ся следующим правилам. Если уровень запасов поднимается выше некоторого фиксированного зна- чения Q, то за каждую единицу продукции, находящуюся в запасе, доплачи- вается дополнительно е фунтов стерлингов (если запас превышает допусти- мый уровень, то излишки перевозятся на другой склад, что требует дополни- тельных затрат). Найдите полные затраты для случаев: (a) q > Q, (б) q < Q. Покажите, что в первом случае оптимальный размер партии будет равен 1 /2pd (s — eQ) 1 / 2pds qi ~ V (p — d) h ’ a Eo ET°P°M Чг= V (p — d)h ‘ Покажите также, что: (1) если и q2 < Q, то размер каждой партии равен q2; (2) если и q2 > Q, то размер каждой партии равен qT; (3) если q± < Q, qs > Q, то размер каждой партии равен Q. 3.5.6. МОДЕЛЬ, ВКЛЮЧАЮЩАЯ ШТРАФЫ Модифицируем основную модель из 3.5.4, допуская возможность существования периодов дефицита товаров, который покрывается при последующих поставках, и штрафов за несвоевременную поставку. Рассмотрим следующую ситуацию. Допустим, по контракту некоторая фирма должна поставить q единиц товара в течение каждого промежутка времени продолжитель- ностью L, за единицу времени поставляется d единиц товара (q = = Ld). Значения q и L постоянны и зафиксированы контрактом. Предположим, что в начале каждого периода L фирма делает за- пас единиц товара (у < q~), равный у. Это означает, что в течение пе- риода будет наблюдаться дефицит товара и некоторое время поставки не будут осуществляться. Невыполненные заявки будут накапливать- ся до максимальной величины q — у, они будут удовлетворены, как только поступит следующая партия товаров в количестве q. За то, что товары доставляются фирмой позже необходимого сро- ка, на фирму налагается штраф, который зависит от того, на сколько была задержана поставка. Рассматривать модели с дефицитом товара вполне разумно, псскольку иногда выгоднее заплатить штраф, чем расходовать дополнительные средства на хранение запасов, пре- вышающих величину у. Задача управления в этом случае состоит 393
в том, чтобы выбрать такое значение у, которое ведет к минимиза- ции всех затрат (т. е. затрат на хранение запасов и затрат на штрафы). График изменения запасов показан на рис. 157. Периоды, для которых запасы отрицательны, соответствуют периодам дефицита то- вара; в течение этого времени спрос на товары непрерывно накапли- вается. а) Издержки одного цикла. Предположим, общие издержки в мо- дели управления запасами будут следующими: h — издержки хранения единицы товара за единицу времени; Р — затраты на штраф в расчете на единицу товара за один день отсрочки. Найдем издержки одного цикла: С = ( общие издержки \ । /общие затраты \ (содержания запасов/ \ на штраф ) С2. Для Сг. Товары находятся на складе в течение периода АВ, сред- ний уровень запасов за этот период равен у/Ч. Продолжительность периода АВ равна yld. Таким образом, 1 2 d 2d Для С2. Штраф выплачивается за невыполнение поставок в течение периода ВС = (д — y)/d. Общее число «товаро-дней», на которые на- лагается штраф, равно площади заштрихованного треугольника BCD (см. рис. 157). Эта площадь равна (д—у \ (q~y\ \ d J' \ 2 )' Следовательно, Сй = Р(д—у)ъ 2d 394
Окончательно имеем Р(<7—У)2 2d 2d б) Оптимальное значение у. __Р(д—у). dy d d Приравнивая нулю, получим следующее уравнение: = Р(д—у) d d Решением этого уравнения будет: Взяв это значение в качестве уровня запасов в начале каждого цик- ла, при условии, что невыполненные заявки в дальнейшем будут удовлетворены, мы сведем суммарные расходы С к минимуму. Упражнение 3.5.5 1. С помощью найденного значения у* проверьте, что _ q2 hP Cpala~ 2d (h-j-P) 2. Покажите,что если периоды дефицита отсутствуют, то издержки за цикл С = q2h/2d. Используя этот результат, докажите, что существование периодов дефицита уменьшает затраты в отношении Р: (h + Р). 3. Фирма, выступающая в качестве посредника, обязуется поставлять за- воду по производству двигателей 5 коленчатых валов в день. Руководство фир- мы решает доставлять коленчатые валы на свой склад партиями по 150 шт. в каж- дой, которые рассчитаны на 30-дневный срок. За один просроченный день в пос- тавке коленчатого вала заводу фирма выплачивает штраф I фунт стерлингов. Издержки хранения одного коленчатого вала были оценены в 1,05 фунта стер- лингов за неделю, организационными затратами можно пренебречь. Найдите оптимальный уровень запасов и продолжительность соответству- ющего ему периода дефицита. Вычислите уменьшение затрат при оптимальной политике управления запасами по сравнению с политикой, когда в начале каж- дого периода на склад поступает 150 коленчатых валов. 4. Модифицируйте модель из 3.5.6, включив издержки на организацию за- пасов. Пусть s означает затраты, связанные с оформлением и доставкой партии товаров для каждого цикла. Предположим, интенсивность спроса и величина штрафа остаются прежними. Принимая во внимание организационные издержки, фирма имеет возмож- ность уменьшить среднюю величину полных издержек, увеличивая время меж- ду поставками (т. е. продолжительность цикла £) и величину заявки q (= Ld). Покажите, что общие затраты, усредненные по времени, равны С— 1 I 14 s ~ L [ 2d + 2d Р L * 395
Переменными в этом уравнении будут у и L. Найдите значения у и L, которые минимизируют С, решая систему уравне- ний дС/ду = 0 = dC/dL. 5. Предположим, в задании 3 организационные издержки принимаются во внимание и равны 250 фунтам стерлингов за партию. Определите оптималь- ную продолжительность цикла и соответствующий уровень запасов, который находится на складе в начале каждого периода. (Минимизируйте средние за- траты за один день.) 6. Как изменится оптимальный уровень запасов, найденный для модели, описанной в задании 4, если организационные издержки увеличить вдвое? 3.5.7. ДАЛЬНЕЙШЕЕ РАЗВИТИЕ МОДЕЛЕЙ Модели управления запасами, рассмотренные в этой главе, явля- ются простейшими и не часто применяются на практике. Однако^эти модели допускают обобщения и дальнейшее развитие. На практике интенсивность спроса не постоянна. Более того, эта величина часто не будет детерминированной, поэтому она описывает- ся в модели распределением вероятности спроса. Очень часто величи- на заявки представляет собой переменную, и на складе может нахо- диться несколько видов товара. Для дальнейшего чтения по затронутым вопросам мы рекомен- дуем читателю книги [30], [31] и [32].
ОТВЕТЫ ЧАСТЬ ПЕРВАЯ ГЛАВА 1.1 1.1.1. 1. {х : х— гласный звук}. 2. {6,1}. 3. (а) 8£ А, (б) 4 ф А. 4. (а), (б) конечны; (в), (г) — бесконечны. 1.1.2. 1. (а)Г, (6)F, (b)F, (r)F, (д)Г, (e)F, (ж)Т, (з)Т, (и)Т, (к)Т, (л)Т. 2. А, С; А, Е-, A, F; В, Е; С, Е; D, Е; D, F; Е, F. 3. Y, W. 4. А = С. 1.1.3. 1. А — не класс множеств. (1)Т, (2)Т, (3)F, (4)F, (5)F, (6)F, (7)F. 2. (1) {2}, (2)’{m, i, s, n, g}, (3) {3, 0, 6, 4, 5}, (4) {1, 3, 5}. 3. (1) {x : x — поло- жительное [четное число, не большее 10}, (2) {х : х—буква в слове «Миссисипи»}, 13) {х; х'— положительное нечетное число}, (4) {х : х—цвет солнечного спект- ра}. 4. (1), (2), (3), (6), (10) конечны; (4), (5), (7), (8), (9) бесконечны. 6. (1) первые три, (2) все, (3) ни один. 7. {0}. 8. (1) {а, е, i, о, w}, {a, е, i, о}, .... 0 (всего 32); (2) {2, 4, 6}, {2, 4} 0 (всего 8); (3) {—3, 3}, {3}, {—3}. 0. 9. (1) SCS, (2) х^Р, (3) YzpX, (4) SZ)T, (5) z $ Z, (6) X£F& (1) G (2) G (3) Z>, (4) C, (5) С. Ни одно; D; В, C, D. {{7, 8}, {7}, {8}, 0}. 397
1.1.4. 2. О'= {2, 4, 6, ...} = множество положительных четных чисел, 3. S' = {х : х£ S и х $ S} = 0. 1.1.5. 1. (1) = {собака, кошка, корова, коза}; (2) A(JB ={1,2, 6, 7, 8}; (3) HUB = {5, 10, 11, 12, 13, 14, 15}; (4) .4(JB = I х : 0 < х < ~ (5) ЛиВ={х : 0 < х < 1}; Сб) .4(JB=Macc всех студентов. 2. Л' = {3, 4, 5,6}. 3. .4UB = Л. 4. SU7 = S. 5. .4(JB = Л. 1.1.6. 1. (1) {кошка}; (2) {1,2}; (3) {5}; (4) {х : 0 < х < 1/2}; (5) {х : 0 < < х < 1/2}; (6) Л — В — А. 2. Л — В = 0. 3. Л — В = В — А; это утверж- дение справедливо только при А = В. 4. Л — Л = 0. 5. Л — В = 0. 1.1.7. 1. (1) {собака}; (2) 0; (3) {10, 15}; (4) (х: 1/2 < х < 1}; (5) {х : 1/2 < х < 1}; (6) 0. 5. (1) {3,5}; (2) 0; (3) {0, 2, 4}; (4) 0; (5) 0; (6) 0. 1.1.9. 1. {0, {а}}. 2. {0, {а}, {/;}, {о, й}}. 3. {0, {а}, {Ь}, {с}, {а, 6}, {а, с}, {Ь, с}, {а, Ь, с}}. 4. 2* = 16. 7. (2), (3), (5). 1.1.12. 1. (2), (3). 2. (1) и (4) равны; (2), (3), (5) равны; 3. (1) да, (2) нет, (3) нет, (4) да. 5. (1) (ЛиВ)П(В'(М)=Л; (2) ЛПВ=(Л иВ)П(Л1)В')П П(Л'1)В); (3) Ли(ЛПВ) = Ли(4'иВ')' = Л; (4) ЛП(Л'иВ)=ЛП(ЛПВ')' = ЛR ПВ; 6. (3), (5), (6), (7), (8). 7. (1) Ли(В'ПС'); (2) Л'ПВ'; (3) (ЛПВПС)и и(Л'ПВ'ПС'); (4) (ЛПВ)и(Л'ПС). 14. (1) (ЛиВ')П(ЛиС); (2) (СиХ)П(Си иУ)П(виХ)П(ВиП; (3) MUB)n(/UCUD); (4) (Л'иВ')П(-4и^ UC). 15. (1) 0; (2) S; (3) Л; (4) S; (5) В; (6) Л; (7) 0. ГЛАВА 1.2 1.2.1. 1. (6) хх-| 2л'24-2л_з-|-Х4; (7) 1 —1-2—]-3—4; (8) -}• — —; (9) Х1 х2 х3 Р+22 + 32 + 42 + 2(1-|-2+3+4); (10) l^-l/x’+l/x*; (11) 2 4 " 3 (12) 1-—+ —. 2. (1) 2 (2) V (,-(г+3)) х Х Г=1 г= 1 3 6 7 4 14 5 8 1 ИЛИ у Г— У Г, (3) У Ху; (4) У X, -]- V Х]- (5) у X2. (6) у --• г— 1 г— 4 /=3 i=2 /=11 г = 2 г—5 Хг 4-2 4 , 6 Б г (7) 5 “7ZT : Z : (9) Z гГ~1’ (Ю) Z “ГГ • Г= 1 xr+ r=I г г=3 Г+1 1.2.2. 1. ].0+2-1+3.2+4-3+... + (л-1)(п-2)+л(я—1). 2. Зах-МагН" + ...+(я-1)оп-з+п«п-2 3. -12+22+...+(-1)'г«2. 4. 2(п-М). п 20 211 J (5) 2 '(г+3): (6> S (-1)г+1б (7) у, — з г= 1 г= 1 г = п г 398
10 п (8) V (2г—1); (9) У (2г—1)2г. Г=1 Г= 1 / з \ / з х ' 3 \ / 3 X 1.2.3. 2. (1) )<?3Р° + j92pi+f ) q0 рз- сумма равна 1 в каждом случае. ,оч/6\„.,/6\_к/6Х , II 77 1701 (3) . ? Р + - <71Р6+ о” р6; суммы равны ----,------,---. \ 4 / 7 н \ 5 / \ 6 / 32 2048 2048 3. (1) 26; (2)—3; (3)—4. 5. (1) среднее = 3, дисперсия = 5/3; (2) среднее = 3, дисперсия = 2; (3) среднее = 1, дисперсия = 22/5; (4) среднее — 6, дисперсия = 7/2. Л 7» У /г*Г = /1*1+/^2*2 + + /п*п! У fr x2r =fl *14' ^2 X2~b • • • + fnXn’ Г= 1 r=l (1) 142,1068; (2) 255,3625. 1.2.4. 2. xj3=3. 3. л'22=0. 4. (7) (2хц-|-3) *n+(2*gi+3) *2i+(2*j2+ 4-3) *12+(2*22+3) *221 (3) °il ^lft+°12 ^2д + с;з fc3ft + ci4 (9) prl </ц+рг2 ?2f+ + Pr3?3i + РглЧн+РгьЧы'’ (10) 1/х?1+1/х|1+1/*|1+1/х?24-1/*|2+1/х|2. 7. (2) *1 + *| + *з + *4 + *1 + *| + *з+*4; (4) 2 (i/xz/0-|-1) + 2 (t/2x/0+1) + + 2(t7i^i + 1) + 2(f/2l/1+l); (6) °ei , O71 , i-«h "r 1-0?! °62 0-72 , 1—06% + l-«?2 ’ (8) (<Z(j12 - 1) + (o?12 1) + (o?22 l)+(c122 l) + (a023 l)+(a123 0 + + («013 — 1) + («113 — О- ГЛАВА 1.3 1.3.1. 2. Каждая вектор-строка имеет порядок 1X4; каждый вектор-стол- бец имеет порядок IX 3. 3. 2 X 3, 3 X 2, 2 X 4, 1 X 4, 3 X 1 соответственно. 4. bO 5. 1 3 4 5“ oo JI • 3 6 9 —3 1 5 6 0 0 0 —4—5 17 _—5 —6 —7 1 1.3.2. 1. Указания: матрицы С и D нельзя складывать, так как они имеют разные порядки. Нулевая матрица имеет в сумме тот же порядок, что и склады- ваемая с ней матрица. 2. 1.3.4. 1. (4) "Зх 2%+ у Зу о ’ — 4 20] . 10 3oJ ’ Зх] 3. х=1, у=1 7р.I ‘ (5)Г4 г=—1/3. 0 о о 4 О 0 0 4 3. v = 4/3, w = 2/3, х = 2/3, у = 3. 1.3.5. 1. (1) 24; (4) 17; (5) 19; (6) -15; (7) -8; (8) 12. 2. (2) (ma)(nb)== п п п п У (та,) (nbi)=mn V at bi=(mri) (ab)=m V at (nbi)=ma. (nb)= У a^mnbi)^ 1=1 1=1 1=1 1=1 = a (mnb). 399
3 7 ( 3 д {. { ( 1.3.6. 1. (2) I 2 —1 ; * * (3) 1 3 1 . (4) F *1. LI 1 2J .0 6 J ’ |4 2] 1.3.7. 2. (1) 11 O' (2) — 0 0 0 0 0" 4 4 1 4 0 2 —2 6 4 1_ 6 0 3 —3 9 -2 0 — 1 1 — 3 0 0 0 0 0_ 3. Д7 = /Д=Д; 4 3 Г ~2 5 2' AJ = 5 2 2 ; JA = 3 4 1 и T. Д 8 4- -1 4 8—1 1.3.9. 2. (Д')' = ([ау]')'==([а/£])'=Д; mA' =т[ац]' =т[ац] = [тац]== = l^ij]''> (A-\-B)' = [ац + Ьц]' = [aji4-bjj] = [a/,]4-[&jj] = laij]/4' I^ij]' = = Д'4-В'. 3. Поскольку A — Д', матрица А имеет столько же строк, сколько и мат- рица Д', но строки матрицы Д' являются столбцами матрицы Д. Следовательно, матрица Д имеет столько же строк, сколько и столбцов, т. е. Д — квадратная матрица. 4. Д = Д', так как Д — симметрическая матрица; тогда [аг-/] = = 1оо]'= [«>£]• Из этого следует, что ац — ац для всех i, j (по определению равенства матриц). 5. (1) А — —А' (определение); тогда [ац] = —[а,/]' = = —[«/г]' = [— ац]. Из этого следует, что ац = — ац для всех i, j. (2) Из (1) при i = j мы имеем ац = —ац', это справедливо при ац = 0. 1.3.10. 1. — 1. 2. 4. 3. 1. 4,—1. 5. ab — cd. 6. 1—х2. 7. 4аЬ. 8.-2. 1.3.11. 1 и 2. Пусть тц и сц обозначают соответственно минор и алгеб- раическое дополнение элемента, стоящего на пересечении Z-й строки и /-го столб- ца матрицы. (1) = —3= 4- cu; т12 = 19 = —с12 и т. д.; (2) ти =14=4- Сц! «12 = 8 = —с12 и т. д.; (4) ’mu = 4 = 4~cu; m12 = 8 = —с12 и т. д. 1.3.12. 2. (1) 23; (2) 7; (3) — 10. 4. Определитель равен 1. 5. aG 4- 6/7 + 4- cl = dA 4- еВ 4- fC = dG 4- eH 4- fl = gA 4- hB 4* iC = cA + fD + + iG — gD 4* hE 4- IF = aC 4~ dF 4' gl — b A 4" el) 4~ hG = bC 4~ cF 4" hl — =сВлА fE 4- iH = 0. a b c (6) Г 0 0 0 — 10 0 0 0 0 1 0 0 0 1 0 — 1 400
1.3.16. 1. (1) Л-1== 1 10 —2 (4) E-i 1 13 2 —1 —10 3 —8 —15 —4 2 7 4 — 1 (6) G-1 не существует, так как G сингулярна (т. е. | G J = 0). 3. (1) J_F 3 01; (2) Г 3 0 -6 3 I -2 1 ] ---L _2 -1 4 3 —3 0 3 Г Л Л В А 1.4 1.4.1. 1. (1) 4х>20; (3) — Зх< —15; (5) 4х 20 3 <— 3 ' 2- 50. 3.26. 4. 39. 5. 86. 6. Зх + 6( — у) < 3-4 + 6-2 = 24. 1.4.3. 1. (2) |х+sinx| < 5; (5) |х — 1 /2 | < 7/2; (6) | х — 1/2 (а + Ь) | < < 1/2 (Ь — а). 3. (3) — 1/3 < 1/х < 1/3; (4) 1/2 < х < 3/2; (6) — 2 < < 1/(х + 1/2) < 2. 4. (2) Сложите: (а — Ь)2 >0; (Ь — с)2 >0, (с — а)2 > 0. 5. {х : х < —1 или х > 5/3}. 6. {х : х <-(2+1/3) или х>Д/3-2}. 1.4.4. 2.(1) (0 < х < 3); (2)(0<х<3); (3)(1<х<3); 4) 0; (5) 0; (6) {1}; (7) (2 < х < 5); (8) 0, 14 Зак. 973 401
1.4.5. 1.4.6. 1.4.7. 1. 2х + Зу = 11. 2. х = Зт — 1; у = т + 4; средняя точка (1/2, 9/2) при т = 1/2. 3. xi — mat + (1 — m) bi; 0 < т < 1; i — 1, ..., п. ГЛАВА 1.5 1.5.3. 1. (1) | V| = 6, | Е| = 8; 3,0,2, 5, 2, 4; (3) | V | = 3, ) Е | = 9; 6,6,6. 2. (1) 16 = 2 | Е (2) 22 = 2 | Е |; (3) 18 ~= 2 | Е |. 1.5.5. 1 е2ев; 3. е2е1е2ее; 5. е7е3еее1()е9е8; 7. e7e3e6eioee. В каждом из случаев 1-—7 есть, много возможностей. 402
8. е4 имеет вершину v3, совместную с е3, но ее другая вершина о5 не является общей с ев, поэтому последовательность не будет цепью; е7е3е4е4е6е1п является слож- ной цепью. 9. Сложный цикл; не цепь; сложный цикл; элементарный цикл; простой цикл; сложная цепь. 10. езвие^е^о — сложная цепь. 11. е8е1се6с2 — элементар- ный (и простой) цикл. е8е9е10е6е2— простой цикл; он не является элементарным, так как вершина v7 встречается дважды. 1.5.6. 1. (1) да; (2) да; (3) да; (4) нет. 5. Степень каждой вершины равна 2. 6. Конечная вершина имеет степень 1; все другие вершины имеют степень 2. 1.5.7. 2. {(145), (147), (155), (157), (165), (167), (245), (247), (255), (257), (265), (267), (345), (347), (355), (357), (365), (367)}. 3. 18 четных сумм х + у + z + w (9 типа ООЕЕ, {(типа ЕООЕ). 5. 20 возможных последовательностей; наибольшая последовательность 5. 6. Число возможных течений матча равно 3247; 541 из них оканчивается вничью. 7. Если D никогда не бросает мяч В или С, то последова- тельность ловящих мяч будет BDABDABDA..., и С никогда не получит мяч. ЧАСТЬ ВТОРАЯ Г Л Л В А 2.1 2.1.1. 1. {мальчик, девочка}. 2. {0, 1, 2, ..., 12}. 3. {/ : 0 < г < /?}. 4. {0, 1, 2}. 5. {0, 1, 2, ...}. 6. {/ : 0 < / < с-}. 2.1.2. 1. {(мальчик, мальчик), (мальчик, девочка), (девочка, мальчик), (девочка, девочка)}. 2. {(ИНН), (ИНТ), .... (ТТТ)} — всего 8 элементов. 3. S X S, где S - {1, 2, 3, 4, 5, 6}, т. е. 36 упорядоченных пар {(г, g) : г £ S, g € з}. 2.1.3. 3. {1, 3, 4, 5, 6}; {2, 5, 6}; {1, 3, 4}; S; 0; {1,2, 3}. 2.1.4. 2. (a) EFG'; (б) £' FG’; (в) £' F' G; (г) (£' F' &)’ =Е (J F U G-, (д) (EF' G') U (Е' EG') U (£' F' G); (е) (£ (J F (J G) — -[(££' G') U (Е' FG') (J (£' F' G)] = (EF) (J (FG) U (GE); (ж) EFG; (з) (EFG') J (Ez FG) U (EE' G) = (EF) (J (EG) (J (GE)-EFG; (и) (£FG)'=£' U F' U G'; (к) [(ЕЕ) (J (FG) (J (GE)]' = = (E'UF')(F' UG')(G' UE'); (л) [(£ (J F)—EF] G' = = [(E-F)U(F-E)]G'. 2.1.5. 1. ф, {£}, {/}, S = {£, 7}. 2. ф, {1}.{6}, {1, 2}, ..., {5, 6}, ..., {1, 2, 3,4, 5}, .... {2, 3, 4, 5, 6}. Всего S содержит 2е — 64 элемента. 2.1.8. 1. Студент не курит — 12/20; студент не носит очки — 8/20; студент не курит и не носит очки •—6/20; студент курит или не курит, по в очках—14/20; не курит, без очков — 6/20; курит и не носит очки — 2/20; иосит очки, если из- вестно, что курит, — 6/8; курит, если известно, что не носит очки, — 2/8; досто- верное событие; невозможное событие. 14* 403
4. Четное Число, 3/6; число > 3, 4/6; 2/6; 4/6; 2/6; 2/6; 1/3; 2/4; 1; 0. И. 25/36* 12. 1/6. 15. (а) 2/3; (б) 2/15; (в) 1/6; (г) 1/30; (д) 29/30. 2.1.10 Г (1) (2) (3) 4. С возвращением Без возвращения ^94 ^100 (1) (0,94)5 0 80 80 270 1 120 200 190 (2) (0,06)6 “ С|00 2 60 260 70 3 10 270 10 (3) 1 — (0,94)-> 1 г5 — г5 • 1 ^1'4 • с'100 1/6. 5. (1) 9/10; (2) 1/10. 7. (1) 5/36; (2) 5/9; (3) 8. (1) 10/21; (2) 1/6; (3) 4/7. 13. 252/924. 15. (1) 1/20; (2) 1/20. 16. (1)19/45; (2)5/9; (3)4/9.17.0,572; 0,128; 0,21333...; 0,42666..; 0,428; 0,872. 18. (1) СЦ- (2) CfC^/Cll, (3) С^С^/СЦ, (4) С1С\ОЙ1СЦ. 19. (1) 1/4; (2) 11/16; (3) 3/8; (4) 1/4. 20. п = 6. 21. 3/5. 23. (1) 13/24; (2) 1/2. P(R/A)P(A) Р (R/А) Р (А) Р (R/В) Р (В) 25‘ (1) 1/3= ,0/21= 4/21‘ ГЛАВА 2.2 2.2.1. 2. Границы групп: (а) (4,0—11,9), (12—19,9), ..., (44 — 51,9); (в) (3,0 — 7,9); (8 — 12,9), ..., (48 — 52,9); (а) (1) (3,95 — 11,95), (11,95 — 19,95) и т. д.; (2) 8 м; (3) 31,95; (4) 43,95; (5) 20; (6) 11,95; (в) (1) (2,95 — 7,95), (7,95 — 12,95) и т. д.; (2) 5 м; (3) 20,45; (4) 27,95; (5) 13; (6) 7,95. 3. Границы групп: (а) (3,45 — 4,94) ...; (в) (3,45 — 4,34) ...; (а) (1) (3,445 — 4,945) '...; (2) 1,5 N; (3) 8,695; (4) 10,945; (5) 6,45; (6) 4,945; (в) (1) (3,445 — 4,345) ...; (2) 0,9 N; (3) 6,595; (4) 7,945; (5) 5,25; (6) 4,345. 4. Ответы 4 и 5 зависят от разбиения на группы. Подходящие границы групп: (а) (121 — 128) ..., ширина 8; (б) (6,14 — 6,22) ..., ширина 0,09; (в) (0,838 — 0,841) ..., ширина 0,004; (г) (30 — 39) ..., ширина 10; (д) (15 — 19) ..., ширина 5, ГЛАВА 2.3 2.3.1. Модальные группы ( разбиение на группы таксе же, как в задании 4 упражнения 2.2.1): (а) пара модальных групп (144,5 — 152,5) и (160,5 — 168,5) (б) (6,495 — 6,585); (в) (0,8535 — 0,8575); (г) (49,5 — 59,5); (д) (29,5 — 44,5) 2.3.2. 1. 5; 2. 4,5. 3. 5,5. 4. 4,45. 2.3.3. Медианы (разбиение на группы такое же, как в задании 4 упражнения 2.2.1): (а) 149,8; (б) 6,513; (в) 0,8543; (г) 575; (д) 40, 75 (41). 2.3.4. 1. (1) 45,4; (2) 4,725; (3) 7; (4) а + --g——; (5) 40 фунтов стерлин- гов. 2.3.5. Квартили и персентили (разбиение на группы такое же, как в зада- нии 4 упражнения 2.2.1): (а) 139; 149,8; 163,7; 130,9; 146,5; 166,9; (б) 6,405; 6,513; 6,615; 6,297; 6,473; 6,711; (в) 0,8479; 0,8543; 0,8587; 0,8415; 0,8522; 0,8615; (г) 525; 575; 705; 495; 555; 795; (д) 34,5; 41; 45,5; 27; 39; 51,5. 2.3.6 19; 10,7; 33. 2.3.7. 1. {—2, —1,0, 1, 2}; {—4,2, —3,1, 5, 0, —1}; {—3,8; 3,7; —2,6; 1,5; 1,2}. 2. Сумма каждого множества равна нулю. Нет. 2.3.9. (1) 16; (2) 25; (3) 100; (4) 5,29. 2.3.10. 1. (1) 11,78; 2,29; (2) 7,506; 0,141; (3) 90,123, 0,139; (4) 1,0014; 0,0087; (5) 53,9; 11,99. 2. S.D. (разбиение на группы такое же, как в 2.1.4). (а) 13,75; (б) 0,1486; (в) 0,0075; (г) 13; (д) 8,92. 404
2.3.11. 1. (1) (7,20; 16,36) (95%-ныеграницы), (4,91; 18,65) (99% ши if.и (2) (7,22; 7,79), (7,08, 7,93); (3) (89,85; 90,40) (89,71; 90,54), (I) (<»,‘н 1. , <>1 >) (0,975; 1,028); (5) (29,92; 77,88), (17,93; 89,87). 2.3.12. 1. (среднее — мода) /S.D- (1) 0,559; (2) 0,043; (3) 0,165; (I) ( | (5) — 0,092. 2. Для А: 2/3; для В: 1/2; для С : 1. ГЛАВА 2.4 2.4.1. 1. С = 60/77; (1) 12,77; (2) 65/77; (3) 27/77. 2. (2) и (5). 3. (а) />(,) 1.1 \ = ~ + х j; 5/8, 3/8, 1/4, 15/16, 1,4; (б) С =- 12/25; 9/25; 16/25, 18/25, 13 26. 18/25. 2.4.2. 1. р (л) = 1/3, 2 < х < 5, 0 в другом~случае. (1) 0; (2) 1/3; (3)'1/3; (4) 2/3; (5) Э; (6) 0; (7) 1/3; (8) 1/2. 2. С 1/3.* (1) 5/12; (2) 11/48; (3) 13/16; (4) 11/48; (5) 11/48; (6) 11/48; (7) 1; (8) (11/48) • (16/3)= 11/39; (9) (11/48) >< 2 е2 X (12/5) 11/20; (10) 5/12; (11) 13/16; (12)1. 3. ---------------. (1)----------; (2) 1 — е" 4 е2 + 1 е2 es — 1 е2 (.+ 1) «. Гн = » ’<•» “<2|; « “(6> “ <* <7’ '•« (9) ( (10) ем. (0; (I I) ем. (3); (12) I. е + 1 х<2; 2. Г(х) = х > 2. (1) 5/12; (2) 11/16; (3) 13/48; (4) 45/64; х = 1,1625 (медиана). 2.4.4. (1) 15/8; (2) 25/18. 1 1 2.4.5. 1. (а) —, —, v 2 2 1 1 4’2’ (б) т 3 3 3 16 ’ 4 ’ 2 4 5 2 3 2 2 (в) 1, — , — ,3. 2. (1)2,5, (2)7; (3) —; (4) — ; (5) — - О О О О 3. С = 1/6; 11/9; 16/9; 23/81. 4. 4,60 фунта стерлингов. 5 (см. 2.4.1). 1. 86/77; 7080/772; 1,093. 2. (2) 17/8; 55/64; 0,927; (5) 23/25; 696/2Б2; 1,055. 4. 1,1,1. 6. (см. 2.4. 2) 1. 7/2, 3/4, У 3/2. 2. 10/9; 26/81; 0,567. С С 3. Е(Х) =--(]— 5е~4) 0,463. Var (X) = — (1 — 13е~4) — (Е (X])3 = = 0,1741; ' 4 S.D. (X) 0,4172; С -- 2/(1 — е~4) = 2,037. 8. (а) (1) X = {0, 1,2,3}; р (X) = {1/30, 3/10, 1/2, 1/6}; (2) р (X) = {0,064; 0,288; 0,432; 0,216}; (б) (1) 1,8; 0,56; 0,748; (2) 1,8; 0,72; 0,8485. 9. (1) X = = {0, 1, 2, 3}; р (X) = — {35, 63, 21,1}; 0,9; 0,49; 0,7; р (X) = {0,343; 0,441; 0,189; 0,027}; 0,9; 0,63; 0,7937. (2) Х= {0, 1, 2, 3}; р (Х)= = {1, 5, 5, 1}; 1,5; 0,583; 0,7639; р (X) = {1, 3, 3, 1}; 1,5; 0,75; 0,866. 8 405
I 1 \x 5 \ 3 — x 2.4.6. 1. (a)p(x)=C|(-j (-) , x= 0, 1, 2, 3; 1/2; 5/12. (2) p (x) = r / 1 \6 ' i 1 ax / 9 \ 15 —x = СЦ?) . * = о, !, .... 6; 3; 3/2. (3) p (x) = C?6 (-J , x = 0, I 1 \x , з \ 10 —x 1, .... 15; 1, 5; 1,35. (4) p (x) = Cf0 I — I "7 , x = 0, 1, .... 10; 2.5. V 4 ./ \ 4 / 1,875. (6) (1) 0,5787; 0,3472; 0,0694; 0,0046; (2)0,0156; 0,0938; 0,2344; 0,3125; 0,2344; 0,0938; 0,0156; {1, 6, 15, 20, 15, 6, ]}j. (в) (3) 0,20589; 0,001937; 0,0000027; 0; (4) 0,05636; 0,01622; 0,000029; 0. (г) (3) ot- 1 Г 15 —x] ношение — ---------- ; 0,34315; 0,00028; 0; 0. 9 L 1 + x J , a 1 I 10 — x I pin — x I (4) отношение у [ J; 0,1879; 0,03089; 0; 0. (д) — x ]• 2. (a) (1) e 2 (1/2)-'/х!; (2)е-зЗ'7х!; (3) е~^ (1,5)7x1 (6) (1) 2 , 3 1,5 X (2) t ; (3) x p вообще —t . (в) (1) 0,6065; 0,3033; 0,0758; 0,0126; 0,0016; 0,00016; (2) 0,0498; 0,1494; 0,2240; 0,2240; 0,1680; 0,1008; (3) 0,2231; 0,3347; 0,2510; 0,1255; 0,0471; 0,0141. 3. (a) (1) 1/4, 3/16, 9/64 и т. д. (2) 1/3, 2/9, 4/27 и т. д. (3) 1/2, 1/4, 1/8 и т. д. (4) 3/4, 3/16, 3/64 и т. д. Сумма каждого ряда равна 1. (г) среднее 6, дисперсия 30. 2.4.7. 1. (а) (1) среднее 2, дисперсия 1/3. (2) 1; 4/3; 3) 2,5; 25/12. (б) Е [(X — р)3] = о, £ [(X —. = (& — а)4/80; Е[(Х — р.)"] = 0, если п нечетное; (Ь — а)п/(п -j- 1) 2я, если п четное. (Замечание. Используйте следующее пре- / 2 \ | a + b I образование у — [х— —g— |.) (в) Да, р(х)=1/г, 0 < х ; г, 0 в других случаях. 2. (а) (1) 0,5; 0,303; 0,184; 0,112; (2) 1; 0,368;_0,135; 0,0498; 1; 1; (3) 10; 0,000449; 0; 0; 0,1; 0,01; (б) X (при х = 0). 3. (б) (1/|^2л) ё~~}^х2 (стандартная нормальная ф. п. в.). 2.4.8. 1. (1) 15/64; (2) 7/64; (3) 42/64; (4) 22/64; (5) 49/64. 2. (1) 10/243; (2) 232/243; (3) 80/243; (4) 112/243. 3. 0,003844. 5. (1) 256/625; (2) 256/625; 65625 (5 V 1 (3) 113/625 . 6. (1) 67 — 0,2344; (2) 1 — J = 0,721; (3) 0,0178. 7. (1)^- X X 200 = 50; (2)75; (3)50; (4) 125. 8. (1) 90/1024; (2)1/64; (3) 781/1024. 9. (1) 0,08808; (2) 0,37581; (3) 0,3222; (4 ) 6778. 10. 1. 3; 1,5. 2. 10/3; 10/9. 3. 2; 3/2. 4. 4,2.5. 4/5; 16/25.6. 7/6; 35/36. 7. 2; 1.8. 5/4; 15/6. 9.2; 1,61. 2.4.9. 1. (б) — 2, 08333; 1,91667; — 0,75; 0; 1; —1; (в) 62; 88,4; 44; 41; 50; 76,4; (г) 1) 0,2025; 2) 0,3085; 3) 0,3333; 4) 0,0305. 2. (а) 4,4934; (б) 6,9766; (в) 2,5632. 3. (а) 202; (б) 127; (в) 382; (г) 85 (между 57, 5 и 58,5 мм). 4. (а) 0,8026; (6) 0,3830.5. (а) 0,1306; (б) 0,2475; (в) 0,4677; (г) 0,9545. 6. 15,3752; 3,2563.7. 6,88.8. 0,0365 кг. 2.4.10. 1. (а) биномиальное 0,2702; 0,2852; 0,8671; (б) пуассоновское 0,2707; 0,2707; 0,8571; (в) нормальное 0,2228; 0,2906; 0,8369. 2. (а) биномиальное 0,2939; 0,3673; 0,2219; (б) пуассоновское 0,3012; 0,3614; 0,2169. 3. (1) 0,0868; (2) 0,8813; (3) 0,0094; (4) 0,1572. 4. (3) биномиальное 0,00384; нормальное 0,000026 (пло- хая аппроксимация; (4) биномиальное 0,1445; нормальное 0,1444 (очень хорошая аппроксимация); (6) биномиальное (1) 0,2344; (2) 0,7210; (3) 0,0178; нормальное (1)0,2785; (2) 0,7505; (3) 0,00898. (9) биномиальное (1) 0,08808; (2) 0,3758; (3) 0,3222; (4) 0,6778. Нормальное (1) 0,0937; (2) 0,3463; (3) 0,3463; (4) 0,6537. (Замечание. Читатель, наверное, заметил, что аппроксимация нормальным рас- пределением в большинстве случаев очень хорошая, несмотря на низкие значения п и пр.) 406
ГЛАВА 2.6 2.6.1. 1. 53; 4. 2. 0,027; 0,0022. 3. 8 /2. 4. 3,75, S. D. = 0,634; 3,5; S. D. = = 1/(35/12); да. 5. w : 1 2 3 4 5 f: 2 10 12 16 10 Среднее = 3,44; S.D. = 1,14. Нет; вероятности 0,0, 0, 0,1 (приближенно); P (ву = 6) = 0. Среднее размаха распределения при увеличении п стремит- ся к 5. 2.6.2. 1. (1) 0,00307; (2) 0,076; (3) 0,12327. 2. (1) нуль; (2) 0,0084; (3) 0,0252. 2.6.3. 2. Среднее (S) = 93; JVar (S) = 25; среднее (D) = lb Var (D) = = 25. 3. Среднее (S) = 93; S. D. (S) = 1; среднее (£>) = 11; S. D. (D) = 1. 2.6.4. 1. (а) 4,5; 2,5; (б) 4,5; (в) 1,768=2, 5/^2. 2. (а) 4; 1,633; б) 4; в) 1,633//3. 3. (а) уменьшится наполовину; (б) уменьшится с о/4 до сг/12, т. е. стандартная ошибка уменьшится в 3 раза. 4. Стандартная ошибка (х) = о/8; стандартная ошибка (х) = о/8,168. 5. Стандартная ошибка (х) = 0,25 о; стандартная ошибка (х) = 0,2507 о; т. е. если за основу брать величину стандартной ошибки, то х будет лучшей оценкой*!!. 6. (а) 0,557; (б) 0,469. 7. (а) 0,212; (б) 0,0228. 8. 0,147. 9. 9 мм; 0,1044 мм. 10. 4,1; 0,02022. И. (а) 3,5 м, 14,21 мм; (б) 0,5 м, 14,21 мм. 12.0,3075. ГЛАВА 2.7 2.7.1. 1. (1) (а) х — 0,3; (б) х = 0,3; (в) Sx/(n + 1) = 0,25; (г) s2 (п в зна- менателе) = О,ОО02, s2 (п — 1 в знаменателе) = 0,00025. (2) (а) 1,998; (б) 2; (в) 1,713; (г) 0,000114; 0,000137. (3) (а) 58; (б) 57; (в) 52,7; (г) 125; 138, 9. (4) (а) 10; (б) 10; (в) 9,1; (г) 6,6; 7,3. (5) (а) 14,7; (б) 14,8; (в) 12,3; (г) 1,24; 1,55. (6) (а) 37,9; (б) 38,5; (в) 33,7; Г) 24,1; 27,6. 2. (1) среднее 0,3; дисперсия 0,00015; (2) 1,9993; 0,000814; (3) 55,5; 119,4; (4) 9,48; 5,58; (5) 14,29; 0,772; (6) 36,75; 23,55. k k S fii^i S («;—l)s2- , I==1 i — 1 5. Среднее 12,29, дисперсия 5,41. 2.7.2. 1. (1) 95%: 12 ± 0,653; 99%: 12 ± 0,859, (2) 27 ±'0,915; 27 ± 1,202; (3) 18,1 ± 0,161; 18,1 ± 0,211; (4) 17,1 ± 0,267; 17,1 ± 0,350; 5) 37,2 ± 0,49; 37,2 ± 0,644. 2. (a) 1,645; (6) 0,842; (в) 3,2905; (г) 0,6745. 3. (1) 90%: 12 ± 0,548; 50% : 12 ± ± 0,225; (2) 27 ± 0,768; 27 ± 0,315; (3) 18,1 ± 0,135; 18,1 ± 0,055; (4) 17,1 ± ± 0,224; 17,1 ± 0,092; (5) 37,2 ± 0,411; 37,2 ± 0,169. 2.7.3. 1. 0,63 ± 0,0794; да. 2. (a) 0,25 ± 0,1499; (6) 0,25 ± 0,197; (в) 0,0516. 3. 0,05; 0,05 ± 0,0119. 4. (a) 73; (6) 171 (находится из решения следующей системы уравнений: 1,96 X X ]/- = 0,05; 3,00 (1 — я) = 0,05). 5. (а) 95%-ный доверительный интервал для р: (1) х ± 2,35; (2) ± 0,028; (3) ± 0,0029; (4) ± 1,789; (5) ± 0,651; 99%-ный дове- рительный интервал для р : (1) х ± 3,096; (2) ± 0,037; (3) ± 0,0038; (4) ± 2, 356; (5) ±0,857; (б) 90%-ный доверительный ин- тервал для о: (1) s ± 1,397; (2) ± 0,0166; (3) ± 0,00173; (4) ± 1,063; (5) ± 0,387; 99,7%-ный доверительный интервал для о (1) s ± 2,547; (2) ± 0,0303; (3) ± 0,00315; (4^ ± 1,938; (5) ± 0,705. 6. (а) 95%-и 99%-ный доверительные интервалы для р: (1) х ± 3,049; 4, 013; 2)± 0,0294; 0,0387; (3) ± 0,00304; 0,00399; 4) ±1,315; 1,731; (5) ± 0,664; 0,875. (б) 95%-ный доверительный интервал для р5 — р2: (1) [—32, —8]; (2) [—0,841; —0,759]; (3) [—0,1252; —0,1168]; (4) [0,83; 5,17]; (5) [—2,045; —0,155]. 407
Ни один из интервалов не содержит нуль, показывая, таким образом, на значимое различие (с вероятностью больше чем 95%). 2.7.4. 1. 95%- и 99%-ный доверительные интервалы разности средних ге- неральных совокупностей: (2) 0,002 ± 0,0114; 0,016 (t = 2,18; 3,05); (3) — 5 ± ± 10, 31; 14, 13 (/=2,11; 2,89) (4) —1 ± 2,17; 2,97 (t = 2,10; 2,88); (5) —0,7 ± 1,147; 1,631 (/= 2,23; 3,17); (6)—1,9 ± 4,673; 6, 401 (/=2,11, 2,89). Все интервалы указывают на отсутствие в изменении средних. 2. Разность сред- них D = — 0,374. Доверительные интервалы: (а) 90% : D ± 0,164 (/ = 1,75); (б) 95% : D ± 0,2 (/ = 2,13); (в) 99% : D ± 0,277 (/ = 2,95). Сосуды наполне- ны одинаковой смесью. 3. 18,1 ± 2,13 • 1,8 = 18,1 ± 3,86. 4. (а) 99%-ный дове- рительный интервал для 26 ± 3,71 • 2,401 = 26 ± 8,91; 99%-ный дове- рительный интервал для р£: : 27,1 ± 3,25 • 1,935 = 27,1 ± 6,29; (б) 95%-ный доверительный интервал для разности средних: —-1,1 ±2,13 0,486 = — 1,1 ± ± 1,035.5.1500 ± 3,71 • 781 = 1500 ± 2898. (При заданном уровне значимости разница в износе шин незначима.) 2.7.5. 1. Нулевая гипотеза Но : л = 1/6. Допустимая область числа выпа- дений шестерок при 900 бросаниях: (а) 5% : 150 ± 21,9; (б) 1% : 150 ± 28,8. Наблюдаемое значение 140 лежит вне обоих интервалов, поэтому нулевую ги- потезу при заданном уровне значимости следует отвергнуть. Таким образом, мы должны принять гипотезу о правильности игральной кости. 2. Допустимая область Решение (1) 50 ± 9,8 Принять Н (2) 45 ± 9,75 Отвергнуть И (3) 60 ± 9,60 Принять И (4) 70 ± 8,98 Отвергнуть И 3. Область принятия гипотезы (для числа бракованных деталей, содержа- щихся в выборке) : 20 ± 11,25. При п = 26 нулевая гипотеза принимается. 2.7.6. 1. Критическое значение Р = 0,226. Решение: доля голубоглазых людей в выборке больше, чем во всем населении (наблюдаемое значение Р = = 0,167 меньше, чем 0,226). 2. Наблюдаемое значение Р = 0,068; критическое значение Р = 0,0613 (при уровне ошибки 0,05) и Р = 0,066 (при уровне ошибки 0,01). Решение: люди, работающие в области строительства, в 60 лет более склон- ны к смерти, чем остальное население. 3. Наблюдаемое значение Р — 0,038, кри- тическое значение Р = 0,0389. Решение: число* забракованных товаров (38) недостаточно при 5%-ном уровне ошибки для того, чтобы остановить выпуск товаров. Директору завода следует продолжить выпуск товаров, однако в по- следующую неделю ему необходимо провести второе наблюдение за качеством товаров. Если и тогда окажется, что число бракованных товаров близко к 38, то производственная линия должна быть тщательно проверена. 2.7.7. 1. Нет, z = 12, 5; критическое значение г (односторонняя проверка) = = 3,08. 2. г = 2,08. (а) принимается при уровне значимости 0,05 и (б) отвер- гается при уровне 0,001 (но не при 0,01). 3. z= 2, двусторонний критерий, при уровне значимости 0,05 гипотеза принимается, при уровне 0,01 — отвергается. Двустороннюю проверку следует применять в том случае, когда неизвестно, приведет ли химическая обработка к увеличению ( или к уменьшению) предель- ной силы натяжения нити. Вопрос о выборе одно- или двусторонней проверки должен быть решен до выполнения эксперимента. Если вместо двусторонней гипо- тезы вы хотите рассмотреть одностороннюю, необходимо собрать новые данные. 2.7.8. 1. (а) / = 1,88; критическое значение / = 2,36; различие не установ- лено; (б) z = 3,162; критическое значение z = 1,96; различие установлено (дву- сторонний тест). 2. z = 14,53; проведенные занятия были эффективными. 3. / = 3,038; критическое значение /= 2,02 (5%), 3,36 (1%). Нулевая гипотеза отвергается при 5%-ном уровне (при 1%-ном—нет). Отсюда заключаем, что хи- мическая обработка увеличивает растяжимость резины. 2.7.9. 1. z = 6,67; скорость изготовления товаров модифицированного про- цесса больше. 2. z= 1,89 (односторонний критерий, гипотеза принимается при 5%- ном уровне ошибки, при 1%-ном—отвергается. Таким образом, с 95%-ной уве- ренностью можно сказать, что горячая обработка увеличивает растяжение пру- 408
жил. 3. z = 2,74 (односторонний критерий) при 1%-ном уровне ошибки. Лекар- ство ускоряет процесс выздоровления. 2.7.10. 1. (а) (76,3 ± 1,96 • 0,753) • 10s; (б) (76,3 ± 2,58 . 0,735) X ХЮ3 м3/км2. 2. г= 2,94 (односторонний критерий при 1%-ном уровне ошибки). Новый сорт пшеницы значимо лучше первого. 3. (а) да, односторонний крите- рий, t — 4,37. (б) t= 1,88 при 5%-ном уровне ошибки. Гипотеза отвергается. 4. г = 5,48, односторонняя проверка. По этому тесту девочки более способные, чем мальчики. 5. И : р = 0,95; критическое значение р = 0,921; 0,9067 < 0,921. Поэтому гипотеза И отвергается, т. е. заявление фирмы не подтверждено 6. (а) 6,20 ± 2,26 - 0,01581; (б) 6,20 ± 3,25 • 0,01581. 7. t = 2,036; односторонний критерий, критическое значение t = 1,75. Диаметр оси пропеллера увеличивается при нагреве. 8. (а) 0,205 ± 2,57 . 0,00428; (б) 0,205 ± 4,03 0,00428. 9. t — 8,97, критическое значение t = 2,35. Резина сорта В больше изнашивает- ся, чем резина сорта А. ГЛАВА 2.8 2.8.1. 1. (1) нет; (2) да; (3) да; (4) стирание монеты; (5) да, направленности зависимости имеют обратные знаки; (6) ответить трудно; может быть, частично; (7) да, обе переменные увеличиваются (уменьшаются) одновременно; (8) да, когда одна переменная возрастает, другая уменьшается; (9) нет. 2.8.2. Значения г приводятся в задании 1 упражнения 2.8. 3. 2.8.3. 1. (1) + 1; (2) 1/577; (3) — 0,9; (4) 0.2. (1) 0,951; (2) 0,977; (3) 0,962; (4) 0,179. 3. —0,89. 4. —0,222. 2.8.5. 1. (1) R = 0,65; (2) Д = 0,65; (3) = 0,41 указывает на некоторое 69 . 27 3 „ положительное соответствие. 2. (1) yg; (2) 1; (3) gg, (4) 3. Xi=yi для любого i. Y—7,5 ! X—7 2.8.6. 1. (6) 0,6366, (в) —-——=0,64 - ' ' 1,36 \ 1,73 2. (1) 0,976; Y—2,99 X—43,5 ------—=0,976 ------- 0,31 \ 3,9 (2) 0,963; У—58 17,5 = 0,963 'X—36,5\ , 9,46 J (3) 0,968; У —13,56 1,965 = 0,968 X—66,2 8,02 (4) —0,967; У—44 5,75 = —0,967 /X—161,5\ \ 69,4 J 3. (1) 44,9; 2,56; (2) 78,5; (3) 60,04; 14,46; (4) 114,8. 6. 95%-ные и 99%-ные доверительные интервалы для р: 1. (0,012; 0,905); (—0,219; 0,936); принять 7/0; 2. (1) (0,87; 0,996); (0,78; 0,998); отвергнуть Но-, (2) (0,69; 0,996); (0,46; 0,998); отвергнуть Яо; (3) (0,87; 0,993); (0,79; 0,995); отвергнуть Но\ (4) (0,86; 0,992); (0,79; 0,995); отвергнуть Но. 7. (б) г = — 0,976; 99%-ный доверительный интервал для р (—1; —0,37); (в) 13,3. 10. а, Ь, с — решения системы уравнений: 2(/х2=а Sx4+Ь 2x3 -|- с • Sx2; 2</х=о-2хЗ-|-Ь.2х2+с-2х; Y.y = a-2x2+&-Sx-|-c-n. * Вторая линия регрессии получается очевидным образом из первой. — Примеч. ред. 409
ГЛАВА 2.9 2.9.2. 2.9.1. (б) Р (A U в U С) = Р (А)+Р (В)-|-Р (С)—Р (АВ)— 3 Г20 ’(^49---С|9). свО 5/11 —Р(ВС) — Р (СА)~У Р (АВС); (в) 1 7/12 (б) (1) 203/396; (2) 203/132 ' 203/132 ’ 1/2 203/132 2.9.3. (в) 1 — 2.9.4. (б) Доля подходящих штифтов в среднем равна 69,4%. 2.9 5. (в) 0,18. 2.9.6. (б) (—0,047 + 0,067). Различия нет. 2.9.7. (б) / = 3,464; 6 степеней свободы, 5%-ный уровень ошибки. 2.9.10. (а) Вкусы I и III судей наиболее близки друг к другу; А’(1 П) = = — 0,519; /?(П> Ш) = — 0,415; К(Ш, = 0,556. (б) У = 45,18 + 6,599х; 66,14 — ожидаемое количество химического вещества. 2.9.11. (a) F — 2,59, гипотеза отвергается; (б) /10 = 1,87, гипотеза отвер- гается (одинаковое расовое происхождение). 2.9.13. (а) (1) нет, пересечение АВ = (И, Т) не пусто; (2) да, Р(А/В) = = Р (А) = 0,5. (б) (1) истинно, ложно (за исключением случаев x=f/=z, или когда х, у, z специально подобраны), ложно; (2) всего имеется 6 возможностей, поэтому искомая вероятность будет равна 4/6. 2.9.14. (1) 19/64; (2) 16/19; (3) 11205/16384. 2.9.15. (a) Blt В2, В3 являются разбиением пространства; Г Y: 1 2 3 ] (б)(1)[₽(^): И/18 5/18 2/18]’ (2) Г Z: 2 3 4 5 6 1 ^^=7/2, Var (Z) = 65/36- [ 18р (Z): 6 3 5 2 2 J 2.9.16. (а) 0,4714; 0,3446; (б) 0,5. 2.9. 17. E(Y) = 0, Var (У) = 5, 3/8. _ 2.9.18. (х1 — 1,9; х' —0,1), (х — 1 ± 1,645 ]/Зп); п = 91. 2.9.19. (а) (1) 3/16; (2) 5/16; 1/2; 3/4; 1; 1. (б) (1) 1/8; (2) 3/10; 19/40; 13/20; 33/40; 1. 2.9.20. Мода = 18,2; w = — 0,485; медиана = 16,64, стандартное откло- нение = 3,72. 2.9.21. (1) Отклонить Но, если х > 266,4; (2) 0,2611; (3) п = 215. 2.9.22. %2 = 8,55; 11 степеней свободы, гипотеза отклоняется, подозрение’ не подтвердилось. у—1,02 / х—3,7 \ « <"> -^иГ“0-989(-5ЛЗг); й буда- 2.9.27. k = 3/28; р = 3/14; г = — 0,057. 1 а 2.9.28. (1—а)е*/(1 — aes); -------; —------— ; Var (х) + (р—<2)2. 1 — а (1—а)* 2.9.29. (a) 0,00019j_(6) 0,0597; п = 5010. 2.9.30. (в) (х — у) ± 2,02 . 0,655. 2.9.32. t = 2,105 (значим при 2,5%, односторонний критерий). 2.9.33. 13/20, 19/30, 1/10. 410
2.9.35. Гипотеза подтверждается (односторонний критерии): (а) 0,001074; (б) 0,01341. 2.9.36. 1/2; 31,5; 15,8; 3,9; 0,7. 2.9.37. х : 0 1 2 3 4 5 6 7 8 9 10 11 12 р (х): 6 10 9 8 7 6Г5 6 5 4 3 2 1 (4-72). Среднее 4,47; мода 1; медиана 4; Р (х < 2) = 16/72; Р (х > 7) = 15/72. 2.9.38. Г—55,2 9,31 “ 0,99 Т—25 \ 12,9 )' 57,34; г=0,99. 2.9.40, (а) 50 ± 1,961/50; (б) 50 ± 1,961/25; (в) 100 1,96 1/800 %. 1 2 ± ЧАСТЬ ТРЕТЬЯ ГЛАВА 3.1 3.1.1. 1. Пространство состояний {маршрут А, маршрут В, маршрут С} Маршруты выбираются каждый вечер в соответствии с множеством вероятностей {Рд> Рв' Рс}< эт0 множество может быть постоянным или меняться день ото дня. 2. Пространство состояний {поступление на 1-й курс, переход на 2-й курс, пе- реход на 3-й курс, окончание колледжа, исключение из колледжа}. 3.1.4. 1. А В с D Е А Г 1/2 0 1/2 0 0 ~ В 1/3 1/3 1/3 0 0 С 0 1/3 1/3 1/3 0 D 0 0 1/3 1/3 1/3 Е 0 0 1/2 0 1/2_ /1 1 \2 Последовательность вероятностен: 0,0, — ?) 0; при а=(0, 1/2, 1/2, 0,0); 0,0,(l/З)3 (1/2)3, 0; (1/2) (1/3)Е, (l/З)3 (1/2)3, 0, (1/2)3 (1/3)3. 4. 0 < г < 1,0 < s < 1. 6. Пространство состояний {0,1, 2, ..., 9}; каждый элемент матрицы переходов равен 1/10; тривиальная марковская цепь. Е F 9. А В С D А 0 1/4 0 1/2 0 1/4 В 1/4 0 1/4 0 1/2 0 С 0 1/4 0 1/4 0 1/2 D 1/2 0 1/4 0 1/4 0 Е 0 1/2 0 1/4 0 1/4 F _ 1/< 0 1/2 0 1/4 0 411
10. Пространство состояний {sj, s2, s3, s4}, «! = {/; В}, s2 = {/}, si S2 S3 s4 s3 = {B}, s4=0. 5/16 3/16 5/16 3/16 0 1 0 0 0 0 1 0 0 0 0 1 3.1.5. 1. (1) a2 = (0,15; 0,85); a3 = (0,255, 0,745). (2) a2 = (0,15, 0,85); a3 = (0,075, 0,925). (3) a2 = (0,45, 0,175, 0,375); a3=(0,635, 0,205; 0,16). (4) a2= = (0,1, 0,75, 0,15); a3=(0,03, 0,89, 0,08). P (цепь не будет находиться в со- стоянии s3 после двух переходов) = 1 — 0,08 = 0,92. 2. (1) 0,61; (2) 0,547. 3.1.6. Рассмотрим например, матрицу (а); начинаем рисовать дерево из со- стояния вр Ясно, что если однажды цепь попала в состояние sj, то затем она будет находиться либо В СОСТОЯНИИ Sj, либо в состоянии s3. 3.1.7. А и Е — поглощающие состояния; В, С, D — мгновенные состояния. 3.1.8. 1. Все эргодические состояния; эргодическая цепь (регулярная). 2. Все эргодические состояния; эргодическая цепь (регулярная). 3. Все эргоди- ческие состояния; эргодическая цепь (регулярная). 4. г = 0, s = 0, поглощаю- щая цепь; г =~ 1, s = 1, эргодическая циклическая цепь; г = 0, s = 1, погло- щающая цепь; г = 1, s = 0, поглощающая цепь; 0 < г < 1, 0 < s < 1, эрго- дическая регулярная цепь. 3.1.9. 1. (а) нерегулярная (поглощающая) цепь; (б), (в), (г), (д), (е) — ре- гулярные цепи. 2. Регулярная матрица переходов R 1/2 1/3 1/8 R D S D S 1/4 1/4 1/3 1/3 1/2 3/8 /9 8 \ 3.1.11. 1. (а) (1/3, 2/3); (б) - ; (в) (1/2, 1/2); (г) (4/11,3/11,4/11); \ 17 1 / ' (д) (9/25, 8/25, 8/25); (е) (2/7, 8/21, 1/3); (ж) (-—--- , ~ ~ Р V 2. b = \ 1 + г — р 1 F г — р 1 = (1/4, 1/4, 1/4, 1/4) во всех случаях. После десяти шагов человек попадет в со- стояние s3 с вероятностью 1/4 (очень приближенно). 3. (а) 0,66; (б) 0,6666; (в) 0,666666; (г) приближенно 2/3. 3.1.12. (а) Si s2 (6) S2 si s3 S1 1 0 ' s2 1 0 0 | s2 3/4 1/4 . Si 0 1/3 2/3 | S3 3/8 1/8 1/2 I 3.1.13. [1] 1. (4) (e) S3 s4 Sl «2 s3 - 1 0 0 0 s4 0 1 0 0 Sl 1/3 0 1/3 1/3 s2 0 0 1/4 3/4 N N2 В т т2, (а) (1) [4] [12] 412
(3) ____12^12/3 1/4 1 2 Г 12 15 1 D Г 1/5 1/5 1 N— I I» л?— I I ; 15 -1 I , 5 L 1/3 3/4 J 25 I. 14 18 J L 3/5 2/5 J I / 11 \ 2 ( 39 \ т=Т ИГ : T“=V V Ь ® 4; 12; <3> 9/5’ 36/25: 5 \ 13 j 25 \ 44 / 13 88 1 (в) (2) 6; 38; (3) — , — ; (r) — . 2. (a) (1) 8/11; 5 25 5 (2) 3/11; (6) 56/11; 2712/121. ГЛАВА 3.2 3.2.1. 1. (a) 32, 64; (6) 74, 74; (в) 59, 177. 3.2.2. 1.1,4, 0, 0, 0. 2. (a) 0, 2, 5, 3, 1, 0; (6) 0, 4, 10, 14, 18, 14. 3.2.3. 1. (a) o, />10 №(/) = 7—2/3/, 0 </< 10 3, 6, 5, 0, 0. c—1, f=O, c=l,..., 8 00 0, />36 U7(/)= 18 — 1/2/, 0</ 36 9, 18, 12, 3, 0. 3(c—1), / = 0, c=l,..., 7. 2. (a) 2, 5, 6 -y , 5—, 0; (6) 4, 10, 16, 18, 18; (в) 6, 15, 15, 12, 0. 3. (a) 4, 0, 0, 0; (6) 44, 34, 26, 10; (в) 92 , 60 , 36 , 0; W (0=0, t > 0; \Vc(0) = b Г b I* ------ (r—c) +(r—c) a—b---J где c = 1,2, 3.r — 1 и [x]* означает наибольшее целое число, меньшее, чем х; №7(0) = 0. 3.2.4. 1. (a) s0 Г ?! pi 1 «1 I Р2Ч1 (PiPt+qO I / 3 4 \ / 1 2 2 2 \ / q 1 1\ 2. 0.4251,^.-). 3. 4. 41 3 1-1- 5? £(”)=2'’6г=Т?7; Vsr{nhlW' Е(п) = 1,07; Var (п) = 0,638. 3.2.6. 2. 4 мин, 4мин. 3. 18, 18. 4. (2, 4); (1, 1); (1/2, 1/4); (1/5, 1/25). 4 1 111 3 27 1 3.2.8. 1. (а) у; (б) 2; (в) у. 2. (a) 4-g; (б) 8j; (в) -g-. 3. (a) j; (б) (в)^; Р 2р (г) 12 мин. 4. 12/5 требований /мин. 6. Е (kj) = • ц _р^; Var (w) = р2 _ру 1 3 11. (а) (1) 20 мин; (2) 2; (3) 20 мин/час; (б) (1) 1-^- мин; (2) -g-; (3) 60 (2Р0 + + IPj) = 80. Введение второго парикмахера сокращает в шестнадцать раз время ожидания посетителя; в результате вчетверо увеличивается ожидаемое время простоя парикмахера. 413
ГЛАВА 3.3 3.3.1. 1. (1) максимизировать Р = 100 хл + 140хв (прибыль); ограниче- ния: Зхл + 5хв < 70 (капитал); хА 4“ хв < 20 (площадь склада); хА, хв — неотрицательные целые числа. (2) минимизировать С — 2xn + 3x12 + 5xl3 + + 6х21 + 2х22 + 4х2з (транспортные издержки); ограничения: хп-|-х12 + 4_ ^1з 20, х2Х -| х22 4~ х23 12; хц 4“ х2Х — 8; хХ2 4" х22 = 10; ххз 4" х23 = = 14; xtj для любых i, j—неотрицательные целые числа. 2. а, 6—минимальные уровни производства (т. е. ограничения по контракту); с, d — человеко-часы на единицу; М — существующее количество человеко-часов; е, f — стоимость материалов на единицу х, у; С — существующее количество материалов. 3.3.4. 1. Р{ = 50; Р2 = 90 (допустимые точки лежат на прямой х + Зг/ = = 90). 2. Р* = 69. 3. P(min) = 34, P(max) = 70. 4. P(min) = 60 (допустимые точки принадлежат прямой s 4~ 27 = 60). 5. Нет решения. 6. Р (max) = беско- нечность, Р (min) = 33. 7. P(max) = 60. 8. Pt (max) = 46, P2 (min) = 20, 3.3.6. Решение: ’6 0 14 2 10 0 C (min)= 114 km. 3.3.8. 1. (1) (x, y) = (15,13), P (max) = 69; (2) (s, t) = (1 1 -j-), 3 P (max) = 2 (3) (p, q) = (5,5), Z (max) = 35; (4) (x, y) = (10,3), M (max) = 13; (5) (x, y, z) = (2, 0, 12), P (max) = 40; (6) (и, о, w) = (0, 3, 11), Q (max) = 48; (7) (p,q, r) = (28, 24, 24), S (max) = 244. 2. (P, Q, R) = (11, 9, 4); максимальная прибыль — 325 фунтов стерлингов в неделю. 4.4 для 1,8 для II, Р (max) = 96 фунтов стерлингов. 5. Пусть х, у, z, w—вес I, II, III, IV продукта соответственно. Проблема заключается в минимизации 4х 4" 2# 4" 5г 4_ 6ш при следующих ограничениях: 2х + 8 у 4~ Ю г + 3 w > 80; бООх 4~ 50у 4~ 4~ 500z + 800ш > 300; х, у, z, w > 0. 6. 1000 вида А, 500 вида В, Р (max) = = 275 фунтов стерлингов. 7. (а) 3000 м Л, 5600 м В; Р (max) = 1420 фунтов стер- лингов; (б) прибыль увеличивается с 80 до 1500 фунтов стерлингов. (Решение: А = 1667р, В = 667 р 4- 7500 (1 — р), где р принимает любые значения от 0 до 1 включительно.) 3.3.9. 1. 4р, + 2р2 > 1; Ipj 4- Зр2 > 1. Минимизировать D — 3у1 4~ 4- 2у2. 2. 2pj 4“ Зр2 : 4; Зу± 4~ 2//„ > 5. Минимизировать D = Gt/i 4~ 6р2. 3. 14рх 4- Юр2 > 5; 5^4-81/2 '> 6. Минимизировать О = 70уг 4-80р2> 4. р24- 7р3< < 1; 2у1 4~ 2р» < 1; Ipi + Зр2 1. Максимизировать С = Бу} + 4г/2 4- + 21р3. 5. рх 4- 2р2 < 2; Зрг+р24-'/з 4; 4р3 1; рх 4- ys 1. Миними- зировать D = 4рх 4~ 3</2 4- Зуз- 3.3.10. 2. (задача 5 упражнения 3.3. 9). х= (1,1, -у-, 0), С = 6, 5; у = / 11 9 2 \ 20 ’ 20 ’ 4 ГЛАВА 3.4 3.4.2. 1. Пути t/1246, г>1256, о1356; время выполнения проекта равно 15; все пути критические. 2. п1257 (время = 13), 12567 (16), и12367 (1>), о 1367 (10), и1467 (15), и147 (10); время выполнения проекта равно 17; критический путь — 1)12367. 3. г/1278 (16), и 12678(20), и 124678 (23), Й14638(16), п135678(24); время выполнения проекта равно 24; критический путь —> v 135678. 4. о12367 (16), v 12357 (17), 1/1367 (16), п1357 (17), t)1457 (16), t/147 (13); время выполнения проек- та равно 17; критические пути — п12357 и о1357. 3.4.3. 1. Время выполнения проекта равно 13; критический путь — и!367 (Замечание. Пусть и137’ не будет критическим, несмотря па то, что вдоль этого пути Е = L.) 2. Не даны. 3.4.6. 2. (1) 1—2 (0,0,0), 1 — 3 (6, 0, 0), 2 — 4 (0, 0, 0), 2 — 5 (4, 0, 0), 3 — 5 (6, 2, 0), 4 — 6 (0, 0, 0), 5 — 6 (4, 4, 0). (2) 1 — 2 (0, 0, 0). 1 — 3 (3, 3, 3), 2 — 3 (0, 0, 0), 2 — 4 (8, 8, 8,), 3 — 4 (0, 0, 0,), 3 — 5 (6, 6, 6), 4 — 5 (0, 0, 0). 414
ГЛАВА 3.5 3.5.1. 2. (б) 400; (в) 380. 3. (б) 500. 4. 225 фунтов стерлингов. 3.5.2. 1. EOQ = 633.2. (а) 15,4 (в году 365 дней); (б) 23,7. 3. EOQ = 2530. Длина оптимального цикла равна 46,1 дня. Число поставок 7,91. 5. Каждые 2 ме- сяца. 3.5.4. 1. 474, ]/10730 лет, l/УТо лет, 158. 2. 2000 Д/б/З. 3. 10000; 1,7 фунта стерлингов. 4. (а) 5% увеличения; (б) 5% увеличения. ’ 3.5.5. 3. у* = 130; 4 дня; уменьшение затрат на 44 фунта стерлингов. 4. у* = J/ L* = ~|/Продолжительность цикла равна 27,7 (28 дней); 120. 6. Увеличение в ~]/2.
ТАБЛИЦА 1. ПЛОЩАДИ ПОД КРИВОЙ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ Z 0,00 0,01 0,02 0,03 0,04 0,05 0.06 0,07 0,08 0,09 0,0 0,000( 10,004 0 0,008! >0,012 3 0,0161 1 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,039! 10,043 3 0,047! 3 0,051 7 0,055' 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,079. 10,083. 2 0,087 0,091 10,094! 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1171 3 0,121 7 0,1255 >0,129 3 0,133 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,155' 10,159 0,1625 0,16К 10,1701 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1911 >0,195( 10,1985 ) 0,201! 10,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,225' 0,229 0,232' 10,235' 7 0,238! 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,258( 10,261 0,2642 0,2675 3 0,2707 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,288: 0.291С 10,2939 0,296' 41,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3151 10,318! 0,3212 0,323! 3 0,3267 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,341.' 0,3435 0,3461 0,3485 >0,350! 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3645 0,3665 0,3686 0,370! 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 3,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 3,4955 3,4956 1,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 3,4965 1,4966 3,4967 1,4968 3,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 3,4974 1,4975 3,4976 1,4977 3,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 1,4981 1,4982 3,4982 1,4983 1,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 1,4987 ( 1,4987 1,4987 6 1,49881 1,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 ( 1,4990 С 1,4991 1,4991 С ,4991 1,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,2 ( 1,4993 С ,49931 1,4994 С 1,49941 1,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 С ,4995 С ,4995 С ,49951 ,49961 1,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 С ,4997 С ,4997 С ,49971 ,49971 1,4997 1 0,4997 0,4997 0,4997 0,4997 0,4998 416
ТАБЛИЦА 2. /-РАСПРЕДЕЛЕНИЕ СТЫОДЕНТА О t ~tot Для односторонней проверки Для двусторонней проверки —• Проверка: односто- ронняя двусторон- няя Q % 5 10 2,5 5 1 2 0,5 1 0,1 0,2 0,05 0,1 *V—1 6,31 12,71 31,82 63,66 318,3 636,6 2 2,92 4,30 6,96 9,92 22,33 31,60 3 2,35 3,18 4,54 5,84 10,21 12,92 4 2,13 2,78 3,75 4,60 7,17 8,61 5 2,02 2,57 3,36 4,03 5,89 6,87 6 1,94 2,45 3,14 3,71 5,21 5,96 7 1,89 2,36 3,00 3,50 4,79 5,41 8 1,86 2,31 2,90 3,36 4,50 5,04 9 1,83 2,26 2,82 3,25 4,30 4,78 10 1,81 2,23 2,76 3,17 4,14 4,59 12 1,78 2,18 2,68 3,05 3,93 4,32 15 1,75 2,13 2,60 2,95 3,73 4,07 20 1,72 2,09 2,53 2,85 3,55 3,85 24 1,71 2,06 2,49 2,80 3,47 3,75 30 1,70 2,04 2,46 2,75 3,39 3,65 40 1,68 2,02 2,42 2,70 3,31 3,55 60 1,67 2,00 2,39 2,66 3,23 3,46 оо 1,64 1,96 2,33 2,58 3,09 3,29 417
ТАБЛИЦА 3. НОРМАЛЬНЫЕ СЛУЧАЙНЫЕ ОТКЛОНЕНИЯ р.=0, о=1 —0,323 1,274 —0,655 1,027 —0,097 —0,357 —1,940 —0,287 1,041 0,078 1,238 1,828 0,699 0,161 —0,899 — 1,657 —0,146 0,554 3,524 —1,346 —1,114 —0,344 — 1,698 —2,068 0,324 1,255 1,278 0,665 —1,044 0,031 0,595 —0,531 —0,144 0,328 —0,521 0,151 0,769 —0,632 —0,886 —0,009 2,990 0,298 —0,138 1,274 0,193 0,110 —1,473 0,984 —0,445 0,047 —0,198 1,292 —0,852 —0,287 0,761 —0,522 0,464 0,586 0,084 1,042 —1,229 0,007 0,060 —0,381 —0,876 0,211 —0,562 —0,166 1,468 —0,841 0,428 1,262 1,597 —1,618 1,020 1,202 —0,528 —0,574 —0,724 0,378 1,399 —0,288 — 1,433 0,034 1,233 1,356 0,906 —0,668 —0,110 — 1,334 0,360 —0,057 —1,501 0,534 0,574 —0,227 1,047 —0,918 —0,690 0,577 —0,509 0,161 0,420 0,012 1,179 2,945 —0,394 —1,344 1,377 —0,911 —0,482 0,926 1,822 1,255 —0,873 1,238 —1,377 0,882 0,296 0,566 0,544 —1,388 —1,100 0,719 —1,558 2,923 0,882 —0,958 —0,004 1,033 1,375 —1,192 —1,210 0,731 1,393 —0,511 —1,851 0,942 0,897 —1,633 —1,788 —С'486 1,977 1,261 0,644 1,112 —0,105 —0,256 —0,935 —1,001 —0,217 —1,632 1,041 0,181 0,712 2,053 0,083 1,155 0,279 0,065 0,203 —2,357 —0,774 —1,947 —1,805 1,147 —2,051 0,565 0,790 1,385 —1,189 —0,199 —0,736 0,578 0,144 —1,080 —0,439 —0,508 0,856 0,552 0,137 —0,324 0,664 —0,992 0,212 0,244 —2,625 0,607 1,398 0,969 0,415 0,866 —0,353 0,121 0,154 0,989 —0,121 — 1,298 —0,427 0,944 2,277 —1,096 —0,266 —1,097 —0,585 —0,531 0,041 0,250 —1,631 —0,041 —2,008 —1,055 —1,132 1,265 —0,110 —1,482 ’ 1,187 —0,489 0,088 —0,927 — 1,144 —0,625 —1,141 0,756 1,414 —0,227 —1,337 1,627 0,209 0,225 —0,901 —0,558 —1,398 1,189 0,287 —0,307 1,670 —0,291 —1,662 —0,040 0,607 —2,098 —0,150 —2,828 0,427 1,105 1,118 —0,288 0,598 —0,247 0,608 —2,079 —0,792 0,178 —0,899 —0,584 0,231 —0,174 0,063 0,785 —1,163 0,444 1,228 —1,411 0,459 0,194 1,579 —0,059 —0,587 0,283 0,023 0,788 1,090 1,354 1,294 0,430 —0,284 0,375 0,447 —0,818 0,545 —0,750 1,206 —0,513 —0,457 0,614 —2,661 1,204 —0,491 0,282 0,961 —0,981 —0,438 0,969 —2,122 0,004 0,482 —0,169 —0,261 0,020 418
ТАБЛИЦА 4. ЗНАЧЕНИЯ r=th z z 0,00 0,02 0,04 0,06 0,08 0,0 0,000 0,020 0,040 0,060 0,080 0,1 0,100 0,119 0,139 0,159 0,178 0,2 0,197 0,217 0,236 0,254 0,273 0,3 0,291 0,310 0,328 0,345 0,363 0,4 0,380 0,397 0,414 0,430 0,446 0,5 0,462 0,478 0,493 0,508 0,523 0,6 0,537 0,551 0,565 0,578 0,592 0,7 0,604 0,617 0,629 0,641 0,653 0,8 0,664 0,675 0,686 0,696 0,706 0,9 0,716 0,726 0,735 0,744 0,753 1,0 0,762 0,770 0,778 0,786 0,793 1,1 0,801 0,808 0,814 0,821 0,828 1,2 0,834 0,840 0,846 0,851 0,857 1,3 0,862 0,867 0,872 0,876 0,881 1,4 0,885 0,890 0,894 0,898 0,902 1,5 0,905 0,909 0,912 0,915 0,919 1,6 0,922 0,925 0,928 0,930 0,933 1,7 0,936 0,938 0,940 0,943 0,945 1,8 0,947 0,949 0,951 0,953 0,955 1,9 0,956 0,958 0,960 0,961 0,963 419
ЛИТЕРАТУРА 1. Lipschutz S. Theory and Problems of Set Theory and Related Topics. Schaum Publishing Co. 2. Berge C. The Theory of Graphs. Methuen & Co. Ltd. Русский перевод: Б e p ж К. Теория графов и ее применение. М., Физматгиз, 1962. 3. Busacker R. G. and Saaty Т. L. Finite Graphs and Networks. McGraw- Hill Book Co. Inc. 4. M о г о n e у M. J. Facts from Figures. Pelican Books Ltd. 5. M u г г a у R. Theory and Problems of Statistics Speigel, Schaum Publishing Co. New York. 6. Brookes В. C. and Dick W. F. L. Introduction to Statistical Method. W. Heinemann Ltd. 7. Moore P. G. Principles of Statistical Techniques. Cambridge University Press. 8. Mode E. B. Elements of Probability and Statistics. Prentice-Hall Inc. 9. Goodman R. Teach Yourself Statistics. English Universities Press Ltd. 10. Goldberg S. Probability — an Introduction. Prentice-Hall Inc. 11. Parzen E. Modern Probability Theory and its Applications. J. Wiley & Sons. Inc. 12. Feller W. An Introduction to Probability Theory and its Applications, Vol, 1, 2nd Edn. J Wiley & Sons. Inc. Русский перевод: Феллер В. Введение в теорию вероятностей и ее приложения. Т, 1. М., «Мир», 1964; т. 2. М., «Мир», 1967. 13. W е a t h е г b u г п С. Е. A First Course in Mathematical Statistics. Cambridge University Press. 14. Hoel P. G. Introduction to Mathematical Statistics. J. Wiley & Sons. Inc. 15. M о о d A. M. and Graybill F. A. Introduction to the Theory of Statistics. McGraw-Hill Book Co. Inc. 16. Kenney J. F. and Keeping E. S. Mathematics of Statistics. 3rd Edn. Pt. I, 2nd Edn. Pt. II, D. Van-Nostrand Co. Inc. 17. Maxwell A. E. Analysing Qualitative Data. Methuen & Co. Ltd. 18. Lindley D. V. and Miller J. С. P. Cambridge Elementary Statistical Tables. Cambridge University Press. 19. Pearson- E. S. and Hartley H. 0. Biometrika Tables for Statisticians. 2nd Edn. (two vols.). Edtrs, C.U.P. 20. В u r i n g t о n R. S. and May D. C. Handbook of Probability and Statistics with Tables. McGraw-Hill Book Co. Inc. 21. Crow E. L., D a v i s F. A. and Maxfield M. W Statistics Manual. Do- ver Pub. Inc. 22. Kerne ny J. G. and Snell J. L. Finite Markov Chains. D. Van Nostrand Co. Inc. • • 23. Cox D. R. and Smith W. L. Queues. Methuen & Co. Ltd. Русский перевод: Кок с Д. P., Смит У. Л. Теория очередей. М., «Мир», 1966. 24. S a a t у Т. L. Elements of Queueing Theory with Applications. McGraw-Hill Book Co. Inc. Русский перевод: С а а т и T. Элементы теории массового об- служивания и ее приложения. М„ «Советское радио», 1965. 25. Tocher К. D. The Art of Simulation. E.U.P. Ltd. * Библиографические источники 40—55 добавлены переводчиками и научным редактором. 420
26. Gass S. I. Linear Programming. McGraw-Hill Book Co. Inc. Русский пе- ревод: Гасс С. Линейное программирование. М., Физматгиз, 1961. 27. G ale D. The Theory of Linear Economic Models. McGraw-Hill Book Co. Inc. Русский перевод: Гейл Д. Теория линейных экономических моделей. М., ИЛ, 1963. 28. Lockyer К. G. An Introduction to С. Р. A. Sir Isaac Pitman & Sons. Ltd. 29. Battersby A, Network Planning. Macmillan & Co. Ltd. 30. Magee J. F. Production Planning and Inventory Control. McGraw-Hill Book Co. Inc. 31. Hadley G. and Whitin T. M. Analysis of Inventory Systems. Prentice- Hall Inc. 32. S t а г r M. K. and Miller D. W. Inventory Control: Theory and Practice. Prentice-Hall Inc. 33. Thompson W. W. Jr. Operations Research Techniques. Merrill Books, Inc. 34. Teach Yourself Operational Research. English Universities Press Ltd. 35. P e n n у c u i c k K. et al. Operational Research in Management. English Uni- versities Press Ltd. 36. Sasieni M. et al. Operations Research — Methods and Problems. Wiley & Sons. Inc. 37. Churchman C. W. ct al. Introduction to Operations Research. J. Wiley & Sons. inc. Русский перевод: Черчмен У., Акоф Р., Арноф Л. Введе- ние в исследование операций. М., «Наука», 1968. 38. S a a t у Т. L. Mathematical Methods of Operations Research. McGraw-Hill Book Co. Inc. 39. God da rd L. S. Mathematical Techniques of Operational Research. Pergamon Press Ltd. 40. Bay мол ь У. Экономическая теория и исследование операций. М., «Про- гресс», 1965. 41. Бор ель Э. Вероятность и достоверность. М., Физматгиз, 1961. 42. В е н т ц е л ь Е. С. Теория вероятностей. М., Физматгиз, 1958. 43. Вентцель Е. С. Исследование операций. М., «Советское радио», 1972. 44, Гнеденко Б. В. Курс теории вероятностей. М, Физматгиз, 1961. 45. Гнеденко Б. В., Хинчин А. Я. Элементарное введение в теорию ве- роятностей. М., «Наука», 1970. 46 Дынкин Е. Б. Основание теории марковских процессов. М., Физматгиз, 1959. 47. Зу хов иц кий С. И., Авдеева Л. И. Линейное и выпуклое программи- рование. М., «Наука», 1967. 48. Карлин С. Основы теории случайных процессов. М., «Мир», 1971. 49. КеидэлМ. Ранговые корреляции. М., «Статистика», 1975. 50. Кендалл М., Стьюарт А Статистические выводы и связи. М., «Наука», 1973. 51. Климов Г. П. Стохастические системы обслуживания. М., «Наука», 1966. 52. Кривцов А. М„ Шеховцев А. В. Сетевое планирование и управление. М., «Экономика», 1969. 53. Л ур ье А. Л. Методы линейного программирования и их применение в эко- номике. М., «Статистика», 1964. 54. Четыркин Е. М. Теория массового обслуживания и ее применение в эко- номике. М., «Статистика», 1971. 55. Юдин Д. В., Гольштейн Е. Г. Линейное программирование. Теория, методы и приложения. М., «Наука», 1969.
АЛФАВИТНЫЙ УКАЗАТЕЛЬ Абсолютная величина 79 Аксиома вероятности 116 Алгебраическое дополнение 62, 63 Алгебра множеств, основные законы 29 Альтернативные гипотезы 227 Аналоговая модель 276 Аппроксимация биномиального рас- пределения нормальным 188, 189 — пуассоновского распределения нормальным 188, 189 Арифметическое среднее 42, 148, 150 Асимметричное распределение 145 Асимметрия, измерение по Пирсону 159 Ассоциативность операций алгебры множеств 29 ----над матрицами 54, 60 Байеса теорема 127 Бернулли Я. 179 — испытания 179 Бесконечные графы 94 — интервалы 78 Бесконечное множество 15 Бимодальное распределение 144 Бинарные операции 23 Биномиальное распределение 176, 179, 188 Биномиальные коэффициенты 41, 121 Биномиальный ряд 41 Борелевское поле 114 Борель Э. 114 Булевское поле 114 Буль Дж. 114 Вариация 151 Вектор вероятностей начальный 283 Вектор-столбец 41, 49 Вектор-строка 41, 49 Венн Дж. 18 Венна диаграмма 18 Вероятная ошибка оценивания 220 Вероятности на произведении про- странств 127 — противоположных событий 117 422 Вероятностная ф}'нкция Лапласа 119 Вероятностное пространство случай- ного эксперимента 117 Вероятность 105 — классическое определение 120 — объединения событий 118 ---взаимно независимых событий 116 — перехода п-шаговая 288 ---одношаговая 282 — полная (безусловная) 289 — события 164 Вершины графа (четные, нечетные) 91, 92 Взаимно несовместимые события 113 Включение 16, 19 —'для событий 113 Временной ряд 136 Время обслуживания 311 — ожидания в очереди 311 — осуществления проекта полное 371 Входящий поток требований 311 Выборка 42, 132, 133, 191 — малая 223 Выборочная дисперсия 42 — точка 106 Выборочное пространство 21 — распределение 200 Выборочные статистики 200 — характеристики 42 Выбор тестовой .статистики критерия 228 Выпуклое множество 86 Вырожденная матрица 71 -- перевозок 351 Вычитание матриц 55 Гальтон Ф. 260 Гауссово распределение 178 Геометрическое распределение 176, 177 Гиперплоскость 85 Гипотезы статистические 226, 227 Гистограмма 138, 141 Главная диагональ матрицы 49
Границы группы 140 Граф 90 — направленный 103 — связный, несвязный 98 График изменения запаса 383 — рассеяния эксперимента 245 Группировка данных 139 Данциг Дж. 337, 354 Двойное суммирование 44 Двойные индексы 45 — неравенства 78 Двойственная задача линейного про- граммирования 362 Двойственности принципы 32, 33 Двойственность 32, 33 — себе 33 Двойственные символы 32 Двумерные эксперименты 243 Двусторонняя альтернатива 227 Двухвершинное распределение 144 Действия над неравенствами 76 Декатили 151 Дерево 94, 101 Детерминированная модель 277 — система обслуживания 317 Диаграмма Венна 18 — круговая 136 — прямоугольная (вертикальная, горизонтальная) 137 Дискретное множество 36 — распределение 160 Дисперсия 144, 153, 173 — внутренняя 222 — выборочная 42 — разности средних двух выборок 207, 208 — суммы и разности случайных величин 207 Дистрибутивность операций алгебры множеств 29, 30 -----над матрицами 60 Дисциплина обслуживания 311 — очереди 311 Длина очереди 311 — цепи 97 Доверительное интервальное оцени- вание 217 Доверительные пределы (нижний, верхний) 218 Доверительный интервал 217 ---для коэффициента корреляции 255 — коэффициент 218 Доля выборки в совокупности 208 Дополнение множества 22 Дополнительности закон 33 Дополнительные события 112 Допустимое множество, задаваемое неравенством 338 — решение задачи линейного про- граммирования 339 Достигнутое событие в сетевом пла- нировании 369 Достоверное событие 112 Единичная матрица 49 Задание вероятностей 118—120 — множества 14 Задача линейного программирования 336 ------стандартная 361 — управления запасами 382 — чистой регрессии 260 Законы алгебры множеств 29 Замкнутая полупрямая 78 Замкнутое выпуклое множество 86 — множество 86 Значимость коэффициента корреля- ции 252 Идемпотентные законы алгебры мно- жеств 29 Издержки, связанные с дефицитом 385 — содержания запасов 384 Измерения на интервальной шкале 138 ----относительной шкале 138 Изолированная вершина 93, 94 Иконическая модель 276 Индексы 37 Интегрирование 36 Интенсивность спроса 385 Интервал 78 Интервальное оценивание 216 Инцидентность ребра вершине 93 Испытания Бернулли 179 Исследование операций 279 Истинное распределение вероятностей 163 Исход 106 Исходов множество 21 Квадратная матрица 49 Квартили 151 Кендэл Д. Г. 323, 325 Кендэла система обозначений 325 Классификация 138 Класс множеств 18 Ковариация выборочная 248 Колоколообразное распределение 144 Комбинаторные'задачи 120 Коммутативность операций алгебры множеств 29, 33 — сложения матриц 54 Компонента графа 99 423
Конечное множество 15 Конечные графы 94 Концевые точки ребра 93 Концы отрезка (интервала) 78 Координаты точки в /г-мерном про- странстве 85 Корень дерева 94 Коррелированные полностью пере- менные 247 Корреляция 247 — ранговая 256 Кососимметрическая матрица 61 Коэффициент асимметрии Пирсона (первый, второй) 159 — доверия 218 — корреляции 248 ---, вычисление 250 — - ранговой корреляции 257 — Спирмана 257 Коэффициенты биномиальные 41 — регрессии 267 Критерии сравнения 236 Критерий оптимальности для задачи линейного программирования 362, 363 Критическая область гипотезы 228 Критический путь 371 Критическое значение 218 Кумулятивная вероятностная огива 169 — вероятность 169 — функция распределения (к. ф. р.) — частота 141 Кумулятивный частотный много- угольник 141 Купманс Т. 354 Лапласа вероятностная функция 119 Линейная корреляция (положитель- ная, отрицательная) 247 Линейное программирование 336 Линейные неравенства 80 Ложные корреляции 259 Марков А. А. 280 Марковская цепь конечная стацио- нарная 284 Марковский процесс 284 Маршрут 96 Математическая модель эксперимента 105 Математическое ожидание 42, 171 Матрица 48 — алгебраических дополнений 69 — вероятностей переходов « шаго- вая 288 — вырожденная 71 — коэффициентов системы линей- ных уравнений 51 — переходов 282 -----, каноническая форма 301 ------ регулярная 293 — присоединенная 69 Медиана 146, 150 — выборки 143, 208 Метод Монте-Карло 195, 320 — наименьших квадратов 261 — определения критического пути 372 — северо-западного угла 346 — сравнения элементов 31 Методы линейного программирова- ния 336 Минор 62, 63 Многовершинное распределение 144 Многоугольник кумулятивных частот 141 Множество 14 — бесконечное 15 — вероятностей 115 — выпуклое 86 — замкнутое 86 — исходов 21 — конечное 15 - — подмножеств 27 — работ плана 366 —, способ конструирования 14 —, точка, член, элемент 14 Мода 144, 146, 150 Модальная группа 146 Моделированная выборка 195 Модель 276 — массового обслуживания 311 — производственных поставок 389 - — сетевая 365 — символическая 277 — управления запасами 382 Модуль 79 Моментов произведение 248 Момент распределения первый 172 ---г-й 173 Моменты нормального распределения 182, 183 Монте-Карло метод 195, 320 Моргана законы 29, 30, 31, 33 Мультимодальное распределение 144 Наилучшая (наиболее эффективная) оценка 213 Направленный граф 92 Наступившее событие в сетевом пла- нировании 369 Начальное событие в сетевом плани- ровании 368 Научный метод 277 Невозможное событие 111 Независимость событий 124, 127 Независимые расположения клеток матрицы транспортной задачи 345 Независимый резерв времени 375, 377 424
Некоррелированные переменные 247 Немой индекс 37 Ненаправленный,граф 92 Непересекающиеся множества 16, 19 Непрерывная случайная переменная 164 Непрерывное распределение 164 Непрерывные множества 36 Непрерывный маршрут 96 Неравенства 76 — нестрогие 76 »— с двумя неизвестными 82 — строгие 76 — с одним неизвестным 81 Несмещенность точечной оценки 211 Несчетность 87 Неустойчивое состояние 291 Нечетная вершина графа 91, 94 Неэффективная оценка 213 Нормальная стандартная ф. п. в. 178 Нормальновершинное распределение 145 Нормальное распределение 144, 178, 182 Нормальные уравнения регрессии 262 Нулевая гипотеза 227 — матрица 49 Нулевое множество 17 Область исследования 21 — принятия гипотезы 228 Обозначение множеств 14 Обратная матрица 51, 69, 71 Объединение выборок 214 — множеств 23 — событий 113 Объединенные несмещенные оценки 215 Огива 196 — вероятностная кумулятивная 169 — процентная 141 — совокупности 169 Ограничения задачи линейного про- граммирования 335, 336, 361 Одновершинное распределение 144 Односторонняя проверка гипотезы 232 Одношаговая вероятность перехода 282 Оператор суммирования 36, 37 Операции над множествами 22 ---переменными с двойными ин- дексами 45 Операция суммирования 36 Описательные статистики 133 Опорное решение 356 Опорные переменные 356 Определение объема выборки 228 Определитель матрицы 61—65, 67 Оптимальное решение задачи линей- ного программирования 339 Оптимальный размер партии 387 391 Оптимизационные задачи 333 Оптимум 337 Организационные издержки 384 Ориентированные отношения 92 Основная теорема линейного про- граммирования 364 Островершинное распределение 145 Отклонение от средней 152 — стандартное 152 Открытая полупрямая 78 Относительная частота 118 Отношение включения 16 — порядка 75, 76 Отношения направленные 92 Отрезок 78 Оцениваемые помехи 191 Оценивание параметров совокупности 191 Оценка кумулятивной функции рас- пределения (к. ф. р ) 169 — точечная 211 Очередь 310, 311 Ошибка наблюдения 191 — оценивания вероятностная 220 Параллельные ребра 93 Параметрическое уравнение прямой 88 Параметры распределения 145 Парные эксперименты 243 Переменные с двойными индексами 45 Пересечение множеств 23, 25 --- выпуклых 86 Персентили 151 Петля 93 Пирсона коэффициент асимметрии (первый, второй) 159 Планирование экспериментов 228 Поглощающая марковская цепь 292, 300 Поглощающие состояния 287, 291, 300 «Подгонка» прямой 260 Подграф 98 Подмножество 16 — собственное 16 Поле событий 114 Полная вероятность 287 —— предельная марковской цепи 297 Положительность числа 75 Полуинтервал 78 Полуотрезок 78 Полупространство 85 Помехи 191 Порядок матрицы 48 Последовательность независимых экспериментов 129 425
Последующее событие в сетевом пла- нировании 369 Построение проекта 365 Поток требований 311 Появление события 110 Правило проверки гипотез 230 Правило сложения вероятностей 116 Пределы группы 140 Предельный вектор марковской цепи 295 Представительная выборка 192 Принадлежность элемента множеству 15 Принцип двойственности 32, 33 Принятие статистических решений 226 Приоритет 311 Присоединенная матрица 68, 69 Проверка гипотез 227, 230 Прогнозы 133 Продолжительность работы 369 Произведение векторов скалярное 41, 56 - — матриц 57—59 ---, некоммутативность 60 - — пространств прямое 108 — событий 113 Производящая функция вероятности 182 Пропорциональная стратифицирован- ная выборка 195 Простая случайная выборка 193 Простое событие 111 Пространство выборочное 21 — исходов 106, 109 -- дискретное 107 ---непрерывное 107 - — состояний 281 Противоположные события 112 Процентная огива 141 Процесс 281 Прямая нулевой прибыли 339 Прямое произведение пространств 108 Прямоугольное распределение 178 Прямоугольные цепи в матрице транс- портной задачи 345 Пуассон С. Д. 177 Пуассоновское распределение 176, 177, 178 Пустое множество 17 Путь 103 Работа 365, 366 Равенство матриц 53 — множеств 17 Равномерное распределение 178 Разбиение 27, 28 — графг1 на связные компоненты 99 Разброс 42 Разложение в ряд 41 — на множители 35 Размер партии 384 ------ оптимальный 387 Размещения 121 Разность двух средних, тестовая ста- тистика 239 — множеств 23, 24 — событий 113 Разрешающая строка 356 Разрешающий элемент 356 Ранги 256 Ранговая корреляция 256 Ранжирование 138, 256 Распределение асимметричное 145 — Бернулли 179 — бимодальное 144 — биномиальное 176, 179, 188 — вероятностей 163 --- дискретное 160 --- истинное 163 --- непрерывное 164 — выборочного среднего 202 • — выборочное 200 — гауссово 178 — геометрическое 176, 177 — двухвершинное 144 — дискретное 160 — колоколообразное 144 — мультимодальное 144 — непрерывное 164 — .нормальновершпнное 145 — нормальное 144, 178, 182 — одновершинное 144 — островершинное 145 — прямоугольное 170 — пуассоновское 176, 177, 178 — равномерное 178 — скошенное 145 — совокупности 911 — Стыодепта (/-распределение) 223 — частот 138 — J-образное, Л-обратное, U-образ- ное 144 Распределения —. стандартные фор- мы 144 Рассеяние 42 Ребро графа 91, 92 — ориентированное 103 Регрессия 260 Регулярная марковская цепь 292, 293 — матрица переходов 293 Резерв времени работы независимый, общий, свободный 375 Репрезентативная выборка 192 Ряды 41 — наблюдений 135 Сбор данных 132 426
Свободный резерв времени 375, 376 Сезонные колебания 136 Серия экспериментов 108 Сетевая модель 365 Сетевое планирование 365 Сеть 90 Семейство множеств 18 Символическая модель 277 Симметрическая матрица 61 Симметричное распределение 144 Симплекс-метод 337, 354 Система линейных неравенств с дву- мя неизвестными 84 ------с одним неизвестным 81 -—--- с тремя и большим числом неизвестных 85 ----уравнений 50 ----, решение 72 — массового обслуживания ----М/М/1 322, 323, 325 Скалярное произведение 41, 56 Скошенная статистическая совокуп- ность 133 Скошенное распределение 145 Слагаемое 37 Сложение матриц 53 Случай 106 Случайная переменная 160 ---- дискретная 160 ----непрерывная 104 Случайные нормальные отклонения 197 Случайный процесс 280, 281 —, эксперимент 104 Смежные ребра 93 Смещенная точечная оценка 211 Собственное подмножество 16 Событие 105, ПО — в сетевом планировании 367 -------- достигнутое 369 --------наступившее 369 -------- начальное 368 --------последующее 368 -------предшествующее 368 Совокупность статистическая 132 Составной эксперимент 108 Состояние 106 — неустойчивое 291 — поглощающее 291, 300 — эргодическое 291 Состоятельность точечной оценки 213 Сочетания 121 Спирмана коэффициент ранговой кор- реляции 257 Список 14 Среднее арифметическое 42, 148, 150 — выборки 208 — выборочного среднего 203 — разности средних двух выборок 207, 208 — суммы и разности случайных величин 206 Стадия анализа 366 — планирования 366, 370 — управления 366, 381 Стандартизированные оценки 184, 185 Стандартизированная случайная пе- ременная 175, 184 Стандартная задача линейного про- граммирования 361 — нормальная кривая 182 -----ф. п. в. 178 -— ошибка 211 -----выборочной статистики 203 Стандартное отклонение 152 ---выборки 208 Стандартные распределения 175 Статистика критерия 227 — теста 227 Статистики выборочные 200 — описательные 133 Статистическая зависимость 243 — процедура 132 — теория проверки гипотез 210 Статистические выводы 133, 210 — гипотезы 226, 227 — решения 133, 226 Статистически зависимая переменная 260 Статистическое исследование 132 — оценивание 210 Стационарное распределение вероят- ностей для длины очереди 327 -----марковской цепи 295 -----, метод отыскания 297 Стационарные вероятности перехода 283 Степень вершины 94 — свободы 224 Столбец матрицы 48 Стохастическая матрица 52, 283 — модель 277 — переменная 160 Стохастические системы обслужива- ния 317 Стохастически независимые события 124 Стратифицированная случайная вы- борка 194 -------- пропорциональная 195 Строка матрицы 48 Стьюдента /-распределение 223 Сумма матриц 53 Суммирование 36 Счетность 87 Таблица 14 — сгруппированных частот 139 — случайных чисел 197 Теневые затраты 348 427
Теорема Байеса 127 ---линейного программирования основная 364 — о среднем выборочного среднего 203 — центральная предельная 182, 204 Теория больших выборок 210 — малых выборок 223, 238 • — множеств 14 — очередей 310 • — проверки гипотез 210 — статистических решений 226 — статистического оценивания 210, 211 Тест двусторонний, односторонний 229 Тождества законы 29, 33 Точечная оценка 211 Точка в «-мерном пространстве 85 Транзитивность отношений порядка 76 Транспонированная матрица 61 Транспортная задача 51, 334, 341 Тренд 133 Треугольная матрица 72 Туповершинное распределение 145 Умножение матриц 57—59 ---, некоммутативность 60 — матрицы на скаляр 55 Универсальное множество 21 Упорядочение чисел 75 Управление запасами 382 Уровень значимости критерия 228 Условие равенства множеств 17 Условная вероятность 124 Фишер Р. А. 253 Форма оптимального размера партии 388, 391 — условной вероятности 124 Фундаментальная матрица цепи 303, 306 Функционально связанные случайные переменные 247 Функция вероятности (ф. в.) 160, 161 — времени ожидания обслужива- ния 314 — изменения запаса 383 — Лапласа вероятностная 119 — плотности вероятности (ф. п. в.) 164 распределения кумулятивная (к. ф. р.) 169 — целевая 335, 361 Целевая функция 335, 361 Центральная предельная теорема 182, 204 Цепь 97 — замкнутая 97 — марковская конечная 284 ----поглощающая 292, 300 ---- регулярная 292, 293 ---- циклическая 292 — эргодическая 287, 292 — открытая, простая, сложная, элементарная 97 — событий 281 Цикл (простой, сложный, элементар- ный) 97 Циклическая марковская цепь 292 Циклическое эргодическое множество 291 Чарли проверка 157 Частота 43, 137 — интервала 139 — появления события 105 Частотная таблица 137 Частоты групп 141 Частотный многоугольник 138 ----кумулятивный 141 Четная вершина 91, 94 Ширина группы 140 Штрафы 385 Элементарное событие 106, 111 Элемент суммирования 37 Элементы матрицы 48 — множества 14 Эксперимент 104 — со случайным исходом (случай- ный) \04 Элементы двумерные 243 Экспонента 41 Экспоненциальное распределение 178 Эксцесс 145 Эргодическая марковская цепь 287, 292 Эргодическое состояние 291 Эрланг А. К.. 310 Эффективность точечной оценки 212
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ [я, b (a, b); ] а, b | (а, Ь]; [я, Ь)\ | а, 6]; [а, b — отрезок 79 — интервал 78 — полуотрезки, полуинтервалы 78 — модуль, абсолютная величина 78 — число элементов множества X 94 S1S2— прямое произведение пространств Sj и S2 109 а С А, b (? А— элемент а принадлежит множест- ву Л. элемент b не принадлежит множеству А 15 0— пустое множество 17 S— универсальное множество 21 А={1, 2, 7, 8}— 15 :х есть натуральное число}— 15 Y={y.y> 3}— 15 В су- А, В CZ А— отношение включения — множест- во В является подмножеством множества А 16 В А— отрицание включения 16 А'— дополнение множества 22 A (J В— объединение множеств 23 А В— пересечение множеств 23 А—В, А/В, А\В, А~Р,— разность множеств 23, 24 $— разбиение 27, 28 50 (.8)— множество подмножеств множест- ва S 27 п хг— оператор суммирования 37 сгп,псг, О- • • • с1п » xm)t Н'1 • Ят]- - У1 ~ биномиальные коэффициенты 121 вектор-строка 41, 49 вектор-столбец 41, 49 41, i = l, т = [Qj] • , — матрица 48 / = !,...,« А-1— обратная матрица 51, 69 | А |— определитель матрицы А 61 А'— транспонированная матрица 61 I— единичная матрица 49 О— нулевая матрица 49 Adj (А)— матрица, присоединенная к А 69 01 > ; {«л, ...,ут}— • • • 429
f— частота 141 F— кумулятивная частота 141 F (v)— кумулятивная функция распреде- ления (к. ф. р.) 169 z 1 С Ф (г) = - I ехр (—x^ltydx— площадь под кривой нормального ' J распределения 183 р (х)— функция плотности вероятности (ф. п. в.) 164 х среднее арифметическое 42 148 х— медиана 146 х—• мода 146 р, Е (X)— математическое ожидание сово- купности 171 о2, Var(X), Var (х)— дисперсия совокупности 153, 173 о, S.D. (X), S.D.— стандартное отклонение совокуп- ности, стандартная ошибка 153, 173, 211 Е (Хг) — г-й момент распределения сово- купности 173 т, s— выборочная оценка среднего и выборочная оценка стандартного отклонения совокупности 211 г коэффициент корреляции (выбо- рочный) 248 р коэффициент корреляции совокун- ' ности 252 R— коэффициент Спирмана ранговой корреляции 257 — выборочная ковариация X и У 248 V - число степеней свободы 224 77о— нулевая гипотеза 227 А (х;р, о2), N (р, о2)_ закон нормального распределения 179 Р (х‘, - закон пуассоновского распределе- ния 179 . 6(х;п, р) — закон биномиального распределе- ния 179 W (t)— функция времени ожидания обслу- живания 314 6 (о) — степень вершины графа 94
ОГЛАВЛЕНИЕ Предисловие к русскому изданию .................... ... !> Предисловие...................................................... Ю Часть первая НЕКОТОРЫЕ ПОНЯТИЯ СОВРЕМЕННОЙ МАТЕМАТИКИ Вводные замечания .................................................... 12 Глава 1.1. Теория множеств..................................... Глава 1.2. Оператор суммирования ... .......................... Глава 1.3. Матрицы ................ ........................... Глава 1.4. Неравенства......................................... Глава 1.5. Теория графов............. ...................... Часть вторая ВЕРОЯТНОСТЬ и статистика Глава Глава Г лава Глава Глава Глава Глава Глава Глава 2.1. Теория вероятностей................................. 2.2. Введение в статистику: распределение частот......... 2.3. Описательные статистики............................. 2.4. Распределение вероятностей ... ..................... 2.5. Выборка........................ .................... 2.6. Выборочные распределения............................ 2.7. Статистические выводы............................... 2.8. Парные (двумерные) эксперименты..................... 2.9. Задачи ко второй части.............................. Часть третья ПРИКЛАДНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ Глава 3.1. Цепи Маркова.......................................... Глава 3.2. Некоторые модели теории очередей...................... Глава 3.3. Линейное программирование............................. Глава 3.4. Сетевое планирование.................................. Глава 3.5. Управление запасами .................................. Ответы........................................................... Литература....................................................... Алфавитный указатель............................................. Указатель обозначений............................................ И 36 48 75 90 104 132 144 160 191 200 210 243 268 280 310 333 365 382 397 420 422 429
Тёрнер Д. Т35 Вероятность, статистика и исследование операций. Пер. с англ. Е. 3. Демиденко и В. С. Занадворова. Под ред. А. А. Рывкина. М„ «Статистика», 1976. 431 с. с ил. (Б-чка иностр, книг для экономистов и статистиков). Книга посвящена вопросам современной прикладной математики, теории вероятностей, математической статистики и некоторых разделов исследования операций. Автор в популярной форме рассматривает теорию множеств, матри- цы, неравенства, графы, метод вычисления основных статистик, теорию выбор- ки, теорию оценивания. Книга может служить как учебным пособием, так и справочником. Опа полезна научным и практическим работникам, преподавателям, аспирантам и студентам. 10805М55 Т ----------- 008 (01)-76 517.8 1 Второй индекс 10803. Д. ТЁРНЕР Вероятность, статистика и исследование операций Редактор Е. В. Крестьянинова Мл. редактор О. Б. Степанченко Техн, редактор Л. Г. Челышева Корректоры Д. Б. Островский, И. П. Елкина Худ. редактор Т. В. Стихно Сдано в набор 25/V 1976 г. Подписано к печати 17/XI 1976 г. Формат бумаги 60X90V16- Бумага № 3. Объем 27,0 печ. л. Уч.-изд. л. 29,71 Усл. п. л. 27,0. Тираж 18000 экз. (Тематич. план 1976 г. № 117) Заказ № 973 Цена 1 р. 92 i Издательство «Статистика», Москва, ул. Кирова, 39. Московская типография № 4 Союзполиграфпрома при Государственном комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли г. Москва, И-41, Б. Переяславская ул., дом 46.