Text
                    В РО-ТНО ТЕ


АКАДЕМИЯ НАУК СССР ИНСТИТУТ ИСТОРИИ ЕСТЕСТВОЗНАНИЯ И ТЕХНИКИ Л. Е. МАЙСТРОВ ТЕОРИЯ ВЕРОЯТНОСТЕЙ ИСТОРИЧЕСКИЙ ОЧЕРК ш ИЗДАТЕЛЬСТВО «НАУК А» Москва 1967
УДК 519.21 В книге изложена история теории вероятностей от ее возникновения до 30-х годов текущего столетия. Большое внимание уделено мало исследованным вопросам — творчеству Байеса, роли Лапласа и др. По-новому освещены возникновение и кризис теории вероятностей, возникновение аксиоматики. Большое внимание уделено и философским проблемам — развитию понятия вероятности, случайности и необходимости. Книга рассчитана на читателей, имеющих подготовку в объеме первых двух курсов физико-математических факультетов университетов и педагогических институтов, а также на лиц, интересующихся историей науки. Иллюстр. — 16, таблиц — 6, библиоер. — 182 назв. ОТВЕТСТВЕННЫЙ РЕДАКТОР Я. Б. ПОГРЕБЫССКИЙ 2-2-3 598-67 (II полугодие) Леонид Ефимович Майстров Теория вероятностей Исторический очерк Утверждено к печати Институтом истории естествознания и техники Академии наук СССР Редактор издательства Ю. Н. Бадлевский. Технический редактор В. В. Волкова Корректор Б. И. Рывин Сдано в набор 1/VII 1967 г. Подписано к печати 22/XI 1967 г. Формат 84Xl08Vs2· Печ. л. 10. Усл.-печ. л. 16,40. Уч.-изд. л. 16,1. Тираж 9000 экз. Т-16211. Тип. за к. 6830. Бумага Типографская № 1. Цена 1 р. 11 к. Издательство «Наука». Москва, К-62, Подсосенский пер., 21 2-я типография издательства «Наука». Москва, Г-99, Шубинский пер., 10
ОТ АВТОРА История теории вероятностей — одна из наименее исследованных областей истории математики. Настоящая книга представляет собой исторический очерк и не претендует на систематическое изложение истории этой дисциплины. В связи с этим в книге не все периоды истории теории вероятностей освещены в одинаковой степени — больше внимания уделено тем вопросам, которые или совсем не изучены или изучены недостаточно: например, одной работе Т. Байеса отведено место немногим менее, чем работам П. Л. Чебышева, только потому, что работа Т. Байеса рассматривается впервые, тогда как исследования П. Л. Чебышева освещены в литературе достаточно полно. Изложение в книге в основном хронологически последовательно и охватывает период от зарождения теории вероятностей до установления ее аксиоматики в XX в. Но с приближением к нашему времени изложение все менее претендует на полноту. В частности, при описании современного периода теории вероятностей говорится в основном об аксиоматике теории вероятностей. Однако надо отметить, что хотя аксиоматика и является важным этапом в развитии современной науки, она не исчерпывает того нового, что было внесено в теорию вероятностей в XX столетии. § 3 гл. III «Работы Оимпсона в области теории вероятностей» написан О. Б. Шейниным. Автор выражает глубокую благодарность академику АН УССР Б. В. Гнеденко, а также доценту И. Л. Калих- ману за внимание к работе, замечания и советы, которые были по возможности учтены.
ВВЕДЕНИЕ В истории теории вероятностей можно выделить следующие этапы. 1. Предыстория теории вероятностей. В этот период, начало которого теряется в дали веков, ставились и примитивно решались элементарные задачи, которые позже будут отнесены к теории вероятностей. Никаких специальных методов в этот период не возникает. Идет накопление материала. Этот период кончается в XVI в. работами Кардано, Пачоли, Тарталья и др. 2. Возникновение теории вероятностей как науки. В этот период вырабатываются первые специфические понятия, такие, как математическое ожидание. Устанавливаются первые теоремы — теоремы сложения и умножения вероятностей. Начало этого периода связано с именами Паскаля, Ферма, Гюйгенса. Этот период продолжается от середины XVII в. до начала XVIII в. В это время теория вероятностей находит свои первые применения в демографии, страховом деле, в оценке ошибок наблюдения. 3. Следующий период начинается с появления работы Я. Бернулли «Искусство предположения» (1713 г.). Это первая работа, в которой была строго доказана предельная теорема—простейший случай закона больших чисел. Теорема Бернулли дала возможность широко применять теорию вероятностей к статистике. К этому периоду относятся работы Муавра, Лапласа, Гаусса, Пуассона и др.; теория вероятностей начинает применяться в различных областях естествознания. Центральное место в этом периоде занимают предельные теоремы. 4. Следующий период развития теории вероятностей связан прежде всего с русской (Петербургской) школой. Здесь можно назвать такие имена, как П, Л. Чебыщев, А. А. Марков, А. ОД. Ляпунов. 5
В этот период распространение закона больших чисел и центральной предельной теоремы на различные классы случайных величин достигает своих естественных границ. Законы теории вероятностей стали применяться к зависимым случайным величинам. Все это дало возможность приложить теорию вероятностей ко многим разделам естествознания, в первую очередь — к физике. Возникает статистическая физика, которая развивается во взаимосвязи с теорией вероятностей. 5. Современный период развития теории вероятностей начался с установления аксиоматики. Этого в первую очередь требовала практика, так как для успешного применения теории вероятностей к физике, биологии и другим областям науки, а также к технике и военному делу необходимо было уточнить и привести в стройную систему ее основные понятия. Благодаря аксиоматике теория вероятностей стала абстрактно-дедуктивной математической дисциплиной, тесно связанной с теорией множеств, а через нее—с другими математическими дисциплинами. Это обусловило небывалую широту исследований по теории вероятностей, начиная от хозяйственно-прикладных вопросов и кончая самыми тонкими вопросами кибернетики. Первые работы этого периода связаны с именами С. Н. Бернштейна, Мизеса, Бореля. Окончательное установление аксиоматики произошло в 30-е годы XX в., когда была опубликована и получила всеобщее признание аксиоматика А. Н. Колмогорова. В последние годы намечаются новые подходы к ос-» новным «понятиям теории вероятностей, в том числе и с позиций теории информации.
Глава I ПРЕДЫСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ § 1. Основные стимулы возникновения теории вероятностей Задачи и проблемы, которые оказали существенное влияние на зарождение и первоначальное развитие теории вероятностей, возникали при обработке статистических данных и результатов наблюдений в различных науках; из практики страховых обществ; в связи с отвлеченными задачами на темы азартных игр. Разработка таких вопросов была тесно связана с комбинаторикой, с развитием взглядов на случайность и необходимость в философии. Первоначальные вопросы вероятностного характера, возникавшие в самых разнообразных сферах деятельности человека, со временем начали выкристаллизовываться в понятия и методы теории вероятностей. Первые статистические данные, главным образом о населении, собирались еще в древности. Так, правители древнего Египта, Греции и Рима делали отдельные попытки подсчета количества населения, количества ежегодно собираемого хлеба, податей и т. п. В древнем Риме со времен правления императора Августа (27 г. до н. э.—14 г. н. э.) присоединение новой области сопровождалось переписью ее населения. Нормандский герцог Вильгельм I Завоеватель (1027—1087 гг.), покорив в 1066 г. Англию, повелел составить особые описки, получившие название «Книга страшного суда». Эти списки содержали результаты всеобщей поземельной переписи в Англии 1086 г. Перепись производилась с целью установления поземельного обложения. Население было переписано по разным категориям и их промыслам. «Книга страшного суда» содержала подробные сведения о королевских, церковных и феодальных поместьях с указанием их размеров, количества скота и инвентаря. 7
В русских летописях, относящихся к X в., и более поздних имеются указания на сбор некоторых статистических данных. После захвата территорий Руси монголы начали проводить переписи населения для сбора дани и податей. Писцовые книги в России также являются источниками статистических данных. В более позднее время в «Южио-руоских летописях», в записи, относящейся к 1666 г., мы читаем: «Того же року была перепись по всей Малой России, по указу царя московского: сколько всех людей на Вкраине — старых и молодых, и в пелюшках» [1, стр. 31—32]. От средних веков до нас дошли подробнейшие сельскохозяйственные инвентаризации поместий крупных феодалов. В Венеции в 1268 и 1296 гг. были изданы законы, обязывавшие губернаторов составить подробные описания своих провинций. Дипломатические представители должны были сообщить сенату по установленным формам сведения о государствах, в которые их посылали. Сенат организовывал переписи населения, домохозяйств, собирал данные о торговле. Венецианские отчеты и другие документы дали богатейший материал о разных странах. Дож Мочениго переработал этот огромный материал и представил в 1421 г. сенату подробный доклад. С того времени в разных торговых центрах Италии начали составлять и издавать аналогичные сборники. С XVII в. в Голландии, Испании, Франции, Англии, Германии появляются различные справочные издания. В Лондоне велись бюллетени о естественном движении населения города. Эти бюллетени были введены в связи с эпидемиями чумы. Первые записи относятся к 1517 г. Форма и содержание бюллетений изменялись. В 1532 и 1535 гг. еженедельные бюллетени давали сведения об общем числе похорон и числе похорон лиц, умерших от чумы, по приходам. Ежегодно начиная с 1603 г. в декабре давалась годичная сводка. Одним из ранних и очень важных добавлений было указание причин смерти. ^Вначале указывались две причины — болезнь и случайность, затем число отмечаемых причин значительно возросло. С 1629 г. стали указывать также и пол умерших и крещеных. 8
На основании такого статистического материала вырабатывались понятия о вероятности смерти в определенный промежуток времени, о вероятности дожития до определенного возраста и многое другое, что, несомненно, оказывало влияние на образование понятий теории вероятностей. Таким образом, сбор статистических сведений и некоторый их анализ производились в разные исторические периоды с большей или меньшей степенью полноты и регулярности. Однако систематические и достаточно обширные статистические исследования начинаются только в период зарождения капитализма, в период развития торговли и денежных операций, в том числе связанных со страхованием, в период возникновения и развития различных новых учреждений. Статистика явилась одним из существенных стимулов первоначального развития теории вероятностей. Развивающиеся капиталистические отношения выдвигали перед статистикой все новые и новые вопросы. «Хотя первые зачатки капиталистического производства спорадически встречаются в отдельных городах по Средиземному морю уже в XIV и XV столетиях, тем не менее начало капиталистической эры относится лишь к XVI столетию» [2, стр. 720]. В XIV в. возникают первые морские страховые общества в Италии и Нидерландах. Вслед за страхованием морских перевозок возникает страхование пере^ возок по суше, рекам, озерам. В этих обществах производился подсчет шансов, так как при большем риске собиралась большая страховая премия. Страховые премии при морских перевозках составляли 12—15%, а при перевозках внутри страны — 6—8% от стоимости перевозимых грузов. С XVI в. морское страхование вводится во многих странах. В XVII в. начинают появляться другие виды страхования. Данные страховых обществ также были тем материалом, на основании которого развивалась теория вероятностей. В связи с бурным развитием естествознания в эпоху Возрождения и все увеличивающейся ролью наблюдения и эксперимента возник вопрос о методах обработки результатов наблюдений, в частности, об оценке случайных ошибок, возникающих при наблюдениях. Все это также стимулировало развитие теории вероятностей. 9
Вопросы о соотношении случайного и необходимого, о законе, о причинности и т. п. обсуждались еще в древности и всегда находились в поле зрения философов. Поэтому нельзя отрицать того, что философия к XVII в. накопила довольно богатый материал, который также оказал влияние на зарождение и первый период развития теории вероятностей. Укажем здесь на интересный пример. В Индии еще до нашей эры широкое распространение получило религиозное течение джайн (jain). Составной частью этой религии было учение суад (syad), илисуадвада (syadva- da). Учение суад получило полное развитие к VI в. н. э.; ему уделялось большое внимание и в средние века. Известен трактат, посвященный этой теории, относящийся к 1292 г., имеются и более поздние работы. Основой учения суадвады является возможность следующих семи утверждений относительно изучаемого явления: 1) может быть есть; 2) может быть нет; 3) может быть есть и нет; 4) может быть это неопределенно; 5) может быть это есть и тоже неопределенно; 6) может быть этого нет и тоже неопределенно; 7) может быть есть и нет и тоже неопределенна По учению суадвады эти семь категорий необходимы и вполне достаточны, чтобы полностью исчерпать все возможности знаний. В четвертом положении сказано, что наряду с утверждением «есть» и отрицанием «нет» имеется еще возможность существования неопределенного. В этом можно видеть зарождение тех понятий, которые впоследствии привели к пониманию вероятности, так как здесь фактически утверждается существование области применимости вероятности. По этому поводу индийский статистик Махаланобис пишет: «Четвертая категория является сутью качественной стороны современной концепции вероятности» [3]. Следует, конечно, подчеркнуть, что это только качественная сторона, в то время как вероятность включает в себя и количественную характеристику. Отметим попутно еще один интересный факт. В средневековых изложениях учения суадвады содер- 10
жится обсуждение поведения браминов, собирающих подаяние. Ставится вопрос: всегда ли брамин, получающий дары, заслуживает их? В ответе говорится, что 10 из 100 браминов не заслуживают этих даров. В этом ответе можно усмотреть некоторый вероятностный подход. В качестве другого примера приведем высказывания Т. Гоббса (1588—1679 гг.), который считал, что, как бы часто ни наблюдалось какое-нибудь явление, этого еще недостаточно для достоверного знания. Гоббс считает, что определить при помощи наблюдений все обстоятельства, вызывающие то или другое явление, нельзя, так как таких обстоятельств бесчисленное множество. Гоббс пишет: «Хотя человек до настоящего времени постоянно наблюдал, что день и ночь чередуются, он, однако, не может отсюда заключать, что они таким же образом чередовались всегда или будут таким же образом чередоваться во веки веков». Далее Гоббс делает вывод, что «из опыта нельзя вывести ни- какого заключения, которое имело бы характер всеобщности. Если признаки в двадцати случаях оказываются верными и только в одном обманывают, то человек может ставить в заклад двадцать против одного за то, что предполагаемое явление наступит, или что оно имело место, но он не может считать свое заключение безусловной истиной» [4, стр. 229—230]. Мы здесь привели только два примера. В философии в течение всей ее истории ставились вопросы, решение и обсуждение которых помогали выработке основных вероятностных понятий. Теория вероятностей смогла возникнуть только после того, когда вопросы, связанные с вероятностной оценкой тех или иных событий, стали появляться в различных областях человеческой деятельности и когда их разрешение становилось все более и более актуальным, так как затрагивало интересы большого числа людей. Это характерно для периода распада феодальных отношений, пролетаризации крестьян и развития буржуазии, для периода роста городов и торговли, увеличения мануфактур и т. п. Все эти явления вызвали бурное развитие естествознания. «Современное естествознание... начинается с той грандиозной эпохи, когда бюргерство сломило мощь фео- 11
дализма» [5, стр. 152]. Именно в этот период зарождаются аналитическая геометрия, дифференциальное и интегральное исчисление и многие другие науки. В это же время зарождается и теория вероятностей. Многие науки в этот период в основном ограничивались сбором материала и его систематизацией; появлялись отдельные открытия и делались лишь первые попытки создания научных методов. Теория вероятностей в своем развитии также прошла этот первый этап. § 2. Роль азартных игр в возникновении теории вероятностей До настоящего времени широко распространено ошибочное мнение о том, что теория вероятностей возникла и начала развиваться на основе азартных игр. Приведем некоторые высказывания. «Теория вероятностей зародилась в XVI в. из попыток дать теорию распространенных в ту эпоху азартных игр» [6, стр. 11]. «Случай сделал так, что изобретение теории вероятностей само было обязано случаю» [7, стр. 327]. «Вполне естественно, что вычислители и математики направляли свои исследования на изучение азартных игр, так были заложены основы теории вероятностей» [8]. «Попытки дать математическое толкование некоторым обнаруженным фактам [из азартных игр.— Л. Λί.] послужили непосредственной причиной возникновения (около 1650 г.) и развития математической теории вероятностей» [9, стр. 164}. «Наука о вероятности родилась, когда Ферма и Паскаль начали изучать азартные игры» [10, стр. 311]. «Первые (работы, в которых зародились основные понятия теории вероятностей, появились в свет в XVI— XVII вв. и были связаны с попытками создания теории азартных игр» [11, стр. 6}. Подобной точки зрения придерживается подавляющее большинство исследователей. Она, например, высказана Дейвидом и Кендаллом на страницах журнала «Biometrika» [12, 13] и многими другими. При такой трактовке возникновения теории вероятностей сводится на нет вся предыстория этой теории, 12
когда исподволь, о недрах других наук, вопросов и задач началось формирование ее основных понятий и первоначальных методов, которые приобрели самостоятельное значение только в период создания теории вероятностей как науки в XVII в., и в то же время азартным играм приписывается незаслуженно большая роль по сравнению с другими, более значительными факторами, стимулировавшими как создание, так и первый период развития этой науки. Также неверно мнение, что начало теории вероятностей теряется в дали веков [14]. Если азартные игры не являлись основным стимулом зарождения и первоначального развития теории вероятностей, то какова же их действительная роль? Азартные игры появились в глубокой древности. Они возникали повсеместно. В азартных играх в качестве игральных костей использовались кости животных — астрагалы, так как при бросании они могли падать на четыре разные стороны. Бросая астрагалы, замечали, какая сторона оказывается сверху. Стороны нумеровались различными числами, но единой нумерации, естественно, не было. При одной из игр в древней Греции бросались одновременно четыре астрагала. Лучшим броском считался тот, при котором выпадали разные стороны; такой бросок назывался «Венерой». В археологических расколках, начиная с V тысячелетия до н. э. (а возможно, и ранее), среди найденных костей животных астрагалы встречаются в несколько, а иногда в несколько десятков раз чаще, чем другие кости. Выпадение различных сторон астрагалов при их бросании имеет устойчивую частоту. После многократных исследований различных астрагалов нами установлены следующие частоты выпадений различных сторон при бросании астрагалов. Частота выпадений широкой стороны с углублением «0,39; противоположной стороны «0,37; частоты выпадений двух оставшихся сторон «0,12. Очевидно, что «Венера» не являлась наименее вероятным броском. В древнем Египте (3500 гг. до н. э.) была известна игра «Гончие и шакалы». Один из экземпляров этой игры, относящийся к XVIII в. до н. э., хранится в Британском музее в Лондоне. В комплекте этой игры 13
имеются астрагалы, использовавшиеся как игральные кости. Азартные игры возникали и развивались в разных вариантах. Известны, например, так называемые игральные палочки из дерева или кости. Боковые стороны палочек отмечали точками от одной до четырех. При бросании палочки, которая катилась так же, как карандаш, фиксировалось число точек на оказавшейся вверху стороне. Такие игральные палочки существовали у многих народов. Несколько игральных палочек, относящихся к VII—VIII вв., найдены в Средней Азии и хранятся в Ленинградском Эрмитаже; в Государственном историческом музее в Москве хранится несколько обломков та* ких палочек, найденных в Чернигове (относятся к X в.). В Эрмитаже хранится одна заостренная костяная палочка, найденная в Ольвии, которая относится к периоду до III в. н. э. В Помпее и Керчи были обнаружены пластинки (хранятся в Эрмитаже), представляющие собой тонкие квадраты площадью около 1 см2; на одной из сторон имеется одна точка, на противоположной — шесть. На тонких боковых гранях также нанесены точки от двух до пяти. По-видимому, этими пластинками играли так, как играют в «решку и герб». Относятся они к началу нашего летосчисления. Самыми распространенными азартными играми были разнообразные игры в кости. Игральная кость представляет собой куб с нанесенными на его гранях точками от одной до шести. Материал для игральных костей был самым различным: глина, кость, дерево, стекло и др. Самая древняя игральная кость найдена в Северном Ираке и относится к четвертому тысячелетию до нашей эры. Приблизительно к этому же времени относится кость, найденная в Индии (в Мохенджа-даро). Иногда попадаются кости с необычным числом точек на гранях: вместо одной точки — 9 точек или такое расположение точек: 4, 4, 5, 5, 6, 6, а также некоторое другое. У древних греков (и у других народов) встречались игральные кости с более чем шестью гранями. В различных музеях хранятся игральные кости разных времен и народов. Некоторые результаты исследований игральных костей, которые мы проделали, сведены в таблице. 14
3 00 σ* м* О5 00ЮЮС55 CD CO CO Ю CO CO ю coco·** О CD ·** СО ОЭ •^(M CO СОЮ si* CO CO t>- CO «4-1 CO <M ЮС0С0СО о ю CO CO CO O5C0<M CO -^h CO CD CO COCO ЮСОх* οοσ>ΐοι>(Ν C0 00C0Nt<t^ ©CT>C0 ©Nt<sj< t>-Oi CO COt— sj< Nt< sj< CO Ю sf ю CO о 33 δ S3 eS C0<MsJ< rococo CO<M<M ©< Ю· >oooco <C0 vj<0 !<M<MsJ< 05 о со О со о о о til А А ft ft < s I sj* s# s# s# stfcDsJisJicD sj< со cococo со**сооою со д д д д д д д дд д ссГ ососо cb^tficcTcocVi ссГ I I I I I I I I I I I со •У д I ссГ WW 4ИН О Ю СО C&Oi^^i© 05 еМ BLSS16 СП S «β й I 1); S ffl > ffl * * *н £ κ * . Ι . 3, *+ .*+ . >> о 5 » S 03 χ · о CO CQ X д ω л В· и « Ε а _ §W S Ε Ε «β « <-rV*J * С С S δ Ia JrS5 Ё χ5 X KfflOWW ооос: Он I. Η с 2 csioosj Юсо^соо
Как видно из таблицы, частоты выпадения различных граней во многих случаях довольно близки друг к другу. Наиболее часто встречаются кости с размером ребра от 9 до 12 мм, что наиболее удобно, так как костям очень маленьких и больших размеров трудно придать правильную форму. Нанести точки на игральной кости можно 15 способами: 6) 1—3; 2—5; 4—6; 7) 1-4; 2—3; 5-6; 8) 1—4; 2—5; 3- 1) 1—2; 3—4; 5-6; 2) 1—2; 3-5; 4—6 3) 1—2; 3-6; 4—5; 4) 1—3; 2—4; 5—6; 5) 1—3; 4—5; 2—6 9) 1—4; 2—6; 3—5 10) 1—5; 2—4; 3—5 11) 1-5; 2—3; 4-6 12) 1-5; 2—6; 3-4; 13) 1—6; 2—3; 4—5; 14) 1—6; 2—4; 3—5; 15) 1—6; 2—5; 3—4. * 1—2 означает: I против 2; 3—4, — 3 против А и т. д. Оказывается, что подавляющее большинство костей имеет следующее расположение точек: 1—6; 2—5; 3—4. На о-ве Суматра существует следующая игра, известная там издавна. В одну половину скорлупы кокосового ореха кладут две, три или четыре игральные палочки, на гранях которых нанесены от одного до четырех очков. Затем закрывают их второй половиной скорлупы и трясут. Открыв скорлупу, считают количество очков или фиксируют, какие очки выпали. Выигрывает тот, кто назвал выпавшее число очков (или числа) до открытия скорлупы. Три такие игральные палочки хранятся в Музее антропологии и этнографии АН СССР в Ленинграде. Сделаны они из плотного коричневого дерева- Очки вырезаны ножом. Грани сильно округлены. Такие палочки имеются и в других музеях (см., например, 116, стр. 119]). В северной части о. Суматра, у каро-батаков, была обнаружена примитивная рулетка. Музей антропологии и этнографии получил экземпляр такой рулетки в 1897 г. В ее комплект входит шестигранная костяная призма с отверстием, куда вставлен деревянный сердечник из плотного южного дерева. Грани призмы отмечены очка- . ми от 1 до 6. Эту призму вращают, как волчок, и когда в конце вращения она падает на бок, то грань, оказавшаяся сверху, определяет число выпавших очков. Кроме того, в комплекте имеется циновка с разметкой и блюдце, в котором вращали волчок. Аналогичный экземпляр рулетки, также с о. Суматра, описан в [17]. 16
Игра состоит в следующем. Хозяин рулетки принимает ставки на номера от 1 до 6, которые отмечены на циновке, а также на левую и правую сторону циновки. Затем крутит волчок. Выигрывает тот, кто поставил на выпавшее число очков. Левая и правая стороны соответствуют первым трем числам (1, 2, 3) и последним (4, 5, 6). Имеются сведения, что хозяин выплачивал всего только четырехкратную ставку <по ставкам на очки. Очень любопытно, что совершенно аналогичная игральная кость (шестигранная призма с отверстием) была найдена в Киеве и относится к XI—XII вв.; деревянный сердечник к ней не сохранился. (Находится эта кость в Государственном историческом музее в Москве). Можно, таким образом, предположить, что рулетка, так же как и игры в кости, возникла повсеместно, как естественное развитие азартных игр. Разновидности карт были известны у разных народов еще в древности. Карты современного вида появились впервые во Франции в XIV в. и вскоре получили широкое распространение для азартных игр. Кости, а затем карты часто употреблялись для бросания жребия, а также для гаданий. Таким образом, азартные игры издавна имели широкое распространение. В Римской империи были законы, разрешающие играть в кости только в определенные сезоны. В жизнеописаниях Августа и Клавдия упоминается, что они любили часто играть в кости. Известна ваза (амфора) VI в. до н. э., на которой изображены Аякс и Ахилл, «играющие в кости. В средневековой европейской литературе начиная с XI—XII вв., встречаются упоминания и некоторые описания различных азартных игр. С течением времени количество таких описаний увеличивается. Об азартных играх говорят попутно Данте, Рабле, Эразм Роттердамский и другие писатели. Шарль де Костер, который для своей «Легенды об Уленшпигеле» широко пользовался архивными и музейными материалами, (несколько раз упоминает игру в кости. Есть много свидетельств о том, что христианская церковь вела борьбу с азартными играми. Это, © частности, говорит об их широком распространении. Законы о запрещении азартных игр в разное время были изданы Фридрихом II (1232 г.), царем Алексеем Михайловичем (1649 г.), Екатериной II (1782 г.) и др. 17
Людовик IX (1255 г.) запрещает не только игры, но даже производство костей. Законы Эдуарда III и Генриха VIII запрещали играть в кости и карты, но рекомендовали заниматься спортом и военными играми (например, стрельбой из лука). Кроме того, в различных странах существовали инструкции, ограничивающие азартные игры. Например, участники третьего крестового похода (1190 г.)—рыцари и духовенство, согласно инструкции, имели право играть ,в азартные игры, но не могли проигрывать более чем 20 шиллингов за 24 часа. Если стать на распространенную точку зрения, состоящую в том, что теория вероятностей своим возникновением обязана азартным играм, то необходимо объяснить, почему же азартные игры, существуя 6 тыс. лет, не стимулировали возникновения и развития теории вероятностей до XVII в., а в XVII в. она возникла на основе тех же азартных игр? На этот вопрос Дейвид [12], например, дает такой ответ: теория вероятностей не возникала раньше потому, что производились несовершенные игральные кости, а на неправильных игральных костях нельзя обнаружить необходимых закономерностей. Однако этот ответ несостоятелен. Как известно, в античном мире были созданы замечательные образцы искусства и архитектуры, и поэтому маловероятно, что в те времена не могли изготовить хороший кубик. И действительно, при обследовании игральных костей, хранящихся в музеях СССР, обнаружено много травильных костей, относящихся к разным временам и народам, в том числе и к античному миру. Кендалл [13] указывает четыре возможные причины, препятствовавшие развитию теории вероятностей в более старое время: 1) отсутствие комбинаторики или, по крайней мере, комбинаторных идей; 2) суеверие игроков; 3) отсутствие соответствующей символики; 4) моральные и религиозные представления, которые служили препятствием для развития цдеи случайного. Сам Кендалл, выдвинув эти причины, в дальнейшем высказывает сомнения относительно того, что все они могли оказать решающее влияние на возникновение теории вероятностей. Но он утверждает: «В религиозных и 18
моральных учениях, в запретах, я склонен искать объяснение этого замедления [в возникновении теории вероятностей— Л. AfJ» ,[13]. В действитецьности все эти причины не выдерживают серьезной критики. Когда потребности практики требуют развития той или иной науки или какого-либо ее раздела, тогда и возникают новые идеи, создаются удобные обозначения, преодолеваются всевозможные суеверия и ломаются мешающие развитию науки барьеры. Почему же этого не произошло с теорией вероятностей раньше XVII в.? Несколько особый ответ на этот вопрос дает В. Хо- тимский [18]. Он считает, что теория вероятностей возникла из азартных игр в XVII в., а не раньше, потому, что азартные игры могли получить широкое распространение только с увеличением денежного обращения и торговли, т. е. с развитием буржуазных отношений, примерно в XVI—XVII вв. Хотя эта точка зрения связывает возникновение теории вероятностей с экономической ^жизнью общества, но она находится в противоречии с фактами. Азартные игры в античном мире и средние века были распространены не менее, если не более, чем в XVI—XVII вв. Эту точку зрения разделяет и Э. Коль- ман. Он пишет: «Будучи на протяжении всей своей истории неразрывно связана с возникновением и развитием капиталистического строя, теория вероятностей зародилась, как теория азартных игр. Правда, игры эти были известны еще древним, но она возникла именно тогда, когда экономический строй с его денежной формой обмена, рынком и конкуренцией сделал их массовым явлением» [19, стр. 231]. Как мы уже говорили, основными стимулами возникновения и развития теории вероятностей были не азартные игры. Однако из этого не следует делать вывод, что азартные игры не имели никакого отношения к появлению теории вероятностей и первым шагам ее развития. Большинство первых задач теории вероятностей связано с азартными играми если не по существу, то по форме. Мы и сейчас при изложении начал теории вероятностей, в методических целях, часто обращаемся к азартным играм, ибо в таких задачах легко показать, как подсчитать вероятности тех или иных возможных исходов. Азартные игры сыграли свою роль в развитии теории вероятностей, потому что они оказались удобной 19
схемой, с готовой терминологией, с помощью которой можно было описать многие явления и решать разнообразные задачи. Конечно, и практика игр выдвигала задачи, которые стимулировали развитие теории вероятностей. Но повторяем, это не была решающим стимулом. Более того, на задачи из практики азартных игр стали обращать внимание только после того, как аналогичные задачи возникли в других областях человеческой деятельности К § 3. Первые задачи Одной из первых задач, которую следует отнести к теории вероятностей, является подсчет числа различных возможных исходов при бросании нескольких игральных костей. Первые известные подсчеты при бросании трех игральных костей относятся к X—XI вв. В средние века (еще до XV в.) встречались поэмы, в которых каждому исходу, при бросании трех игральных костей, соответствовал определенный стих. Таких стихов было 56. Действительно, 56 — это число всех возможных исходов при бросании, не учитывая повторений. Например, две двойки и одна тройка дают только одну возможность, независимо от того, в какой последовательности они могут появиться. Самая ранняя известная попытка подсчитать число возможных исходов при бросании трех игральных костей, включая и перестановки, встречается в поэме, написанной на латинском языке, «De Vetula». Одно время автором этой поэмы считали Овидия, поэтому она была даже включена в некоторые средневековые издания его поэм. После длительных опоров об авторе этой поэмы, пришли к заключению, что им является Ричард де Фор- ниваль (1200—1250 гг.), канцлер кафедрального собора в Амьене. Эта поама содержит главу, посвященную спорту и играм. Интересен следующий отрывок: «Бели три числа одинаковы, то имеется 6 возможностей; если два одинаковы, а третье от них отличается, имеется 30 случаев, потому что пара чисел может быть выбрана 6 способами, а третье число пятью; а если все три разные, то имеется 20 способов, потому что 30 умножить на 4 есть Подробнее о роли азартных игр в теории вероятностей см. [20]. 20
120, а каждая возможность возрастает в 6 раз. Имеется 56 возможностей. Но если все три одинаковы, имеется только один способ для каждого числа. Если два одинаковы, а один отличается, имеется три способа, .а если все разные, то имеется 6 способов» [13, стр. 13—14]. В этом отрывке произведен такой подсчет. Если вое три числа разные, то для того, чтобы указать количество возможных исходов, необходимо 30 возможных исходов без перестановок, при двух равных числах, умножить на 4, так как два числа уже входят в эту тройку. Но теперь мы получаем 120 возможных исходов с перестановками. В каждой тройке чисел можно произвести 6 перестановок. Следовательно, без перестановок будет 120:6=20 троек при различных числах. Таким образом, 56= = 6+30+20 — это уже встречавшееся ранее число всех возможных исходов, без перестановок, при бросании трех игральных костей- Из приведенного текста следует, что общее число исходов, с повторениями, при бросании трех игральных костей будет: 6·1+30·3+20·6=216, хотя прямо это число в поэме и не указано. Любопытно, что наиболее простой способ нахождения этого числа — умножением всех возможных исходов при бросании двух костей (36) на 6 — ускользает от автора поэмы. Несмотря на то, что в этой поэме количество исходов было подсчитано правильно, еще долгое время в задачах, связанных с пересчетом и указанием всех возможных исходов при бросании костей, часто допускались ошибки. В 1307—1321 гг. была написана «Божественная комедия» Данте. VI часть «Чистилища» начинается стихами: Когда кончается игра в три кости, То проигравший снова их берет И мечет их один в унылой злости; Другого провожает весь народ; Кто спереди зайдет, кто сзади тронет, Кто сбоку за себя словцо ввернет. А тот идет и только ухо клонит; Подаст кому,— идти уже вольней, И так он понемногу всех разгонит. Таков был я в густой толпе теней, Чье множество казалось превелико, И, обещая, управлялся с ней [21, стр. 40]. 21
В 1477 г. Бенвенуто д'Имола издал в Венеции «Божественную комедию» со своими комментариями. О самом Бенвенуто д'Имола мы читаем у А. К. Дживелего- ва: «Видным истолкователем «Комедии», который... объяснял ее публично на латинском языке, был Бенвенуто из Имолы, читавший в Болонье много лет подряд курс лекций о творчестве Данте» [22, стр. 383J. В комментарии к приведенному выше отрывку из поэмы Данте Бенвенуто д'Имола писал: «Относительно бросаний следует знать, что случается. Кости суть кубы и для каждой грани возможно очутиться сверху. 3 является наименьшим числом, которое может выпасть и оно может выпасть только одним способом, а именно, когда на каждой кости выпадает туз; 4 при трех костях может выпасть только одним способом, а именно, на одной кости 2 очка, а на двух других по тузу. И так как эти числа могут выпасть только одним способом, то, чтобы избежать беспокойства и не ждать слишкОхМ долго, их в игре не считают, то же самое относится к 17 и 18; другие числа между этими могут появляться разными способами». Этот комментарий часто приводится в различных работах по истории математики (см., например, 03]). Бенвенуто допускает ошибку, считая, что сумма 4 при бросании трех игральных костей может выпасть как и сумма 3, всего лишь одним способом. Действительно 3 получается только одним -путем: 1. 1. 1. Четыре же может появиться тремя способами: 2. 1. 1; 1. 2. 1; 1. 1-2. Это же относится к 17 и 18. Бенвенуто не различал выпадения костей с повторениями, а поэтому не смог бы пересчитать и количество всевозможных исходов при бросании игральных костей. Несмотря на незначительность этих комментариев для теории вероятностей, им часто традиционно приписывают большее значение, чем они заслуживают. (Например, см. [23. стр. 421]). Более специфической является задача о справедливом разделении ставки между двумя игроками, если игра прервана до выигрыша одним из игроков определенного числа партий или очков. Эта задача встречается у Луки Пачоли (ок. 1445 г.—ок. 1514 г.), но она была известна и ранее. Основной труд Пачоли «Сумма знаний по арифметике, геометрии, отношениям и пропорциональ- 22
ности» окончен в 1487 г. и издан в Венеции в 1494 г. на итальянском языке. Эта книга являлась энциклопедией математических знаний своего времени. В разделе «необычайных» задач Пачоли поместил следующие задачи. 1. Компания играет в мяч до 60 очков и делает ставку в 22 дуката. В связи с некоторыми обстоятельствами игра не может быть закончена, причем одна сторона в этот момент имеет 50, другая — 30 очков. Спрашивается, какую часть общей ставки должна получить каждая сторона. 2. Трое соревнуются в стрельбе из арбалета. Кто достигнет 6 первых мест, тот выигрывает. Ставка 10 дукатов. Когда первый получил 4 лучших попадания, второй 3, а третий 2, они не хотят продолжать и решают разделить приз справедливо. Спрашивается, какой должна быть доля каждого. Для первой задачи Пачоли проводит следующий расчет 5 3 8 8 S — + — = —;— —соответствует 22 дукатам, тогда — 11 11 11 11 11 3 3 1 будет соответствовать 13—дуката, а 8— дуката. 4 И 4 Ставка, по Пачоли, должна быть разделена пропорционально набранным очкам. Другими словами, если два игрока А и В играют между собой и к моменту прекращения А я В выиграли соответственно ρ и q партий, то ставка должна быть разделена в отношении ρ: q. § 4. Работы Кардано и Тарталья Существенным шагом в развитии вероятностных представлений явилась работа Д. Кардано (1501—1576 гг.) «Книги об игре в кости»1. Она была найдена в бумагах Кардано в 1576 г.» после его смерти, и впервые опубликована в первом томе собрания сочинений, изданном в 1663 г. Сам Кардано указывает, что ^га работа была написана в 1526 г. В главе XI, которая называется «О бросании двух костей», Кардано говорит: «При бросании двух костей возможны 6 случаев выпадения по два одинаковых чис- 1 Перевод этой работы на английский язык опубликован в приложении к [25]. Следует, однако, отметить, что в этой хорошо изданной книге в некоторые таблицы Кардано вкрались ошибки 23
ла очков и 15 случаев выпадения разного числа очков, т. е. считая и двойные 30, следовательно, всего возможны 36 случаев» [26, стр. 264]. Так Кардано находит число всех случаев при бросании двух игральных костей. При этом он отчетливо различает перестановки. Под двойными выпадениями он понимает, например, такие: на первой кости выпало 2, на второй 3, и, наоборот, на первой 3, а на второй 2. Далее Кардано указывает число возможных случаев появления, по крайней мере на одной кости, определенного числа очков при бросании двух игральных костей. Число таких случаев 11. Действительно, выпишем, например, все случаи, у которых единица будет встречаться хотя бы один раз: 1. 1; 1. 2; 1. 3; 1. 4; 1. 5; 1. 6; 2.1; 3.1; 4.1; 5.1; 6. 1. Общее число их— 11. ДалееКар- дано пишет: «Число θτο — меньше, чем число случаев отсутствия данного числа очков. По отношению к общему числу случаев при бросании двух костей оно составляет больше одной шестой и меньше одной четверти» [26, стр. 264]. У Кардано здесь описка: И действительно ^ 36 36 -ту больше, чем -— , но не меньше чем — . По-видимому, должно быть написано «и меньше одной трети». При бросании двух игральных костей имеется всего 36 исходов, из которых 30 состоят из разного количества очков на костях, а 6 — из одинакового. Без повторений будет 15 исходов, и если прибавить 3 исхода с одинаковым числом очков, то мы 'получим 18, т. е. половину всех возможных исходов. Из этих 18 исходов 9 имеют разное число очков на костях и одновременно разную сумму числа очков на двух костях. Это у Кардано записано следующим образом: «В общее число восемнадцати входят пары равнозначных сочетаний разного числа очков, следовательно, может быть девять пар с разным числом очков» [26', стр. 264]. В дальнейшем под серией игр Кардано понимает 36 бросков. Относительно своего заключения о 6 возможностях получить одинаковые числа очков на двух костях и 30 возможностях — разные, он пишет: «Целая серия игр не дает отклонения, хотя в одной игре это может случиться..., при большом числе игр оказывается, что действительность весьма приближается к этому предположению» [26, стр. 265]. 24
Здесь Кардано утверждает, что при малом количестве наблюдений частота может отклоняться довольно сильно от доли, или, другими словами, — от вероятности; при большом числе испытаний это отклонение будет незначительно. Этим самым он подошел к пониманию статистической закономерности и закона больших чисел. В главе XII «О бросании трех костей» Кардано пишет: «Одинаковое число очков на трех костях выпадает только одним способом, как и в предшествующем примере; стало быть, всего этих случаев 6. Пар же одинаковых чисел очков с отличающимся от них третьим числом очков 30. А так как каждое такое сочетание можно получить тремя способами, то это составит 90. Сочетаний из трех различных очков 20; они видоизменяются шестью способами; это составит 120 бросаний, всего же комбинаций 216, а половина — 108» [26, стр. 265J. Мы видим, что здесь правильно подсчитано количество всех исходов при бросании трех игральных костей. Любопытно, что Кардано находит 216 не как произведение 36 · 6, а другими способами. Далее объясняется, как получены все упоминаемые числа. Например: «Двойные каждого числа очков сочетаются пятью способами. Так как различных чисел очков — шесть, то всего будет 30 способов или различных вариантов выпадений. Учитывается также и тройная перестановка, так что получается 90» [26, стр. 265]. Аналогично объясняется получение и других чисел. В этой главе решается также ряд других задач на подсчет различных исходов. Выясняется количество исходов двух различных очков (например, единицы и двойки) при бросании трех игральных костей. «Как единица, так и двойка могут входить в сочетания тремя способами каждая, а всего, стало быть, получается шесть. Эти шесть пар могут соединяться с другими числами очков четырьмя способами..., так что всего получается двадцать четыре» [26, стр. 265}. Сравниваются количества некоторых исходов при бросании двух и трех игральных костей: «Три различных числа очков, как, например, единица, двойка, четверка, находятся точно в таком же отношении к половинному числу, как и аналогичные числа очков при бросании двух костей» [26, стр. 265], т. е.— =—. ^ J 108 36 25
β главе XIII «О сложных числах, как до шести, так и свыше, и, как для двух, так и для трех костей» Карда- но очень близко подходит к подсчету вероятностей различных событий. Он пишет: «Десять же очков может получиться из двух пятерок и из шестерки и четверки: последнее сочетание возможно при этом в двух видах; таким образом девять очков также может получиться из пятерки и четверки и из шестерки и тройки, так что это составляет */9 часть всей серии, и две девятых ее половины; 8 же очков получается из 4, из 3 и 5, из 6 и 2. Всего же 5 возможных случаев составляют приблизительно 77 часть из всей серии... 7 очков составляется из: 6 и 1, из 5 и 2, из 4 и 3. Всего, стало быть, имеется 6 возможных случаев, составляющих 7е часть всей серии. А 6 очков получается по такому же расчету, как и 8, 5 —как и 9; 4 —как и 10; 3 —как 11; и 2 —как 12» [26, стр. 265]. Фактически он здесь находит вероятности выпадения определенного числа очков при бросании двух игральных костей: 7э, 7z, Ve — вероятности выпадения соответственно 9, 8, 7. Далее он отмечает, что ^(8) = =/>(6)«77; /)(9)=/>(5)=7э и т. д. Правда, вероятность у него пока не отношение, а часть серии. Затем дается таблица «совпадения шансов при метании двух костей» I 1 2 12 || 5 9 1 1 4 1 1 3 11 1 6 8 2 5 4 10 7 8 3 18 Таблица составлена следующим образом: 2 и 12 могут выпасть только одним способом, 3 и И могут выпасть двумя способами, 4 и 10 — тремя и т. д. В последних трех числах имеется ошибка. Вместо 7, 8, 18, должно быть 7, 6, 18. Тогда это означало бы, что 7 может выпасть шестью способами, а 18 — это половина всех возможных исходов, т. е. половина серии, которая часто фигурирует у Кардано. Кардано дает затем табличку «совпадения шансов при метании трех костей». 3 18 4 17 1 1 з 1 1 5 16 1 6 15 61 101 1 7 14 1 8 13 15 21 9 12 10 11 25 27 Первые два столбца указывают сумму очков, которая может появиться при бросании трех игральных ко- 26
стей. Третий столбец показывает, сколькими способами данная сумма может появиться. Кардано отчетливо различает количество случаев, при которых могут появиться 3 и 4, соответственно 18 и 17 и т. п. Далее идет довольно подробное объяснение, как получаются эти числа. Например: «Шестерка же при простом бросании имеет десять шансов, а именно: три двойки, две единицы и четверку; тройку, двойку и единицу» [26, стр. 265]. В главе XIV «Об одинаковых числах очков» Кардано подсчитывает, в скольких случаях при бросании двух игральных костей может по крайней мере один раз появиться 1, в скольких— 1 или 2 и т. д. «Единица имеет одиннадцать выпадений, также и тройка и так далее каждое число очков в отдельности; однако единица вместе с двойкой выпадает не 22 раза, а 20 раз. Таким образом, если присоединить еще тройку, то получится всего выпадений не 29 и не 31, а 27» [26, стр. 265]. Для удобства подсчета приводится такая таблица. 20 27 32 35 36 И 9 7 5 3 Здесь 11 — количество случаев при бросании двух игральных костей, в которых 1 появится хотя бы один раз: 20 — количество случаев, в которых 1 или 2 появятся хотя бы один раз; 27 — количество случаев, в которых 1, 2 или 3 появятся хотя бы один раз, и т. д. Числа 3, 5, 7,... — это последовательные нечетные числа, их необходимо прибавлять к И, чтобы получить искомые числа: 11+9=20; 20+7=27; 27+5=32; 32+3=35; 35+1=36. Единица, как очевидное, в таблице не указана. Эта закономерность может быть получена при следующем рассмотрении. Выпишем ©се исходы при бросании двух игральных костей. 1,1 1,2 1,3 1,4 1,5 1,6 2,1 3,1 4,1 5,1 6,1 2,2 3,2 4,2 5,2 1 6,2 ΊΡ 212 27S 27б 3,3 4,3 5,3 6,3 3,4 3,5 3,6 4,4 4,5 4,6 5,4 1 5,5 5,6 6,4 1 6,5 1 6,6 27
Количество выпадений единицы, хотя бы один раз, отделено верхней чертой 5+6=11. 20 получается прибавлением следующего меньшего нечетного числа, которое выражает количество выпадений двойки, хотя бы один раз, и т. д. После таблицы Кар дано делает следующее заключение. «Если, стало быть, кто-либо заявит, что он желал бы (получить 1, 2 или 3, то ты знаешь, что для этого 27 шансов, а так как вся серия состоит из 36, то остается 9 бросаний, в которых эти числа очков не выпадут; таким образом эти числа будут находиться в тройном отношении. Следовательно, при четырех бросаниях три выпадения будут благоприятны 1, 2 или 3, и только один раз не выйдет ни одного из этих трех чисел. Если тот, кто ждет выпадения одного из трех указанных чисел очков, поставит три асса, а другой один, то сначала первый выиграет трижды и получит три асса, а затем второй выиграет один раз и получит три асса; таким образом в общем итоге четырех бросаний шансы их всегда сравняются. Стало быть, такие условия расчета в игре — правильны; если же второй из них поставит больше, то ему придется состязаться в игре на неравных условиях и с ущербом для себя; а если он поставит меньше, то с барышом» [26, стр. 266]. Далее рассматривается случай для 1, 2, 3 и 4 очков; а затем делается заключение, что «такой же расчет следует применять и при бросании трех костей» [26, стр. 266J. По существу, он приближается здесь к определе- «ию безобидной игры, т. е. игры, в которой математическое ожидание выигрыша равно величине ставки. В этом заключении Кардано не говорит, что приводимые утверждения справедливы в том случае, если игра продолжается достаточно долго, но он неоднократно подчеркивает это в других местах своей книги. В правиле для подсчета величины ставок Кардано вплотную подошел к определению вероятности через отношение равновозможных событий. «Итак, имеется одно общее правило для расчета: необходимо учесть общее число возможных выпадений и число способов, какими могут появиться данные выпадения, а затем найтц отцощение последнего числ£ к чцс- 28
лу оставшихся возможностей выпадений; приблизительно в такой же пропорции определяются относительные размеры ставок для того, чтобы игра шла на равных условиях» [26, стр. 266]. Кардано в этом отрывке говорит, что если возможное число испытаний равно я, а число благоприятных испытаний— т, то ставки должны быть в отношении пЦ^т- Ввиду того, что все примеры взяты из игр в кости, равно- возможность случаев подразумевается. У Кардано говорится о «приблизительно» такой же пропорции ставок. Дело в том, что отношение в рассматриваемых зада- я—т чах иногда бывает такое, что точно в денежных единицах его нельзя выразить. Например: «Для выпадения единицы имеется одиннадцать шансов, так что соответствующие шансы будут относиться, как двадцать пять к одиннадцати, т. е. их отношение будет немногим больше двух». Далее рассматривается задача о выпадении определенного числа очков (двойки) по крайней мере один раз ,в серии из трех бросаний, а затем по крайней мере один раз в каждой из двух серий по три бросания и в каждой из трех серий по три бросания. «Пусть кому- либо необходимо, чтобы выпала одна двойка; этому числу... соответствует 91, ib остатке же 125, умножаем каждое из этих двух чисел в отдельности само на себя и получаем 8281 и 15 625, т. е. отношение, почти равное двум к одному... Если же при метании трех костей было бы необходимо выпадение одного очка, то получится соотношение чисел 753 571 и 1 953 125; пропорция же этих чисел ближе всего к соотношению пяти и двух, но несколько его превышает». Здесь 753571 =913; а 1 953 125=1253. Кардано в этой задаче пользуется теоремой умножения вероятностей. Так, отыскивая величину ставок при двух сериях, он поступает следующим об- ^ /я /я2 разом: возводит в квадрат и получает ,а это л—т (п — т)а означает, что соответствующие вероятности находятся по теореме умножения: р± = — · — = —; η η л2 Λ _ η~~т п — т {η — m)2 71 η η /ι» η
и ставки пропорциональны этим вероятностям: <7ι ~~ /ζ2 ' л2 (л —m)2 Аналогично он поступает и при трех сериях бросаний. Далее следуют две главы, связанные с историей азартных игр. Кардано пишет о том, что изобретателем азартных игр был Галамед во время Троянской войны. Осада этого города длилась десять лет, и для спасения от скуки были выдуманы игральные кости. Кардано приводит много высказываний древних об игре в кости, а также разные приемы жульничества во время игры. Далее рассматривается игра с астрагалами, причем считается, что различные стороны астрагала имеют значения 1, 3, 4, 6. Бросают четыре астрагала и подсчитывают количество благоприятных случаев при различных исходах. Кардано указывает, что бросок, при котором выпадает более одной единицы, «называется „собакой", потому что, каковы бы ни были другие кости, бросок не может превысить среднего числа» [25, стр. 238], и отмечает, что средним числом при бросании четырех астрагалов будет 14. Это было бы справедливо в том случае, если бы вероятности выпадения различных сторон астрагалов были равны между собой. В 1570 г. вышла книга Кардано, состоящая из трех его работ. Первая из них называлась «Новый труд о пропорциональностях». В этой работе содержится ряд задач, связанных с комбинаторикой. Например, он выписывает все 15 сочетаний из 6 элементов по два; ссылаясь на Штифеля, выписывает биномиальные коэффициенты; утверждает, без доказательства, что число всевозможных сочетаний из η элементов равно *·-·.*···(?)+(s)+···+(:)-*■-·· В другой работе, «Практика общей арифметики», изданной в 1539 г., Кардано обоснованно возражал Пачоли по поводу его решения задачи о справедливом разделении ставок. Он указывал, что Пачоли, деля ставку пропорционально числу уже выигранных партий, никак не принимает в расчет то число партий, которое еще не- 30
обходимо выиграть каждому из игроков. Однако, правильно указав на ошибку, Кардано сам не сумел найти верное решение этой задачи. Так, он считал, что если 5 количество партий, до которого должна была продолжаться игра по условию, ρ и ^ — количество выигранных партий партнерами, то ставку необходимо делить в отношении [1+2+3+ ... +(S-<7)1: П+2+3+ ... +(S-p)]. Складывая шансы, Кардано фактически пользовался теоремой сложения вероятностей. Он понимал, что при этом события должны быть несовместные. Фактически Кардано также пользовался теоремой умножения вероятностей для независимых событий. Конечно, во всех этих случаях он не рассматривал вероятности, а подсчитывал ставки в безобидных играх, которые пропорциональны вероятностям. Однако сформулированное им правило для подсчета величины ставок уже достаточно близко к так называемому классическому определению вероятностей. Работы Кардано — существенный шаг в развитии вероятностных понятий и представлений. Он сделал правильный подсчет количества всевозможных исходов как без повторений, так и с повторениями, при бросании двух и трех игральных костей. Он подошел к пониманию статистической закономерности, высказал некоторые соображения относительно вопроса, который впоследствии будет назван законом больших чисел. Он, наконец, близко подошел к определению вероятности через отношение рав- новозможных событий и, используя представление о математическом ожидании, ввел, по существу, понятие безобидной игры. В работе Н. Тарталья (ок. 1499 г.—1557 г.) «Общий трактат о числе и мере», опубликованной в 1556 г., тесно переплетены вопросы комбинаторики «и теории вероятностей. Тарталья рассматривает следующую задачу. «Некто размещает 10 человек и подает им столько блюд, сколько может быть различных способов, которыми они могли бы усесться, с тем чтобы они никогда не сидели второй раз так, как первый». Решив эту задачу и получив /ι»1·2-3-4-5-6·7-8-9-10, т. е. я=10!, Тарталья заявляет: «Этого порядка действий я буду придержи- 31
ваться, если бы было хотя бы 1000 человек, или какое угодно число, потому что правило стремится к бесконечности» [34, ч. II, гл. 16, §10]. Тарталья, конечно, не доказывает это правило в общем виде. Далее в работе Тарталья идет заглавие: «Общее правило данного автора, найденное в первый день поста 1523 г. в Вероне, чтобы уметь найти, сколькими способами может варьировать положение какого угодно количества костей при их метании». Затем идет текст. «Когда в 1523 г. я находился в Вероне, компания юношей и других лиц более зрелого возраста извлекала при помощи трех костей из книги, называемой «Книга счастья», ответы; каждый из них стремился узнать то, что эта книга ему определяла относительно вопросов, которые подобная книга предполагает указать. Видя, что на каждом листе, согласно имевшемуся у данного автора опыту, указанные три кости могут варьироваться 56 способами и обсуждая это обстоятельство, я решил найти, как при помощи общего правила подобная вещь может быть определена и не только по отношению к указанным трем костям, но и для любого другого числа костей. Я всю ночь так усердно обдумывал этот вопрос, что на следующий день, который был первым днем поста, нашел, что подобные порядки или правила образуются из необычных видов прогрессий». Подсчет был произведен следующим образом. Одна кость может выпасть шестью способами: 1+1+1+1+ + 1 + 1=6. Две кости могут выпасть 21 способом (Тарталья здесь рассматривает количество выпадений без повторений). 21 получается как сумма шести чисел, где каждое число есть сумма соответствующего числа членов предыдущего ряда. Количество различных выпадений для трех костей получается аналогичным путем. Итак: 1) 1+1+1+1+1+1=^6; 5) 1+5+15+35+70+126=252; 2) 1+2+3+4+5+6=21; 6) 1+6+21+56+126+252=462; 3) 1+3+6+10+15+21=56; 7) 1+7+28+84+210+462=792; 4) 1+4+10+20+35+56=126; 8) 1+8+36+120+330+792=1287. Глава заканчивается следующими словами: «При желании объяснить подробно в письменном виде проис- 32
хождение всех вышеуказанных 6 членов прогрессии потребуется составить целую книгу. Но действуя таким порядком, ты сможешь узнать, сколькими способами 10 000 костей смогут варьировать при их бросании». Нетрудно видеть, что это фактически суммы следующего вида: 1) C°0 + C\ + Cl + Cl + Ct + Cl=6 = Ch 2) c;+cj+c;+c; + ci + c;=2i=c!; 3) Cl + C\ + Cl + Cl + Ct + Cb7=56=Ch k) Cfc—! "+· Ck + Ck+l + Cl+2 + CJH-з + Ck+\ = C^.j-5 = C6-j-/f—χ. В случае & костей окончательное число равно сумме шести первых членов разностного ряда (k—1)-го порядка, или шестому члену разностного ряда &-го порядка, который равен k+5\ /6+й —П В § 20 «Ошибка брата Луки из Борго» Тарталья останавливается на задаче о разделении ставки. Он приводит текст задачи и решение Пачоли с его правилом деления ставки пропорционально числу уже выигранных партий. Тарталья по этому поводу замечает: «Это его правило мне не кажется ни красивым, ни хорошим, потому, что если бы случайно одна из этих сторон имела 10, а другая вообще не имела никакого очка, то, действуя по такому правилу, получилось бы, что одна сторона, имеющая указанные 10 очков, должна была бы взять все, а другая не получила бы ничего, что было бы совершенно лишено смысла*. Далее он пишет: «Разрешение такого вопроса является скорее делом юриспруденции, чем разума, так что при любом способе решения этой задачи здесь найдутся поводы для споров, но тем не менее наименее спорным, как мне кажется, будет следующее». После этого приводится решение двух задач. 1. Играя до 60 очков, одна сторона набрала 10 очков, а другая 0; как разделить ставку, если каждая сторона ставит по 22 дуката. 33
Решение этой задачи имеет вид: —- = 4 от 22 ДУкатов это будет — =■ 3-§- Дуката. Од- GO 6 6 3 2 2 на сторона должна получить 22 + 3— = 25— дукатов, а о о другая 18 —дукатов. о 2. При тех же условиях одна сторона набрала 50 очков, а другая 30. Решение: 20 1 22 1 50 — 30 = 20;— = — ; — = 7 —. Одна сторона получит 60 3 3 3 11 2 · 22 + 7 — = 29 — дукатов, а другая 14— дукатов. 3 3 3 Тарталья решает также следующую задачу. Двое играют до 6 очков. А имеет 5 очков, г В — 3 очка. Как разделить ставку? Решение: различие между числами очков А и В будет 2, а это — игр, необходимых для выигрыша. Поэтому А з 2 D 1 должен взять —ставки, а В , т. е. ставка должна быть о О разделена в отношении 2:1. Заканчивает этот параграф Тарталья следующими словами: «Решение Пачоли является предметом с небольшим смыслом и с достаточным поводом для споров». В отличие от Пачоли, который предлагает делить ставку пропорционально выигранным партиям, Тарталья считал, что отклонение от половины ставки должно быть пропорционально разности выигранных партий. При этом одна сторона получала половину ставки плюс еще некоторую сумму, вычисленную по указанному принципу, а другая сторона — половину ставки за вычетом этой же суммы. Оба эти решения «еверлы, так как справедливое разделение ставки является разделением ее пропорционально вероятности выигрыша всей ставки при продолжении игры. Через два года после работы Тарталья, в 1558 г., появилась небольшая статья Певероне «Два коротких и легких трактата, первый — по арифметике, второй — по геометрии». 34
В первой части Певероне рассматривает проблему о разделении ставки. Он решает следующую задачу: А и В играют до 10 партий. А выиграл 7, а В —9 партий. Как разделить ставку? Он считает, что ставка должна быть разделена в отношении 1 :6. Певероне был близок к правильному ответу, который дает здесь 1 : 7. § 5. Элементы теории вероятностей у Галилея Наиболее полное решение задачи о числе всех возможных исходов при бросании трех игральных костей дал Г. Галилей в работе «О выходе очков при игре в кости». Время написания этой работы неизвестно. Впервые она была опубликована в 1718 г. Прием, который предложил Галилей в этой работе, довольно легко можно распространить и на большее число костей. Галилей рассматривает следующий вопрос. Одновременно бросают три игральные кости, при этом фиксируется сумма появившихся очков. В этом случае «хотя 9 и 12 получаются в результате стольких же комбинаций, как 10 и 11, и вследствие этого должны были бы признаться равноценными, мы видим тем не менее, что в результате продолжительного наблюдения игроки все же считают более выигрышными 10 и 11, чем 9 и 12. Совершенно очевидно, что 9 и 10 (мы говорим о них, имея в виду также 12 и 11) получаются из того же числа комбинаций: 9 из 1.2.6—1.3.5—1.4.4—2.2.5—2.3.4—3.3.3, т. е. из шести троек, а 10 из 1.3.6—1.4.5—2.2.6—2.3.5—2.4.4— 3.3.4 и ни при каких других сочетаниях, кроме этих шести» [27, стр. 293]. Почему же 10 более предпочтительнее чем 9? Этот вопрос по всей вероятности перед Галилеем был кем-то поставлен, так как он пишет: «Чтобы выполнить данное мне поручение, стоившее мне таких трудов, изложу мои соображения в надежде не только разрешить указанное недоразумение, но и указать путь к точнейшему изложению оснований, которые позволят осветить все особенности игры» [27, стр. 293]. Количество всех выпадений он находит наиболее простым способом: для двух костей это будет 6*6=36, для трех —36-6=216. После подробного обсуждения всех возможных вариантов Галилей приходит к трем основным положени- 35
ям: «1. Тройка или, другими словами,— числа, получающиеся при выходе трех костей, с тремя одинаковыми очками, не могут получиться иначе, как при одном бросании. 2. Тройки, образующиеся из двух одинаковых и третьего отличного от них, могут получиться тремя способами. 3. Те же, которые получаются из трех различных очков, могут получаться шестью способами. Из этих положений мы легко выводим, какими способами или, лучше сказать, при каких выходах трех костей могут получаться все числа» [27, стр. 295]. Работа заканчивается следующей таблицей: 1 3 6 10 15 21 25 27 108 108 216 10 631 6 622 3 541 6 532 6 442 3 433 3 27 9 621 6 531 6 522 3 441 3 432 6 333 1 25 8 611 3 521 6 431 6 422 3 332 3 21 7 511 3 421 6 331 3 322 3 15 6 411 3 321 6 221 1 10 5 311 3 221 3 6 4 211 3 3 3 111 1 1 Верхняя строка, содержащая числа 10, 9 и т. д., указывает сумму выпавших очков на трех костях. Первый столбец под числом 10 указывает, какими путями может получиться 10 на трех костях (6.3.1; 6.2.2 и т. д.). Следующий столбец — сколькими способами получается 10: если три числа на костях разные, то имеем 6 способов; если два числа одинаковы, то имеем 3 способа, и если все три числа одинаковы, то имеем 1 способ. Число 27, внизу, является общим количеством способов, которыми можно получить 10. Аналогично составлены и остальные столбцы. В самом левом столбце подсчитано общее количество различных исходов — их 108. При рассмотрении суммы больше 10 получается еще 108 исходов. Следовательно, всего исходов будет 216, и перед нами, по существу, половина таблицы. 36
Об этом Галилей пишет: «Точно так же получится и для BTqpofl половины чисел,—для чисел 11, 12, 13, 14, 15, 16, 17 и 18, а все вместе даст сумму возможных комбинаций при бросании трех костей, равную 216» [27, стр. 296]. Задача, имеющая многовековую историю, Галилеем решена о исчерпывающей полнотой. Нам хотелось бы сделать одно замечание. Вероятность выпадения 10 очков при бросании трех игральных 27 25 костей равна —=0,125; а 9 =0,116. Их разность 216 216 будет 0,125—0,116=0,009. Такую маленькую разность в практической игре заметить нельзя, хотя бы уже потому, что для этого необходимо сделать очень много бросков одними и теми же костями при одних и тех же условиях, да и кость должна быть идеально правильной. Так что ссылка Галилея на то, что эту разность заметили игроки, является данью традиционному утверждению, которое существует и до теперешнего времени. Задачи такого типа—это задачи теоретические, и Галилей решал теоретическую задачу. Другое дело, что в азартных играх такие теоретические (выводы в какой-то мере можно использовать. В [27, стр. 231—284] наряду с другими работами помещена переписка Галилея. В частности, там имеется переписка с Назолини, а также письмо Бенедетто Ка- стелли. В этих письмах обсуждалась, например, такая задача. Действительная цена лошади 100 крон; один человек оценил ее в 10 крон, другой — в 1000. Кто из них сделал более неправильную оценку? Галилей считал, что обе оценки одинаково ошибочны, так как отношение 1000: : 100 и 100: 10 одно и то же. Священник Назолини считал, что высшая оценка более неправильная, так ка.к разность 1000—100 больше, чем 100—10. Из письма Кастелли -следует, что первоначально Галлилей придерживался того же мнения, что и Назолини, а затем изменил его. После изобретения телескопа в астрономии все шире стали проводить наблюдения при помощи различных установок и все актуальней становился вопрос об оценке ошибок наблюдения. Одним из первых эту проблему в своих работах поставил Галилей. И хотя он не дал количественного или аналитического решения вопроса, многие высказанные им положения оказали большое 37
влияние как на разработку вопроса об оценке ошибок наблюдения, так и на выработку основных понятий теории вероятностей. Наиболее подробно эти вопросы Галилей излагает в «Диалогах о двух главнейших системах мира», которые впервые были опубликованы в 1632 г. В беседе третьего дня этой книги обсуждается вопрос о том, где находится новая звезда 1572 г.—ниже Луны, выше Луны или на сфере (неподвижных звезд. Кратко история этого вопроса такова. 11 ноября 1672 г. в Дании Тихо Браге (1646—1601) заметил яркую звезду в созвездии Каюсиопеи. Новая звезда сверкала с такой же яркостью, как Венера, и была видна даже днем. Это удивительное явление взволловало весь мир. Одни считали, что новая звезда принадлежит к подлунному миру переменных земных элементов, другие — что'это комета, сконденсированная из горячих паров. Некоторые относили ее к миру звезд. Последнее противоречило мнению о том, что в мире звезд все остается неизменным на вечные времена. Тихо Браге пришел к выводу, что она относится к миру звезд и что вопреки распространенному мнению, в эфирном мире (в мире звезд) также происходят изменения. Эти выводы он опубликовал в книге «De Nova Ctella» (1573). Вскоре после своего появления блеск новой звезды начал уменьшаться, и в 1574 г. она совсем исчезла*. Но споры о ней не прекращались еще долгое время. В 1628 г. вышла книга Киарамонти «О трех новых звездах, появившихся в годы 1572, 1600, 1604», в которой автор отстаивает мнение, что расстояние до звезды 1572 г. меньше, чем расстояние до Луны. Галилей в своих «Диалогах» вступает по этому вопросу в дискуссию. Прежде всего Галилей делает замечание о том, что если бы новая звезда находилась среди неподвижных звезд, то ее высоты, измеренные на разных широтах, отличались бы друг от друга точно на столько же, на сколько в этих точках отличаются друг от друга высоты полюса. Но если новая звезда находилась бы на близком расстоянии от Земли, то ее высота при переходе к большим широтам росла бы быстрее, чем высота полюса. Из разности прироста этих высот, которую Галилей * По этому вопросу см. подробнее [67]. 38
называет разницей .параллакса или просто параллаксом, легко вычислить расстояние от звезды до центра Земли. Киарамонти из 13 наблюдений новой звезды разными астрономами составляет по своему усмотрению 12 пар наблюдений. На основании параллаксов в этих парах он вычисляет расстояние до звезды, которое получается равным от 748 радиуса до 32 радиусов Земли, что меньше, чем расстояние до Луны. Из этого он делает вывод, что истинное расстояние до новой звезды меньше, чем расстояние до Луны. Большинство пар наблюдений (а их всего можно составить С?з=78) дают расстояния большие, чем расстояния до Луны, но Киарамонти считает, что наблюдения, помещающие звезду так далеко, ошибочны. В ходе дискуссии с Киарамонти Галилей приходит к ряду важных принципиальных положений. Он отмечает, что все 12 пар наблюдений, которые учитывает Киарамонти, дают разные расстояния. Это зависит «не от недостатков правил вычислений, ,но от ошибок, сделанных при определении углов и расстояний» [28, стр. 212]. Далее Галилей пишет, что при наблюдениях всегда происходят ошибки: «В каждой комбинации наблюдений будет какая-нибудь ошибка; я думаю, что это совершенно неизбежно... Даже при определении одной только высоты полюса посредством одного и того же инструмента в одном и том же месте и одним и тем же наблюдателем, которое может быть повторено тысячу раз, всегда получается отклонение» [28, стр. 214]. Итак, Галилей приходит к выводу, что случайные ошибки при инструментальных наблюдениях неизбежны. Он повторяет эту мысль неоднократно. Затем он ставит вопрос о том, как исправить данные наблюдений, чтобы получить достоверные результаты. Другими словами: как учесть случайные ошибки? По мнению Галилея, ввиду того что чаще допускаются ошибки меньшие, *ем большие, необходимо и исправления вносить скорее меньшие, чем большие. Галилей неоднократно повторяет мысль о там, что вероятность малых отклонений больше, чем вероятность больших отклонений. В дальнейшем этот вопрос обсуждался многими математиками. 39
Далее Галилей считает, что необходимо отбросить все наблюдения, которые дают невозможные результаты, т. е. отбросить те наблюдения, которые дают результаты, далеко отстоящие от большинства других результатов. Затем обсуждается вопрос о том, какого знака могут встречаться ошибки. «Могут ли астрономы при наблюдении посредством своих инструментов и определении, например, высоты звезды над горизонтом отклоняться от истины как в большую, так и в меньшую сторону, т. е. ошибочно считать ее то выше, чем в действительности, то ниже? Или же ошибка непременно должна быть только одного рода, иными словами, может ли погрешность при ошибке выражаться только в избытке и никогда в недостатке или же всегда в недостатке и никогда в избытке?» На эти вопросы Галилей дает определенный ответ: «Можно одинаково легко ошибаться как тем, так и другим образом» [28, стр. 215], т. е. вероятности этих ошибок одинаковы. Галилей имеет в виду, хотя это и не совсем отчетливо высказано, что закон распределения ошибок симметричен. После этого Галилей говорит о широко распространенном ошибочном мнении, когда считают, что по величине ошибки, которая обнаруживается после получения результата наблюдения и соответствующих выкладок, можно судить об ошибках инструмента, на котором производятся наблюдения и, наоборот,— по ошибкам инструментов можно судить о величине окончательных погрешностей. Опровергая это мнение, Галлилей пишет: «Может оказаться (и это частенько случается), что наблюдение, которое даст нам звезду, например, на удалении Сатурна, прибавлением или отнятием одной только минуты высоты, определенной инструментом, относит ее на бесконечное расстояние·... и то, что я говорю об одной минуте, может случиться также при исправлении на половину, на шестую минуты и даже меньше» [28, стр. 216]. После этого следует вывод: «Величину ошибок, так сказать, инструментальных, следует оценивать не по результату вычисления, а по количеству тех градусов, и минут, которые отсчитываются на инструменте» [28, стр. 216]. Галилей говорит о том, что вокруг истинного результата должно группироваться наибольшее число результатов измерений. Касаясь вопроса о расстоянии до но- 40
бой звезды·, он пишет: «Среди возможных мест истинное местонахождение, надо думать, будет то, вокруг которого группируется наибольшее число расстояний» [28, стр. 216]. Заканчивая обсуждение вопроса о расстоянии до новой звезды, Галилей пишет: «Совершенно очевидно, что значительно меньшие поправки требуется внести в наблюдения, дающие для звезды бесконечную высоту, для помещения звезды на небесном своде, чем в лодлунной области. Таким образом, все эти изыскания говорят в пользу мнения тех, кто помещает звезду среди неподвижных звезд» [28, стр. 227]. Справедливость этого вывода следует из того, что большинство наблюдений относят звезду на бесконечную высоту, и для того чтобы ее переместить на небес* ный свод, нужны значительно меньшие исправления в результате наблюдения, чем для отнесения ее на любую другую высоту; а меньшие ошибки, требующие меньшие исправления, более вероятны, чем большие ошибки. Окончательный вывод Галилея совершенно справедлив: «Вы можете понять..., насколько более вероятным представляется, что звезда находилась на расстоянии самых далеких неподвижных звезд» [28, стр. 227]. Как мы видим, Галилей пришел к выводу, что ошибки при измерениях неизбежны, закон распределения случайных ошибок симметричен, вероятность ошибки увеличивается с уменьшением ошибки, около истинного результата скапливается наибольшее количество результатов наблюдения; ошибку, полученную при наблюдениях, никоим образом нельзя сравнивать с окончательными ошибками, которые возникают после расчета с использованием результатов наблюдений. В этих выводах Галилей вскрыл целый ряд характерных особенностей нормального закона распределения вероятностей — в дальнейшем одного из центральных законов теории вероятностей (ιπο этому вопросу см. также [29]). Насколько глубоко эти соображения Галилея отражали существо вопроса, следует хотя бы ;из того, что значительно позже, в 1765 г., Ламберт в работе «К вопросу о применении математики», в главе «Теория надежности наблюдений и опытов», приходит к аналогичным выводам. Указыва&гяа различие между систематическими и случайными ошибками, Ламберт говорит, что случайные 41
ошибки неизбежны, что одинаковые отклонения возможны в обе стороны от середины; что меньшие ошибки встречаются чаще, чем большие. Относительно кривой вероятности (которую он называет возможностью), он пишет, что она симметрична в обе стороны и ее наибольшая ордината лежит на оси симметрии; кривая имеет две точки перегиба, а затем асимптотически приближается к оси абсцисс (см. [30]). § 6. Основные моменты развития комбинаторики До начала применения анализа бесконечно малых комбинаторика являлась основным аппаратом в теории вероятностей. С ее помощью решались почти все задачи того времени. Поэтому развитие комбинаторику также сыграло свою роль в истории теории вероятностей, и особенно в ее первый период. Уже в школе пифагорейцев изучались треугольные числа, тесно (связанные с понятием комбинаторики. Это 1; 3=1+2; 6-1+2 + 3; 10=1+2 + 3 + 4; и вообще η(η+ί) £"~" =1+2 + 3 + ... + п. Как видно, треугольные числа яв- /л+1\ ляются числами сочетаний по 2. Действительно,! 2 1 = ^ — ' .В первые века нашей эры рассматривались 2 более сложные числа — четырехгранные, которые представляют числа сочетаний по 3. В Индии примерно за два века до нашей эры умели составлять так называемый арифметический треугольник Паскаля и знали закон образования его элементов; в частности, было известно, что ·+(?)+(§)+ ■+(^)-2"- Бхаскара II (1114 г.—позже 1178 г.) в сочинении «Венец науки» (ок. 1150 г.) излагает приемы вычислений перестановок и сочетаний. Ему была известна общая формула для подсчета количества сочетаний С«- = (/г). Индийский математик Нарайана (XIV в.) при подсчете стада коров, происходящего от одной коровы за 42
UO лет, пришел, по существу, к операции нахождений числа сочетаний с повторениями из η элементов по k. Комбинаторика использовалась, а возможно, и возникла, в Индии в связи с подсчетом различных комбинаций из долгих и кратких слогов в η сложной стопе. Таблица биномиальных коэффициентов до восьмой степени имеется у китайского математика Чжу Ши-цзе (1303 г.). Возможно, в те времена была известна и общая формула для Сп . Имеются сведения, что такие таблицы были известны в Китае в XII в. Общая теорема о разложении бинома в случае натурального показателя впервые встречается у Джемшида ал-Каши, но, по-видимому, она была известна еще Омару Хайяму (XI в.). Систематическое исследование по вопросам комбинаторики содержится в рукописи Леви бен Герсона (XIII в.). Он получил рекуррентную формулу для вычисления числа размещения из η объектов по ρ (Αζ) и, в частности, получил также формулу для числа перестановок из η объектов. Он сформулировал правила, которые эквивалентны следующим формулам: \р) ~~~р\9 \п~р) ~Ы' Но рукопись Леви бен Герсона, по всей вероятности, не была известна его современникам, поэтому позже все эти результаты были переоткрыты. М. Штифель (1487—1567 гг.) в своей книге «Курс арифметики» (1544 г.) составил таблицу коэффициентов для членов разложений (α+b)2, (а + 6)3,..., (а + Ь)17. Эти коэффициенты следующие: 1 2 1 для (а + Ь)2, 1 3 3 1 для (а+Ь)3, 14 6 4 1 для (а + Ь)4 и т. д. до 17-й степени. В этой же работе Штифель сопоставляет ряды чисел арифметической и геометрической прогрессии. В 1634 г. Эригон во втором томе «Курса математики», который называется «Практическая арифметика», правильно определяет число сочетаний из η элементов по т. К верному ^шределению приходит и А. Таке в своей «Теории и практике арифметики» (1656 г.), в которой 43
имеется небольшая глава, посвященная сочетаниям и перестановкам. В этот период появляется еще много других работ, в которых в той или иной мере разрабатываются вопросы комбинаторики. Существенный вклад в развитие комбинаторики внес Г. Лейбниц. В 1666 г. была опубликована его книга «Рассуждение о комбинаторном искусстве» {32, стр. 27— 102] (в литературе эта работа часто называется «Ars com- binatoria»). В ней Лейбниц существенно разработал комбинаторику—в первую очередь для целей логики, которая была тесно связана у него с построением «всеобщей характеристики». Кроме того, он рассматривает сочетания, перестановки, как линейные, так и круговые, а также много других вопросов. Он фактически пользуется следующими формулами: (2)-(Т') + (Й)!СГ-&)· В его книге имеется таблица, являющаяся по сути арифметическим треугольником Паскаля. Лейбниц отмечает следующие свойства, вытекающие из этой таблицы: (ϊ) -»·—«<* (;) =';(„ι,Η (*)-(-£*) и некоторые другие. Далее он использует (без доказательства) свойство Ш+(г)+ ·· ■+(:)-*■-'· В одной из задач он находит по данному числу элементов количество перестановок и приводит таблицу количества (перестановок до 24. В частности, у него записано, что число перестановок из 24 равно 6 204 484 017 332 394 339 360 000, т. е. этому равно 24! Лейбниц отмечает следующие свойства перестановок: 1 Количество перестановок всегда число четное. 2 По количеству перестановок из предшествующего числа элементов и по данному числу элементов можно 44
вычислить. число перестановок для данного числа элементов. 3. Если число .перестановок последовательно разделить на члены натурального ряда от 1 до числа элементов включительно, то получится гармоническая прогрессия. Например, 120 делим поочередно на 1, 2, 3, 4, 5 и получаем члены гармонической прогрессии 120, 60, 40, 30, 24. 4. 2Рп — (п -1) Рп-г = Рп + Ρη-ι. Действительно: 2Рп — (я — 1) Ρη-ι = 2л! — (л — 1) (л — 1)! = = 2(/г— 1)!/г — (/г— 1)(л — 1)!=(л — 1)![2л —(л — 1)] = = (л-^ 1)!(л + 1) = (л — 1)!л + (л — 1)!=л! + (л — 1)! = = Рп+Рп-1. 5. Ρ„.Ρ„:(/ζ-1)!=Ρ„+1-Ρ„. Действительно: Рп · Рп: (л — 1) = -^— = л · л!; ΡΛ+ι — —Ρ η = (η +1)! — л! =nl(n +1) — л! -= л! (л +1—1) = л · л Лейбниц находит число круговых перестановок: Лейбниц 'неоднократно возвращался к комбинаторным задачам и в других работах. Он занимался подсчетами различных исходов при бросании игральных костей. В частности, он получает, что для т костей количество исходов, в которых определенная грань встречается k раз, равно( f2)^ · Результат Лейбница для количества исходов (без повторений) при различном числе костей можно записать так: 1 кость №\ =6 »■"» (J) (?) + (!) β) = g) =21 3 кости (§) (}j + (2j («J + (|) (|) = (|) =56 и т. д. до 6 костей. Результаты, полученные для шестигранных костей, он распространяет*и на другие многогранники. 45
В работе Лейбница «Рассуждение о комбинаторном искусстве» были рассмотрены и собраны воедино все ранее известные сведения, относящиеся к комбинаторике. Комбинаторика в этом труде получила свое дальнейшее развитие. Лейбниц пришел к новым видам комбинаторных задач, в которых необходимо подсчитав сочетания и размещения с неограниченными повторениями. Как мы видим, комбинаторика, явившаяся до определенного времени основным аппаратом решения вероятностных задач, разрабатывалась многими математиками. Следует отметить, что и в настоящее время комбинаторные методы имеют существенное значение в приложениях теории вероятностей1. В заключении этой главы приведем очень интересное высказывание М. В. Остроградского: «Теорию вероятностей должно отнести к наукам нового времени, ибо настоящее ее начало не выходит дальше половины XVII столетия. Правда, некоторые предметы, относящиеся к этой науке, были известны во времена весьма отдаленные и постоянно делались расчеты, основанные на продолжительности средней жизни, известны были морские страхования, знали число случайностей в азартных играх, но только в самых простых, найдены были величины ставок или закладов безобидных для игроков, /но подобные выводы не были подчинены никаким правилам. Однако ж теорию вероятностей считают наукой нового времени и ее начало относят к половине семнадцатого столетия, ибо прежде этой эпохи вопросы о вероятностях не были подчинены математическому анализу и не имелось никаких точных общих правил для' решения их» [35, стр. 120}. 1 Подробнее об истории комбинаторики и о работах Лейбница по комбинаторике см. [31], (33].
Г л а в a ill ПЕРВЫЙ ПЕРИОД РАЗВИТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ До середины XVII в. не было никакого общего метода решения вероятностных задач, не говоря уже о цельной математической теории, решались лишь отдельные задачи, однако уже был собран довольно обширный материал в различных областях человеческой деятельности, относящийся к вероятностной тематике. В середине XVII в. в разработку вопросов теории вероятностей были вовлечены крупнейшие ученые. В первую очередь здесь следует назвать Паскаля, Ферма и Гюйгенса. Они применяли теоремы сложения и умножения, владели такими понятиями, как зависимость и независимость событий, ввели одно из основных специфических понятий теории вероятностей — математическое ожидание. В это время создаются методы решения вероятностных задач, определяется круг вопросов, которыми должна заниматься новая наука, а также вырабатываются ее основные понятия — теория вероятностей превращается в науку. «Первый период нового естествознания заканчивается в области неорганического мира — Ньютоном. Это — период овладения данным материалом» [5, стр. 153]. § 1. Легенда о де Мере В 1654 г. между Паскалем и Ферма возникла переписка по (поводу ряда задач, среди которых была и задача о разделе ставки. Многие авторы отводят решающую роль как в возникновении этой переписки, так и в возникновении самой теории вероятностей кавалеру де Мере. Приведем некоторые примеры. 47
«Спекуляция одного светского игрока, кавалеЬа Мере, в век Людовика XIV произвела вычисление вероятностей или, по крайней мере, направила в эту сторону идеи Паскаля и Ферма» (36, стр. 249]. [ «Началом исчисления вероятностей служила Задача о разделе между игроками суммы денег, назначенных для выигрыша, в таком случае, когда они прекращают игру, не докончивши партии. Эта задача кавалером де Мере была предложена Паскалю» [37, стр. 5]. Со временем эти сведения начинают обрастать подробностями. «Кавалер де Мере, страстный игрок, предложил однажды Паскалю долго мучавшую его задачу, по-видимому, имевшую для него и прикладное значение. Задача Мере заключается в следующем. Два игрока условились сыграть ряд партий. Выигравшим считается, кто первым выиграет 5 партий. Игра была прервана тогда, когда один из игроков выиграл a(a<S), а другой b(b<S) партий. Спрашивается, как должна быть разделена ставка?» [38, стр. 342]. Здесь де Мере уже страстный игрок. Наиболее подробно легенда о де Мере рассказана в третьем томе Детской энциклопедии в статье А. Я· Хинчи- на и А. М. Яглома «Наука о случайном» [39]. Эта история была приведена в журнале «Знание — сила» (1960 г., № 2) под названием «Рассказ о рыцаре де Мере». Приведем этот рассказ с некоторыми сокращениями. «Один французский рыцарь, кавалер де Мере, был страстным игроком в кости. Он всячески старался разбогатеть при помощи игры и для этого придумывал разные усложненные правила, которые, как ему казалось, приведут его к цели. Де Мере придумал, в частности, такие правила игры. Он предлагал бросить одну кость четыре раза подряд и бился об заклад, что при этом хотя бы один раз выпадет 6, если же этого не случалось — ни разу не выпадало 6 очков, — то выигрывал его противник. Де Мере предполагал, что он будет чаще выигрывать, чем проигрывать, но все же обратился к своему знакомому, Б. Паскалю (1623—1662), с просьбой рассчитать, какова вероятность выигрыша в придуманной им игре. Приведем расчет Паскаля. При одном бросании вероятность выпадения 6 равняется 7б, а вероятность невыпадения 5/б- Вероятность того, 48
что при четырехкратном бросании ни разу не выпадает 6, равна (— ] = · Таким образом, для рыцаря де Мере вероятность проигрыша была равна <■— , Следовательно, вероятность выигрыша была больше половины. Значит, при каждой игре больше половины шансов было за то, что рыцарь выиграет; при многократном же повторении игры он почти наверное оказывался в выигрыше. Действительно, чем больше рыцарь играл, тем больше он выигрывал. Кавалер де Мере был очень доволен и решил, что он открыл верный способ обогащения. Однако постепенно другим игрокам стало ясно, что эта игра для них невыгодна, и они перестали играть с де Мере. Надо было придумывать какие-то новые правила, и де Мере придумал новую игру. Он предложил бросать 2 кости 24 раза и бился об заклад, что сверху, хотя бы один раз, окажутся две пятерки. Но на этот раз рыцарь ошибся. Вероятность одновременного выпадения двух пятерок при бросании двух костей равна Узе. Вероятность, того, что не выпадут две пятерки, равна 35/зб- Вероятность того, что при 24-кратном бросании двух костей ни разу не выпадут две пятерки, равна ( —] >—■ Следователь- \36 / 2 но, для рыцаря вероятность проигрыша была больше половины. Это значило, что чем больше рыцарь будет «играть, тем больше он будет проигрывать. Так и случилось. Чем больше он играл, тем больше разорялся и в конце концов сделался нищим. Самое интересное в этом историческом анекдоте заключается в том, что благодаря таким своеобразным «практическим запросам» появилась теория расчета случайных явлений. В XVII и XVIII вв. ученые смотрели на эти примеры как на «забавные случаи» приложения математических знаний к явлениям, которые не имеют широкого распространения». Во всех этих высказываниях мы встречаемся с уже знакомым нам неправильным положением, когда утверждается, что теория вероятностей возникла из азартных игр в XVII в. К этому еще добавляется «роковая» роль де Мере. Но, как мы видим, задача о разделении ставки до кавалера де Мере имела большую историю и не он первый ею занимался. 49
Де Мере (1607—1648 гг.) был философом и литератором, довольно значительной фигурой при дворе ι Людовика XIV. Де Мере был знаком и состоял в переписке почти со всеми ведущими математиками своего времени, в (том числе и с Паскалем {24]. В решении различных задач, которые в те времена были известны всем математикам, де Мере принимал часто активное участие. Это дало ему возможность писать Паскалю в одном из писем: «Вы знаете, что я открыл редкие вещи, которые почтенные математики никогда не обсуждали. О моих открытиях писали Вы, Ферма и Гюйгенс, которые ими восхищались. Эта наука имеет много любопытных вещей, но которые мне кажутся не очень полезными». Речь идет о теории вероятностей, однако де Мере не увидел «полезности» рассматриваемых вопросов, не сумел их оценить, в то время как его современники, в частности Гюйгенс, давали уже глубокую оценку значимости теории вероятностей. В письме к Ферма от 29.VI 1654 г. Паскаль писал: «Решение проблемы костей нашел де Мере, который дал эту задачу мне и Робервалю». В другом письме Паскаль рассказывает более подробно: «Де Мере сказал, что если кто желает получить 6 при бросании одной кости, то он имеет преимущество начиная с 4 бросков и шансы преимущества есть 671 к 625. Если бросаются две кости, то получение двух шестерок ожидают с преимуществом начиная с 24 бросков». Вероятность того, что 6 не появится ни одного раза л к /5 И 625 при 4 бросках, равна I— = ; а вероятность, что . , 625 671 она появится хотя бы один раз: 1 = Р 1296 1296# Если же бросают две кости, то вероятность того, нто хотя бы один раз появятся две шестерки, будет более 7г начиная с 25 бросков, а не с 24, как думал де Мере. Действительно: ί^J = 0,509 — это вероятность непоявления ни одного раза двух шестерок при 24 бросаниях, а появление хотя бы один раз будет: 1—0,509 = 0,491, что меньше 1/2, а не больше, как думал де Мере. При 25 бросках вероятность непоявления двух шестерок ни одного 50
раза pWa (а5/зб)05=0,496, а вероятность Появлений хотя бы один раз будет: 1—0,496 = 0,504>72. Следовательно, в решаемой задаче де Мере допустил ошибку, считая, что 24 броска достаточно для того, чтобы вероятность появления двух шестерок хотя бы один раз была бы больше 1/2- В действительности же эта вероятность будет больше V2 начиная с 25 бросков. Разность полученных вероятностей будет: 0,509—0,496 = 0,013; 0,504—0,491 =0,013. Отличие полученных вероятностей от 1/2 не превышает 0,009. В процессе игры эти небольшие различия в вероятностях обнаружить нельзя. Де Мере ошибся в теоретическом расчете. В чем состоит ошибка де Мере, 'видно из его письма к Паскалю. «Если в одном случае есть один шанс из N0 в единственной попытке и в другом случае один шанс из Nu тогда отношение соответствующих чисел есть N0: Nx. Таким образом, п0: Ν0=Λι: Λ^» [24]. Пользуясь этой пропорцией, де Мере нашел, что если я0 = 4, Νο = 6, #! = 36, то Ai!=24. Де Мере считал свою пропорцию точной. Эту же задачу впоследствии решал Муавр в своей книге «Учение о случае» (1716 г.); он приводит соответствующую формулу: rt = ln 2·Ν = 0,69ΛΛ По этой формуле для нашего случая получим η = 0,69 -36=24,84 ^25. Эта формула для больших η дает хорошие результаты, но, конечно, она приближенная. Муавр применил ее к лондонской лотерее, где был один шанс из 32 получить выигрыш: я = 0,69-32 = = 22,08. А в действительности (31/з2)22,134 > 7г, а (31/з2)22'135,<72, т. е. η = 22,135. Таким образом, мы видим, что де Мере обратился к Паскалю не с вопросом, возникшим из опыта азартных игр, а с чисто теоретическим вопросом. И конечно не вопросы де Мере положили начало теории вероятностей. § 2. Переписка Паскаля и Ферма Переписка Б. Паскаля (1623—1662 гг.) и П. Ферма (1601—1665 гг.) была существенным шагом в развитии теории вероятностей. Эта переписка относится к 1654 г.; она была опубликована в 1679 г. в Тулузе. К сожалению, часть писем утеряна. В этой переписке они оба, хотя и несколько разными путями, приходят к верному решению 51
задачи о разделении ставки. Метод решения Паскаля ясен из письма к Ферма от 29 июня 1654 г.1 ( «Вот примерно, что я делаю для определения стоимости каждой партии, когда два игрока играют, например, на три партии и каждым вложено в игру по 32 пистоли. Предположим, что один выиграл две партии, а другой одну. Они играют еще одну партию, и если ее выиграет первый, то он получает всю сумму в 64 пистоли, вложенную в игру; если же эту партию выигрывает второй, то каждый игрок будет иметь 2 выигранных партии, и, следовательно, если они намерены произвести раздел, каждый должен получить обратно свой вклад в 32 пистоли. Примите же во внимание, монсеньёр, что если первый выиграет, то ему причитается 64; если он проиграет, то ему причитается 32. Если же игроки не намерены рисковать на эту партию и хотят произвести раздел, то первый должен сказать: „я имею 32 пистоли верных, ибо в случае проигрыша я их также получил бы, но остальные 32 пистоли могут быть получены либо мной, либо Вами. Случайности равны. Разделим же эти 32 пистоли пополам, и дайте мне, кроме того, бесспорную сумму в 32 пистоли"» [18, № 1,стр. 144]. Первый должен получить 48 пистолей, а второй—16. В этом же письме далее разбирается другой случай. Первый выиграл две партии, а второй не выиграл ни одной. Тогда, пишет Паскаль, первый заявляет: «если бы я выиграл, то получил бы всю ставку в 64 пистоли; если бы я проиграл, мне причиталось бы законно 48; дайте поэтому 48, безусловно причитающихся мне даже в случае проигрыша, и разделим остаток в 16 поровну, потому что существует столько же шансов на мой выигрыш этой партии, сколько и на ваш». Таким образом, первый получит 48+8=56. Далее читаем. «Предположим, наконец, что первый выиграл только одну партию, второй не выиграл ни одной. Вы видите, монсеньёр, что если они сыграют еще одну партию и первый ее выиграет, он будет иметь 2 выигрышных партии, и так же, как в предыдущем случае, ему следует 56 пистолей; если он проиграет, у обоих окажется по одной выигрышной партии и первому следует получить 32 пистоли. Тогда он может сказать: „если Вы не хотите иг- 1 Перевод этого письма имеется в [18, № 1]. 52
рать эту партию, дайте мне мой бесспорный выигрыш в 32 пистоли, и разделим остаток от 56 поровну. Вычитая 32 из 56, получим 24. Разделив 24 пополам, возьмем каждый по 12, что с 32 составит 44й» [18, № 1, стр. 144]. Паскаль делит ставку пропорционально вероятности выигрыша при продолжении игры. Метод решения Паскаля оригинален, но его трудно применить к более сложным случаям. Метод решения Ферма можно установить из письма Паскаля к Ферма от 24.VIII 1654 г. Письмо Ферма, в котором он излагает свой способ решения, не сохранилось. Ферма решал следующую задачу. «Пусть до выигрыша всей встречи игроку А недостает 2-х партий, а игроку В — 3-х партий. Если игра прервана, то как справедливо разделить 'ставку?». Ферма рассуждает следующим образом. Игра может продолжаться максимально еще 4 партии. Как могут протекать эти партии? Выигрыш партии для А будем обозначать знаком ( + ), а для В знаком (—). 1 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 + + + + - + + -+ + - + + + - + + - + -+ + + + - + + - + + + - + + - + + + + + ++ Из 16 возможных исходов 11 (с 1 по 11) благоприятны для выигрыша игроком А всей встречи. Для выигрыша В имеется только 5 благоприятных исходов (с 12 по 16). Следовательно, — ставки должен получить А и — — В. Как видим, Ферма предлагает разделить ставку пропорционально вероятности выигрыша всей встречи (с нею и всей ставки). Несмотря на правильность и остроумие, проявленное при решении этих задач, общего метода в то время еще выработано не было. В 1653 г. Паскаль сообщил друзьям о своей рукописи «Арифметический треугольник». Она была опубликована только в 1665 г. посмертно под названием: «Трактат об арифметическом треугольнике» [40]. В этой работе имеется изложение свойств и соотношений членов разностных рядов и биномиальных коэффициентов с необходимыми 53
Доказательствами. Здесь же, в параграфе «Использование арифметического треугольника для определения партий, которые необходимо сделать между двумя игроками, которые играют большое количество партий», он применил арифметический треугольник, впоследствии названный его именем, к решению различных задач, связанных с подсчетами шансов: 1111 111111 1234 5 6789 1 3 6 10 15 21 28 36 1 4 10 20 35 56 84 1 5 15 35 70 126 1 6 21 56 126 1 7 28 84 1 8 36 1 9 1 Здесь записаны коэффициенты разложения (a+b) n для я=1, 2, ... и т. д. В первой строке записаны единицы, во второй строке — суммы чисел первой строки до заполняемого места, в третьей строке — суммы чисел второй строки, и т. д. Числа, расположенные до диагонали, являются биноминальным коэффициентами. Как мы видели, фактически такими числами пользовались уже Тарталья, Штифель и др. У Паскаля числа таблицы (биномиальные коэффициенты) выступают как числа сочетаний из η элементов по k. Если мы обозначим через г номер столбца, через k — номер строки, а символом (г)& — число, стоящее в r-м столбце и &-й строке, то закон образования элементов таблицы Паскаля запишется так: (r)k = (/*)*-i + (r — 1)*» а каждое число (r)k равно (г"£^72)· Паскаль записывает, как следствие, что во всяком арифметическом треугольнике числа, равноотстоящие от концов диагонали, равны, т. е. {r)k = {k)r. Паскаль отмечает совпадение чисел горизонтального и вертикального рядов с одинаковыми номерами: «Во всяком арифметическом треугольнике горизонтальный ряд и вертикальный ряд одинакового номера составлены из ячеек, каждая из которых для одного из этих рядов равна соответствующей ячейке другого ряда» [40, стр. 247]. Из этого вытекает, что (г\ + (г)2 + ... 54
Паскаль употребляет слово «сочетание» в современном смысле в работе «Применение арифметического треугольника для сочетаний» [40]. В этой работе он, по существу, получает следующие соотношения: ««- (* t-r2)=(Ч-г2) ^ Паскаль применяет арифметический треугольник к разложению натуральной степени бинома. При помощи своего треугольника Паскаль решает в общем виде задачу о разделении ставки. Ее решение выглядит так. Вначале складывается количество недостающих партий первому и второму игрокам. Затем берется та диагональ таблицы, в которой количество членов равно найденной сумме. При этом доля первого игрока в разделении ставки будет равна сумме членов найденной диагонали начиная от 1, причем количество слагаемых равно числу недостающих партий второму игроку, а доля второго игрока равна такой же сумме, только количество слагаемых будет равно числу недостающих партий первому игроку. Например, игроку А недостает 3 партии, а игроку В недостает 4 партии: 3+4=7. Выписываем диагональ, в которой находится 7 чисел. Это будет: 1, 6, 15, 20, 15, 6, 1. Доля игрока А будет: 1+6+15 + 20 = 42; а доля Б—1 + + 6+15=22. Следовательно, ставку нужно разделить в 42 21 π отношении 55=77 · **ри таком решении ставка делится пропорционально вероятностям выиграть всю ставку для игроков А и В. Действительно, при продолжении игры может быть сыграно не более 6 партий. Для А будет следующее число благоприятных исходов: l+C\+Ct + Cl=42, где 1 — это один исход, когда все 6 последующих партий выиграет Л; 55
СI — 6 возможных исходов из 6 последующих партий, когда А выигрывает 5 партий; Cl—15 возможных исходов из последующих партий. когда А выигрывает 4 партии; С\—20 возможных исходов из последующих партий, когда А выигрывает 3 партии. Всех же исходов будет 26=64. Следовательно, вероятность того, что всю ставку получит Л, равна -— · Аналогично получаем, что вероятность того, что всю ставку получит В, равна -- . Следовательно, всю ставку необхо- 42 22 42 21 димо делить в отношении ^: ^ = ^ = jj * По .правил у Паскаля мы можем записать в общем виде, что если игроку А не хватает до выигрыша т партий, а игроку В — η партий, то ставка между ними должна быть разделена в отношении Ρ (А) Ρ (В) т-\- η 0_ т + η 1\ (т + п —1\ (т+п —1\ (т+п—1\ Μ 1 ) + 1 2 j+-"+l л-1 ] ■л—1\ //л + л—1\ /m+л—1\ /m+л—1\ " 0 j + l I J + l 2 J+-+1 «-1 J Таким образом, Паскаль дал два решения задачи о разделении ставки: для частного случая и для общего [40, стр. 261]. Из письма Паскаля к Ферма от 27.Х 1654 г. следует, что Паскаль считал свой метод решения задачи о разделении ставки отличным от метода Ферма. Паскаль писал: «Сударь, я очень доволен Вашим последним письмом; я любуюсь методом в отношении партий, тем более, что я его хорошо понимаю; он полностью Ваш, ничего общего не имеет с моим и легко приводит к той же самой цели. Вот и восстановлено наше единомыслие» [40, стр. 235]. Но при внимательном рассмотрении становится ясным, что методы Паскаля и Ферма, ,по существу, тождественны. Различие состоит только в том, что Паскаль количество различных исходов при продолжении игры подсчитывал при помощи арифметического треугольника, 56
что, конечно, является более общей формой, и дает возможность решать задачи о разделении ставки при разном количестве оставшихся партий; Ферма же количество различных исходов подсчитывал непосредственно, выписывая все исходы, что являлось более громоздким и менее совершенным. Хотя математики того времени много внимания уделяли задачам, связанным с азартными играми, сами игры они, как правило, осуждали. Азартные игры им были нужны как удобная и всем доступная схема, при помощи которой легко иллюстрировать те или иные вероятностные положения. § 3. Роль Гюйгенса в теории вероятностей В 1655 г. X. Гюйгенс (1629—1695 гг.) в Париже познакомился со многими видными учеными. На него произвел глубокое впечатление рассказ Милона и Роберваля о новых вопросах, разрабатываемых Паскалем и Ферма; ему сообщили и о задаче о справедливом разделении ставки. Не установив, как решались подобные задачи, Гюйгенс, после возвращения в Голландию в конце 1655 г., самостоятельно занялся их исследованием. Результатом этого исследования явилась работа «О расчете в азартных играх», помещенная в виде приложения на латинском языке к книге «Математические этюды» Франца ван Схоуте- на, вышедшей в 1657 г.1 Хотя работа Гюйгенса и была опубликована уже после переписки Паскаля и Ферма, но эта переписка не могла оказать влияния на книгу Гюйгенса, так как письма Паскаля и Ферма были изданы лишь в 1679 г. В этой работе вместо предисловия напечатано письмо Гюйгенса Схоутену от 27.IV 1657 г., где он пишет: «Во всяком случае, я полагаю, что при внимательном изучении предмета читатель заметит, что имеет дело не только с игрой, но что здесь закладываются основы очень интересной и глубокой теории» (41, стр. 58]2. 1 На латинский язык работа Гюйгенса была переведена Схоу- теном. В 1660 г. она была издана на голландском языке — языке оригинала. 2 В XIV томе сочинений Гюйгенса, на который мы ссылаемся, приведен голландский оригинал и его французский перевод. 57
В этом же письме Гюйгенс объясняет историю написания этой книги. «Затем нужно знать, что в течение известного времени некоторые из наиболее знаменитых математиков всей Франции занимались этого рода расчетами, чтобы никто мне не приписывал чести первого открытия, которая мне не принадлежит. Но эти ученые, подвергнув друг друга испытанию, предлагая взаимно к разрешению много трудных задач, скрывали свои методы, и я должен был сам рассмотреть и углубить весь этот вопрос начиная с основ, и мне невозможно, по только что упомянутым мною причинам, утверждать, что мы исходили из одного и того же основного принципа. Но что касается результатов, то я констатировал в большом числе случаев, что мои решения совершенно не отличаются от их решений» [41, стр. 58]. Эта книга выдержала ряд изданий и считалась образцовой вплоть до начала XVIII в. Вся книга состоит из небольшого введения и 14 предложений. Предложение 1: «Если я имею равные шансы получения а или Ьу то это мне стоит (а+Ь)/2> [41, стр. 62]. Предложение 2: «Если я имею равные шансы на получение а, Ъ или с, то это мне стоит столько же, как если бы я имел (я + 6 + с)/3» [41, стр. 64]. В предложении 3 Гюйгенс пишет: «Если число случаев, в которых получается сумма а, равно ρ и число случаев, в которых получается сумма 6, равно q и все случаи могут получиться одинаково легко, то стоимость моего ожидания равна (pa+qb)/(p + q)» [41, стр. 66]. Это, по существу, есть определение математического ожидания для дискретных случайных величин. В дальнейшем Гюйгенс довольно широко употребляет это понятие. В предложении 4 разбирается задача о разделении ставки. «Предположим, что я играю против другого лица на то, кто первым выиграет 3 партии, и что я уже выиграл 2 партии, а он 1. Я хочу знать, какая часть ставки причитается мне в случае, когда мы хотим прервать игру и справедливо разделить ставки... Нужно заметить сначала, что достаточно принять во внимание число партий, недостающих той и другой стороне. Так как верно, что если бы мы играли на то, кто первым выиграет 20 пар- 58
тий, и если бы я выиграл 19 партий, а мой противник 18, то я имел бы такое самое преимущество, как и в изложенном случае, где при 3 партиях я выиграл 2, а он только 1, и это потому, что в обоих случаях мне недостает только одной партии, а ему двух. Затем, чтобы вычислить часть, причитающуюся каждому из нас, нужно обратить внимание на то, что произошло бы, если бы мы продолжали игру. Верно, что если бы я выиграл первую партию, то я закончил бы игру, и таким образом получил бы полностью сумму ставки, которую я обозначу а. Но если первую партию выигрывает мой противник, то наши шансы отныне станут равными, принимая во внимание, что каждому из нас будет недоставать по одной партии; значит, каждый из нас имел бы право на —а. Очевидно, что я имею столько же шансов выиграть первую партию, как и проиграть ее. Значит, я имею равные шансы получить а и -а, что, согласно первому предложению, эквивалент- ζ 3 но сумме половин, т. е. - а, так что моему противнику | остается -- а» [41, стр. 68]. 4 Мы привели почти полностью четвертое предложение, так как принцип решения других задач на разделение ставки такой же. Решение их мы не будем приводить, а сформулируем только условия и дадим ответы. 1. Мне недостает одной партии, а моему противнику трех партий. Как разделить справедливо ставку? (ответ: —а и -н· 2. Мне недостает одной партии, а моему противнику четы- / 15 1 \ рех партий I ответ: —а я —а 1. 3. Мне недостает двух партий, а моему противнику трех / 11 5 \ ответ: —а и —а]. \ 16 16 у 4. Мне недостает двух партий, а моему противнику четы- (л о о \ ответ:—а и —а]. 16 16 ) 5. Трое игроков. Первому и второму недостает по одной / 4 4 1 \ партии, а третьему — двух партий ответ: — а, —а, —а). 59
После подробного решения этих задач Гюйгенс дает в девятом предложении следующий совет. «Чтобы вычислить часть ставки, причитающейся каждому игроку при каком угодно их числе и условии, что каждому из них недостает определенного числа партий, нужно сначала принять во внимание, что будет причитаться интересующему нас игроку, если он сам или кто- либо другой из игроков выиграет очередную партию. Эти части нужно сложить вместе и полученную сумму разделить на число игроков, что укажет искомую часть... Следует вначале исследовать наиболее простые случаи и потом с их помощью рассматривать следующие. Согласно зтому способу можно вычислить все случаи, которые приведены в таблице, и бесконечное число других случаев» [41, стр. 74]. Далее следует упомянутая таблица. Число не- 1.1.2 1.2.2 1.1.3 1.2.3 1.1.4 1.1.5 1.2.4 1.2.5 достающих партий Части став- 4.4.1 17.5.5 13.13.1 19.6.1 40.40.1 121.121.1 178.58.7 542.179.8 ?аюп?йся" 9 27 27 27 81 243 243 729 игрокам Мы не приводим таблицу до конца, у Гюйгенса она продолжена до числа недостающих партий 2, 3 и 5, с соответст- 1433 635 119 „ * вующими долями , и . Верхняя строка этой таб- J 2187 2187 2187 * v лицы указывает, сколько партий недостает для выигрыша всей ставки каждому из трех партнеров. Например, 1. 1. 2 означает, что первому партнеру недостает одной партии, второму— одной и третьему — двух. Вся таблица составлена для трех партнеров. Нижняя строка дает ответы в долях ставки. Например, запись -^—-— означает, что каждый из 4 4 1 партнеров должен получить соответственно —, — и — У У У ставки. Гюйгенс правильно решил задачу о справедливом разделении ставки. Он исходил из положения, что ставку нужно делить пропорционально вероятностям выигрыша всей ставки при продолжении игры. Эта книга Гюйгенса до появления работы Я. Вернул- ли была по существу единственным руководством по теории вероятностей. Она имела широкое распростране- 60
ние и оказала существенное влияние на многих, кто занимался вопросами теории вероятностей. Гюйгенс фактически впервые вводит понятие математического ожидания и использует его. Математическое ожидание является обобщением понятия средней арифметической. Средняя арифметическая широко применялась в торговле и промышленности для определения средних цен, средней прибыли и т. п. С (развитием торговли и промышленности большое значение приобрели различные денежные операции. В Голландии раньше, чем во многих странах, получил развитие торгово-промышленный и банковский учет. «Голландия, лде колониальная система впервые получила полное развитие, уже в 1648 г. достигла высшей точки своего торгового могущества» [2]. В любой форме учета среднеарифметическое встречается очень часто. Именно отсюда этот метод пришел в науку. Маркс указывает, что коммерческая спекуляция «в своем исчислении вероятностей исходит как из средних цен, которые берутся как центр колебаний, так и из средне-высоких и средне-низких цен, или колебаний цен вверх или вниз от этого центра» [42, стр. 47]. Терминология Гюйгенса в теории вероятностей несет на себе отпечаток коммерческой терминологии. Он считает, что математическое ожидание — это цена шанса на выигрыш в безобидной игре и приходит к выводу, что справедливая цена — есть средняя цена. Он вычисляет «за какую справедливую цену я мог бы уступить свое место в игре другому». Сам Гюйгенс не называет математическое ожидание ожиданием, оно у него фигурирует как стоимость шанса. Впервые термин «ожидание» появляется в переводе ван Схоутена. Гюйгенс при решении задач не применял комбинаторики, поэтому решения получались громоздкими. Его приемы почти непригодны при решении задач в общем виде. У Гюйгенса таких решений и нет. В конце своей книги Гюйгенс предлагает пять задач для читателей. Решения этих задач он опубликовал через 8 лет, в 1665 г., без объяснений, только с математическими выкладками. Вот эти задачи. 1. А и В играют двумя костями на следующих условиях. А выигрывает, есуш он выбросит 6 очков, В 61
выигрывает, если выбросит 7 очков. Первым бросает один раз Л, затем В бросает дважды, затем А бросает два раза и т. д., -пока кто-нибудь не выиграет. В каком отношении шансы А относятся к шансам В? Ответ: как 10 355 к 12 276. 2. Трое игроков А, В и С берут 12 фишек, из которых 4 белых и 8 черных, и играют на таких условиях: первый» вытянувший вслепую белую фишку, побеждает. А тянет фишку лервым, В — вторым и потом С, затем опять А и т. д. Вопрос: в каком отношении находятся шансы одного против других? 3. А держит пари против Ву что из 40 карт (по 10 одинаковой масти) он выберет 4 такие, что каждая будет различной масти. Здесь величина шансов А против В определяется как 1000 к 8139. 4. Имеем, как во второй задаче, 12 фишек, из которых 4 белых, 8 — черных. А держит пари против Bf что в выборе 7 фишек вслепую он будет иметь 3 белых. Спрашивается, в каком отношении стоят шансы А против В? 5. Л и В, каждый имеющий по 12 монет, играют с тремя костями на условиях: если А выбросит 11 очков, он должен дать В одну монету, но если он выбросит 14, тогда В должен дать одну монету Л. Тот игрок выигрывает, который первым получит все монеты. Здесь шансы А относятся к шансам В как 244 140625 к 282429 536481. В конце своей книги Гюйгенс пишет, что он не дает решения этих задач потому, что было бы слишком трудно «надлежаще изложить рассуждения, приводящие к ответам». Кроме того, он считает, что это хорошие упражнения для читателей. После этих слов стоит дата окончания книги: «Гаага, 27 апреля, 1657 г.» Решением этих задач занимались многие математики XVII в. В 1687 г., через 10 лет после смерти Спинозы, в Гааге на голландском языке была издана работа: I часть — «Исследования о радуге», II часть — «Заметки о математической вероятности» (всего 20 стр.). Эта работа была переиздана в 1884 г. голландским математиком Бирнс де Ханом с сопроводительной статьей «Две работы Бенедикта Спинозы», в которой авторство работы он приписывает Спинозе. После этого Гебхардтом было произведено детальное исследование авторства Спинозы. В конце это- 62
го исследования он заявляет: «по-видимому, почти не возникает сомнения об авторстве Спинозы». В 1953 г. были изданы «Заметки о математической вероятности» на английском языке [155]. В этой работе приводятся пять задач из работы Гюйгенса «О расчетах в азартных играх» и дается решение первой из них. Прежде чем решить первую задачу Гюйгенса, Спиноза решает другую задачу, которую он считает более простой. «В и Л играют один против другого двумя костями на условиях ,что В выигрывает, если он выбросит 7 очков, и А, если он выбросит 6 очков, что каждый имеет два броска один после другого и что В бросает первым. Их шансы: В А 14256 8375 22631 Спиноза эту задачу решает следующим образом. а — общая ставка в игре. Пусть шансы А перед началом игры стоят х. Тогда шансы В будут стоить а—х. «Каждый раз, когда В начинает бросать, шансы А должны быть опять ху но каждый раз, когда к А возвращается очередь бросать, его шансы возрастают». В бросает первым. 7 он может получить шестью путям из 36, т. е. с вероятностью — при одном броске, а вероят- 6 1 5 ность не получить 7 равна 1 = —. Вероятность не получить 7 при двукратном бросании будет (—) = —, \ 6 / 36 вероятность получить по крайней мере один раз 7 равна 1— — = — 36 36' Итак, В имеет в первой паре бросков 11 шансов выиграть и 25 — не выиграть. Но эти же 25 шансов являются 25 шансами выиграть для А. Но для А они уже стоят больше. Пусть их стоимость будет у. Тогда Αβϋ;,β2* (И. 1) χ 25 υ 25 V ' Для выигрышам одном бросании А имеет 5 путей из 35, т. е. 63
5 , 5 31 вероятность выигрыша будет —, невыигрыша 1 = —. 36 36 36 Вероятность не выиграть при двукратном бросании: (·—) = = . Вероятность выиграть при двукратном бросании: 1 — • = . Цена шанса перед бросанием А будет состоять 1296 1296 335 из «верного выигрыша» а плюс «проблематичный выиг- 961 335а + 961л- π рыш»: х, у = ! . Подставляем это значение в * 1296 * 1296 3_6* = 335α+ 961, χ = 8375α _ ^^ шанса А ^ ν ' 25 1296 22631 D 14256α - чина шанса В: а — χ == , следовательно, шансы А от- 22 631 носятся к шансам В, как 8375 к 14256. Только после решения этой задачи Спиноза решает первую задачу Гюйгенса. Он рассуждает следующим образом. Вероятность того, что А выиграет ставку а при первом броске, равна —, т. е. стоимость шанса равна —. С веро- 36 36 31 л ятностью — А переидет в состояние, соответствующее условию предыдущей задачи, т. е. его шансы на выигрыш будут 31 8375α π стоить — . По теореме сложения получаем величину 36 22 631 К J J „ 5α , 31 8375α 10 355α D D A шанса А: = . Величина шанса В бу- 36 36 22 631 22 631 J 10355α 12 276α η Α дет: а = . Следовательно, шансы А относятся 22 631 22 631 к шансам В, как 10 355 к 12 276. На этом работа Спинозы кончается. Нам неизвестно, пытался ли он решить остальные задачи, предложенные Гюйгенсом. По этой работе видно, что Спиноза был неплохим математиком, свободно владеющим методом, которым решаются вероятностные задачи у Гюйгенса. В процессе решения Спиноза учитывает изменения цены шанса в зависимости от хода игры. В письме ot16.V1662 г. президент Лондонского королевского общества Морэй попросил Гюйгенса сообщить 64
свое мнение о книге Дж. Граунта, опубликованной в 1662 г. Книга Граунта посвящена различным вопросам, связанным со статистикой населения. В своем ответе от 9.VI. 1662 г. Гюйгенс восторженно отозвался о трактате Граунта. На основании работы Граунта Гюйгенс в 1669 г. построил кривую смертности и правильно определил понятия средней и вероятной продолжительности жизни. Гюйгенс впервые сознательно применил методы теории вероятностей к демографической статистике. В 1671 г. к Гюйгенсу обратился с рядом вопросов бургомистр Амстердама математик ван Гудде (1628— 1704 гг.), который принимал участие в работе, проводимой Виттом1 по исчислению пожизненных рент. В своем ответе от З.Х 1671 г. Гюйгенс одобрил проводимую Виттом работу. Таким образом, в XVII в. уже правильно решались довольно разнообразные задачи по теории вероятностей. Математики владели целым рядом важных понятий и теорем. Были известны теоремы сложения и умножения вероятностей, которые широко применялись при решении задач. Само понятие вероятности стало приобретать все более осязаемое содержание. В науку было введено под названием справедливая цена шанса одно из важных понятий теории вероятностей — математическое ожидание. Теория вероятностей в этот период была тесно связана с другим разделом математики — с комбинаторикой. Теория вероятностей начала применяться в статистике, в физике и астрономии. Теория вероятностей как математическая дисциплина в этот период только создавалась. Решались отдельные задачи, но они были уже объединены общей вероятностной проблематикой. В этот период интерес к новой науке все время возрастал. Следует отметить, что в историко-математической литературе преувеличивается роль Паскаля и Ферма в создании теории вероятностей. В результате происходит другая, на наш взгляд, более сущесгвенная ошибка: творчеству Гюйгенса отводится второстепенное значение, его Я. Витт (1625—1672) —фактический правитель Голландии с 1650 г.— написал, одну из первых работ по применению теории вероятностей к теории ренты. 65
роль в развитии теории вероятностей принижается. Но следует помнить, что Гюйгенс написал первую книгу по теории вероятностей, в которой, в частности, ввел понятие математического ожидания. Его книга оказала большое влияние на многих ученых. Я. Бернулли, положивший начало новому периоду в развитии теории вероятностей, высоко оценивал работу Гюйгенса и отдавал должное его влиянию. В заключение раздела о Гюйгенсе заметим, что его собрание сочинений, содержащее 22 тома, издавалось с 1888 г. по 1950 г. Работа «О расчете в азартных играх» вошла в 14-й том (издан в 1920 г.), где голландский оригинал сопровождается французским переводом. Здесь же приведены девять приложений, написанных Гюйгенсом в разные годы, последнее в 1688 г., что указывает на постоянный интерес Гюйгенса к вопросам теории вероятностей.
Глава III РАЗВИТИЕ ТЕОРИИ ВЕРОЯТНОСТЕЙ ДО СЕРЕДИНЫ XIX в. § 1. Я. Бернулли и его работа «Искусство предположений» Яков Бернулли (1654—1705 гг.) принадлежал к семье знаменитых швейцарских математиков. С 1687 г. он — профессор математики в Базельском университете, с 1699 г. — член Парижской Академии наук. В 1713 г. вышла в свет книга Я. Бернулли «Искусство предположений», которая сыграла существенную роль в истории теории вероятностей. Мы можем считать, что теория вероятностей начиная с Я. Бернулли оформилась как наука и вступила в новый период своего развития. В книге «Искусство предположений» совершенно строго доказана первая предельная теорема, которую сейчас мы называем теоремой Я. Бернулли. В дальнейшем вопросы, связанные с предельными теоремами, заняли центральное место в теории вероятностей. Книга Я. Бернулли [43] была издана на латинском языке через 8 лет после смерти автора, в 1713 г. Николаем Бернулли *. Первую часть книги Я. Бернулли составляет перепечатка полного текста книги Гюйгенса. Я. Бернулли дает ко всем (кроме одного) предложениям Гюйгенса свои примечания. Называется I часть «Сочинение о возможных расчетах в азартной игре Христиана Гюйгенса с замечаниями Я. Бернулли». Остановимся на некоторых наиболее интересных из этих примечаний. 1 Николай Бернулли (племянник Я. Бернулли) также занимался вопросами теории вероятностей. В 1709 г. он защитил диссертацию на соискание степени лиценциата прав: «Об использовании искусства предположений в судебных делах», которую высоко оценил Лейбниц. В этой работе рассматривались вопросы об уплате по долгам, о достоверности свидетельских показаний и т. п. 67
К предложению 1 Гюйгенса Я. Бернулли делает обширное примечание. «Автор этого трактата излагает... в этом и двух следующих предложениях основной принцип искусства предположений. Так как очень важно, чтобы этот принцип был хорошо понят, то я попытаюсь доказать его при помощи исчислений более обычных и более доступных всем, исходя исключительно из той аксиомы, или определения, что каждый должен ожидать или предполагает ожидать столько, сколько он неминуемо получит. Слово «ожидание» здесь не должно пониматься в его обычном смысле, согласно которому «ожидать» или «надеяться» относится к событию наиболее благоприятному, хотя может произойти наихудшее для нас; нужно понимать под этим словом ту надежду, которую мы имеем на получение лучшего, уменьшенную страхом худшего. Так что стоимость нашего ожидания всегда означает нечто среднее между лучшим, на что мы надеемся, и худшим, чего мы боимся. Таким образом следует его понимать здесь и далее». После рассмотрения предложения 3 Бернулли отмечает следующее: «Из рассмотрения... очевидно, что имеется большое сходство с правилом, называемым в арифметике правилом товарищества, которое состоит в нахождении цены смеси, составленной из определенных количеств различных вещей с различной ценой. Или, скорее, что вычисления являются абсолютно одинаковыми. Так, подобно тому, как сумма произведений количеств смешиваемых веществ на их соответственные цены, разделенная на сумму веществ, дает искомую цену, которая всегда находится между крайними ценами, также сумма произведений случаев на соответственно приносимые ими выгоды, разделенная на число всех случаев, указывает стоимость ожидания, которая вследствие этого всегда является средней между наибольшей и наименьшей из этих выгод». Это достаточно хорошее объяснение математического ожидания и его связи со взвешенной средней арифметической. Предложение 4—это одна из задач о разделении ставки. К этой задаче Бернулли делает такое замечание: «Вычисляя уч£сти? нужно р'бращать вццм$щ$ трл&вд 08
на предстоящие игры, не обращая никакого внимания на сыгранные уже партии». Далее в очень оригинальной форме он разъясняет применение теоремы сложения вероятностей, в частности невозможность ее применения для совместных событий. «Если два человека, достойные смертной казни, пртт нуждаются бросить кости, при условии, что тот, кто выбросит меньшее число очков, понесет свое наказание, а другой, который выбросит большее число очков, сохранит свою жизнь, и что оба они сохраняют жизнь, если выбросят одинаковое число очков, то мы найдем для ожидания одного 7/12 или 7/12 жизни..., но из этого не следует заключать, что ожидание другого будет 5/12 жизни, так как очевидно, что здесь обе участи одинаковы, другой также будет ожидать 7/12, что дает для обоих 7/6 жизни, т. е. больше целой жизни. Причиной этого является то, что нет ни одного случая, в котором хотя бы один не остался живым, а имеется несколько случаев, когда они оба могут остаться в живых». К серии предложений Гюйгенса на разделение ставки Бернулли составляет таблицы, в которых указано, в каком отношении должны делиться ставки между игроками при различных условиях. В примечании к предложению 9 Гюйгенса Бернулли подробно останавливается на различных положениях, которые могут произойти при бросании двух и более костей, и на числе случаев, благоприятствующих каждому положению, и строит для этого специальную таблицу, результаты которой можно выразить следующим образом: число способов, которыми может быть получено т очков при бросании η костей, равно коэффициенту хт в разложении (х+х2+х*+х*+х*+х*)п. К предложению И Бернулли делает следующее примечание: «Автор установил..., что можно с выгодой взяться выбросить одной костью в четыре бросания шестерку, теперь он удостоверяет, что нельзя без убытка взяться выбросить на двух костях две шестерки в 24 бросаниях. Это может показаться абсурдным большому количеству людей, так как существует точно такое же отношение между 24 бросаниями и 36 положениями двух костей,, кд?с между 4 бросэгоями и β цодо^едиям^ РДЩ># KQCTJf», 68
В примечании к предложению 12 Бернулли получает результат, который мы теперь называем формулой Бернулли. Он устанавливает вероятность того, что событие А (Р(А) =/?) появится при η испытаниях т раз. Это вошедшая во все учебники формула: p,« = OY"w;!(?=i-p) Из приведенных примеров видно, что во многих случаях задачи Гюйгенса были для Бернулли только поводом для изложения своих взглядов и служили основой для получения новых формул. Часть II работы Бернулли «Учение о перестановках и сочетаниях» состоит из девяти глав: 1. Перестановки. 2. О сочетаниях вообще; сочетания без повторений всего класса вместе. 3. Сочетания (без повторений) определенного класса; фигурные числа и их свойства. 4. Число сочетаний (без повторений) одного определенного класса; число, которое указывает, сколько раз определенный предмет появится отдельно или совместно с другими. 5. Число сочетаний с повторениями. 6. Число сочетаний с ограниченным повторением. 7. Изменения без повторений. 8. Изменения с повторениями. 9. Число изменений с ограниченным повторением. Теория сочетаний была необходима для решения многих задач теории вероятностей того времени. До применения анализа бесконечно малых в теории вероятностей, что было сделано несколько позже, теория сочетаний была основным аппаратом теории вероятностей. На примере развития комбинаторики и теории вероятностей видно, как взаимно влияли друг на друга эти два раздела математики. В своей работе Бернулли указывает, что он знаком с исследованиями по комбинаторике таких известных математиков, как Лейбниц, Валлис, Схоутен и др. по комбинаторике. Работы своих предшественников он дополнил новыми результатами, из которых наиболее значительными он считает свои исследования по фигурным числам. Бернулли пишет, что не существует полного изложения теории сочетаний, и поэтому он излагает все необходимые сведения по этой теории подробно и с самого начала. 70
Теория сочетаний широко применялась при составлении анаграмм, а также стихов протей 1. В Европе XVI и XVII вв. анаграммы из собственною имени нередко служили в качестве псевдонимов. Анаграммами пользовались также для того, чтобы скрыть в них новый метод или открытие. Особенно часто анагра. мы в XVII в. встречаются в религиозной литературе. Начало II части своей книги Я. Бернулли посвящает именно этим вопросам. Заметим, кстати, что этот материал представляет некоторый интерес и для современной математической лингвистики. Первая глава II части посвящена теории перестановок. Перестановками Бернулли называет такие изменения, в результате которых количество предметов сохраняется, а порядок может изменяться различными способами. Он отличает случаи, когда все элементы различны и когда имеются совпадающие элементы. Количество перестановок из η различных элементов он получает следующим образом. На первом месте может стоять любой элемент, следовательно, для первого места мы имеем η возможностей. Для следующего элемента имеется η—1 возможность. Таким образом, для выбора двух первых элементов получим п(п—1) возможностей. Рассуждая подобным образом дальше, Бернулли получает окончательно, что число перестановок из η элементов равно 1·2...(η—1)·λ. Он приводит таблицу количества перестановок от 1 до 12: 12 3 4 5 6 7 8 9 10 11 12 1 2 6 24 120 720 5040 40.320 362 880 36 28 800 39 916 800 479001600 Это есть соответствующие значения факториалов. У Бернулли отсутствуют символические обозначения числа перестановок, сочетаний и размещений, хотя тор- мины «перестановка» и «сочетание» он употребляет в современном значении. Кроме того, он различает перестановки и сочетания с повторениями и без повторений. Вместо понятий «размещение» он употребляет выражение «сочетания вместе с их перестановками». Для числа 1 Стихами протей назывались стихи, составленные из слов дан* ного стиха. Протей — морское божество в греческой мифологии, вещий и бессмертный старец, неуловимый вследствие способности принимать различные образы. 71
перестановок с повторениями Бернулли получил следующий окончательный вывод: я! Ρη{αν α2, ..., ak) = at\a£ ... ak\ В качестве примеров он рассматривает число перестановок, образованных из букв различных слов. Из букв слова «Roma» можно получить 1-2-3-4 = 24 перестановки, из «Leopoldus» 1-2-3-4-5-6.7-8-9 362880 2-2 4 =90720. Из «Studiosus»3^^ =30240 2-6 Далее Бернулли переходит к рассмотрению сочетаний. Под сочетанием он понимает такого рода соединения, в которых из данных элементов выделяют некоторые и соединяют их друг с другом, не обращая внимания на порядок. Показателем класса сочетаний Бернулли называет количество соединенных элементов. Интересно отметить, что при рассмотрении сочетания разных классов у него встречается нулевой класс, т. е. класс, в котором совсем нет элементов; он также различает сочетания без повторений от сочетаний с повторениями. Для различных элементов Бернулли составляет таблицу сочетаний (образец таблицы, по-видимому, заимствован из работы Схоутена «Математические этюды», ом. [44, стр. 30—31]). Для пяти элементов а, Ь, с, d, e эта таблица у Бернулли имеет следующий вид: а; b,ab; c, ас, be, abc\ d, ad, bd, cd, abd, aed, bed, abcd\ (e, ae, be, ce, de, abe, ace, bee, ade, \bde, cde, abce, abde, acde, bede, abede. Бернулли говорит, что эту таблицу можно продолжить. Исходя из этой таблицы, при помощи математической индукции Бернулли доказывает теорему о том, что число всевозможных сочетаний всех классов равно произведению стольких двоек, каково число элементов, и 72
минус единица. В современных обозначениях это выглядит так: (ϊ) *+*©+··· +С)-*·-'· Эта теорема без доказательства содержалась ранее у Кардано, Штифеля, Лейбница. Далее Бернулли приводит таблицу для числа сочетаний: I 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 1 10 1 11 1 II III 0 0 1 0 2 1 3 3 4 6 5 10 6 15 7 21 8 28 9 36 10 45 IV 0 0 0 1 4 10 20 35 56 84 120 V 0 0 0 0 1 5 15 35 70 126 210 VI 0 0 0 0 0 1 6 21 56 126 252 VII VIII] 0 0 0 0 0 0 0 0 0 0 0 0 1 0 7 1 28 8 84 36 210 120 IX X 0 0 0 0 0 0 0 0] 1 9 45 0 0 0 0 0 0 0 0 0 1 10 XI XI 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 12 1 11 55 165 330 462 462 330 165 55 11 1 Эта таблица отличается от аналогичной таблицы Лейбница только иным расположением и является фактически треугольником Паскаля. Любое число в ней находится сложением чисел в предыдущих строках предыдущего столбца. Бернулли перечисляет свойства этой таблицы. Приведем некоторые из них. 1. Второй столбец начинается с одного нуля, третий — с двух, четвертый — с трех, и вообще С-й с С — 1 нуля. 4. Любой член таблицы равен сумме всех предыдущих членов предыдущего столбца. 8. Если начиная от начала взять «екоторое число строк и сложить по столбцам, то получаются члены следующей строки без первого члена. Например: 10 0 0 0 110 0 0 12 10 0 13 3 10 14 6 4 1 5 10 10 5 1 73
12. Сумма некоторого числа членов (считая нули) в любом столбце относится к сумме, состоящей из такого же числа одинаковых слагаемых, каждое из которых равно последнему из взятых членов, как 1 к номеру столбца. Или же сумма некоторого числа членов какого-нибудь столбца, начиная с 1, относится к сумме стольких же слагаемых, каждое из которых равно числу, следующему за последним слагаемым, как 1 к номеру столбца. Например: 0 3 15 0 10 1 56 13 2 5 0 10 4 56 2 3 3 5 1 10 10 56 3 3 4 5 4 10 20 56 10 10 35 56 6:12=1:2 10:20=1:2 15:60=1:4 70:280=1:4 Бернулли доказывает, что сумма η членов &-го столбца, или, что то же самое, число, стоящее в (/г+1)-й строке и (k+ 1)-м столбце, равна п(п — l)...(n — k + 1) т. е. равна числу сочетаний из η элементов по k. В пятой главе Бернулли составляет таблицы сочетаний. Например, из элементов a, ft, с, d можно составить следующие сочетания от первого до третьего класса: а, аа, ааа\ ft, aft, ftft, aab, abb, ftftft; c, ac, be, cc, aac, abc, bbc, ace, bee, ccc; d, ad, bd, cd, dd, aad, abd, bbd, acd, bed, ccd, adb, bdd, edd, ddd. Эту таблицу можно продолжить и далее. Если выписать количество элементов по классам для каждой строки, то получим следующее: для I класса, 1,1,1,1 ..., для II класса 1, 2, 3, 4..., для III класса 1, 3, 6, 10... Если эту запись продолжить, а затем свести в таблицу, то получится таблица числа сочетаний с повторениями, которая совпадает с арифметическим треугольником Паскаля. 74
Бернулли отмечает следующие свойства этой таблицы. 1. Столбцы и строки состоят из одинаковых чисел. 2. Сумма первых η членов &-го столбца равна числу, стоящему в (&+1)-м столбце и n-й строке. 3. Сумма первых η членов &-го столбца (или строки) относится к сумме стольких же слагаемых, каждое из которых равно числу, стоящему за последним слагаемым, как 1 к номеру столбца (или строки). Например, 1 4 10 20 35 35 35 35 35:140=1: :4 Далее Бернулли доказывает, что сумма η первых членов k-го столбца, или, что то же самое, число сочетаний с повторениями из η элементов по k, равна я (я+1) ... (я+6-1) _(n + k—V 1-2 ... k m Пусть an,k будет n-й член fe-ro столбца. Сумма первых η членов первого столбца равна л/1!. По свойству (2) это число равно п-щ члену второго столбца, т. е. аПл = = /г/1, также _ к+1 . п __ п+2 "/1+1.2 — " , «/1+2,2 — ~ 1 1 и т. д. По тому же свойству (2) получаем η у. Я/, 2 == Я/1,3» а ,по свойству (3) имеем η 2 α/,2: ηαη+1Λ = 1:2, /=1 откуда п _ ""п+и* _п(п+1) 75
Λ η (η +1) (η +2) Аналогично можно получить, что апл = ———^——- * «51 Пусть формула будет верна для любого η и k+l: д(п+1)(я+2) ... (я + *-1) a"'k+1 = ТТ^Тк ' Докажем, что она верна для любого η и k+2. η По свойству (2) имеем: аЛ,/н-2 == 2fl/»*+1#» по свойству (3): η 2 ai9k+1: nan+ltk+1 = 1: (k +1). Откуда следует __ "a/*+i,fe+i _ \njn+i)(n+2) ... (n + k) Опм* ~ -Щ 1.2...Л(Л+1) ' Бернулли впервые рассматривает задачу о числе сочетаний с ограниченными повторениями. Решить эту задачу в общем виде ему не удалось. Он только составил таблицу для частных случаев и указал способ определения числа всех классов, вместе взятых. В седьмой главе Бернулли рассматривает вопрос об определении числа размещений без повторений. Именно здесь размещениями он называет «сочетания вместе с их перестановками». Бернулли находит, что число размещений А-го класса из η элементов равно 1.2-3... & V ' = я(/1—1) ... (п — k + l). Далее он находит, что число размещений &-го класса с повторениями из пг различных элементов равно гпк. Затем сумму всех размещений от первого до fe-ro класса, полученных из m различных элементов, Бернулли выражает в виде суммы геометрической прогрессии со знаме- 76
нателем m, т. е. , О , О , ι П ttt (ffl ' 1) т—1 Глава девятая посвящена вопросу определения числа размещений с ограниченными повторениями. Этот вопрос Бернулли излагает не в общем виде, а на частном примере, для которого он составляет таблицу. Бернулли, mo-видимому, первый занимался вопросами определения числа размещений и сочетаний с ограничениями повторениями. Он рассматривает последовательности так называемых фигурных чисел, которые сводит в таблицу, устанавливая ряд их свойств. На основании установленных свойств Бернулли находит формулы для сумм оди* наковых степеней чисел натурального ряда до десятой степени включительно: v' 4 2 ^4 S(nf) = 1/г5 + 1/г4 + -/г3 — —я; S(n10) = ±nn +1-п10 +-п9 — /г7 + л5 — 1л8 + -я 4 ' 11 2 6 2 66 . Формулы для S(n), S(n2)f S(nz) были известны еще в Греции. Выражение для S(n 4) было найдено в средние века. Ферма была известна формула 5 (*') = ТТГ Λ'+1 + *.1Л +>млв + . ·. + а/У, / +1 которая затем была доказана Паскалем, но ими не был получен закон образования коэффициентов a£,k . Бернулли на основании аналогии и догадки, без доказательства, записывает общую формулу: 5 (я') β JL- η/+1 + ±я' +1 C?Ai'^ + v ' ί+1 2 2 +±с$вп'~* + -i Q5 С/г'-6 +1 с;ш'-7 + ... 4 6 8 77
Бернулли отмечает, что начиная с третьего члена степень η уменьшается все время на 2 и каждая формула заканчивается либо членом с я2, либо членом с п. Числа А, В, С, Д..., названные Эйлером числами Бернулли, равны коэффициентам при η в 5(/г2), 5(/г4), S(n6)... Следовательно, Л = 1/6; β =—1/30. Числа Бернулли встречаются во многих формулах и вопросах математического анализа и теории чисел. Связанными с этими числами проблемами впоследствии занимались многие крупные математики, в том числе Эйлер, Лаплас, Остроградский и др. Часть II «Искусства предположений» представляла для своего времени ценный труд в области комбинаторики. Она служила учебником по этому разделу математики в течение XVIII в. Часть III работы Бернулли называется «Применение учения о сочетаниях к различным случайным играм и играм в кости». Эта часть содержит 24 задачи с подробными решениями. Приведем условия некоторых задач. 1. Некто положил в урну два шара, белый и черный, и предложил трем игрокам премию при условии, что ее получит тот, кто первый вытянет белый шар, но если никто не вытянет белый шар, то они премии не получат. Первым извлекает шар А и кладет его обратно, затем вторым испытывает счастье Вив конце, третьим, — С. Какие шансы имеют эти три игрока? 5. А держит лари с Я, что он вытянет из 40 игральных карт, из которых по 10 карт разной масти, четыре разномастные карты. Как относятся шансы обоих друг к другу? 12. Некто желает при 6 бросаниях кости получить все 6 граней в таком порядке: при первом бросании одно очко, при втором — два и т. д. Как велико его ожидание? В ряде задач требуется подсчитать ожидание выигрыша в некоторой азартной игре. Как мы видели, это в основном довольно распространенные для того времени задачи. В первой части своей книги Бернулли неоднократно упрекал Гюйгенса в том, что он решает числовые задачи, а не задачи в общем виде при помощи букв, что давало бы возможность вскрыть общие закономерности. 78
В третьей части Бернулли ряд элементарных, но достаточно сложных задач решает в общем виде. Например: 22) Есть вид азартной игры, в которой число всех случаев а, число некоторых случаев из них ft, а число всех остальных случаев а — 6 = с. Тит, уплатив Каю несколько монет, покупает несколько бросаний кости. Если он выбросит один из Ь случаев, то он получит от Кая т монет; он ничего не получит, если он выбросит один из с случаев. Но если он выбросит η раз один за другим один из с случаев, то Тит от Кая получает обратно свои η монет. Какие ожидания выигрыша Тита и Кая? Рассмотренные три части книги Бернулли представляют несомненный интерес для истории математики. В них часто по-новому осмысливаются уже ставшие стандартными некоторые задачи теории вероятностей. Полностью осознана роль комбинаторики в теории вероятностей того времени. Впервые последовательно изложена теория соединений, причем получено много новых свойств и различных формул; получены очень интересные результаты и по другим разделам. Уже эти три части являются существенным вкладом в развитие не только теории вероятностей, но и математики вообще. Но основная часть книги, которая по существу, является началом нового этапа в истории теории вероятностей,— это часть IV, которая называется «Применение предыдущего учения к гражданским, моральным и экономическим вопросам». Эта часть содержит доказательство теоремы Бернулли, т. е. закона больших чисел и его простейшей формы. Четвертая часть, а следовательно и вся книга осталась неоконченной: она обрывается после доказательства теоремы Бернулли. Но из заглавия следует, что Бернулли ставил своей целью рассмотреть применение теории вероятностей к гражданским, моральным и экономическим вопросам. Об этом пишет и Николай Бернулли в своем предисловии к книге Я. Бернулли. В своей книге, и особенно в части IV, Я. Бернулли касается многих общих и философских вопросов, связанных с вопросами теории вероятностей. Он отчетливо стоит на точке зрений метафизического детерминизма. Более тоге^ · получивший широкое распространение так называемый лапласовский детерминизм не менее после- 79
довательно и точно, а часто даже в близких/выражениях, мы находим у Я. Бернулли. В первой главе этой части он пишет: «Бели не наверно случится то, чему определено случиться, то непонятно, как может остаться непоколебленной хвала всеведению и всемогуществу величайшего творца». «Совершенно несомненно, что при данном положении кости, скорости и расстояния от доски, в тот момент, когда кость оставляет руку бросающего, она не может падать иначе, чем падает на самом деле. Равным образом, при данном составе воздуха и данных массах, положениях, направлениях, скоростях ветров, паров и облаков, а также механических законах, по которым все это взаимодействует, завтрашняя погода не может быть иной, чем та, которая на самом деле должна быть. Так, что эти явления из своих ближайших причин следуют с не меньшей необходимостью, чем затмения из движения светил. И, однако, обычно только затмения причисляются к явлениям необходимым, падение же кости и будущая погода — к случайным. Причина этого исключительно та, что предполагаемое данным для определения последующих действий на самом деле в природе нам недостаточно известно. И если бы даже это было известно, то недостаточно развиты математические и физические знания, чтобы, исходя из данных причин, подвергнуть такие явления вычислению, подобно тому, как из совершенных принципов астрономии могут быть предвьгчисляемы и предсказываемы затмения... Случайность главным образом зависит от нашего знания». Глава II четвертой части начинается со следующего определения: «Искусство предположений у нас определяется как искусство — возможно точнее измерять вероятности вещей затем, чтобы в наших суждениях или действиях мы могли всегда выбирать или следовать тому, что будет найдено лучшим, более удовлетворительным, спокойным и разумным. В этом единственно заключается вся мудрость философа и благоразумие политика». Прежде чем приступить к основной задаче, Я. Бер- нулли пишет, что «полезно предпослать некоторые общие правила или аксиомы». Всего им приведено девять таких правил. Чтобы представить характер этих правил, приведем некоторые из них: 80
1. Догадкам не место в тех вещах, где можно достигнуть полнрй достоверности. 6. Что ^ некотором случае полезно, но ни в каком не вредно, следует предпочитать тому, что никогда не приносит ни пользы, ни вреда. 7. Не следует оценивать поступки людей по их результатам и т. п. После этих правил Я. Бернулли пишет о том, что каждый может составить для себя еще много подобных. Только после всех этих довольно обширных предварительных рассуждений и замечаний он начинает в главах III и IV подходить к формулировке своей основной задачи. Он пишет: «Сила доказательства, свойственная какому-либо доводу, зависит от числа случаев, при которых он может существовать или не существовать, доказывать или не доказывать или даже доказывать противное». Далее он переходит к одному из центральных мест книги. По существу, он дает здесь довольно хорошее объяснение статистическому понятию вероятности. «Все дело сводится к тому, чтобы для правильного составления предположений о какой-либо вещи были точно исчислены как числа случаев, так и было бы определено, насколько одни случаи могут легче встретиться, чем другие. Но здесь мы, по-видимому, встречаем препятствие, так как только крайне редко это возможно сделать и почти нигде не удается, кроме игр, зависящих от случая, которые первые изобретатели постарались сделать безобидными, устроили так, чтобы были совершенно известны числа случаев, влекущих выигрыш или проигрыш, а сами случаи могли бы встретиться одинаково легко. В большинстве же других явлений, зависящих или от действия сил естественных, или от свободной воли людей, не имеет места ни то, ни другое... Кто из смертных когда-либо определит как число случаев, число, например, болезней, и насколько одна болезнь легче погубит человека, чем другая, например чума по сравнению с водобоязнью». Результат в этих случаях «зависит от причин совершенно скрытых и сверх того, вследствие бесконечного разнообразия их сочетаний, всегда ускользающадьоуг нашего познания, и было бы совершенно безумно желать что-либо узнать таким путем. 81
Но здесь нам открывается другая дорога для/достижения искомого. И что не дано вывести a priori, то, по крайней мере, можно получить a posteriori, т./е. из многократного наблюдения результатов в подобных примерах. Потому, что нужно предполагать, чт</ некоторое явление влоследствии в стольких же случаях' может случиться или не случиться, в скольких при подобном же положении вещей раньше оно было отмечено случившимся или неслучившимся... Этот опытный способ определения числа случаев по наблюдениям не нов и не необычен... то же все постоянно соблюдают в повседневной практике». Далее Бернулли еще более глубоко развивает свою мысль. «Для такого рассуждения... требуется большой запас наблюдений... Хотя это, естественно, всем известно, однако доказательство, извлекаемое из научных оснований, вовсе не так обычно, и потому нам предстоит его здесь изложить. Причем я счел бы для себя малой заслугой, если бы остановился на доказательстве того, что все знают. Здесь для рассмотрения остается нечто, о чем до сих пор, может быть, никто и не думал. Именно, остается исследовать, будет ли при таком увеличении числа наблюдений вероятность достичь действительного отношения между числами случаев, при которых какое-либо событие может случиться или не случиться, постоянно возрастать так, чтобы, наконец, превзойти всякую степень достоверности, или же задача, так сказать, имеет свою асимптоту, т. е. имеется такая степень достоверности, которую никогда нельзя превзойти, как бы ни умножались наблюдения». «Чтобы не понимать этого превратно, следует заметить, что отношение между числами случаев, которые мы желаем определить опытом, понимается не в смысле точного отношения..., но до известной степени приближенного, т. е. заключенного в двух границах, которые можно взять сколь угодно тесными». «Вот, следовательно, какова задача, которую я здесь решил обнародовать, после того как уже в течение 20 лет владел ее решением». Только после такого длительного разъяснения в главе V он приступает к доказательству своей теоремы. Вначале доказывается ряд лемм. 82
В ле\мме 1 рассматриваются два ряда О, 1,2, >.., г—1, гг+1, ..., r + s\ О, 1, 2, .,., пт — г, ..., пг, ..., пг + п, ..., nr+ns и утверждается, что с увеличением η растет количество членов между пг и nr+η; пг и пг—я; яг+ai и nr+ns; пг и 0. Кроме того, как бы велико ни было я, число членов шосле nr+η не будет превышать более чем в 5—1 раз число членов, заключенных между пг и nr+η или между пг и пг — п, а также число членов до пг— η не будет превышать более чем в г—1 раз число членов между теми же числами. Лемма 2. Всякая целая степень какого-либо двучлена г+s выражается числом членов, на единицу большим числа единиц в показателе степени. Лемма 3. В любой степени двучлена г+ s, по крайней мере в t=r+s ил1и nt=nr+ns, некоторый член Μ будет наибольшим, если числа предшествующих ему и следующих за ним членов находятся в отношении s к г или, что то же, если в этом члене показатели букв г и s находятся в отношении самих количеств г и s; более близкий к нему член с той и другой стороны больше более удаленного с той же стороны; но тот же член Μ имеет к более близкому меньшее отношение, чем более близкий к более удаленному при равном числе промежуточных членов. Доказательство. (r + syW*+— rnt~1s + 1 nt (nt - 1) ^-2s2 , ntjnt — i)(nt — 2) ^f-з^ , 1-2 1-2-3 Отмечается, что коэффициенты членов равноудаленных от концов равны. Число всех членов nt+l = nr+ns+l. Наибольший член будет: w __ nt(nt-i) ... (nt — ns+l) rnr ns _ 1-2 ... ns — ntjnt—i) .. . (nr+1) nr ns ~~ 1-2-3 ... ns Μ можно записать в другом виде, воспользовавшись форму- лой С% = СУГПЗ = С%. 83
м = nt (nt«-!) (nt >- nr +1) »г Лд = nt(nt^-l) ... (ns-+ji) nr M 1*2 ... nr 1-2 ... nr Ближайший к нему слева член равен (nt —1) ... (nr - 1-2 ... (/is—1) /ι/ (/г/ —1) ... (яг +2) лг+i fts-i. Г S , справа- nt(nt-l) . .. (ns+2) rnr-~i ns+i 1-2 ... (/гг— 1) Следующий СЛеВа- 1-2 ... (ns— 2) nt(nt-i) . .. (ПГ +3) пг+2 ns-ί, справа — nt (nt —i) ... (nS +3) гпг-2сП8+2 и т 1-2 ... (nr —2) При помощи соответствующих делений и сравнений все утверждения леммы легко доказываются. Лемма 4. В степени двучлена с показателем nt число η может быть взято столь большим, чтобы отношение наибольшего члена Μ к двум другим L и λ, отстоящим от него налево и направо на η членов, превзошло всякое данное отношение. Доказательство. м _ nt(nt-l) ... (nr+1) rnr$ns _ 1-2 ... azs __ я* (я* —1) ♦ ♦ ♦ (ns +1) -^erts. 1-2 ... nr г nt(nt~l) ... (nr + n+1) nr+n ns—n. Lt — ——·■—■-«———~-———.——.^——— г S ι 1-2 ... (ns —n) λ η/ (η/ —1) ... (ns + n +1) nr—n^ns+n 1·2 ... (nr —n) Для доказательства леммы необходимо установить, что lim - = оо и lirn — = оо. /1-юо ь /ι-юо λ 84
Посмотрим на примере первого отношения, как Бернулли решает эту задачу. Вначале он делает следующие преобразования: Μ nt (nt —1) (nt —2) Λ . (nr +1) -1 -2 ... (ns— η) rnrsns ^ L nt(nt*-\) ... (nr + n+1) -1-2 ... ns-rnr+nsns-n (nr + n) (nr + n—l) ... (nr +1) sn _ (ns^n +1) (ns — η +2) ... ns· r" ___ (nrs + ns) (nrs + as — s) · · · (ws + s) («rs — яг + r) (nrs — nr +2r) ... nrs После этого Бернулли пишет: «Но эти отношения [имеется в виду и Μ/λ — Л. М.\ будут бесконечно большими, когда η полагается бесконечным, ибо тогда исчезают числа 1,2,3 и пр. по сравнению с /г, и сами числа пг ±п=Р 1, nr ± ±п + 2, /гг±л + 3 и пр. ns Τ η ± 1, ns н1 η ±2, as =F + n±3 и пр. будут иметь те же значения, как пг ±п и nsT п». После этого, отбросив эти числа и проведя соответствующие сокращения на я, получим Μ __ (rs + s) (rs +s) ... rs L (rs — r) (rs — r) ... rs Количество сомножителей в числителе и знаменателе равно п. «Вследствие чего это отношение будет бесконечной степенью rs~T~s и потому бесконечно большим». Для тех, кто сомне- rs — r вается в этом заключении, Бернулли приводит еще одно рассуждение и доказательство того, что rs в степени я, rs — r если η полагается бесконечным, будет бесконечно большим. «Таким образом показано, что в бесконечно высокой степени двучлена отношение наибольшего члена к другому L превосходит всякое заданное отношение». Μ Доказательство утверждения, что lim — =оо про- Λ-Η» λ водится аналогично. Лемма 5. Отношение суммы всех членов от L до λ ко всем остальным с увеличением η может быть сделано больше всякого заданного числа. Доказательство. Μ—(наибольший член разложения. Пусть соседние с ним слева будут F, G, Я,...; пусть соседние с L слева будут Р, Q, R, 85
На основании леммы 3 имеем: F ^P G ^Q H ^R L ^P ^Q ^/? ^ «Так как, по лемме 4, при η бесконечно большом, отношение M/L бесконечно, то тем более будут бесконечными отношения F/P, G/Q, Я//?,..., и потому отношение F +G + H+ ... А —! ! ! также бесконечно, т. е. сумма членов P + Q + R+·.. У между наибольшим Μ и пределом L бесконечно больше суммы такого же числа членов за пределом L и наиболее к нему близких. И так как число всех членов за пределом L превышает, по лемме 1, не более чем в s—1 раз (т. е. конечное число раз) число членов между этим пределом и наибольшим членом М, а сами члены делаются тем меньше, чем дальше они отстоят от предела, по 1-й части леммы 3, то сумма всех членов между Μ и L (даже не считая Λί) будет бесконечно больше сумм всех членов за пределом L». Аналогичное утверждение можно доказать относительно членов между Μ и λ. Оба эти утверждения и доказывают лемму. После этого доказательства Бернулли делает пояснение для тех, кто не привык к рассуждениям с бесконечным и кто сомневается в истинности этих рассуждений. «Этому сомнению я не могу лучше удовлетворить, как показав теперь способ на самом деле найти конечное число η или конечную степень двучлена, в которой сумма членов между пределами L и λ имеет к сумме членов вне их отношение, большее какого угодна большего отношения, которое обозначу буквою с. Когда это будет доказано, возражения необходимо падут». Убедив читателя еще одним путем в справедливости лемм, Бернулли переходит к основной цели своего сочинения. Он формулирует, как он сам называет, «главное предложение». «Наконец, следует само предложение, ради которого сказано все предыдущее и доказательство которого вытекает из одного лишь применения предварительных лемм... Пусть число благоприятных случаев относится к числу неблагоприятных точно или при- 86
ближенно, как г к s, или к числу всех случаев, как г к r + s или г к t, это отношение заключается в пределах (r+l)/t и (г— l)t. Требуется доказать, что можно взять столько опытов, чтобы в какое угодно данное число раз (с раз) было вероятнее, что число благоприятных наблюдений попадет в эти пределы, а вне их, т. е. отношение числа благоприятных наблюдений к числу всех будет не более чем (r+\)/t и не менее (г—l)/f». Очевидно, что это утверждение эквивалентно теореме Бернулли, излагаемой в современных книгах по теории вероятностей. Доказательство. Пусть число необходимых наблюдений будет nt. Вероятность того, что все наблюдения будут благоприятны, равна Patent ~ ( Τ ) » что все, кроме одного — D _ nt г*1*-1 fnt—i.nt — ~~г s —I— » 1 fit кроме двух — fli(nt—i) 2 rnt~2 А это есть члены разложения двучлена (r+s ) в степени nt (деленные на tnt), которые исследовались в предыдущих леммах. Все дальнейшие выводы основываются на доказанных леммах. Число случаев с ns неблагоприятными наблюдениями и пг благоприятными дает член М. Число случаев, при которых будет пг+г или пг—η благоприятных наблюдений, выражается членами L и λ, отстоящими на η членов от М. Следовательно, число случаев, для которых благоприятных наблюдений окажется не более nr+η и не менее пг—nf будет выражаться суммой членов, заключенных между L и λ. Общее же число случаев, для которых благоприятных наблюдений будет или больше nr+η или меньше пг—п, выражаетой суммой членов, стящих левее L и правее λ. «Так как степень двучлена может быть изята столь 87
большая, чтобы сумма членов, заключенных между обоими пределами L и λ превосходила более чем в с раз сумму всех остальных из этих пределов выходящих, по леммам 4-й и 5-й, то, следовательно, можно взять столь большое число наблюдений, чтобы число случаев, при которых отношение числа благоприятных наблюдений к числу всех оказывается заключенным в пределы (nr+n)/nt и (nr—n)lni или (r+l)/t и (г—1)/ί, превышало более чем в с раз число остальных случаев, т. е. сделалось более чем в с раз вероятнее, что отношение числа благоприятных наблюдений к числу всех загслю- г+1 г — ι чается в пределах —·— и , а не вне этих пределов, ч. т. д.» Для сравнения дадим современную формулировку теоремы Бернулли: если вероятность наступления события А в последовательности независимых испытаний постоянна и равна р, то, каково бы ни было положительное число ε, с вероятностью как угодно близкой к единице, можно утверждать, что при достаточно большом числе испытаний η разность ρ по абсолютной η величине окажется меньшей, чем ε: ρ{|7-*Ν>1-''· где η любое малое число. Для выяснения содержания теоремы Бернулли сделаем еще некоторые замечания. Всегда может случиться, что, каким бы большим ни было nf в данной серии из η испытаний ~—/Μокажет" ся больше ε. Но, согласно теореме Бернулли, мы можем утверждать, что если η достаточно велико и если произведено достаточно много серий испытаний по η испытаний в каждой серии, то в подавляющем числе серий неравенство ~—ρ <ε будет выполнено. I п I Теорема Бернулли совсем не утверждает, что при бесконечном увеличении числа испытаний η частота 88
т/п стремится к числу ρ, т. е. что lim — = ρ ; она утвер- /1-ЮО П ждает, что вероятность больших отклонений частоты т/п от вероятности ρ мала, если только η достаточно велико. Теорема Бернулли явилась громадным вкладом в теорию вероятностей, она играет первостепенное значение в различных практических применениях теории вероятностей. Теорему Бернулли неоднократно подтверждали специально поставленными экспериментами, в первую очередь— с бросанием монет. Заканчивается работа Я. Бернулли высказыванием, которое в дальнейшем было принято многими, в том числе и Лапласом, как основное положение детерминизма. Бернулли считает, что из доказанной теоремы «вытекает то удивительное, по-видимому, следствие, что если бы наблюдения над всеми событиями продолжать всю вечность (причем вероятность, наконец, перешла бы в полную достоверность), то было бы замечено, что все в мире управляется точными отношениями и постоянным законом изменения, так, что даже в вещах, в высшей степени случайных, мы принуждены были бы признать как бы некоторую необходимость и, окажу я, рок». На этом «Искусство предположений» обрывается. Возникает вопрос, почему последняя глава, в которой Бернулли обещал применить теорию вероятностей к гражданским и экономическим вопросам, осталась неоконченной. Можно предположить, что работа осталась неоконченной потому, что Бернулли не видел серьезных применений теории вероятностей к упомянутым вопросам. Работа Бернулли всегда оценивалась очень высоко. В 1913 г., к 200-летию ее первого издания в России, была переведена ее IV часть. В предисловии к этому переводу А. А. Марков писал, что в этой работе «впервые была опубликована и доказана знаменитая ... теорема, положившая начало закону больших чисел... Свою теорему Я. Бернулли высказал точно и доказал с полной строгостью» [45]. А. Н. Колмогоров пишет, что Бернулли «свою предельную, теорему доказал с исчерпывающей арифметической строгостью» [46, стр. 56]. 89
§ 2. Развитие теории вероятностей в первой половине XVIII в. Начало XVIII в. было ознаменовано в теории вероятностей не только появлением работы Я. Бернулли. В это время выходят в свет работы Монмора, Муавра и других ученых. П. Р. Монмор (1678—1719 гг.), французский математик, изучал также философию и религию. Он поддерживал отношения со многими крупными математиками (Н. и И. Бернулли, Лейбницем и др.) и пользовался достаточным авторитетом. Он был, в частности, выбран Лейбницем в качестве его представителя в образованную Королевским обществом комиссию для разрешения спора между Ньютоном и Лейбницем о приоритете в открытии дифференциального и интегрального исчисления. Его основная работа по теории вероятностей — «Анализ азартных игр» имела два издания. Первое из них было в 1708 г. Общепринято считать, что второе издание было в 1713 г., но Тодхантер [44] указывает, что на имеющемся у него экземпляре, с автографом автора, стоит 1714 г. Второе издание значительно больше по объему, чем первое; в него, кроме того, включена переписка Монмора с Н. Бернулли и одно письмо И. Бернулли. Работа Монмора (2-е изд.) состоит из четырех частей [47]. Первая часть посвящена комбинаторике, во второй части рассматриваются различные игры в карты, в третьей — игры в кости, четвертая часть содержит решение различных задач, включая пять задач Гюйгенса; затем следует переписка. В предисловии Монмор кратко излагает план построения работы Я. Бернулли, который ему был известен из сообщений Фонтенеля и Сорена. Монмор думал, что после смерти Бернулли работа последнего не будет опубликована. Он писал: «Я пришел к выводу, что можно пойти очень далеко в этой неисследованной области и открыть большое число истин одинаково любопытных и новых. Это привело меня к решению глубоко разработать этот вопрос и этим в некоторой степени утешить публику в той потере, которую она ощутила, лишившись выдающейся работы г. Бернулли». В предисловии Монмор пишет о том, что математика проникла в естественные науки, и прежде всего в физику, где она, по его словам, достигла очень больших успе- 90
хов. «Какой бы славой было для этой науки, если бы она могла служить сверх того для определения суждений и поведения людей в практической жизни». Далее он говорит, что такую попытку сделал Я. Бернулли, но преждевременная смерть не позволила ему закончить эту работу. 1 Монмору было довольно мало известно о книге Бернулли: «Госп. Бернулли разделил ее на четыре части. В первых трех он дает решение различных задач на азартные игры. Там должно было находиться много нового о бесконечных рядах, сочетаниях и перестановках, вместе с решением задач, предложенных математиком Гюйгенсом уже довольно давно. В четвертой части он применял методы, изложенные в первых трех частях, и решению различных гражданских, нравственных и политических вопросов. Нам неизвестно, каковы те игры, раздел ставок которых определял этот автор, ни какие вопросы морали и политики он собирался разъяснить, но как бы ни был удивителен этот проект, есть все основания полагать, что этот ученый автор великолепно выполнил бы его... Я убежден, что он выполнил бы все, что обещало заглавие его книги». Следует подчеркнуть, что Монмор отказался показать применения теории вероятностей к моральным, нравственным, экономическим и другим подобным вопросам. Он пишет: «Если бы я предполагал во всем следовать Бернулли, то я должен был бы прибавить часть, где я применил бы методы, изложенные в первых частях, к политическим, нравственным и экономическим вопросам. Мне помешало выполнить это то затруднение, которое я встретил, когда попытался сделать предположения, основанные на известных фактах, которые могли бы руководить мной и поддерживать меня в моих исследованиях. Не будучи в состоянии удовлетворить это требование полностью, я решил, что лучше отложить эту работу до другого времени, или предоставить славу ее свершения другому, более, чем я, искусному лицу, чем говорить вещи или слишком общеизвестные или недостаточно точные, которые совершенно не отвечали бы ожиданиям читателя и великолепию вопроса». Монмор (как и Бернулли) не находит обоснованных применений вероятностных соображений к нравственным наукам. Следует отметить, что, обсуждая общие методо- 91
логические вопросы, Монмор стоит на точке зрения метафизического детерминизма. Далее в предисловии Монмор долго рассуждает о том, что учение о случае может применяться к поведению человека, но эти рассуждения носят очень общий и неопределенный характер. Монмор ссылается на работы Галлея, Петти, Гюйгенса, на переписку Паскаля и Ферма. В конце предисловия они пишет: «В этом трактате я в первую очередь имел в виду удовольствие математиков, а не пользу игроков; по нашему мнению, те, кто теряют на игры время, вполне заслуживают терять в них свои деньги». Первая часть книги называется «Трактат о сочетаниях». В этой части Монмор рассматривает арифметический треугольник, математическое ожидание и др. материал. Биномиальная теорема доказывается для случая (α+b)4 при помощи следующего рассуждения. Пусть имеются 4 жетона, одна сторона которых белая, а другая— черная. При их бросании имеется одна комбинация, при которой все жетоны выпадут черной стороной, 4— для трех выпасть черной стороной и одной белой. 6 — для двух черных и двух белых и т. д. Поэтому (α+b)4 должно содержать а4 и б4, что соответствует выпадению четырех черных сторон у жетонов и четырех белых; затем должен идти коэффициент 4, соответствующий количеству выпадений трех черных и одной белой сторон, а также трех белых и одной черной; затем должен быть коэффициент 6, соответствующий количеству выпадений двух белых и двух черных сторон. Отсюда Монмор делает заключение, что биномиальные коэффициенты должны быть 1, 4, 6, 4, 1. Далее рассматривается много задач. Среди них, например, имеется такая: определить число способов, которыми можно шлучить при бросании Ρ костей а единиц, Ь двоек, с троек и т. д. Вторая часть посвящена задачам, связанным с карточными играми, в частности с игрой «фараон», «бассет» и др. В третьей части рассматриваются задачи на игры в кости, в том числе и задача на раздел ставки: «Произвести в общем виде раздел ставки между несколькими игроками, играющими несколько партий, при справедливых условиях игрщ», β съцзп ς этой задаче^ Монмор ддводэдо №
подробно останавливается на переписке Паскаля и Ферма, приводя, в частности, полный текст письма Паскаля от 24.VIII 1654 г. ( 47, стр. 233—244]. Монмор прежде всего рассматривает следующую задачу: «Три игрока условились сыграть три партии при условии, что если Пьер, которому недостает только одной партии, выиграет ее раньше, чем один или другой из остальных игроков выиграет две партии, то он является выигравшим; и что он проиграет игру, если один или другой из остальных игроков, которым недостает по две партии, выиграет их раньше, чем он выиграет одну партию». Нужно найти вероятности выигрыша для каждого игрока. Монмор получает ответ, рассматривай следующую таблицу: Пьер Поль Жак ааа abc bob сас ЬЬа сса aab аса bac cba ЪЪЬ ссс aac acb bca ЬЬс ccb aba асе саа beb cbc abb baa cab ebb bec «Из 27 положений трех костей имеется 17, приводящих к выигрышу Пьера, 5 — приводящих к выигрышу Поля и 5 —к выигрышу Жака». После этого дается общее правило, которое «заключается в том, чтобы рассмотреть, за сколько бросаний костей игра необходимо должна окончиться; взять столько костей, сколько этих бросаний, и дать этим костям столько поверхностей, сколько имеется игроков; затем остается только определить из всех возможных положений костей, какие являются благоприятными и неблагоприятными для каждого игрока, что легко сделать». Это правило иллюстрируется рядом задач. Например: Пьеру недостает одной, Полю — двух и Жаку — трех партий; Пьеру недостает 5, а Полю — 6 партий; и т. п. Четвертая часть содержит решение различных задач и в том числе пяти задач Гюйгенса. В частности, здесь имеется задача о продолжительности игры. В конце Монмор предлагает четыре задачи: 1. Определить, каково преимущество банкомета при игре в тринадцать. 2. Задача, связанная с карточной игрой «гер». 3. Задачу связанная с игрой з «ферму» — игрой в карты, похожей **э «очко», 83
4. Задача, связанная с игрой, похожей на раскладывание пасьянса. Далее идет переписка Монмора с И. и Н. Бернулли* В письме от 9.IX 1713 г. [47, стр. 401—402] Н. Бернулли предложил Монмору следующую задачу. Два игрока А и В играют в герб и решетку на следующих условиях: игра продолжается до тех пор, пока не выпадет герб, и игрок В платит 2 монеты игроку Л, если герб выпадет при первом бросании; 4 монеты, если при втором; 8, если при третьем и т. д. Спрашивается, сколько игрок А должен заплатить В перед началом игры, чтобы игра была безобидной. Для безобидности игры нужно, чтобы А заплатил В количество монет, равное математическому ожиданию выигрыша, которое равно: 2.1/2 + 4-1/4 + 8- 1/8 + ... + 2"·1/2"=η. Следовательно, математическое ожидание выигрыша стремится к бесконечности и А должен заплатить В до начала игры бесконечно много монет, что явно бессмысленно. Этой задачей занимался Д. Бернулли, поместивший свое исследование в Трудах Петербургской Академии наук [60]. Именно поэтому задача получила название петербургской, или петербургского парадокса. Основными работами де Муавра (1667—1754 гг.) по теории вероятностей являются «Учение о случаях» (irep- вое издание было в 1718 г., второе — в 1738 г., третье — в 1756 г.) и «Об измерении жребия» (1711 г.). Абрахам де Муавр, член Королевского общества с 1697 г., был также членом Парижской и Берлинской Академий наук. Известен своими работами по рядам. Нашел правила возведения в степень и извлечения корня я-й степени из комплексных чисел; теперь эти правила называются формулами Муавра. Муавр независимо от Стерлинга получил асимптотическое разложение я!=у 2тпПе~п и широко им пользовался. В своей работе «Учение о случаях» Муавр рассматривает вопрос о продолжительности игры, занимается исследованием вопросов, связанных с теоремой Я. Бернулли. Задача о продолжительности игры была предложена еще Гюйгенсом. Муавр неоднократно к ней возвращается [48, стр. 227; 49, стр. 52]. 94
Рассмотрим кратко эту задачу. Пусть имеется двое игроков А л В. Вероятности выиграть определенную партию у них будут соответственно ри?=1 — р. В начале игры А имеет а монет, а В имеет Ъ монет. Необходимо найти вероятность Рд, что А проиграет все свои деньги раньше, чем он выиграет все деньги у 5. Рь определяется аналогично. Можно показать, что эта игра имеет конец, т. е. Ра + Рь— 1. Муавр получил следующий ответ: 07/ρ)α+6-ΐ' Он также нашел, что ожидаемое число игр будет Ε(Ν)= ЬР*-аР° ■ Р — й Он показал также общий метод нахождения Ра,п + Рь,п> где Ρα,η — вероятность того, что разорение А случится за η игр; Рь, η — что 6 разорится за η игр. Он нашел К, η для случая, когда а бесконечно и Ра% п =0. Однако за несколько месяцев перед тем, как эти результаты Муавра появились в печати (так как Philosophical Transactions за 1711 г. вышли значительно позже 1711 г.), Монмор опубликовал в 1713 г. решения, дающие Ра% п и Рь, п- В 1710 г. Монмор нашел метод для вычисления Ра,п и Рь, η в случае ρ = q. Он послал свои соображения Иоганну Бернулли, который переправил это письмо своему племяннику Николаю. В своем ответном письме от 26.11 1711 г., которое и опубликовал Монмор, Николай Бернулли дает без доказательства решение этой задачи для р=р<7· В современных обозначениях это может быть записано так: Рь*=2K+V'2 (?) (^-'<s-y4<^^ где s=a+fc. Суммирование происходит по тем t, которые приводят к неотрицательным показателям степени. Изучая таблицы смертности, Муавр в конце своей книги «Учение о случаях» предложил простое уравнение 95
для закона смертности между 22-летним возрастом и до предела долголетия, которое он принимал за 86 лет. Это уравнение прямой линии у=86—х> где χ— возраст между 22 и 86 годами; у — число людей, достигающих χ лет. Придавая χ значения 23, 24, 25..., мы получаем, что 63 человека достигают 24 лет, 62 достигают 24 лет, 61— 25 и т. д. Как мы уже говорили, из теоремы Бернулли не следует, что т/п обязательно будет сближаться с ρ при увеличении п. Число появлений события, т. е. число т, зависит от случая, и поэтому возможны значительные отклонения т/п от р. В работе «Аналитическая смесь» (1730 г.) Муавр исследует вопрос о том, с какими вероятностями отклонения т/п от ρ могут принимать те или иные значения. Муавр нашел частное решение для случая р=1/2, т. е. для /?==1/2 он исследовал, с какими ве- роятностями р\ принимает различные значения. Iп I Позже Лаплас распространил теорему Муавра на любые /?, не равные 0 и 1. Теорема Муавра — Лапласа явилась после теоремы Бернулли второй основной предельной теоремой теории вероятностей. § 3. Работы Симпсона в области теории вероятностей Томас Симпсон (1710—1761 гг.) впервые в теории вероятностей начал рассматривать непрерывное распределение. Более всего он известен своими работами в области математического анализа. По теории вероятностей Симпсон написал две книги: «Доктрина рент» [143] и «Природа и законы случая» [144], а также статью, посвященную вероятностному обоснованию применения среднего арифметического при обработке измерений (1756 г.). Второе из этих сочинений посвящено в основном азартным играм. Оно разделяется на 30 отдельных задач. Задачи сами по себе и по методу их решения весьма напоминают задачи из книги Муавра [49]. Сама тема в середине XVIII в. уже не представляла особого интереса. Перед теорией вероятностей к тому времени встали новые задачи. Одной из таких задач и посвящена статья Сймп- 96
сона «Письмо ... президенту Королевского общества о преимуществе выбора среднего из некоторого числа наблюдений в практической астрономии» {146]. Симпсон в ней принимает, что шансы ошибок ^-V,..., —3, г—2, —1, О, 1, 2, 3, ..., V в одном измерении соответственно равны Гу, ..., Гв, Г\ Г\ Л г\ т\ г», .... г* (Ш.1) и отыскивает в этом предположении вероятность или отношение вероятностей «за» и «против» того, что ошибка среднего арифметического не превысит заданного числа гп/п (п — число измерений). Точнее, члены ряда (III.1) не являются шансами (вероятностями), так как их сумма не равна 1, а лишь пропорциональны им. О весьма странном выборе распределения мы скажем ниже, но уже здесь отметим, что величина г не войдет в окончательные формулы и что, видимо, поэтому Симнеон не разъясняет смысла этой величины. Вероятность ошибки т/п в среднем арифметическом Симпсон считает равной дроби, знаменатель которой равен сумме членов последовательности (III.1), возведенной в я-ю степень, а числитель — члену знаменателя* содержащему rw. При этом употребляется разложение Вероятность погрешности среднего арифметического находиться в пределах [—т/п, т/п]у как указывает Симпсон, равна сумме вероятностей, определяемых по. приведенному выше 'правилу для т=0, ±1, ±2, ..., ±т. . Вряд ли Симпсон придавал какое-нибудь непосредственное значение полученному выводу, так как распределение (III. 1) имеет весьма специальный характер. Единственное применение, которое Симпсон все же. сумел найти, относится к случаю г=1 (точное равенство шансов положительных и отрицательных ошибок). Этот.случай, как заметил Симпсон, соответствует выпадещда т очков при бросании η штук (2К+1)-гранных KqcreftJBe- роятность последнего события определяется ~Т~з~ада~ч~е 22-й книги Симпсона «Природа и законы случая»: Отметим, что аналогичная задача (№ 38) имеется и у Муав- ра [49]. ^т ' 9J
В рассматриваемой статье (1756 г.) {146] весьма интересен переход Симпсона к проблематике теории ошибок и замеченная им аналогия с бросанием костей. Далее в своей статье Симпсон взамен (III.1) исследует другую «функцию распределения», характеризуемую вероятностями (точнее, количествами исходов): Γν9 2rl~v, Zf~\ ..., (V+ 1) Λ ..., 3rv-2, 2rv~\ r\ (III.2) и замечает, что сумма членов последовательности (III.2), возведенная в степень / (число наблюдений), равна г-"(1+г + г2+ ... + rvf = rvt(l-rv+1f/(l-rf, и что поэтому рассматриваемый случай сводится к первому. После этого Симпсон снова рассматривает частный случай г== 1 *. В отличие от предыдущего, этот случай непосредственно используется, так как далее Симпсон переходит к треугольному распределению, и единственный упрек, который можно было бы высказать Симпсону, заключается в том, что следовало бы с самого начала указать на вспомогательную роль последовательностей (III. 1) и (III. 2). Итак, Симпсон принимает треугольное распределение: «... пусть шансы для ошибок —5, —4, —3, ..., О, ..., 3, 4, 5 соответственно пропорциональны членам ряда 1, 2, 3, ..., 6, ..., 3, 2, 1, каковой ряд намного лучше приспособлен, чем если бы все его члены должны были быть равными друг другу; поскольку весьма благоразумно предположить, что шансы соответствующих ошибок убывают пропорционально тому, как возрастают сами ошибки» [14Θ]. Подсчитав искомую вероятность погрешности среднего арифметического (подсчет производится с применением последовательности (III.2) при г=1), Симпсон заканчивает свою статью следующим утверждением: «В целом представляется, что выбор среднего из некото- * Плакетт (147] описывает результаты Симпсона в терминах производящих функций. Действительно, Симпсон следует здесь обычному для своего времени приему, фактически равносильному введению этих функций. 98
рого числа наблюдений значительно уменьшает шансы для всех меньших ошибок и отрезает почти всю вероятность любых больших ошибок; последнее соображение уже достаточно, чтобы рекомендовать применение этого метода не только астрономам, но всем другим, имеющим отношение к производству экспериментов». Это утверждение более точно, чем аналогичное (предварительное) утверждение, приведенное в начале статьи: «... какой бы ряд ни был принят для шансов появления различных ошибок, результат окажется в большой степени в пользу ныне практикуемого метода...» выбора среднего значения [1460. В 1757 г. эта статья была переиздана с существенным добавлением в сборнике статей Симпсона под общим названием «Разнообразные трактаты о некоторых любопытных и весьма интересных темах из механики, физической астрономии и спекулятивной математики» [148]. Здесь Симпсон впервые в теории вероятностей (не считая Байеса, результаты которого были опубликованы позднее) рассмотрел непрерывную функцию распределения. Впрочем, строго говоря, Симпсон сделал лишь первый шаг в этом направлении. Симпсон отыскивает предел вероятности ошибки среднего арифметического для распределения (III.2) при условии неограниченного возрастания числа возможных ошибок наблюдений, содержащихся в данном интервале Л 5, и иллюстрирует этот случай чертежом (рис. 1). Вероятность погрешности результата наблюдения содержаться в весьма малом интервале Νη, как отмечает Симпсон, пропорциональна площади MNnm (или длине MN). На этом же чертеже Симпсон строит кривую ЛЕВ, которая изображает погрешность среднего арифметического: если, например, CN=mft, то площадь CNFE выражает вероятность того, что погрешность среднего арифметического менее m/t. Симпсона ничуть не смущает явное несоответствие между его выкладками и чертежом: в выкладках принято | У|-^оо, а чертеж составлен для конечного V, но при непрерывном изменении аргумента. Как бы то ни было, ^ами по себе выкладки верны, но не доведены до конца. Отметим, что график кривой АЕВ повернут необычным для ^современного читателя образом (независимое переменное откладывается по вертикали). 99
Симпсон ни разу не упоминает Якова Бернулли — быть может потому, что последний рассмотрел лишь биномиальное распределение. Но и вообще предельный переход Симпсон ввел, пожалуй, лишь для изящества,— в основном он интересовался конечным числом измерений,— тогда как у Бернулли главное в неограниченном возрастании числа опытов. Что же касается принятых Симпсоном свойств случайных, ошибок наблюдений, то эти свойства должны были более или менее отчетливо осознаваться раньше. В дальнейшем,— после Гаусса, — они неизменно описывались во всех учебниках и руководствах. Но ни Симпсон ни, пожалуй, другие авторы вплоть до второй половины XIX в., за единственным исключением Ламберта, не связывали этих свойств с реализацией закона больших чисел. И само понятие о случайных ошибках развивалось как-то независимо от постепенно возникшего понятия случайной' величины. Нужно сказать, что вскоре результаты Симпсона были перекрыты Лагранжем {159]. Остановимся теперь вкратце на роли среднего арифметического в истории теории вероятностей. Среднее арифметическое встречается во многих известных в древности формулах для приближенного вычисления площадей фигур и объемов тел. По мнению Лурье [160], среднее арифметическое появилось из практики экономической жизни и социальных отношений. Именно так полагал и Лейбниц [161, гл. 16]. Кроме того, среднее арифметическое, наряду со средним геометрическим, средним гармоническим и семью (!) дру* гими средними было известно в пифагорейской школе [162, стр. 63]. Примечательно, что в одной индийской рукописи XVI в. употребление среднего арифметического совершенно отчетливо связывалось с компенсацией HP- строгости применяемых формул [163, стр. 97], причем отмечалось повышение точности с возрастанием числа из- 100
мерений. Указанная цель сохранилась и по сей день. Пример: многократные измерения углов в триангуляции имеют целью не только компенсацию погрешностей собственно измерений, но и компенсацию действия горизонтальной рефракции; формула прямолинейного распространения света заведомо неверна. Другая цель применения среднего арифметического древними (вавилонскими) математиками при обработке измерений — компенсация систематических ошибок измерений. Об этом, правда, не приводя соответствующих доказательств, пишет А. А. Вайман [164, стр. 204]. Если это утверждение верно, то можно сказать, что уже в Вавилоне результат обработки измерений считался зависящим от условий.измерений. Мы до сих пор не упомянули о том, что статья Симп- сона была вызвана тем, что «некоторые весьма известные лица были того мнения и даже публично утверждали, что одному единственному наблюдению, исполненному с должной тщательностью, следует доверяться в той же мере, как и среднему из весьма большого числа наблюдений» (начало статьи 1756 г.). Хотя подобные высказывания и не делали погоду (сам Симпсон в начале исправленного варианта своей статьи 1757 г. писал, что «метод, практикуемый астрономами с целью уменьшить ошибки, возникающие вследствие несовершенства инструмента и органов чувств использованием среднего из нескольких измерений, дает весьма значительную выгоду и почти повсеместно принят»), тем не менее они весьма характерны. В XVII в. были изобретены зрительная труба, верньер, уровень, сетка нитей, и астрономо-геодезические инструменты приобрели «почти» современный вид. Погрешность наблюдений резко уменьшилась. У Брадлея она измерялась несколькими секундами, т. е. была в 60 раз меньше, чем у Тихо Браге. Брадлей [165] систематически применял среднее арифметическое, но все же, по крайней мере в одном месте, он писал: «Когда в течение нескольких дней взято несколько наблюдений одной и той же звезды, я выбираю либо средний результат, либо то наблюдение, которое лучше всего согласуется с ним» [165, стр. 29]. В конце концов Брадлей, в силу совершенно необычной точноош своих наблюдений, вполне мог позволить себе такую небольшую «вольность». Но во всяком случае 101
период «спокойствия» и выбора одного, хотя бы и ближайшего к среднему, наблюдения не мог продолжаться долго. Уже сам Брадлей заметил, что новые открытия (аберрация, 1725 г.) ведут к новым задачам (открытие нутации), для чего нужны «регулярные ряды наблюдений и экспериментов». Далее, в тот же период (вторая половина XVIII в.) были проведены сравнительно точные градусные измерения, исполнителям которых пришлось добиваться наивысшей возможной точности. При чтении соответствующих сочинений нам не удалось обнаружить отказа от применения среднего арифметического. Мы теперь вернемся к Лейбницу, который в том же контексте [161, гл. 16] утверждал: «Основой всех этих теоретических построений [в теории вероятностей] является так называемый простаферезис, т. е. берут среднее арифметическое между несколькими одинаково приемлемыми предположениями... Это аксиома: aequalibus aequalia — равно принимать во внимание равноценные предположения». Хотя конкретно Лейбниц упоминает лишь Де Витта, мы полагаем, что именно идея «равно принимать во внимание равноценные предположения» (из которой вытекало и среднее арифметическое) явилась некоторой предпосылкой классического определения вероятности. § 4. Байес и теорема его имени Формула Байеса содержится во всех учебниках по теории вероятностей. Суть этой формулы состоит в следующем. Пусть событие В может осуществиться с одним и только одним из η несовместимых событий Аи Л2, .., А Пу т. е. По формуле полной вероятности Р(В) = %Р(А£)Ра<(В). 102
По теореме умножения мы для любого Ak можем записать Ρ (AkB) = Ρ (ДО Рлк (В) = Ρ (В) Ρ в (Am). Определим отсюда Ре (Ал). Учитывая формулу полной вероятности, получим РвШ = ——— = . Это и есть формулы Байеса (подробнее см., например, [38, § 9]). Зная теорему умножения, формулы Байеса можно получить непосредственно, как другой вид записи формулы умножения вероятностей. Поэтому неясно, что нужно понимать под утверждением, которое часто фигурирует в учебниках. «Эта формула была найдена в середине XVIII в. английским математиком Байесом» [6, стр. 218]. Что же было сделано Байесом? Биографические сведения о Байесе в литературе очень скудны и часто неверны. Ни у Поггендорфа, ни у Кантора никаких сведений о Байесе не содержится, кроме упоминания о том, что он был членом Королевского общества. Даже в БСЭ в статье «Байес» не указан год его рождения, а год смерти указан неверно (1763 г.). В действительности Томас Байес родился в Лондоне в 1702 г. Образование он получил дома. Имеется предположение, что его домашним учителем был Муавр, который в это время вел в Лондоне частное преподавание. Отец Томаса был членом Королевского общества, он имел духовный сан, и был пастором в одной из церквей Лондона. Т. Байес также получил духовный сан и начал помогать отцу в выполнении его пасторских обязанностей. В 1720 г. в Танбридже, в 50 км от Лондона, была организована религиозная секта. Вскоре туда переехал и Т. Байес. В 1731 г. он пишет трактат «Божественная доброта или попытка доказать, что принцип конечного божественного поведения и управления является счастьем его создателя». Этот трактат был издан Джоном Нуном. 103
В 1736 г. тсуг же Нун издает анонимный трактат «Введение в проблему флюксий и защита математики от автора Аналиста». Этот трактат многие приписывают Байесу. В 1742 г. Байеса избирают в члены Королевского общества. В 1752 г. он отошел от всех дел, передав все свои обязанности и личную библиотеку Вильяму Джонстону. Байес продолжал жить в Танбридже до своей кончины, наступившей 17.IV 1761 г. Кроме упомянутой работы, известно еще письмо Байеса Джону Кентону об асимптотических рядах, опубликованное в «Philosophical Transactions of the Royal Society» за 1763 г. В тех же «Философских трудах» за 1763 г. Р. Прайсом 4 были опубликованы работы Байеса по теории вероятностей под названием: «Олыт решения задачи по теории вероятностей покойного достопочтенного мистера Байеса, члена Королевского общества, сообщено мистером Прайсом в письме к Джону Кентону, магистру искусств, члену Королевского общества». Эта работа под заглавием «Очерки к решению проблемы доктрины шансов Томаса Байеса» была напечатана в 1958 г. [61]. Перед работой Байеса ггомещено сопроводительное тшсыую Прайса к Кентону от 10.XI 1763 г. В этом письме Прайс пишет: «Я посылаю Вам сейчас опыт, который я нашел среди бумаг нашего скончавшегося друга, мистера Байеса, и который, по моему мнению, имеет большие достоинства и вполне заслуживает быть сохраненным» [51, стр. 296]. В, письме Прайса говорится о содержаний работы Байеса и содержится просьба к Кентону зачитать эту работу «а заседании Королевского общества. Эта просьба была выполнена, и работа Байеса зачитывалась на заседании Королевского общества 23.XII 1763 г. В своем письме Прайс писал, что Байес имел честь «быть членом этого знаменитого общества [королевского] 1 Ричард Прайс (1723—1791)—член Королевского общества c.1764jv Основные работы Прайса относятся к вопросам религии и мрралд. 104
и очень был уважаем многими членами общества, как способный математик» [51, стр. 296]. Работа Байеса начинается с формулировки общей задачи. «Дано число раз, когда неизвестное событие наступило и не наступило. Отыскивается: шанс, что вероятность его наступления при одном единственном испытании лежит между какими-нибудь двумя, могущими быть названными, степенями ве)роятности» [51, стр. 298]. После общей формулировки задачи Байес переходит к основным определениям и положениям теории вероятностей. Относительно этой части работы Прайс пишет: «Байес полагал начать свою работу кратким доказательством общих законов вероятности. Основанием сделать это, как он говорит в своем введении, было не только то, чтобы его читатель не имел заботы искать в другом месте общие принципы, на которых он основывается, но и то, что он не знал, куда отослать его за ясным их доказательством. Он также оправдывается за специальные определения, даваемые им слову „шанс", или „вероятность". Его намерением в этом случае было пресечь все споры о значении слова, которое в обычном языке употребляется в различных смыслах»[51, стр. 298]. Из этого замечания Прайса следует, что в работе Байеса существовало введение, которое не было опубликовано. Можно предположить, что Прайс его и не посылал Кентону, иначе ему незачем было так подробно пересказывать содержание введения. Байес вначале формулирует семь определений. Приведем эти определения полностью. «1. Несколько событий являются несовместимыми, если наступление одного из них исключает наступление остальных. 2. События являются исключающими друг друга, если одно из них должно наступить, но оба одновременно наступить «е могут. 3. Говорят, что событие не состоялось, если оно не наступает или если наступает исключающее событие. 4. Говорят, что событие определено, если оно наступило или не наступило. 5. Вероятность какого-нибудь события есть отношение значения, которое дается ожиданию, связанному 105
с наступлением события, и значения ожидаемой в этом случае прибыли. 6. Под шансом я понимаю то же самое, что и под вероятностью. 7. События являются независимыми, если наступление одного не уменьшает и не увеличивает вероятности остальных» [51, стр. 298—299]. Некоторые из этих определений, например 1 и 7, почти полностью совпадают с современными. Конечно, определение вероятности у Байеса не отличается ясностью. Далее доказывается ряд основных теорем, которые Байес называет предложениями. Первым предложением является теорема сложения вероятностей. «Предложение 1. Если несколько событий являются несовместимыми, то вероятность того, что наступит одно или другое из них, равна сумме вероятностей каждого из них» [51, стр. 299]. При рассмотрении доказательства этой теоремы хорошо видно, как Байес понимает и употребляет понятие вероятности, поэтому мы это доказательство приведем полностью. «Предположим, что существуют три такие события, что если наступит одно из них, я получаю сумму JV, а также, что вероятность первого, второго и третьего суть a/N, b/N, c/N. Тогда (согласно определению вероятности) значение моего ожидания первого события будет а, второго —Ь и третьего — с. В силу этого, значение моих ожиданий всех трех есть α+b+c. Но сумма моих ожиданий всех трех есть в этом случае ожидание получить сумму N, если наступит одно из трех событий. Поэтому (по определению 5) вероятность одного или другого из этих событий равна (a + b + c)/N или a/N + b/N + c/N. Это есть сумма вероятностей каждого из них» [51, стр. 299]. Из этой теоремы Байес получает следствие, что если вероятность наступления события равна P/N, то вероятность его ненаступления будет (N— P)/N. Далее он пишет: «Если достоверно, что одно или другое из трех событий должно наступить, тогда будет a + b + c = N» [51, стр. 299]. В случае равновозможиых исходов вероятность, по Байесу, есть отношение математического ожидания к сумме всех значений случайной величины. Действитель- 106
но, если Затем Байес доказывает теорему умножения вероятностей. «Вероятность того, что наступят оба взаимосвязанных события, есть отношение, получающееся от перемножения вероятности наступления первого события на вероятность наступления второго, при предположении, что первое событие наступило» [51, стр. 299]. Современная запись этой теоремы: Р(А и В) = =Р(А)РА(В). Из теоремы умножения вероятностей Байес получает следствие: «Если вероятность первого из двух следующих друг за другом событий α/Ν, а вероятность обоих вместе Ρ/Ν, то вероятность второго, при предположении, что первое наступило, есть Ρfa» [51, стр. 300]. Это означает, что из Ρ (А и В) =Р(А)РА (В) следует ν ' Ρ (Α) α/Ν α Приведем еще некоторые предложения. «Если имеются два .взаимно связанных события и вероятность второго b/N, а вероятность обоих вместе ΡΙΝ, и вначале стало известно, что второе событие наступило, то я предполагаю, что другое событие [т. е, наступление обоих событий вместе] тоже наступило. Вероятность, что я окажусь правым, есть Р/Ь» [51, стр. 301]. Действительно, в случае, когда нам известно, что второе событие уже произошло, вероятность совместного наступления обоих событий будет равна вероятности первого события при условии, что второе событие произошло: ρ /η р $ и П) Ρ/Ν р В следующем предложении рассматривается вероятность одновременного наступления нескольких независимых событий. В «Следствии» к этому предложению Байес пишет: «Если имеется несколько независимых событий и вероятность каждого из них есть а и ненаступления его bt то вероятность наступления первого, ненаступ- 107
ления второго и третьего и наступления четвертого будет abba» [Ы, стр. 301]. Последнее, предложение содержит вывод формулы Я. Бернулли: m,n =flnP Я «Если вероятность наступления какого-нибудь события будет а, а вероятность ненаступления его при отдельном, испытании будет Ь, то вероятность его наступления ρ раз и ненаступления q раз при p+q испытаниях есть EaPbq , если Ε будет коэффициент члена, в котором встречается apbq в разложении бинома (а+Ьу+о» [51, стр. 302]. * * Выводом этой формулы и кончается первый раздел. f s 1 ~ 1 1 \ 1 1 1 μ. 1 . ι ι f o'e d с b *' к f У 9 f- 9 ά. Тис. 2 Рис. 3 Раздел, второй начинается с рассмотрения схемы, которая в дальнейшем изложении Байеса играет существенную роль. Рассматривается квадратная доска ABCD (рис. 2), на которую бросают шад ΨΛ Предполагается, что «будет одинаковая вероятность, что он остановится на одной какой-нибудь части плоскости, как и на любой другой, и- что-о»^ необходимо- должен где-нибудь остановиться» [54, етр. 302}, т. е. брошенный шар W равновероятно может остановиться в любой точке ABCD^ На АВ берутся две «произвольные точки f и Ъ и через них проводятся ди- вдш, параллельные AD до пересечения с CD в точках Z7.» L. 108
После этого доказывается «лемма 1. Вероятность того, что точка О [точка остановки шара] будет находиться между двумя какими-нибудь точками линии АВ, есть отношение расстояния между двумя точками ко всей линии АВъ [51, стр. 302]. Другими словами, вероятность того, что шар, брошенный случайным образом на ABCD, остановится в прямоугольнике bfFL, равна fb/AB. Вначале рассматривается случай, когда прямоугольники fBCF, bfFL и AbLD соизмеримы; затем, когда они несоизмеримы. «Если прямоугольники Cf, Fb, LA являются несоизмеримыми, все-таки упомянутая вероятность не может быть ни больше, ни меньше, чем отношение fb к АВ» [51, стр. 303]. Для случая несоизмеримости доказательство ведется от противного. Вначале доказывается, что искомая вероятность не может быть меньше fb/AB, а затем, что она не может быть больше этой же величины. Затем на В А следующим образом строится фигура BghikmA (рис. 3). Пусть у = Εχ?ι*, ι.™ АЪ въ . Ьт ,1# где — = х\ — = г, — у; АВ АВ АВ * Ε — коэффициент члена, содержащего aPbft в разложении (а + b)p+q. После этого формулируется предложение: «Я говорю, что раньше чем брошен шар W, вероятность того, что точка О будрт нахрдиться между./ и,ft, обозначающими какие-нибудь две точки лиции Д£,_ и вдобавок, что событие М* наступит ρ раз и не наступит q раз. при. ρ + Я испытаниях, есть отношение площади Ighikmby. части фигуры BghikmA, содержащейся между вертикалями, fg и Ьт> перпендикулярными линии АВ, к площади СХ построенной на АВь [51, стр. 303]. Доказательство этого, предложения ведется от противного. Пусть искомая вероятность равна не отношению площади названной фигуры к площади ABCD> а отношению площади НеКОТОрОЙ фигуры Д КОТСфДЯ ГбоЛЬШе Sfghikmb^ SabCD- Выберем точки е> d, с так и r таком количестве, чтобы построенные с их помощью прямоугольники bckk\ cdii'y dei"i, efhh' no сумме своих площадей меньше отличались бы от Sfghikmb* чем площадь D. Точки выбираются так, чтобы di была наибольшая из линий между АВ и кривой. * Под событием Μ понимается остановка шара между AD и os. 109
Пусть точка О спроектируется в точку о', совпадающую с е. Тогда вероятность того, что произойдет событие М9 равна X = Ае/АВ, а вероятность ненаступления события Μ будет г = Ве/АВ. Тогда вероятность наступления ρ раз и ненаступления q раз события Μ при ρ + <7 испытаниях будет ЕХрг* и в этом случае у = eh/AB = ЕХрг^. Если точка о' будет лежать на отрезке е/, вероятность, что событие Μ наступит ρ раз и q раз не наступит при ρ + q испытаниях, не может быть больше, чем eh/AB. Итак, у нас имеются два события. Первое: точка о' попадает на отрезок ef. Вероятность этого события ef/AB. Второе: событие Μ наступит ρ раз и не наступит q раз при p + q испытаниях. Вероятность этого события не может быть больше, чем eh/AB. Вероятность совместного наступления этих событий будет не больше, ef eh Sefh,h чем — · — = —-— . Переходя таким образом от отрезка АВ АВ SABCD к отрезку (от fe к ed и т. д.) и суммируя получающиеся вероятности, мы приходим к выводу, что искомая вероятность будет не больше отношения суммы площадей выступающих прямоугольников к Sabcd- Но Sd больше этой суммы, следовательно, искомая вероятность меньше Sd/Sabcd> что противоречит первоначальному предположению. Аналогично приводит к противоречию предположение, что Sd меньше Sfghikmb- Эти противоречия показывают, что искомая вероятность равна Sfghikmb!Sabcd- Следствие из этого вывода: «Раньше, чем будет брошен шар W, вероятность того, что точка О будет находиться где-нибудь между А и В или где-нибудь на линии АВ, и вместе с тем того, что событие Μ наступит ρ и не наступит q раз при p+q испытаниях, есть отношение всей фигуры АгВ к СА. Но известно, что эта точка О будет находиться где-нибудь на АВ. Поэтому раньше, чем шар W будет брошен, вероятность того, что событие Μ наступит ρ и не наступит q раз при p + q испытаниях, есть отношение АгВ к С4» [51, стр. 305]. Непосредственным заключением является следующее предложение: «Если раньше, чем станет известно что-нибудь относительно места точки О, обнаружится, что событие Μ наступило ρ и не наступило q раз при p + q испытаниях, и отсюда я сделал предположение, что точка О лежит между двумя какими-нибудь точками на линии 110
АВ, как f и b, и, следовательно, что эта вероятность события Μ при отдельном испытании находится где-то между отношением АЬ к АВ и отношением Af к АВ: вероятность, что я окажусь правым, есть отношение этой части фигуры AiB, описанной, как раньше, которая заключается между перпендикулярами, восстановленными на АВ в точках / и Ь ко всей фигуре AiB» [51, стр. 305]. Далее Байес заключает, что, рассматривая событием и учитывая только количество его появлений и непоявлений при η испытаниях, можно сделать предположение относительно его вероятности, а также установить вероятность этого предположения. Байес считает, что распределение вероятностей равномерно на АВ. Так как в подсчетах всюду фигурируют отношения площадей, Байес предварительно сокращает все величины ординат на Е. Затем он доказывает следующее предложение: «Если фигура, описанная на основании АН, имеет своим уравнением у=хрг ..., я говорю, что если неизвестное событие наступило ρ раз и не наступило q раз при p+q испытаниях и f и ^ —какие-нибудь две точки на основании АН, вы восстановите ординаты fC и tF под прямым углом к основанию, то шансы, что вероятность события лежит между отношением Af к АН и отношением At к АН, есть отношение площади tFCf, т. е. площади той части ранее описанной фигуры, которая заключается между двумя ординатами,— к площади ACFH, т. е. площади всей фигуры, построенной на основании Л#» [51, стр. 306]. Байес пишет, что истинность этого предложения следует из предыдущего изложения. «Теперь с целью сделать предшествующее правило практически применимым мы должны отыскать значения площадей описанной фигуры и некоторых ее частей» (51, стр. 306]. Пусть Л#=1 и пусть прямоугольник, построенный на АН, будет^з.адратом, который, следовательно, имеет площадь, равную 1 (рис. 4). / д с 111
Так как Cf/AH = у\ Af/AH = χ и Я/УЛЯ = г, то в на- шём случае Cf = #; Л^ = х\ Hf = г. Из уравнения криюй # = xprq мы получаем у*=х?(\—х)д, так как г+ * =1. » = *Ό-*)' = хр-дхр+1+ чЬ-У*** - g(g-l)(g-2)xt>+* [ ^ 2-3 Далее, ссылаясь на Ньютона, Байес пишет: «Если абсцисса л; и ордината**7, то соответствующая площадь есть гр+1/(р+1) и при ординате qxp+1 площадь есть qx p+2/(p +2) и т. д.» [51, стр. 306]. Если абсцисса будет ху а ордината yzssXP-qx**+ ЖЯ-*)*»* _?(?-1)(?-~2)^ * Ч 2 2-3 то соответствующая площадь будет равна χΡ+ι дхР+г д(д-1)хР+* д (д-\) (д-2)хр+* р+1 р + 2 2(р+3) 2-3- (р+4) (Ш.З) Но так как χ = -£- = Л/ и и = —- = С/, то это есть выра- ЛЯ ' v АН " ^ ACT жение для произвольной площади ACf = —- . Аналогично можно найти, что ' НО g+ί q+2 р(р^1)г*« р(р-1)(р-2)г^ Ш14) ~Г 2((/+3) 2-3. (?+4) ^ '" 1 ' ' лс/ Затем Байес записывает отношение —- в виде #0 *"+У ^У-1 (у((/~1)^+У-2 р+1 + (р+1) (р+2) +(р+1)(р+2)(р+3) + 112
(p+l)(p+2)(p+3)(p+4) ^ ^ , j^ft-l)...! (UI5) (л+1)(р+1)(р+2) ...я Если в это выражение подставить г = 1—л: и сделать соответствующие преобразования, то мы получим выражение (Ш.З). Запишем отношение —- в таком же виде НО г*У рг**У~ р(р-1),*У-' Ш6) (7+1 fy +1)^+2)^(^+1) (^+2) ((/+3) После замены лс = 1—г и соответствующих преобразований мы можем из (III.6) получить (Ш.4). Затем Байес доказывает утверждение: «Если Ε в разложении бинома (а + b)p+q является коэффициентом при члене apbq, то отношение всей фигуры ACFH к НО есть {(п +1) Е}~г при/г ==р + φ» [51, стр. 308]. Из предыдущих выводов Байес записывает такое следствие: «Отношение ACf ко всей фигуре ACFH есть Lp+l p+2 2(p+3) _Г если д: выражает отношение Af к ЛЯ, если же X будет выражать отношение At к АН, то отношение AFt к ACFH будет (л + 1)еГ р+1 ρ+2 2(р+3) — etc. 1» [51, стр. 308]. После этого Байес формулирует свое основное утверждение. «Правило 1. Если относительно события неизвестно ничего, кроме того, что оно наступило ρ раз и не наступило q раз при η или p+q испытаниях, из этого я делаю предположение, что вероятность его наступления при отдельном испытании лежит где-нибудь между двумя степенями вероятности X и .ν, то шанс, который я имею для того, чтобы оказаться правым (в нашем 11
предположении), есть (п+\)Е, умноженное на разность между рядом и рядом 2£U_£^U + ^Й"1)^ ctc /7+1 р+2 "*" 2(р+3) р+1 Р+2 + 2(р+3) причем Ε является коэффициентом члена ο?№ в разложении (α+6)Λ. Это есть надлежащее правило, которое должно применяться, когда" q малое число; на есть q велико и ρ мало,— измените в приведенном здесь ряде ρ на q и q на ρ и л: на г или (1 — л;), и X на R = (1 — X), что не внесет изменений в разность между двумя рядами». «На этом,— пишет Прайс,— кончается опыт г. Байе- са» [51, стр. 308]. Правило 1, по существу, излагает способ, как при помощи определенного интеграла находить площадь криволинейной трапеции. Далее Прайс приводит правило 2 для случая, когда ρ и q являются большими числами и правило 1 применять трудно из-за большого числа членов ряда. «Байес поэтому, при помощи исследования, приводить которое здесь было бы слишком скучно, вывел из этого правила другое» [51, стр. 308]. Далее Прайс без вывода записывает это второе правило. «Если ничего неизвестно относительно события, кроме того, что оно наступило ρ раз и не наступило q раз при p+q или η испытаниях, то из этого я предполагаю, что вероятность его наступления при отдельном испытании лежит между (ρ/η) +ζ и (pin) —ζ; если m2=nzf(pq), а=р/п, b = q/n, E — коэффициент при члене аФ ъ разложении бинома (а+Ь)п и η γη умноженному на ряд т3г8 . (п —2) тбг5 (п —2) (п —4) т?г* , 3 2/ι·5 2«·3η·7 114
(rt_2)(ft--4)(ft~-6)m»2i ck 2/ζ·3/*.4η·9 то мои шансы оказаться правым больше 2Σ 2Σ и меньше 1 +2EaPbq +2EaPbq/n i—2Eapbq —2ЕарЬУп и если ρ = q, то мои шансы составляют точно 2Σ» [51, стр. 309]. Прайс указывает, что при определении границ Байе- сом допущена ошибка: в знаменателе отсутствует третий член. Прайс исправляет ее. Для случая больших значений mz Прайс приводит третье правило, полученное им самим. Этого правила у Байеса нет. В работе Байеса имеется приложение, написанное Прайсом, где разъясняются некоторые положения работы Байеса, в частности подробно рассматривается вопрос о применении указанных правил. Первое правило дает прямое и полное решение во всех случаях. Два других правила являются частными приближениями первого правила в том случае, когда первое правило применять громоздко. «Первое правило может применяться во всех случаях, когда или ρ или q равны нулю или невелики. Второе правило 2*ржет применяться во всех случаях, когда mz меньше КЗ» {51, стр. 311]. Далее Прайс рассматривает примеры. Приведем некоторые из них. Пусть некоторое событие случилось один раз. Что мы можем сказать относительно вероятности наступления этого события при втором испытании? В этом случае р = = 1,<7=0. Применяя первое правило и учитывая, что /1=1, получаем: V T,lp+i p+iJ Полагая затем Х=1 и #=72, находим, что вероятность того, что вероятность наступления события при втором испытании в случае его появления при первом испытаниебудет заключена между 1/2 и 1 равна I2— -(V2)2=3A. 115
Если событие наступило дважды, то аналогично получим 7/в, три раза — 15/ι6. Если событие наступило ρ раз подряд, то вероятность того, что вероятность его наступления при р+1 испытании будет заключена между 1/2 и 1, равна 1—(V^)p+1. Пусть событие наступило 10 раз подряд. Какова вероятность того, что вероятность данного события заключена между 16/i7 и 2/з? Решение. ρ = 10, q =0, η = 1, Χ = 1β/17, χ = % ΧΡ+1_ΧΡ+1 = (16/ι?)11 _ (2/3>1λ _0,501». Прайс на примере игральной кос™ проводит следующее рассуждение. Так как игральная кость должна выпасть какой-нибудь стороной, даже если^оиа неправиль- ная> то это первое выпадение не увеличивает наших, знаний о кости, и если мы ничего не знали о ней до первого выпадения, то мы ничего не знаем о ней и после первого выпадения. Поэтому правила Байеса. следует применять начиная со второго испытания. Никакое число испытаний, при которых игральная кость падает одной стороной, не дает оснований думать, что она никогда не выпадает другой стороной. Прайс говорит, что правила Байеса применимы при изучении природы, Он приводит пример с наблюдениями над восходами Солнца, но здесь же предупреждает: «Нужно всегда помнить, что эти выводы предполагают полное предшествующее незнание природы» [51,. стр. 313]. Прайс считает, что эти правила π ом огают выявить закономерности в правильных изменениях.явлений природы и что при их помощи мы поанаем божью мудрость. Далее рассматривается пример с лотереей. Пусть известно, что вынуто 11 билетов. Из них 1 выиграл, а 10 — нет. Делается предположение, что отношение пустых билетов к выигрышным находится между 9Д и и/ь Какова вероятность этого предположения. Здесь * = η/ΐ2> * = %о> Ρ = Ы> Я =1, η = 11, Ε = С\х = 11. Соответствующая вероятность равна LA p+l p+2 J [p+i p+2/J 116
-«•■'(RP-^H1^-^]}- =0,07699 ж Vi«. Пусть сделано то же предположение в случае, если было 20 пустых билетов и 2 выигрышных. Какова соответствующая вероятность? X = п/12, χ = %0, η -22, /? =20, q =2, £ - Cjt -231. V ' IL ρ+1 Ρ+2 2(ρ+3) J Ρ+1 Ρ+2 2(ρ+3) 0,10843 «Vr +1 р+2 + 2(р+3) Если будет 40 пустых и 4 выигрышных, то Ρ = 0,1525, и т. д. Прайс говорит, что случай со 100 пустыми и lfr выигрышными билетами можно рассмотреть по первому правилу, вероятность в этом случае будет равна 0,2306. «Из этих вычислений становится ясным, что в предположенных мною условиях шансы оказаться правым, сделав предположение, что пропорция пустых билетов к выигрышам будет приблизительно та же, что и пропорция, числа вынутых за известное время пустых билетов к числу выигрышей,, будут постоянно возрастать с возрастанием чисел. И что поэтому, когда они достаточно велики, это заключение может рассматриваться, как морально достоверное» {61, стр. 314]. Рассмотрим в тех же предположениях случай, когда на 1000 пустых билетов было 100 выигрышных. В этом случае подсчет по первому правилу практически неосуществим. Необходимо применять второе правило. Чтобы применить второе правило, нужно указать такое гх которое соответствовало бы нашим данным: г= 1/100. Наша задача теперь будет сформулирована так: найти вероятность того, что вероятность появления пустого билета ίο ι при отдельном испытании будет находиться между 11 110 10 1 и—.+—-. При этом от ранее установленных границ мы уклонимся незначительно. 117
Искомая вероятность больше 2Σ и меньше где i+2Eapbq +2Eapbq/n 2Σ i-lEaPtf-lEaPtf!" m323 (/г—2)m5z5 2 = (η+1) Vzpq ЕаРЬд пут: l 3 ■ 2az.5 В нашем случае ρ = 1000; g = 100; η = 1100; 2 = Vioo*» тг ^ = ζ1/ — = 1,048808; α = ρ/η = = — \Ь = я//г = =— r p^r ^ 1100 11 Ί 1100 1Г Искомая вероятность будет больше 0,7953 и меньше 0,9405. При 10000 пустых билетов и 1000 выигрышах второе правило уже трудно применять, так как mz становится очень большим и возникают вычислительные затруднения. В подобных случаях применяется третье правило. Больше никаких работ Байеса по теории вероятностей не известно. Формула, которую сейчас называют формулой Байеса, в работе Байеса не содержится. Она получила такое название с «легкой руки» Лапласа. Сейчас вопрос, рассматриваемый Байесом, не представляется трудным. Его можно сформулировать таким образом: Событие А имеет вероятность р, значение которой неизвестно. Определить вероятность того, что ρ заключено в интервале от а до Ь, если в результате η независимых испытаний событие появилось т раз и п—т не появилось и если вдобавок распределение вероятностей величины ρ до испытаний равномерно в интервале (0,1). Решение может быть представлено в следующем виде: Р\а<р<Ь событие А появилось т раз V \хт(\— х)п~ ΛάΧ 1 \ xm(\-x)n~mdx 118
Однако не следует преуменьшать значение работы Байеса. Он впервые пришел к биномиальной кривой распределения, получив все основные свойства. Байес указал правило нахождения вероятности того, что искомая вероятность заключена между заданными пределами. § 5. Роль Эйлера и Д. Бернулли К середине XVIII в. теория вероятностей стала все чаще применяться к различным областям, в первую очередь к демографии, страхованию, оценке ошибок наблюдений, устройству лотерей и др. Все шире становится круг математиков, разрабатывающих эту науку. К их числу относится Л. Эйлер (1707—1783 гг.). Часть его работ по теории вероятностей и ее применениям была опубликована при его жизни, часть — значительно позже, а некоторые только в 1923 г. в 7-м томе собрания сочинений, где собраны все его работы по этим вопросам [52]. Интерес Эйлера к теории вероятностей, по-видимому, возник при следующих обстоятельствах. В начале XVII в. была впервые организована так называемая генуэзская лотерея (см. [53]). В XVIII в. она была широко распространена во многих государствах Западной Европы. Часто ее применяли для пополнения государственной казны. Прусский король Фридрих II постоянно нуждался в деньгах, поэтому он охотно принимал на рассмотрение различные проекты пополнения государственных капиталов. С предложением организовать в Пруссии лотерею к нему обратился Ракколини. Фридрих II в письме от 15. IX 1749 г. попросил у Эйлера консультацию по поводу устройства этой лотереи. В 1763 г. Фридриху вновь был предложен проект лотереи. Он во второй раз обратился за консультацией к Эйлеру в письме от 17.VIII 1763 г. В своих ответных письмах Эйлер привел подробные расчеты стоимости билета для беспроигрышной лотереи. Рассматриваемая Эйлером лотерея была устроена следующим образом. Каждый играющий указывал номер или несколько номеров, которые, по его мнению, должны оказаться среди пяти извлеченных билетов. Кроме того, играющий'указывал и выигрыш, который он желает получить, если появятся указанные им номера. При этих 119
условиях Эйлер на числовых примерах проводил все необходимые расчеты. В работе «О вероятности последовательностей в генуэзской лотерее» Эйлер указывает, что вычисление вероятностей извлечения заранее заданных номеров среди пяти вынутых номеров хорошо известно. Он же будет рассматривать вероятности появления последовательностей1. Эйлер считает, что вопрос нахождения вероятности появления последовательности «настолько сложен, что при получении его решения встречаются огромные пре·* пятствия» [52, стр. ИЗ,]. Он рассматривает вначале частные случаи, причем начинает с (Простейших, а затем переходит к общей задаче. Первая задача. Определить вероятность появления последовательности при извлечении двух билетов из я. Число всех исходов будет С\= (п— 1) /г/1-2. Количество последовательностей длиною в два числа (будем обозначать последовательно длиною в k чисел через (k)) бу* дет равно η — 1. 2 Лг) = (л—1) · 2/л (п— 1) = —. Вероятность неполуче- п ния последовательности: Рц) =1 = , а число слу- п 2 η (η —1) чаев, не составляющих последовательности, равно ν 2 . 1Ч лг (п —1) —2 (лг —1) (п— 1) (лг — 2) ~ (п — 1) = — - * - = - — '—. Отсюда мы также можем получить η (лг —1) (лг—2) -2 п— 2 2л (п —1) 2 Вторая задача. Извлекаются три билета. Найти вероятность (3) и (2). Всех исходов будет С% =п И* — т Количество 1 * 1 *0 1 Под последовательностью понимают появление среди пяти вынутых номеров двух или более, идущих в натуральном порядке: «например, два таких — 7 и 8, это последовательность двух; если же имеются три таких — 25, 26, 27, то это будет последовательность трех, и подобным образом для большего числа» [52, стр. 113]. 120
(3) = η —2, следовательно, D (л — 2)-2-3 2-3 η (η— 1)(/ι— 2) /ι (/ι—Ι) Количество (2) = {η —2) {η —3), следовательно, (л — 2) (η— 3)л(л — 1) ·2·3 _ 2-3 (αζ— 3) ^(2) = 2·3η (λ — 1) (η—2) η(η—ί) В третьей и четвертой задачах Эйлер рассматривает получение различных последовательностей при извлечении четырех и пяти билетов. Далее идет раздел «Приложения к генуэзской лотерее». Здесь рассматривается следующая задача. В генуэзской лотерее η=90 и извлекается 5 билетов. Вероятности появления последовательностей сведены в таблицу: (5) 90-89-88.87 "511038 * 2-3-4-5-85 _ 85 (4> (1) 90-89-88-87 "511038 2-3-4-5-85 85 <3) <2) 90.89.88-87 ""511038 3.4-5-85-84 3570 (3) (1) (1) 90-89.88-87 ""511038 3-4-5-85-84 3570 (2) (2) (1) 90.89-88-87 "511038 4-5-85-84-83 98770 (2) (1) (1) (1) 90.89-88-87 "511038 85-84-83-82 404957 (1) (1) (1) (1) 90-89-88.87 "511038 Первая вероятность Р$) получена, например, следую- х г» п* 90-89-88-87-86 „ щим образом. Всех исходов С90 = - Коли- 1-2-3-4-5 чество последовательностей (5) будет 90—4 = 86. Следовательно, п 86-2-3-4-5 1 М5) 90-89-88-87-86 511038 * (и) (т). . . ΧΪ) -означает Р(Л)и(т)и.. .и(/). 121
Пользуясь этой таблицей, Эйлер решил ряд задач. Вот, например, одна из них: найти вероятность того, что появится хотя бы одна (2) и т. д. Затем Эйлер рассмотрел случай с извлечением 6 чисел и только после этого перешел к изучению последовательности при извлечении т чисел из я. Вопросами, связанными с устройством лотерей, Эйлер занимается и в работе «Размышление об особом виде лотереи, называемой генуэзской» [52, стр. 466]. Эта работа также возникла в результате обсуждения организации государственной лотереи для пополнения казны. Здесь определяется вероятность того, что при извлечении т билетов из η появится то или иное количество ранее названных номеров. В этой же статье решается вопрос о цене билета. К проблемам, связанным с лотереей, Эйлер вернулся еще раз в работе «Решение некоторых более трудных вопросов теории вероятностей». Он так характеризует эту работу: «Поводом к этим вопросам послужила широко распространенная игра, в которой из 90 билетов, обозначенных номерами 1, 2, 3, 4,..., 90, по жребию извлекается пять билетов. При этом возникают следующие вопросы: какова будет вероятность, что после того как будет произведено определенное число извлечений, будут извлечены все девяносто номеров или по меньшей мере 89 или 88 или меньшее число. Я намереваюсь решить эти трудные вопросы на основании уже давно известных принципов исчисления вероятностей. И меня не останавливают возражения знаменитого Даламбера, который пытался сделать сомнительным это исчисление. После того, как великий математик оставил математические занятия, представляется, что он даже объявил им войну, так как он приступил к разрушению многих наиболее твердо установленных основных положений. Хотя эти возражения должно быть имеют большое значение для незнающих, однако нечего бояться, что они принесут какой-нибудь ущерб науке» [52, стр. 408]. В этом высказывании Эйлера очень интересна характеристика роли Даламбера в теории вероятностей. В 1770 г. Гритхауз предложил Фридриху II следующую лотерею. Выпускается 5 серий по 10 000 билетов з серии, в каждой серии имеется до 1000 выигрышей. Каждый билет участвует в розыгрышах во всех пяти сериях, в некоторых выигрывает, а в некоторых проигрывает. 122
Фридрих поручил Эйлеру исследование этой лотереи. В результате этого появилась работа Эйлера «Решение одного очень трудного вопроса теории вероятностей» [52, стр. 162]. В этой работе Эйлер определяет вероятности всех случаев, которые могут произойти в этой лотерее. В ряде других своих работ Эйлер рассмотрел вопросы, касающиеся различных задач, связанных с азартными играми. Одна из наиболее интересных работ Эйлера по этой тематике является «Вычисление вероятности в игре „встреча"». С самого начала Эйлер формулирует задачу. «Игра «встреча» является азартной игрой, в которой два игрока, имеющие каждый по полной колоде карт, извлекают одновременно карты одну за другой до тех пор, пока они извлекут одинаковую карту, и тогда один из игроков выигрывает. А если такая встреча не произойдет вовсе, тогда выигрывает второй игрок. При этих правилах отыскивается вероятность выигрыша каждого из этих двух игроков» [52, стр. 11]. Прежде В'сего Эйлер заменяет карты занумерованными билетами: 1, 2, 3, 4 и т. д. и считает, что из двух игроков А и В один А извлекает билеты по порядку 1, 2, 3 и т. д. «Задача состоит в определении вероятности, которую будут иметь как Л, так и β на выигрыш ставки, каково бы ни было число карт или иумерованых билетов. С первого взгляда видно, что это определение изменяется в зависимости от числа билетов, и оно становится тем более сложным, чем больше число билетов. Следовательно, необходимо начать это исследование с наименьших чисел билетов, переходя затем к большим числам» [52, стр. 12]. Рассмотрение начинается со случая, когда А и В имеют по одному билету. Тогда Р(Л)=1; Р(В)=0. Затем рассматривается случай с двумя билетами. Ясно, что в этом случае Р(А)=1/2\ Р(В)*=*1/2. Если оба игрока будут иметь по три билета, то в том случае, когда А извлечет билеты в порядке 1, 2, 3, В может их извлечь шестью способами. Эйлер составляет соответствующую таблицу: А| в И 2 3 4 5 6 11112 2 3 3 2 2 3 13 2 1 3 13 2 3 112 123
Все эти шесть исходов равновероятны. Здесь видно, что выигрышу А благоприятны 4 случая, а выигрышу 5 — 2. следовательно, Если у каждого будет по 4 карты, то соответствующая таблица будет выглядеть следующим образом: А | В 1 2 3 4 123456789 10 11 1111112 2 2 2 2 22334433 441 34422341134 43243214313 12 2 1 3 4 13 14 3 3 4 4 1 2 2 1 15 16 3 3 1 1 2 4 4 2 17 3 2 1 4 18 3 2 4 1 19 4 1 2 3 20 4 1 3 2 21 4 2 3 1 22 4 2 1 3 23 24 4 4 3 3 1 2 2 1 15 5 9 3 Легко подсчитать, что Ρ (А) = — = — ; Ρ (β) = — = -· 24 8 ч 24 8 При пяти картах таблица будет иметь 120 столбцов. «Еще большее число карт сделало бы это представление совершенно неосуществимым. Впрочем, такой действительный подсчет мало бы послужил для определения в общем надежд обоих игроков Л и В, как велико бы ни было число карт. Для этого результата нужно сделать общие замечания, которые могут привести нас к знанию большого числа карт, если нам уже известны вероятности для меньшего числа» [52, стр. 14}. В конце статьи он приходит к следующему выводу. «Если бы число карт было бесконечным, то надежда А выразилась бы следующим бесконечным рядом: 1—7г+ +7б—V24+Vi20— 7720 и т. д., а надежда В следующим рядом: 1—1 + !/г—Ve+724—V120+7720 и т. д. ... Мы зна- 1 ем, что этот последний ряд выражается через—. Значит, е \ для случая /г = оо надежда А будет =1 , а надежда е \ В = —... И это отношение будет правильным, как только число карт будет больше 20. Вследствие этого оно будет очень точным для этой игры, в которую играют, обычно употребляя полную колоду в 52 карты» [52, стр. 25]. В этой работе хорошо виден тот метод, которым часто решал Эйлер поставленные задачи. В начале рассматриваются простейшие частные случаи, затем они усложня- 124
ются и только после этого Эйлер переходит к задаче в общем виде. В других работах, относящихся к азартным играм, он рассматривает Петербургский парадокс, игру «фараон» и некоторые отдельные задачи. Развитие естественных наук, в первую очередь физики и астрономии, поставило вопрос об определении по многим результатам наиболее точного значения. В первой половине XVIII в. таким значением большинство исследователей считали среднее арифметическое. Но в связи с улучшением техники наблюдений были исключены многие источники грубых ошибок, и это послужило основой для нападок на принцип среднего арифметического, так как стали считать, что достаточно одного хорошо выполненного измерения. В 1778 г. в «Известиях Петербургской АН» за 1777 г. была опубликована работа Д. Бернулли «Наиболее вероятное значение среди нескольких расходящихся между собой наблюдений и устанавливаемое отсюда наиболее близкое к истине заключение»1. В этой работе Д. Бернулли пишет, что правило среднего арифметического может применяться только в том случае, если известно, что (вероятностности ошибок всех измерений равны. Однако на практике этого не происходит. В § 2 своей работы он замечает: «Но разве справедливо утверждать, что наблюдения имеют один и тот же вес или подвержены любой и всякой ошибке? Разве ошибки в несколько градусов так же легко сделать, как ошибки в столько же минут? Разве ©сюду существует равная вероятность?» [54, стр. 262]. Д. Бернулли сравнивает применение среднего арифметического со стрельбой вслепую. Бериулли считает, что случайные ошибки в наблюдениях вызываются «бесчисленными несовершенствами и другими мельчайшими скрытыми препятствиями» [54, стр. 265]. Взамен среднего арифметического он предлагает оценку, которую впоследствии назвали оценкой максимального правдоподобия. В связи с введением этой оценки Бериулли указывает, что если осуществилось некоторое событие из η взаимоисключаю- щихся событий А* с вероятностями pi и если /?/ наиболь- 1 Эта работа, как и «Замечания», на нее Эйлера, помещена в 7 т. сочинений последнего [52, стр. 262]; перевод ее на английский язык содержится в ж. «Biometrika» [54]. 125
шая из этих вероятностей, то следует считать, что осуществилось событие А/. Бернулли считает, что кривая плотности обладает следующими свойствами: она состоит из двух одинаковых частей, которые опускаются к оси абсцисс и пересекают ее под прямым или почти прямым углом; плотность отлична от нуля только на конечном интервале; вероятность максимальна в середине, где касательная параллельна оси абсцисс. В качестве кривой плотности он выбирает полуокружность, хотя и говорит, что можно выбрать и полуэллипс и дугу параболы или другую соответствующую кривую. Радиус полуокружности равен максимальной ошибке или расстоянию между крайними измерениями. Функция правдоподобия у Д. Бернулли имеет вид Υ г г —хх γη — {χ — αΥ yrr — (x — bf Yrr—(x — c)2· etc., (рис. 5), хотя он использует ее квадрат (гг — хх) (гг — (х — а)2 (гг — (х — b)2) (гг — (х — с)2) etc. [54, стр. 269]. ОА' =г\ОА = х — а; АА' = Υ г2 — (χ — α)2; ОВ = х — Ь\ ВВ' = Yr2 — {x — bf\ ОС == х\ СС = Yr2 — x\ Уравнения правдоподобия даже для малого числа наблюдений получаются очень громоздкими. Так, например, Бернулли составляет уравнение правдоподобия для случая трех измерений, которое является уравнением пятой степени. Он приводит решение этого уравнения в частных случаях, когда έ = 2α, 6 =—а и др. В конце статьи Д. Бернулли пишет, что его оценка не привела «ни к неприятным результатам, ни тем более к абсурду» [54, стр. 279]. Эйлер в связи с этой работой Д. Бернулли написал статью «Замечания к предыдущей статье прославленного Бернулли», которая была опубликована в том же 126
томе «Известий Петербургской АН», перевод ее был помещен в журнале «Biometrika» [55]. По словам Эйлера, принцип Бернулли ничем не подтвержден. Эйлер предлагает вернуться к средней арифметической, и считать эту среднюю по формуле #— =— , где а, &,...—значение наблюдений, α + β+ ... α, β,... — соответствующие веса; кроме этого, принято α? = τ*—{χ — αγ\ $ = r2 — (x — bf, ... Это своеобразное сочетание принципов среднего арифметического и максимального правдоподобия привело Эйлера к уравнению третьей степени вида: пхъ— — nrrx + ЗВх— С=0 [52, стр. 284]. О лес Рис. 5 Во многих случаях задача сводится к квадратному уравнению1. Наибольшее значение из работ, примыкающих к теории вероятностей, имеют работы Эйлера по демографии и страхованию. Из них следует отметить «Исследования о смертности и умножении рода человеческого» и «Об умножении рода человеческого». В этих работах Эйлер ставит и решает много вопросов, которые легли в основу математической демографии. Решая задачи о приросте населения, о численности населения в предстоящие годы, о численности умерших и др., Эйлер создал законченную теорию повозрастной смертности. Он получил интересные выводы при решении задачи о времени удвоения численности населения. 1 См. подробнее по этому поводу и о дальнейшем развитии вопроса в [78] и [166J. 127
Хотя все рассмотренные Эйлером задачи и примеры носят формальный характер, -их значение, в частности, для создания математической демографии, весьма велико. Приведем некоторые результаты работ Эйлера по демографии. Так, он говорил, что таблицы смертности нельзя считать универсальными: каждая такая таблица пригодна только для того места, для которого она построена; что смертность в больших городах выше, чем в малых, а в малых выше, чем в деревнях. Он отмечал, что смертность женщин в соответствующих возрастах ниже, чем у мужчин, а смертность выделенной группы лиц не отражает смертности всего населения. О большом внимании Эйлера к демографическим проблемам говорит хотя бы тот факт, что в работе «Введение в анализ бесконечных», в главе первой — «О показательных логарифмических количествах», Эйлер приводит несколько задач демографического характера. Некоторые из них рассмотрены ниже. Число жителей некоторой области увеличивается ежегодно на 7зо свою часть, а вначале область населяли 100 000 человек; спрашивается: каково будет число жителей через 100 лет? Эйлер так решает эту задачу. Через год число жителей будет: (1 + 7зо) · 100000= (31/зо) · 100000. Через 100 лет: (31/зо)100' 10° °00· Логарифмируем: 100. (Ig31—lg30) + lg 100000 =100-0,014240439+5 = = 6,4240439. Этому логарифму соответствует число 2 654 874. «Итак, через 100 лет число населения увеличится более чем в 267г раз» [56, стр. 95]. Далее приведем лишь формулировки некоторых задач. Пусть к концу каждого века число людей удваивается!; требуется найти годовой прирост. Пусть число людей увеличивается ежегодно на Vioo свою часть; спрашивается: через сколько лет ^исло людей удесятерится? 128
Конечно, эти задачи условны, но при их помощи разрабатывались приемы и методы математической демографии. В статье «Общие исследования о смертности и увеличении численности рода человеческого» {52, стр. 79] Эйлер ввел несколько важных понятий и сделал существенные выводы. Работа начинается с замечания, что в последнее время в разных местах публикуются ежегодные сведения о родившихся и умерших и что эти сведения не только не совпадают, а сильно отличаются друг от друга. В первой части работы Эйлер решает шесть задач. Рассмотрим некоторые из них. Вторая задача: какова вероятность того, что человек в возрасте т лет проживет еще η лет? Пусть N обозначает количество одновременно родившихся людей, {k)N— количество людей, оставшихся в живых через k лет. Следовательно, (k) есть вероятность выживания. После введения этих обозначений Эйлер дает следующий ответ на поставленный вопрос: Р = (т + п) =———, а вероятность, что человек умрет в указанный срок, будет η ι (т + п) При решении четвертой задачи Эйлер вводит понятие жизненной силы для человека в возрасте т лет. Он так определяет это понятие: жизненная сила равна (т) — (m+z), где ζ определяется из соотношения' (m + z) ι/ Вероятности (т) Эйлер брал из работы голландского демографа М. Керсебума (1691—1771 гг.). Демографические таблицы Керсебума были составлены для Голландии. Эйлер отмечал, что таблицы, которые он приводит в своей работе, как и все другие таблицы, не универсальны и их можно применять только для тех районов, для которых они составлены. Он отмечает, что в таблицах Керсебума не учтено, что смертность мужчин и женщин разная. Эйлер указывал на социальный 129
фактор в демографии и в особенности на его влияние на детскую смертность. Эйлер вводит понятия «вероятная продолжительность жизни», «порядок вымирания» — эти понятия лежат в основе современной теории таблиц смертности. В решении задач Эйлер разрабатывает методику пользования таблицами смертности. Здесь фактически излагается основная часть математической теории смертности. Эйлер впервые вводит понятие о вероятной продолжительности жизни. В первой же части решается ряд задач, относящихся к страхованию. Во второй части этой работы Эйлер рассматривает вопрос о приросте населения, решает ряд задач на определение численности населения в предстоящие годы, количества умерших и т. п. Эйлер приходит к идее построения таблиц смертности на основе сведений о живущих и данных об умерших за соответствующий год, распределенных по возрасту. Несколько работ Эйлера посвящены страхованию. Они являются значительным вкладом в развитие теории и практики страхования. В теории вероятностей и ее применениях Эйлер не затрагивал центральных задач, основных проблем и понятий. Он ограничивался решением отдельно поставленных, чаще всего конкретных задач. Они характеризуют широту его взглядов, а также его интерес к практическим запросам. При решении всех этих задач Эйлер часто проявлял изумительное мастерство, оттачивал свои методы. Наиболее крупный след в области применений теории вероятностей Эйлер оставил в демографии. Он заложил основы для выработки ряда основных понятий современной демографии 1. Остановимся теперь на роли Д. Бернулли в развитии теории вероятностей. Выше мы уже упоминали одну работу Д. Бернулли, посвященную изучению кривой распределения. В теории вероятностей Д. Бернулли выдвинул новую идею — применение анализа бесконечно малых к задачам теории вероятностей. Главной в этом отношении является его работа «Опыт исследования о 1 См. f57], где содержится список всех работ Эйлера по вопросам теории вероятностей и ее применениям. 130
применении исчисления бесконечно малых в искусстве предположений» [58]. Как мы уже видели, решение задач теории вероятностей часто приводит к сложным выкладкам с применением довольно громоздкого аппарата комбинаторики. Д. Бернулли предлагает заменить такие решения операциями дифференциального исчисления. Он считает единицу бесконечно малой по сравнению с большими числами и получит ряд приближенных формул. Эти формулы представляют собой асимптотические выражения, соответствующие большим значениям параметров, входящих в данную задачу. Он показывает на примерах, что применение дифференциального исчисления упрощает решение задач. В конце вводной части Д. Бернулли отмечает: «Всякий раз, когда положение вещей изменяется путем непрерывного извлечения жребия и вследствие перемен, с ним связанных, как, например, когда из урны последовательно одна за другой извлекаются карточки, отличающиеся друг от друга различными числами, на них написанными, и когда исследуются законы, определяющие различные изменения, отсюда вытекающие,— с пользой для совершения этого дела могут быть применены исчисления бесконечно малых, если только каждое изменение можно счесть как бы за бесконечно малое, а это возможно до тех пор, пока число карточек, остающихся в урне, весьма велико, ибо тогда единица может приниматься как бы за бесконечно малую; на эту же гипотезу опирается та арифметика бесконечных, которой пользовались математики до открытия дифференциального и интегрального исчисления. Впрочем я понимаю, что этот отвлеченно поставленный вопрос нуждается в дальнейшем объяснении и потому перехожу к иллюстрации сути дела примерами, причем сперва пользуюсь обычным анализом, а от него перехожу к применению алгоритма бесконечно малых» [58, § 1]. В § 2 Д. Бернулли формулирует следующую задачу. Пусть в урну положены карточки в четном числе, причем каждая из двух парных карточек помечена одним и тем же номером, так что одна соответствует другой, а обе вместе составляют одну пару; различные же пары предполагаются помеченными различными номерами, чтобы таким образом было возможно различать отдель- 131
ные пары между собой; затем наудачу извлекаются из урны одна карточка за другой; спрашивается сколько осталось в урне разрозненных и неразрозненных пар среди данного числа оставшихся в урне карточек. Далее Д. Бернулли переходит к решению этой задачи, вначале обычным способом. Пусть общее число карточек будет 2п, следовательно, число пар будет п. После ряда извлечений пусть число оставшихся в урне карточек будет г. Число оставшихся пар обозначим через х. Следовательно, число карточек без пары будет г—2х. Предположим, что после этого извлекается еще одна карточка, так что в урне остается г—1 карточка. Эта последняя карточка может быть взята или из одиночных или из парных карточек. Тому, что она будет взята из одиночных, благоприятствует г—2х случаев, а тому, что из парных — 2х. В первом случае число пар в урне останется х, во втором случае их станет χ—1. «Согласно основному правилу искусства делать предположения, умножим названные выше величины χ и χ—1 на соответствующее число случаев и разделим сумму произведений, на общее число случаев». Другими словами, отыскивается математическое ожидание числа оставшихся пар. Интересно отметить, что отыскание математического ожидания Д. Бернулли называет основным правилом искусства предположений. Вероятность того, что останется χ пар, будет , г 2х вероятность того, что останется χ—1 пара, будет —. г Тогда математическое ожидание числа оставшихся пар подсчитывается следующим образом: «После любого нобого извлечения карточки оставшееся в урне число пар уменьшается на величину 2х/г». Фактически же речь идет об уменьшении математического ожидания. На основании полученного соотношения вычислим значения х, начиная с г = 2/г, затем будем переходить к г=2п— 1, 2л—2, 2п—3 и т. д. Перед первым извлечением х=/г; после первого извлечения х = п— 1. 132
χ после второго извлечения находится по формуле х=Х , где X — количество пар после предыдущего извлечения. t 2 (л — 1) 2/г2 — л — 2п+1—2/г+2 χ =п—1 - = · ·— = 2/г—1 2/г—1 _ 2/г2 —5/г +3 _ 4л2 —10/г +6 ^ (2/г —3) (2/г —2) ~" 2/г—1 "" 4л—2 4л—2 По этой формуле находим χ при следующих извлечениях. После третьего извлечения получим __ (2/г —3) (2/г ^-2) 2 (2/г —3) (2/г —2) __ (2/г —4) (2/г —3) ~~ 4л—2 (4л — 2) (2/г — 2) 4л — 2 После четвертого извлечения — χ = (2/г -4) (2/г -3) 2 (2/г -4) (2/г -3) (2/г -5) (2/г -4) д Ί 4л—2 (4л —2) (2/г —3) 4л—2 Д. Бернулли замечает, что из этой последовательности вычислений χ видно, как строится χ после любого извлечения. После (2я—г)-го извлечения [2/г — (2/г — г +1)] [2/г — (2/г - г)| г (г— 1) ~~ 4л—2 4л— 2 Это ή есть окончательное решение задачи. Следова^ тельно, в этой задаче Д. Бернулли находит математическое ожидание числа оставшихся пар после (2п — г)-го извлечения. После этого для иллюстрации приводится следуй щий пример. Перемешиваются две колоды карт по 52 карты. Получаем 52 пары карт, общее же число карт я=104. Извлекается случайным образом 13 карт, остается 91 карта (г=91). По нашей формуле получаем χ_ г(г-1) = 91-90 ~9 — 4л—2 4-52—2 103* Следовательно, сначала оказываются разрозненными почти столько же пар, сколько карт извлекается. При 133
извлечении 52 карт, получаем 52-51 10 90 X = —————— = 12 " 4-52-2 103 «Стало быть, с некоторой надеждой на выигрыш можно будет делать ставку в игре на то, что в числе 52 оставшихся карт окажется по меньшей мере 12 парных; ставить же на 13 парных будет для игрока несколько рискованным». Далее Д. Бернулли делает общее замечание: «Совершенно бесспорно, что в наше время благороднейшее учение об искусстве делать предположения находится в пренебрежении или недооценивается. А между тем оно помогает разрешать весьма многие вопросы из области морали или политики, извлекать максимальную пользу из человеческих поступков и предусмотрительно их направлять» [58, § 4]. После этого Д. Бернулли пишет, что если η—мх>, то и г—>-оо и мы можем пренебречь 1 и 2 в нашей формуле я=—7—г1-· Тогда мы получим х= —. Отно- 4/г—2 4/г сительно этого последнего равенства Д. Бернулли пишет: «Я покажу метод, каким последнее уравнение х= jf- может быть непосредственно и легко найдено с помощью исчисления бесконечно малых». Пусть г уменьшится на dr. Это уменьшение идет или за счет разрозненных карточек, которых г—2х, или за счет парных карточек, которых 2хт В первом случае число парных карточек не изменится, т. е. dx=0. Во втором случае все уменьшение dr будет идти за счет уменьшения х, т. е. dr=dx. «Следовательно, мы имеем г—2х случаев, в которых dx оказывается=0 и 2х случаев, в которых тот же элемент dx является—dr. Отсюда, согласно основному правилу искусства предположе- « < 2xdr нии, истинное значение элемента dx = , откуда сле- dx 2dr _ дует:—=— ». άτο уравнение интегрируется при следующих начальных условиях: если х=п, то г=2п: In* =2 In г+ 1п С; 1пС = \пп— 21п2л; ln*=21nr + lnn — 21п2я; In* = In — \х = —ч. т. д. 134 ** Ы
Далее Д. Бернулли решает таким же методом другую задачу, которая является некоторым усложнением предыдущей. Положенные в урну карточки разбиты поровну на две категории, например на черные и белые, так, что до извлечения их любая черная имеет соответствующую ей белую, отмеченную таким же значком или цифрой. Таким образом, исходное число пар будет раино п, а число всех карточек—2я, разбитое поровну на черные и белые. Допустим, кроме того, что карточки той или другой из обеих категорий имеют, согласно какому-либо данному постоянному или изменяющемуся закону, более благоприятные шансы для извлечения их, так что черные и белые извлекаются из урны в неравном числе. Предположим далее, что число оставшихся в урне черных карточек равно s, а белых — t. Каково вероятное число оставшихся в урне парных карточек, белых и черных? Решая эту задачу, Д. Бернулли приходит к следующему дифференциальному уравнению: решением которого будет лс= —, если учитывать на- п чальные условия (при лс=/г, s к t также равны /г). Далее он пишет, что легко получить решения, если карточек будет не две категории, а три, четыре и т. д., и приводит окончательные формулы для этих случаев, написанных по аналогии с решением предыдущей задачи. В конце работы рассматривается та же задача для двух категорий карточек, но дополнительно задано отношение легкости выхода черных карточек и легкости выхода белых. Работа заканчивается примером, когда это отношение равно 2. Следует заметить, что Д. Бернулли в этой задаче не отчетливо различает математическое ожидание случайной величины и само значение случайной величины. Метод бесконечно малых Д. Бернулли применяет еще в двух других работах (см. [59]). В первой из них рассматривается следующая задача. В одной урне находится η белых шаров, а в другой — η черных. Одновременно №г каждой урны в другую перекладывается 135
один шар, эта операция производится г раз. Требуется определить математическое ожидание числа белых шаров в первой урне. Решая эту задачу алгебраическим методом, Д. Бернулли получает точный ответ: *-И,+Г-?)']· При большом п, применяя рассуждения, основанные на анализе бесконечно малых, он получает приближенную формулу: * = ±п(1+е п). В 1760 г. Д. Бернулли написал работу о пользе оспопрививания (опубликована в 1766 г.), которая основана на вероятностных соображениях и в которой также применяется метод бесконечно малых. Но наиболее известной работой Д. Бернулли по теории вероятностей является его работа «Попытка новой теории вычисления вероятностей случайных величин» [60], в которой он вводит понятие морального ожидания. Вначале он обычным путем определяет математическое ожидание, как Σχγρι. Далее вводится понятие морального значения перехода капитала α в капитал х. Эта величина определяется формулой */ = Mogx/a, где коэффициент Ь>0. Или в дифференциальной форме — dy = b(dx/x), откуда видно, что бесконечно малое приращение морального значения перехода прямо пропорционально бесконечно малому приращению капитала и обратно пропорционально величине капитала ху который получает приращение dx. Пусть Сь С2,..., С —возможные значения выигрыша и ри /?2,·.., ρ — соответствующие вероятности. Среднее моральное значение выигрыша определяется формулой г = Рхь log £t±£L+ftMog&±« + ... + ^Mog^-tl. a a a Это есть математическое ожидание величины Ь log - , где 136
χ— выигрыш и а — капитал выигрывающего. Определим χ из уравнения ζ = &log—; χ = ааг/ь. Подставим сюда значе- α ние ζ из полученной выше формулы. ft log £±2. +P2 log -fi±« +Pi log ^!±£ +.. .+PmIog gm+« —- (Сх + а)"' (С, + а)"' ... (Ст + а)"" = aV ... о" а /Г* ι ~\Pl //> ι ~\Ρί //*> ι ~\Рт P1+P2+—+РШ (Сх + а)*(С2 + аГ ··· (Ст + а)" Учитывая, что 2 № = 1» окончательно получим * = (Сх + α)* (С2 + α)" ... (Ст + о)Ч Разность (Сх + α)Ρι (С2 + a)Pi ... (С* + а)Рт— α по Д. Бер- нулли и представляет собой величину морального ожидания выигрыша при основном капитале а. Запишем это выражение в виде ■('+*ro+*r-(,+^f-' Разлагая теперь по биному Ньютона, считая α большим и отбрасывая все члены начиная с порядка 1/а, получим выражение математического ожидания. Действительно V α / 8 α 2 α2 (l+ £ΛΡ' = \+Ε£ι+ ... \ α / α 137
_.(,+ла+...)(,+jfi...)... (,+5ώ+..)_ _α = α(ΐ+Α&. + £& + £& + ..Λ-α = \ α α α / m Д. Бернулли применил понятие морального ожидания к задаче, которая впоследствии получила название петербургской. Как мы уже знаем, парадокс этой задачи состоит в том, что математическое ожидание искомого выигрыша равно бесконечности. Если же применить вместо математического ожидания моральное ожидание, введенное Д. Бернулли, то получается конечная величина. Пусть α — капитал, которым владел один из игроков (А) до начала игры. Тогда для морального ожидания получаем выражение: (а +1),/2 (а +2),/4 (а + 4)Vs а = 4 8 = |/а + 1 γα +2 γα +4 а = Р(а) — а. (Ш.7) «При а = 0 разность (Ш.7) равна 2, при а=10 — примерно 3, при а= 100 —около 4!/з, при а=1000— около 6» [62, стр. 463]. Сумма х, за которую можно купить положение Л, имея капитал а, определяется из равенства Ρ (а — х)— —а = 0. В этой работе Д. Бернулли рассматривает и другую задачу. Некто имеет 4000 дукатов наличными и на 8000 дукатов товаров, находящихся в далеких странах; эти товары предстоит перевезти. Предполагается, что из 10 кораблей, на которых перевозится товар, один тонет. Как выгоднее перевозить товар? Предположим, 138
все товары перевозятся на одном корабле. Тогда моральное ожидание прибыли от привозимых товаров будет (8000+4000)Vld(0+4000)1/ld—4000 = 12000Vld.4000Vld—4000. (Ш.8) Если товары перевозятся на двух кораблях, то моральное ожидание будет (8000+4000)'Vldd (4000+4000)"/ιΜ (0+4000)Vld· —4000 « = 12000it/li§8000li/lii40001/lii —4000. (III.9) 81 Здесь вероятность того, что оба корабля прибудут * / 9 9 81 \ 18 благополучно [ — · — = — ι; вероятность того, что J V10 10 100/ 100 r (91 19 18 \ ϊο'ϊο +ϊό "ϊο = ϊόο); 1 / 1 1 1 \ вероятность, что оба корабля погибнут — · — = — |. 100 г \10 10 100J Величина (III.9) больше величины (III.8). Из этого Д. Бернулли делает вывод, что с увеличением числа кораблей увеличивается моральное ожидание1. Вопрос о моральном ожидании в дальнейшем рассматривался Лапласом, Пуассоном, Лакруа, В. Я. Бу- няковским и др. Понятие морального ожидания и связанные с ним идеи неоднократно подвергались критике. В частности, Бертран в своем курсе «Исчисление вероятностей» замечает с иронией: «Теория морального ожидания сделалась классической, и никогда это слово не может цитироваться столь удачно: эту теорию изучали, ей обучали, ее излагали в истинно знаменитых книгах. Успех на этом и окончился, ею фактически не занимались и из нее не смогли сделать никакого употребления» [116]. § 6. Бюффон В XVIII в. естествоиспытатели делают попытки применять теорию вероятностей для доказательства тех или цпых положений. Одним из первых в этом 1 Ом. также [62]. 139
отношении был французский ученый Ж. Л. Бюффон (1707—1788 гг.). Его основной труд «Естественная история», оказавший большое влияние на естествоис- лытателей, поражает своей грандиозностью: 44 больших тома, из которых 36 написаны полностью им самим. Рис б Бюффон использует элементы теории вероятностей для обоснования своей гипотезы происхождения планет. Согласно этой гипотезе1, все шесть известных к тому времени планет (Меркурий, Венера, Земля, Марс, Юпитер, Сатурн) образовались >в результате столкновения Солнца с кометой. Бюффон отмечает, что эти планеты обладают рядом общих свойств, и далее перечисляет эти свойства. «Первое из них есть общее направление всех шести Планет, движущихся от запада к востоку: по сему одному обстоятельству можно держать 64 против 1, что Планеты не имели бы движения в одну сторону, если бы не одна и та же причина привела их в движение: содержание сие удобно можно произвесть из правил исчисления случайностей» [63, стр. 131]. Действительно, если считать, что движение любой планеты вокруг Солнца в одном или другом направлении равновероятно, т. е. вероятность движения в определенном направлении равна 1/2, то вероятность того, что 6 планет случайно будут обращаться вокруг Солнца в одном направлении, равна (1/2)6= 1/64. Далее Бюффон продолжает: «Вторым сходством, что наклонение плоскостей не превосходит 7 степеней с половиною, сия вероятность несказанно умножится: ибо, сравнивая пространства, выходит 24 против 1, чтобы две Планеты находились в плоскостях, больше между собою отстоящих, и, следовательно, 245 или 7 692 624 можно держать против 1, что не случаем каким все шесть Планет таким образом расположены и заключены в пространстве на 7 степеней с половиною простирающемся, или чтоб тоже сказать инако; такова 1 Впервые эта гипотеза была опубликована в его сочинении «Эпохи природы» в 1740 г. 140
есть вероятность, что планеты в движении своем имеют нечто общее, давшее им сие положение» [63, стр. 131}. 7 степеней —это 7°; 7,5° —это 1/24 от 180° (рис. 6). Следовательно, вероятность того, что две случайно выбранные плоскости будут пересекаться под углом не более 7,5°, равна 1/24. А вероятность того, что еще 4 случайно взятые плоскости также будут с первой плоскостью иметь угол не более 7,5°, равна (1/24)5 = 1/7692624. Делая из этих замечаний вывод, что в происхождении планет была общая причина, Бюффон стремится доказать, что такой причиной могло быть только столкновение Солнца с кометой. В своих работах Бюффон применяет следующее рассуждение. Подсчитывается вероятность какого-нибудь объективно существующего явления (например, вероятность движения всех планет в одном направлении), если эта вероятность мала, то утверждается, что это явление не случайно, а закономерно; необходимо искать эту закономерность. К такому рассуждению прибегали естествоиспытатели и значительно позже. Приведем один пример. Г. Р. Кирхгоф (1824—1887 гг.) исследовал спектр железа, состоящий из 60 светлых линий. Он обнаружил, что каждая из этих линий спектра железа совпадает с какой-нибудь темной линией солнечного спектра. Кирхгоф поставил вопрос: возможно ли, чтобы эти совпадения вызывались случайностью? Он установил, что нельзя обнаружить различия между линиями, если расстояние между ними менее 1/2 мм. На той шкале, на которой он наблюдал спектры, расстояние между двумя соседними линиями солнечного спектра было равно 2 мм (рис. 7). Таким образом, если бы 60 линий спектра железа не были связаны с темными линиями солнечного спектра, то вероятность того, что каждая из них будет ближе, чем на 1/2 мм к какой-нибудь линии солнечного спектра, очевидно, была бы равна (1/2)60. После этого Кирхгоф пишет, что совпадение линий спектра железа и линий спектра Солнца должно быть обусловлено причиной, которая должна исчерпывающе объяснить этот факт. А. Пуанкаре считал такое рассуждение вполне правомерным. Он писал относительно этого: «Сколько бы 141
камней ни было разбросано на горе, они все, наконец, скатятся в долину; если мы найдем один из них внизу, это будет банальным фактом, который ничего не укажет; из предыдущей истории камня мы не можем узнать, в каком месте горы он находился до падения. -« 2 мм ί/2Μ№Τ*- -*- —н f/ZMM Рис. 7 Но, встретив случайно камень вблизи вершины, мы можем утверждать, что он всегда находился там, так как, если бы он только попал на склон, то немедленно скатился бы до самого дна; мы сделаем это заключение с тем большей вероятностью, чем случай более исключительный и чем больше имеется шансов ему не произойти» [64, стр. 14}. С именем Бюффона связана известная задача - «задача Бюффона» — о бросании иглы (1777 г.). Задача Бюффона. Какова вероятность того, что игла, имеющая длину /, брошенная на 'горизонтальную плоскость, расчерченную параллельными прямыми, отстоящими на расстоянии а друг от друга, пересечет одну из этих прямых? Если /<а, то искомая вероятность /?=2 //πα*. Многими исследователями, в том числе и Бюффо- ном, эта задача использовалась для экспериментального определения π. Произведя определенное количество бросков иглы (п) и зафиксировав количество ее пересечений с параллельными линиями (т), примем частоту т/п за вероятность ρ и из равенства /?=2//πα вычислим π. Таким путем Вольф при 5000 бросаниях нашел π=3,1596. В 1855 г. А. Смит провел 3204 опытов и получил я=3,1553. В 1901 г. Лацарини провел 3408 аналогичных опытов и получил для π шесть точных знаков. Бюффон выступал также за введение нравственного» (морального) ожидания наряду с математическим. В своей работе «Опыт моральной арифметики» он пишет: '* Вывод см., например, в [6, стр. 104—106] и [38, стр. 35]. 142
«Скупой похож на математика; тот и другой ценят деньги по внутреннему их достоинству; рассудительный же человек не разбирает, какова их условная ценность, а видит только выгоды, которые может извлечь из них. Он рассуждает основательнее скупого и чувствует лучше математика. Таллер, отложенный бедным для внесения законной повинности, и таллер, дополняющий мешки ростовщика, в глазах скупого и математика имеют одинаковую ценность: первый присвоит себе каждый из них с равным наслаждением, второй будет считать их двумя равными единицами; между тем человек рассудительный оценит в золотую монету таллер бедного и в грош таллер ростовщика». Бюффон полагает, что существуют различные обстоятельства, когда следует учитывать нравственное ожидание. Он рассматривает следующий пример. Два человека, имеющие равные состояния по 100 таллеров, играют в кости на половину своего состояния, т. е. на 50 таллеров. Выигравший увеличит свое состояние яа 1/3, так как будет иметь 150 таллеров, проигравший уменьшит свое состояние в два раза, так как у него останется 50 таллеров. Из этого Бюффон делает вывод, что игра невыгодна для игроков по своей сущности. Бюффон считает, что мерой нравственной выгоды является отношение рассматриваемой суммы ко всему капиталу. Пусть А — весь капитал, а — ожидаемое приращение капитала. Нравственная выгода три потере а будет α/Л, а в случае приобретения—дХа'^33" * а а я2 ность будет = * у* А А + а А(А+а) Бюффон занимался различными вопросами, связанными с теорией вероятностей. Он указывал, что в вопросах практического характера события, вероятности которых близки к 1, нужно считать достоверными, а события, вероятности которых близки к 0,— невозможными. Он, например, говорил, что вероятности порядка 0,0001 следует уже рассматривать как вероятности невозможных событий, так как каждый здоровый человек 56 лет уверен, что проживет еще 24 часа, хотя в соответствии со статистическими данными вероятность 56-летнему умереть в течение суток равна 0,0001. Д. Бернулли в письме от 19.111 1762 г. указывает 143
Бюффону, что в статистических данных здоровые не отделены от больных, и поэтому вероятность здоровому 56-летнему умереть в течение суток будет меньше 0,0001. Бюффон соглашается, что, возможно, эту вероятность нужно уменьшить, но общий вывод от этого не изменится. Бюффон также много занимался таблицами смертности, охватывавшими 15 приходов, которые составил Дюпре де Сент-Мор. Эти подробные таблицы, на которых можно основать «вероятности о долготе жизни человеческой», приведены в его работе [150, стр. 153]. На основании этих таблиц он вычисляет «вероятности продолжения жизни» для каждого возраста, понимая под этим понятием срок, вероятность прожить который для данного возраста равна 1/2. Например, рядом с 40 годами в таблицах стоит цифра 22 года и 1 месяц; это означает, что вероятность 40-летнему прожить еще 22 года и 1 месяц равна 1/2, и так для каждого возраста. «Знание вероятностей продолжения жизни есть вещь весьма важная в истории естественной человека» [150, стр. 2093- Нужно отметить, что Бюффон часто оперирует не с вероятностями, а с отношением вероятностей. Например, в таблице указано, что количество новорожденных — 23 994; умерших в течение первого года — 6 454; из этого делается заключение: «Можно с вероятностью утверждать и ставить 17 540 против 6454 или, говоря сократительным образом, около 23Д против 1, что младенец новородившийся проживет один год» [150, стр. 217]. Действительно: 17 540=*23 994—6454—^ко- личество доживших до 2 лет. Следовательно, вероятность умереть на первом году жизни равна /7 = 6454/23 994; вероятность дожить до второго года ?=1—р= ■=17 540/23 994. Разделив q на /?, мы получим число, указываемое Бюффоном: а//7=17 540/23 994:6454/23 994 = Таблица с аналогичными данными рассчитана для разных сроков жизни. Например: «Можио ставить 15162 против 8832 или около 3/4 против 1, что новородившийся младенец проживет 2 года..., 23 030 против 964 или 24 против 1, что не проживет 78 лет» [150, стр. 217, 219], и т. п. Таблицы эти рассчитаны для каждого возраста и занимают более 100 страниц. Иногда в таблицах содержатся утверждения, которые похожи 144
на различные задачи. Например: «Можно ставить 11 против 4, что новородившийся младенец проживет один год, а не доживет до 47 лет» или: «Ежели отец имеет уже 40 лет, можно ставить 3 против 2, что сын его, будучи тогда одного года, переживет его» [150, стр. 221, 228} и т. п. Известно также, что Бюффон для подтверждения теоремы Я. Бернулли произвел 4040 бросаний монеты, причем герб выпал 1992 раза, а решетка 2048. На примере Бюффона мы видим, что естествоиспытатели XVIII в. начали применять вероятностные рассуждения в своих исследованиях. Но не все ученые одобрительно воспринимали теорию вероятностей, несмотря на ее несомненные успехи. § 7. Оппозиция со стороны Даламбера Среди богатого научного наследства Ж. Даламбера (1717—1783 гг.) имеется ряд работ, посвященных теории вероятностей [50]. Вопросов теории вероятностей он касается и во многих письмах [145]. Имя Ж- Даламбера в литературе по теории вероятностей встречается только с целью иллюстрации того, что даже очень крупные математики ошибались иногда при решении самых элементарных вероятностных задач. Приведем пример: «Монета бросается два раза. Какова вероятность того, что хотя бы раз появится герб? Да- ламбер по поводу этой задачи рассуждал следующим образом: герб появится либо при первом бросании, либо при втором, либо совсем не появится. Всех случаев три, из них благоприятствуют ожидаемому событию два, следовательно, искомая вероятность равна 2/3» [6, стр. 35— 36]. Даламбер здесь не различает равновозможные и не- равновозможные случаи. Э. Кольман объясняет происхождение этой ошибки тем, что основные идеи теории вероятностей не свойственны математике, и поэтому математики, в частности Даламбер, допускали самые элементарные ошибки [19, стр. 230]. Другие авторы вообще не касаются причин такой ошибки. Даламбер вместе с Д. Дидро издавал и редактировал знаменитую «Энциклопедию». Первое ее издание 145
выходило с 1751 г. по 1780 г. и состояло из 35 томоз. После выхода 7-го тома в 1757 г. Даламбер отошел от «Энциклопедии». Но © семи томах он поместил много статей, в том числе и оо теории вероятностей. Первой ло времени была статья «Герб и решетка» помещенная в четвертом томе «Энциклопедии» [168]. В этой статье Даламбер решает вопрос о шансах получить два раза герб при двух бросаниях монеты. Эту задачу он решает неправильно, т. к. полагает, что имеется всего три случая, которые следует учитывать, а не четыре. Если в первом броске выпадает решетка, то делать второй бросок не имеет смысла, так как два раза герб вьшасть уже не может — это, по Даламберу, первый случай. Второй случай состоит в получении герба в обоих бросках ( + , +)· Третий — в получении герба в первом броске и решетки во втором ( + , —). Поэтому, по Даламберу, искомый шанс равен 7з. Даламбер не замечает, что указанные им три случая не являются равновозможными. Как легко видеть, в действительности здесь имеется четыре рав- новозможных случая ( + , +), ( + , —), (—, +), (—, —) и искомая вероятность равна XU- Далее в этой же статье Даламбер ищет вероятность того, что «при трех бросаниях монеты герб вьшадет, по крайней мере, один раз. Вместо 8 равновозможных случаев, из которых нашему событию будут благоприятны 7, и, следовательно, искомая вероятность равна 7/8. Даламбер составляет следующую табличку: 1) герб; 2) решетка, герб; 3) решетка, решетка, герб; 4) решетка, решетка, решетка. Он считает, что после того, как при первом или втором броске появился герб, остальные броски делать не следует. Не замечая, что эти четыре случая не равно- возможны, Даламбер ошибочно считает, что искомая вероятность равна 3/4, а не 7/8. В этой же статье Даламбер касается Петербургской задачи и приводит следующее замечание по (поводу решения этой задачи Д. Бернулли: «Но мы не знаем, можно ли быть им удовлетворенным; здесь имеется какой-то скандал, который заслуживает внимания математиков» '[168, стр. 512]. Сам он склоняется к возможности бесконечного ожидания. 146
В 7-м томе «Энциклопедии» [169] Даламбер приводит возражения Неккера (профессор математики из Женевы) против его статьи «Герб и решетка». Неккер сообщил эти возражения Даламберу в письме. Неккер указывает, что три случая, которые рассматривает Даламбер, не являются равновозможными. Далее он приводит правильное решение задачи и в конце говорит, что взгляды Даламбера по этому вопросу неприемлемы, так как они ведут к очевидной ошибке. В статье «Отсутствующий» Даламбер касается работы Н. Бернулли. Ссылаясь на таблицы смертности А. Депарсье (1703—1768 гг.), он приходит к выводу, что безвестно отсутствующий должен считаться умершим в возрасте 75 лет. Далее он говорит, что, учитывая замечания Бюффона о моральной вероятности событий, следует считать, что вероятность меньше 0,0001 является несуществующей. Другие статьи, такие как «Выгода», «Бассет», (азартная игра), «Плитка» (азартная игра), «Кость», «Лотерея», «Пари», «Карты», хотя и содержат материал, связанный с теорией вероятностей, но они еще менее значительны, чем рассмотренные нами. Во II томе «Математических произведений» Даламбера помещена его работа «Размышления о теории вероятностей» [50]. В начале работы он приводит обычное определение математического ожидания и замечает, что хотя это определение принято всеми математиками, но имеются случаи, когда оно оказывается несостоятельным. Наглядным примером вопроса, к которому неприменимо математическое ожидание, Даламбер считает Петербургскую задачу, по поводу которой пишет: «Неограниченная сумма является химерой; не существует человека, который захотел бы заплатить за право играть в эту игру, не говорю неограниченную, но даже и весьма скромную сумму» [50, стр. 2]. Далее приводятся рассуждения о необходимости делать различие между метафизически возможным и физически возможным. Чтобы разъяснить эти понятия, Даламбер приводит следующий пример. Метафизически возможно получить сто раз подряд по 6 очков на каждой кости при бросании двух костей, но физически это невозможно^яотому что это никогда не происходило и не произойдет. Это является для Даламбера 147
подтверждением того, что очень малая вероятность должна рассматриваться равной нулю. Даламбер предлагает устанавливать вероятность событий на основании опыта. При этом он считает, что если при бросании монеты появился три раза подряд герб, то вероятнее, что при следующем броске выпадет решетка. Это соображение он приводит как аргумент против основных установленных положений теории вероятностей. Работа заканчивается следующим образом: «Из этих всех размышлений заключаем: 1. Что если правило, которое я дал в «Энциклопедии» (не зная лучшего), для определения отношения вероятностей при игре в герб и решетку не является строго точным, то общепринятое правило для определения этого отношения является еще менее точным. 2. Что для того, чтобы прийти к удовлетворительной теории вычисления вероятностей, нужно решить несколько задач, которые являются, может быть, неразрешимыми, а именно, установить истинное отношение вероятностей в случаях, не являющихся равно- возможными или могущих не рассматриваться как таковые; определить, когда вероятность должна рассматриваться как несуществующая, наконец, установить, как нужно оценивать ожвдание или ставку в зависимости от того, является ли вероятность большей или меньшей» [50, стр. 24J. Несмотря на свое в общем негативное отношение к теории вероятностей, Даламбер «поставил такие принципиально важные вопросы: 1) Как определять вероятность, когда нет налицо равновозможных случаев? 2) Какой вероятностью можно пренебрегать и что это означает? и др. В работе об оспопрививании Д. Бернулли пришел к выводу, что прививка оспы увеличивает среднюю продолжительность жизни на 3—4 года. Даламбер выступает с критикой этой работы (170]. Он не отрицает пользы оспопрививания, но считает, что его положительные и отрицательные стороны неправильно сравниваются и оцениваются Д. Бернулли. По мнению Даламбера, Д. Бернулли рассматривает оспопрививание с точки зрения интересов государства и доказывает, что оно является желательным, так как увеличивает среднюю продолжительность жизни. Даламбер же подходит к вопросу с точки 148
зрения отдельного индивидуума, который может рассматривать выгоду выиграть три или четыре года в вероятной продолжительности жизни как не окупающую непосредственной опасности от прививки. Связь между этими двумя оценками, по Даламберу, настолько неопределенна, что она не может служить предметом точного подсчета. По этому вопросу Даламбер выступил в Академии наук с докладом 12.XI 1760 г., где опровергал идеи Д. Бернулли. Даламбер писал: «Я полагаю, что в среднем 30-леткему человеку предстоит прожить еще 30 лет и что он вполне может надеяться прожить еще 30 лет, полагаясь на природу и не делая себе прививки. Затем я предполагаю, что после операции средняя продолжительность жизни будет 34 года. Не кажется ли, что для оценки преимуществ прививки следует сравнить не только среднюю продолжительноегь жизни в 30 лет и среднюю продолжительность жизни в 34 года, но и риск, равный 1 против 200, умереть через месяц от прививки с отдаленным преимуществом жить на 4 года больше после 60?» (170]. Даламбер обращает внимание на существование двух различных способов оценки продолжительности жизни для лиц данного возраста. Первая оценка — это средняя продолжительность жизни; вторая — вероятная продолжительность жизни — это такая продолжительность жизни, которая имеет равные шансы как быть недостигнутой, так и быть превзойденной. Даламбер не предлагает разграничивать эти понятия. Его мысль состоит в том, что каждое из них может служить для определения ожидаемой продолжительности жизни. Именно это соображение он выдвигает против теории вероятностей, указывая, что она дает два ответа на один и тот же вопрос. В I томе собраний сочинений Даламбера, изданном в 1820 г., напечатаны его «Сомнения и вопросы относительно теории вероятностей» и «Размышления об оспопрививании» [171]. Эти работы являются изложением уже упоминавшихся выше работ и предназначены для более широкого круга читателей. Касаясь теории вероятностей в целом, он пишет: «Я первый осмелился высказать сомнения относительно некоторых*Ч*ринципов, которые служат основанием для этой теории. Одни великие математлки сочли эти сомне- 149
ния достойными внимания, другие великие математики нашли их абсурдными (зачем я буду смягчать выражения, которыми они пользовались). Задача состоит в том, чтобы узнать, не были ли они неправы, применяя их, и в этом случае они оказались бы вдвое неправыми. Их решение, которое они не сочли нужным мотивировать, придало храбрость средним математикам, которые поторопились написать по этому вопросу и напасть на меня, не выслушав меня. Я попытаюсь объясниться настолько ясно, чтобы все мои читатели были в состоянии судить меня». Следует отметить, что доводы, приводимые против теории вероятностей, повторяют доводы предыдущих работ и нового материала, по существу, не содержат. В 4-м томе «Математических произведений» [145] помещены выдержки из писем Даламбера, касающиеся теории вероятностей. В них рассматривается «Петербургская задача», анализ отдельных игр, вопросы продолжительности жизни, оспопрививание и другие вопросы. В одном из писем он возражает против общепринятого уже в то время понятия математического ожидания: «Пусть будет предложено выбрать из 100 сочетаний одно. Из этих ста 99 дают выигрыш по 1000 экю и сотое дает выигрыш в 99 тысяч экю. Кто будет настолько бессмысленным, чтобы предпочесть сочетание, которое дает 99 тысяч экю. Ожидание в обоих случаях в действительности не является одним и тем же, хогя оно является одним и тем же согласно правилам теории вероятностей». Даламбер в своих письмах неоднократно повторяет знакомые нам возражения против теории вероятностей: «Уже около тридцати лет тому назад у меня сформировались эти сомнения при чтении превосходной книги г. Вернул л и». Возвращаясь к решению задачи о получении двух гербов при двух бросаниях монеты, Даламбер пишет: «Если три случая, единственные, которые могут произойти в этой игре, не являются одинаково возможными, то это вовсе, как мне кажется, не на том основании, которое этому придают, что вероятность первого есть 1/2, а вероятности двух других 1/2-1/2 или 1/4. Чем больше об этом я думаю, тем больше мне представляется, что, говоря математически, эти три бросания являются одинаково возможными». 150
Он считает, что для подсчетов вероятностей не будет одинаково, бросают ли η раз последовательно одну монету или одновременно бросают η монет. В одном из писем Даламбер рассматривает вопрос: при скольких последовательных бросаниях кости можно заключать пари на появление заданного числа очков? Даламбер указывает, что, согласно общепринятым правилам, это пари с выгодой можно заключать при четырех бросаниях. Действительно: (5/6) 4< 1/2; 1—(5/6)4> 1/2, но (5/4) 3> 1/2 и 1—(5/6) 3< 1/2. Но, ссылаясь на одного игрока, он заявляет, что в данном случае теория не соответствует практике. Далее Даламбер -ссылается на письма к нему трех математиков, одного из которых характеризует как очень образованного писателя, который разрабатывал с успехом математику и который известен превосходной работой по филологии. Этот его корреспондент писал: «Все, что вы высказываете о вероятности, превосходно и весьма очевидно; старое исчисление вероятностей разрушено». Даламбер делает примечание к этому месту: «Я вов- · се не претендую на это, я не претендую вов^е разрушить исчисление вероятностей, я желаю, чтобы оно было изменено и улучшено». В 7-м томе, опубликованном в 1780 г., помещен его мемуар «Об исчислении вероятностей» [172]. Этот мемуар посвящен главным образом «Петербургской задаче». Даламбер начинает этот мемуар словами: «Я прошу прощения у математиков за то, что снова возвращаюсь к этому вопросу. Но я признаюсь, что чем больше я о нем думаю, тем более я убеждаюсь в своих сомнениях относительно принципов общепринятой теории. Я желаю, чтобы эти сомнения были разъяснены и чтобы эта теория, будут ли в ней изменены некоторые принципы, или она будет сохранена такой, какая она есть, по меньшей мере излагалась бы впредь так, чтобы не было места туману». Даламбер предлагает следующее совершенно произвольное и необоснованное решение. Он считает, что если герб выпадет при первом бросании, то шансы на его выпадение при втором бросании будут -ί^ , а не 1/2. Если герб выпал при перовом и втором бросании, то шансы на его появление при третьем бросании будут +а~*~р и т. д. 151
Причем α, β,-—положительные числа, а их сумма меньше единицы. В заключение этого решения он пишет. «Этого достаточно, чтобы показать, что члены ставки, начиная с третьего бросания, уменьшаются. Мы доказали, что вся ста-вка, являющаяся суммой этих членов, конечна даже при предположении бесконечного числа требований. Таким образом, даваемый нами здесь результат решения петербургской задачи не подвержен неразрушимой трудности обычных решений». Любопытно, что к статье Даламбера «Отсутствующий» написал дополнение Дидро. Конечно, против основных принципов теории вероятностей выступал не только Даламбер. Вся история этой науки наполнена борьбой с ее извращениями, борьбой с неоправданными применениями ее к законам развития общества, борьбой за признание ее равноправной математической дисциплиной, борьбой с различными идеалистическими извращениями (см. [65]). § 8. Кондорсе Ж. А. Кондорсе (1743—1794 гг.)—политический деятель времен буржуазной революции во Франции, известен как социолог и экономист и менее известен как математик. Но он был избран в 1769 г. в члены Парижской Академии наук за свои математические работы. Наиболее крупной его работой по теории вероятностей является «Очерк применения анализа к вероятности решений, вынесенных по большинству голосов», опубликованный в 1785 г. в истории Королевской Парижской Академии наук за 1781—1784 гг. Эта работа состоит из «Предварительного рассуждения» и самого очерка, состоящего из пяти частей. В «Предварительном рассуждении» Кондорсе излагает основные результаты книги в форме, понятной не только для математиков, а также излагает основные принци- цы теории вероятностей. Задача первой части охарактеризована в ее начальных словах: «В первой части предполагается известной вероятность решения каждого голосующего и отыскивается вероятность решения, принятого по большинству голосов при разных условиях; в начале рассматривается только одно собрание, которое голосует только один раз 152
(предполагается, что одно и то же собрание производит голосование до тех пор, пока не получится требуемое большинство голосов), затем рассматривается решение в зависимости от суждения нескольких собраний, предположив, что выбирают только между двумя противоположными предложениями, или что выбирают из трех предложений, или, наконец, что выбирают или из нескольких людей, или из нескольких предметов, степень качеств которых нужно определить». Далее в этой части рассматриваются 11 гипотез. Ниже мы приведем некоторые из них. Первая гипотеза. Пусть будет 2q+\ избирателя, которые считаются одинаково способными к суждениям, ν — вероятность того, что голосующий решает правильно, е — что неправильно (ν и е — начальные буквы слов verite — истина и emeus — ошибка). Очевидно, v + e=l. Отыскивается вероятность того, что большинство голосующих будет за правильное решение вопроса, предложенного голосующим. Во второй гипотезе в тех же условиях требуется определить .вероятность определенного большинства голосов и т. п. Большое значение Кондорсе -придавал девятой гипотезе, о которой он пишет: «До сего времени мы ппелпо- лагали только один трибунал. Однако во многих странах одно и то же дело подлежит решению нескольких судов, или должно быть решено несколько раз одним и тем же судом, но согласно новым указаниям, пока не получится определенное число совпадающих решений. Это предположение подразделяется на несколько случаев, которые мы будем исследовать отдельно. В самом деле, можно требовать: 1) единогласия этих решений; 2) известного большинства или по абсолютной величине или по отношению к числу вынесенных решений; 3) определенного числа последовательно совпадающих решений». В этой гипотезе он исследует вероятность того, что решение, утвержденное судебными инстанциями, окажется правильным. Для этого он решает несколько задач, представляющих самостоятельный интерес. Задача. Известна вероятность наступления события при отдельном испытании. Требуется определить вероятность того,-что в г испытаниях событие наступит ρ раз подряд. 153
Этой задачей занимался ранее де Муавр [49, задача 74]. Задача. Найти вероятность, что при г испытаниях событие наступит ρ раз подряд раньше, чем оно не наступит ρ раз подряд. Задача. Определить вероятность того, что событие, уже появившееся в т + п опытах т раз, появится в следующих r+t опытах г раз. Кондорсе для искомой вероятности получил следующую формулу (т + я+1)1 (т + г)1 (* + /)! m\nl(m + n + r + i+i)\ Из этой формулы как следствие получается, что вероятность появления события при следующем испытании, если оно появилось при т предыдущих испытаниях, равна т+2 Этими задачами позже занимался Лаплас. В частности, относительно последнего вывода он пишет: «После того, как событие произошло подряд некоторое число раз, вероятность того, что оно произойдет еще следующий раз, равна этому числу, увеличенному на единицу, деленному на то же число, увеличенному на две единицы» [66, стр. 23]. Нелепость этого вывода очевидна. При т—\ получаем ρ=2/3. Если мы (производим испытание, в результате которого будет какой-нибудь исход, то из приведенного правила следует, что, повторив испытание, мы получим, что вероятность того же исхода равна 2/3. Например, в урне находится неизвестное количество занумерованных карточек. При первом извлечении появился номер 597, вероятность, что второй раз, после возвращения карточки в урну, мы вытянем тот же номер, по приведенному правилу будет 2/3. Это же повторится с любым номером, который мы вытянем первый раз. Современный математик Д. Пойа относительно этого правила пишет: «Посмотрим на него более конкретно. Припишем т числовое значение и не будем игнорировать повседневных ситуаций... В иностранном городе, где я едва понимал язык, я питался в ресторане с большими опасениями. Однако после 10 посещений ресторана я не 154
почувствовал никаких болезненных последствий и поэтому совершенно уверенно шел в ресторан одиннадцатый раз. Правило говорит, что вероятность того, что я не буду отравлен во время следующего посещения, равна 11/12. Мальчику 10 лет. Правило говорит, что, прожив 10 лет, он имеет вероятность 11/12 прожить еще один год. Дедушка этого мальчика достиг 70 лет. Правило говорит, что он имеет вероятность 71/72 прожить еще один год. Эти применения кажутся глупыми... Однако правило может превзойти и эту нелепость. Применим его к случаю т=0: вывод правила имеет такую же силу для этого случая, как и для всякого другого. Но для т = 0 правило утверждает, что любое предположение без какого бы то ни было подтверждения имеет вероятность 1/2. Каждый может придумать примеры, демонстрирующие чудовищность такого утверждения (кстати, оно и противоречиво)» [10, стр. 398]. Десятая гипотеза Кондорсе предполагает, что голосующие могут не только высказывать свое мнение, но и воздерживаться от принятия определенного решения. Одиннадцатая гипотеза связана с выбором одного из троих кандидатов. Во всех задачах первой части были известны три величины: число голосующих, требуемое большинство голосов и вероятность правильности каждого голоса. Во второй же части предполагаются известными две из этих величин и результат голосования. В этих предположениях решается ряд задач. Как мы уже видели, некоторые математики выдвигали идею морального ожидания и моральной достоверности. В частности, эти понятия отстаивал Бюффон. Кондорсе во второй части критикует положения Бюффона о моральной достоверности. Он пишет: «Это мнение неточно само по себе, так как оно направлено к смешению двух вещей совершенно различной природы — вероятности и достоверности; это точно так же, если бы мы смешивали асимптотику кривой с касательной, проведенной к очень удаленной точке. Подобного рода предположения не могут быть допущены в точных науках без разрушения их точности». В этой же части Кондорсе рассматривает математическое ожидание, ссылаясь при этом на работы Д. Бер- нулли. 155
Кондорсе так определяет задачу третьей части. «Она должна содержать исследование двух разных вопросов. В первом дело касается определения, согласно наблюдениям, вероятности решений суда или голоса каждого голосующего; второй касается определения степени необходимой вероятности, чтобы можно было поступать при различных обстоятельствах либо благоразумно, либо справедливо. Но легко видеть, что исследования этих двух вопросов требуют сперва установления общих принципов, согласно которым можно определять вероятность будущего или неизвестного события не на основании знания числа возможных сочетаний, к которым приводит это событие, или ему противоположное, но только на основании знания порядка известных или прошлых событий того же рода. Это и является предметом следующих задач». Третья часть содержит 13 задач. Приведем некоторые из них. Задача 1. Известно, что событие А наступило ш раз, а событие N — η раз. После этого предполагается, что одно из этих двух событий наступило. Отыскивается вероятность того, что это событие А (или событие Ν). Несомненный интерес представляет задача 5. Здесь в предположениях первой задачи требуется отыскать вероятность того, что: 1) вероятность А не будет меньше заданной величины; 2) эта вероятность будет отличаться от не более, чем на а\ 3) она будет отличаться от т + п —■ —■ не более, чем на а. Если вероятность А дана, т-\- η +2 требуется отыскать, каков предел а. Задача 7. Найти вероятность того, что А при q испытаниях наступит q—q' раз, а событие N наступит qr раз, в предположении, что А до этого наступило т раз, а N— η раз. О четвертой части Кондорсе говорит: «До сего времени мы рассматривали наш вопрос только абстрактно и делаемые нами общие предположения слишком удалялись от действительности. Эта часть предназначена развить метод, вводящий в .вычисление основные данные, которые нужно принимать во внимание, чтобы найденные результаты были применимы на практике». Четвертая часть разделяется на 6 вопросов, которые 156
посвящены способностям и честности голосующих. Кон- дорсе придает в этих вопросах большое значение единогласное™ решений. Во введении Кондорсе говорит о пятой части. «Предметом этой последней части является применение к некоторым примерам развитых нами принципов. Нужно было бы желать, чтобы это применение могло быть сделано на основании действительных данных, но трудности получить эти данные, трудности которых не мог надеяться преодолеть частный человек, принудили удовольствоваться применением теоретических принципов к простым предположениям, чтобы показать, по крайней мере, ход, которому могли бы следовать для действительного применения те, кто сумел бы получить действительные данные, долженствующие служить для этого применения». Далее рассматривается четыре примера. Первый пример рассматривает форму суда по гражданским делам, второй — по уголовным, третий пример касается способа выборов кандидатов на должности, четвертый — относится к вероятности правильности решения большого собрания. Для понимания того, как складывались основные понятия и принципы теории вероятностей, а также, в какие заблуждения попадали совсем не второстепенные математики своего времени, интересен «Мемуар об исчислении вероятностей» Кондорсе. Этот мемуар состоит из 6 частей. В первой части Кондорсе рассматривает «Петербургскую задачу». Во второй части, очень краткой (всего 8 стр.), обсуждается вопрос о применении теории вероятностей к астрономическим наблюдениям. Третья часть начинается следующими словами: «Уничтожение феодального строя оставило существовать в Европе большое число эвентуальных прав, которые можно свести в две основные группы; одни из них оплачиваются при переходе права собственности через продажу, а другие через наследование по прямой и боковой линиям, или только боковой линии». Эта часть работы Кондорсе посвящена установлению суммы, которую следует уплатить, чтобы освободить имущество от этих феодальных прав. Пятая часть — «О вероятности необычайных событий» и шестая — «Применение принципов предыдущей части к некоторым^вопросам критики» тесно связаны между собой. 157
В шестой части Кондорсе вначале останавливается на вероятности событий, указывая, что «не следует понимать под собственно вероятностью события отношение числа имеющих место сочетаний к общему числу сочетаний. Например, если из 10 карт извлекается одна карта и свидетель говорит мне, что это была именно эта карта, то собственно вероятность этого события, которую нужно сопоставить с вероятностью, рождающейся из свидетельства, не есть вероятность извлечь эту карту, которая будет 1/10, а вероятность извлечь эту карту предпочтительно, чем другую какую-либо определенную карту, и так как все эти вероятности одинаковы, то собственно вероятность будет в этом случае 1/2. Это различие является необходимым, и его достаточно для объяснения противоположности мнений двух групп философов. Одни одинаковые свидетельства могут производить для необычного события вероятность, равную той, которую они производят для обычного события, и что если, например, я верю здравомыслящему человеку, который сказал мне, что женщина родила мальчика, то я должен одинаково верить ему, если бы он сказал мне, что она родила четырех. Другие, напротив, убеждены, что свидетельства не сохраняют всю свою силу для необычных и мало вероятных событий, и они поражаются тому, что если извлекается один билет из 100 000 и человек достойный доверия говорит, что первый выигрыш выпал, например, на номер 256, но никто не усомнится в его свидетельстве, хотя можно заключать пари 99 999 против одного, что это событие не произойдет. Однако на основании предшествующего замечания видно, что во втором случае, собственно вероятность события будет 1/2 и свидетельство сохраняет всю свою силу, тогда как в первом случае, поскольку собственно вероятность является очень малой, то вероятность свидетельства будет почти ничтожной. Поэтому я предлагаю принимать за собственно вероятность события отношение числа сочетаний, производящих это или подобное событие, к общему числу сочетаний. Таким образом, в случае, когда извлекается одна из десяти карт, число сочетаний, при которых извлекается какая-либо определенная карта, есть единица, и число сочетаний, при которых будет извлечена какая-либо дру- 158
гая определенная карта, тоже есть единица, значит, собственно вероятность выразится через 1/2». После ряда примеров Кондорсе применяет свои рассуждения к достоверности некоторых положений из истории Рима. Считается, что продолжительность царствования семи императоров Рима составляет 257 лет. Проверив достоверность этого утверждения, Кондорсе приходит к выводу, что его собственно вероятность составляет 1/4. Для утверждения, что авгур, Акциус Нэвиус рассек ножом камень, он исчисляет собственно вероятность 2/1000000. Мы видим, что понятие собственно вероятности необоснованно. Его противопоставление понятию вероятности чисто субъективное и математически нечеткое. В науке оно не сохранилось. Его возникновение показывает, какими сложными путями вырабатывалось понятие вероятности. Вообще вся направленность работы Кондорсе оказалась в целом несостоятельной. Не имея четких представлений о применимости теории вероятностей и отыскивая возможные применения, Кондорсе пошел по ложному пути. Все попытки применить теорию вероятностей к устройству судов, решениям собраний и т. п., хотя еще довольно долго и продолжались после Кондорсе (и не им были начаты), временами привлекая к себе значительные усилия многих математиков, со временем были отвергнуты как не входящие в компетенцию теории вероятностей. Но из этого не следует, что все, что написано по этим вопросам, следует зачеркнуть и никогда к этим работам не возвращаться. Мы видим, что в ходе своих рассуждений Кондорсе иногда ставил конкретные математические задачи, которые были определенным вкладом в развитие теории вероятностей. § 9. Лаплас и его роль в теории вероятностей П. Лаплас (1749—1827 гг.) начал свою деятельность в 70-х годах XVIII в. В 1773 г. его избирают адъюнктом Парижской Академии наук, а с 1785 г. он — полноправный ее член: 159
Это были годы сложной обстановки кануна буржуазной революции. Деятельность Академии в какой-то мере отражала сложность политической ситуации. Хотя Академия продолжала оставаться в большой степени кастовой, замкнутой организацией она была вынуждена заниматься иногда вопросами, которые выдвигала революционная обстановка. 14 июля 1789 г. вооруженный народ взял Бастилию. Академия пыталась совсем не реагировать на начало революции. Она продолжала свою работу, делая вид, что ничего не произошло. Через 4 дня после взятия Бастилии Лаплас на очередном заседании Академии доложил новые результаты своих исследований о колебании плоскости земной орбиты. Но как ни пыталась Академия отгородиться от окружающей жизни, это невозможно было сделать. Внутри Академии стали все чаще слышаться голоса о перестройке устава Академии в сторону демократизации. В декабре 1789 г. была избрана комиссия для выработки проекта нового устава в составе Барда, Боссю, Кондорсе, Лапласа и Тилле, которая вскоре и представила такой проект. Но проект этот не удовлетворил даже достаточно реакционно настроенную Академию, которая нашла его не отвечающим новым идеям и политической обстановке. Многие члены Академии вступают в политическую борьбу и активно участвуют в ней. Единственное упоминание о деятельности Лапласа в этот период мы находим в связи с избранием его 8 мая 1790 г. в Метрическую комиссию. Но вскоре из состава этой комиссии Лаплас и Лавуазье были отозваны в связи с недостаточностью «республиканских добродетелей и слишком слабой ненависти к королям» [68, сир. 34]. В связи с нарастанием революции и увеличением опасности находиться в центре ее — в Париже — Лаплас весной 1793 г. переехал из Парижа в провинцию, в Мелен. На этом кончается первый период деятельности Лапласа. И нам кажется неверным мнение большинства пишущих о Лапласе, что он «увлекся политикой и показал себя в ней довольно неустойчивым. Вначале пылкий республиканец...» [69, стр. 366], что Лаплас принадлежит к тем ученым, которые стали «вначале на службу революции» [70, стр. 340]. 160
Лаплас предлагает убежище члену Парижской Академии наук, астроному Ж. С. Байи, который, скитаясь по Франции, избегает наказания за расстрел на Марсовом поле 17 июля 1791 г. Будучи в то время мэром Парижа, Байи дал приказ национальной гвардии открыть огонь по республиканской демонстрации. Когда Байи был уже по дороге к Лапласу, в Мелене расположилась дивизия революционных войск. Лаплас предупреждает об этом Байи, находящегося еще в пути. Но Байи все же приехал. Вскоре он был узнан одним из очевидцев расстрела, задержан в доме Лапласа и по постановлению Революционного трибунала гильотинирован. 20 апреля 1794 г. был казнен другой близкий Лапласу человек — Бошар де Сарон, 8 мая — Лавуазье. Над Францией нависла угроза интервенции. Такие известные ученые, как Л. Карно, Монж, Фурье, Фуркруа, Вандермонд и многие другие, отдавали все авои силы для защиты Франции. Лаплас же в это время отсиживался в провинции. С середины 1794 г. наступает буржуазная реакция. 27 июля 1794 г. казнили Робеспьера. Только теперь Лаплас вернулся в Париж. Он был приглашен преподавать в Нормальную школу, организованную декретом Конвента от 30 октября 1794 г. для подготовки препода,вателей. Свои лекции, читанные в 1795 г. под названием «Опыт философии теории вероятностей», он опубликовал в качестве введения ко второму изданию «Аналитической теории вероятностей» в 1814 г. (первое издание вышло в 1812 г.) К Но и до опубликования, в период чтения, эти лекции имели широкое распространение, так как записывались специальными стенографами и распространялись по всей Франции. В 1795 г. вместо упраздненной Академии был учрежден Национальный институт. Лаплас был назначен членом этого института и вскоре избран президентом подсекции математики. Членом института был также Наполеон, с которым Лаплас был в хороших, даже дружеских отношениях. Вначале Лаплас относился к Наполеону осторожно. И когда Наполеон отправился в африканский 1 Русский перевод под редакцией А. К. Власова сделан с издания 1820 г. 161
поход, Лаплас с ним не поехал, хотя Наполеон захватил с собой большую группу крупнейших ученых (Монж и др.). Но после переворота 18 брюмера (8 ноября 1799 г.), когда Наполеон разогнал Совет Пятисот и Директорию, Лаплас увидел в нем диктатора, предугадал «вершителя судеб Франции», монарха. Лаплас полностью стал поддерживать Наполеона. Вышедший в 1802 г. 4-й том «Небесной механики» Лаплас посвятил Наполеону — «умиротворителю Европы, которому Франция обязана своим процветанием и самой блестящей эпохой своей славы». После коронации Наполеона и провозглашения его императором (1804 г.) Лаплас писал ему: «Я хочу к приветствиям народа присоединить и свое приветствие императору Франции» [73, стр. 182]. Нужно напомнить, что многие ученые того времени были возмущены превращением Франции в империю и выражали свой протест в той или иной форме (Монж, Араго и др.). Лаплас полностью поддерживал Наполеона и в то время, когда «после победы реакции внутри страны контрреволюционная диктатура Наполеона превратила войны со стороны Франции из оборонительных в завоевательные» [74, стр. 190]. Но, несмотря на такие взаимные симпатии между Лапласом и Наполеоном, в 1814 г., когда положение Наполеона стало неустойчивым, Лаплас один из лервых его оставил. Понимая, что дело идет к реставрации королевской власти, Лаплас никак себя не проявлял в период «100 дней». Не успели Бурбоны водвориться на трон, как Лаплас приносит им присягу верности. Людовик XVIII осыпает его наградами. Лаплас, как убежденный монархист, выступает с речами в палате лэров. Когда Карл X ввел цензуру, Национальный институт выразил свой протест. Лаплас отказался председательствовать на собрании членов института, обсуждавших протест Карлу X; кроме того, Лаплас опубликовал^ специальное заявление о том, что он не принимал никакого участия в этом протесте. Политические взгляды Лапласа, если и менялись, то не очень сильно: он все время был монархистом, то считая конституционную форму правления во главе с просвещенным монархом самой лучшей формой правления, 162
то примыкая к ультрароялистам. В последние годы жизни Лаплас неоднократно проявлял себя как убежденный монархист. Поэтому вряд ли можно считать верным распространенное утверждение, что «политические умонастроения Лапласа менялись всегда в такт со всеми вариациями режима во Франции, начиная от Конвента и вплоть до Реставрации 1815 г.» (75, стр. 824]. Широко распространен в литературе якобы имевший место разговор Лапласа и Наполеона, в котором Лаплас заявил Наполеону, что он в гипотезе бога не нуждается. На самом деле такого разговора, по-видимому, никогда не было. Во время жизни Лапласа и несколько позже этот разговор приписывался и другим ученым. Однако известно, что, когда этот разговор еще при жизни Лапласа хотели поместить в печатавшемся сборнике биографий, Лаплас протестовал против этого. Рассмотрим теперь его общие методологические установки, которые, пожалуй, наиболее ярко изложены в его «Опыте философии теории вероятностей». В начале своего курса Лаплас останавливается на соотношении случайного и необходимого. Согласно воззрениям Лапласа, в природе существует лишь необходимость: «Кривая, описанная простою молекулою воздуха или пара, определена так же точно, как и орбиты планет: разницу меж ними делает только наше незнание». И далее: «Все явления, даже те, которые по своей незначительности как будто не зависят от великих законов природы, суть следствия столь же неизбежные этих законов, как обращение солнца» [66, стр. 8, 11]. Эту мысль он повторяет и в других работах. «Кривая, описанная легким атомом, который как бы случайно носится ветрами, направлена столь же точно, как и орбиты планет» [71, стр. 175]. Вот еще более категорическое заявление: «Ум, которому были бы известны для какого-либо данного момента все силы, одушевляющие природу, и относительное положение всех ее составных частей, если бы вдобавок он оказался достаточно обширным, чтобы подчинить эти данные анализу, обнял бы в одной формуле движение величайших тел вселенной наравне с движениями легчайших атомов: не осталось бы ничего, что было бы для него недостоверно, и будущее, так же, как и прошедшее, предстало-бы пред его взором» [66, сир. 9]. 163
Это ярко выраженная позиция детерминизма, который был тогда распространен. Лаплас рисует здесь «идеальное» состояние науки, но наука, которая пыталась бы объяснить и установить траекторию отдельной молекулы со всеми ее случайными отклонениями, «была бы уже,— пишет Энгельс,— не наукой, а простой игрой», и даже «случайность не объясняется здесь из необходимости, скорее, наоборот, необходимость низводится до порождения голой случайности» [5, стр. 175]. Изгоняя полностью случайность, Лаплас должен был определить вероятные события, не опираясь на случайность. Он считает те события вероятными, о которых мы не все знаем. «Факт... получает различную степень вероятия, смотря по обширности знаний [66, стр. 9]. Лаплас вводит чисто субъективный признак равновозможности событий, полагая, что два события равновозможны, если нет никакого основания считать наступление одного из них более возможным* чем наступление другого. Этот признак основан не на наших знаниях, а на отсутствии наших знаний. Считая, что о многих вещах и явлениях мы не все знаем, Лаплас предлагает применять теорию вероятностей ко всем вопросам естествознания и жизни общества. После такого введения он пишет: «Будем изменять лишь крайне осторожно наши учреждения и обычаи, к которым мы давно уже применились... Мы хорошо знаем по опыту прошлого неудобства, которые они представляют, но мы не знаем, как велико будет зло, которое может причинить их изменение... При такой неизвестности теория вероятностей предписывает избегать всякого изменения: особенно следует избегать внезапных изменений» [66, стр. 106J. Он выступает против суровых приговоров: «Мягкость судебных приговоров тем более вероятна, чем многочисленнее состав суда и просвещеннее судьи. Поэтому следовало бы, чтобы апелляционные суды удовлетворяли этим двум условиям» [66, стр. 127]. И далее звучит как насмешка разбор случая, когда в судебном процессе заняты 1001 судья. Необходимость многочисленного состава суда Лаплас основывал примерно на следующих соображениях. Предположим, что η судьям необходимо ответить относительно виновности подсудимого «да» или «нет». Если реше- 164
ние, принимаемое каждым судьей, независимо, то в данном случае был бы применим закон больших чисел в форме Бернулли и вопрос о виновности или невиновности подсудимого считался бы решенным правильно, если за него подано большинство голосов судей. Следовательно, если судебный трибунал состоит из достаточно большого числа судей и решает вопросы большинством голосов, то он практически не должен допускать ошибок в своих решениях. Эти рассуждения неоднократно подвергались критике. Например, по поводу них С. Н. Бернштейн пишет: «Здесь не принимается во внимание, что все судьи судят на основании тех же самых свидетельских показаний и вещественных доказательств, так что в простом деле все они более или менее одинаково разберутся, а если запутанные обстоятельства вводят в заблуждение одних, то и для других судей ошибка становится более вероятной, иначе говоря, в случае судебного приговора отсутствует условие независимости между суждениями отдельных судей, и это коренным образом изменяет положение вещей»^, стр. 179]. Многие высказывания, касающиеся общественной жизни, Лаплас необоснованно подкрепляет выводами из теории вероятностей, считая, что важнейшие вопросы любой области «не что иное, как задачи теории вероятностей» [66, стр. 7]. Лаплас признавал наличие внешнего материального мира, существующего вне и независимо от нашего сознания. Внешний мир, по Лапласу, мы познаем посредством наших органов чувств, критерием знаний является соответствие с наблюдениями. Лаплас считал, что явления и сущность не совпадают и что задача науки состоит в том, чтобы исправлять «иллюзии и обманы чувств, познавая истинные предметы в их обманчивых формах проявления» [71, стр. 5]. К сущ· ности необходимо идти через сравнение различных фактов между собой, явления необходимо рассматривать с различных точек зрения в их развитии, одних собранных фактов недостаточно, необходимо сравнивать, сопоставлять, производить опыты. «Если бы человек ограничивался собиранием фактов, наука была бы бесплодною номенклатурою» [71, стр. 54]. Но с точки зрения Лапласа познать сущность всех явлений невозможно. 165
Лаплас считал, что закон всемирного тяготения не только «представляет все небесные явления в их мельчайших подробностях», но и объясняет все или почти все явления природы: «твердость, кристаллизация, преломление света, возвышение и понижение жидкостей в волосных пространствах и вообще все химические соединения представляют результаты сил» 176, стр. 2], которые Лаплас называет частными притяжениями, считая их какими-то частными случаями закона всемирного тяготения. Относительно этого закона он писал: «Мы увидим, что этот великий закон природы представляет небесные явления вплоть до их самых малых деталей; что не имеется ни одного неравенства в их движении, которое не вытекало бы из него с точной изумительностью; что он неоднократно опережал наблюдения, раскрывая нам причину некоторых особенных движе· ний, о которых астрономы догадывались, но которые, в силу их сложности и чрезвычайной медленности, могли бы быть выведены из наблюдений через длинный ряд столетий. С помощью этого закона всякий эмпиризм совершенно изгнан из астрономии, которая является теперь обширной задачей механики» [75, стр. 733]. Лаплас поставил перед собой задачу показать, что в пределах солнечной системы природа подчинена единому закону всемирного тяготения. По Лапласу, не вся природа познаваема. Мы познаем только связи между отдельными явлениями, сводим причины всех явлений к некоторому небольшому числу конечных причин, которые являются совершенно непознаваемыми. Об этом он говорит неоднократно. «Мы можем дойти до общих явлений, от которых происходят все частные факты. Открытие этих великих явлений и приведение их к возможно меньшему числу должно составить предмет наших усилий» потому что начальные причины и внутренняя природа существ останутся нам вечно неизвестными» [76, стр. 7]. «Общность законов, представляемых небеснмми движениями, кажется, указывает на существование единственного начала» [71, стр. 174]. Да, кроме того, это «единственное начало» непознаваемо. Конечно, можно по всякому понимать это «непознаваемое единственное начало», но при любом его толковании эта точка зрения 166
не так уж далека от признания существования бога, что Лаплас и сделал в период после реставрации. Лаплас переносит законы механики в психологию, сводит чувства человека к механическим процессам. Он даже самой мысли придает вид простых механических колебаний. По Лапласу, «сложные идеи образуются из простых, как морской прилив образуется из частных приливов, вызываемых солнцем и луною» [66, стр. 185]. Основное научное наследие Лапласа относится к небесной механике. Но ему также принадлежат фундаментальные работы по математике и физике. Работы по теории вероятностей он начал публиковать с середины 70-х годов К В 1810 г. Лаплас получил в теории вероятностей важнейший результат, который теперь носит название теоремы Лапласа: так называемый биномиальный закон распределения вероятностей, при подходящей нормировке и неограниченном росте числа испытаний стремится к нормальному закону распределения. Только после этого в 1812 г. он издает свой классический труд «Аналитическая теория вероятностей» [142]. Этот труд дважды переиздается еще при жизни Лапласа (в 1814 г. и 1820 г.). В этой работе Лаплас изложил все основные свои результаты по теории вероятностей. Лаплас привел в систему существовавшие до него, часто разрозненные результаты, усовершенствовал методы доказательств, заложил основы для изучения всевозможных статистических закономерностей, успешно применял теорию вероятностей к учету ошибок наблюдений и т. п. Лаплас является крупнейшим ученым, сделавшим неоценимый вклад в развитие теории вероятностей. Из применения этой науки его также глубоко интересовали вопросы статистики населения. Об этом говорят не только соответствующие места из его основных сочинений ло теории вероятностей, но и специальные работы. Лаплас излагает свои взгляды на изменения состава количества населения; рассматривает вопрос о методах косвенного исчисления населения и об оценках точности 1 Первая его работа по теории вероятностей появилась в 1774 г. (Memoire sur ft'^probabilite des causes par les evenements; см. Oeuv- res completes, t. 8, 1891). 167
такого исчисления; разрабатывает теорию выборочных переписей и другие вопросы. В [66] Лаплас дает объяснения, как строятся таблицы смертности. Затем он вводит понятие средней продолжительности жизни; при этом он предполагает, что все умершие до одного года, живут в среднем шесть месяцев, до 2 лет — полтора года и т. д. «Таблица смертности представляет из себя, следовательно, таблицу вероятностей человеческой жизни. Отношение лиц, записанных рядом с каждым годом, к числу рождений есть вероятность, что новорожденное дитя доживает до этого года» [66, стр. 136]. Отметим, -что тот подсчет вероятностей, который здесь рекомендует Лаплас, не соответствует классическому определению вероятности, данному .Далласом, как отношения равновозможных случаев. Лаплас рассматривает вопрос о вычислении количества населения по таблицам смертности. Он говорит, что таблицы смертности справедливы только на определенное время и в определенном месте. Рассматривая разные причины, влияющие на смертность населения, Лаплас пишет: «В большей или меньшей степени здоровая почва, высота ее, ее температура, нравы жителей и мероприятия правительств имеют сильное влияние на смертность» [66, стр. 138]. Переходя к влиянию болезней на смертность, Лаплас останавливается на оспопрививании. Излагая спор Д. Бернулли и Даламбера по этому вопросу, Лаплас поддерживает Бернулли. При определении средней жизни для случаев, когда уничтожается какая-нибудь причина смертности, Лаплас рассуждает следующим образом [142]. Пусть N — общее число рождений, χ— рассматриваемый возраст, U — количество детей, которые из общего числа рождений остаются в живых через χ лет, при условии, что одна причина смертности уничтожена; и — число детей, достигших возраста χ при существовании этой причины, которую назовем В. Пусть ζΑχ — вероятность того, что человек, имеющий χ лет, умрет от β в небольшой промежуток времени Ах. uzAx — количество людей, которые из числа и умрут от болезни В в промежуток Δ*, если и велико. уАх — вероятность того, что человек в возрасте χ умрет от других причин за Δλ:; иуАх — количество людей, которые из числа и умрут от остальных причин за Ах. 168
Общая убыль людей за Ах будет:—Au=u(y+z)Ax. Аналогично — Δι/ = UyAx\ — — = у Ах\ Аи = иуАх -f uzAx\ у Αχ = ζ Αχ; и υ и ζ Xi υ и +ζ Если Δλ: мало, то приращение можно заменить дифференциалами X — = JL 4- zdx\ \nU = In и + \ zdx, при χ =0, U и J о л: 1*** Если бы г как функция от χ было известно, то мы по- лучили бы зависимость между U и и. Тогда легко можно было бы преобразовывать одну таблицу смертности в другую, предполагая, что некоторая причина смертности χ уничтожена. Но эта функция (ζ от х) не определена. \zdx о вычисляют приближенно следующим образом. uzAx — количество людей возраста х, умирающих в Δ* от В. Положим Δλ:, равным 1 году, ζ будет равно дроби, в которой числитель равен числу умерших от β в рассматриваемом году, а знаменатель равен числу детей, которые из числа N остаются в живых в середине толо же года. Так вычисляется и для каждого .возраста. Относительно увеличения средней продолжительности жизни на три года в связи с оспопрививанием Лаплас писал: «Столь значительное увеличение вызвало бы очень большое приращение населения, если бы, с другой стороны, это приращение не ограничивалось соответственно убылью средств существования» [66, стр. 141]. «Если почва, благодаря легкости разработки, может доставлять обильное пропитание новым поколениям, то уверенность в возможности прокормить многочисленную семью поощрйет браки и делает их более ранними и плодовитыми. На подобной почве население и рождение 169
должны оба возрастать в геометрической прогрессии» [66, стр. 141—142]. С 1745 г. в Париже в метрических книгах стали делать отметку о поле. С этого года до конца 1784 г. в Париже окрестили 393 386 мальчиков и 377 555 девочек: 393 386 _ 25 377 555 ^24* Говоря об отношении рождений мальчиков к рождениям девочек в различных странах Европы, Лаплас приходит к выводу, что «это отношение повсюду приблизительно равно отношению 22 к 21» [66, стр. 68]. Учитывая соответствующие наблюдения А. Гумбольдта в Америке, Лаплас пишет: «Он нашел между тропиками то же самое отношение рождений мальчиков к рождениям девочек, какое наблюдалось в Париже, что должно заставить рассматривать преобладание мужских рождений как общий закон для рода человеческого» [66, стр. 68—69]. Лаплас считает, что отношение 25/24, полученное для Парижа, отличается от 22/21, так как в парижских метрических книгах вписаны и дети из приютов, а в приют крестьяне отдают больше девочек, чем мальчиков. Далее Лаплас рассказывает о выборочном обследовании населения Франции, которое он произвел в 1802 г. Были собраны точные данные по 30 департаментам, расположенным по всей территории Франции. Перепись 23.IX 1802 г. дала 2 037 615 жителей. В течение трех лет (1800, 1801 и 1802 гг.) было рождений мальчиков 110 312, рождений девочек 105287; всего 215 599; смертей лиц мужского пола 103 659, лиц женского пола 99 443; браков лсло-7 Н0 312 22 46 037 3 ~ 46 037. ж — ; ж — . Отношение числа насе- 105 287 21 215 5591 14 ления к числу ежегодных рождений будет « ώ15 599 «28,352845. Приняв, что число рождений во Франции ежегодно равно 1000 000, Лаплас пришел к выводу, что население Франции составляет 28352 845 человек. Таким образом, из изложенного видно, что Лапласу принадлежит довольно большая роль в развитии статистики; в первую очередь эта роль оценивается применением теории вероятностей к демографии. 170
В «Аналитической теории» дано так называемое классическое определение вероятности: вероятность Ρ (А) события А равняется отношению числа возможных результатов испытания, благоприпятствую- щих событию Л, к числу всех возможных результатов испытания. В этом определении предполагается, что отдельные возможные результаты испытания равновероятны. Этому определению вероятности Лаплас придал субъективный смысл, введя принцип недостаточности или отсутствия оснований. Этот принцип состоит в том, что если вероятность события неизвестна, то мы для ее значения назначаем некоторое число, которое нам представляется разумным. В случае, если мы имеем несколько событий, которые составляют полную систему, но не знаем вероятности каждого события в отдельности, то мы считаем, что все эти события равновероятны. Лаплас, например, говорит, что если монета не симметрична и мы не знаем, какая сторона выпадает чаще, «то вероятность выпадения креста при первом бросании все еще будет 7а, потому что при нашем незнании стороны, которой благоприятствует это неравенство, вероятность простого события настолько же увеличивается, если это неравенство ей благоприятствует, насколько она уменьшается, если это .неравенство ей не благоприятствует». По поводу этого места Б. В. Гнеденко делает следующее замечание: «Понятно, что ни при первом, ни при втором и ни при каком бросании монеты нельзя говорить, что вероятность выпадения монеты равна половине; она попросту неизвестна. Определение же ее, оценку ее значения нужно производить не такими сомнительными средствами, отнимающими у самого понятия вероятности его объективную роль числовой характеристики определенных реальных явлений» [35, стр. 105]. Петербургскую задачу Лаплас решает с точки зрения нравственного ожидания. Обсуждая вопрос о нравственном ожидании, Лаплас говорит, что человек, лишенный всякого имущества, обладает чем-то, что равносильно некоторому капиталу. Ведь он не согласился бы взять единовременно незначительную сумму, с условием, чтобы, истратив ее, полностью отказаться от всяких средств к пропитанию. 171
Так как величина нравственного ожидания зависит от имеющегося капитала, то после разъяснения Лапласа совершенно неясно, как пользоваться этим понятием. Лаплас, конечно, не хотел дискредитировать понятие нравственного ожидания, но его несостоятельность становилась очевидной. Если рассматривать разложение (х+х2+х*+х4+х?+ +х6) «, то значение коэффициента xs равно числу случаев, которые дают при бросании η костей сумму очков, равную s. Лапласом этот метод расчета был превращен в метод производящих функций. Производящей функцией последовательности /о, fu —» /л,.·· называется функция 00 /(0 = s /^" = /о+/^+//+ ··· +fntn+ .... /г=о при этом предполагается, что степенной ряд сходится хотя бы для одного значения ί^=0. Последовательность /0, /ь—, fn может быть как числовая, так и функциональная. При этом в последнем случае производящая функция будет зависеть как от /, так и от аргументов функций f*. Лаплас решает задачу Бюффона и много других разнообразных задач. Рассмотрим некоторые из них. Задача найти число т розыгрышей французской лотереи, при котором вероятность выхода всех 90 номеров была бы 72- Лаплас нашел, что в этом случае т*=85,53. Далее он ищет формулу для определения числа розыгрышей, при которых вероятность выхода всех номеров лотереи равна определенному числу. Лаплас решает и общую задачу. Лотерея состоит из 5 номеров, при каждом ее розыгрыше выходит по η номеров. Спрашивается, как велика вероятность р, что в т розыгрышах лотереи все s номеров выйдут. Еще одна задача. Предположим, что при т+п наблюдениях, событие А повторилось т раз, а противоположное ему событие В — η раз (т>п). Какова вероятность того, что вероятность появления события А ^больше веро- * Производящие функции применяются не только в теории вероятностей, они нашли применение в алгебре и других разделах математики. 172
ятности появления В. Лаплас для этой вероятности получает выражение 1-2--W [ μ μ μ—1 m m-1 (У2)*~2 | _ ι» m-1 ^ 1 (У,)»-""! μ μ—1 μ~2 """ μ μ— 1 μ —m+1 μ —m J* где μ=/η+η+,1. Затем решается вопрос, как велика вероятность, что событие, которое наблюдалось т раз подряд, повторится при k следующих наблюдениях (ρ = m+—). V m + Λ+ 11 Выше мы уже указывали <на несостоятельность этих расчетов. У Лапласа мы снова встречаем задачу о разделении ставки [142, стр. 22]: А и В играют до s выигранных партий. Игра прерывается, когда А выиграл ρ партий, а В — q. Как справедливо разделить ставку? Естественно, что ставку нужно делить пропорционально вероятностям А и В получить весь выигрыш. Лаплас находит вероятность выигрыша для Л, которая является функцией от V=s—ρ и W=s—q. f<y> щ = (ν/ [ι+ν. ν,+^^t^w + ... V(V+i) ... (V + W^-2) x .ur-il '" "*" (IT—1)1 W2) J" Вероятность выигрыша для В будет l—f(V, W). Лаплас поставил задачу: найти наилучшую комбинацию наблюдений для определения неизвестной величины при условии, что положительные и отрицательные ошибки равновероятны и число их неограниченно большое. Не делая никаких предположений относительно закона распределения ошибок, Лаплас нашел, что способ наименьших квадратов дает наилучшую комбинацию наблюдений. Лаплас дал новое доказательство теоремы Я. Бер- нулли. Он находит асимптотическую формулу для вероятности суммы независимых случайных величин, каждая из которых может принимать лишь все целочисленные 173
значения между —а и +а, используя при этом фактически элементы теории характеристических функций. Фундаментальный труд Лапласа содержит очень большое число различных задач. Все эти задачи и приложения имеют большое значение в теории вероятностей. Но центральным местом всей книги, да и всего творчества Лапласа в области теории вероятностей, было доказательство одной из важнейшей предельной теоремы теории вероятностей. Эта теорема относится к распределению отклонений частоты появления события при независимых испытаниях от его вероятности. Эта теорема сейчас называется теоремой Лапласа. Один ее частный случай, как было указано выше, был известен уже Муав- ру (для р = 7г). Теорема Лапласа состоит в следующем 1#. пусть при каждом из η независимых испытаний вероятность появления некоторого события Ε равна р(0<р<1) и пусть т обозначает число испытаний, в которых событие Ε фактически наступает; тогда вероятность неравенства г1<-^^-<г2(<7 = 1-Р) Упрд при достаточно большом числе испытаний η сколь угодно мало отличается от —з^-V е dz. У2л J Это утверждение еще называют интегральной теоремой Лапласа. Вероятность точно т появлений события Ε при η испытаниях приближенно равна У 2nnpq где т — пр Ynpq Это последнее утверждение иногда называют локальной теоремой Лапласа. Теорема Лапласа применяется на практике, начиная с η порядка нескольких десятков. Получаемые при этом погрешности достаточно малы. 1 Иногда эту теорему называют теоремой Муавра — Лапласа. 174
Лаплас придавал своей теореме большое значение. Он считал, что открытый закон полностью объясняет поведение случайных массовых ансамблей, к которым он относил большинство явлений. Лаплас считал, что предложенная им схема почти всеобъемлющая. Схема состояла в следующем. Имеется большое число величин, изменяющихся случайным образом, но законы этих изменений нам неизвестны. Тогда оказывается, что результирующая этих случайных величин в ее колебаниях вокруг среднего значения подчиняется одному закону. Этот закон А. Пуанкаре назвал нормальным законом. Только после работ Лапласа стало возможным широкое применение научно обоснованных методов в теории вероятностей. Но при трактовке своих работ Лаплас иногда впадает в ошибки. Основная ошибка Лапласа <в теории вероятностей состоит в том, что, считая историю человеческого общества областью, в которой всецело господствует слепой случай, он предполагает, что теория вероятностей является той наукой, которая исчерпывающе объяснит эту историю, и поэтому анализом общественных явлений должна заниматься теория вероятностей. Лаплас считает, что все закономерности любой области массовых явлений полностью сводятся, возможно, к одному нормальному закону, так же как небесные явления сводятся к одному закону всемирного тяготения. Исходя из этой точки зрения, он пытается применить теорию вероятностей к судебным процессам, к решениям собраний и т. п. Подобное необоснованное и ошибочное распространение применений теории вероятностей оказало отрицательное влияние на развитие науки. Современный немецкий историк математики К. Бирман отмечает, что Лаплас в теории вероятностей «затмил всех своих предшественников. Одновременно с этим мы должны констатировать распространенную переоценку по отношению к нему» [8]. §10. Распределение случайных ошибок При любом измерении возникают случайные ошибки. Над вопросом о том, как их избежать или учесть, ученые работали*оч£нь давно. Но только с привлечением теории вероятностей эту проблему можно было решить удовлет- 175
ворительно. Она была рассмотрена с достаточной полнотой в начале XIX в. Два математика, независимо друг от друга, почти одновременно получили один и тот же основной результат, состоящий в выводе нормального закона распределения случайных ошибок. Один из этих математиков — великий немецкий ученый К. Ф. Гаусс (1777—1855 гг.), другой — малоизвестный математик из Америки Р. Эд- рейн (1775—1843 гг.). К своему результату они пришли разными путями. Эдрейн решал частную задачу и в виде ее обобщения получил распределение случайных ошибок. Гаусс разрабатывал теорию ошибок измерений, и нормальное распределение случайных ошибок было необходимой и одной из важнейших частей этой теории. Вывод закона распределения случайных ошибок измерений у Гаусса был не только итогом, но и основой дальнейшей разработки теории ошибок. И хотя Эдрейн опубликовал свою работу несколько ранее Гаусса, их роль в выводе этого закона различна. Работа Эдрейна была опубликована в 1808 г. [77]. В этой статье наибольший интерес представляют два вывода нормального закона распределение случайных ошибок измерений. Пусть АВ — истинное значение измеряемой величины, например некоторой длины. Измеренное значение этой величины пусть будет АЬу а погрешность ЬВ (рис. 8). А о β I . 1 1 Рис. 8 Пусть АВ, ВС...— несколько последовательных расстояний, измеренные значения которых Ab, be. Полная ошибка будет сС. Пусть Aby be, cC даны (рис. 9). Принимается как очевидное, что погрешности в измерении АВ, ВС пропорциональны их длинам. Введем обозначения: Ab = a, bc=b, Сс=с; погрешности измерения АЬ обозначим через ху погрешности измерения be — через у. Тогда для наибольшей вероятности получаем уравнение х/а=у/Ь. Пусть X и У будут вероятности того, что в расстояниях а и b имеются погрешности χ и у. Вероятность совместного осуществления этих погрешностей будет ΧΥ. 176
Необходимо найти X и У при условии, что вероятность XY максимальна. Введем обозначения: f(x) = \r\X; φ(ι/)=1ηΥ. Тогда максимуму ΧΥ соответствует !(х) + ц>(у)=тах. Продифференцируем последнее соотношение1. Г (*) *' + Ф' (У) УГ =0; f (х) *' = - φ' {у) у'. Но для наибольшей вероятности x+# = const и х'+у'=0; я'=—у'. Разделим полученные уравнения друг на друга: А д В С ι ι ι j ι Рис. 9 Υ (х) — ф' (У) · Это уравнение должно быть эквивалентно xfa—yfb. В простейшей форме это выполняется, если /■(*)-«; φ'ДО -SL. а а Рассмотрим первое соотношение: /'(*) = —; а df(x) = ^Ldx; Uf(x) = [^-dx; f(x) = al + ^; a j J a la . mx* f(x) = \nX=a1 + ^-; X = ? ** la ι mX* r^ * Функция *j _ a*+ it названа Эдреином «общим уравнением кривой вероятностей» [77, стр. 94]. Далее доказывается, что т<0 [77, стр. 95]. В этой же статье Эдрейн дает второй вывод закона распределений случайных ошибок измерений. В этом выводе он рассматривает измерение отрезка АВ с погрешностями как по длине, так и по азимуту. Эдрейн 1 Эдрейн нигде не говорит, по какому переменному он дифференцирует. Более того, он не останавливается даже на вопросе, что является аргументом его функций. Все это, конечно, является недостатком его работы. 177
предполагает, что геометрическое место равной вероятности положения · точки В, определенной измерениями длины и азимута АВ, должно представлять собой простейшую фигуру, т. е. это должна быть окружность с центром в точке В. В этих условиях он приходит к выводу, что вероятности погрешностей соответственно равны ес+пх*/2 иес+пу*/г^ где х и у есть соответствующие ошибки: Вт~х, тп=у, c=const (рис. 10)К А Рис. 10 В статье Эдрейна, кроме этого, содержится вывод принципа наименьших квадратов и принципа среднего арифметического, определение вероятнейшего положения судна и другие задачи [78]. К. Ф. Гаусс опубликовал свой вывод нормального закона распределения случайных ошибок наблюдений в 1809 г. в работе «Теория движения» [80]. Занятия астрономией и геодезией привели его к разработке методов обработки результатов наблюдений. В астрономии и геодезии производятся многочисленные измерения в различных местах, различными инструментами, различными наблюдателями. Результаты этих измерений подвержены влиянию ошибок. Поэтому возникает проблема установления наиболее вероятного значения искомой величины. Эти вопросы привели Гаусса к созданию теории ошибок измерений, которая непосредственно связана с идеями и понятиями теории вероятностей. И. М. Виноградов говорил, что «обширные приближенные вычисления, которые приходилось практически производить лично Гауссу при решении задач, относящихся к астрономии и к геодезии, привели его к более глубокой разработке способа наименьших квадратов и к 1 По этому вопросу см. подробнее [78, 140]. 178
выяснению центрального значения нормальной кривой распределения в вопросах, связанных с теорией вероятностей» [79, стр. 9]. Наряду с необыкновенно широким диапазоном творчества характерной особенностью исследований Гаусса является глубокая связь между теоретическими и прикладными вопросами. Общие математические идеи у него часто появлялись в результате решения конкретных задач. Это относится к к вопросам теории вероятностей. Хотя работы Гаусса по теории вероятностей были связаны с приложениями, но они не ограничивались только ими. Работы Гаусса сыграли значительную роль в развитии ряда разделов теории вероятностей. Так, например, теория ошибок наблюдений, разработанная Гауссом, потребовала выяснения условий применимости нормального закона распределения. После работ Гаусса встала задача оценки параметров нормального закона распределения. Гаусс обосновал способ наименьших квадратов с помощью теории вероятностей, приняв за аксиому начало арифметической середины. Первой работой Гаусса, имеющей отношение к теории вероятностей, была «Теория движения небесных тел, обращающихся около Солнца по коническим сечениям» (1809 г.). В последней части работы «Определение орбиты, возможно точно удовлетворяющей любому числу наблюдений» Гаусс впервые изложил теорию ошибок наблюдений. К этой части примыкают две другие работы: «Исследование об эллиптических элементах. Паллады на основании противостояний 1803, 1804, 1805, 1807,1808,1809 го- дов» и «Определение точности наблюдений» (1816 г.). Эти работы были обобщены и дополнены в труде «Теория комбинации наблюдений, подверженных наименьшим ошибкам» (1823 г.). В 1828 г. выходит «Дополнение к теории комбинации наблюдений, подверженных наименьшим ошибкам». В 1845—1851 гг. Гаусс написал «Приложение теории вероятностей для определения баланса вдовьих касс» и рассчитал «Таблицы для определения значений времени однократной прожиточной ренты и связанной ренты» 1. 1 Все эти работы теперь опубликованы в [8Θ]. 179
Большое значение для теории вероятностей имеют также его заметки и письма. В XVIII в. стала актуальной задача о наиболее целесообразном сочетании результатов измерений для получения надежных результатов. Еще Тихо де Браге в 80-х годах XVI в. для устранения ошибок производил наблюдения одного и того же объекта в видоизмененных условиях и, комбинируя эти наблюдения, стремился избавиться от случайных ошибок. Эта проблема всегда интересовала исследователей. А. Лежандр в работе «Новые методы для определения орбит комет», в приложении «О методе наименьших квадратов» предложил метод наименьших квадратов. Он писал: «Из всех принципов, которые можно предложить для этой цели, не существует более простого, чем тот, которым мы пользовались в предыдущем изложении: он состоит в том, чтобы обратить в минимум сумму квадратов погрешностей». Лежандр четко и ясно сформулировал основные принципы и правила этого способа. «Когда все условия задачи выражены соответствующим образом, следует так определять коэффициенты, чтобы ошибки были возможно меньше. Метод, который кажется мне наиболее подходящим для этой цели, состоит в том, чтобы приводить сумму квадратов ошибок к минимуму. При этом получается ровно столько же уравнений, сколько имеется неизвестных... Способ, который я называю способом наименьших квадратов, сможет, вероятно, принести большую пользу во всех вопросах физики и астрономии, где требуется получить из наблюдений возможно более точные результаты» {80, стр. 7—8]. Гаусс впервые изложил метод наименьших квадратов в работе 1809 г. Но он пишет: «Впрочем, наш принцип, которым мы пользуемся с 1795 г., еще недавно был изложен известным Лежандром в его труде «Nouvelles methodes pour la determination des orbites des cometes, Paris, 1806» («Новые способы определения орбит комет») [80, стр. 104]. Эту же дату, 1795 г., Гаусс указывает и в письме к Лапласу от 30.1.1812 г. Гаусс неоднократно возвращается к этому вопросу. Так, например, в письме к Ольберсу он пишет: «Принцип, которым я пользуюсь с 1794 г., а именно, для того, чтобы наилучшим образом представить несколько величин, которым нельзя дать точных знаний, нужно приве- 180
сти к минимуму сумму квадратов ошибок; применяется также и в работе Лежандра и излагается в ней весьма основательно» {80, стр. 8]. Гаусс указывает две даты: 1794 г. и 1795 г. Современные исследователи склонны считать, что верная дата — это 1794 г. В начале работы Гаусс делает ряд общих интересных замечаний. «Так как в действительности все наши измерения и наблюдения представляют собой только приближения к истине, и то же самое можно предполагать о всех основанных на них вычислениях, то окончательную цель этих вычислений сложных явлений следует видеть в том, чтобы возможно ближе подойти к истине. Этого можно достигнуть только целесообразной комбинацией большого числа наблюдений, что обязательно требуется для определения неизвестных величин» [80, стр. 89]. Далее он пишет о том, чтобы результаты выводились не из отдельных наблюдений, а из комбинированных, так, чтобы случайные ошибки по возможности уничтожались. После этого Гаусс рассматривает следующую задачу. При равноточных измерениях некоторой величины случайные ошибки имеют дифференциальную плотность распределения вероятностей φ(Δ). Требуется определить φ(Δ), если наиболее вероятное значение измеряемой величины равно среднему арифметическому из наблюдаемых значений. Приведем слова Гаусса. «Предположим..., что нет никаких оснований считать, почему бы одно наблюдение было менее точным, чем другое, и что одинаковые по величине ошибки у отдельных наблюдений следует принимать за равновероятные. Итак, вероятность, приписываемая любой ошибке Δ, выразится функцией от Δ, которую мы будем обозначать φ(Δ)... Мы можем утверждать, что ее максимум получится, когда Δ = 0, и что в большинстве случаев она одинакова для равных противоположных по знаку значений Δ. φ(Δ) должна быть составлена так, чтобы от значения Δ = 0 в обе стороны она асимптотически приближалась к нулю» [80, стр. 83]. В этих предположениях Гаусс прихо- h -λ*δ· дит к выводу: φ(Δ)— ~pze . Величину h Гаусс рас- уп сматривает как меру точности наблюдений. 181
Гаусс ш качестве следствия вывел утверждение о том, что плотность вероятности данной совокупности наблюдений достигает максимального значения при условии, что сумма квадратов уклонений наблюдаемых значений от истинного значения измеряемой величины обращается в минимум. Этот же принцип распространен и на неравноточные наблюдения. Гаусс считает, что этот принцип должен считаться аксиомой, так же как должно считаться за аксиому и то, что среднее арифметическое из многих наблюденных значений одной и той же величины принимается за наиболее вероятное ее значение. Получив нормальный закон распределения случайных / h —л· а» \ ошибок! φ(Δ)— Tzze J, Гаусс указывает на недостаток, которым, с его точки зрения, обладает этот закон. В соответствии с этим законом возможны в принципе погрешности любой величины. «Полученная таким образом функция, очевидно, не может со всей строгостью выразить вероятности ошибок. Так как возможные ошибки всегда заключаются в известных пределах, то вероятность более крупной ошибки (лежащей вне этих пределов) всегда должна равняться нулю, а между тем наша формула всегда дает некоторое конечное число» [80, стр. 96]. Следует иметь в виду, что Гаусс при выводе нормального распределения существенно использовал принцип среднего арифметического, который он формулировал следующим образом: «Конечно, как аксиома должна быть принята гипотеза: если какая-нибудь величина будет определена из многих непосредственных наблюдений, произведенных при одинаковых обстоятельствах и с одинаковой тщательностью, то среднее арифметическое из всех наблюдавшихся значений окажется наиболее вероятным значением, если и не абсолютно точно, то по крайней мере очень близко к этому, так что всегда будет наиболее надежным придерживаться именно такого значения». Эта аксиома привлекла к себе большое внимание. Ряд авторов старался ее доказать, сведя к другим, на их взгляд, более простым положением. Обзор таких доказательств приведен в [158]. Нормальный закон длительно· время считался универсальным, и это задержало появление количественных 182
критериев отбраковки измерений, так как этот закон допускает возможность погрешностей любой величины, что привело к убеждению в необходимости удерживать результаты всех измерений, ничего не отбрасывая. Это мнение господствовало до середины XIX в., когда стали появляться первые вероятностные критерии отбраковки измерений. В мемуаре «Определение точности наблюдений» рассматривается оценка h по результатам наблюдений. Гаусс вводит в рассмотрение функцию θ(/) — = —г: \ е dt и приводит небольшую таблицу значений О этой функции. Он вводит для аргумента ty при котором 0(0=0,5, обозначение ρ (т. е. θ (ρ) =0,5), причем р= = 0,4769363. Величину р/Л=г он назвал вероятной ошибкой для функции θ (ht). В начале § 3 этой работы приводится формулировка задачи: «Допустим теперь, что при т действительно произведенных наблюдениях получились ошибки α, β, γ, δ,..., и исследуем, какие тогда можно вывести заключения относительно значений h и г» [80, стр. 122]. Считая наблюдения независимыми, Гаусс нашел, что плотность распределения системы наблюдений, полученных из опыта, будет у=Стк»>е-н'{аШ+*'+у*+-\ где Ст -const. Установим при каком значении ft достигает максимума у. у' = Ст [mh^e-^^*^ + ^Wf^..) x х(-2Л)(е# + р + т1+ ...)] = = Cmhm-у^«ч*ч-*+...> [т _2Л» (а« + β» + γ* + ·. .)]· При у' =0, ft =0, что дает 1/=0и/п — 2ftf (α* + β* + Τ* + + ...) =0, откуда h = у . Легко показать, что при этом значении ft, у достигает максимума. 183
Следовательно, наиболее вероятное значение г будет _р_ h _ /_ m_ 2(α« + β» + γ· + ...) 7: V 2(α* + β2 + γ2 + .-.) m Далее в этой работе Гаусс подсчитывает наиболее вероятные значения сумм л-ых степеней ошибок наблюдений и оценивает при помощи этих сумм неизвестные значения Лиг. Наиболее полное изложение теории ошибок содержится в работе Гаусса «Теория комбинаций наблюдений, подверженных наименьшим ошибкам». Гаусс пишет, что на измерения всегда влияют различные ошибки, как бы тщательно ни производились наблюдения. Одни из них имеют случайный характер, другие ошибки можно предвидеть и рассчитать, так как они или постоянны, или изменяются закономерным образом. Эти ошибки впоследствии получили название систематических. Гаусс отмечает, что деление ошибок на эти два вида условно и во многом зависит от поставленных задач. Работа Гаусса посвящена изучению закономерностей, которым подчинено распределение случайных ошибок. Гаусс исходит из самых общих предположений относительно плотности распределения вероятностей ошибок φ (я). «Положительные и отрицательные ошибки одной и той же величины бывают одинаково часто, так что φ(—я)=ф(л;). Далее малые ошибки встречаются чаще, чем крупные; так что значение <р(х) будет максимальным при я=0 и постоянно уменьшаться с непрерывным возрастанием л:... Очевидно, что значение интеграла \ в пределах от #=—оо до #=+оо всегда равно единице» [80, стр. 19]. Основная задача, которую рассматривает Гаусс, фактически состоит в следующем. Пусть переменные у, Х\, х% ... Χσ связаны однородной линейной зависи- σ мостью: f/=aiXi+a2#2+... +ασχσ или у= у asxs, при- S—1 чем as неизвестны. 164
Для их определения из опыта находятся значения У1 = а1х11 + а2хп+ ... +ασχοι, #2=^*12+02*22+ ··· +βσ*σ2, УМ = ΟχΧχΝ + <hx*N + · · · + uaXaN, или в сокращенной форме: σ 0r = 2 0s*sr; Г =1,2, ..., ЛГ. S=*l Экспериментальное определение */г приводит к некоторым ошибкам. В результате этого вместо уг получаем ηΓ = уг + + ΔΓ. По заданным χν и полученным ηΓ требуется определить наилучшие приближенные значения as величин as. По Гауссу, as необходимо определять из условия [% — (αι*η + «2*21 + ·■· +ασ*σι)]2 + + h2 — («1*12+^2*22+ ··· +«σ*σ2)]2+ ... •.. + ΙΆν — (α^ΧιΝ + α2Χ2Ν + ... + ασ*σ;ν)] = min. Или в общем виде: S (чг-2<**хЛ -min. (ШЛО) as однозначно находятся из системы уравнений, которые получаются из приведенного условия и называются нормальными уравнениями. Эти уравнения имеют вид: αι(*ιι*η + *12*12 + *13*13+ ··· +*itf*itf) + + a2(*21*ll + *22*12.+ ··· + Χ%ΝΧ\ν) + ··· ... + «σ (*σι*ιι + *σ2*ΐ2 + ··· + **#*!#) =* = ЛЛ1 + η2*ΐ2 + ··· +ΆνΧιΝ\ αΐ (*11*21 + *12*22 + ··· + *ltf*2tf) + + «2 (*21*21 + *22*22 + ··· + *2tf*2/v) + · ·· ... +аа(ха1ХШ1+Ха9Хп+ ... + *atf*2tf) = = ΉΛΐ + ^2*22 + · · · + r\NX2N\ Οχ(*ΐΐ*σι + *ΐ2*σ2+ ··· + *itf*atf) + + α2(*2ΐ*σι + *22*σ2+ ... + Χ2ΝΧσΝ) + ··. . · · *-i-J&a (*σι*σι + *σ2*σ2 + . . . + ΧσΝΧσκ) = = ηχ*σι + η2*σ2 + ··· +*\ΝΧοΝ- 185
Систему нормальных уравнений можно записать так: σ Ν Ν 2 α· 2x%rXir — ΣΆίΧΐη' -1»'»· · ·»*· Выражение (ШЛО) достигает минимума, который равен нулю в случае, если каждая квадратная скобка в отдельности равна нулю, т. е. агхп + α2*η + ... + «σ^σι = ι\ν Ol*iW + G>iX%N + · · · + &σΧσΝ = Ήλτ. Эти равенства удовлетворяют системе нормальных уравнений. Полученные приближения не содержат систематической ошибки, т. е. математическое ожидание а/ равно искомой величине а/. Результаты Гаусса по теории ошибок измерений излагаются и сейчас почти без изменений в большинстве учебников. В IV томе собраний сочинений Гаусса опубликованы также отдельные замечания, относящиеся к теории вероятностей. Отметим только Задачу Гаусса в его письме к Лапласу от 30.1.1812 г. Она послужила одним из отправных пунктов развития метрической теории чисел. Пусть Μ — неизвестная величина, .заключенная между 0 и 1, для которой все значения или одинаково вероятны, или же более или менее следуют данному закону; предположим, ч>го она разложена в непрерывную дробь 1 Μ »■+ ■ Чему равна вероятность того, что после того, как мы отбросим в разложении конечное число членов до ώη\ дробь 1 . . а(«-И) j i «<«+*> + ... будет заключена в пределах между 0 и х? 186
Несмотря на то, что теория вероятностей не находи* лась в центре научных интересов Гаусса, он обогатил ее многочисленными крупными результатами. Идеи Гаусса находят применение и дальнейшее развитие в ряде разделов теории вероятностей (см. [79]). § 11. Состояние теории вероятностей в Европе перед появлением русской (Петербургской] школы Развитие теории вероятностей в первой половине XIX в. проходило в столкновении противоречий. Ярким свидетельством этому является творчество Лапласа. Так же было противоречиво и творчество Пуассона. Математическое наследие Пуассона (1781—1840 гг.) очень обширно. К теории вероятностей относятся следующие его работы: «О вероятности средних результатов наблюдений» (1827 г.); «Продолжение мемуара о вероятности средних результатов наблюдений» (1832 г.); «О преимуществах банкомета при игре в фараон»; «О вероятности рождений мальчиков и девочек» и некоторые другие. Все эти работы в какой-то мере вошли в основную работу Пуассона по теории вероятностей: «Исследования о вероятности судебных приговоров по уголовным и гражданским делам» [81]. В этой работе содержится и его известная теорема. В своей книге Пуассон дает краткий очерк того, что уже было сделано в теории вероятностей. Он уделяет большое внимание работам Кондорсе и Лапласа о нравственной вероятности. Пуассон утверждает, что аналитическая теория вероятностей применима к оценке правильности решений судов. Он ставит перед собой задачу определения вероятности ошибок в решении судов и считает, что теорема Я. Бернулли не дает математического основания для такого применения. Чтобы создать такую основу,* Пуассон занялся предельными предложениями теории вероятностей. В результате он доказал свою знаменитую теорему, которой дал название «закон больших чисел». Теорема Пуассона говорит о следующем. Если производится ή независимых испытаний, результатами 187
которых является наступление или ненаступление события Л, причем вероятность наступления события в отдельных испытаниях неодинакова, то с вероятностью, сколь угодно близкой к единице (или, другими словами,— к достоверности), можно утверждать, что частота mln наступления события А будет сколь угодно мало отличаться от средней арифметической ρ вероятностей наступления события в отдельных испытаниях; теперь эту теорему записывают так: ϋ(|7-*|<·)-'· Если же вероятность наступления события не будет изменяться от испытания к испытанию, то р—р, и теорема Пуассона в этом случае переходит в теорему Я. Бер- нулли, которая, таким образом, является частным случаем теоремы Пуассона. Все явления как морального, так и физического порядка, по Пуассону, подчинены этому универсальному закону. Он рассматривал эту теорему не только как математическую, но и как философскую. Она служила основанием для его исследований о верности решений судов и применительно к явлениям нравственного порядка. Он считает, что при помощи своего принципа он может найти вероятность любого человеческого решения, независимо от того, какие мотивы привели к этому решению. В его работе имеются формулы, выведенные из анализа очень большого числа прошлых решений, которые выражают «точную вероятность» для каждого гражданина быть в будущем (при действии одного и того же законодательства) обвиненным, осужденным или оправданным. В этой книге Пуассон получил и так называемый закон малых чисел. Чем больше значение ρ отличается от 72, тем хуже результат асимптотического представления Рт,пЪ виде 1 —х*/% Т7^е · Для того чтобы в этом случае теорема Лапласа давала результат с незначительной ошибкой, необходимо увеличить число испытаний п, что не всегда удобно и возможно. Таким образом, возникает задача отыскания асимптотической формулы, которая была бы спе- 188
циально приспособлена для малых ρ (или малых #=1—/?; эти случаи сводятся один к другому). Эта задача была решена в книге Пуассона (81]. Он нашел, что если ρ η—*0 при /г-*оо, то вероятность того, что событие появится т раз, стремится к ρ —- ?l_р~% где λ=ηρη. Эта формула Пуассона может использоваться в качестве приближенного выражения для Ртп при постоянном, но малом ρ и большом п. Польский статистик Л. Борткевич в конце XIX в. назвал распределение Пуассона законом малых чисел. Борткевич применял формулу Пуассона к очень редко встречающимся явлениям: смерть от удара копытом лошади, рождение троен и т. п. Книгу Пуассона поддержали в первую очередь математики, которые считали естественным применять теорию вероятностей к законодательству, юриспруденции, политическим и экономическим наукам. Но это мнение не было единодушным. Ряд математиков выступил резко против такого применения. Они обвинили Пуассона и его последователей в компрометировании самой математики. В споре доходили до утверждения, что положения Пуассона ложны. Эта критика распространилась такж'е и на Лапласа. Характеризуя состояние теории вероятностей в этот период, Б. В. Гнеденко пишет, что несмотря на то, что Лаплас и Пуассон завершили большой и плодотворный начальный период развития теории вероятностей, период философского осмысливания первичных понятий этой науки. «Этот период привел на Западе к более чем холодному отношению к теории вероятностей и к настоящему отрицанию возможности посредством ее методов изучать явления природы. Для теории вероятностей на Западе наступил долгий период застоя» (82, стр. 394]. Характерна в этом отношении деятельность бельгийского статистика А. Кетле (1796—1874 гг.). Находясь в Париже в 1823—1824 гг., Кетле познакомился с Лапласом, слушал его лекции по теории вероятностей. 189
Работы Кетле были написаны под влиянием взглядов Лапласа. Кетле является крупным статистиком. Его энергичная практическая деятельность поставила бельгийскую статистику на большую высоту. Его теоретические работы также содержат много ценного материала. Но основная идея Кетле совершенно несостоятельна. Кетле считал, что человеческим обществом управляют законы теории вероятностей. Меры склонности к преступлению, браку и т. п. Кетле считает математическими вероятностями. Он, например, пишет: «Эту вероятность (0,0884) можно рассматривать как меру видимой склонности к браку живущего в городе бельгийца» [84, стр. 79]. Кетле выдвинул в качестве основной задачи исследования статистики выяснение характера среднего человека. Согласно Кетле, средний человек является совершенным типом, а отдельные индивиды являются искаженным представлением этого типа. «Средний человек, служащий типом нашей породы, есть, в то же время, и тип красоты» [84, стр. 38]. Кетле изображал свойства среднего человека вечными и неизменными. Проникнутый стремлением открыть законы сохранения среднего человека, а с ними и законы сохранения общества в целом, Кетле по существу, пытался доказать вечность существующего капиталистического общества. «Абсолютное невмешательство в частные дела является верховным принципом» [83, стр. 81] — вот одно из основных положений Кетле. К. Маркс писал о Кетле в 1869 г.: «В прошлом у него большая заслуга: он доказал, что даже кажущиеся случайности общественной жизни вследствие их периодической возобновляемое™ и периодических средних цифр обладают внутренней необходимостью. Но объяснение этой необходимости ему никргда не удавалось. Он не двигался вперед, а только расширял материал своего наблюдения и исчисления» f85, стр. 7]. Количество работ, посвященных неоправданным применениям теории вероятностей к iжизни общества, росло. Это привело к тому, что к середине XIX в. теория вероятностей зашла в некоторый тупик. Ввиду того, что не были ясны области ее приложений, стало распространяться (мнение, что теория вероятностей не имеет отношения к естествознанию и математике. 190
§ 12. Теория вероятностей в России до работ Петербургской школы Если не принимать в расчет работ, выполненных в стенах Петербургской Академии в XVIII в. Л. Эйлером и Д. Бернулли, то можно сделать вывод, что интерес к теории вероятностей в России стал проявляться лишь в 20-х годах прошлого столетия. По-видимому, впервые вопрос о теории вероятностей в истории высшего математического образования в России был поставлен в Вильнюсском университете. В начале XIX в. в этом университете большое влияние «а преподавание математики имел проф. И. А. Снядецкий. В 1808 г. на научной сессии университета он выступил с программной речью о перспективах развития математики в университете. Касаясь теории вероятностей, он говорил, что со временем, когда математические науки в университете получат достаточное развитие, необходимо будет подумать об организации кафедры теории вероятностей. Снядецкий неоднократно выступал по методологическим вопросам математики. На научной сессии 1817 г. его выступление было посвящено теории вероятностей. Из этих кратких дошедших до нас сведений мы можем заключить, что введение в 1829/30 учебном году чтения дополнительного (факультативного) курса по теории вероятностей было естественным результатом отношения к этой науке в Вильнюсском университете- Университет в донесении Министерству по поводу чтения этого курса пишет: «Физико-математическое отделение обращало внимание на то, что правдоподобные вычисления, составляющие обширную отрасль математических наук, до сих пор не были еще преподаваемы в университете, между тем как вычисления сии весьма важны и приносят значительную пользу, ибо на оных основываются действия ассекурационных обществ. Славный же Лаплас успел приноровить оные к геодезическим и другим подобным действиям, а потому означенное отделение полагает полезным ознакомить обучаю-' Щихся математическим наукам с таковыми вычислениями» [86, стр. 62]. Далее в донесении говорится, что магистр философии Сигизмунд (Зигмунт) Ревковский (1807— 1893^т) является подходящей кандидатурой 191
для чтения этих лекций. Приводится краткая научная характеристика Ревковского, в которой указано, что Ревковский «по своей собственной охоте трудится около двух лет над сочинением о правдоподобных вычислениях» (86, стр. 62]. К сожалению, это сочинение Ревков- ского не сохранилось. В 1829/30 г. Ревковский впервые в России стал читать курс теории вероятностей. Сохранилась составленная им программа этого курса (см. [86]) К В начале программы идет объяснительная записка. Хотя Ревковский стоит на позиции детерминизма в духе Бернулли — Лапласса, его трактовка этого вопроса несколько самобытна и представляет несомненный интерес. «Каждое явление в природе является результатом одной из многих сил, действующих согласно некоторому закону. Если эти силы нам известны, тогда можно в некоторых случаях вычислить и заранее предсказать явление, которое должно произойти совершенно так же, как астрономы предсказывают движение небесных тел, затмения и т. д. Однако, когда силы, вызывающие данное явление, и законы, согласно которым они действуют, нам либо совершенно неизвестны, либо они так разнообразны и сложны, что они не поддаются вычислениям, тогда обнаружение такого явления является гадательным и обычно приписывается Судьбе. Таким образом судьба своим существованием обязана нашему незнанию или неосведомленности: чем больше мы познаем законов и сил в природе, тем меньше явлений будет зависеть от судьбы. Надежда, что явление, зависящее от судьбы, произойдет, может быть большей или меньшей» [86, стр. 67]. Мерой надежды, по Ревковскому, и есть вероятность, которой он дает классическое определение. «Наука, дающая способы точного вычисления величины надежды или, иначе, вероятности какого-либо явления, есть особая ветвь прикладного анализа, которую мы называем исчислением вероятностей» {86, стр. 67]. 1 В [86] не указан источник, откуда взята эта программа. По просьбе автора [86] восполняем этот пробел. Программа хранится в укописном фонде библиотеки Вильнюсского университета им. . Капкукаса: д. 325, «Рапорты» (программа написана на польском языке). 192
Далее идет сама программа. Часть, относящуюся собственно к теории вероятностей, мы приведем полностью. «Общая теория вычисления вероятностей, а именно: 1. Как обозначают вероятности сложных явлений, когда вероятности простых явлений постоянны и нам известны. 2. Как обозначаются вероятности сложных явлений, когда вероятности простых явлений нам известны, но не постоянны и изменяются непрерывно согласно некоторому закону. 3. Закон Якова Бернулли и его следствия. 4. Как обозначаются вероятности сложных будущих явлений, когда вероятности простых явлений неизвестны, но постоянны. 5. Как наилучше выразить вероятности будущих явлений, исходя из наблюдений прошлых явлений. 6. Как а фортериори обозначать вероятности будущих событий, когда вероятности простых событий неизвестны и изменяются непрерывно согласно некоторому закону» [86, стр. 67.] На этом собственно заканчивается программа по теории вероятностей. Далее идут различные «применения». «1. К натуральной философии. Так как принципом натуральной философии является наблюдение, применения эти следующие: Какие суть вероятности, 1Что некоторая функция ошибок наблюдений заключается в некоторых ей присущих границах. Каков общий способ получения из условных уравнений значений неизвестных элементов, как ближайших к истинным значениям. Способ этот из-за несовершенства анализа можно применить только в некоторых особых случаях. Метод наименьших квадратов дает результаты наибольшие к истине. Как с помощью наблюдений можно проследить наличие в природе известной причины или силы, если результат ее очень мал или же редко наблюдаем; здесь можно приписать причину как ошибке наблюдения, так и судьбе. Эта проблема является важным вопросом вычисления вероятности и объяснена будет на нескольких частных примерах» (86, стр. 67—68]. Далее идет применение к геодезии, «к моральным и политическим наукам», где рассматривается вопрос: 193
«Как большая или меньшая рассудительность и честность свидетелей влияет на вероятность событий, относительно которых они свидетельствуют» и т. п. [86, стр. 68}. Следуя программе, далее должны изучаться таблицы смертности, а затем идут «применения ко всякого рода играм и страхованию». Наряду с другими вопросами, здесь рассматривается «моральная надежда». Программа заканчивается вопросами, связанными с различными видами страхования. Эту программу в 1830 г. Академия наук дала на отзыв М. В. Остроградскому. Сделав несколько замечаний о расположении некоторых вопросов в программе, Остроградский, в целом, отзывается о ней хорошо [167, стр. 277]. В этом отзыве Остроградский также пишет о желательности введения преподавания теории вероятностей во всех университетах и даже в гимназиях. «Я считаю, что Академия наук оказала бы услугу весьма полезную и достойную первого ученого сословия в государстве, если бы употребила все свои усилия по введению преподавания вычисления вероятностей во всех отечественных университетах и даже в гимназиях, дабы начала сей науки заблаговременно напечатывались в умах учащихся» [167, стр. 277—278]. Интересно отступление Остроградского, в котором он говорит о самой теории вероятностей: «Наука вероятностей есть одно из важнейших приспособлений математического анализа: философия природы обязана ей многими методами, посредством коих из великого числа наблюдений определяются элементы, на коих основаны важнейшие астрономические теории; она подала повод к тем полезным общественным заведениям, известным нам под именем страховых компаний; посредством ее усматриваем мы существование причин, имеющих действия меньше, нежели самые погрешности, при наблюдениях встречающиеся. С каждым днем увеличивается влияние сей отрасли анализа, приспособляемой ныне и к самым политическим и нравственным наукам» [167, стр. 277]. Конференция Академии наук 2 июня 1830 г. рассмотрела отзыв Остроградского и записала в своем протоколе: «Остроградский замечает, что, по его мнению, было 194
бы полезным делом со стороны Академии, если бы она сделала все от нее зависящее для введения преподавания теории вероятностей во всех университетах империи. Академия, одобрив как доклад г. Остроградского, так и в особенности этот последний совет, узнала с удовлетворением, что та же мера уже предлагалась министру гг. Вишневским и Коллинсом, мнение которых запросила комиссия по реорганизации школ и университетов, когда дело шло о редакции плана преподавания математики» (167, стр· 276—277]. Все это свидетельствует о том, что в те годы назрела необходимость преподавания теории вероятностей. Несмотря на это теория вероятностей в русских университетах вводилась очень медленно. В 1830 г. в Вильнюсском университете была учреждена кафедра теории вероятностей и Ревковский назначается профессором этой кафедры. Интересна дальнейшая судьба Ревковского. Польское восстание 1830— 1831 гг. нашло свои отголоски и в Вильнюсе. Университет был закрыт, а Ревковский был осужден на смертную казнь, которую затем заменили пожизненной каторгой. После нескольких лет, проведенных в тюрьме на Кавказе, он был освобожден и в качестве рядового солдата привлечен к выполнению топографических работ. Впоследствии он получил чин капитана, а позже и диплом инженера путей сообщения. Выйдя в отставку и вернувшись в Вильнюс, Ревковский занялся политической экономией и опубликовал ряд книг по этому предмету. Свои работы, которые были связаны с применением математики к различным производственным процессам, он начал публиковать с 1866 г.1 В Московском университете впервые теорию вероятностей в 1850 г. начал читать Август Юльевич Давидов (1823—1885 гг.). В архиве Московского университета сохранилась программа по теории вероятностей, составленная А. Ю. Давидовым на 1851/52 учебный год для студентов 3-го курса (87]. Ввиду несомненного интереса, который представляет эта первая в Московском университете программа по теории вероятностей, приведем ее полностью. 1 На эту сторону деятельности Ревковского впервые обратил внимание 3. Жемайтио. 195
«Программа математической теории вероятностей для студентов физ.-мат. факультета на 1851/52 уч. г. Определение вероятностей a priori Об относительной вероятности. О вероятности сложных событий. Теорема Я. Бернулли. О математическом и нравственном ожидании. Определение вероятностей a posteriori Определение вероятности причин. Определение вероятности будущего события из наблюдений. Приложение теории вероятностей к статистике Составление таблиц смертности и употребление их для определения вероятной жизни, средней жизни и меры долголетия. О страховых учреждениях О пожизненных доходах и вдовьих кассах. Определение наивероятнейших результатов из наблюдений· Лит. Буняковский, Математическая теория вероятностей, Пуассон, Теория вероятностей, Лаплас, Теория вероятностей. А. Давидов 11 августа 1851 г.». Теория вероятностей была излюбленным предметом преподавания Давидова. Он ее читал много лет. В 1854—1857 гг. Давидов опубликовал несколько статей по теории вероятностей. В статье «Приложение теории вероятностей к статистике» [131] он исследует вероятность того, что значение данной функции заключено в определенных пределах. В статье «Приложение теории вероятностей к медицине» £156} Давидов рассматривает использование статистических методов при выявлении симптомов болезней, в диагностике и другие вопросы. К работе приложена обширная таблица, при помощи которой он решает различные вопросы. Например, в 200 случаях заболеваний некоторый признак появляется 130 раз. Можно ли 196
его считать симптомом болезни? По таблице определяются пределы вероятности повторения этого признака: 56/100 и 74/100; так как они оба больше 1/2, то делается вывод о возможности считать данный признак симптомом болезни. Следует отметить, что Давидов один из первых выступил против теории среднего человека Кетле. Он писал: «Подобный человек не только не может представлять тип человеческого рода, но без всякого сомнения есть существо невозможное» [157, стр· 16]. В Петербургском университете впервые начал читать лекции по теории вероятностей в 1837 г. В. А. Анкудо- вич; он читал этот курс до 1850 г. С 1850 г. по 1860 г. теорию вероятностей читал В. Я. Буняковский. В 60-е годы лекции по теории вероятностей в разных университетах начинают читать математики первой величины: в Петербургском — П. Л. Чебышев, в Берлинском — Э. Куммер (1810—1893 гг.) и др. Одними из первых серьезных работ в России, касающихся теории вероятностей, были две работы Н. И. Лобачевского. К вопросам теории вероятностей он пришел из следующих соображений. Лобачевский неоднократно говорил, что только с помощью опыта можно выяснить свойства окружающего пространства. Более того, он даже предпринял такую опытную проверку, результаты которой опубликовал в 1829 г. в работе «О началах геометрии». Он высчитал, что сумма углов в треугольнике Земля—Солнце—Сириус отличается от двух прямых менее, чем на 0",000372 1 [88, стр. 209]. В связи с тем, что полученная величина очень мала, возник естественный вопрос об оценке ошибок наблюдения, а для его решения нуж(ны были сведения по теории ошибок. В связи с этим в работе «Новые начала геометрии с полной теорией параллельных» Лобачевский в главах XII и XIII рассматривает решение прямолинейных и сферических треугольников с учетом того, что первичные данные получены с известной степенью точности. Лобачевский пишет: «Ошибки в их соединении могут быть одна другой противными, следовательно, частию, по крайней мере, уничтожаться. Ожидать этого тем скорее должно, чем более чисел складываются, а потому 1 У Лоба*»»ского здесь ошибка, должно быть 0^,00000372 (см. [88, стр. 286]), 197
весьма редко бывает, чтобы здесь неверность выходила по возможности самая большая. Итак, достоинство решения будет определено вполне тогда только, когда сверх точности вычисления покажем, с какою вероятности) происходят ошибки» [89, стр. 397—398]. Таким образом, Лобачевский пришел к задаче нахождения закона распределения суммы заданного числа взаимно независимых случайных величин, имеющих одинаковое распределение вероятностей. Эта задача решается как в «Новых началах геометрии», так и в работе «Вероятность средних результатов, полученных из повторных наблюдений» ι[90], которая была опубликована в 1842 г. в журнале Крелляи является переработкой соответствующих параграфов «Новых начал геометрии». Лобачевский решает следующую задачу: найти распределение суммы μ, = %г + λ2 +;?... + λΓ, где λ/ взаимно независимы и каждое из них принимает значение, заключен- ное между — а и + а, с вероятностью . Сумма μΓ 2α+1 может принимать только целые значения — га^т^га. Лобачевский находит «число шансов» получить μΓ = m, которое он обозначает Сг(т). Он получает формулу Сг (т) = 2 (—1) CrC(XaX)a+m+r—ι—λ» суммирование происходит по ^ ^ 2а+1 Вторая задача, рассмотренная Лобачевским, состоит в нахождении распределения среднего арифметического ξΓ = = — (δχ + ва + · · · + &г)> где δ/ взаимно независимы и распределены равномерно на отрезке [—1, + 1]. Для Ρ г (х) =Р {\ 1г К х) Лобачевский получает выражение: Рг(х)=\ — V (_ΐ)λ^λ(Γ-ΓΧ-2λ)Γ. r!2r~1 r rr Перед Лобачевским стояла задача — получить точные формулы для любого числа наблюдений, которую он успешно выполнил. 198
Лобачевский проводит вычисления Рг (х) для г=2, 3, 10 и дает краткие таблицы Рг(х) для некоторых х. Вероятность Лобачевский определяет, следуя Лапласу: «Под словом вероятность разумеют содержание числа благоприятных случаев к числу всех случаев вместе» [89, стр. 398]. Представляют интерес также высказывания Лобачевского относительно ошибок в наблюдениях. Он пишет, что ошибки в наблюдениях «могут происходить как от неверности самих орудий, употребляемых в измерении, так от неточности ib их установке. Влияние тех и других уменьшают орудия повторительные... Разделяя величину на число повторений [Лобачевский, вероятно, хотел сказать: «Разделяя сумму полученных величин на число повторений»], получают среднее наблюдение... Способ повторений особенно выгоден с орудиями малого размера, тогда как мелкость и верность деления на больших, не уменьшая тех ошибок, которые происходят от наших чувств, может только придавать вероятности в пользу желаемой точности» [89, стр. 406—407]. Любопытно также отметить, что Лобачевский для символики в теории вероятностей пользуется русским алфавитом. Так, для обозначения вероятности он пользуется не буквой Ру а В; для обозначения случайных событий—буквой С. Хотя обращение Лобачевского к вопросам теории вероятностей носит эпизодический характер, оно показывает, что в этой области математики он был на уровне лучших работ своего времени. Поставив конкретные задачи из теории ошибок, он логически строго получил точные и удобные для пользования формулы, интерес к которым сохранился до сегодняшнего дня (см. [91]). К первым работам по теории вероятностей в Московском университете следует отнести статью Н. Д. Браш- мана «Решение задач на исчисление вероятностей» (1835) и обширную работу Н. Е. Зериова. 19 июня 1843 г. профессор математики Московского университета Η. Ε. Зернов (1804—1862 гг.) произнес на торжественном собрании в университете речь «Теория вероятностей, с приложением преимущественно к смертности и страхованию». В том же году эта речь в значительно расширенном виде была издана отдельной книжкой. В историк6:Математической литературе это произведение 199
Зернова не нашло освещения. О нем имеются только упоминания [92], {93]. После вступления, в котором Зернов говорит, что теория вероятностей соответствует современному направлению любознательности, он переходит к очень краткому историческому очерку развития теории вероятностей. Зарождение и первоначальное развитие теории вероятностей он описывает традиционно, преувеличивая роль азартных игр, роль де Мере и т. п. Интересно, что среди современных ему сочинений по теории вероятностей он указывает на работу В. Я. Буняковского, которая к тому времени еще не была опубликована. Он пишет, что у Буняковского имеется «Рассуждение о математической теории вероятностей, коего первая часть окончена» [37, стр. 6), Но, как следует далее из текста, работу Буняковского Зернов не читал. Далее Зернов высказывает некоторые общие положения, характеризующие его как представителя распространенного тогда детерминизма. Очень любопытно высказывание Зернова об областях применения теории вероятностей. «Теория вероятностей в науках естественных указывает законы смертности и народонаселения, через страхование охраняет гражданина от несчастий, между наблюдениями несогласными избирает то, которое должно допустить по преимуществу, руководствует астронома в изыскании уклонений движения светил, которые по малости своей могли бы затеряться между неизбежными ошибками, будучи, однако, весьма важны для науки. Теория вероятнрстей проникает в храм Фемиды, шодавая мерило правды и милости судиям; она может руководствовать законодателя в избрании мер гражданского порядка, оценивая их по замеченным последствиям; она может оодавать светильник историку, взвешивая доверенность к преданиям. Наконец, учение о вероятности просветляет самую логику» (37, стр. 7). Здесь смешаны действительно ценные и научно оправданные применения теории вероятностей (статистика, демография, теория ошибок) и иллюзорные, неоправданные применения (судопроизводство, достоверность преданий, законодательство). Затем дается определение вероятности (р = т/п) и не- котррые элементарные свойства вероятности: p+q=l; Ρ дост =1 и др. Интересно формулируется теорема сложе- 200
ния вероятностей: «Вероятность рода равна сумме вероятностей видов» [37, стр. 91]. Теорема умножения формулируется обычным образом. Вводится понятие относительной вероятности. «Вероятность событий, рассматриваемых в таком виде, как будто прочие события совсем не имели места, называется вероятностью относительного. Относительная вероятность какого-либо события равна частному, происшедшему от деления самостоятельной вероятности того же события на сумму сей последней вероятности и противоположной ей, также самостоятельной» [37, стр. 9—10]. Это определение сопровождается следующим примером. В сосуде имеется 3 красных, 1 черный и 2 белых шара. Вероятность вытащить красный шар РКр =3/б; Ябел =2/б, Рчерн = 7б — это все вероятности самостоятельные. Держат пари относительно появления белого или черного шара, не обращая внимания на красные. Вероятность выиграть <пари на белом шаре 2/з, на черном — 7з· Это, по Зернову, вероятности относительные. Для этих вероятностей справедливы соотношения 2/з = =2/е: (2/б+Уб); Уз=7б: (2/б + Уб). Даже на этом примере видно, что понятие относительной вероятности излишне. Нужно сказать, что все изложение Зернов сопровождает рассмотрением примеров. Затем Зернов объясняет биномиальное распределение вероятностей и формулирует теорему Я. Бернулли. Далее он отмечает: «Важность этой теоремы основана на том именно, что она дает способ перенести приложения теории вероятностей от ничтожных задач о сосуде, содержащем шары, или об игре в кости, в карты и пр., к явлениям природы, предметам мира политического и н,рав- ственного» (37, стр. 15]. Рассматривая устройство различных лотерей, он приходит к выводу, что их организация дает большую при- быль'устроителям. После этого Зернов (переходит к рассмотрению нравственной надежды. Он высказывает мнение, что необходимо «представить истинное значение всякой суммы денег не само по себе, но в отношении к имуществу той особы, о которой идет дело» [37, стр. 21]. Но если имущество какого-нибудь лица равно нулю, то любая сумма для него будет бесконечна. Чтобы избежать этого противоречия, Зернов 'высказывает соображения, из которых сле- 201
дует, что имущество можно выражать не только в деньгах или недвижимостях. В такой трактовке почти каждый человек обладает некоторым имуществом. Для под- тве(рждения своих соображений он приводит следующее высказывание Д. Бернулли: «Нищий не откажется за какую-нибудь ничтожную сумму от возможности собирать милостыню; мот, дошедший до того, что ему остается жить только непрерывным займом, не согласится отказаться от возможности делать новые долги, хотя бы кроме покрытия прежних ему предложили еще некоторую сумму. Заключение в тюрьму на некоторое время сего последнего именно освобождает от долгов и доставляет даже порядочное пропитание; но мот неохотно вступает в такое убежище». Из этого Д. Бернулли делает вывод: «Бедность, не предполагающая никакого имущества, возможна только для умирающего с голоду». Зер- нов от себя добавляет: «Физическая сила, какие-нибудь способности, даже возможность просить милостыню или делать долги, есть уже капитал, имущество» [37, стр. 22]. Все дальнейшее изложение теории нравственной надежды идет по Д. Бернулли. Приводится формула Д. Бернулли и рассматриваются некоторые примеры, в том числе пример с размещением товаров на нескольких судах. Необходимость введения нравственного ожидания в дополнение к математическому по Зернову следует, в частности, и из такого примера. Некто имеет 100 руб. Вероятность ему получить или потерять 50 руб. равна Уг. Отношение приобретенных денег к будущему капиталу — = 7з, а потерянных к настоящему — =72· «Отсюда видно, что потеря этих 50 руб. приносит чувствительно более невыгоды, хотя по математической надежде эта игра справедливая» [37, стр. 25]. Исходя из нравственного ожидания, Зернов подходит к решению «Петербургской задачи». В заключение рассмотрения вопроса о нравственной надежде Зернов пишет о том, что математическая надежда имеет сходство с простыми процентами, а нравственная — со сложными. После рассмотрения вопроса о нравственной надежде Зернов переходит к основному, по его мнению, применению теории вероятностей — к демографической статистике и страхованию. Вначале он приводит большое чис- 202
ло данных iio разным странам об отношении количества родившихся мальчиков к количеству родившихся девочек. Приводятся и некоторые другие постоянные отношения. Зернов приводит ряд данных, относящихся к России. Эти числа доказывают то ужасное состояние, то безжалостное угнетение и эксплуатацию, в которой жил народ. Приведем некоторые из них. В 1834 г. в России умерло православных мужчин 657 822, из них в возрасте до 5 лет — 339 079. Вообще из 1 000 000 новорожденных в России до 5 лет умирало 540 762 человека, т. е. более 54%. В Московском воспитательном доме в период 1764—1796 гг. из 40 669 детей осталось в живых 5 360, в период 1797—1828 гг.— из 116 752 осталось 26 352. По доводу этих данных Зернов пишет: «Вот как числа ясно высказывают быт народный... Не всякий ли увидит здесь следствие множества невежественных, даже суеверных обычаев, наблюдаемых в простом народе при рождении, как в отношении к матери, так и дитяти, умерщвляющих большею частию сего последнего преждевременно» [37, стр. 38]. И в другом месте: «Невежество, окружающее колыбель русского крестьянского ребенка, несравненно вреднее для государства, нежели все враги его; это невежество во всяком случае самый сильный враг России» [37, стр. 49]. В этом разделе Зернов рассматривает большое число демографических понятий, таких как, например, вероятная жизнь, средняя жизнь, мера долголетия и др. Рассматриваются также принципы построения таблиц смертности. Подробно рассказано о различных видах страхований. Кратко освещены взгляды Мальтуса и Кетле. После этого Зернов шерехедит к другим применениям теории вероятностей: к теории ошибок и к судопроизводству. В теории ошибок, после некоторых общих замечаний, Зернов кратко излагает способ наименьших квадратов. Самая неоправданная часть книги Зернова — это последняя часть, касающаяся судопроизводства. В заключении книги Зернов указывает на недостаточность статистического материала для научно обоснованных выводов. Книга заканчивается словами о том, что едва ли найдется другая наука, кроме теории вероятностей, которая имела бы «более или менее прямое отношение к стольким и столь различным наукам» [37, стр. 83]. 203
В своей книге Зернов попытался в какой-то мере осветить все известные ему приложения теории вероятностей. Однако, как правило, он ограничивается лишь пересказом тех или иных известных к тому времени положений теории вероятностей и ее приложений и почти нигде не высказывает своего мнения по поводу излагаемого материала. Результатом этого явилась неравноценность различных частей книги: с одной стороны — важные применения теории вероятностей к ошибкам измерений, к демографии; с другой стороны — не представляющие научного и практического значения применения этой теории к судопроизводству. Конечно, такие работы, как работа Зернова, могли привлечь и привлекали интерес к теории вероятностей, но никакого идейного толчка для ее дальнейшего развитие они не могли дать. В распространении теории вероятностей и возбуждении интереса к ней в России большую роль сыграл выдающийся русский математик В. Я. Буняковский (1804— 1889 гг.). Одной из его первых работ, имеющих отношение к теории вероятностей, была статья «Мысли о неосновательности некоторых понятий, относящихся к общежитию, преимущественно к лотереям и играм» (95]. Буняковский пишет: «Сколько можно насчитать полезных, даже важных истин, вовсе неизвестных людям..., сколько вопросов, давно решенных, и которые до сих пор не только считаются спорными, но даже иногда, вследствие закоренелых предрассудков, многими решаются совершенно превратно» (95, стр. 80]. В качестве примеров Буняковский приводит следующие: прививка оспы, увеличивающая среднюю продолжительность жизни; польза в организации страховых обществ; вред азартных игр и т. п. Страховое дело, имевшее к тому времени уже большую историю, не шолучило широкого (распространения в России. Население питало к страхованию недоверие. Буняковский выступает против этого предрассудка. В основном статья .посвящена роли 'понятий нравственной выгоды и нравственного ожидания. С помощью этих понятий он приходит к выводам: «Всякие игры... невыгодны даже при совершенной честности игроков. Всякая лотерея невыгодна для тех, которые берут биле- 204
ты... Лучше имущество свое подвергать какой-либо опасности по частям, нежели в целости» [95, стр. 83]. На этой интересной статье мы больше останавливаться не будем, так как она в основном вошла в фундаментальную работу Буняковского «Основания математической теории вероятностей» [96]. Во введении к этой книге Буняковский указывает на трудности при ее написании, возникшие из-за отсутствия терминологии на русском языке. «Предлагаемая ныне книга есть первое сочинение на русском языке, заключающее в себе подробное изложение как математических начал теории вероятностей, так и важнейших ее приложений... Так как до сих пор у нас не было никакого отдельного сочинения, ни даже перевода об Математической теории Вероятностей, то мне предстоял труд писать на русском языке о предмете, для которого мы не имели установленных употреблением оборотов и выражений» [96, стр. II—III). С этой работой Буняковский оправился блестяще. Введенная им терминология почти без изменений осталась до наших дней. Буняковский указывает, что при написании своей книги он широко пользовался работой Лапласа «Аналитическая теория вероятностей». Затем Буняковский переходит к некоторым общим методологическим вопросам. Он стоит на детерминистической позиции, полностью отвергающей возможность существования случайного. Приведя цитату из Лапласа о всемогущем уме, для которого как будущее, так и прошедшее было бы совершенно открыто, Буняковский дает следующее пояснение: «Если 'бы все данные, от которых событие зависит, были нам известны и если бы сверх того мы были одарены умом столько проницательным, что могли бы обнять и сообразить взаимные отношения всех этих данных, то безошибочно решили бы вопрос и могли предсказать появление или непоявление события» [95, стр. 2]. Высказывания Буняковского о предмете теории вероятностей довольно расплывчаты. Теорию вероятностей он относит к прикладной математике, а относительно ее общих задаз пишет: «Анализ Вероятностей подвергает рассмотрению и численной оценке явления, зависящие от причин -зй&чтолько совершенно не известных нам, но 205
которые даже по нашему неведению не подлежат никаким предположениям» [96, стр. 1]. В другом месте «Правдоподобие, при различных обстоятельствах, может быть более или менее значительным, и, следовательно, оно, как всякая математическая величина, подлежит измерению и допускает меру. Мера эта, в математическом смысле, называется вероятностью, а исчисление, занимающееся точным ее определением, — Анализом Вероятностей» [96, стр. 3]. После этого он говорит о нравственной достоверности. Здесь неясность и расплывчатость рассуждений вполне понятны, так ка.к сам предмет (нравственная достоверность) никогда це имел четких границ. Буняковский пишет, что нравственная достоверность «обнаруживается в том случае, когда наш ум, признавая с полным внутренним убеждением какой-либо факт, не может, однако же, утвердить бытие его неоспоримыми доводами... Для человека с умом здравым, истины, нравственно достоверные, должны иметь ту же силу, как и предложения, утвержденные математическою достоверностью» [96, стр. 4]. После общего вступления Буняковский приступает к изложению самой теории вероятностей. Мера вероятности определяется как отношение равновозможных случаев. Причем равновозможными называются такие случаи, «в существовании которых мы были бы, в строгом смысле, в одинакоЕОЙ нерешимости» [96, стр. 4]. Следует отметить, что изложение материала в книге сопровождается большим количеством хорошо подобранных и разобранных задач и примеров. Представляют интерес следующие две задачи. Первая задача: найти, сколько раз нужно бросить кость, чтобы вероятность появления определенного числа очков, например, 6, равнялась данному числу, положим 1/2. Решая эту задачу, Буняковский приходит к правильному выводу: «При четырехкратном бросании кости должно считать более правдоподобным однократное вскрытие нумера 6, чем непоявление этого очка» [96, стр. 23]. Вторая задача: найти, сколько раз нужно бросить две кости, чтобы вероятность появления 6 на обеих костях равнялась Уг. Найдя, что т=24,6, Буняковский пишет: «При 24-кратном бросании двух костей, вскрытие двенадцати очков менее вероятно, чем противное событие, а при 25-кратном бросании, напротив того, вскрытие 206
12 очков делается более вероятным, чем невскрытие их» [96, стр. 24]. После этих задач Буняковский делает отступление, в котором говорит, что эти задачи Мере предложил Паскалю, который и решил их. Мере возражал против решения второй задачи, считая, что для получения вероятности больше {/2 достаточно 24 бросаний, а не 25. Далее Буняковский подробно рассматривает вопрос о наивероятнейшем количестве появлений данного события в серии испытаний. После этого он переходит к теореме Я. Бернулли. Относительно этой теоремы он пишет: «Статистики... основывают почти все свои заключения на этом законе. Таковы результаты их о народонаселении вообще, о местном движении населения, о числе преступников, о плодородии почвы, о вывозе и ввозе товаров и проч. Естествознание, медицина, судопроизводство, одним словом, все отрасли наших знаний, заимствуются этим началом, в большей или меньшей мере» [96, стр. 35]. Теорему Я. Бернулли Буняковский формулирует так: «При неопределенном повторении испытаний, из которых каждое приводит к одному из двух простых событий А или В, отношение между числами появлений этих событий непрестанно приближается к отношению их простых вероятностей, и, наконец, при надлежащем числе испытаний, разнствует от него как угодно мало» [96, стр. 36]. Для выяснения существа дела Буняковский придает теореме Я. Бернулли формулировку в виде следующей проблемы: «Производится большой ряд испытаний, из которых каждое приводит к одному из двух событий А или В; простые вероятности для А и В предполагаются постоянными; изобразим их соответствие через ρ = а + Ь и <7=1—р— . Если означим через т число испытала + Ь ний, то вероятнейшее сложное событие будет А*В* для которого отношение х\х' или равно дроби а/6, или весьма мало разнствует от нее, и где, сверх того, х+х'—1. Теперь могут представиться следующие два вопроса: 1°. Как велика вероятность Р9 что при т испытаниях событие А случится не менее χ—1 и не более х+1 раз, и, следовательно, В не менее х?—1 и не более х'+\ раз, разумея по*Ч число несравненно меньшее χ и xf 2° 207
Предполагая /вероятность ρ событии А неизвестною, но зная, сколько раз оно случилось при т испытаниях, определить вероятность Р\ что ρ будет заключаться между данными пределами» [96, стр. 39—40]. На первый вопрос Буняковский получает следующий ответ: P = -L\e-*dt4- J "__€*, (IILll) УЗГ J Vл Ϋ2χχ' VlxF «Найденная величина Ρ изображает вероятность, что по совершении весьма значительного числа т испытаний, число повторений события А будет заключено между пределами χ + / и χ — U г В между х' — / и х' + /, разумея под χ и х' величины целые, которых сумма равна /п, а отношение х\х' наиближе подходит к отношению р/(1 —р) простых вероятностей событий А и В\ I — означает число, которого порядок не превышает γт» [96, стр. 44]. t Далее идет вычисление ^е~** dt: о J 2 r 2t I 2/2 (2*2)2 (2/2)3 J 0 Подставляя это значение в (III. 11) и устремляя t к оо, получаем, что Р-+1. «Отсюда должно заключить, что при неопределенном повторении испытаний, отношение числа появлений события А к числу появлений В непрестанно приближается к отношению простых вероятностей событий А и Ву от которых, наконец, разнствует как угодно мало. В этой правильности в повторении случайностей, обнаруживающейся при значительном ряде испытаний, состоит... примечательная теорема Якова Бернулли» [96, стр. 48]. Решая второй поставленный вопрос, Буняковский получает следующее. Пусть i — число появлений события А при т испытаниях. Тогда вероятность того, что вероят- 208
ность появления А заключена в пределах будет Ρ' = -Μ е^Л + ^ е~'\ Vn J VjT V2i(m — i) Затем Буняковский переходит к схеме невозвращен- ного шара. Глава III посвящена математическому ожиданию, которое Буняковский вводит после рассуждений о безобидной игре. Рассматривается задача о справедливом разделении ставки и другие задачи, а также устройство различных лотерей, в том числе французской. Рассчитывая справедливую величину выигрыша за определенную комбинацию номеров, Буняковский приходит к выводу, что в существующих лотереях покупателям билетов значительно не доплачивают. Глава IV посвящена нравственному ожиданию. Здесь Буняковский вначале излагает взгляды Бюффона и Д. Бернулли по этому вопросу, а затем переходит к рассмотрению «Петербургской задачи». В следующих главах рассматриваются различные задачи. Среди них задача Бюффона о бросании иглы на плоскость, разграфленную параллельными линиями, а также ее некоторые усложнения. Большая глава «О вероятностях жизни человеческой» посвящена демографическим вопросам. Здесь Буняковский, в частности, пишет о большой детской смертности. Рассматривая составление и употребление таблиц смертности, Буняковский приводит в виде примера таблицу смертности для Москвы, составленную по данным 1842 г. В ней имеются, в частности, следующие сведения: из 9276' новорожденных до 5 лет доживало 5815. Буняковский приходит к такому выводу: «Замечен значительный перевес вероятной жизни в деревнях перед большими городами; причина этой разности весьма понятна, приняв в соображение вредное влияние городской жизни на общественное здоровье, в особенности же относительно низших сословий* которые более других подвержены болезням, нищете, тесноте помещения и проч.» {96, стр. 179]. 209
Затем рассматриваются многие вопросы демографии, такие как мера долголетия, средняя продолжительность жизни, мера плодовитости и мера смертности, увеличение продолжительности жизни с избавлением от определенных болезней и много других. После рассмотрения вопроса о величине народонаселения Буняковский в следующей главе переходит к вопросам устройства различных касс, страховых учреждений и т. п. Решается много различных задач. Следующая глава — «О наивыгоднейших результатах наблюдений» — посвящена оценкам ошибок наблюдений. Буняковский пишет, что ошибки при наблюдениях неизбежны. Возникает вопрос, как же все-таки из наблюдений получить наиболее вероятный результат. Буняковский приходит к выводу, что «правдоподобнейший результат, при равновероятных погрешностях, определяется среднею арифметическою из всех наблюдений, когда число сих последних весьма значительно... Это правило справедливо и в том случае, когда погрешности не предполагаются равновозможными, а подчинены, с некоторыми ограничениями, какому ни есть закону» [96, стр. 264]. Буняковский получает вывод, что случайные ошибки наблюдений распределяются по нормальному закону. Заканчивается книга Буняковского кратким историческим очерком развития теории вероятностей. По полноте содержания и ясности изложения работа Буняковского была выдающимся произведением по теории вероятностей не только в России, но и в мировой литературе того времени. Однако, несмотря на несомненные достоинства книги, нельзя пройти мимо принципиальных ошибок, допущенных Буняковским, в первую очередь в приложениях теории вероятностей к свидетельским показаниям, правильности судейских решений и другим необоснованным применениям к вопросам общественной жизни, которые рассматриваются в главе XI — «Приложение анализа вероятностей к свидетельствам, преданиям, различного рода выборам между кандидатами и мнениями, и к судейским определениям по большинству голосов». Эти приложения и взгляды неоднократно подвергались критике. В частности, на них останавливается А. А. Марков в своей книге: «Исчисление вероятностей». Он рассматривает следующую задачу из книги Буняков- 210
ского: «Из полной русской азбуки выдернули шесть букв наудачу, которые, по мере вскрытия, ставили одну возле другой. Два очевидца утверждают, что вынутые буквы составили слово МОСКВА. Спрашивается, как велика вероятность, что показание двух свидетелей справедливо» [96, стр. 314]. При этом предполагается, что полная русская азбука содержит 36 букв и что склонность свидетелей к правде выражается дробью 9/ю. При решении этой задачиБуняковский делает ряд совершенно произвольных допущений. По поводу этой задачи и ее решения Марков пишет: «Приведенный пример, по нашему мнению, достаточно выясняет неизбежность многих произвольных предположений при решении вопросов, подобных разобранному нами, которые по существу дела имеют весьма неопределенный характер. Рассмотренный вопрос примет еще более неопределенный характер, если допустим, что свидетели могут ошибаться и устраним независимость их показаний». После этого Марков делает следующие замечания. «Во-первых, если событие невозможно, то никакие свидетельские показания не могут сообщить ему даже малой вероятности... Мало вероятное событие не станет весьма вероятным от согласного показания таких свидетелей, которые сговорились друг с другом, или имеют одинаковые не вполне точные сведения о предмете их показаний. Наконец, сообщение о событии может доходить к нам не от очевидцев, а через последовательный ряд свидетелей, которые передают то, что они слышали от других. В этом случае удлинение цепи свидетелей, конечно, затемняет совершившееся. Независимо от математических формул, на которых мы не остановимся, не придавая им большого значения, ясно, что к рассказам о невероятных событиях, будто бы происшедших в давно минувшее время, следует относиться с крайним сомнением» [94, стр. 320]. Буняковский пытался оградить религиозные предания от различных нападок. Он писал: «Некоторые философы в видах предосудительных пытались применять формулы, относящиеся к ослаблению вероятности свидетельств и преданий к верованиям религиозным, и тем поколебать их. Для опровержения их выводов стоит только принять в соображение, что всякое следствие, выводимое из ана- литической^формулы, не может быть иным, чем как только развитием первоначального предположения, на кото·- 211
ром формула основана. Если предположение ложно, то и следствия анализа будут ошибочные. Поэтому прежде всего должно разобрать основательно предположение, служащее точкою исхода. Когда этот разбор приведет нас к заключению, что в духовном мире есть такие факты, которые не подчинены физическим законам, тогда все злонамеренные умствования лжефилософов рушатся сами» [96, стр. 326]. По поводу этого высказывания Марков пишет: «Мы никак не можем согласиться с Буняковским, что необходимо выделить известный класс рассказов, сомневаться в которых он считает предосудительным». И добавляет: «В данном случае мое разногласие с Буняковским выходит уже из области математики и касается шаткой области желаний и личных интересов людей» [94, стр. 3201. Кроме своей основной работы по теории вероятностей, Буняковский написал еще ряд статей, которые относятся как к самой теории вероятностей, так и к ее приложениям. Он составил подробные таблицы для эмеритальных касс военных ведомств, чем содействовал их развитию Ряд работ Буняковского относится к движению народонаселения, таблицам смертности и т. п.; он делает подсчеты о возможных контингентах армии в различные годы. Почти все работы Буняковского по вопросам, связанным с теорией вероятностей, выходили из конкретных задач, которые ставила практика. Интересна, например, по своей постановке работа «О суммовании численных таблиц по приближению». Буняковский так определяет свою задачу: «Вопрос, излагаемый в этой статье, состоит в определении возможно простейшим образом приближенной суммы указаний численных таблиц, или, вообще, значительного числа слагаемых» [97, стр. 1]. Поставленная задача сводится к следующей: Дано значительное число наудачу написанных слагаемых с любым количеством цифр. Не производя сложения, а сосчитав только число слагаемых и количество чисел разных разрядов, определить: 1) наивероятнейшую или среднюю сумму данных для сложения чисел и 2) вероятность, что уклонение этой суммы от действительной заключается между данными пределами. Эта статья Буняковского имеет непосредственное отношение к его счетному прибору—«русский самосчет», 212
который был изготовлен в 1867 г. и рассмотрен физико- математическим отделением Академии наук. Самосчеты Буняковского были удобны для суммирования большого числа относительно маленьких слагаемых. Статья Буняковского показывает, что изобретению самосчетов предшествовал вероятностный анализ вопросов, связанных с суммированием большого количества слагаемых. Таким образом, основные интересы Буняковского в теории вероятностей были направлены на ее приложения. Этому еще способствовало то, что с 1858 г. он стал главным правительственным экспертом по статистике и страховому делу. Наиболее крупной его работой этого периода является «Опыт о законах смертности и о распределении православного народонаселения по возрастам» (1865 г.). В этой работе он предложил новый способ составления таблиц смертности. К «Опыту» примыкает другая работа — «Антропобиологические исследования и их приложения к мужскому населению России» (1873— 1874 гг.). В этой работе Буняковский определяет наличный состав мужского населения по возрастам, на основании сопоставления метрических данных за предшествующие годы. Любопытно, что Буняковский в одной из своих работ указывает на следующее возможное применение теории вероятностей. «Да позволено будет мне прибавить несколько слов о другом приложении анализа вероятностей, на которое, кажется, никто еще не указывал. Новое применение относится к грамматически и этимологическим исследованиям о каком-либо языке, также к сравнительной филологии» [98, стр. 48]. Крупным представителем русской теории вероятностей был М. В. Остроградский 1. Его работы в этой области, как и работы Буняковского, были вызваны в первую очередь практическими потребностями. В 1856 г., после поражения в войне, Россию лишили права иметь флот на Черном море. Предстояли массовые увольнения не только матросов, но и служащих. Для улучшения их положения решили устроить эмеритальную кассу, которая должна была начать выдавать пенсии с 1859 г. К расчету устройства этих касс были привлечены Буняковский и Остроградский, которые вошли в комис- 1 Творчествам. В. Остроградского посвящено много работ, мы обращаем внимание на [100] и [141]. 213
сию по выработке положения о к&ссе. с)тому BOripocV посвящена заметка Остроградского — «Записка об эмеритальной кассе», опубликованная в сборнике «Предположение об учреждении в Морском ведомстве эмеритальной пенсионной кассы» в 1868 г. В этой работе Остроградский отмечает, что эмеритальные кассы должны строиться на принципе страхования. Основное содержание своей работы Остроградский характеризует так: «Мы представляем решение вопроса о наименьшей пенсии и доводим его до такой степени простоты, что оно не затруднит и наименее сведущих в арифметике; достаточно будет знать одно сложение чисел. Три таблицы, которые мы прилагаем, доставляют такие решения» [99, стр. 298]. Далее идут упоминаемые таблицы, при помощи которых можно легко подсчитать величину пенсии для различных случаев. В статье приводятся (подробно разобранные числовые примеры. Это работа Остроградского явилась вкладом в страховое дело и долго использовалась в практике страхования. Почти во всех работах Остроградского по теории вероятностей, как правило, ощущается влияние книги Лапласа. Остроградский считал, что теория вероятностей является важным орудием в изучении закономерностей, которые возникают в массовых явлениях. Но он часто впадал в ошибки философского и методологического характера. Он вслед за Лапласом говорил о принципе недостаточного основания, применял теорию вероятностей к нравственным проблемам, и в первую очередь — к судопроизводству. Первая работа Остроградского по теории вероятностей «Извлечение из мемуара о вероятности судебных ошибок» была сообщена на заседании Академии наук 12.VI.1834 г. и опубликована в 1838 г. В этой работе Остроградский рассматривает такой суд, когда судьи не в одинаковой мере обладают правильным суждением. Предположив, что границы для правдивости каждого судьи известны, Остроградский дает формулы для определения вероятности ошибки суда, состоящего из данного числа судей. Решая, по существу, такие беспочвенные задачи, Остроградский делает довольно остроумные замечания. Он приходит к выводу, что если все судьи способны прийти к 214
правильному решению с одной и той же вероятностью, то вероятность судебной ошибки оказалась бы зависящей только от большинства голосов и не зависела бы от общего числа судей. Этот результат не совпадает с мнением Лапласа, который считал, что вероятности принять ошибочное решение различны в случае, если оно принимается единогласно 12 судьями, и в случае, если оно принимается большинством в 12 голосов при составе суда в 212 судей. По этому поводу Остроградский пишет: «Выявляют величайшее доверие беспристрастному суду, состоящему из 12 человек, принявшему решение единогласно, но если суд состоит из 212 судей, из которых известно мнение лишь 12, согласных друг с другом, то следовало бы для ориентировки подождать, пока не станет известным мнение большинства. Однако, не зная мнения двухсот судей, мы приходим как раз к случаю, когда суд состоит из 12 человек, единогласно вынесших решение. Откуда берется та большая разница в доверии, которое мы выявляем одному и тому же числу судей, одинаково справедливых и находящихся в одном и том же положении по отношению к нам? Этого различия вовсе не существует, мы впали в ошибку из-за того, что недостаточно углубились в вопрос» [99, стр. 66]. В работе «Об одном вопросе, касающемся вероятностей», доложенной 23.Х. 1846 г. з Петербургской Академии наук и опубликованной в 1848 г., Остроградский рассматривает один из вопросов приемочного контроля, для чего он приводит такую задачу: «В сосуде имеются белые и черные шары, общее количество которых нам известно, но мы не знаем, сколько из них какого цвета. Мы извлекаем некоторое количество этих шаров и, подсчитав, сколько среди них белых и сколько черных, снова кладем их в сосуд. Требуется определить вероятность того, что общее число белых шаров не выходит из наперед назначенных пределов. Или лучше сказать, мы ищем зависимость между этой вероятностью и пределами, о которых идет речь» (99, стр. 215}. Эта задача рассматривается не как вывод некоторых аналитических выражений, а как задача, имеющая практический характер. Он пишет: «Чтобы понять важность этого вопроса, представим себя на месте того, кто должен получить большое число предметов, причем должны вы- г\
полняться некоторые условия, и кто, чтобы проверить эти условия, должен на каждый предмет потратить некоторое время. Перед армейскими поставщиками часто стоят такого рода задачи. Для них шары, содержащиеся в сосуде, представляют получаемые предметы, белые, например,— предметы приемлемые, как удовлетворяющие определенным условиям, а черные — неприемлемые. Извлечение некоторого числа предметов, чтобы убедиться в их цвете, сводится к проверке части получаемых предметов, чтобы определить их качество. Определим эту часть как пять, шесть или семь процентов, выбираемых наудачу из общего числа, затем берем их и, подсчитав, что при этом получено, найдем вероятность того, что общее число приемлемых предметов не выходит за пределы, которые можно заранее установить. Это вычисление производится так, как если бы речь шла о содержащихся в сосуде белых и черных шарах. При подходящем выборе как пределов, так и количества предметов, подлежащих проверке, рассматриваемая вероятность могла бы отличаться от достоверности как угодно мало. Таким образом, если бы вопрос, который мы перед собой поставили, был решен, поставщик мог бы воспользоваться этим, чтобы свести приблизительно к двадцатой доле часто очень утомительную механическую работу, как, например, проверку очень большого количества мешков муки или штук сукна» (99, стр. 215]. Решение задачи он начинает с рассмотрения следующего вопроса. В сосуде, содержащем данное число шаров, находятся в неизвестной пропорции белые и черные шары. Из сосуда извлекается / шаров. Требуется найти вероятность того, что среди этих / шаров будет η белых и т черных. Остроградский рассуждает следующим образом. «Если / шаров... может быть О, 1,2,3, ..., л, ..., 1-Х J белых шаров, значит, соответственно /,/—1,/—2,/—3, ... т, ..., 1,0 черных шаров. Так как все эти различные гипотезы, число которых /+1, равновозможны, вероятность каждой из них, стало 216
1 быть, и той, которую мы имеем в виду, будет » [99, 1+/ стр. 216]. Остроградский не замечает, что вероятности различных исходов не равновероятны. Для получения расчетных формул он пользуется следующими обозначениями: И* = 2(2-1)(2_2) ... (г-k + l). Далее Остроградский делает допущения. «Предположим теперь..., что в сосуде действительно имеется χ белых и у черных шаров, и найдем, какова вероятность того, что из / извлеченных шаров пудет η белых и т черных» [99, стр. 216]. Остроградский находит, что эта вероятность равна М'М" [y]w [п]п [т]т Is)1' где s — общее число шаров. Предположим теперь, что мы извлекли из сосуда / шаров и что среди этого числа оказалось η белых и т черных, требуется определить вероятность того, что на 5 — I невынутых шаров приходится белых χ и черных у. Эта вероятность равна [1+1]1^МпШт ^ [п]п [т]т [s +1]/+1 или в более привычных обозначениях: (III. 12) <4& Остроградский приводит расчетные формулы. Далее рассматривается вопрос о том, как изменяется вероятность (III.12) при изменениях χ и соответственно у. Остроградский находит, что при тех же условиях задачи вероятность того, что число белых шаров не превосходит q илй^о черных шаров меньше, чем b=s — q, 217
будет [/+l]H-i k^ 1т]к1Ь]т-к1д+1]п^к^ [т\т [s +l]H-i £0 In + k +l]»+*+i В конце работы подробно разобран числовой пример. В статье приведены различные таблицы для расчетов. Статья Остроградского «О страховании», опубликованная в журнале «Финский вестник» в 1847 г., представляет большой интерес, так как она в основном посвящена философским и методологическим вопросам. Статья эта осталась неоконченной. В ней содержатся критические замечания по адресу недавно вышедшей книги В. Я. Буняковского «Основания математической теории вероятностей» (1846 г.), хотя фамилия автора при этом не приводится. Статья начинается словами: «Теория страхования не может быть изложена без помощи анализа вероятностей, на котором она основана, и поэтому мы постараемся сперва дать ясное понятие о том, что такое вероятность» [99, стр. 238]. Затем он переходит к критическим замечаниям в адрес В. Я. Буняковского. «Автор хочет показать, что вероятность, которую он называет правдоподобием, есть величина. Для этого доказательства он старается убедить нас, что правдоподобия могут быть одни других и больше, и меньше. Потом, когда приведены все доводы, по его мнению, достаточные для полного убеждения, то он заключает, что правдоподобие, как и всякая математическая величина, 'подлежит измерению и допускает меру. Итак, по мнению ученого автора, правдоподобие есть математическая величина, потому только что правдоподобия одни могут превосходить и быть меньше других. Мнение это не совсем правильно. И действительно, не говорим ли мы и, говоря, не ясно ли понимаем, что такой- то ученый совестливей другого, что француз храбрее немца, что читатель благоразумнее писателя и цроч. Таким образом, совесть, храбрость, благоразумие и т. д. могут быть и больше, и меньше, следовательно, они суть математические величины, их можно измерять, выражать в числах и производить различные над ними действия. Рассуждая таким образом, круг математических наук весьма 218
бы расширился, могли бы появиться основания математических теорий: бессовестности, нелепости и проч.» [99, стр. 238]. Понятие вероятности Остроградский трактует с субъективных позиций, как меру уверенности познающего субъекта. Он пишет: «В природе нет вероятности. Все, что происходит в мире, непременно и несомненно. Вероятность есть следствие слабости человеческой; она относится к нам, существует для нас и может быть только для нас. Рассматривание ее есть важное, даже необходимое дополнение к тем немногим истинам, которые мы знаем с относительною достоверностью. Явления в природе заменяются в совершенно определенной последовательности. Эту последовательность существа, высшие нас, могли бы открыть и доказать. Но мы, не зная ни начала, ни взаимной связи явлений, ни их отношений к нам, наблюдая только ничтожную часть тех, которые происходят вблизи нашей планеты, мы не только не в состоянии предсказывать их последовательности, но останемся навсегда в совершенном неведении существования большей части из них. Те же, о которых знаем из наблюдения, для нас только вероятны в различных степенях» {99, стр. 240]. Остроградский подробно говорит о том, что вероятность есть мера нашего незнания, что это субъективное понятие, что у вероятности в объективном мире нет никакого соответствия, что весь мир детерминисти- чен и случайного в нем нет, есть только то, что мы не знаем или не познали, которое мы и называем случайным. «Если явление совершенно зависит от несколько других явлений или случаев, из которых одни могут его произвести, другие ему противны, и если притом все эти случаи таковы, что для нас, мы повторяем, для нас, нет причины одни из них предпочитать другим, то вероятность ожидаемого явления измеряется дробью, которой числитель равен числу случаев, доставляющих явление,— а знаменатель числу всех случаев» {99, стр. 240—241]. Это утверждение совпадает с так называемым классическим определением вероятности Лапласа с толкованием равновозможщсти, как недостаточности оснований давать предпочтение одним событиям перед другими. 219
Рассматривается пример. В урне находится 5 шаров (3 белых и 2 черных), из нее извлекают один шар. Какова вероятность, что этот шар будет белым? Относительно этого примера Остроградский пишет: «Пять шаров находятся в вазе; нет никакой причины думать что один из них попадет в руку скорее, нежели другой. Говоря, нет никакой причины, разумеем, что ее нет для нас,— она есть, но совершенно нам неизвестна... И как мы не можем дать одному шару преимущество пред другим, то все шары представляют для нас случаи равновозможные. Тот, кто знал бы расположение шаров в урне и мог бы вычислить движение вынимающей руки, тот сказал бы наперед, какой именно выйдет шар,—для него не было бы вероятности. Если бы для нас в самом деле не было причин вынуть такой-то шар, а не другой, тогда появление шара было бы действительно невозможно, как невозможно действие без причины. Мы повторяем, что вероятность и одинаковая возможность случаев и мера вероятности существуют только для нас. Для существ же всеведущих, т. е. имеющих все сведения о всех явлениях, вероятность не может иметь не только меры, но и никакого значения» {99, стр. 241]. Это высказывание является типичным высказыванием в духе механического детерминизма, который был в то время широко распространен в теории вероятностей. Далее Остроградский переходит к вопросам, связанным со страхованием и устройством лотерей, объяснив предварительно понятие математического ожидания. Рассмотрев один числовой пример расчета страхового взноса, Остроградский предупреждает: «Больше не давайте, напротив, старайтесь дать меньше, чтобы иметь некоторую выгоду. Не заботьтесь о страховом обществе— оно в убытке не останется» [99, стр. 244]. Он подвергает также критике лотереи, приносящие большие доходы устроителям. На этом статья заканчивается. Обещанного же продолжения в дальнейшем не последовало. В статье Остроградского «Игра в кости» (1847 г.) рассматриваются некоторые игры в кости и производится элементарный расчет ставок в безобидных играх. Эти две статьи фактически были направлены против азартных игр и лотерей, получивших в то время широ- 220
кое распространение. Игры и лотереи во многих случаях были основаны на том, что стоимость билета или ставки значительно превышала математическое ожидание выигрыша, которое тщательно скрывалось. Имеются сведения, что в 1858 г. Остроградский читал необязательный курс теории вероятностей в Михайловском артиллерийском училище. Всех лекций было 20. По-видимому, литографированным способом были изданы 3 первые лекции. Но это издание не обнаружено. Б. В. Гнеденко приводит текст краткого исторического обзора теории вероятностей, хранящегося в рукописном отделе Государственной публичной библиотеки УССР, и делает предположение, что это, возможно, набросок вводной лекции Остроградского в Михайловском училище [35]. Из всего сказанного следует, что работы Остроградского по теории вероятностей были на уровне науки того времени. Мы полностью согласны с оценкой Гнеденко творчества Остроградского в области теории вероятностей: «Несмотря на то, что в определении вероятности Остроградский допускал ошибки методологического характера, скатываясь на позиции субъективизма, общая направленность его творчества в теории вероятностей должна быть оценена как стихийно-материалистическая. Для Остроградского теория вероятностей имеет ценность лишь как орудие познания материального мира, и этого вывода не могут затемнить даже его философские шатания, допускаемые в даваемых им определениях. Действительно, темы его работ тесно связаны с вопросами практики» {35, стр. 123]. В заключение данного параграфа отметим, что Буня- ковский и Остроградский много сделали для распространения теории вероятности в России. Но их труды были в основном в русле старой тематики, они не затрагивали центральных вопросов теории вероятностей, без решения которых нельзя было найти выход из создавшегося тупика. Для того чтобы дать теории вероятностей новый толчок в развитии, нужен был материалистический подход к основным вопросам, нужны были новые идеи и новые методы. Их внес в теорию вероятностей П. Л. Чебышев. 221
Глава IV ТЕОРИЯ ВЕРОЯТНОСТЕЙ ВО ВТОРОЙ ПОЛОВИНЕ XIX в. § 1. Чебышев — создатель русской школы теории вероятностей Труды М. В. Остроградского и В. Я. Букяковского способствовали распространению математических знаний в России. Их работы возбудили интерес к математике, в том числе и к теории вероятностей, в первую очередь у молодежи. Это подготавливало необходимую почву для возникновения петербургской математической школы. Создателем и идейным руководителем этой крупнейшей дореволюционной математической школы в России был П. Л. Чебышев (1821—1894). Чебышев, как и многие другие математики, испытал на себе влияние работ Остроградского и Буняковского. Чебышев сыграл крупную роль в развитии многих разделов математики. Его исследования относятся к теории приближения функций многочленами, теории чисел, теории механизмов, теории вероятностей и многим другим областям. В каждой из этих областей Чебышев создал ряд основных, общих методов; его идеи оказали решающее влияние на их дальнейшее развитие. Чебышев оставил яркий след в развитии математики не только своими собственными исследованиями, но и постановкой соответствующих вопросов перед молодыми учеными. Математическая школа, руководимая Чебышевым, имела первостепенное значение в развитии математики в России. Наиболее крупными представителями этой школы были А. Н. Коркин, Е. И. Золотарев, А. А. Марков, Г. Ф. Вороной, А. М. Ляпунов, Д. А. Граве, В. А. Стеклов и др. Школа была объединена не только общностью решаемых проблем, обсуждением задач и постановок вопросов, но и материалистическим подходом к науке вообще и к математике в частности. Такие уче- 222
ные, как Марков, Ляпунов, Стеклов и другие, известны как крупнейшие представители материализма в науке. Чебышев сумел оказать такое большое влияние на развитие науки благодаря материалистическому подходу к ее закономерностям. Как мы видели, к середине XIX в. теория вероятностей в своем развитии зашла в некоторый тупик. Чебышев своим творчеством в теории вероятностей указал дальнейший путь ее развития, вдохнул новые идеи, решил принципиально узловые задачи, привлек к теории вероятностей талантливейших математиков, поставив перед ними новые вопросы,— все это способствовало выходу теории вероятностей из тупика и ее последующему бурному развитию. В беседе с А. В. Васильевым незадолго до своей кончины Чебышев высказал в .полушутливой форме мысль о том, что математика пережила два периода. В первом — задачи ставились богами (делосская задача об удвоении куба), во втором — полубогами (Паскаль, Ферма). В наступившем же третьем периоде задачи ставятся практической необходимостью. Чебышев был уверен, что чем труднее задача, тем плодотворнее методы ее решения и тем шире область их последующих применений. Единство теории и практики было определяющим в математическом творчестве Чебышева. Свои взгляды по этому вопросу он отчетливо высказал в речи, написанной для торжественного акта в Петербургском университете в 1856 г., которая называлась «Черчение географических карт». Чебышев писал: «Науки математические с самой глубокой древности обращали на себя особенное внимание; в настоящее время они получили еще более интереса по влиянию своему на искусство и промышленность. Сближение теории с практикой дает самые благоприятные результаты, и не одна только практика от этого выигрывает; сами науки развиваются под влиянием ее: она открывает им новые предметы для исследования, или новые стороны в предметах давно известных. Несмотря на ту высокую степень развития, до которой доведены науки математические трудами великих геометров трех последних столетий, практика обнаруживает ясно неполноту их во многих отношениях; она предлагает вопросы, существенна дрвые для науки и таким образом вызывает на изыскание совершенно новых метод. Если теория 223
много выигрывает от новых приложений старой методы или от новых развитии ее, то она более приобретает открытием новых метод, и в этом случае науки находят себе верного руководителя в практике» [101, стр. 249]. Чебышев стремился к строгому и эффективному решению задач, к построению алгоритмов, которые позволяют доводить исследование до числового ответа, либо до пригодного приближенного решения. При этом строгость приближенного решения он понимал в смысле возможности установления пределов погрешности. В своих работах Чебышев часто использовал сравнительно простые математические'средства. Он применял только функции действительного аргумента, широко использовал алгебру и, в частности, аппарат непрерывных дробей. Большую роль в создании математической школы сыграла педагогическая деятельность Чебышева в Петербургском университете. Он был не только замечательным лектором, но и замечательным руководителем. Непосредственными учениками Чебышева были, в частности, А. М. Ляпунов и А. А. Марков. Их научная деятельность протекала под сильным воздействием Чебышева. Глубокую характеристику подхода Чебышева (и его школы) к математическим задачам дал А. М. Ляпунов: «Чебышев и его последователи остаются постоянно на реальной почве, руководясь взглядом, что только те изыскания имеют цену, которые вызываются приложениями (научными или практическими) и только те теории действительно полезны, которые вытекают из рассмотрения частных случаев. Детальная разработка вопросов, особенно важных с точки зрения приложений и в то же время представляющих особенные теоретические трудности, требующие изобретения новых методов и восхождения к принципам науки, затем обобщение полученных выводов и создание этим путем более или менее общей теории — таково направление большинства работ П. Л. Чебышева и ученых, усвоивших его взгляды» [102, стр. 20]. При всем прогрессивном значении петербургской школы, ей была свойственна и некоторая ограниченность. Чебышев и многие его ученики часто холодно и скептически относились к некоторым важным направлениям западноевропейской математики. 224
За два столетия развития теории вероятностей главными ее достижениями были предельные теоремы—закон больших чисел и теорема Муавра — Лапласа. Но обоснование предельных теорем было недостаточным. Не были выяснены границы их применимости и возможности дальнейшего обобщения. В приложениях часто допускались принципиальные ошибки. Даже Лаплас и Пуассон не избежали этих ошибок. Эго в первую очередь относится к оценке вероятностей свидетельских показаний, правильности судейских решений и другим вопросам общественной жизни. Подобные необоснованные приложения, опирающиеся на произвольные и неверные допущения, сильно компрометировали саму теорию вероятностей. Б. В. Гнеденко характеризует этот период в теории вероятностей следующими словами: «Увлечение теорией вероятностей в первую четверть прошлого века, связанное с именами Лапласа и Пуассона, привело к огромному числу работ, посвященных приложениям к различным проблемам естествознания и общественной жизни. Многие из них были настолько мало обоснованы, что впоследствии воспринимались в качестве «математического скандала». В результате упомянутые увлечения сменились глубоким разочарованием и полным скептицизмом в отношении возможности использования теории вероятностей в качестве метода научного познания. Среди математиков Западной Европы приобрел господство взгляд на теорию вероятностей, как на своеобразное математическое развлечение, едва ли заслуживающее серьезного внимания» [82, стр. 390]. В результате этого в теории вероятностей сложилась ситуация, когда дальнейшее ее развитие требовало уточнения основных положений. Нужно было установить область применения теории вероятностей, ее предмет, изучить и усилить специфические методы исследования. Большую работу в этом направлении проделал Чебышев. Интерес к теории вероятностей у Чебышева был неизменным и устойчивым. Еще в начале своей творческой деятельности, в 1846 г., он защитил в Московском университете магистерскую диссертацию по работе «Опыт элементарного анализа теории вероятностей». В связи с уходом из Петербургского университета Буняковского, Чебышев в 18βθ)4-861 учебном году начал читать курс теории вероятностей. Чебышев читал много различных 225
курсов, но два из них были для него наиболее излюблен· ные. Это теория чисел и теория вероятностей. За свою долголетнюю работу в университете он прочел каждый из этих курсов 31 раз. Основное внимание в теории вероятностей Чебышев сосредоточил на предельных теоремах. По теории вероятностей им было опубликовано всего четыре работы, но они сыграли громадную роль в дальнейшем развитии этой науки. Первая работа — это его магистерская диссертация. Уже здесь появилась основная идея Чебышева: при доказательстве предельных теорем стремиться давать точные оценки приближений. Он не только доказал теорему Бернулли, но и дал соответствующие оценки получающихся приближений. Задачу своей диссертации Чебышев формулирует следующим образом: «Показать без посредства трансцендентного анализа основные теоремы исчисления вероятностей и главные приложения их, служащие опорою всем знаниям, основанным на наблюдениях и свидетельствах ... Решение этой задачи представляет, с одной стороны, важное развитие приемов алгебраического анализа, с другой,— значительную пользу в распространении знаний исчисления вероятностей между множеством людей, ограничивающихся в изучении математики одною алгеброю» [101, стр. 27]. И далее: «До сих пор элементарные курсы теории вероятностей ограничивались только изложением, более или менее подробным, результатов, полученных посредством высшего анализа. Дать возможность поверить все эти заключения анализом строгим и простым, доступным для большей части учащихся, есть большой шаг в способе элементарного изложения теории вероятностей» [101, стр. 28]. Первую главу Чебышев начинает с введения понятия вероятности. Для этого он прежде всего определяет рав- новозможные события: «Если из определенного числа различных событий при известных обстоятельствах одно необходимо должно случиться и нет особенной причины ожидать какого-либо из этих событий преимущественно пред другими, то такие события отличаем названием случаев равновозможныхъ [101, стр. 28}. Нельзя сказать, чтобы это определение было достаточно четкое. Если из η случаев т имеют следствием некоторое событие, то мерой вероятности этого события, которое 226
называют вероятным, принимают т/п, т. е. «отношение числа равновозможных случаев, благоприятных для события, к числу всех равновозможных случаев» [101, стр. 28]. Затем дается определение предмета теории вероятностей: «Наука о вероятностях, известная под именем теории вероятностей, имеет предметом определение вероятности события по данной связи его с событиями, кото- дых вероятности известны» [101, стр. 29]. Из этого определения следует, что теория вероятностей— математическая наука, которая занимается получением одних вероятностей по уже известным вероятностям. Чебышев не ставит вопроса о том, как получаются эти первые вероятности. Далее Чебышев останавливается на теоремах, которые он называет основными теоремами теории вероятностей. Это теорема сложения, теорема умножения и следующая теорема: Если событие F может случиться только тогда, когда имеет место одно из μ событий Εχ, Еъ ..., Ец, после которых его вероятность ри р2, .... Ρμ» вероятности же событий Еи E2i ..., ΕΊ будут Р\9 Рг, ... ...,Ρμ, то вероятность, что с F имело место событие Εχ, есть ΡιΡι Рл + Рл+ ··· + W Следующая глава посвящена «повторению событий». В ней выводится формула Бернулли μ' ιη!(μ-Αΐ)! Η ν Ηβ Выводится ряд других формул, например, , μΐ/fpp - - - Р«У (1- Рг - Рг - · · - - ^у-щ-т.-.-.-т^ тг\тг\ ... та_х\ (μ — тх — ... — та-1)1 есть вероятность повториться в μ случаях щ раз событию Е'и Щ — событию Е'ъ ..., /πσ-.! — собБггаю Е'о-х ,μ — т^— — т3 — ... — /ησ_! — собвггию, противоположному Е[9 £8,... ..., £*-1> где ρν ρ2, ..., />σ-ι—суть вероятности событий El El ,..., Е'0-Хъ [101, стр. 38]. 227
Затем выводится формула Стерлинга х\ = γ2πχ?+4*έ' и с ее помощью преобразовывается выражение к виду η * 0 V(i—Ρ) μ ν2πρ(1-ρ)μ «Вот как выражается вероятность, что в μ случаях событие, которого вероятность ρ повторится т раз и, следовательно, остальные μ— т раз будет иметь место событие противуположное, которого вероятность 1— р, где т = ρμ + г» [101, стр. 45]. Далее отыскивается вероятность того, что в μ случаях событие Ε повторится не менее т раз и не более т + s. Обозначив эту вероятность [[ , Чебышев получает \х,т Ц ν*<·+ι> £o где Х= χ = ν2ρ(1-ρ)μ ^2ρ(1-ρ)μ Если число s + Ι не большое, эту сумму нетрудно найти. Но вычисление будет затруднительно, когда s+Ι велико. В дальнейшем Чебышев занимается подсчетом [[ при большом s + Ι. В этом случае он приходит к выводу, что Л=Т(х)-Т(Х + х)9 где 228
Таблицу значений Τ (ζ) Чебышев приводит. Теперь легко получить ρμ+ Уър Ц—р) μ Д = 1—2Г(1) =0,8427008, μ-ρμ.— V2JE? (ι—jt?) μ что является вероятностью того, что в μ случаях событие, вероятность которого р, повторится d раз, где ρμ--^2ρ(1-ρ)μ<<ί<ρμ+ΐ/2ρ(1-ρ)μ. Далее имеем: ρμ+2 Угр (1-р) μ JJ = 1—2Г (2) =0,9953224 μ,ρμ—s У 2pjii—p) μ ДЛЯ ρμ_2^2ρ(1-ρ)μ<<ί<ρμ+2ΐ/2ρ(1-ρ)μ, ρμ+5 /20 (ι—ρ)4μ Д = 1—2Γ (5) =0,999999999998 μ.ρμ—eV2p(i—ρ)μ для ρμ-5/2ρ(1-ρ)μ<Λ<ρμ + 5ν2ρ(1-ρ)μ. Другими словами, это будут вероятности того, «чти в μ случаях отношение числа повторений события, которого вероятность ;р, к числу всех [случаев будет разниться от p__L не более Ш$Е£ „JL9 *Ϊ№=Λ-± ,.„ 2μ У]1 2μ ^μ 2μ 5V2p(l—ρ) 1_ Υμ 2μ"" следовательно, чрезвычайно вероятно, что при большем числе случаев отношение числа повторений события к числу всех случаев будет весьма мало разниться от вероятности события в эти случаи. В этом заключается ? теорема Якова Бернулли» [101, стр. 53]. Чебышев не только доказал теорему Бернулли, но и указал пределы погрешностей при пользовании ею. Затем Чебышев применяет Τ (ζ) для различных задач, β том числе к оценке отклонения средней QT истинного m
значения. Рассматривается пример с определением Ка- вендишем плотности Земли. Кавендиш получил 29 различных результатов, средняя из которых — 5,48. Чебы- шев находит, что с вероятностью 0,9924794 можно утверждать, что эта плотность отличается от плотности Земли не более чем на 0,1. Уже в этой работе отчетливо видна основная идея Чебышева при доказательстве предельных теорем давать оценку приближений, которые необходимы при пользовании этими теоремами. В магистерской диссертации Чебышев доказал теорему Пуассона для ограниченного числа различных вероятностей. Но вскоре он нашел общее элементарное доказательство этой теоремы с соответствующими оценками погрешностей. Этому доказательству посвящена работа «Элементарное доказательство одного общего предложения теории вероятностей», опубликованная в 1846 г. Задачу этой статьи Чебышев сформулировал следующими словами: «Предметом этой заметки будет доказательство следующего предложения: Можно всегда назначить столь большое число испытаний, при котором будет сколь угодно близка к достоверности вероятность того, что отношение числа повторений некоторого события Ε к числу испытаний не уклонится от средней арифметической вероятностей события Ε свыше данных пределов, как бы ни были тесны эти пределы. Это основное предложение теории вероятностей, заключающее как частный случай закон Якова Бернулли, было выведено г. Пуассоном... Однако, как ни остроумен способ, употребленный знаменитым геометром, он не доставляет предела погрешности, которую допускает этот приближенный анализ, и вследствие такой неизвестности величины погрешности доказательство не имеет надлежащей строгости» [103, стр. 14]. Чебышев исходит из следующих соображений. Вероятность Рт того, 'что событие Ε при μ испытаниях произойдет не менее т раз, равна выражению, симметричному относительно всех рк (рк— есть вероятность Ε в k-u испнтании; k принимает значения от 1 до μ) и линейно относительно каждого из рк. Например, относительно рг и рг можно записать: Рт = и + У(рг + рг) + Фргр» 230
где ί/, V и W не зависят от рг и р2. Если 0<а = р1 + ра<1, то Pm = U + Va + Wpxp2 достигает наибольшего значения при рх = ра = ϋ или при Ρι=0. Затем Чебышев доказывает теорему: Наибольшая величина, которую может иметь Рт в случае, когда рг + рг + ... ... -|- Ρμ = s, соответствует величинам ρν р2, ... , ρμ, данным уравнениями Pi =0» Ра ^О» · · · > Рр =0» Рр-н ~ 1» Ре+* — 1ι · · · t Ρρ+σ β 1» d 5 —σ s —σ __ 5 — β * p+σ+ι — —— , ρρ+α+% — ,..., Ρμ — — 9 где ρ, σ — определенные числа. После этого Чебышев при m>s+l получает неравенство Ρ < 1'2'-'lJl (s\ Γμ~$\ wVhl-2---m-1.2-.- (μ — m) \μ ) V μ / μΐ (8\Μ(*-*\ [(μ-m)! \μ ) \ μ ) m I vu i— s \ »i~m~1 m ffl-S m f ii λ \μ—m—1 m m\(iL>—m)\ \n J \ μ / m — s или Pm < рш —^—, где pm — вероятность того, что число т — s появлений события Ε равно т, когда px=p2=z ... = ρμ » = —, т. е. в случае, когда схема Пуассона превращается в соответствующую схему Бернулли. Используя неравенство 2,50 *χ+ν4Γχ < 1 ·2 · · · (* — 1) χ < 2,53 χ*+1^Γχ+ν"χ, Чебышев преобразовывает выражение для вероятности к виду '-<Η==7ν^3(ί)"(5Ξ=Γ* <™> Это неравенство дает следующую теорему: 231
Если вероятности события £ в μ последовательных испытаниях суть ри р2, ..., Ρν и их сумма равна $, то величина выражения. 1 |/Μ(μ — /ηΓ(±\т Ι μ — * \»i-m+1 2(m — s)V μ \m У \μ —mj при т большем, чем s+Ι, превзойдет всегда вероятность того, что Ε случится в эти μ испытаний по меньшей мере т раз. Если в этой теореме перейти к противоположным событиям, то мы прийдем к следующему утверждению: Если вероятности события Ε для μ последовательных испытаний суть ри Рь ...» Рд и их сумма равна s, то величина выражения 1 |Α(μ-η) /μ-д у-* ί±\η+1 2(s — η) У μ νμ — η) \η) при η меньшем s—1 лревзойдет всегда величину вероятности, что Ε случится в эти испытания не более η раз. После этого Чебышев формулирует третью теорему: «Но повторение события Ε может дать место только одному из таких трех случаев: или событие Ε случится по меньшей мере т раз, или не более η раз, или, наконец, более л, но менее т раз. Следовательно, вероятность последнего случая будет определена через вычитание из единицы вероятностей двух первых случаев» [103, стр. 21]. Поэтому как следствие двух последних теорем мы получаем: Если вероятности события Ε для μ последовательных испытаний суть ри Ръ ..., Ρμ и их сумма равна s, то вероятность того, что число повторений события Ε в эти μ испытаний будет меньше т и больше л, превзойдет при т большем s+l и η меньшем 5— 1, величину выражения 1— 1 -|/Μ(μ —тГ/ s \т /μ-s \'*-|И+1 _ 2(т — в) У μ \т ) \μ — т) 1 τ/η(μ-η) /μ-« у-" /M"+1 2 (л-β) г μ \,μ —^ J \п) Из этого результата как следствие вытекает основное утверждение, сформулированное в начале работы. 232
Чебышев установил, что значение нижней границы числа μ испытаний, достаточных для того, чтобы вероятность отклонения Шот ρ более данных пределов была μ меньше некоторой произвольно малой величины, в случае Бернулли применимо к случаю Пуассона. Эта работа содержит первое общее доказательство теоремы Пуассона для независимых событий. Полученная оценка (IV. 1) достаточна для обоснования практических применений этой теоремы. Нужно отметить, что Чебышев не оговаривал независимость событий. Возможно, он считал, что вообще теория вероятностей изучает только независимые события, так как он этого не оговаривает ни в одной из своих работ, хотя понятие независимости им существенно используется и к зависимым событиям свои выводы он не применяет. Следует сказать, что Пуассон ошибочно применял свою теорему и к различным зависимым событиям. Метод, используемый Чебышевым в этой работе, является первым примером экстремального рассуждения, который впоследствии широко применяется Чебышевым. Работа «Элементарное доказательство...» имеет подзаголовок «Извлечение из мемуара по элементарному анализу теории вероятностей». На основании этого С. Н. Бернштейн делает вывод: «Главная часть этой заметки в диссертации отсутствует; из этого можно заключить, что работа «Элементарное доказательство одного общего предположения теории вероятностей» фигурировала при защите П. Л. Чебышевым его диссертации, которая состоялась в Москве в 1846 г.» [104, стр. 45]. Нам кажется, что нет достаточных оснований для такого утверждения, хотя несомненно, что эта работа Чебышева является логическим продолжением его диссертации. 17.ΧΙΙ 1866 г. Чебышев доложил Академии наук свою работу «О средних величинах», которая была опубликована в 1867 г. в «Математическом сборнике» [178] и в журнале Лиувилля [179]. В этой работе Чебышев доказал одно важное неравенство, которое теперь называется неравенством Чебышева. При помощи этого неравенства Чебышев получил теорему, из которой как следствия получаются теоремы Бернулли и Пуассона. 233
В начале работы «О средних величинах» Чебышев доказывает теорему: «Если математические ожидания величин ху у, ζ, ... суть Q., и, С, .. · » а математические ожидания квадратов х2, у2, г2, ... суть &1> и±> С±* · · · > то вероятность, что сумма х + У + г+ ... заключается в пределах а + Ь + с+ ... + а у а^ +Ьг+сг+ ... — а2 — Ь2— са—..., а+ Ь + с + ... —a Vai+b1+cl+ ··· —а2 — Ь2—с*—..., при всяком значении α остается больше 1—1/а2» [103, стр. 431]. Затем Чебышев переходит к следующей теореме. «Если мы изобразим через N число величину, t/, г,..., и, полагая в доказанной сейчас теореме α=* , разделим на N как сумму x+y+z+...9 так и пределы ее а + Ь + с+ ... +aYa1 + b1+c1+ ... — а2—Ь2—с2—... а + 6 + с+ ... — а/а1 + &1+с1+ ... —а2— &2—с2—... то из этой теоремы получим следующую относительно средних величин: Теорема. Если математические ожидания величин Х> У* 2* ...» X , ίτ » * » · ·. суть а,Ь,с, ..., а^, ftp q, ..., то вероятность, что среднее арифметическое N величин х, у, г, ... от среднего арифметического математических ожиданий этих величин разнится не более как на X У N Ni 234
при всяком значении, будет превосходить 1 > [103, стр. 435]. Это и есть знаменитое неравенство Чебышева, которое в современной форме записывается следующим образом: Ρ(|*~*|<ε)>1--^-, (IV.2) где случайная величина χ имеет конечную дисперсию D(x), а ε —любая отличная от нуля положительная величина. Действительно, первую теорему Чебышева можно записать так: ... -аУ,7 + 7+*?+ ··· -ix)2-(y)*-®2- ···< <х + У + г+ ... <*+]/ + * + ... + + аУр+7+?+ ··· -®a~(£)f~(*)f~-..)> > 1 - 1/оЛ Применим эту теорему к случайной величине х: P(I-aVrP-Oi)a<JC<J+ay'l?-Qa)>l-l/ai. Но?— (x)*=D(x), р(1 — аУЩх)^х^ J + a|/D(W)> 1—1/a2, Я(*—*|<«1^))>1—1/<А Пусть аУгГМ = ε, тогда аа = —2— и мы получаем прн- J D(x) вычную формулу (IV. 2). Как следствие из своего неравенства Чебышев получает следующую теорему. «Если математические ожидания величин ии и2, и3 ... , wi, u\, ... не превосходят какого-либо конечного предела, то вероятность, что среднее арифметическое N таких величин от среднего арифметического их математических ожиданий разнится менее чем на какую-нибудь 235
данную величину, с возрастанием числа N до оо, приводится к единице» [103, стр. 436]. _ Действительно, рассмотрим случайную величину х, представляющую собой среднюю арифметическую из данных случайных величин ~ *г + *2+ ··. +хПт λΛ ,~ч _ M|(xi)H- Μ (χ2) + А . +\М (хп) ; ~ _ Ρ(*ύ+Ρ(χύ+ ■■. + £(*„) Если ограничены математические ожидания случайных величин и их квадратов, то ограничены также и дисперсии, т. е. все D(Xi)<c, где с — некоторое число. Тогда D(x)<nc/n?=c/n. Применим теперь неравенство Чебы- шева к х: Ρ(|*_Λί(*)|<ε)>1-^, £ или р1|—η η—гР **' Переходя к пределу, получаем Я-*» \| Л П \ / Это и есть теорема Чебышева — закон больших чисел Чебышева. Эта теорема устанавливает, что при достаточно больших η с вероятностью, близкой к единице, можно полагать, что среднее арифметическое случайных величин как угодно мало колеблется около некоторого постоянного числа — среднего их математических ожиданий. Теоремы Пуассона и Бернулли являются частными случаями закона больших чисел Чебышева. Действительно, пусть в η испытаниях событие А наступает с вероятностями ри рь ..., р«- Рассмотрим случайную величину χι — число наступлений события А в 236
ί-м испытании. Тогда Λί(*/) =Ь pi +0· qi = да D{xt) = ft^<V4; — __ *i + *« + · · · H" -Уд ___ m л:/ удовлетворяют условиям теоремы Чебышева, т. е. Цш р(|* + *.+ ... +*п_Р1 + Ъ+ .·· +Рп\<е) д1> л-юо VI л л I / или ϋ'(|τ-?|<·)-'· где р — среднее арифметическое из вероятностей наступлений событий в отдельных испытаниях. А это и есть теорема Пуассона. Если все pi =/?, то и р=р, и мы получим теорему Вернул ли: ШпР(|2—р|<е\«1. л-к» \| Λ | / Следует сказать, что идея вывода основного неравенства (неравенства Чебышева) содержалась в работе Ж. Бьенэме, посвященной методу наименьших квадратов. Причем эта работа была помещена в том же номере журнала Лиувилля, что и работа Чебышева [179]. За этим неравенством надолго закрепилось имя неравенства Бьенэме — Чебышева. А. А. Марков объяснял это следующим образом. «Мы соединяем с этим замечательным, простым неравенством два имени Бьенэме и Чебышева по той причине, что оно впервые ясно высказано и доказано Чебышевым, но основная идея доказательства была значительно раньше указана Бьенэме, в мему- аре которого можно найти и самое неравенство, обставленное только некоторыми частными предложениями» [94, стр. 92]. Но ввиду того, что неравенство «впервые ясно высказано и доказано Чебышевым», а также потому, что применение этого неравенства к обобщению закона больших чисел полностью принадлежит Чебышеву, в современной 237
литературе это неравенство называется неравенством Че- бышева. Из этого неравенства вытекает, в частности, закон больших чисел в классической формулировке Чебышева. Если закон больших чисел был в наиболее общей форме доказан Чебышевым в 1866 г., то вторая основная проблема, которой он занимался,— центральная предельная теорема — была опубликована только в 1887 г. в «Записках Академии наук» в работе под названием «О двух теоремах относительно вероятностей». (В 1891 г. она была перепечатана в «Acta mathematical). Первая теорема, о которой говорится в этой работе,—это закон больших чисел, доказанный в статье «О средних величинах». Вторая теорема, которую доказывает Чебышев, сформулирована им так: «Если математические ожидания величин Щ* ^2» ^8> ' " " равны нулю, а математические ожидания всех их степеней имеют числовую величину ниже какого-либо конечного предела, вероятность, что сумма л величин и1 + иъ + из + ··· +и«> деленная на квадратный корень из удвоенной суммы математических ожиданий их квадратов, заключается между двумя какими-нибудь величинами t и f с возрастанием числа η до оо имеет пределом величину интеграла — [e~xldx»[\05, стр. 230]. Разберем несколько подробнее эту формулировку. Чебышев рассматривает последовательность случайных величин ί^, и2, ..., ип. Математические ожидания μ-χ степеней этих величин обозначим α£μ) = Μ (α£). Тогда теорему Чебышева можно записать так. Если выполняются следующие условия: 1) <№ =0; 2) а{а\ а{п\ ..., а{п\ ... не превосходят по абсолютной величине какого-либо конечного предела; 238
то Второе условие сформулировано не совсем отчетливо. Относительно этого А. Н. Колмогоров пишет: «Судя по дальнейшему тексту, его [второе условие.—Л.М.] следует понимать так: математические ожидания а«при каж- д дом μ не превосходят некоторой постоянной, не завися- шей от η (но, может быть, зависящей от μ)» [105,стр.406]. Следует также иметь в виду, что Чебышев здесь, как и в других местах, не оговаривает взаимную независимость ии и*..., ип. «Однако в формулировке Чебышева,— замечает Колмогоров,— пропущено еще одно условие, без которого его теорема по ее буквальному смыслу ошибочна. Дело в том, что в своих рассуждениях Чебышев, по-видимому, упустил из виду, что, вообще говоря, выражение 1 _ 4а) + <4а)+...+д<я8) может при л-юо стремиться к нулю. Проще всего дополнить формулировку Чебышева условием: средние арифметические 1 _ φ+ €?&...+& при /г-^оо стремятся к конечному положительному пределу \» [105, стр. 40в]. При этих несколько измененных и дополненных условиях теорема Чебышева может быть доказана совершенно строго. В этой работе Чебншев широко! Ьспользует теорию моментов. Проблема моментов возникает в математике в разных областях: при изучении ряда вопросов теории приближенных вычислений определенных интегралов, теории непрерывных дробей и в^других вопросах. Эта проблема состоит 239
в следующем. Заданы числа C/(i = l,2, ..., k). Требуется ь найти такую функцию <р(дс), чтобы Ck = ? x?dq(x). Проблема а имеет разные аспекты в зависимости от того, конечны или ь бесконечны а и b. С* = \ x?dy(x) называются моментами а порядка k. Если φ (я) имеет производную, которая интегрируема по Риману, то момент fe-ro порядка^ будет ь Ck = \x*f(x)dx. Проблемой моментов занимались многие ученые. Че- бышев рассматривает эту проблему в статье «О предельных величинах интегралов» (1874 г.) (см. [106, § 2]). В работе «О двух теоремах относительно вероятностей» Чебышев. по существу создал метод моментов в теории вероятностей. В начале работы, ссылаясь на свою статью «Об интегральных вычетах, доставляющих приближенные величины интегралов», доложенную 18.XI 1886 г. и опубликованную в 1887 г., Чебышев "формулирует полученный в этой статье результат. «Если функция^/(*), оставаясь положительною, дает $/(*)&-1, J xf(x)dx=0, —со —со +00 ' +00 ^x*f(x)dx = ±, J x»f(x)dx=0, .... J *r~fWdx= 1·3·5··;^~3) , [ xtmr-1f(x)dx=0, —00 Ч —00 то величина интеграла ] f(x)dx —00 240
заключается в пределах 1 С Γχ*άχ 3 УТ (m« ~2т +3)'/' foV +1)» ? Уя J 2(т-3)»Ут"=Т VT — С <Гх'</л; + 3 VJ (т* -2т +3)''' . (^ +1)» д ^ УзГ J 2(т-3)»Ут^Т —00 Ч ' W [105, стр. 229—230]. Это утверждение справедливо при условии, что все моменты функции /(*), вплоть до (2т—1)-го, совпадают с моментами функции —i—e-1/*^ т. е. УЪл -foo -Η» q*x* —00 —00 +00 +00 ?»*» -foo +οο g's* -foo -foo ц%хг я \ xw^f{x)dx = -4г 5 χ2Μ"1β 2 dx- Далее после формулировки основной предельной теоремы доказывается, что в условиях этой теоремы моменты величины __ "1 + tl2 + ... +Un χη _ _ Уп сходятся к моментам распределения Муавра — Лапласа. 241
Следовательно, проблема заключается в доказательстве следующих соотношений: +°° _££ (1-3-5··· (μ—1) /..χ η f .. —г ι ■ при μ четном л-юо ΐ/2π J Ι Λ r -oo 10 при μ нечетном, где А{п]— моменты л#, т. е. Λ(Λμ) = Λί (хй), а "i + «a + ··· + "„ *я = гг Из неравенств, приведенных в начале работы, следует, что непрерывная функция /(*), для которой все моменты -И» _JS2 С χμϊ(χ)άχ равны Λ(μ), совпадает с —3-е *. Но фактически необходимо доказать, что из того, что для последовательности неотрицательных функций fn(x) +00 моменты Ляй) = ί // (χ) dx сходятся при /г -> оо к моментам —со +00 __ J1*1 g»*» ^^ = -4_ (Л а dx функции 7(*) = -4г-* \ У"2я J^ У 2л следует, что для любого / t t ^ \ fn(x)dx-+ С J(x)dx при п-*оо. —•о —to Чебышев не доказывал этого. Он фактически считал очевидным, что если последовательность законов вероятно- +00 стей Ρ η (х) такова, что lim С xkdPn (х) = С*, где С* — мо- л-юо J —00 менты, однозначно определяющие некоторый закон Р(х), 242
(+00 ν Ck = С xfdP (*)), то Рп(х)-*Р(х)· Это было вскоре дока- —00 / зано А. А. Марковым при помощи неравенств Чебышева. Чебышев после доказательства сходимости моментов "l + **% + · · · + Un хп = утверждает, что из этой сходимооти и неравенств, приведенных в начале статьи, следует утверждение основной теоремы, которое может быть записано в виде НтР(/<*я</')=-2=-^ 8 dx. /ι-*όο У2зх J Как указывалось ранее, приведенное утверждение требует и некоторого уточнения и некоторых дополнительных доказательств. Рассмотренная выше работа Чебышева помещена в томе III его «Полного собрания сочинений» с комментариями А. Н. Колмогорова, в которых дан глубокий анализ этого произведения. Общая оценка этой работы Колмогоровым дается в следующих словах. «Этот мемуар, несмотря на некоторую его незавершенность, является одним из высших достижений Чебышева и реализацией замыслов, занимавших Чебышева в течение долгих лет. Здесь результаты исследований Чебышева по теории моментов прилагаются к определению вида закона распределения вероятностей суммы большого числа независимых случайных величин, устанавливается, что при некоторых весьма общих условиях этот закон распределения неограниченно приближается с увеличением числа слагаемых к нормальному закону распределения Муавра—Лапласа (так называемая «основная предельная теорема теории вероятностей»), а также без строгого вывода указывается на возможность дальнейшего уточнения этого результата» [105, стр. 404]. Б. В. Гнеденко дает следующую оценку этой работе: «Чебышев не дал строгого доказательства своей теоремы, даже больше — он не ввел ограничений, необходимых для того, чтобы теорема была верна. Но, несмотря на допущенные им логические пробелы, за ним остается та великая заслуга, что он заострил внимание на этой важ- 243
ной проблеме, создал метод ее доказательства (метод моментов) и заинтересовал ею своих учеников, которые не только довели до конца доказательство этого предложения, но и распространили условия ее применимости почти до естественных границ» [82, стр. 399]. Основных вопросов, которыми занимался Чебышев в теории вероятностей, было два: закон больших чисел и предельная теорема для сумм независимых случайных величин. Перед ним стояла задача — доказать для возможно более широкого класса случайных величин эти теоремы. Это были центральные вопросы теории вероятностей. От их решения зависел дальнейший путь развития теории вероятностей. Проблема закона больших чисел была полностью решена Чебышевым в 1866 г. в работе «О средних величинах». Решение же проблемы центральной предельной теоремы было достигнуто только через 20 лет. Случайные явления происходят, как правило, под воздействием большого числа причин, каждая из которых в отдельности оказывает незначительное влияние на явление. Так как число причин велико, распределение вероятностей каждой из этих величин в общем случае неизвестно, и определить функцию распределения суммы этих величин часто бывает не только очень трудным, но и невозможным. Поэтому определяют предельную функцию распределения, т. е. функцию распределения, когда число причин /ι->οο, и заменяют ею ту функцию, которая должна описывать характер явления. Еще Лаплас предполагал, что наличие нормального закона, которому подчиняются случайные ошибки измерений, указывает на то, что ошибка измерения происходит под влиянием большого числа независимо действующих причин. Эта мысль была только высказана Лапласом, но не получила развития в его работах. Возможность замены точной функции распределения — предельной вытекает из так называемой центральной предельной теоремы. Сущность ее состоит в выяснении условий, при которых функция распределения сумм независимых случайных величин с ростом числа слагаемых приближается к нормальному закону распределения. Огромное число явлений происходит под действием боль- 244
шого числа причин, каждая из которых действует независимо от других и очень мало влияет на течение явления. Поэтому эта теорема имеет такое большое значение для всего естествознания. В своей последней работе по теории вероятностей «О двух теоремах относительно вероятностей» (1887 г.) Чебышев фактически подводит итог своей деятельности в этой области. Сначала он формулирует свою теорему относительно закона больших чисел — это и есть первая теорема. Вторая теорема является одним из важнейших результатов Чебышева. В ней он устанавливает, что при весьма общих условиях закон распределения вероятностей суммы большого числа независимых случайных величин неограниченно приближается с увеличением числа слагаемых к нормальному закону распределения. Таким образом, и вторая основная проблема теории вероятностей была также разрешена Чебышевым. О роли, которую сыграл Чебышев в теории вероятностей, А. Н. Колмогоров писал: «Вывел русскую теорию вероятностей на первое место в мире Пафнутий Львович Чебышев. С методологической стороны основной переворот, совершенный Чебышевым, заключается не только в том, что он впервые с полной настойчивостью выдвинул требование абсолютной строгости доказательства теорем (выводы Муавра, Лапласа и Пуассона были с формально-логической стороны совсем не безупречны в отличие, впрочем, от Бернулли, который свою предельную теорему доказал с исчерпывающей арифметической строгостью), но главным образом в том, что Чебышев всюду стремился получать точные оценки отклонений от предельных закономерностей, возможных хотя бы и при большом, но конечном числе испытаний в виде безусловно правильных при любом числе испытаний неравенств» [46, стр. 56]. Устанавливая границы применимости основных теорем теории вероятностей, Чебышев давал случайным величинам ясные и отчетливые математические характеристики, которые имели реальное содержание. Это позволяло в каждом конкретном случае решать вопрос о том, применимы ли к данным случайным величинам предельные теоремы. В трудах Чебышева теория вероятностей не была абстрактным построением, он указал широкие классы 245
случайных явлений, к которым она применима. Его работы по теории вероятностей быстро нашли применение и распространение. Чебышев является стихийным материалистом, пришедшим к материализму через естествознание, в первую очередь через математику и механику. В некоторых своих взглядах он приближался к отдельным диалектическим положениям. Сюда относится прежде всего его понимание роли практики в развитии теории. Чебышев создал материалистическую русскую школу теории вероятностей. Как показала дальнейшая история теории вероятностей, ее последующее развитие шло по намеченному им пути. Мы закончим рассмотрение работ Чебышева по теории вероятностей словами А. Я. Хинчина, который говорил, что, начиная со второй половины XIX в., Россия была «единственной страной, в которой математические основы теории вероятностей культивировались с той серьезностью, какой заслуживала эта наука по своей выдающейся роли в естествознании и технике. Этим своим исключительным положением русская теория вероятности целиком обязана работам Чебышева» [107, стр. 36]. § 2. Крупнейшие представители Петербургской школы Ближайшим учеником и лучшим выразителем идей Чебышева был А. А. Марков (1856—1922 гг.). С. Н. Бернштейн пишет о нем: «Несомненно, самым ярким выразителем идей и направления Чебышева в теории вероятностей был А. А. Марков, наиболее близкий своему учителю по характеру и остроте своего математического дарования... Его оригинальные мемуары, являющиеся образцами точности и ясности изложения, в наибольшей степени содействовали превращению теории вероятностей в одну из самых совершенных областей математики и широкому распространению направления и методов Чебышева» fl04, стр. 59—60]. Основные работы Маркова по теории вероятностей относятся к предельной теореме для сумм независимых величин, к предельным теоремам для зависимых величин, в том числе связанных в цепь. 246
Вопрос о предельной теореме для сумм независимых величин состоял в том, чтобы установить условия, для которых справедливо предельное соотношение t _£ limP(Sn<M(Sn)+ tVmsJ)^-^ [e 2 dx, г —со где D(Sn) =M\Sn—M(Sn)]2 —дисперсия суммы Sn. Чебышев доказал это утверждение для определенного класса случайных величин. Для этого он применил метод моментов, но его доказательство предельной теоремы этим методом, как указывалось выше, имеет некоторые недостатки. Занимаясь вопросами, связанными с предельной теоремой, Марков с 1898 г. в течение ряда лет применяет* метод моментов Чебышев а. Первое доказательство предельной теоремы Марков изложил в 1898 г. в письмах к профессору Казанского университета А. В. Васильеву, выдержки из которых были опубликованы в том же году fl73]. В письме от 23.Х 1898 г. Марков пишет: «Мемуар Че- бышева «О двух теоремах относительно вероятностей» имеет важное значение. К сожалению, это значение сильно затемняется двумя обстоятельствами: 1) сложностью выводов, 2) недостаточною строгостью суждений» [108, стр. 233]. Далее он говорит, что давно имел желание упростить доказательство Чебышева и вместе с тем сделать вполне строгим анализ Чебышева. После этого Марков приступает к доказательству предельной теоремы, которую записывает следующим образом: «Для начала беру теорему о математических ожиданиях, которая составляет главное содержание мемуара «О двух теоремах относительно вероятностей». Ее можно формулировать так. Если математические ожидания независимых величин 1» ^2» *^3> · · · » «*я равны нулю, а математическое ожидание степени 247
для всякого целого положительного числа k остается числом конечным, когда η возрастает беспредельно, то при беспредельном возрастании числа η приближается к пределу нуль каждая из разностей т ( /v._I_v._L J_v \2\Ή/2 Μ·°·(—*ϋ—) -ΑΤ°Λ—^—)\· где m — целое положительное число и Ат=— [ tme^*dti>{№, стр. 234]. • —00 Другими словами, Марков рассматривает сумму независимых случайных величин xt(l =1,2, ..., η) при Μ (xi) =0, таких, что для всякого целого k существует fe-тый момент Μ (j*£), ограниченный по абсолютной величине Сь которое зависит, вообще говоря, от k, но не от /г. Пусть также Υп = — -—— . При этих условиях Марков докажи зьгоает, что где lim {M(YZ)-~Am[M(Ym =0, п-*оо Υπ Эта формулировка предельной теоремы несколько отличается от чебышевской и не содержит тех неточностей, которые имеет последняя. Доказательство Маркова, основанное на применении свойств математических ожиданий и обобщенной формулы бинома Ньютона, вполне строгое и не имеет тех логических пробелов, которые имеются в доказательстве Че- бышева. В статье [174] Марков доказывает предельную теорему в следующей формулировке. «Вероятность, что сумма иг+и2+ ... +ип 248
независимых величин содержится между аУ2(а1 + а2+ ... +ап) и β^ί^ + ^Η- ... + α„), где аь а2, .... аЛ — математические ожидания величин 2 2 2 #1, ί/2, · · · » ^rt и α и β — две какие-либо заданные величины, стремится при неограниченном возрастании η к пределу, равному ±-\e~*dx, α если бесконечная последовательность независимых величин удовлетворяет следующим условиям: 1) математические ожидания величин «!,*>* .. Л иЛ равны нулю; 2) математические ожидания величин #Л» #£, Wfe, ... остаются конечными для конечных значений k в случае, когда k неограниченно возрастает; 3) математическое ожидание величины «S не делается бесконечно малым, когда k неограниченно возрастает» [108, стр. 267—268]. В современной формулировке теорема Маркова записывается следующим образом: Если последовательность взаимно независимых случайных величин |ь &, ..., In, ... такова, что при всех 249
целочисленных значениях г>3 выполняются соотношения С η (г) где то lim -ill: *=ο, в2=%ВЬ\Сп(г)~%М\Ь-МЪГ. limP Hr-2 (б*-А«Ьк)<4=-^г- ^ а л. Итак, Марков доказал предельную теорему при тех же ограничениях, которые были и у Чебышева. Основное из них состоит в требовании существования у случайных величин конечных моментов любого порядка. В 1900 и 1901 гг. появились две работы А. М. Ляпунова: «Об одной теореме теории вероятностей» и «Новая форма теоремы о пределе вероятности» [175], [176], в которых он доказал предельную теорему для случайных величин с гораздо меньшими ограничениями, чем требовал Марков. В первую очередь это относится к отказу от требования существования моментов всех порядков у рассматриваемых случайных величин. При доказательстве своей теоремы Ляпунов отказался от метода моментов; он разработал и применил метод характеристических функций. Именно в формулировке Ляпунова предельная теорема получила название центральной предельной теоремы теории вероятностей. Казалось, что методом моментов нельзя достичь такого результата, так как характеристические функции существуют для любой случайной переменной, хотя математические ожидания ее каких-либо степеней существуют не всегда. По поводу сложившейся ситуации Марков писал: «В этом значительном мемуаре [речь идет о работе Чебышева «О двух теоремах относительно вероятностей»], ясно показавшем значение метода математических ожиданий, оставались некоторые пробелы как в формулировке, так и в доказательстве теоремы; они пополнены ^50
мною в статьях «Закон больших чисел и способ наименьших квадратов» и «Sur lesratines del9equation e = dxm =0». Таким образом, были установлены условия, при соблюдении которых теорема о пределе вероятности несомненно должна иметь место; этих условий достаточно для существования теоремы, и они являлись необходимыми, чтобы можно было прийти к ней путем известных простых рассуждений. Впоследствии академик А. М. Ляпунов поставил себе цель прийти к теореме о пределе вероятности иным путем, дополняя надлежащим образом обычный вывод приближенной формулы, и вместе с тем установить эту теорему для возможно большего числа случаев, что и сделано им в мемуарах «Stir une proposition de la theorie des probabilites» и «Nouvelle forme du theoreme cur la li- mite de probabilites. Общность выводов в последней работе А. М. Ляпунова далеко превзошла ту, которая была достигнута методом математических ожиданий. Достигнуть столь общих выводов методом математических ожиданий казалось даже невозможным, ибо он основан на рассмотрении таких математических ожиданий, в неограниченном числе, существование которых в случаях А. М. Ляпунова не предполагается. Для восстановления поколебленного таким образом значения метода математических ожиданий необходимо было выяснить, что вышеупомянутыми работами он далеко не исчерпан до конца. Об этой задаче я думал довольно долго, и мне удалось решить ее» [108, стр. 321— 322]. Марков доказал теорему Ляпунова методом моментов в следующей формулировке. «Пусть будет 2χ> ^2» · · · » 2fc, · · · , 2/ι> . . . — неограниченный ряд независимых величин; пусть, вместе с тем, при всяком k существуют а* -ш* М. 0.г*, h = Μ. О. (г* =- о*)1 251
b£+6) = M.O.\zk-ak\2+\ где δ — некоторое положительное число, а символ IVI для любого количества V означает абсолютную его величину. Положим, наконец, что отношение Ь(2+а) + 6<и-д)+ _ +#+*> (ь1 + ь2+ ... +bnf+w приближается к пределу нуль, когда η беспредельно возрастает. Таковы условия А. М. Ляпунова. Нам надо доказать, что при соблюдении их оправдывается теорема о пределе вероятности: для любых данных чисел t\ и /*> из которых второе больше первого, вероятность неравенства Y2(b1 + b2+ ... +bn) стремится к пределу и 1 С „-*■ \ё~* dt% *1 когда η возрастает беспредельно» [108, стр. 322—323]. Эту теорему Марков доказал в работе «Теорема о пределе вероятности для случаев академика А. М. Ля* пунова» (1913 .г.), которая непосредственно примыкает к статье «Неравенства Чебышева и основная теорема». Обе эти работы были впервые опубликованы в третьем издании «Исчисления вероятностей». Во второй из этих работ рассмотрено разложение интеграла J Ζ — t в формальную непрерывную дробь и ее подходящие дроби, а также соотношение Цебцтева, которое связывает
значение интеграла -Μ e-'dt У η J —oo при любом α с коэффициентами в разложении подходящей дроби на простейшие. В первой работе метод моментов применяется в такой форме, что он позволяет доказать центральную предельную теорему Ляпунова. Основной идеей применения метода моментов является введение так называемых срезанных случайных величин. Срезанные случайные величины Xk определяются следующим образом: Xk = *k — ak при |2Λ — α*|<Ν и хк=0 при \гк — Qk\>N9 где гк — рассматриваемые случайные величины, а ак = Μ (г*). Для xk существуют моменты любого порядка. При соответствующем выборе N распределение суммы хк будет мало отличаться от распределения исходной суммы в условиях Ляпунова, обе эти суммы имеют одно и то же предельное распределение. Идея срезанных величин позволяет Маркову доказать теорему Ляпунова в условиях последнего. Этот прием часто использовался во многих последующих исследованиях, когда срезанная величина вводится по следующему правилу: χ. ^ ixk> если \xk\<N \0, если | xk | > N. При достаточно большом N равенство х* = хк почти достоверно нх'к обладают моментами всех порядков. В конце работы Марков приводит пример, когда центральная предельная теорема не выполняется. Естественно, что в этом случае нарушаются условия Ляпунова. Марков в теории вероятностей является основателем одного из важнейших ее разделов — изучения зависимых №
случайных величин. Здесь его интересовало в основном два вопроса: применимость закона больших чисел и центральной предельной теоремы к суммам зависимых величин. Хотя в предыдущем изложении мы широко пользовались термином «закон больших чисел», мы нигде не уточняли его. Я. Бернулли не называл так свою теорему. Впервые «Закон больших чисел» появляется у Пуассона. Любопытно, что Чебышев не называл доказанную теорему «законом больших чисел», хотя теорема Пуассона получается из нее как частный случай. Марков под этим законом понимал закон, «в силу которого с вероятностью, сколь угодно близкою к достоверности, можно утверждать, что среднее арифметическое из нескольких величин, при достаточно большом числе этих величин, будет произвольно мало отличаться от средней арифметической их математических ожиданий» [108, стр. 341]. При таком понимании закона больших чисел и теорема Бернулли, и теорема Пуассона, и теорема Чебышева будут его различными формами. Последняя является наиболее общей формой закона. Такое понимание теперь общепринято. Рассказав о содержании закона больших чисел Чебышева, Марков пишет: «Конечно, условия Чебышева далеко не исчерпывают всех случаев, к которым можно применить вышеуказанный закон» [108, стр. 342]. Чебышев, как мы знаем, распространил закон больших чисел на независимые случайные величины с равномерно ограниченными дисперсиями: D(x) <c. Марков расширил условия применимости этого закона. В работе «Распространение закона больших чисел на величины, зависящие друг от друга» 1, Марков установил, что если последовательность взаимно независимых случайных величин хи Х2, ···, *п такая, что Hm DW+DW+.-+°W=llm.-i! DM =0, п-*со Пг /г-н» ~ 1 Эта работа впервые опубликована в «Известиях физико-математического общества при Казанском университете» серия вторая, т. XV, № 4. На обложке этого номера «Известий» стоит 1906, а в конце статьи Марков поставил дату: 25 марта 1907 г. 254
то Цш/>(|* + '» + -+>п_ п-+оо VI П М(хх)+М(хг) + ... +М(хп) η Впоследствии Колмогоров показал, что это условие близко к необходимому условию, установленному в различной форме Колмогоровым (1928 г.) и Хинчиным (1929 г.). В этой работе Марков доказывает, что закон больших чисел применим к 5Λ=2-ν/, если D(Xi)<C и связь величин такова, что увеличение любой из них влечет за собой уменьшение математических ожиданий остальных. Далее Марков делает замечание: «к тому же заключению о применимости закона больших чисел не трудно прийти и в случае, когда математическое ожидание Xk при всяком k уменьшается с увеличением суммы хг + х2 + -.. +Xk-i» [108, стр. 344]. Затем Марков рассматривает последовательность случайных величин, связанных в цепь. Такие цепи зависимых величин получили название марковских цепей. Учение о марковских цепях выросло в большой отдел теории вероятностей. Последовательность случайных величин, каждая из которых может принимать любое число исходов, называется простой цепью Маркова в том случае, когда вероятности исходов при (л + 1)-м испытании получают определенные значения, если известен только результат /г-го испытания. Если же эти вероятности получают определенное значение, только когда известны результаты k предыдущих испытаний, то цепь называется сложной цепью Маркова k-vo порядка. В этой работе Марков рассматривает простую цепь, причем все Х( принимают значения только 0 или 1. Он устанавливает, что эти случайные величины также подчинены закону больших чисел. Нужно отметить, что в работе Марков требовал, чтобы для всех вероятностей перехода выполнялось условие Ραβ>0. Но выводы Маркова остаются справедливыми, если вместо такого 255 <·)-!.
сильного ограничения требовать только, чтобы это условие выполнялось хотя бы для одной вероятности при любом а. Кончается эта работа замечанием о том, что независимость величин не составляет необходимости условия для существования закона больших чисел. В целой серии дальнейших работ («Распространение предельных теорем исчисления вероятностей на сумму величин, связанных в цепь» (1907 г.), «О связанных величинах, не образующих настоящей цепи» (1911 г.), «Об одном случае испытаний, связанных в сложную цепь» (1911 г.), «Об испытаниях, связанных в цепь ненаблюдаемыми событиями» (1912 г.)) Марков доказывает применимость центральной предельной теоремы к суммам случайных величин, которые связаны в простую однородную цепь или в сложную однородную цепь, к двумерным векторам, связанным в цепь, а также к суммам, связанным в так называемую цепь Маркова — Брунса. В дальнейшем Марков ввел в рассмотрение различные цепи величин. Касаясь работ Брунса, Марков пишет: «В книге Г. Брунса (Н. Brims. Wahrscheinlichkeitsrechnung und Kollektivmasslehre) и в статье того же автора «Das Gruppenschema fur zufallige Ereignisse» (Abhandlungen der mathematisch-physischen Klasse der Koniglich Sach- sischen Gesellschaft der Wissenschaften, 1906, B. XXIX) рассматриваются замечательные случаи зависимых испытаний, не подходящие под установленное нами понятие о цепи испытаний» [108, стр. 401]. Здесь имелось в виду следующее. Дана последовательность Υν Υ2, ..., Кя, ... независимых случайных величин Υη, принимающих два значения 1 или 0 с соответствующими вероятностями α и β (α + β =1). Рассматривается последовательность зависимых величин #„ = = УЛУя+1| η =1,2, ..., представляющих собою произведения двух смежных членов данной последовательности. Последовательность лср *2, ..., хп, ... представляет простейший случай цепи Маркова — Брунса. Марков доказывает, что к S„ = Σχη применима центральная предельная теорема, если 5л=Д(5я)>ая, где ая>0. В работе «Исследование общего случая испытаний, связанных в цепь» (1910 г.) Марков рассматривает предельное распределение суммы Sn = Σ*/, где χι образуют неоднород- 256
ную цепь и принимают только два значения: 1 или 0 с переходными вероятностями Pt =P(xt =1 |*/_ι =1), pi = P(Xi=l\Xi^ =0). К сумме Sn для случая p0<Pi<l — p0, Ρ0<Ρ'ί< 1 — Ρ0· где ρ0>0— постоянное, не зависящее от η число, оказывается применима центральная предельная теорема. Доказательство Марков проводит методом моментов. Случай неограниченного приближения р0 к 0 Марковым не рассматривается. В 1926 г. С. Н. Бернштейн получил этот же результат Маркова. Более того, он доказал, что центральная предельная теорема применима к 5Л, если р0 = 1/па> где а<^г/ь, и может быть не применимой, если α = 1/ъ. Исследования цепей Маркова, а затем и марковских процессов, имеют важное значение в приложениях теории вероятностей к различным разделам естествознания и техники^ Цепи Маркова применимы тогда, когда имеются такие системы, которые могут переходить из одного состояния в другое только в определенные моменты времени tv /2, ..., 4, ..., и известна вероятность рц того, что система в момент времени 4+1 находится в состоянии ω/, если известно, что в момент времени 4 она находилась в состоянии α>,·. К такой системе, например, относится модель атома Бора. В этой модели электрон атома водорода может находиться на одной из допустимых орбит. Пусть электрон находится на t-й орбите. Предположим, что изменение состояния атома может наступать только в моменты времени tu t2t tZy.... Вероятность перехода с ί-й орбиты на /-ю зависит только от i и /. Разность / — i зависит от количества энергии, на которую изменился заряд атома. Вероятность перехода не зависит от того, где находился электрон раньше. Марковские процессы — это такие процессы, для которых состояние системы в начальный момент времени определяет закон распределения вероятностей возможных состояний этой системы в последующие моменты времени. Цепи Маркова являются частными случаями такого рода процессов, когда состояние системы изменяется скачками в отдельные моменты времени и число возможных состояний системы конечно. Теория марковских про- 257
цессов находит применение в теории брауновского движения, в теории диффузии, в квантовой механике и многих других областях. Сам Марков не рассматривал никаких естественнонаучных или технических приложений цепей. В работе «Замечательный случай испытаний, связанных в цепь», которая помещена в конце его книги «Исчисление вероятностей», Марков исследует чередование гласных и согласных букв в русском языке. Для этого он берет последовательность из 20000 букв из «Евгения Онегина». Он пишет, что эту последовательность с некоторым приближением можно рассматривать как простую цепь. Марков исследовал также 100000 букв из «Детских годов Багрова-внука» С. Т. Аксакова. Он искал вероятность того, что наугад взятая буква из русского текста будет гласной. Эта вероятность зависит от того, гласной или согласной будет предшествующая буква. Для «Евгения Онегина» вероятность появле- ция гласной после гласной равна <х=0,128, гласной после согласной — β = 0,663. Простая цепь Маркова обладает эргодическим свойством, т. е. свойством, когда предельное распределение не зависит от начального состояния (lim ^(л:, /|ξ, t) = =F(x)). В этом случае limas=:lin^s = ——, s-*oo s-хэо 1— γ где γ=α—β. Применяя эту формулу к нашему случаю, получим, что вероятность встретить на л-м месте гласную букву будет равна lim ап = -J— ^ 2*» « 0,432. п+оо 1-α+β 1-0,128+0,633 Марков подсчитал, что эта величина совпадает с частотой, с которой встречается гласная буква в тексте «Евгения Онегина». Марков начал преподавать в Петербургском университете в 1880 г. в качестве приват-доцента. Здесь он читал различные математические курсы. В 1883 г. из университета ушел Чебышев, и Марков вместо него начал чтение курса теории вероятностей. Даже после того, как 258
в 1905 г. Марков вышел в отставку со званием заслуженного профессора, он продолжал читать в университете курс теории вероятностей. Приведем характеристику, данную Маркову как лектору: «Основным свойством в преподавательской дея« тельности А. А. было стремление дать слушателям весь материал курса в безупречно-строгом виде, при этом А. А. не стремился к нагромождению обильного материала, но к заложению прочного фундамента, на котором у его учеников строилось критическое отношение к изучаемому материалу и к своей работе у тех из них, кто пошел по пути самостоятельного научного творчества. В лекциях А. А. всегда видна была живая деятельность его острой мысли, несмотря на то, что материал для лекций был тщательно всегда обработан и подготовлен. Это особенно ценное свойство лектора, так как это больше всего вызывает также работу мысли и у слушателей» [109, стр. IV]. Высокое качество его лекций нашло отражение в книге «Исчисление вероятностей» (1913 г.). Здесь в полной мере были изложены новые идеи и результаты. Будучи высокоиаучным произведением, эта книга рассчитана также и на начинающего читателя. Доказательства проводятся с полной строгостью и с предельной полнотой. Большое внимание обращено на прикладные вопросы. В предисловии к этой книге сказано: «Самым ценным свойством книги является то, что она дает не обезличенный сглаженный научный материал, а вся проникнута чертами непосредственного исследования. Эти черты дают книге характер редкого классического произведения, равного которому нет в теории вероятностей» [109, стр. XIV]. Четвертое издание этой книги вышло в 1924 г., по ней в течение многих лет учились русские математики. Начинается книга с основных понятий и теорем. Для вероятности дается классическое определение. Но к определению равновозможности («Два события мы называем равновозможными, если нет никаких оснований ожидать одного кз них предпочтительно перед другим. Несколько событий мы называем равновозможными, если каждые два из них равновозможны») Марков делает следующее примечание: «По моему мнению, различные понятия определяются не столько словами, 259
каждое из которых может, в свою очередь, потребовать определения, как нашим отношением к ним, которое выясняется постепенно» [94, стр. 2]. К основным теоремам Марков относит теоремы сложения и умножения. Вторая глава посвящена повторению испытаний. Здесь выводится формула Бернулли ρ = c%Pmqn~~m и находится вероятнейшее число появлений события. Придавая большое значение теореме Бернулли, он после ее формулировки дает три различных доказательства, начиная с доказательства самого Я. Бернулли. После этих доказательств Марков замечает: «Из теоремы Бернулли обыкновенно заключают, что при беспредельном возрастании числа испытаний отношение числа появлений события к числу испытаний приближается к вероятности события при отдельных испытаниях. Подобное заключение нельзя, однако, признать безусловно правильным не только для тех случаев, когда условия теоремы Бернулли не выполнены, но и для тех случаев, к которым эта теорема вполне применима. Условия теоремы Бернулли состоят в независимости испытаний и в постоянстве величины вероятности события. При этих условиях теоремы Бернулли обнаруживает невероятность значительных отклонений отношения т/п от ρ при больших п. Но она не устраняет окончательно возможности таких отклонений; и эти невероятные отклонения могут оказаться действительными» [94, стр. 67]. Это очень интересное замечание. Фактически в нем Марков выступает против определения вероятности как lim т/п=р, которое затем легло в основу несостоятель- п-юо ного мизевского определения вероятности. В этой же главе выводится формула Стирлинга и теорема Муавра — Лапласа, Глава третья посвящена закону больших чисел. В начале главы рассматриваются свойства математических ожиданий, а затем Марков доказывает неравенство Че- бышева и теорему Чебышева. Он пишет: «По моему мнению, законом больших чисел следует называть совокупность всех обобщений теоремы Бернулли» [94, стр. 98]. В конце главы рассматриваются безобидные и небезобидные игры. 260
В главе четвертой решаются разнообразные задачи, в том числе на расчет различных случаев в лотереях разных стран. Рассматриваются также задачи на разделение ставки и разорение игрока и др. Глава пятая называется «Пределы, иррациональные числа и непрерывные величины в исчислении вероятностей». В ней рассматриваются такие задачи, как определение вероятности несократимости рациональной дроби, числитель и знаменатель которой написаны наудачу, задача Бюффона и др. В этой же главе вводится понятие математического ожидания для непрерывных величин. В главе шестой излагаются вероятности гипотез и будущих событий. Две последние главы посвящены способу наименьших квадратов и страхованию жизни. Кроме того, в книге помещен ряд статей, на которых мы останавливались выше. Все главы книги снабжены списком литературы, все примеры и задачи доведены до окончательного результата. Эта выдающаяся книга соединяет в себе простоту и доходчивость изложения с высотой крупнейших открытий в теории вероятностей. Сложившуюся в теории вероятностей ситуацию к началу XX в. Ляпунов описывает следующим образом: «Чебышев в одном из своих мемуаров показал, как результаты его исследований о предельных величинах интегралов могут привести к доказательству известной теоремы Лапласа и Пуассона о вероятности, в которой сумма большого числа независимых случайных величин оказывается заключенной между данными пределами. Известно, что эта теорема была предметом большого числа исследований. Между тем, попытки строгого доказательства ее при сколько-нибудь общих условиях оставались долгое время неудачными, и Чебышев был, насколько мне известно, первым, кто с успехом преодолел эту трудность. Однако знаменитый ученый дал только набросок доказательства... Поэтому в некоторых отношениях мемуар Чебышева требовал еще дополнений, и именно это сделал Марков в своей недавней, не оставляющей желать ничего лучшего работе... Таким образом, в том, что касается строгости, замечательное доказательство, набросанное Чебышевым, проведено безупречно. 261
Несмотря на это, следует признать, что это доказательство, связанное со специальной теорией, является слишком сложным и громоздким. Оно не исключает, следовательно, необходимости дальнейших исследований, и прямое доказательство остается, во всяком случае, желательным. Ввиду этого, мне казалось полезным пересмотреть прежние методы, применявшиеся в рассматриваемом вопросе... Мне удалось получить очень общий результат, доказывающий справедливость теоремы при условиях, значительно более общих, чем дополненные Марковым условия теоремы Чебышева, причем он получен мною с помощью анализа, не зависящего от какой-либо специальной теории, и основан только на самых элементарных соображениях» [ПО, стр. 181—183]. Ляпуновым по теории вероятностей были опубликованы только две большие работы [175] и [176]. Более общие результаты, чем Чебышеву и Маркову, Ляпунову удалось получить благодаря применению нового метода — метода характеристических функций. Характеристическая функция φχ(ί) есть математической ожидание величины νέίχ, τ. е. <px(f)=M(eitx) = $ eitxdF(x). —со 00 Интеграл С elix dF(x) всегда сходится. Поэтому можно окон- —00 чательно сказать: характеристической функцией случайной величины χ с функцией распределения F (х) называется функция φΛ(ί)= Μ (<?"*) = С e£txdF(x). —со Метод характеристических функций является более общим методом по сравнению с методом моментов. Характеристическая функция существует для любой случайной величины, и если существуют моменты любого порядка, то характеристическая функция их полностью определяет. Характеристическая функция однозначно определяет функцию распределения F(x)t независимо от 262
того, сущестбунэт или не существуют момекты определенных порядков. Метод характеристических функции оказался чрезвычайно мощным. Он стал основным методом при решении задач на суммирование случайных величин благодаря следующему свойству: характеристическая функция суммы независимых величин равна произведению их характеристических функций, т. е. q>x+y(t) = βφ*(0·φ*(0· Уже в первой из названных работ Ляпунов доказывает центральную предельную теорему в формулировке значительно более общей, чем у Чебышева и Маркова. Ляпунов рассматривает бесконечную последовательность независимых переменных хи х2, лг3,..., таких, что при каждом испытании они получают определенные значения из совокупности вещественных чисел. Не зная этих значений, можно вычислить для каждой переменной вероятность того, что она находится между данными пределами, и эта вероятность не зависит от значений других переменных. Последнее условие следует из того, что переменные независимые. При этих условиях Ляпунов доказывает следующую теорему. «Предполагая существование математических ожиданий величин Xi,xl\Xi\*, (/=1,2,3,...) и обозначая их соответственно через α/, α/, //(* = 1,2,3, ...), положим «ι— αϊ + 02 — °^+ ■·· + ап — а&=*А и обозначим через L3 наибольшую из η величин 4L> '2* · · · » 'я· Тогда, если выражение —п/3 А стремится к нулю, когда η бесконечно возрастает, то 263
вероятность неравенств ζ1γ2Α<χ1 — α1 + χ2 — α2 + ... +хп — α„<ζ2)/2Λ, каковы бы ни были данные числа ζ и z2>zu будет стремиться, при том же предположении относительно л, к пределу и притом равномерно для всех значений Z\ и z%» [ПО, стр. 184—185]. Здесь не требуется, как у Маркова, чтобы моменты любого порядка были меньше некоторого постоянного предела, т. е. чтобы они были равномерно ограничены. Ляпунов только требует, чтобы существовали моменты первых трех порядков. В двух небольших заметках «Об одной теореме исчисления вероятностей» и «Одно общее предположение исчисления вероятностей», опубликованных в 1901 г. [180, 181], Ляпунов отметил возможность некоторых дальнейших обобщений этой теоремы. В результате появился мемуар «Новая форма теоремы о пределе вероятности», в котором ограничения, накладываемые на случайные величины, ослаблены еще более. В окончательном виде теорема Ляпунова записывается так. «Если через δ обозначить положительное число и через d — математическое ожидание величины \xt-*i\f+\ то всякий раз, когда существует такое значение б, при котором отношение (dx+d2+ ... +dn)* (а1 + а2+ ... +α„)2+δ стремится к нулю, когда η возрастает беспредельно, ве- 264
роятность неравенств ζι< Гп <z2 γ2(α1 + α2+ ... +ап) стремится, для п=оо, к пределу -±{e-z*dz равномерно для всех значений Z\ и ζ2>Ζχ» [110, стр. 223— 224]. Здесь х\, #2, *з> ...— неограниченная последовательность независимых переменных; ai, α2, аз,...— их математические ожидания; аь я2, аз, ...— математические, ожидания величин (хх—αϊ)2, (χ2—α2)2, (*з—аз)2,..·; ζ ι и г2 — заданные числа. Самое существенное расширение теоремы состоит в следующем. Марков требовал, чтобы все 2^> /=1 [П η р /2 =м<?> стремились к 0 при ρ > 2. Ляпунов же требовал только, чтобы существовало лишь одно какое-нибудь значение δ > 0. Это достижение Ляпунова Бернштейн оценивает как «классический результат Ляпунова, представляющий венец его исследований по теории вероятностей» (см. [110, стр. 480]). В работе «Об одной теореме теории вероятностей» Ляпунов рассматривает случай δ=1(ρ=3). Но здесь ему еще не удалось заменить условия Маркова единственным условием Λί«3)->0. Во второй же работе доказывается следующее утверждение: «Условие этой теоремы такою, что если оно выполняется для какого-либо данного значения δ, то оно будет выполняться также и для всех меньших значений» [HQt стр. 226], т. е. условие Л4«р)->0, где ρ =2+ +δ>3, влечет за собой Λί£Ρι)->0 для всех р1<Р- 265
Кроме того, Ляпунов установил верхнюю границу погрешности, происходящую от замены точного закона распределения суммы предельным законом. Теорема Ляпунова имеет важное значение для теории вероятностей и ее приложений. Именно поэтому она получила название центральной предельной теоремы тео' рии вероятностей. Эта теорема объясняет, в частности, почему многие случайные величины подчиняются нормальному распределению. Из теоремы Ляпунова следует, что если случайная величина X является суммой большого числа независимых случайных величин, каждая из которых ничтожно влияет на всю сумму, то X имеет распределение, близкое к нормальному. При этом законы распределения величин, составляющих сумму, могут быть неизвестны. Именно такие случайные величины часто встречаются на практике. К ним, например, относятся ошибки измерений, показатели качества, размеров и веса объектов какого-нибудь производства, многие физические величины, которые подвержены случайным изменениям, и т. п. Работы Ляпунова вызвали целый ряд исследований, в первую очередь в направлении ослабления условий Ляпунова. Только через 20 лет удалось улучшить результат Ляпунова. Линдеберг нашел новое достаточное условие для выполнения теоремы Ляпунова, а Феллер доказал необходимость этого условия. Необходимое и достаточное условие Линдеберга — Феллера формулируется следующим образом:если Fn (x) есть функция распределения ХПу aft — любое фиксированное положительное число то с увеличейием η до оо \x\>h '-ι Это условие является необходимым и достаточным 1 я для сходимости распределения ~ΣΧ/ к нормальному. Предпринимались также попытки распространить теорему Ляпунова на зависимые случайные величины. 266
Эти попытки завершились работой С. Н. Бернштейна «О распространении предельной теоремы исчисления вероятностей на сумму зависимых величин» [182], в которой результаты Ляпунова были распространены на величины со слабой корреляционной зависимостью и на последовательности случайных векторов. В докладе «Роль русской науки в развитии теории вероятностей» на конференции Московского университета Колмогоров говорил: «Значение работ Чебышева, Маркова и Ляпунова было вполне оценено в Западной Европе лишь в большим запозданием — в 20-х и даже 30-х годах нашего века. Теперь они всюду воспринимаются как исходный пункт всего дальнейшего современного развития теории вероятностей. В частности, основная предельная теорема Ляпунова и теория цепей Маркова были именно тем, что было наиболее необходимо для солидного обоснования развившейся статистической физики. Медленность усвоения идей петербургской школы на Западе, может быть, отчасти объясняется тем, что школа стояла очень далеко от статистической науки. Мне не хотелось бы, однако, чтобы из последнего замечания получалось впечатление, будто работы петербургской школы были лишены живого чувства связи с запросами математического естествознания. Но в силу отсталости русской физики второй половины XIX в. интересы математиков петербургской школы не были направлены именно в эту, может быть наиболее интересную, в смысле намечавшихся уже в их время перспектив применения теории вероятностей, сторону (работы Больц- мана относятся к 1866—1898 гг.). Особенно Чебышеву было в высокой степени присуще чувство реальности в постановке математических задач. Отправляясь от сравнительно специальных, элементарных и иногда несколько старомодных прикладных задач, он с исключительной принципиальностью извлекал из них такие математические общие концепции, которые потенциально охватывали неизмеримо более широкий круг технических и естественнонаучных проблем» [82, стр. 404] (см. также [46, стр. 59]). 267
§ 3. Вероятность в физике Еще в 1827 г. английский ботаник Браун1, рассматривая в микроскоп растительные препараты, заметил движение мелких взвешенных частиц. Затем выяснилось, что всякая достаточно мелкая крупинка, находящаяся во взвешенном состоянии, постоянно перемещается самым случайным образом. Это движение получило название брауновского движения. Оно является результатом случайных толчков, которые испытывает взвешенная частица со стороны хаотически движущихся молекул. Теорию брауновского движения оказалось возможным разработать только с помощью вероятностных соображений 2. Вообще говоря, молекулярное учение (практически полностью базируется на вероятностных рассуждениях. Большое число молекул и хаотичность их теплового движения делают плодотворным применение таких рассуждений. Можно с большой степенью точности утверждать, что молекулы газа равномерно распределяются по всему объему. В среднем отклонения от равномерного распределения будут ничтожно малы. Не исключены и заметные отклонения, но они будут встречаться крайне редко и тем реже, чем эти отклонения больше. Все эти выводы и вообще выводы молекулярной физики, можно в основном получать статистическими методами. Статистически* ми методами можно определить среднюю скорость молекул, их среднюю кинетическую энергию и много других величин. Нахождение этих и других средних значений физических величин и установление законов, связывающих эти средние значения, составляют основную задачу статистической физики. Статистическое рассмотрение является одним из наиболее распространенных методов физики. Если до второй половины XIX в. основными областями применения теории вероятностей были обработка результатов наблюдений, статистика (в первую очередь демография) и некоторые другие вопросы, то во второй 1 Часто в научно-технической литературе на русском языке вместо Браун и соответственно — брауновское движение пишут Броун и броуновское движение. Отметим, что последнее написание связано с неправильным транскрибирава«ием английского слова Brown (прим. ред.). 2 Законченная теория брауновского движения была создана лишь в 1905 г. Эйнштейном и Смолуховским (прим. ред.). 268
половине XIX в. положение принципиально изменилось. В первую очередь это связано с появлением работ австрийского физика Л. Больцмана (1844—1906 гг.) и американского ученого Д. В. Гиббса (1833—1903 гг.). Больцман является крупнейшим физиком-теоретиком BTQpOU ПОЛОВИНЫ XIX В., ОДНИМ ИЗ ОСНОВОПОЛОЖНИКОВ СО временной физики. Его имя в первую очередь связывают с обоснованием и развитием статистической физики. Главной заслугой Больцмана является молекулярно- кинетическое истолкование второго начала термодинамики и установление статистического смысла понятия энтропии. Состояние тела характеризуется температурой, давлением, плотностью и т. п. Но 'каждому состоянию соответствуют многие различные случаи распределения молекул и атомов (атомные картины тела). Каждое состояние мы встретим тем чаще, чем больше ему соответствует атомных картин, т. е. чем больше атомных картин, тем большая вероятность встретить данное состояние. Обозначим эту вероятность W. Чаще всего мы будем наблюдать состояния, вероятность которых максимальная. Чем меньше вероятность состояния, тем реже оно будет встречаться. Но и очень маловероятные состояния встречаются; в частности, очень маловероятно то состояние газа, в котором он находится в рассматриваемый момент. Больцман по этому поводу пишет: «Случай, когда все молекулы в газе имеют в точности одинаковые и одинаково направленные скорости, ни на волос не менее вероятен, чем случай, при котором скорость и направление скорости каждой молекулы точно такие, какие она имеет в действительности в определенный момент в газе» 1111, стр. 64]. В другом месте: «Любое, даже и невероятное распределение состояний имеет хотя и малую, но все же отличную от нуля вероятность. Даже тогда, когда имеет место... случай, когда первая молекула имеет как раз ту скорость, которую на самом деле имеет в этот момент, аналогично вторая и т. д., ничуть не более вероятен, чем случай, когда все молекулы имеют одну и ту же скорость» [111, стр. 68]. Маловероятно, но возможно и такое состояние, когда все молекулы газа соберутся в одной половине объема. 269
Больцман вычислил, что для объема в 1 см% вероятность одновременного нахождения всех молекул газа в одной половине этого объема равна 1/101<>10. Без воздействия извне явления развиваются так, что система переходит из менее вероятных состояний в состояния более вероятные. Таким образом, она достигает своего наивероятнейшего состояния, вблизи которого она будет испытывать некоторые изменения — флуктуации. Наивероятнейшее состояние является состоянием равновесия. Таким образом, вероятность все время стремится к своему наибольшему значению. Так же ведет себя и энтропия, которая три любых процессах, происходящих в системе, всегда возрастает. Больцман вводит в рассмотрение функцию Я, которая является аналогом энтропии и играет в статистической физике существенную роль. Пусть в момент времени t f (ξ, η, ε, t)d\ άχ\ аг = fd® означает число молекул m, для которых составляющие скорости в направлении трех координатных осей лежат в пределах между I И ξ + dg, η и η + <*П, еие + ώ. Параллелепипед, вершина которого имеет координаты ξ, η, ε, а параллельные координатным осям ребра равны rf|, dx\, аг, будем называть параллелепипедом dco. Если функция / известна для какого-то значения f, то тем самым определено и распределение скоростей молекул т в момент t. Точно так же пусть будет число (молекул ти составляющие скорости которых лежат между пределами: 11и11 + dlv гц и цг + dx\Xi гг и гг + агГ Тогда Η =Ulnfd<u+[ F1lnF1d(dv Затем доказывается, что в предположении, «что распределение скоростей было в начальный момент молеку- 270
лярно-неупорядоченным и остается таким и в дальнейшем... величина, обозначаемая нами через Я, может только уменьшаться» [111, стр. 63]. Под молекулярно-неупорядоченным распределением Больцман понимает такое состояние, при котором положение и скорость любой из двух сталкивающихся молекул перед столкновением не зависят от положения и скорости другой. Доказав, что функция Я с течением времени не может возрастать, Больцман истолковывает ее, только с обратным знаком, как аналог энтропии. В 1877 г. Больцман указал на связь функции Я с вероятностью данного распределения. Вокруг Я-теоремы разгорелась дискуссия. В результате (последней Больцман вынужден был более внимательно рассмотреть связи этой теоремы с другими вопросами. Это привело его к выводу о статистическом характере второго начала термодинамики. При любых процессах общее количество энтропии возрастает. Закон неизбежного возрастания энтропии называется вторым началом термодинамики. Возникает вопрос: какова связь энтропии S с вероятностью W} Энтропия двух тел равна сумме энтропии каждого из них (5=5ι+52), а их совместная вероятность равна произведению вероятностей отдельных состояний (W=* = И?ГИ?2). Следовательно, связь между 5 и И^должна быть логарифмическая: S=k\nW. Для того чтобы определить коэффициент пропорциональности ky необходимо вычислить S я W для какого-нибудь случая. Такое вычисление было (проделано Больцманом для газа. Он нашел, что k = 1,38 · 10-16 эрг/град — это постоянная Больц- мана, одна из основных универсальных постоянных физики, равная отношению газовой постоянной R к числу Авогадро N (k=R/N). Таким образом, Больцман показал, что энтропия есть мера вероятности пребывания системы в данном состоянии. Относительно второго начала термодинамики Больцман шишет: «То, что в природе энтропия стремится к максимуму, доказывает, что при всяком взаимодействии реальных газов (диффузия, теплопроводность и т. п.) отдельные молекулы вступают во взаимодействие в согласии с законами вероятности или, по крайней мере, что 271
реальные газы всегда ведут себя как воображаемые нами молекулярно-неупорядоченные газы. Второе начало оказывается, таким образом, вероятностным законом» [111, стр. 85]. Представления о связи энтропии с вероятностью, интенсивно и глубоко развитые Больцманом, не сразу были восприняты физиками. Больцман вынужден иногда объяснять те или иные элементарные вопросы теории вероятностей (см., например [111, стр. 63, 99]). Но в своих рассуждениях он часто прибегает не к понятию вероятности, а к количеству молекул, обладающих тем или иным свойством. Причем, по его мнению, такое рассмотрение удобно потому, что «реальное число предметов всегда является гораздо более наглядным понятием, чем простая вероятность» [111, стр. 71]. В противовес теории тепловой смерти Больцман выдвинул свою флуктуационную гипотезу, которая сыграла прогрессивную роль в борьбе за материалистическое мировоззрение, хотя в настоящее время эта гипотеза представляется недостаточно обоснованной. По Больцману, возрастание является только наиболее вероятным изменением энтропии. Пусть дана система, состояние которой в момент времени /о является маловероятным и которая с течением времени с подавляющей вероятностью переходит к более вероятным состояниям, что и приводит с очень большой вероятностью к возрастанию энтропии, хотя возможны и флуктуации, когда энтропия убывает. Из обратимости механики тогда вытекает, что до момента /0 энтропия с такой же большой вероятностью должна была уменьшиться. Наблюдаемая необратимость статистических процессов связана с тем, что сейчас происходит затухание космической флуктуации, а не нарастание. Больцман считает, что к таким мировым процессам 'применима теория вероятностей. «Так как исчисление вероятностей оправдало себя в столь многих частных случаях, я не вижу никаких оснований, по которым оно не могло !бы быть 'применимым также и в процессах природы более общего характера» [111, стр. 527—528]. Чтобы быть правильно понятым в вопросе о возвращении системы к прежнему состоянию, Больцман дает подробные объяснения. В частности, он пишет: 272
«Переход от упорядоченного к неупорядоченному состояниям лишь крайне вероятен. Также и обратный переход имеет известную вычислимую, хотя и невообразимо малую вероятность, которая действительно стремится к нулю только в предельном случае, когда число молекул становится бесконечным. Следовательно, то, что замкнутая система, состоящая из конечного числа молекул, первоначально находившаяся в упорядоченном состоянии и затем перешедшая к неупорядоченному, по прошествии невообразимо длительного при большом числе молекул времени должна снова принимать упорядоченное состояние, не только не опровергает нашу теорию, но даже является ее подтверждением. Не следует, однако, представлять себе дело таким образом, что два газа, которые первоначально находились несмешанными в сосуде с абсолютно гладкими индифферентными стенками емкостью Vio литра, смешиваются, через несколько дней снова разделяются, затем снова смешиваются и т. д. Напротив, согласно тем же принципам получается, что после первого смешения снова произошло бы сколько-нибудь заметное разделение лишь спустя время, несравненно много большее, чем 1010 лет» 1111, стр. 522]. Больцман считал, что статистические методы применимы и к изучению электромагнитных волн. Он писал: «Точно так же, как и в теории газов, можно определить для излучения вероятнейшее состояние..., при котором волны не упорядочены, а разнообразнейшим образом взаимодействуют между собой» [152, стр. 617]. Это мнение разделяет и Планк, когда он пишет, что попытка понять смысл экспериментальных законов излучения «естественно привела меня к рассмотрению связи между энтропией и вероятностью, т. е. к больцмановскому ходу мысли» [153, стр. 102]. Влияние идей Больцмана на развитие физики очень велико. В частности, развитие Больцманом статистических представлений подготовило создание квантовой тео* рии; эти представления являются одним из ее истоков. Больцман с материалистических позиций выступал против идеалистических воззрений Маха, Оствальда и Шопенгауэра, против идеализма вообще. Он писал: «Имя Беркли принадлежит весьма уважаемому английскому философу, которому даже приписывается изобретение 273
самой большой глупости, измышленной когда-либо человеческим умом,— философского идеализма, отрицающего существование материального мира» [151, стр. 51]. В своей лекции «По поводу одного тезиса Шопенгауэра» Больцман пишет: «Я было избрал для своей лекции такое заглавие: „Доказательство, что Шопенгауэр — бессмысленный, невежественный, размазывающий глупости, набивающий головы пустопорожней болтовней и тем доводящий их до полного дегенератства силософастр". Слова эти я буквально заимствовал из Четвертого корня и т. д., только там они относятся к другому философу. Шопенгауэру приводят в извинение, что он был взбешен тем, что его обошли при назначении на какую-то вакансию. Но спрашивается, чей гнев более правдивый — его или мой?» [112, стр. 444]. Из этой цитаты ясно видно отношение Больцмана к Шопенгауэру. К. Тимирязев дает высокую оценку Больцману. Он называет его физиком-антиметафизиком, физиком-философом, одним из самых блестящих представителей этой науки. В. И. Ленин в «Материализме и эмпириокритицизме», подчеркивая борьбу Больцмана против идеализма и махизма, приводит ряд цитат из его произведений [ИЗ, стр. 274 и далее]. Ряд физиков и до Больцмана рассматривали тела как состоящие из очень большого числа частиц, которые поэтому могут быть исследованы только статистически. Уже Д. Бернулли предложил объяснить движением молекул давление, оказываемое газом на стенки сосуда. К аналогичным взглядам пришел и М. В. Ломоносов. Непосредственным предшественником Больцмана был Максвелл, который рассматривал молекулы как упругие тела. Исходя из этого представления, он построил свою теорию газов, которая примыкает к работам Клаузиуса. В обзорной лекции, прочитанной в 1875 г. в Лондонском химическом обществе, Максвелл говорил, что основная заслуга Клаузиуса состоит в том, что, разработав приемы для изучения систем, состоящих из бесчисленного множества движущихся молекул, он создал новую область математической физики. Клаузиус распределял молекулы по группам соответственно их скоростям. Так 274
как невозможно наблюдать события, относйщйеся к отдельным молекулам, Клаузиус учитывал изменения числа молекул в различных группах. В своей лекции Максвелл говорил: «Следуя этому методу, единственно возможному как с точки зрения экспериментальной, так и математической, мы переходим от строго динамических методов к методам статистики и теории вероятностей. При столкновении двух молекул они переходят из одной группы в другую, но за время большого числа столкновений число молекул, вступающих в каждую группу, в среднем не больше и не меньше числа покинувших ее за тот же промежуток времени. Когда система достшла этого состояния, число молекул в каждой группе должно быть распределено согласно некоторому определенному закону» [149, стр. 148—149]. Этот закон распределения скоростей молекул и вывел Максвелл. При этом он рассуждал следующим образом. Пусть <p(x)dx есть вероятность того, что проекция скорости молекулы на ось Ол: заключена между χ и x+dxf аналогично (p(y)dy и q>{z)dx будут вероятности того, что проекции скорости на оси Оу и Oz будут заключены в пределах у и y+dy, z и z+dz. Вероятность того, что вектор, изображающий скорость и исходящий из начала координат, заканчивается в фигуре х, У, ζ, χ + dx, У + dy, z + dzy равна Ρ = φ (χ) φ (у) φ (ζ) dx dy dz< (IV.3) Но эта вероятность должна быть функцией расстояния от начала координат: <p(x)q>(y)<p(z) =f(x2+y2+z2). Логарифмируем это уравнение: 1п<р(л;) +1ηφ(ί/) +1ηφ(2) = = \ni(x2+y2+z2). Берем производную по х: φ'(χ) 2л7'(л* + У2 + г2) „то Ф'(*) _ 2f'(x2 + y* + z*) «~——· — ——.———^—^ ИЛИ ———· — _———^————— л φ Μ /(·*·* +г/2+ *4) *pW / (*a + у3 + ζ») Аналогично получаем φ' (у) _ φ' (г) _ φ' (χ) _ If (x* + У* + г*) у<р(у) гф(г) *р(лг) /(!· + »· +г·) 275
Учитывая некоторые дополнительные физические соображения, легко подобрать функцию, которая удовлетворяет этому соотношению: <р(*) = е~к*х2; φ(*)φ(ί/)φ(ζ) =f(x2 + y2 + z) =er*l*+*+*> Последнее соотношение и представляет закон распределения скоростей Максвелла. Бертран возражал против этого рассуждения. Он считал, что нет уверенности в том, что пределы проекции на Оу (у и у + dy) не зависят от вероятности того, что пределы проекции на Оле будут χ и x-tdx. В этом случае нельзя утверждать, что равенство (IV.3) справедливо. Позже было доказано, что эти события независимы, так что возражение Бертрана отпало. Больцман доказал закон распределения Максвелла, рассматривая столкновение молекул. Даже если предположить, что в какой-то момент все молекулы имеют одинаковую скорость, через некоторое время, в результате столкновений, распределение молекул по скоростям будет случайным, подчиненным закону распределения Максвелла. Клаузиус, Максвелл и другие, конечно, получили некоторые результаты, относящиеся к статистической физике (например, закон распределения скоростей Максвелла), но в их работах вероятностные рассуждения и статистический подход были еще эпизодическими. Только Больцман и Гиббс ввели последовательно вероятностные рассуждения и статистику в физику. К проблемам статистической механики Гиббс обратился еще в начале 80-х годов, но только примерно через 10 лет они заняли в его творчестве основное место. В 1892 г. Гиббс писал английскому физику Д. Рэлею: «В настоящее время стараюсь подготовить к опубликованию кое-что по термодинамике с априорной точки зрения, или вернее по „статистической механике", где основное внимание было бы направлено на ее применение к термодинамике, по линии Максвелла и Больцмана» [154, стр. 124]. В это же время Гиббс начал читать курс статистической физики в Иельском университете. В 1902 г. Гиббс опубликовал книгу «Основные принципы статистической механики». Эта монография имела огромное значение для развития теоретической физики. Гиббс сделал в ней значительный шаг в развитии стати- 276
стической физики. Классическая статистическая физика, созданная трудами в первую очередь Максвелла и Больцмана, нашла в этой работе широкое продолжение и логическое завершение. Гиббс рассматривает свойства тела как свойства ансамбля, состоящего из огромного числа мельчайших частиц, которые подчинены законам механики. Он изучает свойства такого ансамбля, опираясь на теорию вероятностей, выясняет фундаментальную роль самого понятия вероятности в физике. Это понятие позволяет произвести глубокий анализ макроскопических свойств веществ. Гиббс показал связь этих свойств со средними статистическими свойствами ансамблей. Он широко использовал идею Больцмана, состоящую в интерпретации энтропии, как вероятностного состояния системы. Гиббс правильно поставил проблему, возникшую еще у Больцмана и состоящую в разрешении противоречия между термодинамической необратимостью, вытекающей из закона возрастания энтропии, и обратимостью законов движений, т. е. обратимостью во времени всех чисто механических процессов. Эта проблема является предметом исследований вплоть до наших дней. Физические измерения, как мы неоднократно подчеркивали, всегда содержат некоторую ошибку, они никогда не являются точными. Результат действия какой-либо системы является следствием не из точно заданных начальных положений, а из начальных положений, известных только своими распределениями. Уже по этой причине в физику должно было войти учение о случайных величинах и вероятностные соображения. Гиббс считал, что физика не говорит о результатах, которые происходят всегда, а говорит о результатах, которые происходят с большой вероятностью. Хотя идеи Гиббса глубоко проникли в теоретическую физику, его работы оказывались часто незавершенными. В частности, это было вызвано отсутствием или плохой разработкой соответствующих разделов теории вероятностей. «Введение Гиббсом вероятности з физику произошло задолго до того, как появилась адекватная теория того рода вероятностей, которые ему требовались» [114, стр. 26]. В своей книге «Основные принципы статистической механики» Гиббс характеризует цели и задачи статистических методов в физике. 277
«Обычной точкой зрений в изучении механики является та, при которой внимание направлено, главным образом, на изменения, происходящие с течением времени в данной системе» [115, стр. 12]. При этом рассматривается состояние системы в любой момент времени. Иногда рассматриваются состояния, бесконечно мало отличающиеся от действительного состояния системы. «Для некоторых целей, однако, желательно принять более широкую точку зрения. Мы можем представить себе большое число систем одинаковой природы, но различных по конфигурациям и скоростям, которыми они обладают в данный момент, и различных не только бесконечно мало, но так, что охватывается каждая мыслимая комбинация конфигураций и скоростей. При этом мы можем поставить себе задачей не прослеживать определенную систему через всю последовательность ее конфигураций, а установить, как будет распределено все число систем между различными возможными конфигурациями и скоростями в любой требуемый момент, если такое распределение было задано для какого-либо момента времени. Основным уравнением при таком исследовании является уравнение, дающее скорость изменения числа систем, заключенных внутри определенных малых границ конфигурации и скорости. Такие исследования Максвелл назвал статистическими» [115, стр. 12]. В числе своих предшественников Гиббс называет Клаузиуса, Максвелла и Больцмана. Гиббс рассматривает далее вероятность того, что произвольная система ансамбля, о которой мы знаем только то, что она относится к ансамблю, находится внутри данных границ и устанавливает принцип сохранения вероятности фазы. «Мы получаем принцип, который в зависимости от точки зрения, с какой он рассматривается, можно выражать различно — как принцип сохранения фазовой плотности, фазового объема или вероятности фазы... Мы сочетаем принцип сохранения вероятности фазы, являющийся точным, с теми приближенными соотношениями, которые обычно принимаются в теории ошибок» [115, стр. 15]. Максвелл и первоначально Больцман считали, что газовая масса состоит из очень .большого числа молекул, статистические особенности движения которых необходимо изучать. Более поздняя точка зрения Больцмана, а 278
затем и Гиббса, состояла в том, что они рассматривали очень большое число тождественных друг другу газовых масс. Но в этих тождественных массах движение молекул неодинаково. Рассматривая достаточно большое число таких масс и изучая наиболее часто встречающиеся свойства этих масс, Больцман и Гиббс тем самым стали на точку зрения статистической механики. Идеи Гиббса были восприняты многими восторженно. Например, Больцман писал: «Честь систематизировать эту науку, изложить ее в стройном сочинении и дать ей характерное имя принадлежит одному из величайших американских ученых, быть может величайшему в области абстрактного мышления и теоретического исследования,— Вилларду Гяббсу... Он назвал эту науку статистической механикой» [154, стр. 123—124]. Приведем еще высказывание о Гиббсе американского физика Р. Милликэна: «Будучи глубоким, не имеющим себе равных ученым-аналитиком, он сделал для статистической механики и термодинамики то, что для небесной механики сделал Лаплас, а для электродинамики — Максвелл, а именно — он сделал свою область науки почти законченным теоретическим построением» [154, стр. 125]. В первое десятилетие нашего века, благодаря статьям Планка, Лоренца, Эренфеста и других, статистический подход Гиббса стал достоянием широких кругов ученых. Итак, Больцман и Гиббс широко применяли в своих исследованиях вероятностные соображения, в частности само понятие вероятности. Но это понятие и вероятностные рассуждения были не совсем те, с которыми имели дело математики. Например, Гиббс вводит такие понятия, как коэффициент вероятности фазы p = D/Ny где D — фазовая плотность, N — полное число систем и др. Дальнейшая разработка вопросов статистической физики требовала разработки математического аппарата теории вероятностей, дальнейшего развития теории вероятностей. § 4. Парадоксы Бертрана На необходимость уточнения основных понятий теории вероятностей неоднократно указывали и математики. В этом отношении любопытна позиция Бертрана. 279
Бертран выдвинул ряд парадоксов, относящихся к основным понятиям теорий вероятностей [116]. Один из них состоит в следующем. Требуется определить вероятность того, что взятая произвольно хорда окружности будет больше, чем сторона вписанного в окружность равностороннего треугольника. Рис. 11 Рис. 12 По-разному понимая слова «взятая произвольно», мы будем получать разные вероятности. Так, рассматривая только те хорды, которые параллельны данному направлению, мы получим, что искомая вероятность равна 72· Действительно, в этом случае хорды большие, чем сторона треугольника, будут находиться от центра на расстоянии, меньшем г/2 (рис. 11). Если считать, что произвольно проведенные хорды будут выходить из определенной точки на окружности, то искомая вероятность равна 7з (рис. 12). Если мы будем считать, что слова «взятая произвольно» означают, что вероятность попадания середины хорды внутрь какой-либо части круга пропорциональна площади этой части, то получим, что искомая вероятность равна XU. Действительно, так как серединой хорды может быть любая точка круга, а середины хорд, которые больше стороны треугольника, заполняют круг радиуса г/2 (рис. 13), то искомая вероятность будет п{г/2)2/лг2~1/А. При других трактовках «произвольного взятия» можно получить и другие вероятности. Такая неопределенность ответа может быть объяснена следующим образом. Само слово «вероятность» предполагает некоторый определенный опыт. Во многих задачах этот опыт хотя и не оговаривается специально, но каков он, обычно ясно из содержания задачи. В рассмат- 280
риваемом случае слова «произвольно взятая хорда» без дальнейших разъяснений в постановке задачи фактически не дают никаких указаний о конкретном опыте. Из этих трех решений, предложенных Бертраном, следует отдать предпочтение первому. К этому ответу приводят такие общие задачи. При бросании круглого диска на плоскость, на которой начерчены прямые, вероятность того, что покрытая хорда будет больше стороны равностороннего треугольника, равна 72- К этому же ответу мы придем, если будем рассматривать хорды, которые прочерчивают на диске Луны затмеваемые звезды, или хорды, описанные звездами в поле зрения телескопа. Рассмотрим еще один парадокс Бертрана. На поверхности шара взяты наудачу две точки Μ и ΛΓ; какова вероятность, что меньшая из дуг большого круга ММ' будет меньше а? Рис. 13 Нис. 14 От положения Μ эта вероятность не зависит. Но если Μ фиксировано, то точка М' должна находиться на поверхности шара, от точки Μ не далее, чем круг, нанесенный на шаре (рис. 14). Пусть R — радиус шара. Тогда МР=ОМ—OP=i?(l—cosa). Отношение поверхности, где может находиться точка М\ к поверхности шара равно MP/2R=(\—cosa)/2 = sin2(a/2). Это и есть искомая вероятность. Если α мало, то р = а2/4. Бертран дает и второе решение, приводящее совсем к другому результату [116, гл. 1]. Если даны две точки Μ и М\ то тем самым определена и соединяющая их дуга большого круга. Все дуги большого круга одинаковы, и мы не изменим вероятно- 281
сти, рассматривай только данную дугу. Вероятность, wo две точки расположены так, что соединяющая их дуга меньше а, будет α/π. Если а=1°, то α=π/180 и а2/4 = =π2/360; α/π= 1/180. Одна величина больше другой примерно в 70 раз. Бертран заключает отсюда, что данная задача неразрешима, а следовательно, первое решение (как и второе) неверно. Однако в данном случае утверждение Бертрана неверно. Первое решение правильное, а второе содержит ошибку. В этой задаче считается, что все равные доли поверхности шара эквивалентны по отношению нахождения на них точек Μ и Λί'. Ошибка во втором решении заключается в том, что считается, что вероятность нахождения М' на данной дуге большого круга пропорциональна длине дуги. Если дуга большого круга не имеет толщины, та вероятность нахождения точек на этом круге Рис. 15 будет равна 0. Чтобы избежать этого, необходимо вместо линий рассматривать тонкую полосу, стороны которой исходят из одной точки Μ (рис. 15). Из рисунка видно, что вероятность попасть в эту полосу около точки Μ меньше, чем на расстояниях в 90° от нее. Бертран выступал с критическими замечаниями по поводу различных вопросов теории вероятностей. Напри* мер, обсуждается вопрос: если некоторые звезды расположены очень близко на небесной сфере друг от друга, то следует ли из этого, что они действительно близки в пространстве? Если изучать число звезд определенной величины, то можно вычислить вероятность расположения определенного числа звезд на небесной сфере внутри данной небольшой окружности. Если вычисленная вероятность очень мала, то можно предполагать, что эта группировка звезд имеет причину, т. е. что эти звезды действительно близки в пространстве. По этому поводу Бертран делает 282
такое возражение: «Плеяды кажутся более близкими друг к другу, чем следует. Это утверждение заслуживает внимания; но если бы мы захотели выразить выводы цифрами, — у нас не хватило бы данных. Каким путем можно точно определить это туманное понятие близости? Искать наименьший круг, в котором заключена данная группа? Наибольшее угловое расстояние? Сумму квадратов всех расстояний? Площадь сферического многоугольника, вершинами которого являются некоторые звезды и внутри которого заключаются другие? Все эти величины в группе Плеяд меньше, чем можно было ожидать. Которая из них будет мерилом вероятности? Если три звезды образуют равносторонний треугольник, следует ли считать, что это обстоятельство, конечно, мало вероятное a priori, указывает на существование некоторой причины?» [116, стр. 170]. Относительно замечания Бертрана о равностороннем треугольнике скажем только, что любой другой треугольник имеет такую же малую вероятность. · Бертран (а затем и Пуанкаре) рассматривает следующий вопрос. Три одинаковых ящика имеют каждый по два отделения. Первый содержит в каждом отделении по золотой медали, второй — по серебряной, а третий — в одном отделении золотую, а в другом — серебряную. Взят один из ящиков. Какова вероятность того, что в его отделениях будут различные медали? Очевидно, что эта вероятность равна 7з- Поставим другой вопрос: какова вероятность того, что во втором отделении этого ящика будет медаль другого металла, чем во вскрытом первом отделении? Бертран отвечает на этот вопрос следующим образом. Пусть, например, во вскрытом отделении находится золотая медаль; тогда в другом отделении может быть или золотая, или серебряная, следовательно, искомая вероятность равна V2· В этом решении содержится ошибка, так как Бертран не устанавливает равновозможно- сти рассматриваемых случаев. Правильное решение этой задачи становится ясным, если мы представим ящики схематически 12 3 4 5 6 Iз f з| 1з | с | 1с|с[ 283
Если во вскрытом отделении будет золотая медаль, то мы имеем один из трех (1, 2, 3) равновозможных случаев, из которых только третий будет благоприятным. Следовательно, искомая вероятность равна 7з- Аналогично рассуждаем, если во вскрытом ящике будет серебряная медаль. Если же известно, какое отделение вскрыто — левое или правое, то искомая вероятность будет 72· Бертран не принимает теорию среднего человека Кет- ле. Действительно, может ли существовать человек, рост которого равнялся бы среднему росту, вес — среднему весу и т. д.? Возьмем, например, два шара, один из которых имеет радиус гх = 1, а другой — г2=3. Если они сделаны из одного материала и если первый весит 1 г, то второй будет весить 27 г. Тогда средний шар должен иметь г=2 и вес (27+1)/2=14 г. Но если средний шар сделан из того же материала, то при г=2 его вес должен быть 8, а не 14. Таким образом, не может существовать шара, который бы имел одновременно средний радиус и средний вес. Поэтому у нас нет никакой уверенности, что может существовать человек с разнообразными средними данными. В своей книге [116] Бертран касается спора, который возник в связи с введением оспопрививания. Первоначально в среднем 1 человек из 200 умирал в результате прививки. Возникли колебания отосительно целесообразности оспопрививания. «Даниил Бернулли, невозмутимый геометр, научно вычисляя среднюю жизнь, нашел, что она увеличилась на три года, и из этого сделал вывод о благодетельности прививки» [116, стр. XII]. Далее Бертран приводит возражения Даламбера против взглядов Д. Бернулли и поддерживает эти возражения. Для того, чтобы подчеркнуть мысль Даламбера, Бертран пишет: «Допустим, что можно оперативным путем увеличить среднюю продолжительность жизни уже не на 4, а на 40 лет, при условии, что моментальная смерть угрожает четвертой части оперированных: пожертвовать четвертью жизней, чтобы удвоить остальные три четверти, выгода большая. Кто захочет ею воспользоваться? Какой врач согласится оперировать? Кто взялся бы, приглашая 4000 здоровых и сильных людей к операции, заказывать на следующий день 1000 гробов? Какой директор учеб- 284
ного заведения осмелился бы объявить 50 матерям, что, желая увеличить среднюю продолжительность жизни своих 200 учеников, он сыграл за них в эту выгодную игру, и что их сыновья в числе проигравших. Самые благоразумные родители приняли бы риск 1 шанса против 200; никто, на основании каких бы то ни было вычислений, не подвергся бы риску 1 шанса против 4» [116, стр. XII]. Пуанкаре обратил внимание на парадоксы Бертрана и обобщил их. Он предложил вместо непрерывной переменной, которая фигурирует в парадоксах Бертрана, взять любую непрерывную функцию f(x) этой переменной. Тогда все задачи, относящиеся к х, можно заменить соответствующими задачами относительно f{x). Это же замечание относится и к нескольким переменам. Из этого следует, что определение вероятности события довольно произвольно, так как оно зависит от произвольной непрерывной функции. Пусть, например, положение точки зависит от двух переменных; введем произвольную положительную функцию φ (л;, у), которая удовлетворяет условию со оо i ίφ(*> y)dxdy=l. —оо —эо Тогда вероятность того, что точка (л:, у) находится на площади 5, будет (\\) φ (χ, y)dxdy. При таком определе- U) нии вероятность зависит от φ (л:, у). Но Пуанкаре отмечает, что в известных случаях окончательный результат вычисления почти не зависит от выбора произвольной функции, если предположить, что функция удовлетворяет довольно широким условиям. Ни Бертран, ни Пуанкаре своими парадоксами не стремились подорвать авторитет теории вероятностей. Они лишь хотели подчеркнуть нечеткость и неточность некоторых понятий теории вероятностей, способствуя тем самым их уточнению.
Глава V АКСИОМАТИЧЕСКОЕ ОБОСНОВАНИЕ ТЕОРИИ ВЕРОЯТНОСТЕЙ § 1. Необходимость аксиоматики К началу XX в. теория вероятностей, с одной стороны, получила блестящее развитие в трудах ученых русской школы и нашла глубокие применения в физике. С другой стороны, в этот же период появляются совершенно необоснованные приложения теории вероятностей. Отдельные математики стали использовать теорию вероятностей в политических целях. Особенно в этом отличился П. А. Некрасов (1853—1924 гг.). С 1893 г. Некрасов— ректор Московского университета, вскоре он назначается попечителем Московского учебного округа, а затем — членом ученого совета Министерства народного просвещения. В своих многочисленных работах Некрасов стоял на идеалистических позициях. Для характеристики Некрасова приведем только некоторые примеры. Он утверждает, что «раб чувствует стационарную зависимость от господина» {И7, стр. 19], преступник — от суда и полиции и т. п., и меру этой зависимости может дать теория вероятностей. «Теория вероятностей может дать числовую меру как стационарных, так и нестационарных влияний зависимостей» [117, стр. 21]. В 1896 г. Некрасов издает «Теорию вероятностей», которая является изложением его лекций в Московском университете и Межевом институте. В 1912 г. эта книга выходит вторым изданием, существенно дополненным. При чтении этой книги поражает обилие бессвязных наукообразных фраз, хотя они часто относятся к основным принципиальным понятиям и понятиям теории вероятностей. W
Приведем пример: «Теория вероятностей есть врожденная категорическая функция, мысленно предвосхищающая сменные явления природы и многообразно согласуется с функциями души и тела. Роль вероятностей, т. е. условных и безусловных достоверностей, по вопросам жизни познавательная и многосторонне посредническая, междусубъективная в регулировании течений блага, строящая систему посредствующих, ограждающих и искупающих запасов, залогов, божков для умного выпуска явлений против многообразных типических „огневых" народных бедствий и устанавливающая исчислением, измерением, формулами и словом или иными знаками и графиками критерии средства и соотношение или связь интеграцию, интерполяцию между составными частями, секциями и самостоятельными органами живого Всего (Целого) и их функциями» [119, стр. III]. Такого типа высказываний у Некрасова о теории вероятностей и ее основных понятий много не только в цитируемой выше книге (см., например, [118]). Говоря о социальных проблемах, Некрасов резко выступает против политических преобразований, в которых участвует народ. Он считает, что высшим принципом является частная собственность, которую призван охранять царский режим. Некрасов пишет о том, что человек науки обязательно приходит к вере в бога, что должен наступить наиболее тесный союз бога и человека. Он уделяет внимание толкованию положений священного писания и т. п. Все это излагается в книге «Теория вероятностей» причем Некрасов свои высказывания «подкрепляет» и «выводит» из законов теории вероятностей, прибегая часто, для большей убедительности, к сложным математическим выкладкам. В 1915 г. Некрасов как член Совета министерства народного просвещения создал комиссию для введения элементов теории вероятностей в программу средних школ. По проекту этой программы предполагалось использовать теорию вероятностей для воспитания в духе послушания царю, восхваления порядков самодержавия и т. п. После того, как А. А. Марков узнал о создании подобной комиссии, по его инициативе в Академии наук была создана другая комиссия в составе Д. К. Бобылева, А. Н. Крылова, А. М. Ляпунова, А. А. Маркова и 287
В. А. Стеклова. Комиссия приняла по этому вопросу решение, в котором, в частности, говорилось: «Взгляды Некрасова давно известны математикам, но пока они находили место в специальных математических журналах, их можно было считать безвредными. Дело меняется, когда распространителем их является официальный орган. Поэтому Академия наук обязана высказать свое суждение об основных ошибках и неправильных, а потому вредных, идеях, распространяемых П. А. Некрасовым с целью проведения их в обиход средней школы... Комиссия полагает, что вышеупомянутые заблуждения и ... злоупотребление, математикой с предвзятой целью превратить науку в орудие религиозного и политического воздействия... принесут неисправимый вред делу просвещения» [120, стр. 178]. Получив такой отпор, Некрасов решил обвинить А. А. Маркова в пропаганде материализма. Он писал: «Для суждения о том, что действительно непригодными для подготовления учителей средней школы являются не инкриминируемые мне идеи, а идеи А. А. Маркова, предложу вниманию читателя руководство А. А. Маркова „Исчисление вероятностей"» [121, стр. 12]. Далее Некрасов ссылается на приведенную выше цитату из книги Маркова, в которой последний не соглашается с Буня- ковским относительно существования известного класса рассказов, сомневаться в которых, даже если они кажутся невероятными, предосудительно. После этого Некрасов заявляет: «Разрушая приведенные выше основоположения академика Буняковского, Марков тем самым облегчает насаждение основоположений исторического материализма... Лучшего, чем книга Маркова, руководства не требуется для систематической пропаганды крайнего беспочвенного материализма... Ныне мне остается апеллировать к миру ученых и педагогов, прося обсудить, кто из нас превращает чистую науку в орудие воздействия вредного относительно здравости гражданского и религиозного культа, коим подрастающие поколения воспитываются» [121, стр. 16]. В этой развернувшейся борьбе нас интересует не столько позиция реакционера Некрасова, которьдй свои лженаучные выводы прикрывал ссылками на теорию вероятностей, сколько прогрессивная, материалистическая по- 288
зиция А. А. Маркова. В этой борьбе раскрылся благородный образ ученого-материалиста К Потребность в пересмотре логических основ теории вероятностей, закрепление за ней права настоящей математической дисциплины чувствовалось все сильнее. В связи с тем, что не было ясности в вопросе о предмете теории вероятностей, даже такой крупный математик, как Э. Борель (1871—1956 гг.), не избежал увлечения совершенно необоснованными ее применениями, распространяя ее на такие области, которые не имеют отношения к математической дисциплине. В 1914 г. вышла его очень интересная книга «Случай», которая в 1923 г. была переведена на русский язык. В этой книге рассматривается очень много важных вопросов. После подробного обсуждения основных законов теории вероятностей с глубокими историческими и философскими отступлениями Борель говорит о проникновении вероятностных методов в физику, биологию и другие науки, о связи теории вероятностей с другими разделами математики. Несмотря на неоспоримые положительные качества этой книги, мы должны отметить, что в ряде принципиальных вопросов теории вероятностей он стоял на ошибочных позициях. Например: «Представим себе тысячу парижан, проходящих мимо семиэтажной недвижимости; они все согласятся назвать это домом; между тем как они откажут в таком названии каменной постройке, могущей служить приютом двум кроликам и трем курицам. Возьмем теперь среднюю постройку; тут мнения могут разделиться; если 748 из 1000 подающих голос выскажутся за название данного здания домом, то будет правильно утверждать, что вероятность, чтобы здание было домом, равна 0,748, а противоположная вероятность — 0,252» [125, стр. 88]. Такое произвольное толкование вероятности могло возникнуть только в результате неотчетливости и неочерченное™ этого понятия. Борель привлекает теорию вероятностей к социальным, моральным и другим подобным вопросам: «Можно ли идти дальше и построить на основе теории вероят- 1 О борьбе А. А. Маркова за материализм в науке против всяких идеалистических извращений, а также о его активной поддержке всего передового в культурной жизни России см. [122—124].
ностей настоящую индивидуальную и социальную мораль? Самое возвышенное правило морали, когда-либо предлагавшееся людям, казалось бы, заключается в евангельской заповеди: „люби ближнего, как самого себя"» [125, стр. 168—169]. Далее он обсуждает эту евангельскую заповедь и приходит к выводу: «Единственное разумное толкование, которое можно дать евангельскому изречению, следующее: рассматривай каждого твоего ближнего, как величину эквивалентную во всяком случае не тебе самому, а какой-нибудь части тебя, заключающейся между нулем и единицей, но никогда не достигающей нижнего предела нуля и иногда достигающей верхнего предела единицы. Не думаю, чтобы такую формулировку можно было назвать эгоистической; если хорошенько понять ее значение, то становится ясным, что она, напротив, является самым широким и самым полным выражением разумного альтруизма. Различные степени альтруизма и эгоизма проявляются при определении коэффициентов: скольким лицам каждый из нас припишет коэффициент 1, скольким коэффициент 0,9, коэффициент 0,5 ..., коэффициент 0,00001, 0,000001. Я не стану входить в обсуждение этих величин; которое входит в компетенцию практической морали; существенно то, что эти коэффициенты не должны равняться нулю, и это положение можно принять за основу теоретической морали. При установлении этого факта и при изучении его последствий теория вероятностей появляется на каждом шагу» [125, стр. 169— 170]. Сейчас никто из изучающих теорию вероятностей, даже в самом элементарном объеме, не может принимать серьезно такие высказывания. Мы привели эти цитаты не для того, чтобы создать впечатление, что вся книга Бореля состоит из подобных выражений. Повторяем, это очень интересная и полезная книга. Но даже такой математик, как Борель, довольно расплывчато представлял себе предмет и метод теории вероятностей. Борель понимал, что теорию вероятностей необходимо усовершенствовать. Он писал: «Применение к точным наукам усовершенствует теорию вероятностей» [125, стр. VI]. Интересно отметить, что другая его книга «Вероятность и достоверность», написанная в 1950 г. {177}, затрагивает многие принципиальные и важные вопросы тео- 290
рии вероятностей, но не содержит никаких необоснованных применений, так как в это время теория вероятностей уже была полноправной математической дисциплиной. Нечеткость, непонимание и путаница относительно вероятностных и статистических методов существовали довольно долго. Приведем еще один пример. В предисловии к русскому переводу книги Бореля редактор перевода В. А. Костицин писал: «Успехи физики и астрономии выдвинули статистический метод на первое место в современном естествознании» [125, стр. VIII]. И далее: «Поле гипотез относительно молекулярного мира все более сужается, и недалек тот день, когда строение атома и междуатомные силы нам будут хорошо известны. Тогда снова вступит в свои права здоровый научный детерминизм, а статистические естественные законы будут лишь временным этапом нашего познания» [125, стр. X]. Мы видим, что этот прогноз не сбылся, статистические законы проникают во все более широкие сферы современного естествознания, и это определяется не уровнем наших знаний, а структурой явлений, которые изучаются естествознанием. Непосредственным предшественником создания аксиоматики в теории вероятностей был А. Пуанкаре (1854— 1912 гг.)—крупнейший математик и известный физик конца XIX и начала XX в. Ему принадлежат замечательные работы по дифференциальным уравнениям, интегральным уравнениям, по алгебре, по теории чисел, геометрии, по теории электричества, теплоты, по теории волн Герца, по кинетической теории газов и т. д. Среди всех этих вопросов, вопросы теории вероятностей занимают довольно скромное место. Пуанкаре принадлежит ряд книг и статей философского характера, в которых он иногда затрагивает и философские, методологические вопросы теории вероятностей. Кроме того, он написал книгу «Исчисление вероятностей», изданную в 1912 г. (127]. В своих философских работах Пуанкаре стоял на позициях идеализма и махизма. В. И. Ленин в «Материализме и эмпириокритицизме» дал справедливую критику философских взглядов Пуанкаре, назвав его французским махистом, а его гносеологические выводы — идеалистическими (см. [113]). Философские взгляды Пуанка- 291
ре неоднократно подвергались критике в нашей литературе. Однако это не должно умалить его специальных работ по физике и математике. Пуанкаре был крупнейшим ученым. В. И. Ленин называет его известным французским физиком. Книга Пуанкаре «Исчисление вероятностей» является одной из строгих и интересных книг по теории вероятностей начала нашего столетия. Мы остановимся на некоторых общих положениях этой книги. Он определяет случайное событие с позиций детерминизма. «Очень малая, ускользающая от нас причина определяет значительный результат, который мы не можем не видеть; если это происходит, мы приписываем результат случаю. Если бы мы точно знали законы природы и положение вселенной в момент ее возникновения, то мы могли бы точно предсказать положение этой вселенной в последующий момент». И далее: «Может случиться, что небольшие различия в первоначальных условиях порождают значительные различия в конечных явлениях: маленькая ошибка относительно первых может породить громадную ошибку относительно вторых. Предсказание становится невозможным, и мы имеем случайное явление» [127, стр. 4—5]. Пуанкаре рассматривает ряд примеров случайных событий. 1) Неустойчивое равновесие конуса, поставленного на вершину. Нам не известно, в какую сторону упадет конус. 2) Метеорологические явления. Мы не можем предсказать точно, где зародится' циклон. «Здесь мы вновь находим тот же контраст между весьма малой причиной, не поддающейся оценке наблюдателя, и весьма значительными результатами, которые иногда представляют собой опустошительные бедствия» [127, стр. 6]. 3) Распределение малых планет между зодиакальными созвездиями. «Весьма небольшие первоначальные различия между их расстояниями от Солнца, или что сводится к тому же, между их средними движениями, в конце концов дали громадные различия между их современными долготами ... Малая причина и большой результат; или лучше малые различия в причине и большие различия в результате» [127, стр. 6]. 4) Игра в рулетку. Во всех этих примерах случайные события рассматриваются как события, у которых очень малые различия в 292
первоначальных условиях приводят к ощутимым различиям в результатах. Кроме таких случайных событий, Пуанкаре рассматривает события, случайный результат которых объясняется сложностью и большим количеством причин. К такому типу случайных событий он относит различные события, взятые из кинетической теории газов, а также случайное распределение дождевых капель на какой-нибудь поверхности, распределение взвешенных крупинок в сосуде с жидкостью, распределение карт в колоде, в результате хорошей тасовки, случайные ошибки в наблюдениях и т. п. «Здесь опять мы имеем малые причины, но каждая из них порождает малый результат; их результат становится страшным, в силу их соединения и их большого числа» [127, стр. 10]. Пуанкаре рассматривает еще третий тип случайных явлений, который, как он сам считает, сводится к первым двум типам. Он рассматривает следующий пример: кровельщик роняет черепицу, которая убивает проходящего мимо человека. «Человек не думает о кровельщике и кровельщик о человеке, они представляются принадлежащими к двум совершенно чуждым друг другу мирам. И, однако, кровельщик роняет черепицу, которая убивает человека, и никто не поколеблется сказать, что это случай. Наша слабость не позволяет нам обнять целиком всю вселенную и заставляет нас разделять ее на части. Мы пытаемся делать это, насколько возможно менее искусственно, и тем не менее время от времени происходит, что эти части влияют друг на друга. Результаты этого взаимного действия представляются нам тогда вызванными случаем... Всякий раз, когда два мира, совершенно чуждые друг другу, приходят во взаимодействие, законы этой· реакции могут быть только очень сложными, и, с другой стороны, было бы достаточно весьма малого изменения в первоначальных условиях этих двух миров, чтобы эта реакция не имела места. Нужно было очень немного, чтобы человек прошел секундой позже, или чтобы кровельщик уронил свою черепицу секундой раньше» [127, стр. 11]. Далее Пуанкаре ставит вопрос: почему случай подчиняется закону? Он возвращается к примеру с рулеткой. Игла рулетки остановится в том или ином секторе в зависимости от получаемого импульса. Вероятность того, что импульсн будет заключен между а и α+ε, равна 293
вероятности, что он заключен между α + ε и α+2ε, при достаточно малых ε. «Это свойство всех аналитических функций. Малые изменения функции пропорциональны изменениям аргумента» [127, стр. 12]. Пуанкаре считает, что случай подчинен закону, потому что распределение случайностей носит характер непрерывности. Но, с другой стороны, объясняя, почему в природе существует непрерывность, он говорит, что сама непрерывность определяется взаимодействием множества случайностей. «В беге... истории действовали разные сложные причины и действовали долго: они способствовали смеси элементов и стремились сделать все однообразным, по крайней мере в небольших пространствах; они сглаживали углы, сравнивали горы, заполняли долы. Какая бы ни встретилась им капризная и неправильная кривая, какая только возможна была первоначально, они столько работали над ее выправлением, что, в конце концов, она стала непрерывной. Вот почему мы и получили право с полной уверенностью допускать непрерывность» [126, стр. 67]. Пуанкаре считает, что «наука детерминична; она таковой является a priori, она постулирует детерминизм» [64, стр. 127]. Пуанкаре отводит вероятности только области, которые нами не изучены, которые мы не знаем. «Проблемы вероятности могут быть, таким образом, классифицированы по большей или меньшей глубине незнания» [128, стр. 207]. «Случай — только мера нашего невежества. Случайными явлениями, если попытаться дать им определение, будут те, законов которых мы не знаедо» (126, стр. 51]. Исходя из таких, позиций, Пуанкаре в своей книге по теории вероятностей приходит к довольно странным выводам. «Мы не знаем, чем вызываются случайные ошибки, и именно потому, что мы не знаем этого, мы знаем, что они будут подчиняться закону Гаусса. Таков парадокс» [127, стр. 16]. Так из незнания, в духе детерминизма конца XVIII в., делаются положительные выводы. Свою вероятностную концепцию Пуанкаре распространяет на всю историю человечества. «Что означают слова „очень малый"?... Разница является очень малой, интервал является очень малым, когда в границах этого интервала вероятность остается постоянной. Почему эта вероятность может рассматриваться в малом интервале как постоянная? Потому, что 294
мы допускаем, что закон вероятности выражается непрерывной кривой... Что дает нам право сделать это предположение? ...Это то, что в течение столетий существуют сложные причины, которые не прекращают своего действия в одном и том же направлении и которые постоянно ведут вселенную к однообразию, без возможности возврата назад. Именно эти причины постепенно смягчили выступы и заполнили углубления, и именно поэтому наши кривые вероятностей имеют легкую волнистость. В течение миллиардов столетий будет сделан дальнейший шаг к однообразию, и эти колебания станут в десять раз меньшими: средний радиус кривизны нашей кривой станет в десять раз больше. И тогда такая длина, которая сегодня не кажется нам очень малой, потому что в нашей кривой дугу этой длины нельзя рассматривать как прямую линию, должна будет, наоборот, в ту эпоху рассматриваться как очень малая, поскольку ее кривизна в десять раз меньше и дуга этой длины может быть приравнена к прямой. Таким образом слова «очень малый» остаются относительными, но они являются относительными не по отношению к тому или иному человеку, а лишь по отношению к современному состоянию вселенной. Они изменяют свой смысл, когда мир станет более однообразным, когда все вещи смешаются более тесно. Но тогда, без сомнения, люди не смогут жить и должны будут уступить место другим существам» [127, стр. 16—17]. Переходя к определению вероятности и останавливаясь на классическом определении, он пишет: «Как определить, что все случаи являются равновозможными? Математическое определение в данном случае не является возможным; мы должны будем при каждом применении ставить условия, оговаривать, что мы будем рассматривать такой и такой случай, как равновозможные. Эти допущения не являются совершенно произвольными, но ускользают от математика, который после того, как они сделаны, не подвергает их анализу» [127, стр. 28]. Мы видим, что Пуанкаре своей поддержкой парадоксов Бертрана и другими критическими замечаниями требовал более четкого и строгого отношения к основным понятиям теории вероятностей. Его курс теории вероятностей был одним из лучших курсов для своего времени. 295
Но наряду с этим, его идеалистические философские позиции сказывались в трактовке многих принципиальных вопросов теории вероятностей. § 2. Предпосылки аксиоматики Развитие теории вероятностей в начале XX в. привело к необходимости пересмотра и уточнения ее логических основ. Этого требовало развитие статистической физики; этого требовало развитие самой теории вероятностей, в которой остро стала ощущаться неудовлетворенность классического обоснования лапласовского типа; этого требовало и развитие других наук, в которых широко применялись вероятностные понятия. Для того чтобы установить логическую стройность и последовательность выводов, необходимо выделить первоначальные понятия, установить правила вывода, установить непротиворечивость всех полученных результатов и т. п. Ответ на эти вопросы дает аксиоматический метод. Аксиоматический метод позволяет обозреть всю совокупность объектов, изучаемых данной математической теорией. Этот метод заключается в том, что в основу теории кладутся некоторые положения, которые называются аксиомами, и из них выводятся все остальные положения этой теории, при этом отчетливо сформилурованы и все правила вывода. Роль аксиоматического метода возросла особенно после того, как Н. И. Лобачевский показал возможность лостроения геометрии на аксиомах, отличных от евклидовых. После этого появилось много математических теорий, которые строились на основе аксиоматического метода. К началу XX в. аксиоматический метод стал проникать во многие области математики. Был произведен глубокий анализ системы аксиом геометрии (Д. Гильберт, Д. Пеано, В. Ф. Каган), началось серьезное исследование аксиоматики арифметики (Пеано, Гильберт). Аксиоматический метод — это не только метод логического обоснования различных разделов математики, он является также методом отыскания новых фактов. Установление аксиом служит наряду с подведением итога толчком к дальнейшему развитию теории. В начале XX в. во всех трудах по теории вероятно- 296
стей излагалось классическое обоснование, идущее от Лапласа, хотя с развитием науки все отчетливее вырисовывалось несоответствие этой системы и уровня науки. Классическое определение вероятности через равновоз- можные события представляет фактически тавтологию, так как равновозможность, в сущности, есть равновероятность. Следует отметить, что для узкого круга явлений, где можно указать «симметричность», это определение может быть оправдано, но его нельзя распространять на другие явления. Отсюда следует другой существенный недостаток классической концепции — очень ограниченный круг ее применимости. Она оказалась неприменимой к большинству проблем физики, статистики, биологии и техники. Во всех этих задачах не удавалось указать рав- новозможные случаи, без которых нельзя говорить о вероятности. Кроме того, исходя из классической базы, нельзя давать предсказания относительно течения реальных процессов, для этого должны быть сделаны новые специальные допущения, не вытекающие логически из основных понятий. Становилось все отчетливее видно, что теория вероятностей нуждается в новом логическом обосновании — в обосновании с помощью аксиоматического метода. § 3. Роль Бернштейна Пересмотр логических основ теории вероятностей явился началом нового, наиболее плодотворного этапа ее развития. Первые работы в этом направлении принадлежат С. Н. Бернштейну. В 1917 г. в «Записках харьковского математического товарищества» он опубликовал работу «Опыт аксиоматического обоснования теории вероятностей»: Разработкой аксиоматизации Бернштейн занимался и в дальнейшем. В книге «Математика в СССР за тридцать лет» с работами Бернштейна связывается начало нового этапа в развитии теории вероятностей у нас в стране [129]. В 1927 г. вышло первое издание книги С. Н. Бернштейна «Теория вероятностей», последнее (четвертое) издание — в 1946 г. Это одна из лучших книг по теории вероятностей, по ней в течение многих лет учились
не только математики и физики, но и многие представители других специальностей. В книге «Теория вероятностей» Бернштейн подробно излагает свою аксиоматику теории вероятностей. Он обосновывает и объясняет аксиомы, делая много общих выводов и замечаний. Он считает, что основная схема, по которой происходят наши выводы в естествознании, состоит в том, «что на основании предшествующего опыта утверждается достоверность наступления события известного класса Л, если осуществлен некоторый определенный комплекс условий а, каковы бы ни были прочие обстоятельства. Поскольку в данном конкретном опыте соблюдены условия а, наступление факта Л неизбежно» [72, стр. 7]. Но оказывается, замечает Бернштейн, наступление факта Л не является абсолютной достоверностью. Мы не можем предвидеть ход реальных явлений с непоколебимой уверенностью. Закон, который связывает α с Л, только в том случае имеет практический смысл, когда комплекс условий α не слишком громоздок и поддается наблюдению. Если это условие не выполняется то факт А называется случайным. Тогда мы стремимся вместо α ввести более простой комплекс условий β, при наличии которого наступление А приобретает определенную вероятность. «Основное допущение теории вероятностей (постулат существования математической вероятности) состоит в том, что существуют такие комплексы условий β, которые (по крайней мере, теоретически) могут быть реализованы неограниченное число раз и при наличии которых в данном опыте наступление факта А имеет определенную вероятность, выражающуюся числом» (72, стр. 8]. Если В также обладает вероятностью, то имеет место одно из трех соотношений: вер.Л = вер. β; вер. Л > вер. β; вер. Л <вер. В. «Опыт имеет решающий голос в вопросе о том, возможно ли при осуществлении данного комплекса условий β и полной неопределенности прочих обстоятельств приписать факту Л определенную вероятность» [72, стр. 8]. Бернштейн вводит три аксиомы: 1) аксиома сравнения результатов; 2) аксиома о несовместимых событиях; 3) аксиома о совмещении событий. Первые две аксиомы имеют в виду неизменность комплекса β. Третья аксиома 298
связывает вероятность А при одних условиях α с вероятностью того же факта при другом комплексе условий β. Прежде чем перейти к формулировкам аксиом, введем некоторые необходимые понятия. Если наступление а означает также и наступление Л, то а называется частным случаем события Л. Если событие Л возможно и без наступления его частного случая Л ι, то Ах называется частным случаем Л в узком смысле сложна (видом события Л). В противном случае мы считаем, что Ах есть частный случай Л з широком смысле слова. Теперь сформулируем первую аксиому. Аксиома сравнения вероятностей. Если а есть вид (частный случай в узком смысле) события Л, то вер. а < <вер. Л; обратно, если между вероятностями фактов ах и А существует неравенство вер. αχ < вер. Л, то оно означает, что вер. αχ = вер. а, где а есть некоторый вид события Л. Из первой части аксиомы вытекают два очевидных следствия: 1) Вероятность достоверного факта больше вероятности только возможного факта. 2) Вероятность возможного факта больше, чем невозможного. Это означает, что все достоверные факты имеют одну и ту же наибольшую вероятность и что все невозможные факты имеют одну и ту же наименьшую вероятность. Что касается второй части аксиомы, то здесь могут возникнуть трудности при указании события а. Однако считается, что принципиально всегда возможно указать такое событие. Вторая аксиома. Аксиома о несовместимых событиях. Если известно, что события Л и Αχ несовместимы и, с другой стороны, события В и Вх также несовместимы, причем вер. Л = = вер. В и вер. Αχ = вер. Ви то вероятность факта С, заключающегося в наступлении события Л или события Αχ, равна вероятности факта Сь заключающегося в наступлении В или В\, т. е. вер. (Л или Αχ) = (Β или Βχ). Вторая аксиома означает, что вероятность наступления одного из двух несовместимых событий определяется вероятностями каждого из них в отдельности, т. е. является их функцией и не зависит от природы самих событий. 299
Эта аксиома легко распространяется на любое /шсло несовместимых событий. Как следствие из двух аксиом можно получить следующий вывод: «Если событию X благоприятствуют т случаев из общего числа всех η единственно возможных, несовместимых и равновероятных случаев, то вероятность события X зависит только от чисел т и η (а не от природы рассматриваемого опыта), т. е. вер. X = F(mt n)9 где F(m, n) есть некоторая определенная функция» [72, стр. 13]. Любая ли функция F(mt n) удовлетворяет первым двум аксиомам? Оказывается, этим аксиомам удовлетворяет только функция вида F(m/n), причем — это возрастающая функция дроби -. Любую такую функцию η F(m/n) можно принять за вероятность X. Общепринято считать F (m/n)=mjn. Это и есть вероятность события X в высказанных условиях. Аксиома о совмещении событий связывает значения вероятностей при одном комплексе условий со значениями, соответствующими другому комплексу условий. Аксиома совмещения событий. Если α есть частный случай факта Л, то вероятность α при данных условиях зависит только от вероятности факта А при тех же условиях и от вероятности, которую приобретает α в случае осуществления факта А. Это означает, что если αϊ есть частный случай факта Льто вер. α = вер. аь если вер. А = вер. А{ при данных условиях и если вероятность, которую получает α после осуществления Л, равна вероятности, которую получает αϊ в случае осуществления Ах, Если α есть совмещение фактов А и В, то при осуществлении факта А наступление α равнозначно наступлению факта В. Аксиому совмещения событий можно сформулировать еще так: Вероятность совмещения А и В (при данных условиях) зависит исключительно от вероятности А (при тех же условиях) и от вероятности, которую приобретает факт В после осуществления А. Для независимых событий эта аксиома означает: Если события А и В независимы, то вероятность совмещения А и В зависит только от первоначальных вероятностей этих фактов. 300
Аксиому совмещения событий можно записать так: (Л, В) = Φ [(Л), (В)А] - Φ [(B), (А)В]9 где (Л)—вероятность Л; (Л)я — вероятность Л после осуществления В\ (А, В) — вероятность совмещения Л и В\ Ф —некоторая раз навсегда определенная функция (вид этой функции устанавливается теоремой умножения: (А, В) = (Л) (В)А и зависит от вида функции F). На основе этих аксиом Бернштейн строит все здание теории вероятностей. «С. Н. Бернштейну принадлежит первая, систематически развитая аксиоматика теории вероятностей, построенная на понятии качественного сравнения событий по их большей или меньшей вероятности. Само численное выражение вероятности появляется в этой концепции уже в виде производного понятия» [46, стр. 60]. Эта концепция С. Н. Бернштейна позже разрабатывалась В. И. Гливенко и американским математиком Купманом. В своих многочисленных работах по применению теории вероятностей к проблемам естествознания Бернштейн придерживался взглядов, изложенных им на I Всероссийском съезде математиков в 1927 г. в Москве. «Чисто математическая теория вероятностей может не интересоваться тем, имеет ли коэффициент, называемый математической вероятностью, какое-нибудь практическое значение, субъективное или объективное. Единственное требование, которое должно быть соблюдено, это отсутствие противоречий, а именно: различные способы вычисления указанного коэффициента при данных условиях и соблюдении принятых аксиом должны приводить к одному и тому же значению. Кроме того, если мы хотим, чтобы выводы теории вероятностей были не простой игрой ума, а допускали эмпирическую проверку, необходимо рассматривать только такие совокупности предложений или суждений, относительно которых возможно фактически установить, истинны они или ложны. Познавательный процесс, необратимый по существу, в том именно и заключается, что те или иные из признаваемых нами предложений становятся истинными, т. е. осуществляются, и тогда отрицания их в то же время становятся ложными или невозможными. Таким образом, построение теории вероятностей как единого познавательного метода требует, чтобы истин- 301
ность предложения однозначно и без всяких исключений характеризовалась определенным максимальным/значением вероятности, которое принимается равным единице, а ложность предложения должна быть адэкватона наименьшей вероятности, приравниваемой нулю» [?30]. Нужно отметить, что требование непротиворечивости является материалистическим требованием. Систему аксиом считают непротиворечивой, если существуют такие математические объекты, отношения между которыми выражаются этой системой аксиом. Чисто логическим путем непротиворечивость доказать нельзя, потому что каждое доказательство непротиворечивости является относительным доказательством: доказывается только то, что одна система также непротиворечива, как другая. В конечном счете непротиворечивость любой системы аксиом можно свести к непротиворечивости арифметики. Для доказательства непротиворечивости арифметики необходимо обратиться к опыту. Арифметика непротиворечива потому, что все ее законы являются отражением количественных отношений между предметами реального мира и* эти законы миллиарды раз проверены практикой всего человечества. Таким образом, требование непротиворечивости аксиом в конечном счете является требованием соответствия аксиом реальной действительности. Свои идеи об аксиоматике и применимости теории вероятностей к вопросам естествознания Бернштейн положил в основу своего курса «Теория вероятностей» — одного из лучших произведений мировой литературы по теории вероятностей. § 4. Частотная школа Мизеса В основе любой аксиоматической системы теории вероятностей лежит определение понятия вероятности. На недостатки классического определения вероятности указывали давно. Были видны и недостатки субъективной трактовки вероятности, идущей от Лапласа. Критику этих недостатков встречали благожелательно. Наиболее широкое распространение получили работы в этом направлении немецкого ученого Р. Мизеса (1883—1953), который из гитлеровской Германии эмигрировал в США, где он возглавил Институт прикладной математики. Мизес является основателем так называемой частотной концепции в теории вероятностей. Мизес последовательно и на- 302
стойчйво указывал на коренные недостатки классических установок. Мизеси его школа вшервые отчетливо выразили мысль, что понятие вероятности имеет смысл только при наличии массовых явлений. Одно из главных противоречий между частотной школой и основным направлением развития теории вероятностей состоит в ответе на вопрос: йвляется ли теория вероятностей математической дисциплиной или же это научная дисциплина, которая только широко использует математические методы. Мизес считал, что теория вероятностей не является математической дисциплиной. Для доказательства этого утверждения он приводит рассуждение о том, что с каждой вероятностной задачей обязательно связан некоторый реальный процесс, поэтому теория вероятностей есть наука о явлениях реального мира, а математика, по Ми- зесу, таковой не является. Все современное развитие теории вероятностей неоспоримо устанавливает принадлежность ее к математическим дисциплинам. Ряд советских исследователей, категорически отвергая философские установки Мизеса, приняли в свое время положение о том, что теория вероятностей не является математической дисциплиной. Например, Э. Кольман пишет: «Мы займемся лишь одной, принадлежащей к... группе близких математике, но все же отличных от нее отраслей науки — теорией вероятностей. Ее предметом является изучение возможности, категории, которую математика не изучает, хотя при изучении ее и применяют математический метод... В теории вероятностей, прежде чем пустить в ход математический (метод, нужно сначала установить равновозможность отдельных событий, а этого нельзя сделать математическим путем» [19, стр. 229— 230]. Мы не будем здесь подробно останавливаться на этом высказывании. Укажем только, что теория вероятностей изучает не категорию возможности, а массовые случайные явления, и что равновозможность не играет такой фундаментальной роли, как это представляли раньше. Основным понятием в частотной теории Мизеса является понятие коллектива. Под коллективом понимается бесконечная (последовательность k одинаковых наблюдений, каждое из которых определяет некоторую точку, принадлежащую заданному пространству R ко нечного числа измерений. Говорить о вероятности, по Мизесу, можно только тогда, когда существует та опре- 303
деленная совокупность событий, которую он назвал коллективом. «Условимся называть коллективом совокупность событий или явлений, которые отличаются друг от друга каким-нибудь доступным наблюдению/признаком (числом, окраской и т. п.). Спереа должен /быть налицо коллектив, тогда только можно говорить Ь вероятностях» [132, стр. 16]. Коллектив, по Мизесу, должен удовлетворять следующим двум требованиям: 1) относительные частоты появления определенного события в последовательности независимых испытаний имеют определенные предельные значения; 2) предельные значения, о которых говорится в первом требовании, остаются неизменными, если из всей последовательности выбрать любую подпоследовательность. Это и есть аксиомы Мизеса, которые мы сформулируем по другому. Первая аксиома. Существует предел где т — число -случаев при первых я, наблюдениях, когда определяемая наблюдениями точка принадлежит подмножеству S. Этот предел существует для любого простого подмножества SCR. Вторая аксиома Мизеса эквивалентна следующему утверждению. Требуется, чтобы существовал и имел то же значение Ρ (S) аналогичный предел для любой подпоследовательности К', образованной из элементов К по такому правилу, что всегда можно решить, входит ли п-е наблюдение из К в К или нет, не зная результата этого наблюдения. Последняя часть второй аксиомы не имеет точного математического смысла. «Попытки сформулировать вторую аксиому более строго не дали, по-видимому, до сих пор удовлетворительных и легко применимых результатов я думаю, что эти трудности должны быть признаны достаточно серьезными, чтобы оправдать, по крайней мере в настоящее время, выбор существенно иной системы аксиом» [133, стр. 12—13]. Исходя из того, что теория вероятностей не является математической дисциплиной, Мизес рассматривал свои аксиомы только как свойства коллектива и не придавал им значения аксиом математической теории. 304
«Мизес никогда и нигде не идет на полную формализацию своей теории, то есть на придание ей чисто аксиоматической формы» [134, № 2, стр. 86]. Сформулировав две аксиомы, Мизес заканчивает построение основ теории вероятностей и считает, что можно приступать к решению конкретных задач и к установлению общих закономерностей. Но как мы уже отмечали, на этих аксиомах нельзя построить аксиоматическое обоснование теории вероятностей. Приняв за основу тот факт, что вероятность и частота — связанные между собой величины, Мизес определяет вероятность как предельное значение частоты: «Обосновано предположение, что относительная частота появления каждого единичного наблюдаемого признака стремится к определенному предельному значению. Это предельное значение мы называем вероятностью» [132, стр. 20]. Но на самом деле никакого обоснованного предположения у нас нет. Мы никогда не можем знать, имеет ли данная частота предел или нет, хотя бы уже потому, что для этого пришлось бы произвести бесконечное число опытов. Это определение несостоятельно математически, так как мы не можем указать функциональной зависимости между количеством испытаний η и частотой появления событий т/п, где rrt — количество появлений события, а не указав такой зависимости, мы не можем вычислить предел lim m/n, который принят за вероятность. Согласно Мизесу, события до опыта не имеют вероятности, она не является объективным свойством явления. Вероятность у событий появляется только в связи с проведением опыта. Таким образом, по Мизесу, мы с помощью опыта не выясняем существующие объективные свойства, а приписываем их явлениям. Мизес считает, что никакого дальнейшего обоснования понятия вероятности не требуется, и вероятность у него теряет свое содержание объективной числовой характеристики реальных яв лений. Относительно определения вероятности Мизесом шведский математик Г. Крамер пишет: «Предлагаемое определение вероятности приводит к смешению эмпирических и теоретических элементов, а современные аксиоматические теории обычно избегают этого смешения. Указанное определение вероятности можно сравнить, напри- 305
мер, с определением геометрической точки, как предела пятен мела неограниченно убывающих размеров, а подобного определения современная аксиоматическая геометрия не вводит» [9, стр. 172]. А. Н. Колмогоров относительно установок Мизеса пишет: «Допущение о вероятном характере испытаний, т. е. о тенденции частот группироваться вокруг постоянного значения, само по себе бывает верно (как и допущение о «случайности» какого-либо явления) лишь при сохранении некоторых условий, которые не могут сохраниться неограниченно долго и с неограниченной точностью. Поэтому точный переход к пределу—-»/? не мо- жет иметь реального значения. Формулировка принципа устойчивости частот при обращении к такому предельному переходу требует определения допустимых способов отыскания бесконечных последовательностей испытаний, которое тоже может быть лишь математической фикцией. Все это нагромождение понятий могло бы еще подлежать серьезному рассмотрению, если бы в результате получилось построение теории столь своеобразной, что иными путями до ее строгого обоснования нельзя было бы дойти» [135, стр. 274—275]. Далее Колмогоров говорит, что обоснование математической теории вероятностей может быть достигнуто более строгим и логически простым путем. Хинчин по поводу двух аксиом Мизеса пишет: «Возможность полной формализации частотной теории при сохранении обоих этих требований представляется по меньшей мере сомнительной, ибо по отношению к тем представлениям, которые современная математика связывает с понятием иррегулярной последовательности, требование существования пределов оказывается лишенным всякого содержания» [134, № 2, стр. 86]. Взгляды Мизеса широко пропагандировались и имели довольно большое распространение. Но среди математиков концепция Мизеса, из-за указанных недостатков, никогда не пользовалась большой популярностью. «Если среди наших математиков это учение, насколько нам известно, сторонников не имеет (главным образом по причине своих чисто математических пороков), среди физиков оно ...до сих пор пользуется значительным успехом» (136, стр. 528]. Это писалось еще в 1952 г. — настоль- 306
ко распространены были, с одной стороны, взгляды Мизе- са и, с другой стороны, настолько недостаточно велась критика этих взглядов. На сегодняшний день картина изменилась, частотная концепция Мизеса сейчас не удов|- летворяет и большинство физиков. Наиболее полную критику взглядов Мизеса можно найти в работах Б. В. Гнеденко и А. Я. Хинчина (см., например [136, 137, 134]). Известен ряд попыток полной формализации частотной теории, при этом несколько изменялись предпосылки Мизеса. Например, Камке предлагал заменить бесконечные коллективы конечными и отказаться от требования иррегулярности. Дерге, Торнье, Копленд и другие требуют частичного отказа от иррегулярности, т. е. они требуют сохранения одного и того же значения предела не для любого выбора подпоследовательности, а только для некоторой ограниченной совокупности таких выборов. Горнье запрещает пользоваться в теории вероятностей схемами, которые не укладываются в частотную интерпретацию. Для этого он построил громоздкий формальный аппарат и вынужден был отказаться от постановки и решения ряда элементарных задач теории вероятностей. Мизес ко всем этим изменениям своей частотной концепции относился отрицательно. Он считал, что требование иррегулярности является основным в его теории. Конечно, эти попытки могут привести к формализации теории вероятностей. Но любая частотная формализация оказывается очень громоздкой. Это объясняется тем, что она еще недостаточно формальна и несет на себе конкретное содержание. Чем аксиоматическая система абстрактнее, тем она проще, чем она содержательнее, тем она более сложна, и с ее помощью труднее делать выводы в данной теории. Это оказалось существенным недостатком и для всех частотных теорий. Крупнейшие представители теории вероятностей никогда не были приверженцами частотной школы, а приверженцы этой школы не получили существенных результатов в теории вероятностей. Попыток обосновать теорию вероятностей было достаточно много. Например, итальянский математик Б. Фи- нетти выдвинул субъективное толкование вероятности. Таким подходом к вероятности он пытался преодолеть противоречия, которые возникли и в классической теории 307
вероятностей и в частной школе Мизеса. По Финетти вероятность является чисто субъективной величиной. Каждый человек по-своему оценивает вероятность того или иного события. В этой теории не только вероятность, но и другие основные понятия, такие, как зависимость, независимость, равновозможность и другие, определяются так же, как субъективные. Финетти утверждает, что и связь частоты с вероятностью также субъективна. «Никакое отношение между вероятностями и частотами не имеет эмпирического характера» [138, стр. 26]. Определение вероятности через частоту он отвергает, потому что при- таком определении нужно предполагать существование объективной вероятности, что недопустимо с субъективной точки зрения. Вероятность, по Финетти, совсем не обязательно должна быть связана с частотой, так как вероятность есть величина чисто субъективная. Естественно, как и каждый математик, Финетти требует, чтобы при определении субъективных вероятностей выполнялось требование непротиворечивости. Несколько позже Джеффрис (см. [139]) разрабатывал понятие вероятности как степени правдоподобия. Впервые эта концепция была выдвинута Кейнесом в 1921 г. По этой теории каждое предложение имеет определенную вероятность. Вероятностям такого вида нельзя дать частотной интерпретации. Разработка теории степеней правдоподобия продолжается некоторыми математиками •и в наши дни. Приведенные и им подобные попытки обоснования теории вероятностей не имели широкого распространения. § 5. Начало нового периода в развитии теории вероятностей Наряду с попытками обоснования теории вероятностей продолжалась интенсивная разработка этой науки. Анализ тенденций развития теории вероятностей позволил А. Н. Колмогорову создать аксиоматику теории вероятностей, которая явилась решающим этапом в дальнейшем ее развитии. В 1923 г. А. Я. Хинчин установил закон повторного логарифма, который является своеобразным обобщением и усилением закона больших чисел. Рассмотрим вкратце полученные им результаты. 308
Согласно Феореме БернулЛи, при п-+оо для любого •>° Ίΐτ-'Ι^)-*1· В 1909 г. Борель для р = 7г доказал, что р(цт«=ле=о)=1. τ. е. что т — пр для больших η с подавляющей вероятностью должна быть мала в сравнении с п(т—пр=0(п). В 1917 г. Кантелли распространил результат Бореля на любое р. В 1913 г. Хаусдорф для случая Бернулли нашел следующую оценку: с вероятностью единица т — пр = = 0(η1/2+ε), где ε>0 произвольно. В 1914 г. Харди и Литтльвуд показали, что с вероятностью единица т—пр = 0 (γп\ш). А в 1923 г. Хинчин доказал следующую теорему. Если вероятность появления события А в каждом из η независимых испытаний равна р, то число т появлений события А в η испытаниях при я-*<» удовлетворяет соотношению Pflimsup 1ОТ~"Р1_ =Λ=Ϊ. \я-»°о У2прд\п\пп J Функция У 2npqln\nn в этом смысле является точной верхней границей случайной величиньфп — пр\. Представим этот результат геометрически. Будем по оси абсцисс откладывать п, а по оси ординат — у=т — — пр. Проведем в этой системе две прямые: у = гп и у= =—гп. Теорема Бореля — Кантелли утверждает, что при достаточно больших η почти достоверно, что т — пр будет заключаться между прямыми у=гп и у=—ъп. Но эти границы оказались очень широки и Хинчин указал более строгие границы изменения т — пр. Если мы проведем кривые у = (1 + ε) V2npq Inln η (Ι) и у = _ (1 + ε) Y2npq In In η, (Γ) то по теореме Хинчина, каково бы ни было ε>0, для достаточно больших η разность т — пр почти достоверно заключена между этими кривыми. Если же взять кривые у = (1— ε) уШрдШпп (II) 309
и _ У = — (1 — ε) Y2npq In In η, (II') то m — яр почти достоверно бесконечно много раз выйдет за пределы этих кривых (рис. 16). Позже обобщением этого закона занимался и сам Хинчин, и Колмогоров, и другие исследователи. С работ Хинчина, а затем Колмогорова начинаются исследования по теории вероятностей в Москве, начинает создаваться московская школа теории вероятностей. Начиная с 20-х годов XX в. характер исследований по теории вероятностей во многом определялся идеями теории множеств и теории функций. При внимательном изучении основных понятий теории вероятностей оказалось, что между ними и основными понятиями теории множеств и метрической теории функций можно ус- Рис 15 тановить далеко идущие аналогии. «Эти аналогии между столь, казалось бы, различными областями науки позволили по-иному осветить логические основы теории вероятностей, обогатить ее содержание новыми постановками задач и методами исследования, а также довести до конца решение классических задач» [38, стр. 363]. Хотя Марков и расширил границы применимости закона больших чисел, однако окончательно этот вопрос еще не был решен. Установить необходимые и достаточные условия применимости закона больших чисел удалось только благодаря применению методов и понятий теории функций. В 1926 г. А. Н. Колмогоров установил эти условия. Он доказал следующую теорему. 310
Теорема Колмогорова. Последовательность взаимно независимых случайных величин fa fa—In подчиняется закону больших чисел тогда и только тогда, когда при я-»оо выполняются соотношения: 1) 2 [ dFk(x)-+0; 2)12 $ xdF*(*)^b Здесь всюдуFk (x) = Ρ (ξ* — Λίξ* < *)· Этой теоремой была завершена одна из центральных проблем теории вероятностей — проблема закона больших чисел. В том же году Хинчин установил, что если для всех случайных величин fa fa... выполнено условие Fx(x) = = ί72(*)==..4 то необходимым и достаточным условием для закона больших чисел будет существование математического ожидания. Борель в 1909 г. поставил вопрос об условиях, которые следует наложить на случайные величины fa fa...t чтобы выполнялся усиленный закон больших чисел, т. е. чтобы Ρ (ton-!-2 (Ь-л«Ь)=о)=1. Борель решил этот вопрос для схемы Бернулли, когда /? = 72. Наиболее общие результаты здесь получили Колмогоров (для независимых случайных величин) и Хинчин (для зависимых). Колмогоров, в частности, установил, что для независимых одинаково распределенных величин необходимым и достаточным условием для усиленного закона больших чисел, так же как и для простого, является существование математического ожидания. Аналогии с теорией множеств в этих исследованиях играли существенную роль. В частности, аналогом закона больших чисел являлось понятие сходимости функции по мере, а усиленного закона больших чисел — понятие сходимости функций почти всюду. Итак, идеи метрической теории функций все глубже стали проникать в теорию вероятностей. Начиная с сере- 311
дины 20-х годов Колмогоров занимается логическим оформлением этих новых идей. В результате этих исследований появилась книга «Основные понятия теории вероятностей» (1933 г.). Уже были вскрыты глубокие аналогии между понятиями теории вероятностей и понятиями метрической теории функций. Были установлены аналогии между мерой множества и вероятностью события, интегралом π математическим ожиданием, ортогональностью функций и независимостью случайных величин и др. Возникла потребность в аксиоматизации теории вероятностей исходя из теоретико-множественных представлений, что и было выполнено в книге Колмогорова. После этой аксиоматизации теория вероятностей заняла равноправное место среди других математических дисциплин. Рассмотрим аксиоматику Колмогорова. Пусть имеются наблюдения или испытания, которые хотя бы теоретически допускают возможность неограниченного повторения. Каждое отдельное испытание может иметь тот или иной исход в зависимости от случая. Совокупность всех этих возможных исходов образует множество £, которое является первым основным понятием аксиоматики. Это множество Ε называется множеством элементарных событий. Что из себя представляют события, являющиеся элементами этого множества, для дальнейшего логического построения совершенно безразлично, как безразлично для аксиоматического построения геометрии, что мы будем понимать под словами «точка», «прямая» и т. п. Только после такого аксиоматического построения теория вероятностей допускает различные интерпретации, в том числе и не связанные со случайными событиями. Любое подмножество множества Еу т. е. любую совокупность возможных исходов, называют событием. Или другими словами: случайными событиями называются элементы множества F подмножеств из Е. Понятие случайной величины является здесь функцией от элементарного события, тогда как до Колмогорова это понятие само считалось исходным. Далее рассматриваются не все события, а только некоторое тело событий. Уже не раз подчеркивалось, что теория вероятностей занимается только теми событиями, частота которых устойчива. Это положение в аксиоматической теории Колмогорова формализуется таким образом, что каждому событию, которое мы рассматриваем, ставится в соответ- 312
ствие некоторое положительное число, которое называется вероятностью данного события. При этом абстрагируются от всего того, что помогало сформулировать это понятие, например, от частоты. Это дает возможность интерпретировать аксиоматику не только вероятностным способом. Тем самым значительно расширяются возможности вероятностей. В заключение сформулируем аксиомы Колмогорова. 1. Если случайные события А и В входят в состав F, то события А или β, и Л и В, не Л и не В также содержатся в F. 2. F содержит в качестве элементов множество Ε и все отдельные его элементы. 3. Каждому элементу А из F поставлено в соответствие неотрицательное вещественное число Ρ (Л), называемое вероятностью события А. 4. Р(£) = 1. 5. Если Л и θ не пересекаются и принадлежат F, то Р(А + В) = Р(А) + Р(В). Для бесконечных множеств F имеется еще одна аксиома, которая для конечных множеств является следствием пяти приведенных аксиом. 6. Если пересечение последовательности событий \>At> ...>л„> .... пусто, то ПтР(Ап)=0. п-юо Аксиоматика Колмогорова способствовала тому, что теория вероятностей окончательно укрепилась как полноправная математическая дисциплина. Так же как каждая аксиоматически построенная дисциплина может иметь различные интерпретации, так и аксиоматическая теория вероятностей может быть истолкована в различных терминах. Здесь произошло абстрагирование от частотной картины, но оно дает возможность всегда перейти от формальной схемы к реальным процессам. Естественна, что любой вывод этой теории может быть истолкован в частотных терминах. За последние годы наблюдаются попытки дать трактовку вероятности с более широких позиций, в том числе и с позиций теории информации.
ЛИТЕРАТУРА 1. Южно-русские летописи, т. 1. Киев, 1856. 2. К. Маркс. Капитал, т. 1. Госполитиздат, 1949. 3. Р. С. Mahalanobis. The foundations of statistics. Sankhya- Indian J. Statist., 1957, 18, N 1—2. 4. Т. Го ббс. Избр. сочинения. М.—Л., 1926. 5. Φ. Энгельс. Диалектика природы. М., 1955. 6. Г. П. Боев. Теория вероятностей. М.— Л., 195G. 7. G. U г b a i η, Μ. Β ο 11. La science, ses progres, applications, t. II. Paris, 1949. 8. K. Biermann. Aus der Geschichte der Wahrscheinlichkeitsrech- nung.—Wiss. Ann., 1956, 5, N 6. 9. Г. Крамер. Математические методы статистики. М., 1948. 10. Д. Π о й а. Математика и правдоподобные рассуждения. М., 1957. 11. В. Е. Гмурман. Введение в теорию вероятностей. М., 1959. 12. F. N. D a v i d. Studies in the history of probability and statistics. I.— Biometrika, 1955, 42, N 1—2. 13. M. G. Kendall. Studies in the history of probability and statistics, II.—Biometrika, 1956, 43, N 1—2. 14. Д. Г ρ а в е. Математика социального страхования. Л., 1924. 1'5. Л. Ε. Μ а й с τ ρ о в. О математических знаках и терминах, встречающихся в археологических памятниках древней Руси, вып. X. ИМИ, 1957. 16. Н. W. F i s с h е г. Katalog des Ethnographischen Reischsmuseums, Bd. VIII. Leiden, 19-14. 17. F. W. Μ u 11 e r. Batak-Sammlung. Berlin, 1893. 18. Β. Χ ο τ и м с к и й. Исторические корни теории вероятностей. ПЗМ, 1936, Ν* 1 и 6. 19. Э. К о л ь м а н. Предмет и метод современной математики. М., 1936. 20. Л. Ε. Μ а й с τ ρ о в. Роль азартных игр в возникновении теории вероятностей.—Acta Univ. Debrecen., VII/2, 1961. Debrecen, 1962. 21. А. Данте. Божественная комедия. Чистилище. М., 1944. 22. Α. Κ. Дживелегов. Данте Алитьери. Жизнь и творчество. М., 1946. 23. А. П. Юшкевич. История математики в средние века. 1961. 24. О. Ore. Pascal and the invention of probability theory.—Amer. Math. Monthly, 1960, 67, N 5. 25. O. Ore. Cardano the gambling scholar. Princeton, 1953. 26. H. Cardano. Opera omnia, t. I, 1663. 27. G. Galilei. Opera, t. XIV. Fiorentina, 1855. 28. Г. Галилей. Диалог о двух главнейших системах мира птоло- меевой и коперниковой. М.— Л., 1948. 29. Л. Ε. Μ а й с τ ρ о в. Элементы теории вероятностей у Галилея. Вопросы истории естествознания и техники, 1964, вып. 16. 30. Г. В. Багра ту ни. Введение.—В кн.: К. Ф. Гаусс. Избранные геодезические сочинения, т. 1. М., 1957. 314
31. Д. Кутлумуратов. О развитии комбинаторных методов математики. Нукус, 1964. 32. G. W. L e i b π i z. Die philosophische Schriften, т. IV. BerKn, 1880. 33. K. Biermann. Spezielle Untersuchungen zur Kombinatorik durch G. W. Leibniz,—Forschungen und Forschritte. 1954, H. 12, 1956, H. 6. 34. N. Tart alia. General trattato di numeii et misure. 1556 35. Историко-математические исследования, вып. IV. Μ.— Л., 1951. 36. Φ. Α ρ а г о. Биографии знаменитых астрономов, физиков и геометров. СПб., 1860. 37. Н. 3 е ρ н о в. Теория вероятностей. М., 1843. 38. Б. В. Гн еден к о. Курс теории вероятностей. М.— Л., 1950. 39. А. Я. Хинчин, А. М. Яглом. Наука о случайном. Детская энциклопедия, т. 3. М., 1959. 40. В. Pascal. Oeuvres completes, t. III. Paris, 1908 41. Ch. Huygens. Oeuvres completes, t. 14, 1920. 42. Архив Маркса и Энгельса, т. IV. 1935. 43. J. Bernoulli. Ars conjectandi. Basillae, 1713. 44. I. Tod hunter. History of the mathematical theory of probability. Cambpidge — London, 1865. 45. [Я. Бернулли]. Часть четвертая сочинений Я. Бернулли «Ars coniectandi». СПб., 1913. 46. А. Н. Колмогоров. Роль русской науки в развитии теории вероятностей.— Ученые записки МГУ, 1947, 1, вып. 91, кн. 1. 47. (P. Montmort]. Essai d'analyse sur les jeux de hazard. 1713. 48. A. de Moivre. De Mensura Sortis. Philos. Trans. London, 1711. 49. A. de Μ ο i ν r e. The doctrine of chances. London, 1740. 50. D * A1 e m b e r t. Reflexions sur le calcul des probabilites. Opuscules mathematiques, t. 2. Paris, 1761. 51. Т. В ayes. Studies in the history of probability and statistics. IX. Thomas Bayes's essay towards solving a problem in the doctrine of chances (Reproduced from Philos. Trans., 1763, 53), with a biographical note G. A. Barnard.— Biometrika, 45, 1958, N 3—4. 52. L. Ε u 1 e r. Opera omnia, v. 1,7, 1923. 53. К- Р. Бирма ή. Задачи генуэзского лото в работах классиков теории вероятностей, вып. X. ИМИ, 1957. 54. D. Bernoulli. Di udicatio maxime probabilis plurium observa- tionum discrepantium atque verisimillima inductio inde formanda. Cm. [52, стр. 262—279]. Перевод: Biometrika, 1961, 48, pt. 1—2. 55. Biometrika, 1961, 48, pt. 1—2. 56. Л. Эйлер. Введение в анализ бесконечных, т. I. M., 1961 57. Б. В. Гнеденко. О работах Леонарда Эйлера по теории вероятностей, теории обработки наблюдений, демографии и страхованию. В сб.: Леонард Эйлер, в честь 250-летия со дня рождения. М., 1958. 5®. D. Bernoulli. De usu algorithm! infinitesimalis in arte conjectandi specimen. Novi commentarii Academiae Petropolitanae, t. XII. 1768. 59. Novi commentarii Academia Petropolitanae, t. XIV. 1769 60. D. Bernoulli. Specimen Teoria novae de Meusur Sortis. Commentarii Academia Petropolitanae. T. V, 1738. 61. Д. Бернулли. Гидродинамика. Изд-во АН СССР, 1959, 315
Θ2. В. И. Смирнов. Даниил Бернулли. См. [61]. 63. Б ю φ фон. Всеобщая и частная естественная история, ч. 1. СПб., 1789. 64. А. Пуанкаре. Последние мысли. Пг., 1923. 65. Л. Е. Майстров. Борьба материализма с идеализмов в теории вероятностей. В сб.: Философские вопросы естествознания, II. МГУ, 1959. 66. П. Лаплас. Опыт философии теории вероятностей. М., 1908. 67. А. Паннекук. История астрономии. М., 1966. 68. А. и Е. А н д ρ о н о в ы. Лаплас. М., 1930. 69. П. Таннери. Состояние наук в Европе (1798—1814). 'В кн.: «История XIX века». Под ред. Лависса и Рамбо., т. I, гл. XI. М., 1938. 70. П. С. Кудрявцев. История физики, т. I. М., 1948. 71. П. Лаплас. Изложение системы мира, т. I. СПб., 1861. 72 С. Н. Бернштейн. Теория вероятностей. М.—Л., 1946. 73. Б. Воронцов-Вельяминов. Лаплас. М., 1937. 74. В. И. Ленин. Сочинения, т. 25. Изд. 4, 1949. 75. Научное наследство, т. I. M.— Л., 1948. 76. П. Лаплас. Изложение системы мира, т. ΙΓ. СПб., 1861. 77. R. A d r a i п. Research concerning the probabilities of the errors which happen in marking observations. The Analyst or Mathematical Museum, v. I, N. 4. Philadelphia, 1808. 78. О. Б. Шейнин. К истории оценок непосредственных измерений и закона распределения случайных ошибок. М., 1963. (депонированное изд.). 79. Карл Фридрих Гаусс. Сб. статей к 100:летию со дня смерти. М., 1966. 80. К. Ф. Гаусс. Избранные геодезические сочинения, т. 1. М., 1957. 81. S. D. Poisson. Recherches sur la probabilite des jugements en matiere criminelle et en matiere civile. Paris, 1837. 82. Труды Института истории естествознания, т. И. М.— Л., 1948. 83. Η. Μ. Райхсберг. А. Кетлё. СПб., 1894. 84. А. К е τ л е. Социальная система и законы ею управляющие. СПб., 1863. .85. К. Маркс, Ф. Энгельс. Сочинения, т. 26, 1935. 86. Н. Д. Б е с π а м*я τ н ы х. Математика в Вильнюсском университете (1803—1832).— Ученые записки Капельского педагогического ин-та, 1963, 14. 87. Архив МГУ. Дела физико-математического факультета 1815— 1917, № 173. 88. Н. И. Л обачев с к и й. Полное собрание сочинений, т. I. М.— Л., 1946. 89. Н. И. Лобачевский. Полное собрание сочинений, τ II. Μ.—Л., 1949. 90. Η. Й. Лобачевский. Полное собрание сочинений, т. V. М.— Л., 1951. 91. Б. В. Гнеденко. О работах Н. Й. Лобачевского по теории вероятностей. Вып. II. ИМИ, 1949. 92. История естествознания в России, т. II. М., 1960. 93. В. Е. Прудников. 'Русские педагоги-математики XVIII — XIX веков. М., 1956. Щ. А. А. Марков. Исчисление вероятностей. М., 1924. 316
95. «Маяк», ч. II. СПб., 1840. 96. В. Я. Б у н я к о в с к и й. Основания математической теории вероятностей. СПб., 1846. 97. В. Я. Б у н я к о в с к и й. О суммовании численных таблиц по приближению. Прилож. к XII тому записок АН, № 4. СПб., 1867. 98. Современник, т. III. СПб., 1847. 99. М. В. Остроградский. Полное собрание трудов, т. III. Киев, 1961. УУ 100. Б. В. Г н е д е н к о. Михаил Васильевич Остроградский. М., 1952. 101. П. Л. Чебышев. Полное собрание сочинений, т. V. М.— Л., 1951. 102. А. М. Ляпунов. Жизнь и труды П. Л. Чебышева.— В кн.: П. Л. Чебышев. Избранные математические труды. М.— Л., 1946. 103. П. Л. Чебышев. Полное собрание сочинений, т. II. М.— Л., 1947. 104. Научное наследие П. Л. Чебышева, вып. I. М.— Л., 1945. 105. П. Л. Чебышев. Полное собрание сочинений, т. III. M.— Л., 1948. 106. Ф. А. Медведев. Развитие понятия интеграла Стильтьеса, вып. XV. ИМИ, 1963. 107. «Фронт науки и техники», 1937, № 7. 108. А. А. Марков. Избранные труды. Изд-во АН СССР. 1951. 109. А. С. Базикович. Биографический очерк. См. [94]. 110. А. М. Ляпунов. Избранные труда. Изд-во АН СССР. 1948. 111. Л. Больцман. Лекции по теории газов. М., 1956. 112. Л. Больцман. По поводу одного тезиса Шопенгауэра.— В кн.: К. Тимирязев. Насущные задачи современного естествознания. М., 1908. 113. В. И. Л е н и н. Сочинения, изд. 4, т. 14. 114. Н. В и н е р. Кибернетика и общество. М., 1958. 115. В. Гиб б с. Основные принципы статистической механики. М.— Л., 1946. 116. J, В е г t r a n d. Calcul des probabilites. Paris, 1899. 117. П. А. Некрасов. Философия и логика науки о массовых проявлениях человеческой деятельности. М., 1902. 118. П. А. Некрасов. Московская философско-математическая школа и ее основатели. М., 1904. 119. П. Α. Η е к ρ а с о в. Теория вероятностей. СПб., 1912. 120. Историко-математические исследования, вып. I, M.— Л., 1948 121. П. А. Некрасов. Средняя школа, математика и научная подготовка учителей, 1916. 122. Α. Α. Μ а р к о в. Биография А. А. Маркова (см. [108]). 123. Ф. П. Отрадных. Эпизод из жизни академика А. А. Маркова. ИМИ, вып. VI, М., 1953. 124. А. В. Кольцов. Некоторые материалы к биографии академика А. А. Маркова.— Вопросы истории естествознания и техники, вып. Ι, Μ., Ι956. 125. Э. Б о ρ е л ь. Случай. М.— Пг., 1923. 126. А. Пуанкаре. Наука и метод. СПб., 1910. 127. Η. Ρ о i π с а г е. Calcul des probabilites. Paris, 1912. 128. Α. Π у а н к а р е. Наука и гипотеза. М., 1904. 129. Б. В. Гнеденко, А. Н. Колмогоров. Теория вероятностей.—В кн.: «Математика в СССР за 30 лет», М.— Л., 1948. 317
130. Труды I Всероссийского съезда математиков в Москве. М., 1927. 131. А. Ю. Давидов. Приложение теории вероятностей к статистике.—Учебно-литературные статьи к 100-летнему юбилею МУ, М., 1855. 132. Р. Μ из ее. Вероятность и статистика. М.— Л., 1930. 133. Г. Крамер. Случайные величины и распределение вероятностей. М., 1947. 134. А. Я. X и н ч и н. Частная теория Р. Мизеса и современные идеи теории вероятностей. Вопросы философии, 1961, № 12. 135. Математика, ее содержание, методы и значение, т. II. М., 1956. 136. А. Я. Хинчин. Метод произвольных функций и борьба против идеализма в теории вероятностей.— В кн.: Философские вопросы современной физики., 1952. 137. Б. В. Гнеденко. Теория вероятностей и познание реального мира.— Успехи матем. наук., 1950, 5, вып. I. 138. В. F i π е 11 i. La prevesion, ses lois logiques, ses sources subjekti- ves. Trieste. 1936. 139. H. Jeffreys. Theory of probability. Oxford, 1939. 140. О. Б. Ill e й н и н. О работах Роберта Эдрейна по теории ошибок и ее приложениям. ИМИ, вып. XVI, 1965. 141. Б. В. Гнеденко, И. Б. Погреб ы секи й. Михаил Васильевич Остроградский. М., 1963. 142. P. L а р 1 a s. Theorie analytique des probabilites. Paris, 1812. 143. Th. Simpson. The doctrine of annuities and reversions. London, 1742, 1791. 144. Th. Simpson. The nature and laws of chance. London, 1740. 145. D'Alembert. Opuscules mathematique, t. 4. Paris, 1770. 146. Th. Simpson. A letter to the... President of the Royal Society on the advantage of taking the mean of a number of observations, in practical astronomy.— Philos. Trans. Roy. Soc, 1755, (1756), 49, pt. 1. 147. R. L. Ρ1 а с k e 11. The principle of the arithmetic mean.— Biomet- rika, 1958, 45, N 1—2. 148. Th. Simpson. An attempt to show the advantage arising by taking the mean of a number of observations in practical astronomy. Miscellaneous tracts on some curious... subjects in mechanics, physical astronomy and speculative mathematics. London, 1757. 149. Б. Г. Кузнецов. Электродинамика Максвелла, её истоки, развитие и историческое значение.— Труды Института истории естествознания и техники, 1955, 5. 150. Бюффон. Ёсеобщая и частная естественная история, ч. IV. СПб., 1792. 151. Э. Брода. Людвиг Больцман. Вопросы истории естествознания и техники, 1957, вып. 4. 152. L. Boltzmann. Wissenschaftliche Abhandlungen. Bd. III. 1909. 153. Μ. Planck. Wege zur physikalische Erkenntnis. Stuttgart, 1944. 154. У. И. Φ ρ a η κ φ у ρ τ, Α. Μ. Френк, Джозайя Виллард Гиббс. Μ., 1964. 155. J. Dutka. Spinoza and the theory of probability.—Scripta math., 1953, 19, N 1. 156. А. Ю. Давидов. Приложение теории вероятностей к медицине. Московский врачебный журнал, 1854, кн. 1. 157. А. Ю. Давидов. Теория средних величин с приложением ее 318
к составлению таблиц смертности. Речь и отчет, произнесенные в торжественном собрании Московского университета, 1857. 158. 3. Уиттекер, Г. Робинсон. Математическая обработка результатов наблюдений. М., 1933. 159. J. L. Lagrange. Memoire sur l'utilite la methode de prendre le milieu entre les resultats de plusiers observations. Misc. Tauri- nesia. t. 5. 1770—1773. (Oeuvres, t. 2. Paris, 1868). 160. С. Я. Лурье. Приближенные вычисления в древней Греции. Архив истории науки и техники, серия I, вып. 4, 1934. 161. Г. В. Лейбниц. Новые опыты о человеческом разуме. М.— Л., 1936. 162. А. О. Маковельский. Досократики, ч. I. Казань, 1914. 163. Algebra and mensuration from the Sanskrit of Brahmequpta and Bhascara. Transl. by H. Th. Colebrooke. London, 1817. 164. А. А. В а й μ a h. Шумеро-вавилонская математика HI—I тысячелетия до н. э. M.f 1961 165. S. P. Rigand. Miscellaneous works and correspondence of the Rev. James Bradley. Oxford, 1832. 166. О. Б. Шейнин. О статье Даниила Бернулли 1777 г. и о комментарии Эйлера.— Вопросы истории естествознания и техники, 1965, вып. 19. 167. М. В. Остроградский. Педагогическое наследие. М., 1961 168. D'Alembert. Croix ou pile. Encyclopedie. Т. 4. Paris, 1754. 169. Encyclopedie. T. 7. Paris, 1757. 170. D'Alembert. Sur l'application du calcul des probabilites a Tinoculation de la petite Verole.— Opuscules mathematiques, t. 2. Paris, 1761. 171. D*Alembert. Oeuvres completes, t. I. Paris, 1821. 172. D'Al ember t. Sur le calcul des probabilites.— Opuscules mathematiques. T. 7. Paris, 1780. 173. А. А. Марков. Закон больших чисел и способ наименьших квадратов.— Изд. физ.-матем. об-ва при Казанском ун-те, серия вторая, 1898, 8, № 3. д те—х* 174. A. A. Markov. Sur les racines de l'equation ex ■ =0— dxm • Изв. Акад. наук, серия 5, 1898, 9, JSfe 5. 175. Α. Μ. L i a ρ ο u n о f f. Sur une proposition de la theorie des probabilites.—Изв. Акад. наук, серия 5, 1900, 13, № 4. 176. Α. Μ. L i a ρ ο u η ο f f. Nouvelle forme du theoreme sur la limite de probabilite.—Записки Академии наук по физ.-матем. отд., серия 8, 1901, 12, № 5. 177. Э. Боре ль. Вероятность и достоверность. М., 1964. 178. Математический сборник, II, 1867. 179. J. math, pures et appl., 1867, XII. 180. Α. Μ. L i a p о u η ο f f. Sur un theoreme du calcul des probabilites. С. г. Acad. sci. Paris, 1901, t. 132. 181. A. M. Liapounoff. Une proposition generate du calcul des probabilites.—С. г. Acad. sci. Paris, 1901, t. 132. 182. S. N. Bernstein. Sur l'extension du theoreme limite du calcule des probabilites aux sommes des quantites dependantes.— Math. Ann. Berlin, 1927, Bd. 97.
ОГЛАВЛЕНИЕ Отавтора 3 Введение 5 Глава I. Предыстория теории вероятностей ... 7 § 1. Основные стимулы возникновения теории вероятностей 7 § 2. Роль азартных игр в возникновении теории вероятностей 12 § 3. Первые задачи 20 § 4. Работы Кардано и Тарталья 23 § 5. Элементы теории вероятностей у Галилея .... 35 § 6. Основные моменты развития комбинаторики ... 42 Глава II. Первый период развития теории вероятностей 47 § 1. Легенда о де Мере 47 § 2. Переписка Паскаля и Ферма 51 § 3. Роль Гюйгенса в теории вероятностей .... 57 Глава III. Развитие теории вероятностей до середины XIX в. 67 § 1. Я Бернулли и его работа «Искусство предположений» 67 § 2. Развитие теории вероятностей в первой половине XVIII в 90 § 3. Работы Симпсона в области теории вероятностей . 96 § 4. Байес и теорема его имени 102 § Б. Роль Эйлера и Д. Бернулли 119 § 6. Бюффон 139 § 7. Оппозиция со стороны Даламбера 145 § 8. Кондорое 152 § 9. Лаплас и его роль в теории вероятностей . . . 159 § 10. Распределение случайных ошибок 175 § 11. Состояние теории вероятностей в Европе перед появлением русской (Петербургской) школы . . 187 § 12. Теория вероятностей в России до работ Петербургской школы 191 Глава IV. Теория вероятностей во второй половине XIX в. 222 § 1. Чебышев — создатель русской школы теории вероятностей 222 § 2. Крупнейшие представители Петербургской школы . 246 § 3. Вероятность в физике 268 § 4. Парадоксы Бертрана 279 Глава V. Аксиоматическое обоснование теории вероятностей 286 § 1. Необходимость аксиоматики 286 § 2. Предпосылки аксиоматики 296 § 3. Роль Бернштейна .... 297 § 4. Частотная школа Мизеса 302 § 5. Начало нового периода в развитии теории вероятностей .... 308 Литература 314