что дает нам 10 различных вариантов. Еще в 1653 году Блез Паскаль показал, что число способов взять
Выражение
Получился тот же результат, что и при прямом переборе всех возможных вариантов. Поскольку вероятность выпадения орла на симметричной монете равна 1/2, то вероятность получить
Для
Следовательно, шансы на выпадение трех орлов при пяти бросках монеты равны 31,25 %.
Де Муавр знал о таком распределении вероятностей (сейчас оно называется биномиальным распределением), но он также понимал, насколько непрактично применять этот способ, когда
Трюк, который проделал де Муавр, – отказ от непосредственного умножения и изучение математической формы биномиального распределения. Он вывел формулу для приближения факториалов больших чисел, а его друг, шотландский математик Джеймс Стирлинг, нашел точное значение константы в ней[43], и де Муавр доказал, что при достаточно больших
На первый взгляд кажется, что это выражение сложнее, чем исходная формула вероятности для биномиального распределения, поскольку тут есть квадратные корни, константа π = 3,14… и экспонента. Но здесь нет многочисленных умножений, необходимых для вычисления факториалов, и это главное в результате де Муавра. Можно вычислять значения для 3600 или даже миллиона бросаний, просто подставляя нужные значения
Де Муавр построил первый доверительный интервал для такого события. Он показал, что шансы получить при 3600 бросаниях меньше 1740 или больше 1860 орлов составляют примерно 21 к 1, то есть вероятность получить от 1740 до 1860 орлов примерно равна 95,4 %[44].
В общем случае функция
с параметрами μ и σ2 называется плотностью нормального (гауссовского) распределения, и это одна из самых важных функций в математике. Де Муавр, видимо, не осознавал всей важности своей формулы, и только в 1810-х Пьер-Симон, маркиз де Лаплас, понял весь ее потенциал. Лаплас изучал так называемую производящую функцию моментов, которая позволяет однозначно определить распределение через его моменты[45]. Производящие функции моментов позволили Лапласу исследовать, как меняется форма распределения при сложении множества случайных результатов (например, выпадения чисел на колесе рулетки или бросания костей). Лаплас продемонстрировал замечательную вещь: независимо от того, что суммировать, по мере увеличения числа слагаемых моменты суммы всегда становятся всё ближе к моментам нормального распределения.
Потребовалось несколько лет, чтобы справиться с некоторыми хитрыми исключениями в результате Лапласа (к некоторым из них мы вернемся в главе 6). Над теми же вопросами работали в XX веке русский математик Александр Ляпунов и финский математик Ярл Вальдемар Линдеберг. Результат, доказанный Линдебергом в 1920 году, известен сегодня под названием «центральная предельная теорема»[46]. Она говорит, что если мы складываем много независимых случайных величин (например, измерений) со средним значением
Чтобы оценить масштабность этого результата, рассмотрим несколько примеров. Суммируя результаты бросания игральной кости, мы получим нормальное распределение. Суммируя результаты последовательных результатов в карточных играх, рулетке или онлайн-казино, – получим также нормальное распределение. И общее количество очков в играх сезона Национальной баскетбольной ассоциации имеет нормальное распределение (см. нижнюю диаграмму на рис. 3)[47]. И урожайность имеет нормальное распределение[48]. Скорость движения по автостраде тоже. Как и рост людей, их IQ и результаты личностных тестов[49].
Везде, где результат обусловлен различными случайными факторами, можно найти нормальное распределение, поэтому уравнение 3 используют для построения доверительного интервала в любой области, где раз за разом происходит повторение одного типа действий или наблюдений.