4. Совсем несложно совершить ошибку, заключающуюся в вере в существование значимой связи между двумя типами событий на основании наблюдения, согласно которому два события часто ассоциируются друг с другом. Так, предположим, мы обнаружили, что 90 из 100 рыжеволосых людей свойственно переменчивое настроение. Можем ли мы из этого вывести утверждение о том, что рыжие волосы и переменчивое настроение связаны каким-либо особым образом? Разумеется, нет, до тех пор пока мы не получим информацию об относительном числе людей, не имеющих рыжих волос, но обладающих при этом переменчивым настроением. Ведь может случиться так, что 90 из 100 людей с другим цветом волос также будут обладать переменчивым настроением. Следовательно, если мы захотим открыть связь между признаком А и признаком В, то нам нужно будет обнаружить не только пропорцию тех А, которые являются В, но также и суждение об индивидах А (не обладающих свойством А), которые также являются В. Из знания о том, что из тысячи глухонемых 29,6 являются слабоумными, мы не можем обоснованно вывести заключение о том, что слабоумие и свойство быть глухонемым являются взаимозависимыми признаками, если у нас при этом нет знания о том, что отношение слабоумных к общему числу населения меньше, чем 29,6, т. е., скажем, 1,5 на тысячу. Было замечено, что полнолуние и ясная погода зачастую сопутствуют друг другу; однако если мы заметим, что отсутствие полнолуния и хорошая погода ассоциируются друг с другом столь же часто, то мы не сможем проинтерпретировать любую из этих двух пар событий как значащую что-либо конкретное.
5. Существенные корреляции иногда получаются просто в силу смешения двух наборов данных, относительно которых не было установлено никакой корреляции. Если, к примеру, в какой-либо из двух общин отсутствует корреляция в возрастах мужей и жен, то строго доказать то, что при смешении списков в получившейся совокупности можно будет отыскать некоторую корреляцию, можно будет только в том случае, если среднее арифметическое возрастов мужей и жен не является одним и тем же в обеих общинах. Данная корреляция является следствием чисто математических свойств двух групп и не может рассматриваться в качестве основания для существования неизменной связи.
Здесь возникают сложности, происходящие из проведения выборки. Все корреляции могут высчитываться только для групп с конечным числом значений. Однако мы почти всегда стремимся использовать значение коэффициента для обозначения уровня корреляции между группами, которые являются более объемлющими, чем те, которые изначально были рассмотрены. Однако очевидно, что из коэффициента в 0,856 для корреляции между возрастами мужей и жен в одной общине вовсе не следует того, что данная корреляция сохраняется в более многочисленной общине или же в общине с иными социальными обычаями. Как и все статистические показатели, коэффициент подвержен воздействию флуктуаций значений выборки. В некоторых случаях относительно высокая корреляция может в целом оказаться случайной. Так, если пара костей бросается 100 раз и коэффициент корреляции высчитывается относительно числа выпавших значений, то г может обладать значением, которое будет существенно больше 0, хотя если кости являются независимыми друг от друга, то г должен строго равняться нулю. Только из одного г нельзя установить, указывает ли такое отличное от 0 значение г на наличие какой-либо зависимости.
6. Много ошибок совершается при построении умозаключений на основе значений выборки, поскольку сознательно или нет, но эти значения могли бы быть отобраны так, чтобы не являться значимыми репрезентантами всей совокупности. Этот источник ошибки особенно часто встречается в тех случаях, где были взяты лишь несколько значений или где наше знание предмета и его релевантных факторов является недостаточным.