Читаем Голова как решето. Зачем включать мозги в эпоху гаджетов и Google полностью

Пришло время поговорить о еще одном важном правиле статистики: корреляция не доказывает причинно-следственную связь.

В качестве наглядного подтверждения я с удовольствием вспоминаю веб-сайт Spurious Correlations[126] о ложных корреляциях, где приводится впечатляющая и совершенно бессодержательная статистика. С 1999 по 2009 г., к примеру, прослеживается корреляционная связь между числом людей, утонувших в бассейне, и количеством фильмов с Николасом Кейджем. Существует корреляция за тот же период между возрастом победительниц конкурса «Мисс Америка» и числом смертей из-за обваривания кипятком и других ожогов.

Корреляция между возрастом победительниц «Мисс Америка» и числом смертей из-за обваривания кипятком и других ожогов

В наш перенасыщенный данными век отыскать бессмысленные совпадения вроде этих довольно просто.

Некоторые из них успешно проходят тест на статистическую значимость. Всякий, кто станет искать корреляции достаточно долго и упорно, обязательно их найдет.

Вот почему разумно сосредоточиться на корреляциях, которые не лишены смысла. Существует очевидный фактор, объясняющий связь между знанием фактов и уровнем дохода: образование.

Если человек знает много фактов, он наверняка больше времени посвятил учебе. Кто хорошо образован, тот зарабатывает лучше. Помимо прочего, это подходящий девиз для рекламы подготовительных курсов и студенческого кредита. Дипломы Лиги плюща, Стэнфорда или Массачусетского технологического института приносят неплохие дивиденды (как было многократно засвидетельствовано)[127]. Для многих престижных профессий степени бакалавра искусств, магистра делового администрирования, доктора философии или медицины – эквивалент профсоюзного билета.

В связи с этим возникает вопрос: считать ли знание фактов исключительно надежным предвестником размера доходов или только индикатором уровня образования, полученного в учебных заведениях (то есть считать ли знание фактов «суррогатом» образования)?

Специалистам по статистике часто хочется определить влияние не одного, а сразу нескольких факторов, ответственных за определенный результат. Один из наиболее часто используемых методов – линейные регрессии. За мудреным названием стоит простая идея. Допустим, вам кажется, что между количеством пончиков, которые съедает человек, и его весом существует взаимосвязь. Можно ли по съедаемым пончикам предсказать вес едока? Один из способов это выяснить – собрать личные данные о весе и недельном пончиковом рационе. Затем возьмите лист миллиметровой бумаги и для каждого едока – персонального набора данных – отметьте точку (получится точечная диаграмма). Положение точек указывает на число съедаемых пончиков (по оси x) и вес соответствующего едока (по оси y).

Если корреляция имеется – люди, которые съедают много пончиков, весят больше, – то на диаграмме появится облако точек, устремленное вверх от нижнего левого угла к верхнему правому. Эта линия и называется линейной регрессией. С ее помощью можно строить прогнозы. Понадобилось узнать, сколько будет весить человек, съедающий в месяц 14 пончиков? От отметки 14 на «пончиковой» оси проведите вертикальную линию вплоть до ее пересечения с диагональю предполагаемой зависимости. Прямая, проведенная из этой точки по горизонтали, упрется в отметку на «весовой» оси. Так вы узнаете вероятный вес едока.

По сути, именно так и работают программы статистической обработки данных при создании линейных регрессий. И хотя машина, строя точечную диаграмму, на миллиметровке линий не чертит – для этого у нее есть четкий набор математических команд, – программы действуют по тому принципу, который я только что описал.

Гораздо интереснее учитывать не один, а несколько факторов, влияющих на результат. Предсказать вес едока можно точнее, приняв во внимание его пол – ведь мужчина обычно тяжелее женщины. Для этого нужно построить диаграмму рассеяния в трех плоскостях, что на бумаге сделать непросто. А вот для статистических программ это нетрудно.

Главным методом обработки большого массива данных служат так называемые множественные регрессии. Потребитель x пола, купивший y и имеющий почтовый индекс z, склонен покупать a, выбирать b и голосовать за c. По такой модели можно, например, оценить значимость каждого конкретного фактора при составлении прогноза. Когда факторов много, некоторые зачастую оказываются лишними. Если в модели есть почтовый индекс, то нет необходимости указывать населенный пункт (почтовый индекс содержит информацию о штате и указывает на место жительства более точно). Программа это принимает в расчет.

Надбавка за знания: у тех, кто выполнил тест на общую эрудицию без ошибок, доход оказался в два с лишним раза больше

Перейти на страницу:

Похожие книги

10 глупейших ошибок, которые совершают люди
10 глупейших ошибок, которые совершают люди

Умные люди — тоже люди. А человеку свойственно ошибаться. Наверняка в течение своей жизни вы допустили хотя бы одну из глупых ошибок, описанных в этой книге. Но скорее всего, вы совершили сразу несколько ошибок и до сих пор продолжаете упорствовать, называя их фатальным невезением.Виной всему — десять негативных шаблонов мышления. Именно они неизменно вовлекают нас в неприятности, порождают бесконечные сложности, проблемы и непонимание в отношениях с окружающими. Как выпутаться из паутины бесплодного самокопания? Как выплыть из водоворота депрессивных состояний? Как научиться избегать тупиковых ситуаций?Всемирно известные психологи дают ключ к новому образу мыслей. Исправьте ошибки мышления — и вы сможете преобразовать всю свою жизнь. Архимедов рычагу вас в руках!

Артур Фриман , Роуз Девульф

Психология и психотерапия / Психология / Образование и наука
111 баек для тренеров
111 баек для тренеров

Цель данного издания – помочь ведущим тренингов, психологам, преподавателям (как начинающим, так и опытным) более эффективно использовать в своей работе те возможности, которые предоставляют различные виды повествований, применяемых в обучении, а также стимулировать поиск новых историй. Книга состоит из двух глав, бонуса, словаря и библиографического списка. В первой главе рассматриваются основные понятия («повествование», «история», «метафора» и другие), объясняются роль и значение историй в процессе обучения, даются рекомендации по их использованию в конкретных условиях. Во второй главе представлена подборка из 111 баек, разнообразных по стилю и содержанию. Большая часть из них многократно и с успехом применялась автором в педагогической (в том числе тренинговой) практике. Кроме того, информация, содержащаяся в них, сжато характеризует какой-либо психологический феномен или элемент поведения в яркой, доступной и запоминающейся форме.Книга предназначена для тренеров, психологов, преподавателей, менеджеров, для всех, кто по роду своей деятельности связан с обучением, а также разработкой и реализацией образовательных программ.

Игорь Ильич Скрипюк

Психология и психотерапия / Психология / Образование и наука