Разделить корреляцию и причинно-следственную связь сложно. Та корреляционная матрица, которую я заполнил выше для Мэдисон, Райана и их друзей, основана на очень малом числе наблюдений, и мы не можем делать глобальных выводов только из нее (помните уравнение уверенности?). Однако представьте, что такую матрицу построили по очень большому количеству пользователей Snapchat, и мы обнаружили, что Пьюдипай коррелирует с Fortnite. Можно ли сделать вывод, что рост количества подписчиков Пьюдипая увеличит число игроков в Fortnite? Нет. Это снова смешивание корреляции и причинности. Дети не играют в Fortnite
А если Fortnite покупает рекламное место на канале Пьюдипая? Это может сработать: например, если некоторые игроки в Fortnite вернулись к Minecraft, Пьюдипай может привлечь их обратно. Но может ничего и не получиться. Не исключено, что интерес к Fortnite среди аудитории Пьюдипая уже находится в точке насыщения и нужно, чтобы этой игрой увлеклась Кайли Дженнер!
Если мы немного подумаем, то увидим разного рода проблемы с потенциальными выводами из наличия в наших данных корреляции Пьюдипай/Fortnite. Но когда началась революция больших данных, многие из них игнорировались. Компаниям рассказывали, что их данные весьма ценные, поскольку теперь они знают о своих пользователях всё. Но это не так.
Cambridge Analytica – яркий пример компании, которая не сумела разобраться с причинно-следственной связью.
Комитет Сената внимательно слушал то, что я им говорил по скайпу. «Cambridge Analytica собрала массу сведений о пользователях Facebook, в частности о продуктах и сайтах, где те щелкали кнопку “Нравится”. Они намеревались использовать данные для целевого информирования в соответствии с личностью пользователей. Они хотели, чтобы нервным людям показывали сообщения о защите семьи с помощью оружия, а традиционалистам рассказывали о передаче оружия от отца к сыну. Каждое рекламное сообщение должно было быть адаптировано под конкретного избирателя».
Я понимал, что мои собеседники – республиканцы из комитета, – вполне могли вообразить себе выгоды от такого инструмента для следующих выборов. А потому быстро перешел к сути. «Но по нескольким причинам это не могло сработать, – сказал я. – Во-первых, невозможно надежно определить свойства личностей по их лайкам. Таргетирование приводило к ошибкам в определении личностных качеств ненамного реже, чем давало правильные результаты. Во-вторых, тот тип невротизма, который можно найти у пользователей Facebook – любителей группы Nirvana и стиля эмо, – отличается от невротизма, связанного с защитой семьи с помощью оружия».
Я прошелся по проблемам, появляющимся из-за смешивания корреляционной зависимости и причинно-следственной связи. Когда Cambridge Analytica создавала свой алгоритм, выборы еще не состоялись. Как же они могли проверить, работает ли их реклама?
Далее я рассказал о неэффективности фейковых новостей для влияния на избирателей – еще одной теме, которую исследовал в своей предыдущей книге «В меньшинстве»[145]. Я также рассказал им, что, вопреки теории эхо-камеры[146], демократы и республиканцы на выборах 2016 года должны были слышать все стороны. Моя точка зрения противоречила взглядам либеральных СМИ, которые считали победу Трампа манипуляцией с онлайн-избирателями. Его электорат обвиняли в наивности и в том, что эти люди оказались жертвами промывки мозгов. Cambridge Analytica стала олицетворением легкости, с которой соцсети могут влиять на общественное мнение. Я не разделял такую точку зрения.
Координатор звонка сказал: «Сейчас я отключу у вас звук, пока мы обсудим то, что услышали».
Им потребовалось секунд тридцать, чтобы принять решение. «Мы хотели бы, чтобы вы прилетели в Вашингтон для дачи показаний в комитете Сената. Сможете?»
Я не ответил сразу. Я пробормотал что-то о запланированном отпуске и сказал, что мне надо подумать.
В тот момент я действительно не был уверен, стоит ли мне ехать. Но, хорошенько все обдумав, пришел к выводу, что не стоит: мой приезд в США был им нужен не для того, чтобы я объяснял сенаторам причинность и корреляцию. Они не хотели понять используемые мною модели. Они лишь хотели услышать те мои выводы, которые соответствовали их представлениям – что Cambridge Analytica и фейковые новости не сделали Трампа президентом. И я не поехал.
Однако тем летом я оказался в США. Я был в Нью-Йорке и встретился с Алексом Коганом сразу после того, как он давал показания на слушаниях в Сенате. Алекс, исследователь из Кембриджского университета, считался одним из плохих парней в истории Cambridge Analytica. Он собрал данные по 50 миллионам пользователей Facebook и продал их Cambridge Analytica. Не особо мудрый поступок, о котором он потом сожалел.