Мусульмане не единственная группа меньшинств, которую не воспринимают статистически верно. Я часто слышу, как в разговоре об американцах-христианах смешивают противников абортов и гомофобов. Мишель Дилон, профессор социологии из Университета Нью-Гэмпшира, показала, что одни религиозные группы, выступающие против абортов, одобряют однополые браки, а другие против них[143]. В целом аборты и права сексуальных меньшинств внутри религиозных групп рассматриваются как разные вопросы.
По мере того как наша жизнь все больше перемещается в интернет, доступные данные о нас также расширяются: с кем взаимодействуем в Facebook, что нам нравится, куда ходим, что покупаем – и список можно продолжать. Facebook, Google и Amazon сохраняют все социальные взаимодействия, все запросы и потребительские решения. Это мир больших данных. Нас теперь определяют не возраст, гендер или место рождения, а миллионы наблюдений, фиксирующих все наши действия и мысли.
«Десятка» быстро приступила к проблеме больших данных. Ее участники составили матрицу населения мира. Они объединяли людей по интересам. Им казалось, будто расизм и сексизм ушли в прошлое. Они измеряли, как общество развивается, чтобы стать более толерантным: справедливым и уважающим личность людей. «Десятка» действовала статистически правильно.
Новый порядок во многом финансировался рекламой, адаптированной под конкретного человека. Рекламодатели начали тендерные войны за право показывать свои продукты небольшим целевым группам пользователей Facebook. Чтобы доставлять информацию с хорошей точностью, стали привлекать других статистиков и специалистов по данным. Родилась новая область – реклама с микротаргетированием. Сначала выявляются потенциальные клиенты и им подается только нужная информация в нужное время – чтобы максимизировать их заинтересованность.
Участники «Десятки» снова победили, добавив к списку решенных ими задач рекламу и маркетинг. На этот раз даже кажется, что отчасти мораль на их стороне. Но возникла одна проблема. На числа в этой матрице смотрели не только участники «Десятки». И не все люди, видевшие ее корреляции, правильно понимали наблюдаемые закономерности…
Исследование Ани Ламбрехт посвящено правильной интерпретации больших данных. В качестве профессора маркетинга в Лондонской школе бизнеса она изучала, как данные используются повсюду – от брендовой одежды до спортивных сайтов. Аня объяснила мне в электронном письме, что, несмотря на очевидные выгоды от использования больших массивов данных в рекламе, важно учитывать и ограничения. «Данные без умения извлекать надлежащие выводы не особо полезны», – сказала она.
В одной из своих научных статей, из которой взят следующий пример, Ламбрехт с коллегой Кэтрин Такер объясняет возникающие проблемы, используя сценарий из торговли в интернете[144]. Представьте себе розничного продавца игрушек, обнаруживающего, что пользователи, которые видят больше его рекламы в Сети, покупают у него активнее. При этом он установил корреляцию между рекламой и приобретением игрушек, в итоге его маркетинговый отдел «больших данных» пришел к выводу, что кампания работает.
А теперь посмотрим на эту рекламу под другим углом. Возьмем Эмму и Джулию: они незнакомы друг с другом, но у них есть семилетние племянницы. Бродя в Сети в последнее воскресенье перед Рождеством, они, независимо друг от друга, видят рекламу компании игрушек. Эмме предстоит напряженная рабочая неделя, у нее нет времени на магазин. Джулия в отпуске и б
Джулия видела рекламу гораздо чаще Эммы, но можно ли сказать, что та эффективна? Нет. Мы понятия не имеем, что делала бы Эмма, будь у нее время смотреть рекламу. Те специалисты по «большим данным», которые заключили, что их кампания действует, перепутали корреляцию с причинностью. Мы не знаем, реклама ли заставила Джулию купить игру «Четыре в ряд», и поэтому не можем сделать вывод об ее эффективности.