Программа Министерства промышленности и информатизации Китая, одного из ведущих государств по применению технологий больших данных, указывает на необходимость скорейшего их внедрения в промышленное производство: «Планируется, что к 2020 году продукты и услуги, связанные с большими данными, принесут стране 1 трлн юаней, при этом совокупный прирост дохода будет в среднем увеличиваться на 30% в год... Между тем в Министерстве отмечают, что технологии больших данных еще недостаточно распространены на производстве. По словам аналитиков, большие данные могут оптимизировать работу производственного конвейера и предупредить неисправности, помочь менеджерам принимать мотивированные управленческие решения и интеллектуализировать хозяйственную деятельность»22. А по оценке General Electric, оптимизация работы оборудования за
счет анализа данных на базе Big Data в перспективе 20 лет обеспечит экономию для населения до 30%23.
В гуманитарных областях науки так же, как и в технических, передовые исследования все реже обходятся без больших данных. В науках, связанных с изучением людей и общества, традиционные опросы нескольких тысяч респондентов или узкие фокус-группы не дают и десятой доли той информации, которой располагают, к примеру, владельцы больших данных о миллионах пользователей Интернета, на чем полностью строится современная таргетинговая интернет-реклама. Во многом это обусловлено характером мировой экономики (о чем мы поговорим в следующей главе), а также тем, что Интернет является полностью датифицированной сферой, где каждое действие пользователя оставляет свой след, записывается и бережно хранится. Система интернет-рекламы, реализуемая в первую очередь информационными корпорациями Google и Facebook, и анализ больших данных тысяч характеристик пользователей позволяет рекламодателям предложить свою рекламу наиболее релевантной аудитории. В июне 2018 года конгресс США опубликовал письмо от корпорации Facebook, содержащее ответы на вопросы, которые ее глава Марк Цукерберг не смог или не успел дать во время пристрастных слушаний в Капитолии Вашингтона, вызванных скандалом с использованием этой социальной сети как инструмента для манипуляций мнением избирателей во время президентских выборов. В письме перечисляются типы данных, собираемых социальной сетью со своих пользователей. К ним относятся время, частота и длительность действий в окне с вкладкой соцсети (в том числе открыто ли оно или находится в фоновом режиме); покупки на сторонних сайтах; установленные в браузере пользователя плагины; движения мыши на устройстве пользователя; использование камеры, встроенной в приложение Facebook; метаданные фотографий (в том числе время и место съемки); установленные на устройстве пользователя приложения; имена и типы файлов на устройстве пользователя; идентификаторы из игр, приложений и других учетных записей; доступное место на диске устройства пользователя; контакты из адресной книги пользователя; в случае с Android-устройствами — журнал звонков и история SMS; ближайшие к пользователю точки доступа Wi-Fi и сотовой связи; информация мобильных и стационарных провайдеров через компьютеры, телефоны, сопряженные телевизоры и другие устройства в сети; информация об уровне заряда устройства пользователя, настройках и разрешениях; информация и фотографии других пользователей, а также частота взаимодействия и общения с ними24. И это не считая данных партнеров и другой информации, которую Facebook покупает в офлайне. Как видим, социальная сеть обладает серьезными массивами данных о каждом своем пользователе и благодаря этому имеет возможность продавать качественную нацеленную рекламу наравне с Google.
Революционное свойство больших данных состоит в том, что даже абсолютное знание о предмете не дает таких возможностей, как знание о предмете в системе больших данных.
Американский социолог Сет Стивенс-Давидович, длительное время проработавший в компании Google на должности аналитика больших данных и выпустивший известную, насыщенную яркими примерами книгу
«Все Лгут. Поисковики, Big Data и Интернет знают о вас всё», посвященную возможностям больших данных в изучении общества и его отдельных индивидов, выделяет 4 могущественных особенности больших данных:
- способность предложить новые типы фактов;
- предоставление самых правдивых фактов;
- возможность проводить многочисленные причинно-следственные эксперименты;
- возможность рассматривать самые мелкие подмножества людских сообществ.