Мнение о том, что большие данные — это адронный коллайдер и интернет-гиганты, все еще распространено. Хотя данные для анализа можно найти и в небольшом магазинчике. «Веб-мастерам давно известны “тепловые карты” сайтов, позволяющие оптимизировать удобство пользовательского интерфейса. Но эта история была перенесена и в офлайн. Почти каждый торговый центр сейчас оснащен камерами слежения. Был написан софт, распознающий передвижение покупателей и составляющий карты их движения с учетом времени, которое они провели у каждой полки, — в итоге получаются “тепловые карты” торгового зала. Пропустив через этот софт сотни гигабайт видеозаписей, можно выявить “слепые зоны” магазина, временные закономерности, а также оценить эффективность изменений в выкладке товара, — рассказывает Андрей Себрант. — Истории о том, что неявные данные будут неожиданным образом интерпретироваться для предложения новых товаров клиентам, будут только множиться. По мере того как мы все больше оцифровываем нашу жизнь, офлайновые магазины научатся вести себя так же адаптивно, как и веб-страницы, меняя выкладку по дням и часам. Этот мир, возможно, консерваторам будет не очень приятен — слишком адаптивные системы многих пугают».
Большие данные идут к вам
Легендой о точном попадании стала история про американскую школьницу, которой местная торговая сеть присылала скидочные купоны на детскую одежду и кроватки. Ее отец устроил скандал, но потом ему пришлось извиниться перед торговцами. Оказывается, он не знал о предстоящем пополнении семейства. Зато торговцы по перемене вкусов покупательницы могут предсказать не только беременность, но и примерные сроки рождения ребенка.
Не каждому хочется оказаться в прицеле таргетирования. Поэтому регулярно в общественном поле возникают скандалы с очередным нарушением приватности. И чаще всего в фокусе гнева оказываются интернет-компании, собирающие информацию о посещении сайтов при помощи специальных log-файлов — куков. «Куки имеют давнюю офлайновую предысторию. Только в России не особо вдумчивые торговые сети пытаются использовать карты лояльности именно для поддержания лояльности, рассчитывая, что скидки в пять процентов будет достаточно для удержания клиентов. Во всем остальном мире карточки постоянных покупателей появились как инструмент сбора информации и отслеживания поведения клиентов. Database marketing возник еще в 70–80-е годы прошлого века, когда интернета не было, для оптимизации работы крупных торговых сетей. Но весь анализ куков аналогичен математике, связанной с отслеживанием карт лояльности. Например, стиранию куков в браузере соответствует потеря карты в офлайновом мире. Именно из-за вытеснения конкурирующими методами по мере распространения оплаты банковскими картами и онлайн-торговли популярность карт лояльности как маркетингового инструмента снижается», — рассказывает Андрей Себрант.
Data science в ее нынешнем виде — лишь временный суррогат, результат технических ограничений. Пока приходится ограничиваться анализом отдельных сегментов и групп, сами методы еще весьма грубы: раз спросив в поисковике про летние шины, приходится наблюдать объявления о них до следующей зимы. Но идеал data science — тотальная слежка и анализ поведения каждого потребителя для манипуляции его выбором.
Наш мир и дальше будет покрываться сенсорами, оцифровывающими нашу жизнь. Вскоре каждый мобильник может оказаться оснащенным датчиками, фиксирующими параметры нашего здоровья: пульс, давление, кожные реакции. Когда это станет стандартом обеспечения здравоохранения и каждый из нас будет включен в постоянный мониторинг, скрыть имитацию оргазма уже не удастся никому. Но куда больше, чем физиология, человека индивидуализируют его тексты и мысли. Если с мыслями работать только учатся, то методы анализа любых по объему массивов текста уже отработаны. В потоке электронных писем пока фильтруют только спам и потенциальных террористов. Министерство внутренней безопасности США даже раскрывает длинный перечень ключевых слов, по которым осуществляется мониторинг интернета: от «Аль-Каиды» и «теракта» до «исламистов» и «свинины».