Для дальнейших объяснений давайте перемотаем историю назад и кое-что вспомним. На рубеже первого десятилетия XXI века YouTube столкнулся с некоторыми суровыми истинами. Первая из них: зрители часто смотрели видео с других платформ, а не заходили к ним напрямую. Это лишало возможности собирать статистику о пользователях, а также сохранять ее и использовать для монетизации.
Другая суровая истина: у YouTube были разные операционные программы для разных устройств и приложений, поэтому им нужно было собрать все части и перезагрузить операционную систему в одном месте прямо из источника. Поразительно, но у платформы не было даже встроенной системы для анализа использования мобильных устройств, что было неприятным фактом, поскольку огромный процент зрительской аудитории пользовался телефонами и планшетами. Их древняя мобильная версия была настолько медленной, что с этим срочно нужно было что-то делать.
В 2012 году была создана InnerTube – программа для штаб-квартиры YouTube, предназначенная для обновления алгоритмов и разработок «сверху вниз». InnerTube перезагружала систему и наблюдала за процессом, чтобы убедиться, что все встало на свои места правильно и
Еще одной важной частью перезагрузки было использование глубокого машинного обучения[10]. Искусственный интеллект Google прошел несколько этапов разработки и применения и становился все лучше и лучше. Теперь он был способен использовать гигантские нейронные сети, которые хорошо справлялись с такими вещами, как рекомендации и поиск. Глубокое обучение выходит за рамки базового машинного обучения, поскольку оно создано для имитации человеческих нейронных сетей и умеет делать нелинейные выводы.
Исходные данные для глубокого машинного обучения на YouTube были получены из анализа действий пользователей. Отслеживалось не только их «позитивное» поведение (например, какие видео им нравились и они продолжали их смотреть), но и «негативное» (например, что они пропустили или даже удалили со своей стартовой страницы или из рекомендаций). Такой всестронний мониторинг критично важен для точности алгоритма. Эта нейронная сеть стала настолько совершенна, что даже может предсказывать, что пользователь будет делать с новыми или незнакомыми видео, основываясь на его нынешнем поведении. Утверждение «у него есть собственный разум» – не такая уж большая натяжка. ИИ на самом деле не наблюдает за общим поведением пользователя в Интернете: его интересует только то, что имеет отношение к YouTube. Это важно, потому что позволяет поддерживать высокую точность выдаваемых рекомендаций.
Один миллиард часов видеоконтента ежедневно потребляется зрителями на одном ресурсе! За семь лет и тысячи, если не десятки тысяч выполненных настроек и корректировок искусственный интеллект стал практически безошибочно рекомендовать видео, которые зрители смотрели бы дольше.
Как?
Допустим, вы зашли на google.com и набрали в строке поиска «стейкхаусы в Лос-Анджелесе». Приведет ли это к тому, что, зайдя позже на youtube.com, вы увидите в рекомендациях видео о том, как приготовить идеальный стейк на гриле? Или видео-тур по Лос-Анджелесу? Скорее всего, нет. Но если вы наберете «как приготовить идеальный стейк на гриле» прямо в строке поиска YouTube и нажмете на первое рекомендуемое видео, следующим роликом может стать «Самый сильный человек в мире: целый день чревоугодия», а затем – «Как очистить чугунную сковороду». Эти вторичные видео не имеют ничего общего со стейком, но, как вам кажется, на какие видео вы, вероятнее всего, продолжите кликать? Машина глубокого обучения знает, что делает. А YouTube и его экосистема получают прямую выгоду, потому что, когда зрители смотрят больше видео, каждый, кто зарабатывает на этом, получает больше денег, а бренд получает больше рекламы.
Каждый день YouTube рекомендует пользователям