Проблема соблюдения авторских прав постоянно преследует разработчиков YouTube. Пользователи загружали и продолжают загружать на крупнейший видеосайт пиратский контент, а правообладатели во всём винят Google, которому Youtube принадлежит. Как решить эту проблему? Вручную проверять каждый ролик — слишком долго и дорого. В Google разработали автоматическую систему распознавания нелегального видео Content ID.
Правообладатели передают компании Google копии видеофайлов, которые они хотели бы защитить от нелегальной публикации (для них это совершенно бесплатно). «Сигнатуры» подлежащих защите файлов хранятся в специальной базе данных, с которой сверяется каждый загруженный ролик. Если найдено совпадение, система помешает опубликовать видео или снабдит его рекламой, доходы от которой потекут в карман правообладателя.
Директор по разработкам YouTube Оливер Хэкман ответил на вопросы «Компьютерры» и рассказал о распознавании пиратского видео, фильтрации порнографии, новом интерфейсе сайта и HTML5.
- Сколько произведений зарегистрировано в базе данных Content ID? Есть ли среди них российские?
- Сейчас в нашей базе больше миллиона файлов. Мы обновляем её двумя способами. Когда владелец контента присылает нам файл, мы его добавляем в базу напрямую. Здесь используется два канала, причём первый работает несколько быстрее, чем второй. Мы пользуемся более скоростным каналом для обновления базы данных по спортивным мероприятиям, чтобы максимально быстро обеспечить защиту правообладателей именно в этой области. Если же речь идёт о защите контента, для которого оперативность не столь важна, то мы используем менее скоростной канал.
Что же касается объема российского контента в системе, то могу сказать, что референтного материала по российскому контенту у нас пока маловато, поскольку лишь один партнер выразил желание работать с нами – это телеканал Russia Today.
- Насколько часты ложные срабатывания Content ID?
- Их практически нет. Мы с самого начала проектировали систему именно таким образом, чтобы количество ложных срабатываний были минимальным.
- Почему порнографический контент практически никогда не встретишь на YouTube, а пиратское видео то и дело попадается? Как реализован процесс фильтрации порнографии? Кто занимается поиском порнороликов – программы или люди-модераторы?
- Вы говорите о двух фундаментально различающихся явлениях. Начнем с порнографического вопроса. У нас есть очень четкие правила сообщества, где сказано, что обнажёнка в таких-то пределах не допускается. Поэтому мы легко можем обучить наших сотрудников принимать решения даже в очень сложных ситуациях, связанных с порнографическим материалом. В отношении порнографии у нас работают как автоматизированные методы отбраковки, так и ручной просмотр. Вообще, с порнографией все достаточно просто. Любой человек поймет, что вот такое количество обнажёнки допустимо, а вот такое – уже нет. Но если говорить о трейлере какого-нибудь фильма, то мы зачастую сами не можем разобраться, хочет ли автор видео, чтобы его видела широкая публика, или нет. Приходится ждать какого-либо решения и сигнала правообладателя по данному вопросу. И как только мы получаем ту или иную рекомендацию, то сразу вводим в свою систему соответствующий алгоритм.
- Год назад Google сообщал, что на Youtube загружается около 11 часов видео в минуту. А сколько сейчас?
- С тех пор все изменилось. Теперь ежеминутно загружается 24 часа нового контента.
- Какой процент нарушающих права файлов фильтруется автоматически, а какой процент снимается по претензии правообладателя?
- Точной цифры я не знаю.
- Есть и другая проблема. Если речь идёт о каком-то громком событии или популярном фрагменте фильма, то его могут выложить на YouTube сразу несколько пользователей. В результате возникает никому не нужное дублирование файлов. Возможно ли решить эту проблему?
Вильям Л Саймон , Вильям Саймон , Наталья Владимировна Макеева , Нора Робертс , Юрий Викторович Щербатых
Зарубежная компьютерная, околокомпьютерная литература / ОС и Сети, интернет / Короткие любовные романы / Психология / Прочая справочная литература / Образование и наука / Книги по IT / Словари и Энциклопедии