Собрать новости, опубликованные в различных изданиях, в один сюжет — только часть того, что должен предоставить пользователю сервис. И по тематикам распределить — тоже только часть. А что из этих новостей вывести на первый план, что можно оставить в общем списке? Очередная задача — какие принципы положить в основу ранжирования.
Безусловно, основными факторами, влияющими на ранжирование, являются свежесть и размер сюжета (не новости как таковой!).
Дополнительно для ранжирования сюжетов используется глобальный анализ сходства, позволяющий, в частности, находить интернет-издания с высокой степенью текстуального пересечения и учитывать этот фактор в ранжировании сюжетов.
Еще один показатель, оказывающий влияние на ранжирование сюжетов, — это наша с вами, посетителями Яндекса, работа с поиском. Количество запросов в минуту составляет при обычной дневной загрузке около 2 тыс. Этих данных вполне достаточно для того, чтобы учитывать аномалии запросов для ранжирования сюжетов в Новостях. (Ведь что такое
3.1.2. Формирование новостного блока
У Яндекс. Новостей свыше полутора тысяч информационных партнеров. Казалось бы, зачем информационным изданиям отдавать свои новости для публикации на другом ресурсе? Это должно было бы понижать посещаемость основного поставщика новостей. На самом деле все получается наоборот.
Яндекс. Новости не занимаются републикацией новостей. На новостных страницах размещается лишь заголовок и краткая аннотация. Для того чтобы прочитать новость полностью, посетитель должен будет перейти на сайт-первоисточник. Следовательно, количество посетителей у информационного сайта не только не уменьшается, а наоборот, возрастает.
Для информационных партнеров Яндекс разработал специальную партнерскую программу, где каждый участник принимает на себя определенные обязательства. К партнерству приглашаются не только центральные издания, но и региональные, что позволяет Яндекс. Новостям формировать региональные новостные ленты. Но не все издания могут стать партнерами. Обязательным условием является соблюдение партнерами действующего российского законодательства. Партнеры службы — профессиональные издания, предоставляющие качественную информацию. Еще одно условие партнерства в том, что транслируемые данные должны находиться в свободном бесплатном доступе в Интернете (необходимость регистрации считается ограничением свободного доступа).
Не будут информационными партнерами издания, занимающиеся плагиатом, не имеющие собственных источников информации и публикующие только перепечатки уже опубликованных новостей. Не смогут стать информационными партнерами издания, относящие себя к "желтой" прессе. Повышать посещаемость за счет такого рода новостей не является целью Яндекса.
Если в начале существования службы Новостей специальный поисковый робот Яндекса обходил новостные ресурсы, собирая и индексируя информацию, то теперь ситуация изменилась. Информационные партнеры Яндекса сами (с использованием структуры экспортных файлов, предлагаемой Яндексом) предоставляют Новостям свою информацию. Как правило, входящая информация обрабатывается и индексируется каждые 10 минут. При этом издания не обязаны выдавать свои новости с такой же частотой, но частота обновления должна быть заявлена изданием при заключении партнерского соглашения. По словам Елены Колмановской, соглашения о партнерстве заключены у Яндекса со всеми средствами информации, которые предоставляют свои публикации для службы Новостей. В противном случае может возникнуть ситуация, аналогичная тому, что случилось с Google.
Вильям Л Саймон , Вильям Саймон , Наталья Владимировна Макеева , Нора Робертс , Юрий Викторович Щербатых
Зарубежная компьютерная, околокомпьютерная литература / ОС и Сети, интернет / Короткие любовные романы / Психология / Прочая справочная литература / Образование и наука / Книги по IT / Словари и Энциклопедии