Читаем Профессиональный поиск в Интернете полностью

Визуальные поисковые системы действуют на стыке областей собственно интернет-поиска и анализа данных. Не случайно в них широко применяются технологии кластеризации данных. Самые полезные и инновационные системы такого плана – Quintura и AllPlus. Обе эти системы можно рекомендовать широкому кругу пользователей.

<p>Глава 5</p><p>Рекомендательные машины</p>

Эпоха «социального Web 2.0» открыла новую ипостась интернет-поиска. Появились поисковые сервисы, по-английски метко названные «Discovery Engines», то есть «машины открытий». Наиболее распространенный вариант перевода этого названия на русский язык – рекомендательные сервисы. Обычные поисковики способны работать только по прямому запросу пользователя и обладают ограниченными возможностями его уточнения. Запросы на рекомендательных машинах работают по принципу анализа ассоциативных связей. Проанализировав тем или иным способом предоставленную пользователем информацию о его вкусах или потребностях, такие машины автоматически подбирают подходящие предложения из своих баз. Метод поиска, основанный на сборе подобной статистики и применении статистических методов анализа, принято называть «коллаборативной фильтрацией». Рекомендательные машины без преувеличения являются одним из самых полезных классов поисковых приложений Web 2.0.

Рекомендательная функция современных интернет-сервисов становится все более выраженной. Инструменты автоматической рекомендации доступны на значительном количестве мультимедиа-хостингов, а также являются частыми гостями интернет-магазинов. Однако используемые в таких проектах алгоритмы достаточно просты и редко могут похвастаться точными попаданиями. В то же время существует ряд сервисов, для которых рекомендации – это основная специализация. Именно такие решения рассмотрены в данной главе.

Рекомендательные машины можно разделить на два типа: универсальные и тематические. На универсальных ресурсах можно искать и получать рекомендации не только по выбору книг или фильмов, но и музыки, подарков, телепередач, сайтов и других объектов. Тематические рекомендательные машины, как правило, сосредотачиваются на каком-либо одном виде контента. Здесь рассмотрены лучшие представители этих направлений. Примером универсального ресурса выступает крупнейший российский проект рекомендательного плана Imhonet. Тематические проекты представлены сервисами, работающими с музыкой, видео и веб-сайтами.

<p>Imhonet</p>

Информацию, необходимую для расчета рекомендаций, система получает социальными методами. Каждому новому пользователю Imhonet предлагается выставлять оценки предлагаемым объектам. Как только накапливается некий необходимый минимум оценок, пользователь начинает получать рассчитанные именно для него рекомендации и прогнозы.

Чтобы пользоваться рекомендациями можно было как можно скорее, уже в ходе регистрации аккаунта Imhonet предлагается оценить два десятка книг, фильмов и подарков. За счет продуманного интерфейса (на странице выводится сразу шесть объектов, а новые подгружаются по мере оценивания), этот процесс проходит на редкость быстро.

Наиболее качественно на Imhonet реализована работа с фильмами и книгами. Для определения оценок по десятибалльной шкале предлагается весьма функциональная панель. На ее вкладке. Детализированная оценка можно оценить до десятка отдельных характеристик фильма или книги, а также указать, насколько давно состоялось знакомство с оцениваемым произведением. Кроме того, оценку можно пометить как знаковую, которая будет иметь при расчете будущих рекомендаций максимальный вес, а также как неактуальную. При наведении указателя мыши на любой пункт оценки всплывают подсказки со словесной характеристикой, что в определенной степени способствует унификации оценок различных пользователей (рис. 5.1).

Рис. 5.1. Универсальный рекомендательный сервис Imhonet

Список рекомендаций каждого тематического раздела имеет собственные варианты настройки. Так, например, для фильмов можно указать временной промежуток их выхода, жанр, минимальный средний балл рекомендуемых произведений и минимальное количество рекомендующих их пользователей. Любопытно, что предлагается также фильтр, с помощью которого можно отсеять фильмы с очень большим количеством оценок. Это призвано избавить пользователя от банальных и общеизвестных результатов.

Страница выдачи, кроме собственно списка предлагаемых произведений, содержит достаточно подробные сведения о них. Рядом с каждой позицией выводится средняя оценка, а также оценка-прогноз, рассчитанная на основе предыдущих ваших оценок. Доступна и форма расширенной статистики, которая сообщает не только простое количество пользователей, оценивших тот же объект, но и процентное соотношение совпадений ваших оценок с оценками других пользователей, а также соотношение поставленных вами рейтингов с рейтингами других пользователей Imhonet при оценке одного объекта.

Перейти на страницу:

Похожие книги

1001 совет по обустройству компьютера
1001 совет по обустройству компьютера

В книге собраны и обобщены советы по решению различных проблем, которые рано или поздно возникают при эксплуатации как экономичных нетбуков, так и современных настольных моделей. Все приведенные рецепты опробованы на практике и разбиты по темам: аппаратные средства персональных компьютеров, компьютерные сети и подключение к Интернету, установка, настройка и ремонт ОС Windows, работа в Интернете, защита от вирусов. Рассмотрены не только готовые решения внезапно возникающих проблем, но и ответы на многие вопросы, которые возникают еще до покупки компьютера. Приведен необходимый минимум технических сведений, позволяющий принять осознанное решение.Компакт-диск прилагается только к печатному изданию книги.

Юрий Всеволодович Ревич

Программирование, программы, базы данных / Интернет / Компьютерное «железо» / ОС и Сети / Программное обеспечение / Книги по IT
Wi-Fi: Все, что Вы хотели знать, но боялись спросить
Wi-Fi: Все, что Вы хотели знать, но боялись спросить

Жизнь современного человека — это движение. Мобильность для нас становится одним из самых важных моментов для работы, для общения, для жизни. Многие из нас сейчас уже не представляют жизнь без сотовых телефонов, которые из средства роскоши превратились в предмет, без которого жизнь современного человека стала просто немыслима. Многие уже оценили все преимущества Bluetooth, GPRS. Эти устройства превратили наши телефоны из средств связи в незаменимых помощников в работе. К сожалению, один из самых главных недостатков этих беспроводных технологий — малый радиус действия и низкая скорость передачи данных, что сейчас становится очень важным фактором для всех нас. Поэтому к нам на помощь приходит активно развивающийся во всем мире и в России стандарт Wi-Fi. Особенно радует, что в крупных городах России, особенно в Москве и Санкт-Петербурге, начинается массовое внедрение беспроводных сетей Wi-Fi в публичных местах (так называемых Hot Spot) — отелях, аэропортах, ресторанах, торговых центрах и кафе.Что же такое Wi-Fi? Очередной мыльный пузырь IT-индустрии, который изо всех сил надувают производители и поставщики телекоммуникационного оборудования или новая технология, призванная в очередной раз изменить наш привычный мир, как это случилось когда-то с появлением Интернет и сотовой связи?

А К Щербаков , А. К. Щербаков

Компьютерное 'железо' (аппаратное обеспечение), цифровая обработка сигналов / Интернет / Компьютерное «железо» / Книги по IT