Зависимости между фразами. Мы рассмотрели способы установления зависимостей между отдельными словами, однако, помимо этого, можно определять зависимости между целыми фразами либо даже между зависимостями слов. Это несложно – достаточно взять отдельную фразу в круглые скобки.
В качестве примера рассмотрим такой запрос: мумие (лечение | лечебный | болезни)—(цена | прайс | рубли | доллар | фирма | магазин). По данному запросу будут найдены все страницы, на которых присутствует слово мумие, а также одно из слов, символизирующих его лечебные качества. При этом на страницах не должно быть слов, связанных с покупкой этого предмета.
Изменение правил релевантности. Еще одной интересной особенностью поисковой системы «Яндекс» является возможность изменения релевантности отдельных слов в поисковом запросе.
Так, чтобы изменить вес отдельного слова, нужно поставить после него оператор :вес. Например, запрос поисковые механизмы:5 говорит о том, что на результирующих страницах более важно слово механизмы, а не слово поисковые.
Кроме того, поисковая система позволяет определить уровень нестрогого поиска (коэффициент «мягкости»). Иными словами, вы можете определить, будут ли в результаты поиска включаться страницы, которые содержат не все из тех слов, что вы указали в запросе (пассажи). Для этого предназначены запросы вида (слова через пробел)//число от 1 до 100. По умолчанию поиск ведется с коэффициентом мягкости, равным 6.
При коэффициенте мягкости, равном 50, количество найденных документов должно быть примерно равно среднему геометрическому чисел найденных документов при поиске всех возможных неполных пассажей. Подробнее о коэффициенте мягкости можно прочитать на странице http://company.yandex.ru/articles/romip2004.xml.
Команды поиска
Помимо обычных запросов, поисковая система «Яндекс» может обрабатывать и специальные, сформированные при помощи особых команд. Рассмотрим основные команды.
$title (искомые слова) – искать указанные слова только в заголовке страниц. Например, взгляните на такой сложный запрос: Максвелл $title (биография).
$anchor (искомые слова) – выполнить поиск указанных слов только в именах страниц. Например, запрос $anchor (one style) отобразит только те страницы, в имени которых встречаются слова one и style.
#keywords=(искомые слова) – искать указанные слова только в ключевых словах страниц (то есть внутри тега meta name="keywords" content="" страницы).
#abstract=(искомые слова) – выполнить поиск указанных слов только в описании страниц (то есть внутри тега meta name="description" content="" страницы).
#image="название" – искать только изображения, имеющие указанное название.
#hint=(искомые слова) – искать только изображения, в подписях к которым встречаются указанные слова.
#url="имя сайта" – выполнить поиск только на данном сайте. Например, запрос поисковые системы #url = «www.onestyle.com.ua» отобразит все страницы сайта www.onestyle.com.ua, на которых встречается фраза поисковые системы.
host="имя сайта" – выполнить поиск только на данном сайте, а также на всех его зеркалах.
Помимо оператора host, можно использовать оператор rhost. Он аналогичен оператору host во всем, кроме записи имени сайта, – имя сайта при его использовании записывается в обратном порядке. Например, rhost="ru.yandex.*".
#link="имя сайта" – выполнить поиск ссылок на указанный сайт.
#mime="тип файла" – в качестве результатов поиска отображать только файлы с заданным расширением. Например, команда Vista #mime="doc" отобразит список всех файлов с расширением DOC, содержащих слово Vista. При поиске страниц с несколькими расширениями правильнее было бы использовать запрос следующего вида: (инструкция микроволновая печь) (mime="pdf" | mime="rtf"), то есть запретить ранжирование страниц результата запроса по расширениям.
Поисковая система «Яндекс» индексирует содержимое файлов со следующими расширениями: HTML, PDF (Adobe Portable Document Format), DOC (Microsoft Word), PPT (Microsoft PowerPoint), XLS (Microsoft Excel), RTF (Rich Text Format), SWF (Macromedia Flash).