Разобравшись в целом с поиском веб-страниц и документов, следует обратить внимание на поиск файлов всех форматов, так как он имеет некоторые особенности по сравнению с поиском текстов. Под файлами подразумеваются именно файлы в чистом виде: картинки, аудио– и видеофайлы, программы, архивы и т. д. (по сути, веб-страница – это тоже множество файлов). Рассмотрим некоторые тонкости поиска картинок, музыкальных и иных файлов.
Поиск рисунков в Интернете
Миллиарды картинок, хранящихся в Сети, могут быть использованы с самыми разными целями: в качестве рисунка Рабочего стола, как иллюстрация к научной или другой работе, для создания собственных открыток или презентаций и т. д. Искать рисунки сложнее, чем текст, поскольку индексация картинок для поисковика проблематичнее, чем индексация текста, ведь компьютеры пока не научились распознавать образы.
Какими бы умными ни казались компьютеры, как бы ни поражала их вычислительная мощь, но современные вычислительные машины пока не в состоянии справиться с задачей, которую под силу выполнить пятилетнему ребенку, например отличить изображение кошки от изображения собаки. Причем несмотря на то, что конечный пользователь при поиске рисунка описывает его именно словами, а не образами. Определение списка ключевых слов для конкретного изображения в Сети является главной проблемой, стоящей перед поисковыми серверами.
Для ее решения анализируются следующие параметры: слова, встречающиеся на странице рядом с картинкой; название ссылки, ведущей на рисунок; имя файла изображения; название сайта и др. Как бы там ни было, но находить рисунки в Интернете можно.
Однако при поиске картинок необходимо учитывать наличие описанных выше проблем по их поиску. Далеко не всегда на найденном рисунке будет изображено то, что ожидалось. Об этом нужно помнить и при построении поискового запроса. Одно дело, когда требуется найти изображение велосипеда (то есть конкретного предмета), и совсем другое, когда необходима картинка на абстрактную тему, например «бег трусцой». В последнем случае придется поэкспериментировать и попробовать, например, следующие варианты ключевых слов: «пробежка», «бегун», «спортсмен» и т. п. Таким образом, в отличие от поиска текста при поиске рисунков, если их не удается найти сразу, нужно использовать смежные, а порой и отдаленные понятия.
Рассмотрим средства, применяемые для поиска картинок в Сети. Как упоминалось выше, используя серверы метапоиска, можно искать картинки, просто введя ключевые слова в поисковую строку и выбрав функцию поиска по картинкам. Кстати, обычные поисковые серверы тоже предоставляют возможность поиска рисунков. На главной странице практически любого поисковика есть ссылка Картинки или Рисунки, перейдя по которой можно искать рисунки. Например, сервис поиска картинок «Яндекса» находится по адресу www.images.yandex.ru, соответствующей услугой, предоставляемой Google, можно воспользоваться на странице www.images.google.com. Результатом запроса будет страница с уменьшенными копиями найденных рисунков (рис. 3.6).
Рис. 3.6. Результаты поиска картинок по запросу поросенок в Google
Щелкнув на любом из таких миниатюрных изображений, можно увидеть его полноразмерный вариант и, конечно, сохранить рисунок на винчестере компьютера.
Кроме обычных поисковых серверов для поиска картинок можно использовать специализированные службы, задача которых заключается исключительно в поиске изображений. Среди них – GoGraph.com (www.gograph.com) и Picsearch (www.picsearch.com). Общий недостаток этих сервисов – их англоязычный интерфейс. Вкратце охарактеризую оба эти поисковика.
GoGraph.com
Данный сервер, скорее, не поисковик, а веб-каталог рисунков с функцией поиска. Как и в обычном веб-каталоге, на GoGraph.com (рис. 3.7) все рисунки структурированы по категориям, что позволяет искать изображения вручную, не прибегая к функциям поиска.
Рис. 3.7. Каталог-поисковик GoGraph.com
Искать можно по всем типам файлов или выбрав один или несколько из предложенных: Animated GIFs (GIF-анимация), Photos (фотографии), Icons (значки), Clip Art (клипарт). Некоторые изображения, в частности картинки с большим разрешением, будут доступны только за деньги.
Picsearch
Picsearch – удобный в использовании сервис с простым интерфейсом, возможностью расширенного поиска по различным параметрам и даже собственным мини-языком поисковых запросов (поддерживаются команды + (обязательно включать слово) и – (исключить слово)). Как заявлено на главной странице сервиса, искать можно по более чем 2 000 000 000 картинок. Picsearch (рис. 3.8) довольно быстро работает и, несмотря на свой англоязычный интерфейс, неплохо справляется с обработкой русскоязычных запросов.
Рис. 3.8. Главная страница сервера поиска картинок Picsearch