Примером программ первого типа может быть LanSeeker (рис. 5.13). Она бесплатна и «весит» всего около 100 Кбайт. Ее основные возможности вы можете увидеть из рисунка, поэтому что-то еще рассказывать не имеет смысла.
Рис. 5.13. Основное окно программы LanSeeker
Archivarius 3000
Эта программа относится ко второму типу.
Сайт: http://www.wizetech.com/ru/document-search/.
Статус: Shareware, 30 дней и 17 запусков, стоимость 900 рублей.
Размер: 3,43 Мбайт.
Язык: русский.
Одной из программ с серверным режимом для поиска в индексе является Archivarius 3000. Рассмотрим основные возможности данной программы.
Средняя скорость индексирования составляет 1 Гбайт/час.
Объем создаваемого индекса примерно равен 25 % от всех проиндексированных данных.
Поддерживает индексирование следующих форматов файлов: TXT, LEX, ASC, WRI, DOC, DOT, XLS, PPT, PM4, PM5, PM6, P65, PMD, SAM, WPS, WPD, RTF, PDF, WD, HTM, HLP, STD, CHI, EML, MSG, MBX, DBX, TBB, MHT, ACE, ARC, ARJ, BH, CAB, GZ, JAR, LHA, RAR, TAR, ZIP, ZOO, а также письма всех версий Outlook, Outlook Express, The Bat!.
Поддерживает поиск в таких кодировках, как DOS (850, 852, 866), WIN (1250, 1251, 1252), Unicode, UTF-8, KOI-8, ISO (8859-1, 8859-2, 8859-5), MAC, IBM-1125 (RUSCII).
Позволяет вести поиск с учетом морфологии для таких языков, как английский, русский, немецкий, французский, украинский, белорусский.
После того как вы установите и запустите программу, перед вами отобразится мастер создания области индексирования. Дело в том, что программа Archivarius 3000 может искать только в индексе, то есть без него она работать не может, а значит, должна быть создана хотя бы одна область индекса.
Мастер создания нового индекса состоит из восьми шагов, в процессе которых вы определите как расположение индексируемых файлов (каталог или почтовые программы), так и расширения, файлы которых должны входить в индекс. Кроме того, нужно еще выбрать языки, на которых будут встречаться документы в индексе, чтобы программа смогла правильно использовать словарь морфологии.
На первом шаге мастера перед вами будет стоять нелегкий выбор – нужно выбрать элементы, которые попадут в индекс. Проще всего не думать над переключателями этого шага, а просто нажать Далее. В результате вы перейдете ко второму шагу мастера, на котором намного проще выбрать индексируемые места (рис. 5.14).
Следует заметить, что намного удобнее создать несколько индексов. В дальнейшем это позволит вам более гибко управлять полученными индексами: удалять их, перестраивать, редактировать настройки.
После того как вы создадите первый индекс, перед вами отобразится главное окно программы (рис. 5.15). В нем расположены четыре вкладки: Поиск, Индекс, Сервер и Помощь. Возможно, вы уже заметили несоответствие – на изображении главного окна программы видна пятая вкладка Другое. На самом деле это не вкладка, а меню, при помощи которого можно изменить настройки программы, используемый язык и т. д.
Рис. 5.14. Второй шаг мастера создания области индексирования
Рис. 5.15. Главное окно программы
Работа с индексом. Раз уж мы находимся на вкладке Индекс, начнем рассматривать программу именно с нее. С помощью данной вкладки можно управлять созданными областями индексирования: удалять их, перестраивать индекс заново (если индексированная область сильно изменилась, например вы увлеклись детективными рассказами и поместили в индексированную область кучу таких рассказов, перед этим удалив из нее всю фантастику, которой увлекались ранее), а также изменять настройки области. Кроме того, при помощи кнопки Создать можно создавать новые области индексирования.
Как вы уже догадались, мы только что рассмотрели все кнопки на вкладке Индекс. Однако не стоит забывать, что, помимо них, в программах для операционной системы Windows часто используется и контекстное меню. Не забыли о нем и разработчики этой программы. С помощью контекстного меню определенного индекса можно выполнить следующие действия (помимо уже рассмотренных).
Переименовать – переименовывает выбранную область индексирования.
Сжать – дефрагментирует и сжимает содержимое индекса.
Очистить – очищает индекс.
Статистика – выводит подробные сведения о данном индексе и его содержимом. Так, с помощью окна Статистика индекса, отображаемого при выборе этого пункта контекстного меню, можно узнать о количестве файлов определенного расширения, языках содержимого файлов, кодировках, энтропии, частотном распределении слов и т. д.
Лексикон – открывает окно Лексикон индекса, с помощью которого можно выполнить поиск внутри выбранного индекса и узнать количество слов, которые соответствуют тому или иному запросу. Кроме того, можно узнать длину этих слов, частоту их обнаружения и количество документов, в которых они встречаются.