Утилиты для локального поиска

Светлана Шляхтина

Технология быстрого локального поиска

Коротко о продуктах

Архивариус 3000 4.24 (Archivarius)

SearchInform Desktop 4.5.7

diskMETA 4.01

Copernic Desktop Search 3.2.1

Google Desktop 5.9

Персональный поиск 2.6.0

DVYGUN Smart Search 2.5.4.3

Заключение

 

Поиск интересующей информации в Интернете у большинства пользователей сложностей не вызывает: достаточно ввести ключевой запрос в любимой поисковой системе — и она тут же осчастливит вас множеством ссылок, причем еще и отсортированных по релевантности и с отображением фрагментов текста с подсвеченными ключевыми словами. Разобраться в недрах собственного жесткого диска и быс­тро найти нужный документ зачастую оказывается гораздо сложнее, ведь возможности встроенного поиска в Windows ограничены и помогает он далеко не всегда. Особенно плачевно обстоит дело с текстовыми документами, о которых пользователь зачас­тую помнит лишь то, о чем в них примерно говорилось. Попробуйте, например, найти все материалы на русском языке, где речь идет о конкретной проблеме, включая файлы, сообщения электронной почты, данные о деловых встречах или контактах. В таких случаях без специализированных Desktop Search-утилит просто не обойтись. Наиболее интересные из них для широкого круга пользователей мы и рассмотрим в этой статье.

Технология быстрого локального поиска

Если вы не помните имя документа, то для получения доступа к нему придется запускать поиск по ключевым словам. Но при проведении такого поиска встроенными средствами Windows далеко не все файлы окажутся найденными, поскольку морфологические особенности русского языка в этом случае не учитываются — в результате не будут найдены файлы, в которых искомые слова имеют другое падежное окончание. Да и быстро получить результат при таком способе не удастся, ведь у большинства пользователей на диске хранятся десятки и даже сотни тысяч документов. Еще печальнее, что ключевые слова и иные данные, касающиеся искомого документа, зачастую лишь предположительны, а потому поиск нередко приходится повторять снова и снова с изменением параметров, что еще больше увеличивает временные затраты. Заметно ускорить процесс можно включением службы индексирования Windows, но работа с ней не слишком очевидна и недостаточно удобна, да и морфология при поиске все равно учитываться не будет.

Поэтому гораздо лучше обзавестись специализированной поисковой утилитой для быстрого локального поиска. Как и служба индексирования Windows, подобные утилиты индексируют определенные типы документов на жестком диске и затем в ответ на поисковый запрос мгновенно выдают список документов, в тексте которых имеются указанные ключевые слова, извлекая соответствующую информацию из созданной индексной базы. Однако процесс управления индексами и проведение поиска в них реализованы более удобно, а результаты поиска оказываются более качественными. Разумеется, соответствующие индексы должны быть предварительно построены (это займет некоторое время и потребует определенного места на диске) и в дальнейшем в силу динамичности информации их придется периодически обновлять, но это несложно и чаще всего может быть автоматизировано.

Найти подходящую утилиту для проведения быстрого индексированного поиска по ключевым словам сегодня не проблема. Подобных решений очень много, правда тут нужно отметить два существенных момента. Во­первых, многие из них в большей степени ориентированы на корпоративного пользователя и потому предлагаются по весьма приличной цене: скажем, Cros за 4300 руб., dtSearch Desktop за 199 долл. и т.п. Такие решения (несмотря на все их плюсы) мы из рассмотрения исключили, поскольку собираемся представить утилиты, подходящие для широкого круга пользователей. Во­вторых, не все поисковые утилиты поддерживают смысловой морфологический поиск (то есть умеют находить все грамматические формы введенных в запрос ключевых слов, а не только введенные ключевые слова в исходном виде). Из рассмотренных нами в статье решений проводить поиск с учетом морфологии на русском языке в той или иной степени могут все утилиты, за исключением Copernic Desktop Search и Google Desktop. А SearchInform Desktop не только обеспечивает фразовый морфологический поиск, но еще умеет искать похожие по содержанию документы, что не реализовано ни в одной другой из рассмотренных в статье утилит. Этот вид поиска проводится не по отдельным словам и фразам, а по целому тексту (то есть поисковый запрос представляет собой текст определенного размера) — по окончании такого поиска программа выводит список нужных документов, максимально похожих на заданный фрагмент с учетом всего множества встречающихся в документе словоформ.

Принцип работы всех рассмотренных в статье решений в теории примерно одинаков. При первом запуске они индексируют поисковую зону и создают индекс — это в дальнейшем и обеспечивает возможность мгновенного нахождения документов. Однако на практике технология поиска в утилитах реализована по-разному, что для ряда пользователей оказывается принципиальным. Так, в «Архивариусе» и SearchInform Desktop (редакция Standard) количество поддерживаемых индексов ничем не регламентируется, в diskMETA-Personal может быть создано до ста индексов, в diskMETA-Lite — два, а во всех остальных решениях предусмотрено формирование только одного индекса (см. таблицу). Это существенно для технических писателей, журналистов, методистов, преподавателей и других пользователей, которым приходится иметь дело с очень большим количеством документов нескольких базовых типов, включающих данные об одних и тех же объектах, но в разной трактовке. Дело в том, что гораздо удобнее, если каждый тип документов будет индексироваться по отдельности, то есть окажется включенным в свой индекс.

Зона индексирования во всех утилитах может быть ограничена конкретными папками, разрешается также указывать список индексируемых расширений и/или типов данных — это позволяет сократить время построения индекса и уменьшить объем занимаемого им на жестком диске места. Однако в ряде решений (Copernic Desktop Search, Google Desktop и «Персональный поиск») создание первого индекса запускается автоматически при первом запуске утилиты либо даже в ходе ее инсталляции (как у DVYGUN Smart Search), причем по умолчанию сканируются все жесткие диски без исключения и все поддерживаемые форматы данных. А это неразумно, ведь пользователю обычно не требуется индексировать все файлы на всех установленных жестких дисках в полном объеме — как правило, достаточно проиндексировать только папки с документами. В дальнейшем созданный индекс обновляется, что может производиться по требованию, установленному расписанию либо в фоновом режиме во время отсутствия активности со стороны пользователя. Последний вариант может не устроить тех пользователей, у которых в фоновом режиме настроена работа каких­то других утилит — значит, утилита Google Desktop, в которой других вариантов обновления индекса не предусмотрено, им не подойдет.

Заметно отличается функционал решений в отношении возможностей поиска. В частности, «Архивариус» и diskMETA, в отличие от других вошедших в обзор утилит, не позволяют ограничивать зону поиска конкретной папкой — это следует учитывать при создании индексов. А в SearchInform Desktop не предусмотрено проведение поиска определенных типов документов, что может приводить к получению слишком длинных списков с результатами поиска, на визуальный просмотр которых потребуется больше времени.

Во всех утилитах в том или ином варианте существует расширенный поиск, но реализован он по-разному. Практически везде предусмотрена возможность поиска документов с учетом даты, формата, размера документа и т.п., но в одних решениях для этого достаточно лишь включить соответствующие флажки, а в утилитах Google Desktop и «Персональный поиск» придется вводить довольно сложные конструкции, что неудобно и займет больше времени. Так, в Google Desktop для поиска документов определенного формата потребуется конструкция вида «filetype:ppt», а в «Персональном поиске» — вида «текст << mime=»pdf»». Что касается булева поиска, то он возможен только в «Архивариусе», diskMETA, Copernic Desktop Search и DVYGUN Smart Search.

Имеются отличия и в плане отображения и просмотра результатов поиска: чаще всего результаты отображаются в виде списка с автоматической сортировкой документов по релевантности, отображением для каждого документа его типа, размера и тому подобных характеристик и выделением ключевых слов. Исключение составляет утилита Copernic Desktop Search, где результаты могут быть отсортированы по любому из индексируемых по какой­либо категории полей (размеру, дате создания и т.п.), но не по релевантности, а это неудобно. Что касается просмотра, то в большинстве решений найденные документы просматриваются во встроенной программе просмотра и могут быть открыты во внешнем приложении, и только в программе «Персональный поиск» встроенного модуля просмотра документов не предусмотрено.

Коротко о продуктах

Архивариус 3000 4.24 (Archivarius)

Разработчик: Likasoft

Сайт программы: http://www.likasoft.com/ru/document-search/index.shtml

Размер дистрибутива: 4 Мбайт

Работа под управлением: Windows 95/98/Me/NT/2000/XP/2003/Vista

Способ распространения: shareware (30-дневная демо-версия, позволяющая включать в индексы не более 10 тыс. файлов, — http://www.likasoft.com/ru/download.shtml)

Цена: коммерческая лицензия — 990 руб., персональная лицензия — 395 руб., студенческая лицензия — 295 руб.

«Архивариус» — удобный инструмент для быстрого поиска документов на 18 языках (включая русский, английский, немецкий и французский), причем с учетом морфологии на всех этих языках. Обеспечивает поиск в документах более чем 40 форматов, начиная от DOC и PDF и заканчивая NG (Norton Guide) и W&D («Слово и дело»), и во всех распространенных типах архивов, начиная от ZIP и RAR и заканчивая ARJ и ZOO.

 

Рисунок

Предусмотрен также поиск в почтовых сообщениях (Outlook, Outlook Express, The Bat! и др.), вложенных в сообщения файлах (в том числе с возможностью распаковки вложенных архивов), в базах данных Lotus Notes и Lotus Domino и в базах сообщений ICQ, Odigo IM и Miranda IM. Возможен удаленный поиск документов через Интернет с последующим доступом к найденным документам через любой интернет-обозреватель.

SearchInform Desktop 4.5.7

Разработчик: SoftInform

Сайт программы: http://www.searchinform.com/site/ru/main/search-inform-products-search-inform-desktop.htm

Размер дистрибутива: 15,2 Мбайт

Работа под управлением: Windows 2000/XP

Способ распространения: Standard — shareware (30-дневная демо-версия — http://www.searchinform.com/download/searchinformdesk.exe); Free — freeware (http://www.searchinform.com/download/searchinformdeskfree.exe)

Цена: Free — бесплатно, Standard — 1500 руб.

SearchInform Desktop — инструмент для мгновенного полнотекстового поиска документов на русском языке, отличающийся очень высокой скоростью индексирования, но не очень удобный в работе в силу некоторой запутанности интерфейса. Обеспечивает фразовый поиск с учетом морфологии и словаря синонимов, а также умеет находить похожие документы. Поддерживает более 50 распространенных текстовых форматов файлов и корректно работает с основными архивами (RAR, ZIP, JAR, TAR, GZ, TGZ, ISO, CAB). Умеет проводить поиск в почтовых базах Outlook и TheBat! и логах программ мгновенного обмена сообщениями ICQ 99-2005 и Microsoft Messenger.

 

Рисунок

Программа представлена в нескольких редакциях, среди которых для широкого круга пользователей интересными могут оказаться редакции Free и Standard, различающиеся допустимым объемом индексируемой информации и количеством поддерживаемых индексов. В редакции Standard также представлены расширенные возможности работы с индексами. Подробное сравнение редакций можно найти по адресу: http://www.searchinform.com/site/ru/main/search-inform-products-differences-table.htm.

diskMETA 4.01

Разработчик: ЗАО «МЕТА»

Сайт программы: http://diskmeta.com/

Размер дистрибутива: diskMETA-Lite — 2,2 Мбайт; diskMETA-Personal — 2,57 Мбайт

Работа под управлением: Windows 98/Me/NT/2000/XP/2003

Способ распространения: diskMETA-Lite — freeware (http://diskmeta.com/loading/); diskMETA-Personal — shareware (30-дневная демо-версия — http://diskmeta.com/loadingpers/7/)

Цена: diskMETA-Lite — бесплатно, diskMETA-Personal — 48,50 долл. (для некоммерческого использования бесплатно)

diskMETA — простая и удобная, хотя и давно не обновлявшаяся утилита для мгновенного полнотекстового поиска документов на русском, английском и украинском языках с учетом морфологии. Поиск возможен только в основных форматах документов (TXT, HTML, DOC, XLS, RTF, PDF и др.), архивах форматов CHM, ZIP и RAR и аудиофайлах (MP3 и OGG).

 

Рисунок

Программа представлена в трех редакциях, среди которых для домашних пользователей интересными могут оказаться редакции diskMETA-Lite и diskMETA-Personal, различающиеся перечнем поддерживаемых форматов, а также уровнем поддержки морфологического поиска. Подробное сравнение редакций имеется по адресу: http://diskmeta.com/compare/.

Copernic Desktop Search 3.2.1

Разработчик: Copernic Technologies, Inc.

Сайт программы: http://www.copernic.com/en/products/desktop-search/index.html

Размер дистрибутива: 7,07 Мбайт

Работа под управлением: Windows XP(SP2)/Vista

Способ распространения: Professional — shareware (30-дневная демо-версия — http://www.copernic.com/en/products/desktop-search/professional/trial.html); Home — freeware (http://www.copernic.com/en/products/desktop-search/home/download.html)

Цена: Professional — 49,95 долл.; Home — бесплатно (только для некоммерческого использования)

Copernic Desktop Search — инструмент для быстрого поиска документов на английском, русском и других языках, но без учета русскоязычной морфологии. Обеспечивает поиск в файлах более 150 файловых форматов, включая документы Word, Excel и PowerPoint, PDF- и HTML-файлы, популярные архивы (ZIP, RAR, TAR и GZ), аудио­ и видеофайлы и изображения. При необходимости список индексируемых форматов может быть пополнен пользователем. Утилита также может производить поиск в почтовых сообщениях, включая вложенные в них файлы (Outlook, Outlook Express, Eudora и Mozilla Thunderbird), контактах Outlook/Outlook Express, заметках и задачах Outlook и просмотренных веб­страницах. Возможен удаленный поиск документов через Интернет.

 

Рисунок

Программа представлена в нескольких редакциях, среди которых для домашних пользователей интересными могут оказаться редакции Home и Professional, различающиеся перечнем поддерживаемых категорий данных, а также поисковыми возможностями. Подробное сравнение редакций представлено по адресу: http://www.copernic.com/en/products/desktop-search/cds-compare.html.

Google Desktop 5.9

Разработчик: Google

Сайт программы: http://desktop.google.com/

Размер дистрибутива: 2 Мбайт

Работа под управлением: Windows 2K/XP/2003/Vista

Способ распространения: freeware (http://dl.google.com/dl/desktop/R/ru/GoogleDesktopSetup.exe)

Цена: бесплатно

Google Desktop — простая утилита для поиска документов на 29 языках, включая русский, английский, немецкий и французский, правда без учета русскоязычной морфологии. Поддерживается поиск в документах популярных форматов (TXT, HTM/HTML, DOC, XLS, PDF и др.) и ZIP-архивах, а также в сообщениях электронной почты (Outlook/Outlook Express и Mozilla Thunderbird), чатах, Gmail и просмотренных веб­страницах.

 

Рисунок

Возможен поиск метаданных для аудио­ и видеофайлов и изображений. Помимо поиска данная утилита также может быть использована для запуска «гаджетов» — небольших апплетов, автономных или интегрированных с онлайновыми службами поисковой системы Google, коих создано уже довольно много («Календарь Google», «Погодный глобус», «Цифровые часы», «Виртуальный цветочный горшок» и т.п.).

Персональный поиск 2.6.0

Разработчик: Яндекс

Сайт программы: http://desktop.yandex.ru/

Размер дистрибутива: 4,54 Мбайт

Работа под управлением: Windows 98/Me/NT/2000/XP/Vista

Способ распространения: freeware (http://download.yandex.ru/desktop/YandexDesktopSetup.exe)

Цена: бесплатно

«Персональный поиск» — простая утилита для быстрого поиска документов на русском языке с учетом морфологии. В ней реализованы возможности проведения поиска в документах основных форматов (DOC, XLS, PPT, SWF, PDF, RTF, HTML TXT, MHT и др.), архивах (CHM, DjVu, ZIP, RAR и TAR), аудиофайлах (MP3 и OGG), а также сообщениях электронной почты (Outlook, Outlook Express, Thunderbird и TheBat!).

 

Рисунок

Индексация вложений поддерживается только в Outlook, Thunderbird и The Bat!. Может также производиться поиск в кэшах браузеров Internet Explorer, Firefox и Opera.

DVYGUN Smart Search 2.5.4.3

Разработчик: DVYGUN Co

Сайт программы: http://ru.dvygun.com (больше сайт не функционирует, а программа разработчиком не поддерживается, но утилиту можно найти в самых разных интернет-каталогах ПО, например на Softpedia.com — http://www.softpedia.com/get/System/File-Management/DVYGUN-Smart-Search.shtml)

Размер дистрибутива: 1,50 Мбайт

Работа под управлением: Windows NT/2000/XP/2003

Способ распространения: freeware (http://download.softpedia.com/dl/1326c8b8a95379ff490bcce69ad0080d/4abc802e/100026300/software/file_management/dvygun_smart_search_en.exe)

Цена: бесплатно

DVYGUN Smart Search — простая и удобная утилита для быстрого поиска документов на русском и английском языках с учетом морфологии. Поддерживает поиск в текс-товых файлах, файлах форматов PDF, Word, Excel и HTML, сообщениях электронной почты (Outlook/Outlook Express, The Bat! и Mozilla Thunderbird) и архивах (ZIP, TAR, GZIP, CAB и др.).

 

Рисунок

Возможен поиск в контактах адресной книги Windows, посещенных веб­страницах и избранных интернет-адресах, а также поиск картинок, музыки и видеофайлов.

Заключение

Поиск документов в недрах установленных на компьютере жестких дисков встроенным поисковиком Windows либо подручными средствами отнимает немало времени и нер­вов у большинства пользователей и далеко не всегда дает желаемый результат. Если это ваш случай, то имеет смысл обзавестись подходящей утилитой для локального поиска, что доступно для всех без исключения, поскольку многие утилиты бесплатны либо имеют бесплатные редакции. После установки любой из таких поисковых утилит вы мгновенно сможете находить нужные документы и мучительно размышлять о том, где вы сохранили на диске тот или иной файл, больше не придется.

Какую утилиту выбрать? Для многих домашних пользователей вполне достаточно любого бесплатного решения — предпочтительно с поддержкой морфологического поиска на русском языке. Если базовой функциональности бесплатной утилиты окажется недостаточно (например, необходим поиск в почтовых базах The Bat!, базах ICQ-сообщений, архивах мало используемых форматов и т.п.), лучше приобрести «Архивариус». А в случае слишком больших объемов индексируемых данных стоит отдать предпочтение пакету SearchInform Desktop, отличающемуся от аналогов очень высокой скоростью индексирования.

 

В начало В начало

КомпьютерПресс 8'2010

Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует