Корректная работа с локальной сетью Информационная безопасность Поиск похожих документов Скорость индексации Разграничение прав доступа
 
 Домой   Заказать/Скачать   Продукты   Проекты   Наши Технологии   Сотрудничество   Пресса   О Компании   English 
SoftInform Search Technology - это Ваша власть над информацией.

Содержание

 Введение
 Собачья радость
 Следопыт
 Звездочет-русофил
 Мне повезет?
 Тихая революция
 Раздаем слонов
stretcher
Купить программу поиска документов SearchInform Скачать trial-версию программы поиска файлов SearchInform Скачать бесплатную версию программы быстрого поиска текста SearchInform Информация о поисковой системе SearchInform Скачать тестовую версию системы полнотекстового поиска SearchInform
« предыдущая статья | Все статьи | следующая »

Чемпионат по настольному поиску (программы для локального поиска)

Звездочет-русофил

Бесплатный Copernic Desktop Search (www.copernic.com, 2,6 Мб), как будто угадав мои желания, первым делом предложил отметить нужные параметры и каталоги индексации. Разумеется, по умолчанию Коперник готов индексировать все подряд, но при двойном щелчке по нужной области мы вольны выбрать тот или иной тип файлов, либо вообще запретить софтине индексировать данный раздел: Skip all files in this folder and its subfolders. Увы, Коперник соглашается индексировать исключительно весь раздел, отказывая нам в выборе нужных каталогов. Что же, придется смириться. Итак, нам предлагают индексировать Documents, Pictures, Music и Videos. Эти категории подразумевают следующее: все форматы MS Office, документы WordPerfect, PDF-файлы, HTML-страницы, «сермяжные» текстовые расширения TXT и RTF вкупе с другими форматами (.ASP, .C, .CPP, .CS, .H, .INC, .INI, .JAVA, .PAS и .XML). Архивные форматы Коперник знает «на пять баллов»: .GZ, .RAR и .TAR. Добавьте сюда поддержку справочного формата HLP и тэгов в звуковых файлах MP3, OGG, WMA и WAV. Очевидно, дабы совсем сразить автора этих строк, Коперник скромно шепнул о работе с метаданными EXIF в графических файлах форматов JPEG и GIF. После таких возможностей известие об индексации тех же метаданных в видеофайлах (MPEG, QuickTime и Windows Media) воспринялось, как само собой разумеющееся.

Ко всему прочему, Коперник без малейшего труда самостоятельно «вычислил» расположение каталога с почтовыми базами Outlook Express, заодно предложив включить в область поиска контакты из адресной книги. Причем, этот «звездочет» знаком с почтовым клиентом Mozilla Thunderbird - видит Бог, мне это начинает нравиться[7]!

После установки начальных параметров я изменил расположение умолчального каталога с индексными базами (C:\Documents and Settings\ваше_имя\Local Settings\Application Data\Copernic\DesktopSearch) на более толковое (кнопка Options > Advanced > Index > Index folder), после чего Коперник с чувством глубокого удовлетворения занялся своим прямым делом. Правда, «звездочет» предупредил, что способен работать в абсолютной тишине, то бишь, при простое компьютера. Посему отключим всевозможные скринсейверы и дадим программе создать индексные базы.

Время индексации упоминавшегося логического раздела составило 22 минуты, причем, мы так и не смогли «уломать» Коперника исключить из области индексирования ненужные нам папки. Объем индексной базы – 137 Гб. Как видите, «Ищейка» несколько проигрывает зарубежному конкуренту в данном аспекте. Посмотрим, как софтина справится со своей основной работой – поиском файлов и документов. Обратите внимание, что для запроса вовсе не обязательно нажимать кнопку поиска – сей процесс начинается автоматически после ввода искомого текста. Впрочем, запрос можно ввести в программной панели, поселяющейся в системной Панели задач. Еще два небольших плюса в личный зачет.

Первое испытание – поиск по знакомому нам словосочетанию «Антивирусные записки» дает вполне логичный результат: документ найден. Но, как же так? Этот файл у меня наличествует в двух форматах: DOC и RTF. Почему не найден RTF-файл? При повторном запросе Коперник не нашел ни одного документа! Чудеса, да и только. На третьей попытке вновь был найден лишь DOC-файл. Все оказалось прозаично: Коперник таки успешно находил RTF-файлы, но исключительно с текстом, написанным латиницей. Более чем странная русофилия...

Уже без особой надежды ввожу в поле запроса те самые 300 знаков вступления к статье «Второе пришествие SPасителя» и…не может быть! – документ мгновенно найден. Вот уж чего не ожидал, так этого: абсолютно все слова запроса выделены цветом. С гораздо большим интересом прошу Коперника найти мне информацию по композиции «Желтая луна» из альбома Гребенщикова – как говорит нынешняя молодежь, «легко!», причем, западную софтину ничуть не смутили русскоязычные тэги этого MP3-файла. Однако, Коперник вновь выказал редкостное упрямство, отказываясь находить информацию в русскоязычных TXT-файлах и веб-страницах. Причем, поиск в PDF-документах давал отличные результаты. Возможно, мне больше повезет со следующим участником чемпионата.

Система SearchInform легко интегрируется в информационную структуру предприятия, подключая различные источники данных, и имеет архитектуру клиент-сервер. Внедрение SearchInform не требует изменения существующих бизнес-процессов и позволяет максимально сохранить инвестиции компании, вложенные в существующую информационную инфраструктуру. В тоже время система позволяет объединить разрозненные корпоративные приложения и данные в единую информационную систему, что приводит к более эффективному решению бизнес-задач.

« предыдущая статья | Все статьи | следующая »

Для того чтобы отобразить все аспекты работы с программой полнотекстового поиска были проведены тесты на различные виды данных и различного объема. Наиболее распространенные форматы данных: TXT, HTML, DOC, RTF, PDF. Причем наиболее корректными с точки зрения работы поисковой технологии являются тесты простых форматов, так как в промышленном применении данные хранятся уже в какой-либо СУБД или хранилище данных и в поисковую систему эти данные уже попадают в виде чистого текста.

Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года. Подробнее...
»


Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска». iOne.ru   Подробнее...
» Вся пресса