« предыдущая статья | Все статьи | следующая »
Корпоративный поиск
SearchInform 1.5
Разработчик: СофтИнформ Ltd.
Официальный сайт: www.searchinform.com/site/ru
Цена: $199.95
Размер дистрибутива: 15 Мб
Последней в списке, но отнюдь не последней по производительности, значится система SearchInform от компании СофтИнформ. SearchInform Desktop 1.5 проиндексировала предоставленные данные в размере 20 гигабайт за рекордное время - 3 часа 17 минут. Да и размер созданного индекса оказался самым небольшим 4.4 Гб.
Поисковик компании СофтИнформ разработан на основе запатентованной технологии «поиска документов, похожих по содержанию» - SoftInform Search Technology . Он включает в себя все инструменты, необходимые для структуризации разрозненной информации в рамках предприятия и предоставляет собой эффективное решение любых проблем поиска и консолидации информации.
Высокая скорость индексирования (до 6 Гб/час), малый размер индекса (15-20% от реального объема текстовой информации), поддержка практически всех распространенных форматов текстовых файлов (включая . pdf и . html ) и корректная работа с архивами – все это в одной упаковке.
Если учесть небольшую, но очень полезную функцию SearchInform – Smart Indexing ,которая позволяет в режиме реального времени отслеживать нагрузку на процессор компьютера и регулировать уровень потребления программой системных ресурсов при индексации, то пальма первенства разработке СофтИнформ досталась более чем по праву.
К тому же, процесс индексирования (в отличие от других программ в обзоре) весьма нагляден, и демонстрирует не только скорость, но и количество обработанных документов, а также число уникальных слов, по которым будет осуществляться поиск.
Лидером SearchInform Corporate оказался и по скоростям поиска. 20 гигабайт программа щелкала как семечки, делая небольшую паузу только после первого запроса (в дальнейшем поиск проходил мгновенно). Притом адекватность поиска оказалась безупречной.
Плюс ко всему, в программе SearchInform Corporate , разработанной на основе уникальной технологии SoftInform Search Technology , присутствует очень интересная функция: поиск документов похожих по своему содержанию на текст запроса. Это позволяет в процессе поиска избежать предварительного подбора ключевых слов – поиск осуществляется по всему документу в целом. Результатом поиска является вывод максимально похожих на заданный фрагмент текста документов с указанием процента релевантности.
Плюсы SearchInform Desktop 1.5 |
Минусы SearchInform Desktop 1.5 |
+ Поиск с использованием морфологии
+ Поиск с использованием синонимов
+ Нечеткий поиск
+ Функция важных слов для конкретизации поиска
+ Индексация электронных сообщений Outlook и TheBat!
+ Поиск по атрибутам
+ Рубрикатор + авторубрикация документов
+ Поддержка различных источников информации (СУБД, DMS, CRM и так далее)
+ Работа с сетью (Corporate версия) на основе наследования NTFS аутентификации Windows
+ Скорость поиска и индексирования
+ Поиск похожих по смыслу документов* |
- Проблемы с защищенными документами PDF
|
* Данная технология основана на математической модели анализа структуры документа и выбора похожих слов, словосочетаний и массивов текста. Результатом поиска является вывод максимально похожих на заданный фрагмент текста документов с указанием процента релевантности. В отличие от стандартного фразового поиска, SoftInform Search Technology позволяет избежать предварительного подбора ключевых слов. Эта функция позволяет сократить время «поисковой сессии» до минимума. Наличием такой удобной и востребованной функции на данный момент не может похвастаться ни одна система.
Система SearchInform легко интегрируется в информационную структуру предприятия, подключая различные источники данных, и имеет архитектуру клиент-сервер. Внедрение SearchInform не требует изменения существующих бизнес-процессов и позволяет максимально сохранить инвестиции компании, вложенные в существующую информационную инфраструктуру. В тоже время система позволяет объединить разрозненные корпоративные приложения и данные в единую информационную систему, что приводит к более эффективному решению бизнес-задач.
« предыдущая статья | Все статьи | следующая »
Для того чтобы отобразить все аспекты работы с программой полнотекстового поиска были проведены тесты на различные виды данных и различного объема. Наиболее распространенные форматы данных: TXT, HTML, DOC, RTF, PDF. Причем наиболее корректными с точки зрения работы поисковой технологии являются тесты простых форматов, так как в промышленном применении данные хранятся уже в какой-либо СУБД или хранилище данных и в поисковую систему эти данные уже попадают в виде чистого текста.
Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года.
Подробнее...
»
Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска».
iOne.ru
Подробнее...
» Вся пресса
|