« предыдущая статья | Все статьи | следующая »
Технологии поиска
Диспозиция
Выяснить, какая же система поиска информации на данный момент самая быстрая и толковая и признан данный обзор. Выбрав несколько популярных программ от российских и западных разработчиков (iSYS, DtSearch, Архивариус, Ищейка Проф Deluxe и SearchInform Desktop Edition мы провели несколько тестов на скорость индексации документов, быстроту и качество поиска. Заметим, что в тесте участвовали «домашние» версии этих программ, так как ставилась задача не побить рекорды Яндекса или проверить стабильность работы системы в сети предприятия, а проверить возможности используемых в программах технологий.
Для этого нами была собрана обширная библиотека художественной литературы (11 гигабайт текстов в форматах .txt, .html и .doc). Первым заданием для тестируемых программ была индексация всего этого многообразия документов. Далее мы провели тесты на скорость поиска (секундомер в руки!) и на релевантность результатов, путем сравнения полученных списков по одинаковому запросу. В качестве запроса использовались фразы и отрывки (!) из романа Зощенко, содержащегося в подборке документов. Тестовой площадкой был выбран компьютер с процессором Athlon 2,2 MHz, объемом оперативной памяти 1 Гб, 160 гигабайтным IDE жестким диском Seagate на 7200 оборотов в минуту и системой Windows XP. Итак…
Система SearchInform легко интегрируется в информационную структуру предприятия, подключая различные источники данных, и имеет архитектуру клиент-сервер. Внедрение SearchInform не требует изменения существующих бизнес-процессов и позволяет максимально сохранить инвестиции компании, вложенные в существующую информационную инфраструктуру. В тоже время система позволяет объединить разрозненные корпоративные приложения и данные в единую информационную систему, что приводит к более эффективному решению бизнес-задач.
« предыдущая статья | Все статьи | следующая »
Для того чтобы отобразить все аспекты работы с программой полнотекстового поиска были проведены тесты на различные виды данных и различного объема. Наиболее распространенные форматы данных: TXT, HTML, DOC, RTF, PDF. Причем наиболее корректными с точки зрения работы поисковой технологии являются тесты простых форматов, так как в промышленном применении данные хранятся уже в какой-либо СУБД или хранилище данных и в поисковую систему эти данные уже попадают в виде чистого текста.
Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года.
Подробнее...
»
Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска».
iOne.ru
Подробнее...
» Вся пресса
|