Корректная работа с локальной сетью Информационная безопасность Поиск похожих документов Скорость индексации Разграничение прав доступа
 
 Домой   Заказать/Скачать   Продукты   Проекты   Наши Технологии   Сотрудничество   Пресса   О Компании   English 
SoftInform Search Technology - это Ваша власть над информацией.

Содержание

 Введение
 Технологии поиска
 Принцип поиска
 Диспозиция
 Индексирование
 Уникальный поиск похожих
 Перспективы
 Программы для локального поиска
stretcher
Купить программу поиска документов SearchInform Скачать trial-версию программы поиска файлов SearchInform Скачать бесплатную версию программы быстрого поиска текста SearchInform Информация о поисковой системе SearchInform Скачать тестовую версию системы полнотекстового поиска SearchInform
« предыдущая статья | Все статьи | следующая »

Технологии поиска

Технологии поиска

С файловым поиском на персональном компьютере все просто. Он не отличается особыми возможностями и какими-либо изысками, разве что выбором типа файла (медиа, текст) и места поиска. Скорость поиска и результат напрямую зависят от того, что мы вводим в строке запроса. Поиск осуществляется обычным перебором наличествующих файлов на предмет соответствия. Что вполне оправдано – зачем создавать сложную систему для столь нехитрых нужд?
Совсем иначе дело обстоит с поисковыми системами, работающими в глобальной сети. Тут уже не до перебора. Гигантские объемы (тот же Яндекс может похвастаться индексацией более чем 11 терабайт данных), специфика организации информации и глобальная хаотичность сделают простой поиск не только неэффективным, но также длительным и трудоемким. Читая десятки страниц из различных статей, посвященных улучшению поиска с помощью тех же Google или Yandex, можно прийти к выводу, что без знания скрытых возможностей данных систем найти нужный документ по запросу – дело не одной минуты, а иногда и не одного часа. Проблема в том, что такая реализация «поиска» очень зависима от фразы или формулировки «запроса» пользователем. Чем запрос менее конкретизирован, тем хуже результаты поиска. Это уже аксиома. Да и шансы найти нужную информацию довольно низкие. Но технология работает. Пусть не идеально и не всегда как нам хочется, но если сделать скидку на сложность поиска в хаосе Интернета и на объем данных, то даже приемлемо.
Третьими в списке значатся готовые решения на базе поисковых технологий и их «домашние аналоги». Они предназначены для серьезных компаний и корпораций, обладающих действительно гигантскими базами данных и под завязку набитыми документами и информационными системами. Основное применение данные системы находят в тех случаях, когда требуется осуществлять быстрый и точный поиск в больших объемах данных. Схема работы таких поисковых систем довольно проста, хотя за ней кроется, конечно, множество уникальных методов индексации информации и обработки запроса: тот же поиск по фразе. С учетом всех словоформ, синонимов и так далее. Ключевым моментом в данном случае является скорость индексации информации и обработки запроса, а для исключительно корпоративных систем еще и удобство работы с сетевыми индексами и возможность подключения различных источников данных.

Система SearchInform легко интегрируется в информационную структуру предприятия, подключая различные источники данных, и имеет архитектуру клиент-сервер. Внедрение SearchInform не требует изменения существующих бизнес-процессов и позволяет максимально сохранить инвестиции компании, вложенные в существующую информационную инфраструктуру. В тоже время система позволяет объединить разрозненные корпоративные приложения и данные в единую информационную систему, что приводит к более эффективному решению бизнес-задач.

« предыдущая статья | Все статьи | следующая »

Для того чтобы отобразить все аспекты работы с программой полнотекстового поиска были проведены тесты на различные виды данных и различного объема. Наиболее распространенные форматы данных: TXT, HTML, DOC, RTF, PDF. Причем наиболее корректными с точки зрения работы поисковой технологии являются тесты простых форматов, так как в промышленном применении данные хранятся уже в какой-либо СУБД или хранилище данных и в поисковую систему эти данные уже попадают в виде чистого текста.

Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года. Подробнее...
»


Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска». iOne.ru   Подробнее...
» Вся пресса