« предыдущая статья | Все статьи | следующая »
Технологии поиска
Принцип поиска
Понятно, что на данный момент в «мире поиска» наблюдается доминирование именно «фразовых» поисковиков (а каких же еще? – об этом далее!). Как в корпоративном секторе, так и в глобальном интернет-хаосе. Не забыт и домашний пользователь – практически все брэнды «ищеек» могут похвастаться наличием десктоп-варианта своих систем. Технологии, которые применяются как в случае с поиском по сети в пару сотен компьютеров, так и среди десятка мегабайт данных на одном домашнем PC – одни и те же.
Первым делом любая программа создает область поиска (проводится индексация выбранных пользователем файлов на диске, электронной почты, полей баз данных и так далее – в зависимости от возможностей той или иной системы). В дальнейшем именно созданный индекс (организованная структура, в которой содержится информация об обработанных данных) используется для работы – быстрого получения списка нужных документов согласно запросу. Принципы индексирования документов и хранения проиндексированных данных в разных системах, понятно, разные. Как и способы их «извлечения» и последующего вывода в результирующем списке. Но заниматься изучением технологических особенностей организации данных в индексе, способов поиска документов и метрик, по которым этот поиск ведется, и вдаваться в особенности наличия или отсутствия морфологии, словарей синонимов или возможностей нечеткого поиска мы сегодня не будем. Ведь как уже отмечалось, самое важное в любой системе поиска – это скорость. И еще адекватность. Об этом подробнее…
Система SearchInform легко интегрируется в информационную структуру предприятия, подключая различные источники данных, и имеет архитектуру клиент-сервер. Внедрение SearchInform не требует изменения существующих бизнес-процессов и позволяет максимально сохранить инвестиции компании, вложенные в существующую информационную инфраструктуру. В тоже время система позволяет объединить разрозненные корпоративные приложения и данные в единую информационную систему, что приводит к более эффективному решению бизнес-задач.
« предыдущая статья | Все статьи | следующая »
Для того чтобы отобразить все аспекты работы с программой полнотекстового поиска были проведены тесты на различные виды данных и различного объема. Наиболее распространенные форматы данных: TXT, HTML, DOC, RTF, PDF. Причем наиболее корректными с точки зрения работы поисковой технологии являются тесты простых форматов, так как в промышленном применении данные хранятся уже в какой-либо СУБД или хранилище данных и в поисковую систему эти данные уже попадают в виде чистого текста.
Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года.
Подробнее...
»
Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска».
iOne.ru
Подробнее...
» Вся пресса
|