Корректная работа с локальной сетью Информационная безопасность Поиск похожих документов Скорость индексации Разграничение прав доступа
 
 Домой   Заказать/Скачать   Продукты   Проекты   Наши Технологии   Сотрудничество   Пресса   О Компании   English 
SoftInform Search Technology - это Ваша власть над информацией.

Содержание

Скачать демо-ролик
Скачать презентацию
stretcher

5. Интернет-ориентированные программные продукты на базе SoftInform Search Technology

SearchInform - Программа полнотекстового поиска - Быстрый поиск информации в большом объеме данных

Информация на предприятии содержится как на дисках компьютеров, подключенных к локальной сети, так и в базах данных и различных информационных системах. Это создает определенную проблему их поиска – в различных источниках и различными программными средствами. Одним из важнейших преимуществ современных корпоративных систем на базе технологий поиска похожих документов является возможность консолидации информации из различных источников. Это позволяет структурировать информационные составляющие любого крупного предприятия под управлением одной программы. Притом, без нужды переводить документы и данные в какой-либо единый формат. Вся информация, доступная для индексирования и дальнейшего поиска может быть распределена, структурирована и отображена в удобном виде.

5.1 Site Indexer

Разработанный на основе технологии поиска СофтИнформ сервис внешней индексации сайтов. Данный сервис представляет собой эффективное и недорогое решение для организации поиска в рамках какого-либо сайта.  Для владельца сайта намного выгоднее использовать внешний сервис поиска по своему ресурсу, чем самостоятельно разрабатывать и подключать свой собственный «поисковик». Во-первых, технологии СофтИнформ предоставляют возможность организации полнотекстового поиска, а не простого атрибутивного или «прямого» (без создания индекса – перебором) поиска, который можно более или менее просто организовать на сайте. Во-вторых, стоимость такого решения более чем низкая по сравнению с аналогичными предложениями (сказывается более чем быстрая скорость работы ПО СофтИнформ и уникальность используемой при его разработке технологии, что позволило снизить затраты на обслуживание). Сервер индексации, создание индекса и настройка работы сервиса в целом полностью ложится на СофтИнформ и, соответственно, не требует со стороны заказчика затраты ресурсов.

5.2 SearchInform Personal Internet

5.2.1 Описание

Данный продукт служит для создания пользователем своего мини Интернет и организации поиска по различным сайтам, занесенным в базу. Также возможно создание на базе Personal Internet какого-либо поискового Интернет-сервиса. Высокая скорость реагирования на обновление сайтов в базе (переиндексация в указанное пользователем время) и значительно более точная релевантность полученных по запросу результатов в сравнении с глобальными поисковиками (сказывается отсутствие мусора – поиск производится только по нужным пользователю ресурсам) позволяют оперативно и точно получать любую интересующую пользователя информацию.

Данное решение планируется поставлять в двух вариантах:
- выделенный сервер СофтИнформ + полное обслуживание (работы сервиса в целом полностью ложится на СофтИнформ)
- развертывание ПО СофтИнформ на сервере заказчика и осуществление технической поддержки

5.2.2 Выгоды использования Personal Internet

- Оперативное получение информации и возможность реагировать на это (частая переиндексация позволит искать самые свежие данный, вот-вот появившиеся на заданных пользователем ресурсах)
- Более качественная обработка запросов
Более релевантная, чем в случае с «большими» поисковыми машинами, обработка запросов пользователя. Так как количество ресурсов в «теме» поиска в сотни и тысячи раз меньше и, что самое важное, все ресурсы относятся только к интересующей нас тематике.

5.3 Тематический поиск

5.3.1 Описание

Система Тематического Поиска компании СофтИнформ представляет собой комплекс программного обеспечения, позволяющего производить узконаправленный поиск информации в интернет по заранее определенному списку ресурсов. Тематический поиск включает в себя все возможности Personal Internet, дополняя их функциями мониторинга ведущих поисковиков (Google, Yandex, Yahoo, Msn) и добавления в базу новых ресурсов по заданным ключевым словам, а также наличием поиска похожих по содержанию документов для реализации функции построения отчета «похожих» материалов за определенный период.

Google (или любой другой поисковик) индексирует гигантское количество ресурсов и, соответственно, делает это медленно. Так, к примеру, какое-либо сообщение на форуме или комментарий в блоге будет проиндексирован (и, соответственно, появится в списке результатов поиска) в худшем случае через несколько недель. В случае же использования Personal Internet индексация проходит ежедневно (или по заданному пользователем интервалу) и по ограниченному списку ресурсов, что позволяет своевременно получать новые данные. Кстати, одним из применений данной системы может быть оперативное отслеживание информации о конкурентах. А отделам маркетинга пригодится такая система «оперативного реагирования» на любые изменения в форумах, блогах и новостных сайтах. 

5.3.2 Добавление ресурсов в базу

  1. Администратор в явном виде вносит перечень сайтов, который система будет индексировать
  2. Администратор задает ключевые слова связанные с данной темой. Далее система вводит данные ключевые слова в виде запроса для поисковиков (google, yandex и т.д.) и обрабатывает полученный результат. Домены, на страницах которых были найдены заданные ключевые слова автоматически (или в ручном режиме с «модерацией» вносятся в нужную «тему».

5.3.3 Поиск похожих по содержанию документов

Часто при просмотре информации необходимо получить дополнительные данные на эту же тему. Например, просмотрев статью о новом мобильном телефоне на одном ресурсе, нужно ознакомиться с информацией о данной модели на других сайтах. Для обеспечения получения пользователем всей похожей по содержанию и смыслу информации из индекса нужной тематики используется уникальная технология поиска похожих документов. Именно за счет использования этой технологии и возможно получение в течение нескольких секунд всех «похожих» материалов со всех ресурсов в «теме».

5.3.4 Резюме

Поиск по определенной тематике позволит выводить в результирующем списке только информацию по заданной тематике, с автоматической разбивкой ее на подрубрики. Индексация для конкретной задачи только ресурсов со схожей тематикой, мониторинг их в реальном времени специально разработанным «спайдером» и уникальный поиск похожих позволят пользователям получать свежую отрубрицированную информацию по той тематике, которая их интересует.