Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://www.sai.msu.su/~megera/wiki/ZLine_GTSearch_what_for
Дата изменения: Unknown Дата индексирования: Sun Apr 10 22:30:03 2016 Кодировка: UTF-8 |
Если в универсальной поисковой системе вы наберете слово Звезды, то среди первых нескольких первых десятков найденных ссылок будут присутствовать газеты, магазины и огромное число публикаций об артистической элите, но статей по астрономии не найдется. Специалисты в других областях смогут привести свои не менее интересные примеры. И это является общей проблемой: поиске специальной информации в поисковых системах общего профиля малоэффективен. Вывод: необходимо создание Специальных Поисковых Машин (СПМ).
Возможны два подхода к созданию спецпоисковых машин:
Каждый из подходов имеет свои преимущства и недостатки.
легко создаются и изменяются. На базе поисковой системы общего профиля можно создать целое семейство СПМ.
Минусами являются:
лишены всех этих недостатков.
Единственным их недостатком является большая стоимость по сравнению с виртуальными СПМ.
Приведем несколько примеров.
Google – предлагает создание виртуальных СПМ на основе своей глобальной поисковой системы.
Яndex – возможно создание виртуальных поисковых машин с помощью запоминания формы расширенного поиска. При создании или изменении такой формы требуется ручная работа.
Яndex-Сайт – "коробочный" продукт.в основном предназначенный для индексации единственного сайта или файлововй системы. Функционирует в ОС Windows (Server). Не имеет развитых средств работы с группами сайтов и контроля доступа к внешним ресурсам. Функциональные расширения отсутствуют. Обработчие запросов может функционировать автономно, например, на CD-ROM.
Наше предложение: GTSearch (ООО Дельта-Софт) – предлагается прототип поисковой машины. Функционирует в операционных системах семейства Unix, использует свободно-распространяемую базу данных PostgreSQL. В обязательном порядке дорабатывается и конфигурируется в соответствии с требованиями заказчика. Рассчитана на обработку до 10,000,000 документов. Имеет встроенные средства подключения языковых и терминологических ресурсов.