Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://sp.cs.msu.ru/seminar/2005/1214.html
Дата изменения: Wed Feb 11 22:28:56 2015 Дата индексирования: Sat Apr 9 23:52:57 2016 Кодировка: Windows-1251 |
|
||||||||||||
|
Доклад посвящен методу периодического тематического поиска в Web, основанному на совместном использовании механизмов поиска по ключевым словам и классификаторов. Информационная потребность пользователя в рамках предлагаемого метода определяется набором текстов, описывающих его область специализации. В докладе будут рассмотрены вопросы первичной фильтрации документов, предварительного анализа текста и определения релевантности документа интересам пользователя на основе алгоритмов классификации. Предварительный анализ текста включает в себя лингвистический анализ, выбор и оценку весов признаков. В работе рассматривается адаптация синтаксического анализатора применительно к поставленной задаче. Также автором предложены следующие масштабируемые алгоритмы классификации:
Предложены условия применения алгоритмов на основе оценок вычислительной сложности и экпериментального сравнения качества их результатов. Показана эффективность предложенного метода. |
|||||||||||
|