Основные направления работ
|
- Методы автоматизированного анализа текстовой информации на основе
сочетания лингвистического анализа и применения методов машинного обучения
- Методы формирования лингвистических онтологий большого размера
- Методы интеграции разнородных структурированных и слабоструктурированных
данных для корпоративных и Интернет-систем
- Разработка информационных систем корпоративного уровня на базе РСУБД ORACLE
|
Область научных исследований
|
- Методы построения информационных систем на основе автоматизированной
содержательной обработки слабоструктурированных данных
|
Научные результаты
|
Развита теория построения тематического представления содержания текстов, на
основе которой, а также в сочетании с методами машинного обучения, разработаны
эффективные методы:
- Автоматизированной тематической обработки текстовых документов,
- Классификация, в том числе большим и сложным рубрикаторам;
- Реферирование, в том числе построение структурной тематической аннотации;
в том числе многоязычных
- Кластеризации новостного потока, в том числе построения обзорных рефератов для новостных кластеров;
- Поиска ответов на сложные вопросы в специальных коллекциях документов.
Разработаны эффективные методы выявления терминологических слов и словосочетаний
для построения лингвистичсеких онтологий в новых предметных областях;
Развивается лингвистическая Онтология по естественным наукам и технологиям (ОЕНТ) -
более 50 тысяч понятий, более 140 тысяч терминов;
Разработана тиражируемая информационная система, включающая полнофункциональную
технологическую цепочку обработки и интеграции слабоструктурированных данных:
- Система конверторов из различных источников в единый формат;
- Автоматизированная лингвистическая обработка текстов:
- Морфологический анализ;
- Терминологический анализ;
- Тематический анализ;
- Аналитическая информационно-поисковая система
С 2000 г. в Интернет представлен основной информационный продукт - Университетская
информационная система РОССИЯ (http://uisrussia.msu.ru,
http://www.cir.ru),
представляющая собой интегрированный информационный ресурс, предназначенный для
поддержки гуманитарных исследований, включающий:
- Базу данных федеральных СМИ общественно-политической направленности;
- Специализированные информационные ресурсы по социально-экономической статистике;
всего более двух миллионов документов
|
Педагогическая деятельность
|
- специальный семинар 'Методы поиска информации' на кафедре вычислительной математики
механико-математического факультета МГУ;
- участие в работе семинара 'Методы искусственного интеллекта' на кафедре алгоритмических
языков факультета вычислительной математики и кибернетики
|
Гранты
|
Проекты сотрудников лаборатории были поддержаны:
- неоднократно - гранты РФФИ, РГНФ
- неоднократно - гранты фонда Форда, фонда МакАртуров
Некоторые хоздоговорные проекты:
- участие в разработке КФП 'Новости' для департамента исследований и информации Банка России;
- участие в разработке подсистем сбора и анализа неструктурированной информации ЕИСПД Банка России;
- разработка модуля автоматической классификации нормативно-правовых актов по Президентскому
классификатору в интересах УОПИ Спецсвязи ФСО РФ;
- Разработка специального программного обеспечения Региональной системы оказания справочно-
информационных услуг в сфере экологии, природопользования и охраны окружающей среды Московской области
|
Партнеры
|
- факультеты МГУ - экономический, ВМК
- АНО Центр информационных исследований
|
Состав лаборатории
|
- Добров Б.В., к.ф.-м.н., зав. лаб.
- Агеев М.С., к.ф.-м.н., cт.н.сотр.
- Алексеев А.А., к.ф.-м.н., техн.
- Лукашевич Н.В., к.ф.-м.н., вед.н.сотр.
- Мячина А.В., прогр.
- Павлов А.М., прогр.
- Сидоров А.В., прогр.
- Штернов С.В., прогр.
|