Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.intsys.msu.ru/invest/speech/research/
Дата изменения: Unknown
Дата индексирования: Thu Feb 27 21:50:21 2014
Кодировка: Windows-1251
Интеллектуальные системы :: Исследования :: :: Направления
English version of this page
На главную страницу
Официальный сайт кафедры Математической теории интеллектуальных систем и
лаборатории Проблем теоретической кибернетики
механико-математического факультета МГУ им. М. В. Ломоносова
На первую страницу сервера Новости Кафедра Сотрудники Учеба Наука Исследования Журнал Культура Полнотекстовый поиск по серверу
 Автоматический решатель построение автоматического решателя математических задач
 Обучающие системы разработка компьютерных интеллектуальных обучающих систем
 Информационный мониторинг создание интеллектуальных систем информационного мониторинга
 Оптимальная упаковка (Packer3D) приближенное решение NP-полной задачи об упаковке контейнеров
 Распознавание визуальных образов исследования в области распознавания визуальных образов
Направления
Основные направления речевых исследований
Статьи
Научные публикации сотрудников по речевым технологиям
Контакты
Контактная инфомация (телефоны, e-mail адреса)

Исследования в области распознавания речи

В лаборатории проблем теоретической кибернетики проводятся теоретические и практические исследования по следующим основным направлениям:

  • дискретные алгоритмы распознавания речи;
  • устойчивое к шумам и помехам распознавание речи с использованием дополнительных (неакустических) источников речевой информации
  • грамматики естественных языков и их применение в системах распознавания речи
  • автоматическое чтение по губам
  • синтез речи

Основная работа коллектива математиков посвящена теоретическим проблемам в теории автоматов. Автомат - это устройство с входными и выходными каналами и внутренней памятью, способное преобразовывать входные воздействия в выходные реакции. Получение одних автоматов из других возможно с помощью соединения входных и выходных каналов. Для выяснения принципиальной возможности решения такой задачи, называемой задачей полноты, требуется сложный анализ. Задача полноты относится к числу алгоритмически неразрешимых в общем случае задач. Для специальных классов автоматов ее удается решить. Получаемый при этом математический аппарат - это набор правил тестов входной информации, который можно использовать в прикладных исследованиях по распознаванию последовательной информации.

В результате, параллельно с теоретической работой, нам удавалось строить алгоритмы распознавания и модели искусственных органов чувств.

  • 1985 г. - Модель цветового зрения человека и животных (совместно с кафедрой психофизиологии МГУ).
  • 1987 г. - автоматный алгоритм распознавания фотоснимков.
  • 1993 г. - семантический частотный анализ текстов
  • 1994 г. - руководство отечественным проектом по распознаванию речи.
  • 1995 г. - модель субъективного восприятия фонем.
  • 1996 г. - задача отделимости символов в печатных и рукописных текстах
  • 1998 г. - распознавание речи с использованием не аудио-датчиков.
  • 1999 г. - чтение по губам, распознавание рукописных текстов, модель константности цветового зрения человека.

    Все эти задачи были выполнены как студенческие дипломные работы с теоретической частью и демонстрационным программным макетом. Они использовали автоматную модель представления входной информации.

    Нашим коллективом может быть проведено теоретическое исследование по перспективам использования новых математических методов в задачах распознавания речи по следующим направлениям:

     

    Сигнальный уровень.

    1. Поиск новых типов параметризации речевого сигнала, сокращение размерности описания речевого сигнала методами факторного анализа.
    2. Проведение экспериментов по алгоритмизации способов распознавания речи человеком, изучение данных нейрофизиологии слухового аппарата, построение субъективной звуковой метрики. Нахождение размерности пространства субъективных речевых признаков. Проверка гипотезы о возможности локального фонемного распознавания человеком. (Совместно с кафедрой психофизиологии МГУ).
    3. Поиск не зависящих от диктора признаков надежной фонемной сегментации. Изучение возможности локальной идентификация фонем, исследование зависимости параметров звуков от фонетического окружения. Автоматическое выделение признаков, позволяющих определить класс фонемы.
    4. Исследование возможности применения дополнительных источников информации для распознавания речи.

     

    Семантический уровень.

    1. Автоматизация процесса построения семантических грамматик речевых сообщение на заданную тему.
    2. Исследование области применимости семантических грамматик и построение библиотеки тем.
    3. Алгоритмы быстрого определения по аудио информации темы разговора из известного списка тем.

     

    Математические методы распознавания.

    1. Использование метрики на множестве вероятностных автоматов специального вида как расстояния между произвольными скрытыми марковскими моделями, с целью решения задач подбора фонетического алфавита, построения метрики на словарях команд, монофонах, трифонах, слогах и других сочетаниях звуков.
    2. Создание дискретных методов быстрого пред-распознавания на основе фонемной сегментации и выделения признаков отдельных фонем.
    3. Синтез иерархического распознавателя - структурного автомата, одновременно работающего с разными уровнями подробности речевого сигнала.
    4. Построение систем автоматического подравнивания произношения при изучении иностранных языков.
    5. Исследование возможности применения методов нечеткой математики, оптимального управления и других в задачах распознавания речи.

    Руководитель группы речевых исследований д.ф.-м.н. Бабин Дмитрий Николаевич

  •    ї 2001-2013 г. Кафедра Математической теории интеллектуальных систем, лаборатория Проблем теоретической кибернетики Написать вебмастеру