|
Основные направления речевых исследований |
|
|
|
Научные публикации сотрудников по речевым технологиям |
|
|
|
Контактная инфомация (телефоны, e-mail адреса) |
|
|
|
Исследования в области распознавания речи
В лаборатории проблем теоретической кибернетики проводятся теоретические и практические исследования по следующим основным направлениям:
- дискретные алгоритмы распознавания речи;
- устойчивое к шумам и помехам распознавание речи с использованием дополнительных (неакустических) источников речевой информации
- грамматики естественных языков и их применение в системах распознавания речи
- автоматическое чтение по губам
- синтез речи
Основная работа коллектива математиков посвящена
теоретическим проблемам в теории автоматов.
Автомат - это устройство с входными
и выходными каналами и внутренней памятью, способное преобразовывать входные
воздействия в выходные реакции.
Получение одних автоматов из
других возможно с помощью соединения
входных и выходных каналов. Для выяснения принципиальной возможности решения
такой задачи, называемой задачей полноты,
требуется сложный анализ. Задача полноты относится к числу
алгоритмически неразрешимых в общем случае задач. Для специальных классов
автоматов ее удается решить. Получаемый при этом математический аппарат - это
набор правил тестов входной информации, который можно использовать в прикладных
исследованиях по распознаванию последовательной информации.
В результате, параллельно с
теоретической работой, нам удавалось строить алгоритмы распознавания и модели
искусственных органов чувств.
1985 г. - Модель цветового зрения человека и животных (совместно с кафедрой
психофизиологии МГУ).
1987 г. - автоматный алгоритм распознавания
фотоснимков.
1993 г. - семантический частотный анализ текстов
1994 г. - руководство отечественным проектом по распознаванию речи.
1995 г. - модель субъективного восприятия фонем.
1996 г. - задача отделимости символов в печатных и рукописных текстах
1998 г. - распознавание речи с использованием не аудио-датчиков.
1999 г. - чтение по губам, распознавание рукописных текстов, модель
константности цветового зрения человека.
Все эти задачи были выполнены как студенческие дипломные
работы с теоретической частью и демонстрационным программным макетом. Они
использовали автоматную модель представления входной информации.
Нашим коллективом может
быть проведено теоретическое исследование по перспективам использования новых
математических методов в задачах распознавания речи по следующим направлениям:
Сигнальный уровень.
- Поиск новых типов параметризации речевого сигнала, сокращение размерности
описания речевого сигнала методами факторного анализа.
- Проведение экспериментов по алгоритмизации способов распознавания речи
человеком, изучение данных нейрофизиологии слухового аппарата, построение
субъективной звуковой метрики. Нахождение размерности пространства субъективных
речевых признаков. Проверка гипотезы о возможности локального фонемного
распознавания человеком. (Совместно с кафедрой психофизиологии МГУ).
- Поиск не зависящих от диктора признаков надежной фонемной сегментации. Изучение
возможности локальной идентификация фонем, исследование зависимости параметров
звуков от фонетического окружения. Автоматическое выделение признаков,
позволяющих определить класс фонемы.
- Исследование возможности применения дополнительных источников информации для
распознавания речи.
Семантический уровень.
-
Автоматизация процесса построения семантических грамматик речевых сообщение на
заданную тему.
-
Исследование области применимости семантических грамматик и построение
библиотеки тем.
-
Алгоритмы быстрого определения по аудио информации темы разговора из известного
списка тем.
Математические
методы распознавания.
-
Использование метрики на множестве вероятностных автоматов специального вида
как расстояния между произвольными скрытыми марковскими моделями,
с целью решения задач подбора фонетического алфавита, построения метрики
на словарях команд, монофонах, трифонах, слогах и других сочетаниях звуков.
-
Создание дискретных методов быстрого пред-распознавания на основе фонемной
сегментации и выделения признаков отдельных фонем.
-
Синтез иерархического распознавателя - структурного автомата, одновременно
работающего с разными уровнями подробности речевого сигнала.
- Построение систем автоматического подравнивания произношения
при изучении иностранных языков.
-
Исследование возможности применения методов нечеткой математики, оптимального
управления и других в задачах распознавания речи.
Руководитель группы речевых исследований д.ф.-м.н.
Бабин Дмитрий Николаевич
|