|
|
| 14.09.02 17:26 |
Спецсеминар "Математические основы распознавания речи" |
версия для печати
Руководители семинара: проф. Бабин Д.Н., н.с. Мазуренко И.Л., м.н.с. Холоденко А.Б.
Время и место проведения: понед. 14:30, здание ВМиК, ауд.339 (лаборатория проблем теоретической кибернетики).
Спецсеминар адресован студентам 2-5 курсов, интересующимся практическими приложениями математики в области создания компьютерных систем автоматического анализа звучащей речи и естественно-языковых математических моделей при анализе электронных текстов. В рамках семинара-практикума планируется ознакомление слушателей с основными компьютерными математическими пакетами, использующимися при исследованиях в области распознавания речи и анализа текстов.
Программа семинара:
- Акустика звука и речи (распространение звука в воздухе, шумы, помехи, реверберация и т.п.) Речевой и слуховой аппараты человека, математические модели речеобразования и восприятия речи. Основной тон, форманты. Основы цифровой фильтрации.
- Речевой сигнал, дискретизация, теорема Котельникова. Спектр сигнала и преобразование Фурье. Параметризация речевого сигнала: типы параметров (БПФ, КЛП, КЕПСТР и т.п.), критерии и методы выбора оптимального набора параметров.
- Фонетическая теория речи. Постановка задачи распознавания речи (дискретный и слитный случаи, дикторозависимость, обучение и др.). Структурная схема распознавателя слитной речи.
- Задача акустического распознавания речи. Подходы: скрытых марковских моделей (СММ), динамической деформации времени (ДДВ).
Методы СММ и ДДВ. Подробное описание, постановки задач и методы их решения.
- Монофоны, трифоны, трифонная транскрипция, внутрисловные и межсловные трифоны, гауссовы смеси. Задачи обучения параметров СММ для трифонов, синтеза СММ для слов и предложений естественного языка. Бинарные деревья решений как инструмент для связывания состояний СММ.
- Компьютерные математические пакеты (RPL, SPL, IPPS, HTK) и их применение для построения систем распознавания речи. Задачи оптимизации алгоритмов распознавания (по времени и памяти) на акустическом уровне и подходы к их практическому решению.
- Задача подбора фонетического алфавита. Метрика на множестве вероятностных автоматов.
- Декодирование дерева гипотез: языковые модели, их применение в системах распознавания. Обучение моделей. Коэффициент неопределенности. Статистическая языковая модель русского языка.
- Текстовые и речевые базы данных, задачи их обработки и обучения речевых и языковых моделей на их основе. Фонетически богатые тексты, трифонное покрытие, разметка.
- Русский речевой распознаватель и перспективы его создания. Другие практические задачи в области математической теории распознавания речи.
Основная страничка семинара:
http://intsys.msu.ru/study/seminars/speech.htm
Более подробно о тематике семинара можно прочитать в разделе "Распознавание речи" сервера "Интеллектуальные системы"
Интеллектуальные системы
Последние обновления
|
 Темы
|
|
|
|
 RSS ленты
|
|
|
|
|