Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.philol.msu.ru/~otipl/new/main/courses/modelling/program.doc
Дата изменения: Fri Oct 2 12:25:44 2009
Дата индексирования: Thu Apr 8 09:37:04 2010
Кодировка: koi8-r

Примерная программа спецкурса

1 занятие - Вводная часть. Современное состояние акустики речеобразования.
Необходимость создания компьютерных моделей артикуляторных и акустических
процессов в разных языках. Современные экспериментальные методы,
необходимые для создания таких моделей: магнитно-резонансая томография,
электролучевая компьютерная томография, электромагнитная артикулография,
электроглоттография, механическое моделирование протекания воздуха в
вокальном тракте человека. Достоинства и недостатки каждого метода. База
данных микролучевого рентгеноскопа (Wisconsin X-ray Microbeam Database).

2 занятие - Обзор наиболее известных компьютерных артикуляторных моделей
(модель Мермельстейна (Mermelstein), Кокера (Coker), Сорокина). Проблема
построения модели и проблема управления моделью. Выбор параметров
управления моделью. Двухмерные и трехмерные артикуляторные модели. Фонолаб
как пример двухмерной модели. «3-хмерная голова» как пример трехмерной
артикуляторной модели (Engwall). Проблема сравнения моделей и выбора
наилучшей.

3 занятие - Обзор алгоритмов и методов управления артикуляторными моделями.
Выбор наилучших команд управления артикуляцией. Проблема определения команд
управления по акустическому сигналу либо по измерениям артикуляции речевого
аппарата с помощью артикулографа. Артикуляторная фонология (Saltzman,
Haskins Labs).

4 занятие - Взаимосвязь артикуляции и акустики. Основные положения
современной акустической теории речеобразования. Обсуждение справедливости
этих положений. Площадь поперечного сечения речевого аппарата как связующее
звено между артикуляцией и акустикой. Алгоритмы вычисления площади по
текущей форме речевого аппарата (??-модель Стивенса (Stevens), 3-
хпараметрическая модель Фанта, статистические модели, геометрические
модели). Модель Стори-Титце (Story, Titze) управления площади речевого
аппарата.

5 занятие - Проблема определения акустики по площади поперечного сечения
речевого аппарата. Попытка решения этой проблемы методами линейного
предсказания. Передаточная функция и акустический импеданс - обсуждение
этих понятий с их сравнением. Полюсы и нули передаточной функции и
акустического импеданса. Артикуляторное происхождение полюсов и нулей.

6 занятие - Обсуждение некоторых форм реализации передаточной функций.
Гармонический осциллятор (резонатор, двухполюсник). Представление
передаточной функции как последовательное (каскадное) и параллельное
соединение резонаторов. Каскадная и параллельная реализации как
фундаментальные типы формантных синтезаторов. Линейное предсказание как
форма описания передаточной функции. Сжатие речи.

7 занятие - Теория «источник-фильтр». Обсуждение этой теории применительно
к моделированию взрывных и фрикативных звуков. Границы применимости этой
теории. Эффекты, не объясняемые этой теорией, - насколько они важны для
человеческого восприятия? Компьютерные модели турбулентного и импульсного
источников возбуждения.

8 занятие - Компьютерные модели голосового источника. Модели площади
просвета между голосовыми складками (Lin, Titze). Модели объемной скорости
(Фант). Модели голосового источника (LF-модель, модель Анантападманабхи
(Ananthapadmanabha), Ротенберга (Rothenberg)). Достоинства и недостатки
каждого типа моделей. Проблема сравнения этих моделей. Модели голосового
источника в речевых вокодерах (CELP, MELP). Векторное квантование
параметров моделей голосового источника. Модель голосового источника в
вокодере, основанном на линейном предсказании с голосовым возбуждением
(GELP - Childers).

9 занятие - Проблема определения голосового источника по акустическому
сигналу (обратная фильтрация). Обзор основных методов обратной фильтрации
(линейное предсказание, спектральный метод, метод комплексного кепстра, и
т.д.). Сравнение этих методов между собой. Влияние ошибок в оценке формант,
а также внешних шумов и измерительной аппаратуры на результаты обратной
фильтрации. Проблема точности оценок голосового истоничка, получаемых в
результате обратной фильтрации. Можно ли вообще верить обратной фильтрации?

10 занятие - Каскадный формантный синтезатор. Представление назальных,
турбулентных и взрывных звуков средствами каскадного синтезатора.
Достоинства и недостатки каскадной схемы. Каскадно-параллельный синтезатор
Клатта (Klatt). Проблема управления этим синтезатором. Квазиартикуляторный
синтезатор (Stevens).

11 занятие - Параллельный формантный синтезатор. Достоинства и недостатки.
Обсуждение проблемы «паразитных нулей» при синтезе гласных. Решение этой
проблемы Холмсом (Holmes). Проблема управления параллельным синтезатором.
Артикуляторно-формантные синтезаторы (Фант, Lin, Сорокин).

12 занятие - Синтезатор и вокодер на основе линейного предсказания.
Достоинства и недостатки. Представление нулей поседством линейного
предсказания. Авторегрессионные модели и авторегрессионные модели с
подвижным средним. Проблема представления голосового источника полюсной
моделью. Обсуждение применительно к проблем предыскажения речевого сигнала.
Каузальные (физически-реализуемые) и антикаузальные (физически
нереализуемые) системы. Представление голосового источника через физически
нереализуемую полюсную систему.

13 занятие - Артикуляторные синтезаторы речи - состояние проблемы.
Достоинстваи недостатки. Типы артикуляторных синтезаторов - артикуляторно-
формантные, артикуляторно-волновые, квазиартикуляторные, гидродинамические.
Проблема управления артикуляторными синтезаторами. Попытки решения этой
задачи детерминированными и статистическими методами.

14 занятие - Определение формы речевого аппарата по речевому сигналу
(обратная задача). Обзор методов решения - линейное предсказание (Wakita,
Atal, Markel), метод малого параметра (Mermelstein, Schroeder, Фант), метод
входного импеданса (Sondhi, Gopinath), метод регуляризации по Тихонову
(Sondhi, Сорокин), Скрытые Марковские Модели (Honda). Понятие
некорректности задачи. Фонетические и физиологические способы сделать
задачу корректной. Артикуляторный вокодер (Sondhi). Проблема вычисления
команд управления артикуляторной моделью как обратная задача.