Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.philol.msu.ru/~kedr/akin-1.pdf
Дата изменения: Thu Aug 11 17:05:03 2005
Дата индексирования: Mon Oct 1 21:25:51 2012
Кодировка: Windows-1251

УДК 612.78 Г. Е. Кедрова, Л. М. Захаров, Ю. А. Пирогов, Н. В. Анисимов ИССЛЕДОВАНИЕ АРТИКУЛЯТОРНОЙ БАЗЫ РУССКОГО ЯЗЫКА МЕТОДАМИ МАГНИТНО-РЕЗОНАНСНОЙ ТОМОГРАФИИ МГУ им. М. В. Ломоносова Россия, 119992 Мо сква, ГСП-2, Ленинские горы, МГУ, корп. 1, филологический ф-т, комн. 983 Тел.: (095) 939-1478; Факс: (095) 939-5596 Эл. почта: kedr@philol.msu.ru МГУ им. М. В. Ломоносова Россия, 119992 Мо сква, ГСП-2, Ленинские горы, МГУ, ул.Лебедева, 5, ЦМТС МГУ Тел.: (095) 939 1669; Эл. почта: nisimovnv@mail.ru
В докладе представлены промежуточные результаты работ, выполняемых в МГУ им. М. В. Ломоносова в рамках инициативного междисциплинарного проекта, основной целью которого является разработка методик использования новейших технических средств (магнитно-резонансной томографии) в иссл едовании механизмов речепорождения. На основе разработанных методик в дальнейшем планируется сформировать компьютерную базу данных, в которой будут представл ены графические образы для всех типов артикуляторных комплексов русского языка, включая переходные (внутрислоговые и межслоговые) участки. На данном этапе исследования решалась задача выявл ения с помощью ФМРТ-визуализации особенностей работы артикуляторных органов при произнесении гласных звуков (как в изолированной позиции, так и в составе слогов и слов). При этом особое внимание было уделено визуализации движений губ, языка, конфигурации ротовой полости, небной занавески, гортани в процессе порождения звука.

Наше исследование по с вящено изучению возможно стей использования функциона льной магнитно-резонансной томографии для получения верифицированных экспериментальных данных, наиболее подробно и полно отражающих артикуляторные проце ссы порождения речи. В докладе будут изложены промежуточные результаты работ, выполняемых в МГУ им. М. В. Ломоносова в рамках междисциплинарного проекта, о сновной целью которого является разработка методик использования новейших техниче ских средств (магнитно-ре зонансной томографии) в исследовании механизмов речепорождения и формирование на основе разработанных методик электронных баз данных, в которых будут представлены графические образы для всех типов артикуляторных комплексов русского языка. На первом этапе исследования (конец 2002 - начало 2003 гг.) решалась задача выявления с помощью МРТ-визуализации особенностей работы артикуляторных органов при произне сении гласных звуков (как в изолированной позиции, так и в со ставе слогов и слов). При этом особое внимание было уделено визуализации движений губ, языка, конфигурации ротовой полости, небной занавески, гортани в процессе порождения звука. Актуальность проекта обусловлена отсутствием достоверных знаний о динамических механизмам речепорождения в разных языках, и в частно сти, применительно к русскому языку, по скольку до настоящего времени единственным средством экспериментального исследования речевой артикуляции зде сь была кинофоторентгенография. До сегодняшнего дня практиче ски единственным источником сведений об артикуляторной базе русского языка (в части стационарных участков звучания) является справочное издание "Атлас звуков русской речи", подготовленное по кинофоторенгенограммам в Венгрии [1]. Основные недостатки этого метода (снятие, расшифровка и прорисовка кинофоторенггенограмм) связаны с очень большими техниче скими сложно стями в его практическом применении (собственно технологиче ские и с анитарно-гигиениче ские ограничения), которые обусловили принципиальную невозможность изучения речи в процессе ее развертывания (в реальном времени). Разрабатываемый нами метод (ФМРТ-визуализация) позволяет решить эту задачу, что будет иметь самые существенные

последствия для успешного решения как ряда фундаментальных задач (прежде всего совершенствования теории речепорождения), так и для множества прикладных областей речеведения (лингводидактики, автоматиче ского распознавания и синтеза речи, компьютерных речевых баз данных и т. д.). Основной метод нашего исследования - функциональная магнитно-резонансная томография процесса речепроизводства. Задача ФМРТ - получать МР-изображения в режиме реального времени. МР-изображения используют ся для визуа лизации органов в движении, ана лиза физиологиче ских процессов, исследования реакции структур мозга на внешний раздражитель. Простейшим вариантом ФМРТ является по следовательная съемка одной и той же зоны сканирования через определенные интервалы времени для анализа эволюции этой зоны. ФМРТ имеет свои технологиче ские особенности. Для наших задач наиболее существенными явл я ю т ся ограничения на скоро сть считывания информа ции при сканировании. Разрешающая способно сть современных томографов в большинстве случаев превышает 0.5 сек., что затрудняет съемку быст ротекущих проце ссов. Исследователь должен найти компромисс между высокой скоро стью получения изображений и их информативно стью. Для повышения скоро сти считывания МР-сигнала: а) уменьшают количество считываемых точек, что приводит к снижению разрешающей способно сти; б) используют импульсные по следовательности с короткими задержками, из-за чего падает взвешенно сть изображения; в) минимизируют количество накоплений сигнала, что снижает отношение сигнала к шуму; г) от к азыв ают ся о т вспомогательных задержек и импульсов, испо льзуемых для компенсации аппаратурных несовершенств. Задача данного исследования - с помощью МР-визуализации выявить о собенности работы органов, ответственных за голосовое воспроизведение речи. Особое внимание уделяется визуализации губ, языка, ротовой полости, глотки, гортани при произне сении гласных звуков. Время сканирования одного среза не должно превышать времени произнесения гласного звука - примерно 0.5 - 1 с. (последнее - для тянутого произнесения). Кроме того, представляет интерес МР отображение проце сса произнесения по следовательности звуков - слов или фраз. Для визуализации этого процесса необходимо иметь кадры, снятые с интервалом не более 0.1с (10 кадров/сек). Наша МРТ-аппаратура позволяет сканировать срез со скоро стью более 0.5 сек. Поэтому используется стробоскопический спо соб сбора данных: быстрое МР сканирование ведется при многократном повторении одной и той же фразы. Кадры для анимационного представления создаются из МР изображений, которые расставляются с учетом временной привязки каждого кадра относительно начала звуковой осциллограммы. Материалом эксперимента по служили русские гласные звуки, произнесенные в изолированной позиции и в составе фразы (некоторые гласные). В каче стве дикторов выступали 2 человека (мужской и женский голоса). Томографическая съемка проводилась в не сколько сеансов, для диктора-мужчины в целях оценки устойчивости моделей произнесения были о существлены две серии записей. Параллельно в ходе эксперимента велась контрольная аудиозапись (на два канала с установление сигнальных меток в момент начала съемки), а в ходе имитации эксперимента вне магнита - видеосъемка. Полученный массив эксперимент альных данных был вручную обработан: о суще ствлена расшифровка аудиотреков, их разметка, проведена ат рибуция изображений, для оценки степени информативно сти полученных изображений был также проведен специальный перцептивный эксперимент. О дна из целей перцептивног о эк сперимент а заклю ча лась в иссле дов ании степени инфор м ативно сти полученных Т-из ображ ений и в о з м ожно стей их кластеризации на о снов е во спринимаемых глазом различий в особенно стях конфигураций артикуляторных органов, а т акже степень совпадения полученных от разных испытуемых классификаций изображений. В эксперименте приняли участие 10 человек, время работы с экспериментальным материалом было неограничено, размер кластеров и их число также никак не ограничивались. В ре зультате нам уда ло сь показать высокую информативно сть полученных изображений, с высокой степенью достоверно сти представить все основные особенности артикуляторных движений при произне сении русских гласных звуков. Было проведено сравнение полученных Т-изображений с материа лами К. Боллы [1]. При значительном совпадении о сновных парамет ров обоих типов изображений отмечена большая детализация действий органов артикуляции в случае томографической

съемки, о собенно в отношении мягких тканей, которые могут проявлять себя как наиболее подвижные (напр., кончик языка). В ходе доклада будут подробно представлены полученные результаты - результаты перцептивного эксперимента, изображения основных конфигураций артикуляторных органов при производстве русских гласных звуков, полученные в режиме реального времени (по данным томографиче ского исследования) для изолированного произнесения звуков и для звуков в со ставе фразы. Рис. 1. Структура эксперимента и типы полученных данных.

Рис. 2. МР визуа лизация проце сс а произне с ения гласных звуков русского языка в

сопоставлении с рентгеновским изображением и звуковой о сциллограммой.

Примечание к рис. 2. I - о сновные гласные звуки русского языка, II - изображения ротовой поло сти при произнесении соответствующих звуков. Изображения получены с помощью рентгеновской съемки с последующим ручным ретушированием [1], III- МР изображения ротовой полости и шейного отдела испытуемого Л. (муж. 48 лет), при произне сении тех же звуков. IV - о сциллограммы тех же звуков. Длительность о сциллограммы ~2 c. V и VI - аналоги III и IV, для испытуемой Г. (жен. 45 лет). МР изображение с разрешением 0.35х0.35 мм получается за 0.55 c.

ЛИТЕРАТУРА
1. К. Болла "Атлас звуков русской речи", Будапешт, 1981 г.