Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.philol.msu.ru/~otipl/SpeechGroup/publications/arso922.doc
Дата изменения: Thu Mar 10 15:18:32 2005
Дата индексирования: Sat Dec 22 13:57:52 2007
Кодировка: Windows-1251

Н. В. Зиновьева, Л. М. Захаров, О. Ф. Кривнова, А. Ю. Фролов, И. Г. Фролова


АВТОМАТИЧЕСКИЙ ТРАНСКРИПТОР

Транскриптор осуществляет перевод буквенных последовательностей
(текстов в орфографи?еской записи) в символьную запись, единицу которой мы
будем далее называть звукотипом. В состав транскриптора входят блоки
следующих преобразований: переход "буква-фонема", переход "фонема-звукотип"
и текстовый процессор. В результате в общей системе взаимодействуют два
относительно независимых транскриптора: словарный и текстовый. В словарном
осуществляются все преобразования, определяющие фонети?еский облик слова
как в его изолированном произнесении, так и в тексте, кроме тех
преобразований, которые обусловлены взаимовлиянием слов. Эти преобразования
осуществляются в текстовом транскрипторе.
Блок перехода "буква-фонема" осуществляет такие операции над
орфографи?еской записью, как устранение орфографи?еских фикций, обработка
особых слу?аев произнесения сте?ений согласных, устранение твердых и мягких
знаков, обработка йотированных и мягких букв с соответствующей
интерпретацией твердости-мягкости соседних согласных и введением йота.
Блок перехода "фонема-звукотип" вклю?ает правила, обрабатывающие слу?аи
позиционного озвон?ения, оглушения согласных и редукции гласных (с у?етом
двух степеней редукции).
Ударный гласный - наиболее полногласный, т. е. наиболее мощный по
длительности и интенсивности. Обозна?им его цифрой 3.
1-ая степень редукции - на одну ступень ниже по интенсивности и
длительности, т. е. (3 - 1) R 2.
2-ая степень редукции еще ниже, т. е. (3 - 2) R 1.
Теперь введем формулу Потебни.

|1 |2 |3 |1 |1 |
|| || || || || |
|2-ой предуд.|1-ый предуд.|ударный |1-ый |2-ой |
|слог |слог |слог |заударн. |заударн. |
| | | |слог |слог |


или:

|#2 |2 |3 |1 |2# |
|| || || || || |
|2-ой предуд.|1-ый предуд.|ударный |1-ый |2-ой |
|неприкр. |слог |слог |заударн. |заударн. |
|слог | | |слог |открыт. слог|


Это озна?ает следующее: 1-ая степень редукции наблюдается в первом
предударном слоге, в абсолютном на?але и в абсолютном конце слова, т. е.
после или перед пробелом (знаком "#"). 2-ая степень редукции наблюдается во
всех закрытых сзади согласными заударных слогах и во втором, третьем и др.
прикрытых спереди согласными предударных слогах.
Например: "повтори+ть" R 1 2 3
"перестро+йка" R 1 2 3 2
"за+поведь" R 3 1 1
"анахрони+зм" R 2 1 2 3
Знак "+" после гласного озна?ает ударность гласного.
Теперь определим правила замен фонем на редуцированные звукотипы для
каждой степени редукции.

1-ая степень редукции

|фонема |позиционно обусловленные звукотипы |
| |#+Г |Г+Г |С+Г |С'+Г |Г+# |С-Г |
|о |а |а* 1 |а* 2 |и |а* 5 |а |
|а |а |а |а* 3 |и |а |а |
|э |э |э |ы* 4 |и |э |э |
|ы |ы |- |ы |- |ы |ы |
|и |и |и |- |и |и |и |
|у |у2 |у2 |у2 |у2 |у2 |у2 |


* озна?ает нали?ие исклю?ений, которые задаются списками
(соответственно, списки 1, 2, 3, 4, 5)

2-ая степень редукции

|фонема |позиционно обусловленные звукотипы |
| |С+Г |С'+Г |
|о |ъ |ь |
|а |ъ |ь |
|э |ъ |ь |
| ы |ъ |- |
|и |- |ь |
|у | у1 | у1 |


Приме?ание.
Если [й'] стоит в слове между гласными и после ударения (справа от
знака + на любом от него расстоянии), то работает правило:
[й'] R (' [#ку2па+й'ьца#] R [#ку2па+('ца#]
[#спра+шъвъй'у2#] R [спра+шъвъ('у2#]

Блок текстового процессора обрабатывает межсловные стыки (для гласных и
согласных) и функциональные слова, превращая их в проклитики, энклитики и
слабоударные слова. Кроме того, в рамках этого блока осуществляется выбор
типа мелоди?еского контура синтагмы на основании знаков препинания, а также
выбор главноударного слова в синтагме.
1. Правила внешних сандхи
1.1 С5 - С6 R С6 - С6 (кроме [в], [в'])

1.2 С5С5 - С6 R С6С6 - С6 (кроме [в], [в']), где
|С5 (шумные |т|с|п|ф|к|ш|х|ц|т|с|п|ф|к|?|щ|
|глухие) - | | | | | | | | |'|'|'|'|'|'|'|
| |||||||||||||||||||||||||||||||
|С6 (шумные |д|з|б|в|г|ж|h|z|д|з|б|в|г|j|ж|
|звонкие) - | | | | | | | | |'|'|'|'|'|'|'|


1.3 С - [и] R С - [ы]

2. Модификации формулы Потебни для текста.
2.1. На?альный неударный гласный аллофон слова всегда остается первой
степени редукции, т. е. маркируется цифрой 2.
2.2. В слу?ае сте?ения двух гласных аллофонов внутри одного слова
второй аллофон, если он безударный, всегда маркируется цифрой 2
(т. е. он не может быть второй степени редукции).
2.3. Безударный гласный в открытом конце слова в потоке ре?и всегда
маркируется 1, т. е. становится второй степени редукции, кроме
слу?ая, когда следующий слог ударный (т. е. в следующем слове
ударный - первый слог). В этом слу?ае он становится первой
степени редукции и маркируется цифрой 2.
3. Правила обработки служебных слов.
Задаются три списка служебных слов:
3.1. Проклитики - приклеиваются к последующему слову, теряют знак + ,
и полу?ившееся слово транскрибируется по общим правилам, кроме
слу?ая, когда проклитика окан?ивается на согласный, а последующее
слово на?инается на йотированный гласный (я, ю, е, е) - в этом
слу?ае пробел ( - ) обрабатывается как "ъ".
Например: "по+д и+вой" R [пады+въй']
"по+д е+лью" R [падй'э+л'й'у2]

3.2. Энклитики - приклеиваются к предыдущему слову, теряют знак + , и
полу?ившееся слово транскрибируется по общим правилам.
Например: "сказа+л же+" R [сказа+лжэ]
3.3. Ряд слабоударных слов не приклеиваются к знаменательным словам,
теряют знак + , гласный редуцируется до 1-ой степени редукции с
сохранением ка?ества.
Например: "скво+зь тума+н" R [сквос' ту2ма+н]
4. Для определения коммуникативного типа синтагмы используются знаки >,
<, -, ?, /, которые ставятся вместо знака + после ударного гласного
главноударного слова.
Блоки словарного транскриптора содержат не только общие правила
произнесения, распространяющиеся на подавляющее большинство слов, но и
списки исклю?ений, позволяющие транскрибировать слова с нестандартным
произношением (в большинстве своем это слова иностранного происхождения).
Текстовый транскриптор содержит списки проклитиков, энклитиков и служебных
слов, обрабатываемых по особым правилам. Кроме того, для пользователя
предусмотрена возможность формирования собственного словаря слов с
нестандартным произношением.
5. Программная реализация транскриптора у?итывает все вышеприведенные
требования. Входными данными для программы является какая-либо фраза
(некоторый текст до первого знака препинания, такого как: "." "," ":" "?"
"!" "-"). Предусмотрены два режима ввода текста:
1) Пофразовый (в диалоге с пользователем) - программа обеспе?ивает
удобный ввод и обработку введенной фразы после обнаружения ее конца. Сразу
же после ввода фразы происходит вывод полу?енной транскрипции.
2) Текста большего объема ( из файла - trans.inp) - полу?ение
транскрипции всех фраз, составляющих этот текст. Предпологается, ?то текст
ранее был введен в файл с помощью текстового редактора. На выходе программы
- транскрипция введенного текста. Пользователь может выбрать режим выда?и
результатов (на экран дисплея, в файл trans.out или и на экран, и в файл).
Если транскрипция какого-либо слова не удовлетворяет пользователя, он
может занести в словарь (файл slov.txt) другое написание этого слова. Это
может быть сделано как с помощью текстового редактора, так и данной
программы.
При вводе фразы следует у?итывать:
а) в каждом слове должно быть проставлено ударение, если это не
сделано, то ударение автомати?ески поставится на первый слог;
б) в каждой фразе можно отметить главноударное слово;
в) коли?ественные ?ислительные не в именительном падеже должны быть
записаны словами, порядковые могут быть записаны цифрами с указанием
окон?ания (напр. 53-ий); если окон?ание не указано, то ?ислительное
обрабатывается как коли?ественное в именительном падеже;
г) десяти?ная дробь пишется ?ерез знак "," , а простая ?ерез "/";
д) программа обрабатывает знаки "+", "-" и "=";
е) пользователь может использовать некоторые стандартные сокращения
(напр. гор., г., т. к., т. п.), которые заменяются на полное написание.
Более подробную информацию можно полу?ить при работе программы (режим
помощи). Запуск программы - trans.exe.
Программа транскриптора работает в реальном режиме времени. Объем
памяти - 70 килобайт.