Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.philol.msu.ru/~serge/INSTRUCTION.html
Дата изменения: Fri Aug 31 14:42:44 2012
Дата индексирования: Fri Feb 28 02:02:12 2014
Кодировка: Windows-1251

ИНСТРУКЦИЯ ПО ВЫПОЛНЕНИЮ ПРАКТИЧЕСКОЙ РАБОТЫ

(Летняя компьютерная практика)

Цель работы:  Проверка связей, установленных автоматическим семантико-синтаксическим анализатором и исключение ложных связей. Результаты вашей работы помогут улучшить качество автоматического анализа.  

Содержание работы: Вам будут предложены результаты автоматического семантико-синтаксического анализа предложений из рассказов А.П. Чехова.

Например, (рассказ «Делец»)




Рис. 1

В левой части экрана связи представлены графически, в правой части экрана те же связи представлены в виде таблицы. Флажок в третьем столбце таблицы означает установленную связь.
Требуется исключить, удалив флажок, те связи, которые, по вашему мнению, установлены неверно.
После исключения всех лишних связей нажмите OK.

Результаты отображаются на экране и сохраняются в базе данных (на сервере филологического факультета МГУ).



Рис. 2

Таким же образом требуется обработать все данные вам предложения.

Порядок выполнения работы:

При получении задания вам будет сообщен Логин и Пароль для доступа к базе данных.

Логин имеет вид: USERn, где n - ваш персональный номер

Пароль представляет собой целое число от 1 до 10000.

Откройте программу Интернет-браузера (Internet Explorer) и в окне адреса введите

http://www.philol.msu.ru/~serge/DepTree/Index.html

Появится приглашение для ввода Логина (Пользователь: ) и Пароля

Рис. 3

Введите Ваш Логин и Пароль, например, для USER13 паролем является число 2720.

После нажатия OK Вы попадете на страницу Оглавление:

1 АПТЕКАРША (194)

2 БЕСЕДА ПЬЯНОГО С ТРЕЗВЫМ ЧЕРТОМ . (67)

3 БЕСПОКОЙНЫЙ ГОСТЬ . (212)

4 БЛАГОДАРНЫЙ . - (124)

5 БРАТЕЦ . (99)

6 КАНИТЕЛЬ . (109)

7 ЧТЕНИЕ . (142)

8 ЧТО ЛУЧШЕ ? (16)

9 КОНТРАБАС И ФЛЕЙТА . (161)

10 КУЛАЧЬЕ ГНЕЗДО . (115)

11 ДАЧНИКИ . (56)

12 ДАМА С СОБАЧКОЙ . (384)

13 ДЕЛЕЦ . (23)

14 ДЕНЬ ЗА ГОРОДОМ . (185)

15 ДОБРЫЙ ЗНАКОМЫЙ . (59)

Рис. 4

В каждой строке Оглавления указано:

    Номер рассказа Название рассказа (Число предложений в рассказе)

Нажав на название рассказа, Вы перейдете к странице с текстом рассказа (Рассказ ? 13):

13 1 ДЕЛЕЦ .
13 2 Он маклер , биржевой заяц , дирижер в танцах , комиссионер , шафер , кум , плакальщик на похоронах и ходатай по делам .
13 3 Иванову известен он как рьяный консерватор , Петрову же - как отъявленный нигилист .
13 4 Радуется чужим свадьбам , носит детям конфеты и терпеливо беседует со старухами .
13 5 Одет всегда по моде и причесан a la Капуль .

Рис. 5

Каждое предложение рассказа пронумеровано.

Ваш персональный номер n соответствует номеру того рассказа, предложения которого Вы должны обработать.

Перейдя по ссылке «Перейти к разбору предложений» Вы попадете на страницу вида:



Рис. 6

На странице приводится краткая инструкция, далее предлагается ввести номер рассказа и номер предложения. После ввода номера рассказа, равный Вашему персональному номеру и номера предложения, которое требуется обработать,  нажмите клавишу Submit.

Вы перейдете на страницу с результатами автоматического анализа предложения и произведенной Вами правки (Рис. 2). Вы можете продолжить правку, как добавляя, так и вычеркивая флажки в правой части таблицы «ЗАВИСИМОСТИ». После нажатия клавиши OK результаты Вашей правки будут сохранены в базе данных и отображены графически.

Когда предложение обработано, сохраните HTM файл на вашем носителе (Файл – Сохранить как) под тем именем, которое предлагается, напр. в случае 4-го предложения рассказа ? 13 будет предложено имя файла DepTree13_7.htm.

Затем переходите по ссылке Exit - New sentence, указывайте номер следующего предложения.

Вы можете вводить номер «чужого» рассказа, не равный Вашему персональному номеру, но в этом случае Вы сможете только просмотреть результаты, но не сможете вносить исправления.

Некоторые принципы автоматического установления семантико-синтаксических зависимостей

При разработке автоматического анализатора применялись правила, отличные от правил классического грамматического анализа, что нужно учитывать при редактировании связей.

Отличия включают следующее:

- Все знаки препинания опущены.

- Связь между предлогом и существительным идет от существительного к предлогу, а не наоборот.

- Связь между однородными членами может быть направлена как от первого к последующим, так и наоборот.

- Связь между сочинительным союзом и одним из однородных членов направлена в сторону союза. ...

Некоторые погрешности разметки

В качестве границы предложения приняты: точка (.), восклицательный (!), вопросительный (?) знаки, многоточие (…), точка с запятой (;).

Предложения могут оказаться неполными из-за их деления по знакам препинания. Например, иногда точка после инициалов принимается за конец предложения.

С другой стороны, благодаря авторской пунктуации некоторые пары предложений могут сливаться, в частности, в диалогах.

В любом случае Вам следует выполнять правку на имеющемся материале, так слитое предложение Вы можете разделить, удалив связи между его частями.

Предложения, состоящие из 1-2 слов не анализируются.