Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://www.philol.msu.ru/~serge/INSTRUCTION.html
Дата изменения: Fri Aug 31 14:42:44 2012 Дата индексирования: Fri Feb 28 02:02:12 2014 Кодировка: Windows-1251 |
ИНСТРУКЦИЯ ПО ВЫПОЛНЕНИЮ ПРАКТИЧЕСКОЙ РАБОТЫ
(Летняя компьютерная практика)
Цель работы: Проверка связей, установленных автоматическим семантико-синтаксическим анализатором и исключение ложных связей. Результаты вашей работы помогут улучшить качество автоматического анализа.
Содержание работы: Вам будут предложены результаты автоматического семантико-синтаксического анализа предложений из рассказов А.П. Чехова.
Например, (рассказ «Делец»)
Рис. 1
В
левой части экрана связи представлены графически, в правой части
экрана те же связи представлены в виде таблицы. Флажок в третьем
столбце таблицы означает установленную связь.
Требуется
исключить, удалив флажок, те связи, которые, по вашему мнению,
установлены неверно.
После исключения всех лишних связей нажмите
OK.
Результаты отображаются на экране и сохраняются в базе данных (на сервере филологического факультета МГУ).
Рис. 2
Таким же образом требуется обработать все данные вам предложения.
Порядок выполнения работы:
При получении задания вам будет сообщен Логин и Пароль для доступа к базе данных.
Логин имеет вид: USERn, где n - ваш персональный номер
Пароль представляет собой целое число от 1 до 10000.
Откройте программу Интернет-браузера (Internet Explorer) и в окне адреса введите
http://www.philol.msu.ru/~serge/DepTree/Index.html
Появится приглашение для ввода Логина (Пользователь: ) и Пароля
Рис. 3
Введите Ваш Логин и Пароль, например, для USER13 паролем является число 2720.
После нажатия OK Вы попадете на страницу Оглавление:
1 АПТЕКАРША (194)
2 БЕСЕДА ПЬЯНОГО С ТРЕЗВЫМ ЧЕРТОМ . (67)
3 БЕСПОКОЙНЫЙ ГОСТЬ . (212)
4 БЛАГОДАРНЫЙ . - (124)
5 БРАТЕЦ . (99)
6 КАНИТЕЛЬ . (109)
7 ЧТЕНИЕ . (142)
8 ЧТО ЛУЧШЕ ? (16)
9 КОНТРАБАС И ФЛЕЙТА . (161)
10 КУЛАЧЬЕ ГНЕЗДО . (115)
11 ДАЧНИКИ . (56)
12 ДАМА С СОБАЧКОЙ . (384)
13 ДЕЛЕЦ . (23)
14 ДЕНЬ ЗА ГОРОДОМ . (185)
15 ДОБРЫЙ ЗНАКОМЫЙ . (59)
…
Рис. 4
В каждой строке Оглавления указано:
Номер рассказа Название рассказа (Число предложений в рассказе)
Нажав на название рассказа, Вы перейдете к странице с текстом рассказа (Рассказ ? 13):
13
1 ДЕЛЕЦ .
13 2 Он маклер , биржевой заяц , дирижер в танцах ,
комиссионер , шафер , кум , плакальщик на похоронах и ходатай по
делам .
13 3 Иванову известен он как рьяный консерватор , Петрову
же - как отъявленный нигилист .
13 4 Радуется чужим свадьбам ,
носит детям конфеты и терпеливо беседует со старухами .
13 5 Одет
всегда по моде и причесан a la Капуль .
…
Рис. 5
Каждое предложение рассказа пронумеровано.
Ваш персональный номер n соответствует номеру того рассказа, предложения которого Вы должны обработать.
Перейдя по ссылке «Перейти к разбору предложений» Вы попадете на страницу вида:
Рис. 6
На странице приводится краткая инструкция, далее предлагается ввести номер рассказа и номер предложения. После ввода номера рассказа, равный Вашему персональному номеру и номера предложения, которое требуется обработать, нажмите клавишу Submit.
Вы перейдете на страницу с результатами автоматического анализа предложения и произведенной Вами правки (Рис. 2). Вы можете продолжить правку, как добавляя, так и вычеркивая флажки в правой части таблицы «ЗАВИСИМОСТИ». После нажатия клавиши OK результаты Вашей правки будут сохранены в базе данных и отображены графически.
Когда предложение обработано, сохраните HTM файл на вашем носителе (Файл – Сохранить как) под тем именем, которое предлагается, напр. в случае 4-го предложения рассказа ? 13 будет предложено имя файла DepTree13_7.htm.
Затем переходите по ссылке Exit - New sentence, указывайте номер следующего предложения.
Вы можете вводить номер «чужого» рассказа, не равный Вашему персональному номеру, но в этом случае Вы сможете только просмотреть результаты, но не сможете вносить исправления.
Некоторые принципы автоматического установления семантико-синтаксических зависимостей
При разработке автоматического анализатора применялись правила, отличные от правил классического грамматического анализа, что нужно учитывать при редактировании связей.
Отличия включают следующее:
- Все знаки препинания опущены.
- Связь между предлогом и существительным идет от существительного к предлогу, а не наоборот.
- Связь между однородными членами может быть направлена как от первого к последующим, так и наоборот.
- Связь между сочинительным союзом и одним из однородных членов направлена в сторону союза. ...
Некоторые погрешности разметки
В качестве границы предложения приняты: точка (.), восклицательный (!), вопросительный (?) знаки, многоточие (…), точка с запятой (;).
Предложения могут оказаться неполными из-за их деления по знакам препинания. Например, иногда точка после инициалов принимается за конец предложения.
С другой стороны, благодаря авторской пунктуации некоторые пары предложений могут сливаться, в частности, в диалогах.
В любом случае Вам следует выполнять правку на имеющемся материале, так слитое предложение Вы можете разделить, удалив связи между его частями.
Предложения, состоящие из 1-2 слов не анализируются.