HumLang - Отзыв к статье В.В.Кромера

Документ взят из кэша поисковой машины. Адрес оригинального документа : http://old.philol.msu.ru/~humlang/kr_otz2.htm
Дата изменения: Fri Apr 11 00:00:00 2003
Дата индексирования: Mon Oct 1 19:52:18 2012
Кодировка: Windows-1251

лист рассылки

Отзыв к статье Кромера В.В.

"Арктангенс или логиста? (К вопросу диахронического скачка)"

Уважаемый Виктор Вильгельмович!

Вопрос о параметрах - больной вопрос. И даже не вопрос, а множество вопросов. Беда в том, что короткий ряд наблюдений мы можем приближать самыми разными кривыми, и все будет терпимо. Даже линейные приблюжения. А чем больше у кривой параметров, тем точнее и точнее ее можно подгонять к эмпирике. В пределе вместо набора эмпирических чисел получаем примерно такой же по объему набор параметров, совершенно бесполезных для какого бы то ни было анализа.

В случае ранговых распределений предложено великое множество всяческих поправок к формуле Ципфа, но ни одна из этих "моделей" не отвечает на кардинальный вопрос - что делать дальше? Вот, подобрали мы под набор частот куска какого-то текста кучу параметров, прекрасно легла кривая, а дальше что? Что будет, если мы получим данные уже не по куску текста, а по всему тексту? Оказалось, что при таком изменении изменяется форма кривой, и причина этого изменения в первом (и в главном) приближении - именно в изменении объема наблюдений. И меняются не просто параметры - а вид аналитической зависимости. В общем случае она не выражается в элементарных функциях, степень наглядности - нуль, но очень мало параметров и в эту зависимость входит объем наблюдений как независимая переменная. Благодаря этому схема работает в динамике и способна к предсказанию, чего не могут делать формулы с подбираемыми параметрами.

Кроме меня, такой подход разрабатывал только один человек - J.B.Carroll еще в шестидесятые годы. Его схему логнормального распределения можно считать альтернативной моей. В своей работе в сб. "Вопросы кибернетики. Статистика речи и автоматический анализ текста, вып.41", - М.-Л. 1978, с.66-99 я провожу сравнительный анализ своей модели с моделью Кэррола.

Обе модели дали удивительно близкие результаты. К сожалению, обе вычислительно сложны. У Кэррола подбор параметров просто недоработан, в силу чего он даже не дает рабочих формул. Мою же модель в простейшем варианте можно использовать даже без компьютера (в свое время я считал на логарифмической линейке).

Если доберетесь до этой статьи, там же можете посмотреть библиографию работ Кэррола.

Все остальные известные мне модели просто несопоставимы с этими двумя, так как не способны к предсказанию динамики процессов в принципе.

Если захотите углубиться в идейную основу моих построений, посмотрите мои работы с Читашвили, опубликованные в начале 80-х гг.(данные - в моей Библиографии).

Использовать наша переписку в дискуссиях вполне возможно, естественно, с указанием источника.

Ваш Ю.Орлов

11.09.2001.

[ главная страница ]