Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://www.philol.msu.ru/~humlang/kr_otz2.htm
Дата изменения: Fri Apr 11 00:00:00 2003 Дата индексирования: Mon Oct 1 22:52:10 2012 Кодировка: Windows-1251 |
Отзыв к статье Кромера В.В.
"Арктангенс или логиста? (К вопросу диахронического скачка)"
Уважаемый Виктор Вильгельмович!
Вопрос о параметрах - больной вопрос. И даже не вопрос, а множество вопросов. Беда в том, что короткий ряд наблюдений мы можем приближать самыми разными кривыми, и все будет терпимо. Даже линейные приблюжения. А чем больше у кривой параметров, тем точнее и точнее ее можно подгонять к эмпирике. В пределе вместо набора эмпирических чисел получаем примерно такой же по объему набор параметров, совершенно бесполезных для какого бы то ни было анализа.
В случае ранговых распределений предложено великое множество всяческих поправок к формуле Ципфа, но ни одна из этих "моделей" не отвечает на кардинальный вопрос - что делать дальше? Вот, подобрали мы под набор частот куска какого-то текста кучу параметров, прекрасно легла кривая, а дальше что? Что будет, если мы получим данные уже не по куску текста, а по всему тексту? Оказалось, что при таком изменении изменяется форма кривой, и причина этого изменения в первом (и в главном) приближении - именно в изменении объема наблюдений. И меняются не просто параметры - а вид аналитической зависимости. В общем случае она не выражается в элементарных функциях, степень наглядности - нуль, но очень мало параметров и в эту зависимость входит объем наблюдений как независимая переменная. Благодаря этому схема работает в динамике и способна к предсказанию, чего не могут делать формулы с подбираемыми параметрами.
Кроме меня, такой подход разрабатывал только один человек - J.B.Carroll еще в шестидесятые годы. Его схему логнормального распределения можно считать альтернативной моей. В своей работе в сб. "Вопросы кибернетики. Статистика речи и автоматический анализ текста, вып.41", - М.-Л. 1978, с.66-99 я провожу сравнительный анализ своей модели с моделью Кэррола.
Обе модели дали удивительно близкие результаты. К сожалению, обе вычислительно сложны. У Кэррола подбор параметров просто недоработан, в силу чего он даже не дает рабочих формул. Мою же модель в простейшем варианте можно использовать даже без компьютера (в свое время я считал на логарифмической линейке).
Если доберетесь до этой статьи, там же можете посмотреть библиографию работ Кэррола.
Все остальные известные мне модели просто несопоставимы с этими двумя, так как не способны к предсказанию динамики процессов в принципе.
Если захотите углубиться в идейную основу моих построений, посмотрите мои работы с Читашвили, опубликованные в начале 80-х гг.(данные - в моей Библиографии).
Использовать наша переписку в дискуссиях вполне возможно, естественно, с указанием источника.
Ваш Ю.Орлов
11.09.2001.
[ главная страница ]