Документ взят из кэша поисковой машины. Адрес оригинального документа : http://ecology.genebee.msu.ru/3_SOTR/CV_Terekhin_publ/2001_Diss1.doc
Дата изменения: Mon Mar 16 10:58:52 2009
Дата индексирования: Mon Oct 1 20:25:49 2012
Кодировка: koi8-r

I. Общая методология экологического моделирования





1.1. Основные этапы и методы моделирования



Экология (практически с момента своего возникновения, а современная
экология - в еще большей степени) является наукой количественной (как в
своей теоретической основе, так и в приложениях), поскольку ее базовые
объекты - численности и биомассы, а также пространственно-временные шкалы,
с которыми они соотносятся, - сущности чисто количественные. Поэтому
математическое моделирование - естественная среда для экологических
исследований.

Математический инструментарий включает множество подходов и методов, и
конкретный исследователь в конкретной ситуации выбирает те из них, которые
позволяют наиболее эффективно решить поставленную перед ним задачу. Если,
однако, рассмотреть исследование любой экологической проблемы в более
широком содержательном и организационном контексте, то можно выделить ряд
последовательных этапов процесса моделирования реального явления (рис.
1.1). Эти этапы могут не всегда следовать друг за другом во времени,
возможны многократные циклы, вызванные возвратами от последующих этапов к
предыдущим, но, в среднем, направление вектора познания явления
сохраняется: от поверхностного, констатационного знания к более глубокому,
объясняющему скрытые механизмы, порождающие видимые эффекты и
закономерности, и, далее, к объяснению генезиса этих механизмов, причин,
сделавших их такими, какие они есть, а не какими-либо иными.

К первому этапу экологического моделирования мы относим использование
множества методов и приемов, которые можно объединить под общим названием
"методы анализа данных" (Мостеллер, Тьюки, 1982). В п. 1.2 излагается
предложенная нами общая классификация методов анализа данных (Терехин,
1978), иллюстрируемая практическими примерами моделирования в биологии.
Основной особенностью этого этапа является то, что получаемые модели носят
феноменологический характер, т.е. фиксируют наблюдаемые связи между
явлениями, не детализируя их механизм.







Рис. 1.1. Основные этапы экологического моделирования

Относительно применяемых на этом уровне математических моделей можно
сказать, что используются исключительно функциональные модели: одни
переменные выражаются как функции других. Наиболее явно функциональный
характер модели декларирован в постановке задачи регрессионного анализа,
но с большей или меньшей степенью выраженности он прослеживается во всех
методах анализа данных. Характерной особенностью этих методов часто
является, кроме того, повышенное внимание к обоснованности делаемых
выводов, их статистической достоверности. Может даже показаться, что
статистический анализ - основная цель моделирования. Однако с точки зрения
понимания существа проблемы более важна структурная составляющая анализа,
а она никогда не выходит за рамки функциональной связи.

Второй этап моделирования можно рассматривать как попытку более
глубокого проникновения в сущность изучаемого явления путем его редукции к
локальным во времени и в пространстве взаимодействиям. Фактически
анализируется его внутренняя конструкция, поэтому методологический подход
второго этапа можно было бы назвать "конструкционным". Математической
основой этого подхода служит аппарат разностных или дифференциальных
уравнений, обыкновенных или в частных производных (Вольтерра, 1976;
Колмогоров, 1972; Алексеев, 1976; Свирежев, Логофет 1978; Полуэктов и др.,
1980; Беляев, 1983; Базыкин, 1985; Рубин и др., 1987 ). Функциональные
зависимости между переменными, получение которых путем обработки
экспериментальных данных было основной целью моделирования на первом этапе,
на втором этапе получаются просто как следствия в результате численного или
аналитического интегрирования дифференциальных уравнений модели. В качестве
вариантов этого подхода могут также рассматриваться методы имитационного
(Меншуткин, 1971; Горстко и др., 1984; Алексеев, Федоров, 1987) и
мультиагентного (Langton, 1988; Villa, 1992; Van Winkle, Rose, 1993; Бурцев
и др., 2000) моделирования. В п. 1.3 обсуждаются некоторые методологические
трудности, возникающие при использовании этих методов и приводятся примеры
применения этого подхода к практическим задачам, выполненным с нашим
участием.

На втором этапе могут активно использоваться функциональные методы
моделирования первого этапа. Во-первых, функциональный характер носят
локальные взаимодействия, являющиеся основой дифференциальных моделей, и,
соответственно, их можно получить путем анализа данных, характеризующих
локальные взаимодействия. Во-вторых, дифференциальное уравнение (или
систему уравнений) можно интерпретировать как своего рода сложную функцию,
значения которой получаются в результате интегрирования. Эта функция,
подобно любой другой, может содержать неизвестные параметры, которые могут
быть оценены по реальным данным, используя методологию нелинейного
регрессионного анализа. Однако мы считаем, что в данных случаях применение
методов функционального моделирования является скорее вспомогательным.

Третий этап моделирования (именно связанные с ним идеи и подходы
положены в основу данной работы) можно рассматривать как развитие второго в
том смысле, что он позволяет достигнуть более глубокого понимания существа
исследуемого явления. Действительно, используя методы дифференциального
моделирования, мы можем описать механизм функционирования объекта, его
конструкцию, однако не можем объяснить, почему они должны быть именно
такими. Понять это можно, если проанализировать назначение объекта, цель
его функционирования. Математической основой этого подхода служат идеи и
методы динамической оптимизации и, прежде всего, методы теории
оптимального управления, такие как принцип максимума (Понтрягин и др.,
1961; см. также: Pontryagin et al., 1962) и динамическое программирование
(Bellman, 1957; cм. также: Беллман, 1960). Конечно, понятие цели, в
общепринятом смысле этого слова, можно безоговорочно применить лишь к
объектам, сконструированным человеком для выполнения определенной задачи,
и, по возможности, наилучшим, оптимальным образом с точки зрения
эффективности функционирования и затрат на изготовление. Однако это не
означает, что оптимизационный подход не может быть применен для описания
других ситуаций. Даже в такой "бездушной" науке как механика, основной
принцип движения, принцип наименьшего действия Гамильтона, формулируется в
рамках оптимизационной парадигмы: любая механическая система переходит из
одного положения в другое таким образом, чтобы интеграл действия, т.е.
интеграл разности кинетической и потенциальной энергии, был минимальным
(см., напр., Гантмахер, 1966). Тем более этот подход применим в биологии,
где основным принципом является принцип естественного отбора, согласно
которому конструкция организма оптимизируется в интересах выживания вида
(Darwin, 1859; см. также: Дарвин, 1991).

Ниже в этой главе более подробно рассматриваются перечисленные
основные этапы экологического моделирования.

1.2. Феноменологический анализ: функциональные модели



Несмотря на чрезвычайное разнообразие методов феноменологического
анализа данных, можно проследить четкую систему представления как самих
данных, так и результатов их анализа. Данные представляются в виде
прямоугольной таблицы (матрицы), строки которой соответствуют различным
ситуациям (наблюдениям), а столбцы - переменным, наблюдаемым в этих
ситуациях. Результаты же представляются в виде функций, выражающих одни
переменные (называемые зависимыми переменными, или откликами) через другие
переменные (называемые независимыми переменными, или факторами). Такое
представление исходных данных и результатов феноменологического анализа
чрезвычайно удобно с методологической точки зрения, поскольку предлагает
четкую схему для сбора данных, их обработки и интерпретации полученных
результатов. К сожалению, исторически сложившаяся классификация методов
анализа данных и традиционная методология их применения не акцентируют
внимание (за исключение только, быть может, регрессионного анализа) на
функциональном характере лежащей в их основе модели. Поэтому данному
вопросу была посвящена отдельная публикация (Терехин, 1978; см. также:
Голикова и др., 1981; Терехин, 1990; Будилова и др., 1995; Budilova et al.,
1997). Ниже излагаются (с некоторыми модификациями) ее основные идеи.

Предлагается классификация методов анализа данных по двум основаниям:
отсутствию или наличию независимых переменных и типу переменных (которые
могут быть качественными или количественными). Ее схема представлена на
рис. 1.2. Основным служит деление на методы, не предполагающие наличия
независимых переменных (левая половина схемы) и предполагающие их наличие
(правая половина). Это деление определяет содержательную постановку задачи,
тогда как дальнейшее деление методов по типу зависимых и независимых
переменных носит скорее технический характер, детализируя математическую
процедуру ее решения.

Случай отсутствия зависимых переменных (левая половина рис. 1.2)
предполагает, что все анализируемые переменные в некотором смысле
равноправны, и мы принимаем их за отклики, значения которых определяются
какими-то нам неизвестными факторами, X. Примерами могут служить
морфологические (см., напр., Жарикова и др., 1978; Пименов и др., 1978,
1981; Багирян, Терехин, 1980), биохимические (Пименов и др., 1979, 1980;
Шретер, Терехин, 1980; Шретер и др., 1984) или генетические (Рычков и др.,
1990) характеристики растений, животных или людей, принадлежащих
определенному таксону или обитающих на определенной территории. Задача
анализа состоит в поиске этих неизвестных факторов. Выбор метода решения
зависит от того, являются ли искомые факторы качественными или
количественными.



Рис1.2. Классификация методов анализа данных



Для поиска качественных факторов используется группа методов,
известная под названием кластерный анализ (см., напр., Райская и др.,
1972), среди которых наиболее часто используется так называемый
агломеративно-иерархический метод, основанный на последовательном
объединении многомерных наблюдений сначала в мелкие, а затем во все более и
более крупные группы (см., напр., Терехин, 1976). Результатом кластерного
анализа является разбиение всей совокупности наблюдений на классы.
Полученной классификации соответствует качественная переменная (или
несколько переменных, если используются несколько классификаций разной
степени дробности или пересекающиеся классификации), категориями которой
служат номера классов. Именно эта переменная (или переменные) и будет
искомым качественным фактором. Найдя такой фактор (классифицирующую
переменную), мы получаем возможность объяснять сходство или различие в
значениях откликов для разных наблюдений принадлежностью их к одному или к
разным классам.

Если же неизвестные факторы ищутся в форме количественных переменных,
то используются методы факторного анализа. В этом случае задача состоит в
представлении имеющихся откликов, Y, в виде линейных комбинаций
неизвестных количественных факторов, X (см., напр., Носов, 1990). С
практической точки зрения применение этого метода оправдано, если удается с
достаточной степенью приближения выразить большое количество откликов через
малое число факторов. Одним из наиболее часто используемых методов этого
класса является метод главных компонент, основанный на ортогональном
проектировании исходного многомерного пространства в пространство меньшей
размерности, в котором точки-наблюдения имеют наибольший разброс. Метод
позволяет записать исходные данные в более компактном виде с сохранением
максимума содержащейся в них информации и даже представить их графически на
плоскости для случая двух факторов.

В случае априорного разделения переменных на зависимые и независимые
(см. правую половину рис. 1.2) задача анализа состоит в получении описания
зависимости Y от X. Выбор метода решения зависит прежде всего от того,
являются ли качественными или количественными зависимые переменные Y.
Окончательное решение о выборе метода анализа данных принимается в
зависимости от типа независимых переменных X.

Наиболее часто используемыми методами установления связи между
независимыми и зависимыми переменными являются дисперсионный и
регрессионный анализ (см., напр., Кендалл, Стьюарт, 1973). В обоих случаях
откликами служат количественные переменные, однако факторы в дисперсионном
анализе качественные, а в регрессионном - количественные.

Задачей дисперсионного анализа является установление связи между
независимыми качественными переменными и зависимыми количественными. Однако
поскольку функциональная структура связи очень проста - отклики
представляются как линейные комбинации бинарных переменных, уровней
факторов, и произведений этих бинарных переменных, то основное внимание в
дисперсионном анализе уделяется вопросам статистической значимости влияния
отдельных факторов и их уровней на отклики (Шеффе, 1980; Панченко, 1990). В
случае возможности планирования эксперимента решается задача оптимального
(с точки зрения минимизации ошибки прогноза значений Y по значениям X)
выбора значений факторов (Маркова, 1970). Однако в своей структурной основе
любая схема дисперсионного анализа - это всегда модель функционального
типа.

Функциональный характер модели наиболее явно виден в регрессионном
анализе. Задача регрессионного анализа прямо формулируется как задача
поиска функциональной зависимости Y от X, причем задача поиска формы связи
не менее важна, чем вопросы статистической значимости полученных
результатов. Наиболее широко применяется модель множественного линейного
регрессионного анализа, позволяющая получать аналитически все стандартные
статистические оценки (см., напр., Мятлев, 1990). В более сложных ситуациях
(например, при использовании пошаговых процедур) для получения
статистических выводов приходится применять методы, основанные на
стохастическом моделировании, такие как случайная пермутация или бут-стрэп
(Девяткова, Терехин, 1981; Левич, Терехин, 1997). Как и в дисперсионном
анализе, в случае возможности выбора значений факторов ставится задача
нахождения оптимального плана эксперимента (Налимов, Чернова, 1965;
Налимов, 1971; Налимов, Голикова, 1981; Максимов, Федоров, 1975; Адлер и
др., 1976).

Если отклики Y качественные, то для анализа используется группа
методов, известная под общим названием распознавания образов. Наиболее
используемым методом распознавания в случае количественных факторов
является дискриминантный анализ (см., напр., Кендалл, Стьюарт, 1976,
Айвазян и др., 1989). Примерами методов распознавания, ориентированных на
случай качественных факторов, могут служить сегментационный анализ (Cellard
et al., 1967) и метод обобщенного портрета (Вапник, Червоненкис, 1973).

Целью дискриминантного анализа является получение правила,
позволяющего на основе наблюденных значений количественных независимых
переменных X предсказывать значение качественной переменной Y, указывающей
на принадлежность наблюдения к одному из заданных классов. В такой
постановке задачи естественно говорить о классифицирующей переменной как о
зависимой переменной, однако для получения статистического вывода о
различии классов вполне допустимо принять классифицирующую переменную за
фактор, чтобы воспользоваться статистическим аппаратом, разработанным для
многомерного дисперсионного анализа. В (Булгаков и др., 1995; Левич и др.,
1996, 1998; Максимов и др., 1997) метод классификации, близкий к
дискриминантному анализу, был применен для построения правила предсказания
экологического благополучия водоема по комплексу абиотических факторов.

Сегментационный анализ состоит в последовательном дихотомическом
разбиении совокупности наблюдений с целью получения, в конечном итоге,
групп, максимально однородных по классовому составу. Мы использовали этот
метод для прогнозирования лекарственных свойств растений дальневосточной
флоры (Шретер, Терехин, 1980). Недостаток сегментационного анализа, однако,
состоит в том, что получаемое с его помощью классификационное правило
статистически неустойчиво, поэтому он используется относительно нечасто в
практических задачах дискриминации.

Следует еще раз подчеркнуть, что основным является деление методов
анализа на те, в которых переменные делятся на зависимые и независимые
(анализ связи), и те, в которых такого деления нет (анализ факторов).
Дальнейшее деление методов по типу откликов и факторов довольно
относительно. Дело в том, что уровни качественных факторов можно
рассматривать как бинарные переменные, которые, в свою очередь, можно
считать количественными переменными со значениями 0 и 1. С другой стороны,
непрерывную шкалу значений количественной переменной можно категоризовать и
рассматривать эту переменную как качественную. Во всяком случае, такого
рода преобразования приходится делать вынужденно, когда по типу различаются
не только факторы и отклики, но и разные переменные среди факторов или
среди откликов.



1.3. Анализ механизма явления: дифференциальные модели



Под исследованием механизма явления понимается объяснение его
глобальных проявлений как результата взаимодействия локальных составляющих.
Типичным примером моделей, используемых для описания механизма, являются
модели в форме дифференциальных уравнений, позволяющие находить
интегральное поведение системы на основе знания ее локального во времени и
пространстве функционирования. Мы условно назовем модели такого направления
дифференциальными, включая, однако, в это понятие более широкий круг
моделей: от чисто дифференциальных и близких к ним разностных до получающих
в настоящее время широкое распространение мультиагентных. В экологии
классическими примерами моделей на основе дифференциальных уравнений могут
служить модели конкуренции двух видов за общий ресурс и модели типа хищник-
жертва (Вольтерра, 1976; Колмогоров, 1972). В этих моделях используются
обыкновенные дифференциальные уравнения, достаточные для ситуаций, в
которых не учитываются эффекты пространственной неоднородности и
пространственного перемещения моделируемых объектов. В случаях, когда учет
пространственных эффектов важен, используется аппарат дифференциальных
уравнений в частных производных. Так, мы использовали уравнения в частных
производных для моделирования процессов переноса биогенных элементов и
планктона в Северном Каспии (Будилова и др., 1987а,b). Примером разностной
модели является матричная модель Лесли, описывающая динамику
структурированной по возрасту популяции (Leslie, 1945). В (Александрова и
др., 1978 ) эта модель была использована нами для описания динамики
численности лабораторной популяции комаров. Часто разностные модели
получаются в результате дискретизации модели дифференциальных уравнений с
целью получения решения численными методами. При описании биогеоценоза
число уравнений модели может достигать нескольких десятков. Предполагается,
что это дает возможность очень детально описать функционирование реальной
системы, и поэтому модели такого рода принято называть имитационными. В
период их начального становления с имитационными моделями связывались
большие надежды (см., напр., Меншуткин, 1971), которые, однако, как нам
представляется, в значительной степени не оправдались. Основная причина - в
отсутствии робастности (грубости) решения по отношению к неточно
определенным параметрам модели. В настоящее время более популярны другие
модели имитационного характера - так называемые мультиагентные модели. Они
довольно успешно используются в задачах моделирования эволюции поведения
животного при поиске пищи или партнера для размножения (Будилова и др.,
1994; Budilova et al., 1995b; Бурцев и др., 2000). Однако имеется тенденция
к увеличению масштаба мультиагентных моделей, особенно с целью
использования их в чисто прикладных задачах. И здесь, нам кажется, имеется
опасность столкнуться с теми же трудностями, что и при применении
имитационных моделей в 70-80-х годах. Дело в том, что такого рода
широкомасштабные модели неизбежно содержат множество очень приближенно
заданных параметров, поэтому возникают огромные трудности уже на стадии их
подгонки к реальным данным, возможность же их использования для прогноза
может оказаться вообще проблематичной.

Имеется тесная концептуальная и методологическая связь между
функциональным и дифференциальным подходами к моделированию. Строя
функциональные модели, мы неявно предполагаем, что наблюдаемые
функциональные закономерности являются результатом работы некоторого
механизма более низкого уровня. И, наоборот, решения, получаемые
аналитическим или численным интегрированием дифференциальных или разностных
уравнений имеют форму функциональных моделей.

Развитый аппарат подгонки функциональных моделей к данным может быть
использован и при построении дифференциальных моделей. Во-первых, локальные
взаимодействия, используемые в качестве основы в дифференциальных
уравнениях, имеют вид функциональных зависимостей, которые обычно содержат
неизвестные параметры, которые должны быть найдены путем подгонки этих
зависимостей к данным. Во-вторых, если не удается оценить параметры
дифференциальной модели на локальном уровне, это может быть сделано на
интегральном уровне. А именно, если имеются какие-либо данные о том, какой
должна быть интегральная зависимость, получаемая с помощью дифференциальной
модели, то можно ставить задачу о подгонке параметров дифференциальной
модели к этим данным. В такой постановке дифференциальная модель фактически
рассматривается как очень сложная функция, процесс получения значений
которой содержит, в частности, этап интегрирования. Используемые при этом
методы минимизации ошибки подгонки, очевидно, не должны требовать знания
аналитического вида минимизируемой функции (обычно суммы квадратов
расхождений между расчетными и реальными данными).





1.4. Анализ генезиса механизма: оптимизационные модели



Функциональные модели описывают наблюдаемые явления в форме
функциональных связей. Дифференциальные модели описывают механизм,
порождающий наблюдаемые связи, и, в этом смысле, более глубоко проникают в
сущность исследуемого явления. Однако дальнейший, более глубокий уровень
понимания состоит в получении ответа на вопрос, почему описанный с помощью
дифференциальной модели механизм именно такой, а не какой-либо другой.
Ответ на этот вопрос может быть дан в следующей форме: этот механизм именно
таков, потому что только будучи таким он может оптимально выполнять задачу
для которой он предназначен. Мы должны, следовательно, понять назначение
описываемого объекта и найти структуру и параметры механизма,
соответствующие максимальной эффективности (при некоторых заданных
ограничениях на конструкцию объекта и условия, в которых он должен
функционировать). Мы назовем процесс решения этой задачи оптимизационным
моделированием.

Этап оптимизационного моделирования сохраняет преемственность с
предыдущим этапом: оптимальный механизм ищется в форме дифференциальной,
разностной или мультиагентной модели. Однако к требованию соответствия
механизма реальности добавляется требование оптимальности его
функционирования с точки зрения выполняемой задачи. Оптимизационное
моделирование фактически решает задачу нахождения и описания
фундаментальных причин, вызвавших появление данного механизма и
определивших его структуру и параметры, т.е. задачу описания генезиса
механизма.

В следующей главе мы детально остановимся на этом подходе в связи с
задачей моделирования эволюционной оптимизации жизненного цикла живого
организма.



-----------------------
[pic]