Документ взят из кэша поисковой машины. Адрес оригинального документа : http://ecology.genebee.msu.ru/3_SOTR/CV_Terekhin_publ/2001_Neuroendocrin.doc
Дата изменения: Mon Mar 16 10:59:36 2009
Дата индексирования: Mon Oct 1 21:30:15 2012
Кодировка: koi8-r

А.Т. ТЕРЕХИН, Е.В. БУДИЛОВА
Московский государственный университет им. М.В. Ломоносова
AT@ATeriokhin.home.bio.msu.ru

ЭВОЛЮЦИОННАЯ ОПТИМИЗАЦИЯ НЕЙРОЭНДОКРИННОЙ СЕТИ, УПРАВЛЯЮЩЕЙ РАСПРЕДЕЛЕНИЕМ
ЭНЕРГИИ В ОРГАНИЗМЕ

Аннотация
Описывается общая схема взаимодействия потоков энергии и информации в
организме, а также между средой и организмом и анализируются два
методологически разных подхода к определению структуры и параметров
нейроэндокринной сети, управляющей распределением энергии в организме.

Abstract
A general scheme of interaction between flows of energy and information
inside organism and between an environment and organism is presented and
two methodologically different approaches for determining the structure and
parameters of neuroendocrine network controlling energy allocation in
organism are analyzed.

В каждый момент своего жизненного цикла любой организм выполняет ряд
функций, важных для индивидуального и видового выживания: рост,
размножение, добывание пищи, репарация, защита от вредных воздействий
среды, обеспечение базовых физиологических процессов. На разных этапах
жизненного цикла, в зависимости от своего внутреннего состояния и состояния
окружающей среды, организм может по-разному распределять свои ресурсы
(которые мы будем обозначать одним словом "энергия") между этими функциями.
Например, в начале жизни основной поток энергии направляется на рост, а с
наступлением половой зрелости - на размножение. В соответствии с общим
принципом естественного отбора Дарвина [1] стратегия распределения энергии
между различными потребностями организма в течение его жизненного цикла
должна быть оптимальной с точки зрения максимизации шансов выживания вида
во времени и пространстве, или, другими словами, быть эволюционно
оптимальной.
В связи с этим возникают две проблемы. Во-первых, какой должна быть
оптимальная стратегия распределения энергии при заданных условиях внешней
среды и заданных базовых физиологических параметрах организма? Во-вторых,
каким требованиям должна удовлетворять управляющая система организма,
реализующая эту оптимальную стратегию?
Общий методологический подход к формулировке и решению первой проблемы,
основанный на применении идей и методов математической теории оптимального
управления [2, 3], выкристаллизовался к середине 70-х годов [4, 5, 6, 7,
8]. Этот подход требует задания четырех составляющих оптимизационной
модели: переменных состояния, управляющих переменных, уравнений состояния и
критерия оптимизации (целевого функционала). Переменные состояния - это
характеристики организма и среды, динамика изменения которых определяет (в
рамках принятой модели) значение целевого функционала. В свою очередь,
динамика переменных состояния зависит от динамики управляющих переменных,
которые могут (в заданных пределах) в каждый момент времени изменяться
управляющей системой организма. Динамика переменных состояния, с учетом
влияния управляющих переменных, определяется уравнениями состояния,
дифференциальными в непрерывных моделях и разностными - в дискретных.
Результатом решения оптимизационной задачи является определение такой
стратегии изменения организмом значений управляющих переменных в
зависимости от его возраста и других переменных состояния, которая
обеспечивала бы максимум целевого функционала. В качестве последнего чаще
всего используют так называемый коэффициент Мальтуса (т.е. удельную
скорость роста популяции) r, определяемый из уравнения Эйлера - Лотки [9],
а управляющими переменными обычно служат доли энергии, выделяемые
организмом на различные жизненные потребности. В качестве методов
нахождения решения задачи, т.е. оптимальной стратегии распределения энергии
в течение жизненного цикла индивида, используют обычно принцип максимума
Понтрягина [4] или динамическое программирование [3]. Принцип максимума
позволяет получить аналитическое решение (правда, только для относительно
простых постановок задачи). Динамическое программирование дает лишь
численное решение задачи, но допускает более сложные постановки задач.
Подход к решению второй проблемы, основанный на применении методов теории
искусственных нейронных сетей (см., напр., [10]), был предложен в 1990 г.
Менджелом [11] и использован в ряде наших работ [12, 13, 14].
В данном сообщении мы, основываясь на собственном опыте моделирования
процессов эволюционной оптимизации нейроподобной сети, управляющей
распределением энергии в организме, описываем общую постановку задачи
эволюционной оптимизации и предлагаем два методологически разных подхода к
поиску структуры и параметров такой сети.
На рис. 1 представлена общая схема взаимодействия потоков энергии и
информации в организме и между организмом и средой. Среда является
источником энергии для организма, но также и источником повреждающих
воздействий, которые могут способствовать гибели индивида или его
потомства. В принципе, степень агрессивности внешней среды может быть одной
из переменных состояния, отслеживаемых организмом с целью адаптации своей
стратегии распределения энергии в зависимости от значения этой переменной.
В биологии такого рода способность организма называют пластичностью. Однако
для упрощения модели агрессивность среды предполагается постоянной на
протяжении всей эволюции вида и входит в модель в качестве параметра, а не
переменной состояния. На схеме представлена только одна переменная среды -
время сезона v, информация о котором важна для организма, обитающего в
среде с резко выраженной сезонностью.
Состояние организма представлено на схеме четырьмя переменными состояния,
характеризующими его в каждый момент времени t,: количеством имеющейся в
его распоряжении энергии e, количеством накопленной репродуктивной энергии
r, размером s, изношенностью w. Переменные состояния организма и среды
являются входами системы, управляющей распределением энергии. В связи с
этим важно подчеркнуть, что организм должен иметь сенсоры для всех
переменных состояния. Это означает, что никакая характеристика состояния
среды или организма, для которой у организма нет сенсора, не может быть
включена в число переменных состояния в нашей модели.
Управляющая система, возможную структуру которой мы обсудим чуть позже,
вырабатывает ряд управляющих сигналов. Один из них, RF, определяет момент
высвобождения потомства из-под родительской опеки. Остальные указывают доли
энергии, направляемые на добывание пищи и выработку энергии (Ee),
репродукцию (Er), репарацию (Ew), рост (Es). Для упрощения схемы некоторые
траты энергии (и соответствующие им управляющие сигналы), например, расходы
на базовое жизнеобеспечение,


Рис. 1. Общая схема потоков энергии (толстые сплошные линии), физического
влияния (толстые пунктирные), управления (тонкие сплошные) и информации
(тонкие пунктирные) при взаимодействии организма со средой.

не показаны на рис. 1. На схеме также не показаны конкретные зависимости,
отражающие влияние управляющих переменных на изменение переменных состояния
(уравнения состояния). Эти зависимости содержат ряд параметров, которые
часто неизвестны и которые приходится определять путем подгонки модели к
реальным биологическим данным, обычно к относительно более известным
средним размерным и демографическим характеристикам вида (размер тела,
возраст наступления половой зрелости, средняя продолжительность жизни).
Есть два подхода к задаче поиска структуры и параметров системы
управления распределением энергии, которую мы будем считать нейроподобной
сетью (биологически реализованной как нейроэндокринная сеть). Первый -
оптимизация универсальной сети с минимальным использованием априорной
информации о ее структуре и параметрах, второй - оптимизация
специализированной сети, построенной с максимальным использованием
априорной информации.
Первый подход может быть реализован с помощью генетического алгоритма
[15], который в данной ситуации может работать следующим образом. Создаются
N виртуальных особей, каждая из которых растет, размножается и погибает в
соответствии со схемой, представленной на рис. 1. При этом предполагается,
что энергия распределяется нейроэндокринной сетью, структура которой
представлена на рис. 2а. Особи могут исходно различаться своими
"генотипами" - наборами значений весов между нейроннами (число которых, n,
должно быть задано априорно, с некоторым избытком), а между потомками могут
появиться дополнительные различия из-за "мутаций" - случайных модификаций
весов связей у "новорожненных". В силу различий в средней рождаемости и
выживаемости разных генотипов через ряд поколений некоторые из них начнут
доминировать (встречаться чаще), и мы их примем за "эволюционно
оптимальные". Структура сети определяется автоматически: связи, имеющие
нулевой вес, можно считать отсутствующими (можно, кроме того, ввести
мутации специального вида, вызывающие исчезновение или возникновение новых
связей).
Найдя структуру и параметры эволюционно оптимальной управляющей сети, мы
можем легко найти, так сказать, "снизу - вверх", оптимальную стратегию
распределения энергии, т.е. функцию y=F(x), аргументом которой служит
вектор переменных состояния x, а значением - вектор управляющих переменных
y. Фактически, найденная управляющая сеть и является этой функцией,
позволяющей, если возникает необходимость, составлять таблицы или рисовать
графики, отражающие связь между переменными состояния и управляющими
переменными.
Второй подход к задаче определения структуры и параметров управляющей
сети является, в некотором смысле, противоположным первому и использует
логику, которую можно было бы назвать логикой "сверху - вниз". В этом
случае, пользуясь методами динамической оптимизации [2, 3], мы находим
функцию F(x) (в аналитическом виде или в форме таблиц и графиков), после
чего строим возможно более простую нейроподобную сеть, аппроксимирующую эту
функцию.

Рис. 2. Примеры возможной структуры нейроэндокринной сети, управляющей
распределением энергии: (a) сеть с полностью связанными между собой
внутренними нейронами; (b) сеть с не связанными между собой внутренними
нейронами.

В качестве базовой для аппроксимации F(x) удобно использовать так
называемую многослойную сеть, которая имеет достаточно простую стуктуру
(связи между нейронами одного слоя отсутствуют, а остальные направлены от
входных, сенсорных, нейронов к нейронам промежуточных слоев и далее к
выходным, эффекторным, нейронам) и для которой имеется достаточно
эффективный итеративный алгоритм нахождения весов межнейронных связей -
алгоритм обратного распространения ошибки [16] (как пример, на рис. 2b
представлена сеть с одним промежуточным слоем нейронов).
Каждый из подходов имеет свои достоинства и недостатки. Первый привлекает
своей гибкостью и универсальностью, однако требует очень большого машинного
времени, а получаемое решение носит стохастический характер. Задача еще
более усложняется, если неизвестны параметры уравнений состояния и их надо
находить, подгоняя результаты моделирования к реальным данным. Наш опыт
показывает, что второй подход, в силу своей большей структурированности и
нестохастичности решений, обычно оказывается практически более приемлемым.

Литература
1. Darwin C. The Origin of Species by Means of Natural Selection. London:
John Murray, 1859. См. также: Дарвин Ч. Происхождение видов путем
естественного отбора. Санкт-Петербург: Наука, 1991.
2. Bellman R. Dynamic Programming. Princeton, NY: Princeton Univ. Press,
1957. См. также: Беллман Р. Динамическое программирование.
3. Понтрягин Л.С., Болтянский В.Г., Гамрелидзе Р.В., Мищенко Е.Ф.
Математическая теория оптимальных процессов. M.: Наука, 1961.
4. Gadgil M., Bossert W.H. Life historical consequences of natural
selection. American Naturalist, 1970, v. 104, 1-24.
5. Goodman D. Natural selection and a cost ceiling on reproductive effort.
American Naturalist, 1974, v. 108, 247-268.
6. Taylor H.M., Gourley R.S., Lawrence C.E., Kaplan R.S Natural selection
of life history attributes: An analitical approach.. Theor. Pop. Biol.,
1974, v. 5, 104-122.
7. Schaffer W.M. Selection for optimal life histories: the effect of age
structure. Ecology, 1974, v. 55, 291-303. .
8. Leon J.A. Life histories as adaptive strategies. J. Theor. Biol., 1976,
v. 60, 301-305.
9. Lotka A. A contribution to the theory of self-renewing aggregates, with
special reference to industrial replacement. Ann. Math. Stat., 1939, v.
10, 1-25.
10. Уоссермен Ф. Нейрокомпьютерная техника. Теория и практика. Mосква:
Мир, 1992.
11. Mangel M. Evolutionary optimization and neural network models of
behavior. J. Math. Biol., 1990, v. 28, 237-256.
12. Budilova E.V., Kozlowski J., Teriokhin A.T. Neural network models of
life history energy allocation. Proceedings of the First National
Conference on Application of Mathematics to Biology and Medicine
(Zakopane, Poland, September 26-29, 1995). Krakow: Jagiellonian Univ.
and Univ. of Mines, 1995. 13-18.
13. Teriokhin A.T., Budilova E.V. Evolutionarily optimal neuroendocrine
networks controling age-dependent energy allocation to growth and
reproduction.. The Second International Symposium on Neuroinformatics and
Neurocomputers (Rostov-on-Don, Russia, September 20-23,1995). N.Y:
Institute of Electrical and Electronics Engineers, 1995, 438-445.
14. Teriokhin A.T., Budilova E.V. Evolutionarily optimal networks for
controlling energy allocation to growth, reproduction and repair in men
and women. Application of Artificial Networks to Ecological Modelling
(ed. by S. Lek and J.F. Guegan). Berlin, Springer Verlag. 2000, 225-237.
15. Holland J.H. Genetic algorithms. Scietific American, 1992. July, 114-
116.
16. Rumelhart D.E., Hinton G.E., Williams R.J. Learning internal
representations by error propagation. Parallel distributed processing.
Cambridge, MA: MIT Press, 1986, v. 1, 318-362