Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://www.library.biophys.msu.ru/FominBerk/main.htm
Дата изменения: Tue Oct 30 20:53:28 2001 Дата индексирования: Sat Mar 1 20:17:57 2014 Кодировка: Windows-1251 |
О г л а в л е н и е.
Глава 1. Математика и изучение реального мира
1.1 Биологам понадобилась математика, а математики стали интересоваться биологией. Почему?
1.2 Сущность математического подхода к изучению реального мира. Модели
1.4 Появление новых возможностей в математике
Глава 2. Общие принципы управления, действующие в биосистемах
2.1 Особенности управления биологическими системами
2.3 Многоуровневая организация систем управления
2.4 Локальное управление сложными системами
Глава 3. Применение ЭВМ в биологических исследованиях
3.1 Чем может помочь биологу вычислительная машина
3.2 Несколько слов о вычислительной технике
3.3 Примеры использования машин для обработки больших массивов информации:
3.4 Обработка данных в ходе эксперимента:
3.5 Вычислительная машина-участник эксперимента
3.6 Математический анализ электрокардиограмм (обучающиеся программы)
3.7 Моделирование биологических систем и вычислительные машины
Глава 4. Математические модели в биологии
4.1 Роль математических моделей в биологических исследованиях
4.2 Аксиоматические модели активных сред:
4.3 Ионно-мембранные механизмы возбуждения. Модель Ходжкина - Хаксли и ее модификации:
4.4 Модели нейрона. Нейронные сети:
4.5 Зрительная система и ее функции:
4.6 Модели эмбрионального развития. Формообразование
4.7 О регуляции внутриклеточных процессов:
Генетический код | Управление синтезом белка в бактериальных клетках | Математическое описание процесса синтеза белка |
Глава 5. Некоторые математические проблемы, возникшие в связи с биологическими исследованиями
5.1 Проблемы надежности и скорости
5.3 Автоматы в случайных средах
5.4 Формальные модели самовоспроизведения
5.5 Проблемы искусственного интеллекта и распознавание образов
0. Предисловие
<< | >>
Для современной науки характерно применение точных математических методов в самых различных областях. Эти методы проникают в экономику, лингвистику, психологию и многие другие области знания, в том числе и в биологию. В науку о живой природе математика входит различными путями: с одной стороны - это использование современной вычислительной техники для быстрой обработки результатов биологического эксперимента, с другой - создание математических моделей, описывающих различные живые системы и происходящие в них процессы. Не менее важна и 'обратная связь', возникающая между математикой и биологией: биология не только служит ареной для применения математических методов, но и становится все более существенным источником новых математических задач.
Некоторые связи между биологией и математикой стали уже вполне привычными. Это относится прежде всего к генетике и исследованию динамики популяций. Если пока еще трудно говорить о математической биологии в целом как о сложившейся науке, то математическая генетика уже несомненно стала достаточно сформировавшейся дисциплиной. Точно так же и в исследование взаимоотношений между популяциями животных, образующими сообщество, в изучение динамики численности популяций математические методы прочно вошли еще несколько десятилетий тому назад. Наконец для всей биологии в целом стало уже традиционным широкое применение математической статистики, различных методов математической обработки результатов эксперимента.
Все эти направления, безусловно интересные и важные, остались за рамками нашей книги. Наша цель - показать важность и плодотворность математического подхода к таким биологическим, в частности физиологическим проблемам, для которых такой подход еще только складывается. Необходимо при этом подчеркнуть, что 'математический подход' к исследованию тех или иных явлений реального мира - физических, биологических, экономических и т. д. - отнюдь не сводится к применению каких-либо стандартных математических приемов, расчетных формул и т. п. Математический подход к исследованию какой-то новой области - это прежде всего выработка достаточно четких общих понятий', создание моделей, пригодных для изучения их точными количественными методами, выяснение фундаментальных принципов организации изучаемых систем. В нашей книге довольно мало формул. Тем не менее, как нам кажется, в ней не так уж мало математики.
В 1969 г. вышла небольшая брошюра одного из авторов данной книги (С. В. Фомин, Математика в биологии, изд. 'Знание', 1969
); в ней были кратко изложены некоторые проблемы и результаты, связанные с применением математических методов в биологии. Наша теперешняя книга представляет собой существенно переработанный и расширенный вариант этого первоначального издания. Сохраняя общую направленность и структуру своего прототипа, эта новая книга превосходит его по объему примерно втрое и содержит ряд новых тем.
Конечно, и в таком расширенном виде эту книгу нельзя рассматривать как систематическое изложение важнейших направлений математической биологии. Основная цель авторов - показать на некоторых примерах идеи и тенденции этой формирующейся сейчас науки.
В конце книги приведен список литературы. Его назначение - дать начинающему читателю сведения об основных монографиях и тематических сборниках на русском языке, относящихся к математическим проблемам биологии. Кроме того, там указаны некоторые, довольно немногочисленные статьи, результаты которых непосредственно используются в книге. Этот список никак нельзя рассматривать как библиографию по математическим проблемам биологии вообще.
1972 г. С. В. Фомин, М. Б. Беркинблит.
1. Математика и изучение реального мира
<< | >>
1.1 Биологам понадобилась математика, а математики стали интересоваться биологией. Почему?
<< | >>
Каждая наука начинала свое существование как описательная. Даже такая абстрактная как математика. В древнем Египте или Вавилоне ученые знали довольно много математических фактов, которые мы сейчас назвали бы теоремами. Однако для них это были просто наблюдения. Уже 4000 лет тому назад в египетских школах преподавали математику. Но эта наука не содержала доказательств и не представляла собой логической системы. Отдельные факты излагались как практические рецепты. Материал систематизировался на основе вполне конкретных задач ('вычисление вместимости житниц', 'вычисление площади полей' и т. д.). Ученые древней Индии, высказав то или иное геометрическое утверждение, делали чертеж и говорили: 'Смотри'. И лишь сравнительно поздно в математике возникла идея логической систематизации отдельных фактов.
Физика была чисто описательной наукой не так давно - всего несколько столетий тому назад. Однако постепенно и в ней произошел переход от накопления и описания фактов к исследованию связей между ними. По мере систематизации знаний и возникновения общих концепций увеличивалась и роль математических методов в физике. Этот процесс математизации начался прежде всего в механике. Логически стройная система механики была создана Ньютоном и изложена им в книге 'Математические начала натуральной философии' (1687 г.)
. Эта книга сыграла в развитии механики такую же роль как знаменитые 'Начала' Евклида в геометрии. Ньютон подверг математическому анализу систему мира, рассматривая движение тел земных и тел небесных. Его книга построена по примеру математических исследований: она начинается с определений и постулатов, из которых выводятся теоремы и следствия. Работа Ньютона долго оставалась образцом построения физической дисциплины. Таким образом, математические основы механики были сформулированы еще в XVII веке. Значительно позже общие математические методы проникли в изучение электромагнитных явлений. Лишь около 100 лет тому назад Дж. К. Максвелл разработал математическую теорию электромагнетизма.
Теоретическая физика стала самостоятельной научной дисциплиной менее 100 лет тому назад. М. Планк пишет в своей автобиографии, что еще в восьмидесятых годах прошлого века теоретической физики как таковой не существовало. Когда в 1889 г. он стал профессором теоретической физики в Берлинском университете, эта должность рассматривалась его коллегами как нечто необычное. 'Я был тогда, по-видимому, единственным теоретиком...' - вспоминает Планк. Однако прошло совсем немного времени и Л. Больцман, говоря о развитии физики, мог с полным основанием сказать, что 'теория покорила мир'. Математические методы проникли не только в механику и электродинамику, но и в кинетическую теорию газов, термодинамику, а затем и в атомную физику. Математика позволила предсказать радиоволны, существование новых планет, существование новых элементарных частиц и их основные свойства.
Математика не только влияла на развитие астрономии и физики, но и сама испытывала их влияние. Задачи механики стимулировали создание дифференциального и интегрального исчисления, эти же задачи стимулировали и развитие вариационного исчисления. Задачи о распространении тепла, о колебании струн и мембран, проблемы механики жидкостей и газов способствовали развитию теории дифференциальных уравнений в частных производных, теории тригонометрических рядов и некоторых других областей математики.
Долгое время физика и астрономия были основными источниками математических проблем и основными областями, в которых испытывалась сила новых математических методов. Однако в последнее время положение существенно изменилось. Буквально на наших глазах математические методы быстро входят в экономику, социологию, лингвистику, биологию и т. д. Возникли и вошли в обиход такие термины, как математическая лингвистика, математическая экономика, математическая биология.
Чем же обусловлено такое энергичное вторжение математики в области, еще недавно столь от нее далекие, в частности, в биологию? И почему это происходит именно сейчас, а не, скажем, 100 лет тому назад?
Биология долго была описательной наукой, собранием более или менее систематизированных результатов наблюдений и экспериментов. По мере накопления этого фактического материала стали обнаруживаться глубокие связи между явлениями, которые прежде представлялись обособленными. Так, например, работа генетического аппарата клетки оказалась связанной с процессами синтеза белка, а вместе с тем и с процессами формирования организма. С другой стороны, генетические закономерности наряду с теорией естественного отбора легли в основу современных представлений об эволюции. Таким образом, обмен веществ, наследственность, морфогенез и эволюция оказались тесно связанными, причем биология приблизилась к пониманию механизмов, лежащих в основе этих связей. Иными словами, сейчас достигнуты большие успехи в понимании основных биологических закономерностей. Эти успехи повысили интерес к общим проблемам биологии, усилили стремление выявить общие принципы функционирования биологических систем, понять сущность жизни. Все это и послужило предпосылками к созданию теоретической биологии, а вместе с тем и к проникновению в биологию математических методов, сыгравших такую большую роль в развитии теоретической физики, механики и астрономии.
Кроме этой главной причины возникновения теоретической биологии проникновение математики в биологию связано и с другими обстоятельствами. Одно из них - развитие новых дисциплин, лежащих на стыках разных наук. В биологии появляются новые разделы, граничащие с такими науками, где математика применяется давно и причем весьма успешно. Мы имеем в виду, прежде всего, биофизику, биохимию и молекулярную биологию - дисциплины, связывающие биологию с физикой и химией. Биологические задачи, изучаемые этими дисциплинами, часто удается сформулировать как (пусть весьма специфические) физико-химические задачи.
Другое развивающееся направление современной биологии - изучение процессов управления в живых организмах. Это направление еще не выделилось в специальную дисциплину, но усиленно разрабатывается на разных уровнях: цитологи рассматривают процессы регуляции в отдельных клетках, физиологи изучают структуру и функции нервной системы - основной управляющей системы организма, экологи исследуют регуляцию в биологических сообществах и т. д.
Проблемы регуляции, передачи и переработки информации, обучения, памяти и т. д. привлекают сейчас внимание не только биологов, но и специалистов в области техники. Одна из жизненно важных задач современной техники - создание быстродействующих автоматических средств управления. Теоретические проблемы, связанные с управлением, привлекли внимание многих математиков. Можно думать, что некоторые стороны процессов управления в живых организмах и в технических устройствах сходны, и поэтому математические методы, развитые применительно к технике, удастся использовать и в биологии.
Если биологи надеются найти в теории информации, теории автоматического регулирования и других технических дисциплинах идеи и методы, пригодные для изучения биологических процессов управления, то инженеры, исследуя биологические процессы и системы, в свою очередь, стремятся найти новые принципы, которые можно было бы использовать в технике. Резонно считая, что миллионы лет эволюции должны были привести к отбору оптимальных вариантов, инженеры ищут способы использовать эти 'находки природы' в вычислительной технике, системах управления и т. д. Это направление, получившее название 'бионики
', привлекло к биологии людей с физико-математическим образованием. Кроме того, большое число таких специалистов пришло в биологию в связи с появлением новой аппаратуры, новых методов исследования. В современной биологической лаборатории стали обычными усилители и осциллографы, электронные микроскопы, ультрацентрифуги и т.п. Для обслуживания этих приборов необходимы высококвалифицированные инженеры. В результате в биологии начали работать люди, для которых математика - привычный метод исследования.
Таким образом, в результате развития 'пограничных' наук (биофизики
, биохимии
, бионики
), возникновения сходных направлений в биологии и в технике (проблемы управления), а также развития инженерно-технических методов исследования биологических объектов биологам приходится работать бок о бок с физиками и химиками, инженерами и математиками.
Итак, само развитие биологии в последнее время делает естественным и необходимым все более широкое проникновение в нее математических методов. С другой стороны в развитии современной математики появились новые направления, связанные с исследованием сложных систем и существенно увеличивающие возможности применения математических методов в биологии. Мы скажем об этих направлениях ниже, а сперва посмотрим, в чем, собственно, состоит сущность математического подхода к изучению объектов и явлений окружающего нас мира.
1.2 Сущность математического подхода к изучению реального мира. Модели
<< | >>
Характерная черта математики состоит в том, что она оперирует весьма отвлеченными идеализированными понятиями. Такие понятия, как, например, 'прямая', 'плоскость', 'число', означают не какие-либо реальные предметы, а лишь некоторые мысленные модели существующих в природе вещей. К такого рода моделированию (моделирование в логическом, а не в инженерном смысле) приходится прибегать, по существу, всякий раз, когда речь идет о применении математики к изучению окружающего мира.
На самом деле не только математика, но и другие науки имеют дело с отвлеченными понятиями, 'логическими моделями реальных вещей'. Даже в самых конкретных экспериментальных биологических исследованиях основной интерес представляют сведения, относящиеся не к индивидуальному животному, а к целой группе, скажем, не к данной отдельной кошке, а к кошкам вообще, А что такое 'кошка вообще'? Это уже абстрактное понятие, некоторая модель. Что же касается таких биологических понятий, как 'обмен веществ', 'ген', 'гормон', то они обладают уже очень большой общностью и абстрактностью. Наличие такого рода понятий позволяет строить теоретические модели в биологии, а тем самым и использовать в ней математику.
В любой теоретической дисциплине - будь это физика, биология или экономика - возникают свои системы понятий и свои модели. Чем же отличаются эти модели от моделей математических?
Для всякой науки, достигшей определенной степени развития, характерно использование высказываний достаточно высокой степени общности. Однако в математических моделях общность и универсальность особенно велики.
Это важнейшая черта математических моделей. Они всегда более абстрактны и общи, чем модели, возникающие в конкретных естественных науках. Одно и то же уравнение описывает и распад радиоактивных веществ и размножение бактерий. Одна и та же математическая конструкция позволяет описывать и логические суждения и поведение контактных схем. При создании математической модели мы максимально отвлекаемся от конкретных деталей моделируемого явления.
Из основной особенности математических моделей - их общности - вытекает и вторая их особенность: возможность точного и строгого исследования таких моделей. Наиболее общие модели оказываются и наиболее простыми (чем больше отброшено конкретных деталей, тем меньше сложность модели) и в силу этого допускают строго логическое (математическое) исследование. После того как основные положения сформулированы, т. е. модель задана, ход дальнейшего исследования диктуют логика и математический аппарат. Строгость математических моделей особенно важна при рассмотрении достаточно сложных систем, когда чисто словесные рассуждения становятся очень запутанными и не могут гаранти-ровать правильность выводов.
Критерий истинности познания - практика. Применительно к рассматриваемому нами вопросу это означает, что ценность всякой абстрактной модели определяется тем, насколько она полезна для изучения реального мира. Иными словами, модель хороша лишь в том случае, если ее изучение открывает какие-то новые важные свойства моделируемых объектов, которых мы не знали при построении модели. Хорошая модель, возникнув, начи-нает 'жить собственной жизнью', обогащая нас новыми, подчас неожиданными фактами (например, существование позитрона было предсказано Дираком на основе чисто теоретических, 'модельных' рассмотрений).
Мы привыкли к делению наук на естественные и гуманитарные. При этом в первую очередь к естественным наукам относят математику. Но это не вполне справедливо. Математика скорее занимает некое промежуточное положение, будучи связана с изучением как окружающей природы, так и различных форм человеческой деятельности. Математика - это язык, пригодный для описания самых различных явлений.
Но это язык, подчиненный весьма жестким и строгим логическим правилам. И научиться говорить на математическом языке о том или ином круге вопросов подчас весьма сложно. Мы лучше всего умеем говорить на нем о механических и физических явлениях, но в принципе этот язык универсален. В последнее время мы все чаще говорам на математическом языке и о биологии.
1.3 Что мы умеем моделировать
<< | >>
Любая модель должна прежде всего отражать существенные черты моделируемого объекта, иначе ее изучение мало что даст для познания этого объекта. С другой стороны, модель не должна быть слишком сложна, иначе она будет недоступна для точного математического исследования*). Если речь идет о моделировании сложной системы, то весьма трудно совместить эти требования - достаточную простоту и достаточную 'похожесть'. Поэтому в первую очередь математические методы развивались применительно к изучению простых систем.
*) Говорят, что когда однажды Микеланджело спросили, как создать скульптуру из глыбы камня, он ответил: 'Скульптура уже заключена в камне. Нужно только срезать все лишнее, и она предстанет перед вами'. Эти слова можно применить и к тому, как создается абстрактная модель реального явления. Но как отделить 'лишнее' от 'необходимого'? Это трудно и в искусстве, и в науке. |
Примером области естествознания, в которой математические методы применяются давно и с большим успехом, может служить классическая механика, в частности небесная механика. Развитые здесь математические методы позволяют весьма точно описывать движение системы материальных тел, например предсказывать на много лет вперед солнечные и лунные затмения, вычислять орбиты комет и т. д. Однако и здесь возникает много трудных и сложных математических проблем*), в том числе и таких, которые остаются нерешенными до сих пор, несмотря на то, что рассматривается такая простая система, как система материальных точек.
*) Примером может служить известная задача трех тел, состоящая в определении всех возможных движений трех масс, связанных силами взаимного притяжения. |
Что же касается биологических систем, то для них построение удовлетворительных математических моделей оказывается, как правило, чрезвычайно сложным делом.
Несколько полезных математических моделей для описания биологических явлений удалось создать, сформулировав соответствующие биологические задачи как задачи физики или химии. Примером может служить использование так называемых кабельных уравнений
в задаче о распространении нервного импульса. Эти уравнения были впервые предложены Кельвином для описания процессов в кабеле в связи с прокладкой трансатлантической телефонной линии. Оказалось, что свойства нервного волокна как устройства, передающего импульсы, достаточно просты и близки к свойствам кабеля, т. е. покрытого изоляцией проводника. При описании процесса распространения импульсов можно отвлечься от работы мембранного механизма, обеспечивающего поддержание постоянной концентрации ионов в волокне, от процессов синтеза белка в нервной клетке и т. д. В данном случае оказалось возможным выделить одну из сторон работы нервного волокна. Но так бывает далеко не всегда. Часто выделение какой-то одной стороны в работе сложной биологической системы, позволяющее применить к ней какие-либо разработанные математические методы, является чрезмерным упрощением, а поэтому и не приводит к успеху. Модель оказывается простой, но не похожей на исходный объект.
Важно подчеркнуть, что пригодность той или иной модели зависит не только от свойств объекта, но и от характера решаемой задачи. Знаменитый русский математик П. Л. Чебышев, занимаясь геометрическим исследованием вопроса о том, как семейства линий, переплетающихся между собой подобно нитям ткани, могут укладываться на кривой поверхности, изложил результаты этих исследований в работе под названием 'О кройке платья'. Будучи в Париже, он читал лекцию на эту тему. На лекцию, помимо математиков, пришли многие парижские портные. Однако первая же фраза Чебышева их совершенно обескуражила. Он начал так: 'Для простоты мы будем рассматривать человеческое тело как шар'. Для задачи, которую решал Чебышев, ему было важно только одно свойство человеческого тела - кривизна его поверхности. Однако для портных такая степень упрощения была явно чрезмерной. Вместе с тем деревянный манекен служит для портного достаточно удовлетворительной моделью человеческого тела, поскольку он имеет ту же форму. Когда проводят первые испытания нового парашюта, такую сложную биологическую систему, как человек, с успехом заменяет мешок, наполненный песком. Таким образом, существуют задачи, когда важна только форма человеческого тела (для портных) или его вес (для конструктора парашюта). В этих случаях можно обойтись простыми физическими моделями - манекеном или мешком с песком.
При этом вследствие крайней простоты этих моделей никому не приходит в голову считать их моделями человека вообще. Однако при использовании более сложных моделей такое стремление иногда возникает и может привести к ложным выводам. Так, например, в некоторых работах результаты и методы теории автоматического регулирования с излишней категоричностью и общностью применяются к нервной системе. Конечно, наличие известной аналогии между работой автоматического следящего устройства и нервной системы позволяет искать и для человека, когда он следит взглядом за движущейся точкой, такие стандартные способы описания как переходная функция или фазово-частотная характеристика. Если речь идет о сравнении действий человека и автоматического устройства или о получении количественных характеристик работы оператора, такой подход не вызывает возражений. Однако и для глубокого понимания работы нервной системы и для дальнейшего развития общей теории управления важно совсем не это. Ведь мы заранее знаем, что человеческий глаз и рука могут решить не только задачу слежения, что в управлении движениями руки принимает участие много разных нервных центров, работа которых должна быть согласована и т. д. Рассматривая нервную систему как стандартную систему автоматического регулирования, мы получим модель, описывающую некоторую определенную функцию нервной .системы, но не пригодную для описания других ее свойств. Создание же более гибкой и универсальной модели нервной системы или отдельных ее подсистем оказывается, как правило, чрезвычайно сложным делом.
По своей сложности многие биологические проблемы не имеют аналогов в физике или технике и ближе, например, к задачам экономики. Однако эта сложность, сильно затрудняющая создание модели, в то же время и привлекает: она позволяет надеяться, что размышления над такими моделями будут стимулировать появление в математике новых идей и направлений. Сложность мозга, состоящего из большого числа взаимодействующих центров, сложность взаимосвязей в биологических сообществах, высокая способность организмов к адаптации, к самовоспроизведению - все это заставляет думать, что для описания свойств живого потребуются новые математические конструкции. Своеобразие и сложность возникающих здесь задач - одна из основных причин интереса, проявляемого математиками к биологии.
1.4 Появление новых возможностей в математике
<< | >>
Итак, математические методы исследования можно с успехом применять в тех областях, где удается создать достаточно хорошие модели, создать соответствующий изучаемым явлениям 'математический язык'. Если явления, которые мы изучаем, сложны, то они могут оказаться за пределами возможностей тех математических методов, которыми мы располагаем.
Однако сейчас есть серьезные основания для оптимистического взгляда на роль математики в анализе сложных явлении и систем. За последние 20-25 лет в самой математике произошли существенные изменения, значительно расширившие круг ее возможностей. Часто это расширение области применимости математических методов, возникшее в последние годы, связывают в первую очередь с созданием быстродействующих вычислительных машин. Бесспорно, появление таких машин сыграло очень большую роль, но дело не только в них. На протяжении тех же 20-25 лет, в которые укладывается вся история развития электронной вычислительной техники, в математике возник ряд новых направлений и областей, связанных именно с исследованием сложных систем и анализом таких ситуаций, в которых классические математические методы неприменимы.
К этим областям математики относятся теория игр
, теория автоматов
, новые методы решения задач об оптимальном регулировании, теория операций
и т. д. Если попытаться охарактеризовать эти новые области математики в нескольких словах, то о них можно сказать следующее. Теория игр, например, рассматривает вовсе не только игры в собственном смысле этого слова
, такие как шахматы или различные карточные игры. Эта теория рассматривает как 'игру' и экономическое производство, и военные операции, и решение научных проблем ('игры с природой'). В игре может участвовать много игроков, при этом они могут сговариваться между собой ('игры с коалицией'), или действовать независимо. Теория игр должна дать ответ на вопрос о наиболее целесообразной тактике поведения
, то есть о том, как вести себя в настоящей игре, чтобы побольше выиграть, или о том, какую продукцию и в каком количестве производить предприятию, или о выборе военной тактики и т. д. Ясно, что для ответа на эти вопросы надо как-то оценивать ситуацию количественно, иначе нельзя будет решать, что лучше, а что хуже. Таким образом, теория игр связана с оценкой сложной ситуации и выбором правильного поведения в ней, т. е. с решением задач примерно такой же сложности, как и задача о поведении животного. Теория операций изучает вообще любые целенаправленные процессы, занимаясь поиском наиболее эффективного метода действия. Например,
При решении задач теории операций прихо-дится учитывать большое количество разных факторов, много ограничений, разнообразные связи. Таким образом, и здесь изучаемые системы вполне сопоставимы по сложности с биологическими системами.
теория операций
изучает методы наиболее целесообразной организации обслуживания абонентов телефонной сети, принципы организации диспетчерской службы, борьбы с эпидемиями и т. д.
Возможно, конечно, что людям во все времена было свойственно переоценивать научные достижения именно своей эпохи. Однако даже со скидкой на это можно утверждать, что сейчас математика гораздо больше приспособлена к анализу сложных систем, имеющих много степеней свободы и состоящих из большого числа взаимодействующих между собой частей, чем это было еще сравнительно недавно, скажем, в первой половине нашего века.
Сейчас выяснилась возможность построения достаточно удовлетворительных математических моделей в таких сложных и запутанных ситуациях, которые встречаются, например, в экономике. Поучительным примером возникновения хорошей математической модели в области, в которой этого трудно было ожидать заранее, может служить теория информации
. Хотя она возникла каких-нибудь 25 лет тому назад, сейчас она представляет собой развитую математическую теорию, со многими теоремами и разнообразными методами. Однако основной и решающий шаг в построении этой теории, сделанный ее основоположником К. Шенноном в конце 40-х годов, состоял не в теоремах, а в формулировке таких фундаментальных понятий, как количество информации и пропускная способность канала, то есть в создании такой модели, которая отражает общую математическую сущность самых разнообразных способов передачи сообщений. Заметим, что идеи этой теории наложили сильнейший отпечаток на многие биологические исследования
- изучение работы рецепторов, анализ сенсорных систем (зрение, слух), анализ функций центральной нервной системы и т. д.
1.5 Немного истории
<< | >>
Не следует думать, что важность точных количественных методов для биологии была осознана лишь в наше время. Хотя, как мы уже видели, проникновение этих методов в биологию было связано с большими трудностями, чем, скажем, развитие математического аппарата физики, первые попытки (иногда достаточно успешные) применения математики к биологическим проблемам относятся к достаточно далекому прошлому.
Еще в период накопления основного фактического материала перед биологами возникла задача о математической обработке результатов наблюдений и измерений. Поэтому среди разных математических методов первой 'завоевала права гражданства' в биологических исследованиях математическая статистика. Применением статистических методов в биологии интересовался знаменитый английский статистик К. Пирсон.
Более того, ряд исследований в области математической статистики, например, работы Р. Фишера и его школы, в значительной мере стимулировались именно потребностями биологии.
В связи с развитием физики делались неоднократные попытки применения физических представлений и связаных с ними математических методов в разных разделах биологии. Так, например, еще в 1680г. Джованни Борелли опубликовал в Риме обширный труд 'О движении животных' ('Dе Motu Animalium)
, в котором сделал попытку применить геометрические и механические соображения к исследованию движений человека и животных. По-видимому, это была первая систематическая работа по биомеханике
. Впрочем, первые идеи в этой области принадлежат еще Леонардо да Винчи - одному из самых универсальных гениев в истории человеческой культуры.
Около 200 лет тому назад Л. Эйлер предложил гидродинамическую модель системы кровообращения.
В этой работе он рассматривает всю кровеносную систему как состоящую из резервуара с упругими стенками, периферического сопротивления и насоса - сердца. Эта работа Эйлера была одной из первых, если не самой первой, работой по математическому моделированию биологических процессов.
Высказанные Эйлером в этой работе идеи (как и некоторые другие научные результаты) были сперва основательно забыты, а затем возрождены в более поздних исследованиях других авторов.
Существенное развитие физико-математические методы изучения живых организмов получили в работах Г. Гельмгольца. В исследованиях, посвященных зрению и слуху, он использовал математический аппарат, развитый в значительной мере им самим для изучения волновых процессов.
К тому же 'физико-математическому' направлению в биологии относится книга П. П. Лазарева 'Ионная теория возбуждения'
[22]. В этой книге на основании физико-химических представлений развиваются математические модели зрительного, слухового, обонятельного и вкусового ощущений, а также модели распространения возбуждения и мышечного сокращения.
В 1917 году появился фундаментальный труд Д'Арси Томсона 'О росте и форме'
, посвященный применению математических методов к исследованию геометрических форм и процесса роста животных и растительных организмов. Д'Арси Томсон рассматривает также в своей книге ряд физических соображений, служащих основой для некоторых из его математических заключений.
Немного позднее в 1924 г. появилась книга А. Лотки 'Элементы физической биологии'
, в которой автор, используя в основном аппарат теории дифференциальных и интегральных уравнений, рассматривает чрезвычайно широкий круг проблем - от молекулярных процессов в клетках до психических функций центральной нервной системы. Хотя книга эта называется 'физической биологией', она содержит ряд абстрактных математических моделей, никак не связанных с физикой. В этом отношении работа Лотки открывает новый этап в развитии математической биологии.
Одно из направлений теоретической биологии, впервые намеченное в книге Лотки, было развито итальянским математиком В. Вольтерра и его сотрудниками. В их работах рассматривались проблемы теоретической экологии, например, динамика изменения численности двух видов, один из которых служит пищей для другого. Рассмотрение взаимоотношений между несколькими видами привело Вольтерра к необходимости анализировать системы нелинейных дифференциальных уравнений. Для такого анализа Вольтерра предложил некоторые новые математические методы.
К работам по теоретической экологии примыкают исследования по теории эволюции и генетике популяций. Это направление возникло в первой трети нашего века благодаря работам Дж. Холдейна (1924)
, С. С. Четверикова (1926)
, Р. Фишера (1930)
и С. Райта (1930)
.
Начиная с 30-х годов число работ, содержащих попытки математического подхода к тем или иным проблемам биологии, стало быстро возрастать. Сложились целые коллективы, работающие в этом направлении (например, школа Н. Рашевского в США). Ряд важных идей, по существу предвосхитивших в известной мере исходные положения современной
[44].
биокибернетики
, содержится в исследованиях нашего соотечественника академика И. И. Шмальгаузена, начатых им еще в 30-х годах
В последние десятилетия продолжали развиваться все направления математической биологии: и методы обработки результатов наблюдений и экспериментов (например, методы многомерного анализа), и физико-математическое направление, и направление, связанное с построением математических моделей сложных систем.
Возникла обширная литература, посвященная различным проблемам математической биологии, создано несколько специальных, журналов, в ряде университетов математическая биология уже вошла в учебные студенческие программы. Начала складываться самостоятельная наука - 'математическая и теоретическая биология'.
2. Общие принципы управления, действующие в биосистемах
<< | >>
2.1 Особенности управления биологическими системами
<< | >>
Говоря о тех или иных системах - технических, эко-номических, биологических - нам неизбежно приходится пользоваться понятием сложности
. В простейших случаях, например, когда речь идет о механических системах, сложность можно в первом приближении понимать как число степеней свободы
, то есть число независимых параметров, определяющих состояние системы. Однако в менее элементарных случаях понятие сложности, несомненно важное, труднее поддается формальному определению. Если все же пользоваться понятием числа степеней свободы, то надо отметить, что достаточно эффективные методы исследования существуют в основном либо для систем с малым числом степеней свободы, либо для систем, где число степеней свободы столь велико, что отдельные степени свободы становятся несущественными.
Системы с небольшим числом степеней свободы встречаются во многих технических задачах. Как правило, в подобных задачах речь идет о регулировании не более, чем 2-3 параметров, а иногда и только одного. Например, функция регулятора Уатта в паровой машине состоит в поддержании на определенном уровне колич-ства пара, поступающего в машину, т. е. в управлении всего лишь одной переменной. Для исследования таких систем имеется хорошо развитый математический аппарат; это прежде всего теория дифференциальных уравнений
и базирующиеся на ней теория устойчивости
, теория регулирования
, а также теория оптимизации
, особенно энергично развивающаяся в последнее время. Другой крайний случай - системы с очень большим числом степеней свободы. Этот случай реализуется, например, при изучении поведения газа. Здесь исследователя интересуют некоторые интегральные характеристики - давление газа, его температура и т. д., тогда как движение отдельной молекулы интереса не представляет. Для изучения таких систем используется математический аппарат статистической физики
.
К сожалению, методы описания, которые хороши для исследования технических систем с малым числом степеней свободы, или систем статистической физики, оказываются совершенно неэффективными, когда мы переходим к большим системам, в частности к живым системам.
Эти системы представляют собой не предельный случай, а промежуточный вариант, который, как это часто бывает, особенно трудно поддается изучению. С одной стороны, в биологических системах даже при самом грубом упрощении приходится иметь дело с десятками и сотнями существенных параметров. Так, например, в биохимических реакциях, протекающих в клетках живого организма, участвуют сотни разных веществ (здесь параметры системы - концентрации этих веществ), в экологических сообществах взаимодействуют десятки и сотни видов животных и растений и т. д. С другой стороны, эти параметры качественно неравноценны и потому здесь не удается ввести интегральные параметры типа температуры или термодинамических функций.
Для описания таких систем требуется создание новой математической теории, новых понятий и новых моделей. Это направление исследований часто условно называют 'теорией больших систем
'.
Среди задач теории больших систем особенно важную роль играет выяснение принципов управления, которые действуют в подобных системах. Во-первых, выяснение таких принципов важно для целенаправленного воздействия на биологические системы (лечение болезней, охрана природы и т. д.). Во-вторых, такие принципы могли бы найти применение в управлении экономикой и в ряде новых направлений техники.
Необходимо заметить, что хотя конкретные методы классической теории регулирования мало применимы к биологическим вопросам, в самой своей основе процессы управления в живых системах имеют много общего с техническими процессами регулирования (например, принцип обратной связи
и т. п.). Эта бесспорно важная мысль была отчетливо высказана Н. Винером [10]. Однако нас сейчас интересуют не столько эти общие принципы, сколько то, что отличает управление в живых системах от классических технических методов регулирования.
Ниже мы рассмотрим (в основном на примере построения движений) современные представления о принципах управления, действующих в биологических системах. Обратимся к той живой системе, с которой мы никогда не расстаемся, - к нашему собственному телу. Если, максимально упростив реальную ситуацию, рассматривать человеческое тело просто как механическую систему с соответствующим числом шарниров (суставов), то окажется, что эта система имеет более двухсот степеней свободы. Тем не менее, мы успешно справляемся с зада-чей управления такой системой: ходим, бегаем, выполняем различные другие движения.
Следует обратить внимание на то, что при решении таких задач, как задача управления движениями тела, весьма важен фактор времени. Если нам нужно избежать какой-либо опасности, скажем, отскочить от движущегося на нас автомобиля, то эту задачу (требующую участия десятков мышц, то есть достаточно сложную) нужно не просто решить, но решить быстро. Заметим, что даже в самых обычных движениях участвует много мышц: например, когда мы берем со стола какой-либо предмет, работают не только мышцы руки, но и мышцы бедра, которые корректируют положение центра тяжести. Эту простую задачу-взятие предмета - можно рассматривать как поиск минимума некоторой функции. Действительно, эта задача будет решена, когда расстояние от руки до предмета станет равно нулю. Минимизируемая функция зависит от десятков переменных-меняющихся во времени усилий разных мышц. Человек без всякого напряжения решает такую задачу за секунду. А если эту же задачу предложить вычислительной машине, быстродействие которой гораздо выше, чем у нервных клеток, решение потребует больше времени.
Другое соображение, относящееся к обучению новым движениям и также связанное с учетом необходимого времени, таково: число различных положений (поз), которое может принять наше тело, настолько велико, что 'перепробовать' все возможные позы мы не смогли бы даже за всю жизнь. Поэтому обучаться нужным движениям (например, ходьбе) путем последовательного перебора всех мыслимых движений вообще невозможно.
Следовательно, живые системы решают задачи построения движений и выработки новых их сочетаний какими-то собственными, весьма эффективными способами. Что же мы знаем об этом?
2.2 Синергии
<< | >>
Физиологам хорошо известно наличие у организма так называемых синергий
, то есть четкой согласованности движений частей тела при решении тех или иных моторных задач. Мы не можем, даже если будем стараться, независимо управлять всеми теми степенями свободы, которые имеет наше тело. Например, человеку весьма затруднительно одновременно выполнять двумя руками вращательные движения так, чтобы одна рука совершала эти движения с одним периодом, а другая - с другим. При выполнении тех или иных движений имеющиеся у нашего тела степени свободы распадаются на группы, согласованно управляемые 'блоки'. Тем самым реальное число независимых параметров, подлежащих регулированию, оказывается во много раз меньше, чем число степеней свободы, определяемое подвижностью суставов. Некоторые из этих 'блоков' в нашем организме твердо зафиксированы, например согласованность движений рук, о которой упоминалось выше, - это не результат обучения или привычки, а врожденное свойство. В других случаях, скажем, при таких движениях, как катание на коньках и т. п., синергии вырабатываются в результате соответствующей тренировки.
Рис. 1.
Дыхательная синергия. |
Интересным примером синергии (врожденной, а не выработанной) может служить так называемая дыхательная синергия
[65]. Она состоит в следующем. У спокойно стоящего человека при вдохе и выдохе происходит заметное смещение частей тела. Однако это смещение мало отражается на положении центра тяжести тела в целом. Дело в том, что при вдохе одновременно с отклонением туловища назад таз смещается вперед (при выдохе - картина обратная). Таким образом, смещения различных частей тела при дыхании не независимы, а со-гласованы между собой и компенсируют друг друга. Изменение туловищного угла (характеризующего положение грудной части позвоночника относительно таза), тазобедренного угла (характеризующего положение бедра относительно таза) при дыхании показаны на рис. 1.
При некоторых заболеваниях мозга эта синергия разрушается, и тогда центр тяжести стоящего человека колеблется в соответствии с ритмом дыхания.
Мы уже упоминали, что одни синергии - врожденные, а другие возникают в результате обучения. Можно сказать, что обучение человека тем или иным движениям, например, ходьбе на лыжах, плаванию и т. п., собственно и состоит в отработке у него соответствующих синергий. Беспомощные движения человека, впервые попавшего в воду или только что вставшего на лыжи - это неумение справиться в непривычных условиях с множеством степеней свободы, которыми располагает наше тело.
При сложных движениях происходит последовательное чередование различных синергий. Таким образом, синергии - это те 'готовые блоки', из которых мы строим наши движения.
Группировка параметров системы, имеющей много степеней свободы, в 'блоки' и связанное с этим существенное уменьшение числа независимых параметров является, по-видимому, одним из общих и эффективных методов управления такими системами [59, 62]. А то обстоятельство, что эта группировка меняется в зависимости от выполняемой двигательной задачи, делает очень богатым и разнообразным запас тех действий, которые мы способны выполнять.
Мы разобрали принцип 'блочного управления' на примере построения движений, однако он несомненно имеет гораздо более общее значение. Рассмотрим еще несколько примеров, когда можно говорить о блочном способе управления или синергиях.
Как известно, клетки животных и растений содержат большое число генов. Каждый ген можно рассматривать как определенную инструкцию или команду, совокупность которых определяет работу клетки. Перед делением клетки каждый ген самовоспроизводнтся, т. е. удваивается и во время деления одни экземпляр из пары одинаковых генов попадает в одну дочернюю клетку, а другой - в другую. Таким образом, каждая из дочерних клеток получает полный набор инструкций. Если вспомнить, что в клетке имеется от 104 до 107 генов (по оценкам разных авторов), то станет ясно, какая это трудная задача - точно распределить их по дочерним клеткам. Представьте себе, что перед вами десять тысяч записок и столько же их копий, перемешанных совершенно случайно, и вам надо разложить записки и копии по двум разным папкам. Сложность этой двигательной задачи (а ведь она аналогична расхождению двух наборов генов по разным дочерним клеткам), вероятно, не ниже, чем сложность задач, возникающих, скажем, в спортивных играх.
Как же решается эта задача? В любой клетке гены обычно собраны в относительно крупные блоки - хромосомы, число которых у разных видов животных разное, но всегда относительно небольшое. В процессе деления клетки каждая хромосома удваивается и распределение генов по двум дочерним клеткам происходит 'по-хромосомно'. Таким образом, задача правильного распределения генов по клеткам решается 'блочным' способом.
Может быть для определенности терминологии имеет смысл проводить различие между 'блочным управлением' и 'синергиями', считая, что синергии - это временные блоки, возникающие только для решения данной задачи, тогда как о 'блочном управлении' можно говорить при наличии жестко 'запаянных' блоков. Но даже при такой терминологии упаковку генов в хромосомы следует считать скорее синергией, так как возможна перекомбинация генов.
Ряд примеров клеточных синергии рассмотрен в статье Ю. М. Васильева, И. М. Гельфанда, Ш. А. Губермана и М. Л. Шика [59]. Там же рассмотрены синергии, возникающие при ходьбе и беге и ряд теоретических вопросов, связанных с ролью синергии в управлении.
Специализированные блоки могут слагаться в процессе эволюции (или в результате обучения) не только для выполнения различных действий, но и для восприятия сигналов. Если мать просыпается при плаче своего ребенка, но не реагирует на более громкий нейтральный шум, то можно говорить, что у нее возник специальный блок для решения именно данной задачи. Такие блоки часто называют фильтрами или детекторами, но их впол-не можно назвать и афферентными синергиями. Действительно, подобно тому, как из всего многообразия возможных движений моторная синергия 'вырезает' определенную последовательность согласованных мышечных сокращений, афферентная синергия выделяет из всего многообразия возможных сигналов только определенную последовательность согласованных звуков или картин. Афферентная синергия так же как и моторная возникает временно только для решения данной задачи.
Наряду с афферентными синергиями в природе, по-видимому, широко распространено восприятие существенных для организма сигналов с помощью специализированных блоков 'запаянного' типа. Хорошим примером такого устройства служит сетчатка лягушки, которая реагирует только на определенные зрительные сигналы [74]. Так, например, лягушка хорошо видит движение черного пятна на светлом фоне ('муха', 'жук'), но не воспринимает движение светлого пятна на темном фоне. Если в ящик, где сидит голодная лягушка, поместить белых насекомых на черной бумаге, то лягушка на них совершенно не реагирует; не возникает при этом никаких сигналов и в ее зрительных клетках [67, 68].
Картины внешнего мира могут быть весьма разнообразными и сложными. Однако далеко не все, что происходит во внешнем мире жизненно важно для данного организма. Так лягушке для ее существования достаточно уметь выделять лишь относительно небольшое число зрительных сигналов, в частности движение темного пятна небольшого размера. Конечно, большая часть информации о внешнем мире при этом теряется, но она и не нужна для поддержания жизни лягушки. Конечно, если бы сигнал о добыче имел иную природу, например, представлял собой сложную совокупность светлых и темных точек, а движение темного пятна свидетельствовало о наличии добычи лишь в одном случае из ста, орган зрения и мозг лягушки были бы устроены иначе (или лягушки вымерли бы). Однако на самом деле движение маленького темного пятнышка, как правило, является достаточным признаком добычи. Распознающий блок устроен так, что в той среде, где действует лягушка, он с высокой вероятностью приводит к правильной реакции. По этому принципу устроены и многие другие 'запаянные блоки'. Так, например, у некоторых видов птиц птенцы считают своей матерью первый движущийся предмет, который они увидят, вылупившись из яйца. С большой вероятностью этим предметом действительно оказывается мать птенца. И этого достаточно для выживания вида.
Приведенные соображения позволяют понять один парадокс, связанный с синергиями. Как мы уже говорили, организм должен управлять многими степенями свободы, а это сложно. Число же разных сочетаний и последовательностей включения разных мышц в огромное число раз превышает число исходных степеней свободы (этим и обеспечивается потенциальная возможность большого многообразия движений). Однако, если управляющей системе организма - мозгу трудно справляться с исходным числом степеней свободы, то как же он справляется со всем множеством их сочетаний? Дело в том, что в реальной среде, в которой действует человек или животное, обычно приходится использовать лишь относительно небольшое число типов движений. Масса причудливых поз и вычурных движений обычно вполне бесполезна, подобно тому, как для лягушки была бы бесполезна способность видеть движение белого пятна на темном фоне*).
*) Здесь имеется определенная аналогия с языком: число возможных буквенных комбинаций, даже сравнительно коротких, чрезвычайно велико (в русском алфавите 30 букв, а потому число всех возможных комбинаций по |
Весьма вероятно, что насекомые и низшие позвоночные в основном обходятся врожденными синергиями, в то время как сложность строения нервной системы высших позвоночных позволяет им более широко использовать потенциальные возможности своего моторного и сенсорного аппарата, вырабатывая на протяжении индивидуальной жизни ряд новых синергий.
Природа 'придумала' принцип синергий миллионы лет назад, когда на земле возникли достаточно сложные живые организмы. В некоторой примитивной форме люди уже давно используют этот принцип в своей практической деятельности. Так, например, вещи при перевозке укладывают в чемоданы, а зерно ссыпают в мешки, создавая временные блоки, удобные для решения данной задачи, и т. д. В технике в последнее время также используются блочные методы. Относительно недавно принципы, сходные с принципом синергий, возникли и в математике. Это различные методы декомпозиции многомерных задач, куда относятся так называемый метод Данцига-Вульфа
в задачах линейного программирования, метод Сандерса
для вариационных задач и т.д. По существу в каждом из них основная идея состоит в сведении многомерной задачи к некоторой комбинации задач меньшей размерности.
2.3 Многоуровневая организация систем управления
<< | >>
Итак, один из эффективных способов управления многопараметрическими системами состоит в том, чтобы группировать параметры в крупные блоки и управлять целыми такими блоками. Другой общий принцип управления такими сложными системами - распределение задачи между несколькими уровнями. Это означает следующее. Будем для определенности снова говорить о построении движений. Для того, чтобы выполнить некоторое движение, скажем, взять со стола чашку, нужна согласованная работа нескольких мышц, каждая из которых, в свою очередь, состоит из множества отдельных воло-кон - двигательных единиц, управляемых соответствующими мотонейронами. Ясно, что выполняя такое движение, мы вовсе не обдумываем работу каждой отдельной мышцы и тем более не управляем сознательно каждой двигательной единицей. Высший отдел нервной системы (большие полушария головного мозга) ставит лишь общую задачу - переместить рукой чашку из одного заданного положения в другое. Однако мозг не контролирует действия отдельных двигательных единиц, подобно тому как командующий армией, ставя перед своими войсками некую общую задачу, не предписывает каждому солдату, что именно он должен делать в каждый момент сражения.
Детализация построения того или иного движения происходит на уровнях более низких, чем кора больших полушарий, в частности в различных отделах спинного мозга, Более того, в некоторых случаях (например, когда мы отдергиваем руку, случайно прикоснувшись к горячему предмету) вся команда исходит от этих нижележащих уровней: мы еще, как говорится, 'не успели подумать', а рука уже отдернулась.
Такое многоуровневое построение управления гораздо экономичнее, чем жестко централизованное, при котором какой-то центральный орган точно предписывает действия каждой из составляющих систему частей. Действительно, в последнем случае сам управляющий орган оказался бы настолько сложным, что едва ли смог бы функционировать. Попробуйте-ка представить себе штаб армии, который разрабатывает в деталях поведение каждого солдата во время боя! Еще труднее представить себе живой организм, в котором все процессы, вплоть до внутриклеточных, определяются единым центром.
Вдумываясь в возможности многоуровневых систем управления, мы сталкиваемся с одним принципиальным вопросом. С одной стороны, для реализации движения необходима работа большого числа мышц в определенной последовательности, что требует обширной информации. С другой стороны, высшие отделы нервной системы дают лишь общую команду: 'соверши данное движение'.
Однако чудес на свете не бывает. Информация не возникает из ничего. Как же эта общая команда разворачивается в детализированную систему управляющих сигналов? В действительности недостающая информация заключена в памяти систем низшего уровня, в их организации. Ситуация здесь не отличается от случая, когда учитель говорит в классе: прологарифмируйте это выражение. Эта общая команда может выполняться только теми учениками, которые заранее знают, что такое логарифмирование. Другой пример: при составлении сложной программы для вычислительной машины часто используются так называемые стандартные подпрограммы, хранящиеся в машине и встречающиеся в самых разных задачах (например, стандартная подпрограмма для вычисления синуса). За счет этих стандартных подпрограмм короткие команды программиста разворачиваются в детализированную систему вычислений. Фактически здесь мы опять-таки имеем дело с иерархической системой управления. Может быть, одним из первых устройств, преобразующих весьма простую внешнюю команду в достаточно сложное действие за счет внутренней организации, является обычная шарманка, которая при вращении рукоятки воспроизводит определенную музыкальную мелодию.
Идея многоуровневого управления применительно к построению движений была сформулирована в свое время Н. А. Бернштейном [6] и получила подтверждение в ряде конкретных физиологических исследований. В частности эта идея и соображения о неиндивидуализированном управлении (см. 4) легли в основу интересных экспериментальных работ по управляемой локомоции, выполненных М. Л. Шиком, Г. Н. Орловским и Ф. В. Севериным [89]. Если у кошки перерезать головной мозг в области выше дыхательного центра, изолировав, таким образом, верхние отделы мозга от всей нижележащей нервной системы, то такое животное дышит, но лишено способности к самостоятельным движениям и, будучи помещено на движущуюся ленту (тредбан), лежит на ней совершенно пассивно. Однако, если, приведя тредбан в движение, одновременно стимулировать электрическим раздражением определенную область ствола мозга, то животное начинает идти (или бежать, в зависимости от интенсивности раздражения), причем координация всех его движений достаточно близка к нормальной. Эти эксперименты можно интерпретировать следующим образом. Двигательная система кошки представляет собой сложный механизм со многими степенями свободы. Но в управлении этим механизмом нет жесткой централизации. Координация движений конечностей и отдельных мышц задается на уровне более низком, чем кора головного мозга, а 'сверху' приходит лишь однопараметрическое управление, 'запускающее' данное движение и определяющее его интенсивность. Конечно, значение нисходящих влияний этим полностью не исчерпывается. По-видимому, они играют кроме того существенную роль в коррекции движений. Об этом свидетельствует, например, нарушение точности локомоции после удаления мозжечка при сохранении общего рисунка ходьбы.
Принцип многоуровневого управления, как и принцип синергий, имеет значение отнюдь не только для управления движениями. По существу - это один из весьма общих принципов управления сложными системами. В настоящее время теория многоуровневых систем развивается в рамках так называемой общей теории систем
. Существенным свойством сложных многоуровневых систем, необходимым для их функционирования, является определенный обмен информацией между уровнями. При этом, однако, передача избыточной информации с одного уровня на другой не менее серьезно нарушает работу такой системы, чем недостаточная информационная связь между уровнями.
В последнее время в математической теории оптимизации возник интерес к так называемым многоуровневым вариационным задачам
, в которых сам функционал, экстремум которого надо найти, имеет определенную 'иерархическую' структуру. Интересны многоуровневые конструкции и в теории коллективного поведения автоматов.
2.4 Локальное управление сложными системами
<< | >>
Для таких сложных биологических систем, как, например, целый организм, характерна структура, допускающая выделение в них отдельных, относительно независимых подсистем. Для каждой такой подсистемы совокупность всех остальных подсистем образует своего рода 'внешнюю среду', в которой эта подсистема существует. Функционирование такой составной системы может быть организовано по 'централизованному' прин-ципу - каждой подсистеме приписывается определенное поведение. Мы уже говорили о неэффективности такого управления в сложных системах. Целесообразнее другая схема, которую можно назвать схемой неиндивидуализированного локального управления. Это означает, что для каждой подсистемы 'сверху' устанавливаются лишь некоторые общие 'правила взаимодействия', а в остальном она функционирует в соответствии со своей собственной структурой и этими правилами так, чтобы ее взаимодействие с внешней средой и другими подсистемами было в некотором смысле оптимальным. Эти сооб-ражения были развиты И. М. Гельфандом и М. Л. Цетлиным [27, стр. 9-27], [42], которые сформулировали так называемый принцип наименьшего взаимодействия
, аналогичный известным в механике вариационным принципам. Согласно этому принципу каждая подсистема в живом организме функционирует так, чтобы ее взаимодействие со всей системой и с окружающей средой было возможно меньшим. Тем самым задается некоторое универсальное правило поведения локальных подсистем.
Исходя из принципа наименьшего взаимодействия, можно объяснить такие физиологические явления, как синхронизация работы нервных или двигательных элементов и т. п. Вместе с тем следует подчеркнуть, что пока еще соображения, связанные с принципом наименьшего взаимодействия, носят весьма предварительный характер, поскольку для живых систем мы, как правило, не можем точно указать, как это взаимодействие можно выразить математически.
Проиллюстрируем понятие локального управления более подробно на примере одной задачи, взятой из техники [83]. Представим себе, что у нас имеется n
пар радиостанций, причем внутри каждой пары происходит передача и прием, а станции, относящиеся к разным парам, друг с другом не связываются. Если эти пары станций не очень удалены друг от друга, то они создают друг для друга помехи, в той или иной степени затрудняющие связь. Качество радиосвязи для каждой пары можно охарактеризовать отношением мощности сигнала к мощности шума. Если какая-то пара считает качество связи недостаточно хорошим, то она может увеличить мощность передачи. Однако это усилит помехи, создаваемые данной радиостанцией для других; они, в свою очередь, увеличат мощность передачи, а тем самым увеличат и помехи для той станции, о которой идет речь. Таким образом, эта станция может в результате увеличения мощности передачи не улучшить, а ухудшить свое положение. Можно, конечно, попытаться еще больше увеличить мощность, но то же самое могут сделать и другие станции. В системе возникнет лавинный режим нарастания мощностей, так что она станет напоминать некую веселую кампанию, в которой каждый старается перекричать всех остальных, а в результате все голоса тонут в общем шуме.
Возвращаясь к нашим радиостанциям, поставим следующий вопрос: какие же можно предложить разумные способы регулирования мощностей, выводящие систему в целом на некоторый целесообразный устойчивый режим? Подчеркнем еще раз, что регулировка должна быть локальной, то есть каждой станции известны лишь собственная мощность и собственное отношение сигнал/шум, а центра, в котором собирались бы все сведения и вырабатывались рекомендации для всей системы, не существует. Мы не будем здесь заниматься этой проблемой подробно, но укажем, что рассматриваемая задача допускает точное математическое решение. В принципе оно может быть основано на том, что на каждой станции оператор, произведя некоторое изменение мощности, должен потом в течение определенного времени наблюдать, как это изменение отразилось на качестве его связи. Возникающие здесь вопросы и трудности довольно типичны для общей проблемы локального регу-лирования сложных систем.
Обратим внимание еще на одну особенность систем типа системы пар радиостанций. Для разного рода систем мы вводим понятие оптимального режима
. Например, можно говорить об оптимальном режиме работы мотора самолета с точки зрения затраты топлива на данной дистанции и т. п. Однако в таких системах, как наши радиостанции, нет естественного понятия оптимального режима. Ясно, конечно, что если мы сможем уве-личить отношение сигнал/шум для какой-то пары станций, не уменьшив его для остальных, то тем самым работа системы в целом улучшится. Ну, а если для одних пар это отношение увеличилось, а для других уменьшилось, то всей системе стало лучше или хуже? Без каких-либо дополнительных условий такого рода вопрос просто не имеет смысла. Поэтому применительно к системе n
пар радиостанций естественно говорить не об оптимальности, а о некоторой области допустимых режимов
, где каждая пара находится в условиях, обеспечивающих ее нормальное функционирование. Об оптимальности в целом для, такой системы, состоящей из ряда автономных подсистем, можно (и нужно) говорить тогда, когда имеется следующий, более высокий уровень, и задача, решаемая всей системой в целом. Например, если с помощью определенной системы расценок и иных факторов установилось некоторое распределение функций в некоторой группе работников, то об оптимизации режима работы группы в целом имеет смысл говорить тогда, когда имеется некоторая общая задача, выполняемая всей этой группой.
2.5 Преднастройка
<< | >>
Если какое-либо раздражение (вспышка света, звуковой сигнал и т. п.) повторяется периодически, реакция человека или подопытного животного на такое раздражение постепенно ослабевает [31]. Более того, если эту периодическую стимуляцию внезапно прекратить, то в момент, когда должен был бы появиться очередной сигнал, возникает реакция на его непоявление, которая может быть даже сильнее, чем реакция на сигнал.
Таким образом, организм реагирует скорее не на сам сигнал, а на различие между ожидаемой ситуацией и той, которая на самом деле возникает. Чем больше это расхождение, тем сильнее реакция. Человек вздрагивает от неожиданного резкого звука, но, будучи заранее предупрежден, отнесется к такому же звуку гораздо спокойнее.
Вот еще один пример реакции человека именно на расхождение между ожидаемой ситуацией и действительно наступившей: испытуемому дают в руки два одинаковых по весу шарика разной величины, покрытых снаружи одинаковым материалом. При этом меньший шарик кажется более тяжелым, поскольку человек заранее настроился на то, что он должен быть легче.
Мы уже говорили о том, что живому организму часто приходится решать сложную задачу в жестко ограниченное время. Вместе с тем, скорость многих биологических процессов сравнительно невелика. Для того чтобы, с одной стороны по возможности выиграть время, а с другой - избавиться от излишней перегрузки, живой организм старается, прогнозируя ситуацию на ближайшее будущее, заранее приспособиться к ней, с тем чтобы в нужный момент не решать задачу 'на пустом месте', а лишь скорректировать и уточнить подготовленное решение.
Способность адаптироваться к ожидаемой обстановке, или, как обычно говорят, способность к преднастройке - важное и довольно типичное свойство живых организмов. Оно проявляется при решении разных задач, например двигательных. Рассмотрим следующий эксперимент, выполненный В. С. Гурфинкелсм и др. [27, стр. 277-291 ]. Человеку, стоящему неподвижно, говорят, что по определенному сигналу он должен возможно быстрее поднять правую руку; при этом соответствующими приборами регистрируют активность мышц его конечностей. Время реакции, т. е. промежуток между сигналом и началом движения руки, составляет обычно около 100 мсек. Однако уже через 50-60 мсек после сигнала, т. е. еще до начала движения руки, активируются мышцы ног (которые должны скорректировать смещение центра тяжести, вызванное подниманием руки). Интересно отметить, что время, необходимое человеку для того, чтобы напрячь мышцы ног произвольно, существенно больше, чем время от сигнала 'поднять руку' до появления активности в мышцах ног.
Способность живых организмов прогнозировать ситуацию проявляется не только при решении локальных двигательных задач, но и в поведенческих актах. Значение этой способности в поведении особенно подчеркивалось в работах П. К. Анохина и Н. А. Бернштейна. Большая экспериментальная работа по изучению подготовки человека к прогнозируемой им ситуации была вы-полнена школой Д. П. Узнадзе. Важный частный случай прогнозирования животными будущей ситуации был экс-периментально исследован Л. В. Крушинским, который назвал этот тип поведения экстраполяционным рефлесом. Один из вариантов эксперимента состоял в том, что животное видело пищу, которая двигалась в некотором направлении и скрывалась за ширмой. Животное подбегало к другому концу ширмы, готовясь схватить пищу, как: только она покажется из-за ширмы. Это типичный случай поведенческой преднастройки. В естественных условиях она проявляется, например, в том, что хищник в знакомой местности бежит наперерез жертве, сокращая путь. У людей с теми или иными психическими расстройствами способность к преднастройке нередко бывает ослаблена. Так, например, в упомянутых выше опытах с разными по размерам шариками одинакового веса у людей, больных шизофренией, впечатление большего веса маленького шарика или совсем отсутствует или проявляется гораздо слабее, чем у здорового че-ловека.
В целом способность к прогнозированию ситуации и преднастройке представляет собой один из важных общих принципов управления сложными системами, особенно в условиях, когда время для решения той или иной задачи ограничено. В последнее время этот принцип, характерный для живых организмов, находит все более широкое применение в различных технических устройствах.
2.6 Обучаемость
<< | >>
Никого не удивит такое объявление, как например: 'Нужен опытный инженер-конструктор' или 'Требуется механик высокой квалификации'. Однако, объявление вроде 'Нужна вычислительная машина, имеющая опыт решения дифференциальных уравнений' было бы, вероятно, принято за шутку. Мы привыкли к тому, что способность к обучению - привилегия человека и других живых существ. На самом деле это не так; в принципе обучаться могут и достаточно сложные искусственные системы.
Был разработан целый ряд обучающихся программ или устройств [1, стр. 326-351 ], [15], многие из которых внешне оформлялись как игрушки: это 'черепаха', у которой вырабатывались условные рефлексы, созданная Г. Уолтером; 'мышь', которая находила выход из лабиринта и потом запоминала дорогу, сконструированная К. Шенноном; были созданы программы, с помощью которых вычислительная машина 'училась' играть в 'крестики и нолики', в шашки и т. д., постепенно совершенствуя свою игру по мере накопления опыта. В дальнейшем такие устройства и обучающиеся программы на-шли важное практическое применение: обучение узнаванию образов, например, при расшифровке кардиограмм, или при чтении рукописных текстов. На некоторых из этих вопросов мы остановимся подробнее в следующих главах, а сейчас лишь подчеркнем важность обучаемости как одного из общих принципов организации управления в живых системах, особенно в случаях, когда одна и та же задача (может быть с несущественными изменениями) решается многократно.
Мы рассмотрели некоторые общие принципы управления сложными, многопараметрическими системами - группировка параметров (синсргии), многоуровневая организация, преднастройка и т. д. В реальных системах управления все эти принципы встречаются, как правило, не изолированно, а в некоторых сочетаниях, с преобладанием тех или иных аспектов.
Рис. 2.
Схема регулируемого устройства.
|
Очень интересная модель обучаемой управляющей системы с использованием локального управления и многоуровневой организации была построена Д. Мичи и Р. Чемберсом [28, стр. 166-174]. Они рассматривали задачу, близкую к задаче обучения человека балансировать палкой па пальце. Их модель представляет собой тележку с установленным на ней на шарнирной опоре стержнем, движущуюся по дорожке фиксированной длины (рис. 2). Тележка приводится в движение мотором, снабженным переключателем направления. Мотор всег-да работает на полную мощность, двигая тележку либо вправо, либо влево. Задача состоит в том, чтобы, управляя направлением движения тележки, возможно дольше удерживать стержень от падения. Это управление осуществлялось следующим образом. В каждый момент времени состояние системы описывается вектором с четырьмя координатами представляющими собой положение тележки на дорожке, скорость тележки, угол наклона стержня и скорость изменения этого угла. Совокупиость возможных значений этого вектора представляет собой некоторую область в 4-мерном пространстве.
Разобьем эту область на ячейки так, чтобы каждой ячейке соответствовали значения параметров заключенные в некоторых пределах, скажем, первая ячейка определяется условиями
0 ≤ x < 1 (см),
-1 ≤ < 1 (см/с),
-1 ≤ θ < 1 (град),
-2 ≤ < 2 (град/с).
и т. д. (В конкретной работе Мичи и Чемберса различались три области значений для x
, три для , шесть для θ
, и три для , то есть всего было 3x3x6x3 = 162 клетки.) Каждая из этих клеток была 'поручена' некому автомату, который мог переключать направление движения тележки тогда, когда параметры системы находились в пределах данной клетки. Каждый такой автомат имеет память, в которой хранятся сведения о среднем времени, прошедшем с того момента, когда он послал тележку вправо (или влево) до падения стержня (назовем это 'временем жизни' системы). Существует, кроме того, автомат второго уровня ('начальник'), который:
Автомат первого уровня, получив от 'начальника' сигнал, что система находится в его ячейке, сравнивает имеющиеся в его памяти ожидаемые времена жизни при посылке тележки вправо и влево, выбирает из них большее и соответственным образом направляет движение тележки. Когда система перейдет в состояние, принадлежащее другой ячейке, соответствующий этой ячейке автомат проделывает то же самое и т. д., пока стержень не упадет. Получив от 'начальника' сигнал о падении стержня, каждый автомат фиксирует этот момент и заново пересчитывает, с учетом этого результата, среднее время жизни системы, соответствующее принятому им решению, накапливая тем самым опыт.
Рис. 3.
Обучение коллектива автоматов управлению тележкой. По оси ординат - средняя продолжительность цикла (от начала до совершения ошибки). По оси абсцисс - время обучения системы.
|
Ясно, что в начале работы системы, пока автоматы первого уровня еще не накопили сведений о временах жизни системы, отвечающих 'правому' и 'левому' решениям, соответствующие переключения нужно задавать некоторым случайным образом.
Важно подчеркнуть, что описанный метод управления никак не опирается на физическую природу регулируемой системы: автоматы, включая и 'начальника', ничего 'не знают' о законах механики, которым подчиняется наша система. Вместе с тем, автоматы успешно обучаются выполнению своей задачи: по мере накопления опыта среднее время удерживания стержня растет (рис. 3)
.
Рассмотренная нами система обладает следующими основными свойствами:
Эта модель демонстрирует некоторые важные черты систем с локальным управлением. Во-первых, она показывает, что с помощью такого неиндивидуализированного управления можно не только решать стандартные задачи (например, реализовать врожденные или выученные движения), но и обучаться решению новых задач. Во-вторых, она показывает, что для такого обучения необходимо относительно не примитивное устройство подсистем нижнего уровня. Действительно, в модели Мичи и Чемберса каждый из автоматов нижнего уровня имеет собственные часы, по которым он отмечает время от начала своего действия до падения стержня; кроме того в памяти автомата хранятся два средних времени жизни, которые он сам должен уметь вычислять. Конечно, эти автоматы можно еще разбить на несколько 'этажей', состоящих из более простых автоматов, с тем чтобы на каждом 'этаже' выполнялась лишь какая-то часть указанных выше функций, но просто исключить эти функции (отсчет времени, вычисление средних значений) было бы невозможно.
3. Применение ЭВМ в биологических исследованиях
<< | >>
3.1 Чем может помочь биологу вычислительная машина
<< | >>
Характерная черта современных биологических, в частности, физиологических исследований - это обилие экспериментальных данных. Нередко исследователь буквально тонет в этих данных, тратя дни и недели на обработку результатов сравнительно короткого опыта. Поэтому естественно, что экспериментатор обращает взор к быстродействующим вычислительным машинам, надеясь получить помощь отсюда.
Для этих надежд есть достаточно оснований. Однако для того, чтобы они оправдались, важно четко представлять себе, что вычислительная машина 'умеет' и чего она 'не умеет'. Неправильное представление о возможной роли вычислительной техники в тех или иных исследованиях приводят иной раз вот к каким ситуациям. Приходит биолог к математику (желательно такому, который располагает вычислительной машиной) и говорит, что у него накопилась масса экспериментального мате-риала, который надо было бы 'математически обработать'.
- Хорошо, а как именно вы хотите его обрабатывать?
- Ну, это уж ваше дело, на то вы и математики.
- А в чем состоит задача? На какой вопрос вы хотите получить ответ?
И вот в ходе дальнейшего разговора нередко выясняется, что четко поставленной задачи собственно и нет, а есть лишь надежда, что при той или иной обработке экспериментальных данных 'выплывут' какие-то связи и закономерности. В таких случаях приходится объяснять следующее. Да, вычислительные машины могут многое. Они неизмеримо увеличивают наши вычислитель-ные возможности. Они могут хранить и оперативно использовать большие запасы информации. Но вычислительные машины не смогут дать нам никаких заслуживающих внимания результатов, если у нас нет четко поставленной задачи. К вычислительной математике со всей ее современной техникой полностью применимы слова, сказанные Гексли по поводу математики вообще (их часто приводил акад. А. Н. Крылов). Математика, говорил он, подобна мельнице: если в нее насыпать зерно, то получится мука, а если насыпать труху, то только труха и получится.
Для того, чтобы пояснить реальные возможности ис-пользования вычислительных машин в биологических ис-следованиях, скажем несколько слов о самих этих машинах, не входя, конечно, в детали их устройства и эксплуатации.
3.2 Несколько слов о вычислительной технике
<< | >>
В вычислительной технике сложилось деление машин на специализированные
и универсальные
. Специализированными называются машины, предназначенные для выполнения какой-то определенной совокупности операций - например, анализа частот, составляющих некоторый колебательный процесс, решения уравнений или систем уравнений определенного вида и т. д. Такие специализированные машины, как правило, не слишком сложны и громоздки, не требуют для своего обслуживания высококвалифицированного инженерного персонала, а потому и достаточно доступны. Но с другой стороны, в этих машинах уже зафиксирован соответствующий способ обработки информации и переход на какие-то новые методы или задачи требует и новых машин.
Гораздо более широкими возможностями обладают универсальные цифровые вычислительные машины (ЦВМ)
. В принципе на такой машине реализуется любой процесс, который может быть представлен как последовательность элементарных логических или математических операций. Мы не будем здесь описывать принципы устройства ЦВМ, а обратим внимание лишь на следующее.
Универсальные вычислительные машины применяются сейчас в самых разных областях - для решения собственно математических задач, в вопросах управления производством, при анализе текстов (например, при расшифровке древних письмен) и т. д. Однако для этих разнородных задач используются одни и те же машины, а разнообразие задач, которые машина может решать, - это на самом деле разнообразие тех программ, которые такой машине могут быть заданы. В частности, с помощью соответствующих программ па ЦВМ можно реализовать самые различные методы обработки данных биологического эксперимента - как уже существующие, так и те, которые еще будут придуманы.
Современные электронные вычислительные машины работают со скоростью до нескольких миллионов операций в секунду. Поэтому они в состоянии обрабатывать огромное количество самой разнообразной информации, в том числе и биологической. Однако на пути между биологическим экспериментом и цифровой вычислительной машиной стоит одно существенное препятствие, которое можно назвать 'отсутствием общего языка'. Вот что это значит. Цифровая вычислительная машина способна воспринимать и перерабатывать информацию, записанную в цифровом виде, в определенной системе. (Для подавляющего большинства машин такой системой служит так называемая двоичная система
, в которой каждое число представляется некоторой последовательностью нулей и единиц). В то же время те данные, которые получаются непосредственно из физиологического эксперимента, как правило, вовсе не выражены в числах. Например, введя микроэлектрод в нервную клетку, мы можем регистрировать изменения электрического потенциала клетки. Однако эту величину - потенциал клетки - нельзя непосредственно ввести в вычислительную машину: предварительно ее значения в различные моменты времени должны быть выражены в цифрах, так как только цифры представляют собой тот язык, который 'понимает' ЦВМ. Если этот процесс перевода физиологических данных в цифры проделывать вручную, то мы сразу же потеряем все преимущества, связанные с применением быстродействующих вычислительных машин, так как такой перевод будет занимать массу времени. Следовательно, его нужно автоматизировать. Существуют специальные устройства, так называемые аналого-цифровые преобразователи
, осуществляющие такое преобразование автоматически. Такие устройства позволяют быстро и с достаточной точностью переводить непрерывно меняющиеся величины (скажем, изменения потенциала клетки) в последовательность цифр, которые может воспринимать машина.
Необходимо подчеркнуть, что и результаты своих расчетов вычислительная машина обычно выдает в цифровом виде - в виде колонки цифр, напечатанной на бумажной ленте. Такая форма в ряде случаев далеко не оптимальна для человеческого восприятия. Поэтому в последние годы проблеме передачи сведений от человека к машине и от машины человеку - проблеме входных и выходных устройств - уделялось очень много внимания. Теперь для многих машин созданы выходные устройства, позволяющие выдавать результаты расчетов в графической форме - в виде чертежей или графиков, напеча-танных на бумаге, или в виде графиков на экране осциллографа. Например, при моделировании на машине с соответствующим выходным устройством процесса распространения нервного импульса по волокну можно видеть этот процесс на экране, следить за изменением формы и скорости импульса.
В последнее время появились новые устройства для общения человека с машиной, так называемые дисплеи
. Дисплей представляет собой телевизионный экран, на котором машина рисует графики и чертит схемы. Это устройство удобно еще и тем, что его можно использовать 'в обратном направлении': записывая данные или рисуя схемы на том же экране с помощью так называемого светового карандаша
, человек может давать таким путем задания машине. Дисплеи делают общение человека с машиной более непосредственным, позволяя ему следить за процессом вычислений и, если необходимо, вмешиваться в него 'по ходу дела'.
Такой способ работы был использован, например, для определения геометрической конфигурации сложных молекул. После нахождения на основании тех или иных экспериментальных данных, скажем, результатов рентгеноструктурного анализа, приближенной конфигурации молекулы, эта конфигурация выводилась на экран. Затем человек, исходя из определенных химических представлений, вносил свои коррективы, растягивая отдельные участки молекулы, изгибая их и т. д. Потом делался расчет, сопоставлявший параметры вновь получавшейся молекулы, с исходными экспериментальными данными. На основании данных, сообщенных машиной, человек снова изменял форму молекулы, направляя тем самым процесс вычисления, и т.д.
Таким образом, наряду с уже привычными способами ввода информации в цифровом виде с помощью перфокарт или перфолент, в последние годы возникла возможность общения человека с машиной с помощью графических средств. В настоящее время целый ряд лабораторий работает над проблемой общения человека с машиной с помощью речи; в этом состоит один из прикладных аспектов задачи о распознавании речи машиной.
3.3 Примеры использования машин для обработки больших массивов информации:
<< | >>
Вычислительные машины могут обрабатывать за приемлемое время огромное количество информации. Поэтому они широко используются в задачах, требующих большого объема вычислений. Рассмотрим несколько примеров таких задач.
Определение первичной структуры белка
[<< | >>]
. К задачам, связанным с перебором очень большого числа вариантов, относится, в частности, определение первичной структуры белка.
Как известно, каждая белковая молекула представляет собой последовательность аминокислот, соединенных друг с другом в цепь. Число различных типов аминокислот, обычно встречающихся в белках, равно 20. Белковые молекулы могут содержать сотни и даже тысячи аминокислот. Точная последовательность аминокислот известна сейчас лишь для немногих белков - инсулина, гемоглобина и некоторых других. Для анализа этих белков был использован следующий метод. С по-мощью соответствующих химических воздействий белковую молекулу разрывали на отдельные фрагменты.
Затем устанавливали (химическими методами) последо-вательность аминокислот в этих фрагментах и, наконец, путем комбинаторного анализа, реализуемого на вычислительной машине, восстанавливали всю последовательность аминокислот в молекуле. Идею этого последнего этапа работы можно пояснить на таком элементарном примере. Допустим, что у нас имеется цепочка, состоящая из семи аминокислот, которые мы обозначим буквами А, Б, В, Г, Д, Е и Ж, и имеется два набора фрагментов - один полный (то есть составляющий в сумме всю нашу молекулу): АБ, ВГД, Е, Ж, и другой неполный: БВГ, ДЕ. Комбинируя эти два набора, легко заметить, что наша молекула должна представлять собой одну из следующих двух последовательностей: АБВГДЕЖ или ЖАБВГДЕ. Иначе говоря, отрезок АБВГДЕ определяется однозначно, а положение элемента Ж требует дальнейшего уточнения (скажем путем получения фрагмента вида ЕЖ).
В рассмотренном примере анализ возможных комбинаций не представил никакого труда. Однако, если речь идет о цепочках, содержащих сотни элементов, задача установления их структуры по фрагментам становится весьма сложной и требует применения мощной вычислительной техники. Часто эта задача еще более усложняется тем, что удается установить лишь состав отдельных фрагментов, но не точную последовательность элементов в них, или же эта последовательность устанавливается с некоторыми ошибками. Конечно, трудность определения структуры белка вовсе не сводится к сложности соответствующего комбинаторного анализа. Главная и весьма существенная трудность - это само получение и биохимический анализ белковых фрагментов.
Анализ биоэлектрических потенциалов головного мозга
[<< | >>]
. Другим примером интересной биологической задачи, требующей обработки очень большого количества информации, может служить задача, изучавшаяся в лаборатории проф. М. И. Ливанова [7, стр. 112-121]. С помощью специальной многоканальной системы одновременно регистрируются биопотенциалы с большого числа (до 100) участков коры головного мозга кролика и исследуется степень зависимости между данными и изменение этой зависимости в процессе выработки условного рефлекса. Для этого по каждому из каналов через определенные (достаточно малые) промежутки времени измеряется величина потенциала. Значения потенциала для двух последовательных моментов времени, сравниваются между собой, и пишется знак +, - или 0, в зависимости от того, произошло ли возрастание потенциала, его убывание или же потенциал остался неизменным (в пределах принятой точности измерения). Таким образом, процесс изменения биопотенциала в каждой точке представляется в упрощенной форме как последовательность плюсов, минусов и нулей. В такой форме данные эксперимента можно ввести в вычислительную машину, которая подсчитывает коэффициент синхронизации (т. е. процент совпадений) между любыми двумя последовательностями. Такая обработка позволила получить интересные данные об изменении характера электрической активности мозга в процессе формирования условного рефлекса. Оказалось, что до начала выработки условного рефлекса синхронизация различных участков мозга незначительна, причем синхронизированы в основном соседние участки мозга; в процессе выработки рефлекса синхронизация резко возрастает, происходит как бы поиск нужных связей. Наконец, после полной отработки рефлекса синхронизация существенно падает и сохраняется лишь между немногими (не обязательно близкими друг к другу) участками.
Несколько иное исследование было проведено для биопотенциалов головного мозга человека. С помощью сходной методики, то есть записи биопотенциалов с отдельных участков коры, было обнаружено, что если человеку предложить решить в уме какую-нибудь задачу (например, перемножить два двузначных числа), то в процессе ее решения резко возрастает синхронизация активности определенных участков коры больших полушарий.
Хотя в описанных выше экспериментах получаемые данные сильно упрощались и значительная часть информации просто отбрасывалась (в каждой точке учитывалось лишь направление изменения потенциала, по не величина этого изменения), обработка даже таких упрощенных данных вручную представляла бы большие трудности. Эта работа была проделана па вычислительной машине. Однако в первых экспериментах подготовка исходных данных для такой обработки (сопоставление каждой точке, с которой снимался потенциал, последовательности плюсов, минусов и нулей) производилась вручную и это сильно снижало выигрыш, который давала автоматизация самой обработки. В дальнейшем эти работы были автоматизированы полностью.
Построение гистограмм межимпульсных интервалов нервных клеток
[<< | >>]
.
Многие нервные клетки обладают спонтанной активностью
, то есть способностью функционировать в отсутствие каких-либо специальных раздражителей. Активность этих клеток представляет собой последовательность отдельных, очень коротких импульсов - спайков
. Расстояния между соседними спайками (межспайковые интервалы) не постоянны, а в значительной мере случайны. Распределение длин этих интервалов можно охарактеризовать с помощью так называемой гистограммы
, то есть кривой, построенной так, что площадь, заключенная между осью абсцисс, прямыми t = t1
и t = t2
и самой кривой, соответствует относительной доле интервалов, длина которых заключена между t1
и t2
. Для того, чтобы получить достаточно точный ход гистограммы, надо записать, как правило, несколько тысяч, а то и десятков тысяч нервных импульсов. Построение гистограмм вручную - долгое и утомительное занятие.
В последние годы для построения гистограмм широко используется вычислительная техника. Для этого импульсы с микроэлектрода, введенного в нейрон, подаются на соответствующее аналого-цифровое устройство, переводящее промежутки между соседними импульсами в цифровой код (в двоичной системе счисления). Далее эти данные поступают в вычислительную машину, которая по соответствующей программе строит гистограмму.
Нервные клетки, входящие в состав того или иного отдела центральной нервной системы, могут сильно отли-чаться друг от друга по размерам, связям с другими клетками, числу и форме отростков и т. д. Примером структуры, состоящей из существенно различных клеток, может служить кора мозжечка. В частности, в ней имеются так называемые клетки Пуркинье
- сравнительно крупные клетки со сложной системой отростков (дендритов), очень мелкие зернистые клетки и т. д. Выполненные недавно работы по изучению спонтанной активности клеток мозжечка показали, что гистограмма служит хорошим 'паспортом' для клеток некоторых типов. Так, клетки Пуркинье и зернистые клетки можно легко отличить друг от друга и от других типов нейронов коры мозжечка по их гистограммам (рис. 4)
.
Выделение слабого сигнала из шума
[<< | >>]
. Иногда ответ нервной клетки на тот или иной внешний стимул бывает очень отчетлив. Напротив, в других случаях этот ответ почти незаметен на фоне собственной (спонтанной) активности клетки. Например, может оказаться, что под действием внешнего раздражения у клетки лишь слегка меняется частота импульсации, или гистограмма меж-импульсных интервалов. В подобных случаях для выявления ответа клетки на раздражение приходится прибегать к довольно сложной обработке данных, как правило, с применением вычислительной техники.
Допустим, что ответ клетки на раздражение действительно состоит в небольшом (несколько процентов) увеличении частоты ее импульсации, причем оно длится всего несколько десятых секунды после раздражения. Чтобы достоверно отличить такой ответ от случайных колебаний спонтанной импульсации, нужно повторить раздражение достаточно много раз, скажем несколько десятков раз, взять после каждого раздражения интервал, соот-ветствующий длительности предполагаемого ответа (выделение таких интервалов может сделать вычислительная машина автоматически), и по совокупности всех этих постстимульных интервалов определить частоту импульсации (или построить гистограмму). При достаточно большом объеме накопленного таким способом материала, даже слабая реакция клетки станет отчетливо видна.
Случайные колебания частоты клеточных импульсов играют в описанной ситуации роль своего рода шума, мешающего установить наличие ответа на раздражение. Метод накопления слабых сигналов для выявления их на фоне шума применяется в самых различных задачах.
Вот один пример того, как выделение сигнала из шума позволило решить важный физиологический вопрос. Как известно, существует несколько разных типов рецепторов, сообщающих нервной системе о работе той или иной мышцы. Один из наиболее важных видов таких рецепторов - это так называемые мышечные веретена
. Они расположены в самой мышце, а отходящие от них нервные волокна идут в спинной мозг и ветвятся в нем. Для понимания физиологии движений существенно знать, на скольких мотонейронах (нервных клетках, заставляющих мышцу сокращаться) оканчивается одно волокно, идущее из мышечного веретена. Этот вопрос был решен американским биологом Хеннеманом следующим способом. С помощью маленьких электродов регистрировалась активность мышечного веретена (оно довольно регулярно посылает в спинной мозг спонтанные импульсы, причем частота импульсации зависит от степени рас-тяжения мышцы) и одновременно с помощью микроэлектрода регистрировался потенциал одного из мотонейронов данной мышцы. Предположим, что на этом мотонейроне оканчивается одно из разветвлений волокна, идущего от мышечного веретена; тогда приход импульса от веретена несколько меняет потенциал мотонейрона. Но этот потенциал меняется и по другим причинам, на-пример, в ответ на импульсы, приходящие по другим волокнам. Просуммируем достаточно большое число ответов данного мотонейрона на импульсы веретена. Изменения потенциала, вызванные приходом импульса от веретена, наступают всегда через одно и то же время после регистрации этого импульса и поэтому складываются. Напротив, все другие колебания потенциала возникают в случайные моменты времени относительно срабатывания веретена, имеют разное направление и отчасти компенсируют друг друга. Поэтому при многократном суммировании регулярный ответ становится все более и более заметным на фоне случайных колебаний (шумов). Таким образом можно получить достаточно точный ответ на вопрос, кончается ли данное веретено на данном мотонейроне или нет. Затем та же процедура проводится для другого мотонейрона и т. д. Поскольку с каждой мышцей связано несколько десятков и даже сотен мотонейронов, а число мышечных веретен тоже достаточно велико, вся эта работа посильна лишь для вычислительной машины. Интересно, кстати, что, как показал проведенный описанным способом анализ, на самом деле каждое мышечное веретено связано практически со всеми мотонейронами данной мышцы.
Хранение и использование медицинской информации
[<< | >>]
. Опытного работника всегда высоко ценят, но, пожалуй, для врача накопленный за много лет практики опыт важнее, чем для представителей многих других профессий. Аналогичные случаи из практики, сопоставление старых историй болезни, результатов применения тех или иных методов в разных обстоятельствах - все это помогает врачу найти правильное решение в трудной си-туации. В этом важном деле - использовании накопленной медицинской информации - большую помощь могут оказать вычислительные машины. Современная вычислительная машина способна хранить в своей памяти детальные сведения о многих тысячах больных и быстро выдавать ту или иную информацию (например, о результатах применения данного метода лечения при данном заболевании). Таким образом, вычислительная машина может выполнять для врача функции весьма оперативной информационной системы - своего рода автоматизированного справочника. Подобные информационные системы в настоящее время применяются в самых разнообразных областях - медицине, библиотечном деле, торговле, промышленности и т. д.
Когда речь идет о применении вычислительных машин для хранения и быстрой выдачи медицинской информации, машине отводится хотя и важная, но вспомогательная роль. Можно попытаться пойти дальше и поручить машине саму постановку диагноза и рекомендацию хода лечения. Сейчас это направление - машинные методы медицинской диагностики - быстро разви-вается. Разрабатываются программы, по которым машина, учитывая совокупность различных факторов (данные обследования, субъективные жалобы и т. д.), ставит диагноз. Существенная (хотя и далеко не единственная) трудность здесь состоит в том, что многие диагностические признаки, такие, как, скажем, жалобы больного, характер сыпи и т. п., очень трудно выразить в цифровой форме (единственно доступной машине). Между тем, врач при постановке диагноза в значительной мере опирается именно на такие качественные признаки.
Постановка диагноза - один из частных случаев задачи узнавания, состоящей в том, что по совокупности признаков некоторый объект надо отнести к тому или иному из нескольких классов. К проблеме узнавания мы еще вернемся (см. 6 этой главы и гл. V).
3.4 Обработка данных в ходе эксперимента:
<< | >>
Выполнив ту или иную экспериментальную работу, физиолог, конечно, не хочет месяцами ждать результатов обработки данных этого опыта. Ему хочется получить эти результаты поскорее, скажем, на следующий день. Однако и это не предел мечтаний. Лучше всего иметь результаты опыта в обработанном виде сразу же, пока опыт еще не закончился. Тогда в зависимости от уже полученных результатов можно как-то изменить ход опыта или метод обработки, продолжить накопление данных, если они недостаточно убедительны и т. д. Если же обработка данных начинается лишь после окончания опыта, то сам опыт ведется в известной мере 'вслепую'. Поэтому каждый экспериментатор хочет видеть результаты сразу же, как говорят, в реальном времени, т. е. так, чтобы информация не накапливалась, а обрабатывалась без задержки, по мере ее появления. В настоящее время такие методы обработки данных физиологического эксперимента не только существуют, но даже получили довольно широкое распространение *).
*) Обработка данных непосредственно в ходе самого эксперимента с минимальной задержкой важна, конечно, не только в физиологических исследованиях, но и во многих других областях - при исследовании химических реакций, технологических процессов и т. д., однако рассмотрение всех этих интересных и важных проблем выходит за рамки нашей темы. |
При таком использовании вычислительной техники установка, на которой производится тот или иной физиологический эксперимент (скажем, регистрируется изменение электрической активности отдельной нервной клетки), соединяется через такие необходимые вспомогательные приспособления, как усилители, аналого-цифровой преобразователь и т. п. с ЦВМ. Сигналы от изучаемого объекта, соответствующим образом усиленные и преобразованные в цифровой код, поступают прямо в вычис-лительную машину и тут же ею обрабатываются. Для того, чтобы экспериментатор мог видеть результаты такой обработки быстрее и отчетливее, их лучше не печатать в цифровом виде на бумажной лепте, как это обычно делается в вычислительных машинах, а представлять в какой-то более наглядной форме, например, в виде графиков или таблиц на светящемся экране. При тех скоростях, с которыми работают современные вычислительные машины, и при условии, что программа обработки данных не слишком сложна, экспериментатор видит результаты своего эксперимента практически без всякой задержки. Такой метод применения вычислительной техники называется использованием машины в реальном времени
или в линии эксперимента
.
Рассмотрим теперь несколько примеров работ, в которых использование вычислительной машины в реальном времени во много раз ускоряет и облегчает работу экспериментатора.
Изучение активности нервных клеток
[<< | >>]
. Выше мы уже говорили о построении гистограмм нервных клеток и обнаружении на фоне шума их слабых ответов. В ряде случаев важно получить эти данные непосредственно в ходе эксперимента. В таких случаях гистограмма, которая, естественно, по мере накопления материала, все время меняется, выводится из памяти машины на светящийся экран, так что экспериментатор все время видит ее в динамике. Если экспериментатор хочет зафиксировать полученную гистограмму, ему достаточно сфотографировать ее.
Часто экспериментатора интересует, при каких параметрах раздражения реакция той или иной клетки окажется наибольшей. Например, изучается реакция одиночного нейрона слуховой системы кошки при подаче звуковых сигналов различной силы, высоты и продолжительности. Подача такого сигнала может существенно менять исходную гистограмму межспайковых интервалов клетки (рис. 5)
.
При этом для каждого нейрона можно подобрать параметры звукового раздражения так, чтобы изменение гистограммы было наибольшим. Ясно, что если мы будем строить гистограммы только после опыта, то может оказаться, что мы вообще не нашли оптимального значения параметров раздражения. Возможность наблюдать характер изменения гистограммы в ходе эксперимента позволяет целенаправленно менять параметры раздражения. Более того, изменение этих параметров может выполнять сама машина, становясь таким образом участником эксперимента. Ниже мы еще вернемся к этому вопросу, а сейчас рассмотрим другой пример обработки данных в ходе эксперимента.
Изучение нормального и патологического тремора
[<< | >>]
.
Если человек вытягивает перед собой руку, то она никогда не бывает абсолютно неподвижна, а совершает непроизвольные мелкие колебания. Это относится и ко всем другим элементам нашего двигательного аппарата - ни в одном суставе мы не можем сохранить абсолютную неподвижность, в нем обязательно будут происходить колебания вокруг некоторого среднего положения. Это явление называется тремором
. У здорового человека тремор невелик - угловые смещения составляют минуты или доли минут. Однако при некоторых заболеваниях тремор резко возрастает. Одно из наиболее типичных заболеваний такого рода - так называемая болезнь Паркинсона
, при которой тремор в тяжелых случаях возрастает настолько, что человек теряет работоспособность и не может передвигаться без посторонней помощи. Более внимательное рассмотрение показывает, что при болезни Паркинсона не только увеличивается амплитуда тремора,но и меняется его частотный состав (спектр): если нормальныи тремор представляет собой в основном смесь колебаний низкой (около 1 гц), средней (3-4 гц) и высокой (7-8 гц) частоты, то в треморе паркинсоника основная составляющая - колебания с частотой около 5 гц, а другие частоты почти полностью отсутствуют. При болезни Паркинсона в тяжелых случаях применяется хирургическое лечение. Операция - так называемая таламэктомия
- состоит в разрушении определенного участка головного мозга. Эта достаточно тяжелая опе-рация в некоторых случаях приносит стойкое улучшение, однако в других случаях положительные эффект (т. е. снижение амплитуды тремора до нормы), наступающий сразу после операции, через 2-3 недели исчезает, и возникает примерно такой же тремор, какой был до операции.
Проведенный частотный анализ обнаружил следующее: стойкий эффект получался в тех случаях, когда после операции тремор становился нормальным не только по амплитуде, но и по частотному составу. Если же амплитуда тремора падала до нормы, но его спектральный состав оставался характерным для паркинсоника, то эффект операции сравнительно быстро исчезал.
Контроль частотного состава тремора можно вести прямо во время операции, следя, таким образом, за ее эффективностью и внося в нее соответствующие коррективы (скажем, увеличивая участок, подвергаемый разрушению). Представляется весьма интересной следующая гипотеза: не удастся ли при достаточно тщательном исследовании тремора больного паркинсоника до операции заранее предсказать эффективность оперативного вмешательства? К сожалению, пока еще нет убедительных данных, которые позволили бы ответить на этот вопрос положительно.
Исследование тремора здорового человека также представляет определенный интерес [27, стр. 277-291]. Так, например, оказалось, что если человеку дать определенную задачу, скажем, удерживать острие карандаша против определенной точки, то тремор имеет несколько иной характер, чем тремор просто протянутой руки, - в первом случае высокочастотная компонента заметно больше, чем во втором. Это дает основание считать, что изучение тремора может дать ряд сведений о работе двигательного аппарата при выполнении различных задач, требующих точной координации, например при стрельбе.
Для работы по изучению тремора были использованы датчики, превращающие механические отклонения от некоторого среднего положения в электрические, и аналого-цифровой преобразователь, переводящий изменения электрического потенциала в цифровой код. Проведение последующих расчетов (корреляционный и спектральный анализы) сравнительно несложно. Вместе с тем такая обработка данных позволяет оценить возникающую картину значительно точнее, чем это может сделать самый опытный экспериментатор, рассматривая запись тремора на бумажной ленте. Важно, что при этом мы не только устанавливаем качественные различия в треморе, но и вычисляем его количественные характеристики.
3.5 Вычислительная машина-участник эксперимента
<< | >>
Говоря об использовании вычислительных машин для обработки экспериментального материала, мы уже заметили, что сама логика некоторых экспериментов (например, подбор оптимальных параметров раздражающего стимула) подсказывает и другие формы использования вычислительных машин.
Действительно, располагая в физиологической лаборатории современной вычислительной техникой, естественно попытаться сделать еще один шаг и возложить на ЦВМ не только обработку результатов эксперимента, но и некоторые функции самого экспериментатора: машина может в зависимости от уже полученных результатов направлять дальнейший ход эксперимента тем или иным путем, скажем, включать или выклю-чать некоторый стимулятор, менять параметры стимула и т. д.
Важно подчеркнуть, что машина способна принимать решения или давать команду несравненно быстрее, чем это может делать человек, и, следовательно, реагировать на тот или иной результат гораздо оперативнее, чем сам экспериментатор. Для некоторых экспериментов быстрота реакции имеет принципиальное значение, так что без вычислительной машины эти эксперименты вообще неосуществимы.
Идея активного участия вычислительной машины, как управляющего органа, в биологическом эксперименте уже была с успехом реализована в ряде лабораторий.
Такой управляемый эксперимент был поставлен, например, в лаборатории М. Н. Ливанова [75]. В этом эксперименте изучалось функциональное значение корреляции между биопотенциалами двигательных точек задней конечности*) и разных участков зрительной зоны коры больших полушарий животного. При этом непрерывно регистрировались изменения биопотенциалов выбранных участков и в тот момент, когда коэффициент корреляции между их изменениями достигал определенного значения, соответствующее автоматическое устройство, связанное с вычислительной машиной, включало световое раздражение.
*) То есть центров в головном мозге, управляющих движениями этой конечности. |
Участие машины в этом эксперименте принципиально необходимо: за то время, пока человек вручную вычислит коэффициент корреляции, биопотенциалы и в моторной и в зрительной коре успевают много раз сильно измениться, так что вычисленный коэффициент корреляции перестает соответствовать действительности. Конечно, можно поставить опыт иначе: в случайные моменты времени давать световые вспышки и при этом записывать изменения потенциала в моторной и в зрительной коре, а по окончании эксперимента вычислить коэффициент корреляции и посмотреть, при каких значениях этого коэффициента наблюдались те или иные двигательные реакции. Однако при этом длительность эксперимента, необходимая для получения статистически достоверных результатов, так сильно возрастает, что провести за один раз нужное число измерений оказывается невозможно. Кроме того, при такой постановке опыта пришлось бы проводить массу лишней вычислительной работы.
Проводимые опыты показали, что в большинстве случаев свет не вызывает движений животного. Но если световое раздражение подавалось в тот момент, когда коэффициент корреляции между изменениями биопотенциалов двигательных точек и некоторых участков зрительной коры (названных авторами эксперимента 'активными') был достаточно велик, двигательная реакция возникала в ответ на световое раздражение достаточно часто.
3.6 Математический анализ электрокардиограмм (обучающиеся программы)
<< | >>
За последние десятилетия в диагностике различных сердечных заболеваний (инфаркт миокарда, стенокардия и т. п.) весьма важную роль стал играть анализ электрокардиограмм
, т. е. кривых, характеризующих электрическую активность сердца. Нормальная электрокардиограмма изображена на рис. 6А
. Сущность процессов, регистрируемых кардиограммой, состоит в следующем. Ритмические сокращения работающего сердца связаны с распространением по его объему волны электрического возбуждения. Поэтому сердце создает вокруг себя периодически меняющееся электрическое поле. Кардиограмма и представляет собой запись изменений этого поля. Прикладывая электроды к определенным точкам на теле человека, мы записываем соответствующие проекции вектора, характеризующего электрическое поле сердца. Для того, чтобы получить более полную информацию об этом поле в целом, делается запись в нескольких точках или, как говорят медики, берется несколько отведений
. Обычно в медицинской практике берется 12 так называемых 'стандартных' отведений
.
Рис. 6.
|
Различные отклонения вида кардиограммы от нормы позволяют врачу-кардиологу судить о тех или иных сердечных заболеваниях, например о наличии инфаркта и его локализации в сердечной мышце. В принципе это выглядит просто, но на самом деле все гораздо сложнее. Прежде всего само понятие 'нормальная кардиограмма' достаточно неопределенно. Вид кардиограммы зависит от мелких различий в расположении сердца у разных людей, разницы в телосложении и от многих других фак-торов, вовсе не связанных с каким-либо заболеванием. Поэтому кардиограмма используется для диагностических целей обязательно в сочетании с другими признаками (боли в области сердца, сдвиги в составе крови и т. д.) и во всяком случае требует от врача, делающего на основании кардиограммы те или иные заключения, высокой квалификации и большого опыта.
Хотя кардиограмма не может служить единственным основанием для диагноза, содержащаяся в ней информация о состоянии сердечной мышцы достаточно велика. Особенно важно, что те или иные изменения в кардиограмме могут быть предвестниками заболеваний сердца (например, того же инфаркта), т. е. указывать на необходимость профилактических мер. Поэтому регулярное кардиографическое обследование населения, особенно людей среднего и пожилого возраста, имеет большое значение. Но нельзя же безгранично увеличивать необхо-димый для этого медицинский персонал. Естественно, возникает стремление автоматизировать обработку кардиограмм, переложив эту задачу на быстродействующую вычислительную технику. Задача анализа кардиограмм с помощью универсальных вычислительных машин интересна и с теоретической точки зрения, поскольку при этом возникают достаточно сложные математические вопросы.
Возможны различные подходы к решению этой задачи. Врачи выделили ряд параметров кардиограммы, существенных для диагностики (соотношения между высотами зубцов, расстояния между зубцами и т. д.). Существуют машинные программы для вычисления этих параметров. Однако определение параметров-вовсе не самоцель; самое важное - по найденным их значениям поставить диагноз. Поэтому возможны два варианта ис-пользования ЦВМ в кардиографии.
Можно ограничить задачу машины тем, чтобы она находила и представляла в удобном для клинициста виде значения параметров, необходимых для постановки диагноза, предоставив последнее врачу. При этом за машиной остаются такие вспомогательные, но важные функции, как выявление ошибочных или искаженных данных, отсеивание случайных внешних помех и т. д.
Но можно поставить перед машиной и более сложную задачу: вводя в нее данные о связях между теми или иными отклонениями кардиограммы от нормы и различными сердечными заболеваниями, возложить на машину и саму постановку диагноза. Это, конечно, весьма нелегкая задача. Тем не менее, уже найдены некоторые подходы к ее решению и получены первые об-надеживающие результаты. Не имея возможности излагать здесь детали, ограничимся следующими замечаниями.
Предположим, что нам нужно научить кого-либо различать фигуры разных типов, скажем, эллипсы, треугольники и квадраты. Можно добиться этого следующим образом. Сперва возьмем какой-то материал для обучения, то есть некоторое количество образцов каждой из трех фигур, будем показывать их по очереди обучаемому и каждый раз говорить, что это за фигура. Ясно, что вскоре обучаемый сможет различать любые квадраты, треугольники и эллипсы. Едва ли каждое лицо, умеющее отличать квадрат от эллипса, может точно сформулировать рецепт, по которому он это делает, но, по-видимому, процесс состоит в том, что человек фиксирует у себя в памяти (может быть, бессознательно) некоторые характерные признаки показываемых ему фигур (скажем, у эллипса отсутствуют прямолинейные участки, квадрат составлен из четырех прямолинейных отрезков и т. д.) и затем использует эти признаки.
Такое обучение путем предъявления образцов и отбора на этих образцах признаков, характеризующих тот или иной класс объектов, возможно не только для человека, но и для вычислительной машины. Эта идея может быть положена в основу классификации кардиограмм и установления диагноза, хотя, конечно, задача о классификации кардиограмм несравненно сложнее, чем задача различения разных геометрических фигур. К проблеме обучения машины распознаванию образов мы еще вернемся в гл. V.
3.7 Моделирование биологических систем и вычислительные машины
<< | >>
Кто-то сказал, что изобретение логарифмов удлинило жизнь астрономов. Еще больше оснований утверждать, что изобретение вычислительных машин удлинило жизнь экспериментаторов. Сейчас нередко обработка экспериментальных результатов отнимает у физиков, химиков, биологов в несколько раз больше времени, чем сам эксперимент. Поэтому автоматизация обработки этих результатов в несколько раз увеличивает продуктивность работы экспериментатора. Кроме того вычислительные машины позволяют использовать такие методы обработки, которые без машин практически неприемлемы вследствие своей трудоемкости. Наконец, как мы уже говорили, вычислительные машины в ряде случаев заменяют экспериментатора, управляя ходом эксперимента по заданной программе. При этом оказывается возможным поставить такие опыты, которые принципиально неосуществимы без использования машин, поскольку в этих опытах надо принимать решения со скоростью, недоступной человеку. Вычислительная машина стала надежным помощником биолога-экспериментатора.
Не меньшую роль вычислительные машины играют и в работе биологов-теоретиков. В последние годы в теоретической биологии появились очень сложные модели. Эти модели представляют собой или 'плохие' уравнения, которые не удается исследовать аналитически, или системы большого числа уравнений, или, наконец, сложные в логическом отношении построения с большим числом связей и условий.
Конечно, в принципе какое-нибудь 'плохое' уравнение можно исследовать, решая его численно при разных значениях параметров и при разных начальных условиях. Однако в сколько-нибудь сложных случаях сделать это вручную нереально. Подобно тому, как экспериментатор, не располагавший современной вычислительной техникой, останавливался перед горой фотопленок, рулонами осциллограмм и т. п., понимая, что на их обработку уйдет вся его жизнь, так и теоретик останавливался перед сложной системой уравнений, понимая, что для ее анализа потребуется слишком много времени, не говоря уже о том, что ее, возможно, в дальнейшем придется просто забраковать.
Поэтому теоретическая работа нередко ограничивалась формулировкой модели, скажем, составлением уравнений, хотя ясно, что наибольший интерес представляет детальное исследование модели, сравнение ее свойств с данными эксперимента и, если возможно, предсказание на основании изучения модели каких-либо еще неизвестных свойств самого исходного объекта. Появление вычислительных машин изменило положение в теоретической биологии не в меньшей мере, чем в экспериментальной.
В следующей главе будут рассмотрены различные модели достаточно сложных биологических систем и процессов. В ряде случаев (например, при анализе распространения нервного импульса, свойств нервных сетей, моделирования процессов узнавания и мышления и др.) соответствующие модели совершенно невозможно анализировать без вычислительной машины.
Конечно, вычислительная машина может оказать лишь техническую помощь: машина не может заменить человека в выборе и формулировке необходимых понятий и познании принципов работы моделируемой системы, т. е. в создании самой модели.
4. Математические модели в биологии
<< | >>
4.1 Роль математических моделей в биологических исследованиях
<< | >>
Мы уже видели, что применение математических методов к изучению тех или иных явлений реального мира требует прежде всего создания соответствующих общих понятий, то есть построения математических моделей, описывающих в абстрактной форме основные свойства тех систем и процессов, которые мы изучаем. Мы упоминали и о трудностях построения таких моделей в биологии, обусловленных чрезвычайной сложностью биологи-ческих систем. Несмотря на эти трудности, 'модельный' подход к биологическим проблемам сейчас успешно развивается и уже принес определенные результаты. Мы изложим некоторые из них в этой главе.
Говоря о роли моделей в биологических исследованиях, важно иметь в виду следующее. Хотя термин 'модель' мы понимаем в абстрактном смысле - как некоторую систему логических понятий, а не как реальное физическое устройство, все же модель - это нечто существенно большее, чем простое описание явления или чисто качественная гипотеза, в которой еще остается до-статочно места для разного рода неясностей и субъективных мнений. Напомним следующий пример, относящийся к довольно далекому прошлому. В свое время Гельмгольц, занимаясь изучением слуха, выдвинул так называемую резонансную теорию
, выглядевшую правдоподобно с чисто качественной стороны. Однако проведенные позже количественные расчеты, учитывающие реальные значения масс, коэффициентов упругости и вязкости составных частей слуховой системы, показали несостоятельность этой гипотезы. Иначе говоря, попытка превратить чисто качественную гипотезу в точную модель, которую можно исследовать математическими методами, сразу же обнаружила несостоятельность исходных принципов. Конечно, если мы построили некоторую модель и даже получили хорошее согласие между ее свойствами и результатами соответствующего биологического эксперимента, то это еще не доказывает правильности модели. Но если на основании изучения модели можно сделать какие-то предсказания о поведении той биологической системы, которую мы моделируем, а затем подтвердить эти предсказания реальным экспериментом, то это служит гораздо более веским свидетельством в пользу правильности модели.
Мы рассмотрим некоторые модели, относящиеся к различным биологическим процессам и системам, выбирая в первую очередь такие примеры, где возможно количественное сравнение результатов исследования модели с экспериментом. К сожалению, столь детализированных моделей в биологии еще не много. Поэтому мы опишем и некоторые из таких моделей, которые пока что дают лишь качественную картину.
4.2 Аксиоматические модели активных сред:
<< | >>
Аксиоматика модели
[<< | >>]
. Одно из характерных свойств многих тканей, и в первую очередь нервной ткани, это способность к возбуждению и передаче возбуждения от одних участков к другим. Примерно один раз в секунду волна возбуждения пробегает по сердечной мышце, заставляя ее сокращаться и гнать кровь по всему телу. Импульсы возбуждения, распространяясь по нервным волокнам от периферии (рецепторов органов чувств) к спинному и головному мозгу, приносят сигналы от внешнего мира, а в обратном направлении (по другим волокнам) идут импульсы-команды, предписывающие мышцам выполнение тех или иных действий. В. целом, распространение возбуждения - это тот материальный процесс, который в основном обеспечивает передачу информации и регулирование в живом организме.
Возбуждение в нервной клетке может возникнуть либо само по себе (как говорят спонтанно
), либо под влиянием возбужденной соседней клетки, либо, наконец, под действием внешнего сигнала, скажем раздражения электрическим током. Перейдя в возбужденное состояние, клетка остается в этом состоянии некоторое время, а затем возбуждение исчезает и наступает так называемый рефрактерный период
, в течение которого клетка не реагирует на поступающие к ней сигналы. Затем клетка возвращается в первоначальное состояние покоя, из которого она снова может перейти в возбужденное состояние.
Таким образом, процесс возникновения и распространения возбуждения обладает рядом четко выраженных свойств, отправляясь от которых можно построить формальную модель этого явления. А затем для исследования такой модели можно применять уже чисто математические методы.
Впервые математический подход к исследованию возбудимых тканей был осуществлен в 1946 году Н. Винером и А. Розенблютом [60]. В более общей форме эти идеи были развиты И. М. Гельфандом и М. Л. Цетлиным [63], а затем и многими другими авторами. Сформулируем аксиоматическое описание модели, о которой идет речь.
Будем под 'возбудимой средой' понимать некоторое множество элементов ('клеток'), обладающих следующими свойствами:
x
множества X
может находиться в одном из трех состояний: покой
, возбуждение
и рефрактерность
.
t
(различную, вообще говоря, для разных x
); затем элемент переходит на время R(х)
в рефракторное состояние, после чего возвращается в состояние покоя;
v
по множеству находящихся в покое элементов;
x
не был возбужден в течение некоторого определенного времени Т(х)
, то по прошествии этого времени он самопроизвольно переходит в возбужденное состояние. Время Т(х)
называется периодом спонтанной активности
элемента x
. При этом не исключается и тот случай, когда Т(х) = ∞
, то есть когда спонтанная активность отсутствует.
Похожие математические модели рассматриваются и в совсем других областях, например в теории горения, в задачах о распространении света в неоднородной среде и т. д. Однако наличие некоторого конечного 'периода рефрактерности' характерно в первую очередь именно для биологических процессов.
Описанную модель можно исследовать или аналитическими методами, или путем реализации ее на вычислительной машине. В последнем случае, мы, понятно, вынуждены считать, что множество X
(возбудимая среда) состоит из некоторого конечного числа элементов (в соответствии с возможностями существующей вычислительной техники - порядка нескольких тысяч). Для аналитического исследования естественно предполагать X
некоторым непрерывным многообразием (например, считать, что X
- это кусок плоскости). Простейший вариант такой модели мы получим, приняв за X
некоторый отрезок (аналог нервного волокна) и предположив, что время t
, в течение которого каждый элемент находится в возбужденном состоянии очень мало. Тогда, как будет показано ниже, процесс последовательного распространения импульсов по такому 'нервному волокну' легко описать цепочкой обыкновенных дифференциальных уравнений первого порядка. В более сложных случаях (многомерная среда, наличие ветвлений, учет более тонких свойств возбудимой ткани) математическое описание процесса становится гораздо более трудной задачей. Хотя сформулированная выше модель лишь в очень грубой форме воспроизводит основные свойства реальных возбудимых тканей, она способна имитировать ряд интересных и важных явлений, связанных с функционированием живого организма.
Динамическая память
[<< | >>]
. Рассмотрим двумерную возбудимую среду, обладающую спонтанной активностью. Пусть все элементы этой среды имеют один и тот же период спонтанной активности T
и одну и ту же начальную фазу. Если такая среда изолирована от каких-либо внешних воздействий, то все ее элементы перейдут в возбужденное состояние одновременно, затем возбуждение исчезнет, после чего через время T
все элементы возбудятся снова и т. д. Предположим теперь, что в какой-то момент, когда все элементы среды находятся в покое, мы возбудим один из них (обозначим его символом A
) внешним воздействием. Возбуждение начнет распространяться от этого элемента по среде. В результате или волна возбуждения пробежит по всем элементам среды и затухнет, или же (если размеры среды достаточно велики) в определенный момент наступит спонтанное возбуждение тех элементов, до которых не успела дойти волна от элемента A
.
Спустя время T
после того, как элемент A
был возбужден внешним стимулом, он возбудится снова. Затем начнут возбуждаться остальные элементы. Нетрудно понять, что фактически на этот раз элемент A
уже не будет источником распространения возбуждения; каждый из остальных элементов возбудится спонтанно по прошествии времени T
после предыдущего его возбуждения. Однако возникающая при этом картина последовательного возбуждения клеток в точности повторяет ту, которая возникла в первый раз, когда возбуждение было вызвано стимуляцией клетки A
. Через время 2 T
после первоначальной 'затравочной' стимуляции снова начнется распространение возбуждения от элемента A
и т. д., то есть весь процесс будет повторяться периодически с периодом T
.
Мы могли бы первоначально возбудить не один элемент, а некоторую определенную группу элементов. Легко понять, что и в этом случае возник бы некоторый периодический процесс распространения возбуждения. Таким образом, активная среда может играть роль 'динамической памяти': она 'запоминает' нанесенное раздражение, его фазу и место нанесения [63]. Возможно, что в реальных физиологических механизмах памяти, особенно если речь идет о так называемой 'кратковременной' памяти
, процессы, подобные только что описанному, играют определенную роль.
Явление синхронизации
[<< | >>]
. Рассмотрим теперь среду, где периоды спонтанной активности различных элементов неодинаковы. Анализ показывает [27, стр. 9-27], что в такой среде происходит синхронизация, причем ритм возбуждения всей среды определяется ритмом самого быстрого элемента, то есть элемента с наименьшим периодом спонтанной активности. Действительно, пусть речь идет всего лишь о двух связанных между собой элементах A1
и А2
с периодами спонтанной активности Т1
и Т2
, причем Т1 < Т2
. Когда один из этих элементов возбудится, то он возбудит и второй (мы считаем, что время передачи возбуждения к соседнему элементу пренебрежимо мало). Спустя время Т1
возбудится (спонтанно) элемент А1
и передаст возбуждение элементу А2
и т. д. Пара элементов будет работать синхронно с периодом Т1
. Мы сейчас пренебрегли рядом обстоятельств: тем, что передача возбуждения от одного элемента к другому требует некоторого времени, возможностью прихода сигнала от одного элемента к другому в тот момент, когда этот другой находится в состоянии рефрактерности, и т. д. Учет этих факторов усложняет анализ, однако сам факт синхронизации элементов с различными периодами остается верен при достаточно общих предположениях.
Описанный механизм синхронизации важен, в частности, для обеспечения нормальной работы сердца. Ритм сердечных сокращений задается так называемым синусным узлом
. Это образование состоит из очень большого числа клеток (десятки тысяч), каждая из которых обладает спонтанной активностью, причем периоды спонтанной активности различных клеток довольно близки между собой. Самые быстрые из этих клеток задают, в соответствии со сказанным выше, ритм всего синусного узла, а тем самым и ритм сердца в целом (остальные клетки сердца или вовсе лишены спонтанной активности или имеют период больший, чем клетки синусного узла). Если какие-то из клеток синусного узла перестанут функционировать, то роль ведущих элементов перейдет к наиболее быстрым из сохранившихся, и т. д. Такой механизм регуляции очень надежен и устойчив - выключение какой-либо части синусного узла лишь несущественно изменит режим работы сердца. В этом - одно из интересных и важных отличий живых систем от большинства технических устройств, где выход из строя одной ответственной детали может полностью нарушить работу всей системы.
Патологические режимы. Фибрилляция
[<< | >>]
. Одно из важных применений аксиоматических моделей возбудимых сред - это теоретическое исследование различных паталогических режимов работы сердечной мышцы. Собственно говоря, именно в связи с этой задачей Н. Винер и А. Розенблют впервые сформулировали соответствующую аксиоматическую модель.
Среди различных нарушений нормальной работы сердца одно из самых тяжелых - так называемая фибрилляция
. Это явление, хорошо известное врачам и физиологам, состоит в том, что вместо ритмических согласованных сокращений в сердце возникают беспорядочные локальные возбуждения, лишенные какой-либо периодичности. Фибрилляция желудочков сердца полностью нарушает его гемодинамические функции и через несколько минут приводит к смерти. Фибрилляция предсердий не столь катастрофична (она может длиться годами), но все же представляет собой достаточно тяжелое заболевание. Определенную связь с фибрилляцией имеют и другие, менее радикальные нарушения сердечной деятельности - различные формы аритмии.
Механизм возникновения фибрилляции в реальном сердце не вполне ясен, однако некоторые выводы о природе этого явления можно сделать даже на основании той аксиоматической модели, которую мы рассматриваем.
Рассмотрим двумерную возбудимую среду, по которой периодически распространяется волна возбуждения. Предположим, что в момент, когда по ней пробегает очередная волна, некоторая часть среды оказалась временно заторможенной (рис. 7А
), то есть невосприимчивой к возбуждению (такая временная невозбудимость отдельных участков может возникать в сердечной мышце под влиянием нервных воздействий [80]). Предположим, далее, что как раз в тот момент, когда волна возбуждения огибает заторможенную область, последняя выходит из заторможенного состояния. При этом волна возбуждения начнет распространяться внутрь вышедшей из торможения области (рис. 7Б
). Если размеры этой области достаточно велики, то волна возбуждения, пройдя по ней, обогнет рефракторный участок и начнет его периодически обегать (последовательные этапы этого процесса изображены на рис. 7В-7Е
). Описанный здесь механизм спирального закручивания волны возбуждения был подробно рассмотрен И. С. Балаховским [50]. В последующих работах такие спирали получили название ревербераторов
. Как показывает более детальный анализ, такие ревербераторы через некоторое время либо исчезают, либо порождают новые ревербераторы.
Если ревербераторов появляется больше, чем исчезает, то в среде развивается лавинообразный процесс нарастания беспорядочной активности, аналогичный реальной фибрилляции сердечной мышцы [71], [72].
В описанной выше схеме основой возникновения аномального режима была некоторая неоднородность среды (временная невозбудимость одного из участков среды).
Проведенные рядом авторов исследования показали, что это условие носит весьма общий характер: в основе возникновения режимов типа фибрилляции, как правило, лежит та или иная форма неоднородности среды. Эта неоднородность может иметь различную природу: разные участки среды могут исходно отличаться периодом рефрактерности или другими характеристиками, неоднородность (временная) может создаваться какими-либо предшествующими тормозящими или возбуждающими воздействиями [87] и т. д. Это обстоятельство хорошо согласуется с известными в медицине фактами: нарушения сердечного ритма возникают, как правило, на почве сердечных заболеваний (инфаркты, недостаточность коронарного кровообращения и т. д.), нарушающих однородность сердечной ткани. С другой стороны, еще в исходной работе Н. Винера и А. Розенблюта [60] было показано, что в совершенно однородной возбудимой среде возникновение фибрилляции возможно лишь при некоторых весьма искусственных условиях ее стимуляции.
Относительная рефрактерность и ее влияние на распространение серии импульсов по волокну
[<< | >>]
. До сих пор мы считали, что переход элементов возбудимой среды из состояния рефрактерности в состояние покоя происходит скачком. На самом деле, в реальных нервных клетках этот переход происходит постепенно; поэтому между состоянием полной невозбудимости (которое мы будем теперь называть абсолютной рефрактерностью) и состоянием покоя лежит состояние так называемой относительной рефрактерности, в котором клетка отвечает на стимуляцию, но сила раздражения, необходимого для получения ответа, выше, чем в норме. Точнее говоря, каждая возбудимая клетка отвечает лишь на раздражения, интенсивность которых превышает определенную величину, называемую порогом (например, в случае раздражения клетки электрическим током должно быть достигнуто некоторое минимальное напряжение). Наступление абсолютной рефрактерности после возбуждения можно трактовать как повышение этого порога до уровня, недостижимого без повреждения клетки. Тогда относительная рефрактерность - это фаза, в которой происходит постепенное снижение порога от значения, отвечающего абсолютной рефрактерности, до значения, соответствующего состоянию покоя*). Хотя на самом деле граница между абсолютной и относительной рефрактерностью несколько условна, разграничение этих двух понятий оказывается существенным.
*) У реальных нервных клеток состояние относительной рефрактерности может сменяться на короткое время состоянием так называемой супернормальности, в котором клетка легче (то есть с меньшим порогом) воспринимает стимуляцию, чем в состоянии покоя. Мы, однако, не будем останавливаться на этом явлении. |
Наличие у элементов, составляющих активную среду, фазы относительной рефрактерности приводит к тому, что скорость распространения каждого импульса зависит от времени, прошедшего после предыдущего возбуждения, то есть от фазы рефрактерности: если импульс следует за предыдущим через малый промежуток времени, то скорость второго импульса снижается и притом тем сильнее, чем он ближе к первому. (В следующем параграфе мы рассмотрим физическую основу этого явления, а здесь, в рамках аксиоматической модели, зависимость скорости импульса от фазы рефрактерности просто постулируется.)
К каким же явлениям приводит такая зависимость скорости импульса от фазы рефрактерности? Чтобы не осложнять дело вопросами, связанными с геометрической формой рассматриваемой среды, будем считать, что она представляет собой просто отрезок (модель нервного волокна без разветвлений). Предположим, что по такому волокну проходит серия импульсов. Первый из них проходит по покоящемуся волокну с максимально возможной для этого волокна скоростью v0
. Следующий импульс распространяется при соответствующей частоте стимуляции по относительно рефракторному волокну, и его скорость меньше, чем v0
; поэтому он постепенно отстает от первого импульса. Интервал между первым и вторым импульсами возрастает, что приводит к постепенному увеличению скорости второго импульса (отставая от первого, он попадает в лучшие условия для своего продвижения вперед). Однако его скорость всегда будет оставаться меньше скорости первого импульса, так что отставание может только нарастать. А что произойдет при длительной периодической стимуляции одного конца волокна? Анализ показывает, что при этом в волокне установится определенный стационарный режим: все импульсы будут идти по волокну с некоторой постоянной скоростью, меньшей, чем максимально возможная и с одинаковыми интервалами между соседними импульсами, равными периоду стимуляции [63]. Это остается верным и для неоднородных волокон, то есть таких, у которых длительность рефракторного периода в разных участках волокна различна [56].
Рис. 8.
|
Если начало нервного волокна раздражается импульсами, следующими друг за другом через различные промежутки времени, то во время распространения импульсов по волокну интервалы между импульсами будут выравниваться (длинные сокращаться, короткие увеличиваться). В результате при достаточной длине волокна последовательность импульсов на выходе будет близка к равномерной даже при очень неравномерной стимуляции на входе [54, 56] (рис. 8
).
Положение здесь прямо противоположно тому, которое мы наблюдаем при движении автобусов по некоторому маршруту. Там машина, следующая на небольшом расстоянии за предыдущей, меньше задерживается на остановках (почти все пассажиры успели сесть в первую машину) и поэтому двигается быстрее. В силу этого машины имеют тенденцию сбиваться в группы по несколько штук с большими интервалами между группами. Приходится принимать специальные меры (жесткий график движения машин, пункты контроля), чтобы противодействовать этой тенденции. Для импульсов, идущих по нервному волокну, положение обратное: чем меньше интервал между двумя последовательными импульсами, тем больше снижается скорость второго импульса. В результате происходит автоматическое выравнивание меж-импульсных интервалов.
Этот факт - выравнивание межимпульсных интерпалов при прохождении серии импульсов по длинному нервному волокну,- непосредственно связан со следующим важным вопросом. Как известно, вся информация, поступающая от рецепторов в центральную нервную систему, равно как и команды, идущие к мышцам, передаются потоком нервных импульсов. Спрашивается, чем именно кодируется информация в таком потоке: числом импульсов, их средней частотой, длинами межимпульсных интервалов или чем-то еще? Описанное выше явление выравнивания интервалов между импульсами показывает, что, во всяком случае при достаточно высокой частоте импульсации (когда импульсы идут по относительно рефракторному волокну) и большой длине волокна, кодирование информации длинами отдельных межимпульсных интервалов едва ли возможно, - при прохождении импульсов по такому волокну эти величины изменяются, стремясь к некоторому среднему значению. В этом случае информативным признаком скорее будет средняя частота импульсации. Если же импульсы идут по достаточно короткому волокну, то длины отдельных межимпульсных интервалов меняются мало и могут служить 'языком' для передачи информации.
Периодика Венкебаха-Самойлова
[<< | >>]
. Еще в прошлом веке врачи обнаружили нарушение сердечного ритма, получившее название периодики Венкебаха-Самойлова
. Оно состоит в том, что при сохранении правильного ритма работы предсердии возникают периодические пропуски одного сокращения желудочков. Например, на каждые пять сокращений предсердий желудочки сокращаются только четыре раза. При этом промежуток времени между сокращениями предсердий и желудочков (так называемая атрио-вентрикулярная задержка
) в пределах каждого цикла постепенно нарастает. Периодика Венкебаха-Самойлова отличается чрезвычайной правильностью, и это наводит на мысль о возможности ее простого объяснения. Идея такого объяснения была высказана Розенблютом (см. [27, стр. 131-159]). Она состоит в следующем.
Рассмотрим возбудимую среду, элементы которой в покое обладают некоторым определенным порогом, и предположим, что после возбуждения этот порог на какое-то время становится очень высоким (то есть наступает абсолютная рефрактерность), а затем линейно снижается до уровня, отвечающего состоянию покоя (период относительной рефрактерности
). Пусть на такую среду периодически действуют стимулы некоторой фиксированной интенсивности и длительности (на рис. 9
они изображены белыми прямоугольниками).
Тогда при некоторой частоте стимуляции будет наблюдаться периодическое выпадение ответа на n
-й стимул (при наличии ответов на предшествующие n - 1
стимулов); при этом запаздывание ответов на последовательные стимулы постепенно нарастает, пока не произойдет выпадение ответа. Мы видим, что уже в такой простой модели воспроизводятся основные закономерности периодики Венкебаха - Самойлова. Для объяснения более тонких деталей этого явления, например для количественного описания закона нарастания запаздывания, различия в устойчивости циклов разной длины (под циклом понимается число стимулов между двумя соседними выпадениями ответа) и т. д., необходимо использовать более сложные модели, в том числе и модели, связанные с рассмотрением ионно-мембранного механизма нервного возбуждения, о которых будет идти речь в следующем параграфе.
Математическое описание движения точечных импульсов по волокну
[<< | >>]
. В простейших моделях процесс распространения импульса нетрудно описать математически. Рассмотрим, например, отрезок (мы будем называть его нервным, волокном}, по которому распространяется возбуждение. Будем считать импульсы очень короткими (в каждый момент времени возбуждение сосредоточено в одной точке). Предположим, что по волокну проходит серия импульсов и tn(х)
-момент времени, когда n
-импульс проходит через точку x
. Пусть R(х)
- период рефрактерности волокна
в точке x
, то есть время, за которое эта точка после возбуждения возвращается в нормальное состояние покоя. Волокно называется однородным, если R(х) = const
, в противном случае его называют неоднородным. Назовем величину
фазой рефрактерности волокна в точке x
в момент прохождения n
-го импульса. В соответствии со сказанным выше, естественно считать что скорость распространения импульса определяется фазой рефрактериости*):
vn = v(j
n(x))
*) Кроме того, мы считаем, что при снижении скорости до некоторого критического уровня распространение возбуждения прекращается. Это условие равносильно предположению о наличии фазы абсолютной рефрактерности. |
Тогда, полагая, что нервное волокно стимулируется (в начальной точке) периодически с периодом T
, получаем, что промежуток времени между прохождениями (n-1
)-го и n
-го импульсов через точку x
равно
Из (4.2.1)
и (4.2.2)
легко получается дифференциальное уравнение для
:
j
n(x)
Функция
удовлетворяет, очевидно, начальному условию
j
n(x)
Подставив в (4.2.3)
конкретный вид функции v(
получим уравнение, описывающее процесс распространения импульсов по водокну.
j
(x))
Действительно, если начальная фаза рефрактерности в каждой точке (то есть функция
известна, то из уравнения j
0(x)(4.2.3)
и начального условия (4.2.4)
находятся последовательно
, j
1(x)
и т. д., а по ним, в свою очередь, из равенства j
2(x)(4.2.2)
определяются t1(х)
, t2(х)
и т. д. В результате мы для каждой точки x
знаем время прохождения через нее каждого импульса, т. е. получаем полное описание процесса.
При рассмотрении более сложных моделей, например учитывающих, что возбуждение каждой точки происходит не мгновенно, а имеет конечную длительность (это существенно для таких явлений, как описанная выше периодика Венкебаха-Самойлова), или относящихся к средам более сложной геометрической структуры, чем отрезок (многомерные, ветвящиеся и т. д.), существенно увеличивается сложность математического описания. В этой ситуации эффективным средством исследования может служить реализация подобных моделей на вычислительных машинах. Например, такие машинные эксперименты по анализу фибрилляций были выполнены в США (см., например, работу Моу и др. [14, стр. 408-432]), в Институте биофизики АН СССР и в других местах. Применение современной электронной аппаратуры (например, представление результатов машинного счета в виде подвижного изображения на светящемся экране) делает такого рода моделирование очень удобным и наглядным.
Моделирование процессов распространения возбуждения интересно не только с точки зрения чистой теории. Мы уже говорили о той роли, которую в развитии модельных исследований сыграла проблема фибрилляций сердца. Модельные исследования удобны, в частности, тем, что они позволяют детально исследовать роль тех или иных параметров, менять по усмотрению исследователя значения этих параметров. Так, например, модельные исследования показали существенное значение для процессов возникновения и развития фибрилляций величины
- отношения длительности возбужденного состояния элемента к периоду его рефрактерности. Поняв на модели роль тех или иных параметров, можно использовать эти сведения в медицинской практике, например при поисках лекарственных веществ для регуляции сердечного ритма.
t
/ R4.3 Ионно-мембранные механизмы возбуждения:
<< | >>
В предыдущем параграфе мы изучали процессы распространения возбуждения в активной среде, вводя основные характеристики среды - порог, рефрактерность, время возбуждения, скорость распространения импульса и т. д. чисто аксиоматически, без какого-либо анализа механизма нервного возбуждения. Сейчас мы изложим основные представления и результаты, связанные с изучением этого механизма.
Механизм распространения возбуждения
[<< | >>]
. Материальная природа нервного импульса интересовала многих исследователей и о ней высказывались различные предположения. Еще в XVIII веке был обнаружен ряд явлений, указывающих на электрическую природу возбуждения нервных и мышечных тканей. На основании этих данных английский естествоиспытатель и философ Дж. Пристли (1733-1804) высказал предположение, что передача возбуждения по нерву представляет собой движение 'электрической жидкости'. В 1791 году Л. Гальвани опубликовал свой 'Трактат о силах электричества при мышечном сокращении'
, в котором он развил свое учение о 'животном электричестве'. После того, как в 20-х годах прошлого века появился гальванометр, стало возможным прямое измерение электрических токов в тканях живого организма.
В середине прошлого столетия учение об электрических явлениях в живом организме получило дальнейшее развитие в фундаментальных работах Э. Дюбуа-Реймона, значительно усовершенствовавшего технику эксперимента и получившего надежные количественные данные об электрических потенциалах в нервных и мышечных тканях в покое и при возбуждении.
Наряду с развитием и уточнением представлений об электрической природе нервного возбуждения высказывались и другие гипотезы. Так, например, Умрат, изучавший распространение возбуждения в растениях и впервые (в 1928 г.) предложивший дифференциальные уравнения для описания этого процесса, полагал, что распространение возбуждения связано с диффузией какого-то химически активного вещества. Сильная зависимость скорости проведения импульса от температуры рассматривалась при этом как довод в пользу химической природы процессов возбуждения. Однако, тот факт, что скорость импульса может быть очень значительна (100 метров в секунду и более; впервые эти измерения были выполнены Гельмгольцем в 1850 г.), свидетельствует против диффузионной природы возбуждения.
В настоящее время общепризнано, что распространение возбуждения в нервных и мышечных волокнах обусловлено электрическим током. Согласно представлениям, сложившимся к началу нашего столетия на основе исследований Б.Ф. Вериго, Ю. Бернштейна, Л. Германа и других, возбужденный участок волокна становится генератором электрического тока. Этот ток, затекая в соседние участки, заставляет их в свою очередь генери-ровать ток, который переводит в возбужденное состояние новые участки и т. д.
Оказалось, что нервные и мышечные волокна по своей электрической природе подобны кабелю (см. обзор [88]), то есть представляют собой относительно хорошо проводящий сердечник (протоплазма), окруженный оболочкой (мембрана волокна) с большим сопротивлением и большой емкостью.
Основная роль в формировании и распространении импульса принадлежит мембране: если из нервного волокна выдавить протоплазму и заполнить его оболочку (мембрану) морской водой, то такое нервное волокно может в течение довольно длительного времени передавать возбуждение. Как показали эксперименты, участок волокна возбуждается, когда разность потенциалов по обе стороны мембраны достигает некоторого порогового уровня. Иначе говоря, разность потенциалов на мембране служит параметром, определяющим включение механизмов генерации тока. Механизм работы мембранного генератора выглядит в общих чертах следующим образом. В состоянии покоя между наружной поверхностью нервного волокна и находящейся внутри протоплазмой существует разность потенциалов, составляющая примерно 60-90 милливольт, причем поверхность клетки заряжена положительно по отношению к протоплазме. Эта разность потенциалов называется потенциалом покоя
или мембранным потенциалом покоя
. Она создается тем, что ионный состав протоплазмы нервных и мышечных клеток сильно отличается от ионного состава окружающей внеклеточной жидкости; в протоплазме концентрация ионов калия в 30-50 раз больше, а ионов натрия - в 10 раз меньше, чем снаружи. Положительно заряженные ионы калия, выходя через клеточную мембрану наружу, создают потенциал покоя. Ионы натрия (заряженные тоже положительно), проходя в обратном направлении, создают противоположный эффект, но так как в состоянии покоя мембрана значительно более проницаема для калия, чем для натрия, первый процесс доминирует, и в результате возникает указанная выше разность потенциалов ([19, 23, 40, 41])
Рис. 10.
|
Когда мембрана переходит в возбужденное состояние (под влиянием внешнего воздействия, возбуждения соседних участков мембраны и т. д.) избирательным образом меняется ее проницаемость для различных ионов. Сперва происходит резкое увеличение натриевой проницаемости мембраны и поток положительно заряженных ионов натрия устремляется внутрь клетки. При этом разность потенциалов по обе стороны мембраны сперва снижается до нуля, а затем меняет знак: аксоплазма ста-новится заряженной положительно по отношению к внеклеточной среде, причем разность потенциалов достигает в максимуме примерно 30 мв. (Таким образом, полное изменение мембранного потенциала по сравнению с исходным значением составляет примерно 100-120 мв.) После этого снова начинает преобладать поток ионов калия наружу, и система постепенно возвращается к исходному состоянию покоя. Изменение потенциала при возбуждении показано на рис. 10
.
Длительность процесса возбуждения сильно зависит от температуры (снижение ее на 10њ против нормы замедляет процесс примерно втрое). Это заставляет предполагать участие в работе мембранного генератора химических процессов. Однако детали механизма, обеспечивающего избирательную проницаемость мембраны, то есть ее способность пропускать преимущественно то натрий, то калий, пока еще не выяснены. Иногда проводят аналогию между передачей импульсов по нервным волокнам и, скажем, телефонной или телеграфной связью. Эта аналогия не вполне правомерна. Дело в том, что толщина нервных волокон у человека и большинства животных очень мала и составляет от 0,1 до 20 микрон, поэтому электрическое сопротивление их протоплазмы очень велико-свыше 1010
ом на 1 см длины. Передача сигнала по такому проводу, скажем, на 1 м - задача не менее сложная, чем передача сигнала по обычному телефонному проводу, идущему от Земли за пределы солнечной системы. На этом пути величина сигнала уменьшилась бы в миллионы раз и восприятие его было бы невозможно. Если бы инженеру понадобилось передавать сигнал на такие расстояния по проводу, ему пришлось бs оснастить этот провод огромным количеством усилителей, то есть сделать сам провод активным генератором электрических импульсов, подобно тому, как это наблюдается в нервном волокне.
Приведем выкладки, подтверждающие сказанное. Пусть в некоторой точке волокна, погруженного в большой объем проводящей жидкости, на мембране создается сдвиг потенциала Найдем распределение потенциала Пусть и . Подставив эти значения для
и перейдя затем к пределу при
Его решение (с учетом того, что потенциал не может неограниченно расти вдоль волокна) имеет вид
где |
Пассивные электрические свойства волокон и тканей
[<< | >>]
.
Итак, распространение возбуждения по волокну зависит, с одной стороны, от электрических параметров (сопротивление, емкость) волокна и окружающей его среды, а с другой - от свойств мембраны как генератора импульсов. В соответствующем образом поставленном эксперименте эти два аспекта можно изучать в известной мере независимо. Как мы уже упоминали, мембранный генератор включается лишь тогда, когда возбуждающий ток превышает некоторую определенную величину, называемую порогом. Следовательно, если через волокно пропускать очень слабый ток (в несколько раз слабее порогового), то оно будет вести себя как пассивный проводник: мембранные генераторы при этом не включаются,
Свойства ткани, изучаемые в таких условиях, называют ее пассивными электрическими свойствами. Представляют интерес такие пассивные свойства ткани как ее входное сопротивление (то есть отношение напряжения, возникающего на мембране в некоторой точке, к силе тока, пропускаемого через введенный в этой точке микроэлектрод), зависимость потенциала в ткани от расстояния до точки, в которой приложено заданное напряжение, и т. д. В частности, значительный интерес представляет установление того, как электрические свойства ткани в целом зависят от элементарных свойств мембраны и аксоплазмы (то есть от свойств 'материала') и от геометрии ткани (размеры, характер ветвления, толщина волокон и т. д.) [55].
Рассмотрим несколько подробнее вопрос о зависимости входного сопротивления от геометрии ткани. Воспользовавшись найденным выше выражением (1)
для потенциала, мы можем найти полный ток, протекающий через мембрану полубесконечного волокна. Он равен
В бесконечном цилиндрическом волокне ток будет вдвое больше. Следовательно, входное сопротивление, то есть отношение потенциала к полному току, равно
Таким образом, входное сопротивление цилиндрического нервного волокна пропорционально корню квадратному из сопротивления его мембраны. Для объектов с другой геометрией зависимость будет иной. Так, например, входное сопротивление сферической клетки без отростков, очевидно, пропорционально первой степени удельного сопротивления ее мембраны*).
*) Более слабая но сравнению со сферической клеткой зависимость входного сопротивления волокна от удельного сопротивления мембраны связана с тем, что при уменьшении сопротивления мембраны убывает и константа длины волокна, а значит становится меньше и размер области, через которую эффективно вытекает ток. Это умень-шение размера эффективной области частично компенсирует уменьшение сопротивления мембраны. |
Соображения, связанные с зависимостью входного сопротивления от геометрии среды, позволили понять следующий парадокс. Ряд экспериментов показывал, что клетки сердца по своим электрическим свойствам весьма сходны с нервными и мышечными волокнами. Это, в частности, означает, что у них, как и у этих последних, в момент возбуждения, то есть когда увеличивается натриевая проницаемость мембраны, ее сопротивление должно резко падать (по крайней мере на порядок).
Рис. 11.
|
Рис. 12.
|
Между тем при прямом измерении входного сопротивления миокарда не удалось обнаружить его заметного изменения в момент возбуждения. Это противоречие разрешается следующим образом. Миокард состоит из вытянутых клеток, образующих сложную сетчатую структуру (синцитий
). Были проведены расчеты ([55, 82]) зависимости входного сопротивления мембраны для решетчатых структур различной конфигурации (рис. 11
). Как показывают эти расчеты, входное сопротивление таких структур мало меняется даже при сильном изменении сопротивления мембраны (рис. 12
). Это связано с тем, что в такой сетчатой cтруктуре при уменьшении сопротивления мембраны эффективная площадь поверхности, через которую вытекает ток, убывает так сильно, что практически полностью компенсирует снижение сопротивления мембраны. Таким образом, расчет, основанный на соответствующей модели, позволил устранить здесь кажущееся противоречие между локальными свойствами мембраны сердечных клеток и электрическими свойствами сердечной ткани в целом.
Итак, с точки зрения пассивных электрических свойств нервная ткань аналогична кабелю и описывается соответствующими уравнениями. Перейдем теперь к математическому описанию мембранной генерации тока в волокне и процесса распространения возбуждения.
Модели распространения возбуждения
[<< | >>]
. Как известно, распространение электрического импульса по кабелю, содержащему генераторы тока, описывается уравнением вида
Здесь выражение I(V)
характеризует свойства генераторов тока, R
- удельное сопротивление проводника, C
- удельная емкость оболочки, a
- диаметр проводника. Упрощенное уравнение, описывающее распространение импульса по нервному волокну, можно получить, приняв за I(V)
некоторую фиксированную функцию переменных x
и t
, с одной стороны достаточно простую, а с другой - более или менее согласующуюся с экспериментальными данными. Эксперимент показывает, что как только в некоторой точке x
волокна потенциал достигает порогового значения, эта точка на некоторое время становится источником тока, сперва нарастающего, а затем спадающего. Простейшая аппроксимация состоит в предположении, что этот ток мгновенно достигает некоторой фиксированной величины, а потом через определенный промежуток времени сразу падает до нуля. Иначе говоря, I(V)
в уравнении (3)
заменяется функцией, которая при каждом фиксированном x
равна b = const
на некотором временном интервале длины t
и равна нулю вне этого интервала.
Полученное таким образом уравнение довольно хорошо воспроизводит некоторые свойства реального процесса распространения импульса [77]. Однако для более точного описания этого процесса нужна более сложная модель, достаточно полно учитывающая основные свойства мембранного генератора. Такая модель была в 1952 году предложена английскими физиологами А. Ходжкином и А. Хаксли [40]
.
В своих теоретических построениях А. Ходжкин и Д. Хаксли исходили из результатов экспериментального исследования гигантского аксона кальмара. Это нервное волокно достигает толщины 0,5-1 мм (что в сотни раз превышает толщину нервных волокон млекопитающих) и представляет собой очень удобный объект для таких исследований.
В модели Ходжкнна-Хаксли член I(V)
уравнения (3)
представляется как сумма трех слагаемых - калиевого тока (то есть тока, создаваемого ионами калия), натриевого тока и тока, создаваемого другими переносчиками зарядов (в частности, ионами хлора), - и описывается структура каждого из этих слагаемых. Точнее говоря, моделью Ходжкина-Хаксли называется следующая система нелинейных дифференциальных уравнений:
Здесь n
, m
и h
- функции потенциала и времени, определяющие поведение натриевого и калиевого токов, a
- радиус волокна, R
- удельное сопротивление протоплазмы, C
- удельная емкость мембраны, - постоянные, и, наконец,
, a
n
, a
m
, a
h
, b
n
, b
m
- заданные функции потенциала, имеющие следующий вид:
b
h
a
h = 0.07 exp (V / 20); b
n = 0.125 exp (V / 80); b
m = 4 exp (V / 18)
Система уравнений Ходжкииа-Хаксли не может быть решена аналитически в явном виде. Решение этой системы, отвечающее определенным начальным и краевым условиям, можно получить с помощью численных методов (и соответствующей вычислительной техники). С другой стороны, некоторые свойства процесса распространения импульса по нервному волокну можно извлечь из анализа системы (4)
и не располагая ее решением. Наконец, делая те или иные допущения, можно заменить систему (4)
некоторым ее упрощенным приближением и таким образом облегчить задачу исследования модели.
Изложим некоторые результаты, вытекающие из анализа модели Ходжкина-Хаксли.
Рис. 13.
Сравнение формы импульсов, полученных в реальных экспериментах ( |
Допустим, что нервное волокно, находившееся первоначально в покое, стимулируется на протяжении короткого времени внешним источником тока. Как показывает анализ уравнений, при этом прежде всего начнет возрастать величина m(V, t)
, что приведет к увеличению натриевого тока (равного
), а следовательно и к увеличению разности потенциалов между протоплазмой и внешней средой (то есть усилению деполяризации волокна). При увеличении деполяризации величина b
n = 0.125 exp (V / 80)m
растет, а величина h
уменьшается, причем эти изменения m
и h
связаны так, что величина m3h
, входящая в выражение для натриевого тока, сперва растет, а потом начинает убывать.
Функция n(V, t)
под действием внешнего источника тока тоже начинает возрастать, но с существенным запаздыванием по сравнению с m
. Возрастание n
означает усиление калиевого тока. Поскольку калиевый ток имеет направление, противоположное направлению натриевого тока, его увеличение уменьшает деполяризацию, возвращая в конечном счете мембранный потенциал к исходному уровню.
Если, подставив в уравнения (4)
значения констант, полученные из экспериментов на реальном аксоне, найти путем численных расчетов форму импульса, возникающего под действием внешнего стимула, то мы увидим, что модель Ходжкина-Хаксли не только качественно, но и количественно согласуется с данными физиологического эксперимента. На рис. 13
приведена форма нервного импульса, полученная в экспериментах на аксоне кальмара, и форма 'импульса', найденного с помощью численного решения уравнения Ходжкина - Хаксли [40]. Видно, что соответствующие кривые достаточно сходны.
Известно, что изменение потенциала мембраны приводит к возбуждению нервного волокна и возникновению в нем импульса лишь в том случае, когда это начальное изменение превышает некоторую определенную величину, называемую порогом
. А слишком малые 'подпороговые' изменения потенциала затухают, не порождая импульса. Наличие такого порога аналогично существованию определенной температуры воспламенения, то есть температуры, до которой нужно нагреть данное вещество для того, чтобы оно загорелось.
Как же объясняется наличие порога у нервного волокна в рамках модели Ходжкина-Хаксли? Дело в том, что если изменение потенциала мало, то вызванный этим изменением натриевый ток оказывается меньше калиевого, и суммарный ток возвращает потенциал мембраны к исходному значению. Если же изменение мембранного потенциала превосходит некоторое определенное значение, то натриевый ток становится больше калиевого. При этом деполяризация волокна увеличивается, что приводит к дальнейшему увеличению натриевого тока, и т. д. Происходит развитие и распространение импульса. То значение мембранного потенциала, при котором натриевый ток равен калиевому, и есть порог возбуждения*).
*) Строго говоря, к этому условию необходимо добавить еще одно требование: в это время скорость нарастания натриевого тока должна быть выше скорости нарастания калиевого тока. |
Наличие у всех нервных и мышечных волокон рефрактерности, то есть некоторого периода невозбудимости, наступающего после прохождения импульса, тоже естественно вытекает из рассматриваемой модели. Как мы уже видели, через некоторое время после возникновения в волокне импульса параметр h
становится мал, а параметр n
возрастает. В этих условиях при любом увеличении мембранного потенциала соответствующий калиевый ток будет превышать натриевый, то есть любая стимуляция будет подпороговой. В этом и состоит явление рефрактерности.
Из эксперимента известно, что если действовать на нервное волокно током постепенно нарастающей силы, то такое воздействие приводит к возникновению импульса в волокне лишь в том случае, если скорость нарастания тока превышает некоторую определенную величину; при слишком медленном увеличении тока волокно не возбуждается (это явление называется 'аккомодацией'
, или 'привыканием' волокна). В модели Ходжкина-Хаксли наличие аккомодации объясняется тем, что при медленном нарастании тока успевает развиться натриевая инактивация (то есть уменьшится медленная переменная A
), в силу чего натриевый ток не может превысить калиевый и импульс не возникает. Минимальную скорость нарастания тока, при которой еще возможно возникновение импульса, можно определить с помощью численного решения уравнений Ходжкина - Хаксли.
Из сказанного видно, что и аккомодация и рефрактерность имеют в своей основе один и тот же механизм, хотя до создания модели Ходжкина-Хаксли связь между этими двумя явлениями была неясна.
Рис. 14.
|
Решение системы (4)
позволяет получить характеристики импульса, распространяющегося по волокну. Как было показано в 1952 г. Ходжкином и Хаксли, их модель дает правильные значения для скорости распространения импульса и хорошо воспроизводит его форму.
В частности, амплитуда распространяющегося потенциала действия несколько ниже, чем амплитуда импульса, возникающего при одновременном возбуждении всей мембраны. Модель позволила также определить зависимость скорости распространения импульса от параметров волокна и условий внешней среды (температуры, удельного сопротивления). В частности, как это видно из уравнения (4)
, скорость распространения прямо пропорциональна корню квадратному из диаметра волокна.
Модель Ходжкина-Хаксли позволила рассчитать изменения формы второго импульса, возникающего через разные сроки после первого. Эта модель позволила вычислить изменение сопротивления мембраны в разные фазы импульса, ответы мембраны на раздражение постоянным током и т. д. Расчетные данные хорошо совпадали с результатами соответствующих экспериментов.
Наконец, на модели Ходжкина-Хаксли хорошо воспроизводится периодика Венкебаха - Самойлова, о которой мы говорили в предыдущем параграфе в рамках аксиоматической модели. Результаты соответствующих расчетов приведены на рис. 14
.
Итак, модель Ходжкина - Хаксли достаточно хорошо воспроизводит, притом не только качественно, но и количественно, основные особенности процесса возбуждения реального нервного волокна. Вместе с тем при создании этой модели такие свойства волокна как рефрактерность, аккомодация, наличие порога и т. д. вовсе не вводились в модель в явном виде. Эта модель была построена на основании довольно ограниченного набора экспериментальных данных, полученных на аксоне кальмара в условиях так называемой 'фиксации напряжений'
: специальная электронная аппаратура доводит разность потенциала по обе стороны мембраны до заданной величины и поддерживает ее на этом уровне, независимо от величины тока, генерируемого самой мембраной. При этом измеряется величина тока, отвечающая различным значениям разности потенциалов.
Соответствие же между свойствами реального волокна и поведением модели в иных условиях (например, в условиях распространения импульса) в модель не 'закладывалось'.
Таким образом, модель Ходжкина - Хаксли в значительной мере реализует применительно к процессам распространения возбуждения те цели, которые преследует математическое моделирование вообще: на основании небольшого числа исходных постулатов количественно описать и объяснить достаточно широкий круг явлений, прежде воспринимавшихся как не связанные между собой. В этом смысле модель Ходжкина-Хаксли близка к таким физическим моделям, как уравнения Максвелла, которые дают единое описание разнообразных электрических и магнитных явлений.
Уравнения Ходжкина-Хаксли могут быть применены для исследования процессов, происходящих в возбудимых средах с разной геометрией (ветвящиеся волокна, волокна переменного диаметра и т. д.). В этих случаях, качественное исследование труднее, чем в случае однородного волокна, и основным методом исследования становится численное нахождение соответствующих решений. Проведенные расчеты показали, например ([51, 52, 85]), что в окончаниях нервных волокон возникает явление типа гидравлического удара: когда импульс приближается к концу волокна, его скорость возрастает примерно вдвое; кроме того, увеличивается его амплитуда. Напротив, когда импульс подходит к месту расширения или разветвления волокна, его скорость и амплитуда падают (рис. 15
).
Рис. 15.
|
Интересные результаты были получены при анализе процессов, происходящих в местах ветвления нервного волокна [52]. Оказалось, что узел ветвления может выполнять роль логического элемента, реализующего основные логические операции над сигналами. В зависимости от диаметров трех сходящихся в узле ветвей, из которых по двум сигнал поступает к узлу ветвления (назовем их входами), а по одной выходит из него (эту ветвь назовем выходом), возможны следующие случаи:
a) поступление импульса хотя бы по одному из входов порождает импульс на выходе; иначе говоря, узел осуществляет логическую функцию 'или'
;
b) импульс на выходе возникает в том и только том случае, когда к узлу приходят одновременно два импульса, по обеим входным ветвям; это - логическая функция 'и'
;
c) импульс, приходящий по первому входу, не возбуждает выходную ветвь, а приходящий по второму входу - возбуждает ее. Однако, если сначала приходит импульс по первой входной ветви, а спустя некоторое время - по второй, то этот второй импульс тоже не возбудит выходную ветвь. Итак, возбуждение на выходе возникает в том и только в том случае, если второй вход возбужден, а первый нет, то есть импульс, приходящий по первой ветви, играет роль блокировки
*).
Как известно из математической логики, комбинируя указанные выше операции ('и', 'или', блокировка) можно получить любые логические функции.
Иначе говоря, в ветвящихся нервных структурах (таких, как, например, дендриты клеток) может происходить весьма сложная обработка информации. (Детальный качественный анализ этой возможности был проведен в работе Ю. И. Аршавского и др. [27, стр. 28-70]).
*) Причина здесь состоит в том, что импульс, приходящий по первой (достаточно тонкой) ветви, не может возбудить узел, но вызывает там некоторую натриевую инактивацию, приводящую к повышению порога возбудимости в узле.
Миелинизированные волокна
[<< | >>]
. В то время как у аксона кальмара вся мембрана играет роль электрического генератора, большая часть нервных волокон позвоночных работает несколько иначе. В этих волокнах мембранные генераторы расположены в некоторых определенных участках, в промежутках между которыми волокно покрыто слоем специального изолятора - миелина
. Можно показать, что такая структура волокна выгоднее, чем рассмотренная выше: при том же диаметре волокна и меньших затратах энергии она обеспечивает более высокую скорость распространения возбуждения. Кроме того, в миэлинизированных волокнах скорость распространения импульса иначе зависит от параметров волокна, чем в безмиэлиновых волокнах. В частности, в миэлинизированных волокнах скорость распространения прямо пропорциональна диаметру волокна, в то время как в безмиэлиновых волокнах она пропорциональна корню квадратному из диаметра. Модификация уравнений Ходжкина - Хаксли, соответствующая распространению возбуждения в миэлинизированных волокнах, была предложена Франкенхойзером.
У миелинизированных волокон толщина внутренней (проводящей) части волокна составляет примерно 0,7 толщины всего волокна (вместе с оболочкой) независимо от вида животного и диаметра волокна. Раштон (см. [40]) показал, что именно такое отношение обеспечивает максимальную скорость распространения импульса. Ясно, что если при фиксированном диаметре волокна слой миэлина очень тонок, то его емкость будет велика и ток, генерируемый возбудимым участком, будет долго заряжать эту емкость, что приведет к снижению скорости проведения. Если слой миэлина очень толстый, то проводящая часть волокна (протоплазма) будет очень тонкой и ее сопротивление будет велико, что также снижает скорость распространения импульса. Таким образом, имеется некоторая оптимальная толщина миэлиновой оболочки, при которой скорость проведения максимальна.
Расчеты Раштона показали, что максимальная скорость соответствует максимуму величины k2 ln (1/k)
, где k
- отношение внутреннего диаметра к наружному. Как легко убедиться, максимум этого выражения достигается при k=е1/2=0.62...
, то есть при значении, довольно близком к наблюдаемому в живых организмах.
Распространение возбуждения в сердце. Уравнения Нобла
[<< | >>]
. Механизм возбуждения в волокнах сердечной мышцы в принципе тот же, что в нервных волокнах, однако форма импульса, возникающего в сердце, существенно отличается от формы импульса, распространяющегося по нервному волокну. Нобл предложил модификацию уравнений Ходжкина-Хаксли, описывающую распространение возбуждения в волокнах сердечной мышцы. Уравнения Нобла аналогичны уравнениям Ходжкина-Хаксли; они также состоят из основного уравнения для потенциала и уравнений для величин n
, m
, h
, описывающих калиевый и натриевый токи, но коэффициенты в них имеют несколько иную структуру и, кроме того, калиевый ток в этом случае состоит из двух компонент.
Модель Нобла правильно воспроизводит общую форму сердечного потенциала и ряд других его свойств. Например, известно, что если сердечная мышца раздражается дважды, причем промежуток времени между этими двумя раздражениями достаточно мал, то импульс, возникающий в ответ на второе раздражение, будет короче нормального. Это же явление обнаруживается на модели Нобла. Модель Нобла правильно описывает изменение сопротивления мембраны в разные фазы потенциала действия и т. д. Некоторое изменение коэффициентов уравнений Нобла приводит к системе, в которой имеет место самопроизвольное ритмическое возбуждение мембраны, аналогичное периодической активности синусного узла сердца.
Однако имеются и некоторые расхождения между моделью Нобла и данными реальных физиологических экспериментов; так, например, расчет скорости распространения импульса с помощью модели Нобла дает величину примерно в пять раз меньшую, чем измеряемая в экспериментах. Эти расхождения в значительной степени связаны с тем, что структура реальных сердечных волокон (как и других мышечных волокон) значительно сложнее, чем те схемы, на которых основана модель Нобла. В частности, модель Нобла не учитывает того, что мышечные волокна имеют кроме наружной еще целый ряд внутренних мембран. А наличие этих мембран существенно меняет электрические свойства всей системы. Учет этого обстоятельства приводит к модели, в которой расчетная скорость проведения импульса отличается от наблюдаемой в эксперименте всего лишь вдвое. Однако, вполне удовлетворительного описания потенциалов действия сердца и процесса их распространения существующие модели не дают.
4.4 Модели нейрона. Нейронные сети:
<< | >>
Некоторые сведения из нейрофизиологии
[<< | >>]
. Нервные клетки
, или нейроны
, это те 'рабочие единицы', из которых состоит нервная система и благодаря которым животное или человек способны воспринимать внешние сигналы и управлять различными частями своего тела. Нейрон состоит из тела клетки и отростков: одного выходного отростка - аксона
и нескольких дендритов
. Сама нервная клетка обладает сходными с аксоном электрическими свойствами: в покое внутриклеточная среда имеет некоторый потенциал V0
(примерно 60-80 мв у млекопитающих), называемый потенциалом покоя. Если в результате внешнего воздействия или внутриклеточных процессов потенциал клетки превысит некоторую пороговую величину, клетка генерирует импульс, распространяющийся по ее аксону к другим клеткам - нервным, мышечным или железистым [46]. Подходя к другим нервным клеткам аксон ветвится, образуя на теле и дендритах этих клеток многочисленные окончания - так называемые синапсы. Через синапсы нервная клетка получает сигналы от других нейронов. Когда импульс подходит к окончанию нервного волокна, из этого окончания освобождается особое химическое вещество-передатчик или медиатор
; медиаторы изменяют потенциал той нервной клетки, на которую передается сигнал [19, 47]. В зависимости от типа медиатора потенциал этой клетки или приближается к порогу (тогда соответствующий синапс
называется возбуждающим
) или удаляется от него (тормозной синапс
). Когда на данный нейрон приходит достаточное число возбуждающих сигналов (или, точнее, когда разность между числом возбуждающих и тормозных воздействий достаточно велика), нейрон выдает импульс, который через аксон и синапсы передается на другие нейроны. В некоторых клетках достижение порогового значения потенциала (а следовательно и выдача импульса) может происходить полностью за счет внутриклеточных процессов. В этом случае говорят, что клетка обладает спонтанной активностью.
Мембрана, окружающая нервную клетку, обладает такими же свойствами, как мембрана нервного волокна, о которой шла речь в предыдущем параграфе. В частности, здесь действуют те же самые механизмы формирования и распространения импульса, основанные на изменении избирательной проницаемости мембраны по отношению к различным ионам.
Внутриклеточные процессы, в частности те, которые определяют наличие спонтанной активности, механизмы синаптической передачи и т. д. представляют большой интерес и их исследованию посвящено много работ. Мы, однако, сосредоточим свое внимание на несколько более формальной стороне дела, рассматривая в основном процессы передачи и переработки информации в нейронных ансамблях.
Формальные нейроны. Дискретная модель
[<< | >>]
. Под нейроном
, точнее формальным нейроном
, мы будем понимать некий элемент (его физическая природа нам безразлична), обладающий следующими свойствами:
входными
(они соответствуют рецепторам
, т. е. первичным датчикам органов чувств). Остальные нейроны называются внутренними
;
t
определяется некоторой величиной h
- порогом - и разностью между числом возбуждающих и тормозных импульсов, пришедших на данный нейрон в момент t - 1
*). (Время при этом удобно считать дискретным). Возбуждение наступает, если эта разность становится больше или равна h
.
*) В исходной модели Мак-Каллока и Питса тормозные синапсы были 'запрещающими', т. е. если в данный такт времени к нейрону приходил хотя бы один тормозной импульс, нейрон в следующем такте не возбуждался независимо от числа возбуждающих сигналов. |
Совокупность формальных нейронов, соединенных между собой синаптическими связями, называется (формальной) нервной или нейронной сетью
.
Понятия формального нейрона, формальной нейронной сети были сформулированы в работе Мак-Каллока и Питтса [1, стр. 362-384], опубликованной в 1943 г. Основной результат этой работы состоит в том, что любая логическая операция над сигналами может быть реализована с помощью некоторой нейронной сети.
Не останавливаясь на доказательстве этого общего утверждения, проиллюстрируем его простейшими примерами.
Рассмотрим сеть, изображенную на рис. 16А
. В этой сети имеются три входных нейрона (рецептора) и один внутренний. Входные нейроны связаны с внутренним синаптическими связями. Пусть порог внутреннего нейрона равен 1
. Такая сеть реализует логическую функцию 'или'
, т. е. внутренний нейрон возбуждается, как только приходит сигнал хотя бы от одного рецептора.
Если в той же сети, изображенной на рис. 16А
, положить порог внутреннего нейрона равным 3
, то мы получим логическую функцию 'и'
: внутренний нейрон возбуждается, когда возбуждены все три рецептора. Сеть, изображенная на рис. 16Б
, содержит пять рецепторов, из которых три имеют на внутреннем нейроне возбуждающие синаптические окончания, а два - тормозные (первые изображены светлыми, а вторые-черными кружками).
Если порог внутреннего нейрона равен 3
, то этот нейрон возбуждается в том случае, когда первые три рецептора возбуждены, а последние два находятся в покое.
В приведенных примерах речь шла о реализации в нейронных сетях некоторых абстрактных логических функций. Рассмотрим более 'физиологичный' пример. Известна следующая иллюзия восприятия. Если на мгновение приложить к коже холодный предмет и сейчас же его убрать, то возникнет ощущение тепла, в то время как при более длительном контакте с холодным предметом возникает лишь ощущение холода без какого-либо, хотя бы кратковременного, ощущения тепла. Покажем, что именно такой эффект реализуется нейронной сетью, предложенной Мак-Каллоком и Питтсом и изображенной па рис. 16В
.
Входной нейрон этой сети представляет собой рецептор, который возбуждается под действием холода; выходные нейроны - это нейроны, вызывающие ощущение холода (3) или тепла (4); порог каждого из внутренних нейронов этой сети равен 2
. Напомним, что время мы считаем разбитым на дискретные интервалы - такты. Покажем, что если рецептор возбужден в течение одного такта, то возникает ощущение тепла, а если он возбужден в течение двух или больше тактов, то возникает ощущение холода.
Итак, пусть рецептор холода возбужден в момент t = 1
. В момент t = 2
возбудится нейрон 1, нейрон 2 получит тормозной импульс, а нейрон 3 - единичный (то есть подпороговый) возбуждающий импульс. В момент t = 3
возбудится нейрон 2, а нейрон 3 снова получит единичное, то есть подпороговое возбуждающее воздействие. Наконец, в момент t = 4
нейрон 2 возбудит нейрон 4 и возникнет ощущение тепла.
Если же рецептор оставался возбужденным и в момент t = 2
, то в момент t = 3
нейрон 2 получит лишь подпороговое воздействие (два возбуждающих импульса и один тормозной), а следовательно он не сможет вызвать возбуждение нейрона 4. Напротив, нейрон 3 в момент t = 3
получит два возбуждающих импульса (один от рецептора, возбужденного в момент t = 2
, а другой от нейрона 1) и в результате возникнет ощущение холода.
Установление того факта, что с помощью формальных нейронных сетей можно, в принципе, реализовать любую обработку информации, еще не означает, что мы действительно познали основные законы работы нервной системы.
Прежде всего, хотя для нервных клеток характерен принцип 'все или ничего'
, то есть наличие двух четко выраженных состояний - покоя и возбуждения, - из этого никак не следует, что в нашей нервной системе информация, как в универсальной вычислительной машине, обязательно реализуется с помощью двоичного кода, состоящего из нулей и единиц. Весьма вероятно, что в нервной системе используется представление информации с помощью длин интервалов между импульсами, средних частот импульсации и т. д.Вообще, в нервной системе нет, видимо, такого резкого разделения способов представления информации на 'цифровые' (дискретные) и 'аналоговые' (непрерывные), какое имеется в современной вычислительной технике.
Вероятно, в реальной нервной системе нет и той степени детерминированности, какую мы видим в формальных нейронных сетях Мак-Каллока и Питтса, где выпадение или, наоборот, появ-ление одного лишнего импульса может радикально изменить работу всей системы. (Например, в рассмотренной выше схеме восприятия тепла и холода разница в один импульс меняет ощущение на противоположное.)
В связи с этим возник ряд моделей нейронов и нейронных сетей, в которых нейрон рассматривается как аналоговый элемент, то есть устройство, состояние которого может непрерывно меняться от полного покоя до некоторого максимального уровня возбуждения. Нейронные схемы из таких элементов позволяют выполнять логические операции над непрерывными величинами. Логику операций с непрерывными величинами часто называют 'нейронной' или 'непрерывной' логикой
.
Аналоговые модели нейрона. Непрерывная логика
[<< | >>]
. Будем под аналоговыми нейронами понимать некоторое устройство, имеющее k
входов, на каждый из которых может поступать соответствующая непрерывно меняющаяся величина F1, ..., Fk
. Такими величинами могут быть, например, частоты соответствующих серий импульсов. Величинами входных сигналов F1, ..., Fk
определяется значение некоторого результирующего параметра p
, характеризующего уровень возбуждения нейрона р = р(F1,... ,Fk)
. Функция р (F1, ..., Fk)
может иметь различный вид. Можно, например, считать ее линейной:
Здесь si
- веса соответствующих синаптических контактов. Если si > 0
, то соответствующий синапс - возбуждающий, если si < 0
- тормозной.
Значение p
в свою очередь определяет выходной сигнал F
(например частоту импульсации данного нейрона). Зависимость выходного сигнала F
от p
также может быть различной. Обычно, в соответствии с физиологическими данными, считают, что эта зависимость (называемая характеристикой нейрона) имеет вид, изображенный на рис. 17А
, то есть она линейна вплоть до определенного уровня, за которым наступает насыщение.
Рассмотрим, следуя [32], некоторые простейшие операции непрерывной логики и реализующие эти операции сети из аналоговых нейронов. Будем при этом считать, что каждый нейрон функционирует лишь в пределах линейного участка своей характеристики, то есть что насыщения не наступает. Если имеется один нейрон, у которого есть и возбуждающие и тормозные входы, то он реализует функцию
(здесь хi
- входные частоты, si
- веса соответствующих входов).
Рассмотрим сеть из трех нейронов, изображенную на рис. 17Б
. Здесь, как и прежде, светлые кружки изображают возбуждающие входы (с весами 1
), а черные кружки - тормозные (с весами -1
). Эта сеть реализует функцию
y = |x1 - x2|.
Действительно, пусть на входы схемы поступают величины х1
и x2
. Если, х1 > x2
. то нейрон 2 заторможен, а на выходе нейрона 1 имеется сигнал х1 - x2
, который проходит без изменений на выход нейрона 3. Если же х2 > x1
, то заторможен нейрон 1 и на выходе сети получается сигнал х2 - x1
.
Рассмотрим еще один пример. Сеть, изображенная на рис. 17В
, реализует выбор максимума из двух величин:
y = max(х2, x1).
Действительно, пусть для определенности х1 > x2
, тогда нейрон 2 заторможен, нейрон 1 посылает нейрону 3 сигнал (х1 - x2) / 2
*) и кроме того, на нейрон 3 непосредственно приходят сигналы х1 / 2
и х2 / 2
. В результате получаем на выходе нейрона 3 сигнал х1
. Если х2 > x1
, то, как показывают аналогичные рассуждения, на выходе сети получим сигнал х2
.
*) Деление сигнала на 2 изображено на рисунке уменьшением числа возбуждающих синапсов от двух до одного. |
Легко проверить, что ту же функцию y = max(х2, x1)
реализует и сеть, изображенная на рис. 17Г
, хотя внешне эти сети выглядят совсем разными. Нетрудно указать сети из аналоговых нейронов, реализующие некоторые другие логические операции над непрерывными величинами, например, нахождение минимума двух величин, сравнение, то есть функцию
и т. д. (рис. 17Д, Е
).
За последние два десятилетия непрерывной логике было посвящено довольно много работ (см., например, [32] и указанную там литературу), однако по сравнению с 'обычной' математической логикой, оперирующей величинами, принимающими лишь два значения ('да - нет', 'истинно - ложно') непрерывная логика еще находится в начальной стадии развития.
Нейронные сети с латеральным торможением
[<< | >>]
. Среди немногих известных в настоящее время общих принципов работы нейронных сетей, реализующих те или иные физиологические функции, один из самых интересных и важных - это принцип так называемого латерального (бокового) торможения
.
Явление латерального торможения было детально изучено на сложном глазе мечехвоста (подробнее см. [9], [38, стр. 373-400] и указанную там литературу). Глаз мечехвоста состоит примерно из 1000 отдельных воспринимающих свет единиц - омматидиев
. Если регистрировать электрическую активность в нервном волокне, идущем от одного омматидия, то можно обнаружить, что электрические ответы на световое раздражение возникают только в том случае, когда свет попадает именно на этот омматидий. На освещение соседних омматидиев данный омматидий не реагирует. Это не значит, однако, что разные омматидий никак не влияют друг на друга. Оказалось, что частота импульсации в волокне зрительного нерва, идущего от данного омматидия, понижается, если освещать не только его, но и соседние омматидий. При этом тормозное влияние данного омматидия на другие тем сильнее, чем ярче он освещен и чем ближе к нему находятся эти другие. Схема нейронной сети с латеральным торможением изображена на рис. 18
.
В чем же состоит роль этого взаимного торможения (поскольку каждый элемент тормозит соседние с ним, это явление и получило название латерального, или бокового торможения)? Прежде всего латеральное торможение усиливает резкость контуров воспринимаемого глазом зрительного образа. В самом деле, допустим, что часть омматидиев освещена сильно, а часть слабо и рассмотрим слабо освещенный омматидий, вблизи которого имеются ярко освещенные. Такой омматидий будет испытывать более сильное торможение, чем те слабо освещенные омматидий, все соседи которых слабо освещены.
Точно так же ответы сильно освещенного омматидия, лежащего вблизи границы света и тени, будут интенсивнее, чем у такого же сильно освещенного омматидия, все соседи которого тоже ярко освещены. В результате этого ярко освещенная область вблизи затемненной будет казаться особенно светлой, а затемненная будет казаться особенной темной на границе с освещенной. Иначе говоря, латеральное торможение позволяет зрительной системе подчеркивать световые контрасты, что увеличивает четкость контуров предметов. Количественная модель преобразования изображений глазом мечехвоста была разработана В. Рейхардом [38, стр. 373-400]. Он оценил, в какой мере латеральное торможение исправляет недостатки оптической системы такого глаза, обостряя контрасты освещенности и подчеркивая контуры изображений.
Хотя латеральное торможение было открыто при изучении весьма специального объекта - глаза мечехвоста, на самом деле это один из весьма общих принципов работы нервной системы. Латеральное торможение обнаружено в сетчатке позвоночных, в слуховой системе, в системе осязания и т. д. По-видимому, именно латеральным торможением объясняется в значительной мере *) явление контраста, хорошо известное нам из повседневной жизни и детально изучавшееся в ряде психофизиологических экспериментов.
*) Наряду с латеральным торможением в сетчатке, определенную роль в явлениях контраста играют процессы, происходящие в зрительных отделах мозга. |
Так, например, неосвещенный экран в кинозале нам кажется серым, а когда на него проектируется какой-либо чертеж или надпись, буквы и линии кажутся нам на ярко освещенном фоне совсем черными, хотя на самом деле они, конечно, не могут быть темнее поверхности неосвещенного экрана. Стандартным объектом для демонстрации контраста может служить серый круг, часть которого расположена на белом, а часть - на черном фоне. Часть круга, расположенная на черном фоне, кажется светлее, чем расположенная на белом. Если круг сделать вращающимся, то кажется, что при повороте круга происходит изменение окраски различных его частей.
Нейронные сети с латеральным торможением рассматривались в ряде теоретических работ. В частности, анализ работы таких сетей при разных радиусах действия латеральных тормозных связей был проведен Н. В. Позиным и его сотрудниками [32]. Оказалось, что в зависимости от условий сеть с латеральными связями может осуществлять различные преобразования входного сигнала. Например, если на слой нейронов с латеральными связями поступает сигнал, имеющий вид колокола (рис. 19А
), то при соответствующем выборе связей происходит преобразование его в такой же сигнал с более резким максимумом (операция обострения максимума). Прямоугольный сигнал (рис. 19Б
) может преобразовываться в зависимости от его ширины или в сигнал с выраженным максимумом, или в сигнал с выделенными краями (рис. 19В
). Более сложные преобразования можно получить, рассматривая прохождение сигнала через многослойную нейронную структуру с латеральными связями (подробное изложение этих вопросов см. в [32]).
Рассмотрим роль нейронных сетей с латеральными связями в анализе звуковых сигналов ([32], [34, стр. 262-290]), в частности в определении высоты звука.
Звуковые волны, достигая уха, заставляют колебаться так называемую основную мембрану, вдоль которой расположены волосковые клетки - рецепторы органа слуха. Упругость различных участков основной мембраны различна, поэтому звук определенной высоты вызывает колебания лишь некоторого участка основной мембраны. Таким образом осуществляется первый этап кодирования звуковой информации: определенной высоте звука соответствует определенное положение максимума возбуждения основной мембраны. Однако точность этого преобразования очень мала: даже сигнал, состоящий лишь из колебаний точно фиксированной частоты, возбуждает значительную часть (порядка 1/3) мембраны, и, следовательно, значительную часть рецепторных клеток. В силу этого, зоны возбуждения, отвечающие даже сравнительно далеким частотам, довольно сильно перекрываются. Казалось бы, разрешающая способность уха должна быть, в силу этих обстоятельств, очень низка. На самом же деле человек отчетливо улавливает изменение высоты тона на 0,5% (т. е., скажем, различает частоты в 1000 и 1005 герц). Как же согласовать между собой эти факты?
Еще в 1951 г. Ликлайдер и Хиггинс выдвинули предположение, что высокая избирательная чувствительность слуховой системы в целом обусловлена работой нейронной сети с латеральными связями.
Позже эта мысль с учетом имеющихся экспериментальных данных о строении слуховой системы была развита в работах Н. В. Позина и ряда других авторов (см. [32] и указанную там литературу). Детальный анализ соответствующей модели показывает, что обработка сигналов в многослойной сети из нейронов с латеральными связями действительно может обеспечить такую разрешающую способность, какой обладает слуховая система человека. Последовательное изменение сигналов при прохождении через такую многослойную сеть показано на рис. 20
.
До сих пор речь шла о значении латерального торможения в функционировании органов чувств. Однако латеральное торможение играет, видимо, существенную роль и в ряде других явлений. Так, например, группы нейронов, близко расположенных друг к другу и имеющих сходные функции, проявляют тенденцию к синхронизации (об этом подробно говорилось еще в 2). Но в ряде случаев такая синхронизация может быть крайне нежелательна. Например, при работе группы мотонейронов, относящихся к одной мышце, такая синхронизация привела бы к замене плавного движения серией рывков. Было высказано предположение [61], подтвержденное затем модельными экспериментами на вычислительных машинах [42, стр. 212-227], что тормозное влияние каждого из нейронов, входящих в данную группу, на все остальные, может играть десинхронизирующую роль и тем самым обеспечивать возможность заданного плавного изменения той или иной величины (например, напряжения мышцы), передаваемой с помощью нервных импульсов, исходящих от некоторого нейронного ансамбля.
Рис. 21.
Сеть с латеральным торможением для измерения расстояния (для простоты указаны только тормозные связи, идущие от одного элемента).
|
Рассмотрим еще роль латерального торможения при измерении (оценке на глаз) расстояния между двумя точками (вопроса о том, как глаз выделяет эти две точки и как они проецируются со зрительного поля на измеряющую сеть, мы здесь не касаемся). Ограничимся простейшей одномерной моделью. Пусть сеть представляет собой цепочку нейронов, каждый из которых оказывает некоторое тормозное воздействие на все остальные (рис. 21
), и пусть две точки, расстояние l
между которыми надо измерить, спроецированы на два нейрона этой цепочки (близкие между собой, если расстояние между точками мало, и далекие, если оно велико), так что эти два нейрона получают всегда одинаковые стандартные входные сигналы. Если сделать естественное допущение, что близкие нейроны цепочки тормозят друг друга сильнее, чем далекие, то суммарный сигнал P
на выходе системы будет тем больше, чем больше расстояние между двумя возбужденными нейронами. Можно, в частности, выбрать тормозные связи между нейронами цепочки так, чтобы выходной сигнал был прямо пропорционален измеряемому расстоянию.
Конечно, приведенными примерами не исчерпываются функциональные возможности латеральных тормозных связей, играющих фундаментальную роль в работе многих отделов нервной системы.
Нейронные сети со случайными связями. Статистика нейронных ансамблей
[<< | >>]
. Вопрос о том, в какой мере структура связей в нервной системе предопределена генетически, а в какой является следствием тех или иных случайных обстоятельств развития далеко не ясен. Трудно, однако, предполагать, что генетической информации, содержащейся в зародышевой клетке, было бы достаточно для точной фиксации всех межнейронных связей в организме, где число нейронов составляет многие миллиарды. Впрочем, даже, если бы эти связи были вполне детерминированы, уже само количество нейронов и межнейронных связей делает естественным и допустимым статистический подход к исследованию таких ансамблей *).
*) В статистической физике движения молекул, составляющих данный объем газа, рассматриваются как случайные, хотя, конечно, задание координат и скоростей всех молекул газа в некоторый момент полностью определяет движение каждой молекулы в сколь угодно далеком будущем. |
Поэтому рассмотрение нейронных сетей со случайными связями между ними и случайными значениями порогов возбудимости и других параметров достаточно оправдано. По аналогии со статистической физикой и термодинамикой, где интерес представляют не движения отдельных молекул, а такие интегральные характеристики системы как давление, температура, энтропия и т. д., для больших нейронных ансамблей тоже интересно было бы найти параметры, характеризующие не отдельные нейроны, а систему в целом. Одна из задач, которая рассматривалась для нейронных сетей со случайными связями, в частности, с помощью моделирования на вычислительных машинах, это задача о существовании в такой сети устойчивого, самоподдерживающегося уровня активности и о характере колебаний этой активности вокруг среднего значения. Возможно, что результаты такого исследования окажутся полезными для понимания происхождения разных волн электроэнцефалограмм и для выяснения условий, при которых возникает лавинная активность типа эпилептических разрядов.
В работах Л. И. Розоноэра [81] было показано, что в сети, содержащей несколько типов нейронов, с различными значениями порогов, возможно несколько различных устойчивых уровней активности. Круг вопросов, который можно назвать 'статистической нейрофизиологией', систематически изложен в недавно вышедшей книге английского нейрофизиолога Б. Бернса [5], само название которой - 'Неопределенность в нервной системе' - достаточно хорошо характеризует ее направленность.
Сеть из большого числа нейронов со случайными связями в некотором приближении может рассматриваться как непрерывная возбудимая среда. Синаптический характер передачи возбуждения обусловливает ряд особенностей распространения волн в таких средах. Например, в таких сетях возможно с некоторой вероятностью прохождение двух волн 'друг сквозь друга', что совершенно исключено в средах с электрической передачей возбуждения. Сотрудники Л. И. Розоноэра показали, что в синаптических средах некоторая ограниченная возбужденная область может распространяться, не меняя своей величины и формы. Берль [33, стр. 358-387] впервые рассмотрел условия, при которых в двумерной нейронной сети со случайными связями могут возникать и распространяться волны с устойчивой амплитудой, а также возможность использования сетей такого типа для моделирования обучения (см. [12, стр. 141-155]).
Нейронные генераторы ритмов
[<< | >>]
. Сложные сети, составленные из формальных нейронов Мак-Каллока и Питтса или из аналоговых нейронов, могут выполнять самые различные логические операции. Наряду с такими универсальными сетями интерес представляют и специализированные нейронные структуры, состоящие из небольшого числа элементов и выполняющие те или иные конкретные регуляторные или сенсорные функции. Сейчас мы рассмотрим один тип таких структур - так называемые генераторы ритмической активности. (Другой важный пример специализированных нейронных структур - это зрительные детекторы; о них будет сказано в следующем параграфе.)
Среди жизненно важных биологических процессов существенное место занимают различные периодические процессы - дыхание, ходьба и т. д. Поскольку все такие процессы должны управляться какими-то отделами нервной системы, естественно возникает вопрос, как организовать взаимодействие элементов в некотором нейронном ансамбле для того, чтобы этот ансамбль обладал устойчивой периодической активностью. Вообще говоря, эта задача может быть решена разными способами, но при моделировании тех или иных конкретных периодических процессов возникает ряд дополнительных условий и ограничений, существенно усложняющих построение соответствующей модели.
Естественной характеристикой различных периодических процессов в нейронных ансамблях может служить отношение периода процесса к средней длине межимпульсных интервалов, входящих в ансамбль нейронов. Известны процессы, период которых много меньше длины межимпульсных интервалов. Это - колебания, обусловленные синаптическими задержками в межнейронных связях (мы не будем их здесь рассматривать). Далее следуют процессы, связанные с синхронизацией нейронов и имеющие период того же порядка, что и длины межимпульсных интервалов. Таковы, например, ритмические возбуждения активных сред типа сердечной мышцы, о которых говорилось в первых параграфах этой главы. Пожалуй, наибольший интерес представляет механизм 'медленных' ритмических процессов, у которых период колебаний много больше, чем длительность межимпульсных интервалов. Типичным примером таких процессов может служить дыхание. Так у человека и у многих других млекопитающих период дыхания - несколько секунд, а длительность межспайковых интервалов нейронов дыхательного центра - всего лишь сотни или даже десятки миллисекунд.
Одна из первых моделей работы дыхательного центра была предложена Б. Бернсом в 1960 г.
Экспериментально установлено наличие в дыхательном центре нейронов двух типов - инспираторных
(т. е. активных при вдохе) и экспираторных
(т. е. активных при выдохе). Бернс предположил, что эти два нейронных ансамбля оказывают тормозное влияние друг на друга, образуя два реципрокных полуцентра. Нейроны одного типа, напротив, связаны возбуждающими связями. Работа дыхательного центра, согласно Бернсу, происходит следующим образом. Пусть в какой-то момент инспнраторные нейроны возбуждены, а экспираторные нет. Тогда инспираторные нейроны, возбуждая друг друга, будут работать все интенсивнее, а экспираторные нейроны будут заторможены. Но в какой-то момент наступает утомление инспираторных нейронов и их активность уменьшается. При этом уменьшается их тормозное воздействие на экспираторные нейроны, активность которых начинает, наоборот, возрастать и т. д. В результате возникает периодический режим. Период этого процесса будет велик по сравнению с длинами межимпульсных интервалов (а именно так и обстоит дело в дыхательном центре), если каждый из полуцентров, нейроны которого связаны между собой возбуждающими связями, 'разгорается' до максимального уровня активности достаточно медленно. Ситуация здесь напоминает запуск ядерного реактора: там время от вылета нейтрона из ядра до попадания его в другое ядро (что сопровождается вылетом новых нейтронов) весьма мало, но, если коэффициент размножения нейтронов близок к единице, то время выхода реактора на заданную мощность может измеряться часами.
Слабая сторона модели Бернса - это прежде всего необходимость постулировать утомление нейронов, для чего нет достаточных экспериментальных данных. Кроме того, нужно предположить, что в каждом из полуцентров происходит медленное самовозбуждение, то есть, говоря языком техники, что каждый из этих полуцентров работает по принципу положительной обратной связи
с коэффициентом, весьма близким к единице. При этом получится очень неустойчивая система: как показывают расчеты, для того, чтобы в такой системе обеспечить сохранение периода с точностью до 10%, необходимо стабилизировать параметры системы с точностью около 0,1%. Иначе говоря, здесь из устойчивых элементов строится довольно неустойчивая система. А для живой природы характерна прямо противоположная ситуация - использование систем, устойчивость которых в целом существенно превосходит устойчивость отдельных элементов.
Другой тип моделей, генерирующих медленную ритмическую активность, основан на идее 'тормозного кольца'
(см. [32, 66]). Рассмотрим в качестве простейшего примера три нейрона, обладающих спонтанной активностью и связанных между собой так, что нейрон 1 тормозит нейрон 2, тот, в свою очередь, тормозит нейрон 3, который тормозит нейрон 1. Пусть тормозное воздействие таково, что заторможенный нейрон полностью прекращает свою активность на все время торможения и еще на некоторое время t
после прекращения торможения. В такой системе будет устойчив режим работы с периодом, равным (примерно) Зt
. Можно, очевидно, построить аналогичную схему из любого числа нейронов. Целесообразно рассматривать кольцевые генераторы, элементами которых служат не отдельные нейроны, а целые группы параллельно работающих нейронов. Такие генераторы не только могут реализовывать режимы с большим периодом, но и обладают достаточной живучестью: выход из строя небольшой части нейронов мало меняет параметры генератора. Нейронные генераторы ритмов, построенные по принципу тормозного кольца, обладают широкими функциональными возможностями и реализуются с помощью достаточно естественных для нервной системы механизмов. Кольцевые генераторы могут быть, видимо, полезны для моделирования периодических движений типа ходьбы или бега; в управлении такими движениями участвует несколько групп мотонейронов, причем максимальная активность различных групп приходится на разные фазы двигательного цикла.
Один из наиболее детально исследованных процессов, связанных с периодической активностью нейронных ансамблей - это полет насекомых (см. обзор Вилсона и Уилдроу [18, стр. 182-188]). Движения крыла при полете управляются двумя группами мотонейронов - опускающих крыло и поднимающих его. Эти группы подобно инспираторным и экспираторным нейронам дыхательного центра работают в противофазе, то есть когда мотонейроны одной группы дают вспышку импульсов, мотонейроны другой группы бездействуют. Каждый такой нейрон работает отдельными вспышками импульсов, разделенными паузами. Внутри каждой вспышки межимпульсные интервалы постепенно укорачиваются. Таким образом, нейрон начинает работать с малой частотой, затем постепенно разгоняется, а достигнув некоторой определенной частоты резко выключается. При более энергичном полете растет частота вспышек, а также число импульсов в отдельной вспышке и ее длительность.
В известной мере работа мотонейронов - опускателей и поднимателей крыла - напоминает работу дыхательного центра, состоящего из инспираторных и экспираторных нейронов, но на самом деле положение здесь несколько сложнее; например, у насекомых возможна ситуация, когда одна группа мотонейронов (скажем, подниматели крыла) периодически работает, в то время как другая полностью выключена. Установление этого факта заставило моделировать подниматели и опускатели крыла раздельно. При этом возник отдельный вопрос о фазировании этих двух генераторов (при построении полной модели полета приходится решать еще и задачу о фазировании передней и задней пары крыльев, фазовый сдвиг между которыми может составлять, например, 30њ).
Существуют некоторые модели генераторов, управляющих полетом насекомых, основанные на той же идее постепенного 'разгорания' и наступающего затем 'утомления' нейронных ансамблей, что и предложенная Бернсом модель дыхательного центра. Мы уже отмечали слабые стороны этой идеи. Вместе с тем формально эта модель, при подходящем выборе параметров входящих в нее элементов ведет себя весьма сходно с мотонейронными ансамблями насекомых. Другой вариант модели, также достаточно хорошо имитирующей особенности работы мотонейронов при полете, - двухслойная сеть с реципрокным торможением. Ни одну из этих моделей нельзя, видимо, рассматривать как достаточно полное решение вопроса о механизме управления полетом. Возникающая здесь ситуация довольно типична. Построение грубой модели (нейронного генератора ритмов вообще) не представляет больших трудностей. Но разработка действительно 'хорошей', то есть адекватной объекту модели, трудна и требует достаточно детального изучения свойств самого объекта. При этом сопоставление различных вариантов модели часто подсказывает идеи новых экспериментов.
Обучающиеся сети. Перцептрон
[<< | >>]
. Наряду с нервными сетями с фиксированной структурой, предназначенной для решения тех или иных определенных задач, в последнее время интерес исследователей привлекают модели таких сетей, у которых структура или интенсивность связей между элементами меняется в результате обучения. Подобные конструкции использовались для моделирования условных рефлексов, процесса обучения и особенно для распознавания образов.
Первая модель, позволившая в упрощенной форме воспроизвести и исследовать возможные механизмы обучения, была предложена в 1954 г. Б. Ферли и У. Кларком (см. [15])
. Эта модель представляла собой нервную сеть, реализованную в виде программы для вычислительной машины. На этой модели проверялась неоднократно высказывавшаяся биологами идея о том, что в основе обучения лежит так называемое 'проторение путей'
, то есть возникновение и усиление именно тех связей между элементами сети, которые нужны для решения данной (многократно повторяющейся) задачи.
Эта модель представляла собой сеть нейронов со случайными связями. При возбуждении внешним стимулом определенной группы входных нейронов сеть должна была отвечать возбуждением некоторой определенной группы выходных нейронов. Требуемое состояние сети достигалось в процессе обучения путем изменения эффективности связей между нейронами и изменения порогов возбуждения нейронов.
Начиная с конца 50-х годов работы по исследованию обучающихся нейронных сетей развивались в значительной мере в связи с задачей распознавания образов. Эта проблема не случайно привлекла внимание как биологов и психологов, так и инженеров и математиков. Распознавание образов лежит в основе механизма принятия решений, поскольку, прежде чем принять то или иное решение, нужно уяснить ситуацию.
Далее, поскольку строго тождественных ситуаций, не существует, возникает вопрос о группировке сходных ситуаций
, то есть проблема классификации и выработки общих понятий. Наконец, те задачи распознавания образов, для решения которых в организме нет врожденных жестких механизмов, непосредственно связаны с проблемой обучения.
С другой стороны, проблема распознавания образов имеет важное практическое значение в связи с конструированием машин для чтения печатных и рукописных текстов, созданием управляемых голосом автоматов, разработкой машинных методов медицинской диагностики и т. д. Этим объясняется то большое внимание, которое эта проблема привлекла к себе в последнее время (см., например, [4, 7, 8, 35]). К проблеме распознавания образов мы еще вернемся в следующей главе.
С 1957 г. началась публикация работ Ф. Розенблатта, посвященных применению к задаче распознавания образов обучающихся нейронных сетей со случайными связями, названных Ф. Розенблаттом перцентронами
[36].
Схема перцептрона основана на идеях Ферли и Кларка о 'проторении путей', дополненных представлениями о слоистой структуре сетчатки. Перцептрон состоит из элементов трех типов:
S
-элементов, A
-элементов и R
-элемента (последний имеется в единственном числе).S
-элементы образуют первый слой - слой рецепторов. Эти рецепторы соединены с A
-элементами, образующими второй слой, с помощью связей, которые могут быть возбуждающими или тормозными. Каждый рецептор может находиться в одном из двух состояний - покоя или возбуждения. A
-элементы (ассоциативные элементы) представляют собой сумматоры с порогом. Это значит, что A
-элемент возбуждается, когда алгебраическая сумма возбуждений, приходящих к нему от рецепторов, превышает определенную величину - его порог. При этом сигнал от рецептора, приходящий по возбуждающей связи, считается положительным, а приходящий по тормозной связи - отрицательным. Сигналы от возбудившихся A
-элементов передаются в сумматор R
, причем сигнал от i
-го ассоциативного элемента передается с коэффициентом ki
.
Система связей между рецепторами и A
-элементами, так же, как и пороги A
-элементов, выбираются некоторым случайным, но фиксированным образом, а обучение состоит лишь в изменении коэффициентов ki
. Это обучение может идти по следующей схеме. Пусть сперва все ki
равны нулю. Мы хотим 'научить' перцептрон различать объекты двух классов, скажем круги и квадраты. Мы 'показываем' ему объект первого класса. При этом некоторые A
-элементы возбудятся. Коэффициенты ki
, отвечающие этим возбужденным элементам, увеличим на 1. Затем 'показываем' объект из второго класса и коэффициенты элементов, которые возбудятся при этом показе, уменьшаем на 1. Этот процесс продолжается, пока не будет исчерпан весь материал, предназначенный для обучения. В результате обучения сформируются некоторые значения коэффициентов ki
. После этого такому 'обученному' перцептрону предъявляется объект, не входивший в материал для обучения. Возбудившиеся A
-элементы передают R
-элементу сигнал, равный сумме соответствующих коэффициентов ki
. Если эта сумма положительна, то принимается решение, что предъявленный объект принадлежит первому классу, а если она отрицательна - то второму.
Из сказанного видно, что перцептрону присущи следующие особенности:
На первый взгляд кажется, что такая система вообще ничему не может научиться. Например, мы хотим научить перцептрон отличать вертикальные полосы от горизонтальных. Спроецируем сначала на слой рецепторов вертикальную полосу. В соответствии со сказанным выше мы должны увеличить коэффициенты у всех сработавших при этом ассоциативных элементов. После этого предъявим перцептрону горизонтальную полосу и, в соответствии со сказанным выше, уменьшим коэффициенты, отвечающие возбудившимся при этом A
-элементам. Но среди A
-элементов, которые сработали в первый и во второй раз, могут быть общие. В первый раз мы увеличили их коэффициенты, а во второй - уменьшили. Кажется что результаты последующих 'уроков' могут уничтожить предыдущие достижения. Тем не менее при строгом анализе процесса обучения перцептронов было показано, что независимо от начального значения коэффициентов и независимо от порядка показа образцов при обучении перцептрон за конечное число шагов научится различать два класса объектов, то есть подберет нужные значения коэффициентов, если только вообще существуют такие значения, при которых эти классы разделяются. Это утверждение обычно называют теоремой о сходимости перцептрона
. Таким образом, несмотря на простоту конструкции и алгоритма работы, перцептрон может научиться различать два класса объектов. Однако здесь принципиально важна оговорка, содержащаяся в формулирове теоремы: обязательно научится, если только эти два класса вообще могут быть различены перцептроном.
Теорема ничего не говорит о том, какие же классы могут быть разделены. К сожалению, реальные возможности трехслойных перцептронов оказались не слишком велики. Кроме того, хотя в теореме и говорится, что время обучения псрцептрона конечно, никаких оценок скорости обучения не дается. Между тем для многих задач время обучения оказалось чрезвычайно велико. По этим причинам надежды на использование перцептронов в технических устойствах не оправдались.
Рис. 22.
|
Исследования показали, что слабые стороны перцептронов (в частности большое время обучения) в значительной степени связаны со случайностью связей между его элементами. Однако эта конструктивная особенность обеспечивает перцептрону и положительное качество - надежность: выход из строя заметного числа элементов перцептрона слабо сказывается на качестве его работы
(рис. 22
). Анализ перцептронов оказался весьма полезен и для биологов и для математиков. Простота перцептрона сделала его удобной моделью процессов распознавания и обучения, а его исследование позволило поставить ряд важных вопросов. При этом интересными оказались и отрицательные результаты анализа. Так, например, было показано, что перцептрон, у которого ассоциативные элементы собирают сигналы только с рецепторов, расположенных в небольших ограниченных участках сетчатки, не могут решить вопрос о том, односвязна предъявляемая фигура или нет. Этот результат важен для биологов, так как он показывает, что в зрительной системе животных, которые справляются с этой задачей, имеются механизмы более сложные, чем простое синаптическое суммирование сигналов от отдельных рецептивных полей сетчатки. Однако, вероятно, наиболее важные вопросы изучение перцептронов поставило перед математиками.
Один из таких принципиальных вопросов - различие между теоретической и реальной осуществимостью тех или иных процессов.
Выше уже говорилось, что задачи, которые в принципе могут быть решены перцептронами, могут потребовать нереально больших времен. Другой пример: как показано в работе М. Минского и С. Пейперта [26], для различения некоторых классов объектов перцептронами коэффициенты части ассоциативных элементов должны быть столь велики, что для хранения их в вычислительной машине потребовался бы больший объем памяти, чем для того, чтобы просто запомнить все конкретные объекты этих двух классов.
Другой важный вопрос, представляющий особый интерес для вычислительной математики, таков. Перцептрон - типичная машина параллельного действия: все ассоциативные элементы собирают сведения от рецептонов и суммируют их одновременно и независимо друг от друга. Однако значительная часть ассоциативных элементов работает при этом вхолостую, так как их данные не оказывают влияния на результат. При этом общее количество вычислений может намного превысить то количество, которое должно быть проведено при хорошо организованном последовательном процессе, когда решение о том, что вычислять далее, выносится на основе результата предыдущего вычисления. В каких же случаях выгодно использовать параллельный счет (то есть когда выигрыш во времени перекрывает затраты на добавочные вычисления)? Эти и другие математические вопросы, возникшие при анализе перцептронов, живо и увлекательно изложены в книге М. Минского и С. Пейперта [26]. Между прочим, в ней показано, как трудная задача о числе односвязных фигур, спроецированных на сетчатку, может быть быстро решена коллективом взаимодействующих автоматов с помощью последовательной процедуры.
4.5 Зрительная система и ее функции:
<< | >>
Зрение - важнейший канал, по которому к нам поступают сведения о внешнем мире. Поговорка 'лучше одни раз увидеть, чем сто раз услышать' справедлива, между прочим, и с чисто информационной точки зрения: количество информации, которое мы воспринимаем с помощью зрения, несравненно больше, чем воспринимаемое другими органами чувств.
Глаз представляет собой орган, служащий одновременно и оптической системой и устройством для обработки информации. Общую задачу, решаемую зрительной системой - восприятие и анализ изображений, - можно разбить на ряд частных задач, таких как слежение за объектом, установление различий в освещенности разных частей изображения, опознавание оттенков цвета, выделение тех или иных особенностей формы предметов и т. д. Рассмотрим подробнее некоторые из этих функций.
Регуляция размеров зрачка
[<< | >>]
. Зрачок
- это отверстие в радужной оболочке, через которое свет попадает в глаз. Размеры зрачка могут меняться с помощью специальных мышц. При ярком свете зрачок сужается, а при слабом - расширяется так, чтобы суммарный световой поток, попадающий на сетчатку, был, по возможности, постоянным. Площадь зрачка может меняться примерно в 5 раз. При регуляции размеров зрачка сигналы проходят по такому контуру: сетчатка (при этом суммируются сигналы, собранные со всей поверхности сетчатки) - зрачковые волокна, входящие в состав зрительного нерва, - ядра мозга, на которые выходят эти волокна, и, наконец, - цилиарный нерв, управляющий мышцей зрачка. По этой цепочке осуществляется влияние освещенности сетчатки на размер зрачка, который в свою очередь влияет на освещенность. Заметим, что зрачковые волокна, идущие от обоих глаз, оканчиваются в одних и тех же мозговых ядрах, поэтому освещение одного глаза вызывает сужение зрачков обоих глаз.
Рис. 23.
|
Были изучены реакции зрачка на импульсные скачкообразные и синусоидальные изменения интенсивности света. При этом обнаружились неожиданные результаты. Так например, оказалось, что зрачок одинаково реагирует и на очень короткую вспышку света и на очень короткое затемнение - в обоих случаях происходит кратковременное сужение зрачка, за которым следует медленное возвращение к исходному состоянию (рис. 23
).
Весь процесс занимает около 2 сек. На длительное скачкообразное увеличение яркости зрачок отвечает сильным сужением, за которым следует постепенное его расширение до некоторой (конечно, меньшей, чем первоначальная) величины, отвечающей новому уровню освещенности. Если яркость света скачком уменьшается на длительное время, зрачок медленно и плавно расширяется.
Поскольку реакция зрачка на изменение освещенности начинается с некоторым запаздыванием (обычно не менее 1/4 сек), то при периодических изменениях яркости освещения на некоторой частоте (около 2 герц) наблюдается аномальный эффект: размер зрачка максимален как раз в тот момент, когда максимальна яркость освещения. В этих условиях система регуляции размера зрачка не справляется со своей задачей и даже оказывается вредной. (Субъективно мелькание света с такой частотой воспринимается как весьма неприятное для глаз.)
Изучение регулирования размеров зрачка привело к постановке следующего красивого эксперимента. На край зрачка направляется узкий пучок света, так что лишь часть пучка попадает через зрачок на сетчатку. Тогда сужение зрачка резко уменьшает освещенность сетчатки, в результате чего зрачок вновь расширяется, что увеличивает освещенность сетчатки и т. д. В результате при постоянстве направленного на глаз светового пучка, возникают периодические колебания размеров зрачка. Субъективно испытуемый воспринимает эти колебания как ритмические изменения яркости света.
Четкость экспериментальных данных, относящихся к регуляции размеров зрачка, возможность анатомически проследить связи между отдельными блоками соответствующей регуляторной системы позволяют подойти к изучению этой системы с точки зрения математической теории регулирования. (Довольно подробно эти вопросы изложены, например, в книге Милсума [25]; см. также указанную там литературу). Однако полный учет всех особенностей рассматриваемой системы, в частности роли запаздывания в цепи регулирования, представляет собой достаточно сложную задачу.
Движение глаз
[<< | >>]
. Интересным объектом для анализа с позиций теории регулирования является движение глаза как целого [18, стр. 153-171], [48]. Как известно, периферические участки сетчатки не дают возможности различать мелкие детали объекта. Максимальная острота зрения обеспечивается, когда изображение попадает на область так называемой центральной ямки. Поэтому при рассматривании предмета глаз все время движется, с тем чтобы различные части изображения попадали на центральную ямку. Если рассматривается движущийся предмет, глаз поворачивается вслед за ним так, чтобы изображение оставалось в области центральной ямки. Существуют два основных типа движения глаза - скачки и прослеживание.
Когда, рассматривая тот или иной предмет, мы переводим взгляд с одной точки на другую, глаз совершает так называемый скачок
. Для этого движения характерна очень большая скорость: например, скачок на 10њ занимает всего 20 мсек. Другая особенность скачка - его непроизвольность: человек не замечает его и не может сознательно замедлить или ускорить его. Наконец, третья особенность скачка состоит в том, что, раз начавшись, он уже не допускает никакой корректировки. Время скачка столь мало, что его заведомо не хватит на обработку сведений об изменении положения цели или выработку поправочной команды (одна лишь обработка сигнала в сетчатке, по-видимому, занимает не менее 40-50 мсек). Кроме того, скорость движения глаза во время скачка так велика, что детали наблюдаемой картины проецируются на каждую точку сетчатки слишком короткое время (изображение 'смазывается'); это также делает невозможным внесение поправок во время скачка.
Если скачок оказался неточным, то поправка вносится в виде второго скачка, следующего за первым. Эти факты показывают, что скачок представляет собой баллистическое движение, аналогичное, например, прыжку: программа движения вырабатывается в нервной система заранее и реализуется без коррекции (подобно тому как полет снаряда после выстрела уже не допускает никаких поправок; поэтому такие движения и называют баллистическими
).
Скачкообразные движения глаз удобнее всего изучать в ситуации, когда испытуемый видит в темноте одну светящуюся точку, которая затем гаснет с одновременным появлением другой такой точки, па некотором угловом расстоянии от первой. Спустя примерно 200 мсек после такого переключения глаз совершает скачок, поворачиваясь так, что теперь на центральную ямку проецируется новая светящаяся точка. Если новая точка зажигается всего лишь на 100-150 мсек, после чего она гаснет и вновь зажигается прежняя точка, то глаз все равно совершит скачок, хотя к моменту начала скачка светящаяся точка уже вернется в исходное положение. За 100-150 мсек выработка программы скачка успевает зайти так далеко, что скачок происходит, хотя он уже и не нужен. Если же точка в новом положении будет светиться всего 50 мсек, то скачок происходит всего лишь в одном случае из десяти. В этом случае зрительная система, как правило, успевает воспользоваться новой информацией и отменить ненужный скачок.
Другой тип движения глаз получается, если испытуемый следит за непрерывно движущимся предметом. В этом случае глаз совершает плавное движение, следуя с некоторым запаздыванием за перемещением наблюдаемого предмета и меняя скорость, если меняется скорость этого перемещения. Интересно, что человек не может вызвать такое плавное движение произвольно: оно появляется лишь при слежении за движущимся предметом. Система плавного слежения и система скачкообразных движений глаза управляются, видимо, разными центрами, так как при некоторых повреждениях мозга может оказаться, что одна из этих систем нарушена, а другая полностью сохранилась. Кроме того, эти системы различны по своим скоростям: латентный период при слежении равен примерно 120 мсек, а при скачках - примерно 200 мсек. О большем быстродействии системы плавного слежения свидетельствует и то, что при двукратном изменении скорости движения предмета с интервалом всего в 75 мсек, скорость слежения также успевает измениться дважды и с тем же интервалом.
Скачки и плавные движения глаза имеют разные системы управления, но реализуются одними и теми же мышцами. В реальных условиях работы глаза эти два типа движений обычно комбинируются. Например, если светящаяся точка резко сместится и начнет двигаться с некоторой скоростью, то глаз сперва совершает скачок, настигая движущуюся точку (с учетом ее перемещения за время, необходимое для выполнения скачка), а затем этот скачок непосредственно переходит в слежение со скоростью, равной скорости движущейся точки. Здесь системы управления скачками и слежением работают согласованно и при этом проявляется способность зрительной системы работать 'с опережением', заранее вычисляя будущее положение цели.
Такое опережение оказывается возможным и при чисто скачкообразных движениях глаз. Если точка многократно обегает вершины некоторого прямоугольника, то на первый скачок цели глаз реагирует, как мы уже говорили, с задержкой около 200 мсек. Однако при каждом следующем пробеге сигнала эта задержка убывает и уже после 4-5 таких периодов глаз начинает двигаться синхронно с целью или даже с небольшим опережением, ожидая цель в соответствующей точке.
Способность глаза приспосабливаться к прогнозируемому движению цели с помощью опережающих движений должна учитываться при попытках моделирования глазодвигательной системы. Она заставляет предполагать наличие в этой системе некоторого внутреннего генератора ритма, который может настраиваться на режим движения цели. Таким образом, хорошо регулируемые нейронные генераторы нужны не только для моделирования дыхания или ходьбы.
До сих пор речь шла о движении самих глаз. Однако, обычно движения глаз сочетаются с теми или иными движениями головы - наклонами, поворотами. Если человек, рассматривая некоторую точку, поворачивает голову, то его глаза сохраняют прежнее положение, продолжая фиксировать эту точку. Глазные мышцы получают команду, которая заставляет их повернуть глаза в сторону, противоположную повороту головы и тем самым скомпенсировать движения головы. Эта компенсирующая команда вырабатывается при участии вестибулярного аппарата. Однако при совместных перемещениях головы и глаз дело не сводится к простому наложению прослеживающих и компенсирующих движений. Например, при резком повороте головы и глаз к новому объекту, появившемуся в поле зрения, глаза совершают скачок и фиксируют этот объект, в то время как резкий поворот головы должен был бы вызвать компенсирующее движение глаз в обратном направлении. По-видимому, в этих условиях вестибулярное воздействие на движение глаз отключается.
Здесь мы снова сталкиваемся с ситуацией, когда недостаточно рассматривать ту или иную часть сложной системы саму по себе, а нужно учитывать ее разнообразные и многочисленные связи с остальными частями всей системы. Зафиксировав положение головы, можно изучать систему управления движениями глаз как изолированную. Но в других условиях, например при ходьбе, когда корпус движется относительно наблюдаемого объекта, а голова - относительно корпуса, на глазные мышцы действуют и вестибулярные сигналы, и сигналы, от рецепторов шейных мышц, и от сетчатки. На работу глазных мышц влияют, в силу этого, самые различные отделы нервной системы: ядра среднего мозга, кора больших полушарий, мозжечок и т. д. Построение модели, учитывающей все такие влияния, представляется задачей не очень близкого будущего.
Роль движений глаз в восприятии зрительных образов. Модель сетчатки М. М. Бонгарда и К. В. Голубцова
[<< | >>]
. Мы выяснили важную роль движений глаз при наблюдении за движущимися объектами. Оказывается, однако, что эти движения играют фундаментальную роль и при наблюдении за неподвижными предметами. С помощью ряда остроумных опытов (выполненных в лаборатории зрения Института проблем передачи информации АН СССР) А. Л. Ярбус [48] установил следующий неожиданный факт: если некоторое изображение неподвижно относительно сетчатки глаза, то глаз его не воспринимает (точнее говоря, перестает воспринимать вскоре после того, как оно стало неподвижным).
Поясним вкратце технику таких экспериментов. Неподвижность изображения относительно сетчатки достигается тем, что оно попадает в глаз от зеркальца, помещенного на особую присоску, которая крепится к глазу и смещается вместе с ним. Оказалось, что такое неподвижное относительно сетчатки изображение через 1-3 сек исчезает для испытуемого и затем уже не появляется, если только не изменить освещение или не сдвинуть присоску. Изображение исчезает независимо от формы и цвета находящихся в поле зрения предметов, степени контрастности деталей и т. д. Вместо изображения возникает то, что экспериментаторы назвали 'пустым полем'. Хотя субъективно испытуемые оценивают 'пустое поле' как черное пятно, при движении через это поле реального черного пятна они сразу замечают свою ошибку и говорят, что фон был не черный. 'Пустое поле' не имеет цвета. Если 'пустое поле' возникает на цветном фоне, который тем или иным способом делают видимым, то оно заполняется цветом этого фона.
При движении через 'пустое поле' светлого пятна испытуемый видит 'комету' - пятно с 'хвостом'. В первом приближении (см. ниже) это объясняется тем, что изображение пятна на фоне 'пустого поля' исчезает не сразу, а через некоторое время. 'Хвост кометы' представляет собой пространственную развертку этого процесса исчезновения изображения.
Приведенные факты показывают, что глаз, в отличие, скажем от фотопластинки, вообще не реагирует на неизменную освещенность - он реагирует только на ее изменение. (Если говорить о моделировании функций глаза в радиотехнических терминах, это свойство глаза означает, что на входе системы стоит конденсатор, который не пропускает постоянной составляющей сигнала).
Рис. 24.
|
Из сказанного ясна принципиальная роль движения глаз в процессе восприятия зрительной информации. При неподвижных глазах мы очень быстро перестали бы видеть окружающие предметы. Записав движения глаз при рассматривании какого-либо предмета, можно убедиться, что при этом происходит как бы 'ощупывание' взглядом различных деталей изображения (рис. 24
).
Пытаясь построить модель зрительной системы, совместимую с изложенными экспериментальными данными, мы сталкиваемся с рядом трудностей, в частности с необходимостью как-то согласовать высокую разрешающую способность глаза (т. е. способность различать две близкие точки) с его способностью заполнять цветом фона обширные участки 'пустого поля'. М. М. Бонгард и К. В. Голубцов [57] построили модель сетчатки, удовлетворяющую этим требованиям.
Модель была выполнена в виде реального электронного устройства; это позволяло поставить на ней ряд экспериментов. Конечно, ту же самую модель можно было осуществить в виде некоторой совокупности формул или программы для ЦВМ, но тогда соответствующие эксперименты оказались бы более трудоемкими.
В этой модели роль рецепторов играли фотоэлементы. Сигналы от каждого фотоэлемента поступали в схему сетчатки через конденсатор.
Если каналы от разных фотоэлементов независимы, то такая модель имеет высокую разрешающую способность и перестает 'видеть' неподвижные объекты спустя некоторое время, зависящее от емкости конденсатора. Однако, если спроецировать на такую модель изображение большого предмета, закрывающего сразу много рецепторов, а затем заставить это изображение совершать небольшие колебания, то обнаружится резкая разница между свойствами модели и свойствами человеческого глаза. Действительно, такая модель с независимыми каналами будет 'видеть' только края предметов, так как только там происходят изменения освещенности. В центре изображения останется 'пустое поле' (т. е. отсутствие потенциалов), так как при слабых колебаниях большого одноцветного объекта рецепторы, на которые проецируется его середина, находятся в таких же условиях, как и при полной неподвижности изображения. Между тем человек при тех же условиях наблюдения видит не контуры предметов, а предметы целиком, правильно определяя их цвет и освещенность. Для того, чтобы модель воспроизвела это свойство зрительной системы человека, необходимо, чтобы сигналы от краев изображения 'заползали' достаточно далеко внутрь, иными словами, необходимо ввести горизонтальное взаимодействие каналов. Кроме того, этот горизонтальный сигнал должен определяться разностью освещенностей двух соседних рецепторов (при произвольно заданном 'расползании' резко упадет пространственная разрешающая способность модели). Далее авторы модели показали, что величина горизонтального сигнала должна быть нелинейной функцией разности освещенностей соседних фотоэлементов. Такая модель обладает высокой разрешающей способностью, быстро перестает воспринимать неподвижное изображение и способна заполнять 'пустое поле' цветом окружающего фона.
Говоря о роли моделей в биологических исследованиях, мы подчеркивали, особую ценность тех моделей, которые воспроизводят свойства прототипов, не учтенные при конструировании модели, и предсказывают новые факты. Описанная модель воспроизвела ряд свойств реальной зрительной системы, которые никак не учитывались при создании модели. В частности модель воспроизвела падение разрешающей способности глаза при снижении освещенности; 'исчезновение' мелких объектов при меньших частотах мелькающего света, чем для крупных объектов; иллюзию Маха, состояющую в том, что при определенных условиях более яркое поле кажется на-блюдателю менее ярким и др. Более того, исследование модели привело к установлению некоторых новых свойств зрительного восприятия. Так, на модели было показано, что заполнение 'пустого поля' цветом окружающего фона ускоряется при малой освещенности. Проверочные опыты, поставленные А. Л. Ярбусом, обнаружили это явление и в зрении человека.
Другой пример. На модели было показано, что длина 'хвоста кометы', создаваемого движением светлого пятна через пустое поле, должна зависеть от его ширины, т. е. от размеров пятна. К такой зависимости приводят введенные в модель горизонтальные взаимодействия между удаленными частями сетчатки. Если бы 'хвост кометы' был только пространственной разверткой про-цесса исчезновения изображения, то его длина не зависела бы от ширины кометы. Поставленные затем эксперименты подтвердили предсказание модели.
Восприятие цвета
[<< | >>]
. Согласно классической теории цветного зрения Ломоносова-Юнга-Гельмгольца все оттенки цветов, воспринимаемые нашим глазом, могут быть представлены как комбинации трех основных цветов.
Сравнительно недавно правильность теории трехкомпонентного цветного зрения была подтверждена прямыми физиологическими экспериментами: с помощью микроспектрофотометра в глазу обезьяны и человека было обнаружено три типа рецепторов, с максимумами поглощения в красной, зеленой и фиолетовой областях спектра [16]. Таким образом, когда глаз воспринимает световое излучение определенного спектрального состава, происходит возбуждение до соответствующих уровней этих трех рецепторов. Иначе говоря, каждому излучению рецепторы глаза сопоставляют вектор (F1, F2, F3)
, компоненты которого представляют собой уровни возбуждения красного, зеленого и фиолетового рецепторов. Этот вектор можно назвать 'кодом оттенка цвета на уровне первичных рецепторов'. Вопрос о том, чем именно кодируются цвета в последующих отделах зрительной системы - частотой импульсации, локализацией того нейрона, который преимущественно реагирует на данный оттенок цвета, и т. д. - еще не вполне ясен. Однако ряд экспериментальных данных указывает на то, что в цветном зрении существенную роль играет 'кодирование местом': нейроны, избирательно реагирующие на раздражение глаза определенным оттенком цвета, обнаружены в зрительной системе обезьян, кроликов и некоторых других животных*).
*) Напомним, что с 'кодированием местом' мы уже встречались, рассматривая восприятие высоты звука слуховой системой (см.). |
На основе представлений о том, что каждому оттенку цвета, воспринимаемому глазом, отвечает нейрон, избирательно реагирующий на этот цвет, была предложена следующая модель цветного зрения, реализованная в виде программы для вычислительной машины.
Модель состоит из трех светочувствительных рецепторов, имитирующих колбочковые рецепторы глаза, и слоя нейронов (детекторов цвета), соединенных между собой латеральными связями, подобранными так, чтобы обострять максимум возбуждения в этом нейронном слое. Хотя такая модель весьма примитивна по сравнению с реальной зрительной системой, она воспроизводит многие психофизиологические особенности восприятия цвета [58].
Восприятие формы и движения
[<< | >>]
. Одно из существенных отличий зрительной системы от устройств, подобных фотоаппарату, состоит в том, что фотоаппарат лишь фиксирует картину, находящуюся перед объективом, в то время как в зрительной системе фиксация и передача информации непосредственно связаны с ее обработкой. Уже на первом этапе - в сетчатке - поступающая в глаз информация подвергается существенной переработке. У многих животных (лягушки, голубя, кролика, суслика и многих других) именно в сетчатке происходит основная обработка зрительной информации. Напротив, у таких животных как кошка или обезьяна, зрительная информация обрабатывается главным образом (но все же не целиком) в зрительных отделах центральной нервной системы.
В 1959 г. была опубликована работа Леттвина, Матураны, Мак-Каллока и Питтса 'Что сообщает глаз лягушки мозгу лягушки'
[74], сыгравшая большую роль в развитии физиологии зрения. Авторы установили, что в глазу лягушки имеются специальные детекторы, посредством которых выделяются некоторые весьма специфические зрительные сигналы. Один из наиболее существенных - это так называемый детектор темного пятна. Он срабатывает тогда, когда перед глазом лягушки на светлом фоне появляется темное пятнышко (так выглядят насекомые - обычная пища лягушки - на фоне неба). Этот детектор не реагирует на общее изменение освещенности сетчатки или на перемещение по всей сетчатке границы света и тени. Таким образом, он не реагирует на появление и движение в поле зрения больших предметов.
Другой детектор-детектор движущегося края, напротив, отвечает на перемещение границы света и тени по сетчатке. Можно думать, что он сигнализирует именно о движении больших объектов. Исследование этих детекторов проводилось Г. М. Зенкиным и И. Н. Пигаревым как в лабораторных условиях, так и в условиях, близких к естественным [67, 68]. Данные, полученные этими авторами при изучении работы детекторов в полевых условиях, по-видимому, подтверждают предположение, что детектор темного пятна служит лягушке для обнаружения добычи (мухи, жука), а детектор движущегося края - для обнаружения приближения возможных врагов.
Выделение глазом лягушки из окружающего мира ограниченного числа определенных зрительных образов, важных для жизни - проявление очень общих свойств живых организмов. Физиологические исследования последних лет показали, что органы чувств животных вовсе не представляют собой мозаику рецепторов, действующих независимо и пассивно воспринимающих приходящие на них сигналы (свет, звук и т. д.). Оказалось, что уже на низших уровнях сенсорных систем (слуховой, зрительной, обонятельной) происходит достаточно сложная обработка входной информации. У самых различных животных на этих уровнях обнаруживаются специализированные 'детекторы', способные выделять контуры изображений, углы, направление движения, звуки определенной частоты и т. д., причем способность к выполнению этих операций заложена в самом строении органов чувств, выработанном в процессе эволюции, а не приобретается организмом в результате обучения. Интересно исследовать те нейронные механизмы, которые реализуют такие детекторные функции. Они изучались разными методами, в том числе и путем построения соответствующих формальных моделей.
Г. Д. Ландаль [24, стр. 11-35] рассмотрел сети из формальных нейронов, реагирующие только на движущиеся объекты, сети, оценивающие кривизну траектории движущегося объекта, а также сети, различающие цвета.
Рис. 25.
|
Детекторами могут быть нейронные структуры самой различной сложности. Например, функции детектора движения может осуществлять даже отдельный нейрон [52]. Пусть имеется нейрон с разветвленным дендритом (рис. 25А
) и пусть свойства каждого узла ветвления таковы: импульс, приходящий по одной ветви, не проходит через узел ветвления, а два импульса, приходящие к узлу по двум ветвям одновременно или с достаточно небольшим временным сдвигом, проходят через разветвление (см. 3). Пусть, наконец, в каждой из ветвей дендрита, направленных вверх, может возникать импульс в ответ на освещение (или затемнение) связанного с этой ветвью зрительного рецептора. Рассмотрим работу такого нейрона.
Если изображение движется по сетчатке слева направо, то первой возбудится самая левая веточка и импульс начнет распространяться к узлу ветвления. В это время изображение вызовет возбуждение второй веточки дендрита и по ней также начнет распространяться импульс. Эти импульсы встретятся в узле ветвления и в результате суммации дадут новый импульс, который будет распространяться дальше но дендриту. В следующем узле ветвления этот импульс встретится с импульсом, пришедшим но третьей веточке, что позволит им пройти третий узел ветвления и т. д. В результате импульс дойдет до тела нейрона-детектора и возбудит его. Рассмотрим теперь случай, когда изображение двигается справа налево. Тогда вначале возбудится правая веточка дендрита, но возникший в ней импульс достигнув узла ветвления погаснет, поскольку ему не с кем будет суммироваться; то же самое произойдет и с импульсом, возникшим в следующей веточке. В результате нейрон-детектор не возбудится при движении изображения справа налево. Заметим, что такой детектор будет сообщать не только о том, что изображение двигается слева направо, но и о том, что оно имеет скорость, заключенную в определенных пределах. Действительно, если изображение будет двигаться слишком медленно, то за то время, что оно достигнет второй веточки и возбудит ее, в узле ветвления уже исчезнут следы от импульса первой веточки, в результате чего детектор не ответит на столь медленно движущееся изображение. Напротив, при слишком высокой скорости движения изображения все дендритные веточки возбудятся одновременно и тогда за то время, что импульс будет распространяться от левого края дендрита, в каком-то из достаточно далеко расположенных правых узлов успеют исчезнуть следы импульса соответствующей веточки. Таким образом, меняя длины веточек дендрита и расстояния между узлами ветвления можно создать детекторы, реагирующие на разные скорости движения изображения.
Хотя, как мы только что видели, детектором движения в принципе может быть отдельный нейрон, в реальной сетчатке детектирование движения, по-видимому, осуществляется ансамблем, содержащим нейроны разных типов [76]. Предположим, что клетка сетчатки, служащая детектором направления движения, связана с двумя группами рецепторов, расположенных в сетчатке рядом (рис. 25Б
). Пусть клетка-детектор связана с левой группой рецепторов непосредственно, а с правой - через тормозной нейрон. Тогда при движении объекта слева направо сначала возбудятся рецепторы, непосредственно связанные с нейроном-детектором, а затем рецепторы, связанные с тормозным нейроном. Нейрон-детектор успеет возбудиться (и передать сигнал другим нейронам) раньше, чем он будет выключен тормозным нейроном. А при движении объекта справа налево сперва возбудится тормозной нейрон, поэтому к моменту возбуждения левой группы рецепторов нейрон-детектор окажется выключенным и никакого сигнала не передаст. Таким образом, нейрон-детектор возбуждается при движении объекта в одном направлении и тормозится при его движении в противоположном направлении.
Исследование и моделирование нейронных механизмов, реализующих те или иные детекторные функции, - интересная и важная задача, в которой еще много неясного.
Интересно, что обе описанные конструкции детектора направления движения хорошо воспроизводят еще одно свойство реального детектора сетчатки - они не дают ответа при одновременном движении двух стимулов навстречу друг другу.
Описанные конструкции позволяют понять идею моделирования детекторов. При этом можно почти дословно повторить то, что мы уже говорили про моделирование нейронных генераторов. Для моделирования системы 'в первом приближении' можно предложить много вариантов, однако задача становится гораздо более интересной и трудной, если требуется учесть больше конкретных свойств реальных объектов. Так при моделировании детектора темного пятна надо учесть, что он реагирует на мелкие (угловые размеры 3њ-5њ) объекты, которые темнее фона, двигаются в пределах некоторой ограниченной зоны и притом к ее центру, что контраст освещенности этого объекта и фона должен быть резким. Если объект останавливается, то детектор продолжает импульсировать еще несколько секунд. Частота импульсации детектора очень слабо зависит от общего уровня освещенности и скорости движения объекта. Этот детектор практически не реагирует на движения светлого пятна. Детектор значительно сильнее реагирует на объекты, которые перемещаются отдельными скачками, чем на непрерывно движущиеся объекты. Выделение функциональных свойств реального детектора темного пятна и данные о морфологии сетчатки глаза лягушки позволили построить достаточно удовлетворительную модель этого детектора [20].
Константность восприятия зрительных образов
[<< | >>]
. Мы правильно оцениваем относительную яркость, цвет, форму, размеры и положение предметов, несмотря на то, что они находятся в разных условиях освещения, на разном расстоянии от нас и т. д. Например, хотя кусок мела в плохо освещенной комнате отражает меньше света, чем кусок угля на ярком солнце, мы в каждом из этих случаев правильно оцениваем цвет предмета. Это свойство глаза называется константностью зрительного восприятия
.
Как было показано работами Н. Д. Нюберга и др. [79], константность восприятия цвета предметов достигается тем, что глаз (точнее, зрительная система в целом) автоматически учитывает особенности освещения и делает соответствующие поправки.
Рассмотрим следующий эксперимент. Человеку показывают гладкий лист белой бумаги, освещенный красным светом, и лист красной бумаги, освещенный белым светом. Может ли он отличить одно от другого? Очевидно нет, так как и в том и в другом случае воспринимаемый глазом отраженный свет одинаков и различение этих двух ситуаций было бы необъяснимым чудом. Однако если берется не гладкая бумага, а скажем гофрированная или мятая, или имеющая блики, то глаз достаточно уверенно определяет истинный цвет бумаги и характер освещения. Во впадинах и складках бумаги происходит многократное отражение света. В случае красной бумаги свет при многократном отражении меняет свой спектральный состав (становится все более красным), а при многократном отражении от белой бумаги спектральный состав света остается прежним, меняется лишь его интенсивность. Этой 'зацепки' оказывается достаточно для того, чтобы глаз надежно определил истинное освещение и истинный цвет бумаги. Цвет излучения, отражаемого предметом данной окраски, резко меняется при изменении спектрального состава падающего на него света. Однако при любом освещении белые предметы будут светлее, чем другие предметы при том же освещении, а отраженный ими свет по своему спектральному составу совпадает со светом, даваемым источником. Поэтому цвет излучения, отраженного от самых ярких в данных условиях предметов, может служить основой для определения истинного характера освещения. Это подтверждает следующий эксперимент. Розово-оранжевый образец можно осветить зеленым светом так, чтобы наблюдатель с уверенностью принимал этот образец за зеленый. Если теперь на этот образец поместить небольшие разноцветные фигурки - белые, зеленые, голубые и красные, то наблюдатель, рассматривая тот же образец при том же освещении, достаточно правильно оценит его истинную окраску. В некоторых случаях 'опорными пунктами' для определения истинного цвета предметов и характера освещения могут быть предметы, цвет которых нам хорошо известен заранее (например, трава должна быть зеленой, апельсин - оранжевым и т. п.).
Константность восприятия, т. е. способность глаза вводить поправки на свойства источника света, - важное и ценное свойство нашей зрительной системы. Однако при некоторых условиях это же свойство может оказаться источником различных цветовых иллюзий - грубых ошибок в оценке цвета предметов.
Пусть на белом фоне лежит зеленая бумажка. Осветим фон и бумажку красным светом, подобрав освещение так, чтобы отраженный бумажкой свет был ахроматическим ('белым'). Казалось бы, мы должны при этом увидеть серую бумажку на красном фоне. Но фон, представляющий собой самую яркую часть видимой картины (он ведь белый, т. е. обладает максимальной отражательной способностью), служит сигналом красного освещения. Срабатывает механизм константности, и мы воспринимаем бумажку как зеленую, т. е. правильно. Но ведь физически тождественная картина имеется на сетчатке и тогда, когда серая бумажка лежит на красном фоне при белом освещении. В этом случае возникает ложная константность (серая бумажка кажется зеленой); мы называем это контрастностью (поскольку происходит кажущееся появление цвета, дополнительного к цвету фона, в данном случае появление зеленого - дополнительного к красному*)).
*) Два цвета называются дополнительными друг к другу, если из их смеси можно получить белый цвет. |
То, что в основе контрастности лежит тот же самый механизм подсознательного внесения поправок (правильных или ошибочных) на цвет освещения, подтверждается сравнением следующих двух опытов.
В первом опыте испытуемый смотрит на волнистую белую бумагу, посыпанную чешуйками слюды ('блестками'), с помещенным в центре серым кружком. Весь образец, кроме кружка, освещается красно-оранжевым светом. Кружок освещается белым светом. У испытуемого при этом создается впечатление, что все освещено красным светом и серый кружок он воспринимает как голубой или синий.
Во втором опыте берется образец, изготовленный из волнистой красно-оранжевой бумаги, покрытой блестками слюды. В центре - серый кружок (такой же, как и в первом опыте). Весь образец освещается белым светом. (Как и в первом опыте волнистость бумаги и блестки помогают правильно оценить освещение фона.) Несмотря на то, что во втором опыте фон казался заметно более красным, чем в первом, контраст практически не возникал. Здесь иллюзия цветного освещения отсутствовала и одно лишь наличие красного цвета не создавало никакой контрастности.
Исследование механизма константности восприятия цвета и его моделирование интересно не только для физиологии: на этом пути могут быть созданы автоматические устройства и алгоритмы для правильного распознавания цветов в различных условиях освещения [79].
Измерение длин и углов и возникающие при этом иллюзии
[<< | >>]
. То обстоятельство, что в зрительной системе восприятие информации практически неотделимо от ее обработки, служит причиной различных 'иллюзий' или 'обманов' зрения. Поняв, как именно обрабатывается тот или иной тип зрительной информации, можно целенаправленно 'конструировать' изображения, вызывающие различные иллюзии зрения, 'сознательно обманывая' нашу зрительную систему. Возникновение иллюзий при рассматривании таких 'сконструированных' изображений служит косвенной проверкой соответствующих гипотез о работе зрительной системы.
Только что мы привели несколько примеров иллюзий, возникающих при восприятии цвета предметов в условиях, специально созданных экспериментаторами. Ниже мы опишем некоторые иллюзии, возникающие при измерении длин отрезков и величины углов в фигурах, 'сконструированных' И. Б. Мучником и Н. В. Завалишиным на основании разработанной ими гипотезы о механизме восприятия таких объектов зрительной системой человека [69, 70].
Авторы предполагают, что на каждом изображении может быть задана некоторая непрерывная функция, названная ими функцией информативности. Эта функция может быть задана, например, так. Пусть по изображению движется круглое окно, размеры которого гораздо меньше размеров изображения. Через такое окно будет виден отдельный фрагмент изображения. Каждому такому фрагменту требуется поставить в соответствие число, характеризующее особенности его формы. С этой целью вводится в рассмотрение стандартное изображение - пятно, размер которого совпадает с размером окна, а зачерненность падает от центра к периферии. Далее стандартное изображение и окно одинаковым образом разбиваются на клетки. С каждой клеткой стандартного изображения связывается число, характеризующее ее зачерненность, а с каждой клеткой окна - число, характеризующее зачерненность участка фрагмента изображения, видимого через эту клетку. В результате получаются два набора чисел, каждый из которых рассматривается как координаты точки многомерного пространства (размерность которого, естественно, равна числу клеток, на которое разбито окно). Обычное евклидово расстояние между указанными двумя точками многомерного пространства и принимается за значение функции информативности точки изображения, расположенной в центре окна.
Ясно, что введенная функция будет иметь минимумы в тех местах изображения, зачерненность которых распределена так же, как и зачерненность стандартного изображения, то есть в местах существенного изменения зачерненности. На однотонных участках функция информативности будет иметь постоянное значение. На контурных изображениях местами наибольшего изменения зачерненности являются концы линий, углы, разветвления линий и т. д. Эксперименты на вычислительной машине показали, что приведенный выше формальный способ описания изображении; позволяет найти геометрические особенности изображения, которые лежат в области экстремумов функции информативности. (Выбрав всего две градации зачерненности - черное и белое - читатель сам может найти экстремумы функции информативности для отрезка, угла, разветвления и др.; см. рис. 26А
.) Эксперименты по изучению движений глаз человека показали, что при рассматривании изображений глаз, как правило, останавливается в точках, в которых функция информативности достигает экстремума. На основании этих экспериментов была выдвинута гипотеза, что при измерении длины отрезка измеряется расстояние между экстремумами функций информативности, расположенными у его концов. Но точное положение этих экстремумов зависит от того, кончается ли отрезок 'просто так' или же на его конце имеется стрелка или кружок и т.д.
Рис. 26.
|
Ясно, что выдвинутая гипотеза позволила рассчитать для разных изображений положение экстремумов функции информативности и предсказать ожидаемые иллюзии. Это позволило авторам объяснить ряд известных иллюзий и синтезировать новые.
Одну из известных иллюзий воспроизводит рис. 26Б
;
на нем длина верхних отрезков кажется меньше, чем длина нижних, хотя в действительности они равны. На втором и четвертом отрезках точками показано расположение экстремумов функции информативности, поясняющее возникновение иллюзии. На рис. 26В
приведена новая иллюзия, сконструированная И. Б. Мучником и Н. В. Завалишиным. Вершины четырех углов в действительности образуют квадрат, однако кажется, что расстояние между вершинами по вертикали меньше, чем по горизонтали. Нижняя часть рисунка поясняет возникновение иллюзии.
Предположение, что измерение углов сводится к измерению расстояния между максимумом и минимумом функции информативности (это предположение было проверено в опытах с движениями глаз), позволило сконструировать новые иллюзии и для задач, в которых требуется определить величины углов.
На рис. 26Г
приведен один пример такого рода иллюзий: угол с отрезком, идущим из вершины наружу, кажется меньше, чем такой же угол с отрезком, идущим внутрь (для понимания подобных иллюзий важно помнить, что чем больше расстояние между максимумом и минимумом функции информативности, тем меньшим кажется угол, см. рис. 26А
).
4.6 Модели эмбрионального развития. Формообразование
<< | >>
Законы, управляющие развитием организма - одна из центральных проблем современной биологии. Процесс, в результате которого из одной клетки получается сложный организм, остается во многом неясным. Первая стадия этого процесса состоит в том, что из оплодотворенного яйца в результате дробления возникает однослойная клеточная структура, представляющая собой полую внутри сферу - так называемая бластула
. Мы не знаем, однако, ни причин, по которым в процессе дробления возникает не беспорядочное скопление клеток, а правильная сферическая структура, ни механизма взаимодействия между составляющими бластулу клетками.
Затем бластула превращается в трехслойный мешок с отверстием, так называемую гаструлу
. В дальнейшем, в результате деления, перемещения и взаимодействия клеток, образования складок, трубок и т. д., возникают различные ткани и отдельные органы, составляющие живой организм. В целом процесс эмбрионального развития - это процесс возникновения из простой однородной структуры весьма сложной гетерогенной системы, с четким разграничением отдельных частей и достаточно сложными и вместе с тем устойчивыми геометрическими формами.
По-видимому, первой работой, посвященной математическому исследованию вопросов роста и формообразования была книга д'Арси У. Томсона "О росте и форме", вышедшая в 1917 году
. Используя несложный математический аппарат (соображения симметрии, арифметические соотношения, законы подобия и т. д.), Томсон исследовал закономерности расположения листьев, форму раковин, яиц, рогов и т. д. Свою основную идею он выразил во введении к книге следующими словами: "...проблемы формы - это в первую очередь математические проблемы, проблемы роста - в основе своей физические проблемы и морфолог ipso facto*) является представителем физической науки". Хотя тот элементарный, иногда даже наивный физико-математический аппарат, которым пользовался Томсон, не мог послужить основой для достаточно полного анализа проблем морфогенеза, важность его работы трудно переоценить. Она была одним из первых предвестников того направления, которое мы сейчас называем теоретической биологией
.
*) Фактически, силой обстоятельств (лат). |
С проблемами формообразования связаны идеи выдающегося советского биолога А. Г. Гурвича, изложенные в его книге "Теория биологического поля", вышедшей в 1944 г. [17]
. С каждой клеткой А. Г. Гурвич связывает некоторое поле (физическая природа которого не обсуждается), выходящее за ее пределы и оказывающее влияние на соседние клетки. Поля нескольких клеток складываются по правилам сложения векторов. Под действием суммарного поля своих соседей каждая клетка, входящая в некоторый клеточный ансамбль, перемещается в соответствии с величиной и направлением этого поля. В результате форма того или иного скопления клеток претерпевает определенные изменения. Понятие клеточного поля дает некий формальный метод, позволяющий описывать взаимодействие клеток и предсказывать появление новых форм. А. Г. Гурвич рассмотрел с точки зрения своей теории процесс гаструляции у морских ежей, развитие мозговых пузырей у зародыша акулы, развитие хряща фаланги пальца у тритона, постепенное изменение, на протяжении цикла развития, формы шляпок у грибов и соцветий растений.
Одна из первых моделей морфогенеза, учитывающая роль конкретных физических процессов, была предложена в 1952 г. А. Тьюрингом (см. [37])
. Он показал как однородная группа клеток, имеющая симметричную форму, например сферическую, может перейти в более сложную структуру. Согласно Тьюрингу, основой этого процесса могут служить флуктуации содержания в клетках некоторых веществ, имеющихся в окружающей среде и влияющих на развитие. При определенных условиях эти флуктуации не затухают, а нарастают и ведут ко все более сильному отклонению от исходной формы. Тьюринг рассмотрел, в частности, возникновение на основе такого механизма структуры с тремя или четырьмя лепестками из сферического скопления клеток, возникновение периодической структуры (сегментов) в первоначально однородной полоске ткани и т.д. (см. [37]).
В теории Тьюринга важную роль играет идея о наличии устойчивых и неустойчивых состояний и переходе одних состояний в другие. Первоначально существование особых неустойчивых состояний - критических фаз морфогенеза - было обнаружено экспериментально. Так, например, было показано, что на определенной стадии эмбрионального развития дрозофилы изменение температуры влияет на число фасеток глаза, в то время как на другой стадии такое же температурное воздействие подобного эффекта не вызывает. Вместе с тем в целом процесс эмбрионального развития организма обладает большой устойчивостью по отношению к разным внешним воздействиям, иногда очень радикальным. Так еще более 100 лет назад Э. Геккель обнаружил, что после разделения оплодотворенного яйца на две клетки можно изолировать одну из них и получить целый организм (здесь внешнее воздействие состоит в уничтожении половины зародыша). У тритонов целый организм можно получить из клетки, которая образуется после пятого деления оплодотворенного яйца (т. е. из 1/32 части зародыша). В последние годы аналогичные опыты удалось поставить на кроликах: одну из четырех клеток, образовавшихся после двухкратного деления оплодотворенного яйца, вводят в матку крольчихи и из этой клетки развивается полноценный крольчонок.
Вот еще один яркий пример устойчивости эмбриональной структуры: если гаструлу амфибии, состоящую из трех слоев клеток (так называемых зародышевых листков
) поместить в подщелоченную воду, она распадется на отдельные клетки. Если затем эту массу клеток вернуть в нормальную среду, то они вновь соберутся в исходную структуру, причем каждая клетка окажется в том же слое (наружном, внутреннем или среднем), в котором она была первоначально.
Устойчивость процесса эмбриогенеза - один из важнейших факторов стабильности видов, многие из которых (в частности, некоторые насекомые) существуют без больших изменений миллионы лет.
Еще в 1940 г. Уоддингтон ввел для описания морфогенеза понятие эпигенетического ландшафта
. В максимально упрощенной форме смысл его состоит в том, что развитие организма уподобляется движению по пересеченной местности со сложной системой долин и водоразделов. При движении по такой местности маршрут иногда жестко диктуется ее характером (скажем, движение по тропе в горном ущелье), а иногда (в местах слияния долин, на перекрестках удобных путей) имеется значительная свобода выбора и сравнительно мелкие причины могут существенно изменить весь дальнейший путь. Известный французский математик Р. Том предпринял попытку построить, исходя из подобных соображений, общую математическую теорию морфогенеза. Том использует при этом сложный аппарат топологической теории динамических систем и результаты своих исследований по проблеме структурной устойчивости таких систем (подробнее см. [28, стр. 145-165]). Такие попытки бесспорно представляют большой интерес, однако, здесь трудно пока еще говорить о модели, достаточно определенной для того, чтобы была возможность подвергнуть ее хотя бы качественной проверке на основе экспериментальных данных. Тем не менее исходное представление о наличии в морфогенезе как неустойчивых, критических состояний, когда изменяется структура и выбирается путь дальнейшего развития, так и определенной устойчивости, следует, по-видимому, считать достаточно твердо установленным.
Одна из важных черт процесса эмбрионального развития состоит в отсутствии какого-либо единого центра, управляющего процессом в целом. На ранних стадиях развития зародыша это особенно ясно, так как клеток еще немного и все они мало отличаются друг от друга. В это время развитие, но всей вероятности, должно определяться локальным взаимодействием между соседними клетками. Таким образом, к эмбриогенезу должны быть применимы общие идеи децентрализованного управления, о которых мы говорили, излагая принципы управления сложными системами (см. гл. II). Опыты подтверждают предположения о роли локального взаимодействия клеток в эмбриогенезе. Так например, Шпеман провел над зародышем тритона, находящимся на очень ранней стадии развития (в начале гаструляции), следующий эксперимент: вырезав у одного зародыша кусочек той ткани, которая при нормальном развитии дает нервную пластинку, а у другого - кусочек ткани, из которой должен развиваться эпидермис, он поменял их местами. Пересаженные кусочки прижились и в дальнейшем развивались не согласно своему первоначальному назначению, а под влиянием нового окружения. Было проведено много аналогичных экспериментов, показавших первостепенную роль взаимодействия соседних клеток в процессе эмбрионального развития.
Эти факты наводят на мысль о возможности моделировать процессы развития и формообразования с помощью коллектива автоматов, связанных между собой некоторым локальным взаимодействием*).
*) Это направление исследований, стимулируется также тесной связью современной эмбриологии с генетикой, где рассмотрение клетки как автомата, снабженного записанной в ее генетическом материале программой, стало уже достаточно привычным. |
Под автоматом
(мы еще вернемся к понятию автомата в следующей главе) подразумевается устройство, имеющее некоторое конечное число состояний, способное воспринимать входные сигналы (из фиксированного конечного набора их), менять в зависимости от этих сигналов свое состояние (по определенным правилам) и, наконец, совершать некоторые "действия" (т. е. генерировать "выходной сигнал"), причем действие автомата определяется его состоянием в данный момент времени.
Примером автомата может служить формальный нейрон Мак-Каллока-иттса (см. 4). Если порог такого нейрона равен n
, а число возбуждающих синапсов на нем равно m
, то он имеет m + 1
состояний, соответствующих его возможным уровням возбуждения (от 0
до m
), причем уровням возбуждения, не меньшим, чем m
, соответствует наличие выходного импульса, а остальным, то есть подпороговым - его отсутствие. (Таким образом наш автомат имеет два действия). Входным сигналом здесь служит суммарное воздействие синапсов, оканчивающихся на этом нейроне.
Если имеется некоторая совокупность автоматов, то смена состояний одного автомата может зависеть от действий других автоматов (именно так обстоит дело в нейронных сетях, где каждый нейрон кроме входных испытывает влияние других нейронов). Тогда говорят о коллективе автоматов, связанных определенным взаимодействием (или локальным взаимодействием, подчеркивая этим отсутствие какой-либо централизации).
Конечно, те "автоматные" модели, о которых будет идти речь ниже, имеют довольно мало общего с реальным процессом морфогенеза. Они, в основном, демонстрируют лишь возможность получения тех или иных пространственных форм на основе чисто локальных правил взаимодействия между сравнительно простыми объектами.
Предположим, что на плоскости (которую удобно представить себе разбитой на маленькие клетки) имеется некий автомат, занимающий одну клетку, одним из возможных действий которого является самовоспроизведение, то есть создание в соседней клетке своей точной копии. Спрашивается, как задать конструкцию и программу работы такого автомата, чтобы в результате его "размножения" возникла заданная геометрическая конфигурация, после чего дальнейшее размножение автоматически прекратилось бы. Оказалось, что та-кая задача разрешима, причем даже достаточно сложная конфигурация может быть получена при сравнительно простой программе действий исходного автомата.
Так, например, в Ленинграде группой В. И. Варшавского была разработана конструкция автомата, воспроизводившего при размножении плоское изображение кошки (любопытно, что создание изображения кошки с хвостом потребовало значительно более сложной конструкции, чем воспроизведение бесхвостой кошки).
И. И. Пятецкий-Шапиро и его сотрудники рассмотрели вопрос о том, как клеточный коллектив может принимать определенную форму под влиянием локального взаимодействия между соседними клетками [73]. Были рассмотрены две задачи такого типа: выстраивание клеток по прямой и окружение некоторой области на плоскости. Клетки соединялись ломаной линией и каждой из вершин этой ломаной задавалось определенное правило движения в зависимости от положения двух соседних вершин (или большего их числа). Моделирование на вычислительной машине показало, что существуют различные правила взаимодействия и много разных начальных положений, при которых клеточный ансамбль достигает через некоторое время желаемого расположения - выстраивается вдоль прямой или окружает заданную область. Однако каких-либо достаточно общих теорем здесь получить не удалось. Некоторые другие задачи, связанные с воспроизведением коллективом автоматов тех или иных геометрических форм, рассмотрены в книге М. Аптера [2].
В приведенных выше примерах взаимодействие между автоматами было устроено так, что па каждый автомат влияли лишь его ближайшие соседи, а не все вообще автоматы, входящие в данный коллектив. Это соответствует данным реальных биологических экспериментов, согласно которым в небольших изолированных участках тканей эмбриона наблюдаются те же движения клеток, что и в целом эмбрионе.
Заметим, что упоминавшаяся выше модель А. Г. Гурвнча, основанная на представлении о биологическом поле, тоже по сути дела связана с идеей локального взаимодействия. Действительно, Гурвич считал, что поле каждой клетки достаточно быстро ослабевает по мере удаления от нее, а это и значит, что в основном на каждую клетку действуют лишь ее ближайшие соседи. (Модель Гурвича фактически является моделью локального взаимодействия для ранних стадий развития, пока клеток немного; при больших клеточных коллективах в этой модели на данную клетку могут влиять и достаточно удаленные от нее клетки, если их много, так как их поля суммируются).
К процессам морфогенеза
, то есть превращения зародыша в сформировавшийся организм, очень близки процессы регенерации
- восстановления организмом утраченных частей. Иногда между этими процессами вообще трудно провести границу. Способность к регенерации в какой-то мере присуща всем живым организмам, но особенно велика она у низкоорганизованных животных. Так, например, из 1/200 части тела гидры может развиться целая гидра, а у некоторых планарий (плоские черви) новая особь может развиться из кусочка, составляющего всего 1/500 часть взрослого червя. Интересна также способность многих живых организмов восстанавливать свою структуру после казалось бы непоправимого ее нарушения. Например, взяв губку и протерев ее через сито, мы получим аморфную массу клеток. Но если эти клетки поместить в воду и предоставить самим себе, то через некоторое время из них вновь образуется губка (ср. с описанным выше восстановлением структуры гаструлы у амфибий).
В последние годы появились разные модели, в которых коллектив элементов, связанных между собой локальным взаимодействием, оказывается способным сохранять и восстанавливать некоторую определенную структуру (см., например, [2], [28, стр. 120-128], [73]). Вот одна из таких моделей, рассмотренная Л. Вольпертом.
Предположим, что у нас имеется цепочка из N
элементов (клеток). Каждый из этих элементов может находиться в одном из n
состояний. Состояние каждого элемента в некоторый момент определяется сигналами, которые он получает от других элементов, и его предшествующим состоянием. Нужно так определить свойства элементов и систему связи между ними, чтобы вся цепочка разделилась на r
участков, причем все элементы данного участка находились бы в одном и том же фиксированном состоянии. Длина каждого из этих участков должна составлять заданную часть длины всей цепочки. Наконец, требуется, чтобы эта структура восстанавливалась при перестановке клеток в цепочке, а также при удалении части клеток или добавлении новых. Пусть число участков равно трем, а три разных состояния элементов - это синий, белый и красный цвет; тогда получится трехцветная структура, аналогичная французскому флагу. При удалении любой части эта структура должна восстанавливаться, т. е. должен возникать трехцветный флаг меньшего размера.
Было предложено несколько вариантов организации такой структуры. В частности, М. Аптер предложил следующее решение задачи.
Допустим сперва, что элементы цепочки - не клетки или автоматы, а выстроенные в шеренгу люди. Тогда задачу можно решить с помощью следующих команд:
Рассчитаться справа налево (т. е. правофланговый говорит "первый", его сосед слева говорит "второй" и т. д.);
Рассчитаться слева направо;
Каждому разделить свой номер, полученный при расчете слева, на номер, полученный при расчете справа;
Перейти в соответствующее состояние (скажем, вынуть флажок соответствующего цвета) в зависимости от полученного результата.
При этом заранее должны быть назначены числовые границы (пороги), соответствующие каждому из состояний. Пусть, например, шеренга состоит из 9 человек.
Тогда при расчете справа они получат номера 1, 2,.,..,9, а при расчете слева-номера 9, 8, ..., 1. После деления получаются числа: 1/9,..., 9/1. Предпишем следующие правила:
Тем, у кого получилось отношение меньше 1/2, принять состояние I (синий цвет);
если отношение больше 1/2, но меньше 2 - принять состояние II (белый цвет);
если отношение больше 2 - принять состояние III (красный цвет).
Ясно, что при этом первая тройка будет в состоянии I; следующая тройка - в состоянии II, а последняя тройка - в состоянии III. Если теперь удалить, скажем, трех человек с левого фланга, то после переходного процесса, когда заново будет произведен расчет справа налево и слева направо и найдено для каждого отношение соответствующих номеров, получатся следующие числа: 1/6, 2/5, 3/4, 4/3, 5/2 и 6/1. Ясно, что при сохранении тех же границ: до 1/2, от 1/2 до 2 и больше 2 состояние I будет у двух первых членов цепочки, состояния II - у 3-го и 4-го, а состояние III - у двух последних. Таким образом, структура "трехцветного флага" сохранится.
Мы все время говорили о том, как разбить цепочку на три участка. Ясно, что для разбиения цепочки на r
равных по длине участков с определенным состоянием элементов на каждом участке, нужно, очевидно, задать следующее правило: если отношение менее 1 / (r - 1)
, то принимается первое состояние, от 1 / (r - 1)
до 2 / (r - 2)
- второе состояние и т. д. Наконец, при отношении, большем (r - 1) / 1
принимается r
-е состояние.
Мы выяснили как можно решить задачу трехцветного флага, когда "участники" структуры - люди. Однако действия, которые эти участники должны совершить (расчет по номерам, нахождение отношения двух чисел, сравнение двух величин) столь просты, что их вполне может выполнить и весьма элементарное автоматическое устройство. Поэтому цепь, реализующую описанную процедуру, можно устроить из автоматов, каждый из которых способен передавать сигнал соседям.
Может, однако, сложиться впечатление, что операции, доступные людям и даже несложным автоматам, превосходят, тем не менее, возможности реальных клеток*). Л. Вольперт предложил следующие два варианта модели восстановления и поддержания структуры типа трехцветного флага, не предъявляющие, пожалуй, слишком больших требований к "интеллекту" клеток.
Первый вариант основан на том, что в системе существует некоторый градиент, так что один конец цепочки служит источником какого-то влияния, а другой - его стоком (например, на одном конце синтезируется некоторое вещество, а на другом оно разрушается). В результате с каждой клеткой связывается определенная числовая величина (концентрация вещества в данном месте), которая может выполнять те же функции, что и "отношение номеров при расчете справа и слева" в шеренге людей.
Второй вариант модели не нуждается в каких-либо градиентах. Предположим сперва, что у клеток есть два состояния и что наша система разбита на два участка с определенным состоянием клеток на каждом. Пусть далее клетки, находящиеся в первом состоянии, выделяют некоторое вещество, стимулирующее переход клеток во второе состояние, а находящиеся во втором состоянии клетки стимулируют обратный переход. Ясно, что в системе автоматически установится некоторое устойчивое соотношение размеров 1-го и 2-го участков (определяемое интенсивностью выделения соответствующих веществ).
Легко понять, что аналогичные рассуждения будут справедливы и в том случае, если речь идет о произвольном числе участков и состояний.
Заметим, что если ввести дополнительное требование, чтобы крайний автомат цепочки начинал делиться и продолжал деление до тех пор, пока при расчете слева направо его номер не станет равен в точности N
, то мы получим систему, которая будет поддерживать не только свою структуру, но и размеры.
*) В книге Аптера [2] приведете несколько вариантов моделей, показывающих, что в принципе клетки могут осуществлять необходимые операции. Вместо чисел клетки оперируют с концентрациями соответствующих ферментов; которые могут диффундировать из одной клетки в другую. |
<< | >>
Говоря о сложности биологических систем, обилии подлежащих регуляции параметров в них, принципах управления такими системами, мы до сих пор имели в виду в основном такие объекты как нервная система в целом, слуховая или зрительная система, локомоторная (двигательная) система человека или животного и т. д. Каждая такая система - это совокупность очень большого числа клеток с многочисленными сложно организованными связями между ними. При моделировании такого рода объектов мы представляем отдельные клетки весьма упрощенным образом. Например, когда речь шла о моделировании нейронных сетей, то нервная клетка представлялась просто как автомат, имеющий два состояния - покой и возбуждение. Такое упрощение неизбежно: без него нельзя построить никакой сколько-нибудь обозримой модели сложной многоклеточной системы.
Но на самом деле клетка - эта основная единица всего живого - сама по себе представляет сложную систему, в которой, при детальном ее изучении мы обнаруживаем и большое число независимых параметров и разных более или менее автономных подсистем, и "блочную" организацию регуляторных процессов, и другие характерные черты "больших" высокоорганизованных систем.
За последние 2-3 десятилетия достигнуты огромные успехи в исследовании молекулярных механизмов клетки. Возникла новая обширная и увлекательная наука - молекулярная биология
. В этом параграфе мы остановимся лишь на некоторых примерах внутриклеточных процессов и постараемся показать справедливость применительно к отдельной клетке тех общих принципов регуляции биологических систем, о которых говорилось в гл. II.
Генетический код
[<< | >>]
. В живой клетке непрерывно идут разнообразные биохимические процессы, среди которых один из важнейших - это синтез белков - основного "строительного материала" живых организмов. Естественно возникает вопрос об исследовании механизма, управляющего по определенной программе этим синтезом, заложенного в клетке и передаваемого каким-то образом из поколения в поколение от родительских организмов к потомкам. Изучение этого механизма справедливо считалось одной из центральных проблем всей современной биологии.
Мысль о том, что в каждой клетке должна быть как-то "записана" на молекулярном уровне программа происходящих в ней процессов была высказана еще в 30-х годах замечательным советским биологом Н. К. Кольцовым. Кольцов полагал, что носителями такой программы должны быть молекулы белка. Хотя эта конкретная гипотеза и не подтвердилась - носителями наследственной информации в клетке оказались молекулы так называемой дезоксирибонуклеиновой кислоты (ДНК)
, - общая идея Кольцова о молекулах - носителях программы оказалась верной.
В 1942 г. вышла книга Э. Шредннгера "Что такое жизнь с точки зрения физики" [45]
, в которой также в числе других проблем обсуждался вопрос о механизме передачи наследственной информации. Недостаток экспериментальных данных делал возможной в то время лишь весьма общую постановку этого вопроса. Позже, когда выяснилась определяющая роль молекул ДНК в регуляции белкового синтеза в клетке и структура самой ДНК, стала возможной точная формулировка проблемы. Было установлено, что молекула ДНК представляет собой двойную спираль вроде винтовой лестницы с большим количеством (несколько сот) поперечных "ступенек", причем роль этих "ступенек" играют четыре типа химических соединений (оснований), а разные молекулы ДНК отличаются друг от друга порядком чередования оснований разных типов и числом "ступенек". Таким образом, условно молекулы ДНК можно представить как последовательность символов четырех типов, скажем *)
ААГЦАТЦГ...
*) Мы пользуемся принятыми обозначениями А, Г, Т, Ц входящих в ДНК оснований, соответствующими их названиям: аденин (А), гуанин (Г), тимин (Т) и цитозин (Ц). |
С другой стороны, белковые молекулы представляют собой цепочки разной длины, составленные из аминокислот 20 различных типов. Было сделано предположение, в дальнейшем полностью подтвердившееся, что процесс синтеза каждой белковой молекулы задается молекулой ДНК, то есть последовательность чередования 20 аминокислот в белке определяется чередованием 4 оснований в ДНК. Возникла задача выяснения соответствия между этими последовательностями - так называемая задача расшифровки генетического кода
.
Эта проблема потребовала нескольких лет напряженной работы, огромного количества остроумных и сложных экспериментов. Но важным этапом в ее решении был и чисто логический анализ, основанный на идеях теории информации. Существенная роль в этом анализе принадлежит Г. Гамову (1954)
.
Г. Гамов подошел к задаче расшифровки генетического кода как к формальной проблеме перевода текста с одного языка па другой. Это позволило отвлечься от частных химических проблем и использовать ряд общих соображений. Ясно, например, что аминокислота не может определяться одним основанием, так как аминокислот 20, а оснований только 4. Нельзя кодировать аминокислоты и парами оснований, так как число таких пар всего 16. Таким образом, каждая аминокислота должна кодироваться по крайней мере тройкой оснований (триплетом
). Но число таких триплетов равно 64, то есть их слишком много для кодирования 20 аминокислот. Следовательно, триплетный код должен быть или вырожденным (то есть одна и та же аминокислота кодируется несколькими разными триплетами) или неполным (то есть некоторые триплеты не кодируют ничего, они "бессмысленны"). В работах, развивавших теоретико-информационный подход к проблеме генетического кода, были поставлены и другие важные вопросы, например, вопрос о наличии в нем "знаков препинания" (то есть сочетаний, отделяющих одну "осмысленную" кодовую комбинацию от другой) и т. д.
В начале 60-х годов Ф. Крик, М. Ниренберг и Д. Уотсон добились решающих успехов в расшифровке генетического кода. Было показано, что последовательность аминокислот в белке определяется неперекрывающимися триплетами оснований в ДНК (то есть код действительно оказался трехбуквенным), а "знаки препинания" между такими триплетами отсутствуют. Оказалось, что почти все аминокислоты кодируются более, чем одним триплетом, то есть код действительно вырожденный (есть основания предполагать, что разные триплеты, отвечающие одной и той же аминокислоте, определяют разную скорость синтеза). В настоящее время составлен полный словарь, то есть выяснено точное соответствие между триплетами и аминокислотами. При этом выяснилось, что 3 из 64 возможных триплетов не отвечают ни одной из аминокислот. Эти "бессмысленные" триплеты играют особую роль - они служат сигналом к концу синтеза, к обрыву синтезируемой белковой цепи.
Работы по расшифровке генетического кода были удостоены в 1968 г. Нобелевской премии.
Генетический код оказался универсальным, то есть одинаковым для всех живых существ.
Наряду с самим генетическим кодом большой интерес представляет и выяснение механизма его реализации. Каким именно образом информация, "записанная" в молекуле ДНК, считывается с нее и используется для построения соответствующей белковой молекулы? В очень общих чертах этот процесс, ряд деталей которого не выяснен до сих пор, выглядит следующим образом. На молекуле ДНК синтезируется одноцепочечная молекула рибонуклеиновой кислоты (РНК)
, которую называют информационной
, или матричной
РНК. Эта РНК попадает в рибосому - особую внутриклеточную частицу, где и происходит синтез белка. Отдельные аминокислоты, имеющиеся в цитоплазме, присоединяются к молекулам особой, так называемой транспортной РНК. С помощью этой РНК они доставляются к рибосоме и используются там как "строительный материал". Здесь возникает ряд новых информационных вопросов. Например, каким образом транспортные РНК узнают разные аминокислоты и различают между собой разные участки матричной РНК, доставляя нужные аминокислоты к нужному месту?
Хотя расшифровка генетического кода - это в первую очередь биохимическая проблема, ее математический теоретико-информационный анализ был тоже очень важен. Влияние теоретико-информационного подхода сказалось даже в терминологии - "генетический код", "информационная РНК" и др.
Управление синтезом белка в бактериальных клетках
[<< | >>]
. В живой клетке одновременно протекает по крайней мере несколько сот реакций. Строгий математический анализ всей этой разветвленной системы реакций в настоящее время невозможен: такой анализ потребовал бы совместного решения тысяч дифференциальных уравнений, не говоря уже о том, что многие происходящие в клетке биохимические реакции еще не изучены в такой мере, чтобы их можно было описывать количественно. Пока что мы вынуждены ограничиваться или изучением отдельных групп реакций, которые по каким-либо причинам можно рассматривать относительно изолированно, или качественными соображениями о механизмах регуляции биохимических реакций в клетке.
Из большого числа различных внутриклеточных биохимических процессов довольно детально исследован процесс синтеза белка в бактериальных клетках. Как сейчас хорошо известно, этот синтез идет под контролем генов
- структурных единиц хромосом. В соответствии с информацией, записанной в данном гене, синтезируется соответствующая белковая цепь, например, образуются структурные белки, которые входят в состав клеточных органелл, или синтезируются ферменты
- катализаторы внутриклеточных химических реакций. Но ход синтеза зависит и от внешних условий. Так, например, при появлении в среде, окружающей клетку, тех или иных питательных веществ начинается энергичный синтез ферментов, необходимых для переваривания именно этих веществ. А как только запас этих питательных веществ иссякает, прекращается и синтез ферментов. Таким образом, было показано, что в зависимости от окружающих условий активность соответствующих генов может регулироваться.
Детальный анализ этого процесса регуляции был выполнен Жакобом и Моно (см. [11]) на примере ферментов кишечной палочки (бактерия, обитающая в кишечнике), переваривающих молочный сахар. Было установлено, что в этом процессе участвуют три фермента, которым соответствуют три гена. Жакоб и Моно установили, что в бактериальных клетках могут возникать мутации, которые изменяют активность одновременно всех трех генов. При одной мутации подавлялся синтез всех трех ферментов, причем клетка прекращала их синтез даже при наличии в среде молочного сахара. Было показано, что эта мутация возникает на некотором расстоянии от трех генов, управляющих синтезом соответствующих ферментов. Жакоб и Моно высказали гипотезу, которую в настоящее время можно считать доказанной, что в клетке существует два типа генов: структурные гены, которые заведуют синтезом специфических белков, и управляющие гены, контролирующие активность структурных генов. Таким образом, Жакоб и Моно представляют себе систему регуляции синтеза белка как иерархическую систему, состоящую по крайней мере из двух уровней: структурных генов и управляющих генов. Дальнейший анализ показал, что управляющие гены в свою очередь делятся на два типа. Гены первого типа (их назвали гены-операторы
) расположены вблизи структурных генов и играют роль выключателей. При одном положении гена-оператора структурный ген ведет синтез белка, а при другом синтез белка блокируется. Управляющие гены второго типа (их назвали гены-регуляторы
) включают или выключают ген-оператор. Это происходит так. Под действием гена-регулятора синтезируется особый белок-репрессор. Этот белок переводит ген-оператор в состояние "выключено". При появлении в среде молочного сахара репрессор отделяется от гена-оператора, который переходит в состояние "включено" и запускает синтез нужных ферментов. Замечательная особенность этой ферментной системы состоит в том, что все три гена, контролирующие синтез соответствующих ферментов, располагаются рядом и запускаются или блокируются одним и тем же геном-оператором.
Таким образом, в системе регуляции синтеза белка в бактериальных клетках мы обнаруживаем те же общие принципы, которые были описаны в связи с регуляцией движений (см. II гл.): иерархическая система управления из нескольких уровней (гены-регуляторы и структурные гены) и блочное управление (несколько генов, объединенных в один комплекс, управляемый одновременно). Сходство с системой управления движением прослеживается и в более мелких деталях. Так, во второй главе мы говорили, что запуск движения (ходьбы и бега) верхним уровнем осуществляется с помощью простого сигнала, а детали движения строятся на нижних уровнях. Точно так же, ген-оператор только дает сигнал "включено - выключено", а структурные гены передают исполнительным органам детальную информацию.
"Блочная" организация управления характерна не только для синтеза ферментов, переваривающих молочный сахар, но и для многих других внутриклеточных процессов. Так, в системе биосинтеза одной из аминокислот - гистидина - один репрессор подавляет около десяти генов, расположенных рядом. При синтезе другой аминокислоты (аргинина) один и тот же репрессор выключает три разных гена-оператора, расположенных в разных местах. Обнаруживаются в системах внутриклеточного синтеза и другие особенности, присущие сложным многозвенным процессам регуляции, в частности, наличие обратных связей, как положительных, так и отрицательных. Например, как было сказано, синтез некоторых ферментов начинается только после появления в среде соответствующих питательных веществ (эти вещества называют индукторами
). Здесь имеет место положительная обратная связь. С другой стороны, при избытке в клетке конечных продуктов некоторых реакций происходит подавление синтеза ферментов, необходимых для образования этих продуктов. Это - отрицательная обратная связь.
Математическое описание процесса синтеза белка
[<< | >>]
. Рассмотрим, следуя [37], простейшую схему регуляции синтеза белка в клетке. Пусть на молекуле ДНК синтезируется информационная РНК, которая доставляется к рибосоме, где синтезируется некоторый фермент; пусть затем этот фермент действует на некоторый субстрат, образуя конечный продукт, который служит репрессором, то есть действуя на ДНК, тормозит синтез РНК на ней. Пусть Х(t)
, Y(t)
, Z(t)
- концентрации РНК, фермента и репрессора соответственно в момент t
. Найдем систему уравнений, связывающих эти функции.
Уравнение, определяющее изменение концентрации РНК. Это изменение определяется взаимодействием двух процессов - синтеза РНК и ее распада. Скорость синтеза естественно считать пропорциональной доле незаблокированных репрессором генов, участвующих в этом синтезе. Пусть p
- доля незаблокированных генов. Тогда (1 - р)
- доля генов, заблокированных репрессором. Заблокированные гены могут с некоторой скоростью освобождаться от репрессора, в силу чего доля разблокированных генов увеличивается за единицу времени на величину a(1 - р)
, где a
- постоянная. С другой стороны, все время идет процесс блокирования свободных генов. Его скорость естественно считать пропорциональной концентрации репреcсора. Он уменьшает за единицу времени долю свободных генов на величину bZр
(b
- постоянная). Если процесс установился, то есть значение p
не меняется, то должно выполняться равенство
а(1 - р) = bZр
(процессы блокировки и разблокировки генов уравновешивают друг друга). Отсюда
.
Таким образом, процесс синтеза РНК идет со скоростью, равной
.
Скорость распада РНК естественно считать пропорциональной ее концентрации, то есть равной kХ
,
Объединив процессы синтеза и распада РНК получаем, что величина X
удовлетворяет уравнению
Уравнение, определяющее изменение концентрации фермента.
Посмотрим теперь, чем определяется изменение концентрации фермента. Если считать, что всегда имеются в избытке свободные рибосомы, то скорость синтеза фермента естественно положить пропорциональной концентрации РНК. Что же касается скорости распада фермента, то она пропорциональна его собственной концентрации. Таким образом, получаем
Уравнение, определяющее изменение концентрации репрессора.
Для репрессора скорость прироста прямо пропорциональна концентрации фермента, а его расход равен концентрации самого репрессора, умноженной на некоторый коэффициент a
(a
может быть переменной величиной, а может быть и постоянной). Следовательно, для скорости изменения концентрации репрессора получаем уравнение
Мы получили для описания процесса синтеза систему уравнений (1)-(3). Эта система нелинейна (нелинейность содержится в первом уравнении) и выписать ее решение в явном виде невозможно даже в случае
. Можно решать эту систему численно, но можно получить некоторые результаты и с помощью качественного ее исследования. Это исследование существенно упрощается, если воспользоваться следующим обстоятельством.
a
= const
Известно, что реакции, регулирующие концентрацию репрессора, идут гораздо быстрее остальных участвующих в синтезе реакций. Поэтому, если нас интересует поведение величин X
и Y
- концентраций РНК и фермента, - то можно считать, что равновесное значение Z
уже достигнуто, и рассматривать дальнейшее поведение системы при этом условии. Положив в (3) dZ / dt=0
, получим для Z
равновесное значение
Подставив это значение Z
в (1) и положив для краткости bg /
, получим систему двух уравнений
a
= m
Основной интерес представляет вопрос о существовании в рассматриваемой системе устойчивых колебательных режимов. Если ограничиться рассмотрением состояний, близких к равновесному, то решение этого вопроса можно получить следующим образом. Будем рассматривать в качестве новых неизвестных функций не X
и Y
, а их отклонения от равновесных значений Х0
и У0
, определяемых условиями dX / dt = 0
и dY / dt = 0
. Положив
X = X0 + x, Y = Y0 + y,
подставим эти выражения в уравнения (4) и (5). Далее, поскольку x
и y
- малые величины, отбросим члены выше первой степени относительно x
и y
. Получим систему линейных уравнений с постоянными коэффициентами:
где
Решения этой системы могут быть найдены в явном виде; они выражаются через показательные и тригонометрические функции. Как показывает несложное исследование, решения системы (6) или представляют собой затухающие колебания или не колеблются вовсе. Далее, из общих теорем теории устойчивости следует, что такой же характер имеют и близкие к стационарному решения исходной системы (4)-(5). Итак, если рассматривать процесс белкового синтеза в предположении, что в клетке уже установилась равновесная концентрация репреосора, то при малых отклонениях концентраций от равновесных или возникают затухающие колебания или колебания вообще отсутствуют.
Положение существенно изменяется, если учесть следующее обстоятельство. Для перехода молекулы РНК из ядра (где она синтезируется) в рибосому (где она "срабатывает") требуется некоторое время t
. Поэтому скорость синтеза фермента в некоторый момент t
определяется концентрацией РНК не в этот момент, а в момент t -
. Если учесть это запаздывание, то получится система уравнений, среди решений которых будут, в частности, и незатухающие колебания. Учет t
"эффекта запаздывания"
, связанного с тем, что влияние того или иного фактора на другие передается не мгновенно, важен при описании самых различных процессов - физических, биохимических, экономических и т. д. В последние 20-25 лет теория дифференциальных уравнений с запаздыванием получила большое развитие и нашла многочисленные применения. Как оказалось, наличие колебательных режимов довольно характерно для регуляторных систем, описываемых такими уравнениями.
Описание протекающих в клетке химических реакций системой дифференциальных уравнений, в которых неизвестными служат концентрации или количества различных веществ, рассматриваемых как функции времени, было предложено в 1945 г. К. Хиншельвудом
. Однако реализация этого подхода применительно к тем или иным конкретным реакциям оказывается весьма трудной. Исследования биохимиков показали, что биохимические процессы в клетке обычно слагаются из целого ряда последовательных простых реакций. Каждая простая реакция катализируется своим ферментом и состоит, как правило, в разрыве или образовании какой-либо одной химической связи. Например, процесс образования из молекулы сахара двух молекул молочной кислоты
С6Н12О6 2С3Н6О3,
при котором шестиуглеродная цепь сахара разрывается пополам, состоит из 11 отдельных реакций, каждая из которых катализируется своим ферментом.
Совокупность этих простых реакций может представлять собой линейную последовательность, разветвленную систему или систему, содержащую циклы. Для описания таких совокупностей реакций системами дифференциальных уравнений нужны сведения о каждой отдельной реакции. К сожалению, мы редко располагаем такими исчерпывающими данными. Примером такой хорошо исследованной реакции может служить разложение глюкозы на С02
и Н20
(см. [24, стр. 208-230]). Математически эта реакция описывается системой из 21 дифференциального уравнения, анализ которой требует, естественно, применения вычислительной техники. Вместе с тем разложение глюкозы относится к числу далеко не самых сложных внутриклеточных процессов. Отсюда видно, что рассмотренная нами выше ситуация, когда взаимодействие трех компонент - РНК, фермента и репрессора - описывается системой всего лишь трех дифференциальных уравнений, никак не характеризует действительную сложность идущих в клетке реакций.
В предыдущих параграфах мы рассматривали в основном сложные многоклеточные структуры - организм в целом, зрительную систему и т. д. В последнем параграфе был сделан переход на другой уровень, и мы познакомились, хотя и очень бегло, с организацией некоторых внутриклеточных процессов и структур. Возможен и естественен переход и в противоположном направлении: от отдельного организма и его подсистем к изучению больших биологических сообществ - скоплений организмов данного вида (популяций) или даже сообществ, состоящих из нескольких взаимодействующих между собой видов. Изучение законов, управляющих развитием подобных сообществ, динамикой их численности, передачей и отбором тех или иных признаков составляет содержание таких разделов биологии как генетика
и динамика популяций
. Именно эти направления были одними из первых, где применение математических методов привело к определенным успехам. Однако изложение этих важных и увлекательных вопросов выходит за рамки нашей книги.
5. Некоторые математические проблемы, возникшие в связи с биологическими исследованиями
<< | >>
До сих пор мы говорили о возможностях и перспективах применения математических методов для нужд биологии. Но не менее важна и "обратная связь" - влияние биологических исследований на развитие математики, на появление новых математических проблем. За последние десятилетия это влияние биологии на математическую проблематику стало достаточно существенным. В этой заключительной главе мы рассмотрим некоторые математические проблемы, возникновение которых полностью или в значительной мере связано с теми или иными биологическими исследованиями.
5.1 Проблемы надежности и скорости
<< | >>
Одно из замечательных свойств живых систем - это их надежность.
Еще сравнительно недавно старые кадровые артиллеристы, сетуя на замену в артиллерии конной тяги механической, выдвигали в качестве основного аргумента то, что живое существо - лошадь - гораздо надежнее в работе, чем самый совершенный механизм. Вместе с тем элементы, из которых строится живая система, - отдельные клетки - вовсе не обладают такой уж большой надежностью. Их ответы на те или иные воздействия довольно неустойчивы, а сами клетки легко разрушаются. Это положение обратно тому, с которым мы обычно встречаемся в технических системах. Там, как правило, усложнение конструкции требует для обеспечения работоспособности системы все большей надежности отдельных ее элементов. Например, если в радиоприемнике имеется пять ламп, каждая из которых служит в среднем 1000 часов, то такое устройство можно считать достаточно надежным. А если взять ламповую вычислительную машину (сейчас такие машины вышли из употребления, но еще в 50-х годах они были широко распространены), содержащую несколько тысяч ламп, то при той же надежности отдельных элементов машина в целом весьма ненадежна, поскольку в среднем через каждые 10-15 минут какая-нибудь из ламп в машине перегорает, выводя машину из строя.
Какими же способами в живых организмах достигается такая надежность системы, которая существенно превосходит надежность составляющих ее элементов? Как математическую проблему этот вопрос впервые рассмотрел Дж. Нейман [1, стр. 68-139]
. Изучая цепи, составленные из элементов, каждый из которых может с некоторой вероятностью "не сработать", он показал, что вероятность "несрабатывания" такой цепи в целом при соответствующей организации ее работы можно сделать сколь угодно малой. Например, если имеется достаточно большой запас ненадежных выключателей, каждый из которых с некоторой вероятностью e
не замыкает сеть в положении "включено" и с той же вероятностью не размыкает ее в положении "выключено", то из них можно собрать схему, которая будет работать как выключатель, имеющий сколь угодно малую вероятность ошибки*).
*) При этом следует полагать, что |
В такого рода схемах надежность достигается применением процедуры, аналогичной "принятию решения большинством голосов". При этом, однако, увеличение надежности достигается за счет возрастания числа элементов, составляющих сеть, то есть за счет так называемой избыточности.
Работа Неймана была продолжена рядом исследователей. Так К. Шеннон [43] рассмотрел связь проблемы построения надежных схем из ненадежных элементов с проблемой построения надежного кода для случаев, когда надежность передачи отдельного символа низка. Шеннон показал, что если вместо простых выключателей выбрать более сложные исходные элементы, то такое же повышение надежности, как в схемах Дж. Неймана, может быть получено при меньшей избыточности.
Специально была рассмотрена проблема надежности нейронных сетей. Как только появилась первая работа Мак-Каллока и Питтса о сетях из простых формальных нейронов, сразу же был отмечен существенный недостаток этих сетей - их крайне низкая надежность: выход из строя всего одного нейрона мог принципиально изменить характер работы всей сети. В 1958 г. Мак-Каллок предложил усложненную модель формального нейрона. В ней, во-первых, допускается, что порог нейрона может меняться во времени; во-вторых, принят закон суммации возбуждающих и тормозных входов, более близкий к реально наблюдаемому (возбуждение наступает, когда алгебраическая сумма входных сигналов превышает пороговое значение; в исходной модели срабатывание одного тормозного синапса предотвращало возбуждение нейрона); и наконец, учтено существованне пресинаптического торможения, то есть существование входных волокон, возбуждение которых может блокировать приход сигнала по другим волокнам. Рассмотрен ряд вопросов о конструировании из таких элементов надежных сетей, или как их называет Мак-Каллок, сетей, устойчивых к шуму [21, 33]. В частности была рассмотрена и решена задача о синтезе сетей, работа которых не меняется, когда порог всех нейронов одновременно сдвигается на одну или несколько единиц ("логически стабильные" сети
). Поясняя значение этой модели Мак-Каллок говорит, что в живом организме такой сдвиг порогов может происходить без существенного нарушения некоторых функций, например, ритмическая работа нейронов дыхательного центра не прекращается и при таких дозах наркоза, когда пороги этих нейронов увеличиваются вдвое. Далее были исследованы возможности и методы построения нейронных сетей, которые работают без ошибок при неодновременных и даже разнонаправленных сдвигах порогов образующих их элементов, а также при изменении веса синапсов, появлении новых связей между нейронами и при некоторой вероятности того, что нейрон не ответит на сверхпороговый сигнал или, напротив, самопроизвольно возбудится в отсутствие входного сигнала.
Нет оснований считать, что принцип дублирования элементов, предложенный Дж. Нейманом для построения надежных схем из ненадежных элементов, - единственный, с помощью которого может быть решена за дача обеспечения надежности, и что именно так она решается в живых системах. Выше, рассматривая модели формообразования, мы упоминали задачу сохранения структуры и некоторые способы ее решения. Например в задаче о "трехцветном флаге"
рассматривалась система, устойчиво сохраняющая свою структуру (структура трехцветного флага восстанавливается после удаления части элементов), однако там эта устойчивость достигается соответствующим взаимодействием элементов, а вовсе не их дублированием - в этой модели нет элементов, расположенных параллельно удаленным и играющих до "аварии" роль резерва. И если некоторые из элементов вышли из строя, то оставшиеся перестраивают свою структуру, часть их меняет свои свойства и приходит на смену выбывшим. Эта модель более пластична, и, вероятно, для многих биологических ситуаций ближе к реальности, чем неймановская.
Заметим, кстати, что может быть имеет смысл ввести различие между терминами "надежность"
и "живучесть"
. Существуют такие функции, которые характеризуются всего двумя состояниями, например, "включено - выключено". Исправная система решает задачу такого рода, неисправная - не решает. В этом случае используют термин "надежность"
. Однако в биологических системах часты другие ситуации, когда кроме двух крайних состояний ("успешно решил задачу" - "не решил задачу") есть много промежуточных. Так, например, дыхание может стать более частым и менее глубоким, но все же обеспечивать поддержание жизни. В таких случаях, когда система продолжает справляться с задачей и после выхода из строя части ее элементов, хотя качество решения задачи при этом ухудшается, целесообразно говорить о "живучести"
, или "функциональной устойчивости"
системы. Такой "живучестью" обладает, например, перцептрон (рис. 22
).
Интересное направление в проблеме надежности развивает Л. Лефгрен ([33, стр. 226-281], [34, стр. 475- 517]). Лефгрен рассмотрел автоматы, состоящие из элементов, которые с некоторой вероятностью могут выходить из строя. В этих автоматах предусмотрены устройства, обнаруживающие испортившиеся элементы и заменяющие их исправными. Однако элементы, из которых состоят эти контролирующие устройства, сами могут портиться. Лефгрен оценивает время жизни таких "самовосстанавливающпхся" автоматов и показывает, что при прочих равных условиях время их правильной работы больше, чем при простом дублировании элементов. Автоматы Лефгрена могут служить простейшими моделями таких биологических процессов, как заживление ран или регенерация.
Таким образом, в настоящее время возникли разные подходы к проблеме надежности; возможно, что и в разных биологических ситуациях надежность обеспечивается за счет разных процессов, основанных на разных принципах.
Проблема надежности родственна в известной мере другой проблеме, которую можно назвать проблемой скорости [84]. Как известно, современная вычислительная машина производит арифметические операции несравненно быстрее, чем человек. Тем не менее при решении некоторых задач человеческий мозг вполне может конкурировать по скорости с самой быстродействующей машиной. Предположим, человеку задают вопрос:
"Смотрели ли Вы вчера в телескоп?" Как правило, для ответа на этот вопрос достаточно доли секунды (может быть, лишь астроном-наблюдатель, для которого смотреть в телескоп - обычное, но все же не ежедневное занятие, задумается чуть дольше). При этом, чтобы дать верный ответ, человеку вовсе не нужно вспоминать в деталях весь свой вчерашний день (встал, умылся, позавтракал и т. д.). Он сразу же использует некоторую более общую информацию (например, "никогда в жизни не смотрел в телескоп", или "смотрел, но это было очень давно"). А у машины нет аналогичного способа быстрого получения ответа. Если мы хотим выяснить, не записана ли в ее памяти (неизвестно в каком месте) какая-либо определенная информация, у нас нет иного способа, как перебрать по очереди все ячейки ее памяти. Обследование каждой отдельной ячейки делается быстро, однако при большом объеме памяти весь процесс такого последовательного поиска займет немало времени.
Способность человеческого мозга успешно справляться с задачами, требующими, казалось бы, перебора такого числа вариантов, которое затруднительно даже для электронной машины, обнаруживается в самых разнообразных случаях, например при игре в шахматы. Хороший шахматист "видит" все возможности игры на несколько ходов вперед и безошибочно рассчитывает многоходовые комбинации, учитывая все варианты. Как показывает несложный подсчет, если при этом действительно перебирать все допустимые правилами игры собственные ходы и все возможные ответы противника, то такой перебор окажется непосильным даже для самых быстродействующих электронных машин. Высказываемое иногда предположение, что в мозгу на самом деле происходит весьма быстрая, но не контролируемая нашим сознанием переработка информации, представляется маловероятным, так как для этого нужно было бы допустить существование в нервных клетках каких-то неизвестных нам и необычайно быстрых физико-химических процессов (ведь обработка информации - обязательно материальный процесс). Следовательно, экономия времени в такого рода ситуациях достигается не за счет каких-либо сверхбыстрых процессов, а за счет применения методов обработки информации, существенно отличных от полного перебора.
В последнее время в связи с развитием так называемого эвристического программирования
, то есть применения вычислительных машин к решению разного рода невычислительных задач (сюда относится и составление программ для игры в шахматы), был выполнен ряд исследований, посвященных различным методам повышения эффективности перебора возможных вариантов с целью выбора наилучшего. Полученные при этом математические результаты позволили, например, реализовать на сравнительно медленной вычислительной машине М-20 такую программу для игры в шахматы, которая для каждого целесообразного хода проделывает анализ из 5 полуходов вперед (то есть оценивает положение, возникающее после трех собственных ходов и двух ответов противника). Такую программу заведомо невозможно реализовать даже на более быстродействующей машине, если пользоваться методом полного перебора всех возможных вариантов.
Математические результаты, относящиеся к исследованию наиболее эффективных методов обработки и использования больших массивов информации, представляют существенный интерес. Однако все сделанное в этом направлении до сих пор не дает еще ясного ответа на вопрос о том, как справляются с такого рода задачами живые системы. Таким образом, наряду с парадоксом о надежных системах, построенных из ненадежных элементов, живые организмы приводят нас еще к одному парадоксу, который можно сформулировать так: быстрые системы, построенные из медленных элементов.
5.2 'Метод оврагов'
<< | >>
Задача о "разумном" или "целесообразном" функционировании той или иной системы, биологической или технической, родственна, по существу, чисто математической задаче об отыскании экстремума (для определенности, скажем, минимума) некоторой функции многих переменных.
Действительно, как правило, с такой системой можно связать некоторую функцию Ф
(оценочную функцию
), минимум которой отвечает оптимальному с некоторой точки зрения состоянию системы.
Если бы оценочная функция, о которой идет речь, была задана какой-то формулой, то для нахождения ее минимума можно было бы воспользоваться хорошо известным из анализа приемом: продифференцировать эту функцию по каждому из аргументов, приравнять эти производные нулю и решить полученную таким образом систему уравнений*).
*) Впрочем, при большом числе переменных этот путь мало эффектниен и в том случае, если функция задана аналитически. |
Однако в задачах, связанных с биологией, мы обычно не можем дать аналитического выражения для оценочной функции. Поэтому поиск ее минимума должен по необходимости сводиться к серии проб, или чисто случайных, или подчиненных определенной тактике. Так как наша оценочная функция, вообще говоря, меняется со временем (состояние, благоприятное для системы в данным момент, может оказаться непригодным для нее в дальнейшем в силу изменения окружающих условий), то процесс отыскания ее минимума должен повторяться многократно и не быть слишком длительным (иначе существенное изменение ситуации произойдет раньше
, чем мы закончим поиск). Какие же возможны разумные тактики такого поиска?
Если о функции Ф = Ф(x1, x2, ..., хn)
нам ничего не известно, то для отыскания ее минимума нельзя предложить ничего лучшего, чем так называемый слепой поиск, состоящий в том, что различные точки в пространстве параметров просматриваются в том или ином порядке, например случайном. В каждой из выбираемой точек находится значение оценочной функции и поиск прекращается тогда, когда находится значение, не превосходящее некоторого допустимого предела. После того, как в силу изменения оценочной функции во времени ее значение в данной точке превысит допустимый предел, поиск возобновляется. Ясно, что такой поиск, особенно в случае большого числа параметров, может быть весьма длительным. Например, если бы человек обучался координации движений при ходьбе с помощью "слепого поиска", то скорее всего он не научился бы ходить до конца жизни.
Если оценочную функцию можно считать непрерывно зависящей от параметров, то для отыскания ее минимума можно применять различные методы локального поиска, общей основой которых служит следующая идея: изучив поведение функции в окрестности некоторой точки, мы устанавливаем, в каких направлениях функция убывает, и в соответствии с этим перемещаемся в новую точку. Например, определяем в данной точке направление наибыстрейшего убывания функции и затем сдвигаемся в этом направлении на определенное расстояние (так называемый "градиентный метод"
). Однако во всех процессах локального поиска существует опасность "зацикливания", т. е. блуждания в окрестности какой-то локальной "ямы", в которой значения функции меньше, чем в близлежащих точках, но весьма далеки от абсолютного минимума.
Опасность такого зацикливания делает существенным использование тех или иных методов нелокального поиска. Однако для того, чтобы получить на этом пути результаты, существенно лучшие, чем при слепом поиске, нужно, чтобы наша функция была соответствующим образом организована. Поясним смысл этого, рассмотрев так называемый "метод оврагов"
, предложенный для отыскания экстремумов функций многих переменных И. М. Гельфандом и М. Л. Цетлиным [27, стр. 9-27], [64]. Идея этого метода возникла на основе изучения особенностей поведения живых систем.
Предположим, что переменные, от которых зависит функция Ф
, могут быть разбиты на две группы, скажем x1, x2, ..., хn
и у1, y2, ..., yn
. Допустим, что большинство переменных входит в первую группу и что изменение значений этих параметров заметно меняет значение функции Ф
. Эти переменные мы назовем несущественными
. Вторая группа включает небольшое число переменных (может быть, всего 2-3) и от них функция Ф
зависит слабо. Эти переменные называются существенными
. То обстоятельство, что изменение несущественных переменных достаточно резко сказывается на значении оценочной функции, позволяет сравнительно просто подобрать подходящие значения этих переменных; поэтому основные затруднения при отыскании экстремума связаны с наличием существенных переменных (именно этим и объясняется та на первый взгляд несколько нелогичная терминология, которую мы используем). Конечно, не всякая функция многих переменных допускает такое разбиение параметров на существенные и несущественные. Однако для многих функций, возникающих из практических задач, такое положение имеет место. В частности, с такой ситуацией приходится встречаться в задачах координации движений. Грубая схема того или иного движения (бег, прыжок, плавание, удар ракеткой по мячу и т. д.) усваивается человеком, как правило, сравнительно легко (на нашем языке - легко находятся нужные значения "грубых", несущественных параметров этого движения), после чего начинается трудная и кропотливая "отработка техники", совершенствование деталей этого движения (т. е. выбор оптимальных значений существенных параметров).
Разумеется, и в тех случаях, когда рассматриваемая функция обладает "организацией" в указанном выше смысле, мы не можем заранее выделить существенные и несущественные параметры, а лишь исходим из возможности такого выделения. Само же выделение существенных и несущественных переменных должно происходить автоматически в процессе отыскания экстремума.
Таковы те общие соображения, которые были положены в основу "метода оврагов". Сам этот метод состоит в следующем. Сперва в пространстве переменных выбираем некоторую произвольную точку x0
(рис. 27)
и, отправляясь от нее, начинаем поиск минимума каким-либо локальным способом, например спуском по градиенту. Спуск продолжается до тех пор, пока дальнейшее продвижение не станет малоэффективным, то есть пока отношение
(где D
Ф / Ф
- изменение D
ФФ
за один шаг) не станет меньше некоторой заданной величины. Эту величину не надо брать слишком малой, так как там, где
мало, различие между существенными и несущественными переменными исчезает и применение локального спуска приводит к блужданию, не приближающему нас к цели.
D
Ф / Ф
Рис. 27.
Схема 'Метода оврагов'.
|
Пусть локальный спуск привел нас в некоторую точку М0
. Зафиксируем ее и выберем некоторую точку x1
в окрестности исходной точки x0
, но отстоящую от x0
на расстояние, существенно превышающем шаг градиентного спуска. Применив в точке x1
локальный спуск, придем в некоторую точку М1
. После этого соединим точки М0
и М1
прямой, выберем на этой прямой точку x2
, отстоящую от точки М0
на некоторое расстояние L
, существенно превышающем первоначально выбранный градиентный шаг, и затем производим из x2
спуск, приводящий нас в некоторую точку М2
. Далее по точкам М1
и М2
выбирается точка x3
, так же как по М0
и М1
выбиралась точка x2
, и процесс повторяется.
Наглядно смысл метода можно пояснить так. Разделение переменных на существенные и несущественные означает, что поверхность, определяемая рассматриваемой функцией Ф
, имеет вид рельефа, прорезанного "оврагами", и мы сперва нащупываем направление такого "оврага" (прямая М0 М1
, а потом идем по его дну к возможно более низкой точке (рис. 27)
.
Рис. 28.
Линии уровня функции, сильно зависящей от |
Следует отметить, что та организация функции с разделением переменных на существенные и несущественные, на которой основана эффективность метода оврагов, может оказаться весьма неблагоприятной для применения других методов поиска экстремума. Например, ограничиваясь для наглядности случаем двух переменных, рассмотрим функцию f(х, у)
, которая сильно зависит от y
и слабо - от x
. Линии уровня такой функции имеют вид вытянутых эллипсов (рис. 28)
. Если мы, находясь в некоторой точке М0
, попытаемся для достижения минимума двинуться по градиенту, то, как видно из рисунка, соответствующее направление будет почти перпендикулярно тому, по которому из точки М0
на самом деле нужно идти в точку минимума М*
. Таким образом, рассматриваемая организация функции благоприятна для метода оврагов, но неблагоприятна для метода спуска по градиенту. Напротив, если функция одинаково сильно зависит от всех переменных, то метод оврагов фактически сведется к тому локальному методу, который в нем используется как один из этапов.
"Метод оврагов"
был с успехом применен к решению ряда задач, например к изучению молекулярной структуры некоторых аминокислот по данным рентгеноструктурного анализа, к задаче рассеяния элементарных частиц, к задаче прогнозирования при разведке нефти и т. д. Во всех этих задачах использование метода оврагов позволило во много раз сократить время необходимых расчетов.
Вернемся еще раз к парадоксальному быстродействию живых систем (см. 1
этой главы). В чем причина ускорения расчетов при использовании метода оврагов? Если для нахождения минимума функции многих переменных пользоваться случайным поиском, то информация, полученная при определении оценочной функции Ф
в одной точке, в дальнейшем при поиске значений Ф
в других точках никак не используется. При локальных методах поиска информация, полученная о значении функции Ф
в окрестности данной точки, используется для перемещения на небольшое расстояние от этой точки. Наконец, в методе оврагов используется информация о значениях функции Ф
в двух разных точках; кроме того используются сведения об организации функции, что и позволяет сделать большой шаг вдоль оврага и тем самым сильно сократить время поиска.
Очевидно, один из принципов, который позволяет живым системам очень быстро перерабатывать информацию, как раз и состоит в использовании сведении (или гипотез) об организации среды. Вернемся к игре в шахматы. Изучение движений глаз шахматистов позволило установить, какие именно поля доски и фигуры фиксирует игрок при выборе очередного хода (кроме того, анализировалась игра слепых шахматистов, ощупывающих поля доски и фигуры перед ходом). Эти исследования показали, что человек на самом деле каждый раз анализирует только сотую или тысячную часть ходов, возможных в данной позиции. Такое сокращение перебора обеспечивается прежде всего учетом предшествующей ситуации на доске, которая уже была проанализирована ранее, и учетом связей между разными фигурами. Так как отдельные позиции, последовательно возникающие в шахматной партии, не независимы между собой, и в каждой данной позиции фигуры не набросаны на доску случайным образом, то и выбор хода оказывается подчиненным некоторой далеко не случайной тактике. По-видимому, случайный перебор используется только в тех задачах (шахматы к ним не относятся), в которых отсутствуют какие бы то ни было данные или гипотезы об организации системы.
Вероятно, быстрота, с которой человек может вспомнить какое-либо событие, не воскрешая в памяти всю свою жизнь с самого рождения до данной минуты или в обратном порядке, связана с тем, что наша память обладает определенной и притом достаточно хорошей организацией. Проблема такой организации памяти, при которой из нее можно было бы быстро извлекать нужную информацию, не прибегая к полному перебору, имеет первостепенное значение для создания автоматизированных информационных систем (АСУ), новых более совершенных вычислительных машин и т. д.
5.3 Автоматы в случайных средах
<< | >>
Одно из важных качеств живых систем - это так называемая целесообразность поведения
. Каждое живое существо действует таким образом, чтобы обеспечить себе возможно более благоприятные условия (ищет пищу, уклоняется от опасностей и т. д.). Естественно, возникает желание построить формальную математическую модель такого поведения. Это было осуществлено М.Л. Цетлиным в развитой им теории поведения автоматов в случайных средах [42]. Изложим кратко основные идеи этой теории.
Под автоматом
, или, точнее, конечным автоматом
, понимается некоторое устройство А
, обладающее следующими свойствами:
S1, S2, ..., Sn
, и в каждый момент времени находится в одном из этих состояний;
j
1, j
2, ..., j
l
., выбор действия определяется состоянием автомата (но возможно, что различным состояниям отвечает одно и то же действие);
f1, f2, ..., fn
и в зависимости от получаемого сигнала изменять свое состояние.
Рассмотрим тот простейший случай, когда входной сигнал, получаемый автоматом от внешней среды, принимает только два значения: f = 1
и f = 0
, которые мы условно назовем поощрением
и штрафом
(или отсутствием поощрения
).
Мы скажем, что автомат находится в стационарной случайной среде, если действия автомата и сигналы, получаемые им от внешней среды, связаны следующим образом: в ответ на действие
, совершаемое в момент времени j
a
t
, автомат в момент t + 1
с вероятностью p
, получает поощрение, а с вероятностью a
q
получает штраф*).
a
= 1 - pa
*) Величины |
Если автомат совершает все свои действия с одной и той же вероятностью и независимо от воздействия среды, то математическое ожидание его выигрыша (за один такт работы) равно 1 / l * (p1 + p2 + ... + pn)
где l
- число действий. Далее очевидно, что при любом поведении автомата математическое ожидание его выигрыша заключено между min p
(что соответствует непрерывному повторению самого невыгодного действия) и max a
p
(что отвечает наивыгоднейшему действию). Если бы вместо автомата действовал человек, который знал бы величины a
p
, то его тактика была бы очевидна: он все время повторял бы то действие, которому отвечает максимальное a
p
, и получал бы (в среднем) максимальный возможный выигрыш, равный a
max p
. Но мы рассматриваем не человека, а автомат, который такими сведениями не располагает, а может лишь в зависимости от получаемых от среды сигналов переходить из одного состояния в другое и, следовательно, изменять свои действия. То, как автомат изменяет свои состояния (а следовательно и действия) в ответ на сигналы среды, называется a
тактикой автомата
. Мы скажем, что автомат обладает целесообразной тактикой, если математическое ожидание его выигрыша больше, чем 1 / l * (p1 + p2 + ... + pn)
то есть больше, чем выигрыш, отвечающий чисто случайному поведению. Нетрудно указать примеры автоматов, обладающих целесообразным поведением. Более того, можно доказать следующее утверждение: если среда задана (то есть заданы вероятности p
), то для каждого положительного числа a
a
можно построить такой автомат, что математическое ожидание его выигрыша будет меньше, чем на a
отличаться от max p
, т. е. от максимального возможного выигрыша.
a
Приведем элементарный пример автомата, обладающего целесообразным поведением. Пусть автомат А2,2
имеет два состояния S1
и S2
и два действия
и j
1
, причем в состоянии j
2S1
совершается действие
, а в состоянии j
1S2
- действие
. Пусть тактика этого автомата состоит в том, что при получении поощрения он сохраняет свое состояние, а при штрафе - изменяет. Если, в соответствии с введенными выше обозначениями, j
2p1
и q1 = 1 - p1
- вероятности поощрения и штрафа в первом состоянии, а р2
и q2 = 1 - р2
- аналогичные вероятности для второго состояния, то, как нетрудно показать, наш автомат (независимо от своего состояния в начальный момент) будет на протяжении длительного промежутка времени с вероятностью р1 / (р1 + р2)
находиться в состоянии S1
, а с вероятностью р2 / (р1 + p2)
- в состоянии S2
. Так как в состоянии Si (i = 1, 2)
математическое ожидание выигрыша равно рi
то окончательно математическое ожидание выигрыша для нашего автомата равно (p12 + p22) / (p1 + p2)
. Предположим, что p1 ≠ p2
если (p1 = p2
, то все тактики автомата дают один и тот же результат). Тогда элементарный подсчет показывает, что
то есть наш автомат выигрывает больше, чем автомат, выбирающий свои действия случайно.
Можно, несколько усложнив конструкцию такого автомата, увеличить его выигрыш. Пусть автомат после штрафа меняет свое действие на противоположное не сразу, а лишь в том случае, если он получает штраф на протяжении m
тактов подряд (т в этой конструкции называют глубиной памяти
, так как автомат на протяжении m
тактов как бы помнит, что ему было "хорошо" в данном состоянии и не спешит выйти из этого состояния). Рассмотренный нами выше простейший автомат имеет глубину памяти, равную единице.
Если параметры среды (то есть вероятности p
) не постоянны, а меняются с течением времени случайным образом, то опять-таки можно ставить вопрос об автомате, обладающем в данной среде целесообразным поведением. Можно, например, считать, что имеются две стационарные среды и автомат случайным образом переходит из одной среды в другую. При этом ему нужно после каждого перехода "адаптироваться к новым условиям" и важно, чтобы это время адаптации было мало по сравнению со временем, в течение которого среда остается постоянной. Иначе автомат не будет успевать приспосабливаться к перемене условий существования. Анализ показал, что для заданной частоты изменений среды существует оптимальная глубина памяти автомата. Если память автомата чрезмерно велика, то его поведение недостаточно гибко и он не успевает адаптироваться к изменениям среды. Если же память автомата слишком мала, то ухудшается его поведение в те промежутки времени, когда характеристики среды не меняются.
a
Вместо взаимодействия одного автомата со средой можно рассматривать поведение коллектива взаимодействующих между собой автоматов в некоторой среде [42]. При этом возможный выигрыш каждого автомата определяется как его собственной тактикой, так и тактикой остальных автоматов, которые по отношению к каждому фиксированному автомату тоже играют роль своего рода "внешней среды". В предыдущей главе мы отмечали важное значение моделей коллективного поведения автоматов, в частности для анализа морфогенеза и обучения движениям.
Мы не имеем возможности излагать здесь теорию поведения автоматов сколько-нибудь подробно. Нам хочется лишь подчеркнуть, что такое, казалось бы далекое от математики понятие, как понятие целесообразности поведения живого организма, на самом деле, при соответствующей его формализации, приводит к постановке точных задач и к интересным и важным математическим результатам.
В частности, изучение коллективного поведения автоматов привело к возникновению нового направления в теории игр
- развитой М. Л. Цетлиным теории игр автоматов
. В классической теории игр (одним из создателей которой был Дж. Нейман [30]) предполагается, что задающая игру система поощрений и штрафов, зависящая от ходов противников, сообщается игрокам заранее. Пользуясь этой информацией, игроки вырабатывают свои стратегии. При этом каждый игрок считает, что его партнеры играют наилучшим образом (иногда говорят, что игрок в теории игр действует так, как будто бы он играет с Богом). Таким образом, как говорил М. Л. Цетлин, классическая игра напоминает шахматную партию, которая начинается и заканчивается домашним анализом.
М. Л. Цетлин рассмотрел более реальную ситуацию, исследовав такие игры, в которых игроками являются конечные автоматы. Эти автоматы исходно не обладают исчерпывающими сведениями об игре. Только в процессе самой игры они постепенно "нащупывают" систему поощрений и штрафов. При этом было показано, что в ряде игр автомат добивается не худшего результата, чем игрок Неймана. В классической теории игрок является неким идеальным созданием, не делающим ошибок; его действия в каждой ситуации предполагаются наилучшими из возможных. В играх автоматов можно учитывать не только особенности самой игры, но и возможности партнера (например, емкость его памяти). В ходе игры автомат выясняет как принципы игры, так и качества противника. При этом интересно исследовать игры автоматов с разной конструкцией, разной емкостью памяти и т. д. Теория игр автоматов полезна для моделирования различных конфликтных ситуаций, в том числе и связанных с биологическими системами.
5.4 Формальные модели самовоспроизведения
<< | >>
Во все времена одной из самых характерных черт живых существ считалась их способность порождать себе подобных. Вопрос о том, способны ли к такому воспроизведению не живые существа, а машины, представляется на первый взгляд не очень серьезным. Дж. Нейман был первым, кто поставил его как строгую научную проблему и получил здесь глубокие результаты (см. [З], [29], [39]). Его интерес к этим вопросам стимулировался как желанием разобраться в фундаментальных свойствах биологических систем, так и стремлением выяснить те возможности, которыми обладают (хотя бы в принципе) создаваемые человеком автоматические конструкции.
Некоторыми авторами, в том числе и самим Дж. Нейманом, были предложены различные физические конструкции, обладающие способностью к самовоспроизведению. Точнее, речь идет о следующем: некоторое устройство, "машину", помещают в среду, в которой находятся в достаточном количестве соответствующие детали ("пища"). Машина отбирает необходимые детали и создает из них собственную копию. В отсутствие же первоначальной машины, то есть "родителя", детали "сами собой" в такую машину не соединяются.
Некоторые из таких конструкций весьма просты и в то же время остроумны. Так, например, английский генетик Пенроуз придумал следующую модель: имеются два типа деталей, представляющих собой определенной формы плоские куски твердого материала, снабженных выступами и захватами (рис. 29)
. Обозначим эти два типа деталей символами А
и Б
.
Рис. 29.
Механическая модель самовоспроизведения, предложенная Пенроузом.
|
Элементы А
и Б
могут сцепиться друг с другом двумя различными способами, образуя либо машину АБ
, либо машину БА
. Если на фанерный лист с прибитыми к нему планками поместить элементы обоих типов, а затем встряхивать лист, то не образуется ни машин АБ
, ни машин БА
(рис. 29
, позиции 1
и 2
). Если же на лист поместить исходно машину АБ
, то при встряхивании она придаст свободным элементам нужный наклон н начнут возникать новые копии АБ
(рис. 29
, позиции 3
и 4
). Если первоначально на лист поместить машину БА
и запас деталей, то при встряхивании будут возникать новые экземпляры машин БА
, но не АБ
(рис. 29
, позиции 5
и 6
).
Дж. Нейман также предложил некую кинематическую модель, которая представляла собой автомат, состоящий из ряда элементов: датчика, обнаруживающего присутствие других деталей, соединительных частей для их скрепления и т. д. (такой автомат не был изготовлен из реальных деталей, а рассматривался теоретически). Дж. Нейман показал, что можно создать такую машину с определенной программой, собирающую из готовых деталей подобные себе автоматы и копирующую для них свою программу.
Дж. Нейман отмечал, что программа его самовоспроизводящихся автоматов подобна хромосомному набору клетки, а передачу программы вновь построенному автомату можно сравнить с передачей хромосом дочерней клетке после предварительного удвоения генетического материала. С этой точки зрения ошибки в программе нового автомата, возникающие при ее переписывании, - аналог генетических мутаций. Нейман показал, что существует некоторый критический уровень сложности для самовоспроизводящихся автоматов. Автоматы, имеющие сложность ниже критической, могут порождать только более простые автоматы, чем они сами. Автоматы, имеющие сложность выше критической, могут порождать подобные себе или даже более сложные автоматы. Таким образом, при некотором уровне сложности системы возникает предпосылка для ее дальнейшей самостоятельной эволюции и приспособления к среде.
Построение подобных моделей весьма увлекательно, но мы рассмотрим сейчас чисто логическую сторону дела, то есть будем говорить не о физических, а о математических моделях самовоспроизведения.
Представим себе плоскость, разбитую на квадратные клетки. Предположим, что в каждой такой клетке "живет" некий автомат, имеющий конечное число состояний. Время будем считать дискретным. Предположим, что состояние каждого автомата в момент времени T
определяется состоянием самого этого автомата и всех его соседей в момент Т - 1
. Будем, наконец, считать, что для каждого автомата есть состояние, называемое покоем, и что в каждый момент времени все автоматы, кроме некоторого конечного их числа, находятся в этом состоянии.
Назовем конфигурацией
любой фиксированный набор клеток, в каждой из которых для находящегося в ней автомата зафиксировано его состояние. Конфигурация С'
называется копией конфигурации C
, если одна из них может быть переведена в другую с помощью некоторого движения плоскости. Пусть C
- некоторая конфигурация и пусть в момент Т = 0
во всех клетках, не принадлежащих C
, автоматы находятся и состоянии покоя. Говорят, что эта конфигурация способна произвести n
потомков за время T
, если в какой-то момент Т' ≤ Т
в конфигурации, состоящей из всех активных (то есть не находящихся в состоянии покоя), клеток, имеется n
попарно непересекающихся копий конфигурации C
. Конфигурация называется неограниченно размножающейся
, если для каждого n
найдется время T
, за которое эта конфигурация способна воспроизвести n
потомков.
Описанная формальная схема (также предложенная Дж. Нейманом) представляется, конечно, чрезвычайно упрощенной по сравнению с теми процессами самовоспроизведения, которые мы наблюдаем в живой природе. Однако эта упрощенная схема допускает постановку и строгое математическое решение ряда интересных и важных вопросов, таких как существование нетривиальных (то есть достаточно сложных) неограниченно размножающихся конфигураций, оценка возможной скорости их размножения и т. д. Таким образом, здесь мы опять-таки, как и во многих других случаях, исходя из некоторого реального явления (в данном случае - размножения), строим абстрактную модель, сохраняющую лишь некоторые, самые основные черты этого явления, но зато достаточно простую, чтобы можно было на ее основе строить точную математическую теорию.
Работы Дж. Неймана были продолжены рядом исследователей. М. Арбиб рассмотрел модели самовоспроизведения не только на двумерной решетке, но и с выходом в третье измерение [З]. Э. Мур [78] доказал теорему о существовании конфигураций, которые можно задать в начальный момент, но которые не могут быть получены в момент Т ≠ 0
ни из какой конфигурации, заданной в начальный момент*).
*) Конфигурацию, которая не может быть получена из какой-либо иной в процессе эволюции системы, называют |
Поскольку эти конфигурации не воспроизводятся никакими другими конфигурациями, они не могут воспроизводить также и самих себя. Исследование условий, при которых существуют такие конфигурации, помогает провести границу между системами, способными и неспособными к самовоспроизведению.
5.5 Проблемы искусственного интеллекта и распознавание образов
<< | >>
До сих пор мы касались, в основном, математических моделей и проблем, Возникающих в связи с такими биологическими процессами, как выполнение движений, распространение возбуждения, размножение (самовоспроизведение). Все эти процессы обязаны с чисто физиологическими, а не "интеллектуальными" функциями организма. Но в последнее время возник большой интерес к проблемам, которые принято называть проблемами "искусственного интеллекта" [13]. Под этим понимается применение вычислительных машин к решению различного рода задач (не вычислительных), которые мы считаем специфическими для сознательной деятельности разумного существа. Например, может ли машина "научиться" играть в шахматы хотя бы на уровне рядового шахматиста, а если это возможно, то какие принципы должны быть положены в основу ее обучения? Задача составления и исследования "шахматных программ" уже дала ряд интересных и важных математических результатов, значение которых выходит за пределы породивших их шахматных проблем.
Сейчас достигнуты некоторые успехи в осуществлении на вычислительных машинах такой "высоко интеллектуальной" деятельности, как нахождение формулировок и доказательств математических теорем. Несомненно, что в этой области мы достигли бы значительно больших успехов, если бы математики могли разобраться в том, как они сами справляются с подобными задачами. Однако, по-видимому, работа интеллекта при решении подобных задач в значительной мере относится к области подсознательного и плохо поддается контролю.
К проблемам искусственного интеллекта примыкает и так называемое распознавание образов, о котором мы уже упоминали в связи с анализом кардиограмм (гл. III) и перцептронами (гл. IV). Будем для определенности говорить о зрительных образах, хотя можно было бы рассматривать и образы иной природы, скажем воспринимаемые с помощью слуха или осязания. Для того, чтобы разъяснить сущность такого рода проблем, рассмотрим следующий пример. Допустим, что человеку, не знающему букв, показывают различные начертания разных букв и каждый раз говорят, что это за буква. Вскоре этот человек научится узнавать буквы, причем не только в тех начертаниях, которые он видел, но и в других. Едва ли этот человек смог бы сам точно сформулировать те признаки, по которым он отличает одну букву от другой. Точно так же мы не можем детально описать, как именно (по каким формальным признакам) мы отличаем, например, кошку от собаки, хотя и делаем это достаточно легко и уверенно.
Возникает желание, с одной стороны, проанализировать те методы, с помощью которых задачу узнавания решает человек, а с другой - составить программу для решения такого рода задач на вычислительной машине. Видимо, процесс распознавания образов, осуществляемый нашим мозгом, основан в общих чертах на следующих принципах, которыми мы пользуемся подсознательно. В том материале, который предъявляется для обучения распознаванию тех или иных объектов, мы фиксируем различные признаки этих объектов (размер, форма, окраска и т. п.) и отбираем те из них, которые полезны в данной задаче (например, если нужно отличать зайцев от кошек, то число ног - признак бесполезный, поскольку и у тех, и у других по четыре ноги, а длина ушей - полезный признак, поскольку у кошек и у зайцев она различна). Отобрав некоторое, сравнительно небольшое число таких полезных признаков, наш мозг использует их в дальнейшем для опознавания новых объектов. Важно, что при этом мы не имеем заранее никакого списка "полезных" или, точнее, "несущих информацию" признаков; их отбор происходит в процессе самого обучения. При переходе к новой задаче - распознаванию объектов других типов - отбор таких признаков производится заново.
Описанные принципы могут быть положены в основу машинной программы распознавания образов. Однако реализация этих принципов на вычислительной машине связана с рядом математических проблем, в известной мере аналогичных тем, которые возникают, например, при составлении шахматных программ. В частности, здесь мы снова сталкиваемся с уже упоминавшимся парадоксом: мозг, состоящий из медленно работающих нейронов, решает задачи распознавания несравненно быстрее, чем быстродействующая вычислительная машина. Например, в экспериментах по узнаванию, проведенных М. М. Бонгардом и его сотрудниками на машине М-20, распознавание буквы "А" занимало около 20 сек, а человеку для решения подобных и даже значительно более сложных задач распознавания достаточно долей секунды.
Видимо настанет время, когда математическая биология превратится в такое же мощное орудие исследования живой природы, каким применительно к физическим явлениям служит сейчас теоретическая физика. Вместе с тем, несомненно и то, что биологические проблемы послужат источником многих математических исследований. Если пока что эти направления развиваются не слишком быстро, то это объясняется не недостатком биологических проблем, требующих математической разработки, а их сложностью.