Документ взят из кэша поисковой машины. Адрес оригинального документа : http://brain.bio.msu.ru/papers/Darkhovskii_Kaplan_Shishkin_2002_AutomRemoteControl_Complexity_rus.pdf
Дата изменения: Thu Dec 1 17:43:12 2005
Дата индексирования: Mon Oct 1 20:21:47 2012
Кодировка: Windows-1251
УДК TPESHIFUPXSU
Б.С.Дарховский, д-р физ-мат. наук (Институт системного анализа РАН), А.Я.Каплан, д-р биол. наук, С.Л.Шишкин, канд. биол. наук (Московский государственный университет им. М.В.Ломоносова) О ПОДХОДЕ К ОЦЕНКЕ СЛОЖНОСТИ КРИВЫХ (НА ПРИМЕРЕ ЭЛЕКТРОЭНЦЕФАЛОГРАММЫ ЧЕЛОВЕКА)
Предлагается новый подход к оценке "сложности" непрерывной кривой на отрезке. Основная идея предлагаемого подхода состоит в том, что сложность кривой должна оцениваться относительной долей информации, которая необходима для ее восстановления с заданной точностью по набору значений в конечном числе точек при помощи заданной совокупности методов. Предлагаемый подход иллюстрируется оценкой сложности различных фрагментов электроэнцефалограммы человека (ЭЭГ) и может быть использован, в частности, для макро- и микроструктурного анализа ЭЭГ.
1. Основная идея

Понятие 4сложности4 @или 4простоты4A того или иного объекта отE носится к числу фундаментальных научных понятийF Этой проблемой занимались многие выдающиеся ученыеD и имеются многочисленные поE пытки применить 4сложностной4 подход к прикладным задачамD в том числе и к анализу электроэнцефалограммы человека @ЭЭГAF Напомним вкратце основные идеиD связанные с понятием 4сложE ность4F ПоEвидимомуD впервые количественный подход к понятию 4сложность физической системы4 появился в статистической физикеD коE гда возникло понятие 4энтропия4F В равновесной статистической физиE ке под энтропией понимают коэффициент при асимптотике логарифма числа конфигурацийD обладающих теми или иными свойствамиD когда число степеней свободы системы стремится к бесконечностиF Чем больE ше энтропияD тем 4сложнее4 системаF В теории информации ШеннонаD созданной в RHEе годыD вводится понятие энтропии вероятностных распределенийF УстанавливаетсяD что энтропия есть некоторая мера 4степени неопределенности4D свойственE ной тому или иному вероятностному распределениюD и при естественных I


условиях эта мера единственнаF Можно показатьD что шенноновская энE тропия есть коэффициент при асимптотике логарифма числа 4типичE ных4 последовательностей независимых случайных величинD имеющих одно и то же данное распределение вероятностейD при увеличении длины последовательности @4типичные4 последовательности " это такие послеE довательностиD для которых отклонение частот событий от их вероятE ностей не превышает заданного малого числаAF Вновь можно говорить о томD что вероятностное распределение тем более 4сложно4D чем больE ше его энтропия @с этой точки зрения самое 4сложное4 распределение " равномерноеD так как оно имеет максимально большую неопределенE ностьAF Развитая Колмогоровым и Синаем @смFD напримерD IA теория динаE мических систем приходит к понятию энтропии таких системF По сутиD это обобщение шенноновской энтропии на динамические системыF ЭнE тропия динамической системы есть коэффициент при асимптотике лоE гарифма числа различных типов траекторий динамической системыD коE гда время стремится к бесконечностиF И снова энтропия динамической системы может служить мерой ее 4сложности4X чем 4сложнее4 системаD тем богаче разнообразие ее траекторийF Понятие энтропии динамической системы @и связанные с энтропиE ей такие 4нелинейные характеристики4D как корреляционный интегралD фрактальная размерностьD экспонента ЛяпуноваD смFD напримерD PA приE меняется и в так называемой нелинейнойD или 4хаотической4D динамикеF Одна из задач этой науки " восстановление описания динамической сиE стемы по ее реализациямF Здесь опять сложность системы отождествляE ется со сложностью ее описанияD тFеFD в конечном счетеD с энтропиейF В начале VHEх годов Колмогоров Q предложил новыйD алгоритмиE ческийD подход к понятию 4сложность4 объектовF Основная идея этого подхода состоит в томD что 4сложный4 объект требует для своего опиE сания много информацииD а 4простой4 " малоF Эта идея формализоваE на на языке теории алгоритмовD и сложностьD грубо говоряD измеряется длиной программыD приводящей к выделению данного объекта из некоE торого множестваF Именно эта идея Колмогорова ближе всего к тойD которую мы соE бираемся здесь изложитьF Но прежде чем это сделатьD рассмотримD как используются 4сложностные4 подходы в анализе ЭЭГF ЭЭГEсигналD как известноD относится к наиболее сложным физичеE ским сигналамF Это связаноD прежде всегоD с высокой @и принципиальной A нестационарностью ЭЭГ RF Вследствие нестационарности ЭЭГ меE тодыD основанные на подгонке различных моделей к уже зафиксироE P


ванной ЭЭГD принципиально не годятся для описания ее новых участE ковF Феномен нестационарности привел к необходимости предварительE ной сегментации ЭЭГ на @квазиAEстационарные сегменты с темD чтобы после такой сегментации для каждого сегмента подбирать свою матеE матическую модельF Для целей сегментации предпринимались попытки применить понятие 4сложность4D чтобы выделять в ЭЭГEсигнале одноE родные по 4сложности4 фрагментыF Используемые в литературе по анализу ЭЭГ понятия 4сложноE сти4 базируются на изложенных выше идеяхD прежде всегоD на энтропии @или близких 4нелинейных характеристиках4A динамических систем и шенноновской энтропииF Отметим основные дефекты подобных подхоE довF Базовым предположением нелинейной динамики @теории динамичеE ских системD теории детерминированного хаосаA является предположеE ние о томD что исследуемая динамическая система стационарнаD тFеF не меняет своих свойств во времениF Именно это предположение лежит в основе современной и весьма развитой математической теорииD имеющей многочисленные применения в физике и других областяхF Нарушение этого условия делает невозможным применение указанных подходовD но именно нестационарность и является едва ли не главным признаком ЭЭГEсигналаF Отметим здесьD что даже для стационарного случая задаE ча восстановления описания динамической системы по ее наблюдаемым траекториям весьма сложна и в практическом отношении весьма далека от своего решения @рекомендуем читателю ознакомиться с интересной и содержательной статьей PD гдеD поEвидимомуD впервые на достаточE но строгом математическом уровне рассмотрены практические аспекты этой проблемыAF Таким образомD попытка применения энтропийных понятий сложноE сти как способа описания динамической системыD генерирующей ЭЭГE сигналD на наш взглядD априори несостоятельнаF С другой стороныD исE пользование для характеризации ЭЭГEсигнала классической шенноновE ской энтропии такжеD на наш взглядD не вполне отвечает тем целямD которые можно было бы поставить при работе с таким сигналомF Дело в томD что шенноновская энтропия характеризует сложность распредеE ления вероятностейD илиD как выше отмечалосьD богатство 4типических4 траекторий последовательности независимых случайных величинF ДаE же если отвлечься от проблемы нестационарностиD такая характеристиE ка лишь опосредованно может использоваться для тогоD чтобы измерять 4сложность4 описания самого сигналаD а именно сложность описания и естьD на наш взглядD то свойствоD которым можно было бы характеризоE вать различные сегменты ЭЭГF Q


Перейдем теперь непосредственно к идее нашего подхода к понятию 4сложность ЭЭГ4 иD более общоD к понятию 4сложность непрерывной кривой4F Пусть на отрезке [0, T ] задана непрерывная функция @криваяA x(t)F Нам хотелось бы поставить в соответствие этой кривой некое числоD которое характеризует ее 4сложность4F Будем исходить из идеи КолмоE горова о томD что 4сложный4 объект требует для своего описания много информацииD а 4простой4 " малоF Выберем число h > 0 и рассмотрим разбиение отрезка [0, T ] точками {ti } на n = [T /h] равных частей @здесь [a] " это целая часть числа aAF ПредположимD что мы измерили нашу кривую только в точках разбиения ti F С какой точностью можно восE становить всю кривую по этой информацииc Пусть задано некоторое множество F способов аппроксимации кривой по конечному множеству точек @в идеале это множество всех известных методов восстановления кривой по ее значениям в конечном числе точекAF Рассмотрим ошибку аппроксимации

(h) = inf x(t) - x(t) , ^
F

где x(t) " аппроксимирующая криваяD построенная одним из допустиE ^ мых способов аппроксимации по n данным точкамD ћ " некоторая инE тегральная норма в функциональном пространствеD а инфимум берется по всему множеству заданных способов аппроксимацииF ЯсноD что если x(t) constD то для ее восстановления достаточно одE ной точкиD иными словамиD константа есть наиболее 4простая4 криваяD что вполне согласуется с интуициейF Поэтому целесообразно исключить константы из множества рассматриваемых кривыхD для чего следует провести предварительное центрирование x(t)F ДалееD для возможноE сти сравнения между собой погрешностей аппроксимации разных криE вых надо все их рассматривать в одном масштабеD тFеF провести предE варительную нормировкуF С этой целью следуетD после центрированияD рассматривать нормированную кривую z (t) = x(t)/ x(t) @очевидноD z (t) = 1AF После центрирования и нормирования кривой ошибка апE проксимации @интегральнаяA не превзойдет 1D причем максимальная ошибка достигаетсяD если интервал дискретности h = T @это означаетD что мы должны использовать для аппроксимации лишь одну константуD а тогда наилучшей константой будетD из соображений симметрииD нулеE ваяY при этом погрешность окажется равной норме исходной кривойD тFеF 1AF Будем теперь строить график функции (h)D увеличивая величину h @тF еF уменьшая количество данных nAF ПонятноD что с ростом h функE R


ция (h) должна монотонно расти @ведь увеличение шага дискретности означаетD что мы выбрасываем все больше и больше информации о функE ции иD значитD ее аппроксимация становится все хуже и хужеD если наE бор методов аппроксимации фиксированAF С учетом сделанных замечаE ний погрешность (h) будет монотонной положительной функцией своE его аргументаD достигающей своего максимумаD равного 1D при h = T F Если теперь задаться неким 4приемлемым4 @с точки зрения конкретноE го пользователяA уровнем погрешности аппроксимации < 1D то можно определитьD каков тот допустимый объем информацииD который может быть выброшен без существенной потери качества восстановления криE войF Теперь сложностью @точнееD , F ћ -сложностью A данной конE кретной кривой x(t) можно назвать величину 1 - h /T D где h = min{h T : (h) = }F Иными словамиD это относительная доля информации, которая необходима для восстановления данной кривой с данной точностью заданным набором методовF ОтметимD что предлагаемая мера сложности есть индивидуальная хаE рактеристика конкретной кривойD а не некоторого множества кривыхD порождаемых неким механизмомD как это получается при использоваE нии энтропии динамических системF ДалееD эта мера никак не связана с возможными механизмами порождения кривой @напримерD с темD являE ется ли кривая куском реализации какогоEто случайного процесса или траекторией какойEто динамической системыAF Это обстоятельство предE ставляется важнымD в частностиD применительно к ЭЭГ в силу уже выE сказанных соображениях об особенностях этого сигналаF ВообщеD предE лагаемая мера сложности 4настроена4 на восприятие пользователяD тFеF прямо учитываетD легко или нет можно работать с дискретными данныE ми о кривойF З а м е ч а н и е IFIF Можно было бы попробовать характеризовать сложность кривой ее шенноновской энтропией. А именно, можно разбить ось значений кривой на конечное число интервалов, подсчитать частоты попадания значений кривой в тот или иной интервал и затем по формуле Шеннона подсчитать энтропию полученного частотного распределения. Однако нетрудно построить кривые (например, периодические), у которых энтропия (при фиксированном числе интервалов разбиения оси значений) практически не будет меняться с уменьшением числа дискретных отсчетов (если этих отсчетов все еще достаточно много), так что зависимость такой меры от доли оставшейся информации будет очень слабой. В то же время ошибка аппроксимации должна быть достаточно чувствительной к уменьшеS


нию доступной информации, особенно для "сложных" кривыхF З а м е ч а н и е IFPF Предлагаемая мера сложности, очевидно, зависит от принятой функциональной нормы, от класса F и от уровня . Может так случиться, что при изменении этих параметров отношение сложности для одной и той же пары кривых изменится на противоположное. Это, однако, на наш взгляд, не является недостатком, так как функциональная норма и уровень есть критерии качества аппроксимации, которые выбрал для себя конкретный пользователь, а класс F описывает алгоритмические возможности этого пользователя. Более того, для анализа таких сложных кривых как ЭЭГ, важно не конкретное числовое значение сложности, а динамика ее изменений при переходе от одного участка кривой к другому. Именно эта динамика в принципе может дать возможность детектировать важные изменения в ЭЭГ, которые могут означать какие-либо функциональные перестройки. С этой точки зрения наиболее приемлемым для анализа ЭЭГ следует признать такой показатель сложности, который улавливает ее изменение при переходе от одного сегмента ЭЭГ к другому; при этом несущественно числовое выражение показателя для конкретного сегмента, а важна лишь степень его чувствительности к изменению характера кривой. З а м е ч а н и е IFQFВозможность подсчитывать сложность кривой на сегменте произвольной длины позволяет исследователю выбирать тот временной масштаб, для которого он хотел бы провести анализ всей наблюденной реализации. Появляется возможность исследовать динамику сложности ЭЭГ в разных временных масштабах и, следовательно, анализировать разные структуры этой кривой, которые могут характеризовать разные функциональные состояния мозга.
2. Алгоритм

При практической реализации изложенной выше идеи нужно учитыE ватьD что реализация кривой задается всегда в дискретном времениD тFеF 4кривая4 представляет собой конечный набор отсчетов @конечномерный векторAF Кроме тогоD из соображений простоты реализации для первых экспериментов следовало выбрать не слишком богатый класс F F ДалееD как уже отмечалосьD все анализируемые кривые нужно привести к одE ному масштабуF Дискретность исходной кривой приводит к томуD что зависимость ошибки аппроксимации от количества выброшенных точек не будет моE T


нотоннойD если остающихся точек достаточно малоF Поэтому желательE но иметь достаточно высокую частоту опроса с темD чтобы даже при удалении большого процента данных @реально в наших опытах это UHE WH7AD при котором еще возможна удовлетворительная аппроксимацияD дискретность записи кривой мало влияла на монотонность поведения ошибкиF Для приведения кривых к одному масштабу мы использовали ценE трирование и последующую нормировку @в метрике l1 A конечномерного вектора @кривойAD так что в результате получался вектор из соответствуE ющей единичной сферыF Таким образомD если кривая задавалась вектором x = x1 , x2 , . . . , xn D то первая операция алгоритма состояла в переходе к вектору y = x - xD где x = n-1 n xi D а вторая операция " в ? ? i=1 переходе к вектору z = y / y , y = n |yi |F i=1 Погрешность аппроксимации вектора z вектором z мы измеряли в ^ той же l1 EметрикеD тFеF z - z = n |zi - zi |F ^ ^ i=1 Дискретность записи исходной непрерывной кривой приводит к небольшой модификации формулы для сложностиF ВоEпервыхD при доE статочно большом числе n < n оставшихся после выбрасывания точек отношение h/T можно заменить величиной 1/n F ВоEвторыхD целесообE разно считатьD что если n = n @тFеF нельзя выбросить ни одной точки из исходной записи без существенной потери качества восстановленияAD то сложность кривой равна 1F С учетом этих замечаний мы использовали для подсчета сложности s кривой формулу

s=

1 - 1/n , 1 - 1/n

гдеD напомнимD n " это число точекD оставшихся после выбрасыванияD при котором кривая еще восстанавливается с приемлемой точностьюD n " число точек в исходной записи кривойF
3. Экспериментальные результаты

Класс F в первом варианте нашего алгоритма состоял всего лишь из одного способа " аппроксимации кривой кусочноEпостоянной функциE ейF Иными словамиD при удалении какихEлибо точек из первоначального набора мы заменяли значения кривой в удаленной точке ее значением в предыдущей точкеF ИзEза дискретности при поиске наилучшей аппроксиE мации надо проводить перебор по значению в начальной точкеD несмотE ря на тоD что мы используем только один метод аппроксимацииF Этот U


перебор делается внутри того 4окна прореживания4D которое в данный момент применяется @тFеF при заданной доле выброшенных точекAF В дальнейшем предполагается включить в класс F кусочноE полиномиальные функции и аппроксимацию отрезком ряда Фурье по разным ортонормированным системам функцийF Тестирование проводилось на ЭЭГD зарегистрированной у человека во время снаF Для такой ЭЭГ характерен очень широкий диапазон патE терновD соответствующих различным состояниям нейронов коры больE ших полушарий мозга SF ЭЭГ регистрировалась в правом затылочном отведении с частотой дискретизации IHH ГцF При просмотре были отобраны PS безартефактных фрагментов длиE тельностью от R до IT сF @медиана " V сFAD каждый из которых визуально представлялся сравнительно гомогеннымD но отличался по паттерну от остальныхF Показатель сложности рассчитывался в последовательных 4окнах4 " отрезках длительностью ТaP сF Величина погрешности апE проксимации была установлена на уровне HDQPF Вариативность оценок сложности в 4окнах4 анализа внутри гомогенE ных фрагментов ЭЭГ оказалась значительно ниже вариативности оцеE нокD усредненных по каждому из этих фрагментовX медиана 4внутриE интервального4 стандартного отклонения была равна HDHHIWD тогда как стандартное отклонение @по всем фрагментамA усредненных по фрагE менту значений равнялось HDHHVQF Оценки сложности особенно сильно различались между T фрагментамиD имевшими наиболе четкие признаки неглубокого или парадоксального сна @среднее HDWWQD стандартное отклоE нение HDHHHRAD и четырьмя фрагментами с наиболее четко выраженной мощной дельтаEактивностьюD характерной для третьей и четвертой стаE дий сна @среднее HDWUQD стандартное отклонение HDHHWAF Проявившаяся в этих результатах связь между паттерном ЭЭГ и оценками сложности нашла дополнительное подтверждениеD когда мы расположили фрагменты ЭЭГ в порядке понижения средней оценки сложности @смF рисунок ID где в целях экономии места показаны только каждый третий фрагмент и только первые три 4окна4 длительностью по P сFAF Средняя оценка сложности @по всем 4окнам4A для представленных на рисунке фрагментовD обозначенных буквами аEзD была равнаD соотE ветственноD HDWWQRD HDWWPTD HDWWIUD HDWWIID HDWVUSD HDWVQHD HDWUWRD HDWTQSF ОказалосьD что приблизительно в этом порядке наблюдается и углублеE ние снаD если судить по ЭЭГEпризнакам @смF на рисунке ID слеваAF ДинаE мика единичных оценок сложности @смF в правой части рисунке IAD как правилоD также следовала за изменениями в ЭЭГF Предложенная нами мера сложностиD описанная здесь впервыеD уже V


в самом простом варианте реализации алгоритма оказалась вполне рабоE тающим инструментомD чувствительным к паттерну ЭЭГF Как и можно было ожидатьD оценки сложности падали параллельно со сдвигом ЭЭГ в сторону типично сонного паттернаF Отметим еще разD что новая мера сложности представляет собой инE дивидуальную характеристику конкретной кривой и никак не связана с возможными механизмами ее порожденияD что особенно важно в слуE чае ЭЭГD общепринятой модели генерации которой в настоящее время не существуетF Возможность подсчитывать сложность кривой на сегменте произвольной длины позволяет исследователю изучать динамику этоE го показателя ЭЭГ в разных временных масштабах иD следовательноD анализировать временную иерархию разных функциональных состояE ний мозгаF Авторы выражают признательность профF tF? hke @Университет os гFМайнцD ГерманияA за предоставленные записи сонной ЭЭГF Авторы благодарны ЮFСFПопкову за внимание к работеF

W



СПИСОК ЛИТЕРАТУРЫ IF Синай Я.Г. Введение в эргодическую теориюF МFX ФазисD IWWTF PF Демидов Е.Е., Даревская Ю.В., Моренков О.А. и др. Нелинейный корреляционный анализ GG Обозрение прикладной и промышленной маE тематикиF МFX ИздEво ТВПD IWWWF ТFTF ВыпFIF СFRESUF QF Колмогоров А.Н. Комбинаторные основания теории информации и исчисления вероятностей GG Успехи матF наукF IWVQF ТF QVF ВыпF RF СF PUEQTF RF Каплан А.Я. Нестационарность ЭЭГX методологический и экспеE риментальный анализ GG Успехи физиолF наукF IWWVF ТFPWF xQF gFQSESSF SF Steriade M. goherent osilltions nd shortEterm plstiity in oriothlmi networks GG rends in xeurosiF IWWWF F PPF xoF VF F QQUE QRSF

IH


К статье БFСF ДарховскогоD АFЯF КапланаD СFЛF Шишкина Подпись к рисунку Фрагменты ЭЭГ @аEзA в порядке уменьшения оценки сложности и динамика этой оценкиF Слева " ЭЭГD справа " динамика оценки сложE ностиF Границы оконD в которых оценивалась сложностьD отмечены точE ками для удобства сопоставления ЭЭГ и динамики сложностиF Внизу " шкала времени @в секундахAF

II