Rambler's Top100Astronet    
  по текстам   по ключевым словам   в глоссарии   по сайтам   перевод   по каталогу
 

Обратные задачи в астрофизике
12.12.2005 21:11 |


1. Введение

Астрофизика является наблюдательной наукой, поскольку исследователь в подавляющем большинстве случаев не имеет возможности воздействовать на изучаемый объект. Выводы о природе исследуемых объектов ученые-астрофизики делают на основе анализа косвенной информации, которая заключена в поступающих из Космоса различных излучениях: электромагнитном (от гамма-квантов до радиоволн), нейтринном, корпускулярном (космические лучи), гравитационно-волновом (регистрация которого намечается в ближайшей перспективе). Характеристики этих излучений (интенсивность, спектр, поляризация, переменность и т. п.) являются следствиями тех процессов, о природе которых должен судить астроном. Лишь в редких случаях астрофизики могут непосредственно воздействовать на изучаемый объект – это исследование метеоритного вещества, которое выпадает на Землю из межпланетного пространства (упомянем в этой связи недавнее открытие американскими учеными следов жизнедеятельности микроорганизмов в марсианском метеорите), а также изучение поверхностей планет с помощью активных космических аппаратов, спускаемых на поверхность планеты. В подавляющем же большинстве случаев астрофизики вынуждены по следствиям некоторых процессов, протекающих на небесных телах, судить о причинах, их породивших, то есть решать обратные задачи.

Решение прямой задачи связано с отысканием следствия некоторого процесса по его известной причине. Например, можно на любой момент времени рассчитать положения планет Солнечной системы, зная главную причину, которая лежит в основе их движения, – закон всемирного тяготения Ньютона с поправками за эффекты общей теории относительности, ответственные, например, за прогрессивное смещение перигелия Меркурия, cоставляющее 43″ в столетие. Однако когда И. Ньютон решал обратную задачу – выводил свой знаменитый закон всемирного тяготения из наблюдаемого движения планет, обобщенного в известных законах Кеплера, он столкнулся со значительно более сложной проблемой. Только огромный наблюдательный материал по многим планетам в сочетании с гениальностью и тонкой физической интуицией позволили Ньютону успешно решить эту типичную обратную задачу.

В отличие от прямых задач трудности решения обратных задач связаны с тем, что один и тот же эффект может быть порожден разными причинами. Например, известно, что если нагреть воду при атмосферном давлении до температуры 100ºC, то она закипит. Однако из того факта, что вода кипит, вовсе не следует, что она нагрета до температуры 100ºC, поскольку вода может кипеть и при комнатной температуре, но при достаточно низком атмосферном давлении. Таким образом, эффект кипения воды может быть вызван разными причинами: либо высокой температурой, либо низким давлением.

Приведенный пример наглядно иллюстрирует, какой тонкой и деликатной процедурой является решение обратной задачи интерпретации наблюдательных данных. Если для решения прямой задачи достаточно знать одну причинно-следственную связь, то для успешного решения обратной задачи этого явно недостаточно и необходимо учитывать многие причинно-следственные связи, сопровождающие изучаемый процесс, и следовательно, иметь гораздо более богатый опыт и экспериментальный материал, чем для решения прямой задачи.

В математике хорошо известно, что подавляющее большинство обратных задач являются некорректно поставленными – малым возмущением исходных данных (данных наблюдений) могут соответствовать сколь угодно большие возмущения решения. Как отмечено французским ученым Ж. Адамаром в 1939 году, задача называется корректно поставленной (корректной), если: 1) ее решение существует, 2) решение единственно, и 3) решение непрерывно зависит от входных данных, то есть устойчиво по отношению к малым возмущениям (ошибкам) данных наблюдений. Если хотя бы одно из этих трех условий не выполняется, задача называется некорректно поставленной (или некорректной).

Наиболее часто в случае обратных задач нарушается третье условие, то есть условие устойчивости решения. В этом случае возникает парадоксальная ситуация: несмотря на то что задача математически сформулирована, ее решение невозможно получить обычными методами. Действительно, какой смысл имеет решение, которое испытывает формально бесконечно большие возмущения при малых возмущениях результатов наблюдений, которые всегда получаются с некоторой неопределенностью (ошибкой). Именно поэтому Адамар и пришел к заключению, что некорректные задачи не имеют практического смысла. Однако по существу все задачи обработки и интерпретации результатов астрономических наблюдений, как и многих физических экспериментов, являются обратными и некорректно поставленными. До появления современных научно обоснованных методов исследователь, либо используя детальную физическую модель изучаемого явления сводил обратную задачу к нахождению небольшого числа параметров, либо основываясь на физической интуиции отбирал из множества допустимых решений то, которое лучше всего соответствует здравому смыслу. В первом случае часто бывает, что детальная физическая модель, допускающая жесткую параметризацию решения, не адекватна используемым наблюдательным данным (что приводит к большим остаточным уклонениям наблюдательных данных от теоретических предсказаний), во втором случае выбор решения субъективен, что не характерно для научного метода исследований.

Математически под обратной задачей понимается задача отыскания функции z(s) по функции u(x) , получаемой из эксперимента или наблюдений и определяемой уравнением вида

u(x)=A(x,z(s)) , (1)

где A – некоторый оператор, устанавливающий причинно-следственную связь между z(s) и u(x). В уравнении (1) по наблюдаемым следствиям процесса u(x) нужно судить о причинах z(s) , породивших его.

Во многих случаях обратная задача (1) может быть представлена интегральным уравнением Фредгольдма 1-го рода

u(x) = ∫ab K(x, s)z(s) ds (2)

где K(x, s) – ядро (непрерывное или квадратично суммируемое по переменным x, s), которое описывает конкретную модель исследуемого процесса.

Математические трудности решения обратных задач связаны с тем, что обратный оператор A -1 (см. уравнение (1)) не является непрерывным. Поэтому если данные наблюдений u(x) получены с некоторой ошибкой δ (обозначим приближенные данные символом uδ(x)), то соответствующее приближенное решение, полученное стандартным методом,

zδ(s)= A -1 (uδ(x)) , (3)

будет сколь угодно сильно отклоняться от решения, соответствующего идеально точным входным данным u(x).

Предлагаемые ранее методы решения обратных некорректных задач основывались прежде всего на интуиции авторов, и, хотя в ряде обратных задач удавалось получить важную физическую информацию, необходимость в строгой математической постановке и разработке численных методов решения этого важнейшего для современного естествознания круга проблем назрела к 60-м годам, особенно в связи с широким внедрением компьютеров в практику научных исследований.

Предложенный российским академиком А.Н. Тихоновым метод решения некорректно поставленных задач состоит в том, что такие задачи рассматриваются как физически недоопределенные. Они "плохо" поставлены, множества их приближенных решений очень широки, даже неограниченны. Поэтому некорректные задачи нужно доопределить. Для этого необходима дополнительная (априорная) информация об искомом решении z(s), вытекающая из обширного опыта всесторонних исследований данного процесса. Эта дополнительная информация об искомом решении должна быть известна а priori (заранее), до решения соответствующей некорректной задачи. Априорная информация позволяет сформулировать критерий отбора приближенного решения из множества приближенных решений уравнения (1) и построить регуляризирующий алгоритм.

Такой информацией могут служить сведения о гладкости искомого решения z(s), его монотонности, выпуклости, неотрицательности, принадлежности к конечно-параметрическому семейству и т. п.

На рис. 1,а приведены точное и приближенное решение некорректной задачи – интегрального уравнения Фредгольма 1-го рода (2), причем приближенное решение получено с помощью регуляризирующего алгоритма – сужения множества допустимых решений до множества выпуклых функций. Попытка решения этой же задачи без регуляризации является безуспешной (см. рис. 1,б).

В настоящее время развитая теория решения некорректно поставленных задач успешно применяется для решения многих обратных задач астрофизики, а также задач оптики и спектроскопии, оптимального планирования и т. п. Регуляризирующие алгоритмы гарантируют сходимость последовательности приближенных решений к точному решению обратной задачи, то есть при стремлении ошибки наблюдений δ к нулю приближенное решение стремится к точному. Это дает веские основания считать, что приближенное решение некорректной задачи, полученное с помощью регуляризирующего алгоритма, близко к решению, соответствующему идеально точным данным наблюдений u(x). Стихийные интуитивные методы решения обратных некорректных задач, отмеченные выше, не обладают этим достоинством.

Ниже рассмотрены несколько примеров применения регуляризирующих алгоритмов к решению обратных задач астрофизики.

\includegraphics[width=55mm]{pic1.eps}

Рис. 1. Результаты решения обратной задачи, описываемой интегральным уравнением (2) с ядром K(x, s)=1/[1+100(x-s). Сплошной линией представлено точное решение z(s) . Это решение подставлялось под знак интеграла в уравнение (2) и вычислялась соответствующая ему функция u(x) – идеально точные входные данные обратной задачи (2). Затем в полученную функцию u(x) вносилась погрешность δ=3 % от максимального значения, и решалась обратная задача: по возмущенной функции uδ(x) находилось приближенное решение zδ(s). Приближенное решение zδ(s) (а, точки) получено с помощью регуляризирующего алгоритма, использующего априорную информацию о выпуклости искомого решения z(s). При попытке решить эту же задачу без регуляризации получаются сколь угодно большие отклонения приближенного решения (б, точки) от истинного. Так проявляется некорректность обратной задачи (2)

2. Звезды Вольфа-Райе в тесных двойных системах

Звезды Вольфа-Райе, расположенные вблизи галактической плоскости (тo есть относящиеся к первому типу населения Галактики), были открыты в 1867 году французскими учеными М. Вольфом и Дж. Райе. Среди 100 млрд звезд Галактики таких звезд известно около 200. Почему астрономы уделяют столь пристальное внимание изучению этих объектов? Причина в том, что в оптическом спектре звезд Вольфа-Райе (WR) одновременно присутствуют сильные и широкие линии излучения атомов и ионов водорода, гелия, а также азота, углерода и кислорода в разных стадиях ионизации (рис. 2). Для возникновения высокой степени ионизации необходима температура в сотни тысяч градусов, в то время как непрерывный спектр звезд WR в оптическом диапазоне может быть грубо аппроксимирован излучением абсолютно черного тела со средней температурой, не превышающей 10 000-20 000 К. Это свидетельствует о сильном отклонении вещества атмосфер звезд WR от состояния термодинамического равновесия.

Звезды WR делятся на две последовательности: азотную WN и углеродную WC. В спектрах звезд WN в основном содержатся линии азота, а в спектрах звезд WC – линии углерода и кислорода. И в звездах WN, и в звездах WC присутствуют линии гелия, а иногда также слабые линии водорода. Оценки относительного содержания химических элементов показывают, что число атомов гелия в атмосферах звезд WR во много раз больше, чем число атомов водорода. Этим звезды WR радикально отличаются от обычных звезд солнечного типа. В последние годы все более утверждается точка зрения о том, что звезды WR представляют собой обнаженные ядра массивных m=30-100Mʘ горячих (T=30 000-40 000 К) звезд спектральных классов O или B, потерявших значительную часть (до 60 %) своей массы вследствие истечения вещества либо в виде звездного ветра, либо в результате перетекания вещества в тесных двойных системах. Таким образом, скорее всего спектры звезд WR демонстрируют продукты термоядерных реакций, протекающих в недрах массивных звезд.

\includegraphics{pic2.eps}

Рис. 2. Оптические спектры двух звезд Вольфа-Райе: HD 191765 (WN6) и HD 192103 (WC7). Отмечены линии излучения различных химических элементов

Являясь объектами абсолютно молодыми (возраст ~106 лет), звезды WR, по-видимому, находятся на конечной стадии эволюции – на стадии исчерпания запасов ядерной энергии, после которой должен следовать коллапс звезды с образованием релятивистского объекта – нейтронной звезды или черной дыры. Как возможные прародители нейтронных звезд и черных дыр звезды WR интересуют многих исследователей. Однако до последнего времени проблема звезд WR была далека от окончательного решения. Наряду с описанной концепцией эволюции звезд WR существует несколько вариантов для объяснения явления WR. От гипотезы, в которой звезда WR считается молодым объектом нормального химического состава, находящимся на стадии гравитационного сжатия, до модели, согласно которой явление WR в тесных двойных системах связано со сверхкритической аккрецией на релятивистский объект.

Такая неоднозначность в интерпретации явления WR связана с тем, что собственно звезда WR погребена внутри мощной протяженной атмосферы, радиально расширяющейся под действием давления радиации со скоростью в тысячи километров в секунду. Атмосфера звезды WR простирается на много миллионов километров и в несколько раз превышает радиус собственно звезды. При этом масса атмосферы ничтожно мала – в миллиард раз меньше массы центральной звезды.

Для сравнения: диск СолнцеСолнца резко очерчен. Это связано с тем, что толщина атмосферы Солнца, где формируется видимое излучение, не превышает 300 км, что составляет ~1/10 000 его радиуса.

Неудивительно поэтому, что многие исследователи, основываясь на изучении одиночных звезд WR, когда измеряется полное излучение от всего диска звезды с протяженной атмосферой, приходили к выводу, что радиусы звезд WR велики (порядка 20-30Rʘ ), а эффективные температуры относительно низки (порядка 30 000 К).

В затменных двойных системах, содержащих WR-компоненту, ситуация иная. Когда происходит затмение звезды WR ее спутником – нормальной звездой спектрального класса OB с тонкой атмосферой, кривая блеска содержит информацию не только о суммарной светимости звезды WR, но и о распределении яркости по ее диску. Даже в самый крупный телескоп все звезды (кроме Солнца) выглядят как точки. Из-за колоссальной удаленности звезд WR их диски нельзя увидеть (в отличие от Солнца, у которого виден диск и можно изучать структуру поверхности). Тем не менее анализ затмений в двойных системах, содержащих звезды WR, дает уникальную возможность восстановить распределение яркости по диску звезды и как бы нарисовать его изображение.

В общем случае задача определения физических характеристик звезд из анализа кривой блеска затменной двойной системы сводится к решению двух интегральных уравнений Фредгольма 1-го рода

u(θ)=∫a b K(θ, χ) I(χ) dχ (4)

и нелинейного алгебраического уравнения, описывающего блеск двойной системы вне затмений. В уравнении (4) функция u(θ) есть наблюдаемое изменение блеска двойной системы во время затмения, функция K(θ, χ) – ядро уравнения – также известна: она описывает форму области перекрытия дисков компонент во время затмения (θ – угол относительного поворота компонент на орбите, пропорциональный времени, χ – полярное расстояние на диске звезды WR). Задача решения интегрального уравнения (4) представляет собой типичную обратную задачу: по наблюдаемым следствиям процесса затмения – функции u(θ) (кривой блеска) – необходимо определить распределение яркости по диску звезды WR – функцию I(χ). Эта задача относится к классу некорректно поставленных.

Классическая методика интерпретации основывается на предположении о том, что толщина атмосферы звезды мала по сравнению с ее радиусом. Теория тонких звездных атмосфер дает аналитическое выражение для распределения яркости I(χ) как функцию трех параметров: яркости в центре диска звезды I0, радиуса звезды r и коэффициента потемнения к краю X . Аналитическое выражение для I(χ) подставляется в уравнение (4), которое в результате интегрирования сводится к системе нелинейных алгебраических уравнений относительно небольшого числа параметров. Это позволяет обойти трудности, связанные с некорректностью обратной задачи (4).

\includegraphics{pic3.eps}

Рис. 3. Распределение яркости по диску звезды WN5 в затменной двойной системе V444 Лебедя, восстановленное по кривым блеска в разных областях спектра на множестве монотонных неотрицательных функций. Хотя полный радиус протяженной атмосферы звезды WN5 составляет около 20Rʘ, радиус "собственно звезды WR" (определяемый по ширине центрального максимума интенсивности в синей области спектра) не превышает 3Rʘ, а его