Астронет > Обратные задачи в астрофизике

Астронет: "Соросовская Энциклопедия" Обратные задачи в астрофизике
http://www.astronet.ru/db/msg/1210266

Обратные задачи в астрофизике
12.12.2005 21:11 | "Соросовская Энциклопедия"

1. Введение

Астрофизика является наблюдательной наукой, поскольку исследователь в подавляющем большинстве случаев не имеет возможности воздействовать на изучаемый объект. Выводы о природе исследуемых объектов ученые-астрофизики делают на основе анализа косвенной информации, которая заключена в поступающих из Космоса различных излучениях: электромагнитном (от гамма-квантов до радиоволн), нейтринном, корпускулярном (космические лучи), гравитационно-волновом (регистрация которого намечается в ближайшей перспективе). Характеристики этих излучений (интенсивность, спектр, поляризация, переменность и т. п.) являются следствиями тех процессов, о природе которых должен судить астроном. Лишь в редких случаях астрофизики могут непосредственно воздействовать на изучаемый объект – это исследование метеоритного вещества, которое выпадает на Землю из межпланетного пространства (упомянем в этой связи недавнее открытие американскими учеными следов жизнедеятельности микроорганизмов в марсианском метеорите ), а также изучение поверхностей планет с помощью активных космических аппаратов, спускаемых на поверхность планеты. В подавляющем же большинстве случаев астрофизики вынуждены по следствиям некоторых процессов, протекающих на небесных телах, судить о причинах, их породивших, то есть решать обратные задачи.

Решение прямой задачи связано с отысканием следствия некоторого процесса по его известной причине. Например, можно на любой момент времени рассчитать положения планет Солнечной системы, зная главную причину, которая лежит в основе их движения, – закон всемирного тяготения Ньютона с поправками за эффекты общей теории относительности, ответственные, например, за прогрессивное смещение перигелия Меркурия, cоставляющее 43″ в столетие. Однако когда И. Ньютон решал обратную задачу – выводил свой знаменитый закон всемирного тяготения из наблюдаемого движения планет, обобщенного в известных законах Кеплера, он столкнулся со значительно более сложной проблемой. Только огромный наблюдательный материал по многим планетам в сочетании с гениальностью и тонкой физической интуицией позволили Ньютону успешно решить эту типичную обратную задачу.

В отличие от прямых задач трудности решения обратных задач связаны с тем, что один и тот же эффект может быть порожден разными причинами. Например, известно, что если нагреть воду при атмосферном давлении до температуры 100ºC, то она закипит. Однако из того факта, что вода кипит, вовсе не следует, что она нагрета до температуры 100ºC, поскольку вода может кипеть и при комнатной температуре, но при достаточно низком атмосферном давлении. Таким образом, эффект кипения воды может быть вызван разными причинами: либо высокой температурой, либо низким давлением.

Приведенный пример наглядно иллюстрирует, какой тонкой и деликатной процедурой является решение обратной задачи интерпретации наблюдательных данных. Если для решения прямой задачи достаточно знать одну причинно-следственную связь, то для успешного решения обратной задачи этого явно недостаточно и необходимо учитывать многие причинно-следственные связи, сопровождающие изучаемый процесс, и следовательно, иметь гораздо более богатый опыт и экспериментальный материал, чем для решения прямой задачи.

В математике хорошо известно, что подавляющее большинство обратных задач являются некорректно поставленными – малым возмущением исходных данных (данных наблюдений) могут соответствовать сколь угодно большие возмущения решения. Как отмечено французским ученым Ж. Адамаром в 1939 году, задача называется корректно поставленной (корректной), если: 1) ее решение существует, 2) решение единственно, и 3) решение непрерывно зависит от входных данных, то есть устойчиво по отношению к малым возмущениям (ошибкам) данных наблюдений. Если хотя бы одно из этих трех условий не выполняется, задача называется некорректно поставленной (или некорректной).

Наиболее часто в случае обратных задач нарушается третье условие, то есть условие устойчивости решения. В этом случае возникает парадоксальная ситуация: несмотря на то что задача математически сформулирована, ее решение невозможно получить обычными методами. Действительно, какой смысл имеет решение, которое испытывает формально бесконечно большие возмущения при малых возмущениях результатов наблюдений, которые всегда получаются с некоторой неопределенностью (ошибкой). Именно поэтому Адамар и пришел к заключению, что некорректные задачи не имеют практического смысла. Однако по существу все задачи обработки и интерпретации результатов астрономических наблюдений, как и многих физических экспериментов, являются обратными и некорректно поставленными. До появления современных научно обоснованных методов исследователь, либо используя детальную физическую модель изучаемого явления сводил обратную задачу к нахождению небольшого числа параметров, либо основываясь на физической интуиции отбирал из множества допустимых решений то, которое лучше всего соответствует здравому смыслу. В первом случае часто бывает, что детальная физическая модель, допускающая жесткую параметризацию решения, не адекватна используемым наблюдательным данным (что приводит к большим остаточным уклонениям наблюдательных данных от теоретических предсказаний), во втором случае выбор решения субъективен, что не характерно для научного метода исследований.

Математически под обратной задачей понимается задача отыскания функции z(s) по функции u(x) , получаемой из эксперимента или наблюдений и определяемой уравнением вида

u(x)=A(x,z(s)) ,

(1)

где A – некоторый оператор, устанавливающий причинно-следственную связь между z(s) и u(x). В уравнении (1) по наблюдаемым следствиям процесса u(x) нужно судить о причинах z(s) , породивших его.

Во многих случаях обратная задача (1) может быть представлена интегральным уравнением Фредгольдма 1-го рода

u(x) = ∫_a^b K(x, s)z(s) ds

(2)

где K(x, s) – ядро (непрерывное или квадратично суммируемое по переменным x, s), которое описывает конкретную модель исследуемого процесса.

Математические трудности решения обратных задач связаны с тем, что обратный оператор A ^-1 (см. уравнение (1)) не является непрерывным. Поэтому если данные наблюдений u(x) получены с некоторой ошибкой δ (обозначим приближенные данные символом u_δ(x)), то соответствующее приближенное решение, полученное стандартным методом,

z_δ(s)= A ^-1 (u_δ(x)) ,

(3)

будет сколь угодно сильно отклоняться от решения, соответствующего идеально точным входным данным u(x).

Предлагаемые ранее методы решения обратных некорректных задач основывались прежде всего на интуиции авторов, и, хотя в ряде обратных задач удавалось получить важную физическую информацию, необходимость в строгой математической постановке и разработке численных методов решения этого важнейшего для современного естествознания круга проблем назрела к 60-м годам, особенно в связи с широким внедрением компьютеров в практику научных исследований.

Предложенный российским академиком А.Н. Тихоновым метод решения некорректно поставленных задач состоит в том, что такие задачи рассматриваются как физически недоопределенные. Они "плохо" поставлены, множества их приближенных решений очень широки, даже неограниченны. Поэтому некорректные задачи нужно доопределить. Для этого необходима дополнительная (априорная) информация об искомом решении z(s), вытекающая из обширного опыта всесторонних исследований данного процесса. Эта дополнительная информация об искомом решении должна быть известна а priori (заранее), до решения соответствующей некорректной задачи. Априорная информация позволяет сформулировать критерий отбора приближенного решения из множества приближенных решений уравнения (1) и построить регуляризирующий алгоритм.

Такой информацией могут служить сведения о гладкости искомого решения z(s), его монотонности, выпуклости, неотрицательности, принадлежности к конечно-параметрическому семейству и т. п.

На рис. 1,а приведены точное и приближенное решение некорректной задачи – интегрального уравнения Фредгольма 1-го рода (2), причем приближенное решение получено с помощью регуляризирующего алгоритма – сужения множества допустимых решений до множества выпуклых функций. Попытка решения этой же задачи без регуляризации является безуспешной (см. рис. 1,б).

В настоящее время развитая теория решения некорректно поставленных задач успешно применяется для решения многих обратных задач астрофизики, а также задач оптики и спектроскопии, оптимального планирования и т. п. Регуляризирующие алгоритмы гарантируют сходимость последовательности приближенных решений к точному решению обратной задачи, то есть при стремлении ошибки наблюдений δ к нулю приближенное решение стремится к точному. Это дает веские основания считать, что приближенное решение некорректной задачи, полученное с помощью регуляризирующего алгоритма, близко к решению, соответствующему идеально точным данным наблюдений u(x). Стихийные интуитивные методы решения обратных некорректных задач, отмеченные выше, не обладают этим достоинством.

Ниже рассмотрены несколько примеров применения регуляризирующих алгоритмов к решению обратных задач астрофизики.

$\includegraphics[width=55mm]{pic1.eps}$

Рис. 1. Результаты решения обратной задачи, описываемой интегральным уравнением (2) с ядром K(x, s)=1/[1+100(x-s). Сплошной линией представлено точное решение z(s) . Это решение подставлялось под знак интеграла в уравнение (2) и вычислялась соответствующая ему функция u(x) – идеально точные входные данные обратной задачи (2). Затем в полученную функцию u(x) вносилась погрешность δ=3 % от максимального значения, и решалась обратная задача: по возмущенной функции u_δ(x) находилось приближенное решение z_δ(s). Приближенное решение z_δ(s) (а, точки) получено с помощью регуляризирующего алгоритма, использующего априорную информацию о выпуклости искомого решения z(s). При попытке решить эту же задачу без регуляризации получаются сколь угодно большие отклонения приближенного решения (б, точки) от истинного. Так проявляется некорректность обратной задачи (2)

2. Звезды Вольфа-Райе в тесных двойных системах

Звезды Вольфа-Райе , расположенные вблизи галактической плоскости (тo есть относящиеся к первому типу населения Галактики), были открыты в 1867 году французскими учеными М. Вольфом и Дж. Райе. Среди 100 млрд звезд Галактики таких звезд известно около 200. Почему астрономы уделяют столь пристальное внимание изучению этих объектов? Причина в том, что в оптическом спектре звезд Вольфа-Райе (WR) одновременно присутствуют сильные и широкие линии излучения атомов и ионов водорода, гелия, а также азота, углерода и кислорода в разных стадиях ионизации (рис. 2). Для возникновения высокой степени ионизации необходима температура в сотни тысяч градусов, в то время как непрерывный спектр звезд WR в оптическом диапазоне может быть грубо аппроксимирован излучением абсолютно черного тела со средней температурой, не превышающей 10 000-20 000 К. Это свидетельствует о сильном отклонении вещества атмосфер звезд WR от состояния термодинамического равновесия.

Звезды WR делятся на две последовательности: азотную WN и углеродную WC. В спектрах звезд WN в основном содержатся линии азота, а в спектрах звезд WC – линии углерода и кислорода. И в звездах WN, и в звездах WC присутствуют линии гелия, а иногда также слабые линии водорода. Оценки относительного содержания химических элементов показывают, что число атомов гелия в атмосферах звезд WR во много раз больше, чем число атомов водорода. Этим звезды WR радикально отличаются от обычных звезд солнечного типа. В последние годы все более утверждается точка зрения о том, что звезды WR представляют собой обнаженные ядра массивных m=30-100M_ʘ горячих (T=30 000-40 000 К) звезд спектральных классов O или B, потерявших значительную часть (до 60 %) своей массы вследствие истечения вещества либо в виде звездного ветра , либо в результате перетекания вещества в тесных двойных системах . Таким образом, скорее всего спектры звезд WR демонстрируют продукты термоядерных реакций, протекающих в недрах массивных звезд.

$\includegraphics{pic2.eps}$

Рис. 2. Оптические спектры двух звезд Вольфа-Райе: HD 191765 (WN6) и HD 192103 (WC7). Отмечены линии излучения различных химических элементов

Являясь объектами абсолютно молодыми (возраст ~10⁶ лет), звезды WR, по-видимому, находятся на конечной стадии эволюции – на стадии исчерпания запасов ядерной энергии, после которой должен следовать коллапс звезды с образованием релятивистского объекта – нейтронной звезды или черной дыры. Как возможные прародители нейтронных звезд и черных дыр звезды WR интересуют многих исследователей. Однако до последнего времени проблема звезд WR была далека от окончательного решения. Наряду с описанной концепцией эволюции звезд WR существует несколько вариантов для объяснения явления WR. От гипотезы, в которой звезда WR считается молодым объектом нормального химического состава, находящимся на стадии гравитационного сжатия, до модели, согласно которой явление WR в тесных двойных системах связано со сверхкритической аккрецией на релятивистский объект.

Такая неоднозначность в интерпретации явления WR связана с тем, что собственно звезда WR погребена внутри мощной протяженной атмосферы, радиально расширяющейся под действием давления радиации со скоростью в тысячи километров в секунду. Атмосфера звезды WR простирается на много миллионов километров и в несколько раз превышает радиус собственно звезды. При этом масса атмосферы ничтожно мала – в миллиард раз меньше массы центральной звезды.

Для сравнения: диск СолнцеСолнца резко очерчен. Это связано с тем, что толщина атмосферы Солнца, где формируется видимое излучение, не превышает 300 км, что составляет ~1/10 000 его радиуса.

Неудивительно поэтому, что многие исследователи, основываясь на изучении одиночных звезд WR, когда измеряется полное излучение от всего диска звезды с протяженной атмосферой, приходили к выводу, что радиусы звезд WR велики (порядка 20-30R_ʘ ), а эффективные температуры относительно низки (порядка 30 000 К).

В затменных двойных системах, содержащих WR-компоненту, ситуация иная. Когда происходит затмение звезды WR ее спутником – нормальной звездой спектрального класса OB с тонкой атмосферой, кривая блеска содержит информацию не только о суммарной светимости звезды WR, но и о распределении яркости по ее диску. Даже в самый крупный телескоп все звезды (кроме Солнца) выглядят как точки. Из-за колоссальной удаленности звезд WR их диски нельзя увидеть (в отличие от Солнца, у которого виден диск и можно изучать структуру поверхности). Тем не менее анализ затмений в двойных системах, содержащих звезды WR, дает уникальную возможность восстановить распределение яркости по диску звезды и как бы нарисовать его изображение.

В общем случае задача определения физических характеристик звезд из анализа кривой блеска затменной двойной системы сводится к решению двух интегральных уравнений Фредгольма 1-го рода

u(θ)=∫_a ^b K(θ, χ) I(χ) dχ

(4)

и нелинейного алгебраического уравнения, описывающего блеск двойной системы вне затмений. В уравнении (4) функция u(θ) есть наблюдаемое изменение блеска двойной системы во время затмения, функция K(θ, χ) – ядро уравнения – также известна: она описывает форму области перекрытия дисков компонент во время затмения (θ – угол относительного поворота компонент на орбите, пропорциональный времени, χ – полярное расстояние на диске звезды WR). Задача решения интегрального уравнения (4) представляет собой типичную обратную задачу: по наблюдаемым следствиям процесса затмения – функции u(θ) (кривой блеска) – необходимо определить распределение яркости по диску звезды WR – функцию I(χ). Эта задача относится к классу некорректно поставленных.

Классическая методика интерпретации основывается на предположении о том, что толщина атмосферы звезды мала по сравнению с ее радиусом. Теория тонких звездных атмосфер дает аналитическое выражение для распределения яркости I(χ) как функцию трех параметров: яркости в центре диска звезды I₀, радиуса звезды r и коэффициента потемнения к краю X . Аналитическое выражение для I(χ) подставляется в уравнение (4), которое в результате интегрирования сводится к системе нелинейных алгебраических уравнений относительно небольшого числа параметров. Это позволяет обойти трудности, связанные с некорректностью обратной задачи (4).

$\includegraphics{pic3.eps}$

Рис. 3. Распределение яркости по диску звезды WN5 в затменной двойной системе V444 Лебедя, восстановленное по кривым блеска в разных областях спектра на множестве монотонных неотрицательных функций. Хотя полный радиус протяженной атмосферы звезды WN5 составляет около 20R_ʘ, радиус "собственно звезды WR" (определяемый по ширине центрального максимума интенсивности в синей области спектра) не превышает 3R_ʘ, а его температура выше 50 000 K

У звезд WR протяженные атмосферы. Сложность физических процессов и неопределенность моделей протяженных звездных атмосфер не позволяют применить в данном случае классический способ параметризации искомой функции I(χ) при решении обратной задачи (4). Вместе с тем функцию I(χ) можно считать монотонной и неотрицательной, алгоритм решения обратной задачи (4) на множестве монотонных неотрицательных функций является регуляризирующим, а сама задача (4) на этом множестве функций I(χ) – корректной в классическом смысле. Это позволяет по-новому поставить задачу интерпретации кривых блеска затменных двойных систем и на основе современных методов регуляризации некорректно поставленных задач разработать эффективные численные алгоритмы ее решения для компьютеров. Некорректность задачи (4) была преодолена, и получено ее устойчивое решение. Это стимулировало наблюдения всех известных затменных двойных звезд с компонентами WR, а наблюдательные данные в ультрафиолетовом, оптическом и инфракрасном диапазонах интерпретировались с помощью новой методики.

При решении обратной задачи интерпретации кривых блеска затменных двойных звезд оказалось возможным восстановить распределение яркости по диску звезды WR в различных участках спектра (см. рис. 3), отделить излучение собственно звезды WR от излучения ее протяженной атмосферы и тем самым определить истинный радиус, температуру и светимость звезды WR. Оказалось, что в то время как полный радиус видимой атмосферы звезды WR составляет ~20R_ʘ, радиус собственно звезды WR (то есть гидростатического тела звезды, содержащего основную часть массы) не превышает 3R_ʘ, а температура собственно звезды WR больше 50 000 K (!). Относительно низкая температура излучения всего диска звезды WR ( ~20 000 К) связана с низкотемпературным рекомбинационным излучением полупрозрачной протяженной атмосферы, вклад которой в видимой области спектра достигает 80 %. Малый радиус звезды WR и высокая эффективная температура при массе 10M_ʘ свидетельствуют о том, что звезда WR является гелиевым остатком от первоначально более массивной звезды, потерявшей основную часть своей водородной оболочки.

3. Анализ дифракционных кривых блеска при покрытии звезд Луной

При наблюдениях небесных тел астрономы всегда стремятся достичь как можно более высокого углового разрешения. Чтобы добиться этого, они идут на хитроумные и дорогостоящие ухищрения. Создаются интерферометры разных типов, запускаются телескопы за пределы искажающей земной атмосферы (например, известный космический телескоп им. Хаббла с зеркалом диаметром 2,4 м). Однако оказывается, что высокое угловое разрешение (до 0″,0001-0″,001 можно получить гораздо более простым и дешевым способом, наблюдая покрытия звезд Луной с помощью наземных телескопов со скромным диаметром порядка 1 метра. Суть метода весьма проста: Луна при своем орбитальном движении вокруг Земли затмевает звезды. Угловые диаметры сравнительно близких звезд составляют несколько тысячных секунды дуги. Только у некоторых самых близких звезд – гигантов и сверхгигантов – угловые размеры достигают сотых долей секунды. Ясно, что процесс затмения диска звезды Луной будет иметь хотя и очень малую, но вполне измеримую продолжительность – порядка нескольких сотых долей секунды времени. Проведя высокоточные фотоэлектрические наблюдения с достаточно высоким временным разрешением (около 0,001 с), можно получить кривую затмения звезды Луной, которая будет обусловлена как геометрическим затмением, так и эффектами дифракции света звезды на краю диска Луны (см. рис. 4). Чем больше угловой диаметр затмеваемой звезды, тем меньше будет высота дифракционных максимумов и тем ближе кривая блеска при покрытии звезды Луной будет напоминать кривую геометрического затмения. Таким образом, решая обратную задачу интерпретации кривой покрытия звезды Луной, можно определить угловой диаметр звезды и даже пытаться получать информацию о распределении яркости по диску звезды или о наличии околозвездной структуры (например, протопланетного диска вокруг звезды, ее близкого спутника и т. п.). Важно то, что и Луна, и затмеваемая ею звезда находятся за пределами неспокойной земной атмосферы, поэтому атмосферные искажения не могут существенно повлиять на вид дифракционной кривой покрытия звезды Луной.

$\includegraphics[width=78mm]{pic4.eps}$

Рис. 4. Наблюдения (точки) и теоретическая кривая блеска при затмении Луной звезды 61δ' в созвездии Тельца. По оси абсцисс отложено расстояние x от края Луны до проекции центра диска звезды на плоскость Лунного диска, по оси ординат – интенсивность. Виден эффект дифракции света звезды на краю диска Луны, проявляющийся в чередовании максимумов и минимумов интенсивности излучения перед входом в затмение. Высота дифракционных максимумов тем меньше, чем больше угловой диаметр звезды. Решение обратной задачи интерпретации кривой блеска на множестве конечно-параметрических функций дает для углового диаметра звезды значение 0″,0028±0″,001. Внизу показаны остаточные уклонения "наблюденных" точек от модельной теоретической кривой

Математически рассматриваемая задача заключается в решении интегрального уравнения Фредгольма 1-го рода

S(x)=∫ _-∞^∞ K(x-χ)B(χ) dχ ,

(5)

где S(x) – наблюдаемая дифракционная картина изменения интенсивности при покрытии звезды Луной, x(t)=V(t-t₀), V – проекция линейной скорости движения Лунного края на его нормаль в направлении на проекцию звезды, t – время, t₀ – момент времени, когда центр звезды точно проектируется на край лунного диска, B(χ) – искомая функция, выражающая стрип-распределение яркости по диску звезды (то есть распределение, проинтегрированное вдоль прямых, параллельных лунному краю). Ядро K(x-χ) представляет собой дифракционную картину точечного источника, полученную с учетом влияния различных искажающих факторов. Ядро K(x-χ) выражается через интегралы Френеля, описывающие дифракцию излучения бесконечно удаленного точечного монохроматического источника на краю бесконечного плоского экрана.

Уравнение (5) – интегральное уравнение Фредгольма 1-го рода, которое нужно решать с помощью метода регуляризации. Естественной априорной информацией об искомой функции является ее монотонность или выпуклость, а также неотрицательность. Кроме того, в случае звезды с тонкой атмосферой, можно использовать аналитическое конечно-параметрическое представление функции B(χ) , полученное из теории. В случае, когда наблюдается покрытие двойной звезды или звезды, обладающей околозвездной структурой (аккреционный диск, планетная система), можно использовать регуляризирующий алгоритм Тихонова на множестве гладких неотрицательных функций.

На рис. 4 приведены наблюдаемая и теоретическая кривые блеска при покрытии Луной звезды 61δ' Тельца (гиганта спектрального класса K0), полученные с временным разрешением 0,001 с. Найденный из кривой покрытия угловой диаметр этой звезды составляет d=0″,003±0″,001.

Применение метода наблюдений покрытий звезд Луной к исследованию молодых звезд типа Т Тельца позволило выявить внутренние части околозвездного (возможно, протопланетного) диска вокруг звезды DG в созвездии Тельца с угловым разрешением до 0″,0001 (см. рис. 5).

$\includegraphics[width=78mm]{pic5.eps}$

Рис. 5. Стрип-распределение яркости B(χ) для звезды DG в созвездии Тельца, восстановленное из дифракционной кривой покрытия Луной. Использовался метод регуляризации на множестве гладких неотрицательных функций. Центральный пик соответствует звезде. Сложная структура в крыльях, прослеживаемая до расстояния в 3 а.е. от центра звезды, соответствует центральным частям протопланетного диска вокруг звезды

К настоящему времени методом лунных покрытий определены угловые диаметры сотен звезд, открыты тысячи новых тесных двойных звезд, изучена структура протопланетных дисков вокруг ряда молодых звезд. Таким образом, метод лунных покрытий превратился в мощный метод исследования звезд с очень высоким угловым разрешением.

4. Заключение

Примеры двух обратных задач астрофизики показывают, как современный математический аппарат, примененный к анализу высокоточной наблюдательной информации, позволяет делать важные выводы о природе и эволюции различных астрофизических объектов, удаленных от нас на громадные расстояния.

Регуляризирующие алгоритмы используются также при решении таких обратных задач астрофизики, как восстановление распределения химических элементов по поверхностям пекулярных Ap-звезд из переменности линий поглощения в их спектрах, восстановление радиоастрономических и оптических изображений небесных тел из наблюдений, искаженных влиянием аппаратной функции, повышение разрешающей способности спектрографа и во многих других. Во всех этих задачах применение современных регуляризирующих алгоритмов оказалось весьма эффективным.

Литература

Гончарский А.В., Черепащук А.М., Ягола А.Г. Численные методы решения обратных задач астрофизики. М.: Наука, 1978.
Гончарский А.В., Черепащук А.М., Ягола А.Г. Некорректные задачи астрофизики. М.: Наука, 1985.
Гончарский А.В., Черепащук А.М., Ягола А.Г. Природа. 1985. 9. С. 3.
Богданов М.Б., Трунковский Е.М., Черепащук А.М. Земля и Вселенная. 1992. 6. С. 3.

Глоссарий Astronet.ru