Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://comet.sai.msu.ru/~dmbiz/prac/next/statpar/statp.html
Дата изменения: Thu Mar 15 15:21:39 2001 Дата индексирования: Tue Oct 2 04:21:35 2012 Кодировка: koi8-r Поисковые слова: п п п п п |
КАФЕДРА АСТРОФИЗИКИ И ЗВЕЗДНОЙ АСТРОНОМИИ
КАФЕДРА ЭКСПЕРИМЕНТАЛЬНОЙ АСТРОНОМИИ
А.С.РАСТОРГУЕВ
УТОЧНЕНИЕ СВЕТИМОСТЕЙ, КИНЕМАТИЧЕСКИХ ПАРАМЕТРОВ И ШКАЛЫ РАССТОЯНИЙ ЗВЕЗД МЕТОДОМ СТАТИСТИЧЕСКИХ ПАРАЛЛАКСОВ
1.
ПОСТАНОВКА ЗАДАЧИ.Метод статистических параллаксов опирается на простую идею: требование согласованности остаточных тангенциальных и лучевых скоростей совокупности объектов, расстояния до которых вычисляются по известному модулю расстояния, т.е. на основании определенной гипотезы относительно их светимости. Так как тангенциальная скорость вычисляется по собственному движению и расстоянию, то она, в отличие от лучевой скорости, непосредственно зависит от принятого расстояния до объектов, принадлежащих некоторой однородной совокупности, т.е. от их светимости. Если расстояния до объектов систематически завышены, то их тангенциальные скорости будут систематически больше лучевых и наоборот. К таким объектам можно отнести звезды, традиционно считающиеся индикаторами расстояний – классические цефеиды, переменные звезды типа RR Лиры, рассеянные звездные скопления и др. Хорошо известно, что расстояния до цефеид вычисляются с помощью зависимости “период пульсаций – светимость” [2]; до RR-Лирид – в течение длительного времени вычислялись по известному постоянному блеску этих звезд [3]; до рассеянных скоплений – методом наложения главных последовательностей на диаграмме Герцшпрунга-Рессела (“цвет – величина”) или методом их сопоставления с теоретическими изохронами [4].
Одной из простейших разновидностей метода статистических параллаксов является групповой параллакс движущихся скоплений [1]. Он опирается на хорошо известный факт равенства пространственных скоростей всех звезд – членов скопления. Как известно, именно групповой параллакс ближайшего скопления – Гиад – долгое время лежал в основе современной астрономической шкалы расстояний. Со звездами, рассеянными по всему небу и движущимися с разными скоростями, дело обстоит несколько сложнее, но и в их собственных движениях можно выявить систематическое смещение, вызванное движением Солнца относительно выборки. Светимость переменных звезд типа RR Лиры в начале 1950-х годов впервые была оценена именно таким методом [2].
Однако до последнего времени применение метода статистических параллаксов ограничивалось классами быстро движущихся объектов, что было связано с малой точностью собственных движений и, что самое главное - наличием в них заметных систематических ошибок. Действительно, только для объектов с большой дисперсией пространственных скоростей и быстрым движением относительно Солнца (например, RR-Лирид) обремененные ошибками собственные движения все же несут информацию об их кинематике.
После появления массовых высокоточных каталогов собственных движений - HIPPARCOS [5] и TRC [6], в которых к тому же декларируемые систематические ошибки невелики, впервые появилась возможность применения метода статистических параллаксов для уточнения светимостей объектов галактического диска, имеющих малые дисперсии пространственных скоростей и движущихся с малой скоростью относительно Солнца. Более того, применение метода статистических параллаксов открывает возможность не только уточнить светимости, но и одновременно найти согласованное решение для всех кинематических характеристик выборки, т.е. для кривой вращения и осей эллипсоида скоростей.
В данной задаче рассматривается применение метода статистических параллаксов к двум классам объектов: а) переменным звездам типа RR Лиры и б) классическим цефеидам. Методическое различие между ними состоит в том, что классические цефеиды обладают малыми случайными скоростями, но заметным систематическим движением – дифференциальным вращением, а RR-Лириды – большими случайными скоростями и пренебрежимо малым вращением. После несущественных изменений предлагаемый метод может быть распространен и на другие объекты Галактики.
2.
Выведем основные соотношения, используемые в методе статистических параллаксов. Прежде всего, мы принимаем гипотезу об эллипсоидальном трехосном (Шварцшильдовском) распределении остаточных пространственных скоростей исследуемых объектов. Будем также считать, что выборка объектов занимает широкую солнечную окрестность (например, до 3 – 5 кпк от Солнца), поэтому следует учитывать как дифференциальное вращение подсистемы объектов, так и изменение ориентации эллипсоида скоростей относительно основных галактических направлений в пределах этой области. Наблюдаемая скорость объекта включает следующие компоненты: а) общее движение локального центроида выборки относительно Солнца; б) дифференциальное вращение подсистемы; в) дисперсию скоростей объектов относительно своего центроида (“космическую” дисперсию); г) ошибки лучевой скорости и собственного движения. Учтем также, что индивидуальные расстояния объектов характеризуются некоторой случайной ошибкой
, d r» r´ d MV/2.17. Предположим, что величина d MV распределена по нормальному закону со среднеквадратическим значением s M (ошибкой калибровки шкалы абсолютных величин исследуемых объектов или точностью определения абсолютных величин, которая определяет точность фотометрических расстояний). Чаще всего эта величина известна. Нашей задачей является вывод функции распределения наблюдаемых скоростей и определение ее параметров.2.1. Предварительная оценка расстояния.
Как уже было сказано, метод статистических параллаксов состоит в уточнении предварительно принятой шкалы расстояний исследуемых объектов. Так, расстояния классических цефеид могут быть вычислены по зависимости “период - светимость” в лучах V [2], выражаемой формулой
, (1)
где
- период фундаментального тона пульсаций, а нижний индекс I обозначает абсолютную величину, соответствующую потоку излучения, усредненному по периоду пульсаций. Поглощение света вычисляется стандартным способом, исходя из наблюдаемого цвета цефеид и нормального цвета, оцениваемого по зависимости “период – нормальный цвет” [2](2)
Что касается RR-Лирид, то их светимость в первом приближении можно считать постоянной и равной
[3]. Еще лучше рассчитать расстояния по зависимости “светимость – металличность” [7], выведенной методом Бааде-Весселинка по пульсационным радиусам:. (3)
При этом достаточно хорошие оценки их избытков цвета можно сделать на основе “закона косеканса” [1], воспользовавшись для значений предельных избытков цвета
подробной картой Бурштейна и Хейлеса [8]. Впредь условимся обозначать вычисленные гелиоцентрические расстояния объектов как (от expected – ожидаемые), а истинные, или уточненные – как .2.2. Учет движения Солнца и дифференциального вращения выборки.
На следующем рисунке схематически показан треугольник “Солнце – центр Галактики – исследуемый центроид S” и связанный с центроидом эллипсоид скоростей. Будем считать, что его малая ось параллельна оси вращения Галактики, а большая ось указывает на ее центр. Здесь - спроектированное на плоскость Галактики истинное расстояние до центроида S, и - соответственно лучевая скорость и тангенциальная скорость по галактической долготе (вектор тангенциальной скорости по галактической широте не показан). - расстояние до центра Галактики. Будем выражать собственные движения в ² /год, линейные (в том числе лучевые) скорости в км/с, расстояния в кпк, а угловые скорости в единицах км/с/кпк. Для удобства введем коэффициент перевода расстояний и собственных движений в линейные скорости, входящий в формулу , где - компонент тангенциальной скорости.
Обозначим местный (околосолнечный) центроид объектов как
. Пусть при этом скорость местной выборки относительно Солнца равна, (4)
где компоненты скорости заданы в галактической прямоугольной системе координат (ось
x которой направлена в центр Галактики, ось y - в направлении галактического вращения, z - к северному полюсу Галактики). Рассматривая треугольник и применив к расстояниям теорему косинусов, легко вычислим истинное галактоцентрическое расстояние объекта по истинным гелиоцентрическим расстояниям и его галактическим координатам по формуле(5)
Вспомогательный угол
, определяющий ориентацию эллипсоида скоростей в области центроида S относительно луча зрения, вычисляется по формуле(6)
Проще всего рассматривать распределение относительных скоростей объектов в локальной системе координат, привязанной к направлению на объект и галактическим координатам (l, b); в этой системе координат компоненты скорости нам либо известны из измерений (лучевая скорость), либо могут быть легко вычислены по расстоянию и компонентам собственного движения (тангенциальные скорости по галактической долготе и широте). Поскольку тангенциальные скорости вычисляются через ожидаемое расстояние
, вектор скорости в этой системе отсчета можно записать в виде. (7)
Легко показать, что истинный вклад дифференциального вращения Галактики описывается формулами Боттлингера [1], которые могут быть переписаны с использованием истинного расстояния
в векторном виде, (8)
где
и - угловая скорость исследуемого центроида на расстоянии и на расстоянии Солнца соответственно. Для решения обычно разлагают разность угловых скоростей в ряд Тейлора, (9)
ограничиваясь, как правило, вторым порядком. Такое разложение дает хорошие результаты даже для расстояний порядка 5 – 6 кпк от Солнца.
Наконец, введем коэффициент шкалы расстояний, переводящий истинные расстояния в вычисленные (или ожидаемые) по формуле
, (10)
а также матрицу шкалы расстояний
, (11)
которая, как легко понять, переводит компоненты истинной скорости в локальной системе координат в вычисленные (или ожидаемые) по формуле:
. (12)
Первый диагональный элемент матрицы
равен 1, т.к. лучевая скорость от расстояния не зависит.2.3. Преобразование координат, скоростей и тензора ковариации.
Вначале найдем связь дисперсий скоростей в локальной системе координат с осями эллипсоида скоростей S. Она определяется ориентацией ортов локальной системы координат, образующих правую тройку векторов, относительно главных осей эллипсоида скоростей, т.е. парой углов .
Пусть
- единичный вектор-столбец в системе координат, связанной с главными осями эллипсоида S, а - тот же единичный вектор в локальной системе координат. Компоненты этих векторов связаны между собой преобразованием поворота от главных осей эллипсоида к локальным осям , осуществляемым с помощью матрицы. (13)
Пусть форма и размеры эллипсоида скоростей задаются тензором дисперсий
(14)
с постоянными коэффициентами, имеющим в главных осях диагональный вид. Тогда истинный тензор дисперсий (или ковариации) в локальной системе координат можно вычислить путем преобразования
, (15)
где
- транспонированная матрица. После приведения к используемой шкале расстояний тензор ковариации примет вид. (16)
Наличие ошибок наблюдательных данных приводит к тому, что распределение наблюдаемых (в том числе вычисленных тангенциальных) скоростей в локальных координатах описывается модифицированным тензором ковариации
, (17)
где тензор ошибок
наблюдательных данных можно записать в виде, (18)
а
- среднеквадратические ошибки лучевой скорости и собственных движений, а s M – среднеквадратическая ошибка абсолютной величины. Наличие случайных ошибок истинного расстояния d r0 приводит к дополнительному рассеянию скоростей, поскольку вклад дифференциального вращения, выражаемый формулой (8), зависит от расстояния r0. Легко понять, что ошибка вектора-столбца вращательной скорости равнагде дифференцирование вектора (8) проводится покомпонентно с учетом выражений (9) для
и (5) для R;,
соответствующая матрица ковариации (для истинных расстояний), используемая в формуле (17), равна
Здесь угловыми скобками обозначено усреднение по распределению d
r0, а значком T обозначена операция транспонирования.Запишем вклад движения местной выборки относительно Солнца в наблюдаемую скорость. С учетом (4) будем иметь
, (19)
где по аналогии с (13) роль угла
играет галактическая долгота , т.е. матрица поворота для местного центроида равна. (20)
2.4. Распределение остаточных скоростей и функция правдоподобия.
С учетом всего сказанного выше остаточная скорость объекта относительно центроида S, расположенного в области , за вычетом всех систематических движений (т.е. движения Солнца относительно местной выборки и дифференциального вращения) в локальной системе координат будет равна
, (21)
где наблюдаемая скорость
выражается формулой (7). Различие шкал расстояний учитывается умножением компонентов скорости (4) и (8), записанных с использованием истинных расстояний, на матрицу шкалы ; следовательно, в формуле (21) все скорости уже приведены к принятой шкале расстояний.Функция распределения остаточных скоростей может быть записана в общем виде (см. [9])
, (22)
где
и - соответственно определитель и обратная матрица наблюдаемого тензора ковариации (17). Функция распределения имеет смысл плотности вероятности определенного значения остаточной скорости конкретного объекта.Поскольку объекты распределены в пространстве скоростей независимо друг от друга, их N-частичная (полная) функция распределения равна произведению функций (22) для всех объектов выборки (по теореме о произведении вероятностей независимых событий):
, (23)
где
– число объектов. Принцип максимального правдоподобия состоит в том, что в действительности реализуется наиболее вероятное распределение скоростей объектов используемой выборки. Следовательно, все входящие в выражение (23) параметры (описывающие поле скоростей, а также - коэффициент шкалы расстояний) должны быть подобраны так, чтобы значение плотности вероятности на реальной выборке объектов было максимальным из всех возможных. Обычно решают задачу, минимизируя взятый с обратным знаком логарифм значения плотности вероятности, т.е. строят функцию правдоподобия(24)
и сводят задачу к поиску минимума функции правдоподобия
с использованием какого-либо алгоритма оптимизации. Легко видеть, что, (25)
где индекс
относится к текущему объекту выборки.2.5. Вычисление ошибок параметров.
Функция правдоподобия является нелинейной функцией неизвестных кинематических параметров и коэффициента шкалы расстояний. Поэтому вычисление ошибок параметров проще всего производить следующим нестандартным, но вполне корректным способом [10], не связанным с линеаризацией минимизируемой функции, имеющей весьма сложную структуру. Пусть - какой-либо из найденных параметров задачи, - минимальное значение функции правдоподобия, достигнутое в процессе решения. Изменим значение этого параметра и зафиксируем его: , где величина мала (в пределах нескольких процентов от). Теперь при фиксированном значении , варьируя остальные параметры (теперь число неизвестных параметров стало на один меньше), снова найдем минимальное значение функции правдоподобия, равное . Тогда среднеквадратичную ошибку параметра вычислим по формуле
. (26)
Ясно, что
3.
Предполагается, что в работе методом статистического параллакса будет обработана шкала расстояний одного из типов объектов – классических цефеид или переменных звезд типа RR Лиры.
3.1. Классические цефеиды.
Для выполнения работы предоставляется каталог цефеид, содержащий галактические координаты звезд; их гелиоцентрические расстояния в кпк, вычисленные по зависимостям “период - светимость” и “период – цвет” (1, 2) из работы [3]; пульсационные периоды; лучевые скорости и их ошибки, взятые из компилятивной сводки в работе [11]; и компоненты собственных движений и с их ошибками, рассчитанные по данным каталога HIPPARCOS [5].
Остаточная скорость цефеид вычисляется по формуле (21), учитывающей дифференциальное вращение выборки.
3.2. Переменные типа RR Лиры.
Каталог RR-Лирид имеет ту же структуру, что и каталог цефеид; добавлены лишь данные о металличности. Предварительные расстояния звезд вычислены по формуле [3], а оценки поглощения произведены по картам Бурштейна и Хейлеса [8]. Лучевые скорости и оценки металличности [Fe/H] взяты из сводки Лейдена [12]. Собственные движения – из каталогов HIPPARCOS [5] и TRC [6].
При вычислении остаточных скоростей RR-Лирид дифференциальное вращение, выражаемое третьим членом в правой части формулы (21), можно не учитывать, т.к. объекты галактического гало практически не вращаются, т.е. для них
,
хотя наблюдаемый тензор дисперсий имеет тот же вид (16-18), что и для цефеид.
3.3. Составление подвыборок.
Полные выборки цефеид и RR-Лирид не являются кинематически однородными. Существует мнение, что долгопериодические и короткопериодические цефеиды (с граничным значением периода около 10 суток) обладают большими различиями в механизме пульсаций. Долгопериодическая группа цефеид, как группа более массивных звезд, в среднем моложе короткопериодической, поэтому в их кинематике еще должны сохраняться особенности кинематики той среды, из которой эти звезды образовались; тогда как кинематика более старой группы короткопериодических цефеид может уже отражать релаксационные процессы. Кинематические различия между группами цефеид отмечены в работе [11].
Выборка звезд типа RR Лиры еще более кинематически неоднородна. Их металличности заключены в пределах –2.5 <[Fe/H] < -0.5, причем максимум распределения по металличности наблюдается вблизи значения [Fe/H] ~ -1.5. Существует связь металличности со светимостью [7] и, разумеется, с кинематикой. Для группы низкометалличных звезд (максимальное значение [Fe/H] = -0.8) звезд характерна кинематика гало (т.е. практическое отсутствие вращение и большая дисперсия скоростей), тогда как RR-Лириды с высокой металличностью показывают заметное вращение и обладают низкой дисперсией скоростей. Кинематические свойства звезд меняются с металличностью непрерывным образом. Поэтому рекомендуется делить исходную выборку на несколько групп по металличности, по возможности сохраняя в каждой из групп большое число звезд.
Рекомендуется также провести вычисления для разных интервалов гелиоцентрических расстояний объектов. Дело в том, что с удалением от Солнца меняется соотношение ошибок лучевой и тангенциальной скорости, что может привести к смещению оценок параметров.
К отчету о выполнении задачи должны прилагаться значения кинематических параметров, коэффициента шкалы расстояний и их ошибки для каждого варианта вычислений.
3.4. Метод решения.
Максимально правдоподобное решение для неизвестных параметров задачи (22-25) сравнительно слабо чувствительно к случайным ошибкам наблюдений, которые автоматически учитываются с помощью тензора ковариации (15-18). Тем не менее, оно также требует внимательного отношения к объектам, которые при малых случайных ошибках наблюдений сильно уклоняются от общего решения. Их не следует включать в выражение для функции правдоподобия.
Для минимизации этой нелинейной функции существует целый ряд эффективных алгоритмов, в том числе методы Гаусса – Ньютона и Левенберга – Маркардта
[13, стр. 523], использующие интерполяцию и/или градиентный поиск, и метод деформируемых многогранников Нелдера – Мида [13, стр. 289], (так наз. симплекс-алгоритм), более медленный, но не нуждающийся в вычислении производных от целевой функции. На их базе созданы готовые эффективные алгоритмы, написанные на языках Fortran, Pascal, C [13], а также включенные в пакет MATLAB.ЛИТЕРАТУРА