Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://sed.sao.ru/~vo/disser/ch3.html
Дата изменения: Thu Sep 9 19:16:47 2010 Дата индексирования: Mon Oct 1 20:35:18 2012 Кодировка: koi8-r Поисковые слова: п п п п п п п п п п п п |
gzipped PostScript версия здесь, 2005 г.
Начало | Введение | Глава 2 | Глава 3 | Глава 4 | Глава 5 | Глава 6 | Библиография | Приложения |
Верходанов О.В.
Специальная Астрофизическая обсерватория
Таким образом, создание базы данных радиоастрономических каталогов CATS (Astrophysical CATalogs Support System) явилось закономерным этапом развития систем обработки, большого числа архивированных списков обнаруженных источников и появления данных на новых вступивших в строй телескопах с приемниками на дополнительных длинах волн. Острой необходимостью стало построение и расширение континуальных спектров объектов в дополнение к точкам радиоспектра, измеряемым на РАТАН-600, не только при анализе механизмов энерговыделения, но и просто для более точных оценок измеряемых плотностей потоков калибровочных источников в процедуре привязки наблюдений к международной шкале потоков.
Можно выделить следующие предпосылки создания базы данных CATS на момент ее появления в САО в 1993г. (Верходанов, Трушкин, 1994, 1995a,b):
Табличные данные каталогов поступали на РАТАН-600 в разное время. MASTER LIST, объединенный каталог всех радиообзоров неба, выполненных до 1981 г., созданный Диксоном (США) (Dixon, 1970), стал первым из вошедших в CATS, так как широко использовался в радионаблюдениях на РАТАН-600 еще с 80-х гг. Коллекция данных содержит также информацию по тысячам слабых радиоисточников из обзора ``Холод'' и Зеленчукского обзора ГАИШ, проведенных с помощью радиотелескопа РАТАН-600. Очень большой вклад внес энтузиаст коллекционирования астрономических данных Хайнц Андернах, который передал многие оцифрованные им каталоги. Им собрано 600 каталогов, содержащих радиоданные, и около 500 - результаты наблюдений в других диапазонах (Andernach et al., 1994, 1995, 1997).
В данной главе будут рассмотрены принципы каталогизации радиоисточников, являющиеся оригинальной авторской разработкой, описаны идеология и правила построения баз данных астрофизических объектов и описаны принципиальные моменты селекции объектов. В рамках построенной системы проведены исследования нескольких списков объектов, отобраны радиоисточники с ультракрутыми спектрами, проведено их кросс-отождествление с объектами других диапазонов длин волн.
Основной упор в CATS сделан на работу с радиокаталогами и отдельными таблицами, использующими результаты наблюдений в сплошном спектре. Таких таблиц в БД около 400 (на начало 2005г.). Все самые объемные известные радиокаталоги с числом записей больше 800 уже включены в CATS. По нашим оценкам более 98% всех каталогизированных радиоданных являются частью CATS, что делает ее самой крупной радиоастрономической базой данных в мире.
Одной из основных задач, стоявших перед авторами, было сохранение исходного астрофизического каталога в формате автора, т.е. неизменность авторских данных. Необходимо было разработать такую структуру взаимодействия пользователя и поисковой программы, работающей с каталогом, чтобы и пользователю было удобно и программа разбиралась с первичным каталогом. Для выполнения этих целей была выбрана двухуровневая иерархическая структура описания и хранения данных, а также двухуровневая (а позднее - трехуровневая) структура поисковых и обслуживающих пользователя программ (Рис.3.1) (Verkhodanov et al., 1997c).
Добавление нового каталога в базу данных CATS происходит по следующим правилам:
Внешний пользователь взаимодействует с CATS через специально созданные командные файлы (второй уровень системы управления базой данных CATS) из любой директории системы (Рис. 3.1). Эти командные файлы считывают всю необходимую информацию из файла описаний (cats_descr) - центрального репозитория (хранилища ссылок) метаданных, описывающих физические свойства каталога. Именно благодаря взаимодействию с репозиторием, поисковые программы отождествляют местоположение искомого каталога в системе управления файлами OS Unix по запросам пользователя.
Описанный способ размещения и хранения каталогов позволяет быстро и легко развивать БД CATS, и настраивать поддерживающие программы. Таким образом, CATS представляет из себя базу данных объектов, где каждый объект - структурная единица, объединяющая сам астрофизический каталог, помещенный в соответствующую директорию системы, файл с его кратким описанием, а также программы для работы с этими данными (Рис.3.1).
Реально все каталоги имеют различный формат представления данных и получены в различных по методам наблюдениях. Таким образом, пользователю предоставляется однородный доступ к разнообразной коллекции данных, полученных на различной наблюдательной базе с различными физическими характеристиками и единицами измерения в противовес принятым на начало 90-х годов стандартам создания единого каталога с полным набором описываемых параметров. Система настройки организована таким образом, что описанные каталоги включаются в CATS без изменения расположения полей с параметрами, а прямо в том виде, как они были опубликованы.
Тонкая настройка.
Локальные программы вызова - нижний уровень взаимодействия с каталогами
- сами являются двухуровневыми программами (командными файлами).
Нижний уровень подготавливает верхний вызов в виде унифицированного
поискового запроса, который уже используется для передачи общих
параметров запроса к атомам системы. В качестве атомов системы
используются две специально разработанные программы c_sel и
c_match, которые настраиваются администратором на формат описания
соответствующего каталога, а именно на позиционирование
определенных полей с параметрами. Например,
нижеприведенная строка демонстрирует, как определенные
символы соответствуют определенным параметрам:
c_sel \ -pat "nnnnn hhmmssss ee tddmmss ee zzzzz fff eee\n i xx yy aa q\n".Здесь в трех вводимых строках:
Используя такую методику задания форматов полей, мы смогли подключить разнообразные каталоги, чьи наблюдательные характеристики, например координаты, выражены в радианах, градусах или часах, т.е. в различных физических единицах. Это позволило включить в CATS на общих основаниях старые каталоги с худшими (имеющими точность до 30 мин дуги) координатами без изменения форматов записей.
Индексация.
При работе c каталогами огромных размеров (свыше 0.5млн. записей)
становится заметной скорость взаимодействия программы с жестким
диском компьютера,
с одной стороны, а также время вычислений при обработке данных каждой
записи, с другой стороны. Для решение этих проблем была введена система
индексации записей (программа c_divide) с такой же тонкой
подстройкой описания параметров, что и для атомов системы c_sel и
c_match. Количество методов индексации устанавливает администратор
при включении каталога в базу данных CATS.
Подобный подход в индексации каталогов ускорил поиск и обработку информации
в десятки тысяч раз (Verkhodanov et al., 1997c; Верходанов и др., 2005c).
Расщепление каталогов на объекты.
Одна из мировых тенденций при создании баз данных - архивирование
астрофизической информации по конкретным объектам, т.е. в отличие
от CATS, которая развивалась, сохраняя каталоги в их исходном виде,
ряд баз данных (см. например, базы данных скоплений галактик (Gubanov, 1997)
или физических свойств галактик HyperLeda (Prugniel et al., 2002))
собирает и структуирует информацию по отдельным объектам.
Следуя этим тенденциям,
мы добавили
процедуры работы c S-файлами (в FITS-подобном формате для описания
данных радиоспектров (Верходанов и др., 1997a))
в программы нижнего уровня - атомы CATS.
Таким образом были представлены и сохранены в CATS результаты отождествлений
декаметровых источников (Verkhodanov et al., 2000d; Верходанов и др., 2003b).
Выдаваемые таблицы CATS (Верходанов и др., 1997a, 2004b) воспринимаются графическими процедурами FADPS (spg, см. Главу 2, (Верходанов, 1997)), таким образом формируя единую цепочку обработки информации.
Построение континуальных радиоспектров в базе данных обеспечивается несколькими процедурами на разных уровнях доступа. На нижнем уровне взаимодействуют процедуры FADPS spg и plgr с данными вывода процедур CATS c_sel и c_match. На верхнем уровне доступны разработанные А.С.Трушкиной и С.А.Трушкиным Java-процедуры и GIF-процедуры для оперативного построения спектров из многочастотных каталогов.
Предоставление краткого описания и характеристик каждого каталога оформлено на трех уровнях доступа: Web-страницы подготовлены С.А. Трушкиным, а описание для FTP- и SCP-доступа производится администратором в момент ввода нового каталога.
Перевод координат с эпохи на эпоху - одна из функций CATS. Координаты выбираемых объектов могут задаваться на произвольную эпоху, а согласование с эпохой каталога производится специальной утилитой epoch, в которой реализованы алгоритмы, разработанные В.П.Львовым (ГАО РАН).
Две функции, являющиеся принципиальными в селекции объектов: выборку по параметрам и кросс-идентификацию, связанные с процедурами вычислений, рассмотрим отдельно.
Взаимодействие программ выборки и каталогов и файла описаний cats_descr выполняет процедура cats_sel, распределяющая работу по заданным каталогам. Она обеспечивает взаимодействие между пользовательскими интерфейсными программами и нижним уровнем. Задача выборки по параметрам решается на всех уровнях управления CATS (например, HTTP - см. Рис.3.2).
Кросс-идентификация позволяет выбирать все источники внутри некоторого окна поиска вокруг объектов, задаваемых пользователем. При определении окна отождествления можно выбрать форму (эллипс/прямоугольник) и размер. Кроме того, при работе описываемой процедуры учитываются ошибки определения координат, имеющиеся внутри обрабатываемых списков. Для ряда каталогов (IRAS) ошибки определяются с учетом наклона эллипса диаграммы направленности. Вероятность правильного отождествления объектов может быть оценена процедурой, описанной формулой (2.9).
Взаимодействие программ кросс-идентификации и каталогов и базы данных описаний выполняет процедура cats_match, распределяющая задания по выбранным каталогам. Она, как и ранее описанная процедура cats_sel, обеспечивает взаимодействие между пользовательскими интерфейсными программами и нижним уровнем.
Задача кросс-идентификации по параметрам решается на всех уровнях управления CATS.
![]() |
Рис.3.2. Стартовая страница базы данных CATS для выборки по параметрам (разработана В.Н.Черненковым и др., 1997). Рисунок опубликован в работе (Verkhodanov et al., 1997c). |
Для организации доступа к программам cats_match и cats_sel В.Н.Черненковым (Черненков и др., 1997) были разработаны интерфейсные CGI-процедуры, обслуживающие клиентские запросы по протоколам SMTP (e-mail) и HTTP, а также программа для синхронизации базы данных описаний cats_descr и содержимого форм запроса.
Для запуска процедур CATS с помощью электронной почты разработаны специальные форматы, подробное описание которых можно получить по e-mail, послав пустое письмо по адресу cats@sao.ru.
После выполнения вычислительных запросов пользователю доставляется выводимый результат, записанный в одном из следующих форматов:
Результирующий файл по умолчанию сортируется в порядке возрастания прямого восхождения и может без изменений обрабатываться программой spg системы обработки FADPS.
Наша цель состояла в том, чтобы идентифицировать по возможности все УТР объекты с известными радиоисточниками. Кросс-идентификация и дальнейшие исследования позволили нам как уточнить положения радиоисточников, так и получить их радиоспектры. По новым координатным данным для ряда объектов удалось провести оптические отождествления c объектами цифрового Паломарского Атласа. Данные о спектрах позволили построить выборки источников в декаметровом диапазоне в зависимости от морфологии спектра, например, выборки источников с крутыми спектрами.
Чистка данных.
Проблема построения спектров радиоисточников каталога УТР,
обнаруженных на Харьковском Т-образном радиотелескопе (Брауде и др., 1996)
в декаметровом диапазоне волн (10МГц, 12.6МГц, 14.7МГц, 16.7МГц,
20МГц, 25МГц), связана прежде всего
с отождествлением источников в больших
боксах ошибок, в данном случае в окне 40'x40'cosec(δ),
полученных при
кросс-идентификации в базе данных CATS (Verkhodanov et al., 1997a).
Для решения этой проблемы
мы применили
интерактивную обработку радиоспектров (Верходанов и др., 1997b),
полученных путем
кросс-идентификации объектов УТР каталога с источниками базы данных
CATS с окном отождествления 40 минут
дуги.
Характеристики основных каталогов,
используемых при отождествлении, приводятся в Таблице 3.1.
Таблица 3.1. Характеристики основных каталогов, используемых при отождествлении декаметровых объектов.
Имя | Частота | HPBW(') | Slim(мЯн) | Ссылка |
6C | 151 | 4.2 | ~200 | Hales et al., 1988, 1990 |
7C | 151 | 1.2 | 80 | McGilchrist et al., 1990 |
MIYUN | 232 | 3.8 | ~100 | Zhang et al., 1997 |
WENSS | 325 | 0.9 | ~18 | Rengelink et al., 1997 |
TXS | 365 | ~0.1 | ~200 | Douglas et al., 1996 |
B3 | 408 | 3x5 | 100 | Ficarra et al., 1996 |
WB92 | 1400 | 10x11 | 150 | White & Becker, 1992 |
87GB | 4850 | 3.7 | 25 | Gregory & Condon, 1991 |
GB6 | 4850 | 3.7 | 15 | Gregory et al., 1996 |
PMN | 4850 | 4.2 | 30 | Wright et al., 1996 |
MSL | разл. | разл. | разл. | Dixon, 1970, 1981 |
Чистка спектров производилась программой spg (Верходанов, 1997) по отработанной методике (Верходанов и др., 1997b). При чистке удалялись источники, спектры которых не достигают точек каталога УТР при аппроксимации стандартными кривыми. Поиск предполагаемых кандидатов на отождествление состоял из нескольких шагов: