Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://sed.sao.ru/~vo/disser/ch2.html
Дата изменения: Wed Jul 15 12:41:36 2009 Дата индексирования: Mon Oct 1 20:35:00 2012 Кодировка: koi8-r Поисковые слова: m 101 |
gzipped PostScript версия здесь, 2005 г.
Начало | Введение | Глава 2 | Глава 3 | Глава 4 | Глава 5 | Глава 6 | Библиография | Приложения |
Верходанов О.В.
Специальная Астрофизическая обсерватория
Любая система обработки, какой бы дружелюбной она не была, требует определенного уровня компьютерной грамотности или просто подготовленности пользователя. Причем, чем выше дружелюбность системы, тем больше об этой системе необходимо знать. Подобные системы обработки данных зачастую бывают довольно громоздкими. Этими недостатками обладают системы, рассчитанные на универсальность: MIDAS, AIPS и др. Процедуры запуска системы, команды редактирования данных и выполнения той или иной операции обязывают знать базовый уровень системы обработки. Если учесть, что всякая развитая система обработки астрономических данных (ADPS - astronomical data processing system) является ``системой в системе'', то необходимость знания команд операционной системы, под которой работает ADPS, уже подразумевается. У развитых ADPS может быть еще один недостаток, связанный с тем, что принципы программирования и обработки изображений в такой ADPS отличаются от принципов операционной среды, под управлением которой эта система обработки существует.
Здесь предлагается иной подход к созданию системы обработки данных, реализованный, в частности, уже при создании ADPS для первого облучателя РАТАН-600 (Ерухимов и др., 1990; Верходанов и др., 1992a,b; Verkhodanov et al., 1993), предполагающий создание конструктора систем обработки из малых модулей и обеспечивающий простую настройку под различные процессоры. Назовем такой подход модульным, а систему обработки - гибкой системой обработки астрономических данных (FADPS - flexible astronomical data processing).
Отметим, что на РАТАН-600 существовали и существуют другие программы обработки данных, использующие специфику систем регистрации и решаемых задач. Упомянем здесь систему PRF, созданную Витковским, Шергиным и Моносовым для данных радиометров сплошного спектра в операционных системах семейства RT-11 (Витковский, 1990) и действующую до 1993 г.; программу prad, созданную Т.Н.Соколовой и развитую С.А.Трушкиным как программу pradT в DOS; систему обработки данных наблюдений переменности квазаров АКЦ ФИАН (Kovalev, 1998; Ковалев, 2002); методы и программы обработки данных первого облучателя ГАИШ МГУ (Горшков и Хромов, 1981; Амирханян, 1989). Кроме того, для обработки данных спектральных наблюдений на 2-м облучателе и солнечных данных на 3-м облучателе РАТАН-600 имеются свои пакеты обработки данных (Алферова и др., 1986 и Гараимов, 1998 соответственно).
Предлагаемый нами подход используется в обработке данных первого облучателя РАТАН-600 уже свыше 15 лет: первые модули созданы для анализа данных в методе сечений в работе (Бурсов и др., 1989). В рамках выработанной нами идеологии уже разработано несколько пакетов, из которых четыре основные будут представлены ниже. На базе разработанных процедур проводятся исследования радиоисточников, одно из которых: исследование объектов обзора 1995г. на Северном секторе РАТАН-600, также приведено в данной главе.
В основе современных методик обработки данных наблюдений радиогалактик на РАТАН-600 лежит описываемая ниже система FADPS, а исследование микроволнового фонового излучения проведено в пакете GLESP, тоже являющемся частью FADPS. Алгоритмическая часть многих программ (обнаружение и подсчеты источников, аппроксимация табулированными аппаратными функциями, обнаружение и ``чистка'' помех) разработана в рамках описываемой системы (Горохов, Верходанов, 1993, 1994, 1995a,b; Verkhodanov, Gorokhov, 1995; Verkhodanov, 1996; Shergin et al., 1997; Verkhodanov, Pavlov, 2000; Верходанов, Павлов, 2001).
Пусть, например, исследуемым данным соответствует вектор,
описывающий наблюдения некоторого радиоисточника. Нам нужно в
качестве результата получить аппроксимационную кривую в виде
Гауссианы, вписанной в запись прохождения этого источника,
с тремя параметрами (координата,
размер, амплитуда).
Стандартная процедура получения этого результата представляет из себя
последовательное применение двух операторов: оператора вычитания
фона Fbgd (низкочастотной составляющей шума)
и оператора аппроксимации гауссианой Fgauss, то есть
задача состоит в том, чтобы
получить в качестве результата вектор R, равный:
R = Fgauss ( Fbgd ( D ) ) | (2.1) |
bgd -w 10 D | gauss -n 20 > R, | (2.2) |
Еще один пример: операция осреднения нескольких векторов
данных с предварительным вычитанием фона:
Этому выражению соответствует команда
aver D* -r -o R, | (2.4) |
При создании модулей следует учитывать некоторые принципы написания таких программ.
Итак, используя идеологию построения системы обработки, детально проработанный формат описания данных, принципы обработки данных и алгоритмическое обеспечение, можно приступить к ее реализации.
Выделим несколько этапов разработки системы:
Любое построение системы обработки начинается с принятия правил описания данных, а именно формата представления данных. В международной астрономической среде для этих целей принят FITS-формат, зарегистрированный Институтом Стандартов США (Wells et al., 1981). Это самодокументируемый формат, описывающий данные неограниченной длины и понимаемый международными системами обработки. Естественно, он должен включаться в систему ввода/вывода любой системы обработки. Однако, он не может отразить некоторые особенности локальных систем регистрации и управления телескопом, но в то же время это может быть сделано в локальных форматах записи данных. Рассмотрим эту проблему подробнее.
Основные причины выбора F-формата были следующие:
Кроме стандартных ключевых слов шапочки F-файлов, соответствующих стандарту FITS, мы ввели дополнительные слова для описания технических параметров системы `антенна - облучатель - приемник - система регистрации': RCV-MODE для описания режима использования приемника со значениями SH, BS, RH (соответственно приемник с пилот-сигналом, режим сканирования, рупор в небо); REGIMOBS - режим наблюдения источника D, S, C, V, 3 (соответственно наблюдения дискретного источника, обзор, наблюдения в режиме скольжения, режим скольжения быстро переменных процессов (мерцаний), трехзеркальная конфигурацию антенны: наблюдения на южном секторе РАТАН-600 с плоским отражателем). Кроме того, введены новые ключевые слова:
VELO-CAR | скорость движения каретки облучателя в режиме сопровождения источника; |
CARRIAGE | положение рупора приемника данной длины волны на каретке облучателя; |
CMPRS-CF | коэффициент сжатия данных; |
FOCUS | значение фокуса антенны; |
SIDTIME | звездное время кульминации объекта; |
DECTIME | декретное время кульминации объекта. |
Вслед за шапочкой в F-файле записываются двоичные данные, представляющие из себя последовательность равноудаленных измерений (или вычислений) с шагом CDELT1. Если массив данных двумерный, запись производится по строкам. Список стандартных ключевых слов приведен в Приложении 1. Таким образом, используя введенные ключевые слова, FADPS выбирает и контролирует стратегию обработки наблюдательных данных.
Начиная с 1994 года (Верходанов и др., 1994), система обработки радиоастрономических данных FADPS использует FITS Binary Table-подобный формат (Harten et al., 1985; 1988; Cotton et al., 1995; Hanisch et al., 2001), описывающий в виде одного файла многочастотные наблюдения в континууме. Позднее все архивные данные широкополосных радиометров были полностью переведены в данный формат (Кононов, Павлов, 1999; Кононов и др., 1999). Подчеркнем, что наряду с многочастотными файлами в повседневной обработке на радиотелескопе РАТАН-600 используется также и одночастотный формат, приближенный к классическому Basic FITS. Детальное описание формата уже приводилось в работах Верходанова и др. (1994, 1995a,b). Отметим здесь только некоторые ключевые слова заголовка расширения, которые приведены в Приложении 2. Обращаем внимание, что в приведенном примере практически все ключевые слова, кроме описателей полей TFORM#, TDIM#, TTYPE#, TUNIT#, TSCAL# и TZERO#, являются нестандартными и при перекодировке в канонический FITS могут быть закомментированы в строках COMMENT. Обратим внимание на использованные ключевые слова в примере системы обработки FADPS: SP-FORMU (формула спектра радиоисточника) и TARF# (формула площади антенны на соответствующей длине волны). От остальных параметров они отличаются тем, что содержат аналитические формулы. Аналогичным образом задаются и формулы аппроксимации спектров в системе анализа данных CATS (Глава 3). Для описания формы спектра используется ключевое слово SP-AP#, причем спектр может быть разбит на отдельные участки. Для анализа подобных аналитических записей разработана специальная библиотека на языке ``C'', которая позволяет разбирать члены формулы и подставлять функциональные значения для заданных аргументов.
Для описания современных данных мы предлагаем структуру, объединяющую результаты наблюдений (включая рассчитанные эффективные площади антенны, обеспечивающие быструю калибровку по аналитическим формулам), двумерные площадки неба в оптическом и радиодиапазонах, записанные в двоичных кодах, а также данные радио и оптических спектров, представленные в виде ASCII-таблиц. При этом разнородные данные должны оформляться как расширения, а соответствующие программы-распаковщики и визуализаторы должны их понимать. Вариант такой структуры, оформленный как единственный FITS или FITS-подобный файл, в общем виде представлен на Рис.2.1, где p-H - первичный FITS-заголовок, e-Hi и e-Di - соответственно заголовок и данные i-го расширения.
Рис.2.1. Вариант представления разнородных астрономических данных в виде одного FITS или FITS-подобного файла. Рисунок опубликован в работе (Verkhodanov & Kononov, 2002). |
Кроме того, текущие библиотеки чтения FITS-данных должны уметь разбираться с аналитическими формулами и дополнительными ключевыми словами, содержащимися в строках заголовка COMMENT.
По-видимому, эти направления и будут основными при формировании новых стандартов представления информации в развивающихся электронных системах доступа на радиотелескопе РАТАН-600.
Отдельный вопрос - визуализация результатов обработки. В основном удобство ADPS определяется возможностями визуализации данных и результатов обработки, а также возможностью работать с данными в интерактивном графическом режиме. В этом случае, конечно, не удается избежать создания ``системы в системе''. Удобство системы UNIX заключается в том, что создание подобных систем значительно облегчается при наличии FADPS. В этом случае нет смысла писать подпрограммы, выполняющие те или другие операции. Достаточно вызвать и передать управление программе FADPS, выводящей результат на графическую станцию. Это экономит как человеческие, так и машинные ресурсы.
Рис.2.2. Рабочий экран программы fgr. Рисунок опубликован в работе (Верходанов, 1995a). |
Рис.2.2. Фрагмент модульной схемы программы fgr. Демонстрационный рисунок для данной диссертации. |
Основные задачи программы следующие:
Math (математические операции) ----> Fcalc (скалярно-векторные операции) ----> Vector (векторные операции) ----> требуемая операция.
В каждом меню кроме операций, объединенных именем пункта, присутствуют также операции управления, например, операции записи результата в оперативную память, на твердый диск, операции выхода из текущего меню.
Построение программы ориентировано исключительно на описанный модульный принцип организации системы обработки данных. В обязанности такой программы, кроме вызова соответствующих ``кирпичей'', входит сервисное обслуживание (система меню разного уровня и соответствующие подсказки) и визуализация результата. Имеется возможность запуска программы-модуля, заранее не описанного как пункт меню, для выполнения дополнительных операций над данными: при входе в пункт Filt (filter) программа запрашивает имя программы (можно с ключами) и передает управление ей, а полученный результат выводит на экран. Программа имеет специальное меню для работы с курсором и графического редактирования данных. Имеется возможность ``ручного'' клиппирования источников и помех, а также ``ручного'' удаления фоновых нелинейных компонент.
При создании процедур визуализации мы исходно использовали библиотеку CGI системы XENIX, но таким образом, чтобы в дальнейшем произвести безболезненный переход в стандартную графическую оболочку X~Window системы UNIX. Причем реализация процедур произведена на самом низком уровне программирования X~Window таким образом, чтобы не было зависимости от коммерческих библиотек (Верходанов, 1991a; Верходанов, 1993b; Верходанов и др., 1995c). Практика показала, что выбранная идеология оказалась действенной, и новая версия программы fgr заработала в сетевой графической среде X Window без существенных осложнений. В настоящий момент графическая система fgr (Верходанов, 1995a) реализована и поддерживается в ОС Linux, Sun OS, OS Solaris, Silicon Graphics Irix.
В рамках обозначенной идеологии были также предложены и реализованы библиотеки функций для создания бумажных копий изображений, а именно: система описания графопостроителей - {\rm PLOTCAP}, позволяющая выводить данные на различные типы графопостроителей без изменения программ обработки, а лишь переименованием логических имен среды (Верходанов, Черепахин, 1993), а также библиотека функций для работы с языком PostScript (Верходанов, 1994a).
Система обработки спектров состоит из нескольких программ, позволяющих работать с данными как в интерактивной графической моде, так и ``вслепую'', что, в свою очередь, позволяет переходить к потоковой обработке. Центральной утилитой системы является программа spg (SPectral Graphics), разработанная в среде X Window OS UNIX. Утилита spg позволяет в системе многоуровневого меню и последовательной визуализацией всех операций над спектрами выполнять следующие действия:
Рис.2.4. Экран программы spg с меню и спектром радиоисточника. Рисунок опубликован в работе (Verkhodanov et al., 1997a). |
Рис.2.5. Фрагмент модульной схемы программы spg. Демонстрационный рисунок для данной диссертации. |
В качестве основных стандартных функций аппроксимации спектров используются следующие:
Реализованные процедуры вычисления радиосветимости и мощности
радиоисточников используют формулы (Lang, 1999):
для светимости,
где Sν - плотность потока на частоте ν,
D