Система поиска астрофизической информации в базе данных CATS
Черненков В.Н., Верходанов О.В., Трушкин С.А.
Специальная астрофизическая обсерватория, Нижний Архыз
Коллекция ~ 150 каталогов астрономических объектов в БД CATS
(Verkhodanov et al., 1997)
имеет объем около 500 Мбайт табличных данных. Подробные описания к ним
составляют около 4 Мбайт.
Эффективная работа с таким объемом информации возможна только
при организации автоматизированного доступа и развитой поисковой системы.
Сейчас выборка из базы данных,
например, поиск нужной информации по шаблону,
включающему параметры источника, каталогов, ключевые слова, фамилии авторов
и т.п., осуществляется несколькими способами, согласно видам доступа к базе.
Для увеличения надежности и ускорения доступа
база данных CATS размещена в виде "зеркальных" копий на двух
серверах САО РАН, функционирующих в локальных субсетях РАТАН и ННП САО.
В обоих случаях реализованы следующие виды работ:
-
доступ к поисковой системе через telnet://cats@cats.sao.ru/, или
telnet://cats@www.ratan.sao.ru/;
-
доступ к файлам данных и описаниям через ftp://cats.sao.ru/, или
ftp://www.ratan.sao.ru/;
-
гипертекстовый доступ: http://cats.sao.ru/, или
http://www.ratan.sao.ru/~cats/;
-
доступ к поисковой системе через электронную почту по адресу:
cats@sao.ru;
-
доступ к CATS и другим общедоступным файлам через
электронную почту (подробные правила работы с файловым сервером
можно получить, послав письмо с единственным словом help
по адресу: observ@ratan.sao.ru);
-
работа на сервере РАТАН-600 или с любого компьютера (с ОС Linux)
в локальной сети САО, к которому подмонтирована файловая система
сервера с расположенными на ней утилитами и базой данных CATS.
Первый и последний виды работы построены с помощью системы последовательных
меню.
При гипертекстовом доступе ввод параметров для выборки источников в заданной
области или для поиска координатных совпадений оформлен в виде форм.
При этом удобнее
использовать графические браузеры для X Window и
Windows: Mosaic, Netscape, Internet Explorer,
но можно пользоваться и текстовыми браузерами типа Lynx.
Собственно поисковые программы, реализующие CGI, написаны для Unix на
Shell и C.
Поскольку обработка большого списка отождествляемых источников может занимать
продолжительное время, для пользователя будет более удобна
обработка его запросов через электронную почту (E-mail).
Ниже приводится примеры задания команд поисковой системы при доступе
к CATS через электронную почту
(подробное описание можно получить, послав пустое письмо
по адресу cats@sao.ru):
-
Пример письма-запроса для получения выборки всех радиоисточников с плотностью
потока свыше 0.5 Ян в заданной граничными координатами
области неба и
выводом результата в виде FITS файла размером не более 50 Кбайт:
mail -s "" cats@sao.ru
cats select
ra min=12:30 max=12:40:15. dec > 0 < 5' 46"
catalogs r epoch=1950 flux > 0.5
out fits, size=50
cats end
- Пример письма-запроса для получения результатов поиска координатных
совпадений трех источников с заданными ошибками (x по RA; y по DEC):
mail -s "" cats@sao.ru
cats match catalogs a
window box x=60" y=40'
sources:
s1 02:02:00 +31:23:16 1950
s2 02:23:10 00:03:00 1950
s3 21:26:33.9 -18:34:33.0 1950
cats end
Существенным развитием поисковых средств стало подключение
системы быстрого индексного поиска GLobal IMPlicit SEarch и
ее гипертекстового расширения WebGlimpse (Manber et al., 1997)
Средства этой свободно распространяемой системы способны в течение секунд
производить поиск информации (в нашем случае: имена источников и каталогов,
фамилии авторов и т.п. в различных комбинациях) среди множества файлов по
заданному шаблону и формировать список ссылок в гипертекстовом виде, удобном
для дальнейшей работы.
WebGlimpse позволяет легко расширить систему поиска не только внутри
локальной файловой системы CATS, но и среди документации, размещенной на
аналогичных серверах в Internet.
Доступ к сервису WebGlimpse находится на домашней странице CATS.
Авторы благодарны РФФИ за поддержку проекта CATS, грант No 96-07-89075.
Литература
Manber U., M. Smith and B. Gopal: 1997.
WebGlimpse -- Combining Browsing and Searching; To appear in the
``USENIX Annual Technical Conference", Jan 6-10, 1997, Anaheim,
California. http://glimpse.cs.arizona.edu/
Verkhodanov O.V., Trushkin S.A., Andernach H., Chernenkov V.N.: 1997.
In Proc. of the ``Astronomical Data Analysis Software and
Systems -- VI", ed. R.Simon; NRAO, Charlottesville.
Vladimir Chernenkov
Sun Jun 8 21:17:44 MSD 1997