Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://vo.astronet.ru/wiki/q3c-paper
Дата изменения: Unknown Дата индексирования: Sat Apr 9 22:47:41 2016 Кодировка: UTF-8 Поисковые слова: m 106 |
Одним из основных видов научной информации в современной астрономии являются каталоги объектов различных классов – звезд, инфракрасных и рентгеновских источников, галактик. Объемы каталогов стремительно растут с вводом в строй новых крупномасштабных обзорных проектов - SDSS, PanSTARRS, ожидаемый через несколько лет LSST. Задача эффективного хранения такой информации в современных системах управления базами данных (СУБД) становится все более важной. Основной проблемой при этом является обеспечение возможности быстрого поиска объектов по заданным координатам, что требует создания специальных структур, описывающих их распределение в пространстве координат – поисковых индексов. Для наиболее развитой на данный момент открытой СУБД – PostgreSQL – существуют две основных реализации подобных индексов – Q3C, основанная на бинарном дереве, и реализованная как GiST-индекс pgSphere. Мы провели сравнение производительности основных операций, востребованных в реальной работе с каталогами, для этих индексов. Рассмотренные сценарии включали в себя одномоментную заливку большого объема данных с последующим построением индекса, проведение позиционных выборок с разным размером окна, а также задачу непрерывного пополнения базы постоянно поступающими данным с поддержанием индексов в актуальном состоянии. Проведенные эксперименты показали, что реализация Q3C существенно выигрывает как в случае одномоментной, так и при непрерывной вставке данных в базу, тогда как pgSphere, основанная на более совершенной индексной структуре, окаызвается быстрее в задаче позиционной выборки данных. В заключении мы обсуждаем возможные сценарии использования этих типов индексов в реальных условиях современных обзорных экспериментов разного уровня.