Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://www.cplire.ru/rus/casr/projects/oscentre/report-2001/part1-2.html
Дата изменения: Fri Mar 1 21:01:29 2002 Дата индексирования: Sat Dec 22 12:27:52 2007 Кодировка: Windows-1251 Поисковые слова: п п п п п п п п п п |
Секция Открытых Систем |
||||||
|
АННОТИРОВАННЫЙ ОТЧЕТ проект ? А0086 "Центр открытых систем" этап 2001 г.
1.2 Аннотация Книги 2"Развитие информационного обеспечения Центра открытых систем. Поддержка Web-портала по проблемам открытых систем"
Книга состоит из 3 глав. Глава 1. "Структура информационного хранилища портала" Под информационным хранилищем в данной НИР понимается совокупность разнородных информационных ресурсов, хранящихся на различных сайтах сети Интернет, объединенных единой системой администрирования, метаописания, атрибутно-контекстного поиска и аналитической обработки. В данной НИР в отличие от большинства известных подходов реализованы процедуры работы с расширенной структурой каталога, значительно более эффективной, чем древовидная. Принятая модель информационного хранилища соответствует стандарту X500. Распределенность информационного хранилища означает, что отдельные части каталога информационного хранилища могут размещаться и администрироваться на различных сайтах в сети Интернет. Понятно, что в этом случае эти части во первых должны быть определенным образом согласованы друг с другом, а во вторых должен существовать механизм обмена данными между отдельными частями каталога, не зависящие от его программной реализации. Обе эти проблемы рассматриваются и решаются в работе. Реляционные модели плохо приспособлены для представления графовой модели каталога. Кроме того, в случае большого числа узлов и ссылок, что характерно для реальных электронных хранилищ СУБД, построенные на основе реляционных моделей проигрывают объектно-ориентированным по скорости выполнения запросов. Одним из наиболее продвинутых технологических инструментов в этой области является СУБД ObjectStore Pse/PsePro, поставляемая в виде целого спектра версий - от бесплатной однопользовательской версии до многофункциональной версии, предназначенной для приложений клиент-сервер. Языками программирования для этой СУБД служат языки C++ и Java. В данной НИР в качестве языка прикладного программирования выбран язык Java. Основу структуры базы данных (каталога) составляют два класса: класс Item и класс Node. Класс Item служит для описания одного информационного ресурса (в частности ресурса, описывающего телекоммуникационный стандарт, профиль ГОСИП и др.). Класс Item содержит четыре поля url, name, descr, date описывающих url ресурса, его название, краткую аннотацию и дату создания (последней модификации) соответственно. Это и есть описательные атрибуты, перечень которых легко может быть расширен. Перечень классификационных атрибутов (т.е. узлов графа классификации, соответствующих рассматриваемому информационному ресурсу) моделируется структурой Java - множества. Класс Node служит для моделирования графовой структуры множества классификационных атрибутов. В нем реализованы все операции необходимые для администрирования каталога информационного хранилища: добавление и удаление узлов графа, добавление и удаление ссылок на информационные ресурсы, извлечение ссылок на информационные ресурсы по заданному узлу (атрибуту) и т.п. Еще одной базовой структурой, использованной при построении каталога, является структура, реализующая понятие ключевого слова, использующегося в контекстном поиске. Какой бы ни была конкретная реализация отдельных частей распределенного каталога, должны быть определены механизмы взаимодействия этих частей и, в частности, механизмы переноса данных из одной части каталога в другую. Крайне желательно, чтобы в соответствии с принципами открытых систем эти механизмы не зависели от конкретной программной реализации отдельных функциональных подсистем информационного хранилища. Такие механизмы могут быть обеспечены с помощью XML модели каталога, предложенной и реализованной в данном проекте. Глава 2 "Программное обеспечение портала" С учетом принятой в предыдущем разделе модели данных информационного хранилища, может быть предложена следующая структура программного обеспечения информационного Интернет-хранилища: ћ подсистема управления каталогом ћ подсистема управления информационными ресурсами ћ система автоматической каталогизации ћ система автоматической индексации ћ система объединения хранилищ ћ система атрибутно-контекстного поиска Первые пять из них относятся к системе администрирования информационного хранилища, в то время как последняя обеспечивает обработку всего спектра клиентских запросов к информационному хранилищу. Все программные модули системы построены на базе технологии сервлетов, что обеспечивает переносимость построенных серверных решений. Глава 3. Информационное обеспечение портала" Осуществлено информационное наполнение следующих разделов Интернет-портала Центра открытых систем:
|