Документ взят из кэша поисковой машины. Адрес оригинального документа : http://parcon.parallel.ru/
Дата изменения: Tue Sep 14 18:27:48 2010
Дата индексирования: Mon Oct 1 19:38:44 2012
Кодировка: koi8-r
Система ParCon
parallel.ru
Главная Документация Скриншоты Примеры Обратная связь

Работа выполняется при поддержке РФФИ, грант N 02-07-90442.

Что это.

Система ParCon предназначена для эффективного управления ресурсами вычислительных кластеров, а также анализа эффективности кластеров и параллельных программ.

Возможности.

ParCon позволяет:

  • управлять прохождением задач
  • проводить анализ эффективности задач
  • автоматически распределять свободные процессоры между задачами
  • управлять политикой использования кластера различными пользователями
  • предоставлять информацию о работе задач на кластере
  • предоставлять детальную статистику использования ресурсов кластера задачей, как во время работы задачи, так и по окончании.

Структура.

ParCon состоит из двух программных комплексов, способных работать как совместно, так и независимо друг от друга.

Первый комплекс - система управления заданиями Cleo. Она была разработана в НИВЦ МГУ специально для управления ресурсами вычислительных кластеров. Эта система ориентирована на работу с параллельными приложениями и поддерживает многие параллельные среды. Под её управлением работают кластеры НИВЦ МГУ, объединяющие в общей сложности 73 вычислительных узла (146 процессоров)

Второй комплекс, входящий в состав программной среды, - комплекс мониторинга Ant. Комплекс сделан расширяемым, для того, чтобы максимально охватить спектр параметров вычислительных узлов, которые необходимо отслеживать, а также спектр программ реагирования на нештатные значения параметров. Комплекс задумывался максимально устойчивым к внешним воздействиям, таким как обрывы связи, отказ серверов и т.п. Такая устойчивость обеспечивается за счёт децентрализации головных процессов комплекса.

Оба компонента в комплексе представляют инструмент для получения максимально полной информации о задачах, выполнявшихся (и выполняющихся) на кластере. ParCon предоставляет web-интерфейс, с помощью которого пользователь может получить "профиль" работы своей программы в виде диаграмм использования ресурсов всех вычислительных узлов, которые использовала его программа. По такому "профилю" пользователь может определить источники неудовлетворительной работы своих программ.