Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2012q3/000618.html
Дата изменения: Fri Sep 14 16:33:10 2012
Дата индексирования: Tue Oct 2 03:34:34 2012
Кодировка:
[RU-NGI] Проблемы на региональном Nagios с модулями lcg_util для Python?

[RU-NGI] Проблемы на региональном Nagios с модулями lcg_util для Python?

Valery Mitsyn vvm at mammoth.jinr.ru
Thu Sep 13 18:31:19 MSK 2012


On Wed, 12 Sep 2012, Lev Shamardin wrote:

> Прошел апгрейд, не автоматом, а руками. К сожалению занял очень много 
> времени из-за серьезных изменений схемы базы данных - миграция несколько 
> часов шла. Сейчас все должно быть ок.

  Кажется не совсем ок.
Для тестов на CE (CREAM) вижу, что сами тесты CE проходят
без проблем, но то , что отрабатавает на WN'ах не отчитывается
о результатах начиная где-то с 2-х ночи 09-12-2012.
  Можно посмотреть на:
https://lcg05.sinp.msu.ru/nagios/cgi-bin/status.cgi?servicegroup=SERVICE_CREAM-CE&style=overview
последние отчеты о выполнении тестов на WN для всех
CE были не позднее 09-12-2012 03:00:00.
  Куда деваются результаты с WN?

>
> --
> Lev.
>
> On 09/12/2012 08:37 AM, Victor Kotlyar (IHEP) wrote:
>> On 09/12/2012 08:09 AM, Eygene Ryabinkin wrote:
>>> Обозревая произошедшее за ночь, я увидел, что у многих сайтов
>>> сегодня с 4 до 6 ночи были проблемы с тестом org.sam.SRM-All:
>>> {{{
>>> [09-12-2012 05:19:52] SERVICE ALERT:
>>> cluster.pnpi.nw.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;HARD;4;UNKNOWN:
>>> Error loading modules : No module named lcg_util
>>> [09-12-2012 05:04:52] SERVICE ALERT:
>>> cluster.pnpi.nw.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;3;UNKNOWN:
>>> Error loading modules : No module named lcg_util
>>> [09-12-2012 04:49:52] SERVICE ALERT:
>>> cluster.pnpi.nw.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;2;UNKNOWN:
>>> Error loading modules : No module named lcg_util
>>> [09-12-2012 04:34:52] SERVICE ALERT:
>>> cluster.pnpi.nw.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;1;UNKNOWN:
>>> Error loading modules : No module named lcg_util
>>> [09-12-2012 05:26:32] SERVICE ALERT:
>>> lxse-dc01.jinr.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;HARD;4;UNKNOWN:
>>> Error loading modules : No module named lcg_util
>>> [09-12-2012 05:11:32] SERVICE ALERT:
>>> lxse-dc01.jinr.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;3;UNKNOWN:
>>> Error loading modules : No module named lcg_util
>>> [09-12-2012 04:56:32] SERVICE ALERT:
>>> lxse-dc01.jinr.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;2;UNKNOWN:
>>> Error loading modules : No module named lcg_util
>>> [09-12-2012 04:41:32] SERVICE ALERT:
>>> lxse-dc01.jinr.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;1;UNKNOWN:
>>> Error loading modules : No module named lcg_util
>>> }}}
>>> Сейчас, правда, стало все хорошо, часов около полдесятого утра.
>>> 
>>> Это уже какая-то известная и вылеченная проблема или пока нет?
>> 
>> 
>> Имхо, какой-то апгрейд прошёл (автоматом?).
>> Выглядит сейчас всё иначе.
>> 
>> Виктор
>> _______________________________________________
>> RU-NGI mailing list
>> RU-NGI at theory.sinp.msu.ru
>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>
> _______________________________________________
> RU-NGI mailing list
> RU-NGI at theory.sinp.msu.ru
> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>

-- 
Best regards,
  Valery Mitsyn


More information about the RU-NGI mailing list