Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2012q3/000619.html
Дата изменения: Fri Sep 14 16:49:00 2012
Дата индексирования: Tue Oct 2 03:34:38 2012
Кодировка:
[RU-NGI] Проблемы на региональном Nagios с модулями lcg_util для Python?

[RU-NGI] Проблемы на региональном Nagios с модулями lcg_util для Python?

Victor Kotlyar (IHEP) Victor.Kotlyar at ihep.ru
Fri Sep 14 16:32:59 MSK 2012


On 09/13/2012 04:31 PM, Valery Mitsyn wrote:
> On Wed, 12 Sep 2012, Lev Shamardin wrote:
>
>> Прошел апгрейд, не автоматом, а руками. К сожалению занял очень много
>> времени из-за серьезных изменений схемы базы данных - миграция
>> несколько часов шла. Сейчас все должно быть ок.
>
> Кажется не совсем ок.
> Для тестов на CE (CREAM) вижу, что сами тесты CE проходят
> без проблем, но то , что отрабатавает на WN'ах не отчитывается
> о результатах начиная где-то с 2-х ночи 09-12-2012.
> Можно посмотреть на:
> https://lcg05.sinp.msu.ru/nagios/cgi-bin/status.cgi?servicegroup=SERVICE_CREAM-CE&style=overview
>
> последние отчеты о выполнении тестов на WN для всех
> CE были не позднее 09-12-2012 03:00:00.
> Куда деваются результаты с WN?


Зато удобно :)) будет 100% надёжность\доступность, если тест был 
успешным последний.




>
>>
>> --
>> Lev.
>>
>> On 09/12/2012 08:37 AM, Victor Kotlyar (IHEP) wrote:
>>> On 09/12/2012 08:09 AM, Eygene Ryabinkin wrote:
>>>> Обозревая произошедшее за ночь, я увидел, что у многих сайтов
>>>> сегодня с 4 до 6 ночи были проблемы с тестом org.sam.SRM-All:
>>>> {{{
>>>> [09-12-2012 05:19:52] SERVICE ALERT:
>>>> cluster.pnpi.nw.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;HARD;4;UNKNOWN:
>>>>
>>>> Error loading modules : No module named lcg_util
>>>> [09-12-2012 05:04:52] SERVICE ALERT:
>>>> cluster.pnpi.nw.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;3;UNKNOWN:
>>>>
>>>> Error loading modules : No module named lcg_util
>>>> [09-12-2012 04:49:52] SERVICE ALERT:
>>>> cluster.pnpi.nw.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;2;UNKNOWN:
>>>>
>>>> Error loading modules : No module named lcg_util
>>>> [09-12-2012 04:34:52] SERVICE ALERT:
>>>> cluster.pnpi.nw.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;1;UNKNOWN:
>>>>
>>>> Error loading modules : No module named lcg_util
>>>> [09-12-2012 05:26:32] SERVICE ALERT:
>>>> lxse-dc01.jinr.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;HARD;4;UNKNOWN:
>>>>
>>>> Error loading modules : No module named lcg_util
>>>> [09-12-2012 05:11:32] SERVICE ALERT:
>>>> lxse-dc01.jinr.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;3;UNKNOWN:
>>>>
>>>> Error loading modules : No module named lcg_util
>>>> [09-12-2012 04:56:32] SERVICE ALERT:
>>>> lxse-dc01.jinr.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;2;UNKNOWN:
>>>>
>>>> Error loading modules : No module named lcg_util
>>>> [09-12-2012 04:41:32] SERVICE ALERT:
>>>> lxse-dc01.jinr.ru;org.sam.SRM-All-/ops/Role=lcgadmin;UNKNOWN;SOFT;1;UNKNOWN:
>>>>
>>>> Error loading modules : No module named lcg_util
>>>> }}}
>>>> Сейчас, правда, стало все хорошо, часов около полдесятого утра.
>>>>
>>>> Это уже какая-то известная и вылеченная проблема или пока нет?
>>>
>>>
>>> Имхо, какой-то апгрейд прошёл (автоматом?).
>>> Выглядит сейчас всё иначе.
>>>
>>> Виктор
>>> _______________________________________________
>>> RU-NGI mailing list
>>> RU-NGI at theory.sinp.msu.ru
>>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>>
>> _______________________________________________
>> RU-NGI mailing list
>> RU-NGI at theory.sinp.msu.ru
>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>>
>



More information about the RU-NGI mailing list