Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2011q4/000279.html
Дата изменения: Mon Oct 10 14:23:50 2011
Дата индексирования: Tue Oct 2 02:48:19 2012
Кодировка:
[RU-NGI] regional nagios problem.

[RU-NGI] regional nagios problem.

Valery Mitsyn vvm at mammoth.jinr.ru
Mon Oct 10 14:18:28 MSD 2011


On Mon, 10 Oct 2011, Victor Kotlyar (IHEP) wrote:

> В 2011 году по всему RDIG будет очень большой провал из-за регионального
> Nagios по A/R.
>
> Я как-то спраливал это: какова ситуация, если проблема в мониторинге
> Nagios, а не в сайтах.
> Нельзя ли на это время считать A/R 100%. Но что-то ответа так и не услышал.
>
> Получаются все эти доступности и надёжности - пустой звук можно смело
> выкидывать их на помойку.

  Это совсем не "пустой звук". По правилам на:
https://wiki.egi.eu/wiki/Availability_and_reliability_monthly_statistics
--------------------------------------------
Resource Centres not providing minimum monthly performance (70% 
availability, 75% reliability) MUST provide justification through a GGUS 
ticket.
--------------------------------------------
и
--------------------------------------------
Resource Centres which have an availability of less than 70% for three 
consecutive months will be suspended, i.e. removed from the production 
infrastructure.
--------------------------------------------

>
> Удачи,
> Виктор
>
>
> On 10/10/2011 11:31 AM, Valery Mitsyn wrote:
>> On Thu, 6 Oct 2011, A.Kryukov wrote:
>>
>>> Коллеги!
>>>
>>> С точки зрения EGI, в настоящее время возглавляю ROC я, Крюков. Однако
>>> курирование вопросов WLCG (планирование ресурсов, их распределение и
>>> т.п.) относится к компетенции В.А.Ильина.
>>>
>>> Таким образом, вопрос о работе регионального Нагиоса в зоне моей
>>> ответственности и мы его сегодня обсуждали на совещании. Не позднее
>>> чем завтра этот вопрос будет решен.
>>
>>  У вас "день сурка"?
>> A/R упали до 72% даже у тех в ROC Russia, кто работает без проблем.
>>
>>>
>>>             С уважением,           А.К.
>>>
>>> On 10/06/2011 07:43 PM, Victor Kotlyar (IHEP) wrote:
>>>> Поддерживаю, заодно я бы хотел уточнить, кто сейчас наш ROC?
>>>>
>>>> Спасибо заранее.
>>>> С уважением.
>>>> Виктор Котляр
>>>>
>>>>
>>>>
>>>> On 10/06/2011 02:23 PM, Valery Mitsyn wrote:
>>>>> Hi,
>>>>>
>>>>> сегодня весь наш регион получил critical в тесте nagios:
>>>>> org.sam.WN-RepRep-/ops/Role=lcgadmin
>>>>> Как и было ранее рекомендовано Львом Шамардиным, я вставил
>>>>> тикет в GGUS с описанием проблемы:
>>>>> https://ggus.eu/ws/ticket_info.php?ticket=74999
>>>>> Проблема оказалась в настройках нашего nagios,
>>>>> как указал в коментарии Maarten Litmaath.
>>>>> ---------------------------------------
>>>>> your Nagios must _not_ refer to samdpm00x.cern.ch:
>>>>> we will decommission those nodes very soon.
>>>>> Instead you must define your own reference SE.
>>>>> This was communicated multiple times by the SAM team
>>>>> ---------------------------------------
>>>>>
>>>>>   Прошу срочно заняться этой проблемой наш ROC и
>>>>> ответсвенных за наш nagios.
>>>>>
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> RU-NGI mailing list
>>>>> RU-NGI at theory.sinp.msu.ru
>>>>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>>>>
>>>> _______________________________________________
>>>> RU-NGI mailing list
>>>> RU-NGI at theory.sinp.msu.ru
>>>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>>>
>>>
>>
>>
>>
>> _______________________________________________
>> RU-NGI mailing list
>> RU-NGI at theory.sinp.msu.ru
>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>

-- 
Best regards,
  Valery Mitsyn


More information about the RU-NGI mailing list