Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2013q3/001070.html
Дата изменения: Tue Jul 23 10:29:08 2013
Дата индексирования: Fri Feb 28 03:21:15 2014
Кодировка:
[RU-NGI] need hekp

[RU-NGI] need hekp

Eygene Ryabinkin rea at grid.kiae.ru
Tue Jul 23 10:19:33 MSK 2013


Tue, Jul 23, 2013 at 09:19:45AM +0400, Yevgeniy Lyublev wrote:
> Необходимы помощь или совет.
> Есть RAID 5, при Rebuild возникает проблема со
> вторым диском -

Со вторым по счету или у вас два диска с пробемами?

> 0026 Drive ECC error reported
> Event Type
> Error
> Cause
> Drive ECC errors are an indication of grown defects on a particular
> drive. For redundant units, this typically means that dynamic sector
> repair has been invoked (see message 0023 Sector repair completed).
> For non-redundant units (Single Disk, RAID 0 and degraded units),
> which do not have another copy of the data, drive ECC errors result
> in the 3ware RAID controller returning failed status to the
> associated host command.

Насколько я понимаю, контроллер говорит, что у диска посыпался сектор,
а dynamic repair -- это просто подсчет содержимого этого сектора из
остатка данных и контрольной суммы и переписывание его содержимого,
когда диск сделает bad sector reallocation.

> Вроде не критическая и можно как-то ее решить, но не знаю как.

Я бы, если систему можно на какое-то время положить в down, вытащил
диск и проверил бы состояние его SMART обычными утилитами типа
smartctl (но тесты бы не гонял во избежание дальнейшего осыпания
секторов).  Очень может быть, что у вас растет количество bad-секторов
и вопрос состоит в том, какова динамика роста и хватает ли еще у вас
дополнительных секторов, в которые делается remap плохих.  Если есть
запас таких дисков для замены и у вас действительно поврежден только
один диск, то я бы его заменил; хотя есть вероятность отказа второго
диска при rebuild, но вам этот диск, скорее всего, нужно будет всё
равно когда-то заменять -- если он начал "сыпаться", то будет
продолжать это делать -- так что если не сейчас, так потом.  Но у меня
нет хорошей статистики по RAID5, поскольку у нас везде RAID6
используется: диски летят нередко, а терять массивы не хочется.
-- 
Eygene Ryabinkin, National Research Centre "Kurchatov Institute"

Always code as if the guy who ends up maintaining your code will be
a violent psychopath who knows where you live.


More information about the RU-NGI mailing list