Как быть если сломался RAID массив. Первые шаги

IT

RAIDВсе причины поломок рейдов разделяются на два типа – программные (простые) и аппаратные (сложные). Стоит отметить, что, если программные неполадки всегда устраняются в кратчайшие сроки, и вся информация зачастую в полном объеме всегда возвращается к пользователю, то аппаратные могут быть самыми различными, и шансы на успех восстановления данных в таком случае могут быть самыми разными.

Простые ошибки

 

В список наиболее распространенных незначительных повреждений следует отнести:

  • Поломка контроллера;
  • Переход нескольких дисков в состояние FAIL’а;
  • Сбои в файловой системе.

Стоит отметить, что рейд массивы представляют собой чрезвычайно сложные устройства, и далеко не всегда те неполадки, которые на первый взгляд кажутся незначительными, могут оказаться такими в конечном итоге. Лучше всего осуществить предварительную диагностику устройства, и только потом уже начинать восстанавливать HDD Fujitsu или же каких-либо других производителей, включенных в состав массива.

Почему может сломаться RAID?

 

Среди всех ситуаций поломок таких систем чаще всего можно встретить халатность системных администраторов, которые запускают критичные ситуации, и оставляют их такими, какими они и есть. К примеру, в случае отключения винчестера в составе пятого уровня, оборудование не прекращает работу, хоть и делает ее гораздо более медленной. Так как массив функционирует, обслуживание ему никакое не предоставляется, и когда уже из строя выходит второй HDD, система полностью разрушается.

В любом уровне (за исключением нулевого, где это не принесет результата) необходимо при поломке даже одного накопителя моментально осуществлять резервное копирование и, заменяя один из носителей, осуществлять ребилд.

Предварительное копирование делается для того, чтобы избежать полной потери данных в случае каких-либо сбоев в процессе ребилда. Таким образом, при возникновении bad-блоков процесс может попросту зависнуть и, соответственно, потребовать перезагрузки, после которой разрушится уже все.

Если же несколько дисков одновременно перешли в офф-лайн режим, то в таком случае стоит обратить внимание на состояние SMART, а так же проверить всю систему на наличие нечитаемых секторов. Таким образом, пока их количество последних еще не стало слишком большим, оборудование будет работать достаточно исправно, но буквально в один момент все может полностью «развалиться», и процесс восстановления жестких дисков, входящих в состав массива, станет гораздо труднее.

Оцените статью
ЗнайКак.ру
Добавить комментарий