Восстановление RAID массивов своими руками
Внимание! Если информация на RAID-массиве, которая стала недоступна, действительно очень важная, то лучше всего сразу обращаться к специалистам. Любые самостоятельные эксперименты с составляющими массива могут привести к безвозвратной потере данных, которые возможно уже никто не восстановит.
В статье мы рассматриваем самые простейшие случаи восстановления данных с RAID массивов. Например, к ним относятся: выход из строя контроллера, переход одного или более дисков в состояние FAIL, при отсутствии аппаратных проблем с ними, незначительные повреждения файловой системы или какие-то еще некритичные неисправности. Если с помощью этих методов не удается получить желаемый результат, то Ваш случай не является простым. К сожалению, в рамках этой статьи невозможно рассмотреть все сложнее случаи, уровни RAID. Более того на данный момент их существует заметно больше 10 и еще множество различных модификаций и способов организации доступа, а это уже невозможно описать в одной статье. Работа по восстановлению данных с таких сложных структур часто требует глубоких знаний файловых систем и аппаратных особенностей оборудования, без этих знаний мало что возможно сделать.
Причины выхода RAID массивов из строя
Наиболее распространённой причиной выхода из строя дисковых массивов является халатность системных администраторов, рассчитывающих на то, что «в одну воронку бомба дважды не падает». Во время работы, например RAID 5, выходит из строя один из дисков. Массив продолжает функционировать, но уже с заметным уменьшением скорости. Системный администратор, заметив сбой в работе накопителя, не очень спешит предпринимать активные действия, т.к. рассчитывает на то, что массив в таком виде еще сможет поработать некоторое время. Это порой оказывается заблуждением.
Если у Вас выходит из строя один из дисков, лучше всего немедленно произвести резервное копирование особо важных данных и потом, заменив один из накопителей, произвести ребилд массива.
Почему пришлось отметить то, что необходимо предварительно произвести бэкап? Потому что при попытке ребилда массива, иногда случается такое, что процесс «зависает». Как правило, это происходит, если в процессе чтения\записи на одном из дисков обнаруживается бэд-блок, и контроллер не может вычитать информацию из сектора. В результате, после длительного и бесполезного ожидания, сервер перегружают. После чего выясняется, что массив полностью «развалился». Зависание в таких случаях, вероятнее всего, связано с некорректной обработкой исключительной ситуации. Как правило, описанное явление более характерно для дешевых моделей контроллеров, но встречается также и при использовании дорогого «железа».
Ещё одной распространённой причиной отказа массивов, является одновременный переход нескольких дисков в режим off-line. Как показала практика, чаще всего это происходит из-за проблем со SMART, или накопления бэд-блоков. Пока их количество не превысит определённого значения, диск работает корректно, но в один прекрасный момент массив перестает запускаться. И вроде бы все хорошо, и диск, судя по звуку, нормально стартует, и контроллером правильно определяется, но вот только непонятно, почему статус у диска off-line, массив не стартует и данные не отдает. Все из-за того, что контроллер не может считать необходимые данные с диска, либо, диагностируя SMART, определяет диск как «мертвый».
Можно привести ещё множество примеров сбоев в работе массивов, но что делать, если таки это свершилось? Информация потеряна, её необходимо восстановить.
Принципы восстановления информации и уровни RAID
Неплохой популярностью сегодня пользуются уровни 0, 1, 10, 5, 6, 50 и JBOD.
Принципы работы массивов
RAID 0 – чередующаяся запись (страйп). Такой массив состоит из двух и более дисков. Запись информации в данном случае производится на все накопители массива по блокам фиксированного размера. Файл размером в один блок распределяется равномерно по дискам. Главным недостатком такого массива является то, что при выходе из строя одного из дисков, без его использования невозможно произвести восстановление данных в полном объеме. В таких случаях, для полноценного восстановления RAID необходимо сначала снять информацию с неисправного накопителя. При выходе из строя всех дисков для восстановления приходится пользоваться программными методами.
RAID 1 — технология зеркалирования. Такой массив строится из двух копирующих друг друга дисков, на которые записывается одна и та же информация. В случае применения такой комбинации данные сохраняются, даже если дин из накопителей выходит из строя. Когда RAID контроллер выходит из строя и массив не определяется, необходимо один из дисков подключить к компьютеру без использования контроллера, т. е. напрямую. Таким образом, можно получить доступ к данным, не используя программное обеспечение.
RAID 10 представляет собой объединенные 0 и 1 уровни и состоит, как минимум, из 4-х дисков. Достоинство такого построения в том, что при неисправности одного из страйпов копирующая его пара остается работоспособной.
При сбое в работе такого массива могут возникнуть проблемы как с дисками, так и с контроллером. Если из строя вышел котроллер, то определяется пара дисков, из которых состоит страйп и из нее считываются данные по аналогу RAID 0.
Основное достоинство массива RAID 5 – распределение контрольных блоков четности и блоков информации по всем присутствующим в массиве накопителям, количество которых составляет не менее трех. В случае неисправности одного из дисков массив продолжает работать, благодаря использованию блоков контроля четности, необходимых для вычисления недостающей информации при выходе из строя одного из накопителей.
Не рекомендуемые действия
Во избежание потери данных не следует надеяться на хорошую работоспособность старых дисков и использовать их для создания нового массива. Конечно, это может дать результат, но при другом исходе контроллер может выполнить действия, которые повлекут за собой необратимую потерю данных.
От запуска инициализации также лучше отказаться, потому как могут быть не самые лучшие последствии, а в случае необходимости разумнее будет прибегнуть к использованию только quick init. Запуск чекдиска и подобных служебных программ тоже может нанести вред массиву. И главное – помнить, что при потере информации на RAID любая запись данных на диски будет только в ущерб. И потом, лучше отказаться от каких-либо предпринимаемых действий если нет полной уверенности, что они не приведут к утрате информации.
Как восстановить RAID массив простыми методами: несколько способов
RAID и его программное восстановление (использование массивов уровней 0 и 5)
Очень часто данные с RAID восстанавливаются с помощью программной сборки образа массива. То есть программные средства блока разных дисков располагаются в необходимой последовательности. Расположение блоков массивов зависит от того, как располагаются на каналах диски, а также от алгоритма работы контроллера.
Перед началом работы обязательно создайте клоны имеющихся дисков. Это позволит избежать последствий от неверных действий. Копии делаются как на другие накопители, так и в качестве файлов-образов.
Специалисты рекомендуют использовать копии в работе, т.к. если нестабильные или нечитаемые сектора располагаются на исходных носителях, работа с подобными дисками значительно ухудшит их состояние или же станет причиной их полного отказа.
При сборке массива следует знать его изначальные параметры, в частности последовательность дисков и размер блока. Зная эти данные, можно считать, что вы полпути к успеху. Если же вы их не знаете, то вам предварительно придется подобрать их.
Радует, что имеются автоматические средства для восстановления RAID и поиска конфигурации. К наиболее известным можно отнести программу RAID Reconstructor. Задавая в ней уровень массива, вы сможете найти изначальную последовательность дисков и размер блока, что позволит вывести алгоритм действия по записи информации на диски.
Главное окно запущенной программы выглядит следующим образом:
Работу следует начинать с выбора массива, который осуществляется в списке «RAID TYPE».
После того, как задан тип массива, нужно в окне «#drives» указать число дисков. Выполнив это действие, вы увидите, как ниже белым подсветятся поля, количество которых будет такое же, как и количество дисков, указанных вами. Для каждого поля выберем диски, на которых был массив. После этого действия перейдем к «Block size», где следует указать параметр размер блока. Если же вы его не знаете, то оставляйте данный пункт без изменения и жмите кнопки «Open drives» и «Analyze».
Видим окно с возможностью выбора:
- Автоподбор параметров.
- Указать точные параметры.
- Пропустить данный шаг.
Нажимаем кнопку «Next». Далее появится окно. Если вы работаете с RAID 0, оно будет иметь следующий вид:
Окно RAID 5:
В этом окне следует задавать параметры последовательности дисков, размера поиска и Parity Rotations (в случае работы с RAID 5).
Если вам известно, на каком из контроллеров создавался массив, размер блока и алгоритм записи информации на диски, то все ненужные параметры нужно исключить в окнах «Parity rotations» и «Block size». Когда параметры неизвестны, оставьте все так, как есть и нажмите клавишу «Next».
После просчета комбинаций программа подберет наиболее удобный вариант, написав сообщение по типу «Recommendation: choose entry 1». Но это не повод для беспокойства, так как правильной алгоритм утилитой найден.
Если этого не произошло, массив разрушен достаточно серьезно, поэтому количество секторов в соответствующем поле для пробы следует увеличить, а анализ повторить. В случае более серьезных разрушений может помочь только специалист.
Когда алгоритм найден, возможно несколько вариантов развития:
- Перепись в файл образ массива.
- Его запись на массив или диск.
- Создание файла виртуального образа, продолжение его разбора в DiscEditor, Get Data Back, Captain Nemo или R-Studio.
Если массив был собран правильно, а его файловые системы без каких-либо логических повреждений, доступ к информации можно получить стандартными способами. Так, если образ был скопирован на хард-диск, можно подключить его к ПК, после чего сделать перезагрузку ОС.
Способ, изложенный выше, помогает восстановить RAID в простых случаях. Сложные случаи выходят за рамки статьи, так как они подразумевают наличие специальных данных.
К примеру, вы не сможете по какой-то причине восстановить RAID, так как описанные выше методы не помогут (например, контроллер будет записывать конфигурационную информацию в начало диска). Если количество секторов, которые заняты служебными данными, не указаны программе, в результате можно получить неверный итог автоматического подбора массива конфигурации.
Метод аппаратного восстановления RAID массивов
Данный метод является достаточно своеобразным, потому как подразумевает знание алгоритма работы контроллера и наличие резервных копий всех, без исключения, накопителей. В противном случае, существует большая доля вероятности искажения данных дисков и полной потери информации.
Используя метод аппаратной сборки, производится пересоздание массива с первоначальной конфигурацией. Однако, следует помнить о том, что во время данного процесса нельзя запускать ребилд, т. к. можно потерять все данные без возможности их восстановления. Даже при помощи специалистов. Существуют модели контроллеров, функциональный набор которых подразумевает выполнение инициализации сразу после создания массивов, что также влечет за собой потерю данных.
В случае полной исправности дисков массива может случиться так, что без надобности проведения дополнительных операций можно получить доступ к информации. Если же обнаружены частичные повреждения файловой системы, то придется прибегнуть к использованию таких программ, как UFS Explorer, GetDataBack, R-Studio или других подобных.
Прочитав статью и перед тем как предпринимать попытки восстановления RAID массива, еще раз хорошо подумайте, стоит ли рисковать важной информацией? Любое неосторожное действие может привести к полной потере всех данных и возможно после этого помочь уже не сможет никто.