Дисковые массивы и уровни RAID.

Так же как и для оперативной памяти для дисковой памяти важнейшими характеристиками являются скорость обмена данными и их сохранность. Ввиду большого объема дисковой памяти потеря хранящихся в ней данных из-за сбоя или отказа оборудования является более серьезной проблемой, чем потеря информации оперативной памяти, поэтому к дисковой памяти предъявляются более высокие требования по отказоустойчивости. Одним из способов повышения отказоустойчивости дисковой памяти является организация избыточного дискового массива, позволяющего восстановить исходные данные при сбоях и отказах. Одна из технологий повышения отказоустойчивости получила название RAID (избыточный массив недорогих дисков). Технология RAID базируется на трех основных методах записи и защиты информации:

1. Распределение последовательности сегментов данных по дискам с определенной циклической очередностью.

2. Зеркальное отображение дисков

3. Вычисление контрольных сумм

Поочередное размещение позволяет создавать тома памяти большого объема и ускорять выполнение операций записи и чтения данных так как предполагает запись первого сегмента данных на первый диск, второго на второй и т.д. В этом случает производительность массива повышается, поскольку процессор или контроллер ввода/вывода начинает записывать очередной сегмент данных на следующий диск до того, как закончил запись предыдущего сегмента.

Зеркальное отображение накопителей и вычисление контрольных сумм приводит к появлению избыточной информации, обеспечивающей восстановление утерянных из-за сбоя или отказа оборудования данных.

Различные схемы реализации дисковых массивов получили названия – уровней RAID.

1. RAID система уровня 0 (ноль)

Данная система не является отказоустойчивой и довольно часто такую организацию дисковой памяти вообще не относят к RAID массивам. В системах RAID-0 осуществляет только поочередное размещение сегментов данных на дисках, они применяются когда повышенная надежность хранения данных не имеет очень большого значения, поскольку выход из строя одного диска приводит к потере всей хранящейся в массиве информации. Такая организация дисковой памяти используется например для задач редактирования изображений и разного рода приложений, требующих большой емкости массива и высокой скорости выполнения операций ввода/вывода.

2. Отказоустойчивость системы дисковой памяти реализуется по технологии RAID-1, которая представляет собой зеркальное отображение дисков, т.е. данные записываются на 2 или большее число дисков одновременно при этом образуется более одной копии данных, а уровень информационной избыточности при записи на 2 диска уже составляет 100%. При сбое или выходе из строя одного диска данные считываются с его зеркального отображения. Недостатком RAID-1 является высокая избыточность оборудования и возможные проблемы с заменой вышедшего из строя диска, если функциональность RAID -1 реализуется программно, а не с помощью специального контроллера.

3. Технология RAID-2, коммерческие реализации которой практически отсутствует, предусмотрены защита данных с помощью корректирующих кодов Хэймонда. Записываемые данные распределяются по нескольким дискам, а контрольные разряды записываются на один или несколько, предназначенных специально для этого дисков. Недостатком RAID-2 является большая доля таких дисков в массиве, что делает реализацию данной архитектуры довольно дорогостоящей. Кроме того контроллеры современных дисковых устройств часто уже имеют встроенные схемы коррекции ошибок.

4. RAID-3. данные распределяются по информационным дискам и для совокупности сегментов данных, расположенных в одних и тех же секторах разных физических дисках, определяется контрольная сумма или код честности, которые записываются на отдельный диск. Массивы RAID-3 обеспечивают высокую скорость передачи данных при выполнении операций чтения/записи и по сравнению с массивами RAID-2 им требуется меньшее количество дисков для хранения контрольных сумм. Недостатком этого уровня является его достаточная сложность и возможность реализации только аппаратным способом.

5. Массив RAID-4 повышает производительность передачи небольших объемов данных за счет параллелизма, давая возможность выполнять более одного обращения по вводу-выводу к группе в единицу времени. Логические блоки информации в RAID-4 не распределяются между отдельными дисками, а каждый индивидуальный блок попадает на отдельный диск. Это дает возможность выполнять несколько разных запросов на чтение одновременно.

6. В массивах RAID-5 как и в RAID-4 на дисках поочередно размещаются большие блоки данных, но в отличие от системы предыдущего уровня, контрольная информация распределяется по всем дискам массива. Это небольшое изменение оказывает огромное влияние на производительность записи небольших массивов информации, если операции записи могут быть спланированы так, чтобы обращаться за данными и соответствующими им блоками четности к разным дискам. Появляется возможность параллельного выполнения n/2 записей, где n – число дисков в группе. Данная организация имеет одинаково высокую производительность при записи и при считывании как небольших, так и больших объемов информации.

Следующие уровни RAID разработаны с целью повышения надежности хранения данных. Их реализация обходится довольно дорого, основывается, как правило на предыдущих уровнях RAID или является фирменным решением компании разработчика.