RAID (Redundant Array of Independent Disks, избыточный массив независимых дисков) - это технология хранения одних и тех же информационных блоков на нескольких HDD или SSD-дисках, объединяемых в общую логическую структуру.
Массивы RAID задействуются в серверах или системах хранения данных, чтобы сделать их более отказоустойчивыми и производительными, помогают расширять общее пространство памяти, стабилизировать дисковое пространство и защищать информацию при утрате работоспособности одним из носителей в структуре массива.
Типы RAID и степени их надежности
В массивах RAID задействуются диски, работающие в различных режимах и имеющие широкий функционал. Структура массива во многом определяет скорость и бесперебойность работы сервера и сохранность размещенных в нем данных, и в зависимости от этого RAID-массивы делятся на типы (или уровни):
- RAID 0 (Stripe, или режим чередования). Массивы этого уровня используются для значительного повышения производительности работы дисковой подсистемы. Массив работает по схеме разбивки всех данных на блоки и записи каждого блока на индивидуальный носитель. Данный массив применяется на серверах, передающих значительные объемы информации на высокой скорости;
- RAID 1 (Mirror, режим зеркалирования) - этот массив обладает высоким уровнем надежности, поскольку все данные в нем записываются на каждый логический диск, состоящий из пары физических. Если один из дисков выйдет из строя, другой сможет стать его заменой, дублируя его функционал. Данный рейд ускоряет чтение информации, потому что данные могут считываться с обоих дисков одновременно;
- RAID 5. Эти массивы состоят из трех и более носителей (один из которых является диском четности), что дает RAID 5 возможность выделения значительных логических блоков под размещение информации, а также обеспечивает условия для параллельной записи. Производительность таких массивов наращивают, добавляя дополнительные диски;
- в массивы RAID 6 встроены два диска данных и два диска контроля четности, что существенно повышает производительность этих рейдов и поддерживает их работоспособность после одновременного выхода из строя любых двух дисков. RAID 6 устанавливаются в серверах с повышенными требованиями к надежности;
- RAID 10 (1+0) - микс RAID-массивов 1 и 0, который характеризуется высокими производительностью и отказоустойчивостью. В таких массивах содержится обязательно четное количество дисков (минимально - 4), что делает их самым надежным вариантом архивирования информации;
- RAID 50 - микс RAID массивов 5 и 0, построенный по схеме создания RAID 5, но не из самостоятельных жестких дисков, а из массивов RAID 0. Это решение отличается хорошей отказоустойчивостью, высокой скоростью передачи данных и обработки запросов.
Также существуют Hybrid RAID, сочетающие в себе RAID-массивы обычных уровней и дополненные специальным ПО и SSD-дисками (в качестве кэша для чтения данных). Этот тип массивов устанавливается в основном в файловые серверы и виртуальные вычислительные машины.
На изображении отражена пирамида RAID-массивов, которая иллюстрирует их преимущества.
Что нужно для создания массива RAID
При создании структуры дисковых массивов RAID могут задействоваться и жесткие диски, и твердотельные накопители (но не одновременно). При этом рейды целесообразнее создавать из HDD, потому что массивы, «смонтированные» из SSD, имеют сложности в обновлении прошивки, затрудненное отслеживание работоспособности, а накопители в таких системах выходят из строя одновременно.
Объединение дисков в RAID-массив проводится при помощи контроллера, который может быть физическим устройством (адаптером) или утилитой ОС. В зависимости от разновидности контроллера массивы RAID делятся на:
- аппаратные - формируются при установке отдельных контроллеров с индивидуальным процессором и кэшируемой памятью. Такие массивы выполняют все дисковые операции. Аппаратные RAID считаются наиболее производительными и надежными в эксплуатации массивами;
- программные - данный вид RAID-массивов создается при помощи средств ОС, при этом всей работой с данными «занимается» центральный процессор. По своей стоимости RAID на основе утилит ОС дешевле аппаратных, но их производительность очень мала.
Также существуют интегрированные аппаратные Fake-RAID - микрочипы, «привязанные» к материнским платам. Эти микрочипы работают в «связке» с центральным процессором и выполняют некоторые элементы функционала аппаратного RAID-контроллера. Fake-RAID-массивы имеют удовлетворительно высокую скорость работы, но при этом очень ненадежны.
Самым применяемой технологией формирования RAID-массивов считается аппаратная, но она же является и наиболее затратной.
Методика расчетов необходимого количества дисков
При расчете количества дисков, требующихся для формирования RAID-массивов, следует учитывать:
- технологию диска. Так, SATA поддерживают меньшие массивы, чем SAS /FC;
- ограничения RAID-контроллера. Если контроллер действует по SCSI, и каждому из видимых дисков присваивается LUN, правилу 7/14 дается значение true, а при поддержке контроллера, основанного на FibreChannel, в массиве может работать свыше 120 видимых дисков;
- процессор RAID-контроллера. CPU на RAID-контроллере станет ограничителем скорости записи данных независимо от типа контроля четности;
- ширину шины. SCSI и FibreChannel имеют свои лимиты поддержки контроллера при размещении элементов RAID на разных каналах в повышении параллельности и производительности.
Для расчетов эффективности дискового пространства различных уровней RAID используются специальные калькуляторы, исходными данными в которых являются уровень массива, объем и параметры диска, количество дисков в RAID-группе.