RAID-массив в персональном компьютере

Владимир Леонов

Уровни RAID

   RAID 0

   RAID 1

   RAID 5

   Intel Matrix RAID

 

Большинство современных материнских плат поддерживают технологию RAID. На некоторых из них RAID-массивы уровней 0 и 1 образуются средствами южного моста чипсета, а на других интегрируется дополнительный RAID-контроллер (например, Silicon Image Sil3114), позволяющий, кроме перечисленных выше, построить RAID-массивы уровней 0+1 и 5. В этой статье мы попробуем разобраться, что такое RAID-массив и что он может дать пользователю персонального компьютера.

В современной компьютерной индустрии в качестве устройств хранения данных самое широкое распространение получили жесткие диски, поскольку, несмотря на все свои недостатки, они обладают наилучшими характеристиками для соответствующего типа устройств при доступной цене. Однако, несмотря на все усилия производителей, из-за конструктивных особенностей жестких дисков их производительность значительно отстает от производительности процессорной и других подсистем компьютера.

Невозможность значительного увеличения производительности жестких дисков заставляет искать другие пути повышения производительности системы хранения данных. Одним из таких путей является параллельная обработка данных. Если разделить блок данных на несколько частей и расположить на N дисках некоторого массива, обеспечив возможность одновременной обработки, то этот блок можно будет считать/записать в N раз быстрее (без учета времени формирования блока). К сожалению, при увеличении количества дисков в массиве его надежность уменьшается и возникает необходимость повышения отказоустойчивости.

Несмотря на то что системы хранения данных, основанные на магнитных дисках, производятся уже более 40 лет, к разработке отказоустойчивых систем приступили совсем недавно — в 1987 году американские исследователи Паттерсон, Гибсон и Катц из Калифорнийского университета Беркли в своей статье «A Case for Redundant Arrays of Inexpensive Discs, RAID» (“Избыточный массив недорогих дисков”) описали, каким образом можно объединить несколько дешевых жестких дисков в одно логическое устройство так, чтобы в результате повышались емкость и быстродействие системы, а отказ отдельных дисков не приводил к отказу всей системы. Через некоторое время название технологии немного изменили, слово Inexpensive (недорогие) поменяли на Independent (независимые), что больше соответствовало действительности (все жесткие диски в то время были довольно дорогими устройствами) и сути технологии.

Итак, RAID — это избыточный массив независимых дисков (Redundant Arrays of Independent Discs), на который возлагается задача обеспечения отказоустойчивости и повышения производительности обработки данных. Повышение производительности обработки данных обеспечивается одновременной работой нескольких дисков, и в этом смысле чем больше дисков в массиве (до определенного предела), тем лучше. Одновременную работу дисков в массиве можно организовать с использованием либо параллельного, либо независимого доступа. При параллельном доступе дисковое пространство разбивается на блоки (полоски) для записи данных.

Информация, подлежащая записи на диск, разбивается на такие же блоки. При записи отдельные блоки одновременно записываются на различные диски, что и приводит к увеличению производительности. Чтение также выполняется отдельными блоками одновременно с нескольких дисков, при этом производительность растет пропорционально количеству дисков в массиве.

Следует отметить, что модель с параллельным доступом реализуется лишь при условии, что размер запроса на обработку данных больше размера блока данных на диске. В противном случае параллельная обработка нескольких блоков становится просто невозможной.

Если размер записываемых данных меньше размера блока, то можно реализовать принципиально иную модель доступа — независимый доступ. Подобная модель может применяться и в том случае, когда размер записываемых данных больше размера одного блока. При независимом доступе все данные отдельного запроса записываются на отдельный диск, то есть ситуация идентична работе с одним диском. Преимущество модели с параллельным доступом заключается в том, что при одновременном поступлении нескольких запросов на запись (чтение) все они будут выполняться независимо, на отдельных дисках.

Отказоустойчивость массива достигается за счет избыточности информации, сохраняемой на жестких дисках, то есть часть емкости дискового пространства отводится для служебных целей, становясь недоступной для пользователя. Избыточная информация может либо размещаться на специально выделенном диске, либо распределяться между всеми дисками массива. Способов формирования избыточной информации довольно много. Простейший из них — полное дублирование (или зеркалирование) — имеет 100-процентную избыточность. Для снижения избыточности (увеличения объема полезного дискового пространства) используются различные математические методы типа вычисления четности или применения кодов с коррекцией ошибок.

Сначала из-за высокой стоимости технология использовалась только в специализированных системах хранения данных и в дорогостоящих серверах масштаба предприятия. Высокая цена определялась как стоимостью контроллеров, так применением дорогих жестких дисков с SCSI-интерфейсом. По мере развития технологии и снижения стоимости всех ее компонентов RAID-массивы стали своеобразным стандартом де-факто даже для серверов начального уровня, а с появлением IDE RAID-контроллеров сфера применения RAID-массивов расширилась еще больше. RAID-массивы с использованием дешевых IDE-дисков появились на серверах начального уровня, высокопроизводительных рабочих станциях, а затем и на персональных компьютерах.

Сейчас большинство современных материнских плат для ПК снабжены возможностями построения RAID-массивов либо средствами южного моста чипсета, либо при помощи интегрированного на плате дополнительного RAID-контроллера.

В соответствии с различными типами доступа и способами формирования избыточной информации существуют и различные типы RAID-массивов, которые принято характеризовать уровнями RAID.

Уровни RAID

В настоящее время существует несколько RAID-уровней, которые можно считать стандартизованными, — это RAID 0, RAID 1, RAID 2, RAID 3, RAID 4, RAID 5 и RAID 6. Применяются также различные комбинации RAID-уровней, что позволяет объединить их достоинства. Обычно это комбинация какого-либо отказоустойчивого уровня и нулевого уровня, применяемого для повышения производительности (RAID 10, RAID 30, RAID 50).

Большинство уровней применяются в системах хранения данных и в серверах, но пока недоступны для пользователей персональных компьютеров. На персональных компьютерах сначала использовались RAID-массивы уровней RAID 0 и RAID 1, затем RAID 0+1, и, наконец, появилась возможность построения RAID-массива уровня RAID 5 (например, на интегрированном RAID-контроллере Silicon Image Sil3114). А недавно компания Intel внедрила технологию Matrix RAID, которая позволяет создать на двух жестких дисках одновременно RAID-массивы двух уровней — RAID 0 и RAID 1, выделив для каждого из них часть дискового пространства. Такая возможность предусмотрена у многих RAID-контроллеров, используемых в серверах, но на персональных компьютерах она реализована впервые.

Напомним, что имеющаяся у многих RAID-контроллеров функция JBOD (Just a Bench Of Disks) не предназначена для создания массивов, а обеспечивает возможность подключения к RAID-контроллеру отдельных дисков.

Рассмотрим более подробно способы организации дискового массива в современных персональных компьютерах.

RAID 0

Представляет собой дисковый массив, в котором данные разбиваются на блоки (stripe) и каждый блок записывается (или же считывается) на отдельный диск. В результате обеспечивается возможность либо ускоренной обработки файлов большого размера, либо одновременного выполнения нескольких операций ввода-вывода небольших блоков информации (рис. 1).

 

Рис. 1. RAID-массив уровня 0

Рис. 1. RAID-массив уровня 0

RAID 0 не является избыточным массивом, поэтому не обеспечивает надежности хранения данных — отказ одного диска влечет за собой потерю всех данных массива.

Тем не менее данный уровень находит широкое применение, что объясняется простотой реализации и максимальной эффективностью использования дискового пространства, поскольку не требуется места для хранения контрольных сумм, и, следовательно, низкой стоимостью на единицу объема.

RAID 0 применяется в тех случаях, когда необходимо обеспечить высокую производительность дисковой подсистемы, — например для размещения рабочих файлов при обработке изображений в Adobe Photoshop, обработке видео в Adobe Premiere, создании CD- или DVD-образов и при решении других подобных задач.

RAID 1

RAID 1 — это массив дисков со 100-процентной избыточностью, обладающий очень высоким уровнем надежности хранения данных. Запись выполняется сразу на два диска, при этом данные полностью дублируются (зеркалируются) и два диска содержат одинаковую информацию (рис. 2), что определяет основные недостатки массива — высокую стоимость хранения и невысокую скорость записи данных, равную скорости записи на одиночный диск. При выходе из строя одного из дисков его функции выполняет другой; восстановление массива выполняется простым копированием.

 

Рис. 2. RAID-массив уровня 1

Рис. 2. RAID-массив уровня 1

К достоинствам массива можно отнести простоту реализации и возможность увеличения скорости чтения информации, поскольку эта операция может выполняться одновременно с двух дисков (так могут работать не все RAID-контроллеры).

Такая схема хранения информации используется в основном в тех случаях, когда цена безопасности данных значительно превышает стоимость реализации системы хранения. В домашних условиях RAID-массив уровня 1 можно применить для хранения ценных фотографий, документов и финансовых записей.

RAID 5

RAID 5 — это отказоустойчивый дисковый массив, данные в котором восстанавливаются при отказе одного из жестких дисков. Перед записью данные разбиваются на блоки и для блоков данных одного уровня рассчитывается контрольная сумма. Блоки данных и контрольные суммы циклически записываются на все диски массива, следовательно, отсутствует выделенный диск для хранения информации о контрольных суммах (рис. 3). При чтении четность блоков проверяется.

 

Рис. 3. RAID-массив уровня 5

Рис. 3. RAID-массив уровня 5

RAID 5 может быть построен на трех и более жестких дисках. С увеличением количества жестких дисков в массиве его избыточность уменьшается (1/2 при трех дисках, 1/3 — при четырех, 1/4 — при пяти и т.д.). Общая емкость дисковой подсистемы, доступной для записи, становится меньше ровно на один диск, при этом все диски массива должны быть одного размера. Например, если четыре диска имеют размер 100 Гбайт, то доступный для записи размер массива составляет 300 Гбайт, так как 100 Гбайт будет занято контрольной информацией. При создании и восстановлении массива в случае отказа жесткого диска выполняется большое количество вычислений, требующих наличия специализированного процессора, поэтому применение RAID 5 до недавнего времени ограничивалось только серверами.

RAID 5 имеет архитектуру независимого доступа, что обеспечивает возможность одновременного выполнения нескольких операций считывания или записи. Прирост производительности обеспечивается как при одновременной обработке нескольких коротких запросов, так и при обработке больших блоков данных. При обработке единичных запросов чтения/записи данных малого объема производительность невысокая.

RAID 5 — наиболее универсальный уровень RAID-массива. Он успешно применяется на серверах различного назначения — сервер приложений, файловый сервер, почтовый сервер и др.

Если вы планируете использование дисковой подсистемы большой емкости, то стоит подумать о применении RAID 5, ведь накладные расходы 25% (при четырех дисках) — не слишком высокая плата за гарантию сохранности данных.

Intel Matrix RAID

Как бы ни снижались цены на комплектующие, все равно применение RAID-массивов будет связано с дополнительными затратами, которые по плечу не каждому пользователю. Технология Intel Matrix RAID делает использование RAID-массивов более доступным. С ее помощью всего на двух жестких дисках можно построить два RAID-массива, образующих два логических диска, получив при этом и высокую производительность, свойственную RAID 0, и высокую надежность хранения данных, характерную для RAID 1 (рис. 4).

 

Рис. 4. Intel Matrix RAID

RAID-массивы занимают на дисках выделенное для них пространство и работают независимо. Соотношение объемов, занимаемых массивами на жестких дисках, можно выбрать в соответствии с потребностями пользователя. Данные, размещенные на разделе RAID 1, сохраняются при отказе одного жесткого диска.

Технология Intel Matrix RAID работает только на чипсетах Intel последних моделей. Для ее работы необходимо, чтобы на материнской плате был установлен южный мост 82801ER (ICH5R) или 82801FR (ICH6R). Технология работает только под управлением операционных систем Microsoft Windows 2000, Microsoft Windows XP Home Edition и Microsoft Windows XP Professional, а кроме того, обязательно нужно установить Intel Application Accelerator RAID Edition версии 4.0 или выше.

КомпьютерПресс 6'2005


Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует