Передовые технологии хранения и восстановления данных в Storage Area Network (SAN)
Методы резервного копирования в сетях SAN
SAN — сети хранения данных
Стремительное развитие информационных технологий за последние несколько лет привело к взрывоподобному росту объемов данных в компьютерных сетях. Подсчитано, что потребность компаний в дополнительных ресурсах памяти увеличивается на 50-100% каждый год. Главным образом это обусловлено ростом популярности сети Интернет и появлением приложений, активно работающих с большими массивами данных: мультимедиа, хранилища и архивы данных, вычисления в реальном времени, распознавание и обработка образов в медицине, коллективная работа над проектами. Все большее число пользователей нуждаются в увеличении емкости носителей информации, а также в обеспечении быстрого, надежного и разделяемого доступа к своим данным зачастую из разных, территориально отделенных друг от друга мест.
Чтобы удовлетворить эти быстро растущие требования, IT-менеджеры многих фирм внедряют и успешно используют на своих предприятиях сети хранения данных SAN (Storage Area Network), построенные на базе технологии Fibre Channel.
Что же такое SAN? Можно сказать, что это дополнительная сеть, связывающая один или несколько серверов с одной или несколькими системами хранения данных. В качестве систем хранения могут использоваться RAID-массивы, ленточные и CD-ROM-библиотеки, а также JBOD (Just a Bunch of Disks) — простые массивы дисков без возможностей RAID. Пример архитектуры SAN показан на рис. 1.
Технология Fibre Channel, лежащая в основе построения SAN, была одобрена ANSI (American National Standards Institute) как стандарт в 1994 году. Эта технология устанавливает интерфейс передачи данных со скоростью 1 Гбит/с, который может использоваться как для передачи сетевых данных (по протоколам типа IP), так и для непосредственного обмена с устройствами ввода/вывода компьютера (по интерфейсу SCSI). Таким образом, он объединяет в себе функциональность высокопроизводительного интерфейса ввода/вывода и компьютерных сетей. Средой передачи в Fibre Channel могут быть медный кабель и оптоволокно, проложенные на расстояние до 10 км.
Сети хранения данных, построенные на основе Fibre Channel, обладают следующими основными характеристиками:
- передача данных по отдельной сети — таким образом разгружается локальная сеть предприятия;
- передача информации на скоростях до 100 Мбайт/с при конфигурации с одинарным кольцом и до 200 Мбайт/с с двойным кольцом;
- простой доступ удаленных рабочих станций и серверов к совместно используемым ресурсам памяти — как если бы они были напрямую подключены к ним;
- простота расширения сети. Посредством концентраторов и коммутаторов возможно виртуально неограниченное расширение;
- минимальные изменения в конфигурации сети при удалении и добавлении узлов;
- легкое конфигурирование сетей SAN для выполнения операций с полным резервированием;
- открытость. Различные компоненты технологии Fibre Channel можно купить у многих производителей.
Несмотря на все эти очевидные преимущества, до сих пор существовала одна проблема, тормозящая внедрение SAN, — отсутствие оптимально сбалансированной защиты данных. Действительно, традиционно серверы резервного копирования имели в сети свои собственные «эксклюзивные» ленточные устройства, которые не могли совместно использоваться в сети несколькими серверами. Но времена меняются. В следующей части статьи речь пойдет об эффективной организации резервного копирования и восстановления данных в SAN.
Методы резервного копирования в сетях SAN
Сети хранения данных SAN позволяют смягчить некоторые ограничения, присущие традиционным методам резервного копирования. Первая и самая главная проблема — в большинстве случаев ленточное устройство подключается к одному хосту, который должен напрямую управлять операциями резервного копирования и передавать данные для этого. Таким образом, информация, которую необходимо записать на ленту, должна быть передана этому хосту по локальной сети, что сильно ограничивает скорость резервирования и неэффективно расходует ресурсы сервера и ЛВС (рис. 2). С точки зрения сервера, выполняющего операции резервного копирования, неэффективность заключается в том, что он является промежуточной точкой на пути данных, которые много раз пересылаются через его системную память. В результате мы имеем следующие нежелательные моменты:
- Дополнительную нагрузку на сервер — увеличение использования его системных ресурсов: процессора, системной шины, памяти.
- Лишние маршруты передачи данных — неэффективное использование сети.
- Неполное использование устройств — устройство резервного копирования не может совместно использоваться несколькими серверами.
Теперь давайте более подробно рассмотрим методы организации резервного копирования с использованием технологии SAN, позволяющие устранить некоторые из вышеперечисленных проблем. Решение начального уровня позволяет нескольким серверам, подключенным к сети Fibre Channel, совместно использовать устройства резервного копирования. Программное обеспечение, отвечающее за резервирование информации, управляет доступом серверов к этим устройствам. Сервер в начале сессии резервирует под себя необходимое ленточное устройство, а по ее окончании освобождает устройство для использования его другими серверами. Этот метод называется резервным копированием без использования локальной сети (далее резервирование без ЛВС — LAN-Free backup), так как данные для копирования больше не передаются от сервера к серверу через ЛВС предприятия. Передача данных осуществляется по-прежнему через сервер резервного копирования, но сами данные передаются блоками через интерфейс Fibre Channel, а не посредством высокоуровневых протоколов в сети. Резервирование без ЛВС позволяет совместно использовать большие устройства хранения и значительно оптимизирует как использование ресурсов серверов, так и маршруты передачи данных.
Следующим по сложности организации и выполняемым функциям является метод резервирования без использования сервера (далее резервирование без сервера — Server-Free Backup). Он основан на схеме резервирования без ЛВС, но использует еще функции дисковой памяти, напрямую подключаемой к SAN. Чтобы дальнейшее было более понятным, введем пару новых терминов: маршрутизатор хранения и пересыльщик данных. Маршрутизатор хранения — это интеллектуальное устройство в рамках инфраструктуры SAN, которое обеспечивает преобразование протоколов и маршрутизацию команд, данных и состояния между запоминающими устройствами. Пересыльщик данных представляет собой маршрутизатор хранения либо другое устройство в SAN со способностью инициировать и контролировать перемещение данных в сети хранения либо самостоятельно, либо подчиняясь управляющей информации от других устройств сети. Для реализации метода резервирования без сервера маршрутизатору хранения SAN добавляются функции и возможности пересыльщика данных. Потоки данных и управления отделяются друг от друга так, что сервер распоряжается управляющей информацией, а маршрутизатор хранения осуществляет реальные перемещения данных между устройствами. Теперь данные не передаются через сервер и поэтому не копируются два раза: первый раз — в его системную память и второй раз — из нее. Соответственно, уменьшается нагрузка на центральный процессор, так как ему не нужно управлять этими действиями. Внедрение схемы резервирования без сервера затрудняется необходимостью внесения изменений и дополнений в интерфейсы файловой системы ОС и драйвера устройства. Реализация же резервирования без ЛВС не требует модификации существующих операционных систем.
Существующие решения
В настоящее время уже несколько фирм поставляют на рынок программное обеспечение, поддерживающее архитектуру резервирования без использования ЛВС. Пионером в этой области является компания Computer Associates (CA), которая в партнерстве с Compaq, Hewlett-Packard и ADIC еще в октябре прошлого года анонсировала первое в индустрии решение по резервному копированию на базе SAN. Ядром этого решения является система резервного копирования ARCserveIT for Windows NT с дополнительными опциями: Tape Library Option, используемой для управления большими библиотеками, и Enterprise Library Option, которая обеспечивает поддержку технологии SAN (рис. 3).
Это решение включает в себя следующие компоненты и понятия:
- Группа серверов предприятия — группа серверов ARCserveIT, которые могут совместно использовать несколько ленточных библиотек в SAN.
- Первичный сервер — сервер ARCserveIT, который инициализирует разделяемые устройства хранения, контролирует и отслеживает их состояние.
- Распределенные серверы — подключенные к SAN серверы, которые назначаются Первичному серверу, контролирующему их доступ к устройству резервного копирования.
- Разделяемая ленточная библиотека — устройство резервирования, используемое Группой серверов предприятия.
- Группа разделяемых устройств — одна или несколько ленточных библиотек, включенных в логическую группу, используемую ARCserveIT.
Как все это работает? Первичный сервер управляет потоком информации от распределенных серверов, чтобы предотвратить конфликты, если сразу два сервера из группы серверов предприятия попытаются обратиться к устройству или к ленте в одно и то же время. Когда работа по резервному копированию готова к запуску, первичный сервер проверяет доступность любого устройства из используемой группы разделяемых устройств. Затем он резервирует устройство и запускает работу. С этого момента первичный сервер оповещает все другие серверы из группы серверов предприятия, что в настоящий момент используемое устройство резервного копирования занято и не может использоваться каким-либо другим сервером.
Работа по резервированию данных выполняется локально на том сервере ARCserveIT, где она задана, и данные (как в архитектуре резервирования без ЛВС) передаются на разделяемую ленточную библиотеку через SAN. Всеми процессами можно управлять и отслеживать их состояние с первичного сервера. При этом каждый сервер ARCserveIT из группы серверов предприятия видит одни и те же устройства резервного копирования. Пример разделяемой ленточной библиотеки показан на рис. 4.
Подводя итоги, сформулируем еще раз основные доводы в пользу перехода на технологии Fibre Channel и SAN на предприятии:
- Fibre Channel и SAN широко признаны в мире. В том числе и в качестве промышленного стандарта.
- Для построения SAN доступны компоненты многих производителей.
- Fibre Channel поддерживает стандартные протоколы TCP/IP, SCSI, HIPPI и ATM.
- Fiber Channel отделяет трафик данных от сетевого в ЛВС, повышая эффективность обоих.
- В Fiber Channel и концепцию SAN заложен большой потенциал для будущего развития.
Материал предоставлен компанией «Интерпроком ЛАН». Тел.: (095) 129-8301, 129-8009 www.ipclan.rosmail.com
КомпьютерПресс 8'1999