oldi

SAN — cети хранения данных

Максим Сергиевский, Юрий Шатохин

Возможности сетей хранения данных

Реализация сетей хранения данных

Подход IBM к разработке SAN

Versatile Storage Server

Network Storage Manager

Magstar Virtual Tape Server

Базовые программные средства

Заключение



Уже несколько лет аналитики говорят о том, что современное общество прошло индустриальную эпоху и вступило в информационную. Именно поэтому способность использовать информацию наиболее эффективным образом становится одной из самых важных задач. Для достижения успеха в информационную эпоху любая организация должна сделать информацию легко распространяемой и доступной. Поэтому разработка эффективных способов для подключения каждого работника к информационному потоку организации стала стратегической задачей. Можно утверждать, что организациям необходима информационная система, обеспечивающая свободный и чрезвычайно быстрый обмен информацией.

Вероятно, наиболее сложной проблемой в разработке подобных систем является огромный рост количества информации. Еще до появления систем электронной коммерции было подсчитано, что многие корпоративные приложения каждый год удваивают объем обрабатываемых данных. С приходом электронного бизнеса рост объемов данных стал еще более значительным.

Информация является валютой электронного бизнеса. Перед тем как начать получать прибыль от информации, большинство организаций должно решить проблему хранения и управления громадными массивами данных. Кроме того, глобализация электронного бизнеса требует доступа к информации 24 часа в сутки 365 дней в году. Это означает не только использование резервного оборудования для обеспечения доступа к критически важной информации даже в случае аппаратного или программного сбоя в работе, но и сокращение времени на осуществление операций резервного копирования, обновления и поддержания целостности системы.

Также существуют проблемы управления информацией в гетерогенных средах. Персонал должен быть подготовлен для работы с несколькими операционными средами, а слабая интеграция между продуктами различных поставщиков потребует специальных средств управления и администрирования.

Перечислим требования, которым должны удовлетворять современные корпоративные вычислительные среды:

1. Поддержка решений важнейших бизнес-задач.

2. Обеспечение централизованного управления информацией и устройствами.

3. Работа в гетерогенных сетях.

4. Обеспечение гибкости, необходимой для быстрой реакции на изменение условий.

Типичная распределенная среда вычислений «привязывает» информацию к определенному серверу и не обладает достаточной гибкостью. Но сравнительно новый способ управления информацией, известный как сети хранения данных (Storage Area Network, SAN), способен обеспечить фундамент для разработки универсальной корпоративной информационной среды.

В начало В начало

Возможности сетей хранения данных

SAN — это высокоскоростная сеть, разработанная для управления данными. SAN объединяет аппаратное и программное обеспечение и сетевые компоненты, которые обеспечивают связь по принципу «многие-ко-многим» между серверами и устройствами хранения данных. Отделяя управление информацией от ее обработки, SAN обеспечивает гибкость, необходимую для удовлетворения требований, определенных выше. SAN основана на технологии Fibre Channel, которая связывает устройства хранения данных (дисковые массивы, магнитооптические диски и ленточные библиотеки) и серверы по принципу «многие-ко-многим». Серверы приложений и баз данных связаны как с SAN, так и с локальной или глобальной сетью.

SAN должна быть настроена так, чтобы обеспечить серверам, находящимся в различных местах, прямой доступ к огромному количеству разделяемых ресурсов хранения данных. SAN также обеспечивает прямую связь между устройствами хранения, например между дисковыми массивами или между дисковым массивом и ленточной библиотекой, обеспечивая проведение операций резервного копирования независимо от серверов.

SAN предоставляет две замечательные возможности. Первая из них — это создание информационной среды, исключающей связь по принципу «один-к-одному» между серверами и важными бизнес-данными. Введение нового типа связи между серверами и данными позволит создавать корпоративный банк информации, а SAN сделает информацию доступной для всей сети. Вторая возможность состоит в том, что SAN может обеспечить более быстрый и более эффективный способ работы с быстро растущими объемами данных. Используя отдельную сеть управления информацией, дополнительные устройства хранения данных могут быть подключены с минимальным влиянием на скорость работы серверов и других компонентов локальной или глобальной сети. SAN сможет повысить быстродействие системы. Например, установка SAN позволит уменьшить трафик в традиционной сети. Быстродействие системы также увеличится с улучшением возможностей резервного копирования и восстановления данных. С помощью SAN копирование и восстановление будет проходить без использования локальной сети и серверов приложений. Ни один из серверов не будет связан с каким-либо конкретным набором информации: остановка одного из серверов не окажет серьезного влияния на возможность доступа пользователей к информации. Управление также значительно упростится. SAN позволит использовать общий инструментарий и одну точку контроля для управления всеми данными.

В начало В начало

Реализация сетей хранения данных

Практическая реализация сетей хранения данных требует интеграции и взаимодействия устройств хранения данных, серверов, программных и сетевых компонентов различных производителей. Для организации работы SAN требуются:

  • дисковые и ленточные продукты, которые работают с SAN;

  • серверная поддержка соединений с SAN;

  • устройства Fibre Channel (коммутаторы, концентраторы, шлюзы, маршрутизаторы и мосты);

  • программное обеспечение для управления SAN;

  • программное обеспечение, которое выполняет прикладные задачи, работая с SAN.

Мультисерверные среды, программное и аппаратное обеспечение будут играть ключевую роль при выборе пользователями решений SAN, потому что программная совместимость — это то, что делает SAN привлекательным для пользователя. Возможности, которые обеспечиваются SAN, например резервное копирование данных без загрузки сервера, будут ключевыми факторами для принятия решения перехода на технологии SAN. Подобно другим сетям, эффективность работы SAN будет зависеть от правильной установки и конфигурирования. Особенно критичной правильная настройка и конфигурация будет для сложных сетей хранения данных.

Несмотря на все достоинства среды «клиент-сервер», данная модель вычислений создает ряд проблем для специалистов по информационным технологиям, например увеличивает стоимость поддержки и управления хранением информации. Информация, которая хранилась централизованно, сейчас разбросана по всей вычислительной сети и часто плохо управляется и контролируется. Средства хранения данных также разбросаны по сети и жестко связаны с серверами. Увеличение производительности одного сервера может улучшить доступ и обработку только тех данных, которые хранятся на сервере. Особенно остро данная проблема проявляется в гетерогенных сетях. Эту ситуацию можно представить себе в виде информационных «островков», связь между которыми затруднена из-за несовместимости продуктов различных производителей (рис. 1).

Сейчас процессы представления, обработки и хранения данных отделены друг от друга. Современная архитектура «клиент-сервер» базируется на трехуровневой модели.

Верхний уровень используется для представления данных. На верхнем уровне могут работать персональные и сетевые компьютеры. Средний уровень представлен серверами приложений, которые осуществляют обработку данных. К серверам приложений обращаются компьютеры верхнего уровня. В свою очередь, серверы приложений используют нижний уровень для хранения данных. Нижний уровень состоит из устройств хранения данных.

В SAN устройства хранения данных нижнего уровня централизованы и соединены друг с другом. Одно из определений SAN — высокоскоростная сеть, совместимая с локальной сетью, которая позволяет установить прямые соединения между устройствами хранения и серверами. SAN может рассматриваться как расширение концепции шины хранения, позволяющее устройствам хранения и серверам взаимодействовать друг с другом с помощью тех же компонентов, которые используют локальные и глобальные сети: маршрутизаторов, концентраторов, коммутаторов, шлюзов. Сеть хранения данных может разделяться несколькими серверами и/или может быть присоединена к одному выделенному серверу. Сеть хранения данных может быть локальной или территориально распределенной.

В сетях хранения данных можно использовать различные типы интерфейсов: Enterprise Systems Connection (ESCON), Small Computer Systems Interface (SCSI), Serial Storage Architecture (SSA), High Performance Parallel Interface (HIPPI), Fibre Channel (FC) или любой новый способ соединения (рис. 2).

Важно отметить, что в SAN используются принципиально новые методы соединения систем хранения с серверами. Эти новые методы позволяют увеличить как скорость работы с данными, так и эффективность доступа к ним. В настоящее время SAN используется для соединения массивов хранения данных с несколькими серверами. SAN может связывать диск или ленту мэйнфрейма с сервером или клиентом в сети.

Одним из преимуществ SAN является отделение хранения данных от серверов, осуществляющих их обработку. В традиционных системах увеличение объема данных или обращение к данным требует наращивания мощности сервера, на котором располагаются данные, что, в свою очередь, ведет к увеличению расходов на управление сервером. Возможность доступа к данным на сервере жестко связана с аппаратными возможностями самого сервера. В среде SAN управление хранением данных может быть изменено для того, чтобы быстро приспособиться к изменениям в конфигурации серверов и систем хранения данных, и выбор среды хранения данных будет полностью зависеть от ее возможностей.

Сеть SAN отличается от традиционной сети, поскольку строится на интерфейсах, существующих между устройствами хранения данных. SAN позволяет преодолеть «узкие места» традиционной сети. Она поддерживает прямую высокоскоростную передачу данных между серверами и устройствами хранения данных следующими тремя способами:

1. Сервер — память. Это традиционная модель взаимодействия с устройствами хранения. Преимущество заключается в том, что доступ к одному и тому же устройству хранения может быть организован одновременно несколькими серверами.

2. Сервер — сервер. SAN можно использовать для высокоскоростного обмена большими объемами данных между серверами.

3. Память — память. Обмен данными между устройствами хранения происходит без участия сервера, например резервное копирование данных с жесткого диска на магнитную ленту или зеркалирование данных по каналам SAN.

SAN позволяет более эффективно выполнять приложения, которые осуществляют передачу данных, например автономное (без участия сервера) перемещение данных от одного устройства хранения к другому. SAN предполагает новую сетевую архитектуру, в которой сразу несколько ПК параллельно организуют доступ к нескольким устройствам хранения. С использованием SAN связаны следующие преимущества:

  • большая доступность приложений. Независимость устройств хранения от приложений и доступ к ним по альтернативным путям;

  • большая производительность приложений. Работа с устройствами хранения без дополнительной нагрузки на сервер и передача данных по отдельной сети;

  • централизация и консолидация устройств хранения. Большая управляемость, масштабируемость, гибкость и доступность;

  • передача данных удаленным узлам. Удаленное копирование данных — средство защиты от катастроф;

  • эффективное централизованное управление. Единый образ устройства хранения упрощает управление.

В начало В начало

Подход IBM к разработке SAN

Компания IBM разработала свою архитектуру для сетей хранения данных, которая получила название Seascape. Эта архитектура делает реальностью создание эффективной корпоративной информационной среды. Занимаясь созданием и продвижением Seascape, IBM определяет свою стратегию следующим образом:

  • сохранить уже сделанные инвестиции в программное и аппаратное обеспечение;

  • обеспечить интеграцию в Seascape новых технологий;

  • позволить персоналу использовать опыт работы с мэйнфреймами;

  • поддерживать работу с решениями различных поставщиков.

Seascape естественно опирается на технологии компании IBM, включая использование жестких дисков, магнитооптических дисков, мощных серверов и многофункционального программного обеспечения. Архитектура Seascape обеспечивает высоконадежные масштабируемые решения и позволяет использовать разные типы серверов. В основу архитектуры Seascape положены три основных принципа: использование сервера хранения для выполнения сложных операций перемещения данных, архитектура которого удовлетворяет индустриальным стандартам; легкость замены программных и аппаратных блоков, необходимых для расширения возможностей системы; поддержка универсальных методов доступа к данным.

В настоящий момент IBM предлагает следующие продукты для реализации сетей хранения данных: Versatile Storage Server, Network Storage Manager, Magstar Virtual Tape Server и ряд программных средств.

В начало В начало

Versatile Storage Server

Сервер Versatile Storage Server предназначен для обеспечения централизации хранения данных и консолидации серверных функций (рис. 3). Используя дисковые системы IBM 7133 Serial Disk System в качестве блоков для формирования системы хранения данных, Versatile Storage Server обеспечивает сохранение инвестиций в аппаратное обеспечение. С Versatile Storage Server распределенная система хранения данных может быть объединена в единую мощную систему, обеспечивающую выполнение следующих функций: удаленное управление через Web, параллельный доступ к данным для нескольких серверов и динамическое выделение ресурсов.

IBM Versatile Storage Server обеспечивает централизованное управление и разделение данных для различных диалектов UNIX, Windows NT и AS/400. При необходимости можно присваивать невыделенные ресурсы любому присоединенному серверу без нарушения режимов работы остальных серверов.

Централизованное управление значительно упрощается при использовании IBM StorWatch — утилиты управления для Versatile Storage Server. Данная утилита позволяет осуществлять удаленное или локальное администрирование для мониторинга и управления сервером Versatile Storage Server, используя Java-совместимый браузер Internet.

В начало В начало

Network Storage Manager

Устройство управления сетевой памятью IBM 3466 Network Storage Manager (рис. 4) — одно из самых эффективных решений для управления данными предприятия. Это семейство продуктов включает аппаратное и программное обеспечение, которое необходимо для предотвращения потерь данных в сети. Все модели имеют минимум 72 Гбайт дисковой памяти и оснащаютcя различными типами ленточных библиотек.

Поддерживая следующие эффективные механизмы, Network Storage Manager гарантирует, что данные сети будут надежно защищены:

  • централизованное копирование и восстановление данных;

  • поддержка более 30 различных клиентских платформ;

  • масштабирование в соответствии с требованиями заказчика;

- быстрое восстановление файлов за счет точного определения местонахождения каждой резервной копии с помощью реляционной базы данных;

- гибкие механизмы администрирования, мониторинга и формирования отчетов, включающие администрирование с помощью Web-интерфейса, SNMP-мониторинг и мониторинг событий.

В начало В начало

Magstar Virtual Tape Server

Использование виртуального ленточного сервера Magstar Virtual Tape Server (рис. 4) обеспечивает большую емкость внешней памяти и уменьшает затраты на резервное копирование. В состав Magstar Virtual Tape Server входят три блока: один содержит RISC-процессор и RAID-массив, второй представляет собой мощную ленточную библиотеку, третий является устройством управления ленточными библиотеками.

Работа IBM Virtual Tape Server организована следующим образом. Для компьютера, на котором работает приложение копирования данных, Magstar Virtual Tape Server представляется как две или четыре полностью сконфигурированных IBM 3490E ленточных подсистемы с 64 приводами. Компьютер обрабатывает данные и посылает их на запись в Magstar Virtual Tape Server. После передачи данных Magstar Virtual Tape Server сохраняет данные, полученные от компьютера, в кэш-память на своем жестком диске. При получении новых данных от других компьютеров Magstar Virtual Tape Server продолжает хранить данные в кэш-памяти на диске. Когда объем данных на дисках становится достаточным для заполнения ленточного картриджа, информация переносится на картридж. Таким образом, каждый картридж в библиотеке заполняется полностью, что существенно сокращает количество ленточных картриджей, необходимых для хранения информации. (Сегодня большинство картриджей, используемых в традиционных системах резервного копирования, содержат один том данных и в среднем заполнены только на 15%). Обычно многие запросы к данным архива происходят в течение 24 часов после завершения операции архивирования. Когда происходит запрос, большинство данных все еще находится в кэш-памяти на диске, и поэтому многие запросы к данным архива выполняются очень быстро. Если необходимые данные все же находятся на ленте, происходит загрузка всего логического тома в кэш-память, а считывание информации происходит уже непосредственно с диска.

В начало В начало

Базовые программные средства

Компания IBM предлагает также программные средства управления для среды SAN. Одним из ключевых продуктов IBM в этой области является Tivoli Storage Management. Это семейство продуктов предназначено для конструирования решений масштаба предприятия и объединяет системы автоматического резервного копирования, восстановления после сбоев и управления механизмами хранения данных.

Другим важным компонентом SAN является StorWatch — семейство продуктов, которое позволяет администраторам эффективно управлять устройствами хранения с любого узла корпоративной сети. StorWatch дает администраторам возможность наблюдения и постоянного управления стандартными системами хранения данных, интеллектуальными подсистемами Seascape хранения данных и устройствами, базирующимися на технологии Fibre Channel, — шлюзами, концентраторами и коммутаторами.

В начало В начало

Заключение

Сегодня сети хранения данных находятся в том же состоянии, что и электронная коммерция несколько лет назад. Очевидно, что данная технология будет играть ключевую роль в современном мире, идущем по пути создания глобальных систем хранения и обработки информации. Подобно электронному бизнесу, возможности SAN чрезвычайно велики. Сети хранения данных позволяют справляться с обработкой огромного количества данных и значительно уменьшать время, необходимое на обработку запросов клиентов.

КомпьютерПресс 7'2000