Обзор "Рынок серверных технологий 2007" подготовлен При поддержке
CNewsAnalytics Kraftway

Битва за рынок СХД разворачивается на поле виртуализации

Битва за рынок СХД разворачивается на поле виртуализации По результатам исследования IDC, совокупный объем информации, хранящейся в электронном виде, в 2006 году составил 161 Экзабайт (1018 байт). Аналитики предполагают, что за период с 2006 по 2010 годы общий объем информации увеличится, по крайней мере, в шесть раз. Соответственно, все серьезнее становится проблема надежного хранения данных и скорости доступа к ним. Одним из способов их решения являются технологии виртуализации.

Информация в разные периоды своего существования обладает разной степенью важности для бизнеса и, соответственно, предъявляет различные требования к надежности и доступности систем, на которых она хранится. Очевидно, что не вся информация должна быть доступна в оперативном режиме. Например, файловый сервер для данных пользователей — достаточно трудно управляемый ресурс, измеряемый терабайтами. Его объемы растут ежедневно, однако одни пользователи хранят здесь проектную документацию, а другие — архивы музыки и видео. Поэтому сегодня эффективность работы информационных систем компаний зачастую зависит от того, разделяется ли информация на классы и уровни доступа по принципу критичности для бизнеса, обеспечивается ли она соответствующим хранилищем. Собственно, именно в этом и заключается суть концепции ILM (Information Lifecycle Management — управление жизненным циклом информации).

Концепция ILM подразумевает наличие развитой ИТ-инфраструктуры и современного оборудования. Зачастую это означает усложнение архитектуры сетей хранения данных, в том числе увеличение количества систем хранения различного уровня. Как альтернативный метод реализации концепции ILM производителями была предложена технология под названием «виртуализация систем хранения данных».

До сих пор ведущие мировые производители не выработали единого четкого представления о том, что такое виртуализация систем хранения данных и каковы основные принципы внедрения этой технологии. Хотя каждый из них оперирует в принципе идентичными понятиями, практические воплощения отличаются принципиально. В данной статье будут рассмотрены решения мировых лидеров по производству систем хранения данных — EMC, IBM, HP.

Виртуализация СХД отличается от виртуализации серверов

Виртуализация систем хранения — это подход или комплекс мер по объединению различных дисковых массивов в единое информационное пространство, при котором устраняются физические связи между сервером и дисковой системой. При этом сервер непосредственно работает не с системой хранения, а с абстрактной виртуальной системой ввода-вывода. Концепция виртуализации в ее современном виде появилась достаточно давно — почти 10 лет назад. Но, как это часто бывает с новыми технологиями, рынок не был к ней готов. Коммерческим решениям по виртуализации чуть более 4-х лет, поэтому пока можно говорить о начальном этапе развития технологии.

Основная предпосылка возникновения виртуализации — использование каждым производителем систем хранения собственных закрытых технологий, несовместимых с конкурентами. В результате виртуализация появилась как способ реализовывать в одной и той же сети хранения данных передовые разработки сразу нескольких производителей. Здесь можно провести аналогию с виртуализацией вычислительных систем, например, с продуктом ESX от компании VMware. Технология виртуализации вычислительных систем позволяет запускать приложения, написанные для разных операционных систем на одной физической машине, таким образом, значительно сокращая количество серверов в инфраструктуре. Важно отметить, что назначение этой технологии отличается от виртуализации СХД, так как рынок серверов x86 архитектуры, в отличие от рынка систем хранения, обезличен, т.е. практически все используют одни и те же технологии и одну и ту же элементную базу. Виртуализация серверов — это увеличение их загрузки с помощью добавления дополнительных задач. Очень важно не путать виртуализацию серверов с виртуализацией систем хранения.

Руслан Заединов, заместитель директора департамента вычислительных систем компании «Крок», в качестве примера альтернативного подхода к виртуализации приводит систему хранения HP EVA. В названии систем хранения HP Enterprise Virtual Array термин виртуализация присутствует явно, однако это совсем не та виртуализация, о которой пойдет речь. Традиционная идеология предполагает привязку один диск — один массив определенного уровня RAID. Например, если мы реализуем систему хранения для СУБД, мы оставляем RAID 5 для данных пользователей и RAID 10, как более производительный, для журнала транзакций. Причем эти массивы создаются на разных физических дисках. Один из недостатков такого подхода — разная загрузка шпинделей, более того, каждый RAID массив располагается на выделенных дисках и их количество должно быть достаточно большим. У массива EVA термин «виртуализация» означает, что один диск может сразу принадлежать нескольким массивам с разным типом RAID. Такие массивы называются VRAID. Такой подход позволяет использовать меньшее количество шпинделей и позволяет динамически балансировать нагрузку между ними. В силу того, что VRAID поддерживается только на оборудовании HP, эта технология имеет очень мало общего с открытой концепцией «виртуализация систем хранения», так активно обсуждаемой сегодня в сфере ИТ.

Виртуализируя ЦОД

В классическом, если так можно выразится, ЦОД каждое межсоединение — это привязка логического тома к серверу. Виртуализация — это введение своего рода управляющей прослойки между непосредственно системой хранения и сервером, что позволяет добиться нескольких преимуществ. Появляется единая точка управления, что позволяет администратору использовать единый интерфейс для выполнения повседневных операций мониторинга сети SAN. Упрощение средств управления и мониторинга позволяет сократить издержки на содержание системы.

В виртуализированной среде появляется возможность гораздо проще, дешевле и эффективнее реализовать концепцию ILM — можно создавать логические уровни систем хранения, объединяя их в соответствующие классы ресурсов.

Традиционная схема подключения СХД
Введение виртуализации СХД — разделение систем хранения по уровням

Традиционная схема подключения СХД

Введение виртуализации СХД - разделение систем хранения по уровням


Источник: Крок, 2007
Источник: Крок, 2007

Одно из главных удобств виртуализированной СХД — динамическая миграция томов. То есть логические тома можно переносить между системами хранения без прерывания работоспособности системы. Например, при возникновении необходимости вывести какую-либо систему из эксплуатации или наоборот добавить новое оборудование в уже существующую инфраструктуру, не нужно прерывать работу корпоративных приложений или производить операции в нерабочее время. Место хранения данных может меняться прозрачно для приложений. Аналогично, без привязки к железу, виртуализированные системы хранения позволяют использовать функцию резервного копирования.

В некоторых реализациях технологии виртуализации присутствуют аналоги RAID 1, что позволяет добиться увеличения отказоустойчивости путем создания логического тома с зеркалированием между двумя различными массивами (из списка поддерживаемых).

Как уже было отмечено, все производители систем хранения применяют собственные технологии. В частности, это касается таких функций копирования на уровне массива, как создание мгновенных снимков (SnapShot или Flashcopy), создание полных копий томов (PiT copy или Volumecopy). Эти функции работоспособны только в пределах одной системы хранения. Удаленное зеркалирование томов систем хранения данных, также возможно, как правило, только между двумя массивами одного производителя. Внедрение виртуализации позволяет сделать все эти функции полностью аппаратно-независимыми. Наиболее очевидное преимущество такого решения — экономия на лицензиях: Если на разнесенных площадках установлено по две системы хранения разных производителей, нужно покупать два комплекта дорогостоящих лицензий. А если системы хранения вообще все разные, функция удаленного копирования недоступна в принципе. В случае с виртуальной инфраструктурой необходимо лишь однократное приобретение лицензий на виртуальную платформу вне зависимости от типа систем хранения.

Примеры реализации

Программно-аппаратное решение от EMC, появившееся в 2005 году под названием Invista — специальное ПО, дополняющее функционал интеллектуальных Fibre Channel коммутаторов (таких устройств, как Brocade AP7420, а также коммутаторов Cisco MDS с установленными модулями SSM). Invista использует дополнительную вычислительную мощность этих устройств для выполнения основных операций, реализующих концепцию виртуализации.

Основные механизмы технологии EMC работают по следующему принципу. Информационный поток разделяется внутри коммутатора на два компонента: собственно данные и управляющую информацию (метаданные). Метаданные отправляются на внешний вычислительный модуль, а сами данные ожидают от него команды. После того, как вся необходимая логика рассчитана, данные объединяются с метаданными и направляются адресату.

Внешний вычислительный модуль — это, как правило, двухузловой кластер (Out-of-band Control Path Cluster) на серверах с процессорами x86. Управляется через web- интерфейс с командной строки или через стандартное программное обеспечение EMC Control Center. Серверы и системы хранения подключаются непосредственно к FC коммутаторам, таким образом, внедрение Invista не влечет радикального изменения SAN архитектуры

Виртуализация с помощью EMC Invista

Виртуализация с помощью EMC Invista

Источник: Крок, 2007

Благодаря тому, что Invista задействует вычислительную мощность коммутатора и действует на самом низком уровне двоичной логики, это достаточно быстрое решение. Однако основным недостатком такого подхода является необходимость использования достаточно дорогостоящих интеллектуальных коммутаторов или соответствующих модулей расширения.

HP предложила свой продукт для технологии виртуализации в 2004 году — HP SVS200 (OEM Hitachi Tagmastore Universal  Storage Platform). Вместо того, чтобы выпускать на рынок независимые внешние устройства для виртуализации, а также реализовывать этот функционал на уровне SAN, как это сделано у EMC, в Hitachi было решено внедрить всю логику для виртуализации в контроллеры TagmaStore своих систем хранения. Таким образом, внешние СХД подключаются непосредственно к этим контроллерам (Backend Storage). Это достаточно оригинальный подход, на сегодняшний день ни один контроллер других производителей не может управлять внешними системами хранения. В линейке HP продукт SVS200 — это контроллер системы хранения серии XP10000, являющийся переименованной версией HDS Tagmastore USP.

Основная причина, по которой Hitachi отказывается от виртуализации на уровне SAN в пользу своего подхода, в следующем. По мнению разработчиков Hitachi, введение виртуализации на уровне SAN существенно увеличивает сложность коммутации узлов, за счет чего уменьшается быстродействие.

По отзывам экспертов SNIA1, виртуализация от HDS, на сегодняшний день — это самое производительное решение из всех представленных на рынке, однако при этом и самое дорогое.

Виртуализация с помощью HDS USP (HP SVS200)

Виртуализация с помощью HDS USP (HP SVS200)

Источник: Крок, 2007

Виртуализация от IBM, а именно программно-аппаратный комплекс SAN Volume Controller (SVC) берет свое начало в 2003 году. На сегодняшний день насчитывается порядка 2000 реализаций по всему миру. Конструктивно SVC представляет собой двухузловой кластер, собранный из 1U серверов x86 архитектуры, каждый из которых имеет по четыре FC интерфейса для соединения с внешними устройствами. В отличие от EMC Invista, весь поток информации (данные и метаданные) обрабатывается синхронно одним и тем же устройством, для работы SVC нет никаких дополнительных требований к коммутаторам, вся управляющая информация проходит по тому же оптическому каналу. И в отличие от HP SVS200, SVC — абсолютно не связанное с дисковыми системами независимое устройство.

При внедрении SVC разделяет SAN среду на 2 части: back-end — системы хранения данных и front-end — серверы. Данное разделение выражается в перенастройке зонирования (SAN Zoning)  на коммутаторах. Таким образом, SVC, наверное, наиболее полно реализует концепцию виртуализации среди всех описанных выше решений и становится центральным компонентом сети хранения данных. Весь поток информации от серверов, а также управляющие команды обрабатываются кластером SVC. Можно также сказать, что SVC является конечным устройством хранения для сервера, которому последний адресует все запросы на чтение/запись и от которого получает соответствующую информацию.

Виртуализация с помощью IBM SVC

Виртуализация с помощью IBM SVC

Источник: Крок, 2007

Виртуализация на практике

Виртуализация — это способ навести порядок в сети, добиться максимума производительности от имеющегося оборудования. Поэтому в первую очередь виртуализация систем хранения данных необходима компаниям, уже имеющим значительный парк систем хранения разных годов выпуска и несовместимых между собой, а также большую SAN сеть. Наиболее распространены два сценария применения виртуализации систем хранения данных — это случай построения распределенного центра обработки данных или объединение устаревших СХД.

Сегодня практически все компании резервируют центр обработки данных. Традиционный способ решения проблемы — полное зеркалирование имеющегося аппаратного обеспечения. Но логично, что для резервного оборудования можно использовать более дешевое решение, особенно учитывая стоимость современных High-end решений, которая измеряется шестизначными числами. Используя виртуализацию, можно на резервную площадку ставить более дешевые системы хранения из списка поддерживаемых.

Кроме того, виртуализация позволяет не устанавливать дорогостоящие массивы для удовлетворения растущих нужд компаний в объёмах систем хранения. Часто встречается ситуация, когда в компании используется большое количество унаследованных систем хранения, с помощью технологии виртуализации такие СХД можно объединять, например, в недорогие файловые ресурсы.

«Конечно, есть факторы и препятствующие виртуализации, — уточняет Руслан Заединов. — Прежде всего, это ограниченная пропускная способность виртуализационных решений по сравнению с прямым соединением с дисковым массивом класса Mid-Range или High-End. Большим препятствием в деле внедрения виртуализации является также консерватизм в реализации систем хранения данных, Надеюсь, что функциональные и экономические преимущества технологий помогут его преодолеть».

Сейчас достаточно сложно сказать насколько тот или иной существующий подход к виртуализации себя оправдает. Остается надеяться, что в самое ближайшее время производители придут к единому видению процессов модернизации сетей хранения. Стоит отметить, что к виртуализации СХД, как и к большинству нововведений, российский рынок еще не очень готов. По мнению Алексея Забродина,  директора по ИТ Объединенной промышленной корпорации, «это решение пока еще явно не доказало свою эффективность в противопоставлении стоимости своего внедрения и владения этим решением. Но нужно немного времени для понимания, что виртуализация в ИТ — это неизбежный процесс, более того, это процесс объективно правильный. Российский рынок, несомненно, готов или будет в ближайшее время в большой степени готов к виртуализации, как и ко всем процессам в ИТ, которые проистекают в мире. Не хватает только камня, чтобы пошли круги по воде».

Евгений Пухов

Вернуться на главную страницу обзора

Версия для печати

Toolbar | КПК-версия | Подписка на новости  | RSS