Обзор подготовлен

версия для печати
ИИерархические СХД закрепились в России

Иерархические СХД закрепились в России

Несмотря на то, что некоторые эксперты предсказывали скорый отказ потребителей от иерархических СХД, данный сегмент пока продолжает расти примерно на 20% в год. Однако в силу специфичности этих решений их использование по-прежнему актуально в основном для компаний с очень большим объемом используемых данных.

Особенность иерархических систем в том, что данные в зависимости от их актуальности размещаются на различных носителях в зависимости. Чем менее востребованы данные, тем менее производительные и более экономичные носители требуются, благодаря чему удается значительно сократить затраты на СХД. Подобная оптимизация хранения наиболее востребована в крупных информационных системах, где общий объем используемых данных измеряется терабайтами.

В больших информационных системах лишь около 20% данных постоянно востребовано пользователями. Остальные (в основном архивная информация) обычно хранятся на случай непредвиденных обстоятельств и используются достаточно редко. Постоянно увеличивающийся объем неиспользуемых данных заставляет непрерывно наращивать емкость системы хранения, что рано или поздно начинает сказываться на производительности системы в целом: учащаются сбои, возникают проблемы с доступом у пользователей и т.п. Основным требованием к системе хранения в данном случае становится обеспечение бесперебойной работы с актуальными данным, при этом архивные данные не должны быть исключены из прямого доступа.

Использование HSM (Hierarchical Storage Management) основано на выделении нескольких уровней хранения данных. Первый уровень располагается на наиболее быстрых носителях - NAS или SAN системах, второй - на сравнительно недорогих и не самых производительных SATA-дисках, а третий - на роботизированных библиотеках магнитных лент или оптических дисков. Движение информационных потоков между уровнями производится понятно для пользователя по определенным правилам в автоматическом режиме: если информация долгое время не востребована, она переводится на более медленные уровни, и напротив - информация, на которую возникает спрос, оказывается на быстрых устройствах.

С увеличением объемов данных (и, в первую очередь, с ростом объемов неструктурированной информации) усложняются проблемы, связанные с хранением и поиском. Именно здесь у HSM в первую очередь уменьшается оперативность доступа к данным. Носители последнего уровня обычно используют последовательный доступ к данным, что значительно увеличивает время доступа. Еще одна проблема связана с поиском информации внутри файлов. Большинство HSM-решений не оснащены специализированным инструментарием для поиска данных, а использование традиционных средств поиска может привести к активной демиграции файлов.

Для снятия подобных проблем приобретают актуальность системы, позволяющие производить поиск данных внутри файлов. Благодаря увеличению объемов неструктурированной информации решение подобных задач становится все более насущным. В свою очередь, это заставляет ИТ-менеджеров уделять внимание не только количественным характеристикам СХД, таким как скорость работы, емкость и отказоустойчивость, но и наличию возможностей по анализу и структурированию данных. Впрочем, ведущие производители решений для хранения данных уже давно осознали эту проблему, поэтому в линейке продуктов большинства вендоров подобные системы есть.

Подход к хранению данных, основанный на ранжировании последних согласно их предполагаемой ценности и критериям стоимости, производительности, доступности, времени восстановления, нормативным и организационным требованиям лежит в основе стратегии управления жизненным циклом информации (Information Lifecycle Management, ILM). Реализации основной идеи ILM, основанной на привязке хранящихся данных к приложениям, использующим их, позволяет прогнозировать доступность информации. Как только запускается программа, должны быть доступны и необходимые для ее работы данные, что вызывает их демиграцию на более производительные носители. А поскольку использование тех или иных приложений определяется происходящими на предприятии бизнес-процессами, то можно говорить об интеграции информационных ресурсов в цепочку бизнес-процессов и организации информационной инфраструктуры "по требованию".

Именно стратегия ILM становится основой построения комплексных HSM систем. Построение связанной с бизнес-процессами предприятия системы хранения данных даст возможность не только снизить затраты на хранение информации и повысить производительность инфраструктуры, но и позволит действительно управлять данными, оперативно предоставляя в пользователям именно ту информацию, которая им нужна в данный момент.

Кому нужны иерархические системы в России?

Роман Зейбот, заместитель директора департамента вычислительных систем компании "Крок", выделяет два пути построения многоуровневого хранилища. "Первый из них - это плановое внедрение систем с учетом уже существующей инфраструктуры хранения данных, - говорит г-н Зейбот. - Второй, лучшим образом подходящий для вновь строящихся комплексов, - установка комплексной системы хранения, реализующей внутри себя весь функционал для хранения данных с разными требованиями по уровню доступности".

В первую очередь, подобные системы востребованы в инфраструктуре крупных предприятий, однако в последнее время интерес к иерархическим системам стали проявлять также и средние предприятия. По словам Зейбота, потребности небольших компаний в дисковых ресурсах постоянно растут, и при этом организация средних размеров не может себе позволить полностью менять парк вычислительной техники. Обычно в данном случае для хранения устаревших данных используется существующие системы хранения, а для работы с актуальными данными внедряется современная высокопроизводительная СХД. Таким образом и реализуется идея многоуровневого хранения данных. При этом подобный подход вполне оправдан и для крупных организаций. Кроме того, при создании нового комплекса по обработке и хранению информации, применение идеи многоуровневого хранения позволит оптимизировать расходы на его построение. Исходя из этого, можно предположить, что в том или ином виде многоуровневые СХД используется в большинстве организаций, накопивших за период своего существования значительные объемы данных.

Что касается спроса на HSM в России, то, как и везде, основным побудительным мотивом к приобретению подобной системы остается желание сократить расходы на ИТ-инфраструктуру и при этом не потерять доступ к устаревшей информации. Начальник отдела вычислительных платформ компании IBS Андрей Узварик, говорит о том, что в России, как и за рубежом, спрос на иерархические СХД уже сформировался, и основными заказчиками подобных систем являются крупные компании, в которых данные активно накапливаются более пяти лет. То сеть подобные системы актуальны для компаний с очень большим объемом хранимых данных, которые не подвержены активным изменениям.

"При этом, с одной стороны, хранимая информация должна быть относительно редко используемой, с другой стороны, должна существовать потребность в оперативном доступе ко всем запрашиваемым данным", - отмечает Александр Яковлев из Fujitsu Siemens.

HSM системы обычно являются частью традиционных СХД при реализации крупных проектов. HSM позволяют снизить затраты на обслуживание, и в частности, затраты на электроэнергию и физическое размещение. - Сейчас практически в 60-70% новых проектах сразу закладываются HSM и часть существующих "железных" СХД модернизируется в иерархические, сообщает Андрей Узварик.

В целом иерархические системы хранения данных пока не нашли должного применения в российской практике. По мнению Виктора Урусова, директора по системной интеграции и аутсорсингу DEPO Computers, их применение становится актуальным, когда организации хранят большие объемы информации с неодинаковой востребованностью.

HSM+виртуализация

Большинство экспертов говорят об оптимистичном прогнозе развития рынка HSM, поскольку внедрение многоуровневых систем - это выгодно. Вместе с тем, все сходятся во мнении, что наиболее востребованы комбинированные решения, сочетающие HSM с возможностями виртуализации СХД. По словам Романа Зейбота, подобные решения имеют ряд очевидных преимуществ и, в частности, позволяют прозрачно для пользователя интегрировать различные СХД. Добавление новой системы хранения не приведет к изменению схемы распределения ресурсов между потребителями, следовательно, масштабирование происходит наиболее простым способом.

С другой стороны, особых предпосылок для бурного роста рынка HSM не находится - несмотря на существенные преимущества многоуровневой технологии, относительно невысокая цена дискового пространства и сложность внедрения HSM-систем не позволяют пока говорить о широкой распространенности данных решений. Тем не менее, по мнению Александра Яковлева, тенденция к экспоненциальному росту данных приводит к тому, что существующие СХД усложняются настолько, что управлять ими становится слишком накладно. Быть может, здесь находится источник неплохих перспектив для развития рынка HSM? Ведь ранее организации оперировали гигабайтами данных, сейчас уже терабайтами. "Вероятно, при увеличении объемов еще на три порядка альтернатив HSM решениям просто не будет", - делает вывод Виктор Урусов.

Внедрение HSM на предприятии является начальной стадией стратегии управления жизненным циклом информации (ILM). Несмотря на то, что в последнее время термин ILM звучит не часто, данный подход к организации хранения данных не потерял актуальности. Если не ставить своей целью конечную задачу ILM, а именно тотальное внедрение сервисно-ориентированной архитектуры, то HSM в целом себя оправдывают. Если есть удобная и простая функция виртуализации, то появляется возможность решать немалое количество практических задач. Например - обеспечение архивирования и удаленной гетерогенной репликации, а также продление "активной жизни" устаревшего оборудования.

Максим Никитин

Toolbar | КПК-версия | Подписка на новости  | RSS