Наш ассоциированный член www.Bikinika.com.ua

Сучасні дискові масиви середнього класу - ємність більше, ефективність вище

  1. Класична функціональність масивів середнього класу
  2. Нові завдання - новий функціонал

13 травня 2011 р

Випускаються сьогодні зовнішні дискові масиви середнього класу і початкового рівня побудовані за модульним принципом. Модульність дозволяє зменшити витрати на первісну конфігурацію масиву, економить місце в ЦОДі, оскільки в цій же стійці можна розмістити інше обладнання (сервери, стрічкову бібліотеку, комутатори) і дозволяє поступово нарощувати ємність масиву установкою в стійку додаткових дискових полиць.

Масиви середнього класу відрізняються від моделей початкового рівня ціною (цінова межа між цими двома класами проходить на рівні 25 тис. Дол.), Більшою масштабністю і продуктивністю контролерів масиву. Якщо масиви entry-level зазвичай підтримують не більше 120 жорстких дисків і розраховані на обслуговування декількох серверів стандартної архітектури (вони часто застосовуються для побудови відмовостійких двовузлового кластерів), то масиви mid-range масштабируются понад 500 дисків, а деякі моделі - до двох і навіть трьох 19-дюйм полиць і до 1 тис. жорстких дисків, і здатні забезпечити централізоване зберігання даних в досить великому ЦОДі, де працює понад 10 серверів, в тому числі, - і багатопроцесорні Unix-сервери. У той же час на відміну від масивів high-end більшість масивів середнього класу не підтримують сервери з «закритою» архітектурою: оскільки в штучному вираженні на частку закритих платформ припадає невелика частина серверного ринку, розробникам дискових масивів середнього класу не має сенсу вкладати гроші в реалізацію підтримки цих «екзотичних» ОС в своїх продуктах.

Ще одне, і навіть більш важлива відмінність масивів середнього класу від вищого - це число контролерів, від якого залежить загальна продуктивність і відмовостійкість дискового масиву. У класичних mid-range-масивах підтримується тільки два контролера. Хоча вже з'явилися масиви цього класу, які масштабуються понад двох контролерів, за цим показником вони сильно відстають від систем high-end, в яких встановлюється до декількох десятків контролерів.

Класична функціональність масивів середнього класу

Практично всі системи середнього класу реалізують найбільш популярні варіанти об'єднання дисків в RAID-масив, а саме - RAID п'ятого і шостого рівнів, що забезпечують розпаралелювання операцій введення / виводу дисків в поєднанні із захистом від втрати даних через збій одного або двох дисків масиву.

Всі масиви середнього класу підтримують найбільш поширені серверні ОС - Windows, Linux і комерційний Unix (перш за все Solaris), тому їх можна використовувати для консолідованого зберігання даних в ЦОДах, де застосовуються сервери різної архітектури (за винятком серверів на базі закритих архітектур). Вони також можуть використовуватися в якості загальної системи зберігання серверних кластерів високої доступності.

Практично стандартної для масивів цього класу стала функція миттєвих знімків (snapshots), за допомогою яких зручно, не перериваючи основні операції масиву, проводити резервне копіювання або робити копії великих обсягів продукційних даних для поглибленого аналізу або тестування нових версій програм.

Для захисту даних від втрати через великих аварій в масивах середнього класу традиційно застосовується віддалена реплікація на таку ж модель масиву, встановлену на окремому майданчику.

Нові завдання - новий функціонал

Останні два-три роки відзначені швидким зростанням продажів дискових масивів середнього класу, який не зміг зупинити навіть спад світової економіки. Наприклад, за оцінками Gartner, в середині 2010 р продажу цих систем зберігання зросли майже на 10% в порівнянні з рівнем літа 2009 р

Крім безперервного зростання обсягів даних корпоративних додатків, які зберігаються на дискових масивів, збільшення попиту на системи середнього класу сприяло також впровадження серверної віртуалізації, для якої, як правило, потрібно дисковий масив не тільки великої місткості, а й з високою продуктивністю введення / виведення, надійністю і гнучкістю конфігурації. Другий новий фактор зростання попиту на дискові масиви класу mid-range - це застосування резервного копіювання на жорсткі диски замість значно більш повільного традиційного резервного копіювання на магнітні стрічки.

З технологічних новинок останніх років насамперед варто відзначити концепцію Unified Storage, вперше запропоновану NetApp і потім взяту на озброєння іншими вендорами. Якщо раніше всі системи зберігання чітко ділилися за способом підключення до мережі на системи для мереж зберігання SAN, що використовують блоковий доступ до даних і інтерфейс Fibre Channel, і NAS-системи, що підключаються до локальної мережі Ethernet і призначені для зберігання файлів, то системи Unified Storage здатні працювати і в складі SAN, і як NAS-система. В результаті на одній системі можна зберігати як дані корпоративних додатків, які використовують блоковий доступ (наприклад, базу даних ERP-системи), так і файли користувачів. В результаті такої консолідації економляться витрати на придбання систем зберігання і їх обслуговування.

Додатковим стимулом для реалізації Unified Storage на практиці стає впровадження 10-Гб Ethernet із застосуванням технологій Fibre Channel over Ethernet, що дозволить використовувати мережу Ethernet і як традиційну LAN, і як мережу SAN, т. Е. Відмовитися від використання виділеної мережі зберігання і за допомогою 10 Gigabit Ethernet консолідувати всю мережеву інфраструктуру підприємства. Крім того, перехід на 10-Гб Ethernet відкриває нові перспективи для побудови SAN на базі iSCSI і застосування таких систем зберігання iSCSI, як Dell EqualLogic і HP StorageWorks P4000 (продукт колишньої компанії LeftHand), оскільки до цих пір впровадження iSCSI на базі 1-гигабитного Ethernet не забезпечувало ту швидкість доступу до даних на системі зберігання, який реалізують класичні SAN на Fibre Channel.

Взагалі, остання витісняється новими, більш доступними за ціною і стандартизованими технологіями не тільки на рівні мережі, а й на рівні внутрішньої архітектури масивів. Так, майже всі представлені за останні півроку нові дискові масиви середнього класу побудовані на базі технології Serial Attached SCSI (SAS), яка суттєво спрощує проектування нових систем в порівнянні з використанням Fibre Channel, дозволяє застосовувати стандартні компоненти і встановлювати в масивах дешевші диски SATA великий ємності (в деяких масивах попереднього покоління їх також можна було застосовувати, однак для цього вони повинні були бути забезпечені спеціальними конекторами Fibre Channel і тому обходилися дорожче, ніж стандартні е SATA-диски). Ще одне нововведення дискових масивів розглянутого класу - підтримка 2,5-дюймовий жорстких дисків на додаток до класичних 3,5-дюймовий, що збільшує щільність розміщення ємності і покращує можливості розпаралелювання введення / виведення в дисковому масиві.

Твердотільні диски (SSD) практично вже стали стандартним компонентом сучасних дискових масивів. Незважаючи на значно більш високі в порівнянні з жорсткими дисками ціни ці накопичувачі дозволяють істотно поліпшити «скорострільність» дискового масиву і дуже ефективні для зберігання тих даних, до яких найчастіше здійснюються запити, наприклад, в транзакційних додатках. За продуктивністю введення / виведення даних один диск SSD може замінити цілу полицю швидкісних жорстких дисків SAS, що не тільки виправдовує його більш високу вартість, але і істотно зменшує місце, необхідне для дискового масиву, і його енергоспоживання.

Комбінування твердотільних дисків зі швидкісними жорсткими дисками SAS і більш повільними SATA-дисками великої ємності дозволяє всередині одного масиву організувати кілька рівнів зберігання даних з різними показниками швидкості доступу і вартості зберігання одного гігабайта. Для максимальної ефективності багаторівневого зберігання потрібні механізми автоматичного переміщення даних за певними правилами між різними рівнями зберігання, наприклад, щоб без участі системного адміністратора сам дисковий масив перекладав дані, до яких стало менше запитів або вони застаріли, з твердотільних дисків на більш повільні жорсткі диски SAS, а потім - і на SATA-диски. Такий механізм реалізований, наприклад, в EMC Clariion CX4 / VNX, IBM Storwize V7000 (за допомогою технології Storage Easy Tier) і дискових масивах компанії Compellent, яку в кінці минулого року купила Dell.

Скорочення витрат на зберігання даних забезпечує також і застосування в деяких масивах технологій дедублікация і онлайнового стиснення. Спочатку дедублікация використовувалася для усунення повторного копіювання ідентичних наборів даних при резервному копіюванні на дискові бібліотеки, але потім вона була розширена і на зберігання інших типів даних, перш за все на образи віртуальних машин VMware, в яких багато дані повторюються.

Ще одна функція - thin provisioning - допомагає скоротити початкові витрати на закупівлю систем зберігання. При традиційному підході дискові масиви закуповуються з великим запасом по ємності в розрахунку на зростання обсягів даних в майбутньому. Тому частина дисків масиву крутиться вхолосту кілька місяців до того, як на ці диски будуть записані перші дані. Для покупців було б вигідніше купувати масив в тій конфігурації, яка відповідає поточним обсягами даних, і потім поступово, у міру зростання даних, докуповувати і встановлювати додаткові диски, однак тоді при кожному розширенні ємності масиву доведеться зупиняти додатки, чиї дані зберігаються на масиві, і заново виділяти їм ємність. Якщо такі операції виконуються досить часто, вони створюють істотне навантаження на системного адміністратора і негативно впливають на ступеня доступності важливих для бізнесу додатків. До кінця минулого десятиліття ця функція стала стандартним функціоналом масивів середнього і старшого класу. При використанні thin provisioning ємність виділяється додатків не безпосередньо (т. Е. На рівні окремих дисків), а з віртуального пулу, в який об'єднані всі диски масиву. Віртуальну ємність з цього пулу можна виділити з розрахунком на зростання даних в майбутньому, причому фізична ємність може бути набагато менше ємності виділеного з додатком віртуального томи. Тому в цьому випадку розширення ємності не порушує роботу додатків і не вимагає заново прописувати їх налаштування.

Додатковою до thin provisioning є функція thin reclamation, т. Е. Повернення в віртуальний пул тієї частини ємності віртуального томи, яка виявилася непотрібною додатком (наприклад, через завищений прогноз зростання даних або при видаленні великих обсягів даних програми). Для thin reclamation потрібно, щоб система зберігання дізналася, що з додатком певна ємність не потрібна.

Для скорочення енергоспоживання і тепловиділення дискових масивів ряд вендорів реалізували в своїх системах функцію spin-down, яка тимчасово зупиняє ті диски, до яких останнім часом не було звернень. Перш за все ця функція застосовується до SATA-дисків, на яких зазвичай зберігаються редкозапрашіваемие дані.

Серед нових функцій, що забезпечують додатковий захист від апаратних збоїв, варто відзначити застосовується деякими вендорами (наприклад, HDS) архітектуру контролерів active-active з балансуванням навантаження між двома контролерами масиву, і реалізовану функцію вилученої реплікації між трьома майданчиками для підтримки доступу до даних в разі катастроф . Іноді застосовується багатовузловий конфігурація контролерів, що дозволяє мінімізувати падіння продуктивності при виході з ладу одного з них.

При розробці нових дискових масивів сьогодні більшість вендорів орієнтуються на застосування компонентів, що випускаються для серверів стандартної архітектури, наприклад, процесорів Intel Xeon. Ця стандартизація дозволяє позбутися від великих витрат, пов'язаних з розробкою і виробництвом спеціалізованих ASIC і зосередитися на програмно-реалізується функціонал, який в майбутньому можна буде перенести на нові процесори Intel. Наприклад, вже згадуваний HP P4000 (LeftHand) в якості апаратної платформи контролера масиву використовує сервери стандартної архітектури HP ProLiant, до яких підключаються зовнішні дискові полки, IBM Storwize V7000 - аналогічні сервери IBM System X, а в тільки що представленому EMC VNX встановлена ​​тільки одна мікросхема ASIC. У продуктах 3Par за допомогою ASIC на апаратному рівні реалізований механізм thin provisioning.

У даній статті описані найбільш типові підходи, за допомогою яких реалізуються основні функції сучасних СГД середнього класу. Разом з тим слід враховувати, що в окремих моделях використовуються свої фірмові підходи.

Детальніше про властивості сучасних СГД середнього класу читайте в статті «Дискові масиви стали розумнішими», "Бесстселлери ІТ-ринку № 1, с. 64 .

Building cost-effective network storage Building cost-effective network storage

Попит насетевие рішення для зберігання даних безперервно зростає, нодосравнітельно недавнього часу дозволити корпоративну мережу зберігання даних могли лише великі організації, які мають досить великим бюджетом наразвитие обчислювальної ...

Читати далі

Новости