poniedziałek, 25 marca 2013

Macierze midrange-unified - poradnik kupującego na 2013

Trochę odpuściłem ostatnio pisanie na bloga. Powody rożne i nie ma ich co roztrząsać  postaram się o poprawę ale duże zmiany idą u mnie w życiu zawodowym tak wiec zobaczymy jak to finalnie wyjdzie.

Ostatni wpis był o poradniku dotyczącym backup appliancow od DCIG, od czasu jego pokazania ukazał się kolejny "buyer's guide" tej firmy, tym razem o macierzach klasy midrange unified, czyli obsługujących ruch zarówno blokowy (SAN) jak i plikowy (NAS).

Bazując na strukturze poprzedniego wpisu przyjrzymy się najpierw założeniom do testów  potem funkcjonalnością i parametrom jakie były porównywane przez redaktorów DCIG, następnie samym "uczestnikom" testu i na końcu wynikom.

Zalozenia:

Aby dany produkt został zaklasyfikowany do grupy midrange unified i dopuszczony do testu musiał spełniać następujące wymagania:

  • Mieć postać odrębnego urządzenia, które zawiera w sobie cały hardware i software(firmware)
  • Prezentować zasoby dyskowe jako pojedynczy system plików w globalnej przestrzeni nazw
  • Obsłużyć zarówno NFS jak i CIFS
  • Obsłużyć przynajmniej jeden z protokołów SANowych (np: iSCSI,FCP,FCoE)
  • Mieć możliwość wystawiania lokalnie zasobów dyskowych (to założenie które wydaje się naturalne dla macierzy miało na celu wyeliminowanie urządzeń typu "cloud gateway" czyli pseudo-macierzy które tak naprawdę jedynie pośrednicza w transporcie danych z/do chmury publicznej)
  • Musza być w stanie obsłużyć conajmniej dwa kontrolery (czyli odpadają macierze z pojedyncza jednostka zarządzająca - nie sa one uznawane za klasę midrange)
  • Musi być w stanie obsłużyć co najmniej 24 dyski
  • Musi być w stanie obsłużyć co najmniej 60TB przestrzeni (surowej)

Kryteria oceniania:

Macierze były porównywane w pięciu obszarach:

  • Zarządzanie i replikacja (MANAGEMENT & REPLICATION)
  • Warstwa aplikacyjna (APPLICATION LAYER)
  • Sprzęt (HARDWARE)
  • Integracja z VMware (WMVARE vSPHERE INTEGRATION)
  • Wsparcie (SUPPORT)

Zarzadzenie i replikacja:
  • Management Software - informacja czy oprogramowanie zarządzające macierzą pozwala na użycie wszystkich jej funkcjonalności, czy pewne opcje są dostępne dopiero jako odrębne licencje
  • Asynchronous Replication - czy macierz obsługuje replikacje. Mam tutaj pewna niepewność co do definicji asynchronicznej replikacji w rozumieniu DCIG, ponieważ opis tego parametru de facto wygląda jako ogólny opis replikacji nie replikacji asynchronicznej.
  • Snapshots - czy dana macierz obsługuje kopie migawkowe (snapshots) czyli obrazy "z danego punktu w czasie" systemu plików lub wolumenu (LUNa). Wyliczone jest także jakie rodzaje snapshotow obsługuje macierz. Wyróżnione zostały następujące metody:
    • Allocate-on-Write (AoW) - przy stworzeniu snapshota, tworzona jest tablica ze wskaźnikami do wszystkich danych. W przypadku gdy dane na wolumenie mają zostać zmienione, modyfikowane bloki są zapisywane w nowym miejscu i tablica wskaźników jest zmieniana tak aby wskazywać na nowe bloki danych. Oryginalne dane pozostają niezmienione i w pierwotnej lokalizacji. Snapshot zajmuje jedynie tyle miejsca, ile zmienione od czasu jego powstanie dane.
    • Copy-on-Write (CoW) - podobnie jak w metodzie AoW tworzona jest tablica wskaźników. W momencie jednak kiedy dane oryginalne mają zostać zmienione, zostają one przekopiowane w nowe miejsce, a następnie oryginalna wartość i lokalizacja zostają nadpisane nowymi. 
    • Replica - DCIG podaje replikę jako rodzaj snapshotu, choć nie jest to kopia migawkowa, tylko inny twór. Replika jest to kopia danych stworzona z oryginalnego snapshota i umieszczona na innej macierzy tego samego typu. Replika zajmuje tyle samo miejsca co oryginał (jest to jego kopia)
    • Split-Mirror - kolejny typ snapshotu, który (moim zdaniem) nie jest do końca "tradycyjnym" snapshotem. Split Mirror powstaje kiedy wolumen działający w konfiguracji mirror (wszystkie dane zapisywane w dwóch kopiach), zostaje "podzielony". Od momentu podzielenia jedna część jest aktywna i może się zmieniać, druga stanowi "snapshot" - i dostępna jest jedynie do odczytu.
  • Application Aware Snapshot - czy snapshot wykonywany przez macierz jest "świadomy" aplikacji która korzysta z danych znajdujących się na wolumenie. Jest to bardzo istotne w przypadku np: baz danych gdzie ykonanie kopii migawkowej na poziomie macierzy (gdy macierz "nie wie" jaką aplikację snapshotuje) nie gwarantuje zachowania konsystencji danych
  • Thin Provisioning - czy macierz wspiera technologię "thin provisioning", czyli alokowanie na macierzy tylko tej przestrzeni, która jest rzeczywiście wykorzystywana przez hosty
  • Automated Storage Reclamation - technologia wspierające "thin provisionig".O ile ten pierwszy dba o to żeby miejsce nie używane nie było alokowane na macierzy, proces Reclamation, zwalnia przestrzeń która była już nie jest używana (np: dane zostały skasowane)
  • Zero Reclamation API - wsparcie dla Symantec Zero Reclamation API - technologii również używanej do odzyskiwania już nieużywanej przestrzeni z macierzy. Ta funkcjonalność może być wykorzystane jedynie jeżeli systemy podpięte do macierzy korzystają z Symantec Storage Foundation
  • Quotas - czy rozwiązanie wspiera obsługę "limitów" (quota) w ilości plików, wielkości itd.. dla użytkowników
  • Thereshold Alerts - kontrola i alarmowanie o przekroczeniu pewnych zdefiniowanych wcześniej progów (zwykle dotyczących utylizacji przestrzeni - np: 90% zapełnienie)
  • Deduplication - czy macierz wspiera deduplikację danych
  • Sub-volume Tiering (Type/Level) - opis opcji jest trochę enigmatyczny, ale najprawdopodobniej chodzi tutaj o obsługę przez macierz auto-tieringu, czyli automatycznym przenoszeniu danych na dyski o odpowiednich dla nich prędkościach
  • Management Interfaces -  wymieniona są możliwości w jakie macierz może być zarządzana  Możliwe są następujące rozwiązania: Aplikacja, CLI, SSH, Web-based GUI
  • Unified Management of Similar Devices - czy możliwe jest zarządzanie wieloma urządzeniami tego samego/podobnego typu z poziomu jednego narzędzia (bez potrzeby logowania się na każde osobno)
  • SNMP - czy macierz może być monitorowana za pomocą SNMP
  • Notification and Logging - wymienione są możliwości wysyłania i odbierania logów z macierzy
  • NDMP - czy macierz obsługuje NDMP (protokół do wykonywania backupów urządzeń NAS)
  • Cloud Storage Support - czy macierz wspiera (a jeżeli tak to jakie dokładnie rozwiązana) wysyłanie/odbieranie/migrację danych z/do chmury.
  • NAS Virtualization - czy macierz wspiera wirtualizację NAS - tutaj rozumianą jako możliwość spartycjonowania na kilka wirtualnych urządzeń NAS.

Application Layer
  • Network File System - jakie systemy plików sieciowych wspiera dane urządzenie. Do wyboru : NFS,CIFS,WebDAV
  • Concurrent NFS/CIFS Mix - czy urządzenie potrafi obsługiwać jednocześnie NFS i CIFS
  • Other Data Transfer Protocols - czy urządzenie wspiera dostęp po FTP lub SFTP
  • PSK Authentication over HTTPS - czy rozwiązanie wspiera użycie mechanizmu Pre-Shared Key przy używaniu HTTPS
  • Authentication Protocols - jakiego rodzaju mechanizmy autentyfikacji mogą być użyte na macierzy. Wyróżnione zostały:
    • Active Directory - logowanie z użyciem hasła i użytkownika z AD
    • Host/IP - ograniczenie dostępu do macierzy tylko dla określonych hostów lub adresów IP
    • LDAP - użycie systemu LDAP
    • NIS/NIS+ - użycie NIS lub NIS+

Hardware
  • Controller Interfases - obsługiwane interfejsy pomiędzy napędami dyskowymi a kontrolerami. Możliwości: FC-AL (Fibre Channel Arbitrated Loop), FC-SW (Fibre Channel Switched Fabric), SAS,SATA
  • Raw Storage Capacity (Max) - maksymalna "surowa" (przed konfiguracja w RAID) przestrzeń
  • RAID Options - jakie rodzaje RAIDów są wspierane
  • 7.2k RPM FC/SAS HDD - czy i jakie (jakie pojemności) dysków danego typu są wspierane
  • 10k RPM FC/SAS HDD - czy i jakie (jakie pojemności) dysków danego typu są wspierane
  • 15k RPM FC/SAS HDD - czy i jakie (jakie pojemności) dysków danego typu są wspierane
  • 5,4k RPM SATA HDD - czy i jakie (jakie pojemności) dysków danego typu są wspierane
  • 7.2k RPM SATA HDD - czy i jakie (jakie pojemności) dysków danego typu są wspierane
  • SSD - czy i jakie (jakie pojemności) dysków danego typu są wspierane
  • Concurrent HDD Mix- czy w obrębie jednego węzła (node) można mieszać dyski różnych rodzajów. Niestety nie do końca wyjaśnione jest jak rozumieć pojęcie noda.
  • FLASH-Based Caching - czy dyski SSD mogą być używane jako cache (czyli nie do docelowego przechowania danych ale jako bufor przed ich "zrzutem" na dyski mechaniczne). Wyróżnione zostały następujące warianty działania dysków SSD
    • Read Caching - SSD jako cache tylko dla odczytów
    • Write Caching - SSD jako cache do zapisów
    • Write Journaling - podobne rozwiązanie jak powyższe, także do cachowania zapisów
    • Block I/O Acceleration - użycie cache tylko dla dostępu blokowego (SAN)
    • NAS Acceleration - użycie cache tylko dla dostępu plikowego (NAS)
  • Cache (Max) - maksymalna liczba obsługiwanej pamięci RAM
  • Controller Config - w jakich konfiguracjach mogą pracować kontrolery (np: active-active, active-passive itd..)
  • Scale-Out Config (Max Nodes) - do ilu węzłów skaluje się rozwiązanie
  • Cluster Config (Max Nodes) - ile maksymalnie węzłów może wchodzić w stworzyć klaster HA
  • 1/10 Gb Ehernet Ports (Max)  - ile portów 1 i 10Gb Ethernetowych może mieć dane urządzenie
  • 4/8 Gb Fibre Channel or 8 Gb Fibre Channel - j.w ale dotyczy portów FC
  • iSCSI - czy rozwiązanie wspiera protokół iSCSI (dotęp blokowy po sieci LAN)
  • Concurrent FC/iSCSI Mix - czy urządzenie może jednocześnie udostępniać zasoby po FC i iSCSI
  • Concurrent NAS/SAN Mix - czy urządzenie może jednocześnie udostępniać zasoby plikowe (NAS) i blokowe (SAN)
  • Power Supplies (Redundant/Hot Swap) - czy urządzenie posiada redundantne zasilacze i czy można je wymieniać podczas pracy urządzenia
  • Fans (Redundant/Hot Swap) - czy urządzenie posiada redundantne wiatraki i czy można je wymieniać podczas pracy urządzenia
  • Hot Swap Drives - czy uszkodzone dyski mogą być wymieniane bez wyłączania macierzy
  • Global Hot Spares - czy urządzenie ma możliwość wydzielenia grupy dysków na tzw: hot spare (dyski automatycznie zastępujące uszkodzone napędy)
  • Managed UPS/Battery Backup - czy urządzenie może automatycznie wyłączyć się lub przejść w tryb oszczędny po informacji z UPS o zaniku zasilania
  • RoHS Compliant - czy urządzenie jest zgodne z rekomendacją dotyczącą braku szkodliwych substancji (Restiction of Hazardois Substances Directive)

VMWare vSphere Integration
  • VAAI (vStorage API Array Integration) - obsługa VAAI, czyli API, które dostarcza VMware (od wersji vSphere 4.1 )a ktore wykorzystanie pozwala na przesunięcie wykonania pewnych zadań związanych z ruchem i obsługą I/O, z warstwy samego VMware do macierzy.Operacje jakie wspiera VAAI są następujące:
    • Full Copy - używane do robienia kopii danych/klonów - dzięki tej funkcji VAAI redukujemy ruch danych do i z hosta podczas tej operacji
    • Hardware Assisted Locking - przesunięcie (z ESXa na hardware macierzy) pilnowania i kontroli nad blokadami zakładanymi na dany i LUNy podczas różnych operacji aktualizowania i zmiany danego zasobu.
    • Block Zeroing   - pozwala macierzy wyzerować (nadpisać zerami) duże przestrzenie danych
    • Dead Space Reclamation - ESX informuje macierz, że zaalokowana przestrzeń nie jest dłużej już wykorzystywana (np: rezydująca na niej VMka została przesunięta na inny datastore lub usunięta) i może zostać odzyskana
    • Full File Clone- tworzenie klona zasoby NAS
    • Out of Space Conditions - obsługa pewnych progów ostrzegających przed kończącym się miejscem oraz umożliwienie "zatrzymania" danej VMki do czasu aż przestrzeń jej potrzebna zostanie poszerzona
    • Reserve Space - tworzenie przestrzeni "zarezerwowanych"
  • VASA (vStorage API  for Storage Awarness) - kolejne API dostarczane przez VMware. Wykorzystanie go pozwala ESXowi uzyskać pewne informacje o wystawionych dla niego zasobach dyskowych, które normalnie są niewidoczne. 
  • SIOC (Storage I/O Control for VMware) -  i jeszcze jedno API z VMware. Tym razem dbające o to aby żaden zasób z VMware nie zmonopolizował wykorzystania macierzy.
  • Load Balancing - czy urządzenie wspiera load balancing ruchu sterowany z poziomu vSphere
  • Snapshot Integration - czy urządzenie integruje się ze snapshotami wykonywanymi przez vSphere

Support
  • Hardware Warranty -  ile gwarancji producent daje dla swojego urządzenia
  • Contract Support Avaliability - w jakich godzinach/dniach dostępne jest wsparcie (np: bussines hours, 24x7 etc...)
  • Contract Support Methods - sposób kontaktu z wsparciem (np: email/telefon/czat)
  • Non-Contract Support Availability - w jakch godzinach dostępne jest wsparcie dla użytkowników którzy nie mają podpisanego kontraktu serwisowego
  • Non-Contract Support Methods - jakie są sposoby kontaktu ze wsparcie dla użytkowników którzy nie mają podpisanego kontraktu serwisowego

Przetestowane modele:

W teście porównawczym wzięły udział następujące firmy:


Ze "stajni" Dell-a oceniane były dwie macierze z serii EquaLogic (FS7500 i FS 7600) - nie posiadające interfejsów FC (obsługa dostępu blokowego poprzez iSCSI), a także Compellent Storage Center FS8600 NAS (typowa macierz unified) i model NX3600


Największy dostawca i producent w obszarze storage miał swoich reprezentantów z dwóch "rodzin". Pierwsza z nich ma korzenie NASowe (i to te bardziej z obszaru enterprise) - mowa o macierzy Isilon (startują przdstawiciele serii NL,S i X), druga to VNX czyli macierz midrange będąca połączeniem Clariiona (SAN) i Celery (NAS)

HDS
http://www.hds.com/

Hitachi startuje z trójką swoich HUSów (Hitachi Unifed Storage) - HUS 110/130/150

IBM
http://www-03.ibm.com/systems/storage/

IBM ma tylko jednego przedstawiciela: Storwise V7000 Unifed, pozostałe produkty z obszaru storage od tego producenta obsługują tylko jeden z typów ruchu blokowy( XIV, seria DS) lub plikowy ( N-series) tak więc nie zakwaliwikowały się do tego "buyers guide"-a

IceWEB
http://www.iceweb.com/

Firma o której produktach nie wiem zbyt dużo. Szybki rzut oka na stronę i na portfolio pokazuje "standardowe" macierze klasy midrange. W porównaniu DCIGa udział wzięły trzy modele: 3000, 6500 oraz 7000

NetApp
http://www.netapp.com

Kolejny duży gracz na rynku storage, regularnie "podgryzający" obecnego lidera czyli EMC. Nie wiedzieć czemu w porównaniu DCIGa uczestniczyła tylko seria 3200 (modele FAS3210/3220/3240/3250/3270), topowe macierze serii 6200 nie zostały uwzględnione.
Nexsan
http://www.nexsan.com/

Jeszcze jedna firma działające w "branży". Jej produkty mają "wyposażenie" i funkcjonalności standardowe dla rozwiązań innych producentów (podwójne kontrolery, replikacja lokalna i zdalna, auto-tiering itd...). W kompendium mamy ocenione modele NST5100/5300/5500

Starboard
http://www.starboardstorage.com/

Druga z mniej mi znanych firm występujących w tym porównaniu. Ocenione zostały dwa jej produkty( AC45 Storage System i AC72 Storage System) i nie wypadły jakoś porywająco.

Wyniki:

Czołówka (pierwsze 4 miejsca) zajmują macierze NetApp z modelem FAS3270 na czele. Ogólne rzecz biorąc, cała konkurencja została znokautowana.
Za serią NetAppa uplasowały się modele EMC VNX (miejsca 5,6 i 8) oraz HDS (7,9,10).
Z tyłu poza pierwszą dziesiątką mamy IBMa, Dell Compellent oraz różne modele Nexsana i IceWeba.
Końcówka czyli druga dziesiątka to pozostałe DELLe, Isilony oraz VNXe z EMC a także Starboard.

Trochę zaskakująco jeżeli chodzi o zwycięzcę. NetApp zawsze wydawał mi się bardziej "eleganckim" rozwiązanie niż np: VNX gdzie de facto dwa osobne rozwiązania (z czego jedno działające na Windowsie, drugie na Linux-ie) są "upychane" w jednym racku i sprzedawane jako macierz unified, ale jak widzę porównanie także samych możliwości a nie samej architektury wychodzi na plus dla NetApp-a.
Brawo.

Podsumowanie:

Jak zwykle DCIG nie zawiódł i przygotował świetny materiał dla osób przymierzających się do zakupu macierzy midrange lub zainteresowanych tym tematem.
Natomiast już wyszedł kolejny "buyers guide" tym razem o macierzach AFA (All flash arrays) co jest tematem bardzo ostatnio gorącym. Już wiem o czym będzie kolejny wpis,mam nadzieję tylko że uda mi się go przygotować nieco szybciej niż ten ;)