sobota, 15 maja 2010

"Automated tiering" - czyli być na odpowiednim poziomie ( cześć 2)

W poprzednim wpisie dowiedzieliśmy się czym jest "Automated Tiering", teraz czas na przybliżenie konkretnych implementacji tej technologii.

Oczywiście nie da się nawet ogólnie opisach wszystkich obecnych lub planowanych rozwiązań w tym zakresie dlatego postanowiłem skupić się na czterech najbardziej znanych ( choć oczywiście wybór ten był bardzo subiektywny):

EMC(FAST)
FAST czyli Fully Automated Storage Tiering to propozycja EMC która ma zostać wprowadzona jako opcja do maszyn z serii Symmetrix, Clariion oraz Cellera.
Administrator będzie miał możliwość definiowania różnego rodzaju "policy" z określonymi poziomami a nastęnie przypisywania konkretnych LUNów do tych "policy".
Czyli tworzymy policy np: "bazy danych OLTP" i w nim definiujemy Tier1 z dyskami SSD , Tier2 z dyskami FC 15k i Tier3 z dyskami FC 10k , ustawiamy że Tier1 ma mieć 10% , Tier2 30% a Tier 3 60% i gotowe. Teraz do danej polityki przydzielamy LUNy wystawione do systemów bazodanowych i macierz zajmie się optymalizacją wydajnościową. Oczywiście podobnych polityk możemy stworzyć więcej i poprzydzieleń do nich zasoby wedle naszych potrzeb.Poziomy (Tier-y) mogą nie tylo różnić się rodzajem dysków ale także ich ilością czy też strukturami RAID jakie na nich tworzymy. Można więć stworzyć górny poziom z RAIDem 10 i dolny na tych samych dyskach ale w RAIDzie 5 lub 6.
Ograniczeniem FASTa przynajmniej w wersji v1 jest to że przenoszenie danych odbywa się na poziomie LUNa.W świecie rzeczywistym nie ma sytuacji że wszystkie dane z obrębu file systemu czy LUNa są tak samo często używane, nawet na LUNie który "uśredniony" wydaje się bardzo zajęty znajdują się dane które odczytywane/zapisywane są relatywnie żadka. Niestety FAST nie potrafi (jeszcze) operować na poziomie bloku i dlatego wszystkie przesunięcia pomiędzy warstwami odbywają się całym LUNem.
Zapowiedziana jest już kolejna wersja systemu FAST ( v2 ) która będzie umożliwiała przenoszenie na poziomie bloku - jeżeli EMC nie będzie miało poślizgu to powinniśmy tą funkcjonalność zobaczyć w trzecim kwartale tego roku.


IBM(Easy Tier)
Rozwiązanie IBMa w zakresie "Automated Tieringu" nazywa się Easy Tier i zostało ostatnio zaimplementowane w najbardziej zaawansowanej macierzy tego producenta czyli DS8700.
Funkcjonalność ta nie wymaga wykupienia na nią licencji i jest dostępna dla wszystkich posiadających daną macierz i wersję mikrokodu R5.1. Oprócz tego IBM oferuje dodatek o nazwie "Storage Tier Advisor" który automatycznie przeanalizuje aktywność danych na naszej macierzy i pomoże optymalnie dobrać ich rozłożenie na warstwach ( tyle oficjalnie - nieoficjalnie mówi się że główną rolą "Doradcy" jest naciągnięcie nas na kupno dysków SSD , które w większości przypadków są według niego niezbędne dla zapewnienia naszej macierzy prawidłowego działania ).
"Easy Tier" bada dane podzielone na 1GB partie i wyznacza dla nich tzw "heat map" , czyli mapę miejsc aktywnych. Użytkownik następnie może takie "gorące" dane poprzemieszczać na wyższe TIERy lub też zostawić ta pracę samej macierzy. Oprócz przenoszenia danych pakietami po 1GB, można również dokonywać tieringu na poziomie całych LUNów.


Compellent(Data Progression)
Compellent ma rozwiązanie czysto softwarowe z dziedziny "Data Tieringu", na dodatek działające na poziomie bloków danych, co sprawia że oferta EMC i IBMa pod tym względem pozostaje nieco w tyle. Program nazywa się "Data Progression" i ( przynajmniej według samego Comellenta ) jest jedyną aplikacją która potrafi dokonywac inteligentnego przenoszenia danych na tak niskim poziomie.


3PAR(Adaptive Optimalization)
Firma 3PAR pozostaje tak jakby trochę poza głównymi liderami rynku storage (EMC, Netapp , IBM ), nie oznacza to jednak, że jej produkty są niewarte zainteresowania.
Jezeli chodzi o tematykę "Automated tiering" to produkt 3PARa nazywa się "Adaptive Optimalization" i został zaimplementowany w firmwarze macierzy z serii "InServ Storage Server".
Oprogramowanie te szczególnie dobrze współpracuje z dyskami SSD i według danych z testów ( przeprowadzanych przez 3PARa więc trzeba je traktowac z dużą dozą ostrożności ) pozwalają zaoszczędzić do 30% kosztów niż przy użyciu środowiska opartego na dyskach FC. Własnością odróżniająca rozwiązanie 3PARa od innych jest sposób pomiaru, które dane są najbardziej aktywne i powinny być przeniesione. U innych producentów zwykle zajmuje się tym osobny program/proces działający na macierzy, którego normalnym zadaniem jest pomiar i monitorowanie wydajności. W macierzach 3 PARa dane w LUNie podzielone są na jeszcze pewne mniejsze jednostki (Tzw: "regions") i do każdego regionu dodane są pewne metadane zawierające między innymi liczniki z ilością odwołań. Bazując na tym "Adaptive Optimalization" potrafi zidentyfikować i przenieść dane na odpowiednie dla nich miejsce.



Oprócz czterech wspomnianych rozwiązań istnieje także wiele innych. Wśród nich można np wspomnieć o firmie StoreSimple i jej kombajnie do deduplikacji, auto-tieringu i pracy w "chmurze" dla środowisk Windowsowych o nazwie: Hybrid Storage Appliance ( obecnie w fazie beta testów).
Googlując hasło "Automated tiering" czy przeglądając blogi i portale związane z tematyką storage znaleźć można jesze masę informacji o innych nie wspomnianych tutaj rozwiązaniach.


Do poczytania:
EMC - FAST - Take Action
EMC - Fast and the continuing virtualization of storage p1
EMC - Fast and the continuing virtualization of storage p2
EMC - Fast and the continuing virtualization of storage p3
IBM - Easy Tier
IBM - "Easy Tier" in DS8700
Compellent - Intelligent Tiered Storage
3PAR - Adaptive Optimization
3PAR - New operational efficiences
StoreSimple

Brak komentarzy:

Prześlij komentarz