niedziela, 13 marca 2011

Deduplikacja - kopie idą precz! (Część 5 - IBM)

Po opisaniu rozwiązań firmy EMC, sprawdzimy co też do zaoferowania ma IBM.
Jeżeli chodzi o rynek storage, to polityka tych dwóch korporacji jest dość odmienna. Portfolio EMC to produkty prawie wyłącznie skierowane na rynek pamięci masowych, natomiast IBM jest gigantem oferującym usługi praktycznie w każdej dziedzinie (nie tylko IT). Jeżeli chodzi o sam storage, to podejścia także są różne: EMC wychodzi z założenia, że taśma to przeżytek i zostanie całkowicie zastąpiona składowaniami na deduplikowane dyski. IBM cały czas mocno zaznacza swoją obecność na rynku bibliotek i taśm magnetycznych. Oczywiście nie przeszkadza mu to oferować rozwiązań wykorzystujących deduplikację.

IBM:


ProtecTier:
Protectier to rozwiązanie hardwarowe, oferujące deduplikację na celu. Występuje w dwóch wariantach: deduplikatora zintegrowanego z zasobami storage (np: TS7650) oraz jako gateway (np: TS7650G). Gateway to sama "główka" deduplikująca, na back-endzie której dopiero podłączamy, za pomocą FC, macierz docelową dla zeskładowanych danych. Tym co można uznać za wyróżnik Protectier-a to zastosowany algorytm deduplikacji. Nosi on nazwę HyperFactor i jest opatentowanym rozwiązaniem IBMa.
HyperFactor nie liczy skrótów (hashy) z porcji danych i nie porównuje ich z innymi wyszukując kopii. Stosuje metodę, która nie sprawdza czy dane są identyczne, ale czy mają dużo części wspólnych/podobnych. Protectier na bieżąco sprawdza przychodzący do niego strumień danych i porównuje czy w jego repozytorium nie znajdują się dane podobne - mechanizm wyznaczania tej miary "podobieństwa" opiera się na kilku dość skomplikowanych algorytmach (którymi IBM się nie chwali) oraz na informacji o rozmieszczeniu danych, która jest przechowywana w tzw: Memory Resident Index. Po znalezieniu podobnych fragmentów system składuje jedynie różnice (deltę) między nimi, dodatkowo przed nagraniem na dysk kompresując za pomocą algorytmu LHZ.

Tivoli Storage Manager 6.1 i 6.2
TSM to oprogramowanie do wykonywania backupów z danych i składowania ich na taśmach, bądź innych nośnikach. Sama aplikacja jest bardzo popularna i ma kilkunastoletnią historię (przed 1999r znana była jako ADSM). Obecnie najpopularniejsza jest wersja 5.5, która nie posiada możliwości deduplikacji danych.
Usuwanie kopii pojawiło się niedawno razem z wersją 6.1 która posiada funkcjonalność deduplikacji na targecie czyli serwerze backupowym. Kolejna wersja 6.2 dodaje deduplikację na źródle, czyli wykonywaną przez samego agenta TSMa.
Największa zaleta - funkcjonalność wbudowana w samą aplikację backupową. Bezproblemowe wdrożenie w firmach już używających TSMa.
Największa wada - w tej chwili wersja jeszcze mało "wygrzana" - możliwe jest pojawianie się błędów w nowym kodzie. Druga sprawa to brak deduplikacji na źródle przy składowaniu przez sieć SAN (agenci w wersji 6.2 obsługują tylko deduplikację przez LAN)





 Kolejny wpis - NetApp ( i może coś jeszcze, zobaczymy)

Brak komentarzy:

Prześlij komentarz