poniedziałek, 27 września 2010

ISM - Backup i odtworzenie - techniki wykonywania oraz topologie

Ten wpis jest bezpośrednią kontynuacją poprzedniego, dalej zajmujemy się procesem składowania i odtworzenia ( Backup/Recovery).
Przed rozpoczęciem muszę jednak ostrzec potencjalnego czytelnika: ten wpis jest pełen moich schematów wykonanych w technice ASCII-ART. Dalszą lekturę polecam jedynie osobą o dużej odporności na szok estetyczny. Może kiedyś zainwestuję w Visio, ale na razie musi wystarczyć funkcjonalność klawiatury :D

OK, zostaliście ostrzeżeni...

Topologie Backupu:


Możemy wyróżnić cztery topologie w jakich wykonujemy backup:

  • Direct Attached Based Backup
W tej metodzie urządzenie storage, na które wykonujemy backup, jest bezpośrednio podłączone do klienta. Do serwera backupu wysyłane są jedynie metadane. Taka konfiguracja nie obciąża sieci LAN przesyłem danych ale  nie sprawdza się przy dużych środowiskach.

TOPOLOGIA:
---- LAN
---- FC SAN

                                metadane                                                                        Data
Backup serwer <----------------------------------------Backup client -----------------------------------------> Backup device
                                             LAN




  • LAN Based Backup
W LAN Based Backup wszystkie serwery są podpięte do sieci LAN i poprzez to połączenie wysyłają dane do storage nodów, które następnie przysyłają je na urządzenie składujące. Wykorzystanie tej topologii powoduje zmniejszenie wydajności sieci.


TOPOLOGIA:
---- LAN
---- FC SAN

                                                                   Data
                                       Storage Node ----------------------->Backup Device
                                              |  
                                              |                Metadata
Backup Client --------------------------------------------->Backup Server



  • SAN Based Backup
SAN Based Backup jest także zwany LAN-free backupem. Jest to najlepsza topologia backupu w sytuacjach gdy urządzenie na którym składujemy kopie zapasowe jest współdzielone przez wielu klientów.


TOPOLOGIA:
---- LAN
---- FC SAN


                                    ----------------------------------------Storage node
                            LAN    |                                                |     | FC SAN      
                                    |Metadane                                    |     |    DATA                      
Backup server <=====---------------------Backup client ---------       ---------------------->Backup device

                                                                                                     
    • Mixed ( SAN/LAN) Backup
    Ta topologia łączy w sobie rozwiązania oparte na SANie z rozwiązaniami LANowskimi.


    Sposoby backupowania zasobów NAS:

    W środowisku NAS można zaimplementować backup na 4 rodzaje:


    • Server based
                                                                                    Storage
                                                                                         |
    Backup client--------------------NAS Head----------------------Backup device
                                       |                                                 |
                                       ----------Backup server-------------------
                                                     /storage node

    NAS Head otrzymuje dane ze stroge poprzez sieć i wysyał je do backup klienta. Backup klient wysyła te dane dalej do storage noda który zapisuje je na Backup device. Wynikiem takiego rozwiązania jest duże obciązenie sieci SAN oraz serwera produkcyjnego.

    • Serverless
                                                                                    Storage
                                                                                         |
    Backup client--------------------NAS Head----------------------Backup device
                                       |                                                 |
                                       ----------Backup server-------------------
                                                     /storage node

    W tym typie backupu, udział sieciowy jest bezpośrednio podmontowany do storage noda , dzięki temu unikamy przeciążenia sieci i zaangażowania mocy serwera produkcyjnego.

    • NDMP 2-way
                                                                                    Storage
                                                                                         |
    Backup client--------------------NAS Head----------------------Backup device
                                       |                                
                                       ----------Backup server
                                                     /storage node

    NDMP (Network Data Management Protocol) to protokół definiujący przesył danych z zasobu NASowego na urządzenie backupujące ( macierz , biblioteka ) bez udziału serwera backupu. Do serwera backupu trafiają jedynie metadane. Obciązenie sieci LAN związane z backupem NASa jest zredukowane do minimum.

    • NDMP 3 way

    Rozwiązanie podobne do NDMP 2 way ale do transportu danych z NAS Storage do Backup Device używa się sieci LAN ( zwykle dedykowanej ). Rozwiązanie takie musi zostać zastosowane w przypadku monolitycznych NASów ( gdzie NAS storage jest zintegrowany z NAS head i nie ma dostępu do SANa)


    Technologie przechowywania danych (backupów):

    Backup na taśmy:

    Taśmy magnetyczne (Magnetic tapes) to tradycyjne medium do przechowywania backupów, jest bardzo popularne głównie ze względu na koszty. Napędy taśmowe (Tape Drives) są używane do pisania i czytania danych z taśm. Dostęp do danych jest sekwencyjny (sequential). Zapis dokonywany przez napęd jest zapisem streaming( jeden backup zapisywany naraz jednym "strumieniem") lub multistreaming ( kilka backupów zapisywanych naraz, dane są ułożone na przemian ).

    Biblioteki taśmowe:
    Urządzenie do przechowywanie dużej ilość napędów taśmowych oraz taśm magnetycznych to biblioteka taśmowa (Tape Library). Biblioteka składa się ze slotów, w których umieszczane są kasetki z danymi, do przenoszenia taśm pomiędzy slotami oraz napędami służą roboty (robotic arm , picker , accessor). Biblioteką taśmową steruje oprogramowanie do wykonywania backupów na backup serwerze. Oprócz standardowych slotów w bibliotece znajduje się także klika import/export slotów (lub mailslot) służących do dodawania i usuwania kasetek z biblioteki bez przerywania jej pracy.
    Czas jaki upływa od momentu wydania do biblioteki polecenia pod-montowania kasetki, a wykonaniem tego przez bibliotekę nazywamy load to ready time. Zwykle jest on z zakresu od sekund do minut.

    Ograniczenia taśm:
    • prędkość działania - taśmy są bardzo wolne
    • dostęp sekwencyjny
    • brak możliwości dostępu do danych przez kilka hostów jednocześnie
    • zużywanie się taśm
    • duże wymogi dotyczące warunków przechowywania i transportu

    Backup na dyski:

    Ostatnio coraz więcej backupów wykonuje się nie na taśmy magnetyczne ale na dyski. Zaletą tego typu rozwiązania jest o wiele większa wydajność systemów dyskowych nad bibliotekami taśmowymi. Dodatkowo dostęp do dysków jest możliwy przez wiele hostów jednocześnie.
    W niektórych rozwiązaniach dane zeskładowane na dyskach zostają potem przeniesione na taśmy.

    Virtual Tape Library (VTL):
    VTL jest to system dyskowy z odpowiednim modułem zarządzającym, który na zewnątrz prezentuje zasoby dyskowe pod postacią biblioteki taśmowej ( z kasetkami, napędami , robotami itd.). Oprogramowanie na serwerze backupu widzi bibliotekę taśmową i nie jest w stanie rozpoznać że w rzeczywistości wysyła dane na dyski. 





    Trochę chaotyczny jest ten wpis, dodatkowo okraszony niezbyt czytelnymi "diagramami".
    Mam nadzieję, że przy odrobinie samozaparcia, uda się zrozumieć temat.

    W kolejce czekają tematy związane z replikacją i z tego co widzę całkiem ciekawie i obszernie jest ona wyjaśniona. Za parę dni się przekonamy :D



    2 komentarze:

    1. Jaka jest różnica między Server based, a Serverless? Bo na rysunkach wygląda to dokładnie tak samo...
      Co to jest NAS Head? I gdzie jest serwer produkcyjny?

      OdpowiedzUsuń
    2. 1. Co do "rysunków" to postaram się je zmienić. Niestety padły ofiarą zmiany wystroju bloga (z ciemnego tła na jasny) i stały się zupełnie nieczytelne.

      2. NAS Head (główka NASowa) jest to urządzenie wpinane między sieć LAN a SAN. Jego rolą jest działać jak macierz NASowa (udostępnianie danych plikowych) ale dyski z których korzysta są dyskami zewnętrznymi znajdującymi się w macierzy SAN w sieci SAN.

      3. NA tych "schematach" serwer produkcyjny to backup client ;) Znajdują się na nim dane które chcemy zeskładować i zainstalowany jest klient aplikacji backupu, który to umożliwia - stąd takie oznaczenia.

      OdpowiedzUsuń