Disaster recovery

Z Encyklopedia Zarządzania

Disaster recovery - (z angielskiego: Odzyskanie po awarii, odtwarzanie awaryjne) - Proces związany z odtworzeniem utraconych danych. Jest to część Bussiness Countinuity - czyli zapewniania ciągłości. Rozwiązania 'Disaster Recovery' skupiają się na przywróceniu przetwarzania po awarii (katastrofie) uniemożliwiającej pracę w Ośrodku Podstawowym. Ośrodek Podstawowy rozumiany jest jako infrastruktura informatyczna (pomieszczenia, zasilanie, serwery, sieć, obsługa itp.) używana w czasie normalnej pracy przedsiębiorstwa lub instytucji. (J. Łagowski (2004) s. 143)

TL;DR

Artykuł omawia pojęcie "disaster recovery" i klasyfikację zagrożeń, które mogą spowodować utratę danych. Przedstawione są również podstawowe parametry oraz elementy planu awaryjnego, które pomagają minimalizować skutki awarii lub katastrofy. Artykuł kończy się opisem różnych poziomów rozwiązań disaster recovery, które są związane z kompleksowością i czasem wymaganym do odtworzenia danych.

Klasy zagrożeń

Istnieje wiele czynników powodujących utratę danych. Najczęściej występującym czynnikiem jest szeroko pojęte zasilanie. Jest ona niemożliwa do wyeliminowania przez człowieka, czyli ma charakter obiektywny. Kolejnym zagrożeniem dla danych jest przyroda, na przykład tornada, huragany, burze, inwazja szkodników. Zagrożeniem dla utraty danych jest również człowiek, a dokładniej jego błędy, czyli: wycieki materiałów niebezpiecznych oraz awarie infrastrukturalne. Ogólnie przyjęte, dwa typy stanu ograniczenia dostępności danych oraz ich braku dzielą się na:

  • Awarię, w której uszkodzeniu ulega niewielka część systemu. Do ich przywrócenia wystarczy działanie serwisu komputerowego.
  • Katastrofę, gdzie uszkodzeniu ulega znaczna część systemu. Do przywrócenia stanu pierwotnego wymagana jest działania związane z odtworzeniem uszkodzonego sprzętu, nieruchomości danych i zasobów ludzkich.

Podstawowe parametry disaster recovery

  • Recovery time objective (RTO) - Maksymalny czas konieczny na odzysanie danych i wznowienie działania systemu w całości. Do oszacowania koniecznego czasu potrzebne są możliwości pracowników, infrastruktury oraz okoliczności wystąpienia awarii.
  • Recovery point objective (RPO) - Czas, w którym firma może funkcjonować bez dostępu do danych i infrastruktury. Wartość tego parametru zależy od rodzaju prowadzonej działalności. Ważne jest rozważenie. RPO jest również określana aktualność danych po odtworzeniu.
  • Backup window objective (BWO) - Czas i długość przerwy w przetwarzaniu jaka może wystąpić, aby możliwe było utworzenie disaster recovery.
  • Network recovery objective (NRO) - Czas pomiędzy katastrofą a nawiązaniem awaryjnych połączeń sieciowych koniecznych do rozpoczęcia odtwarzania danych, wznowienia odtwarzania lub docelowych po katastrofie.
  • Maximum data lost (MDL) - Utrata danych, która jest maksymalna z uwzględnieniem dodatkowych możliwości odtwarzania.

Według 'share', podstawowymi parametrami są RTO oraz RPO.

Disaster recovery plan

Disaster recovery plan to zaplanowane działania, które zminimalizują skutki awarii lub katastrofy. To najważniejszy dokument przy rozwiązywaniu disaster recovery. Plan awaryjny podlega ciągłym zmianom i udoskonaleniom, ponieważ w przedsiębiorstwie ciągle następują zmiany na tle organizacyjno-technologicznym.

Elementy planu awaryjnego

  1. Rola pracowników firmy. Każdy pracownik w sytuacji zagrożenia musi wiedzieć jakie są jego obowiązki w przypadku zauważenia awarii. Szybka reakcja pracownika może spowodować, że skutki awarii będą mniejsze.
  2. Sposób reakcji na zagrożenie. - Musi zostać opracowana procedura postępowania w przypadku wystąpienia zagrożenia. Konieczne jest, aby awaria została jak najszybciej zauważona, zlokalizowana, zdiagnozowana i zgłoszona odpowiedniemu działowi.
  3. Plan naprawy szkody. Powinny zostać wypracowane odpowiednie zasady naprawy, które mogą zostać zastosowane, jeżeli wystąpi taka potrzeba. Nie można przewidzieć typu awarii która wystąpi, ale w planie awaryjnym musi być kilka najbardziej prawdopodobnych scenariuszy, które w razie potrzeby można szybko zastosować.
  4. Procedury działania. Pracownicy w przypadku wystąpienia szkody muszą wiedzieć, co należy do ich obowiązków. Należy stosować się do wyznaczonych poleceń, co pozwoli uniknąć nieprzemyślanych i chaotycznych działań.
  5. Dokumentacja. Każde działanie podjęte ku usunięciu awarii musi zostać szczegółowo opisane. Może się okazać, że awaria jest bardziej skomplikowana niż początkowo zakładano i konieczne będzie skorzystanie z usług firmy odzyskującej dane. Dokładny opis awarii znacznie skróci proces odzyskiwania danych.
  6. Szczegóły systemu. W każdym planie awaryjnym muszą znajdować się szczegóły dotyczące systemu informacyjnego, którego dotyczy plan. Mowa o: spisie inwentaryzacyjnym całego używanego sprzętu, szczegóły konfiguracji systemu, dane o posiadanych kopiach zapasowych i tym podobne.

Poziomy rozwiązania disaster recovery

Klasyfikacja rozwiązań odtwarzania awaryjnego usystematyzowana jest według rosnącej kompleksowości i złożoności rozwiązania oraz malejącego czasu wymaganego do otworzenia danych.

  1. Kopia lokalna składowana lokalnie - brak udokumentowanych procedur i planu awaryjnego, brak określonego czasu odtworzenia, możliwość braku możliwości odtworzenia po awarii.
  2. Kopia lokalna składowania zewnętrznie - zdefiniowany plan awaryjny i procedury, zabezpieczenie danych lokalną kopią zapasową fizycznie oddaloną, odtworzenie danych możliwe tak szybko jak odtworzenie infrastruktury.
  3. Kopia lokalna i ośrodek zapasowy - zdefiniowany plan awaryjny i procedury, kopia zapasowa zabezpieczona w ośrodku zapasowym, odtworzenie danych zależy od stopnia gotowości ośrodka zapasowego.
  4. Kopia zdalna w ośrodku zapasowym - wymagania disaster recovery są podwyższone, zdefiniowany plan awaryjny i procedury, kopia zdalna w ośrodku zapasowym, ośrodek zapasowy musi mieć przynajmniej odpowiednią przestrzeń dyskową do odbioru kopii zdalnej.
  5. Aktywny ośrodek zapasowy - wymagania disaster recovery są wysokie, udokumentowany plan awaryjny i procedury, dane zabezpieczone kopią zdalną w ośrodku zapasowym, bardzo szybkie odtwarzanie, kompletne wyposażenie i personel ośrodka, wymagane połączenie sieciowe, które umożliwi produkcję w ośrodku zapasowym.
  6. Zapis jednoczesny - wymagania disaster recovery są bardzo wysokie, udokumentowany plan awaryjny i procedury, zabezpieczenie danych poprzez mechanizm replikacji w ośrodku zapasowym, dane są aktualne, a ich odtwarzanie bardzo szybkie, wymagane istnienie połączeń sieciowych między ośrodkami umożliwiające produkcję w ośrodku zapasowym i zapewniające nieznaczne opóźnienia w replikacji danych.
  7. Brak utraty danych - wymagania disaster recovery są najwyższe, udokumentowany plan awaryjny i procedury, poprzez mechanizm zdalnej kopii lustrzanej dane są na bieżąco aktualizowane, bardzo szybkie odtwarzanie.
  8. Automatyczne przełączanie - wymagania disaster recovery są najwyższe, udokumentowany plan awaryjny i procedury, poprzez mechanizm zdalnej kopii lustrzanej dane są na bieżąco aktualizowane, automatyczne odtwarzanie, wymagane połączenie sieciowe umożliwiające produkcję w ośrodku zapasowym i zaimplementowane oprogramowanie automatycznego zarządzania disaster recovery (J. Łagowski (2004) s. 146-151).


Disaster recoveryartykuły polecane
Nadzór nad dokumentamiOdzyskiwanie danychAktualizacja oprogramowaniaSystem zarządzania przebiegiem procesówChmura obliczeniowaPodatność informatycznaCechy stanowiska pracyIntegralność danychModelowanie procesów

Bibliografia


Autor: Julia Witana