IT Disaster Recovery Plan w wersji mini

IT Disaster Recovery Plan w wersji mini

Krótko i konkretnie o tym, co powinno się znaleźć w Planie Odtwarzania po awarii dla obszaru IT. Kto zmierzył się z tym tematem ten wie, że są atrakcyjniejsze formy spędzania czasu. Mimo wszystko, gdy się już go popełni, satysfakcja gwarantowana 😉 Jeśli zabieracie się za samodzielne opracowanie planu, być może ten artykuł pomoże Wam uporządkować myśli.

Dla porządku, IT Disaster Recovery Plan jest częścią Zarządzania Ciągłością Działania (Business Continuity Management – BCM), a dokładnie jest jednym z dokumentów Planu Ciągłości Działania. Celem BCM jest zapewnienie dostępności krytycznych procesów i zasobów nawet w sytuacji kryzysowej, a więc na przykład w trakcie awarii. BCM obejmuje wszelkie procesy i zasoby występujące w organizacji. Tymczasem Plan Odtwarzania po awarii skupia się na obszarze teleinformatycznym.

Jak każdy plan, wymaga formy pisemnej. Warto go mieć pod ręką. Co powinien zawierać IT Disaster Recovery Plan, wymieniam w kolejności:

  1. Analiza Ryzyk, czyli przed czym mamy się chronić. Podczas analizy proponuję skupić się na procesach krytycznych. Biznes musi wiedzieć też o pozostałych operacjach, które nie zostaną obsłużone w razie awarii. Pamiętajmy, że to zarząd ostatecznie zdecyduje, które procesy mamy podtrzymać.
  2. Analiza Wpływu na Biznes (BIA) skoro mamy już opisane zagrożenia, to teraz przypisujemy im oddziaływanie. Przyczyna – skutek – konsekwencje. Polecam tutaj proste tabelki i matrycę, która „wyostrza optykę”. Bardzo ważne to wyliczenia, np. koszty przestoju, utraconych korzyści, itd.
  3. Katalog usług i map zależności – to zadanie może być przykre, bo pisanie katalogu usług dla klienta wewnętrznego, gdy służyć ma tylko jednemu celowi, słabo się broni. Jak dla mnie, wystarczy przyłożyć każdy proces krytyczny do odpowiedniego systemu czy aplikacji i tak powstanie nam lista zasobów, które musimy podtrzymać podczas awarii.
  4. Parametryzacja RTO & RPO, czyli określamy dla każdego procesu oczekiwany czas odtworzenia oraz akceptowalny przez organizację poziom utraty danych. Namawiam, by „odczarować” akronimy.

Koniecznie trzeba zrobić przymiarkę, ile będzie kosztował przyjęty zakres ochrony. Jeśli poza podstawowymi procesami mamy chronić także coś więcej, koniecznie sprawdźmy czy to ekonomicznie uzasadnione. Znowu, niech zdecyduje biznes.

Według mnie to najważniejsze punkty IT Disaster Recovery Planu. Mniej znaczy więcej. Zawsze można coś dopisać 🙂

Darmowa konsultacja - anty.expert

Czy kopia zapasowa (backup) to ratunek od przestoju?

Czy kopia zapasowa (backup) to ratunek od przestoju?

Po co nam usługi disaster-recovery, przecież my nie żyjemy w Ameryce. W końcu jakie jest prawdopodobieństwo katastrofalnego zdarzenia, które akurat zniszczy nasz budynek? Uwielbiam taką retorykę! A już Albert Einstein mówił: „Wyobraźnia jest ważniejsza od wiedzy, ponieważ wiedza jest ograniczona”. Proponuję zatem nieco poszerzyć nasze horyzonty i rozważyć, czy rzeczywiście w każdym przypadku dobrze wykonany backup to ratunek od przestoju.

Skojarzenie dotyczące katastrof najczęściej bierze się z rozdzielnego tłumaczenia wyrazów „disaster” i „recovery”. Wówczas krążymy wokół zdarzeń kategorii: tornado, upadek statku powietrznego, pożar czy powódź. Tymczasem już Google Translator to zestawienie wyrazów tłumaczy jako: „odzyskiwanie po awarii”. A że awaria me wiele imion i zwykle wydarzy się w najgorszym momencie, to i jest miejsce na rozważania czy ten firmowy backup to na pewno odpowiedź na każdą sytuację. Odpowiedź oczywiście jest przecząca.

Pora na konkrety. Kiedy zdecydowanie potrzebujesz usług disaster-recovery:

  1. Jeśli przetwarzasz dane we własnej serwerowni, która nie spełnia standardu Uptime Institute Tier II lub ANSI/TIA-942 Tier 2.
  2. Gdy nie dublujesz kluczowej infrastruktury (serwery, przełączniki) i nie stosujesz mechanizmów wysokiej dostępności (high availability).
  3. Gdy sprzęt, którego używasz ma więcej niż 3 lata i jest już po gwarancji.
  4. Jeśli Twój kontrakt serwisowy z dostawcą przewiduje naprawę lub wymianę w następnym dniu roboczym (np. 8x5xNBD).
  5. Jeśli godzinna przerwa w dostępności choćby jednego serwera jest biznesowo nie do zaakceptowania.
  6. Jeśli nie masz własnego zespołu IT lub masz tylko jednego fachowca.
  7. Gdy nie masz ubezpieczenia typu business interruption rozszerzonego o systemy IT i dane[1].
  8. Jeśli przywracanie z kopii zapasowej krytycznego serwera zajmuje kilka godzin.

Nawet jeśli tylko jeden z punktów pasuje do sytuacji jaką masz w firmie, powinieneś poważnie rozważyć usługi z zakresu disaster-recovery, np. DRaaS. Jeśli pasujących punktów jest więcej (wyłączając oczywiście pkt. 5 i 7), wówczas ryzyko wystąpienia przestoju jest bardzo wysokie. Kopia zapasowa jest niezbędna, jednak nie przywróci normalnego funkcjonowania, gdy pojawi się problem sprzętowy. W takiej sytuacji potrzebny jest szybki start na innym sprzęcie np. w zapasowej lokalizacji lub w chmurze publicznej dostawcy nawet w ciągu 15 minut.

[1] na dzień pisania tego artykułu w Polsce nie znalazłem takiej oferty.

Darmowa konsultacja - anty.expert

Od kogo DRaaS w Polsce? Lista dostawców DRaaS

Od kogo DRaaS w Polsce? Lista dostawców DRaaS

Od pierwszego zestawienia dostawców DRaaS w Polsce minęły ponad 3 lata. Od tego czasu, przybyło nowych usługodawców, a lista doczekała się 3 aktualizacji. Najnowszy wpis z 19 grudnia 2021 znajdziecie tutaj.

Poniżej oryginalny artykuł z 31 lipca 2018.


Lista ta powstała w bólach. Znalezienie polskiego dostawcy DRaaS gotowego do natychmiastowego świadczenia usługi nie jest łatwe. Najpierw trzeba odszukać tych, którzy wiedzą o czym mówią. Następnie wyłuskać nielicznych, którzy mają gotowe usługi. Chwilami z badacza zmieniałem się w detektywa. W efekcie lista jest krótka, a na dodatek wcale nie miała powstać…

Klient wrzucił mnie na minę. Zostałem poproszony o wsparcie w procesie wyboru dostawcy DRaaS (Disaster Recovery as a Service). Szczerze, od razu podałem kandydata. Klient jednak chciał sam dokonać wyboru. Potrzeba trzech dostawców. Pomyślałem, że to banał. A potem zaczęła się jazda. I tak, niejako mimochodem, powstał pomysł sporządzenia listy dostawców DRaaS w Polsce.

Ważna rzecz – kryteria wyboru. Prowadzony projekt dostarczył mi inspiracji. Oto klient chciał by dostawcy byli krajowi oraz by zastosowanie miało nasza polska legislacja. Najważniejsze jednak, aby przetwarzanie danych było w granicach RP – czyli DRaaS w polskiej chmurze. Drugie kryterium to gotowość do świadczenia usługi. Tylko dostawcy, którzy deklarowali, że są w stanie w ciągu 48h udostępnić usługę do testów trafili na listę. Chodziło o to by wyłonić usługodawców mających gotowe środowisko w architekturze wielu najemców. Oferty takich firm istotnie różnią się cenowo od propozycji dostawców projektowych.

Dla porządku muszę też napisać, że praktycznie każde centrum danych może zaoferować usługę centrum zapasowego (DRC, DR Site), a czasem także wirtualnego centrum zapasowego (VDRC). Ten zakres usług to jednak nie SaaS (poziom aplikacji), czyli nie DRaaS. To w zasadzie wynajęcie miejsca w szafach (kolokacja), transmisja danych oraz najem sprzętu, i/lub licencji. To tradycyjne podejście do odtwarzania po awarii, podejście kosztowniejsze.

Nie wszystko złoto co się świeci. Proszę się nie dziwić, że w zestawieniu nie ma wielu rynkowych graczy. Owszem, o usługach z zakresu Disaster-recovery piszą prawie wszyscy, jest to jednak bardziej działanie policzone na zyskanie ruchu organicznego w wyszukiwarce Google (SEO), niż faktyczna oferta. W internecie znaleźć można też dostawców, którzy niefrasobliwie miksują definicje (o tym tutaj), niestety to także utrudnia zadanie poszukującym dostawcy konkretnej usługi.

Planowanie odtwarzania po awarii – 7 grzechów głównych

Planowanie odtwarzania po awarii – 7 grzechów głównych

Jako samozwańczy „ewangelista” z zakresu ciągłości działania – czuję się usprawiedliwiony sięgając po katechizm 😉 Nie będę jednak prawił kazań. Opowiem tylko o typowych błędach jakie towarzyszą planowaniu odtwarzania po awarii, pamiętając przy tym o lekkostrawnej formie.

    1. Pycha. Nam się nic nie przytrafi. Zadziwiająco często spotykam menadżerów którzy jak mantrę powtarzają: „Przecież nigdy się to nie zdarzyło, po co więc chronić się przed takim ryzykiem?” Wtedy zalecam BIA (Analiza wpływu na biznes), która wprost odpowiada na pytanie czy warto czy też nie.
    2. Chciwość. Ta inwestycja nie przyniesie pieniędzy. Biznes nie lubi inwestować gdy nie widzi policzalnych zwrotów. Ciągłość działania porównać można do polisy ubezpieczeniowej, gdzie nakłady to koszt. Niestety, nie wiadomo, czy zaangażowane środki się zwrócą – czyli czy na przykład dzięki nim uratujemy organizację od przestoju. Pozostaje chłodna analizy ryzyk i ich wpływu na biznes oraz kosztów przestoju.
    3. Nieczystość. Nadmiarowość to nie odtwarzanie po awarii. Posiadanie klastra wysokiej dostępności, wyeliminowanie pojedynczych punktów awarii infrastruktury czy świetnie zabezpieczone centrum danych to solidny fundament ciągłości działania. Nie jest to jednak ochrona przed każdym ryzykiem. Przeciętny informatyk wyrwany ze snu bez wahania wskaże kilka scenariuszy, które zatrzymają IT Twojego przedsiębiorstwa.
    4. Zazdrość. Pomijanie właścicieli procesów. Zapominamy, lub co gorsza nie chcemy włączyć do planowania wszystkich interesariuszy. To strzał w kolano. Bez ich wiedzy nie będzie skutecznego odtworzenia po awarii.
    5. Nieumiarkowanie. Wszystko jest krytyczne. Klasyka. Zwykle, gdy zespół IT arbitralnie decyduje o tym, jakie zasoby mają być zabezpieczone na wypadek awarii, mamy sytuację, w której zasoby centrum zapasowego równe są zasobom centrum podstawowego.
    6. Gniew. Dlaczego działa tak wolno? Aspekt wydajności środowiska zapasowego jest częstym zarzewiem konfliktów wewnętrznych i zewnętrznych. Pamiętajmy, że to proteza, niezbędna do czasu powrotu stanu normalnego. Mamy podtrzymać procesy krytyczne. Poza tym testujmy praktycznie nasz plan odzyskiwania po awarii.
    7. Lenistwo. Zbytnie zaufanie do dostawcy DRaaS. Odtwarzanie po awarii jako usługa wymaga zaangażowania każdej strony umowy. Dostawca odpowiada za technologię i zasoby po swojej stronie. My natomiast, zadbajmy o uruchomienia testowe czy też cykliczne aktualizujmy plan odtwarzania po awarii. Przy okazji, zmianie może ulec zapotrzebowanie na zasoby dostawcy.

Darmowa konsultacja - anty.expert

Ciągłość Działania

Ciągłość Działania

Zbyt wielu menadżerów uważa, że Ciągłość Działania to fanaberia bogatych firm, które mają dużo wolnych zasobów.  Często też pada argument, że prawdopodobieństwo zdarzenia, które unieruchomi organizację jest na tyle małe, że nie warto poświęcać temu czasu. Poza tym, przecież w razie czego coś wymyślimy, prawda? Jeśli masz podobną opinię i nie masz obaw, że zakłócę Twoje dobre samopoczucie, zapraszam do lektury.

Czym właściwie jest Ciągłość Działania (Business Continuity)?  Napiszę własnymi słowami, bez książkowych definicji. Chodzi o to, by działać nieprzerwanie. Proste? Mamy być przygotowani na nieprzewidziane i właśnie na takie okoliczności zbudować scenariusze przetrwania. Skuteczna reakcja firmy w sytuacji kryzysowej minimalizuje przestój. Zespół ma wiedzieć co należy robić. Jako że takie momenty w życiu firmy mogą zadecydować o jej przyszłych losach, nie ma tu miejsca na improwizację.

W planowaniu Ciągłości Działania, pod uwagę bierzemy zarówno zagadnienia techniczne – awarie maszyn, systemów IT jak i obszar biznesu, w tym problemy naszych dostawców, oraz kapitał ludzki. Dla uproszczenia, organizacje skupiają się zazwyczaj na procesach krytycznych. Czyli takich, które warunkują przetrwanie. Wskazuje je nam analiza BIA (Business Impact Analysis), czyli Analiza Wpływu na Biznes.

Kto się powinien tym zająć? Ciągłość Działania to już planowanie strategiczne, a więc obszar odpowiedzialności zarządu. W praktyce, cała organizacja musi być zaangażowana w planowanie. W szczególności właściciele procesów, czyli osoby odpowiedzialne, za poszczególne odcinki, np.: sprzedaż, marketing, zaopatrzenie, itd. I choć, cechą immanentną menadżera jest przewidywanie i szacowanie ryzyk, to jednak nasza orientacja na sukcesie rynkowym wycelowana jest w pogoń za przychodami. I w tej gonitwie, często ginie nam dbałość o zdolność do wywiązania się z powziętych zobowiązań, czyli realizację pozyskanych zleceń bez względu na okoliczności.

Niestety, ciągle jeszcze problematyka z zakresu zapewnienia Ciągłości Działania dla małych i średnich firm w Polsce, to temat tabu. Mało kto o nim wie, a jeśli już, to zagadnienie spychane jest na bliżej nieokreśloną przyszłość. Mimo odpowiedzialności Zarządu przed udziałowcami czy akcjonariuszami, w tym odpowiedzialności osobistej, nie przejawiamy zainteresowania przetrwaniem firmy, którą zarządzamy. Czy to się zmieni? Jak pokazują doświadczenia naszych europejskich sąsiadów, raczej tak.

Darmowa konsultacja - anty.expert