Ciągłość działania Centrum Danych

Ciągłość działania Centrum Danych

Od czasu do czasu, gdy dochodzi do katastrofy, czyli zdarzenia o naturze niszczącej, pojawia się pytanie o granice odpowiedzialności operatora Centrum Danych. Wówczas też, wiele osób z branży, samozwańczo przywdziewa szaty eksperta od Odtwarzania Awaryjnego rozumiejącego Ciągłość Działania Centrum Danych. Z takim nadaniem, bez pardonu biczuje zwykle nieszczęśnika. Zazwyczaj, chodzi o to, że w opinii „ekspertów”, wszystko powinno być zdublowane. Najlepiej replikowane do innego Data Center. Tylko, czy aby na pewno? Czy operator ośrodka przetwarzania może zabezpieczyć przed katastrofą każdego klienta?

Zacznę od przekrojowego przedstawienia usług świadczonych przez typowe Data Center, bo zrozumienie tego aspektu jest kluczowe. Nie jest tak, jak uważa wielu, że Centrum Danych zajmuje się głównie dostarczaniem chmury publicznej. Ba, większość biznesu dla typowego DC, to kolokacja, wynajem kiosków, czy całych komór. Dochodzą także tzw. dedyki, czyli instalacje serwerowo-sieciowe przygotowywane dla konkretnego klienta. Dopiero na końcu stawki są usługi przetworzone, repozytoria, archiwizacja, backup i chmura publiczna oraz prywatna plus różne usługi dodatkowe.

Widzicie już pewnie do czego zmierzam. Co usługodawca może wiedzieć o Planie Odtwarzania Awaryjnego klienta, który wynajmuje u niego 2 szafy rack postawione obok siebie? Operator świadczy w tym przypadku usługę kolokacji. Zapewnia szafy, dostarcza zakontraktowaną moc (prąd), realizuje połączenia sieciowe i dba odpowiednie warunki środowiskowe (temperatura, wilgotność powietrza, itp.). Natomiast, nie ma wiedzy o tym, co klient w tych szafach trzyma. Albo weźmy klaster serwerów dedykowanych, które klient odbiera do poziomu wirtualizatora. Czy taka usługa jest odporna na pożar Centrum Danych? Kompletnie nie! Chyba że klient wykupi sobie podobna usługę w innym DC i zsynchronizuje te zasoby. Może też robić kopie zapasowe lub nabyć usługę DRaaS. Ważne przy tym, by repliki składować w innym ośrodku. Zatem, czy operator Centrum Danych może samodzielnie zabezpieczyć klienta przed katastrofą? Bez jego chęci i woli, nie ma o tym mowy.

Trochę inaczej wygląda to z perspektywy hiperskalerów, które budują ośrodki przetwarzania wyłącznie na potrzeby swoich chmur. Jednak, nawet i w tym przypadku nic nie dzieje się samo.

Nie wiem, czy słyszeliście o „wspólnej odpowiedzialności” (shared responsibility)? Dostawcy chmury publicznej jasno definiują, za co odpowiadają przy każdym z typów usług. Gdy uruchamiamy serwer wirtualny (VPS), sami musimy zadbać o jego ciągłość działania. Służy temu na przykład Site Recovery (Azure), oczywiście to usługa dodatkowo płatna. Jeśli nie zdecydujemy się na takie zabezpieczenie, będziemy musieli pogodzić się z ewentualnymi konsekwencjami, w razie katastrofy.

Wszystko ma swoją cenę. Nie zapłacisz teraz, zapłacisz później, zwykle jeszcze więcej. Dlatego, analizując ryzyka, ważmy koszty ich materializacji. Zestawmy ze sobą, całkowite koszty przestoju oraz odtwarzania awaryjnego. Dodajmy konsekwencje utraty wizerunku i klientów. Porównajmy to z ceną usługi, nawet na 3 lata, która ten przestój skróci lub wyeliminuje. Dodajmy jeszcze do tego nasz święty spokój, który dostajemy w bonusie 🙂 . Taka jest właśnie recepta na ciągłość działania bez względu na to jakie Centrum Danych wybierzemy.

Darmowa konsultacja - anty.expert

Lista dostawców Disaster Recovery

Lista dostawców Disaster Recovery

Ekosystem usługodawców i znawców odtwarzania awaryjnego operujących w Polsce to ciągle jeszcze mała enklawa. Firm i osób znających ten obszar jest mało. Jeszcze mniej jest tych, dla których DRaaS, czy DRC stanowią ważną linię biznesu. Lista będzie aktualizowana, więc warto zaglądać.

Od pierwszej wersji Listy dostawców DRaaS minął ponad rok. Wówczas zestawienie powstało przy okazji projektu. Właściwie to mój klient miał wpływ na większość kryteriów wyboru (zainteresowanych odsyłam do pierwotnego artykułu). Tym razem zaprosiłem do udziału zarówno usługodawców dysponujących Odtwarzaniem awaryjnym w postaci usługi (Disaster Recovery as a Service) jak i klasycznych dostawców Centrów Awaryjnych (Disaster Recovery Center/Site). Nie zamykam listy usługodawcom mających centra danych poza obszarem RP. Najważniejsze by podmioty działały w Polsce i podlegały polskiej legislacji. Z każdym zatem możecie śmiało rozmawiać w naszym języku. Żeby było łatwiej dotrzeć do właściwych osób, podaję Wam nazwiska, rozumiecie – RODO. Dane teleadresowe znajdziecie na stronach dostawców.

Zestawienia tym razem w postaci tabelarycznej, by można było łatwo poddać je własnej edycji. Każdą tabelkę możecie skopiować lub pobrać w kilku formatach. Na początku prezentuję usługodawców DRaaS, a następnie firmy oferujące DRC/VDRC/DRS (więcej o terminologii znajdziecie w tym artykule). Nadmienię, że niektórzy dostawcy DRaaS także realizują usługi projektowe.

Dostawcy DRaaS

Czyli Odtwarzanie awaryjne w postaci usługi. Skrócona charakterystyka:

  • Natychmiastowa dostępność, bo to architektura wielu najemców, czyli środowisko jest i czeka na klientów.
  • Niski koszt usługi, gdyż zazwyczaj formuła SaaS, czyli współdzielenie zasobów powoduje korzyści skali.
  • Trochę ograniczeń wynikających z formy realizacji usługi, technologii i skalowalności.
  • Rozliczenie wyłącznie abonamentowe, a więc póki płacisz używasz.
3S Data Center any.cloud Engave Exea Data Center
Nazwa usługi 3S Cloud2B Disaster Recovery ReVirt DRaaS Doublecloud DRaaS
Strona o usłudze https://cutt.ly/Cloud2B https://cutt.ly/ReVirt https://cutt.ly/Engave https://cutt.ly/Exea
Lokalizacja centrum danych Katowice, Warszawa, Kraków Kopenhaga Warszawa (Netia) Toruń
SLA centrum danych 99.999% 99.999% 99.99% 99.99%
SLA usługi 99.50% 99.9% - 99.99%
ISO 27001 Tak Tak Tak Tak
ISO 22301 Nie Tak Nie Tak
Inne certyfikaty i standardy Veeam Platinum Service Provider, VMware Service Provider Program – Enterprise Level, VMware Solution Provider Program - Professional Level, Fujitsu SELECT Expert Partner ISO 27002, ISAE 3402, SOC2 - TIER III (facility & design)
Czas uruchomienia 4h 1 h 2 h 1 h
Darmowy okres próbny 14 dni 30 dni 14 dni 30 dni
Technologia Veeam Veeam Veeam Veeam
Obsługiwane hypervisory ESXi, Hyper-V ESXi, Hyper-V ESXi, Hyper-V ESXi
Obsługa maszyn fizycznych Tak Nie Nie Nie
Portal usługi Tak Tak Nie https://vac.exea.pl
Metoda rozliczenia Abonament miesięczny, w cenie testy przez 7 dni na m-c. Licencje OS/DB (o ile wymagane) za cały miesiąc. Ryczałt miesięczny za replikację. Uruchomienie awaryjne rozliczane za dzień. Ryczałt miesięczny za replikację. Uruchomienie awaryjne rozliczane za użycie. Ryczałt miesięczny za replikację. Uruchomienie awaryjne rozliczane za godziny (raz na pół roku). Licencje OS/DB (o ile wymagane) za cały miesiąc.
Wynajem licencji OS/DB Tak Nie Nie Tak
Minimalne RPO 15 min 5 min 15 min 15 min
Minimalne RTO 30 min 15 min 120 min 15 min
Konfiguracja środowiska klienta Tak Tak Tak Tak
Plan odtwarzania awaryjnego Tak Tak Tak Tak
Okres związania umową miesiąc 3 miesiące 6 miesięcy miesiąc
Cykl rozliczeniowy miesiąc miesiąc miesiąc miesiąc
Kontakt handlowy solutions@3s.pl Michał Drąg Tomasz Strugalski Marcin Zawadzki, Dawid Goljat

Dostawcy DRC / VDRC / DR Site

Najczęściej dla wymagających klientów. To klasyczne podejście, czyli projektowe, a więc na zamówienie przygotowanie środowiska odtwarzania awaryjnego. Składowe usługi to zwykle: kolokacja, najem sprzętu (opcja), konfiguracja (opcja) transmisji danych i serwis. Krótka charakterystyka usług w zakresie Disaster Recovery Center:

  • Uruchomienie usług zależne od wielkości projektu, zwykle zajmuje kilka lub nawet kilkanaście tygodni.
  • Wysoki koszt usług, który kształtuje amortyzacja sprzętu kupionego pod projekt.
  • Duża dowolność w sposobie realizacji usługi.
  • Rozliczenie zwykle mieszane – inwestycja i abonament.
3S Data Center Atman Exea Data Center DataCenter PPNT
Nazwa usługi DRC DRC DRaaS DC PPNT
Strona o usłudze https://cutt.ly/Priv_Cloud www.atman.pl https://exea.pl https://datacenterppnt.pl/pl
Lokalizacja centrum danych Katowice, Warszawa, Kraków Warszawa (Grochowska, Konstruktorska), Katowice Toruń Poznań
SLA centrum danych 99.999% 99.99% 99.99% 99.50%
ISO 27001 Tak Tak Tak Tak
ISO 22301 Nie Nie Tak Nie
Inne certyfikaty i standardy TIER III/3, ISO 9001, Świadectwo Bezpieczeństwa Przemysłowego I stopnia ISO 9001, DCOS TIER III (facility & design) ISO 20000-1, ISO 9001
Certyfikacje producentów Veeam Platinum Service Provider, VMware Service Provider Program – Enterprise Level, VMware Solution Provider Program - Professional Level, Fujitsu SELECT Expert Partner - VMware Enterprise Cloud Provider, Veeam Gold Pro Partner, Microsoft Silver Partner, VMCE Veeam Gold Cloud Provider, Microsoft Partner Datacenter Silver, Vmware Professional Service Provider Partner, MCSA
Model rozliczeniowy Opex, Capex Capex, Opex Opex Opex
Wynajem licencji OS/DB Tak Tak Tak Tak
Konfiguracja środowiska klienta Tak Tak Tak Tak
Plan odtwarzania awaryjnego Tak Tak Tak Tak
Okres związania umową 12 miesięcy brak 12 miesięcy brak
Cykl rozliczeniowy miesiąc miesiąc miesiąc miesiąc
Kontakt handlowy solutions@3s.pl drc.info@atman.pl Marcin Zawadzki, Dawid Goljat Dominik Bocheński

Darmowa konsultacja - anty.expert

Nadmiarowość, czy odtwarzanie po awarii?

Nadmiarowość, czy odtwarzanie po awarii?

Czym jest uptime i jak się to ma do czasu przestoju?  Ile dziewiątek po przecinku gwarantuje względny spokój, gdy mowa jest o wysokiej dostępności infrastruktury informatycznej? I na koniec, na co postawić: na nadmiarowość czy może na błyskawiczne odtwarzanie po awarii?

Czy wiesz jaki poziom dostępności mają Twoje systemy?  Najlepsze centra danych w Polsce (np.: Atman, Beyond, Exea, Polcom, T-mobile), mogą pochwalić się niezawodnością na poziomie 99,99%. Oznacza to, że ich przestój w skali roku nie przekroczy godziny. Zwracam jednak uwagę, że procenty dotyczą określonych usług. Już tłumaczę. Powiedzmy, że zdecydujemy się na usługę kolokacji, czyli wynajmujemy miejsce w szafach teletechnicznych w centrum danych. Usługodawca deklaruje cztery dziewiątki. Czy w związku z tym nasze środowisko także będzie miało dostępność na poziomie 99,99%? Najprawdopodobniej nie. Wysoka dostępność dotyczy systemów zbudowanych w centrum danych, w tym zasilania, łączności, klimatyzacji, itp. Wystarczy, że architektura naszego rozwiązania została zaprojektowana bez nadmiarowości. Czyli do szaf wynajętych w centrum danych włożymy pojedyncze urządzenia. Wówczas niestety, poziom dostępności naszego środowiska IT będzie równy poziomowi dostępności najsłabszego elementu.

Czas nieprzerwanej pracy systemów określany jako uptime, dotyczy każdego elementu infrastruktury IT. Projektując wysokodostępne środowisko IT należy eliminować pojedyncze punkty awarii. Robimy to dublując urządzenia z najniższym przeciętnym uptime. Właściwie, to robimy to dublując wszystko co się da 🙂 Jedyne odstępstwa dotyczą usług, których niedostępność nie zatrzymuje procesów krytycznych dla działalności operacyjnej. W ten sposób istotnie zmniejszamy ryzyko wystąpienia przestojów. Naturalnie, poszczególne systemy nie muszą mieć jednakowego poziomu dostępności. Ustalanie precyzyjnych wskaźników dla każdej usługi wpływa wprost na poziom nakładów na środowisko IT i na rodzaj i koszt Disaster recovery.

Wysoka dostępność (HA) jest pochodną nadmiarowości. Odtwarzanie awaryjne uznać powinniśmy za uzupełnienie HA, bo odpowiada na problemy, których nie rozwiąże nawet rozproszony geograficznie klaster wysokiej dostępności. Disaster recovery (np. DRaaS) to ostatnia deska ratunku, gdy nasze systemy padną ofiarą cyberataku lub co bardziej prawdopodobne, staną się niedostępne przez jakiegoś wirusa szyfrującego. Moje doświadczenia pokazują, że nadmiarowość i odtwarzanie po awarii, które według najlepszych praktyk ITIL powinny być komplementarne, bardzo często rozdziela tytułowe „czy”.

Darmowa konsultacja - anty.expert

Czy małe i średnie firmy potrzebują Disaster recovery?

Czy małe i średnie firmy potrzebują Disaster recovery?

Znawcy tematu (celowo unikam słowa eksperci) twierdzą, że Ciągłość Działania i Disaster recovery są dla firm z ustabilizowanymi przychodami. Firmy te z natury rzeczy doskonalą procesy. Co Wy na to? No właśnie, jak zwykle to zależy. Czy mała firma udostępniająca swoje systemy transakcyjne klientom i kontrahentom przetrwa kryzys w postaci dwudniowego przestoju serwerów? Pewnie tak, ale statystycznie ma o wiele mniejsze szanse niż firma duża.

W Stanach Zjednoczonych Ameryki, powstała ku przestrodze i pewnie „na zachętę” 😉 pewna statystyka. Mówi się w niej, że aż 93% firm, których centra danych nie funkcjonowały 10 lub więcej dni, ogłosiły upadłość w ciągu roku. Na dokładkę, ponad 60% firm, które całkowicie utraciły dane, zamknięto w przeciągu sześciu miesięcy. Statystyka pochodzi z NARA, czyli National Archives and Records Administration, co w wolnym tłumaczeniu oznacza: Krajową Administrację Archiwów i Rejestrów. Danych źródłowych nie widziałem, ale domyślam się, że próba została dobrana rzetelnie przez wzgląd na rangę instytucji.

Jak to wygląda u nas? Polskich statystyk chyba jeszcze nikt nie zrobił (kto widział lub słyszał niech napisze, odwdzięczę się!). Tyle, że my Polacy jesteśmy bardzo zaradni i nie takie rzeczy przeżyliśmy 😉 A tak na poważnie. Odporność biznesu jest pochodną rodzaju biznesu i rozkładu przychodów. Jeśli na przykład nasze przychody mają liniowy charakter, wówczas nakłady na Ciągłość Działania są niezbędne. Jeśli działamy projektowo, wtedy mamy mniejszą wrażliwość na przerwy dostępności infrastruktury informatycznej i aplikacji.

Pamiętajmy przy tym wszystkim o tym jaką mamy „poduchę”. Chodzi o to, jakie mamy kapitały własne, aktywa szybko zbywalne, stan konta, itd. Zazwyczaj, małe firmy mają płynność opartą na rolowaniu należności. Wówczas, wszelkie zasoby gotówki są w obrocie lub są natychmiast reinwestowane, a limity kredytowe są bardzo małe lub nie ma ich wcale. W takiej sytuacji, przerwa napływu gotówki powoduje natychmiastowe problemy płatnicze. O tym, że jak krytyczna jest płynność finansowa przekonywać nie muszę. Jeśli do tego dołożyć: problemy wizerunkowe związane z przestojem, kary umowne, to niebezpiecznie zbliżamy się do scenariusza, który może położyć firmę. Dlatego, moim zdaniem Disaster recovery jako usługa (DRaaS) to pozycja obowiązkowa dla małego i średniego biznesu.

Darmowa konsultacja - anty.expert