Aby zapewnić ciągłość działania przedsiębiorstwa, powielamy wszystko – począwszy od linii zasilających, poprzez agregaty prądotwórcze, zasilacze UPS, obwody prądowe doprowadzone do szaf serwerowych, łącza internetowe, na replikowanych w trybie aktywnym macierzach i zautomatyzowanej wirtualizacji skończywszy. Idąc krok dalej, firmy wykupują usługi kopii zapasowej danych czy replikacji do innego oddalonego data center. Ale czy te inwestycje są ekonomicznie uzasadnione? I co ważniejsze – czy to nas ustrzeże przed coraz bardziej realnymi zagrożeniami blackoutu, działań o podłożu terrorystycznym, czy katastrofami naturalnymi?
Zamiast inwestować w redundancję wszystkiego, warto rozważyć prostą usługę replikacji systemów do chmury publicznej. W All for One Poland rozwijamy kompetencje w usługach chmurowych, w tym usługach opartych na chmurach publicznych Microsoft Azure, Amazon Web Services (AWS) oraz czy Google Cloud. Na podstawie tych doświadczeń z sukcesem przeprowadziliśmy projekt uruchomienia replikacji środowiska firmy Ramirent w ramach usługi Microsoft Azure Site Recovery, wraz ze złożonymi testami przełączenia całości rozwiązania do chmury publicznej.
DRC w Azure
Ramirent to lider w wypożyczaniu sprzętu budowlanego, podnośników, kontenerów i rusztowań w Polsce. Należy do europejskiej grupy z siedzibą w Finlandii. Na polskim rynku Ramirent obecny jest od 2000 r., a współpraca między naszymi firmami rozpoczęła się w 2010 r., właśnie od replikacji ich systemów do dwóch Data Centers All for One Poland. Z biegiem lat usługa ewoluowała poprzez kolokację infrastruktury klienta, zarządzanie siecią WAN, do obecnego modelu, gdzie 100% systemów jest hostowanych i zarządzanych (do poziomu systemów operacyjnych i baz danych) przez All for One Poland.
Przeszło 90% systemów Ramirent jest opartych na systemach Microsoft Windows, dlatego naturalnym kandydatem do usługi Disaster Recovery Center (DRC) była chmura publiczna Microsoft Azure. Maszyny wirtualne z Data Center w All for One Poland, oparte na rozwiązaniach wirtualizacji VMware, są replikowane do usługi Microsoft Azure Site Recovery (ASR) w formacie Hyper-V. Do tego wykorzystano najnowszą dostępną wersję usługi ASR o nazwie Modernized. Po stronie maszyn zabezpieczanych usługą ASR wymagana jest instalacja oprogramowania klienckiego, tzw. klient Mobility. Azure zapewnia automatyczną aktualizację komponentów tej usługi zarówno na serwerze replikacji, jak i na wirtualnych serwerach klienckich. Usługa replikacji została tak przez nas zaprojektowana, by w przypadku awarii lub testu po stronie Azure została zachowana oryginalna adresacja IP.
Dla głównego systemu bazodanowego klienta został zaimplementowany proces replikacji danych w środowisku bazodanowym Microsoft SQL Server. Takie rozwiązanie pozwala na automatyczne przesyłanie i przywracanie kopii zapasowych dla transakcyjnych dzienników do drugiej instancji bazy danych (druga instancja może działać na innym logicznym serwerze wirtualnym). Replikacja następuje z częstotliwością co 5 minut z serwera po stronie Data Centers All for One Poland i te dane odtwarzane są co 15 minut na serwerze w chmurze Azure.
Ze względu na specyfikę Microsoft Azure maszyny wirtualne uruchomione w chmurze muszą mieć inne parametry vCPU/RAM – to znaczy mogą być one takie same lub większe w porównaniu do parametrów oryginału. Wynika to z wymogu stosowania tzw. Size w Azure, czyli predefiniowanych wzorców maszyn wirtualnych posiadających określone ilości vCPU i RAM.
Dostęp do środowiska Azure DRC jak i utrzymanie oraz zapewnienie bezpieczeństwa infrastruktury sieciowej w Azure jest realizowany poprzez FortiGate Virtual Appliance (FGVA). Umożliwia ono rozszerzone funkcjonalności ponad te dostępne w standardowych rozwiązaniach Azure. FGVA jest odpowiedzialny za bezpieczeństwo ruchu przychodzącego oraz wychodzącego poza chmurę Azure, odpowiada za granulację ruchu pomiędzy sieciami wewnątrz Azure, a także pełni funkcję koncentratora VPN zarówno dla kont SSL VPN, jak i tuneli Site-to-Site. FGVA oraz wcześniej wspominany system bazodanowy to jedyne maszyny wirtualne pracujące na co dzień po stronie Azure w ramach usługi DRC.
Celem zapewnienia najwyższego bezpieczeństwa oraz odpowiedniego poziomu przepustowości w rozwiązaniu DRC zastosowano tzw. Azure ExpressRoute – dedykowane, prywatne połączenie pomiędzy DataCenter All for One Poland a strukturą Microsoft Azure w regionie położonym na terminie Unii Europejskiej. Połączenie to umożliwia gwarantowany poziom transmisji danych bez użycia połączeń przez sieć Internet. Na wypadek awarii rozwiązania ExpressRoute dodatkowo skonfigurowano równoległe połączenie VPN Site-to-Site, celem zapewnienia ciągłości replikacji danych do DRC.
Ciągłość działania w chmurze
Zapewnienie ciągłości działania to jedno z najważniejszych zadań, jakie biznes stawia przed IT. Dlatego od lat inwestujemy w nowoczesne rozwiązania zapewniające nam bezpieczeństwo i podążamy za trendami, jakie wynikają zarówno z rozwoju technologii, jak i sytuacji geopolitycznej. Usługa Microsoft Azure Site Recovery jest jednym z kroków na tej ścieżce. Innym jest zapewnienie sobie wsparcia merytorycznego i operacyjnego. W naszym przypadku są to specjaliści All for One Poland, z którymi współpracujemy od kilkunastu lat, powierzając im nasze systemy.
Polski oddział Ramirent jako pierwszy w grupie korzysta z usługi Disaster Recovery Center w chmurze publicznej. Cieszę się, że we współpracy z zaufanym partnerem możemy być liderem i dzielić się tymi doświadczeniami z kolegami w innych krajach.
Kamil Lisiecki, IT Manager, Ramirent
Testy, testy
Poprawnie skonfigurowane środowisko DRC to jednak dopiero połowa sukcesu. Każdy system zapasowy powinien przechodzić regularne testy. Nie inaczej jest w tym przypadku, gdzie wspólnie z Ramirent przeprowadzamy cyklicznie test niedostępności środowiska podstawowego. Podczas testu symulowana jest niedostępność obu Data Centers All for One Poland. Wykonywane są wtedy procedury DRC, w ramach których uruchamiane jest kompletne środowisko produkcyjne w chmurze Azure. Środowisko to następnie jest testowane przez użytkowników klienta, którzy weryfikują zarówno kompletność systemów oraz danych, jak i ich wydajność. W zależności od ustalonego scenariusza, po zakończeniu testów DRC możliwe są dwa podejścia:
- Usunięcie całego środowiska testowego w Azure i przywrócenie komunikacji ze środowiskiem po stronie Data Centers, a następnie zestawienie na nowo replikacji do Azure;
- Wykonanie replikacji zwrotnej z Azure do środowiska podstawowego po stronie Data Centers.
Poniższy schemat przedstawia pełen cykl synchronizacji maszyny wirtualnej do chmury Azure oraz synchronizację powrotną.
W przypadku awarii systemów podstawowych i uruchomienia środowiska produkcyjnego w Azure należy zapewnić mu ciągłość działania. W tym celu scenariusz DRC obejmuje również uruchomienie kopii zapasowych zgodnie z oryginalnym harmonogramem ich wykonywania w ramach Azure Backup Center do innego europejskiego regionu oraz włączenie monitoringu tych usług.
Rozwiązanie replikacji całego środowiska do chmury publicznej Microsoft Azure pozwoliło przygotować firmę Ramirent na przywrócenie ciągłości działania w krótkim czasie w zupełniej innej lokalizacji geograficznej. Podobnie jak poprzednio, za utrzymanie i administrację usługi odpowiada All for One Poland.
Ramirent jest największym w Polsce dostawcą innowacyjnych rozwiązań w zakresie wynajmu sprzętu budowlanego i rusztowań. Na polskim rynku jest obecny od 2000 r. W ofercie wynajmu ma sprzęt budowlany, podnośniki, kontenery, rusztowania, podesty, platformy i dźwigi. Sieć oddziałów liczy ponad 40 jednostek na terenie całego kraju oraz specjalne oddziały projektowe, dedykowane konkretnym inwestycjom budowlanym. Firma zatrudnia około 370 profesjonalnie przygotowanych specjalistów, ekspertów z zakresu poszczególnych grup sprzętowych i wynajmu. Ramirent jest marką znaną w skali lokalnej i europejskiej.