COMPAREX wird SoftwareONE. Ab dem 1. April wird die COMPAREX AG ihren Markenauftritt in SoftwareONE ändern. Die Markenkonsolidierung ist Teil eines laufenden Integrationsprozesses im Zuge des Erwerbs der COMPAREX AG durch SoftwareONE.
Disaster Recovery mit VMware Cloud on AWS

VMware Cloud on AWS

Best Practices für Disaster Recovery

Disaster Recovery mit VMware Cloud on AWS

So gestalten Sie Ihr Disaster Recovery mit VMware Cloud on AWS

Viele Unternehmen, die ihre VMware-Produkte On-Premises betreiben, integrieren VMware Cloud on AWS in ihre Hybrid-Cloud-Strategie, um so von den Vorteilen der AWS Global Infrastructure zu profitieren.

Sobald Unternehmen Hybrid-Cloud-Strategien einplanen, sollten sie sich unbedingt mit dem Thema Disaster Recovery (DR) befassen, um die Aufrechterhaltung des Geschäftsbetriebs im Falle eines Systemausfalls zu gewährleisten.

Im folgenden Beitrag wird näher auf Architektur-Überlegungen und Best Practices für die Implementierung von Disaster Recovery mit VMware Cloud on AWS eingegangen. Der Schwerpunkt liegt dabei auf VMware Cloud on AWS und dem VMware Site Recovery Manager (SRM) Add-on.

Nicht selten führt eine unzureichende Planung einer Notfallwiederherstellung im Ernstfall dazu, dass Services eingestellt und Service Level Agreements (SLAs) nicht eingehalten werden können. Ein solcher Ausfall kann für betroffene Unternehmen immense wirtschaftliche Folgen und einen erheblichen Imageschaden nach sich ziehen.

Disaster Recovery-Möglichkeiten

Um zu verstehen, was Disaster Recovery genau umfasst, nehmen wir die Definition von Gartner als Basis:

“Disaster recovery is defined as (1) The use of alternative network circuits to re-establish communications channels in the event the primary channels are disconnected or malfunctioning, and (2) The methods and procedures for returning a data center to full operation after a catastrophic interruption (including recovery of lost data).”

Disaster Recovery, Gartner Glossary

Anhand dieser Definition soll im Folgenden dargestellt werden, welche Arten von Disaster Recovery möglich sind und wie VMware Cloud on AWS und die zugehörigen Services in diese Überlegung passen.

VMware Cloud on AWS bietet eine Disaster-Recovery-Unterstützung auf vier verschiedenen Ebenen an, die ein breites Spektrum an Komplexität und Dauer umfassen. Auf folgende Schwerpunkte gehen wir näher ein: Backup und Restore, Pilot Light, Warm Standby in AWS und Hot Standby Active/Active.

Vier Disaster-Recovery-Möglichkeiten in AWS (Quelle: VMware)

1. Backup und Restore

Innerhalb von 120 Minuten kann ein Software Defined Data Center (SDDC) mit der Bereitstellung von Workloads loslegen. Genau das ist der Punkt, an dem eine Notfallwiederherstellung nach Bedarf durchgeführt werden kann. Die Möglichkeit, Ressourcen on-demand hochzufahren, ist ein kosteneffizienter Ansatz, der verhindert, dass Ressourcen ungenutzt auf ihren Einsatz warten.

Auf der On-Premises-Seite werden Backups mit Backup-Repositories konfiguriert, die auf Amazon Simple Storage Service (Amazon S3) erweitert werden können. Um dies nutzen zu können, ist ein VMware Cloud on AWS-zertifiziertes Backup erforderlich.

Von dort aus werden die Sicherungsdaten auf der Grundlage einer Zero-Day-Value-Move-Richtlinie, die das operative Wiederherstellungsfenster vorgibt, in den S3-Bucket verlagert.

Disaster Recovery mit Backup- und Restore-Architektur. (Quelle: VMware)

Das passiert in der Architektur, wie oben dargestellt:

  • Amazon Route 53 verarbeitet die DNS-Abfragen an das primäre Rechenzentrum.
  • Der Backup & Replication-Server sichert Workloads im Backup-Repository.
  • Lokale Daten aus dem Backup-Repository werden über AWS Direct Connect oder das Internet in den Capacity Tier in Amazon S3 ausgelagert.
  • Der Wiederherstellungsprozess startet und konfiguriert den VMware SDDC-Cluster in der vorgesehenen AWS-Wiederherstellungsregion über Automatisierungsskripte des Webportals mit vRA oder vCLI.
  • Eine neue Backup-Repository-Instanz wird innerhalb des neu erstellten SDDCs bereitgestellt und konfiguriert.
  • In S3 gespeicherte frühere Daten werden erkannt. Die erste Synchronisierung von Metadaten und Archivindex wird durchgeführt.
  • Die Workloads werden im SDDC-Cluster wiederhergestellt und die Dienste werden wieder online gestellt.
  • Amazon Route 53-Datensatzeinstellungen werden aktualisiert, um Anfragen an das neue sekundäre Rechenzentrum in der Cloud zu leiten.

2. Pilot Light

Mittels Pilot Light lassen sich On-Premises-Produktionsumgebungen auf VMware Cloud on AWS als Wiederherstellungsstandort schützen. Mit der VMware Cloud on AWS benötigen Sie lediglich eine Pilot-Light-Umgebung mit 2 Knoten, sodass Sie Tier-0-Anwendungen und kritische virtuelle Maschinen (VMs) wie sekundäre Domain-Controller jederzeit ausführen können.

Im Ernstfall können Sie dann bei Bedarf aufstocken. Bei diesem Ansatz zahlen die Kunden so lange nur für 2 Knoten, bis ein Notfall sie dazu zwingt, auf mehr Knoten zu skalieren und eine supportete Backup-Lösung zur Wiederherstellung ihrer Workloads zu nutzen.

Bei dieser Methode empfiehlt es sich, ein Skript zu den Wiederherstellungsplänen hinzuzufügen, damit die Hosts in Ihrem SDDC-Cluster automatisch skaliert werden können. Eine weitere Möglichkeit ist der Einsatz von VMware Cloud Disaster Recovery (VCDR), einer kostengünstigen Alternative zur Implementierung einer Pilot-Light-Architektur. Mit VCDR müssen Sie bis zu einer Ausfallsituation keine betriebsbereiten VMware SDDCs haben, bevor VCDR automatisch ein SDDC bereitstellt und Ihre VMs auf dem neuen SDDC wiederherstellt.

Darüber hinaus lässt sich mit VCDR ein kleineres Teilnetzwerk von SDDC-Hosts im Voraus bereitstellen, um kritische Anwendungen mit geringeren RTO-Anforderungen (Recovery Time Objective) wiederherzustellen als bei einem reinen On-Demand-Ansatz.

Dieses Modell eignet sich eher für Kunden, die keine niedrigeren Recovery Point Objectives (RPO) und RTO haben, da die Einrichtung eines SDDC bis zu zwei Stunden dauern kann. Auch die Wiederherstellung Ihrer virtuellen Maschinen kann einige Zeit in Anspruch nehmen, je nachdem, wie viele und wie groß die virtuellen Maschinen sind, die wiederhergestellt werden müssen.

3. Warm-Standby in AWS

Die nächste Möglichkeit ist ein Warm-Standby-Ansatz, d. h. die Bereitstellung der benötigten Ressourcen für die Wiederherstellung Ihrer Tier1- oder geschäftskritischen Services am Wiederherstellungsstandort und die anschließende Skalierung für die Wiederherstellung der weniger kritischen Services mit einer längeren RTO aus Backups mit Elastic Distributed Resource Scheduler.

Die Vorteile dieser Lösung liegen darin, dass Anwender ihre geschäftskritischen Anwendungen schützen und gleichzeitig Kosten sparen können. Die Kunden zahlen im Bedarfsfall für alle DR-Ressourcen und können ohne Unterbrechung DR-Tests für ihre Anwendungen durchführen, ohne dass dies Auswirkungen auf den Geschäftsbetrieb hat.

Wie bereits erwähnt, können Kunden im Notfall oder während der DR-Tests VMs aus Backups skalieren und wiederherstellen, um ihre Wiederherstellungsanforderungen zu erfüllen. VMware SRM kann verwendet werden, um diese Option mit VMware Cloud on AWS zu erreichen.

4. Hot Standby Active/Active

Active/Active-Bereitstellungen werden verwendet, wenn Kunden alle Ressourcen bereitstellen möchten, die für den Betrieb einer vollständigen Produktionsumgebung erforderlich sind. Diese Lösung eignet sich für Kunden, die Active/Active-Rechenzentren betreiben und niedrige RTOs und RPOs haben möchten.

Im Falle einer Störung sind nur geringe oder gar keine Änderungen an der Infrastruktur erforderlich, um sicherzustellen, dass Sie die unmittelbaren Anforderungen des Unternehmens erfüllen können. VMware SRM kann zur Unterstützung dieser Option zwischen On-Premises und VMware Cloud on AWS konfiguriert werden.

Architekturmöglichkeiten für Disaster Recovery

Disaster Recovery kann über VMware Cloud on AWS als Wiederherstellungsstandort mit VMware Site Recovery Manager als DR-Software erfolgen.

Manche Unternehmen waren bisher von den Kosten und der Komplexität einer herkömmlichen Notfallwiederherstellung abgeschreckt und haben daher noch keine Recovery-Lösung implementiert. Für diese Unternehmen ist es nun möglich, mit Site Recovery und VMware Cloud on AWS eine kostengünstige DR einzuführen.

Im Folgenden finden Sie einige Architekturmodelle, die für die Implementierung von VMware Cloud on AWS mit VMware Site Recovery Manager unterstützt werden.

1. Einrichtung einer neuen DR von On-Premises zu VMware Cloud on AWS

Durch den Einsatz von VMware Cloud on AWS und VMware Site Recovery Manager benötigen Unternehmen keine vergleichbare IT-Infrastruktur, um Disaster Recovery zu implementieren.

Darüber hinaus müssen sie kein Colocation-Rechenzentrum anschaffen oder mieten. Stattdessen können sie VMware Cloud on AWS als Wiederherstellungsstandort nutzen und Ressourcen nach Bedarf oder ab einer Reservierung des minimalen vSphere-Clusters in der AWS Cloud verwenden.

Verwendung von VMware Cloud on AWS als neues DR-Ziel (Quelle: VMware)

In dieser Architektur wird VMware Site Recovery Manager auf VMware Cloud on AWS aktiviert und die Komponenten werden on-premises bereitgestellt und mit dem VMware Cloud on AWS SDDC gekoppelt.

Dies ermöglicht die Replikation von VMs auf VMware Cloud on AWS via Internet. Die Verwendung von AWS Direct Connect oder eines virtuellen privaten Netzwerks (VPN) zur Verbindung mit VMware Cloud on AWS für die Replikation virtueller Maschinen wird ebenfalls unterstützt.

2. Ersetzen eines bestehenden DR-Standorts durch VMware Cloud on AWS

Unternehmen mit bestehenden DR-Rechenzentren, die ihre volle Kapazität erreicht haben und nicht mehr in der Lage sind, die erforderliche Hardware oder den notwendigen Platz im Rechenzentrum zu beschaffen, um ihre Geschäftsanforderungen schnell und kostengünstig zu erfüllen, können VMware Cloud on AWS als Wiederherstellungsziel für neue DR-Workloads verwenden.

Wie im unten stehenden Bereitstellungsdesign zu sehen ist, können Kunden lokale Colocation-Rechenzentren durch VMware Cloud on AWS als Wiederherstellungsstandort ersetzen.

 

Umstellung von einem On-Premises-DR-Standort zu VMware Cloud on AWS (Quelle: VMware)

3. Erweitern Sie Ihre bestehende DR-Lösung durch VMware Cloud on AWS

Kunden, die VMware Site Recovery Manager noch nicht verwenden, können eine Architektur mit mehreren Wiederherstellungsstandorten konfigurieren, wie in der folgenden Abbildung dargestellt. Bei dieser Architektur können Unternehmen ihre bestehenden DR-Implementierungen mit VMware Cloud on AWS und VMware Site Recovery Manager ergänzen.

Verwendung von VMware Cloud on AWS für standortübergreifendes/On-Premises-DR (Quelle: VMware)

Bei dieser Architektur verwendet der Site Recovery Manager eine andere VMware Cloud on AWS in einer anderen Region und einen On-Premises-Standort als Wiederherstellungsort für Workloads in der Cloud.

Design-Überlegungen

Um eine wirklich funktionale Disaster Recovery-Lösung erfolgreich zu implementieren, muss das zugrunde liegende Infrastrukturnetzwerk, das Ihre DR-Infrastruktur unterstützt, gut konzipiert sein.

Es empfiehlt sich, Ihre Netzwerkinfrastruktur zu vereinfachen, indem Sie neue Netzwerke an Ihrem Wiederherstellungsstandort einrichten. Site Recovery Manager ist in der Lage, alle virtuellen Maschinen, die am Recovery-Standort wiederhergestellt werden, neu zu verknüpfen, unabhängig davon, ob es sich um VMware Cloud on AWS oder On-Premises handelt. Diese Funktion ist von VMware-Tools abhängig. Sie müssen also sicherstellen, dass Ihre kritischen VMs, die wiederhergestellt werden müssen, VMware Tools installiert haben.

Viele Unternehmen verwenden VMware HCX, um ihre lokalen Netzwerke auf VMware Cloud on AWS zu erweitern und diese Netzwerke als Wiederherstellungsnetzwerke zu nutzen. Im Falle eines Disaster-Recovery-Ereignisses oder eines Tests sollten Unternehmen sich bewusst sein, dass ein manueller Eingriff erforderlich ist, um die Gateways von ihrem lokalen Rechenzentrum zu verschieben. Außerdem ist zu bedenken, dass einzelne Fehlerquellen bei den Appliances, die zur Ausdehnung ihrer Netzwerke verwendet werden, auftreten können.

Darüber hinaus spielt die DNS-Auflösung eine wichtige Rolle, um sicherzustellen, dass alle Services verfügbar sind und funktionieren. Als bewährte Praxis empfiehlt es sich, die DNS-Infrastruktur auf den Wiederherstellungsstandort auszudehnen, um eine Ausfallsicherung und DNS-Auflösung zu ermöglichen. Amazon Route 53 ist ein hervorragender DNS-Service für dieses Szenario und kann automatisch ein Failover durchführen, wenn die DNS-Infrastruktur lokal während einer Ausfallsituation nicht mehr aktiv ist.

 

Generische Architektur mit Amazon Route 53 und VMware Cloud on AWS für DR (Quelle: VMware)

Mithilfe der Failover-Routing-Richtlinien auf Amazon Route 53 kann DNS automatisch auf Ihren VMware Cloud on AWS-Cluster in der Cloud übertragen werden, um im Notfall eine kontinuierliche DNS-Auflösung zu ermöglichen.

Best Practices für Disaster Recovery

Bei der Verwendung von VMware Cloud on AWS zur Unterstützung Ihrer Disaster Recovery-Pläne sind einige Dinge zu beachten, um einen erfolgreichen und funktionalen Notfallplan zu gewährleisten.

  • Erstellen Sie einen detaillierten Plan für Ihre Notfallwiederherstellung: Ohne einen detaillierten Disaster-Recovery-Plan bleibt oft wenig oder gar keine Zeit, um sich mit der Wiederherstellung Ihrer IT-Infrastruktur und geschäftskritischen Anwendungen zu befassen. Stellen Sie sicher, dass Sie einen strukturierten Plan für die Wiederherstellung haben, damit Ihre Systeme nach einer Notfallsituation wieder online gehen können.

    Stellen Sie sicher, dass es Prozesse und Verfahren gibt, die es autorisierten Mitarbeitern ermöglichen, auf Ihre Wiederherstellungspläne zuzugreifen, wenn die Systeme ausgefallen sind. Solche Dokumente können extern, in einem Cloud-basierten Speicher wie Amazon S3 oder einem anderen Cloud-Speicherdienst gesichert werden.
  • Wahl des Standorts für die Notfallwiederherstellung: Der für Ihren Disaster Recovery-Plan ausgewählte Wiederherstellungsstandort sollte kein zweites Gebäude am selben Ort oder im selben Aktionsradius sein. Am besten sollte der Wiederherstellungsstandort für Ihre lokale IT-Infrastruktur an einem Ort liegen, der voraussichtlich nicht von der Katastrophe betroffen sein wird, die den Hauptstandort betrifft. Manchmal reichen ein paar Kilometer Entfernung zwischen den Standorten nicht aus, um einen wirklich sicheren Wiederherstellungsstandort zu schaffen.

    Unternehmen sollten sicherstellen, dass ihr DR-Standort ihren geschäftlichen und gesetzlichen Anforderungen entspricht. In einigen Gegenden sollten zudem klimatische Bedingungen und Versorgungseinrichtungen berücksichtigt werden. Bei der Verwendung von VMware Cloud on AWS als Wiederherstellungsstandort wird empfohlen, diesen nicht in derselben Region wie das Rechenzentrum vor Ort einzurichten.

    Wenn sich Ihre On-Premises-Umgebung beispielsweise an der Ostküste der Vereinigten Staaten befindet, können Sie VMware Cloud on AWS in den Regionen Central oder West Coast als Wiederherstellungsstandort für Ihre IT-Infrastruktur wählen.
  • Testen Sie Ihren Wiederherstellungsplan regelmäßig: Viele Unternehmen verfügen über DR-Pläne, aber aufgrund mangelnder Tests erweist sich der Recovery-Prozess im Ernstfall schnell als Mammutaufgabe. Wir empfehlen unseren Kunden, ihre Wiederherstellungspläne regelmäßig zu testen, indem sie ihren IT-Teams die Möglichkeit geben, sich mit dem Failover- und Failback-Prozess vertraut zu machen, um dessen Funktionalität sicherzustellen.

    Mit dem zusätzlichen Site Recovery Manager Service, der von VMware für VMware Cloud on AWS bereitgestellt wird, können Kunden diese Tests regelmäßig durchführen und simulieren, wie eine Wiederherstellung während einer echten Wiederherstellung auf VMware Cloud on AWS abläuft.
  • Planen Sie die Wiederherstellung des Betriebs: Eine Systemwiederherstellung ist erst dann vollständig abgeschlossen, wenn Ihre VMs und Anwendungen nach einem Ausfall oder einer Prüfung vom Wiederherstellungsstandort aus gestartet werden. Die Anwendungen müssen so funktionieren wie vor dem Ausfall. Auch dieser Prozess kann eine Herausforderung sein. Wir empfehlen Ihnen daher, einen Plan für die erforderlichen Verfahren und Tests zu erstellen, um Ihre Anwendungen am Wiederherstellungsstandort betriebsbereit zu machen.

    Wenn Sie Site Recovery Manager und VMware Cloud on AWS als Wiederherstellungsstandort verwenden, können Sie einige dieser Prozesse automatisieren, indem Sie die Startreihenfolge Ihrer VMs festlegen, wenn diese auf VMware Cloud on AWS in der Cloud übertragen werden.
  • Beziehen Sie die Notfallwiederherstellung in Ihren Change-Management-Prozess ein: In vielen Fällen werden in IT-Infrastrukturumgebungen mehrere Veränderungen gleichzeitig vorgenommen. Aus diesem Grund sollte der Notfallplan bei jeder Änderung in der Umgebung aktualisiert werden, egal ob es sich um eine Hardware-, Software- oder Netzwerkänderung handelt. Dadurch wird ein voll funktionsfähiger Wiederherstellungsplan gewährleistet.

Fazit

Ein separates lokales Rechenzentrum als Disaster-Recovery-Ziel zu unterhalten, ist arbeitsintensiv und erfordert erhebliche Investitionen für die Bereitstellung und Wartung. Viele Unternehmen haben die Notwendigkeit einer Disaster-Recovery-Lösung erkannt und erwägen die Nutzung von Public Clouds.

Der VMware Site Recovery Manager ergänzt VMware Cloud on AWS und ermöglicht es Kunden, viele der mit Cloud-basierter DR verbundenen Herausforderungen zu überwinden.

So unterstützt Sie SoftwareONE

Wir kommen gerne vorbei und erklären alles anschaulich und leicht verständlich. Dafür bieten wir eine Reihe von Workshops an, bei denen wir die VMware Lösungen detailliert und praktisch in einer Demo-Umgebung vorstellen – remote oder bei Ihnen vor Ort. Wir erklären Ihnen die Lösung bis in die Tiefe, für jedermann verständlich und beantworten Ihre Fragen. Gemeinsam sehen wir uns Ihre Umgebung an und besprechen Ihre Herausforderungen und Ziele.

SoftwareONE ist langjähriger VMware Partner und hält als Principal Partner den höchsten erreichbaren Status. Wir unterstützen Sie bei der Optimierung Ihrer VMware Workloads, der Planung und Durchführung von Cloud-Projekten sowie dem VMware Lizenzmanagement und der Compliance. Gemeinsam finden wir die passende Lösung für Ihre Anforderungen und unterstützen Sie bei jedem Schritt.

VMware Premier Partner

Kommentieren Sie diesen Artikel

Hinterlassen Sie einen Kommentar, um uns mitzuteilen, was Sie von diesem Thema halten!

Kommentar hinterlassen

Autor

Christoph Kautzky

Christoph Kautzky

Solution Sales Specialist Services

Verwandte Artikel

Wie arbeitet ein Security Operations Center (SOC)?

Wie arbeitet ein Security Operations Center (SOC)?

Wer erfüllt welche Aufgaben in einem Security Operations Center und vor welchen großen Herausforderungen stehen Unternehmen?

Mehr Durchblick mit Multi Cloud Ops

Mehr Durchblick mit Multi Cloud Ops

VMware bietet ein nützliches Framework, um Geschäfts-, Anwendungs- und Cloud-Strategien miteinander zu verbinden und Multi-Cloud-Umgebungen effizient zu managen.

TCO senken mit Horizon SaaS-Editionen

TCO senken mit Horizon SaaS-Editionen

VMware führt neue Horizon SaaS-Editionen ein, mit deren Hilfe sich die Betriebskosten mittels Automatisierung, Optimierung und Performance-Management senken lassen.