Mit dem richtigen Notfallplan die Energieversorgung und den Betrieb im Rechenzentrum immer aufrecht halten

Können Sie sich noch an den letzten Stromausfall erinnern? Nein? Kein Wunder, denn richtige Stromausfälle sind heutzutage eher selten geworden, zumindest hier bei uns in Westeuropa. Spannungsschwankungen kann es aber immer geben. Von Jörg Tarach, Application Engineering/Sales Support Manager für Masterguard Products & Services, Emerson Network Power in Deutschland.

Sie können den Betrieb von Servern oder Netzwerkkomponenten im Rechenzentrum empfindlich stören und damit den ganz normalen Geschäftsbetrieb außer Kraft setzen – mit schlimmen möglichen Folgen: Verlust von Unternehmensdaten, Produktionsausfälle und Umsatzeinbußen. Um die kontinuierliche Energieversorgung im Rechenzentrum aufrechtzuerhalten, gibt es verschiedene Ersatzmechanismen. Und diese gilt es in einem Notfallplan sinnvoll aufzusetzen, damit das Rechenzentrum – heutzutage das technische „Herz“ der meisten Unternehmen, immer funktioniert.

Fällt der Strom nun aus oder gibt es Spannungsschwankungen, steht in einem Rechenzentrum im Idealfall zunächst ein System zur unterbrechungsfreien Stromversorgung (USV) bereit. Die USV sorgt für höchste Ausfallsicherheit und sollte daher im Business Continuity- oder Notfallplan von Anfang an berücksichtigt werden.

 

Die Auswertung von 3.000 USV-Systemen durch Emerson Network Power ergab: Ein USV-System in einem Rechenzentrum fängt innerhalb eines Jahres durchschnittlich 1.500 Störungen der Energiezufuhr ab. Damit kommt USV-Systemen eine außerordentlich wichtige Rolle im Rechenzentrum zu. Da die USV-Systeme aber so viele Ausfallereignisse im Hintergrund abfangen, werden bei der Aufstellung von Business Continuity-Plänen für Rechenzentren die Gefahren durch mögliche Stromausfälle und Spannungsschwankungen oftmals erheblich unterschätzt. Daher wird die Gefahr, die von Stromausfällen und -Schwankungen ausgeht, in der Analyse für Notfallpläne häufig nicht berücksichtigt. Potenziell schädliche Spannungsabweichungen dauern in der Regel nämlich nur wenige Millisekunden. Ein Störfall wird aber erst wahrgenommen, sobald die externe Stromzufuhr für über eine Sekunde unterbrochen wird. Dies macht weniger als zehn Prozent aller Störfälle aus, kann aber erhebliche Auswirkungen auf den Geschäftsbetrieb haben. Ab diesem Zeitpunkt steigt nämlich die Wahrscheinlichkeit für einen länger anhaltenden Stromausfall rasant an. USV-Systeme können in dieser Situation, je nach Größe und Ausstattung, die Stromversorgung für zehn Minuten oder sogar für mehrere Stunden übernehmen. Es bleibt also genügend Zeit, um auch größere Stromausfälle weitgehend unbeschadet zu überstehen, die Last geordnet herunterzufahren oder einen Dieselgenerator als nächste Maßnahme im Rahmen der Notfallüberbrückung zu starten.

 

Ein Kontinuitätsplan für alle Fälle

Wie im Störfall im Einzelnen zu reagieren ist, sollte in einem Notfallplan dezidiert festgelegt werden. Das erste System, das im Notfall einspringen muss, ist die USV. Liegen zwischen mehreren Stromausfällen nur ein paar Stunden, fehlt oftmals  die Zeit, um die Batterien der USV-Systeme wieder vollständig aufzuladen. Um auch diesen Fall vorzubeugen, empfliehlt sich der Einsatz einer Netzersatzanlage (Dieselgenerator). Ist ein Dieselgenerator vorgesehen, sollte stets genügend Kraftstoff vorhanden sein und der Dieseltank rechtzeitig wieder aufgefüllt werden.

 

Im Falle des Generatoreinsatzes muss klar definiert sein, ab wann dieser starten und die Stromversorgung übernehmen soll. Regelmäßige Prüfungen der Funktionstüchtigkeit sind hier ebenso notwendig. Und der Ladungszustand der Batterie, die den Dieselgenerator startet, muss kontinuierlich aufrechterhalten bzw. nach einem Einsatz geladen werden. Denn der Start dieser Zusatzsysteme verbraucht zunächst Batteriestrom und kann unter Umständen länger dauern.
Damit diese Notfallmaßnahmen planmäßig durchgeführt werden und greifen können, ist im Business Continuity-Plan also neben den situativ in einer Notfallsituation anfallenden Aufgaben auch detailliert aufzulisten, welche Ersatzteile vorzuhalten sind, und ob bzw. wie viel Treibstoff nachbestellt werden muss.

 

Regelmäßige Überprüfung der Kontinuitätsvorkehrungen für den Ernstfall – intern oder extern

Darüber hinaus muss der Kontinuitätsplan regelmäßige Wartungen vorsehen. Diese können entweder von einem unternehmenseigenen Wartungsdienst oder von einem externen Dienstleister vorgenommen werden. Ein externer Wartungsdienst kann in der Regel Fehler wie das Unterbleiben der Zurücksetzung des Systems nach einem Alarm, fehlerhafte Schaltungen oder die Abnutzung einzelner Komponenten auch per Fernüberwachung aufdecken. Damit ist er in der Lage, beispielsweise einen Spannungsabfall von Ersatzbatterien oder fehlerhafte Einstellungen der Systeme frühzeitig zu entdecken.

 

Für extrem kritische Rechenzentren stellen solche Anbieter außerdem eine Fernüberwachung rund um die Uhr bereit. Emerson Network Power bietet beispielsweise die LIFE-Technologie an. Diese ist insbesondere für Unternehmen mit verschiedenen Standorten interessant, denn sie ermöglicht eine einheitliche Business Continuity für alle Rechenzentren: Erfahrene Techniker überprüfen kontinuierlich die Funktionstüchtigkeit des gesamten Systems,  angefangen bei den Batterien der USV, über die Einsatzbereitschaft des Generators bis hin zu den einzelnen Schaltern. Einige Reparaturen können sogar per Fernzugriff vorgenommen werden. Für notwendige Vorort-Einsätze bringen die Techniker dank Fernüberwachung bereits das erforderliche Wissen inklusive der benötigten Werkzeuge und Ersatzteile mit, um für schnelle Abhilfe zu sorgen. So sind die Notfallsysteme für ihren Einsatz im Ernstfall immer gerüstet. Ganz gleich wie ausgefeilt ein Business Continuity-Plan auch im Vorfeld erscheinen mag, es können im Laufe der Zeit weitere Aspekte hinzukommen. Fehlerquellen müssen daher kontinuierlich aufgespürt und ausgeräumt werden.

 

Vorsichtsmaßnahmen sind gut – Stromausfälle und Spannungsschwankungen vermeiden ist besser

Nicht selten lassen sich Stromausfälle im Rechenzentrum durch geschicktes Management der gesamten Infrastruktur vermeiden. Denn Rechenzentrumsverantwortliche, die wissen, wann und wo ihre Ressourcen belastet werden, können bereits frühzeitig gegensteuern, indem sie beispielsweise die Lastverteilung verändern. Vor allem Virtualisierung erhöht durch die permanente Verlagerung virtueller Maschinen die Dynamik im Rechenzentrum und sorgt so für Lastschwankungen. Dies führt zu einem wesentlich stärker variierenden Strombedarf und erhöht die Gefahr von Ausfällen deutlich.

 

Datacenter Infrastructure Management (DCIM) – der ganzheitliche Ansatz

Für die Sicherstellung von Business Continuity reichen deshalb gängige Lösungen für das Infrastrukturmanagement nicht aus. Es bedarf vielmehr einer Lösung, die ein umfassendes Management der gesamten Infrastruktur erlaubt – also sowohl der IT- als auch der Facility-Komponenten. Dazu zählen beispielsweise die Kühlung und Beleuchtung im Rechenzentrum. Mit solch einer Lösung für ganzheitliches Datacenter Infrastructure Management (DCIM) lassen sich die kritischen Wechselbeziehungen im Rechenzentrum detailliert erfassen und managen.

 

Die Lösung bezieht in Echtzeit gemessene Daten mit ein, berücksichtigt auch Veränderungen der virtuellen Infrastruktur und erlaubt auf diese Weise eine dynamische Optimierung der gesamten RZ-Infrastruktur. Mit einer modernen DCIM-Lösung, wie beispielsweise Trellis von Emerson Network Power, kann daher Schwankungen in der Stromversorgung im Vorfeld entgegen gesteuert werden. Größere Unterbrechungen und Ausfälle der Energiezufuhr werden so verhindert.

 

Zusammenfassung

Angesichts der verheerenden Folgen, die Unterbrechungen der Stromversorgung im Rechenzentrum für Unternehmen haben können, sollte ein Business Continuity-Plan für den alle Fälle vorgehalten werden. Dabei gilt es, bei der Planung von Vorsorgemaßnahmen potenzielle Gefahrenquellen zu erkennen, geeignete Ersatzmechanismen bereit zu stellen und regelmäßige Wartungsarbeiten, auch an den Ersatzsystemen, durchzuführen. Nur so kann sichergestellt werden, dass USV-Systeme und Generatoren stets einsatzbereit sind und im Notfall die Stromversorgung übernehmen. Wenn darüber hinaus mit Hilfe einer modernen DCIM-Lösung sowohl IT- als auch Facility-Rechenzentrumskomponenten überwacht werden, lassen sich Schwankungen in der Stromversorgung vielfach ausgleichen, noch bevor es zu größeren Unterbrechungen und Ausfällen kommt.

 

 

 

New state-of-the-art data centre features Vultr’s first AMD GPU supercompute cluster.
Only a quarter (25%) think their approach to the cloud is carefully considered and successful.
Moving to AWS Cloud will enable The Co-operative Bank to adopt cutting edge IT Infrastructure.
The global airline group will upgrade the value of its data and get its AI & generative AI ready...
Barracuda Networks’s award-winning Email Protection and Cloud Backup security solutions will be...
Leading company in renewables to leverage HPE’s unique turnkey AI infrastructure solution to...
The four-year project extension focuses on cloud transformation and enhanced operational efficiency...
Businesses in the UK are risking slower development as they fail to fully embrace technologies that...