Abwägung der Verfügbarkeit und Kosten von IT-Services

Abwägung der Verfügbarkeit und Kosten von IT-Services

Um Transparenz bzw. Kontrollmöglichkeiten für intern oder extern bereitgestellte IT-Services zu schaffen, werden so genannte „Service Level Agreements“ (SLA) zwischen Dienstleister und Auftraggeber vereinbart. Neben weiteren Angaben beinhalten die SLA Garantien für Qualitätskennzahlen, auf Basis derer eine schnelle, sichere und zuverlässige IT-Dienstleistung gewährleistet wird. Eine der wichtigsten Qualitätskennzahlen für Kunden ist dabei die Service-Verfügbarkeit.

Die „IT Infrastructure Library” (ITIL) definiert Verfügbarkeit als „die Fähigkeit eines […] IT-Service, bei Bedarf die vereinbarte Funktion auszuführen“. Demnach bildet diese Kennzahl das „Kernstück der Kundenzufriedenheit“ für IT-Dienstleister. Würde nun die Service-Verfügbarkeit das zuvor vereinbarte Level unterschreiten, hätte dies nicht nur kurzfristig anfallende Kosten im Sinne einer Vertragsstrafe, sondern langfristig auch einen Vertrauens- bzw. Reputationsverlust für den Anbieter zur Folge. Entscheidend für IT-Dienstleister ist es demnach, eine ausreichende Verfügbarkeit bei gleichzeitig minimalen Kosten zu gewährleisten.

Vier wesentliche Ansätze lassen sich für eine Steigerung der Verfügbarkeit identifizieren:

  • Fehlerprävention umfasst die Minimierung der Eintrittswahrscheinlichkeit von Fehlern im System, z. B. durch den Einsatz hochwertiger Hardware- oder Software-Komponenten
  • Fehlertoleranz impliziert die Gewährleistung des Betriebs auch im Falle von Fehlern, in der Regel durch den Einsatz von Redundanzmechanismen
  • Fehlerprognose umfasst die Ermittlung bzw. Abschätzung möglicher Fehler, so dass erforderliche Gegenmaßnahmen getroffen werden können, z. B. durch Kombination von Monitoringdaten und Datenstromanalysen
  • Fehlerbeseitigung beinhaltet die Minimierung der Wiederherstellungsphase im Falle eines Fehlers und erfordert sowohl Fehleridentifikationstechniken als auch eine Reihe unmittelbar verfügbarer (und idealerweise automatischer) Gegenmaßnahmen

Die ersten beiden Ansätze können Berücksichtigung in der Service-Designphase finden. Hingegen bleiben die Erfolgschancen der Fehlerprävention aufgrund der Tatsache, dass Fehler nie vollständig ausgeschlossen werden können, begrenzt. Demgegenüber stellen Fehlertoleranzmechanismen einen wirkungsvollen, aber kostenintensiven Ansatz zur Steigerung der Verfügbarkeit dar.

Um Kosten und Auswirkungen der Redundanzmechanismen gegeneinander abzuwägen, bietet sich die Formalisierung als RAP (Redundancy Allocation Problem) an. Innerhalb dieses kombinatorischen Optimierungsproblems wird ein Dienst in seine Subsysteme aufgegliedert, in welchen Redundanzen geschaffen werden können. Unter Verwendung einer Kombination von Meta-Heuristiken und Simulation können Kombinationsmöglichkeiten für Redundanzmechanismen identifiziert werden, für welche ein nahezu optimales Gleichgewicht zwischen Kosten und Verfügbarkeit besteht. In Anlehnung an den Pareto-Ansatz können – wie dieser Abbildung zu entnehmen ist – die Ergebnisse als Pareto-Front visualisiert werden, wobei die beiden Ziele gegenübergestellt werden. Auf Basis der darin abgebildeten Punkte ist es einem Entscheidungsträger in der Service-Planungsphase möglich ein geeignetes Redundanzkonzept abzuleiten.