BLOG

Eine praktische Einführung in Incident Management Kennzahlen

Sirine Karray
February 7, 2024
Table of Contents:

Die Nachverfolgung Ihrer Kennzahlen für das Incident Management ist für alle beabsichtigten Optimierungen innerhalb Ihres Unternehmens erforderlich. Unabhängig davon, ob Ihr Team die Unternehmensziele erreichen, die Leistung messen und verbessern, die Kundenzufriedenheit erhöhen oder mehr erreichen möchte, ist die Überprüfung dieser Kennzahlen der richtige Weg. 

Wir empfehlen, dass Sie zunächst definieren, warum Sie eine Betriebszeit von 99,99 % anstreben, was sich in einem quantitativen Ziel oder einem qualitativen Ziel niederschlagen kann, das darin besteht, die wichtigsten Herausforderungen zu verstehen, die Ihr Team davon abhalten, eine Betriebszeit von 99,99 % zu erreichen. 

Sobald Sie ein klares Verständnis Ihrer spezifischen Ziele haben, besteht der nächste Schritt darin, auszuwählen, auf welche Kennzahlen Sie sich konzentrieren müssen. Dies ermöglicht eine kontinuierliche Überwachung dieser Ziele und den Aufbau eines robusten operativen Rahmens.

Kategorien von Kennzahlen zum Incident-Management

In diesem Blog haben wir die wichtigsten Kennzahlen für das Incident Management in vier Hauptkategorien zusammengefasst, um Ihnen die Auswahl der wichtigsten Kennzahlen zu erleichtern:

  • Betriebliche Leistungskennzahlen beschreiben die Verfügbarkeit und Leistung des Dienstes. Dies umfasst die Reflektion darüber, wie gut der Dienst den Erwartungen der Benutzer entspricht und beinhaltet die Betriebszeit (Uptime), Latenz und Leistung.
  • Stabilitätskennzahlen geben Auskunft über die Zuverlässigkeit und Stabilität des Systems. Relevante Kennzahlen umfassen die Änderungsfehlerrate (Change Failure Rate, CFR) und die durchschnittliche Zeit bis zur Behebung (Mean Time to Resolve, MTTR).
  • Bereitschaftskennzahlen messen die Reaktionsfähigkeit und Wirksamkeit des Incident-Management-Prozesses. Dazu gehören die durchschnittliche Zeit bis zur Anerkennung (Mean Time to Acknowledge, MTTA) und die Reaktionszeit bei Vorfällen (Incident Response Time).
  • Durchsatzkennzahlen geben Auskunft über die Effizienz des Arbeitsablaufs und das Änderungstempo der Bereitstellungspipeline. Beispiele für Kennzahlen sind die Vorlaufzeit für Änderungen (Lead Time for Changes) und die Bereitstellungshäufigkeit (Deployment Frequency).
Infografiken zu Kennzahlen zum Incident-Management
Infografiken zu Kennzahlen zum Incident-Management

Die 10 wichtigsten Kennzahlen für das Incident-Management

Bei genauerer Betrachtung dieser Kategorien empfehlen wir, dass Sie die folgenden zehn wichtigsten Kennzahlen priorisieren:

  • Betriebszeit (Uptime): Eine wesentliche Kennzahl, die die Dauer quantifiziert, in der ein System funktionsfähig bleibt. Sie wird typischerweise als Prozentsatz der maximal möglichen Betriebszeit in einem definierten Intervall, wie zum Beispiel einem jährlichen oder monatlichen Zeitraum, angezeigt.
  • Änderungsfehlerrate (CFR): Eine Kennzahl, die den Prozentsatz der Änderungen misst, die zu einem Fehler führen. Formel: CFR = (Fehlgeschlagene Bereitstellungen / Gesamtbereitstellungen)
  • Mittlere Zeit bis zur Behebung (MTTR): Diese Kennzahl berechnet die durchschnittliche Zeit, die benötigt wird, um sich von einem Fehler zu erholen. Eine niedrigere MTTR deutet auf eine höhere operationale Effizienz hin.
  • Mittlere Zeit bis zur Anerkennung (MTTA): Die durchschnittliche Zeit, die nach der Meldung eines Vorfalls bis zur Anerkennung vergeht, was die Aufmerksamkeit und Bereitschaft des Teams zeigt.
  • Durchschnittliche Reaktionszeit bei Vorfällen: Die verstrichene Zeit von der Meldung eines Vorfalls bis zur Zuweisung an das richtige Teammitglied, einschließlich der Anerkennungszeit und der ersten Reaktionszeit.
  • Bereitschaftszeit: Die Messung der Zeit, die im Bereitschaftsdienst verbracht wird, hilft den Bereitschaftsteams, die Arbeitsbelastung auszugleichen und Burnout vorzubeugen.
  • Vorlaufzeit für Änderungen: Die Zeitspanne zwischen dem Zeitpunkt, an dem eine Änderung bestätigt wird, und dem Zeitpunkt, an dem sie in die Produktion überführt wird; sie gibt an, wie effizient der Bereitstellungsprozess ist.
  • Bereitstellungshäufigkeit: Die Anzahl der Einsätze in der Produktion innerhalb eines bestimmten Zeitraums. Eine höhere Häufigkeit von kleineren, besser handhabbaren Bereitstellungen deutet oft auf einen ausgereiften Bereitstellungsprozess hin.
  • Anzahl der Vorfälle: Die Verfolgung der Anzahl von Vorfällen über einen bestimmten Zeitraum kann Trends und Muster aufdecken, was eine proaktive Vorfallsverwaltung ermöglicht.
  • Anzahl der Warnungen: Die Messung der Anzahl von Warnungen hilft dabei, falsch positive Meldungen zu minimieren und einer Alarmmüdigkeit vorzubeugen, um sicherzustellen, dass Warnungen sinnvoll und handlungsorientiert bleiben.
Die 10 wichtigsten Kennzahlen für das Incident-Management
Die 10 wichtigsten Kennzahlen für das Incident-Management

Benchmarks für das Leistungsniveau

Da Sie nun ein detaillierteres Verständnis dieser Metriken haben und wissen, welche für Ihren speziellen Fall am relevantesten sind, müssen Sie möglicherweise Leistungsniveau-Benchmarks untersuchen, um zu beurteilen, wie gut Ihre Metriken abschneiden. Die folgende Tabelle enthält einige Richtlinien:

Incident Management Metriken Leistungs-Benchmarks
Quelle: Accelerate State of DevOps Report 2023

Während Sie Ihren metrikgestützten Ansatz zur Überwachung Ihres Incident-Management-Prozesses entwickeln, gewinnen Sie praktische Einblicke und decken relevante Trends in Ihren Daten auf. Diese Erkenntnisse können genutzt werden, um fundierte Entscheidungen und notwendige Verbesserungen zu treffen, sodass Sie betriebliche Exzellenz erreichen und eine hohe Kundenzufriedenheit sicherstellen können.

Blog-Beiträge, die dir gefallen könnten:

Sind Sie bereit, Ihr Incident-Management zu verbessern?
Start for free
Unsere Cookie-Richtlinie
Wir verwenden Cookies, um Ihre Erfahrung zu verbessern, den Seitenverkehr zu verbessern und für Marketingzwecke. Erfahren Sie mehr in unserem Datenschutzrichtlinie.
Open Preferences
Danke! Deine Einreichung ist eingegangen!
Hoppla! Beim Absenden des Formulars ist etwas schief gelaufen.
Danke! Deine Einreichung ist eingegangen!
Hoppla! Beim Absenden des Formulars ist etwas schief gelaufen.
Danke! Deine Einreichung ist eingegangen!
Hoppla! Beim Absenden des Formulars ist etwas schief gelaufen.