Öfter als man es eigentlich will, tritt ein Problem auf und es startet die Suche nach dem richtigen Lösungsansatz - im schlimmsten Falle sogar als “Trial and Error” Versuch. So werden die üblichen Suchmaschinen befragt, Kollegen angerufen, alte Dokumente nach ähnlichen Problemen durchsucht oder eine ganz andere Abteilung nach Rat gefragt.
Auf diese Weise können viele Stunden vergehen und ggf. auch nicht die beste Lösung zur Problembehebung genutzt werden. Genau hier lassen sich Runbooks einsetzen um im Problemfall einen klaren Plan mit Anweisungen zu haben, der befolgt werden kann - vor allem für neue Kollegen, ist dies ein wunderbarer Ansatz, da er bei richtiger Umsetzung keine längere Erfahrung benötigt, sondern nur ein verfolgen der Anweisungen im Runbook.
Ein Runbook enthält detaillierte Anweisungen für die schnelle und effiziente Erledigung einer bestimmten Aufgabe, die auf früheren Erfahrungen mit der Lösung des Problems beruht. Ein Runbook ermöglicht es erfahreneren Teammitgliedern, ihr Wissen weiterzugeben, sodass neuere Mitglieder häufig auftretende Probleme effektiv lösen können, ohne dass eine Eskalation erforderlich ist. Es bedeutet auch, dass alle Teammitglieder schnell ihr Gedächtnis auffrischen und detaillierte Schritte befolgen können, ohne dass sie sich unzählige einzelne Verfahren einprägen müssen.
Runbooks werden erstellt, um allen Teammitgliedern - egal ob neu oder erfahren - das Wissen und die Schritte zur Verfügung zu stellen, mit denen ein bestimmtes Problem schnell und präzise gelöst werden kann. Ein einfaches Beispiel für ein Runbook kann z.B. die Erneuerung eines abgelaufenen SSL Zertifikates sein oder das hochskalieren einer Datenbankanwendung sein.
Auch wenn Runbooks for allem beim Thema Incident Response eine große Rolle spielen und die MTTR für Störfälle deutlich reduzieren können, so eignen sie sich auch für alltägliche Aufgaben wie z.B. das Erstellen von Datenbank-Backups. Hierbei können Runbooks auch durchaus teils- oder komplett automatisiert sein und werden durch den enstprechenden Responder oder Mitarbeiter manuell getriggert.
Zuerst einmal sollten Sie sich Fragen, mit welchen Problemen Ihr Team oft konfrontiert ist und was die besten Lösungen waren, die in der Vergangenheit genutzt worden sind um diese anzugehen.
Wenn das Problem und die Lösung klar sind, können diese nun als Runbook dokumentiert werden. Hierzu sollte sichergestellt werden, dass die alle unnötigen Details ausgelassen werden und das Runbook möglichst simple und klare Anweisungen in einfacher Sprache enthält. Werden Sie zudem nicht zu generisch, sondern versuchen Sie jedes Runbook ruhig spezifisch auf den bestimmten Problemfall zu fokussieren.
Im besten Falle verfolgen alle Runbooks die gleiche Struktur und den selben Aufbau.
Es bietet sich auch an, jedes Runbook einmal durchzutesten um zu schauen, ob es auch wirklich den Ansprüchen einer Lösung im Ernstfall genügt.
Übrigens: Runbooks sollten regelmäßig auf Updates überprüft werden, damit sie nicht an Effektivät verlieren und im Ernstfall nicht mehr aktuell sind.
iLert’s flexible Uptime Plattform kann dabei helfen Prozesse wie Runbooks in IT-Ops und DevOps Umfeldern noch effizienter einzusetzen und MTTA und MTTR zu verbessern. Probieren Sie uns kostenlos und unverbindlich aus.