Alle 14 Tage aktuelle News aus der IT-Szene >
Gastbeitrag: Jedes Unternehmen muss für sich die ideale Balance zwischen kritischen und unkritischen Incidents finden, um das Vertrauen in die Systeme nicht zu gefährden. Über automatisierte Incident-Bearbeitung berichtet Klaus Ziegerhofer
Foto: Matrix42
Der Autor Klaus Ziegerhofer ist Product Manager Service Management bei Matrix42
In Unternehmen gehören Störungen (Incidents) innerhalb der IT-Landschaft zum Alltag. Die Frage ist, wie mit diesen Incidents umgegangen wird, um zum Beispiel kostspielige Ausfälle in der Produktion zu vermeiden. Doch jedes Unternehmen muss auch für sich die ideale Balance zwischen kritischen und unkritischen Incidents finden, um das Vertrauen in die Systeme nicht zu gefährden. Mit innovativen Tools lassen sich diese Prozesse vollständig automatisieren – die ideale Basis, um Silostrukturen zu reduzieren und später künstliche Intelligenz (KI) zu integrieren.
Die grundsätzliche Herausforderung in der Bearbeitung von Incidents besteht darin, wie die Verantwortlichen am besten bereits qualifizierte Tickets durch ein externes System im intern gesteuerten Service Desk anlegen. Kommt als Schnittstelle ein E-Mail-System zum Einsatz, müssen unter Umständen entsprechend komplexe Regeln im Postfach konfiguriert werden, die das Routing festlegen. Wie z. B.: Im Betreff kommt „Mailserver“ vor und im Fließtext der E-Mail noch zusätzlich die Wörter „kritisch“ und „ausgefallen“. Dies kann zu Fehlerquellen und auch zu einem gewissen Zeitverzug führen. Zum Teil erfolgen in der Incident-Bearbeitung auch direkte Eingriffe in die Datenbank der Service-Desk-Lösung mittels Updates oder Imports. Das hat wiederum den großen Nachteil, dass ohne die Verwendung einer Business-Logik Daten ungefiltert ins System gelangen.
Die externen Applikationen senden regelmäßig Mitteilungen über die aktuellen Incidents an die Verantwortlichen. Eine weitere Schwierigkeit kann in der Taktung dieser Mitteilungen liegen. Denn viele Überwachungstools melden schon zu einem frühen Zeitpunkt, dass etwas nicht stimmen könnte. Tatsächlich wäre dies aber noch kein Incident. Wenig später kann sich die zunächst harmlose Störung aber zum kritischen Störfall entwickeln.
In der Incident-Bearbeitung gilt es also, die ideale Balance zwischen kritischen und unkritischen Meldungen zu finden. Je nach Unternehmen ist es sinnvoll, eine Störung bereits bei der ersten Meldung anzulegen und danach zu aktualisieren. Aber wie bekommt dann das externe System beispielsweise die fortlaufende Incident-Nummer oder eine Datenbank-ID als Referenz auf den Incident? Alternativ könnte man die erste Meldung auch ignorieren und erstellt den Incident erst bei der zweiten oder dritten Meldung. Hierdurch könnte aber eine kritische Situation übersehen werden.
Für die automatisierte Bearbeitung von Incidents bietet sich deshalb der Einsatz eines Service-Management-Systems an. Dort laufen sämtliche Unternehmensdaten zusammen und ein integrierter Service-Desk bietet als Drehscheibe wertvolle Unterstützung in der Incident-Bearbeitung. Das Zusammenspiel von Benutzerdaten, Services, Konfigurationen und die Übersicht zu geplanten Changes ermöglicht eine zügige Weiterverarbeitung von automatisch erstellten Störfällen mittels Public API. Dadurch geht bei der Incident-Erstellung keine wertvolle Zeit verloren und manuelle Eingriffe hinsichtlich Qualifizierung werden auf ein Minimum reduziert.
Durch die Automatisierung der Incident-Bearbeitung können Unternehmen deutlich schneller auf Vorfälle reagieren. Zudem steigt die Qualität der Störungsmeldungen, was die Bearbeitungszeiten verkürzt und Risiken minimiert. Darüber hinaus weisen die erstellten Incidents eine gleichbleibende Datenstruktur auf, was den Einsatz von KI vereinfacht.
Vorab sollten die Verantwortlichen die eingesetzten Lösungen analysieren, welche Incidents aktiv erstellen. Dabei gilt es ebenfalls zu prüfen, wie mit False Positives umgegangen wird. Im nächsten Schritt müssen die Systemvoraussetzungen, zum Beispiel mittels Schnittstelle und Service-Desk-Setup, geschaffen werden. Die Beachtung oder Erstellung eines Service-Level-Agreements (SLA) darf dabei keinesfalls vergessen werden. Vor dem finalen Go-live ist eine Testphase zu empfehlen, um Interaktionen der Systeme zu betrachten und False Positives frühzeitig zu eliminieren.
Die Automatisierung von Serviceprozessen ist ein wichtiger Bestandteil, um den steigenden Anforderungen gerecht zu werden. Dabei gilt es allerdings zu beachten, dass Automatisierungstools gezielt eingesetzt werden. Andernfalls könnten externe Systeme einen unnötig hohen Anteil an „Grundrauschen“ im Service Desk erzeugen. Geschieht dies dauerhaft, wird die IT-Abteilung den Fokus verlieren und nicht mehr auf das System vertrauen.