Was ist Incident-Management?

Incident-Management ist der häufigste aller IT-Supportprozesse. Diesen Prozess verwendet die IT zur Lösung, wenn Kunden melden, dass etwas kaputt oder nicht verfügbar ist oder nicht so funktioniert, wie es sollte. Der Zweck des Incident-Managements ist es, einen durchgehenden und vorhersagbaren Weg für das Engagement mit Nutzern bereitzustellen, herauszufinden, ob etwas kaputt ist und es so schnell wie möglich zu reparieren, damit das Geschäft normal weiterlaufen kann. Oft wird das Incident-Management entweder direkt von einer Helpdesk-Funktion ausgeführt oder von einer solchen über ein Netzwerk von Fachexperten koordiniert.

Was ist ein Incident?

Ein Incident im Sinne der IT ist ein stattfindendes Ereignis, das nicht Teil der normalen Operationen ist und das die Aktivitäten eines Nutzers oder einen Geschäftsprozess stört. Ein Incident beginnt, wenn die normalen Operationen gestört werden und dauert an, bis die normalen Operationen wieder hergestellt sind. Incidents sind Technologieereignisse, die die geschäftlichen Aktivitäten stören und zum Lösen gewöhnlich eine Art von Eingriff erfordern. Ein Incident kann mit einem Versagen einer technischen Komponente oder einer Funktion zusammenhängen. Es kann sich auch um ein Problem der Integrationen zwischen Komponenten handeln oder das Versagen von Workflows, die für ein System konfiguriert wurden. Hier einige Beispiele für Incidents:

Beispiele für Software-Incidents

Hardware-Incidents

Nicht alle Incidents sind gleich wichtig, haben die gleichen Auswirkungen und sind gleich dringend. Einige Incidents führen zu ganzen Arbeitsausfällen, während andere nur lästig sind und leicht umgangen werden können. Ein Incident kann eine einzelne Person (oder niemanden), ein Team, einen Standort oder eine ganze Organisation betreffen. Je nach Tageszeit, Stärke der Auswirkungen und Bedeutung der betroffenen Geschäftsfunktionen erfordern Incidents verschiedene Dringlichkeitsstufen und Aufmerksamkeit. Die meisten Unternehmen nutzen formalisierte Service Level Agreements (SLAs) für die Bewertung der Auswirkungen und der Dringlichkeit von Incidents. Anhand der SLAs weisen Sie den Incidents Prioritäts- und Kritikalitätswerte zu, die sicherstellen, dass die Ressourcen so konzentriert werden, dass die dringendsten Incidents zuerst gelöst werden.

Was ist der Incident-Managementprozess?

Incident-Management ist ein Prozessbereich des IT-Servicemanagements (ITSM), der sich darauf konzentriert, die normale Diensteoperationen so schnell wie möglich wiederherzustellen und die Auswirkungen von Störungen der Geschäftsoperationen zu minimieren. Dieser Prozess wird üblicherweise in aufeinanderfolgenden Schritten ausgeführt.

 

Um die IT-Effizienz zu erhöhen, kann das IT-Servicemanagement für Folgendes genutzt werden:

Auffinden und Aufzeichnen von Incidents 

Feststellen, dass ein Incident vorliegt und erfassen des Incidents im Incident-Managementsystem. Das kann durch ein automatisiertes Überwachungssystem ausgelöst werden oder durch einen Nutzer, der sich mit einer Supportanfrage an den Helpdesk wendet.

Incidentberichte und -kommunikation

Das Berichten und Kommunizieren beginnt, wenn der Incident erkannt ist. Beides dient dazu, dem Nutzer oder der Community zu bestätigen, dass eine Störung vorliegt und eine Untersuchung durchgeführt wird.

Prioritätsklassifizierung und einleitender Support

Die Bewertung der Auswirkungen und der Dringlichkeit bestimmen die Prioritäts- und die Schwereeinordnung, die dazu dienen, das Maß des gebotenen Supports zu bestimmen.

Untersuchung und Analyse

Problemdiagnosen und die Fehlersuche tragen dazu bei, die Symptome von den unterliegenden Gründen zu isolieren und Zusammenhänge zwischen dem Incident und Änderungen in der Umgebung oder bekannten Problemen aufzudecken.

Lösung und Aufzeichnung

Das Lösen von Incidents erfordert gewöhnlich eine Art von Supporthandlung (Vornahme einer Änderung, Neustart einer Ressource und so weiter). Zur Lösung eines Incidents gehört auch die Dokumentation der Analyseergebnisse und der zur Wiederherstellung des Dienstes durchgeführten Schritte.

Schließen von Incidents

Das Schließen eines Incidents umfasst auch die Kommunikation mit dem Nutzer/der Community, das Aktualisieren der Supportdokumentation und Einleiten von Problemmanagementprozessen (soweit notwendig).

Welche Rolle spielt ein Incident-Manager?

Viele einfache Incidents können mit einer einzigen Supportressource gelöst werden. Komplexere Incidents erfordern möglicherweise die Einbindung einer Reihe von Ressourcen, die koordiniert werden müssen, und/oder verschiedene Stakeholdergruppen, die dauerhafte Kommunikation notwendig machen. Ein Incident-Manager ist verantwortlich für die Orchestrierung des Incident-Managementprozesses, die Koordination der Lösungsressourcen und das Ermöglichen der Stakeholder-Kommunikation.

Was ist ein Incident-Command-System?

Ein Incident-Command-System ist eine Software, die zur Koordination der gemeinsam an einem Incident arbeitenden Ressourcen beiträgt. Diese Software geht oft über grundlegende Funktionen eines Incident-Managementsystems hinaus und umfasst Dinge wie Konferenz- und Zusammenarbeits-Tools, Ressourcenmanagementfunktionen, eine zentralisierte Überwachungskonsole und eine Funktion zum Veröffentlichen von Incident-Aktualisierungen über unterschiedliche Kanäle.

Was ist der Unterschied zwischen einem Incident und einer Anfrage?

Helpdesks und IT-Servicedesks bearbeiten nicht nur Incidents, sondern auch andere Probleme von Nutzern. Eine der häufiger auftauchenden Probleme sind Nutzeranfragen. Während ein Incident eine Störung eines normalen Prozesses ist (etwas ist kaputt), ist eine Anfrage eine Aktivität, zu deren Ausführung der Nutzer Unterstützung benötigt (etwas muss erledigt werden). Beispiele für Anfragen können das Einrichten von Systemen für einen neuen Mitarbeiter, das Gewähren von Zugriff auf Daten oder das Ausführen eines Updates der Systemsoftware sein. Obwohl Incidents und Anfragen oft ähnlichen Prozessen folgen und gegebenenfalls auch die Nutzung derselben Tools für das Nachverfolgen erfordern, sind Anfragen nicht auf ein Versagen oder eine Störung gerichtet. Sie sind vielmehr Teil des normalen Geschäftsganges.

Was ist ein schwerwiegender Incident und wie unterscheidet er sich?

Ein schwerwiegender Incident (auch „Major Incident“ genannt) ist eine spezielle Klassifizierung für Incidents in Krisensituationen. Ein solcher Incident bezeichnet eine weitreichende Störung der Geschäftsoperationen, ein kritisches Sicherheitsrisiko oder die Unfähigkeit des Unternehmens, die Erwartungen der Kunden zu erfüllen. Schwerwiegende Incidents erfordern oft eine erhöhte Einbindung des Managements, um die Auswirkungen zu bewerten und die Kommunikation zu koordinieren. Auch kann ein möglicher Incident-Manager stärker eingebunden sein. Zugleich gelten formalere Entscheidungsfindungsstrukturen. Schwerwiegende Incidents sind hochgradig zeitkritisch und können auch die Einbindung von Ressourcen außerhalb der Geschäftszeiten erforderlich machen, um bei der Diagnose und Lösung des Problems zu helfen.

Was ist der Unterschied zwischen Incident-Management und Problemmanagement?

Die Begriffe „Incident“ und „Problem“ werden häufig synonym verwendet. Es gibt jedoch einen wichtigen Unterschied zwischen beiden. Das Incidentmanagement befasst sich mit den Symptomen und Auswirkungen eines Problems. Das Problemmanagement dagegen befasst sich mit dem Grund und dem Potenzial des wiederholten Auftretens des Problems.

Die Incident-Zeitleiste beginnt, wenn eine Störung der normalen Operationen auftritt und endet, wenn der Service wiederhergestellt ist und der normale Betrieb wieder aufgenommen wird. Eine Problemzeitleiste beginnt zu dem Zeitpunkt, zu dem das unterliegende Problem in das Umfeld gelangt ist (oft durch eine Änderung der Konfiguration, einen Release oder eine Änderung der Nutzung). Sie endet, wenn das unterliegende Problem beseitigt ist (was möglicherweise erst mit einem zukünftigen Release der Fall ist). Problemmanagement umfasst Aktivitäten wie eine Fehler-Ursachen-Analyse, eine Risikobewertung und die Priorisierung sowie die Auswahl einer langfristigen Lösung.

Standards des Incident-Managements

Es gibt zwei Hauptbranchenstandards, die Unternehmen für ihre Incident-Managementprozesse nutzen. Da das Incident-Management so weit verbreitet ist und von nahezu jeder IT-Organisation betrieben wird, gibt es nur wenig Bedarf für Benutzeranpassungen. Standards sind daher hilfreich bei der Einweisung von Organisationen, was getan werden muss und wie der Incident-Managementprozess zu steuern ist.

Die IT-Infrastrukturbibliothek (ITIL) ist die am häufigsten genannte Referenz für das Incident-Management. Sie wird genutzt, um operative Prozesse in Unternehmen zu erstellen. Als Teil des Gesamtbereiches der IT-Serviceoperationen ist ITIL vor allem auf Prozesse des Incident-Managements ausgerichtet, einschließlich Schnittstellen mit anderen Prozessen, etwa dem Änderungsmanagement, dem Problemmanagement und dem Anforderungsmanagement.

ISO 20000-1 ist der internationale Standard für das Incident-Management. Der ISO-Standard wird seltener zum Erstellen von Operationen verwendet, sondern eher zum Schaffen von Vertragsbeziehungen und zum Festlegen von Leistungsstandards für Serviceanbieterorganisationen.

Weitere Informationen zum Thema