Qu'est-ce que la gestion des incidents ?

La gestion des incidents, ou incident management en anglais, est le plus répandu de tous les processus de support informatique. C'est le processus que le département informatique utilise pour répondre aux clients qui signalent une panne, une indisponibilité de service ou un fonctionnement non conforme. Le but de la gestion des incidents est de fournir une manière cohérente et prévisible d'interagir avec les utilisateurs, d'identifier ce qui est ne fonctionne pas et de le réparer aussi vite que possible, pour permettre aux opérations de revenir à la normale. Souvent, la gestion des incidents est effectuée soit directement par une fonction du helpdesk, soit en coordination avec une fonction du helpdesk via un réseau d'experts en la matière.

illustration laptop c0a16eb6 illustration laptop c0a16eb6

Qu'est-ce qu'un incident ?

Dans le contexte informatique, un incident est un événement qui se produit hors des opérations normales, et qui perturbe les activités d'un utilisateur ou un processus opérationnel. Un incident commence lorsque les opérations normales sont perturbées et continue jusqu'à ce que les opérations normales soient restaurées. Les incidents sont des événements technologiques qui perturbent les activités de l'entreprise et requièrent généralement une intervention quelconque pour être résolus. Un incident peut impliquer la défaillance d'un composant ou d'une fonctionnalité technologique ; il peut s'agir d'un problème lié aux intégrations entre les composants ; il peut également s'agir de la défaillance des workflows configurés pour être exécutés dans un système. Certains exemples d'incidents peuvent être :

Exemples d'incidents logiciels

Incidents matériels

Tous les incident n'ont pas le même niveau d'importance, d'impact et d'urgence. Certains incidents se traduisent par un arrêt complet du travail tandis que d'autres ne représentent qu'un contretemps qui peut être facilement contourné. Un incident peut impacter une seule personne (voire personne du tout), une équipe, un site ou une organisation entière. Selon l'heure de la journée, le degré d'impact et la criticité des opérations qui sont impactées, les incidents vont nécessiter différents niveaux d'urgence et d'attention. La plupart des entreprises formalisent des accords sur les niveaux de service (SLA) pour créer une structure objective permettant l'évaluation de l'impact et de l'urgence et l'attribution d'une priorité d'incident et des scores de criticité qui sont utilisés pour s'assurer que les ressources se concentrent en premier sur les incidents les plus pressants.

Qu'est-ce que le processus de gestion des incidents ?

La gestion des incidents est un domaine du processus de la gestion des services informatique (ITSM) qui a pour but de restaurer aussi rapidement que possible le fonctionnement normal du service et de minimiser l'impact de la perturbation sur les opérations de l'entreprise. Elle s'effectue généralement sous forme de processus séquentiel.

 

Afin d'augmenter l'efficacité informatique, la gestion des services IT peut apporter de l'aide pour :

Détecter et enregistrer les incidents 

Identifier qu'un incident s'est produit et le saisir dans le système de gestion des incidents. Ceci peut s'effectuer par des systèmes de surveillance automatique ou lorsqu'un utilisateur contacte le helpdesk pour demander de l'aide.

Rapporter et communiquer les incidents

Le reporting et la communication commencent au moment où un incident est identifié pour confirmer à l'utilisateur ou à la communauté qu'une perturbation s'est produite et que l'analyse est en cours.

Donner une priorité et offrir un support initial

Les évaluations d'impact et d'urgence guident l'attribution d'une priorité et le classement en terme de sévérité qui sont utilisés pour déterminer le niveau de support à fournir.

Enquêter et analyser

Le diagnostic et la réparation du problème permettent d'isoler les symptômes des causes sous-jacentes et d'identifier la relation entre l'incident et les changements dans l'environnement ou les problèmes connus.

Résoudre et enregistrer

Résoudre les incidents implique généralement une forme d'action de la part du support (effectuer un changement, réinitialiser une ressource, etc). Résoudre un incident comprend également la documentation des résultats de l'analyse et les mesures prises pour restaurer le service.

Résolution de l'incident

Clôturer un incident implique communiquer avec l'utilisateur/la communauté, mettre à jour la documentation de support et lancer les processus de gestion des problèmes (le cas échéant)

Quel rôle le gestionnaire d'incidents joue-t-il ?

Beaucoup d'incidents simple sont résolus par une seule ressource du support, toutefois les incidents plus complexes peuvent impliquer des équipes de ressources qui doivent être coordonnées et/ou des parties prenantes différentes qui nécessitent une communication constante. Un gestionnaire d'incidents est en charge d'orchestrer le processus de gestion des incidents, de coordonner les ressources pour résoudre l'incident et de faciliter les communications entre les parties prenantes.

Qu'est-ce qu'un système de commandement des incidents ?

Un système de commandement des incidents est un logiciel qui est utilisé pour aider à la coordination des ressources qui travaillent ensemble sur un incident. Il s'étend souvent au-delà des capacités de base d'un système de gestion des incidents et comprend des éléments comme des outils de conférence et de collaboration, des capacités de gestion des ressources, une console de surveillance centralisée et la possibilité de publier des mises à jour d'incidents sur une variété de canaux.

Quelle est la différence entre un incident et une requête ?

Les helpdesks et les service desks s'occupent plus souvent des problèmes utilisateurs que simplement les incidents. Un des problèmes les plus fréquemment traités sont les demandes des utilisateurs. Lorsqu'un incident perturbe un processus normal (quelque chose ne fonctionne pas), une requête est simplement une activité qui nécessite de l'aide pour pouvoir être complétée (quelque chose qui doit être fait). Des exemples de requêtes pourraient être paramétrer des systèmes pour un nouvel employé, autoriser l'accès à des données ou effectuer une mise à jour d'un logiciel système. Bien que les incidents et les requêtes utilisent souvent des processus similaires et peuvent utiliser les mêmes outils pour effectuer le suivi, les requêtes ne représentent pas une défaillance ou une perturbation – elles font partie des processus opérationnels normaux.

Qu'est-ce qu'un incident majeur et en quoi est-il différent ?

Il existe une classification spéciale des incidents dans les situations de crise qu'on appelle Incidents Majeurs, qui représente une perturbation significative des opérations, un risque critique pour la sécurité ou l'incapacité pour l'entreprise de répondre aux attentes de ses clients. Les incidents majeurs s'accompagnent souvent d'une implication accrue de la direction pour évaluer les impacts et coordonner la communication, une plus grande participation du gestionnaire d'incidents ainsi que des structures décisionnelles plus formelles. Les incident majeurs sont très urgents et peuvent nécessiter l'utilisation de ressources en-dehors des horaires d'ouverture normaux pour participer au diagnostic et à la résolution de l'incident.

Quelle est la différence entre la gestion des incidents et la gestion des problèmes ?

Les termes incident et problème sont souvent utilisés de façon interchangeable, mais il convient de faire une véritable distinction entre les deux. La gestion des incidents traite les symptômes et l'impact d'un incident tandis que la gestion des problèmes traite les causes et l'éventualité que l'incident se reproduise.

La chronologie d'un incident débute lorsque les opérations normales sont perturbées et se termine lorsque le service est restauré et que les opérations normales peuvent reprendre leur cours. La chronologie d'un problème débute lorsque la problématique sous-jacente est introduite dans l'environnement (ce peut être un changement dans la configuration, la mise en production ou un changement d'utilisation) et se termine lorsque la problématique sous-jacente est supprimée (ce qui peut ne se produire que lors d'une future mise en production). La gestion des problèmes comprend des activités comme l'analyse de la cause première, l'évaluation des risques et la priorisation et la sélection d'une solution pour régler le problème à long terme.

Les normes de gestion des incidents

Il existe deux normes principales dans l'industrie utilisées par les entreprises pour les guider dans leurs processus de gestion des incidents. La gestion des incidents est très répandue et effectuée par pratiquement toutes les organisations informatiques sans qu'il y ait vraiment besoin de personnalisation ; de ce fait, les normes jouent un rôle utile pour ce qui est d'apprendre aux organisations ce qui doit être fait et comment gérer le processus de gestion des incidents.

Le référentiel ITIL est la référence la plus fréquemment citée en termes de gestion des incidents, et est utilisée pour concevoir les processus opérationnels utilisés par les entreprises. Dans le cadre du processus de l'exploitation des services informatiques dans son ensemble, ITIL consacre une attention considérable aux processus qui gravitent autour de la gestion des incidents, y compris les interfaces avec d'autres processus tels que la gestion des changements, la gestion des problèmes et la gestion des demandes.

La norme ISO 20000-1 détermine les définitions internationales de la gestion des incidents. La norme ISO est moins souvent utilisée pour la conception opérationnelle et plus souvent pour mettre en place les relations contractuelles et définir les normes de performance pour les fournisseurs de services.

Ressources associées