Les Incidents récurrents
Pour traiter correctement et rapidement un incident récurrent qui se
présente, il est indispensable que les informations (conseils,
solution) soient disponibles et accessibles rapidement (pertinence,
facilité d’interprétation) ceci dès les premières phases d’un Incident.
On constate que très peu d’Incidents arrivant au Centre de Services
sont nouveaux et inédits. Les équipes de support ont déjà rencontré et
résolu des Incidents similaires.
L’utilisation optimale de ces informations est de les documenter de
telle manière que le support de premier niveau puisse les utiliser
facilement.
Plus que de l’écriture de documentations
L’information doit être indexée de manière pertinente et des examens
réguliers de la pérennité des informations au regard des changements de
l’infrastructure doivent être menées régulièrement.
Il faut aussi former les équipes qui vont utiliser l’information
(accès, interprétation) et avoir un retour des équipes sur
l’utilisation de l'outil. Il faut en effet utiliser un outil logiciel
intégré (transversal sur la Gestion des Services).
La méthode ITIL suggère aussi l'utilisation de systèmes experts
"Matières premières" des Problèmes et Erreurs Connues
- analyse des Incidents en cours (mode réactif)
- analyses statistiques des Incidents (mode proactif ou préventif)
- analyses de l’infrastructure informatique
- consultation de bases de problèmes (externes)
- documentations de nouveaux services (matériels, logiciels, applications)
La Gestion des Incidents contre la Gestion des Problèmes ?
La Gestion des Problèmes recherche la cause inconnue d’un ou de plusieurs Incidents
Souvent, cet objectif est en conflit avec l’objetif principal de la
Gestion des Incidents (redémarrer le service au plus vite). En effet,
il arrive que la mise en place d’une solution de contournement soit
antagoniste avec la recherche de la cause.
Prenons l'exemple d'un crash système :
- la Gestion des Incidents demandera de rebooter le système immédiatement afin de minimiser le temps d'indisponibilité du serveur
- la Gestion des Problèmes demandera à différer le reboot du
système car ce reboot peut supprimer des fichiers logs contenant des
informations sur l’origine du crash entraînant une perte d'informations
pour trouver la cause du crash (et beaucoup de crash systèmes demeurent
mystérieux...)
Les trois activités de la Gestion des Problèmes
Le contrôle des Problèmes
Objectif : Identifier la cause première (Elément de Configuration
par ex.) et fournir au Centre de Services des informations sur les
solutions de contournement quand elles existent.
Qui définit les solutions de contournement ?
- la Gestion des Incidents en définit dans l’urgence (une ou plusieurs)
- la Gestion des Problèmes étudie ces solutions de contournement (et d’autres) et définit la meilleure
Le contrôle des Erreurs
Objectif : Eradication des Erreurs Connues en émettant vers la
Gestion des Changements une Demande de Changement (RFC) et en la
suivant jusqu’à sa mise en place effective.
Il faut donc être au courant des Erreurs existantes, il faut les
surveiller et les éradiquer quand cela est possible et justifiable
budgétairement.
La Gestion proactive (ou préventive) des Problèmes
Objectif : Identifier et résoudre les Problèmes avant que des Incidents ne surviennent
Source :
|