Вы находитесь на странице: 1из 14

Proceso Incident Mgmt v2.

Proceso: Gestin de Incidentes


Tabla de Contenidos

Pgina 1 de 14

1. Objetivo ................................................................................................................... 2 2. mbito de Aplicacin .................................................................................................. 2 3. Alcance .................................................................................................................... 2 4. Desarrollo ................................................................................................................. 2 4.1. Actividad: Detectar y Registrar .................................................................................. 2 4.1.1. Detectar el Incidente ............................................................................................ 2 4.1.2. Registrar el Incidente ........................................................................................... 2 4.2. Actividad: Categorizar y Priorizar ............................................................................... 2 4.2.1. Categorizar ......................................................................................................... 3 4.2.2. Priorizar ............................................................................................................. 3 4.3. Actividad: Realizar Diagnostico Inicial ........................................................................ 3 4.3.1. Realizar Diagnostico Inicial ................................................................................... 3 4.3.2. Asignar el Incidente ............................................................................................. 3 4.3.3. Validar Asignacin ............................................................................................... 3 4.3.4. Tomar Incidente .................................................................................................. 3 4.4. Actividad: Investigar y Diagnosticar ........................................................................... 3 4.4.1. Investigar la Falla ................................................................................................ 3 4.4.2. Documentar Actividades ....................................................................................... 4 4.4.3. Asignar Como Pendiente ....................................................................................... 4 4.5. Actividad: Resolver y Cerrar ...................................................................................... 4 4.5.1. Resolver ............................................................................................................. 4 4.5.2. Validar solucin ................................................................................................... 4 4.5.3. Cerrar ................................................................................................................ 4 4.6. Actividad: Gestionar Incidentes Mayores .................................................................... 4 4.6.1. Escalar al Incident Manager .................................................................................. 4 4.6.2. Validar Criticidad ................................................................................................. 4 4.6.3. Abrir el Bridge ..................................................................................................... 4 4.6.4. Comunicar Incidente ............................................................................................ 4 4.6.5. Escalar Jerrquicamente ....................................................................................... 5 4.6.6. Enviar Actualizacin ............................................................................................. 5 4.6.7. Cerrar el Bridge ................................................................................................... 5 4.6.8. Enviar Informe Preliminar ..................................................................................... 5 4.6.9. Informar en daily y weekly ops .............................................................................. 5 4.6.10.Enviar informe final ............................................................................................. 5 5. Anexo ...................................................................................................................... 6 5.1. Tabla RACI ............................................................................................................. 6 5.2. Circuitos ................................................................................................................. 8 5.3. Roles y Responsabilidades ...................................................................................... 12 5.4. Checklist de los Puntos de Control ........................................................................... 13 5.5. Factores Crticos de xito y KPI ............................................................................... 13 6. Glosario.................................................................................................................. 14 7. Log de Auditora ...................................................................................................... 14

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes

Pgina 2 de 14

1. Objetivo
El objetivo del proceso es restaurar la operacin normal del servicio afectado lo ms rpido posible, minimizando el impacto en el negocio y asegurando que se mantengan los niveles acordados de calidad y disponibilidad.

2. mbito de Aplicacin
Regional

3. Alcance
El alcance de este proceso es cualquier evento que interrumpa o pueda interrumpir un servicio, y que sea comunicado por los usuario a travs del service desk o por una interfaz entre Gestin de Eventos y Gestin de Incidentes.

4. Desarrollo
El proceso estar conformado por 6 actividades principales: Detectar y Registrar Categorizar y Priorizar Realizar Diagnstico Inicial Investigar y Diagnosticar Resolver y Cerrar Gestionar Incidentes Crticos

4.1. Actividad: Detectar y Registrar En esta actividad se realiza la identificacin de incidentes y la registracin en la herramienta de gestin. Entrada: Escalamiento Jerrquico, Incident Manager, Reporte del usuario, Personal de TI, Gestin de Cambios, Gestin de Request, Gestin de Eventos Salida: Incidente registrado 4.1.1. Detectar el Incidente Los incidentes pueden producirse cuando un usuario se contacta con la Mesa de Ayuda para reportar una falla, cuando se detecta un incidente por parte de un rea de IT, por la deteccin de un evento por parte de las herramientas de monitoreo, como resultado de un cambio fallido, cuando un Incident Manager detecta el mismo o cuando es escalado jerrquicamente. 4.1.2. Registrar el Incidente Se registra el incidente en la herramienta de gestin, completando los campos requeridos. 4.2. Actividad: Categorizar y Priorizar En esta actividad se realiza la categorizacin del incidente y la priorizacin de acuerdo a la matriz de prioridad. Entrada: Incidente registrado Salida: Incidente priorizado y categorizado
Autor: I. Simon Padros Area/Sector: Procesos IT Regionales Revisor: J. Nuez Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes


4.2.1. Categorizar

Pgina 3 de 14

Categorizar el incidente para determinar el origen de la falla acorde al rbol de categoras. 4.2.2. Priorizar Priorizar el incidente en base al impacto y a la urgencia (cun rpido precisa el negocio que el proceso sea resuelto), utilizando como referencia la matriz. 4.3. Actividad: Realizar Diagnostico Inicial En esta actividad el primer nivel debe realizar un primer diagnstico del incidente y lo escala en el caso que no pueda resolverlo. El grupo que lo recibe debe validar la asignacin, y en caso que sea vlida, tomar el incidente. Entrada: Incidente priorizado y categorizado Salida: Incidente con asignacin aceptada 4.3.1. Realizar Diagnostico Inicial El primer nivel, usando la informacin disponible en la CMDB, la base de soluciones y los procedimientos especficos de la mesa debe realizar un primer diagnstico del incidente. Tambin tiene que asociar el CI correspondiente. 4.3.2. Asignar el Incidente Si el primer nivel no puede resolver el incidente, o el incidente estaba asignado incorrectamente, dentro del formulario de incidente correspondiente, se selecciona el grupo de solucin que debe trabajar en el incidente. 4.3.3. Validar Asignacin El especialista asignado ingresa a la herramienta de gestin y verifica que el incidente est asignado correctamente. Si corresponde a su grupo, toma el incidente, si no lo vuelve a asignar al grupo correspondiente si lo conoce, caso contrario lo enva al grupo que le asign el ticket. 4.3.4. Tomar Incidente El responsable de continuar la investigacin de la falla, se asigna a su usuario el incidente en cuestin. 4.4. Actividad: Investigar y Diagnosticar En esta actividad se debe investigar la falla y encontrar un diagnstico final para poder luego aplicar la solucin. Se deben documentar todas las acciones que se realicen. Entrada: Incidente asignado Salida: incidente con el diagnstico realizado 4.4.1. Investigar la Falla El analista que tiene asignado el incidente, usando la informacin disponible en la CMDB, la base de soluciones y los procedimientos especficos del rea, debe realizar un diagnstico del incidente. En el caso que sea necesario, deber contactar a los proveedores para que lo ayuden con la solucin.

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes


4.4.2. Documentar Actividades

Pgina 4 de 14

Todas las actividades realizadas en este paso deben ser registradas en la herramienta de gestin correspondiente. 4.4.3. Asignar Como Pendiente En los casos en los que se espere una respuesta del cliente para poder continuar con la investigacin, el incidente debe quedar en estado pendiente. 4.5. Actividad: Resolver y Cerrar En esta actividad se realiza la resolucin y cierre del incidente. Entrada: Incidente con diagnstico realizado Salida: Incidente cerrado 4.5.1. Resolver De acuerdo al diagnstico del mismo, debe aplicarse la solucin del incidente. Puede ser una nueva solucin o aplicarse una solucin existente. 4.5.2. Validar solucin Se debe validar con el usuario que la solucin aplicada sea realmente lo que resuelve el incidente. 4.5.3. Cerrar Los incidentes pasan a estado cerrado luego de la confirmacin del usuario o despus de un tiempo establecido. 4.6. Actividad: Gestionar Incidentes Mayores En este actividad se realiza la gestin de los incidentes crticos y altos*. Entrada: Incidente crtico o alto* Salida: Incidente resuelto 4.6.1. Escalar al Incident Manager Informar telefnicamente al Incidente Manager, o al siguiente nivel de escalamiento hasta hacer contacto y recibir confirmacin. 4.6.2. Validar Criticidad El Incident Manager confirma si realmente es un incidente crtico o alto*. Si no lo es, el proceso sigue el flujo de resolucin del incidente normal. 4.6.3. Abrir el Bridge El Incident Manager realiza la apertura del bridge de comunicacin, agregando a todo el personal involucrado en la resolucin del incidente. La primer actividad del bridge consiste en validar si es realmente un Incidente crtico o alto*. El bridge se mantiene activo hasta la resolucin final del incidente, y la confirmacin por parte del negocio. 4.6.4. Comunicar Incidente Se enva la comunicacin (placa) de incidente crtico o alto* segn corresponda a la lista de distribucin correspondiente para cada pas.
Autor: I. Simon Padros Area/Sector: Procesos IT Regionales Revisor: J. Nuez Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes

Pgina 5 de 14

4.6.5. Escalar Jerrquicamente Informar telefnicamente al Incidente Manager, o al siguiente nivel de escalamiento hasta hacer contacto y recibir confirmacin. El Incident Manager ejecuta el siguiente nivel de escalamiento, transcurrido el tiempo estipulado en el escalamiento jerrquico. En los casos de los incidentes alto*, el escalamiento es slo hasta el nivel gerencial de operaciones local y regional, dejando la decisin de continuar el escalamiento en la figura del gerente de operaciones. En los casos del incidente crtico, se activan los sucesivos niveles de escalamiento jerrquico, durante todo el ciclo de vida del incidente crtico finalizando con la resolucin del mismo. 4.6.6. Enviar Actualizacin El Incident Manager enva a la lista de distribucin correspondiente, una actualizacin de estado y avance, cada 15 minutos de vida del incidente, comenzando desde que es informado. 4.6.7. Cerrar el Bridge Una vez que el Incidente est resuelto, el Incident Manager cierra el bridge. 4.6.8. Enviar Informe Preliminar Transcurridas 24 horas desde la solucin del incidente, el grupo resolutor debe adjuntar en el registro de la herramienta de gestin, el informe preliminar de incidente crtico, utilizando el modelo correspondiente. 4.6.9. Informar en daily y weekly ops El Incident Manager debe informar lo ocurrido en la daily ops y en la weekly. 4.6.10. Enviar informe final

Transcurridas 48 horas desde la solucin del incidente se actualiza el informe preliminar con la versin completa.

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes


5. Anexo
5.1. Tabla RACI Detectar y Registrar Analista de Primer Nivel R R Analista de Segundo Nivel R R

Pgina 6 de 14

Tarea / Rol Detectar el Incidente Registrar el Incidente Categorizar y Priorizar Tarea / Rol Categorizar Priorizar Realizar Diagnostico Inicial Tarea / Rol Realizar diagnostico inicial Asignar Incidente Validar Asignacin Tomar Incidente Investigar y Diagnosticar Tarea / Rol Investigar la falla Documentar Actividades Asignar como pendiente Resolver y Cerrar

Incident Manager R-A R-A

Analista de Primer Nivel R R

Analista de Segundo Nivel R R

Incident Manager R-A R-A

Analista de Primer Nivel R R -

Analista de Segundo Nivel R R R R

Incident Manager R-A R-A R-A R-A

Analista de Primer Nivel -

Analista de Segundo Nivel R R R

Incident Manager R-A R-A R-A

Tarea / Rol Resolver Validar Solucin Cerrar

Analista de Primer Nivel R R R

Analista de Segundo Nivel R -

Incident Manager R-A A A

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes

Pgina 7 de 14

Gestionar Incidentes Mayores Tarea / Rol Escalar al Incident Manager Validar criticidad Abrir el bridge Comunicar incidente critico Escalar jerrquicamente Enviar actualizacin Cerrar el bridge Enviar informe Informar en daily y weekly ops Enviar informe final R: Responsable A: Accountable C: Consulted I: Informed Analista de Primer Nivel R Analista de Segundo Nivel R Incident Manager R-A R-A R-A R-A R-A R-A R-A R-A R-A R-A

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes


5.2. Circuitos Proceso
1.0 - GESTION DE INCIDENTES Escalamiento Jerrquico Usuario Personal de TI Gestin de Eventos
SI

Pgina 8 de 14

Gestin de Cambios

Gestin de Request

CI1 CI2

1.1 Detectar y Registrar

Es realmente un incidente?
SI

NO

Gestin de Request

1.2 Categorizar y Priorizar


CI9 A CC17

Es mayor?
NO

SI

1.6 Gestionar Incidentes Mayores

1.3 Realizar Diagnstico Inicial


CMDB Precisa derivacin?
SI

Base de Soluciones Documentacin Propia

1.4 Investigar y Diagnosticar


Precisa investigar causa raiz?
NO NO
CI6 CI8

CI5

SI

Gestin de Problemas

Se modifica CI?
NO SI

SI

Gestin de Cambios Gestin de la Demanda

CI7

Se deriva de un proyecto?
NO

CI3 CI4

1.5 Resolver y Cerrar

Fin

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes

Pgina 9 de 14

Detectar y Registrar
1.1 - GESTION DE INCIDENTES - Detectar y Registrar

Incident Manager

Usuario

Esc. Jerrquico

Personal de TI

Gestin de Eventos

Gestin de Request

Gestin de Cambios

1.1.1 Detectar el Incidente

Es realmente un incidente? SI 1.1.2 Registrar el Incidente

NO

Gestin de Request

CI1 CI2

Mximo

Ir a 1.2

Categorizar y Priorizar
1.2 - GESTION DE INCIDENTES - Categorizar y Priorizar

De 1.1

1.2.1 Categorizar Matriz de Prioridades 1.2.2 Priorizar De 1.5.2 Mximo

Es mayor?

SI

Ir a 1.6

NO Ir a 1.3

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes


Realizar Diagnostico Inicial
1.3 - GESTION DE INCIDENTES - Realizar Diagnstico Inicial
De 1.2 CMDB

Pgina 10 de 14

1.3.1 Realizar diagnstico inicial

Documentacin propia Base de Soluciones

Ir a 1.5

No

Precisa derivacin?

1.3.2 Asignar Incidente

NO

1.3.3 Validar asignacin Mximo Asignacin valida? SI 1.3.4 Tomar Incidente

Ir a 1.4

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes


Investigar y Diagnosticar
1.4 GESTION DE INCIDENTES Investigar y Diagnosticar

Pgina 11 de 14

De 1.3 CMDB

Documentacin propia Base de Soluciones

1.4.1 Investigar la falla

1.4.2 Documentar actividades

Mximo

Se est esperando informacin? NO Precisa investigar causa raiz? NO


CI6 CI8

SI

1.4.3 Asignar como pendiente

CI5

SI

Gestin de Problemas

Se modifica CI? NO

SI

Gestin de Cambios

CI7

Se deriva de un proyecto? NO Ir a 1.5

SI

Gestin de Cambios

Resolver y Cerrar
1.5 - GESTION DE INCIDENTES Resolver y Cerrar

De 1.4

De 1.3

Gestin de Problemas

Gestin de Cambios

CMDB 1.5.1 Resolver


CI4

Documentacin propia Base de Soluciones

1.5.2 Validar solucin Mximo Solucin vlida? SI


CI3

Ir a 1.2.2

NO

1.5.3 Cerrar

FIN

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes

Pgina 12 de 14

Gestionar Incidentes Mayores


1.6 - GESTION DE INCIDENTES Gestionar Incidentes Mayores

De 1.2.2
CI10

Lista de Distribucin

Ir a 1.4 1.6.1 Escalar al Incident Manager 1.6.2 Validar criticidad

Ir a 1.3 NO Mayor?
CI9 C11 CI12 CI13

1.6.3 Abrir el Bridge

1.6.4 Comunicar Incidente crtico

1.6.5 Escalar jerrquicamente

1.6.6 Enviar actualizacin

CI3 CI14

Resuelto?

SI

1.6.7 Cerrar el bridge

CI15 CI16

CI17

1.6.8 Enviar informe preliminar

1.6.9 Informar en Daily y weekly Ops

1.6.10 Enviar informe final

FIN

NO Ir a 1.4

5.3. Roles y Responsabilidades Rol Process Owner de Gestin de incidentes Responsabilidad Llevar a cabo el rol genrica de Process Owner para el proceso de Gestin de Incidentes Disear modelos de incidentes y flujos de trabajo Trabajar con otros dueos procesos para asegurar que haya un enfoque integrado para el diseo e implementacin de Gestin de Problemas, Gestin de Problemas, Gestin de Eventos, Gestin de Acceso y Gestin de Solicitudes Llevar a cabo rol genrico de Process Manager para Gestin de incidentes Planificar y gestionar el soporte para las herramientas y el proceso de Gestin de Incidentes Coordinar las interfaces entre la Gestin de Problemas y otros procesos de la Gestin de servicios Servir de intermediario con todos los grupos de resolucin de incidentes para garantizar la rpida resolucin de incidentes dentro de objetivos de los SLA Servir de intermediario con los proveedores, contratistas, etc. para asegurarse que terceras partes cumplan con sus obligaciones contractuales, especialmente con respecto a la resolucin de incidentes y el suministro de informacin relacionada con el problema y los datos Organizar, ejecutar, documentar y todas las actividades de seguimiento relativas a las revisiones de problemas importantes
Revisor: J. Nuez Autorizador: C. Pregoni

Process Manager de Gestin de incidentes

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes


Mesa de Servicio Analista de 2 Nivel

Pgina 13 de 14

Atencin y registro de incidentes Resolucin de incidentes en primer nivel Seguimiento de incidentes Comunicacin con los usuarios de TI Restaurar los servicios interrumpidos en el tiempo requerido por los usuarios de la organizacin, normalmente documentado en el acuerdo de nivel de servicio Documentar progreso, resolucin y respuestas a las llamadas de servicio Realizar bsquedas de soluciones de incidentes o llamadas de servicio en la Base de Errores Conocidos Escalar Incidentes crticos al Incident Manager Resolucin de todos los incidentes asignados por la Mesa de Servicios Seguimiento de los incidentes asignados al grupo Reclasificar los incidentes en los casos que sea necesario Reasignar los incidentes a otros grupos de soporte, de acuerdo al procedimiento de escalamiento Restaurar los servicios interrumpidos en el tiempo requerido por los usuarios de negocio, normalmente documentado en el acuerdo de nivel de servicio Documentar la resolucin y respuestas a los incidentes asignados Realizar bsquedas de soluciones de incidentes en la Base de Errores Conocidos o Base Histrica de Incidentes Escalar Incidentes crticos al Incident Manager

5.4. Checklist de los Puntos de Control

Checklist Control Procedimiento

5.5. Factores Crticos de xito y KPI CSF Resolver incidentes tan rpido como sea posible minimizando el impacto en el negocio KPI Tiempo medio de resolucin de incidentes por impacto Porcentaje de incidentes por estado Porcentaje de incidentes resueltos por la mesa de servicios (sin necesidad de escalarlo) Nmero y porcentaje de incidentes resueltos de manera remota, sin la necesidad de una visita presencial Nmero de incidentes resueltos antes de que impacte al negocio (ej. incidentes levantados por gestin de eventos y resueltos antes que impacte en el negocio)

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni

Proceso Incident Mgmt v2.0

Proceso: Gestin de Incidentes

Pgina 14 de 14

Mantener la calidad de los servicios de TI

Mantener la satisfaccin de los usuarios con respecto de los servicios de TI Incrementar la visibilidad y la comunicacin de los incidentes al negocio y a TI

Nmero total de incidentes (como una medida de control) Cantidad de incidentes pendientes (sin resolver/cerrar) para cada servicio Nmero y porcentaje de incidentes mayores para cada servicio de TI Puntaje promedio en las encuestas de satisfaccin (total y por categora) Porcentaje de encuestas contestadas vs encuestas enviadas Cantidad de llamadas u otros contactos de los usuarios, en promedio, sobre incidentes ya reportados Cantidad de quejas de los usuarios sobre el contenido y calidad de la comunicacin de incidentes Porcentaje de incidentes gestionados dentro de los tiempos definidos en el SLA (segn el impacto y la urgencia) Nmero y porcentaje de incidentes asignados incorrectamente Nmero y porcentaje de incidentes categorizados incorrectamente

Alinear las actividades y las prioridades de la gestin de incidentes con el negocio Asegurar que se usen mtodos y procesos estandarizados para gestionar los incidentes para mantener la confianza del negocio en TI

6. Glosario
Trmino Descripcin

7. Log de Auditora
Fecha
27/11/2012 29/11/2012 05/04/2013

Versin
2.0 2.0 2.0

Observaciones
Versin Inicial Revisin Procesos IT Agregado Puntos de Control

Autor
R. Lombardi I. Simon Padros F. De Rentis

Autor: I. Simon Padros Area/Sector: Procesos IT Regionales

Revisor: J. Nuez

Autorizador: C. Pregoni