You are on page 1of 11

2015

ANLISIS DE AVERAS PARA


DETERMINAR LA CAUSA RAZ

Alejandro Palacios Rodrigo


Rosmann Ingeniera, Software y
Mantenimiento Industrial S.L.
1-3-2015

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ

pg. 1

CURSO DE ATMSFERAS EXPLOSIVAS (ATEX)


CURSO DE RIESGO ELCTRICO
CURSO DE OPERADOR INDUSTRIAL DE CALDERAS
CURSO BSICO DE INSTRUMENTACIN Y CONTROL
CURSO PRCTICO DE AUDITORAS ENERGTICAS

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ

ANALISIS DE AVERAS PARA DETERMINACIN DE CAUSA RAIZ Y


UN EJEMPLO PRCTICO.
INTRODUCCIN
Una de las tareas ms
importantes que debera
desarrollar un jefe de
mantenimiento consiste
en analizar qu averas y
porqu
se
estn
produciendo
en
la
instalacin. Comprender
por qu sucede un hecho
es clave para evitar que
vuelva a suceder en el
futuro. Cualquier tcnico
de mantenimiento sabe que en numerosas ocasiones debe reparar una avera
que ya haba ocurrido y reparado con anterioridad. Parece evidente que,
cuando una avera se repite por primera vez (y cuando digo se repite es que ya
haba sucedido una vez anterior), la probabilidad de que se repita en el futuro
es alta.
En muchas ocasiones, los tcnicos de mantenimiento se limitan a reparar la
avera, sin investigar las causas que han llevado a dicho situacin. Pongamos un
ejemplo cotidiano, que si bien no tiene que ver con la tcnica, ilustra lo que
acabo de decir:
Si me duele la cabeza y tomo una aspirina, estoy atacando el sntoma.
Inmediatamente el dolor desaparece, pero la causa del mismo sigue activa. Si
dicha causa es que necesito gafas y no me las pongo, cada vez que inicie la
lectura, volver a presentar los sntomas.
Pongamos otro ejemplo: Supongamos una instalacin cuya operacin requiere
la manipulacin de dos vlvulas en un determinado orden, procediendo a la
apertura de la vlvula 1 y seguidamente la 2. El hecho de que un operario
proceda a la apertura de la vlvula 2 en lugar de la apertura de la vlvula 1,
nos lleva a la conclusin inmediata de que la causa de la avera es el error del
tcnico. Sin embargo esta conclusin es pobre y no evita que suceda en el
futuro. Cul ha sido el la razn por la cual el operario fall? La respuesta puede
ser una falta de formacin, unos procedimientos poco claros o incluso un error
en la sealizacin de las vlvulas. Determinar la causa ltima que llev al
operario al error permitir tomar medidas que eviten (o minimicen) la
probabilidad de fallo en el futuro.

pg. 2

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ


Sin lugar a dudas, identificar los problemas es una oportunidad de mejorar. Por
este motivo, todo anlisis de causa raz debe finalizar con un apartado de
recomendaciones que eviten que se repitan esos hechos en el futuro.

LA DIMENSIN ECONMICA
Es importante que los responsables de mantenimiento tomen conciencia de la
trascendencia econmica que para una instalacin tiene que existan averas
repetitivas. Estos son los aspectos sobre los que tiene influencia:

Las averas repetitivas tienen un coste de repuestos. Coste que sera


innecesario si se hubiese investigado la causa raz.
Si la avera detiene total o parcialmente la operacin de la planta,
tenemos adems un coste por produccin.
Debemos sumar el riesgo de avera de otros equipos como consecuencia
del fallo del primero. Como ejemplo, bombas de lubricacin que fallan,
termostatos de proteccin, sensores de temperatura sobre los que se
apoya el sistema de control puede tener consecuencias graves y
costosas.

LOS LMITES DE LA INVESTIGACIN


Hay que tener en cuenta que la investigacin de la causa ltima que provoca
una avera o causa raz, debe tener unos lmites. La investigacin consume
recursos y tiene tambin un coste econmico, razn por la cual se debe
establecer unos lmites que racionalicen su desarrollo.

Las causas encontradas son suficientes para explicar lo sucedido. Se trata


de encontrar una razn controlable dentro de los trminos y parmetros
de la propia instalacin.
Se pueden identificar de una manera razonable y usando medios
razonables. Utilizando medios tcnicos y recursos que justifiquen que el
coste de encontrar el origen de la avera es menor que la consecuencia
de la propia avera.
Ser susceptibles de ser controladas y corregidas. Hay que evitar concluir
en causas de tipo genrico que no aportan ningn valor como error del
operario o debido a los procedimientos.

LA METODOLOGA
Encontrar la causa ltima que trae como consecuencia una avera no es una
tarea sencilla y requiere de una base de conocimientos slida por parte del
tcnico que investiga, as como de una metodologa rigurosa que le permita
llegar a conclusiones fiables.
La metodologa que se utiliza para obtener estas conclusiones se denomina
anlisis de causa raz, y es conocida internacionalmente.

pg. 3

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ

Los pasos que se deben seguir son los siguientes:


1. Recopilacin de daos observados
2. Recopilacin de hechos que se puede corroborar que han sucedido. Es
importante recopilar informacin de las siguientes fuentes:
a. Sistemas de control y monitorizacin de equipos
b. Entrevistas con tcnicos
c. Observaciones del propio inspector
3. Recopilacin de hechos significativos, es decir, hechos que
aparentemente no tienen que ver con los daos pero que suceden en la
misma ventana temporal que los mismos, y que por consiguiente, merece
la pena tenerlos en consideracin.
4. Elaboracin del diagrama causal. Este diagrama desarrolla hiptesis
siguiendo secuencias de hechos de acuerdo a los datos recopilados.
5. Descartar la hiptesis que no justifiquen los daos observados o no
contemplen los hechos corroborados. El resultado es un diagrama de
causa-efecto, es decir, de todos los posibles diagramas del apartado 4
solo uno explica la secuencia temporal y es compatible con los daos y
hechos corroborados.
6. Conclusiones y propuestas

EJEMPLO
El ejemplo que se detalla a continuacin es un caso real. Se han alterado
algunos datos y hechos por motivos de confidencialidad, pero la base
fundamental de los acontecimientos se ha mantenido para ilustrar todo lo dicho
hasta aqu. No obstante, se han omitido aspectos que le restan rigor al informe,
para evitar una gran extensin y que el documento pierda su carcter formativo.

En la instalacin industrial de este ejemplo, se dispone de varios procesos


productivos. Se dispone de una red informtica con un rack donde se han
montado Switches gestionables para el envo y recepcin de informacin,
almacenamiento de datos en servidores, comunicacin de PLCs y control
remoto.
Estos switches se encuentran protegidos por un UPS.
El esquema de montaje de los equipos es el siguiente:

Interruptor
Automtico

Interruptor
Automtico

Cuadro
Principal
Fig.1 Esquema de la instalacin inicial

pg. 4

Diferencial
Superinmunizado

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ

Tras una revisin tcnica, los electricistas modifican la instalacin, quedando


como sigue:

Interruptor
Automtico

Interruptor
Automtico

Cuadro
Principal

Diferencial
Superinmunizado

Fig.2 Esquema de la instalacin final

Al da siguiente se produce una avera de los switches, debiendo ser sustituidos.


Dado el alto coste de estos, se solicita un anlisis de la avera con objeto de
determinar la causa raz del problema y solicitar la indemnizacin al seguro, a la
empresa de instalaciones elctricas o al fabricante de la UPS por no haber
protegido los equipos de manera correcta.

ANLISIS
Siguiendo la metodologa:
1) Recopilacin de daos observados.
Se puede verificar que los switches no responden (poseen un IP fija
para su gestin). Tampoco responde ningn equipo conectado a
travs de sus puertos.
Se percibe un olor a quemado al acercarse a ellos.
No se aprecia ningn otro dao sobre ningn equipo ms, ni del
proceso productivo ni informtico.
2) Hechos corroborados.
a. Entrevista con los tcnicos y operarios: Lo primero que realizan los
ingenieros encargados del anlisis es hablar con los tcnicos y
operarios para tratar de identificar una secuencia de hechos. La
descripcin que los operarios realizan es la siguiente:
i. sobre las 9:45 de la maana, se observa como deja de
funcionar la comunicacin entre los equipos informticos.
Al no saber la causa que origina esta cada, se procede a
inspeccionar el S.A.I. que protege las alimentaciones de las
lneas informticas, observando que el equipo se encuentra
sin tensin y sin bateras, y que la alarma de falta de tensin
y baja batera se encuentra activada.
ii. Se abre el cuadro donde se encuentra el magnetotrmico
que protege la alimentacin del S.A.I. y este se encuentra
disparado, por lo que se rearma y el S.A.I. vuelve a entrar en

pg. 5

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ


funcionamiento observando que se posiciona en la opcin
de Bypass. Tras el rearme, se detecta que sigue sin haber
comunicacin con la planta.
iii. La revisin por parte del departamento informtico,
comprueba que los switches se encuentran averiados, con
olor a quemado.
iv. Segn el departamento informtico, la UPS debera haber
protegido los equipos, por lo que se solicita un informe
tcnico que determine el funcionamiento incorrecto de la
UPS con objeto de ejecutar la garanta del equipo con el
fabricante.
b. Datos registrados por los equipos
i. El tcnico de la UPS descarga informacin de los datos
registrados por el equipo. En su informe, al que los ingenieros
que realizaban el anlisis de causa raz tuvieron acceso,
indicaba lo siguiente:
El cliente expresa que al detectar defecto en las cargas,
identifican la proteccin de entrada a la UPS abierta, y
proceden a rearmar este elemento para reestablecer el
servicio. A las dos horas y cuarto, al detectar que no pasa
la UPS a trabajar sobre ondulador, pulsan el botn verde del
display, para forzar el trabajo sobre dicho ondulador, y dejar
el servicio de la UPS correcto. El histrico de la mquina
presenta trabajo sobre bateras, prealarma fin de
autonoma, y posteriormente paso a by-pass esttico por fin
de autonoma, y cero elctrico al no tener tensin dicho bypass, por ser comn la entrada de by-pass y rectificador. El
cero elctrico se ha producido, por fin de autonoma de las
bateras. No se detecta funcionamiento anmalo en el
histrico de la mquina, ni alarmas actuales de defecto en
el equipo
3) Hechos significativos:
a. Se recoge como hecho significativo (que puede guardar relacin
con lo acontecido o no) el cambio de posicin del diferencial que
tuvo lugar el da anterior.
b. Se recoge como hecho significativo que no se produjese disparo
de ningn otro interruptor automtico, ni alteracin de ningn otro
equipo de toda la planta.

pg. 6

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ

4) Diagrama causal y elaboracin de hiptesis.


a. Desarrollando los hechos en el tiempo:
Disparo del automtico

Rearme automtico

Entrada en funcionamiento de
baterias

9:45 AM

10:05 AM
9:50 AM

6:15 AM

Deteccin de falta de
conexin switches

Confrmacin avera
switches

Fig.3 Esquema causal con lnea de tiempos (inicial)

Cules son las hiptesis que pueden explicar dicha secuencia de


hechos y el dao causado a los equipos?
Cmo se puede daar un switch
Las principales causas por las que un elemento electrnico como
un switch se daa son debidas a:

Bajadas y subidas de tensin


Sobretensiones e impulsos de corta duracin
Cambios de frecuencia

Estos efectos se producen fundamentalmente si:

pg. 7

Se producen conmutaciones de compaas elctricas.


Se produce actuacin de dispositivos de proteccin de redes.
Se producen cortocircuitos.
Se producen entradas o salidas de cargas inductivas en la red
elctrica donde estn los equipos
Se producen conmutaciones de mquinas de gran potencia.
Se producen transitorios por transferencias de energa (grupos
electrgenos).
Se producen descargas de rayos.

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ

Esto nos lleva a elaborar la siguiente hiptesis:


La causa por la que se han daado los dispositivos electrnicos
es una alteracin en la lnea elctrica donde estaban conectados
los equipos, bien por pico de tensin o de corriente. En cualquier
caso, se descarta completamente el hecho de la modificacin de
posicin del diferencial, que nunca puede producir estos efectos.
Analicemos ahora si es compatible con la lnea de tiempos y si es
compatible con los hechos corroborados y significativos que se
han observado:
1.- Los equipos no protegidos por la UPS, pueden ser daados por
el pico de tensin, y los protegidos por UPS? No sera posible.
2.- En realidad si atendemos a la escala de tiempos si es posible:
PICO DE CORRIENTE

DAADO DE SWITCHES
NO PROTEGIDOS

Disparo del automtico


Rearme del automtico
DAADO DE SWITCHES PROTEGIDOS
Al encontrarse en modo bypass, la corriente
entra de forma directa, sin filtrar

Entrada en funcionamiento de
baterias

9:45 AM

10:05 AM

9:50 AM

6:15 AM
Alarma fin de
bateras

Deteccin de falta de
conexin switches

Confrmacin avera
switches

ENTRADA MODO BYPASS

FIN DE BATERAS

Fig.4 Esquema causal con lnea de tiempos (final)

Adems, el pico de corriente es compatible con el disparo del


interruptor automtico, ya que la parte magntica del interruptor
produce el disparo (como si fuera un cortocircuito).
No obstante, un pico de corriente no dura tanto tiempo para
daar los equipos protegidos por la UPS casi tres horas despus de
haber daado los que se encontraban fuera de la proteccin de
las bateras. Sin embargo, el rearme del interruptor automtico

pg. 8

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ


conecta todos los consumidores de la lnea de manera simultnea,
provocando un nuevo pico de corriente. Este pico de corriente si
entra de manera directa a los equipos electrnicos al encontrarse
la UPS en modo bypass, lo que hace compatible los daos con la
secuencia de hechos observados.
Como la hiptesis es compatible con los daos observados, con
los hechos corroborados y en el diagrama podemos explicar la
secuencia de hechos que nos ha llevado a esta situacin, esta
hiptesis se puede aceptar como causa ms probable.
Pero si nos quedamos aqu, no habremos determinado la raz del
problema, y con probabilidad volver a suceder.
Es el pico de corriente debido a un evento exterior, como un rayo
o la conexin o maniobra de un centro de transformacin o es
debido a un proceso productivo interno, que produce armnicos
y picos de corriente capaces de provocar los efectos que hemos
visto?

HIPTESIS 1
Un pico de corriente exterior debido a una conexin o maniobra
de un transformador ha provocado el disparo y los daos.
HIPTESIS 2
Un proceso productivo es el que ha provocado una importante
carga armnica y ha provocado el disparo del automtico y los
daos.

5) Descarte de hiptesis no compatibles


La hiptesis 1 no es compatible con los hechos significativos que se
anotaron fundamentalmente por la siguiente razn:
Un interruptor automtico se elige por varios parmetros. Dos de los
ms importantes (a parte de su poder de corte) son:
1.- TENSIN NOMINAL DE FUNCIONAMIENTO (Un) (en V) Tensin o
tensiones en las que se puede usar el automtico.
2.- INTENSIDAD NOMINAL (In) (en Amperios (A)) Este valor caracteriza
la capacidad del dispositivo para soportar sobreintensidades
transitorias (cortocircuito) o continuadas (disparo por calentamiento
en la parte trmica).

pg. 9

FICHA TCNICA: ANALISIS DE AVERAS Y CAUSA RAZ

Fig.5 Curva caracterstica de un interruptor automtico

Por tanto, todos los dispositivos con igual o inferior intensidad de corte,
hubiesen disparado.
6) Conclusiones y recomendaciones:
La causa ms probable de los daos es una alteracin (armnicos,
conexin de equipos con bobinas etc) que se produjo en el interior de
la instalacin durante la operacin de algn proceso productivo. Los
equipos que produjeron esa alteracin se encuentran conectados en el
mismo cuadro y lnea de alimentacin elctrica donde se encontraban
los equipos electrnicos daados.
Esta alteracin produjo los daos en los equipos no protegidos y dispar
el interruptor automtico, quedando en funcionamiento parte de los
equipos debido a las bateras. La UPS emiti alarma de fin de batera, que
no est conectada al email o cualquier otro mtodo de aviso a los
administradores del sistema. De igual forma no exista generador auxiliar
con arranque automtico en caso de detectar ausencia de tensin. Esto
llev al agotamiento de las bateras y cero elctrico con desconexin de
los equipos. El rearme del interruptor provoc un nuevo pico de consumo
que da los equipos electrnicos, ya que se encontraba la UPS en modo
bypass.
Como recomendaciones:
Conectar generador auxiliar de arranque automtico
Conectar servicio de aviso por mail
Analizar en la red la existencia de armnicos y poner filtros

pg. 10