Вы находитесь на странице: 1из 14

Tiempo Medio Entre Fallas y

Tiempo Medio Para Reparar


Tiempo Medio Entre Fallas y Tiempo Medio Para Reparar son dos KPI importantes en el mantenimiento
de planta.

MTBF = (Tiempo total de funcionamiento) / (nmero de fallas)

MTTR = (Tiempo total de inactividad) / (nmero de fallas)

Qu significan?
"Tiempo Medio" significa, estadsticamente, el tiempo promedio.

El "Tiempo Medio Entre Fallas" (MTBF) es literalmente el promedio de tiempo transcurrido entre una
falla y la siguiente. Usualmente la gente lo considera como el tiempo promedio que algo funciona hasta
que falla y necesita ser reparado (otra vez).

El "Tiempo Medio Para Reparar" (MTTR) es el tiempo promedio que toma reparar algo despus de una
falla.

Para algo que no puede ser reparado, el trmino correcto es "Tiempo Medio Para Falla" (MTTF).
Algunos definiran el MTBF para aparatos capaces de reparacin- como la suma de MTTF ms MTTR.
(MTBF = MTTF + MTTR). En otras palabras, el tiempo medio entre fallas es el tiempo de una falla a
otra. Esta distincin es importante si el tiempo de reparacin (MTTR) es una fraccin significativa del
MTTF.

Aqu hay un ejemplo. Un bombillo en un candelabro no es reparable, por lo que el MTTF es ms


apropiado. (El bombillo ser sustituido). El MTTF podra ser 10,000 horas.

Por otro lado, sin cambios de aceite, el motor de un automvil puede fallar luego de 150 horas de
conduccin en carretera ese es el MTTF. Asumiendo 6 horas para quitar y sustituir el motor (MTTR), el
MTBF es 150 + 6 = 156 horas.

Como los automviles, la mayora del equipo de fabricacin ser reparado, en lugar de sustituido
despus de una falla, por lo que el MTBF es la medida ms apropiada.

Qu es una Falla?
"Falla" puede tener mltiples significados. Examinemos brevemente las "fallas" de un aparato.

Una Fuente de Poder Ininterrumpida (UPS) puede tener cinco funciones bajo dos condiciones:

Cuando la energa principal est disponible:


o Permitir que la energa fluya desde la fuente principal a la mquina que est
siendo protegida
o Acondicionar la energa limitando los picos de energa o bajones de voltaje
o Almacenar energa en una bacteria, hasta la carga total de la batera
Cuando la energa principal se interrumpe:
Proveer energa continua a la mquina que est siendo protegida
Emitir una seal para indicar que la energa principal est apagada
No hay duda de que el UPS ha fallado si impide que la energa principal fluya hacia la mquina que est
siendo protegida (funcin 1). Fallas debidas a las funciones 2, 3 o 5 tal vez no sean obvias, porque la
mquina "protegida" todava est funcionando por la energa principal o por la batera. Incluso si lo
notamos, estas fallan puede que no provoquen medidas correctivas inmediatas porque la mquina
"protegida" sigue funcionando y puede que sea ms importante mantenerla trabajando que reparar o
sustituir el UPS.

Qu es Disponibilidad?
La "disponibilidad" de un aparato es, matemticamente, MTBF / (MTBF + MTTR) para el tiempo de
trabajo programado. El automvil del ejemplo anterior est disponible durante 150/156 = 96.2% del
tiempo. La reparacin es tiempo de inactividad no programado.

Con un cambio de aceite de media hora no programado cada 50 horas cuando un indicador del tablero
alerta al conductor la disponibilidad incrementara a 50/50.5 = 99%.

Si los cambios de aceite se programaran adecuadamente como una actividad de mantenimiento,


entonces la disponibilidad sera 100%.

Por qu son importantes?


La "disponibilidad" es un indicador clave de rendimiento en la fabricacin, es parte de la medida de
"Eficiencia General de Equipos" (OEE).

Un programa de produccin que incluye tiempo de inactividad para mantenimiento preventivo puede
predecir con precisin la produccin total. Los programas que ignoran el MTBF y el MTTR son
simplemente futuros desastres esperando remedio.

Cmo calcular el MTBF actual


El MTBF actual o histrico se calcula utilizando observaciones en el mundo real. (Existe una disciplina
aparte para que los diseadores de equipo pronostiquen el MTBF, basndose en los componentes y la
carga de trabajo prevista).

El clculo del MTBF actual requiere de un conjunto de observaciones, cada observacin es:

Momento del tiempo de funcionamiento: el momento en el cual una mquina


empieza a trabajar (inicialmente o despus de una reparacin)
Momento del tiempo de inactividad: el momento en el cual una mquina fall
despus de trabajar a partir del momento de tiempo de funcionamiento previo
Por lo que cada Tiempo Entre Falla (TBF) es la diferencia entre una observacin del Momento del
tiempo de funcionamiento y el subsecuente momento del tiempo de inactividad.

Se necesitan tres cantidades:

n = Nmero de observaciones.
ui = Este es el isimo Momento del tiempo de funcionamiento
di = Este es el isimo Momento del tiempo de inactividad que sigue al isimo
Momento del tiempo de funcionamiento
Por lo que el MTBF = Sumatoria (di ui)/ n , para todos los i = 1 durante n observaciones. Ms
sencillamente, es el tiempo de trabajo total dividido entre el nmero de fallas.

El clculo de la Confiabilidad

Claro, no basta con un solo ndice para medir la gestin del


mantenimiento. Para tener una visin ms completa, se hace necesario
analizar el ndice de confiabilidad junto con la disponibilidad, la
mantenibilidad, etctera.

An as, la metodologa para llevar a cabo el clculo de este ndice no


aparece con claridad en los textos especializados o se remiten al empleo
de la distribucin de Weibull el cual es complejo por el clculo de sus
parmetros; y he tenido la experiencia con asesores en la
implementacin de programas de mantenimiento, que stos slo se
limitan al clculo de variables como el MTBF (Tiempo Medio entre Fallas)
y el MTTR (Tiempo Medio Para Reparacin) como un indicativo de la
confiabilidad y ninguna referencia directa al clculo de sta.

Con base en lo anterior, el objetivo del presente artculo es desarrollar un


mtodo para el clculo de este ndice, con base en el MTBF y el MTTR y
teniendo en cuenta los tres posibles arregles de los sistemas: Serie,
Paralelo y Redundante, pues la confiabilidad se ve afectada de forma
directa dependiendo del tipo de sistema.

Es de aclarar que el mtodo de clculo de la confiabilidad que se


presenta es un mtodo discreto, en contraposicin al mtodo que emplea
la distribucin de Weibull, que es una distribucin continua.

El mtodo se basa en la ecuacin que presenta el Ingeniero Lourival


Augusto Tavares para el clculo de la confiabilidad [1].

Con respecto a esta ecuacin, el ingeniero Augusto Tavares dice lo


siguiente: La frmula indicada por Ud. (una de las cuatro que aparece en
mi libro)[1] es la ms sencilla de utilizar y el valor, an con un pequeo
error (que no llega a perjudicar el anlisis y la toma de decisiones) puede
ser depurado cuando se utiliza los clculos estadsticos, como los
indicados por Ud. de la distribucin de Weibull.[2]

2. LOS DATOS BASE

Para que la confiabilidad calculada tenga una alta credibilidad, los datos
con los cuales se efecta el clculo deben ser igualmente crebles; y
estos datos no son ms que los registros de los paros de los activos. Es
por ello que el registro de los paros debe hacerse de la manera ms
imparcial y objetiva posible.

El registro de los paros implica: codificacin y clasificacin; esta ltima se


puede subdividir en propios, ajenos y programados.

Los paros propios son aquellos imputables al equipo.

Los paros ajenos son paros no imputables al equipo pero que causan la
parada del mismo. Por ejemplo, una falta de energa externa.

Los paros programados son aquellos que estn establecidos en el


programa de mantenimiento anual.

Dentro de la divisin anterior, es necesario clasificarlos por especialidad:


Mantenimiento y Produccin, ya que si se desea calcular la confiabilidad
por mantenimiento nicamente, por ejemplo, slo se deben tener en
cuenta los paros imputables a ste.

La codificacin permite establecer rpidamente la falla que se imputar al


activo sin ambigedades.

3. DEFINICIN DE CONFIABILIDAD

Para tener claro nuestro horizonte, en lo referente al clculo, se debe


tener claro qu es confiabilidad, para lo cual se puede definir de la
siguiente manera: Es la probabilidad de que un sistema, activo o
componente lleve a cabo su funcin adecuadamente durante un perodo
bajo condiciones operacionales previamente definidas y constantes [2].

Como se deduce de esta definicin, la confiabilidad es un dato


estadstico, pues es una probabilidad la cual es determinada o calculada
a partir de la informacin de los registros de los paros. Como veremos
ms adelante, el clculo de la confiabilidad segn el mtodo que
expongo se basa en la definicin clsica de Laplace de probabilidad.

Otro aspecto importante de la definicin anterior, es que la confiabilidad


se puede aplicar a un sistema, a un activo o a un componente. Es en
este punto donde se debe tener en cuenta si el sistema es en serie, en
paralelo o redundante. Un activo, por ejemplo una volqueta, puede
considerarse como un sistema en serie. Vase el ejemplo al final.

Es importante resaltar, adems, que la confiabilidad se determina para


un determinado perodo de tiempo, el cual puede ser semanal, mensual,
anual, etctera, y bajo el contexto operacional en el cual opera el activo o
el sistema. No es lo mismo, por ejemplo, una bomba que impulsa agua a
otra bomba que impulsa una mezcla de caliza y agua. Aqu los contextos
operacionales son diferentes e influye directamente en la operacin del
activo, aun si ambas bombas son iguales.

4. ECUACIN BSICA

Como se mencion en el numeral 1, la ecuacin para el clculo se basa


en la expresin desarrollada por el ingeniero Lourival Tavares, en la cual
la confiabilidad est en funcin del MTBF y el MTTR:

(1)

Donde: R: Confiabilidad.

MTBF: Tiempo Medio Entre Fallas.

MTTR: Tiempo Medio Para Reparacin.


Ahora veamos como se relacionan las tres variables de la ecuacin (1):

(2) [1]

Como se observa en la ecuacin (2), dicha expresin no es ms que la


definicin de probabilidad segn Laplace: Nmero de aciertos (MTBF=
tiempo total que funciona el activo sin fallar) sobre el nmero total de
eventos (tiempo total que funciona el activo ms el tiempo que estuvo
parado para reparaciones). Esta es la ecuacin bsica para el clculo de
la confiabilidad.

Ahora bien, cmo se determinan el MTBF y el MTTR?

Las ecuaciones son las siguientes.

(3)

(4)

Donde.

hT: Horas trabajadas o de marcha durante el perodo de evaluacin.

p: Nmero de paros durante el perodo de evaluacin.

hp: Horas de paro durante el perodo de avaluacin.

Es aqu donde se hace importante tener, de manera clara, la clasificacin


de los paros por mantenimiento o produccin, pues si se quiere calcular
la confiabilidad por mantenimiento, por ejemplo, las horas de paro y el
nmero de paros deben ser los imputados a mantenimiento
exclusivamente.

5. SISTEMA EN SERIE
Los sistemas en serie se caracterizan por que el funcionamiento de cada
tem que lo compone depende directamente del funcionamiento del
componente que lo antecede y precede; es decir, si uno de los
componentes falla, falla todo el sistema. Vase la figura 1

La confiabilidad del sistema est dada por:

(5)

Donde Cf1, Cf2,....., Cfn son las confiabilidades de cada tem.

De la expresin anterior, se concluye que la confiabilidad del sistema es


el producto de las confiabilidades individuales de sus componentes.

Generalizando para n componentes:

(6)[3]

Donde:

RS: Confiabilidad del sistema.

Rj: Confiabilidad del j-simo componente.

Es el carcter multiplicativo de las confiabilidades que hace a este


sistema tan sensible a las fallas.

Dado que la confiabilidad de un sistema en serie es el producto de las


confiabilidades de sus componentes, se puede concluir que: La
confiabilidad total de un sistema en serie es menor que la confiabilidad
de cualquiera de sus componentes.

6. SISTEMA EN PARALELO
Segn Lourival Tavares: La confiabilidad final de un conjunto de
equipos, ser obtenida por la suma de los productos de las
confiabilidades de cada tem por sus capacidades de produccin, dividido
por la suma de las capacidades de produccin de esos tems [4]. Vase
la figura 2.

Segn la definicin anterior, la confiabilidad de un sistema en paralelo


est dada por:

(7)[1]

Donde Cf1, Cf2,...., Cfn son las confiabilidades de cada uno de los
equipos.

Pr1, Pr2,...., Prn son las participaciones de cada uno de los equipos en la
produccin del sistema evaluado.

Generalizando para n equipos en paralelo:

(8)
De la expresin anterior, se concluye que el paro de un equipo no implica
el paro del sistema. Esta caracterstica de los sistemas en paralelo se
debe al carcter aditivo de las confiabilidades ponderadas con la
produccin de cada uno de ellos.

Con respecto a la participacin en la produccin de cada uno los equipos


involucrados, es vlida la siguiente observacin: No necesariamente la
sumatoria de las participaciones debe ser 100% pues, por lo general, las
lneas de produccin son sobredimensionadas.

7. SISTEMA REDUNDANTE

Se entiende por un sistema redundante, un sistema que permanece en


stand bay (reserva) con el propsito de garantizar la operacin normal
del proceso. En la realidad, sistemas completos en reserva son poco
comunes, por el costo que ello implica. Un ejemplo de ello lo constituye
una planta donde se producen qumicos letales para el ambiente y la vida
en general. En este tipo de plantas se hace obligatorio tener un sistema
de control de emisiones al ambiente en reserva por las implicaciones que
se derivan de la emisin al ambiente de estos qumicos. Lo que si es
comn, es tener equipos de reserva para garantizar la normal operacin
del proceso.

Citando nuevamente a Lourival Tavares, un sistema redundante se


puede definir como: Cualquier elemento que tenga por un perodo el
100% de confiabilidad hace 1 a toda la ecuacin. Ocurrida la falla, si la
conmutacin es inmediata, la confiabilidad se mantendr en el 100%
hasta la siguiente falla de este elemento [1]. Vase la figura 3.
Segn la definicin anterior, la confiabilidad de un sistema redundante
est dada por:

(9)

Donde las variables tienen el mismo significado que en los casos


anteriores.

Generalizando para n equipos:

(10)[3]

De la expresin anterior se puede concluir lo siguiente:

La redundancia, que en la ecuacin (10) es representada por el uno fuera


de la productoria, garantiza una confiabilidad cercana al 100% al sistema
productivo, siempre y cuando la conmutacin (o el cambio al sistema en
reserva) se haga inmediatamente. Dicha ecuacin tambin nos dice que
si al menos un componente del sistema tiene confiabilidad del 100%,
todo el sistema alcanza una confiabilidad del 100%.

Con respecto a los comentarios anteriores, es importante sealar que el


sistema redundante no se menciona en la literatura tcnica, y que la
ecuacin para su clculo la toma para un sistema en paralelo.

La frmula para calcular la confiabilidad para un sistema en paralelo es


un aporte importante del Ing. Lourival Tavares, la cual verifiqu con datos
reales y la compar con la ecuacin que tradicionalmente se emplea para
el sistema en paralelo, siendo la indicada por Tavares la que arroj datos
fiables.

8. EJEMPLO DE CLCULO

Para el ejemplo que se da a continuacin, se emple el programa


OptiMax del cual soy el autor. Este es un programa escrito en VBA
(Visual Basic para Aplicaciones) y tiene como plataforma al software
Microsoft Excel.
El programa calcula la confiabilidad con base en el MTBF y el MTTR, y
para ello solicita los datos: horas de paros, horas trabajadas y nmero de
paros para el perodo considerado. Estos datos son obtenidos por el
programa a partir de los registros de paros que se llevan en el ERP de la
compaa.

Lo interesante de la interfaz de usuario de OptiMax es la representacin,


en diagramas de bloque, de los equipos y su sistema de alarma con base
en colores, el cual, dependiendo de los valores de alarma de
confiabilidad previamente definidos, stos se indicarn por medio de los
colores amarillo, verde y rojo. En la siguiente tabla se da el significado de
los colores y los respectivos valores de alarma.

El ejemplo a analizar se muestra en la figura 4.

Como se observa en la Figura 4, se tienen tres equipos automotrices


(Volquetas) los cuales forman el subsistema Transporte Materias Primas
y estn dispuestos en una serie en paralelo, pues no es redundante ya
que trabajan al mismo tiempo; tambin se observa que cada equipo est
dividido en secciones, cada una de ellas correspondiente a un sistema en
que normalmente se dividen este tipo de equipos. Esta divisin forma un
sistema en serie, es decir, cada equipo es un sistema en serie y el
funcionamiento del conjunto (equipo) depende de cada una de ellas. Si
una seccin falla, falla todo el equipo. El valor dentro de cada bloque
representa la confiabilidad de cada uno de ellos, el cual es calculado por
OptiMax con base en la ecuacin fundamental.

Continuando con el anlisis, en el bloque Conf. Equipo (Confiabilidad


Equipo) se indica el valor de la confiabilidad del equipo tomado en su
conjunto. Este valor lo calcula el programa con base en la ecuacin de un
sistema en serie y est de acuerdo con el anlisis efectuado en el
numeral 5: La confiabilidad total de un sistema en serie es menor que la
confiabilidad de cualquiera de sus componentes. Hay que tener en
cuenta que el programa redondea los valores a cero decimales.

Por ltimo, el valor de confiabilidad del subsistema en su conjunto es el


resultado de aplicar la ecuacin para un sistema en paralelo, que para el
ejemplo es del 41%.

Ahora bien, cmo interpretar estos valores? Dado que el perodo para el
cual se calcularon estas confiabilidades es de un mes, las cifras se
pueden interpretar de la siguiente manera: Si las condiciones
operaciones (Contexto operacional) no cambian para el prximo mes, la
probabilidad de que el activo llegue sin fallar al final del perodo es de
1%, 76% y 47% respectivamente. Lo anterior implica que para el
subsistema Transporte Materias Primas la probabilidad de llegar final del
perodo sin fallar es del 41%.

La grfica en s nos est diciendo: El motor en el primer equipo y el


chasis en el tercero son el problema y los que estn afectando de forma
directa la confiabilidad del subsistema en su conjunto; pero la situacin
ms grave se presenta en el motor. Estas conclusiones son inmediatas
gracias al sistema de alarma implementado en el programa OptiMax.

Segn lo anterior, los mayores esfuerzos se deben encaminar en mejorar


la confiabilidad del motor sin olvidar la situacin del chasis si se quiere
aumentar la confiabilidad de todo el subsistema.

Esta es otra de las ventajas de OptiMax: permite visualizar, de forma


inmediata, cuales son los componentes problemas para concentrarnos
en ellos y as reducir el abanico de posibilidades.

Otra posibilidad de OptiMax: permite generar grficas donde se muestra


el comportamiento, mes a mes, de los equipos, los subsistemas o
sistemas desde el punto de vista de confiabilidad. Vase la figura 5.
9. CONCLUSIONES

El mtodo que se describe, es un mtodo discreto y aproximado


comparado con el mtodo de la distribucin de Weibull, y aunque se
genera un pequeo error en los resultados, ste no impide llevar a cabo
el anlisis respectivo de la situacin.
El mtodo facilita los clculos para tener una idea del comportamiento de
los activos desde el punto de vista de la confiabilidad y tomar acciones
proactivas, preventivas y correctivas si fuere el caso.
Aunque el mtodo no permite hacer predicciones en cuanto a la
confiabilidad, si facilita la toma de decisiones a futuro con base los
resultado obtenidos.
De los tres sistemas analizados, el sistema en serie es el menos
confiable y el ms confiable es el sistema redundante; el sistema en
paralelo tiene una confiabilidad intermedia.
10. BIBLIOGRAFA

[1] Tavares, Lourival. Mantenimiento y Confiabilidad, VI Congreso


Internacional de Mantenimiento, 3 y 4 de junio de 2004, Bogot,
Colombia.

[2] Huerta, Rosendo. Proceso de Anlisis Integral de Disponibilidad y


Confiabilidad como Soporte para el Mejoramiento Continuo de las
Empresas. Reliability World 2006, junio 5 al 9 de 2006, Monterrey,
Mxico.

[3] Gmez Martnez, lvaro. Anlisis y pronstico de fallas en


mantenimiento, 4 y 5 de diciembre de 2006, Bogot, Colombia.
[1] Se refiere a su libro Manuteno Centrada no Negocio, escrito en
portugus.

[2] En comunicacin personal, va e-mail el 15 de marzo de 2008

Qu es el MTBF?
El Tiempo Medio Entre Fallas conocido como MTBF, por sus siglas en ingls
(Mean Time Between Failures), es un indicador que representa el tiempo
promedio en el que un equipo funciona sin fallas, dicho de otra forma, el tiempo
promedio que transcurre entre una falla y la siguiente.

Tiempo medio entre fallos

Qu es el MTTR?
El Tiempo Medio Entre Reparaciones conocido como MTTR, por sus siglas en
ingls (Mean Time Through Repair), es una medida que indica el tiempo estimado
que un equipo estar parado mientras es reparado, dicho de ora forma, el tiempo
promedio en que se efecta una reparacin.

Tiempo medio gracias a la reparacin