Вы находитесь на странице: 1из 28

Fotocopiadora confiabilidad modelado Usando algoritmos evolutivos Michael Bulmer y

John Eccleston
18.1 INTRODUCCION
Las fotocopiadoras son una de las piezas de equipo de oficina más comunes e importantes en
el lugar de trabajo moderno. El hecho de que las fotocopiadoras no funcionen correctamente
causa grandes inconvenientes a través de la producción de documentos de apariencia y
calidad deficientes, retrasos en la producción y mayores costos debido a la pérdida de tiempo
y pérdidas. Hay una gran variedad de componentes en una fotocopiadora: mecánica, eléctrica
y de computadora. Esto conduce a los numerosos modos de falla que se manifiestan de
diversas maneras, incluyendo copias sucias o manchadas, atascos de papel, papel dañado,
sobreexposición o subexposición, alimentación de papel incorrecta y alineación incorrecta.
Los costos implican no solo el tiempo de inactividad y el desperdicio de copias, sino también
los costos de servicio y reemplazo de partes (así como los costos de garantía). El usuario no
siente los efectos de la falla de una fotocopia sola, ya que la fabricación también se ve
afectada por las fallas. En el largo y mediano plazo, la confiabilidad y la insatisfacción de los
clientes pueden afectar negativamente la rentabilidad y la participación de mercado. En el
corto plazo, normalmente se espera que el fabricante cubra las piezas y el servicio en virtud
de un acuerdo de garantía. Normalmente, se ofrece un plan de servicio o una garantía externa
de contrato con la venta de una fotocopiadora. La naturaleza de tales planes se basa
necesariamente en una comprensión de la confiabilidad de la máquina y, en consecuencia, en
el análisis de los datos de fallas y el modelado de confiabilidad. En este estudio de caso
aplicamos el algoritmo evolutivo [EA; ver Michalewicz (1996)] acercamiento a los datos de
fallas de fotocopias para determinar modelos para los diferentes modos de fallas. Los
resultados deben dar una idea de la confiabilidad y la calidad de la fotocopiadora y de la
determinación de posibles planes de garantía y / o servicio. En la Sección 18.2 se proporciona
una descripción de la fotocopiadora y los datos relativos a su historial de servicio. Algunos
análisis preliminares se presentan en la Sección 18.3. Un rango de 399 400
MODELADO DE FIABILIDAD DE FOTOCOPIADORES UTILIZANDO ALGORITMOS
EVOLUTIVOS
los modelos de falla potencial se especifican en la Sección 18.4, y la metodología de EA se
desarrolla en la Sección 18.5. La Sección 18.6 da los resultados del ajuste del modelo e
introduce métodos de remuestreo para dar una medida de precisión a las estimaciones del
modelo. Los resúmenes y las recomendaciones con respecto a la fiabilidad y los requisitos
de servicio de la fotocopiadora se encuentran en la Sección 18.7. Las observaciones finales
con respecto al uso de los modelos se dan en la Sección 18.8.

18.2 CARACTERIZACIÓN DEL SISTEMA


La fotocopiadora bajo investigación utiliza dos procesos principales para producir copias;
transfiriendo la imagen al papel y luego arreglando esa imagen. En el primero de estos, un
tambor giratorio se carga eléctricamente a lo largo de una línea mediante un cable de carga.
A medida que la sección cargada gira, se expone a la imagen reflejada que se está copiando.
La luz más brillante disipa la carga, mientras que las secciones más oscuras, la imagen, no
afectan la carga. La superficie del tambor luego pasa a un revelador donde la carga restante
atrae el tóner. Finalmente, la superficie del tambor se encuentra con el papel donde se usa
una carga opuesta para tirar el tóner a la página. Las garras del tambor luego levantan el papel
del tambor, mientras que una cuchilla de limpieza elimina el tóner residual de la superficie,
dejándolo listo para que se cargue nuevamente para la próxima copia. El segundo proceso
implica que el papel pase a través de un par de rodillos (uno de los cuales se calienta) que
fusiona el tóner en la página. El rodillo superior acumula tóner de este proceso. Una lámina
de limpieza se asienta en el rodillo para eliminar esto. A medida que la propia red acumula
el tóner residual, se extiende para exponer una sección nueva de la limpieza de la tela. Una
vez que la web está completamente terminada, debe ser reemplazada. Modelaremos el
reemplazo de la web de limpieza en la Sección 18.6. Tenga en cuenta que el enfoque en este
modelado es, en gran medida, en los consumibles. Los componentes que deben considerarse
se reemplazan simplemente cuando están agotados o desgastados. Usaremos esto para
suponer que los tiempos de vida de los componentes pueden considerarse como tiempos
independientes de falla. Esperamos que estos reemplazos estén fuertemente asociados con el
uso. Sin embargo, es posible que la independencia no se mantenga estrictamente, ya que estos
componentes funcionan dentro del entorno de una máquina que también está envejeciendo.
Consideraremos las fallas del sistema y las fallas de los componentes por separado. En este
estudio de caso, proponemos modelar la confiabilidad de una fotocopiadora ampliamente
utilizada. Los tiempos de falla para varios componentes se modelarán utilizando un rango de
distribuciones de falla con un énfasis particular en la distribución de Weibull y sus
extensiones. Estos incluyen la distribución estándar, con y sin el parámetro de retardo, y
combinaciones de distribuciones de Weibull, como modelos mixtos, modelos de riesgo en
competencia, modelos multiplicativos y modelos seccionales. Estos modelos más complejos
son necesarios para estudiar la confiabilidad de un sistema complejo como una fotocopiadora,
en el cual los diferentes componentes pueden fallar de diferentes maneras y tener efectos
complicados en general. Los parámetros de los modelos se estiman a través de una
metodología basada en algoritmos evolutivos (Michalewicz, 1996). En comparación con los
métodos tradicionales, como la probabilidad máxima y la estimación bayesiana, este enfoque
es muy general y no requiere estimaciones iniciales. En lugar de iterar una única solución,
una EA trata con una población de soluciones, utilizando analogías de biodiversidad y
mutación para superar los óptimos locales. Una ventaja clave del sistema EA es la facilidad
con la que se pueden incorporar nuevos modelos. El algoritmo requiere solo una
especificación de los parámetros y una expresión para la confiabilidad. Esto permite al
usuario explorar y comparar fácilmente modelos candidatos y también variar el criterio de
optimalidad utilizado en el proceso de adaptación. Los datos analizados aquí se obtuvieron
de un agente de servicio y son para una sola máquina. La fotocopiadora en cuestión es una
máquina popular de un fabricante multinacional importante y está diseñada para un uso
medio en un entorno de oficina, aunque a partir de estos datos parece que, en ocasiones,
algunos usos tienden a ser de gran volumen. El historial de servicio de la máquina es
incompleto, ya que solo se incluyen los componentes que se reemplazaron dos veces durante
la vida útil de la máquina debido a una falla. No se incluyó el reemplazo de consumibles,
como el tóner y el revelador. El procedimiento de la oficina para la identificación y
rectificación de problemas con la fotocopiadora fue: 1. Modo de falla. Un operador notaría
el funcionamiento incorrecto de la máquina y se comunicará con el proveedor de servicio e
informará el problema. 2. Causa de falla. El proveedor del servicio determinaría la razón
(debido al diseño, la fabricación o el uso de la máquina) que dio lugar a una falla y luego
reemplazaría los componentes según se considere necesario. Los tipos de operaciones y
copias dañadas que se consideraron fallas incluyeron: copias sucias o manchadas, daños en
el papel durante la copia, sobreexposición o subexposición, alimentación de papel deficiente,
atascos de papel repetidos, desalineación del papel y marcas no deseadas en las copias . La
solución más común para estos problemas fue el reemplazo de uno o más componentes. Las
fechas en que se hicieron estos reemplazos y la lectura del contador correspondiente en el
momento del reemplazo se dan en el Apéndice. Los datos cubren fallas durante los primeros
4.5 años de la fotocopiadora.

18.3 ANALISIS PRELIMINAR

Pocos elementos fallaron con la frecuencia suficiente para permitir un análisis y modelado a
nivel de componente. La banda de limpieza falló 15 veces y los rodillos de alimentación 11
veces; Todos los demás componentes fallaron menos de 10 veces, la mayoría mucho menos.
En consecuencia, hemos analizado los datos a nivel del sistema, que es considerando una
falla del sistema como cuando la máquina no está funcionando correctamente y recibe
servicio, e ignoramos los componentes particulares que han fallado. Además, se realizó un
análisis a nivel de componente del historial de limpieza web. El modelado a nivel del sistema
es necesario para determinar las llamadas de servicio para corregir fallas, y el modelado a
nivel de componente es necesario para la planificación de piezas de repuesto.
El tiempo (en días) y el número de copias entre fallas se obtienen fácilmente a partir de los
datos de los datos del sistema (todas las fallas) y la web de limpieza. Algunas des
A continuación se muestran las estadísticas y gráficos de scripts con respecto al número de
fallas (tiempos y copias entre fallas) para el sistema y la web de limpieza. Hubo 39 fallas en
el sistema (ocasiones de servicio) que comprenden 98 fallas de componentes.

18.3.1 Fallos del sistema

Como era de esperar, la cantidad de días (tiempo) y la cantidad de copias entre fallas del
sistema, denotadas n_t y n_c, respectivamente, se correlacionaron positivamente (r = 0.753).
El promedio de días entre fallas fue de 41.56 y el promedio de días de copias entre fallos fue
de 26.647. Debido a la correlación, solo se proporciona un gráfico de tiempo para las copias.
En los histogramas y gráficos que siguen, el tiempo entre fallas y el número de copias entre
fallas (el cambio en la lectura del contador en el contador de la máquina denotada) se denota
respectivamente como día y contador.
De la gráfica de tiempo de la Figura 18.1 se desprende que el número de copias entre fallas
disminuye con el tiempo. Esto refleja el efecto del envejecimiento, por lo que se producen
fallos.
más frecuentemente a medida que el artículo envejece. El histograma del número de copias
entre fallas está muy inclinado hacia la derecha. La cola corresponde a la vida temprana de
la copiadora, sugiriendo además que un modelo de mezcla puede ser apropiado.

La figura 18.2 muestra que el histograma por día es algo diferente. Esto puede indicar que se
necesitan diferentes modelos de falla para modelar los datos de día y contador, como se
demostrará más adelante.
Otra variable que puede ser de interés es el uso, definido como la cantidad de copias entre
fallas dividida por la cantidad de días entre fallas. El uso promedio entre fallas fue de 670.2
copias por día con una desviación estándar de 409.8 copias por día. El último punto de datos
es un posible valor atípico, como se puede ver en la Figura 18.3, quizás debido a una
grabación incorrecta.
18.3.2 Limpieza de fallas web

El componente con las fallas más observadas fue la web de limpieza, por lo que se utilizará
como un ejemplo de falla de componentes de modelado. El número de días y el número de
copias entre fallas de la red de limpieza, denotadas por ntw y ncw respectivamente, se
correlacionaron fuertemente (r = 0.916). El número promedio de días entre fallas fue de
115.1, y el número promedio de copias entre fallas fue de 72,670. Estos son necesariamente
más altos que los medios del sistema porque las fallas de limpieza de la web son un
subconjunto de las fallas del sistema. La figura 18.4 muestra que los histogramas del contador
y los datos diarios de la limpieza de la web son similares a los de todos los datos. Están
inclinados hacia la derecha, y el número de copias y la cantidad de días entre fallos de la
banda de limpieza disminuye con el tiempo.
La figura 18.5 muestra un histograma del uso, en copias por día, entre fallas de la web de
limpieza. La media del uso para la limpieza de la tela fue de 598.8 copias por día entre fallas
con una desviación estándar de 235.8 copias por día.
Las estadísticas y gráficas descriptivas anteriores demuestran claramente que a medida que
la fotocopia envejece, su confiabilidad se vuelve cuestionable y, en última instancia, será
motivo de preocupación para el propietario / usuario y el proveedor de servicios. La
distribución de copias y el tiempo entre fallas implica que una familia de distribuciones
sesgadas, como las distribuciones de Weibull, son potencialmente útiles para modelar los
datos de fallas. La medida de uso, aunque de cierto uso descriptivo, se encontró que no era
valiosa en el modelado adicional y no juega ninguna parte más en este estudio. El objetivo
entonces es determinar los modelos adecuados para el fallo de la fotocopiadora que podrían
ser útiles para diseñar contratos de garantía y servicio.

18.4 MODELOS WEIBULL

La familia de modelos de Weibull es una de las distribuciones estadísticas más utilizadas


para el modelado de fallas y confiabilidad, y es un ingrediente vital de nuestro enfoque. A
continuación se describen brevemente los modelos que se han explorado en este estudio de
caso. Se puede encontrar más información sobre los modelos en Blischke y Murthy (2000).
No es difícil incluir otros modelos en el algoritmo.

Weibull de dos parámetros


Este es el modelo más simple considerado. Tiene un parámetro de forma, betha, y un
parámetro de escala, etha, con función de confiabilidad.
En este y los siguientes modelos, la función de confiabilidad dada se define para t> 0.
De manera similar, los parámetros de forma y escala se llevan a lo positivo; es decir, bheta>
0y
etha> 0.

Weibull de tres parámetros

Este modelo es el mismo que el Weibull de dos parámetros, pero incluye un retraso o un
cambio
parámetro, Ghamma, con función de fiabilidad.

Modelos de mezcla

Una mezcla aditiva de dos distribuciones de Weibull de dos parámetros da lugar a un modelo
de cinco parámetros con una mezcla, dos parámetros de forma y dos parámetros de escala
denotados como p, Bheta 1, Betha 2, etha 1 y etha 2, respectivamente, con función de
confiabilidad.

donde 0 <= p <= 1. Si los dos procesos de falla son similares en naturaleza, entonces un
método más simple el modelo se obtiene al asumir un parámetro de forma común, Betha =
Betha 1 = Betha =2, dando un Modelo de cuatro parámetros.

Multiplicativa
Un modelo multiplicativo tiene una función de falla que es el producto de las funciones de
falla de dos distribuciones de Weibull y, como resultado, un modelo de confiabilidad de
cuatro parámetros con los parámetros Betha 1, Betha 2, etha 1 y etha 2. Modela un sistema
que falla cuando fallan los dos subsistemas, dando una función de confiabilidad

Riesgo de competencia

Un modelo de riesgo competitivo tiene una función de confiabilidad que es el producto de


las funciones de confiabilidad de dos distribuciones Weibull con los parámetros Betha 1,
Betha 2, Etha 1 y Etha 2. Modela un sistema que falla cuando falla cualquiera de los dos
subsistemas, dando una función de confiabilidad.

Modelo seccional

Un modelo seccional se compone de diferentes distribuciones de Weibull para diferentes


períodos de tiempo. El modelo seccional más simple es uno con dos distribuciones de
Weibull. Este modelo incluye seis parámetros, cuatro de los cuales son independientes
después de considerar las condiciones de continuidad. La función de confiabilidad con los
parámetros Betha 1, Betha 2, Etha 1 y Etha 2 es

18.5 ALGORITMO EVOLUTIVO (GENETICO)

La aplicación de estos modelos a una serie de conjuntos de datos, equipados con el EA


descrito en la siguiente sección, se da en Bulmer y Eccleston (1998b).

El objetivo principal del estudio es estimar la fiabilidad y las demandas de servicio de una
fotocopiadora en particular. Esto requiere la estimación precisa de las distribuciones de fallas
del sistema y componentes específicos. Los métodos más utilizados para esta tarea incluyen
métodos gráficos [por ejemplo, consulte Jiang y Murthy (1995)], y métodos de estimación
estadística como Máxima probabilidad, Bayesiano y Mínimos cuadrados. Las técnicas
numéricas requeridas para estos métodos estadísticos generalmente se basan en valores
iniciales razonables y, por consiguiente, la automatización de estos métodos es problemática.
En consecuencia, es atractivo un método de estimación y modelado que pueda automatizarse
y que no sea altamente dependiente o dependiente de la elección de los valores de los
parámetros iniciales. Esto es particularmente importante para los métodos que
consideraremos, que se basan en el remuestreo.
Deseamos modelar los datos y estimar los parámetros relevantes de una manera óptima con
respecto a un criterio apropiado. Algoritmos evolutivos (Michalewicz,1996) tienen las
propiedades de (a) facilidad de automatización e independencia de los valores iniciales y (b)
flexibilidad que permite una amplia clase de posibles funciones objetivas. Estos conceptos e
ideas se describen y explican más detalladamente a continuación.
El algoritmo evolutivo descrito aquí a menudo se conoce como un algoritmo genético por
razones que se harán evidentes a continuación. La idea básica de un algoritmo genético
(Holland, 1975) es iterar una población de estimaciones de parámetros, en lugar de trabajar
con un solo punto, como se hace usando métodos clásicos. Estas soluciones se "evolucionan"
utilizando la selección natural, donde la aptitud física se mide según la proximidad del
modelo resultante a los datos. La idea de biodiversidad ayuda al algoritmo a evitar los
óptimos locales, que pueden surgir en los modelos complejos considerados aquí.

A continuación se presenta un resumen del método y la descripción de los términos que


utilizamos.

Los genes de cada individuo en la población son simplemente sus estimaciones en valores
reales para cada parámetro en el modelo. La población inicial tiene genes que se generan
aleatoriamente desde un espacio de parámetros, con la aptitud de cada individuo calculada a
partir del valor objetivo del modelo correspondiente. Una función objetiva es típicamente
una medida de la bondad del ajuste de una solución a los datos. Se crea una nueva población
eligiendo primero a los padres de la población actual al azar, con probabilidad proporcional
a su condición física, y luego apareando para producir descendencia. La solución capturada
por cada descendiente es una combinación afín aleatoria de las soluciones de sus padres. Es
decir, los hijos de dos padres (x1, x2, ..., x n) y (y1, y2, ..., y n) son

donde c es un número aleatorio uniforme de [0,1].

Este proceso de cruce genético es el principal agente evolutivo. Sin embargo, la mutación
también juega un papel importante al permitir la reintroducción de la información genética
perdida. Este trabajo ha utilizado la "mutación dinámica" de Michalewicz y Janikow (1996),
según la cual cada gen tiene una probabilidad constante de mutación, pero la escala de la
mutación se reduce a medida que avanza la evolución. Dado un rango de valores para el
parámetro que se está mutando, una desviación se elige uniformemente por encima o por
debajo del valor actual. Esta desviación es entonces escalada por el factor

donde es uniforme sobre [0,1], t es el número de generación actual de T generations, y es un


parámetro del sistema que rige la rapidez con la que se reduce la escala de mutación. Este
operador recuerda la función de Boltzmann en el corazón del recocido simulado (Van
Laarhoven y Aarts, 1987), inicialmente permitiendo el acceso al espacio de búsqueda
completo y luego restringiendo el sistema a movimientos locales a medida que la población
se "enfría".

Los métodos de punto flotante no son de ninguna manera el único enfoque para la
optimización genética de valor real. Los primeros experimentos de De Jong (De Jong, 1975)
utilizaron la optimización de funciones y la codificación binaria para explorar el
comportamiento de los sistemas adaptativos. También se ha utilizado una codificación
binaria en el modelado de confiabilidad (Bulmer y Eccleston, 1998a).
Una ventaja del enfoque del algoritmo genético es que la selección natural no hace
suposiciones sobre la función objetivo, como la diferenciabilidad o incluso la continuidad.
Esto significa que se pueden incorporar fácilmente nuevos modelos y funciones objetivas. El
motor del algoritmo genético requiere solo una especificación de los parámetros y una
expresión para la función de confiabilidad (y la probabilidad correspondiente, si es
necesario).

Criterios de ajuste

Además de seleccionar un modelo para ajustarse a los datos, junto con un método de "ajuste",
se requiere un criterio de optimalidad para medir el ajuste de un modelo y luego determinar
cuál es el de "mejor ajuste". Esta función objetivo debe ser una medida que se pueda utilizar
para discriminar entre modelos y valores de parámetros. En este enfoque, la función objetivo
se puede modificar fácilmente como se describe a continuación.

Esta discusión se centrará en minimizar una suma de desviaciones cuadradas y maximizar la


probabilidad. El método anterior, “mínimos cuadrados”, compara las estimaciones y los
valores de confiabilidad de la función de confiabilidad en el papel de trazado Weibull. El
algoritmo también puede usar la suma mínima de desviaciones absolutas o el mínimo de la
desviación máxima como una función objetivo. Los resultados son similares para todas las
funciones objetivas y, en consecuencia, los resultados para las dos últimas no se incluyen
aquí.
El algoritmo se aplicó utilizando una población de tamaño 20, evolucionó en 1000
generaciones. Este proceso tomó poco menos de 3 segundos en una computadora portátil
PowerBook de 400 MHz.

18.6 AJUSTE Y ANALISIS DE MODELOS

El algoritmo genético descrito anteriormente se utilizó para ajustar los datos a los modelos
descritos en la sección anterior. Weibull (2) denota los dos parámetros de Weibull
distribución, y las otras distribuciones se denotan de una manera clara y obvia. El valor de la
función objetivo, la suma de las desviaciones cuadradas definidas en la Sección 18.2, es la
falta de ajuste entre los datos y el modelo ajustado y se denota como lo fin Tablas 18.1 a 18.4.
Los resultados se presentan a continuación en tablas junto con los gráficos adjuntos. En cada
caso, estos incluyen los gráficos para el modelo de mejor ajuste y, para comparación, el del
modelo estándar de Weibull (sin parámetro de retardo). Las estimaciones de los parámetros
de cada modelo para el contador y el tiempo (días) en caso de fallo de todos los datos (fallo
del sistema) y para la red de limpieza (fallo del componente) acompañados por el respectivo
lofare dado. El modelo de mejor ajuste se resalta en letra cursiva en cada tabla.

18.6.1 Copias entre fallos del sistema

La Tabla 18.1 muestra las estimaciones de parámetros obtenidas al encontrar ajustes de


mínimos cuadrados de los modelos enumerados en la Sección 18.3. Se encontró una mezcla
de dos distribuciones de Weibull para dar el lof más pequeño, indicado con cursiva. La
mezcla indica que hay dos mecanismos de falla en juego o que hay uno que sufre un cambio
brusco en algún momento. La última es la explicación probable porque más componentes se
desgastan y fallan a medida que la máquina envejece. Esto fue visto anteriormente en la
Figura 18.1.
La figura 18.6 compara el modelo simple de Weibull (sin demora) con la mezcla obtenida.
Como lo sugiere la Figura 18.1, la función principal de la mezcla ha sido adaptarse mejor a
las fallas que fueron separadas por un gran número de copias.
18.6.2 Días entre fallos del sistema

El modelo multiplicativo demostró ser el mejor para los datos de tiempo (días hasta fallas)
para todos los datos; ver tabla 18.2. Este modelo se compara con un solo Weibull en las
Figuras 18.7 y 18.9. Sin embargo, es interesante observar que el modelo de Weibull de tres
parámetros no se ajusta a los datos y es un modelo más simple que el multiplicativo, como
se muestra en la Figura 18.8. Un ajuste de modelo seccional, también se muestra en la Figura
18.8, es muy similar al modelo de tres parámetros.

18.6.3 Copias entre fallas en la limpieza de la web.

Los datos del contador para la banda de limpieza se ajustaron bien mediante un modelo de
mezcla (Tabla 18.3). Tenga en cuenta que la estimación de uno de los parámetros de forma
(␤1) está cerca de 1 (0.851). Por lo tanto, un modelo exponencial simple podría ser un
modelo de falla más apropiado en la vida temprana de la fotocopiadora, mientras que un
modelo Weibull de dos parámetros podría ser más adecuado más adelante. El histograma
para los datos confirma esto (ver Sección 18.3).

18.6.4 Días Entre Limpieza de Fallas Web

Al igual que con los días entre fallas del sistema, la Tabla 18.4 muestra que la falla de la red
de limpieza en términos de días parece ser mejor ajustada por un modelo multiplicativo, y
en la Figura 18.10 se muestra una comparación con un solo Weibull. Dado que el componente
de limpieza es el componente que falla con más frecuencia, el acuerdo con el modelo por
días hasta el fallo de todos los datos es tranquilizador. Nuevamente, los modelos de tres
parámetros y seccionales proporcionan ajustes comparablemente buenos, como se muestra
en la Figura 18.11.

18.6.5 Métodos de remuestreo

Los resultados anteriores proporcionan estimaciones de parámetros que se utilizan para


resumir las observaciones con un modelo dado. La elección del modelo se puede hacer
seleccionando y aplicando algún criterio, como minimizar las desviaciones al cuadrado en el
papel de trazado de Weibull. Hay cuestiones importantes aquí, en particular la posibilidad de
adaptar excesivamente los datos mediante la adición de modelos que son innecesariamente
complicados. Sin embargo, incluso si la elección del modelo es clara, sigue existiendo la
pregunta estadística fundamental sobre la precisión con que las estimaciones de los
parámetros reflejan los valores reales del proceso de falla bajo investigación. El enfoque
estándar para abordar esta pregunta es cuantificar la variabilidad del muestreo con un error
estándar. Los errores estándar se pueden calcular analíticamente para modelos simples, pero
esto no es práctico para muchos de los Weibull más complicados.
Modelos considerados aquí. En cambio, las estimaciones del error estándar se pueden obtener
a través de técnicas de remuestreo como bootstrap y jackknife (Efron, 2000). La motivación
inicial para el enfoque de EA fue automatizar el enfoque gráfico para el modelado de
confiabilidad, mediante el cual los profesionales ajustarían las asíntotas a los gráficos de
Weibull para estimar los parámetros del modelo. Esto requeriría mucho tiempo para aplicar
con métodos de remuestreo, por lo que ajustamos los modelos de mínimos cuadrados en los
diagramas de Weibull usando el EA en su lugar.
El método bootstrap funciona tratando a la muestra como una población y tomando nuevas
muestras, con reemplazo, de esta población. Los parámetros del modelo se estiman para cada
nueva muestra, y la variabilidad observada en sus valores de muestra a muestra se puede usar
para estimar el error estándar.
Desafortunadamente, para muestras pequeñas, particularmente aquellas tan pequeñas como
la muestra de observaciones de limpieza de la web, las muestras bootstrap pueden no ser
representativas de los datos originales. En particular, si hay dos modos de falla, entonces una
nueva muestra puede, por casualidad, solo incluir observaciones de un tipo de falla. Los
resultados pueden ser muy variables y difíciles de usar.

Un problema adicional con las mezclas es que si la muestra se aleja demasiado del original,
puede ser difícil determinar qué componente es cuál de los estimados de los parámetros. Por
ejemplo, los datos del contador para la web de limpieza se modelaron mejor con una mezcla
de Weibull donde p = 0.674. La aplicación de la EA a un conjunto resamplificado puede
producir un valor de p = 0,45. No está claro si esto realmente es 0.45 o si debe ser 1 - 0.45 =
0.55, y las estimaciones de los dos componentes deben intercambiarse. Esto es
particularmente difícil aquí ya que los parámetros de escala de los dos componentes también
son similares. Se puede obtener cierta evidencia a partir de los parámetros de forma, pero
también se ha encontrado que son similares en muchas de las muestras, lo que hace que el
proceso de arranque no sea confiable.
Una alternativa es utilizar la técnica de navaja en su lugar. En lugar de generar una muestra
completamente nueva cada vez, el jackknife genera nuevas muestras de tamaño n–
1 al omitir una observación a la vez de la muestra original de tamaño n. El proceso de
estimación de parámetros se aplica a cada una de las nuevas muestras, y la variabilidad en
los resultados se utiliza para estimar el error estándar. Este es un enfoque inherentemente
más estable cuando se aplica a muestras pequeñas.
La tabla 18.5 muestra los resultados del jackknife para el ajuste multiplicativo de los días
entre fallas del sistema. Se puede ver, por ejemplo, que la estimación para ␤2 parece ser más
precisa que la estimación para ␤1. Esto no es sorprendente cuando se compara con el gráfico
de Weibull en la Figura 18.8. El primer componente (con ␤1 = 115) captura el pequeño
número de observaciones con un número bajo de días entre fallas. Como solo hay unas pocas
observaciones de este tipo, las estimaciones para este componente son naturalmente menos
certeras que para el modo de falla mayor. El jackknife puede usarse para identificar este tipo
de situación, si se pasa por alto.

18.7 FALLAS EN EL MODELADO A LO LARGO DEL TIEMPO

El supuesto subyacente en todos los modelos hasta ahora es que los tiempos entre las
llamadas de servicio para la fotocopiadora son independientes. Este es el supuesto de un
proceso de renovación, en el que el sistema es como nuevo después de una falla. Esto es
plausible para los componentes individuales, como la banda de limpieza, que se reemplazan
en lugar de reparar. Sin embargo, a nivel del sistema es probable que las fallas se vuelvan
más frecuentes a medida que la fotocopiadora envejece, como lo sugiere la gráfica de tiempo
en la Figura 18.1. El seguimiento

las secciones muestran cómo se puede estimar el número esperado de fallas en estas dos
configuraciones.

18.7.1 Funciones de renovación de la web de limpieza

Dado que es razonable modelar los reemplazos de limpieza de la web como un proceso de
renovación, una caracterización útil del proceso es la función de renovación, M (t). La
función proporciona el número esperado de fallas en [0, t) y se describe mediante una
ecuación integral que involucra la función de falla [consulte Blischke y Murthy (1994)].

Desafortunadamente, para todas las funciones de falla menos las más simples, como la
exponencial, esta ecuación integral no tiene solución de forma cerrada. La Figura 18.12
muestra los resultados de la resolución numérica de esta ecuación, primero para el modelo
de mezcla de Weibull utilizado con las copias entre los datos de reemplazo (ver Sección
18.6.3) y luego para el modelo de Weibull multiplicativo usado con los días entre los datos
de reemplazo (Sección 18.6). .4).

Al principio de la vida de la copiadora, el componente de la mezcla con ␤ pequeño domina.


Esto resulta en una caída en la función de renovación ya que este componente tenía ␤ = 5.23.
Además, ambos componentes tienden a una función de renovación lineal. El mismo patrón
se mantiene para el modelo basado en días entre fallas.
La función de renovación se puede utilizar para estimar la cantidad de componentes
necesarios durante ciertos períodos de tiempo. Por ejemplo, usando el modelo basado en días,
en el primer año se estima que M (365) - M (0) = 2.83 telas de limpieza serán necesarias para
esta copiadora, mientras que en el segundo año M (2 · 365) - M (365) = 5.87 - 2.83 = 3.04 se
requerirán redes de limpieza. Del mismo modo, la función de renovación estima que en la
primera se reemplazarán 100,000 copias de 1.29 redes de limpieza, mientras que en las
segundas 100,000 copias se necesitarán 1.32 redes de limpieza. La tabla 18.6 muestra otros
valores derivados de la función de renovación.
18.7.2 Fallo del sistema como un proceso de punto no estacionario

La figura 18.13 resume las fallas del sistema al trazar la cantidad de fallas en función del
tiempo. La trama será una función escalonada, que se incrementará en uno en cada momento
de falla.

Si los tiempos entre fallas vinieron independientemente de una distribución exponencial,


entonces esta gráfica debería seguir aproximadamente una línea recta. En cambio, parece
curvado, con la sección más empinada correspondiente a tiempos más cortos entre fallas, lo
que sugiere en general que las fallas son cada vez más frecuentes con la edad.
La curva de esta función de paso se puede modelar usando una función de potencia de la
forma

Los dos parámetros se pueden determinar utilizando el ajuste de mínimos cuadrados o


mediante la estimación de máxima verosimilitud. La figura 18.13 muestra las funciones de
potencia ajustadas obtenidas por mínimos cuadrados. Para el tiempo en el número de copias,
los valores de los parámetros son alfa = 1.64 y Betha = 118.400. Por el tiempo en días, Alpha
= 1.55 y Betha = 157.5. Las funciones ajustadas se pueden usar directamente para estimar el
número esperado de fallas en intervalos de tiempo especificados. Por ejemplo, en el próximo
año esperaríamos A (365) - A (0) = 3.7 fallas, mientras que en el año siguiente esperaríamos
A (2 · 365) - A (365) = 10.8 - 3.7 = 7.1 fallas. La tabla 18.7 da un rango de predicciones
similares. Dado que la cantidad estimada de llamadas de servicio aumenta cada año, llegará
un momento en el que será más barato reemplazar la copiadora en lugar de pagar los costos
de servicio. En consecuencia, la edad de la máquina será un factor importante al momento de
celebrar un contrato de servicio. Los detalles precisos dependerán de los costos particulares
del servicio.
La derivada de la función de potencia es la función de intensidad estimada. Lamda (t) = A`
(t). Esta función proporciona el número esperado de fallas por unidad de tiempo. Figura
18.14 muestra las funciones de intensidad frente al tiempo en número de copias y en días.

Ambos sugieren un aumento constante en la tasa de fallas del sistema durante la vida útil de
la fotocopiadora, aunque con un aumento relativamente lento.

18.7.3 Predicciones de Weibull Fits.

Además de las predicciones dadas en las Tablas 18.6 y 18.7, los modelos de Weibull para el
tiempo entre fallas se pueden usar para describir el proceso de falla en una variedad de
formas. Por ejemplo, considere el modelo multiplicativo para los días entre la falla de la
limpieza de la web. Este modelo predice un tiempo medio entre fallas de 120.1 días con una
desviación estándar de 90.2 días. La función de falla también se puede usar para hacer
predicciones adicionales relevantes para los inventarios. Por ejemplo, supongamos que un
proveedor de servicios está buscando una sola copiadora y desea mantener el inventario al
mínimo sin dejar que los tiempos de servicio sufran. Un criterio que podría usarse es
especificar que una red de limpieza de reemplazo debe estar disponible el 95% del tiempo.
La función de falla para el modelo ajustado muestra que la probabilidad de un tiempo de falla
de menos de 26 días es alrededor
5%. Por lo tanto, si un proveedor de mantenimiento que presta servicio a esta copiadora única
puede reabastecer las redes de limpieza dentro de los 26 días posteriores a la sustitución de
una, el cliente solo tendrá que esperar una parte del 5% del tiempo. Este tipo de análisis es
uno de los principales objetivos de modelar los datos de tiempo de falla; El modelo ajustado
puede utilizarse para responder a una amplia gama de preguntas sobre los posibles resultados
futuros.

18.8 CONCLUSIONES

El enfoque de EA ha demostrado ser un método útil para ajustar un rango de posibles


distribuciones a fallas observadas.

Esto se puede utilizar, en combinación con dominio específico

juicio, para decidir sobre un "mejor" modelo para usar. Naturalmente, es más lento que los
métodos de optimización tradicionales, como los que se basan en la búsqueda de gradientes,
pero su solidez es deseable para un sistema general de ajuste de modelos.
El enfoque de remuestreo descrito es un medio simple de aumentar las estimaciones de
parámetros con medidas de confianza. Tal remuestreo puede ser problemático para muestras
pequeñas o para mezclas en las que un componente es muy raro, como lo discuten Bulmer y
Eccleston (1998a). Sin embargo, tales problemas son fácilmente visibles y, en general, la
capacidad de dar estimaciones de confianza enriquece enormemente el proceso de modelado.

REFERENCES

Blischke, W. R., and Murthy, D. N. P. (1994). Warranty Cost Analysis, Marcel Dekker, New
York.
Blischke, W. R., and Murthy, D. N. P. (2000). Reliability: Modeling, Prediction and Opti-
mization, Wiley, New York.
Bulmer, M., and Eccleston, J. A. (1998a). Reliability, Genetic Algorithms, and Resampling,
Centre for Statistics Research Report #88, The University of Queensland, Brisbane.
Bulmer, M. and Eccleston, J. A. (1998b). Automated reliability modelling with a genetic al-
gorithm, Proceedings, 6th International Applied Statistics in Industry Conference, Mel-
bourne, pp. 1–8.
De Jong, K. A. (1975). An Analysis of the Behavior of a Class of Genetic Adaptive Systems,
Ph.D. thesis, University of Michigan, Ann Arbor.
Efron, B. (2000). The bootstrap and modern statistics, Journal of the American Statistical As-
sociation 95:1293–1296.
Holland, J. H. (1975). Adaptation in Natural and Artificial Systems, University of Michigan
Press, Ann Arbor.
Jiang, R., and Murthy, D. N. P. (1995), Modeling failure data by mixture of two Weibull dis-
tributions: A graphical approach, IEEE Transactions on Reliability 44:477–488.
Michalewicz, Z. (1996). Genetic Algorithms + Data Structures = Evolution Programs, 3rd
edition, Springer-Verlag, New York.
Michalewicz, Z., and Janikow, C. Z. (1996). GENECOP: A genetic algorithm for numerical
optimisation problems with linear constraints, Communications of the ACM 39(electron- ic
supplement).
Van Laarhoven, P. J. M., and Aarts, E. H. L. (1987). Simulated Annealing: Theory and Ap-
plications, Reidel, Holland.

CEREMONIAS

18.1.Weibull Plotting Paper.Weibull plotting paper (WPP) traza ln (–ln (Ri)) contra ln (ti),
donde Ri es la confiabilidad estimada de cada vez que falla. Muestre que los datos que siguen
un modelo de Weibull de dos parámetros aparecerán como una línea recta en WPP. ¿Cómo
se relacionan la intersección y la pendiente de esta línea con los parámetros de Weibull?

Los siguientes ejercicios usan Excel para el ajuste de modelo y bootstrapping. También puede
utilizar su paquete estadístico favorito para estos ejercicios.

18.2. Regression.Based on Ejercicio 18.1, ajustando un modelo de Weibull de dos parámetros


Los datos de tiempo de falla se pueden lograr con la mayoría de los paquetes estadísticos, así
como con Microsoft Excel, usando regresión lineal. La siguiente tabla muestra los resultados
de Excel para ajustar los días al fallo de la cuchilla de limpieza.

Reproduzca estos resultados en Excel ingresando los números de observación y los tiempos
entre fallas (ordenados) (en días). Suponiendo que "Observación" se encuentra en la celda
A1, la columna "log (t)" se ingresa rellenando = LN (B2), mientras que la columna "Mediana
Rango" usa = 1- (A2-0.3) / (7 + 0.4), con "log (–log (R))" dado por = LN (-LN (D2)). Use el
asistente de gráficos para hacer un diagrama x-yscatter de "log (–log (R))" contra "log (t)".
Hay una opción para agregar una línea de regresión lineal a la gráfica. Alternativamente, use
las funciones INTERCEPT y PENDIENTE para obtener las estimaciones de los parámetros
en la hoja de trabajo.

18.3. Bootstrap. El procedimiento en el Ejercicio 18.2 puede extenderse para dar


estimaciones de bootstrap del error estándar de las estimaciones de parámetros. Siguiendo
las celdas anteriores, haga una columna "Muestra" (G) con celdas dadas por = CEIL-ING (7
* RAND (), 1). Es decir, la columna proporciona una muestra de rutina de carga que indica
cuáles de los tiempos de fallas originales deben incluirse. La siguiente columna (H) muestra
los tiempos reales de falla usando = VLOOKUP (G2, A $ 2: B $ 8,2)
+ RAND () / 1000. Se agrega la pequeña cantidad de aleatoriedad para que podamos
clasificarlos en orden usando la función RANK de Excel. Columna I, "Ordenado", utiliza
= RANGO (H2, H $ 2: H $ 8,1). Las columnas restantes son como en el Ejercicio 18.2, con
el rango mediano calculado usando los rangos en la columna I. La intersección y la pendiente
se calculan usando INTERCEPT y PENDIENTE.

Cada vez que Excel recalcula la hoja de trabajo, obtiene una muestra aleatoria (correa de
arranque) diferente y los valores correspondientes de intercepción y pendiente, pero estos
desaparecen cada vez. Para hacer un registro de las estimaciones de arranque, podemos usar
una tabla de datos en Excel. Por ejemplo, llene una serie de 1, 2,. . . , 30 en celdas G11 a G40.
En la celda H10, coloque una referencia a la estimación de pendiente (= M5 en el ejemplo
anterior). Seleccione las celdas G10 a H40 y elija Tabla del Datamenú. Ingrese la dirección
de cualquier celda en blanco para la entrada de la columna (ya que en realidad no estamos
cambiando un parámetro). Al hacer clic en Aceptar se producirá una tabla de 30 estimaciones
de bootstrap para la pendiente. Calcule la media y la desviación estándar de estos. Repita la
configuración con un número mayor de muestras (al menos 200). Interpreta los resultados.

18.4. Copias entre fallas. Repita el análisis en los Ejercicios 18.2 y 18.3 utilizando las copias
entre fallas para la cuchilla de limpieza, en lugar de los días entre fallas.

18.5.Modelos. ¿El modelo de dos parámetros parece apropiado para los datos de la lámina
de limpieza, con fallos medidos en copias o en días? Discuta cualquier característica
importante no capturada por la línea recta en WPP.
18.6.Otros componentes. El apéndice proporciona los tiempos de falla para un rango de otros
componentes reemplazados durante el mantenimiento de la fotocopiadora. Repita el estudio
en los Ejercicios 18.2 a 18.5 para otros componentes.

18.7. Suposición de renovación. El análisis que aquí se presenta hace una serie de
suposiciones sobre los tiempos de falla. Por ejemplo, se supone que un componente se
reemplaza porque ha fallado y que un nuevo componente tendrá la misma distribución de
fallas que un componente antes en la vida de la copiadora. Discuta la validez de estos y
cualquier suposición relacionada en términos de la diferencia entre la falla del sistema y la
falla de los componentes para una fotocopiadora.

APÉNDICE

Los datos registrados del historial de servicio de la fotocopiadora se indican a continuación.


Cada fila describe una parte que se reemplazó, con el número de copias realizadas en el
momento del reemplazo, la antigüedad de la máquina en días y el componente reemplazado.
La mayoría de los servicios implicaban el reemplazo de múltiples componentes.

Вам также может понравиться