Академический Документы
Профессиональный Документы
Культура Документы
Proceso en la Ausencia de
Normalidad
Dr. Eduardo Santiago
Minitab Inc.
Objetivos
1. Repaso de supuestos del Anlisis de Capacidad para
datos normalmente distribuidos
2. Generar un Anlisis de Capacidad para datos que no
siguen una distribucin normal utilizando diferentes
tcnicas
3. Qu situacin produce datos no-normales?
4. Desventajas de las pruebas de Normalidad
5. Cmo manejar datos que provienen de un sistema de
medicin con baja discriminacin?
Resumen (Obj. 1)
El anlisis de capacidad es sensible a los siguientes
supuestos:
Supuesto de la distribucin de los datos
Estabilidad del proceso
Uso de Transformaciones
Analicemos el tiempo necesario en minutos para
completar una actividad especfica.
Uso de Transformaciones
La transformacin de Box-Cox
= where [-5, 5]
Uso de Transformaciones
La transformacin de Johnson
= + ln[ ]
Nota: Asenh(z) =
ln z + 2 + 1
Fuente:
http://es.wikipedia.org/wiki/Cirug%C
3%ADa_de_la_hernia_inguinal
Muestra
1
X
7967
N
7978
Muestra p
0.998621
Lmite
inferior
de 95%
0.997719
Resumen (Obj. 2)
Cuando los datos no son normales uno puede utilizar
distintas tcnicas:
Transformacin de Box-Cox o Johnson
Modelar los datos con una distribucin no-normal como por
ejemplo Weibull, Lognormal, o la distribucin del valor ms
extremo.
Con tamaos de muestra ms grandes usted puede utilizar un
enfoque no-paramtrico
Mtodo
Cpk
Tasa de defectos
FPY
Una proporcin
N/A
0.14%
99.86%
Mtodo no-paramtrico
(percentiles)
1.29* 0.14%
99.86%
Mtodo Normal
1.45
99.9978%
0.0022%
Resumen (Objetivos 3, 4)
La naturaleza de los datos hace inapropiado el uso de la
distribucin normal.
La falta de controles en un proceso produce muestras de
distribuciones distintas.
Tamaos de muestra grandes pueden incrementar la
sensibilidad de las pruebas de normalidad.
Conforme incrementa el nivel de redondeo, las pruebas
clsicas de normalidad se vuelven menos efectivas.
Valores Observados
5.1
5.1
5.0
5.2
5.1
5.0
Converted to
Inicio
Fin
Frecuencia
4.95
5.05
5.05
5.15
5.15
5.25
Fin: Fin
Informacin de censura
Valor censurado del intervalo
Conteo
6
Parmetro
Media
Desv.Est.
Estimacin
5.08345
0.0619204
Error
estndar
0.0278668
0.0218490
IC normal de 95.0%
Inferior Superior
5.02883
5.13807
0.0310086 0.123648
Resumen (Obj. 5)
El redondeo de datos produce una falla en las pruebas
clsicas de normalidad. [Rechazan casi con certeza sin
importar la naturaleza de los datos.]
Los datos normales medidos con un sistema de
medicin con baja discriminacin debern ser simtricos;
por lo tanto, hace sentido que las pruebas de sesgo y
mnibus sean de mayor utilidad en este caso.
Otros aspectos no-normales no sern capturados por las
dos pruebas anteriores.
Resumen (Obj. 5)
El mtodo de mxima verosimilitud (MLE) para datos
por intervalos produce mejores estimadores en general.
Los estimadores MLE son asintticamente insesgados.
[Conforme aumenta el tamao de muestra, el sesgo de
los estimadores se vuelve despreciable]
La simplicidad de la correccin de Sheppard para
estimar s hace de este mtodo uno bastante fcil de
implementar.
Conclusiones
El objetivo final de un anlisis de capacidad es la
estimacin de la tasa de defectos del proceso.
Cuando el inters de un anlisis estadstico se centre en
la estimacin de los defectos, el supuesto de distribucin
ser extremadamente importante.
Otro supuesto importante es asegurarnos de que el
proceso sea estable y est en control.
Conclusiones
De los dos supuestos, el de normalidad es el que se
viola ms frecuentemente en la prctica.
El anlisis de capacidad No-Normal (NN) requiere:
Utilizar una transformacin
Encontrar una distribucin alterna que ajuste los datos
Usar un enfoque no-paramtrico el cual requiere un tamao de
muestra grande.
Conclusiones
Las pruebas clsicas de normalidad (Anderson-Darling,
Kolmogorov-Smirnov, Shapiro-Wilk) tpicamente
rechazan la normalidad cuando los datos tienen poca
discriminacin, sin importar cul es la distribucin real de
los datos.
Cuando utilice un equipo de medicin con baja
discriminacin, utilice distintas pruebas para verificar la
normalidad, como la de Sesgo o la mnibus.
Conclusiones
Si no existe evidencia de que los datos redondeados
sean no-normales, asuma normalidad.
Utilice el mtodo de censura por intervalos (Mxima
Verosimilitud) para estimar la media y la desviacin
estndar.
Referencias Bibliogrficas
1.
2.
3.
4.
5.
6.
Juran, J.M., Godfrey, A.M. Jurans Quality Handbook. 5th edition, McGrawHill. New York, 1999.
Kane, V.E. (1986) Process Capability Indices. Journal of Quality
Technology, 18, 41-52.
McComack, D.W., Harris, I.R., Hurwitz, A.M., and Spagon, P.D. (2000)
Capability Indices for Non-normal data, Quality Engineering. 12(4), 489495.
Schneeweiss, H., Komlos, J., and Ahmad, A.S. (2006) Symmetric and
Asymmetric Rounding. Working paper.
Sheppard, W.F. (1898). On the calculation of the most probable values of
frequency constants for data arranged according to equidistant division of a
scale. Proceedings of the London Mathematical Society. 29, 231-258.
Tricker, A.R. (1984) Effects of Rounding on the Moments of a Probability
Distribution. Journal of the Royal Statistical Society. Series D (The
Statistician). 33(4), 381-390.
APNDICE
Caso de Estudio
Un fabricante de dispositivos mdicos construye un aparato
de monitoreo de niveles de glucosa en la sangre para
personas diabticas. La lectura es truncada para facilitar el
uso y entendimiento de la misma.
El fabricante mide una solucin estndar con 100 dispositivos
para establecer una base de referencia. Los lmites de
especificacin son [99, 136].
Datos
122
118
117
120
120
121
122
116
124
117
2014 Minitab, Inc.
121
120
118
117
120
118
119
122
121
118
119
118
119
119
120
117
121
120
118
122
119
120
120
121
122
118
118
117
119
121
123
117
118
120
118
122
118
124
118
121
116
116
118
121
120
119
119
117
121
121
119
120
120
118
117
120
118
120
119
121
120
118
119
117
119
120
121
121
118
119
119
121
120
119
121
120
119
120
122
118
121
120
123
118
117
118
120
115
121
119
Caso de Estudio
La prueba de Anderson-Darling rechaza la normalidad.
Caso de Estudio
Utilizar una prueba alternativa de Normalidad, como la
prueba de Sesgo.
Nmero Total de Observaciones en Glucosa = 100
Prueba de Sesgo.
Z
0.600407
P-value 0.548235
Caso de Estudio
Convertir los datos al siguiente formato.
Inicio
114.5
115.5
116.5
117.5
118.5
119.5
120.5
121.5
122.5
123.5
Fin
115.5
116.5
117.5
118.5
119.5
120.5
121.5
122.5
123.5
124.5
Frecuencia
1
3
10
20
17
21
17
7
2
2
Caso de Estudio
Tratar los datos como censurados por intervalos y
analizarlos con un Anlisis de distribucin paramtrico
para estimar y s.
Caso de Estudio
Finalmente, con los estimadores de 119.41 para la
media y 1.766 para la desviacin estndar, proceder a
estimar Ppk.
=
,
= 3.13
3
3