Вы находитесь на странице: 1из 20

Cuadernos de Estadı́stica Aplicada

Enero - Junio de 2014, Vol. I, No. 1

Eficiencia de los gráficos de control bajo supuestos


de no normalidad
Efficiency of control charts under non-normality assumptions
Carlos M. Camelo1 , Héctor F. López2 , Alex J. Zambrano3
Recibido: noviembre 2 de 2013. Revisado: noviembre 8 de 2013. Aprobado: diciembre 09 de 2013.

Resumen
Las gráficas de control son herramientas que se utilizan para monitorear variables en
procesos de calidad, donde se tienen distintas metodologı́as basadas en el supuesto de
normalidad en los datos, pero que pueden presentar problemas cuando los supuestos
no se cumplen. En este trabajo se estudian dos metodologı́as: dos gráficas de control
bootstrap, propuestas por Liu, Tang y por Bajgier; la segunda, es la gráfica de control
propuesta por Choobineh y Ballard basada en un método heurı́stico para distribu-
ciones sesgadas. Se pretende medir la eficiencia de las gráficas de control y decidir
cuál de las dos alternativas es la más conveniente y aplicarlo a un caso real.

Palabras clave: gráficos de control, no normalidad, bootstrap.

Abstract
Control charts are tools used to monitor process quality variables, which have diffe-
rent methodologies based on the assumption of normality in the data, but they can
present problems when the assumptions are not met. This paper studies two methodo-
logies: two bootstrap control charts proposed by Liu, Tang and by Bajgier; the second
methodology presented is the control chart, proposed Ballard Choobineh based on a
heuristic method for skewed distributions. The aim is to measure the efficiency of
control charts and decide which of the two alternatives is the most convenient and
apply it to a real case.

Keywords: Control charts, non-normality, bootstrap.


1 Especialistaen estadı́stica aplicada. Consultor estadı́stico de Cala Analytics. Bogotá,
Colombia. E-mail: mauro8824@gmail.com
2 Especialista en estadı́stica aplicada. E-mail: hectorfl186@hotmail.com
3 Docente de tiempo completo, Facultad de Estadı́stica, Universidad Santo Tomás. Bogotá,

Colombia. E-mail: alexzambrano@usantotomas.edu.co

39
40 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

1. Introducción

Las gráficas de control son herramientas estadı́sticas que se utilizan para moni-
torear y detectar cambios que afectan procesos de calidad. Identificar las causas
de estos cambios es el principal objetivo en los sectores de industria y comercio
ya que buscan ser competitivos en la satisfacción de los consumidores. Existen
diferentes gráficas de control como son: los gráficos de tipo Shewhart, los de
sumas acumuladas (CUSUM), el de promedio móvil ponderado exponencial-
mente (EWMA), todos ellos bajo el supuesto de normalidad e independencia
en las observaciones. Estos gráficos de control permiten monitorear procesos
donde la eficiencia de los mismos frente a la detección de cambios en un pro-
ceso o la interpretación de las causas que generan una señal fuera de control
permiten mejorar la calidad en procesos.

En la práctica no siempre se cumplen los supuestos de normalidad e indepen-


dencia, por lo cual se proponen en este trabajo dos alternativas; la primera
consiste en implementar gráficas de control basadas en métodos bootstrap, la
cual fue propuesta por Liu y Tang (1996) y Bajgier (1992) que gozan de mayor
aplicación en la práctica; método que resulta ser más efectivo para el cálculo
de los lı́mites de control, además se ajusta de mejor manera que la carta tradi-
cional Shewhart. La segunda alternativa es la gráfica de control propuesta por
Choobineh y Ballard (1987) basado en un método heurı́stico para distribu-
ciones sesgadas. Ambas metodologı́cas serán comparadas. Dichos gráficos de
control son diseñados para el estudio del proceso de monitoreo en media, se
implementa una rutina de programación en R Core Team (2013). Para ob-
servar cómo difieren estas tres gráficas de control, se realizará una prueba de
ARL y se decidirá cuál de las tres alternativas es la más conveniente en este
caso.

Este artı́culo pretende abordar los conceptos básicos (sección 2), consecuente-
mente, se describe la metodologı́a propuesta (sección 3). Se presentan los re-
sultados obtenidos (sección 4), se implementa un ejemplo con datos reales
(sección 5), se dan a conocer las conclusiones (sección 6) ası́ como recomenda-
ciones para trabajos futuros (sección 7).

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas


Eficiencia de los gráficos de control bajo supuestos de no normalidad 41

2. Conceptos básicos

2.1. El control del proceso estadı́stico

El control de proceso estadı́stico (CPE) es el compendio de técnicas y herra-


mientas para el monitoreo y mejoramiento continuo de la calidad en un pro-
ceso industrial o de servicios. Dentro de las herramientas, más usadas están
las gráficas de control inicialmente desarrolladas por Shewhart en los años 20
del siglo anterior. Dichas gráficas de control poseen un buen funcionamiento si
se cumplen los supuestos de independencia y normalidad en las observaciones.
Cuando falla uno o los dos supuestos, la carta presenta una gran cantidad de
falsas alarmas. Debido a esto, en la literatura estadı́stica se encuentra una gran
variedad de cartas alternativas, que tienen en cuenta el no cumplimiento de
dichos supuestos. En el caso particular de que las observaciones no provengan
de una distribución normal se cuenta con gráficas de control no paramétricas,
gráficas de control bootstrap Stoumbos, Reynolds Jr., Ryan & Woodall (2000).

2.2. El problema del proceso de monitoreo

El problema del proceso de monitoreo se puede describir, en términos generales,


de la siguiente manera: sea X una variable de calidad de interés, y fθ (X) la
función de distribución de X, siendo θ un vector de uno o más parámetros.
Un proceso estable que está operando con θ = θ0 es considerado en control
estadı́stico. El valor de θ0 puede o no corresponder a un valor ideal. Cualquier
circunstancia que afecte el proceso de calidad se asume que será reflejado por
un cambio en θ del valor θ0 , ası́ el objetivo básico del proceso de monitoreo
es detectar el cambio en θ que puede ocurrir en un tiempo desconocido.

Las gráficas de control para el monitoreo de θ se basan en sobre la toma de


muestras del proceso y al observar los valores de X. Un estadı́stico de control,
digamos Y , es calculado después de cada muestra y graficando en el tiempo so-
bre una gráfica de control. Los lı́mites de control son construidos de tal manera
que el valor de Y es muy poco probable que este fuera de estos cuando θ = θ0 .
Un valor de Y que se encuentre fuera de los lı́mites de control es tomado como
señal de que un cambio en θ ha ocurrido, y que alguna acción apropiada es
requerida.

Al comienzo del proceso, los valores de algun o de todos los componentes de


θ0 pueden ser desconocidos, por lo cual se requiere de una fase preliminar de
recolección de datos, estimación de parámetros y pruebas de estabilidad del
proceso Stoumbos et al. (2000).

Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1


42 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

2.3. Función de densidad de probabilidad

Para una variable aleatoria continua X, una función de densidad de probabi-


lidad es una función f (·) tal que Montgomery & Runger (2002):

Propiedad 1: f (x) ≥ 0
∫∞
Propiedad 2: −∞ f (x) dx = 1
∫b
Propiedad 3: P(a ≤ x ≤ b) = a f (x) dx

2.4. Funciones de distribución

2.4.1. Función de distribución Beta


Según Walck (1996) la función de distribución Beta está dada por

x(p−1) (1 − x)q−1
f (x; p, q) = ,
B (p, q)

donde los parámetros p y q son números reales positivos y la variable x satisface


0 ≤ x ≤ 1. B (p, q) es la función Beta definida en términos de la función Gamma
como
Γ(p)Γ(q)
B (p, q) = .
Γ(p + q)
Según Walck (1996), la media y la varianza están dadas por:
p pq
E (x) = , V (x) = .
p+q (p + q)2 (p + q + 1)

2.4.2. Función de distribución Log-Normal


La función de distribución Log-Normal está dada por:
( )
1 log(x−µ ) 2
−1
f (x; µ , σ ) = √ e 2 σ
,
xσ 2π
donde la variable x > 0 y los parámetros µ y σ > 0 son números reales, denotado
algunas veces como Λ(µ , σ 2 ) Walck (1996).
El valor esperado y su varianza son

σ2 ( 2 )
V (x) = e2µ +σ eσ − 1 .
2
E (x) = µ + ,
2

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas


Eficiencia de los gráficos de control bajo supuestos de no normalidad 43

2.4.3. Función de distribución Normal


La función de distribución Normal está dada por Walck (1996):
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) .
σ 2π
El valor esperado y su varianza son

E (x) = µ , V (x) = σ 2 .

2.5. Gráficas de control

2.5.1. Gráficos bootstrap


Según Vargas (2006), el método propuesto por Efron (1979), es una herra-
mienta computacional que ha demostrado ser muy efectiva para estimar la
distribución muestral de una estadı́stica dada. Este método opera de la si-
guiente manera: sea {X1 , X2 , . . . , Xn } una muestra aleatoria de una distribución
de probabilidad desconocida F la cual contiene un parámetro θ . Interesa esti-
mar este parámetro, que puede ser la media ó la varianza poblacionales. Sea
F̂ la distribución de probabilidad empı́rica de los datos que asigna una masa
1/n a cada uno de los valores observados.

Sea {X1∗ , X2∗ , . . . , Xn∗ } una muestra aleatoria seleccionada con reemplazo de {X1 , X2 ,
· · · , Xn }. {X1∗ , X2∗ , . . . , Xn∗ } es una muestra aleatoria de F̂ y se denomina muestra
bootstrap. Sea θ̂ ∗ un estimador de θ̂ obtenido a partir de la muestra bootstrap.
El proceso de re-muestreo se repite un número B de veces obteniendo B esti-
madores bootstrap.

2.5.2. Gráfico de control propuesto por Bajgier (1992)


Jones & Woodall (1998) propone la construcción de un gráfico de control
basado en la metodologı́a bootstrap para el proceso de monitoreo en media,
siendo una alternativa a la gráfica de control Shewart. La construcción del
algoritmo se desarrolla de la siguiente manera:

1. Seleccione k muestras de tamaño n, para un total de n · k observaciones.

2. Seleccione una muestra aleatoria de tamaño n, obtenida de las n · k ob-


servaciones. Dicha muestra x1∗ , x2∗ , . . . , xn∗ , es una muestra bootstrap.

3. Calcule la media muestral x̄∗ de la muestra bootstrap obtenida en el paso


2.

Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1


44 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

4. Repita los pasos 2 y 3 un número B de veces.

5. Encuentre el valor del cuantil α /2 de las B muestras bootstrap. Este


valor corresponde al lı́mite de control inferior de la gráfica de control.

6. Encuentre el valor del cuantil 1 − α /2 de las B muestras bootstrap. Este


valor corresponde al lı́mite de control inferior de la gráfica de control.

El valor de α corresponde a la probabilidad de cometer error tipo I.

2.5.3. Gráfico de control propuesto por Liu y Tang (1996)


Estos autores proponen una alternativa para la construcción de la gráfica de
control X̄, cuando no se cumple el supuesto de normalidad en las observaciones,
basado en el método bootstrap, sin importar la distribución teórica de las
observaciones. La construcción se realiza de la siguiente manera:

1. Tenga en cuenta k subgrupos de tamaño n para un total de N = n · k


observaciones.

2. Calcule el valor del promedio general de la siguiente forma

1 k n
X̄¯N = ∑ ∑ Xi j .
N i=1 j=1

3. Extraiga una muestra aleatoria de tamaño n, con reemplazo, a partir de


la muestra representativa de N observaciones. Denotada por x1∗ , x2∗ , . . . , xn∗ ,
llamada muestra bootstrap.

4. Calcule la media de las muestras X̄ ∗ = 1n ∑ni=1 xi∗ y t ∗ = x(x̄∗ − X̄¯N ), de la
muestra bootstrap, extraı́da en el paso 3.

5. Repita los pasos 3 y 4, B veces.

6. Localice los cuantiles 1 − α /2 y α /2 de t1∗ ,t2∗ , . . . ,tB∗ .

7. Calculamos los lı́mites de control inferior y superior:

tα∗ /2 ∗
t1−α /2
LCI = X̄¯N + √ , LCS = X̄¯N + √
n n

El valor de α corresponde a la probabilidad de cometer error tipo I.

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas


Eficiencia de los gráficos de control bajo supuestos de no normalidad 45

2.5.4. Gráfico de control propuesto por Choobineh y Ballard (1987)


Chaparro & Vargas (2000) presenta una metodologı́a heurı́stica para la cons-
trucción de gráficas de control para la media de un proceso que ajusta los
lı́mites de acuerdo a la dirección de la asimetrı́a que presenta la función de
la distribución de la caracterı́stica de interés. La construcción de la gráfica de
control se realiza de la siguiente manera:

1. Calcule µx̄ = x̄ y σ̂x = Sx , corresponden a la media y desviación estándar


del conjunto del total de observaciones de X. Si son desconocidos µx̄ y
σ̂x se calculan de la siguiente forma µx̄ = x̄¯ y σ̂x = Sx , donde x̄¯ representa
la media global de todas las observaciones de la muestra.
2. Estime P̄¯x = 1
m ∑m
i=1 I(x̄i ) donde
{
1 si x̄i ≤ x̄¯
I(x̄i ) =
0 en otro caso

3. Calculamos los lı́mites de control inferior y superior:


3σx √ 3σx √
LCS = µX̄ + √ 2Px , LCI = µX̄ − √ 2Px
n n

2.6. Cálculo del ARL

Según Vargas (2006) cuando un proceso está siendo monitoreado en lı́nea,


es decir que se encuentra en la fase II al número de puntos graficados en
la carta hasta que aparezca una señal fuera de control se le conoce como
longitud de corrida (RL). El valor de RL cambia de ensayo a ensayo en razón
a una variabilidad aleatoria. El valor esperado de la variable aleatoria RL,
calculado con base en un número grande de ensayos, se denota por ARL.
Puede ser calculado teóricamente para varias cartas y graficando en una curva,
denominada curva ARL. En varios casos es difı́cil calcular teóricamente la
ARL. Se utilizan entonces procedimientos de simulación. Hay que tener en
claro el concepto de ARL, pues es un criterio necesario si se desea comparar
la eficiencia de varias gráficas de control.

3. Marco Metodológico

3.1. Definición de la población y determinación de la muestra

Las muestras se obtienen vı́a simulación estadı́stica, provenientes de distribu-


ciones Beta, Log-Normal y Normal. Los tamaños de las muestras k = 250, y

Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1


46 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

2000, con tamaños de sub-muestras de n = 5 y 10. Para cada distribución, se


calculan sus correspondientes estadı́sticos media y varianza teóricos. Poste-
riormente se implementan los gráficos de control propuestos para una base de
datos real proveniente de una concentración de residuos quı́micos.

3.2. Instrumentos de recolección de la información

La generación de muestras sintéticas, ası́ como la construcción de las gráficas


de control, se realizaron en el programa R Core Team (2013). La base de datos
real, es tomada de Cowden (1957) que fueron aplicados por Chaparro & Vargas
(2000).

3.3. Diseño estadı́stico

A partir de las distribuciones Beta, Log-normal y Normal, se fijan paráme-


tros para calcular media y desviación estándar teóricas correspondientes. El
siguiente paso consiste en calcular cambios de media, teniendo en cuenta que:

µ j = µ0 + δ j σ0 ;
j = 1, 2, 3, . . . , 6, δ j = 0.5, 1, 1.5, 2, 2.5, 3,

donde µ0 = E (x), la media teórica y σ0 = V (x) desviación estándar teórica,
con δ j representando los distintos corrimientos en media. En la distribución
Beta, se toman los parámetros √ p = 2 y q = 5. El valor esperado es E (x) = µ0 =
2/7, desviación estándar σ0 = 5/196. Los cambios en media se calculan de
la siguiente manera:

2 5
µ1 = + 0.5 = 0.3655.
7 296
pj
Los cambios en el parámetro p a partir de µ j = p j +5 se tiene que

p1
0.3655 = → p1 = 2.8802.
p1 + 5

La tabla 1 muestra cómo se calculan los cambios en medias y del parámetro


p.

µj µ1 = 0.37 µ2 = 0.45 µ3 = 0.53 µ4 = 0.61 µ5 = 0.69 µ6 = 0.76


p p1 = 2.88 p2 = 4.02 p3 = 5.53 p4 = 7.67 p5 = 10.87 p6 = 16.26

Tabla 1: Valores que corresponden al cambio de medias y parámetro p en la distribu-


ción Beta (2;5)

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas


Eficiencia de los gráficos de control bajo supuestos de no normalidad 47

A partir de los distintos valores de µ j y p j , se obtiene aumento gradual en am-


bas partes. Para el caso de la distribución Log-normal, de parámetros µ = 0
y σ 2 = 1. El valor √esperado teórico es E (x) = e2 − e, y su desviación están-
dar teórica es σ0 = e2 − e. Los cambios en media se calculan de la siguiente
manera:

µ1 = e1/2 + 0.5 e2 − e = 2.72931.
Se procede a calcular los cambios en el parámetro a j :

µ j = ea j +1/2 → despejar a j
2.72931 = ea1 +1/2 → a1 = 0.50405

Analizando los resultados de la tabla 2, los valores de µ j , tienen un crecimiento


de forma exponencial, mientras que los resultados de los distintos valores a j ,
tienen un crecimiento de forma gradual.

µj µ1 = 2.73 µ2 = 3.81 µ3 = 4.89 µ4 = 5.97 µ5 = 7.05 µ6 = 8.13


aj a1 = 0.50 a2 = 0.84 a3 = 1.09 a4 = 1.29 a5 = 1.45 a6 = 1.60

Tabla 2: Valores que corresponden al cambio de medias y parámetro a j en la dis-


tribución Log-Normal (0;1)

Para el caso de la distribución Normal, se escogen como parámetros µ = 0 y


σ 2 =√
1. El promedio teórico es E (x) = 0 y la desviación estándar teórica es
σ0 = σ 2 = 1. Los cambios en media se realizan de la siguiente manera:

µ j = µ + δ j σ0 .
De los cálculos obtenidos en la tabla 3, los cambios en media, y corrimientos
en δ j son exactamente iguales.

µj µ1 = 0.5 µ2 = 1 µ3 = 1.5 µ4 = 2 µ5 = 2.5 µ6 = 3


δj δ1 = 0.5 δ2 = 1 δ3 = 1.5 δ4 = 2 δ5 = 2.5 δ6 = 3

Tabla 3: Valores que corresponden al cambio de medias y corrimientos en la distribu-


ción Normal (0;1)

4. Resultados

La información suministrada de las tablas 4 a la 12, son los resultados de


las simulaciones de las distribuciones teóricas, las cuales están divididas en

Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1


48 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

tres bloques. El primer bloque corresponde a los tamaños de sub-muestras n


y tamaños de muestra k; el segundo bloque corresponde a los valores ARL
simulados teniendo en cuenta los cambios en media para cada distribución
teórica propuesta, y el último bloque corresponde a los valores de los lı́mites
de control inferior (LCI) y lı́mites de control superior (LCS). El valor teórico
del ARL es de 370, debido a que se consideran gráficos de control con lı́mites
de ±3σ , es decir, con un nivel α = 0.0027. Por último se muestran 3 figuras
que representan los casos más sobresalientes del estudio.

Tamaños Valores ARL Lı́mites de control


n k δ =0 δ = 0.5 δ = 1 δ = 1.5 δ = 2 δ = 2.5 δ =3 LCI LCS
5 250 401.72 56.08 7.41 1.95 1.11 1 1 0.11 0.52
5 2000 294.8 41.65 5.98 1.75 1.06 1 1 0.11 0.51
10 250 431.83 23.07 2.36 1.07 1 1 1 0.15 0.46
10 2000 435.8 19.95 2.33 1.04 1 1 1 0.15 0.45

Tabla 4: Valores ARL distribución Beta(2;5) para el gráfico de control de Bajgier


(1992)

Analizando los resultados de la tabla 4, para los tamaños de las sub-muestras


n = 5, sin hacer corrimiento en media cuando δ = 0, hay variabilidad de los
ARL simulados con respecto al valor ARL teórico. Cuando los corrimientos son
cortos δ = 0.5, 1, 1.5, detecta más rápido los cambios cuando k = 2000. cuando
los corrimientos son grandes δ = 2 en adelante tienden a ser constantes. Los
lı́mites de control parecen tener cierta similitud sin importar el valor de k.
Cuando los tamaños de las sub-muestras es de n = 10, y sin hacer corrimiento
en media es decir cuando δ = 0, se encuentran por encima del valor ARL
teórico. Luego los corrimientos en media tienden a tener cierta similitud. Los
lı́mites de control tienen cierta similitud.
Tamaños Valores ARL Lı́mites de control
n k δ =0 δ = 0.5 δ = 1 δ = 1.5 δ = 2 δ = 2.5 δ =3 LCI LCS
5 250 404.6 54.31 7.11 1.96 1.09 1 1 0.1 0.52
5 2000 361.5 47.08 6.91 1.803 1.09 1 1 0.11 0.52
10 250 393.1 20.65 2.23 1.076 1 1 1 0.15 0.45
10 2000 404.7 20 2.26 1.054 1 1 1 1.15 0.45

Tabla 5: Valores ARL distribución Beta(2;5) para el gráfico de control de Lui y Tang
(1992)

Analizando los resultados de la tabla 5, para los tamaños de las sub-muestras


n = 5, sin hacer corrimiento en media, oscilan alrededor del valor ARL teórico.
Para corrimientos cortos en media cuando δ = 0.5, 1, 1.5, detecta más rápido

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas


Eficiencia de los gráficos de control bajo supuestos de no normalidad 49

los cambios cuando el valor de k = 2000. A medida que aumente el valor del
corrimiento en media tiende al valor de 1. Los lı́mites de control parecen tener
cierta similitud sin importar el valor de k.

Cuando los tamaños de las sub-muestras es de n = 10, y sin hacer corrimiento


en media oscilan alrededor del valor ARL teórico. Además los corrimientos en
media tienden a tener cierta similitud. Los lı́mites de control son un poco más
anchos cuando el tamaño de la submuestra es inferior a 10.

Tamaños Valores ARL Lı́mites de control


n k δ =0 δ = 0.5 δ = 1 δ = 1.5 δ = 2 δ = 2.5 δ =3 LCI LCS
5 250 249.28 22.56 3.86 1.43 1.04 1 1 0.07 0.49
5 2000 334.87 26.32 4.53 1.55 1.04 1 1 0.07 0.5
10 250 387.12 13.79 1.88 1.04 1 1 1 0.14 0.44
10 2000 384.67 14.79 1.9 1.04 1 1 1 0.14 0.44

Tabla 6: Valores ARL distribución Beta(2;5) para el gráfico de control de Choobineh


y Ballard (1987)

Analizando los resultados de la Tabla 6, muestra que al aumentar el tamaño


de muestra k, cuando el tamaño de submuestra es de n = 5, se va aproximando
al valor ARL teórico. Los distintos corrimientos en media parecen tener cierta
similitud, mientras que los valores de los lı́mites de control tienen cierta simi-
litud.

Cuando los tamaños de las sub-muestras es de n = 10, y sin hacer corrimiento


en media oscilan alrededor del valor ARL teórico. Además los corrimientos en
media tienden a tener cierta similitud. Los lı́mites de control son un poco más
anchos cuando el tamaño de la sub-muestra es inferior a 10.

Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1


50 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

400

300
Valores ARL

Método
Bajgier
Choobineh y Ballard
200
Liu y Tang

100

0 0.5 1 1.5 2 2.5 3


Delta

Figura 1: Valores ARL de la distribución Beta (2;5), k = 2000, n = 10

Analizando la figura 1, se toma el caso para el cual k = 2000 y n = 10, para


la distribución Beta(2;5), se puede analizar que sin hacer corrimiento en media
los valores ARL para las gráficas de control estudiadas oscilan alrededor del
valor ARL teórico, además para los distintos corrimientos en media empiezan
a tener cierta similitud.

Tamaños Valores ARL Lı́mites de control


n k δ =0 δ = 0.5 δ = 1 δ = 1.5 δ = 2 δ = 2.5 δ =3 LCI LCS
5 250 155.9 24.22 7.59 3.84 2.49 1.91 1.5 0.34 5.91
5 2000 468.4 146.61 35.64 15.07 8.15 4.7 3.35 0.34 9.2
10 250 209.46 18.79 4.72 2.12 1.51 1.23 1.1 0.52 4.72
10 2000 368.45 37.42 8.01 3.18 1.96 1.41 1.2 0.52 5.42

Tabla 7: Valores ARL distribución Log-Normal(0;1) para el gráfico de control de


Bajgier (1992)

Los resultados de la tabla 7, cuando el tamaño de muestra k = 2000, y los


tamaños de sub-muestra son de tamaño n = 5 y 10, hay variabilidad con el ARL
teórico. Cuando los corrimientos son grandes δ = 2 la detección disminuye. Los
lı́mites de control parecen ser más anchos a medida que se aumenta el valor
de n y en general.

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas


Eficiencia de los gráficos de control bajo supuestos de no normalidad 51

Tamaños Valores ARL Lı́mites de control


n k δ =0 δ = 0.5 δ = 1 δ = 1.5 δ = 2 δ = 2.5 δ =3 LCI LCS
5 250 336.23 113.38 28.24 12.36 6.56 4.19 3.13 0.36 8.73
5 2000 317.33 89.78 23.53 9.48 5.33 3.59 2.62 0.35 8.19
10 250 214.68 18.61 4.43 2.27 1.44 1.21 1.1 0.51 4.7
10 2000 334.89 49.33 10.08 3.8 2.29 1.57 1.29 0.54 5.72

Tabla 8: Valores ARL distribución Log-Normal(0;1) para el gráfico de control de Lui


y Tang (1992)

Analizando los resultados de la Tabla 8, para los tamaños de las sub-muestras


n = 5, sin hacer corrimiento en media, es decir cuando δ = 0, hay variación
del ARL simulado con respecto al valor ARL teórico. Si los corrimientos son
grandes, es decir δ = 2 en adelante tienden a disminuir las detecciones. Los
lı́mites de control parecen tener cierta similitud sin importar el valor de k. Los
correspondientes lı́mites de control cuando k = 250 y 2000, presentan cierta
similitud.

Para los tamaños de las sub-muestras de n = 10, sin hacer corrimiento en media
(δ = 0), a medida que se aumente el tamaño de la muestra se va aproximando
al valor ARL teórico (370). Cuando los corrimientos son cortos son grandes los
valores ARL simulados para k = 2000, luego los corrimientos en media tienden
a tener cierta similitud cuando son grandes. Por último los lı́mites de control
son mucho más amplios cuando n = 10 y k = 2000.

Tamaños Valores ARL Lı́mites de control


n k δ =0 δ = 0.5 δ = 1 δ = 1.5 δ = 2 δ = 2.5 δ =3 LCI LCS
5 250 76.10 10.47 4.15 2.51 1.79 1.40 1.26 -0.88 4.72
5 2000 80.32 10.98 4.05 2.49 1.78 1.46 1.28 -0.83 4.80
10 250 72.25 6.66 2.4 1.42 1.15 1.08 1.02 -0.09 3.72
10 2000 82.14 7 2.35 1.50 1.21 1.08 1.03 -0.2 3.83

Tabla 9: Valores ARL distribución Log-Normal(0;1) para el gráfico de control de


Choobineh y Ballard (1987)

Analizando la tabla 9, se observa que para cualquier tamaño de muestra y de


sub-muestra cuando δ = 0, están muy por debajo del ARL teórico, lo cual in-
dica que no es una buena alternativa en este caso. Mientras que para cualquier
corrimiento en media presentan cierta similitud en este caso. En cuanto a los
lı́mites de control para valores de n = 5, k = 250 y 2000 se presenta una si-
militud entre dichos lı́mites, caso contrario sucede cuando n = 10, k = 250 y
2000.

Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1


52 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

300

200
Valores ARL

Método
Bajgier
Choobineh y Ballard
Lui y Tang

100

0 0.5 1 1.5 2 2.5 3


Delta

Figura 2: Valores ARL de la distribución Log-Normal (0;1), k = 250, n = 5

Al analizar la figura 2, con k = 250 y n = 5, para la distribución Log- Normal


(0;1), se puede observar que al no realizar corrimiento en media, el valor ARL
para la gráficas de control de Choobineh & Ballard (1987) tiene un valor muy
por debajo del ARL teórico, mientras que el gráfico de control de Liu & Tang
(1996) tiene un valor cercano por encima de 300; el gráfico de control de Bajgier
(1992) el valor del ARL simulado está muy por debajo del ARL teórico, al ser
un tamaño de muestra pequeño.

Tamaños Valores ARL Lı́mites de control


n k δ =0 δ = 0.5 δ = 1 δ = 1.5 δ = 2 δ = 2.5 δ =3 LCI LCS
5 250 266.8 22.55 3.48 1.45 1.04 1 0.13 -1.33 1.26
5 2000 436.2 43.96 4.88 1.68 1.12 1.01 1.02 -1.35 1.4
10 250 298.4 13.03 1.78 1.04 1 1 1 -0.91 0.95
10 2000 396.8 13.4 1.84 1.05 1 1 1 -0.96 0.95

Tabla 10: Valores ARL distribución Normal(0;1) para el gráfico de control de Bajgier
(1992)

En la tabla 10 se observa que a medida que aumenta el tamaño de muestra k


dejando fijo el valor de n = 5, el valor del ARL simulado va aumentando de
una manera rápida sin corrimiento en media. Cuando el corrimiento en media
es de δ = 1.5, el proceso tiende a estabilizarse. Los correspondientes lı́mites
de control presentan una anchura mayor cuando el valor de k es de 2000. Por
tanto, si el tamaño de la sub-muestra es de n = 10, variando el valor de k de
250 a 2000, tiende a oscilar el ARL simulado alrededor del valor ARL teórico,

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas


Eficiencia de los gráficos de control bajo supuestos de no normalidad 53

con corrimientos mayores o iguales de δ = 0.5, tiende a estabilizarse el proces.


Por último se da un caso de simetrı́a con respecto a los lı́mites de control
simulados.

Tamaños Valores ARL Lı́mites de control


n k δ =0 δ = 0.5 δ = 1 δ = 1.5 δ = 2 δ = 2.5 δ =3 LCI LCS
5 250 525.87 48.37 5.32 1.7 1.1 1.01 1 -1.39 1.41
5 2000 424.53 34.35 4.79 1.56 1.09 1 1 -1.36 1.35
10 250 262.93 9.34 1.59 1.03 1 1 1 -0.93 0.9
10 2000 390.32 13.65 1.81 1.04 1 1 1 -0.96 0.46

Tabla 11: Valores ARL distribución Normal(0;1) para el gráfico de control de Lui y
Tang (1992)

Analizando los resultados de la tabla 11, para los tamaños de las sub-muestras
n = 5, sin hacer corrimiento en media cuando δ = 0, los valores de la tabla se
encuentran por encima del valor ARL teórico, lo interesante es que a medida
que se aumenta el tamaño de muestra tiende a reducirse el valor del ARL
simulado hacia el ARL teórico, para corrimientos en media de δ = 1.5 en
adelante se tiende a estabilizar el proceso. Caso contrario sucede cuando el
valor de n = 10, aumentándose el valor de k, oscila alrededor del ARL teórico.
Con corrimientos en media mayores de δ = 1.5, el proceso tiende a estabilizarse
y además los lı́mites de control son más anchos cuando el valor de k = 250.

Tamaños Valores ARL Lı́mites de control


n k δ =0 δ = 0.5 δ = 1 δ = 1.5 δ = 2 δ = 2.5 δ =3 LCI LCS
5 250 364.28 34.84 4.31 1.59 1.07 1 1 -1.39 1.34
5 2000 393.81 36.99 4.9 1.61 1.08 1.01 1 -1.34 1.36
10 250 376.18 12.67 1.77 1.05 1 1 1 -0.94 0.96
10 2000 377.01 12.59 1.72 1.05 1 1 1 -0.95 0.95

Tabla 12: Valores ARL distribución Normal(0;1) para el gráfico de control de


Choobineh y Ballard (1987)

Analizando los resultados de la tabla 12, para los tamaños de las sub-muestras
n = 5, sin hacer corrimiento en media cuando δ = 0, hay variabilidad de los
ARL simulados con respecto al valor ARL teórico, sin importar cuál sea el
valor de n y de k. cuando n = 5, y el corrimiento es mayor o igual que δ =
1, tiende a estabilizarse el proceso. Mientras que para el caso de n = 10 sin
corrimientos, con corrimientos cortos o grandes el proceso es semejante. Los
lı́mites de control presentan a tener cierta simetrı́a cuando el valor de n = 10
y k aumenta su valor.

Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1


54 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

400

300
Valores ARL

Método
Bajgier
200
Choobineh y Ballard
Lui y Tang

100

0 0.5 1 1.5 2 2.5 3


Delta

Figura 3: Valores ARL de la distribución Normal (0;1), k = 2000, n = 10

En la Figura 3 se muestra un caso particular para la distribución Normal


(0;1), con k = 2000 y n = 10, se concluye en este caso que al valor del ARL
simulado coincide con el valor ARL teórico, al igual que si se comparan con
sus correspondientes corrimientos en media para los tres gráficos de control
bajo estudio.

5. Ejemplo

A continuación se toma un conjunto de datos reales, provenientes de un proce-


so de residuos quı́micos, suministrados por Cowden (1957). Dicha información
está disponible en el anexo de Chaparro & Vargas (2000). Está información
consta de 30 muestras de tamaño 5, para un total de 150 observaciones.

La tabla 13 muestra un resumen general de las observaciones. En este caso el


promedio de los residuos quı́micos es de 18.453, su error estándar con respecto
a la media es de 20.627. El coeficiente de asimetrı́a es de 2.74429, el cual
indica que la distribución de los datos es sesgada a la derecha. El coeficiente
de curtosis es de 9.710449, es decir el histograma va a presentar una curva de
tipo leptocúrtica. Los valores de los cuantiles 25, 50 y 75 son de 6, 11,22. Por
último el total es de 150.

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas


Eficiencia de los gráficos de control bajo supuestos de no normalidad 55

Mean sd skewness kurtosis 25 % 50 % 75 % N


18.453 20.627 2.74429 9.710449 6 11 22 150

Tabla 13: Resumen estadı́stico del proceso de residuos quı́micos

En la figura 4 el histograma muestra la distribución de los residuos quı́micos,


con sesgo a la derecha y el box plot evidencia que la mediana está más cerca
del primer cuantil indicando que los datos son positivamente asimétricos.

30

20
count

10

0 50 100 150
Datos

1.4

1.2

1.0

0.8

0.6
0 50 100 150
Datos

Figura 4: Histograma y box-plot de residuos quı́micos

A continuación se realizó la prueba de normalidad de Shapiro Wilk y de inde-


pendencia de Ljung-Box.

Shapiro-Wilk normality test


data: Datos$Muestra
W = 0.7055, p-value = 5.635e-16

Box.test (Muestra, lag = 1, type="Ljung")


Box-Ljung test
data: Muestra
X-squared = 0.0543, df = 1, p-value = 0.8158

Basándose en la hipótesis de normalidad, el p value es de 5.635e-16, permite


que haya suficiente evidencia para rechazar la hipótesis de normalidad, bajo
un nivel de significancia α = 0.05. La prueba de independecia de Ljung-Box,

Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1


56 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

que arroja un p-value de 0.8158, permite aceptar la hipótesis nula de indepen-


dencia, es decir hay independencia en las observaciones.

La tabla 14 muestra los resultados al ser simulados y los gráficos de control


en estudio bajo un nivel α = 0.0027, preestablecido. Hay ciertas similitudes en
cuanto a los gráficos de control de Bajgier y el de Liu y Tang, mientras que el
lı́mite inferior del gráfico de Choobineh y Ballard resulta ser un valor negativo
de -5.2456. Por último se adicionan los lı́mites de control de Shewhart para
comprobar que no son adecuados para el estudio.

Gráfica de Gráfica de Gráfica de Gráfica de


Lı́mites control de control de Liu control de control
de control Bajgier Tang Choobineh Shewhart
Ballard
LCI 4.2 4 -5.25456 -8.62
LCS 55.9865 55.7865 49.5998 45.53

Tabla 14: Resultados de los lı́mites de control de los residuos quı́micos

La figura 5 muestra los resultados de los lı́mites de control de las tres gráficas
de control en estudio. Se puede apreciar que ningún punto se sale de control.
Hay cierta similitud entre los lı́mites de control de Liu y Tang y de Bajgier, por
tanto cualquiera de los dos son buenas alternativas, y son eficientes. Para el
gráfico de control de Choobineh y Ballard se recomienda tener precaución ya
que la distribución de las observaciones tiene un sesgo severo y puede prestarse
para malas interpretaciones, según estudio del ARL simulado anteriormente.
Los lı́mites de control de Shewhart, presenta una señal fuera de control en
la muestra 22, la cual es un indicio de que el gráfico está fallando por los
supuestos clásicos.

6. Conclusiones

Los resultados del estudio se realizaron vı́a simulación estadı́stica, comparando


la eficiencia de tres gráficos de control propuestos mediante la técnica del ARL.
Obtuvieron los siguientes resultados:

Para distribuciones moderadamente simétricas, como es el caso de la


distribución Beta (2;5), los tres gráficos de control propuestos son ade-
cuados, sin importar el tamaño de la muestra y submuestra; debido a
que los valores ARL simulados sin hacer corrimiento en media, oscilan
alrededor del valor ARL teórico.

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas


Eficiencia de los gráficos de control bajo supuestos de no normalidad 57

Figura 5: Valores ARL de la distribución Normal (0;1), k = 2000, n = 10

Cuando el tipo de distribución es Normal estándar, el gráfico de control


de Bajgier, necesita tamaños de muestras grandes para oscilar al valor
del ARL teórico sin hacer corrimientos en media. El gráfico de control de
Liu y Tang y el gráfico de control de Choobineh y Ballard no presentan
las mismas inconsistencias del gráfico de control de Bajgier.

Cuando el tipo de distribución es asimétrica, el gráfico de control de


Choobineh y Ballard no es adecuado, debido a que el valor del ARL
simulado sin hacer corrimiento en media está muy por debajo del valor
ARL teórico lo cual implica que detecta muchas señales fuera de control
cuando en verdad no lo es. Lo recomendable serı́a trabajar con el gráfico
de control de Bajgier y el gráfico de Liu y Tang que no presentan dichas
inconsistencias dichas anteriormente.

7. Recomendaciones para trabajos futuros

Se recomienda el uso de los gráficos de control de Bajgier y el de Liu


y Tang para cualquier tipo de distribución, sin importar cuál sea su
coeficiente de asimetrı́a, ya que se basan en metodologı́a Bootstrap.

Implementar dichos gráficos de control bajo estudio, comparándolos con


gráficos de control no paramétricos y bayesianos.

Implementar los gráficos de control bajo estudio a un enfoque multiva-


riado.

Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1


58 Carlos M. Camelo, Héctor F. López, Alex J. Zambrano

Bibliografı́a

Bajgier, S. M. (1992), The use of bootstrapping to construct limits on control


charts, in ‘Decision Science Institute’, San Diego, CA, pp. 1611–1613.
Chaparro, E. A. & Vargas, J. A. (2000), ‘Gráficos de control para la media de un
proceso en poblaciones con distribución asimétricas’, Revista Colombiana
de Estadı́stica 23(2), 29–44.
Choobineh, F. & Ballard, J. L. (1987), ‘Control-limits of qc charts for skewed
distributions using weighted-variance’, IEEE Transactions on reliability
36(4), 473–477.
Cowden, D. J. (1957), Statistical methods in quality control, Prentice Hall, Engle-
wood Cliffs, N. J.
Efron, B. (1979), ‘Bootstrap methods: Another look at the jackknife’, The Annals
of Statistics 7(1), 1–26.
Jones, L. A. & Woodall, W. H. (1998), ‘The performance of bootstrap control
charts’, Journal of Quality Techology 30(2), 362–375.
Liu, R. Y. & Tang, J. (1996), ‘Control charts for dependent and independent mea-
surements based on bootstrap methods’, Journal of the American Sta-
tistical Association 91(436), 1694–1700.
Montgomery, D. C. & Runger, G. C. (2002), Probabilidad y estadı́stica aplicadas a
la ingenierı́a, 2 edn, Limusa, México.
R Core Team (2013), R: A Language and Environment for Statistical Computing,
R Foundation for Statistical Computing, Vienna, Austria.
URL: http://www.R-project.org/
Stoumbos, Z. G., Reynolds Jr., M. R., Ryan, T. P. & Woodall, W. H. (2000), ‘The
state of statistical process control as we proceed into the 21st century’,
Journal of the American statistical association 95(451), 992–998.
Vargas, J. A. (2006), Control Estadı́stico de Calidad, Universidad Nacional de
Colombia, Bogotá.
Walck, C. (1996), Hand-book on Statistical Distributions for experimentalists.

Institución Universitaria Los Libertadores Departamento de Ciencias Básicas

Вам также может понравиться