Вы находитесь на странице: 1из 64

Capacidad de Procesos I

Estadstica Descriptiva
Objetivos de Aprendizaje
Analizar las principales tcnicas para realizar un anlisis descriptivo de un
conjunto de datos.
Interpretar correctamente un histograma y un diagrama de cajas.
Aplicar los conocimientos anteriores para realizar un estudio de capacidad de
un proceso.

Slide 2
Capacidad de Procesos
Las variables de salida de un proceso deben cumplir con ciertas metas y/o
especificaciones, a fin que sea posible considerar que el proceso funciona de
manera satisfactoria.
Una tarea primordial del Control de Calidad es conocer la habilidad o capacidad
de un proceso.

Capacidad de un Proceso
Consiste en conocer la amplitud de la variacin natural del proceso para una
caracterstica de calidad dada; esto permitir saber en qu medida tal
caracterstica de calidad es satisfactoria. (CUMPLE ESPECIFICACIONES)

Slide 3
Capacidad de Procesos
Para realizar un estudio de capacidad se deben tomar datos del proceso durante
un perodo considerable para que se refleje bien el desempeo del proceso.
En la medida en que el perodo de recoleccin de datos y los datos en s sean
ms amplios, mejor ser el conocimiento que tengamos del estado real del
proceso.

Estadsticos
Mediciones o clculos que se obtienen a partir de un conjunto de datos con el
objetivo de conocer sus caractersticas ms relevantes.

Slide 4
Qu es una Medida?
Es una evaluacin cuantificada de una caracterstica y/o nivel de desempeo
basado en datos.

Ejemplos:
Tiempo. (velocidad, edad)
Tamao (largo, altura, peso)
Valores monetarios (costos, ventas, ingresos, ganancias)
Conteo de caractersticas o atributos (tipos de cliente, gnero)
Conteo de defectos (nmero de errores, quejas)

Slide 5
Estadstica
Estadstica Descriptiva
Se encarga de la descripcin de los datos recopilados.
Se centra en tres aspectos:
Ubicacin (tendencia central)
Dispersin.
Forma.

Puede estudiar los datos de una poblacin o de una muestra.


Estadstica Inferencial
Se encarga de establecer conclusiones acerca de una poblacin basndose en la
estadstica descriptiva de una muestra.

Slide 6
Medidas Descriptivas

Medidas Descriptivas

Tendencia Central Cuartiles Variacin Forma

Media aritmtica Rango Sesgo

Mediana Rango Intercuartil

Moda Varianza

Desviacin
Estndar

Slide 7
Por qu Medir?
Establecer el nivel actual de desempeo. (baseline).

Determinar prioridades para tomar acciones o no tomar acciones.

Comprender la magnitud de un problema.

Tener un mejor panorama de las causas potenciales de un problema y cambios en los procesos.

Para prevenir problemas y predecir el desempeo futuro.

Mantener las mejoras y establecer los lineamientos para mejoras futuras.

Slide 8
Mtodos de Medicin
Tendencia Central es la medida que describe
cmo todos los valores de los datos se agrupan en
torno a un valor central.

Variacin es la cantidad de disgregacin o


dispersin de los valores con respecto a un valor
central.

Forma es el patrn de distribucin de los valores


desde el menor hasta el mayor.

Slide 9
Tendencia Central
Es la propiedad de los datos
de agruparse alrededor de un
punto central.
Este centro puede ser el
promedio, el dato ms

Conte
frecuente o un dato

o
ubicado justo en el centro
del conjunto de datos.
Media, mediana y moda
son las medidas ms
comunes de tendencia Medida
central. Tendencia
Central

Slide 10
Media Muestral
Es el promedio aritmtico de un conjunto de datos.
Es una medida de tendencia central NO de variacin.
La media se requiere para calcular algunos estadstico de
variacin.

Media Muestral Media Poblacional


N

n
Xi X
i 1 i
X i 1

n N
N = tamao de la poblacin.
x = Media = Media poblacional (mu)
xi = Dato isimo.
n = tamao de muestra.

Slide 11
Media
Afectada por valores extremos (outliers)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Media = 3 Media = 4

1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5
Mediana
Medida de tendencia central que es igual al valor que divide a la mitad
de los datos cuando son ordenados de menor a mayor.

La mediana es el valor que divide a todos los datos en dos partes


iguales.
El 50% de los datos se encuentra siempre a la izquierda de la mediana y
el otro 50% a su derecha.

Pasos
1. Se ordenan de menor a mayor
2. Se escoge el numero que esta a la mitad de los datos.
3. En caso de ser un par la mediana se calcula dividiendo entre dos la
suma de los nmeros que estn en el centro del ordenamiento.

Slide 13
Mediana
Ubicacin de la mediana:
n 1
Posicin
2

Si el nmero de datos es impar, la mediana es el valor central.


Si el nmero de datos es par, la mediana es el promedio
aritmtmtico de los dos valores centrales.

n 1
NO es el valor de la mediana, es la POSICIN de
2
la mediana en un arreglo ordenado de datos.
Mediana
En un arreglo ordenado, la mediana es el valor
medio. (50% ariba, 50% abajo)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Mediana = 3 Mediana = 3

No es afectada por valores extremos.


Moda
Es una medida de tendencia central que
corresponde al valor que se repite ms veces
en un conjunto de datos.
No es afectado por valores extremos.
Puede no haber moda.
Pueden haber varias modas.

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

No hay Moda
Moda = 9
Cuartiles
Los cuartiles dividen a un conjunto de datos en cuatro partes
iguales: Q1 separa al 25% que abarca los valores ms
pequeos, del 75% restante que son los mayores.

El segundo cuartil Q2 es la mediana: 50% de sus valores


son menores que la mediana y 50% son mayores.

El tercer cuartil Q3 separa al 25% que abarca a los valores


ms grandes del 75% restante constituido por los que son
menores.

Slide 17
Cuartiles
Las ecuaciones que definen a Q1 y Q3 son:

Q1 n 1
4

Q3 3(n 1)
4

Slide 18
Cuartiles
Para calcular los cuartiles se utilizan las siguientes reglas:

Regla 1 si el resultado es un nmero entero, entonces el


cuartil es igual al valor clasificado.

Regla 2 si el resultado es una fraccin de mitad, entonces el


cuartil es igual al promedio de los valores clasificados
correspondientes.

Regla 3 si el resultado no es un nmero entero ni una


fraccin de mitad, se redondea al entero ms cercano y se
selecciona ese valor clasificado.
Slide 19
Medidas de Tendencia Central
Las medidas de tendencia central no son suficientes como
criterio de calidad.

Por qu?
Medidas de Tendencia Central
Las medidas de tendencia central no son suficientes como
criterio de calidad.

Por qu?

Porque no toman en cuenta qu tan


dispersos estn los datos, un hecho vital
para la calidad.

Ejemplo Tabla 2.1 Pg. 18


Variabilidad
La variabilidad reconoce
que los procecos no
producen resultados
idnticos siempre.
La variabilidad puede ser
causada por causas
identificables que actan

Conteo
en el proceso o por
pequeas causas que
pertenecen al proceso en
s.
Rango, desviacin
estndar y varianza son
las ms comunes Medida

medidas de variacin.
Variabilidad
Slide 22
Medidas de Variabilidad
Adems de conocer la tendencia central de un conjunto de
datos es necesario saber qu tan diferentes son entre s, es
decir, es preciso determinar su variabilidad o dispersin.

Nos indican qu tan separados estn los datos unos de otros.

Variacin

Rango Rango Varianza Desviacin Coeficiente


Intercuartil Estndar de
Variacin
Medidas de Variabilidad

Las medidas de variacin brindan


informacin sobre la dispersin or
variabilidad de los valores de los
datos.

Misma
centralizacin,
diferente
variacin.
Rango
Es la ms simple medida de variacin.
Es la diferencia entre el valor mayor y el
valor menor de un conjunto de datos.
Rango = Xmayor Xmenor

Ejemplo:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Rango = 14 - 1 = 13
Se ve afectado por valores extremos.
Rango
El rango mide la distribucin total del conjunto de datos.

Aunque el rango es una medida simple de la variacin total de los


datos, no toma en cuenta cmo se distribuyen los datos entre los
valores menor y mayor.

En otras palabras el rango no indica si los valores estn distribuidos


de manera uniforme a lo largo del conjunto de datos, as no resulta
prudente utilizar el rango como medida de variacin cuando al menos
uno de los valores es extremo.

Slide 26
Desventajas del Rango
Ignora la forma en que estn distribuidos los datos.

7 8 9 10 11 12 7 8 9 10 11 12
Rango = 12 - 7 = 5 Rango = 12 - 7 = 5

Sensible a valores extremos


1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5

Rango = 5 - 1 = 4

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

Rango = 120 - 1 = 119

Slide 27
Rango Intercuartil
Es la diferencia entre el tercer y el primer cuartil de un conjunto de
datos, se le llama tambin dispersin media.

Q3 Q1 = Rango Intercuartil

Mide la dispersin en la mitad (parte central) de los datos, no se ve


influido por valores extremos. (Lo que permite la conveniencia de su
uso en ocasiones)

Slide 28
Rango Intercuartil
Ejemplo:
Mediana X
X Q1 Q3
(Q2) mximo
mnimo
25% 25% 25% 25%

12 30 45 57 70

Rango Intercuartil
= 57 30 = 27

Slide 29
Varianza y Desviacin Estndar
La varianza y la desviacin estndar son dos
medidas de variacin muy utilizadas para tomar en
cuenta cmo se distribuyen los datos.

Miden las dispersin promedio alrededor de la


media, es decir qu tanto varan los valores ms
grandes que estn por encima de ella y cmo se
distribuyen los valores menores que estn por
debajo de ella.
Desviacin Estndar
Es la medida ms usual de variabilidad e indica qu tan esparcidos
estn los datos respecto a la media.

Desviacin estndar muestral: medida de variabilidad que indica


qu tan esparcidos estn los datos respecto a la media.

Desviacin estndar del proceso: refleja la variabilidad de un


proceso. Para su clculo se debe utilizar un nmero grande de datos
que hayan sido obtenidos en el transcurso de un lapso de tiempo
amplio.

Slide 31
Desviacin Estndar
Dicho de manera intuitiva: la desviacin estndar es la distancia
promedio de cada dato con respecto a la media.

N 2
( X i )
Desviacin estndar
poblacional

i 1 N

n 2
Desviacin estndar (x i x )
de la muestra. s
i 1 n 1

Tiene las mismas unidades que los datos originales.


Se utilizan todos los datos.
Slide 32
Desviacin Estndar

Desviacin estndar pequea

Desviacin estndar grande


Desviacin Estndar
Data A
Media = 15.5
S = 3.338
11 12 13 14 15 16 17 18 19 20 21

Data B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 0.926

Data C
Media = 15.5

11 12 13 14 15 16 17 18 19 20 21 S = 4.567
Varianza
Es otra medida de variabilidad.
2
(X i )
N
Varianza 2
Poblacional i 1 N

n 2
(x i x )
Varianza
Muestral
s 2

i 1 n 1
Note que la varianza es el cuadrado de la desviacin
estndar.
Su desventaja es que sus unidades al cuadrado en
ocasiones no tienen interpretacin lgica.
Slide 35
Caractersticas de las Medidas de Variacin

1. Cuanto ms esparcidos o dispersos estn los datos,


mayor es el rango, rango intercuartil, varianza y
desviacin estndar.

2. Cunto ms concentrados u homogneos estn los


datos, menor es el rango, rango intercuartil, varianza y
desviacin estndar.

3. Si todos los valores son los mismos, el rango, el rango


intercuartil, la varianza y la desviacin estndar son
iguales a cero.

4. Ninguna de las medidas de variacin puede ser


negativa.
Coeficiente de Variacin
Es una medida relativa de la variacin que siempre se
expresa como porcentaje, ms que en trminos de las
unidades de los datos en particular, mide la dispersin de los
datos con respecto a la media.

El coeficiente de variacin (CV) es igual a la desviacin


estndar dividida entre la media.

S
CV 100%
X
Coeficiente de Variacin
Es til para comparar la variacin de dos o ms variables
que estn medidas en diferentes escalas o unidades de
medicin. Por ejemplo: metro frente a centmetro o metro
frente a kilogramo.
Coeficiente de Variacin
Stock A:
Precio promedio ao anterior = $50
Desviacin estndar = $5
S $5
CVA 100%
100% 10%
X $50 Ambos stocks
Stock B: tienen la misma
desviacin,
Precio promedio ao anterior = $100 pero el stock B
Desviacin estndar = $5 es menos
variable
respecto a su
S $5 precio.
CVB 100%
100% 5%
X $100
Relacin entre X y S
Un forma de apreciar claramente el significado de la
desviacin estndar como medida de dispersin en torno a la
media, es a travs de la relacin entre la media y la
desviacin estndar, la cual est dada por la regla de
Chebyshev y la regla emprica.
Relacin entre X y S

Misma media, diferente desviacin.

Misma desviacin, diferente media.


La Regla Emprica
En la mayora de los conjuntos de datos, una gran parte de los valores
tienden a agruparse en algn valor cercano a la mediana.

En los conjuntos de datos asimtricos a la derecha, el agrupamiento se


presenta a la izquierda de la media, es decir en un valor menor que la
media.

En los conjuntos de datos asimtricos a la izquierda, el agrupamiento


se presenta a la derecha de la media, es decir en un valor mayor que
la media.

En los datos simtricos, los valores tienden a agruparse alrededor de


la
media y la mediana, generalmente una distribucin en forma de
campana, en estas distribuciones, la regla emprica permite examinar
la variabilidad de la siguiente manera:
La Regla Emprica

99.73%

95.46%
68.26%

(x)

3 2 1 1 2 3

La Regla Emprica

La regla emprica ayuda a medir cmo se distribuyen los


valores por encima y debajo de la media.

En los datos con mucha asimetra o en los que por alguna


razn no tienen forma de campana, se debe utilizar la
regla de Chebyshev.
Regla de Chebyshev
Esta regla establece que para todo conjunto de datos, independientemente
de su forma, el porcentaje de valores que se encuentran a una distancia de
k, desviaciones estndar o menos de la media, debe ser igual a:

(1 1 / k ) x100%
2

Puede usar esta regla para todo valor de k mayor que 1.


Al menos dentro

(1 - 1/12) x 100% = 0% k=1 ( 1)

(1 - 1/22) x 100% = 75% . k=2 ( 2)

(1 - 1/32) x 100% = 89% k=3 ( 3)


Regla de Chebyshev
Si el conjunto de datos tiene una forma que se aproxima a
la de una campana, la regla emprica reflejar con mayor
precisin la mayor concentracin de datos cerca de la
media.
Porcentaje de valores encontrados en
intervalos alrededor de la media
Intervalo Chebyshev Regla Emprica
( - , + ) Al menos 0% Aproximadamente 68%
( - 2, + 2) Al menos 75% Aproximadamente 95%

( - 3, + 3) Al menos 88.89% Aproximadamente 99.7%


Lmites Reales o Naturales
Indican los puntos entre los cuales vara la salida de un
proceso y, por lo general se obtienen de la siguiente manera:

Lmite real inferior (LRI) = - 3

Lmite real superior (LRS) = + 3

El clculo de estos lmites est basado en la regla emprica,


los datos deben pertenecer a una distribucin normal.

En un estudio de capacidad, estos lmites reales se comparan


con las especificaciones para la caracterstica de calidad.
Forma
Una tercera propiedad que describe a un conjunto de datos
numricos es la forma.

Forma se refiere al patrn de distribucin de los valores de


los datos a travs del rango de todos los valores. La
distribucin puede ser simtrica cuando los valores
pequeos y grandes se equilibran entre s o asimtrica
cuando muestra desequilibrio de los valores pequeos o
grandes.
Forma
La forma influye en la relacin de la media con la mediana de
la siguiente manera:

Media < Mediana; asimtrica negativa o sesgo izquierdo.

Media = Mediana; simtrica o asimetra cero.

Media > Mediana; asimtrica positiva o sesgo derecho.


Forma
Histograma
Es la representacin grfica de la distribucin de un conjunto
de datos o de una variable, donde los datos se clasifican por
su magnitud en un cierto nmero de clases. Permite
visualizar:

Tendencia Central.
Dispersin.
Forma de la distribucin.
Histograma

Unimodal un proceso Bimodal dos procesos

Inclinacin Positiva Inclinacin Negativa


Histograma
Histograma
Interpretacin del Histograma
Se recomienda considerar los siguientes puntos en la
interpretacin del histograma:

1. Estudiar el centrado del proceso.

2. Examinar la variabilidad del proceso.

3. Analizar la forma del histograma:


Sesgada: forma asimtrica de la distribucin. Un sesgo refleja el
desplazamiento paulatino de un proceso debido a desgastes o
desajustes; puede indicar tambin procedimientos viciados en la
forma de obtener mediciones o un desempeo especial del
proceso.

Multimodal: se aprecian claramente dos o ms modas (picos).


Algunas situaciones que originan esto son:
Interpretacin del Histograma
Multimodal: se aprecian claramente dos o ms modas (picos).
Algunas situaciones que originan esto son:

Diferencias importantes de lote a lote en materia prima debido a diferentes


causas: distintos proveedores por ejemplo.
Varios operadores o mtodos de trabajo diferentes.
Medicin realizada con instrumentos diferentes.
Condiciones diferentes del proceso.
Fuentes de variacin bien definidas (pueden ser identificadas y corregidas)

Distribucin muy plana: las causas de esto son similares a las


anteriores pero menos fuertes.

Distribucin con acantilados: suspensin o corte brusco en la cada


de la distribucin. Esto se puede deber a: exclusin de lotes,
problemas de medicin (equipo o mtodo).
Interpretacin del Histograma
5. Datos raros o atpicos: aparecen barras pequeas separadas o
aisladas del resto. Las causas pueden ser: dato incorrecto, eventos raros
o especiales.

6. Estratificar.

Limitaciones del Histograma

1. No considera el tiempo en que se obtuvieron los datos por lo que es


complicado detectar tendencias o estabilidad.

2. No es apropiado para comparar varios procesos, para esto es mejor


el diagrama de cajas.

3. La cantidad de clases influye en la forma del histograma, por lo que se


sugiere analizar los datos utilizando diferentes nmeros de clases.
Medidas de Forma
1. Sesgo es una medida numrica de la asimetra en la
distribucin de un conjunto de datos. Si es positivo, la
distribucin est cargada hacia la derecha.

2. Curtosis estadstico que mide que tan elevada o plana


es la curva de distribucin de unos datos respecto a la
distribucin normal.
Si la Curtosis es mayor que cero casi no hay datos en los extremos.

La Curtosis es cero para la Distribucin Normal, que es la


referencia.

Si la Curtosis es menor que cero hay una cantidad mayor de datos


en los extremos.
Diagrama de Caja
Qu son?
Los diagramas de caja son una representacin grfica de las diferentes
caractersticas del conjunto de datos.
Centro
Dispersin
Grado de simetra
Identificacin de datos raros Mximo

Mnimo

3er cuartil
1er cuartil

2do cuartil
Resumen de Cinco Nmeros
Un resumen de cinco nmeros compuesto por:

Xmenor Q1 Mediana Q3 Xmayor

Permite determinar la forma de la distribucin.

Tipo de Distribucin

Comparacin Asimtrico a la Simtrico Asimtrico a la


Izquierda Derecha
La distancia de Xmenor La distancia de Xmenor Ambas distancias son La distancia de Xmenor
a la mediana contra la a la mediana es mayor iguales. a la mediana es menor
distancia de la mediana que la distancia de la que la distancia de la
a Xmayor. mediana a Xmayor. mediana a Xmayor.
La distancia de Xmenor La distancia de Xmenor Ambas distancias son La distancia de Xmenor
a Q1 contra la distancia a Q1 es mayor que la iguales. a Q1 es menor que la
de Q3 a Xmayor. distancia de Q3 a distancia de Q3 a
Xmayor. Xmayor.
La distancia de Q1 a la La distancia de Q1 a la Ambas distancias son La distancia de Q1 a la
mediana contra la mediana es mayor que iguales. mediana es menor que
distancia de la mediana la distancia de la la distancia de la
a Q3. mediana a Q3. mediana a Q3.
Grfico de Caja y Bigotes
Grfico de Caja y Bigotes
Ejemplo Estudio Integral de
Capacidad
Fin de Presentacin

Вам также может понравиться