Академический Документы
Профессиональный Документы
Культура Документы
Estadstica Descriptiva
Objetivos de Aprendizaje
Analizar las principales tcnicas para realizar un anlisis descriptivo de un
conjunto de datos.
Interpretar correctamente un histograma y un diagrama de cajas.
Aplicar los conocimientos anteriores para realizar un estudio de capacidad de
un proceso.
Slide 2
Capacidad de Procesos
Las variables de salida de un proceso deben cumplir con ciertas metas y/o
especificaciones, a fin que sea posible considerar que el proceso funciona de
manera satisfactoria.
Una tarea primordial del Control de Calidad es conocer la habilidad o capacidad
de un proceso.
Capacidad de un Proceso
Consiste en conocer la amplitud de la variacin natural del proceso para una
caracterstica de calidad dada; esto permitir saber en qu medida tal
caracterstica de calidad es satisfactoria. (CUMPLE ESPECIFICACIONES)
Slide 3
Capacidad de Procesos
Para realizar un estudio de capacidad se deben tomar datos del proceso durante
un perodo considerable para que se refleje bien el desempeo del proceso.
En la medida en que el perodo de recoleccin de datos y los datos en s sean
ms amplios, mejor ser el conocimiento que tengamos del estado real del
proceso.
Estadsticos
Mediciones o clculos que se obtienen a partir de un conjunto de datos con el
objetivo de conocer sus caractersticas ms relevantes.
Slide 4
Qu es una Medida?
Es una evaluacin cuantificada de una caracterstica y/o nivel de desempeo
basado en datos.
Ejemplos:
Tiempo. (velocidad, edad)
Tamao (largo, altura, peso)
Valores monetarios (costos, ventas, ingresos, ganancias)
Conteo de caractersticas o atributos (tipos de cliente, gnero)
Conteo de defectos (nmero de errores, quejas)
Slide 5
Estadstica
Estadstica Descriptiva
Se encarga de la descripcin de los datos recopilados.
Se centra en tres aspectos:
Ubicacin (tendencia central)
Dispersin.
Forma.
Slide 6
Medidas Descriptivas
Medidas Descriptivas
Moda Varianza
Desviacin
Estndar
Slide 7
Por qu Medir?
Establecer el nivel actual de desempeo. (baseline).
Tener un mejor panorama de las causas potenciales de un problema y cambios en los procesos.
Slide 8
Mtodos de Medicin
Tendencia Central es la medida que describe
cmo todos los valores de los datos se agrupan en
torno a un valor central.
Slide 9
Tendencia Central
Es la propiedad de los datos
de agruparse alrededor de un
punto central.
Este centro puede ser el
promedio, el dato ms
Conte
frecuente o un dato
o
ubicado justo en el centro
del conjunto de datos.
Media, mediana y moda
son las medidas ms
comunes de tendencia Medida
central. Tendencia
Central
Slide 10
Media Muestral
Es el promedio aritmtico de un conjunto de datos.
Es una medida de tendencia central NO de variacin.
La media se requiere para calcular algunos estadstico de
variacin.
N
n
Xi X
i 1 i
X i 1
n N
N = tamao de la poblacin.
x = Media = Media poblacional (mu)
xi = Dato isimo.
n = tamao de muestra.
Slide 11
Media
Afectada por valores extremos (outliers)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Media = 3 Media = 4
1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5
Mediana
Medida de tendencia central que es igual al valor que divide a la mitad
de los datos cuando son ordenados de menor a mayor.
Pasos
1. Se ordenan de menor a mayor
2. Se escoge el numero que esta a la mitad de los datos.
3. En caso de ser un par la mediana se calcula dividiendo entre dos la
suma de los nmeros que estn en el centro del ordenamiento.
Slide 13
Mediana
Ubicacin de la mediana:
n 1
Posicin
2
n 1
NO es el valor de la mediana, es la POSICIN de
2
la mediana en un arreglo ordenado de datos.
Mediana
En un arreglo ordenado, la mediana es el valor
medio. (50% ariba, 50% abajo)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Mediana = 3 Mediana = 3
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
No hay Moda
Moda = 9
Cuartiles
Los cuartiles dividen a un conjunto de datos en cuatro partes
iguales: Q1 separa al 25% que abarca los valores ms
pequeos, del 75% restante que son los mayores.
Slide 17
Cuartiles
Las ecuaciones que definen a Q1 y Q3 son:
Q1 n 1
4
Q3 3(n 1)
4
Slide 18
Cuartiles
Para calcular los cuartiles se utilizan las siguientes reglas:
Por qu?
Medidas de Tendencia Central
Las medidas de tendencia central no son suficientes como
criterio de calidad.
Por qu?
Conteo
en el proceso o por
pequeas causas que
pertenecen al proceso en
s.
Rango, desviacin
estndar y varianza son
las ms comunes Medida
medidas de variacin.
Variabilidad
Slide 22
Medidas de Variabilidad
Adems de conocer la tendencia central de un conjunto de
datos es necesario saber qu tan diferentes son entre s, es
decir, es preciso determinar su variabilidad o dispersin.
Variacin
Misma
centralizacin,
diferente
variacin.
Rango
Es la ms simple medida de variacin.
Es la diferencia entre el valor mayor y el
valor menor de un conjunto de datos.
Rango = Xmayor Xmenor
Ejemplo:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Rango = 14 - 1 = 13
Se ve afectado por valores extremos.
Rango
El rango mide la distribucin total del conjunto de datos.
Slide 26
Desventajas del Rango
Ignora la forma en que estn distribuidos los datos.
7 8 9 10 11 12 7 8 9 10 11 12
Rango = 12 - 7 = 5 Rango = 12 - 7 = 5
Rango = 5 - 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Slide 27
Rango Intercuartil
Es la diferencia entre el tercer y el primer cuartil de un conjunto de
datos, se le llama tambin dispersin media.
Q3 Q1 = Rango Intercuartil
Slide 28
Rango Intercuartil
Ejemplo:
Mediana X
X Q1 Q3
(Q2) mximo
mnimo
25% 25% 25% 25%
12 30 45 57 70
Rango Intercuartil
= 57 30 = 27
Slide 29
Varianza y Desviacin Estndar
La varianza y la desviacin estndar son dos
medidas de variacin muy utilizadas para tomar en
cuenta cmo se distribuyen los datos.
Slide 31
Desviacin Estndar
Dicho de manera intuitiva: la desviacin estndar es la distancia
promedio de cada dato con respecto a la media.
N 2
( X i )
Desviacin estndar
poblacional
i 1 N
n 2
Desviacin estndar (x i x )
de la muestra. s
i 1 n 1
Data B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 0.926
Data C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 4.567
Varianza
Es otra medida de variabilidad.
2
(X i )
N
Varianza 2
Poblacional i 1 N
n 2
(x i x )
Varianza
Muestral
s 2
i 1 n 1
Note que la varianza es el cuadrado de la desviacin
estndar.
Su desventaja es que sus unidades al cuadrado en
ocasiones no tienen interpretacin lgica.
Slide 35
Caractersticas de las Medidas de Variacin
S
CV 100%
X
Coeficiente de Variacin
Es til para comparar la variacin de dos o ms variables
que estn medidas en diferentes escalas o unidades de
medicin. Por ejemplo: metro frente a centmetro o metro
frente a kilogramo.
Coeficiente de Variacin
Stock A:
Precio promedio ao anterior = $50
Desviacin estndar = $5
S $5
CVA 100%
100% 10%
X $50 Ambos stocks
Stock B: tienen la misma
desviacin,
Precio promedio ao anterior = $100 pero el stock B
Desviacin estndar = $5 es menos
variable
respecto a su
S $5 precio.
CVB 100%
100% 5%
X $100
Relacin entre X y S
Un forma de apreciar claramente el significado de la
desviacin estndar como medida de dispersin en torno a la
media, es a travs de la relacin entre la media y la
desviacin estndar, la cual est dada por la regla de
Chebyshev y la regla emprica.
Relacin entre X y S
99.73%
95.46%
68.26%
(x)
3 2 1 1 2 3
La Regla Emprica
(1 1 / k ) x100%
2
Tendencia Central.
Dispersin.
Forma de la distribucin.
Histograma
6. Estratificar.
Mnimo
3er cuartil
1er cuartil
2do cuartil
Resumen de Cinco Nmeros
Un resumen de cinco nmeros compuesto por:
Tipo de Distribucin