Академический Документы
Профессиональный Документы
Культура Документы
ESTADSTICA I
AUTOR: Patricia Castillo Garzn
NDICE
NDICE
1. Medidas de localizacin
1.1. Cuartiles
1.2. Percentiles
2. Medidas de dispersin
2.1. El rango
2.2. La varianza
2.2.1. Datos sin agrupar
2.2.2. Datos agrupados
2.3. La desviacin estndar Acceso rpido
2.4. Coeficiente de variacin
2.4.1. Ejercicio de aplicacin
DESARROLLO
GLOSARIO REFERENCIAS
Este material pertenece al Politcnico
Grancolombiano y a la Red Ilumno. Por ende, son
de uso exclusivo de las Instituciones adscritas a
la Red Ilumno. Prohibida su reproduccin total
o parcial.
02 -
1. Medidas de localizacin
1.1. Cuartiles
Adems de las medidas de tendencia central (media, mediana, moda), existen otras medias que
determinan la ubicacin de los datos dividiendo un conjunto de observaciones en partes iguales.
Estas medidas son los cuartiles y los percentiles.
Smbolo
Figura 1. Cuartiles en Excel
Fuente: (elaboracin propia)
De las medidas de tendencia central recuerde que la mediana es el valor que est en el centro
de los datos; de tal manera que el 50% de los valores ms pequeos son menores o iguales a la
mediana y el 50% de los valores ms grandes son mayores o iguales a la mediana. As como la
mediana divide los datos en dos partes iguales, los tres cuartiles (Q1, Q2 y Q3) dividen los valores
ordenados en cuatro partes iguales.
Los cuartiles se denotan usualmente como Q1, Q2, Q3
Cuando los datos estn en una tabla de distribucin de frecuencias, los cuartiles se pueden
calcular en una forma similar a la mediana, en datos agrupados, siguiendo los siguientes pasos:
Q3, el tercer cuartil es el valor por debajo del cual se encuentra el 75% de las observaciones. Compare el valor de con la frecuencia absoluta acumulada hasta obtener la
menor frecuencia acumulada que lo contiene.
Para el clculo de los cuartiles en datos sin agrupar se pueden utilizar diferentes programas de
cmputo; si trabajamos en Excel, con la funcin fx, estadstica, por ejemplo para los siguientes
datos: 12, 15, 22, 28, 31, 34, 35, 38, tendramos:
Aplique la siguiente frmula: De acuerdo con los pasos definidos para el clculo de los cuartiles:
ni = frecuencia del intervalo donde est
C = amplitud del intervalo
Ejemplo El 25% de los estudiantes con menores puntajes obtienen un valor mximo de 39,44
Los siguientes datos representan los puntajes obtenidos por un grupo de estudiantes en una De manera similar para el cuartil tres Q3
prueba de aptitud.
Tabla 2. Distribucin de frecuencias (tercer cuartil)
Tabla 1. Distribucin de frecuencia. (Puntajes)
Fuente: (elaboracin propia)
Fuente: (elaboracin propia)
1. En este caso se ubica el grupo del cuartil con Por ejemplo para los datos 12, 15, 22, 28, 31, 34, 35, 38 tenemos:
Percentil 30 22,6
Percentil 65 32,65
Percentil 90 35,9
Cuando los datos estn agrupados en una tabla de frecuencia se calculan con la siguiente
frmula
Q3 = 50+7,85
Q3 = 57,85
El 75% de los estudiantes con menores puntajes obtienen un puntaje mximo de 57,85%
1.2. Percentiles Para aplicar la formula, como en el caso de los cuartiles, primero se ubica el grupo o intervalo
que contiene al percentil con el valor.
Smbolo
Este valor se compara con las frecuencias acumuladas Nj, y luego se aplica la formula como se
muestra en el siguiente ejemplo:
Figura 2. Percentiles en Excel Fuente: (elaboracin propia)
Fuente: (elaboracin propia)
En la frmula: Cuando se mostr el ejemplo de la media para datos sin agrupar, se usaron dos grupos de
personas en el que la edad promedio era de 20 aos:
Aunque la media de los dos grupos es igual, si se observa la distancia que hay entre los datos del
grupo A, con respecto a la media, se puede decir que entre 18 y 20 hay 2 unidades, entre 19 y
20 hay 1 unidad, etc. Para el segundo grupo, el B, las diferencias son 16 unidades entre 4 y 20, 5
unidades entre 5 y 20 1 etc. Esto quiere decir que las distancias que hay de los datos del
segundo grupo son mayores que las del primero. Esta situacin nos indica que una medida de
Este valor indica que el 62% de las personas con menores puntajes tienen un valor mximo de
tendencia central no es suficiente para la descripcin completa de una serie de datos. Entonces,
49,47.
existe la necesidad de encontrar una medida que mida la distancia, variacin o dispersin de los
datos con respecto a la media.
2. Medidas de dispersin
Las medidas de dispersin son las que miden la agrupacin o dispersin de los datos con
La media o promedio de los datos como medida de tendencia central pretende ser un valor respecto a la media. Las medidas de dispersin son el rango, la varianza y la desviacin estndar
representativo de ellos. Al describir informacin es necesario acompaar esta medida de una (medidas absolutas) y el coeficiente de variacin (variacin relativa)
que muestre qu tanta dispersin o variacin tienen los datos con respecto a esta medida de
tendencia central; para esto contamos con las medidas de dispersin, tales como la varianza, la
desviacin estndar y el coeficiente de variacin que nos van a indicar hasta qu punto las
medidas de tendencia central son representativas.
Smbolos
2.1. El Rango
El rango es una medida de dispersin muy fcil de calcular. Esta medida se conoce tambin
como recorrido o amplitud y, como se mostr en los pasos para elaborar una tabla de
frecuencias, es la diferencia entre el valor mximo y el valor mnimo. Esta medida, aunque es
muy sencilla de calcular, no se emplea usualmente, pues no considera las variaciones de valores
intermedios y es muy sensible a los valores extremos. Esta medida se identifica con la letra R.
R = 65 4 = 61
En este caso, la diferencia entre la edad de la persona mayor con respecto a la menor es de 61
aos.
En el segundo ejemplo se ve que aunque el rango es sencillo de calcular es sensible a los valores
extremos.
2.2. La Varianza
Smbolo
La varianza es igual a 2 aos2
Observamos que al elevar al cuadrado la suma de las desviaciones de los datos con respecto a la
media, las unidades de la variable tambin quedan elevadas al cuadrado; as encontramos
2.2.1. Datos sin agrupar aos2. Es por esto que la varianza no tiene interpretacin. Para que la variable quede
nuevamente en las unidades originales, se extrae la raz cuadrada de la varianza, obteniendo
Por definicin la varianza es igual al promedio de las desviaciones al cuadrado; esto lo una nueva medida que manejamos ms adelante.
expresamos en la siguiente frmula:
Para el grupo B:
Las dos frmulas para la varianza dan el mismo resultado. Por facilidad de clculo se recomienda
la frmula del mtodo abreviado. Recuerde que son dos formas diferentes para llegar al mismo
resultado.
La varianza se puede calcular utilizando una nueva expresin conocida como la frmula del Su frmula es:
mtodo abreviado:
Si la aplicamos a los datos del grupo A del ejemplo Ejemplo: Los siguientes datos representan el peso (kg) para un grupo de personas
Fuente: (elaboracin propia)
Mtodo abreviado En el ejemplo en donde tenamos el peso de los 100 estudiantes, la desviacin estndar es:
La frmula de la varianza muestra que las unidades en las que se mide la variable siempre
Para calcular la varianza con esta frmula, agregamos a la tabla original dos columnas; una con quedan al cuadrado, es decir, si la variable se refiere a peso en kg, al calcular la varianza estar
el producto de la variable por la frecuencia, Xini y, la otra, con cada valor de la variable al dado el peso en kg al cuadrado. Es por esto que se utiliza la desviacin estndar como medida
cuadrado multiplicada por la frecuencia X2ni, de la siguiente forma: de dispersin, pues se expresa en las mismas unidades de la variable.
Tabla 5. Clculo de la varianza (mtodo abreviado) La desviacin estndar se interpreta como la variacin promedio de los datos con respecto a la
media; as, para el ejemplo, se dice que el peso de los estudiantes tiene una variacin de 2,92 kg
con respecto al peso promedio.
Fuente: (elaboracin propia)
La edad en el grupo A tiene una variacin promedio de 1,41 aos con respecto a la edad media,
mientras que en el grupo B la variacin promedio es de 25,99 aos con respecto a la edad media
o promedio, indicando que los datos en el grupo B tienen una mayor variacin o dispersin.
Es una medida relativa de dispersin de gran utilidad cuando las variables a comparar no estn
en las mismas unidades. Por ejemplo, cuando se quiere comparar la variabilidad del ingreso per
cpita de Colombia ($) y de Estados Unidos ($US).
Los datos son heterogneos por lo que la media no es representativa; en este caso es mejor
caracterizar el grupo con la mediana y no con la media. Recuerde que la mediana es el valor que
ocupa la posicin central de los datos ordenados:
Para la interpretacin del coeficiente de variacin en este mdulo se va a tener en cuenta lo
siguiente:
La edad mxima para el 50% de las personas con menor edad es de 5,5 aos.
Use lo aprendido en clase y lo revisado en los libros sugeridos (bibliografa) para completar las
siguientes frases.
b. En datos originales, para calcular la desviacin estndar a partir de los valores de las
observaciones originales, debo sumar______________________________, posteriormente
Si los datos son heterogneos o son muy dispersos, es decir, existen valores extremos, y por lo dividir por ________________ y enseguida _________________. Este procedimiento del clculo
tanto la media deja de ser una medida representativa, es mejor, en estos casos, describir los de la desviacin estndar es a partir de la definicin.
datos con otra medida de tendencia central, que puede ser la mediana o la moda.
c. En datos originales, para calcular la desviacin estndar a partir de los valores de las
Si se sigue trabajando con el ejemplo de la edad, en el grupo A en donde: observaciones, usando el mtodo abreviado, debo sumar _________________ dividir por
____________ a este resultado debo restarle el cuadrado de _______ ___________ y
finalmente ________________.
f. La suma de los cuadrados de cada observacin debe ser ______________ a la suma de las Cul de los dos grupos tiene mayor variabilidad absoluta?
observaciones al cuadrado.
a. El grupo A b. El grupo B
g. Para diferenciar los parmetros de los estadgrafos, los parmetros se simbolizan con letras
del __________________________ y los estadgrafos con letras del ____________________. c. Los datos son incorrectos d. No se puede obtener
2. A continuacin se presentan los datos de una muestra de la tasa de produccin diaria de Margarita utiliza dos medios de transporte para ir de su casa a la oficina: transporte pblico y su
automviles de cierta marca: automvil particular. A continuacin se registran los tiempos, en minutos, de sus traslados en
cada uno de estos medios.
17 21 18 27 17 21 20 22 18 23 18 19
Tabla 7. Tiempos de desplazamiento
El gerente de produccin de la compaa siente que una desviacin estndar de ms de tres
carros indica variaciones de tasas de produccin inaceptables. Debera preocuparse por las
tasas de produccin de la compaa?
En la cadena radial "La Z" se acostumbra a que los radioescuchas llamen para opinar sobre el
tema del da. Se registraron los siguientes tiempos de espera, en minutos, hasta el momento de
salir al aire.
Fuente: (elaboracin propia)
Con base en los resultados de los tems a y b, qu medio de transporte debe preferir
Margarita?
Fuente: (elaboracin propia)
Calcule e interprete el coeficiente de variacin.
4. Si se tienen dos grupos A y B de los cuales se han obtenido los siguientes resultados:
A: n = 100 media = 28 2 = 36
B: n = 50 media = 15 2 = 25
04
Coeficiente de variacin: es el cociente entre la desviacin estndar y la media aritmtica. Lind, D., Marshal, W. y Wathen, S. (2012). Estadstica aplicada a los negocios y la
Usualmente se expresa en porcentaje. economa. Mxico: Mc Graw Hill.
Cuartil: medida de localizacin que divide los datos en cuatro grupos. Martinez, C. (2002). Estadstica y Muestreo. Bogot: ECOE Ediciones.
Newbold, P. (2008). Estadstica para los negocios y la economa. Mxico: Editorial
Desviacin tpica: medida positiva que mide la dispersin de los datos. Prentice Hall.
Mediana: es el valor de la variable que supera a la mitad de las mediciones y, por tanto, es Triola, M. (2013). Estadstica. Mxico: Pearson.
superado por la otra mitad de mediciones.
Moda: de un conjunto de datos es el valor de la variable que ms se repite, el que presenta la
mayor frecuencia.