Вы находитесь на странице: 1из 13

MEDIDAS DESCRIPTIVAS

ESTADSTICA I
AUTOR: Patricia Castillo Garzn
NDICE
NDICE


1. Medidas de localizacin
1.1. Cuartiles
1.2. Percentiles
2. Medidas de dispersin
2.1. El rango
2.2. La varianza
2.2.1. Datos sin agrupar
2.2.2. Datos agrupados
2.3. La desviacin estndar Acceso rpido
2.4. Coeficiente de variacin
2.4.1. Ejercicio de aplicacin


DESARROLLO


GLOSARIO REFERENCIAS


Este material pertenece al Politcnico
Grancolombiano y a la Red Ilumno. Por ende, son
de uso exclusivo de las Instituciones adscritas a
la Red Ilumno. Prohibida su reproduccin total
o parcial.
02 -

DESARROLLO DE CADA UNA DE LAS UNIDADES TEMTICAS

1. Medidas de localizacin

1.1. Cuartiles

Adems de las medidas de tendencia central (media, mediana, moda), existen otras medias que
determinan la ubicacin de los datos dividiendo un conjunto de observaciones en partes iguales.
Estas medidas son los cuartiles y los percentiles.

Smbolo



Figura 1. Cuartiles en Excel
Fuente: (elaboracin propia)

De las medidas de tendencia central recuerde que la mediana es el valor que est en el centro
de los datos; de tal manera que el 50% de los valores ms pequeos son menores o iguales a la
mediana y el 50% de los valores ms grandes son mayores o iguales a la mediana. As como la
mediana divide los datos en dos partes iguales, los tres cuartiles (Q1, Q2 y Q3) dividen los valores
ordenados en cuatro partes iguales.

Los cuartiles se denotan usualmente como Q1, Q2, Q3

Cuando los datos estn en una tabla de distribucin de frecuencias, los cuartiles se pueden
calcular en una forma similar a la mediana, en datos agrupados, siguiendo los siguientes pasos:

Encuentre las frecuencias absolutas acumuladas.



Con base en la frecuencia absoluta acumulada ubique el intervalo donde est el k-simo cuartil,
Q1, el primer cuartil, supera al 25% de los datos ordenados y es superado por el 75%
es decir
Q2, el segundo cuartil es la mediana

Q3, el tercer cuartil es el valor por debajo del cual se encuentra el 75% de las observaciones. Compare el valor de con la frecuencia absoluta acumulada hasta obtener la
menor frecuencia acumulada que lo contiene.
Para el clculo de los cuartiles en datos sin agrupar se pueden utilizar diferentes programas de
cmputo; si trabajamos en Excel, con la funcin fx, estadstica, por ejemplo para los siguientes
datos: 12, 15, 22, 28, 31, 34, 35, 38, tendramos:

3 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 4


Aplique la siguiente frmula: De acuerdo con los pasos definidos para el clculo de los cuartiles:

En esta tabla ya estn calculadas las frecuencias acumuladas

Calculamos el valor , como k= 1 entonces queda



Al comparar el valor de 12,5 con las frecuencias acumuladas, se observa que el valor est
en donde:
contenido en el segundo grupo con una frecuencia acumulada de 13.

Li = lmite inferior del grupo en donde se ubica Reemplazamos en la frmula:

N i-1= frecuencia absoluta acumulada en el grupo anterior a donde est ubicado


ni = frecuencia del intervalo donde est

C = amplitud del intervalo

Ejemplo El 25% de los estudiantes con menores puntajes obtienen un valor mximo de 39,44

Los siguientes datos representan los puntajes obtenidos por un grupo de estudiantes en una De manera similar para el cuartil tres Q3
prueba de aptitud.
Tabla 2. Distribucin de frecuencias (tercer cuartil)
Tabla 1. Distribucin de frecuencia. (Puntajes)


Fuente: (elaboracin propia)

Fuente: (elaboracin propia)

5 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 6


1. En este caso se ubica el grupo del cuartil con Por ejemplo para los datos 12, 15, 22, 28, 31, 34, 35, 38 tenemos:

Percentil 30 22,6
Percentil 65 32,65
Percentil 90 35,9

Cuando los datos estn agrupados en una tabla de frecuencia se calculan con la siguiente
frmula
Q3 = 50+7,85

Q3 = 57,85

El 75% de los estudiantes con menores puntajes obtienen un puntaje mximo de 57,85%

1.2. Percentiles Para aplicar la formula, como en el caso de los cuartiles, primero se ubica el grupo o intervalo
que contiene al percentil con el valor.
Smbolo
Este valor se compara con las frecuencias acumuladas Nj, y luego se aplica la formula como se
muestra en el siguiente ejemplo:

Calcular el percentil 62 P62



Grupo del percentil con k=62
Los percentiles dividen los datos ordenados en cien partes iguales, cuando los datos estn sin
agrupar se pueden manejar utilizando la funcin fx estadstica: Tabla 3. Distribucin de frecuencias (percentil)



Figura 2. Percentiles en Excel Fuente: (elaboracin propia)
Fuente: (elaboracin propia)

7 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 8


En la frmula: Cuando se mostr el ejemplo de la media para datos sin agrupar, se usaron dos grupos de
personas en el que la edad promedio era de 20 aos:



Aunque la media de los dos grupos es igual, si se observa la distancia que hay entre los datos del
grupo A, con respecto a la media, se puede decir que entre 18 y 20 hay 2 unidades, entre 19 y
20 hay 1 unidad, etc. Para el segundo grupo, el B, las diferencias son 16 unidades entre 4 y 20, 5
unidades entre 5 y 20 1 etc. Esto quiere decir que las distancias que hay de los datos del
segundo grupo son mayores que las del primero. Esta situacin nos indica que una medida de
Este valor indica que el 62% de las personas con menores puntajes tienen un valor mximo de
tendencia central no es suficiente para la descripcin completa de una serie de datos. Entonces,
49,47.
existe la necesidad de encontrar una medida que mida la distancia, variacin o dispersin de los
datos con respecto a la media.
2. Medidas de dispersin
Las medidas de dispersin son las que miden la agrupacin o dispersin de los datos con
La media o promedio de los datos como medida de tendencia central pretende ser un valor respecto a la media. Las medidas de dispersin son el rango, la varianza y la desviacin estndar
representativo de ellos. Al describir informacin es necesario acompaar esta medida de una (medidas absolutas) y el coeficiente de variacin (variacin relativa)
que muestre qu tanta dispersin o variacin tienen los datos con respecto a esta medida de
tendencia central; para esto contamos con las medidas de dispersin, tales como la varianza, la
desviacin estndar y el coeficiente de variacin que nos van a indicar hasta qu punto las
medidas de tendencia central son representativas.

Smbolos

9 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 10


2.1. El Rango

El rango es una medida de dispersin muy fcil de calcular. Esta medida se conoce tambin
como recorrido o amplitud y, como se mostr en los pasos para elaborar una tabla de
frecuencias, es la diferencia entre el valor mximo y el valor mnimo. Esta medida, aunque es
muy sencilla de calcular, no se emplea usualmente, pues no considera las variaciones de valores
intermedios y es muy sensible a los valores extremos. Esta medida se identifica con la letra R.

El rango de las edades en el grupo A es:



R = 22 - 18 = 4
Ejemplo con los datos del grupo A (X: edad):
Significa que la diferencia entre la edad de la persona mayor con respecto a la menor es de 4
aos. 18 19 20 21 22

Para el grupo B el rango es:

R = 65 4 = 61

En este caso, la diferencia entre la edad de la persona mayor con respecto a la menor es de 61
aos.

En el segundo ejemplo se ve que aunque el rango es sencillo de calcular es sensible a los valores
extremos.

2.2. La Varianza

Smbolo


La varianza es igual a 2 aos2
Observamos que al elevar al cuadrado la suma de las desviaciones de los datos con respecto a la
media, las unidades de la variable tambin quedan elevadas al cuadrado; as encontramos
2.2.1. Datos sin agrupar aos2. Es por esto que la varianza no tiene interpretacin. Para que la variable quede
nuevamente en las unidades originales, se extrae la raz cuadrada de la varianza, obteniendo
Por definicin la varianza es igual al promedio de las desviaciones al cuadrado; esto lo una nueva medida que manejamos ms adelante.
expresamos en la siguiente frmula:


11 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 12


Para el grupo B:


Las dos frmulas para la varianza dan el mismo resultado. Por facilidad de clculo se recomienda
la frmula del mtodo abreviado. Recuerde que son dos formas diferentes para llegar al mismo
resultado.

2.2.2. Datos agrupados



Para datos agrupados hacemos una pequea modificacin de la frmula, teniendo en cuenta la
Mtodo Abreviado frecuencia de ocurrencia ni.

La varianza se puede calcular utilizando una nueva expresin conocida como la frmula del Su frmula es:
mtodo abreviado:

Si la aplicamos a los datos del grupo A del ejemplo Ejemplo: Los siguientes datos representan el peso (kg) para un grupo de personas

Tabla 4. Clculo de la varianza (por definicin)


Fuente: (elaboracin propia)

13 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 14


2.3. La desviacin estndar


La desviacin estndar o desviacin tpica es la raz cuadrada positiva de la varianza:

Mtodo abreviado En el ejemplo en donde tenamos el peso de los 100 estudiantes, la desviacin estndar es:

Para datos agrupados, la frmula con el mtodo abreviado es:



La frmula de la varianza muestra que las unidades en las que se mide la variable siempre
Para calcular la varianza con esta frmula, agregamos a la tabla original dos columnas; una con quedan al cuadrado, es decir, si la variable se refiere a peso en kg, al calcular la varianza estar
el producto de la variable por la frecuencia, Xini y, la otra, con cada valor de la variable al dado el peso en kg al cuadrado. Es por esto que se utiliza la desviacin estndar como medida
cuadrado multiplicada por la frecuencia X2ni, de la siguiente forma: de dispersin, pues se expresa en las mismas unidades de la variable.
Tabla 5. Clculo de la varianza (mtodo abreviado) La desviacin estndar se interpreta como la variacin promedio de los datos con respecto a la
media; as, para el ejemplo, se dice que el peso de los estudiantes tiene una variacin de 2,92 kg
con respecto al peso promedio.

Observe que la desviacin estndar es la raz cuadrada de la varianza, independientemente de si


la varianza se obtuvo de datos agrupados o de datos originales. As, en el ejemplo para datos
originales sobre la edad de dos grupos de personas, tenemos que:


Fuente: (elaboracin propia)

La edad en el grupo A tiene una variacin promedio de 1,41 aos con respecto a la edad media,

mientras que en el grupo B la variacin promedio es de 25,99 aos con respecto a la edad media
o promedio, indicando que los datos en el grupo B tienen una mayor variacin o dispersin.

15 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 16


2.4. Coeficiente de variacin

Es una medida relativa de dispersin de gran utilidad cuando las variables a comparar no estn
en las mismas unidades. Por ejemplo, cuando se quiere comparar la variabilidad del ingreso per
cpita de Colombia ($) y de Estados Unidos ($US).


Los datos son heterogneos por lo que la media no es representativa; en este caso es mejor
caracterizar el grupo con la mediana y no con la media. Recuerde que la mediana es el valor que
ocupa la posicin central de los datos ordenados:

Para la interpretacin del coeficiente de variacin en este mdulo se va a tener en cuenta lo
siguiente:

La edad mxima para el 50% de las personas con menor edad es de 5,5 aos.

2.5. Ejercicio de aplicacin

Use lo aprendido en clase y lo revisado en los libros sugeridos (bibliografa) para completar las
siguientes frases.

a. Para calcular la desviacin estndar, debo _____________________si conozco la varianza.

b. En datos originales, para calcular la desviacin estndar a partir de los valores de las

observaciones originales, debo sumar______________________________, posteriormente
Si los datos son heterogneos o son muy dispersos, es decir, existen valores extremos, y por lo dividir por ________________ y enseguida _________________. Este procedimiento del clculo
tanto la media deja de ser una medida representativa, es mejor, en estos casos, describir los de la desviacin estndar es a partir de la definicin.
datos con otra medida de tendencia central, que puede ser la mediana o la moda.
c. En datos originales, para calcular la desviacin estndar a partir de los valores de las
Si se sigue trabajando con el ejemplo de la edad, en el grupo A en donde: observaciones, usando el mtodo abreviado, debo sumar _________________ dividir por
____________ a este resultado debo restarle el cuadrado de _______ ___________ y
finalmente ________________.

d. Para comparar el grado de variabilidad de dos grupos o ms de observaciones se debe utilizar


el __________________________________, que se obtiene dividiendo la
_______________________ por la _______________________.
Los datos son homogneos y, por lo tanto, la media es una medida representativa. e. La varianza o la desviacin estndar nunca asumen valores_______________.

17 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 18


f. La suma de los cuadrados de cada observacin debe ser ______________ a la suma de las Cul de los dos grupos tiene mayor variabilidad absoluta?
observaciones al cuadrado.
a. El grupo A b. El grupo B
g. Para diferenciar los parmetros de los estadgrafos, los parmetros se simbolizan con letras
del __________________________ y los estadgrafos con letras del ____________________. c. Los datos son incorrectos d. No se puede obtener

2. A continuacin se presentan los datos de una muestra de la tasa de produccin diaria de Margarita utiliza dos medios de transporte para ir de su casa a la oficina: transporte pblico y su
automviles de cierta marca: automvil particular. A continuacin se registran los tiempos, en minutos, de sus traslados en
cada uno de estos medios.
17 21 18 27 17 21 20 22 18 23 18 19
Tabla 7. Tiempos de desplazamiento
El gerente de produccin de la compaa siente que una desviacin estndar de ms de tres
carros indica variaciones de tasas de produccin inaceptables. Debera preocuparse por las
tasas de produccin de la compaa?

En la cadena radial "La Z" se acostumbra a que los radioescuchas llamen para opinar sobre el
tema del da. Se registraron los siguientes tiempos de espera, en minutos, hasta el momento de
salir al aire.

Tabla 6. Tiempos de espera


Fuente: (elaboracin propia)

Calcular el tiempo promedio empleado por cada medio de transporte.

Calcular la desviacin estndar de los tiempos en cada medio de transporte.

Con base en los resultados de los tems a y b, qu medio de transporte debe preferir
Margarita?
Fuente: (elaboracin propia)

Explique sus razones.


Calcule e interprete la varianza (utilice el mtodo abreviado).

Calcule e interprete la desviacin estndar.


Calcule e interprete el coeficiente de variacin.

4. Si se tienen dos grupos A y B de los cuales se han obtenido los siguientes resultados:


A: n = 100 media = 28 2 = 36

B: n = 50 media = 15 2 = 25

19 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 20


03 -

GLOSARIO DE TRMINOS REFERENCIAS


04
Coeficiente de variacin: es el cociente entre la desviacin estndar y la media aritmtica. Lind, D., Marshal, W. y Wathen, S. (2012). Estadstica aplicada a los negocios y la
Usualmente se expresa en porcentaje. economa. Mxico: Mc Graw Hill.

Cuartil: medida de localizacin que divide los datos en cuatro grupos. Martinez, C. (2002). Estadstica y Muestreo. Bogot: ECOE Ediciones.
Newbold, P. (2008). Estadstica para los negocios y la economa. Mxico: Editorial
Desviacin tpica: medida positiva que mide la dispersin de los datos. Prentice Hall.
Mediana: es el valor de la variable que supera a la mitad de las mediciones y, por tanto, es Triola, M. (2013). Estadstica. Mxico: Pearson.
superado por la otra mitad de mediciones.

Moda: de un conjunto de datos es el valor de la variable que ms se repite, el que presenta la
mayor frecuencia.

Percentil: medida que divide los datos en 100 partes iguales.

Varianza: es el promedio de las desviaciones al cuadrado con respecto a la media aritmtica.

21 POLITCNICO GRANCOLOMBIANO ESTADSTICA I 22


POLITCNICO GRANCOLOMBIANO - 2016

Вам также может понравиться