Вы находитесь на странице: 1из 9

Medidas Descriptivas

Medidas de Dispersión

Las Medidas de Dispersión nos van a dar una idea sobre la representatividad de las medidas
centrales, a mayor dispersión menor representatividad.
Hasta el momento, hemos estudiado los valores centrales de la distribución, pero también es
importante conocer si los valores en general están cerca o alejados de estos valores centrales, es
por lo que surge la necesidad de estudiar medidas de dispersión.

Las medidas de dispersión permiten evaluar la confiabilidad del promedio. Diremos que existe una
dispersión pequeña si los datos se encuentran acumulados cercanamente, en este caso la media
es muy representativa, en caso que la dispersión sea grande la media no es muy confiable.

Las medidas de dispersión nos permiten además apreciar cuan dispersas están dos o mas
distribuciones.

Las principales medidas de variabilidad que se emplean:


 El rango
 Rango intercuartil
 Varianza
 Desviación Estándar
 Coeficiente de variación

A.- Rango

Es la primera medida que vamos a estudiar, el rango de un conjunto de observaciones se tiene


restando el valor más bajo de un conjunto de observaciones del valor más alto. Lo notaremos
como R. Realmente no es una medida muy significativa e la mayoría de los casos, pero
indudablemente es muy fácil de calcular y sus unidades son las mismas que de las variables,
aunque posee varios inconvenientes:
 No utiliza todas las observaciones (solo dos de ella)
 Se puede ver muy afectada por alguna observación extrema;
 El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier
caso nunca disminuye.

Por lo tanto, está fuertemente influenciado por los datos extremos. Solo debe usarse cuando se
desea saber en forma inmediata la dispersión de los datos, sin ninguna precisión estadística.

A.1.- Para datos no agrupados

El rango es la diferencia entre el dato mayor y el dato menor, es decir:

1 Est. Sandra Cecilia Loaiza Chumacero


Medidas Descriptivas
Donde: R = rango
Xmax = dato mayor
Xmin = dato menor

Ejemplo 01: Para datos no agrupados.

Se tiene la edad de 15 pobladores de la comunidad del Pueblo Joven Santo Toribio de Mogrovejo

Edad
18 22 21 20 18
22 24 23 21 18
24 25 21 19 23

Para hallar el rango utilizando Excel, se ingresa las formulas en una celda como la muestra la figura
1.

Figura 1.

A.2.- Para datos agrupados

El rango es la diferencia entre el límite superior de la última clase y el límite inferior de la primera
clase. Así:

2 Est. Sandra Cecilia Loaiza Chumacero


Medidas Descriptivas

B.- Rango intercuartílico

Una medida única de dispersión es el rango recorrido intercuartílico, es la diferencia entre


el tercer cuartil y el primer cuartil. Es decir , P75  P25 . La mitad de las observaciones se
clasifican dentro de este rango. Consta del 50% de la mitad de las observaciones y corta
el 25% inferior y el 25% superior de los puntos de datos. Como resultado, el RIQ
proporciona una medida de dispersión que no está muy influenciada por unas cuantas
observaciones extremas. El rango intercuartílico se ilustra en el siguiente esquema:

Ejemplo:

Figura 2.

RIQ  3.5  4 años

El 50% central de la edad de los Pobladores se distribuye a una distancia de 4 años.

3 Est. Sandra Cecilia Loaiza Chumacero


Medidas Descriptivas

Ejemplo: Datos agrupados

Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Marca de


Marca de Número de
absoluta relativa relativa relativa relativa clase*frecuencia
clase personas
Edad acumulada simple acumulada simple% acumulada % absoluta simple

Yi
ni Ni hi Hi hi% Hi% Yini

[18 - 24) 21 21 21 0.124 0.124 12.426 12.426 441


Q1 [24 - 30) 27 49 70 0.290 0.414 28.994 41.420 1323
[30 - 36) 33 31 101 0.183 0.598 18.343 59.763 1023
[36 - 42) 39 25 126 0.148 0.746 14.793 74.556 975
Q3 [42 - 48) 45 19 145 0.112 0.858 11.243 85.799 855
[48 - 54) 51 19 164 0.112 0.970 11.243 97.041 969
[54 - 60) 57 1 165 0.006 0.976 0.592 97.633 57
[60 - 66) 63 4 169 0.024 1.000 2.367 100.000 252

Total 169 1 100 5895

126.75  126 
Q3  42  6  42.236  42 años
 145  126 

 42.25  21
Q1  24  6  26.602  27 años
 70  21 

RIQ  Q3  Q1  42  27  15 años

El 50% central de la edad de los Pobladores del pueblo joven Santo Toribio de Mogrovejo se
distribuye a una distancia de 15 años.

C.- Varianza

Es el estadígrafo de dispersión más importante y expresa el grado de dispersión de las


observaciones respecto a la media aritmética.

C.1.- Varianza poblacional

Miden la variación en una población. La varianza poblacional es la suma de las diferencias con
respecto a la media de la población elevada al cuadrado y dividida por el tamaño de la población
N.

4 Est. Sandra Cecilia Loaiza Chumacero


Medidas Descriptivas

C.2.- Varianza de una muestra

Miden la variación de los datos en una muestra.

Otra forma de expresar las formulas que facilitan los datos.

Datos No tabulados

5 Est. Sandra Cecilia Loaiza Chumacero


Medidas Descriptivas
Datos tabulados

D.- Desviación estándar o típica

Se define como la raíz cuadrada de la varianza. Es uno de los estadígrafos de dispersión de mayor
uso en el cual las unidades de la variable ya no están elevadas al cuadrado. La desviación estándar
al igual que la varianza es no negativa.

E.- Coeficiente de variación

Es el indicador relativo del grado de dispersión de los valores respecto de su promedio, el mismo
que esta expresado en tanto por ciento.

El valor de este indicador no está afectado por la unidad de medida, por lo tanto es útil para la
comparación en términos relativos del grado de concentración entorno a la media de dos
distribuciones distintas. En general cuando el coeficiente de variación es igual al 30% se dice que la
distribución es homogénea, si el valor es superior al 30% se considera que la distribución es
heterogénea o tiene alto grado de dispersión.

6 Est. Sandra Cecilia Loaiza Chumacero


Medidas Descriptivas
Ejemplo: datos no agrupados

Varianza

Figura 3.

Desviación Estándar

Figura 4.

Coeficiente de variación

Figura 5.

La media de las diferencias cuadráticas de las edades de los pobladores del pueblo joven Santo
Toribio de Mogrovejo respecto a la edad promedio es 5.3523 años2, la variabilidad de la edad es
2.3135 años. Y la desviación estándar de la edad representa el 10.88% de la edad promedio. El
bajo valor del coeficiente de variabilidad nos indica que no existe una gran dispersión en la edad
de los pobladores, por lo tanto los datos son homogéneos.

7 Est. Sandra Cecilia Loaiza Chumacero


Medidas Descriptivas
Ejemplo: datos agrupados

Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Marca de Marca de


Marca de Número de
absoluta relativa relativa relativa relativa clase*frecuencia clase^2*frecuencia
clase personas
Edad acumulada simple acumulada simple% acumulada % absoluta simple absoluta simple

Yi
ni Ni hi Hi hi% Hi% Yini Yi^2ni

[18 - 24) 21 21 21 0.124 0.124 12.426 12.426 441 9261


[24 - 30) 27 49 70 0.290 0.414 28.994 41.420 1323 35721
[30 - 36) 33 31 101 0.183 0.598 18.343 59.763 1023 33759
[36 - 42) 39 25 126 0.148 0.746 14.793 74.556 975 38025
[42 - 48) 45 19 145 0.112 0.858 11.243 85.799 855 38475
[48 - 54) 51 19 164 0.112 0.970 11.243 97.041 969 49419
[54 - 60) 57 1 165 0.006 0.976 0.592 97.633 57 3249
[60 - 66) 63 4 169 0.024 1.000 2.367 100.000 252 15876

Total 169 1 100 5895 223785

1  2 Yi ni  1  58952 
2
S2   i i      108.08115
n  168  169 
Y n 223785
n 1 

S  108.08115  10.396208

S 10.396208
CV  * 100  * 100  29.804228%
Y 34.882

La media de las diferencias cuadráticas de las edades de los pobladores del pueblo joven Santo
Toribio de Mogrovejo respecto a la edad promedio es 108. 08115 años2, la variabilidad de la edad
es 10.396208 años. Y la desviación estándar de la edad representa el 29.80% de la edad promedio.
El alto valor del coeficiente de variabilidad nos indica que existe una gran dispersión en la edad de
los pobladores.

8 Est. Sandra Cecilia Loaiza Chumacero


Medidas Descriptivas

La Regla Empírica

Es posible que dos conjuntos de datos distintos tengan el mismo rango pero difieran
considerablemente en el grado de variación de los datos. En consecuencia, el rango es una medida
relativamente insensible de la variación de los datos. La varianza tiene importancia teórica, pero es
difícil de interpretar porque las unidades de medición de la variable de interés están elevadas al
cuadrado. En cambio, las unidades de medición de la desviación estándar son las unidades de la
variable. Si la desviación estándar se combina con la media del conjunto de datos, resulta fácil
interpretarla.

Si el histograma asociado a unos datos de origen tiene la forma de una campana o de una joroba,
el conjunto de datos tendrá las siguientes características, lo que algunos libros se conocen como
Regla Empírica.

Si un conjunto de datos tiene una distribución aproximadamente simétrica se pueden utilizar las
siguientes reglas prácticas para describir el conjunto de datos


1.- Aproximadamente el 68% de los datos estará en el intervalo X  S , X  S 
2.- Aproximadamente el 95% de los datos estará en el intervalo X  2S , X  2S 
3.- Aproximadamente el 99% de los datos estará en el intervalo X  3S , X  3S 

9 Est. Sandra Cecilia Loaiza Chumacero

Вам также может понравиться