Вы находитесь на странице: 1из 6

Estadstica I Prof.

Edmundo Pea Rozas

1 Medidas de Dispersin

Las medidas de tendencia central entregan una medida respecto del valor central, promedio o ms frecuente de un conjunto de datos, sin embargo, si bien es cierto esta informacin es muy importante al momento de describir un fenmeno, no es suficiente por cuanto adems de saber cul es el valor central de la distribucin, es necesario saber tambin que tan dispersos estn respecto de ese valor central. Dicho de otra manera, es necesario tener una medida del grado de variabilidad que presentan los datos. Las medidas de dispersin proveen de una medida del grado de variabilidad de los datos respecto de un valor central. Dentro de las medidas de dispersin ms conocidas se tiene: Rango Varianza Desviacin Estndar Rango o Recorrido El rango o recorrido es el estadgrafo de dispersin ms simple, pero tambin el menos eficiente por cuanto solo considera las dos observaciones de los extremos y no proporcionado en torno de un valor central. Adems presenta otra deficiencia importante por cuanto si en la distribucin existen valores extremos demasiado exagerados, esto afectar directamente el resultado que arroje el estadgrafo. Si los datos no estn agrupados, el recorrido se calcula de acuerdo a la siguiente expresin:

R x = x mx x mn
Si los datos se encuentran agrupados en una tabla intervalos, el clculo del Recorrido se realiza de la siguiente manera:

Rx = L0 Lk
donde L0 es el lmite inferior del primer intervalo es el lmite superior del ltimo intervalo

Lk
Varianza

La varianza es un estadgrafo de dispersin que se encuentra asociado a la media aritmtica, entregando una medida respecto de la dispersin de los datos en torno de la media, razn por la cual es el estadgrafo de dispersin ms ampliamente utilizado. Al igual que en el caso de la media aritmtica, es necesario distinguir entre la media poblacional y la muestral, de tal manera que se la media y la varianza segn sea el caso se denotan como Poblacin Muestra N n x
2
s2

Tamao Media Varianza

07/04/2013

Estadstica I Prof. Edmundo Pea Rozas

La varianza se define como el promedio de las diferencias al cuadrado de las observaciones respecto de su media aritmtica, de tal manera que mientras mayor sea la dispersin de las observaciones, mayor ser la magnitud de sus desviaciones respecto de la media aritmtica y por lo tanto mayor ser la varianza. De acuerdo a la definicin anterior, la varianza poblacional se calcula como: Datos no Agrupados
2 ( xi ) n 2 2 xi ( xi ) / N i =1 n N n

=
2

i =1

o equivalentemente

=
2

i =1

=
2

i =1

xi N

Datos Agrupados
2 =
i =1 2 ( xi ) f i k

o equivalentemente

2 =

i =1

2 2 xi f i ( xi f i ) / N i =1

2 =

i =1

2 xi f i

Si los datos disponibles corresponden a una muestra, la varianza muestral se calcula de la siguiente manera: Datos no Agrupados

s2 =

i =1

( x i x) 2
n 1

o equivalentemente

s2 =

i =1

x i2 ( x i ) 2 / n
i =1

n 1

Datos Agrupados
s2 =
i =1 2 ( x i x) f i k _

n 1

o equivalentemente

s2 =

i =1

2 2 xi f i ( xi f i ) / n i =1

n 1

Se puede observar que la suma de las diferencias al cuadrado de las observaciones respecto de la media en el caso de la varianza poblacional es dividida por N, en tanto que en el caso de la muestra, la divisin es por n-1. Esta diferencia se debe a que matemticamente se ha demostrado que la expresin entregada para la varianza muestral provee de un estimador con mejores propiedades matemticas que si el divisor fuera n. Por otra parte, se debe tener en cuenta que desde el punto de vista de los clculos, a medida que aumenta el tamao de la muestra, la diferencia en la estimacin de la varianza con uno u otro denominador se reduce progresivamente. Al igual que la media aritmtica, la varianza tiene una serie de propiedades: 1. La varianza es un valor mayor o igual a cero.
V [x ] 0

2. La varianza de una constante es cero.

V [cte] = 0

3. La varianza de una variable ms una constante, es la varianza de la variable.

07/04/2013

Estadstica I Prof. Edmundo Pea Rozas

V [cte + x ] = V [x]

4. La varianza del producto de una variable por una constante es el cuadrado de la constante multiplicado por la varianza de la variable.

V [cte x] = cte 2 V [x ]

5. De las anteriores se desprende:

2 V [cte1 x + cte 2 ] = cte1 V [x ]

Desviacin Estndar Como la varianza entrega una medida de la dispersin de los datos respecto de la media en una unidad de medida distinta a la de los datos, lo cual complica su interpretacin, es que se recurre a la desviacin estndar, la cual es otra que la raz cuadrada de la varianza.
= 2 y s=

s2

Ejemplo: Consideremos las siguientes observaciones correspondientes a las ventas diarias (en UF) de una pequea empresa durante 40 das 90 108 80 95
n

75 83 91 54
40

61 74 59 76

59 72 77 66

63 102 104 51

73 61 75 64

88 64 56 67

65 58 94 76

58 99 74 63

61 88 67 79

x=

xi
i =1

n
n i =1

xi x1 + x2 + ... + xn 90 + 75 + 61 + ... + 76 + 63 + 79 2970 i =1 = = = = = 74.250UF n 40 40 40


_ 2 i

s2 =
s2 =

( x x)
n 1
n 2 i i =1 n

(90 74.250)2 + (75 74.250) 2 + ... + (79 74.250) 2 = 225.987UF 2 s = 15.033UF 40 1


=

229336 (2970)2 40 229336 220522.500 8813.500 = = = 225.987UF 2 s = 15.033UF n 1 40 1 40 1 39 Si los datos anteriores, en lugar de pertenecer a una muestra correspondiesen a la totalidad de la poblacin, tendramos:
i =1

( xi )2 / n

=
2

(x )
i =1 i

N
N n

(90 74.250) 2 + (75 74.250) 2 + ... + (79 74.250) 2 = = 220.338UF 2 s = 14.844UF 40


229336 (2970) 2 40 229336 220522.500 8813.500 = = = 220.338UF 2 s = 14.844UF 40 40 40

2 =

x
i =1

2 i

( xi ) 2 / n
i =1

La siguiente tabla de distribucin de frecuencias, contiene de manera resumida las observaciones anteriores

07/04/2013

Estadstica I Prof. Edmundo Pea Rozas

4
Li

Li 1
50 60 70 80 90 100

xi
55 65 75 85 95 105

fi
7 11 10 4 5 3 40

xi fi
385 715 750 340 475 315 2980

xi2 f i
21175 46475 56250 28900 45125 33075 231000

( xi x ) 2
380.250 90.250 0.250 110.250 420.250 930.250

( xi x ) 2 f i
2661.750 992.750 2.500 441.000 2101.250 2790.750 8990.000

60 70 80 90 100 110

Si consideramos estos datos como una muestra:

x=

xi fi
i =1

n
k i =1 i

x f + x f + ... + xk f k = 1 1 2 2 = n
_ 2

x f
i =1 i

40

55 ( 7 ) + 65 (11) + ... + 105 ( 3) 40

2980 = 74.500UF 40

s =
2

( x x)
n 1
k

fi
k

8990 = 230.513UF 2 40 1

s2 =

xi2 fi ( xi fi )2 / n
i =1

n 1

i =1

231000 (2980) 2 40 231000 222010 8990 = = = 230.513UF 2 40 1 40 1 39

Si los consideramos como la poblacin total:

=
2

(x )
i =1 i

fi

N
k k i =1 i =1

8990 = 224.750UF 2 40

2 =

xi2 fi ( xi fi )2 / N
N

231000 (2980) 2 40 231000 222010 8990 = = = 224.750UF 2 40 40 40


Coeficiente de Variacin

De acuerdo a lo visto anteriormente, las medidas de tendencia central, de posicin y de dispersin, nos entregan importante informacin sobre las caractersticas de la poblacin o de la muestra bajo estudio. Las medidas vistas hasta la fecha, en conjunto nos permiten realizar la comparacin de dos o ms poblaciones distintas pero siempre y cuando se trate de la misma variable. Por ejemplo, si estamos analizando la produccin de celulosa proveniente de dos plantas de la Regin del Bo Bo, los estadgrafos vistos anteriormente resultarn de utilidad para comparar ambas plantas. Es posible comparar la variabilidad que existe en la produccin de ambas plantas. Pero si lo que se desea es, comparar el peso y la edad del ganado, tenemos que tanto la media como la desviacin estndar no se encuentran en la misma escala de medida, en kilogramos para el peso, y aos para la edad. En este caso, comparar la variabilidad entre ambas variables no tiene ningn sentido porque no se puede comparar kilogramos con aos. De igual manera, si las muestras o poblaciones fueron medidas en distintas unidades, las medidas de dispersin no son comparables a menos que se efecten las transformaciones pertinentes.
07/04/2013

Estadstica I Prof. Edmundo Pea Rozas

Por otra parte, si se desea comparar la variabilidad que existe entre el peso de las bateras de camin y de las ampolletas, aunque se encuentren en una misma unidad de medida, las diferencias que existen en peso son de tal envergadura que no tiene mucho sentido comparar directamente las respectivas desviaciones estndares. El coeficiente de variacin permite solucionar los problemas anteriores, debido a que este indicador de variablidad es un nmero puro que no posee unidad de medida, que tiene en cuenta la proporcin que existe entre media y desviacin estndar, debiendo ser calculada como:
CV x =

x x

CV x =

sx x

Aplicaciones del Coeficiente de Variacin Comparar la variabilidad de dos distribuciones de una misma variable con unidades distintas. Comparar la variabilidad de distribuciones de variables distintas. Comparar la variabilidad cuando los promedios son distintos. Ejemplo: Los alumnos que cursaron la asignatura de Bioestadstica obtuvieron los siguientes rendimientos acadmicos en sus dos evaluaciones solemnes: 1 Solemne 2 Solemne 4.1 4.8 0.96 1.03 En cul de las dos evaluaciones los alumnos obtuvieron un resultado ms homogneo?
CV Solemne1 = 0.96 = 0.23 4.1

CV Solemne 2 =

1.03 = 0.21 4.8

Como el coeficiente de variacin de la primera prueba solemne es mayor que el de la segunda solemne, se puede afirmar que en la segunda evaluacin, los alumnos obtuvieron un resultado ms homogneo, debido a que el grado de dispersin respecto del promedio en la primera solemne fue de un 23% mientras que en la segunda fue de 21%. Otras Medidas de Dispersin Recorrido Intercuartlico Cuando se vio el rango, se seal que ste era muy influenciable por los valores extremos Para eliminar la influencia de los valores extremos se puede calcular el recorrido pero obviando los valores extremos, es decir, considerando los valores intermedios de la distribucin. Esto se obtiene calculando el rango o recorrido intercuartlico, el cual no es ms que la diferencia entre el tercer y el primer cuartil.
RQ = Q3 Q1

Se debe tener en cuenta que: El recorrido intercuartlico considera el 50% central de los datos, de tal forma, que es perfectamente posible que los valores inferiores a Q1 o superiores a Q3 estn muy compactos o muy dispersos, y el valor del recorrido intercuartlico sera el mismo.
07/04/2013

Estadstica I Prof. Edmundo Pea Rozas

No es posible, conociendo solo RQ, hacer la ubicacin precisa de una observacin dentro de la distribucin. Al igual que la mediana, que es el segundo cuartil, no tiene propiedades que les permitan intervenir en las relaciones matemticas que utiliza la estadstica. Desviacin Media La desviacin media es una medida de dispersin bastante objetiva, es decir mientras ms dispersos estn los datos mayor es la desviacin media, pero no muestra si estn bajo x , ya que tomamos su valor absoluto. Datos no agrupados Datos tabulados
DM =
i =1

xi x
n

DM =

x x f
i =1 i

o equivalentemente

DM = xi x hi
i =1

07/04/2013

Вам также может понравиться