You are on page 1of 17

UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO

FACULTAD DE INGENIERIA GEOLOGICA Y METALURGICA


ESCUELA PROFESIONAL DE INGENIERIA GEOLOGICA

CURSO DE GEOESTADISTICA I
TEMA 6: MEDIDAS DE DISPERSION
Por: Ing. MSc. Roger Gonzales Aliaga

Puno, Marzo del 2012

MEDIDAS DE DISPERSION
1.
2.
3.
4.

Rango o recorrido
Varianza
Desviacin estndar
Coeficiente de variacin

MEDIDAS DE DISPERSION
Que es la dispersin?
La dispersin se refiere a la extensin de los datos, es decir al grado en que las
observaciones se distribuyen (o se separan).
La descripcin de un conjunto de datos no es completa citando solamente las medidas de
tendencia central (media, mediana y moda). Tambin es importante analizar las medidas de
dispersin que nos permiten determinar el grado en que los datos numricos tienden a
extenderse alrededor de un valor medio.
Cuando la medida de dispersin es alta con respecto a la escala en que se mide la variable,
entonces, los datos no se encuentran tan cercanos unos a otros. Si la medida de dispersin es
baja entonces los datos estn cercanos. Las principales medidas de dispersin son: el rango o
recorrido de la variable, la varianza y la desviacin estndar.
Son medidas que determinan en que forma se desvan o se dispersan los datos de una
muestra o poblacin con respecto a una medida de tendencia central (generalmente es con
respecto a la media aritmtica).
Las medidas de tendencia central proporcionan una descripcin incompleta de una
distribucin de datos. Puede haber dos distribuciones que tengan iguales uno o varios
promedios y ser completamente diferentes.

1. RANGO O RECORRIDO
Es la medida de dispersin ms fcil de calcular. Para datos finitos o sin agrupar, el rango se
define como la diferencia entre el valor ms alto (Xmax.) y el mas bajo (Xmin) en un conjunto
de datos.
Rango para datos no agrupados;
R = Xmx - Xmn
Ejemplo:
Se tienen los resultados geoqumicos de cinco muestras con contenido de Au en g/tn en
una veta de cuarzo: 18,23, 27,34 y 25. Para calcular el rango, se tiene que:
R = 34 -18 = 16 g/tn
Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos
de clases abiertos podemos aproximar el rango mediante el uso de los limites de clases.
Se aproxima el rango tomando el limite superior de la ltima clase menos el limite
inferior de la primera clase.
Rango para datos agrupados;
R= (limite superior de la clase n limite inferior de la clase n)
Cuanto ms grande es el rango, mayor ser la dispersin de los datos de una distribucin. Es
adecuada para medir la variacin de pequeos conjuntos de datos.

1. RANGO O RECORRIDO
Ejemplo:
Si se toman los datos de la tabla de distribucin de frecuencias siguiente, que pertenece a
una mina de Cu en %, el resultado del rango ser:
Clases
7.420 21.835

Xi

fi

14.628 10 0.33

21.835 36.250 29.043

0.13

36.250 50.665 43.458

0.17

50.665 65.080 57.873

0.10

65.080 79.495 72.288

0.10

79.495 93.910 86.703

0.17

Total

XXX

30 1.00

R= (limite superior de la clase limite inferior de la clase )


R= (93.910 7.420) = 86.49 %

fr

2. VARIANZA
Es la media aritmtica de los cuadrados de las desviaciones. Se denota por S2. Este valor
cuantifica el grado de dispersin o separacin de los valores de la distribucin con
respecto a la media aritmtica. A mayor dispersin mayor valor de la varianza, a menor
dispersin menor valor de la varianza. La idea de dispersin se relaciona con la mayor o
menor concentracin de los datos en torno a un valor central, generalmente la media
aritmtica.
- Para datos no agrupados: antes de aplicar la formula se calcula la media aritmtica y
luego se utiliza la siguiente formula .

2. VARIANZA
En el siguiente ejemplo calcular la varianza

2. VARIANZA
-Para datos agrupados: la varianza se basa en las diferencias entre la media aritmtica y
cada una de las puntuaciones. Es el promedio de los cuadrados de las distancias de las
observaciones a partir de la media (su valor nunca ser negativo).
Cuando se tiene los datos en una tabla de frecuencia, el calculo de la varianza se hace a
travs de la siguientes frmulas.

La frmula del clculo depender si la distribucin es de datos originales o agrupados,


as como de si se trabaja con poblaciones (se usa en el denominador N) o con una
muestra (se usa n-1).

2. VARIANZA
En la siguiente tabla de frecuencias hallar la varianza

3. DESVIACION ESTANDAR
Las desviacin estndar se designa por la letra S y se define como la raz cuadrada de la
varianza.
de manera simplificada
se utiliza la siguiente
formula
La desviacin estndar es mas usada que la varianza. Una de sus utilidades es medir la
concentracin de los datos respecto a la media aritmtica. Para distribuciones
normales. Expresa la cantidad de variabilidad promedio en una distribucin, ella nos
permite determinar cmo se distribuyen los valores en relacin con la media; su
frmula es indistinta para distribuciones de datos originales o agrupados.
Si tenamos 37,75 como resultado de la varianza en el ejemplo anterior, entonces la
desviacin estndar ser: S = 37,75; S = 6,14

4. COEFICIENTE DE VARIACION
Las medidas de dispersin que se han estudiado anteriormente son medidas absolutas
y se expresan en las mismas unidades con las que se mide la variable. Si se necesita
comparar dos o ms grupos de datos medidos con diferentes unidades, por lo general,
no es posible la comparacin utilizando la dispersin absoluta. Por ejemplo, una serie
de precios en dlares con una serie de precios en soles.
En algunos casos se utiliza la dispersin relativa, que viene dado por:

Esta medida hace referencia a la variabilidad relativa y relaciona la media con la


desviacin estndar. Tambin nos indica el porcentaje de variacin que existe con
respecto al valor promedio de la distribucin. Su frmula es igual para datos agrupados
y no agrupados.
Si en el caso particular de usar la desviacin estndar (S) como
dispersin absoluta y la media aritmtica ( X ), recibe el nombre
de coeficiente de variacin y su formula es la siguiente:

4. COEFICIENTE DE VARIACION
Este coeficiente permite comparar la variabilidad de diferentes muestras en una misma
variable la variabilidad existente entre variables diferentes. Una investigacin
experimental en el campo geolgico que tenga un CV menor al 10 %, muestra que en
el experimento hubo un muy buen control del error experimental entre las diferentes
repeticiones, sin embargo en procesos productivos industriales ste valor de
variabilidad en una variables de salida, sera muy alto, en general se aceptan valores
muy pequeos, inferiores al 1%.

5. EJEMPLO TIPO
Al medir las alturas de los perros en el vecindario (en milmetros):

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Entonces hay que calcular la media para datos no agrupados, la varianza y la desviacin
estndar.

5. EJEMPLO TIPO
RESPUESTA
600 + 470 + 170 + 430 + 300
Media =

1970
=

= 394
5

Entonces la altura media de los perros es 394 mm y vamos dibujar esto en el grafico.

Como vemos la lnea de color verde es la media grafica de las estaturas de los perros

5. EJEMPLO TIPO
Ahora calculamos la diferencia de altura con la media

Para calcular la varianza (datos no agrupados) se toma cada diferencia y se elvala al


cuadrado; y luego se obtiene la media:
2062 + 762 + (-224)2 + 362 + (-94)2
Varianza: 2 =

=
5

Entonces la varianza es 21, 704

108,520
= 21,704
5

5. EJEMPLO TIPO
Para calcular la desviacin estndar, sabemos que es la raz de la varianza, as que:
Desviacin estndar: = 21,704 = 147
Entonces la desviacin estndar es til por que nos ayuda a diferenciar las alturas que
estn distancia menos de la desviacin estndar (147 mm) con respecto a la media.

5. EJEMPLO TIPO
As que usando la desviacin estndar tenemos una manera "estndar" de saber qu
es normal, o extra grande o extra pequeo.
Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos.
por qu al cuadrado la varianza y por que la raz de la varianza?
Elevar cada diferencia al cuadrado hace que todos los nmeros sean positivos (para
evitar que los nmeros negativos reduzcan la varianza)
Y tambin hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es
mucho ms grande que 502=2,500.
Pero elevarlas al cuadrado hace que la respuesta sea muy grande, as que lo
deshacemos (con la raz cuadrada) y as la desviacin estndar es mucho ms til.