Вы находитесь на странице: 1из 8

1.

Definición de medidas de dispersión


Parámetros estadísticos que indican como se alejan los datos respecto de la
media aritmética. Sirven como indicador de la variabilidad de los datos. Las
medidas de dispersión más utilizadas son el rango, la desviación estándar y la
varianza.
Las medidas de dispersión son importantes porque:
 Proporciona información adicional que permite juzgar la confiabilidad de
la medida de tendencia central. Si los datos se encuentran ampliamente
dispersos, la posición central es menos representativa de los datos.
 Ya que existen problemas característicos para datos ampliamente
dispersos, debemos ser capaces de distinguir que presentan esa
dispersión antes de abordar esos problemas.
 Quizá se desee comparar las dispersiones de diferentes muestras. Si no
se desea tener una amplia dispersión de valores con respecto al centro
de distribución o esto presenta riesgos inaceptables, necesitamos tener
habilidad de reconocerlo y evitar escoger distribuciones que tengan las
dispersiones más grandes.

2. Rango

2.1. Definición:
Es la medida de dispersión más simple, de un conjunto de números es la
diferencia entre el mayor y el menor de todos ellos. , para el caso de datos
no agrupados se calcula:
2.1.1. Datos no agrupados
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
2.1.2. Datos agrupados
Por límites reales
𝑅 = 𝐿𝑆𝑅 ↓ −𝐿𝐼𝑅 ↑
Por límites de intervalos
𝑅 = 𝐿𝑆 ↓ −𝐿𝐼 ↑
Por marcas de clases
𝑅 = 𝑋 ↓ −𝑋 ↑

2.2. Ventajas:

 Es relativamente sencilla su obtención


 El significado de ésta medida es fácil de comprender.
2.3. Desventajas:

 Es muy general, tan solo nos da una idea de cuán amplia es la


variación entre puntajes extremos.
 No toman en cuenta los valores intermedios de la distribución.
 Se ve muy influida por los valores extremos.

2.4. Ejercicio de Aplicación


Tabla 1: Gasto total de 50 familias por compras con motivo de navidad
Intervalo f x Limites Reales
700-999 10 849,5 699,5-999,5
1000-1299 7 1149,5 999,5-1299,5
1300-1599 15 1449,5 1299,5-1599,5
1600-1899 2 1749,5 1599,5-1899,5
1900-2199 12 2049,5 1899,5-2199,5
2200-2499 4 2349,5 2199,5-2499,5
TOTAL 50

Cálculo de Rango por:


 Por limites reales
𝑅 = 𝐿𝑆𝑅 − 𝐿𝐼𝑅
𝑅 = 2499.5 − 699.5
𝑅 = 1800

 Por límites de intervalos


𝑅 = 𝐿𝑆 − 𝐿𝐼
𝑅 = 2499 − 700
𝑅 = 1799
 Por marcas de clases
𝑅 = 𝑋𝑓 − 𝑋𝑖
𝑅 = 2349.5 − 849.5
𝑅 = 1500
Interpretación:

 El rango por límites reales, es decir la diferencia entre el último límite real
y el primer límite real es 1800.
 El rango por límites, es decir la diferencia entre el último límite y el primero
es 1799.
 El rango por marcas de clase, es decir la diferencia entre la última marca
de clase y la primera es 1500.

3. Desviación Media

3.1. Definición:
Mide la desviación promedio de valores con respecto a la media del
grupo, sin tomar en cuenta el signo de la desviación
3.1.1. Datos no agrupados
∑|𝑥𝑖 − 𝑥̅ |
𝐷𝑀 =
𝑛
3.1.2. Datos agrupados
∑ 𝑓|𝑥𝑖 − 𝑥̅ |
𝐷𝑀 =
𝑛
3.2. Ventajas:

 Es relativamente sencilla su obtención


 Toma en cuenta todos los datos

3.3. Desventajas:

 Esta medida de dispersión es poco utilizada por tener el inconveniente de


no poderse manipular algebraicamente, lo que implica que sea muy
engorroso trabajar con ella a la hora de hacer inferencias en la población
de estudio.

3.4. Ejercicio de Aplicación


Tabla 2: Pensión mensual de diez universidades del mundo en dólares.
Intervalo xi (xi-xmedia) |xi-xmedia|
1 1200 -650 650
2 1100 -750 750
3 1550 -300 300
4 3000 1150 1150
5 2500 650 650
6 3000 1150 1150
7 2000 150 150
8 1600 -250 250
9 1350 -500 500
10 1200 -650 650
6200
Media 1850

∑|𝑥𝑖 − 𝑥̅ |
𝐷𝑀 =
𝑛
6200
𝐷𝑀 =
10
𝐷𝑀 = 620
Interpretación:

La media aritmética de los valores absolutos de las desviaciones con


respecto a la media aritmética es de 620.
4. Varianza

4.1. Definición:
La varianza es la media aritmética del cuadrado de las desviaciones respecto
a la media de una distribución estadística.

4.1.1. Datos no agrupados


∑(𝑥 − 𝑥̅ )2
𝑆2 =
𝑛−1
4.1.2. Datos agrupados
2
∑ 𝑓(𝑥 − 𝑥̅ )2
𝑆 =
𝑛−1
4.2. Ventajas:

 Es relativamente sencilla su obtención


 Toma en cuenta todos los datos

4.3. Desventajas:

 Hay que tener en cuenta que la varianza puede verse muy influida por los
valores atípicos.
 Es de difícil interpretación al tener unidades diferentes que los valores.

4.4. Ejercicio de Aplicación


Tabla 3: Calificaciones del 0 al 100 de un examen de comprensión lectora a 70
personas

Intervalo f xi f*xi xi-xmedia (xi-xmedia)^2 f*(xi-xmedia)^2


0-9. 2 4,5 9 -41,86 1752,02 3504,04
10-19. 5 14,5 72,5 -31,86 1014,88 5074,39
20-29. 3 24,5 73,5 -21,86 477,73 1433,20
30-39. 12 34,5 414 -11,86 140,59 1687,10
40-49. 15 44,5 667,5 -1,86 3,45 51,73
50-59. 22 54,5 1199 8,14 66,31 1458,73
60-69. 5 64,5 322,5 18,14 329,16 1645,82
70-79. 3 74,5 223,5 28,14 792,02 2376,06
80-89. 2 84,5 169 38,14 1454,88 2909,76
90-99. 1 94,5 94,5 48,14 2317,73 2317,73
70 3245 22458,57

Media 46,36

∑ 𝑓(𝑥 − 𝑥̅ )2
𝑆2 =
𝑛−1
22458,57
𝑆2 =
70 − 1

𝑆 2 = 325.48
Interpretación:
La varianza no tiene una interpretación muy fácil de explicar, puesto que las
unidades quedan elevadas al cuadrado.

5. Desviación Estándar

5.1. Definición:
Esta medida nos permite determinar el promedio aritmético de fluctuación de
los datos respecto a su punto central o media. La desviación estándar nos da
como resultado un valor numérico que representa el promedio de diferencia
que hay entre los datos y la media. Para calcular la desviación estándar basta
con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:

5.1.1. Datos no agrupados

∑(𝑥 − 𝑥̅ )2
𝜎=√
𝑛−1

5.1.2. Datos agrupados


∑ 𝑓(𝑥 − 𝑥̅ )2
𝜎=√
𝑛−1
5.2. Ventajas:

 Las unidades son las mismas de las observaciones, y como es la raíz


cuadrada de la varianza, se pueden hacer inferencias a través de la
varianza y dar explicaciones a través de la desviación estándar.
 Toma en cuenta todos los datos.
 Fácil de interpretar.

5.3. Desventajas:

 Hay que tener en cuenta que la desviación estándar puede verse muy
influida por los valores atípicos

5.4. Ejercicio de Aplicación


Tabla 5: Tiempo requerido de un grupo de trabajadores para ensamblar un
producto
Trabajador xi (xi-xmedia) (xi-xmedia)^2
1 5 -5,5 30,25
2 7 -3,5 12,25
3 8 -2,5 6,25
4 8 -2,5 6,25
5 8 -2,5 6,25
6 10 -0,5 0,25
7 13 2,5 6,25
8 13 2,5 6,25
9 16 5,5 30,25
10 17 6,5 42,25
146,5
Media 10,5

∑(𝑥 − 𝑥̅ )2
𝜎= √
𝑛−1

146.5
𝜎=√
10 − 1

𝜎 = 4.034
Interpretación:
4.034 es el grado de dispersión de los datos con respecto al valor promedio.
Dicho de otra manera, la desviación estándar es simplemente el "promedio" o
variación esperada con respecto a la media aritmética.

6. Coeficiente de Variación

6.1. Definición:
El coeficiente de variación es una medida de dispersión que describe la
cantidad de variabilidad en relación con la media. Puesto que el coeficiente
de variación no se basa en unidades, se puede utilizar en lugar de la
desviación estándar para comparar la dispersión de los conjuntos de datos
que tienen diferentes unidades o diferentes medias.
𝜎
𝐶𝑉 = ∗ 100
𝑥̅
6.2. Ventajas:

 Permite comparar el nivel de dispersión de dos muestras con variables


diferentes.
 Fácil de calcular.

6.3. Desventajas:

 No es una medida de dispersión con respecto al centro de distribución


de los datos.
6.4. Ejercicio de Aplicación
Tabla 5: Tiempo requerido de un grupo de trabajadores para ensamblar un
producto
Trabajador xi (xi-xmedia) (xi-xmedia)^2
1 5 -5,5 30,25
2 7 -3,5 12,25
3 8 -2,5 6,25
4 8 -2,5 6,25
5 8 -2,5 6,25
6 10 -0,5 0,25
7 13 2,5 6,25
8 13 2,5 6,25
9 16 5,5 30,25
10 17 6,5 42,25
146,5
Media 10,5

𝜎
𝐶𝑉 = ∗ 100
𝑥̅
4.034
𝐶𝑉 = ∗ 100
10.5
𝐶𝑉 = 38.41%
Interpretación
38.41% es el coeficiente de variación, es decir describe la cantidad de
variabilidad en relación con la media. Es mayor que 33%, por lo tanto es una
variable heterogénea.

Вам также может понравиться