Medidas de Dispersion

MEDIDAS DE DISPERSIÓN
Las medidas de centralización no son suficientes para describir una muestra. Se deberá saber si los
datos están muy cercanos o muy lejanos a la media. Es decir, cómo de dispersos están los datos.
Las medidas de dispersión más importantes son el rango o recorrido, la varianza y la desviación
típica.
El rango o recorrido.
Se llama rango o recorrido de una distribución a la diferencia entre el mayor y el menor valor.
Por ejemplo, en la muestra 1, 2, 2, 2, 3, 4, 4, 5; el rango será 5 − 1 = 4
Varianza.
Se llama varianza de una variable estadística a la media aritmética de los cuadrados de las
desviacionesrespecto de la media:
𝑓1 (𝑥1 − 𝑥̅ )2 + 𝑓2 (𝑥2 − 𝑥̅ )2 + 𝑓3 (𝑥3 − 𝑥̅ )2 + 𝑓1 (𝑥1 − 𝑥̅ )2 + ⋯ + 𝑓𝑛 (𝑥𝑛 − 𝑥̅ )2

𝜎2 =
𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑛
∑𝑛𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2 ∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖 2

= = − 𝑥̅ 2
∑𝑛𝑖=1 𝑓𝑖 ∑𝑛𝑖=1 𝑓𝑖
Cálculo de la Varianza Para Datos Agrupados
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
Ejemplo 6. Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo 7. Calcular la varianza de la distribución de la tabla:

Propiedades de la Varianza
1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean
iguales.
2. Si a todos los valores de la variable se les suma un número la varianza no varía.
3. Si todos los valores de la variable se multiplican por un número la varianza queda

multiplicada por el cuadrado de dicho número.
4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas

varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
Observaciones sobre la Varianza
1. La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2. En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
3. La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones están elevadas al cuadrado.
4. La varianza es siempre positiva o nula. Cuando es nula todos los datos son iguales a la
media, cuanto mayor es la varianza más lejos están los datos de la media.
Desviación estándar
La desviación estándar (σ) mide cuánto se separan los datos.
La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"
Varianza
la varianza (que es el cuadrado de la desviación estándar: σ2) se define así:
Es la media de las diferencias con la media elevadas al cuadrado.
En otras palabras, sigue estos pasos:
1. Calcula la media (el promedio de los números)

2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al
cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?)
Ejemplo
Tú y tus amigos habéis medido las alturas de vuestros perros (en milímetros):
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Calcula la media, la varianza y la desviación estándar.
Respuesta:
600 + 470 + 170 + 430 + 300 1970
Media = = = 394
5 5
así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:
Ahora calculamos la diferencia de cada altura con la media:
Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:
2062 + 762 + (-224)2 + 362 + (-94)2 108,520

Varianza: σ2 = = = 21,704
5 5
Así que la varianza es 21,704.
Y la desviación estándar es la raíz de la varianza, así que:
Desviación estándar: σ = √21,704 = 147

y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a distancia
menos de la desviación estándar (147mm) de la media:
Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o
extra grande o extra pequeño.
Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... ¡pero que no se
enteren!
*Nota: ¿por qué al cuadrado?
Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los
números negativos reduzcan la varianza)
Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho
más grande que 502=2,500.
Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con la
raíz cuadrada) y así la desviación estándar es mucho más útil.
La Desviación Típica
La desviación típica es la raíz cuadrada de la varianza:
σ = √σ2
Asimetría
Es una medida de forma de una distribución que permite identificar y describir la manera como los
datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución.
Permite identificar las características de la distribución de datos sin necesidad de generar el

gráfico.
Tipos De Asimetría
La asimetría presenta las siguientes formas:
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está
en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia
la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la
derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo negativo
cuando el valor de la media aritmética es menor que la mediana y éste valor de la mediana a su
vez es menor que la moda, en símbolos 𝑥̅ < 𝑀𝑑 < 𝑀𝑜.
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría.
Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad

de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa
por una curva normal en forma de campana llamada campana de Gauss (matemático Alemán
1777-1855) o también conocida como de Laplace (1749-1827).También se dice que una
distribución es simétrica cuando su media aritmética, su mediana y su moda son iguales, en
símbolos 𝑥̅ =Md=Mo
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está
en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o
sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga
que a la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el
valor de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es
mayor que la moda, en símbolos 𝑥̅ > 𝑀𝑑 > 𝑀𝑜.
Medidas De Asimetría
Coeficiente de Karl Pearson

3(𝑥̅ − 𝑀𝑑)
𝐴𝑠 =
𝑠
Donde:
𝑥̅ = media aritmética.
Md = Mediana.
s = desviación típica o estándar.
Nota:
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 → la distribución será asimétrica negativa.
Si As = 0 → la distribución será simétrica.
Si As > 0 → la distribución será asimétrica positiva.
Medida de Yule Bowley o Medida Cuartílica
𝑄1 + 𝑄3 − 2𝑄2
𝐴𝑠 =
𝑄3 − 𝑄1
Donde:
𝑄1 = Cuartil uno; 𝑄2 = Cuartil dos = Mediana; 𝑄3 = Cuartil tres.
Nota:
La Medida de Bowley varía entre -1 y 1
Si As < 0 → la distribución será asimétrica negativa.
Si As = 0 → la distribución será simétrica.
Si As > 0 → la distribución será asimétrica positiva.

Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:
∑(xi − x̅)3
As =
nσ3
Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:
∑ f(xi − x̅)3
As =
nσ3
Para datos agrupados en intervalos se emplea la siguiente fórmula:
∑ f(xm − x̅)3
As =
nσ3
Donde:
xi = cada uno de los valores; n = número de datos; x̅ = media aritmética; f = frecuencia absoluta
σ3 = cubo de la desviación estándar poblacional; xm = marca de clase
Nota:
Si As < 0 →Indica que existe presencia de la minoría de datos en la parte izquierda de la media,
aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica negativa
Si As = 0 → la distribución será simétrica
Si As > 0 → Indica que existe presencia de la minoría de datos en la parte derecha de la media,
aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica positiva
Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, Medida Cuartílica y la Medida de Fisherdada la siguiente

distribución: 6, 9, 9, 12, 12, 12, 15 y 17
Solución:
Calculando la media aritmética se obtiene:

∑ 𝑥𝑖 6 + 9 + 9 + 12 + 12 + 12 + 15 + 17 92
𝑥̅ = = = = 11,5
𝑛 8 8
Para calcular los cuartiles se ordena los datos de menor a mayor
6 9 9 12 12 12 15 17
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
Calculando el cuartil uno se obtiene:
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥2 + 𝑥3 9 + 9
𝑄1 = 𝑋[𝑛+2] = 𝑋[8+2]= 𝑋[10]= 𝑋2,5 = = =9
4 4 4 2 2
Calculando el cuartil dos se obtiene:
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥4 + 𝑥5 12 + 12
𝑄2 = 𝑋[𝑛∙2+2] = 𝑋[2𝑛+2]= 𝑋[2∙8+2]= 𝑋[16+2]= 𝑋4,5= = = 12
4 4 4 4 2 2
Calculando el cuartil tres se obtiene:
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥6 + 𝑥7 12 + 15
𝑄3 = 𝑋[3𝑛+2]= 𝑋[3∙8+2]= 𝑋[24+2]= 𝑥26 = 𝑋6,5= = = 13,5
4 4 4 4 2 2
Calculando la desviación estándar muestral se obtiene:
∑(xi − x̅)2
𝑠=√
n−1
(6 − 11,5)2 + (9 − 11,5)2 + (9 − 11,5)2 + (12 − 11,5)2 + (12 − 11,5)2 +(12 − 11,5)2 + (15 − 11,5)2 + (17 − 11,5)2
𝑠=√
8−1
𝑠 = 3,505
Calculando el Coeficiente de Pearson se obtiene:
3(𝑥̅ − 𝑀𝑑) 3(11,5 − 12) −1,5

𝐴𝑠 = = = = −0,428
𝑠 3,505 3,505
Calculando la Medida deBowley se obtiene
𝑄1 + 𝑄3 − 2𝑄2 9 + 13,5 − 3 ∙ 12
𝐴𝑠 = = = −0,333
𝑄3 − 𝑄1 13,5 − 9
Calculando la desviación estándar poblacional se obtiene:
∑(xi − μ)2
𝜎=√
N
(6 − 11,5)2 + (9 − 11,5)2 + (9 − 11,5)2 + (12 − 11,5)2 + (12 − 11,5)2 +(12 − 11,5)2 + (15 − 11,5)2 + (17 − 11,5)2
𝜎=√
8
𝜎 = 3,279
Calculando la Medida deFisher se obtiene
Datos (xi − x̅)3
6 -166,375
9 -15,625
9 -15,625
12 0,125
12 0,125
12 0,125
15 42,875
17 166,375
Total 12
∑(xi − x̅)3 12
As = 3
= = 0,035
nσ 8(3,279)3
Los cálculos en Excel se muestran en la siguiente figura:
Nota: El COEFICIENTE.ASIMETRIA(A2:A9) es un valor que tiene consideraciones semejantes a la

Medida de Fisher
Curtosis O Apuntamiento
La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la
distribución normal, es decir, mide cuán puntiaguda es una distribución.
Tipos De Curtosis
La curtosis determina el grado de concentración que presentan los valores en la región central de
la distribución. Así puede ser:
Leptocúrtica.- Existe una gran concentración.
Mesocúrtica.- Existe una concentración normal.
Platicúrtica.- Existe una baja concentración.
Medidas De Curtosis
Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:
∑(xi − x̅)4
α=
nσ4
Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:
∑ f(xi − x̅)4
α=
nσ4
Para datos agrupados en intervalos se emplea la siguiente fórmula:
∑ f(xm − x̅)4
α=
nσ4
Donde: xi = cada uno de los valores; n = número de datos; x̅ = media aritmética; 𝜎 4 = Cuádruplo
de la desviación estándar poblacional; f = frecuencia absoluta; xm = marca de clase
Nota:
Si α < 3 → la distribución es platicútica
Si α = 3 → la distribución es normal o mesocúrtica
Si α > 3 → la distribución es leptocúrtica
Medida basada en Cuartiles y Percentiles

Q3 −Q1
Desviación cuartílica 2 Q 3 − Q1
κ= = =
Amplitud cuartílica P90 – P10 2(P90 – P10 )
κ (letra griega minúscula kappa) = Coeficiente percentil de curtosis
Nota:
Si κ< 0,263 → la distribución es platicúrtica
Si κ = 0,263 → la distribución es normal o mesocúrtica
Si κ> 0,263 → la distribución es leptocúrtica
Esta medida no es muy utilizada.
Ejemplo ilustrativo: Determinar qué tipo de curtosis tiene la siguiente distribución: 6, 9, 9, 12, 12,
12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Solución: Calculando la media aritmética se obtiene
∑ 𝑥𝑖 6 + 9 + 9 + 12 + 12 + 12 + 15 + 17 92
𝑥̅ = = = = 11,5
𝑛 8 8
Calculando la desviación estándar poblacional se obtiene:
∑(xi − x̅)2
𝜎=√
n
(6 − 11,5)2 + (9 − 11,5)2 + (9 − 11,5)2 + (12 − 11,5)2 + (12 − 11,5)2 +(12 − 11,5)2 + (15 − 11,5)2 + (17 − 11,5)2
𝜎=√
8
𝜎 = 3,279
Calculando la Medida deFisher se obtiene:
Datos
6 915,0625
9 39,0625
9 39,0625
12 0,0625
12 0,0625
12 0,0625
15 150,0625
17 915,0625
Total 2058,5
∑(xi − x̅)4 2058,5

α= = = 2,23
nσ4 8 ∙ (3,279)4
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
6 9 9 12 12 12 15 17
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
Calculando el cuartil uno se obtiene:
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥2 + 𝑥3 9 + 9
𝑄1 = 𝑋[𝑛+2] = 𝑋[8+2]= 𝑋[10]= 𝑋2,5 = = =9
4 4 4 2 2
Calculando el cuartil tres se obtiene:
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥6 + 𝑥7 12 + 15
𝑄3 = 𝑋[3𝑛+2]= 𝑋[3∙8+2]= 𝑋[24+2]= 𝑥26 = 𝑋6,5= = = 13,5
4 4 4 4 2 2
Calculando el percentil 90 se tiene:
𝑃𝑘 = 𝑋[𝑛∙𝑘+50]
100
𝑥7 + 𝑥8 15 + 17
𝑃90 = 𝑋[𝑛∙90+50]= 𝑋[8∙90+50]= 𝑋[770]= 𝑋7,7= = = 16
100 100 100 2 2
Calculando el percentil 10 se tiene:
𝑃𝑘 = 𝑋[𝑛∙𝑘+50]
100
𝑃10 = 𝑋[𝑛∙10+50]= 𝑋[8∙10+50]= 𝑋[130]= 𝑋1,3= 𝑥1 = 6

100 100 100
Calculandoel coeficiente percentil de curtosis se obtiene:
Q 3 − Q1 13,5 − 9
κ= = = 0,225
2(P90 – P10 ) 2(16– 6)
Como α= 2,23 y κ = 0,225, la distribución es platicúrtica
Los cálculos en Excel se muestran en la siguiente figura:

Medidas de Dispersion

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Medidas de Dispersion

Загружено:

Авторское право:

Доступные форматы

MEDIDAS DE DISPERSIÓN

𝑓1 (𝑥1 − 𝑥̅ )2 + 𝑓2 (𝑥2 − 𝑥̅ )2 + 𝑓3 (𝑥3 − 𝑥̅ )2 + 𝑓1 (𝑥1 − 𝑥̅ )2 + ⋯ + 𝑓𝑛 (𝑥𝑛 − 𝑥̅ )2

∑𝑛𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2 ∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖 2

Cálculo de la Varianza Para Datos Agrupados

Ejemplo 7. Calcular la varianza de la distribución de la tabla:

2. Si a todos los valores de la variable se les suma un número la varianza no varía.

3. Si todos los valores de la variable se multiplican por un número la varianza queda

4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

Observaciones sobre la Varianza

La desviación estándar (σ) mide cuánto se separan los datos.

La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"

la varianza (que es el cuadrado de la desviación estándar: σ2) se define así:

Es la media de las diferencias con la media elevadas al cuadrado.

En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los números)

Calcula la media, la varianza y la desviación estándar.

Ahora calculamos la diferencia de cada altura con la media:

2062 + 762 + (-224)2 + 362 + (-94)2 108,520

Así que la varianza es 21,704.

Y la desviación estándar es la raíz de la varianza, así que:

Desviación estándar: σ = √21,704 = 147

*Nota: ¿por qué al cuadrado?

La desviación típica es la raíz cuadrada de la varianza:

Permite identificar las características de la distribución de datos sin necesidad de generar el

La asimetría presenta las siguientes formas:

Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad

Coeficiente de Karl Pearson

s = desviación típica o estándar.

El Coeficiente de Pearson varía entre -3 y 3

Si As < 0 → la distribución será asimétrica negativa.

Si As = 0 → la distribución será simétrica.

Si As > 0 → la distribución será asimétrica positiva.

Medida de Yule Bowley o Medida Cuartílica

𝑄1 = Cuartil uno; 𝑄2 = Cuartil dos = Mediana; 𝑄3 = Cuartil tres.

La Medida de Bowley varía entre -1 y 1

Si As < 0 → la distribución será asimétrica negativa.

Si As = 0 → la distribución será simétrica.

Si As > 0 → la distribución será asimétrica positiva.

Para datos sin agrupar se emplea la siguiente fórmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:

Para datos agrupados en intervalos se emplea la siguiente fórmula:

σ3 = cubo de la desviación estándar poblacional; xm = marca de clase

Si As = 0 → la distribución será simétrica

Calcular el Coeficiente de Pearson, Medida Cuartílica y la Medida de Fisherdada la siguiente

Calculando la media aritmética se obtiene:

Para calcular los cuartiles se ordena los datos de menor a mayor

Calculando el cuartil uno se obtiene:

Calculando el cuartil dos se obtiene:

Calculando el cuartil tres se obtiene:

Calculando la desviación estándar muestral se obtiene:

Calculando el Coeficiente de Pearson se obtiene:

3(𝑥̅ − 𝑀𝑑) 3(11,5 − 12) −1,5

Calculando la Medida deBowley se obtiene

Calculando la desviación estándar poblacional se obtiene:

Calculando la Medida deFisher se obtiene

Datos (xi − x̅)3

Los cálculos en Excel se muestran en la siguiente figura:

Nota: El COEFICIENTE.ASIMETRIA(A2:A9) es un valor que tiene consideraciones semejantes a la

Leptocúrtica.- Existe una gran concentración.

Mesocúrtica.- Existe una concentración normal.

Platicúrtica.- Existe una baja concentración.