Вы находитесь на странице: 1из 17

MEDIDAS DE DISPERSIÓN

Las medidas de centralización no son suficientes para describir una muestra. Se deberá saber si los
datos están muy cercanos o muy lejanos a la media. Es decir, cómo de dispersos están los datos.
Las medidas de dispersión más importantes son el rango o recorrido, la varianza y la desviación
típica.

El rango o recorrido.
Se llama rango o recorrido de una distribución a la diferencia entre el mayor y el menor valor.
Por ejemplo, en la muestra 1, 2, 2, 2, 3, 4, 4, 5; el rango será 5 − 1 = 4

Varianza.
Se llama varianza de una variable estadística a la media aritmética de los cuadrados de las
desviacionesrespecto de la media:

𝑓1 (𝑥1 − 𝑥̅ )2 + 𝑓2 (𝑥2 − 𝑥̅ )2 + 𝑓3 (𝑥3 − 𝑥̅ )2 + 𝑓1 (𝑥1 − 𝑥̅ )2 + ⋯ + 𝑓𝑛 (𝑥𝑛 − 𝑥̅ )2


𝜎2 =
𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑛

∑𝑛𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2 ∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖 2


= = − 𝑥̅ 2
∑𝑛𝑖=1 𝑓𝑖 ∑𝑛𝑖=1 𝑓𝑖

Cálculo de la Varianza Para Datos Agrupados

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
Ejemplo 6. Calcular la varianza de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Ejemplo 7. Calcular la varianza de la distribución de la tabla:


Propiedades de la Varianza

1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean
iguales.

2. Si a todos los valores de la variable se les suma un número la varianza no varía.

3. Si todos los valores de la variable se multiplican por un número la varianza queda


multiplicada por el cuadrado de dicho número.

4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas


varianzas se puede calcular la varianza total.

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

Observaciones sobre la Varianza

1. La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.

2. En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.

3. La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones están elevadas al cuadrado.

4. La varianza es siempre positiva o nula. Cuando es nula todos los datos son iguales a la
media, cuanto mayor es la varianza más lejos están los datos de la media.
Desviación estándar

La desviación estándar (σ) mide cuánto se separan los datos.

La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"

Varianza

la varianza (que es el cuadrado de la desviación estándar: σ2) se define así:

Es la media de las diferencias con la media elevadas al cuadrado.

En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los números)


2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al
cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?)

Ejemplo

Tú y tus amigos habéis medido las alturas de vuestros perros (en milímetros):

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.

Calcula la media, la varianza y la desviación estándar.

Respuesta:
600 + 470 + 170 + 430 + 300 1970
Media = = = 394
5 5
así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:

Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:

2062 + 762 + (-224)2 + 362 + (-94)2 108,520


Varianza: σ2 = = = 21,704
5 5

Así que la varianza es 21,704.

Y la desviación estándar es la raíz de la varianza, así que:

Desviación estándar: σ = √21,704 = 147


y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a distancia
menos de la desviación estándar (147mm) de la media:

Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o
extra grande o extra pequeño.

Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... ¡pero que no se
enteren!

*Nota: ¿por qué al cuadrado?

Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los
números negativos reduzcan la varianza)

Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho
más grande que 502=2,500.

Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con la
raíz cuadrada) y así la desviación estándar es mucho más útil.

La Desviación Típica

La desviación típica es la raíz cuadrada de la varianza:

σ = √σ2
Asimetría
Es una medida de forma de una distribución que permite identificar y describir la manera como los
datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución.

Permite identificar las características de la distribución de datos sin necesidad de generar el


gráfico.

Tipos De Asimetría

La asimetría presenta las siguientes formas:

Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está
en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia
la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la
derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo negativo
cuando el valor de la media aritmética es menor que la mediana y éste valor de la mediana a su
vez es menor que la moda, en símbolos 𝑥̅ < 𝑀𝑑 < 𝑀𝑜.

Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría.

Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad


de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa
por una curva normal en forma de campana llamada campana de Gauss (matemático Alemán
1777-1855) o también conocida como de Laplace (1749-1827).También se dice que una
distribución es simétrica cuando su media aritmética, su mediana y su moda son iguales, en
símbolos 𝑥̅ =Md=Mo

Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está
en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o
sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga
que a la izquierda.

También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el
valor de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es
mayor que la moda, en símbolos 𝑥̅ > 𝑀𝑑 > 𝑀𝑜.
Medidas De Asimetría

Coeficiente de Karl Pearson


3(𝑥̅ − 𝑀𝑑)
𝐴𝑠 =
𝑠
Donde:

𝑥̅ = media aritmética.

Md = Mediana.

s = desviación típica o estándar.

Nota:

El Coeficiente de Pearson varía entre -3 y 3

Si As < 0 → la distribución será asimétrica negativa.

Si As = 0 → la distribución será simétrica.

Si As > 0 → la distribución será asimétrica positiva.

Medida de Yule Bowley o Medida Cuartílica

𝑄1 + 𝑄3 − 2𝑄2
𝐴𝑠 =
𝑄3 − 𝑄1

Donde:

𝑄1 = Cuartil uno; 𝑄2 = Cuartil dos = Mediana; 𝑄3 = Cuartil tres.

Nota:

La Medida de Bowley varía entre -1 y 1

Si As < 0 → la distribución será asimétrica negativa.

Si As = 0 → la distribución será simétrica.

Si As > 0 → la distribución será asimétrica positiva.


Medida de Fisher

Para datos sin agrupar se emplea la siguiente fórmula:

∑(xi − x̅)3
As =
nσ3

Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:

∑ f(xi − x̅)3
As =
nσ3

Para datos agrupados en intervalos se emplea la siguiente fórmula:

∑ f(xm − x̅)3
As =
nσ3
Donde:

xi = cada uno de los valores; n = número de datos; x̅ = media aritmética; f = frecuencia absoluta

σ3 = cubo de la desviación estándar poblacional; xm = marca de clase

Nota:

Si As < 0 →Indica que existe presencia de la minoría de datos en la parte izquierda de la media,
aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica negativa

Si As = 0 → la distribución será simétrica

Si As > 0 → Indica que existe presencia de la minoría de datos en la parte derecha de la media,
aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica positiva

Ejemplo ilustrativo:

Calcular el Coeficiente de Pearson, Medida Cuartílica y la Medida de Fisherdada la siguiente


distribución: 6, 9, 9, 12, 12, 12, 15 y 17

Solución:

Calculando la media aritmética se obtiene:


∑ 𝑥𝑖 6 + 9 + 9 + 12 + 12 + 12 + 15 + 17 92
𝑥̅ = = = = 11,5
𝑛 8 8

Para calcular los cuartiles se ordena los datos de menor a mayor

6 9 9 12 12 12 15 17

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8

Calculando el cuartil uno se obtiene:

𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4

𝑥2 + 𝑥3 9 + 9
𝑄1 = 𝑋[𝑛+2] = 𝑋[8+2]= 𝑋[10]= 𝑋2,5 = = =9
4 4 4 2 2

Calculando el cuartil dos se obtiene:

𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4

𝑥4 + 𝑥5 12 + 12
𝑄2 = 𝑋[𝑛∙2+2] = 𝑋[2𝑛+2]= 𝑋[2∙8+2]= 𝑋[16+2]= 𝑋4,5= = = 12
4 4 4 4 2 2

Calculando el cuartil tres se obtiene:

𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4

𝑥6 + 𝑥7 12 + 15
𝑄3 = 𝑋[3𝑛+2]= 𝑋[3∙8+2]= 𝑋[24+2]= 𝑥26 = 𝑋6,5= = = 13,5
4 4 4 4 2 2

Calculando la desviación estándar muestral se obtiene:

∑(xi − x̅)2
𝑠=√
n−1
(6 − 11,5)2 + (9 − 11,5)2 + (9 − 11,5)2 + (12 − 11,5)2 + (12 − 11,5)2 +(12 − 11,5)2 + (15 − 11,5)2 + (17 − 11,5)2
𝑠=√
8−1

𝑠 = 3,505

Calculando el Coeficiente de Pearson se obtiene:

3(𝑥̅ − 𝑀𝑑) 3(11,5 − 12) −1,5


𝐴𝑠 = = = = −0,428
𝑠 3,505 3,505

Calculando la Medida deBowley se obtiene

𝑄1 + 𝑄3 − 2𝑄2 9 + 13,5 − 3 ∙ 12
𝐴𝑠 = = = −0,333
𝑄3 − 𝑄1 13,5 − 9

Calculando la desviación estándar poblacional se obtiene:

∑(xi − μ)2
𝜎=√
N

(6 − 11,5)2 + (9 − 11,5)2 + (9 − 11,5)2 + (12 − 11,5)2 + (12 − 11,5)2 +(12 − 11,5)2 + (15 − 11,5)2 + (17 − 11,5)2
𝜎=√
8

𝜎 = 3,279

Calculando la Medida deFisher se obtiene

Datos (xi − x̅)3

6 -166,375

9 -15,625

9 -15,625

12 0,125

12 0,125

12 0,125

15 42,875

17 166,375
Total 12

∑(xi − x̅)3 12
As = 3
= = 0,035
nσ 8(3,279)3

Los cálculos en Excel se muestran en la siguiente figura:

Nota: El COEFICIENTE.ASIMETRIA(A2:A9) es un valor que tiene consideraciones semejantes a la


Medida de Fisher
Curtosis O Apuntamiento
La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la
distribución normal, es decir, mide cuán puntiaguda es una distribución.

Tipos De Curtosis

La curtosis determina el grado de concentración que presentan los valores en la región central de
la distribución. Así puede ser:

Leptocúrtica.- Existe una gran concentración.

Mesocúrtica.- Existe una concentración normal.

Platicúrtica.- Existe una baja concentración.

Medidas De Curtosis

Medida de Fisher

Para datos sin agrupar se emplea la siguiente fórmula:

∑(xi − x̅)4
α=
nσ4

Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:

∑ f(xi − x̅)4
α=
nσ4
Para datos agrupados en intervalos se emplea la siguiente fórmula:

∑ f(xm − x̅)4
α=
nσ4
Donde: xi = cada uno de los valores; n = número de datos; x̅ = media aritmética; 𝜎 4 = Cuádruplo
de la desviación estándar poblacional; f = frecuencia absoluta; xm = marca de clase

Nota:

Si α < 3 → la distribución es platicútica

Si α = 3 → la distribución es normal o mesocúrtica

Si α > 3 → la distribución es leptocúrtica

Medida basada en Cuartiles y Percentiles


Q3 −Q1
Desviación cuartílica 2 Q 3 − Q1
κ= = =
Amplitud cuartílica P90 – P10 2(P90 – P10 )

κ (letra griega minúscula kappa) = Coeficiente percentil de curtosis

Nota:

Si κ< 0,263 → la distribución es platicúrtica

Si κ = 0,263 → la distribución es normal o mesocúrtica

Si κ> 0,263 → la distribución es leptocúrtica

Esta medida no es muy utilizada.

Ejemplo ilustrativo: Determinar qué tipo de curtosis tiene la siguiente distribución: 6, 9, 9, 12, 12,
12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.

Solución: Calculando la media aritmética se obtiene

∑ 𝑥𝑖 6 + 9 + 9 + 12 + 12 + 12 + 15 + 17 92
𝑥̅ = = = = 11,5
𝑛 8 8

Calculando la desviación estándar poblacional se obtiene:

∑(xi − x̅)2
𝜎=√
n
(6 − 11,5)2 + (9 − 11,5)2 + (9 − 11,5)2 + (12 − 11,5)2 + (12 − 11,5)2 +(12 − 11,5)2 + (15 − 11,5)2 + (17 − 11,5)2
𝜎=√
8

𝜎 = 3,279

Calculando la Medida deFisher se obtiene:

Datos

6 915,0625

9 39,0625

9 39,0625

12 0,0625

12 0,0625

12 0,0625

15 150,0625

17 915,0625

Total 2058,5

∑(xi − x̅)4 2058,5


α= = = 2,23
nσ4 8 ∙ (3,279)4

Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:

6 9 9 12 12 12 15 17

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8

Calculando el cuartil uno se obtiene:

𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4

𝑥2 + 𝑥3 9 + 9
𝑄1 = 𝑋[𝑛+2] = 𝑋[8+2]= 𝑋[10]= 𝑋2,5 = = =9
4 4 4 2 2
Calculando el cuartil tres se obtiene:

𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4

𝑥6 + 𝑥7 12 + 15
𝑄3 = 𝑋[3𝑛+2]= 𝑋[3∙8+2]= 𝑋[24+2]= 𝑥26 = 𝑋6,5= = = 13,5
4 4 4 4 2 2

Calculando el percentil 90 se tiene:

𝑃𝑘 = 𝑋[𝑛∙𝑘+50]
100

𝑥7 + 𝑥8 15 + 17
𝑃90 = 𝑋[𝑛∙90+50]= 𝑋[8∙90+50]= 𝑋[770]= 𝑋7,7= = = 16
100 100 100 2 2

Calculando el percentil 10 se tiene:

𝑃𝑘 = 𝑋[𝑛∙𝑘+50]
100

𝑃10 = 𝑋[𝑛∙10+50]= 𝑋[8∙10+50]= 𝑋[130]= 𝑋1,3= 𝑥1 = 6


100 100 100

Calculandoel coeficiente percentil de curtosis se obtiene:

Q 3 − Q1 13,5 − 9
κ= = = 0,225
2(P90 – P10 ) 2(16– 6)

Como α= 2,23 y κ = 0,225, la distribución es platicúrtica

Los cálculos en Excel se muestran en la siguiente figura:

Вам также может понравиться