Академический Документы
Профессиональный Документы
Культура Документы
Las medidas de centralización no son suficientes para describir una muestra. Se deberá saber si los
datos están muy cercanos o muy lejanos a la media. Es decir, cómo de dispersos están los datos.
Las medidas de dispersión más importantes son el rango o recorrido, la varianza y la desviación
típica.
El rango o recorrido.
Se llama rango o recorrido de una distribución a la diferencia entre el mayor y el menor valor.
Por ejemplo, en la muestra 1, 2, 2, 2, 3, 4, 4, 5; el rango será 5 − 1 = 4
Varianza.
Se llama varianza de una variable estadística a la media aritmética de los cuadrados de las
desviacionesrespecto de la media:
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
Ejemplo 6. Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean
iguales.
1. La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2. En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
3. La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones están elevadas al cuadrado.
4. La varianza es siempre positiva o nula. Cuando es nula todos los datos son iguales a la
media, cuanto mayor es la varianza más lejos están los datos de la media.
Desviación estándar
Varianza
Ejemplo
Tú y tus amigos habéis medido las alturas de vuestros perros (en milímetros):
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Respuesta:
600 + 470 + 170 + 430 + 300 1970
Media = = = 394
5 5
así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:
Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:
Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o
extra grande o extra pequeño.
Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... ¡pero que no se
enteren!
Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los
números negativos reduzcan la varianza)
Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho
más grande que 502=2,500.
Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con la
raíz cuadrada) y así la desviación estándar es mucho más útil.
La Desviación Típica
σ = √σ2
Asimetría
Es una medida de forma de una distribución que permite identificar y describir la manera como los
datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución.
Tipos De Asimetría
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está
en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia
la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la
derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo negativo
cuando el valor de la media aritmética es menor que la mediana y éste valor de la mediana a su
vez es menor que la moda, en símbolos 𝑥̅ < 𝑀𝑑 < 𝑀𝑜.
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría.
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está
en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o
sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga
que a la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el
valor de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es
mayor que la moda, en símbolos 𝑥̅ > 𝑀𝑑 > 𝑀𝑜.
Medidas De Asimetría
𝑥̅ = media aritmética.
Md = Mediana.
Nota:
𝑄1 + 𝑄3 − 2𝑄2
𝐴𝑠 =
𝑄3 − 𝑄1
Donde:
Nota:
∑(xi − x̅)3
As =
nσ3
∑ f(xi − x̅)3
As =
nσ3
∑ f(xm − x̅)3
As =
nσ3
Donde:
xi = cada uno de los valores; n = número de datos; x̅ = media aritmética; f = frecuencia absoluta
Nota:
Si As < 0 →Indica que existe presencia de la minoría de datos en la parte izquierda de la media,
aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica negativa
Si As > 0 → Indica que existe presencia de la minoría de datos en la parte derecha de la media,
aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica positiva
Ejemplo ilustrativo:
Solución:
6 9 9 12 12 12 15 17
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥2 + 𝑥3 9 + 9
𝑄1 = 𝑋[𝑛+2] = 𝑋[8+2]= 𝑋[10]= 𝑋2,5 = = =9
4 4 4 2 2
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥4 + 𝑥5 12 + 12
𝑄2 = 𝑋[𝑛∙2+2] = 𝑋[2𝑛+2]= 𝑋[2∙8+2]= 𝑋[16+2]= 𝑋4,5= = = 12
4 4 4 4 2 2
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥6 + 𝑥7 12 + 15
𝑄3 = 𝑋[3𝑛+2]= 𝑋[3∙8+2]= 𝑋[24+2]= 𝑥26 = 𝑋6,5= = = 13,5
4 4 4 4 2 2
∑(xi − x̅)2
𝑠=√
n−1
(6 − 11,5)2 + (9 − 11,5)2 + (9 − 11,5)2 + (12 − 11,5)2 + (12 − 11,5)2 +(12 − 11,5)2 + (15 − 11,5)2 + (17 − 11,5)2
𝑠=√
8−1
𝑠 = 3,505
𝑄1 + 𝑄3 − 2𝑄2 9 + 13,5 − 3 ∙ 12
𝐴𝑠 = = = −0,333
𝑄3 − 𝑄1 13,5 − 9
∑(xi − μ)2
𝜎=√
N
(6 − 11,5)2 + (9 − 11,5)2 + (9 − 11,5)2 + (12 − 11,5)2 + (12 − 11,5)2 +(12 − 11,5)2 + (15 − 11,5)2 + (17 − 11,5)2
𝜎=√
8
𝜎 = 3,279
6 -166,375
9 -15,625
9 -15,625
12 0,125
12 0,125
12 0,125
15 42,875
17 166,375
Total 12
∑(xi − x̅)3 12
As = 3
= = 0,035
nσ 8(3,279)3
Tipos De Curtosis
La curtosis determina el grado de concentración que presentan los valores en la región central de
la distribución. Así puede ser:
Medidas De Curtosis
Medida de Fisher
∑(xi − x̅)4
α=
nσ4
∑ f(xi − x̅)4
α=
nσ4
Para datos agrupados en intervalos se emplea la siguiente fórmula:
∑ f(xm − x̅)4
α=
nσ4
Donde: xi = cada uno de los valores; n = número de datos; x̅ = media aritmética; 𝜎 4 = Cuádruplo
de la desviación estándar poblacional; f = frecuencia absoluta; xm = marca de clase
Nota:
Nota:
Ejemplo ilustrativo: Determinar qué tipo de curtosis tiene la siguiente distribución: 6, 9, 9, 12, 12,
12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.
∑ 𝑥𝑖 6 + 9 + 9 + 12 + 12 + 12 + 15 + 17 92
𝑥̅ = = = = 11,5
𝑛 8 8
∑(xi − x̅)2
𝜎=√
n
(6 − 11,5)2 + (9 − 11,5)2 + (9 − 11,5)2 + (12 − 11,5)2 + (12 − 11,5)2 +(12 − 11,5)2 + (15 − 11,5)2 + (17 − 11,5)2
𝜎=√
8
𝜎 = 3,279
Datos
6 915,0625
9 39,0625
9 39,0625
12 0,0625
12 0,0625
12 0,0625
15 150,0625
17 915,0625
Total 2058,5
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
6 9 9 12 12 12 15 17
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥2 + 𝑥3 9 + 9
𝑄1 = 𝑋[𝑛+2] = 𝑋[8+2]= 𝑋[10]= 𝑋2,5 = = =9
4 4 4 2 2
Calculando el cuartil tres se obtiene:
𝑄𝑘 = 𝑋[𝑛∙𝑘+2]
4
𝑥6 + 𝑥7 12 + 15
𝑄3 = 𝑋[3𝑛+2]= 𝑋[3∙8+2]= 𝑋[24+2]= 𝑥26 = 𝑋6,5= = = 13,5
4 4 4 4 2 2
𝑃𝑘 = 𝑋[𝑛∙𝑘+50]
100
𝑥7 + 𝑥8 15 + 17
𝑃90 = 𝑋[𝑛∙90+50]= 𝑋[8∙90+50]= 𝑋[770]= 𝑋7,7= = = 16
100 100 100 2 2
𝑃𝑘 = 𝑋[𝑛∙𝑘+50]
100
Q 3 − Q1 13,5 − 9
κ= = = 0,225
2(P90 – P10 ) 2(16– 6)