Академический Документы
Профессиональный Документы
Культура Документы
DE DISPERSIÓN
Introducción
• Son medidas estadísticas que permiten conocer el grado de
dispersión o variabilidad (homogeneidad o heterogeneidad) dentro
de un conjunto de datos. Cuando los datos presentan baja
variabilidad se dice que son homogéneos y cuando presentan alta son
heterogéneos.
Objetivo:
Calcular e interpretar las principales mediadas de variabilidad para
describir las características (variables cuantitativas) de las unidades
experimentales en términos de su dispersión.
Las principales medidas de variabilidad son las siguientes:
- La amplitud o rango
- El rango intercuartil
- La desviación estándar
- La varianza
- El coeficiente de variabilidad
Ejemplo 1:
Suponga que las notas del primer examen de estadística fueron las siguientes para tres grupos:
Grupo NOTAS 𝑋ഥ
A 14 14 14 14 14 14 14 14 14 14 14
B 14 13 15 14 12 15 16 13 12 16 14
C 19 8 19 11 16 18 6 13 10 20 14
El Rango
- El rango o amplitud de un conjunto de observaciones es igual a la diferencia entre el valor máximo y el
valor mínimo.
R = Xmáximo – Xmínimo
Desventajas:
- Queda afectada por valores extremos
- No mide la variabilidad de los datos intermedios
Ejemplo 2:
• El rango de la nota para el grupo B es: RB = 16 – 12 = 4 puntos; Para el grupo C es: 20 – 8 = 12 puntos
• Esto indica que la amplitud de la nota del examen del grupo B fue de 4 puntos y para el grupo C es 12 puntos
El Rango Intercuartil
- El rango intercuartil se define como la diferencia entre el percentil 75 (P75 = Q3) y el percentil 25 (P25 = Q1)
RI = P75 – P25
• El RI excluye el 25% mas alto y el 25% mas bajo, dando un rango dentro del cual se encuentra el 50% central de los
datos.
• Un RI pequeño indica alta homogeneidad o pequeña variabilidad dentro del 50% central de los datos
Ejemplo 3:
- Para el grupo C: P75 = 19 y P25 = 9.5, entonces el rango intercuartil: RI = 19 – 9.5 = 9.5 puntos.
- Esto indica que la amplitud del 50% central de las notas del examen de estadística para el grupo C fue 9.5
La Desviación Estándar y la Varianza
• La desviación estándar (σ) mide cuánto se separan los datos.
• Para conocer con detalle un conjunto de datos, no solo basta con conocer las medidas de tendencia
central, sino que necesitamos conocer también la desviación que presentan los datos en su
distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión
de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma
de decisiones.
• La fórmula es fácil:
S=
A 14 14 14 14 14 14 14 14 14 14 10 1960 140
B 14 13 15 14 12 15 16 13 12 16 10 1980 140
C 19 8 19 11 16 18 6 13 10 20 10 2192 140
1402
SA = 1960 − 10
=0
10−1
1402
SB = 1980 − 10
= 1.49
10−1
1402
SC = 2192 − 10
= 5.08
10−1
Utilidad de la desviación estándar
Varianza
Se observa que la varianza está dada en las mismas unidades que la variable en estudio al cuadrado. Por ejemplo si
las unidades de las observaciones son Kg. entonces la varianza se expresa en Kg al cuadrado.
Ejemplo 5:
Hallar la varianza y desviación estándar de las notas de cada uno de los grupos
10
Grupo NOTAS 𝑋ഥ 𝑋𝑖 2
𝑖=1
A 14 14 14 14 14 14 14 14 14 14 14 1960
B 14 13 15 14 12 15 16 13 12 16 14 1980
C 19 8 19 11 16 18 6 13 10 20 14 2192
1 1
𝑆𝐴2 = σ10 𝑋𝑖 2 - n𝑋ഥ 2 = ((1960 – (10*142 )) = 0 y 𝑆𝐴 = 0
𝑛−1 𝑖=1 10−1
1 1
𝑆𝐵2 = σ10
𝑖=1 𝑋𝑖 2 - n𝑋ഥ 2 = ((1980 – (10*142 )) = 2.22 y 𝑆𝐵 = 2.22 = 1.49
𝑛−1 10−1
1 1
𝑆𝐶 2 = σ10
𝑖=1 𝑋𝑖 2 - n𝑋ഥ 2 = ((2192 – (10*142 )) = 25.78 y 𝑆𝐶 = 25.78 = 5.08
𝑛−1 10−1
Se observa que a mayor variabilidad entre las observaciones, la varianza es mayor. Esta comparación se
cumple siempre en cuando los promedios sean similares. Se indica que la variabilidad promedio de las
notas del grupo B es 1.49 puntos.
2° Forma de hallar la varianza
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la
diferencia elevada al cuadrado).
Grupo NOTAS 𝑋ഥ S
A 14 14 14 14 14 14 14 14 14 14 14 0
B 14 13 15 14 12 15 16 13 12 16 14 1.49
C 19 8 19 11 16 18 6 13 10 20 14 5.08
𝑆𝐴 0
Grupo A: 𝐶𝑉𝐴 = 𝑋 100 = 𝑋 100 = 0
𝑋ഥ 𝐴 14
𝑆𝐵 1.49
𝐶𝑉𝐵 = 𝑋 100 = 𝑋 100 = 10.6%
Grupo B: ഥ
𝑋𝐵 14
𝑆𝐶 5.08
Grupo C: 𝐶𝑉𝐶 = 𝑋 100 = 𝑋 100 = 36.3%
ഥ
𝑋𝐶 14
Esto indica que la variabilidad de la nota de la primera práctica del grupo C es 36.3%
Ejemplo 8:
Halle el coeficiente de variabilidad de las producciones de leche de las vacas del Mantaro y de Yauris
Mantaro Yauris
n 40 vacas 16 vacas
ഥ
𝑿 12.6 10.2
S 2.81 2.84
Que estación experimental tiene el grupo de vacas con producción de leche mas homogénea?
𝑆𝑚 2.81
Mantaro: 𝐶𝑉𝑚 = 𝑋 100 = 𝑋 100 = 22.3%
𝑋ഥ 𝑚 12.6
𝑆𝑦 2.84
𝐶𝑉𝑦 = 𝑋 100 = 𝑋 100 = 27.8%
Yauris: ഥ
𝑋𝑦 10.2
Se concluye que la producción de leche de las vacas del Mantaro es más homogénea que las de Yauris
Estadística descriptiva
bidimensional
Covarianza, R de Pearson
Interpretación
• Cuando los valores altos de una de las variables suelen mayoritariamente corresponderse con los valores
altos de la otra, y lo mismo se verifica para los pequeños valores de una con los de la otra, se corrobora
que tienden a mostrar similar comportamiento lo que se refleja en un valor positivo de la covarianza
Por el contrario, cuando a los mayores valores de una variable suelen corresponder en general los
menores de la otra, expresando un comportamiento opuesto, la covarianza es negativa.
El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal entre las variables.
Formula:
Ejemplo 9:
Hallar la Covarianza entre las variables peso vivo y consumo en vacas de la estación experimental El Mantaro. Se desea
conocer si hay una correlación entre estas dos variables. Se tienen los siguientes datos.
Interpretación
•Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las
dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace
en proporción constante.
•Si 0 < r < 1, existe una correlación positiva.
•Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
•Si -1 < r < 0, existe una correlación negativa.
•Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las
dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en
proporción constante.
Formula:
Ejemplo 11:
Hallar el grado de correlación entre las variables peso vivo y consumo en vacas de la estación experimental El Mantaro.
Se tienen los siguientes datos.