Вы находитесь на странице: 1из 28

MEDIDAS DE VARIABILIDAD O

DE DISPERSIÓN
Introducción
• Son medidas estadísticas que permiten conocer el grado de
dispersión o variabilidad (homogeneidad o heterogeneidad) dentro
de un conjunto de datos. Cuando los datos presentan baja
variabilidad se dice que son homogéneos y cuando presentan alta son
heterogéneos.
Objetivo:
Calcular e interpretar las principales mediadas de variabilidad para
describir las características (variables cuantitativas) de las unidades
experimentales en términos de su dispersión.
Las principales medidas de variabilidad son las siguientes:
- La amplitud o rango
- El rango intercuartil
- La desviación estándar
- La varianza
- El coeficiente de variabilidad

Ejemplo 1:
Suponga que las notas del primer examen de estadística fueron las siguientes para tres grupos:

Grupo NOTAS 𝑋ഥ
A 14 14 14 14 14 14 14 14 14 14 14
B 14 13 15 14 12 15 16 13 12 16 14
C 19 8 19 11 16 18 6 13 10 20 14

Del cuadro se observa que:


- Los grupos A, B, y C tienen la misma media pero diferente dispersión en torno a la media.
- Respecto a la variabilidad o dispersión: A<B<C
- Respecto a la homogeneidad: A>B>C
- Respecto a la confiabilidad de la media: A>B>C
PRINCIPALES MEDIDAS DE VARIABILIDAD

El Rango
- El rango o amplitud de un conjunto de observaciones es igual a la diferencia entre el valor máximo y el
valor mínimo.

R = Xmáximo – Xmínimo

Desventajas:
- Queda afectada por valores extremos
- No mide la variabilidad de los datos intermedios

Ejemplo 2:
• El rango de la nota para el grupo B es: RB = 16 – 12 = 4 puntos; Para el grupo C es: 20 – 8 = 12 puntos
• Esto indica que la amplitud de la nota del examen del grupo B fue de 4 puntos y para el grupo C es 12 puntos
El Rango Intercuartil
- El rango intercuartil se define como la diferencia entre el percentil 75 (P75 = Q3) y el percentil 25 (P25 = Q1)

RI = P75 – P25

• El RI excluye el 25% mas alto y el 25% mas bajo, dando un rango dentro del cual se encuentra el 50% central de los
datos.
• Un RI pequeño indica alta homogeneidad o pequeña variabilidad dentro del 50% central de los datos

Ejemplo 3:
- Para el grupo C: P75 = 19 y P25 = 9.5, entonces el rango intercuartil: RI = 19 – 9.5 = 9.5 puntos.
- Esto indica que la amplitud del 50% central de las notas del examen de estadística para el grupo C fue 9.5
La Desviación Estándar y la Varianza
• La desviación estándar (σ) mide cuánto se separan los datos.
• Para conocer con detalle un conjunto de datos, no solo basta con conocer las medidas de tendencia
central, sino que necesitamos conocer también la desviación que presentan los datos en su
distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión
de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma
de decisiones.
• La fórmula es fácil:

S=

• Es la raíz cuadrada de la varianza.


Ejemplo 4:
Hallar desviación estándar de las notas de cada uno de los grupos

Grupo NOTAS n ෍ 𝑿𝒊𝟐 ෍ 𝑿𝒊

A 14 14 14 14 14 14 14 14 14 14 10 1960 140
B 14 13 15 14 12 15 16 13 12 16 10 1980 140
C 19 8 19 11 16 18 6 13 10 20 10 2192 140

1402
SA = 1960 − 10
=0
10−1

1402
SB = 1980 − 10
= 1.49
10−1

1402
SC = 2192 − 10
= 5.08
10−1
Utilidad de la desviación estándar
Varianza

• Uno de los conceptos mas importantes en el análisis estadístico y en el control experimental de


variables es la varianza.
• En principio, la varianza es una medida de variabilidad que da cuenta del grado de homogeneidad de
un grupo de observaciones.

La principal función y utilidad que se le puede encontrar a la


varianza es que nos permite saber y determinar qué es normal, qué
es grande, qué es pequeño, aquello que es extra grande o bien
aquello que es extra pequeño.
1° Forma de hallar la varianza

Se observa que la varianza está dada en las mismas unidades que la variable en estudio al cuadrado. Por ejemplo si
las unidades de las observaciones son Kg. entonces la varianza se expresa en Kg al cuadrado.
Ejemplo 5:
Hallar la varianza y desviación estándar de las notas de cada uno de los grupos

10

Grupo NOTAS 𝑋ഥ ෍ 𝑋𝑖 2
𝑖=1

A 14 14 14 14 14 14 14 14 14 14 14 1960
B 14 13 15 14 12 15 16 13 12 16 14 1980
C 19 8 19 11 16 18 6 13 10 20 14 2192

1 1
𝑆𝐴2 = σ10 𝑋𝑖 2 - n𝑋ഥ 2 = ((1960 – (10*142 )) = 0 y 𝑆𝐴 = 0
𝑛−1 𝑖=1 10−1

1 1
𝑆𝐵2 = σ10
𝑖=1 𝑋𝑖 2 - n𝑋ഥ 2 = ((1980 – (10*142 )) = 2.22 y 𝑆𝐵 = 2.22 = 1.49
𝑛−1 10−1
1 1
𝑆𝐶 2 = σ10
𝑖=1 𝑋𝑖 2 - n𝑋ഥ 2 = ((2192 – (10*142 )) = 25.78 y 𝑆𝐶 = 25.78 = 5.08
𝑛−1 10−1

Se observa que a mayor variabilidad entre las observaciones, la varianza es mayor. Esta comparación se
cumple siempre en cuando los promedios sean similares. Se indica que la variabilidad promedio de las
notas del grupo B es 1.49 puntos.
2° Forma de hallar la varianza

• La varianza (que es el cuadrado de la desviación estándar: σ2) se define


así:
• Es la media de las diferencias con la media elevadas al cuadrado.
• En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los números)

2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la
diferencia elevada al cuadrado).

3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al


cuadrado?)
Ejemplo 6:
Se determinaron las alturas de algunas razas de perritos en milímetros
Coeficiente de variabilidad (CV)
• El coeficiente de variabilidad es una medida de dispersión relativa (no tiene unidades). En estadística,
cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable,
se utiliza el coeficiente de variación.
• Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor
interpretación porcentual del grado de variabilidad que la desviación típica o estándar. A mayor valor del
coeficiente de variación mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor
homogeneidad en los valores de la variable.

Coeficiente de variabilidad poblacional: Coeficiente de variabilidad muestral:


Ejemplo 7:
Halle el coeficiente de variabilidad de las notas de cada grupo

Grupo NOTAS 𝑋ഥ S

A 14 14 14 14 14 14 14 14 14 14 14 0
B 14 13 15 14 12 15 16 13 12 16 14 1.49
C 19 8 19 11 16 18 6 13 10 20 14 5.08

𝑆𝐴 0
Grupo A: 𝐶𝑉𝐴 = 𝑋 100 = 𝑋 100 = 0
𝑋ഥ 𝐴 14

𝑆𝐵 1.49
𝐶𝑉𝐵 = 𝑋 100 = 𝑋 100 = 10.6%
Grupo B: ഥ
𝑋𝐵 14

𝑆𝐶 5.08
Grupo C: 𝐶𝑉𝐶 = 𝑋 100 = 𝑋 100 = 36.3%

𝑋𝐶 14

Esto indica que la variabilidad de la nota de la primera práctica del grupo C es 36.3%
Ejemplo 8:
Halle el coeficiente de variabilidad de las producciones de leche de las vacas del Mantaro y de Yauris

Mantaro Yauris
n 40 vacas 16 vacas

𝑿 12.6 10.2
S 2.81 2.84

Que estación experimental tiene el grupo de vacas con producción de leche mas homogénea?
𝑆𝑚 2.81
Mantaro: 𝐶𝑉𝑚 = 𝑋 100 = 𝑋 100 = 22.3%
𝑋ഥ 𝑚 12.6

𝑆𝑦 2.84
𝐶𝑉𝑦 = 𝑋 100 = 𝑋 100 = 27.8%
Yauris: ഥ
𝑋𝑦 10.2

Se concluye que la producción de leche de las vacas del Mantaro es más homogénea que las de Yauris
Estadística descriptiva
bidimensional
Covarianza, R de Pearson

Para realizar la comparación de dos variables, necesitamos nuevos


estadísticos para poder medir la correlación que hay entre ellas.
Cuando nos referimos a correlación, estamos refiriéndonos a relación que hay
entre las variables.
Por ejemplo, es intuitivo pensar que a mayor altura que tenga una persona,
mayor será su peso. En este momento estamos buscando los estadísticos que
nos den esa relación.
Covarianza
En probabilidad y estadística, la covarianza es un valor que indica el grado de variación conjunta de
dos variables aleatorias respecto a sus medias. Es el dato básico para determinar si existe una dependencia
entre ambas variables.

Interpretación
• Cuando los valores altos de una de las variables suelen mayoritariamente corresponderse con los valores
altos de la otra, y lo mismo se verifica para los pequeños valores de una con los de la otra, se corrobora
que tienden a mostrar similar comportamiento lo que se refleja en un valor positivo de la covarianza
Por el contrario, cuando a los mayores valores de una variable suelen corresponder en general los
menores de la otra, expresando un comportamiento opuesto, la covarianza es negativa.

El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal entre las variables.
Formula:
Ejemplo 9:
Hallar la Covarianza entre las variables peso vivo y consumo en vacas de la estación experimental El Mantaro. Se desea
conocer si hay una correlación entre estas dos variables. Se tienen los siguientes datos.

Vacas Peso Vivo (Kg) Consumo (kg) Xi . Yi


1 478 46.2 22083.6
2 456 34.7 15823.2
3 543 52.6 28561.8
4 498 49 24402
5 439 41.2 18086.8
6 471 46.1 21713.1
217462.7
7 453 41.5 18799.5 Sx𝑦 = − 476.2 𝑥 45.36 = 145.8
10
8 485 50.3 24395.5
9 438 39.6 17344.8 En este caso, se ve que hay una
10 501 52.4 26252.4 relación directa (a mayor valor
de la variable X mayor valor de
ഥ = 476.2
𝑿 ഥ = 45.36
𝑿 σ10
𝑖=1 𝑋𝑖. 𝑌𝑖 = 217462.7 la Variable Y)
Ejemplo 10:
Hallar la Covarianza entre las variables peso vivo y producción de leche en vacas de la estación experimental El Mantaro.
Se desea conocer si hay una correlación entre estas dos variables. Se tienen los siguientes datos.

Vacas Peso Vivo (Kg) P. Leche (litros) Xi . Yi


1 478 17.4 8317.2
2 456 18.5 8436
3 543 12.5 6787.5
4 498 13.1 6523.8
5 439 19.3 8472.7
6 471 20.2 9514.2
80703
7 453 21.1 9558.3 Sx𝑦 = − 476.2 𝑥 17.15 = − 96.53
10
8 485 15.7 7614.5
9 438 22.3 9767.4 En este caso, se ve que hay una
10 501 11.4 relación indirecta (a mayor valor
5711.4
de la variable X menor valor de
ഥ = 476.2
𝑿 ഥ = 17.15
𝑿 10
la Variable Y)
෍ 𝑋𝑖. 𝑌𝑖 = 𝟖𝟎𝟕𝟎𝟑
𝑖=1
Coeficiente de correlación de Pearson
Al igual que la covarianza, se utiliza para comprobar la relación entre dos variables, pero ésta tiene un valor
comprendido entre -1 y 1. El signo indica si la relación es directa o indirecta y el valor indica cuánto
relacionadas están las variables, si es cercano a -1 o 1 indica que hay relación fuerte(o en valor absoluto
cercano a 1), si es cercana a cero relación débil (en la practica se considerará fuerte cuando sea menor que -
0,8 o mayor que 0,8).

Interpretación
•Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las
dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace
en proporción constante.
•Si 0 < r < 1, existe una correlación positiva.
•Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
•Si -1 < r < 0, existe una correlación negativa.
•Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las
dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en
proporción constante.
Formula:
Ejemplo 11:
Hallar el grado de correlación entre las variables peso vivo y consumo en vacas de la estación experimental El Mantaro.
Se tienen los siguientes datos.

Vacas Peso Vivo (Kg) Consumo (kg) Xi . Yi


1 478 46.2 22083.6
2 456 34.7 15823.2
3 543 52.6 28561.8
4 498 49 24402
5 439 41.2 18086.8
6 471 46.1 21713.1
4762 𝑥 453.6
7 453 41.5 18799.5 217462.7 − 10
r= = 0.838
8 485 50.3 24395.5 47622 453.62
2277114 − 10 20895.2 − 10
9 438 39.6 17344.8
10 501 52.4 26252.4 Como el valor absoluto es mayor que 0,8
se considera que hay una relación fuerte,
σ 𝑋𝑖= 4762 σ 𝑌𝑖= 453.6 σ10
𝑖=1 𝑋𝑖. 𝑌𝑖 = 217462.7 es decir, el consumo influye en el peso
σ 𝑋𝑖 2 = 2277114 σ 𝑌𝑖 2 = 20895.2 vivo, y además al ser positiva (relación
directa), a más consumo mayor peso vivo.
Ejemplo 12: Tarea para la clase
Hallar el grado de correlación entre las variables peso vivo y Producción de leche en vacas de la estación experimental El
Mantaro. Se tienen los siguientes datos.

Vacas Peso Vivo (Kg) Consumo (kg) Xi . Yi


1 478 17.4
2 456 18.5
3 543 12.5
4 498 13.1
5 439 19.3
6 471 20.2
7 453 21.1 ……..−
4762 𝑥 171.5
10
8 485 15.7 r= = −0.867
47622 171.52
2277114 − ……..−
10 10
9 438 22.3
10 501 11.4 Como el valor absoluto es -0,867 se
considera que hay una relación fuerte, es
σ 𝑋𝑖= 4762 σ 𝑌𝑖= 171.5 σ10
𝑖=1 𝑋𝑖. 𝑌𝑖 = 80703 decir, la producción de leche influye
σ 𝑋𝑖 2 =2277114 σ 𝑌𝑖 2 = 3072.35 negativamente en el peso vivo, y además
al ser negativa (relación indirecta), a más
producción de leche menor peso vivo.

Вам также может понравиться