Академический Документы
Профессиональный Документы
Культура Документы
PROBABILIDADES
Prof. HECTOR CHECASACA
Medidas de dispersión
Estas medidas estadísticas nos indican la concentración de los datos alrededor de las
medidas de tendencia central. Nos indican en forma cuantitativa la separación, la dispersión,
la variabilidad de los valores de la distribución respecto al valor central.
Veamos un ejemplo: En el almacén de un taller se busca estudiar la longitud de los tornillos
que se encuentran en 3 cajas diferentes. Todos ellos tienen el mismo diámetro, pero
distinta longitud. Para ello, se saca al azar una muestra de 5 tornillos de cada una de las
cajas. Se observa entonces:
15+14+16+13+17
Para la muestra 1: 𝑥1 = = 15
5
15+6+16+18+20
Para la muestra 2: 𝑥2 = = 15
5
14+15+14+18+14
Para la muestra 3: 𝑥3 = = 15
5
El valor promedio para las tres muestras es igual a 15 mm, pero si observas bien los datos
de cada una de las muestras, notarás que tienen diferencias entre ellas.
Veamos esas diferencias:
¿Cuál es el rango de cada muestra? El rango (𝑅) es la diferencia entre el mayor valor y
el menor valor de la muestra. En símbolos: 𝑹 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏 para cada muestra
Entonces: 𝑅1 = 17 − 13 = 4
𝑅2 = 20 − 6 = 14
𝑅3 = 18 − 14 = 4
Vemos que las muestras 1 y 3 tienen el mismo rango, pero la muestra 2 tiene un rango de
datos mayor.
¿Cuál es la desviación del promedio para los datos de cada muestra? La desviación es la
distancia entre cada valor de la muestra y su valor promedio. Como es una distancia , se
halla el valor absoluto de la diferencia entre un dato y el promedio. En símbolos 𝑑 =
𝑥𝑖 − 𝑥ҧ .
𝑥𝑖 15 14 16 13 17
Por ejemplo, en la muestra 1,
en la que e𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑒𝑠 𝑥1 = 15 𝑥 − 𝑥ҧ 0 1 1 2 2
𝑖
Nos interesa conocer la desviación media del promedio , es decir, el promedio de las
desviaciones de cada dato en una muestra con respecto a su promedio.
0+1+1+2+2 6
Para la muestra 1: Desviación media del promedio en la muestra 1= = = 1,2
5 5 2
0+9+1+3+5 15
Para la muestra 2: Desviación media del promedio en la muestra 2= = =3
5 5
1+0+1+3+1 6
Para la muestra 3: Desviación media del promedio en la muestra 3= = = 1,2
5 5
Para un mejor estudio de las características de dispersión de estas muestras vamos a utilizar
la varianza
¿Qué es la varianza?
Es el promedio del cuadrado de las distancias entre cada dato y el promedio de la muestra.
Se le simboliza como 𝑠 2
𝒙)𝟐
σ𝒊(𝒙𝒊 −ഥ (𝑥1 −𝑥)ҧ 2 + (𝑥2 −𝑥)ҧ 2 + (𝑥3 −𝑥)ҧ 2 + ⋯ (𝑥𝑛 −𝑥)ҧ 2
𝒔𝟐 = =
𝒏 𝑥 𝑛15 14 16 13 17
𝑖
σ𝑖(𝑥𝑖 −𝑥)ҧ 2 0 + 1 + 1 + 4 + 4 10
𝑠2 = = = =2
𝑛 5 5
ഥ = 𝟏𝟓
Para la muestra 3, con 𝒙
𝑥𝑖 14 15 14 18 14
𝑥𝑖 − 𝑥ҧ -1 0 1 3 -1
(𝑥𝑖 −𝑥)ҧ 2 1 0 1 9 1
σ𝑖(𝑥𝑖 −𝑥)ҧ 2 1 + 0 + 1 + 9 + 1 12
𝑠2 = = = = 2,4
𝑛 5 5
Como la varianza no tiene las mismas unidades que los datos porque está elevada al
cuadrado, se extrae la raíz cuadrada para que las unidades sean correspondientes. El
resultado es también una medida estadística de dispersión. A esa unidad la llamamos
desviación estándar ( s)
σ𝑖(𝑥𝑖 −𝑥)ҧ 2
𝒔 = 𝒔𝟐 =
𝑛
La desviación estándar es un índice numérico de la dispersión de un conjunto de datos
.Mientras mayor es la desviación estándar, mayor es la dispersión de la muestra con respecto
a su valor central
En nuestro ejemplo:
Desviación estándar para la muestra 1: 2 = 1,41 3
Esto nos indica que en la muestra 3 los datos están un poco más dispersos que los de
la muestra 1, en relación al promedio aritmético .
La desviación estándar es un indicador muy valioso con muchas aplicaciones. En la práctica
los estadísticos saben que cuando un conjunto de datos se distribuye de manera “normal”, el
68% de las observaciones de la distribución tiene un valor que se encuentra a menos de una
desviación estándar de la media. Esto significa que el 68% de los datos se encuentran en
el intervalo 𝒙ഥ − 𝒔; ഥ𝒙 + 𝒔
Los estadísticos también saben que en una distribución normal, el 96% de todas las
observaciones se encuentra entre la media más o menos dos desviaciones estándar
Frecuen
cia
Imagen tomada de:
http://www.cca.org.mx/cca/c
ursos/estadistica/html/m11/
desviacion_estandar.htm
Valo
r
ഥ)𝟐
σ𝒊 𝒇𝒊 (𝒄𝒊 − 𝒙
𝒔𝟐 =
𝒏
Donde:
𝒇𝒊 = frecuencia del intervalo
𝒄𝒊 = marca de clase del intervalo (punto medio del intervalo)
ഥ = promedio de la muestra
𝒙
𝒏 = Número de datos de la muestra.
Elaboramos esta otra tabla con todos los datos que necesitamos:
N° de
Talla de Marca de alumnos Promedio
zapatos clase (𝒄𝒊) ( 𝑓𝑖 ) 𝒄𝒊 ∙ 𝒇 𝒊 𝑥ҧ 𝒄𝒊 − 𝑥ҧ (𝒄𝒊 − 𝑥)2 𝑓𝑖 (𝒄𝒊 − 𝑥)2
29-33 31 3 93 36 31-36= -5 25 75
34-38 36 9 324 36 36-36= 0 0 0
39-43 41 3 123 36 41-36= 5 25 75
Σ = 540 Σ = 150 4
𝒙) 𝟐
σ𝒊 𝒇𝒊 (𝒄𝒊 −ഥ 𝟏𝟓𝟎
Hallamos la varianza 𝒔𝟐 = = = 𝟏𝟎
𝒏 𝟏𝟓
También hallamos la desviación estándar 𝒔= 𝒔𝟐 = 𝟏𝟎 = 𝟑. 𝟏𝟔
Coeficiente de variación de Pearson
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en
porcentaje.
Hallemos el coeficiente de variación de Pearson para cada una de las muestras de tornillos
con las que trabajamos en las páginas anteriores:
𝑠 1,41
Para la muestra 1 tenemos que 𝑥ҧ =1,5 y 𝑠 = 1,41 𝐶𝑉 = ҧ = = 0,94
𝑥 1,5
𝑠 1,55
Para la muestra 3: 𝑥ҧ =1,5 y 𝑠 = 1,55 𝐶𝑉 = ҧ = = 1.03
𝑥 1,5
Observa que aunque las tres muestras tienen mismo promedio, la que menos dispersión de
datos tiene es la muestra 1, y la que mayor dispersión tiene es la muestra 2.
5
Ejemplo
En una fábrica de bicicletas se midió la longitud exacta en mm de una muestra de 10
rayos para ruedas de bicicleta. Se obtuvo los siguientes resultados:
269; 274; 269; 268; 272; 270; 269; 270; 268; 271
a) Indica el rango de las longitudes.
b) Calcula el promedio
c) Calcula la varianza y la desviación estándar de la muestra.
Solución
a) El rango es la diferencia entre el mayor y menor valor.
Rango: 274 mm – 268 mm = 6 mm.
268∙2+269∙3+270∙2+271+272+274 2700
b) Calculamos el promedio 𝑥ҧ = = = 270 𝑚𝑚
10 10
274 270 4 16
269 270 1 1
268 270 2 4
272 270 2 4
270 270 0 0
269 270 1 1
270 270 0 0
268 270 2 4
271 270 1 1
Suma (Σ) 2700 14 32
1 270 1,4 3,2
Σ
𝑛
Se dice que una distribución es simétrica cuando su mediana, su moda y su media aritmética
coinciden. Si una distribución es simétrica, existe el mismo número de valores a la derecha
que a la izquierda de la media, por tanto, el mismo número de desviaciones con signo positivo
que con signo negativo.
ഥ −𝑴𝒐
𝒙
𝑨𝒔 =
𝒔
Donde:
𝑥:ҧ promedio o media aritmética
Mo: es la moda de la muestra
𝑠: es la desviación estándar
8
Tu propósito de aprendizaje:
En esta sesión resolverás situaciones relacionadas con las medidas
de dispersión.
1. Se realiza una encuesta a una muestra de 176 personas . La pregunta fue: ¿Cree usted
que la situación política en el próximo año será mejor, igual o peor que en este año?. Se ha
clasificado la respuesta “mejor”, de acuerdo a la edad de los entrevistados.
Completa la siguiente tabla y calcula el promedio de edad en esta muestra, la varianza; la
desviación estándar y el coeficiente de variación para esta muestra. Interpreta el resultado
del coeficiente de variación.
N° de
Edad Marca de personas
(𝑥𝑖 ) clase 𝑓𝑖
15-18 10
18-21 9
21-25 19
25-35 27
35-45 42
45-60 42
60-70 27
9
Cierre de la sesión
Para cerrar la sesión, reflexiona algunos momentos sobre los siguientes
aspectos. Luego participa en el plenario:
1. Qué utilidad tienen las medidas de dispersión?
2. ¿Qué es el rango? ¿Cómo se calcula?
3. ¿Qué es la varianza? ¿Cómo se calcula?
4. ¿Qué es la desviación estándar? ¿Cómo se calcula?
5. ¿Cómo se halla la varianza cuando los datos están agrupados?
6. ¿Qué indica el coeficiente de variación de Pearson? ¿Cómo se calcula?
7. ¿Qué indica el coeficiente de asimetría de Pearson? ¿Cómo se calcula?
10
Octava sesión. Actividad de
inicio
Trabaja con un compañero o compañera para resolver la siguiente
situación:
11
Resuelve con un compañero los siguientes problemas. Consulta
con el material desarrollado en la sesión anterior cuando lo creas
conveniente.
1. Las 10 mejores economías del mundo según datos del Banco Mundial 2013, tienen la
siguientes poblaciones expresadas en millones de habitantes:
12
2. Los siguientes datos corresponden al peso en kilogramos de 10 estudiantes del instituto.
Halla la desviación estándar ; el coeficiente de variación de Pearson y el coeficiente de
asimetría para esta muestra. Interpreta los resultados:
Proveedor B:
Diámetro
en mm 10,03 9,90 9,87 10,01 9,99 9,91 10,10 9,85 9,95 10,08 10,15 10,16
13
Cierre de la sesión
Para cerrar la sesión, reflexiona algunos momentos sobre los siguientes
aspectos. Luego participa en el plenario:
1. Qué utilidad tienen las medidas de dispersión?
2. ¿Qué es el rango? ¿Cómo se calcula?
3. ¿Qué es la varianza? ¿Cómo se calcula?
4. ¿Qué es la desviación estándar? ¿Cómo se calcula?
5. ¿Cómo se halla la varianza cuando los datos están agrupados?
6. ¿Qué indica el coeficiente de variación de Pearson? ¿Cómo se calcula?
7. ¿Qué indica el coeficiente de asimetría de Pearson? ¿Cómo se calcula?
Día Peso en kg
Lunes 68,950
Martes 68,900
Miércoles 68,850
Jueves 68,805
Viernes 67,910
Sábado 68,410
Domingo 68,655