Вы находитесь на странице: 1из 14

ESTADÍSTICA Y

PROBABILIDADES
Prof. HECTOR CHECASACA
Medidas de dispersión
Estas medidas estadísticas nos indican la concentración de los datos alrededor de las
medidas de tendencia central. Nos indican en forma cuantitativa la separación, la dispersión,
la variabilidad de los valores de la distribución respecto al valor central.
Veamos un ejemplo: En el almacén de un taller se busca estudiar la longitud de los tornillos
que se encuentran en 3 cajas diferentes. Todos ellos tienen el mismo diámetro, pero
distinta longitud. Para ello, se saca al azar una muestra de 5 tornillos de cada una de las
cajas. Se observa entonces:

Longitud en mm de los tornillos en la Muestra 1: 15; 14; 16; 13; 17


Longitud en mm de los tornillos en la Muestra 2: 15; 6; 16; 18; 20
Longitud en mm de los tornillos en la Muestra 3: 14; 15; 14; 18; 14

Hallamos el promedio de longitud en las 3 muestras:

15+14+16+13+17
Para la muestra 1: 𝑥1 = = 15
5
15+6+16+18+20
Para la muestra 2: 𝑥2 = = 15
5
14+15+14+18+14
Para la muestra 3: 𝑥3 = = 15
5

El valor promedio para las tres muestras es igual a 15 mm, pero si observas bien los datos
de cada una de las muestras, notarás que tienen diferencias entre ellas.
Veamos esas diferencias:
¿Cuál es el rango de cada muestra? El rango (𝑅) es la diferencia entre el mayor valor y
el menor valor de la muestra. En símbolos: 𝑹 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏 para cada muestra
Entonces: 𝑅1 = 17 − 13 = 4
𝑅2 = 20 − 6 = 14
𝑅3 = 18 − 14 = 4
Vemos que las muestras 1 y 3 tienen el mismo rango, pero la muestra 2 tiene un rango de
datos mayor.

¿Cuál es la desviación del promedio para los datos de cada muestra? La desviación es la
distancia entre cada valor de la muestra y su valor promedio. Como es una distancia , se
halla el valor absoluto de la diferencia entre un dato y el promedio. En símbolos 𝑑 =
𝑥𝑖 − 𝑥ҧ .
𝑥𝑖 15 14 16 13 17
Por ejemplo, en la muestra 1,
en la que e𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑒𝑠 𝑥1 = 15 𝑥 − 𝑥ҧ 0 1 1 2 2
𝑖

Nos interesa conocer la desviación media del promedio , es decir, el promedio de las
desviaciones de cada dato en una muestra con respecto a su promedio.
0+1+1+2+2 6
Para la muestra 1: Desviación media del promedio en la muestra 1= = = 1,2
5 5 2

0+9+1+3+5 15
Para la muestra 2: Desviación media del promedio en la muestra 2= = =3
5 5

1+0+1+3+1 6
Para la muestra 3: Desviación media del promedio en la muestra 3= = = 1,2
5 5

La muestra 2 es la que tiene mayor dispersión entre sus datos.


Has observado que las muestras 1 y 3 tienen los mismos valores de dispersión media de su
promedio.

Para un mejor estudio de las características de dispersión de estas muestras vamos a utilizar
la varianza

¿Qué es la varianza?
Es el promedio del cuadrado de las distancias entre cada dato y el promedio de la muestra.
Se le simboliza como 𝑠 2
𝒙)𝟐
σ𝒊(𝒙𝒊 −ഥ (𝑥1 −𝑥)ҧ 2 + (𝑥2 −𝑥)ҧ 2 + (𝑥3 −𝑥)ҧ 2 + ⋯ (𝑥𝑛 −𝑥)ҧ 2
𝒔𝟐 = =
𝒏 𝑥 𝑛15 14 16 13 17
𝑖

Veamos la varianza de las muestras 1 y 3.


𝑥𝑖 − 𝑥ҧ 0 -1 1 -2 2
Para la muestra 1, sabiendo que 𝒙ഥ = 𝟏𝟓
(𝑥𝑖 −𝑥)ҧ 2 0 1 1 4 4

σ𝑖(𝑥𝑖 −𝑥)ҧ 2 0 + 1 + 1 + 4 + 4 10
𝑠2 = = = =2
𝑛 5 5
ഥ = 𝟏𝟓
Para la muestra 3, con 𝒙
𝑥𝑖 14 15 14 18 14

𝑥𝑖 − 𝑥ҧ -1 0 1 3 -1

(𝑥𝑖 −𝑥)ҧ 2 1 0 1 9 1

σ𝑖(𝑥𝑖 −𝑥)ҧ 2 1 + 0 + 1 + 9 + 1 12
𝑠2 = = = = 2,4
𝑛 5 5

Como la varianza no tiene las mismas unidades que los datos porque está elevada al
cuadrado, se extrae la raíz cuadrada para que las unidades sean correspondientes. El
resultado es también una medida estadística de dispersión. A esa unidad la llamamos
desviación estándar ( s)
σ𝑖(𝑥𝑖 −𝑥)ҧ 2
𝒔 = 𝒔𝟐 =
𝑛
La desviación estándar es un índice numérico de la dispersión de un conjunto de datos
.Mientras mayor es la desviación estándar, mayor es la dispersión de la muestra con respecto
a su valor central
En nuestro ejemplo:
Desviación estándar para la muestra 1: 2 = 1,41 3

Desviación estándar para la muestra 3: 2,4 = 1,55

Esto nos indica que en la muestra 3 los datos están un poco más dispersos que los de
la muestra 1, en relación al promedio aritmético .
La desviación estándar es un indicador muy valioso con muchas aplicaciones. En la práctica
los estadísticos saben que cuando un conjunto de datos se distribuye de manera “normal”, el
68% de las observaciones de la distribución tiene un valor que se encuentra a menos de una
desviación estándar de la media. Esto significa que el 68% de los datos se encuentran en
el intervalo 𝒙ഥ − 𝒔; ഥ𝒙 + 𝒔
Los estadísticos también saben que en una distribución normal, el 96% de todas las
observaciones se encuentra entre la media más o menos dos desviaciones estándar

Frecuen
cia
Imagen tomada de:
http://www.cca.org.mx/cca/c
ursos/estadistica/html/m11/
desviacion_estandar.htm
Valo
r

Cuando los datos están agrupados en intervalos


Si los datos están agrupados, la varianza (𝒔𝟐 ) se calcula usando la siguiente ecuación:

ഥ)𝟐
σ𝒊 𝒇𝒊 (𝒄𝒊 − 𝒙
𝒔𝟐 =
𝒏
Donde:
𝒇𝒊 = frecuencia del intervalo
𝒄𝒊 = marca de clase del intervalo (punto medio del intervalo)
ഥ = promedio de la muestra
𝒙
𝒏 = Número de datos de la muestra.

Por ejemplo, queremos calcular


Talla de la varianza de una muestra de 15 escolares . Los datos
están registrado en la tabla:
zapatos 29-33 34-38 39-43
N° de
alumnos 3 9 3

Elaboramos esta otra tabla con todos los datos que necesitamos:

N° de
Talla de Marca de alumnos Promedio
zapatos clase (𝒄𝒊) ( 𝑓𝑖 ) 𝒄𝒊 ∙ 𝒇 𝒊 𝑥ҧ 𝒄𝒊 − 𝑥ҧ (𝒄𝒊 − 𝑥)2 𝑓𝑖 (𝒄𝒊 − 𝑥)2
29-33 31 3 93 36 31-36= -5 25 75
34-38 36 9 324 36 36-36= 0 0 0
39-43 41 3 123 36 41-36= 5 25 75
Σ = 540 Σ = 150 4

𝑴𝒄𝒊 ∙𝒇𝒊 𝟗𝟑+𝟑𝟐𝟒+𝟏𝟐𝟑 𝟓𝟒𝟎


Como los datos están agrupados, el promedio ഥ =σ𝒊
𝒙 = = = 𝟑𝟔
𝒏 𝟏𝟓 𝟏𝟓

𝒙) 𝟐
σ𝒊 𝒇𝒊 (𝒄𝒊 −ഥ 𝟏𝟓𝟎
Hallamos la varianza 𝒔𝟐 = = = 𝟏𝟎
𝒏 𝟏𝟓
También hallamos la desviación estándar 𝒔= 𝒔𝟐 = 𝟏𝟎 = 𝟑. 𝟏𝟔
Coeficiente de variación de Pearson

El coeficiente de variación de Pearson (𝑪𝑽) Indica la relación existente entre la desviación


𝑠
estándar de una muestra y su promedio . 𝐶𝑉 =
𝑥ҧ

Al dividir la desviación estándar entre el promedio , el resultado no tiene unidad de medida.


Si comparamos la dispersión en varios conjuntos de observaciones tendrá menor
dispersión aquella que tenga menor coeficiente de variación.

El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0,


significa que existe poca variabilidad en los datos y es una muestra muy compacta. En
cambio, si el valor obtenido tiende a 1 se trata de una muestra muy dispersa.

Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en
porcentaje.

Hallemos el coeficiente de variación de Pearson para cada una de las muestras de tornillos
con las que trabajamos en las páginas anteriores:
𝑠 1,41
Para la muestra 1 tenemos que 𝑥ҧ =1,5 y 𝑠 = 1,41 𝐶𝑉 = ҧ = = 0,94
𝑥 1,5

𝑠 1,55
Para la muestra 3: 𝑥ҧ =1,5 y 𝑠 = 1,55 𝐶𝑉 = ҧ = = 1.03
𝑥 1,5

Para la muestra 2: 𝑥ҧ =1,5


Hallamos el valor de la desviación estándar (𝑠). Para esto calculamos primero la varianza:
σ𝑖(𝑥𝑖 −𝑥)ҧ 2 0+81+1+9+25 116
𝑠2 = = = = 23,2 Entonces: 𝒔 = 𝒔𝟐 = 𝟐𝟑, 𝟐 =
𝑛 5 5
𝟒, 𝟖𝟏

Para la muestra 2: 𝑥ҧ =1,5 y 𝑠 = 4,811


𝑠 4,811
𝐶𝑉 = = = 3,21
𝑥ҧ 1,5

Observa que aunque las tres muestras tienen mismo promedio, la que menos dispersión de
datos tiene es la muestra 1, y la que mayor dispersión tiene es la muestra 2.

Las medidas de dispersión nos ayudan a determinar que tan representativo es el


promedio en un conjunto de datos.

5
Ejemplo
En una fábrica de bicicletas se midió la longitud exacta en mm de una muestra de 10
rayos para ruedas de bicicleta. Se obtuvo los siguientes resultados:
269; 274; 269; 268; 272; 270; 269; 270; 268; 271
a) Indica el rango de las longitudes.
b) Calcula el promedio
c) Calcula la varianza y la desviación estándar de la muestra.

Solución
a) El rango es la diferencia entre el mayor y menor valor.
Rango: 274 mm – 268 mm = 6 mm.
268∙2+269∙3+270∙2+271+272+274 2700
b) Calculamos el promedio 𝑥ҧ = = = 270 𝑚𝑚
10 10

c) Elaboramos una tabla para encontrar la varianza

Valor Promedio Desviación de Desviación


𝒙𝒊 ഥ
𝒙 𝑥 cuadrática
𝒙𝒊 − ഥ
𝒙 𝒙 )𝟐
(𝒙𝒊 −ഥ
269 270 1 1

274 270 4 16
269 270 1 1
268 270 2 4
272 270 2 4
270 270 0 0
269 270 1 1

270 270 0 0

268 270 2 4

271 270 1 1
Suma (Σ) 2700 14 32
1 270 1,4 3,2
Σ
𝑛

La varianza(𝑠 2 ) es 3,2𝑚𝑚2 y la desviación estándar (𝑠) es 3,2 = 1,8 𝑚𝑚


Observa que la desviación media es 1,4 𝑚𝑚. 6
Medida de asimetría
Como eje de simetría consideramos una recta paralela al eje de ordenadas (eje Y) que pasa
por la media aritmética o promedio de la distribución de datos.

Se dice que una distribución es simétrica cuando su mediana, su moda y su media aritmética
coinciden. Si una distribución es simétrica, existe el mismo número de valores a la derecha
que a la izquierda de la media, por tanto, el mismo número de desviaciones con signo positivo
que con signo negativo.

Se dice que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de la media es


más larga que la de la izquierda, es decir, si hay valores más separados de la media a la
derecha.

Se dice que hay asimetría negativa (o a la izquierda) si la "cola" a la izquierda de la media es


más larga que la de la derecha, es decir, si hay valores más separados de la media a la
izquierda.

Para calcular la medida de la asimetría de una distribución de datos, vamos a utilizar el


Coeficiente de Asimetría de Pearson:

ഥ −𝑴𝒐
𝒙
𝑨𝒔 =
𝒔
Donde:
𝑥:ҧ promedio o media aritmética
Mo: es la moda de la muestra
𝑠: es la desviación estándar

El signo de este coeficiente de asimetría nos indica la asimetría en la distribución de datos:

• Si el valor es cero la distribución es simétrica.


• Si el valor de As es positivo, entonces existe asimetría a la derecha . 7

• Si el valor de As es negativo, existe asimetría a la izquierda.


Verifica el procesamiento de la información que acabas de leer. Contesta las
siguientes preguntas que luego te servirán para participar en el plenario. No
escribas las respuestas, solo revísalas mentalmente.
Si es necesario, vuelve a leer el material de estudio. Si tienes alguna duda,
anótala para aclararla en el plenario.

1. ¿Qué utilidad tienen las medidas de dispersión?


2. ¿Qué es el rango? ¿Cómo se calcula?
3. ¿Qué es la varianza? ¿Cómo se calcula?
4. ¿Qué relación existe entre la varianza y la desviación estándar?
5. ¿Por qué se prefiere usar la desviación estándar como media de dispersión?
6. ¿Qué regla práctica se cumple para la desviación estándar en una distribución
normal?
7. ¿Cómo se halla la varianza cuando los datos están agrupados?
8. ¿Qué indica el coeficiente de variación de Pearson? ¿Cómo se calcula?
9. ¿Qué indica el coeficiente de asimetría de Pearson? ¿Cómo se calcula?

8
Tu propósito de aprendizaje:
En esta sesión resolverás situaciones relacionadas con las medidas
de dispersión.

1. Se realiza una encuesta a una muestra de 176 personas . La pregunta fue: ¿Cree usted
que la situación política en el próximo año será mejor, igual o peor que en este año?. Se ha
clasificado la respuesta “mejor”, de acuerdo a la edad de los entrevistados.
Completa la siguiente tabla y calcula el promedio de edad en esta muestra, la varianza; la
desviación estándar y el coeficiente de variación para esta muestra. Interpreta el resultado
del coeficiente de variación.
N° de
Edad Marca de personas
(𝑥𝑖 ) clase 𝑓𝑖
15-18 10
18-21 9
21-25 19
25-35 27
35-45 42
45-60 42
60-70 27

9
Cierre de la sesión
Para cerrar la sesión, reflexiona algunos momentos sobre los siguientes
aspectos. Luego participa en el plenario:
1. Qué utilidad tienen las medidas de dispersión?
2. ¿Qué es el rango? ¿Cómo se calcula?
3. ¿Qué es la varianza? ¿Cómo se calcula?
4. ¿Qué es la desviación estándar? ¿Cómo se calcula?
5. ¿Cómo se halla la varianza cuando los datos están agrupados?
6. ¿Qué indica el coeficiente de variación de Pearson? ¿Cómo se calcula?
7. ¿Qué indica el coeficiente de asimetría de Pearson? ¿Cómo se calcula?

Tarea para resolver en casa:


En una tienda de electrodomésticos se tienen los siguientes datos sobre los años de
servicio de sus 15 empleados:
N° de Calcula:
Años de servicio empleados a) El promedio de años de
1 1 servicio
4 2 b) La varianza de la muestra
12 3 c) La desviación estándar de la
14 2 muestra
15 2
17 2
20 3

Responde las siguientes preguntas:


1. ¿Qué utilidad tiene este aprendizaje para tu vida cotidiana?
2. ¿Qué dificultades has encontrado en el desarrollo de esta tarea?

10
Octava sesión. Actividad de
inicio
Trabaja con un compañero o compañera para resolver la siguiente
situación:

El transporte público y el automóvil son los


dos medios que usan los empleados para ir
a su trabajo cada día desde Los Olivos hasta
el centro de Lima. A continuación se
presenta una muestra del tiempo requerido
para transportarse con cada medio. El
tiempo está dado en minutos.
Transporte
público 28 29 32 37 33 25 29 32 41 34
Automóvil 29 31 33 32 34 30 31 32 35 33

a) Calcula la media de tiempo que se


necesita con cada transporte
b) Halla la desviación estándar en cada
grupo y determina cuál de los dos grupos
tiene mayor dispersión en torno a su
promedio.

11
Resuelve con un compañero los siguientes problemas. Consulta
con el material desarrollado en la sesión anterior cuando lo creas
conveniente.

1. Las 10 mejores economías del mundo según datos del Banco Mundial 2013, tienen la
siguientes poblaciones expresadas en millones de habitantes:

a) Calcula el promedio de habitantes en


estos países N° de habitantes
b) Calcula la desviación estándar del País (en millones)
número de habitantes para esta Alemania 81
muestra de países Brasil 200
c) Halla el coeficiente de variación de Canadá 35
Pearson. China 1357
España 47
EEUU 319
Francia 66
Italia 60
Japón 127
Reino Unido 64

12
2. Los siguientes datos corresponden al peso en kilogramos de 10 estudiantes del instituto.
Halla la desviación estándar ; el coeficiente de variación de Pearson y el coeficiente de
asimetría para esta muestra. Interpreta los resultados:

40,8 52,5 49,2 40,8 62,2


52,5 58 60 40,8 52,5

3. Un taller de confecciones tiene la opción de comprar botones de 10mm de diámetro de


dos proveedores que ofrecen el mismo precio. Se tomó una muestra al azar de 12 botones
de cada proveedor para medir el diámetro de cada uno. Halla el diámetro promedio de los
botones de ambos proveedores, los rangos de los diámetros y la desviación estándar del
promedio. ¿Cuál de los dos proveedores trabaja con mayor exactitud?
Proveedor A:
Diámetro 10,16 10,09 9,99 10,03 10,00 10,04 9,85 10,00 10,02 9,95 9,90 9,97
en mm:

Proveedor B:

Diámetro
en mm 10,03 9,90 9,87 10,01 9,99 9,91 10,10 9,85 9,95 10,08 10,15 10,16

13
Cierre de la sesión
Para cerrar la sesión, reflexiona algunos momentos sobre los siguientes
aspectos. Luego participa en el plenario:
1. Qué utilidad tienen las medidas de dispersión?
2. ¿Qué es el rango? ¿Cómo se calcula?
3. ¿Qué es la varianza? ¿Cómo se calcula?
4. ¿Qué es la desviación estándar? ¿Cómo se calcula?
5. ¿Cómo se halla la varianza cuando los datos están agrupados?
6. ¿Qué indica el coeficiente de variación de Pearson? ¿Cómo se calcula?
7. ¿Qué indica el coeficiente de asimetría de Pearson? ¿Cómo se calcula?

Tarea para resolver en casa:


El señor Fernández se pesó todas las mañanas de la semana pasada en una
balanza. Los resultados se encuentran en la siguiente tabla. Calcula la desviación
estándar en el peso del señor Fernández durante esa semana.

Día Peso en kg
Lunes 68,950
Martes 68,900
Miércoles 68,850
Jueves 68,805
Viernes 67,910
Sábado 68,410
Domingo 68,655

Responde las siguientes preguntas:


1. ¿Qué utilidad tiene este aprendizaje para tu vida cotidiana?
2. ¿Qué dificultades has encontrado en el desarrollo de esta tarea?
14

Вам также может понравиться