Вы находитесь на странице: 1из 22

ESTADÍSTICA Y PROBABILIDADES

TEMA: MEDIDAS DE DISPERSIÓN


Docente: Ing. Wilder Luis Balbín Chuquillanqui
2017-II
III
III
Concepto:
• Miden el grado de dispersión o diseminación de
los datos
• Dos conjuntos de datos pueden diferir tanto en
tendencia central como en dispersión
• Dos conjuntos de datos pueden tener las mismas
medidas de tendencia central, pero diferir mucho
en términos de dispersión

Ejm:
Validez y confiabilidad en las medidas de dispersión

• Un procedimiento de medición será confiable


en la medida en que proporciona datos con
poca variación.
• Si el proceso es válido mide lo que se desea
medir, por tanto disponer de un
procedimiento de medición válido y confiable
será muy deseable.
• Por ejemplo, una prueba con elevada
confiabilidad y validez medirá el conocimiento
que se pretende evaluar de manera repetible
cuando se aplique una y otra vez
Concepto estadístico de dispersión
• El la medida de la distancia de alejamiento de los datos respecto a su media.

𝑑3
𝑑1
𝑑=
𝑑4
𝑑2

𝑋
𝒊=𝒏
𝒅𝒕 = 𝒅𝟏 + 𝒅𝟐 +𝒅𝟑 +….. 𝒅𝒏 = 𝒊=𝟎(𝒙𝒊 −𝒙) =𝟎

• La suma de las desviaciones respecto a la media siempre es igual a cero


Cuantificación de la dispersión:
• Las medidas de dispersión cuantifican la separación, la
dispersión, la variabilidad de los valores de la
distribución respecto al valor central denominado
Media 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑚𝑒𝑛𝑜𝑠𝑑𝑖𝑠𝑝𝑒𝑟𝑠𝑎
• Llamaremos dispersión, a la mayor o menor separación 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑚á𝑠 𝑑𝑖𝑠𝑝𝑒𝑟𝑠𝑎
de los valores de la muestra, respecto de las medidas
de centralización que hayamos calculado.

Tipos de medidas de dispersión:


RANGO

DESVIACIÓN MEDIA
ABSOLUTAS
VARIANZA
No son comparables entre diferentes muestras
MEDIDAS DE
DISPERSIÓN DESVIACIÓN ESTANDAR

RELATIVAS COEFICIENTE DE VARIACIÓN Nos permiten comparar


varias muestras
a. Rango:
Indica el número de valores que toma la variable. El rango es la diferencia entre el valor
máximo y el valor mínimo de un conjunto de datos
Sólo es válido para datos numéricos. No cuenta
absolutamente nada sobre la distribución de los datos
dentro del mismo

DATOS NO AGRUPADOS 𝑅 = 𝐷𝑎𝑡𝑜𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜𝑚𝑒𝑛𝑜𝑟 = 𝑥𝑚𝑎𝑥 − 𝑥min


RANGO
(R)
DATOS AGRUPADOS 𝑅 = 𝐿𝑅𝑆𝐶𝑚𝑎𝑥 − 𝐿𝑅𝐼𝐶𝑚𝑖𝑛

 𝐿𝑅𝑆𝐶𝑚𝑎𝑥 :Límite real superior


del último intervalo
 𝐿𝑅𝐼𝐶𝑚𝑖𝑛 :Límite real inferior del
primer intervalo.
EJEMPLO: Ejemplo:
Hallar el Rango de los datos no Se monitorea la concentración de un metal
agrupados pesado en ppm, obteniéndose
200.23 145.81
178.15 133.9
13 25 57 48 69 89 38 70 45 100 149.11
176.59
211.64
124.45
194.58 144.32
13 157.21 174.38 𝑅𝑎𝑛𝑔𝑜 = 252.975 − 121.035 = 131.94
121.04 193.2
25 139.45 201.55
38 174.73 147.83
45 230.99 212.71

48 Rango 87 IC LRC
57 m LIC LSC LRIC LRSC xi fi
0 99.05 121.03 99.045 121.035 110.04 0
69 1 121.04 143.02 121.035 143.025 132.03 4
70 2 143.03 165.01 143.025 165.015 154.02 5
89 3 165.02 187 165.015 187.005 176.01 4
100 4 187.01 208.99 187.005 208.995 198 4
5 209 230.98 208.995 230.985 219.99 2
6 230.99 252.97 230.985 252.975 241.98 1
7 252.98 274.96 252.975 274.965 263.97 0

El rango mide "la dispersión total" del conjunto de datos. Aunque el rango es una medida de dispersión simple y
que se calcula con facilidad, su debilidad preponderante es que no toma en consideración la forma en que se
distribuyen los datos entre los valores más pequeños y los más grandes.
B. Desviación Media 𝑥 es el promedio
𝑥𝑖 es la marca de clase
Equivale a la división de la sumatoria del valor absoluto
de las distancias existentes entre cada dato y su media
aritmética y el número total de datos
𝑖=𝑛
DATOS NO AGRUPADOS 1
𝐷𝑀 = 𝑥𝑖 − 𝑥
EN TABLAS DE 𝑛
FRECUENCIA 𝐼=1

Desviación media (DM)


DATOS NO AGRUPADOS 𝑖=𝑛
1
EN TABLAS DE 𝐷𝑀 = 𝑥𝑖 − 𝑥 𝑓𝑖
FRECUENCIA 𝑛
𝐼=1

Entiéndase por datos no agrupados en tablas de


frecuencia aquellos que no tienen cuadro de distribución
de frecuencias. Es decir datos sueltos
Ejemplo:
Hallar la desviación media de las siguientes observaciones no
agrupados en intervalos de agrupación
11 13 11 12 11 9 11 11 16 10 13 12 12
11 12 11 11 13 12 10 10 11 12 13 11 16
15 15 11 10 15 12 12 15 12 10 9

n 37
dato mayor 16
dato menor 9

x(prom) 11.919
N° CLASE (xi) fi hi |xi-x|*fi DM 1.381
1 9 2 0.05 5.838
2 10 5 0.14 9.595
3 11 11 0.3 10.109 𝑖=𝑛
1 51.081
4 12 9 0.24 0.729 𝐷𝑀 = 𝑥𝑖 − 𝑥 ∗ 𝑓𝑖 = = 1.38
5 13 4 0.11 4.324 𝑛 37
𝐼=1
6 15 4 0.11 12.324
7 16 2 0.05 8.162
37 1 51.081
Ejemplo: Se monitorea la concentración de un metal pesado en ppm, hallar
la DM
200.23 145.81
178.15 133.9
149.11 211.64 IC LRC
176.59 124.45 m LIC LSC LRIC LRSC xi fi fi*xi |xi-x|*fi
194.58 144.32 0 99.05 121.03 99.045 121.035 110.04 0 0 0
157.21 174.38
1 121.04 143.02 121.035 143.025 132.03 4 528.12 167.124
121.04 193.2
139.45 201.55 2 143.03 165.01 143.025 165.015 154.02 5 770.1 98.955
174.73 147.83 3 165.02 187 165.015 187.005 176.01 4 704.04 8.796
230.99 212.71 4 187.01 208.99 187.005 208.995 198 4 792 96.756
5 209 230.98 208.995 230.985 219.99 2 439.98 92.358
n 20
6 230.99 252.97 230.985 252.975 241.98 1 241.98 68.169
DATO MAY 230.99
DATO MEN 121.04 7 252.98 274.96 252.975 274.965 263.97 0 0 0
R 109.95 20 3476.22 532.158
m 5
a 21.99

1 𝑖=𝑛 532.158 x(prom) 173.811 DM 26.6079


𝐷𝑀 = 𝐼=1 𝑥𝑖 − 𝑥 𝑓𝑖 = =26.6079
𝑛 20
c. varianza La varianza se define como el promedio aritmético de las diferencias entre cada uno de
los valores del conjunto de datos y la media aritmética del conjunto elevadas al
cuadrado.
• La varianza mide la
mayor o menor 𝑖=𝑁
dispersión de los 1
DATOS NO AGRUPADOS EN TABLAS 𝛿2 = 𝑥𝑖 − 𝑢 2
valores de la variable DE FRECUENCIA 𝑁−1
𝐼=1
respecto a la media
aritmética. POBLACIÓN (𝛿 2 )
• Cuanto mayor sea la
𝑖=𝑚
varianza mayor 1
DATOS AGRUPADOS EN TABLAS DE 𝛿2 = 𝑥𝑖 − 𝑢 2
𝑓𝑖
dispersión existirá y 𝑁−1
FRECUENCIA 𝐼=1
por tanto menor
representatividad
tendrá la media varianza
aritmética. 𝑖=𝑛
1
• La varianza se DATOS NO AGRUPADOS EN TABLAS DE 𝑆2 = 𝑥𝑖 − 𝑥 2
FRECUENCIA 𝑛−1
expresa en las mismas 𝐼=1

unidades que la
variable analizada, MUESTRA(𝑆 2 )
pero elevadas al
cuadrado. DATOS AGRUPADOS EN TABLAS DE
1
𝑖=𝑚

• La varianza siempre FRECUENCIA 𝑆2 = 𝑥𝑖 − 𝑥 2


𝑓𝑖
𝑛−1
es mayor o igual que 𝐼=1

cero y menor que Las unidades de medida de la varianza son las


infinito unidades del cuadrado de los datos.
Ejemplo: Hallar la varianza de las siguientes observaciones

11 13 11 12 11 9 11 11 16 10 13 12 12
11 12 11 11 13 12 10 10 11 12 13 11 16
15 15 11 10 15 12 12 15 12 10 9

N° CLASE (xi) fi hi (xi-x)^2*fi


1 9 2 0.05 17.041
2 10 5 0.14 18.413
3 11 11 0.3 9.29
4 12 9 0.24 0.059
5 13 4 0.11 4.674
6 15 4 0.11 37.97
7 16 2 0.05 33.309
37 1 120.756 Var 3.354

𝑖=𝑛
2
1 2
120.756
𝑆 = 𝑥𝑖 − 𝑥 ∗ 𝑓𝑖 = = 3.354
𝑛−1 37 − 1
𝐼=1
Ejemplo: Se monitorea la concentración de un metal pesado en ppm,
hallar la varianza n 20
DATO MAY 230.99
DATO MEN 121.04
R 109.95
m 5
x(prom) 173.811
a 21.99
200.23 145.81 IC LRC
178.15 133.9 m LIC LSC LRIC LRSC xi fi fi*xi |xi-x|*fi (xi-x)^2 *fi
149.11 211.64
0 99.05 121.03 99.045 121.035 110.04 0 0 0 0
176.59 124.45
1 121.04 143.02 121.035 143.025 132.03 4 528.12 167.124 6982.608
194.58 144.32
157.21 174.38 2 143.03 165.01 143.025 165.015 154.02 5 770.1 98.955 1958.418
121.04 193.2 3 165.02 187 165.015 187.005 176.01 4 704.04 8.796 19.342
139.45 201.55 4 187.01 208.99 187.005 208.995 198 4 792 96.756 2340.431
174.73 147.83 5 209 230.98 208.995 230.985 219.99 2 439.98 92.358 4265
230.99 212.71 6 230.99 252.97 230.985 252.975 241.98 1 241.98 68.169 4647.013
7 252.98 274.96 252.975 274.965 263.97 0 0 0 0
20 3476.22 532.158 20212.812

var 1063.83221

1 𝑖=𝑛 20212.812
𝑆 2 = 𝑛−1 𝐼=1 𝑥𝑖 − 𝑥 2
∗ 𝑓𝑖 = = 1063.8322 𝑝𝑝𝑚2
20−1
Es la raíz cuadrada positiva de la Varianza
d. Desviación estándar
• Es la medida de variabilidad 𝑖=𝑁
1
utilizada con más frecuencia en DATOS NO AGRUPADOS EN 𝛿= 𝑥𝑖 − 𝑢 2
𝑁−1
la investigación por ser la más TABLAS DE FRECUENCIA 𝐼=1

estable de todas y se basa en los


desvíos de los datos originales POBLACIÓN (𝛿)
con respecto a la media x.
• Se define como la raíz cuadrada 1
𝑖=𝑚

𝛿= 𝑥𝑖 − 𝑢 2𝑓
con signo positivo de la varianza. DATOS AGRUPADOS EN TABLAS 𝑁−1 𝑖
DE FRECUENCIA 𝐼=1

DESVIACIÓN ESTANDAR
𝑖=𝑛
1 2
DATOS NO AGRUPADOS EN TABLAS 𝑆= 𝑥𝑖 − 𝑥
𝑛−1
DE FRECUENCIA 𝐼=1

MUESTRA(𝑆)
𝑖=𝑚
DATOS AGRUPADOS EN TABLAS 1
DE FRECUENCIA 𝑆= 𝑥𝑖 − 𝑥 2 𝑓𝑖
𝑛−1
𝐼=1
Comportamiento de la desviación estándar
del Ejemplo anterior: n
DATO MAY
DATO MEN
20
230.99
121.04
R 109.95
m 5
a 21.99 x(prom) 173.811

200.23 145.81 IC LRC


178.15 133.9 m LIC LSC LRIC LRSC xi fi fi*xi |xi-x|*fi (xi-x)^2 *fi
149.11 211.64
0 99.05 121.03 99.045 121.035 110.04 0 0 0 0
176.59 124.45
1 121.04 143.02 121.035 143.025 132.03 4 528.12 167.124 6982.608
194.58 144.32
157.21 174.38 2 143.03 165.01 143.025 165.015 154.02 5 770.1 98.955 1958.418
121.04 193.2 3 165.02 187 165.015 187.005 176.01 4 704.04 8.796 19.342
139.45 201.55 4 187.01 208.99 187.005 208.995 198 4 792 96.756 2340.431
174.73 147.83 5 209 230.98 208.995 230.985 219.99 2 439.98 92.358 4265
230.99 212.71 6 230.99 252.97 230.985 252.975 241.98 1 241.98 68.169 4647.013
7 252.98 274.96 252.975 274.965 263.97 0 0 0 0
20 3476.22 532.158 20212.812

var 1063.83221 ppm^2

des es(S) 32.6164408 ppm Sacando la raíz cuadrada


Interpretación de la varianza y la desviación estándar
• La varianza tiene ciertas propiedades matemáticas útiles. Sin embargo, al
calcularla se obtienen unidades al cuadrado (𝑆 2 ) 𝑐𝑚2 , 𝑝𝑢𝑙𝑔𝑎𝑑𝑎𝑠 2 , 𝑚𝑚2 ,
𝑒𝑑𝑎𝑑𝑒𝑠 2 , ℎ𝑜𝑟𝑎𝑠 2 , etc. por ello, en la práctica, la principal medida de
dispersión que se utiliza es la desviación estándar, cuyo valor está dado en las
unidades originales : cm, pulgadas, mm, edades, horas, etc.
• La varianza y la desviación estándar miden la dispersión "promedio" en torno
a la media aritmética, es decir, cómo fluctúan las observaciones mayores por
encima de la media aritmética y cómo se distribuyen las observaciones
menores por debajo de ella.
INTERPRETANDO EL EJEMPLO ANTERIOR: La varianza del ejemplo anterior es de 32.6164 ppm significa que la mayor
cantidad de datos varía entre 206.43 ppm (32.6164+173.811) y 141.19 ppm (173.811-32.6184)
Ejemplo de interpretación de la desviación estándar
Para julio del 2016 la media de la concentración de plomo de un río era
0,221 ppm mientras que para el 2017 alcanzaba 0,276 ppm. El cálculo
de la desviación estándar de las concentraciones en el río para los años
correspondientes son: 𝑆2016 = 0,048 𝑝𝑝𝑚 y 𝑆2017 = 0,077 ppm . Estos
valores nos permiten apreciar la consistencia de la concentración de
plomo en el río . El mayor valor de la desviación estándar indica que
hay mayor variabilidad en torno a la media en el año 2017 y podemos
concluir que en el año 2016 se ha tenido una mejor gestión en
controlar la segregación al río de dicho metal pesado.
𝑆 = 0.048 𝑆 = 0.048
2016
𝑥 − 𝑠 = 0.173 𝑥 = 0.221 𝑥 + 𝑠 = 0.269

2017 𝑆 = 0.077 𝑆 = 0.077

𝑥 − 𝑠 = 0.199 𝑥 = 0.276 𝑥 + 𝑠 = 0.353


Homogeneidad y heterogeneidad de los datos:
Una distribución se considera homogénea (DATOS CONCENTRADOS), si la desviación
estándar se encuentra entre la quinta y la cuarta parte del rango. Si no es así, entonces
se considera que la muestra es heterogénea (DATOS DISPERSOS).

DATOS NO AGRUPADOS EN 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟
TABLAS DE FRECUENCIA ,
4 5

SI LADESVIACIÓN ESTANDAR CAE EN ESTE INTERVALO LOS


DATOS SON HOMOGÉNEOS SI NÓ HETEROGÉNEROS

DATOS AGRUPADOS EN TABLAS 𝐿𝐼𝑅𝐶 − 𝐿𝑅𝑆𝐶 𝐿𝑅𝐼𝐶 − 𝐿𝑅𝑆𝐶


DE FRECUENCIA ,
5 4
EJEMPLO:
1)Cuanto más separados o dispersos estén los datos, es
decir, para muestras heterogéneas, tanto mayores serán
el rango, la varianza y la desviación estándar.
2) Si los datos están más concentrados, es decir, para
muestras homogéneas, tanto menores serán el rango, la
varianza y la desviación estándar.
3) Si todas las observaciones son iguales ( de manera que
no haya variación en los datos ), el rango, la varianza y la
desviación estándar serán iguales a cero.

IC LRC
m LIC LSC LRIC LRSC xi fi fi*xi |xi-x|*fi (xi-x)^2 *fi
EJEMPLO: 0 99.05 121.03 99.045 121.035 110.04 0 0 0 0
1 121.04 143.02 121.035 143.025 132.03 4 528.12 167.124 6982.608
PARA EL EJEMPLO DE DATOS AGRUPADOS 2
3
143.03
165.02
165.01
187
143.025
165.015
165.015
187.005
154.02
176.01
5
4
770.1
704.04
98.955 1958.418
8.796 19.342
DESARROLLADO: 4 187.01 208.99 187.005 208.995 198 4 792 96.756 2340.431
5 209 230.98 208.995 230.985 219.99 2 439.98 92.358 4265
6 230.99 252.97 230.985 252.975 241.98 1 241.98 68.169 4647.013
7 252.98 274.96 252.975 274.965 263.97 0 0 0 0
20 3476.22 532.158 20212.812

des es(S) 32.6164408 ppm


252.975 − 121.035 252.975 − 121.035 LA DESVIACIÓN ESTANDAR CAE EN EL INTERVALO
, , = 26.38,32.985 POR LO TANTO LAS OBSERVACIONES SON
5 4
HOMOGÉNEAS

Вам также может понравиться