Академический Документы
Профессиональный Документы
Культура Документы
SEMANA 3
Medidas de dispersin
Todos los derechos de autor son de la exclusiva propiedad de IACC o de los otorgantes de sus licencias. No est
permitido copiar, reproducir, reeditar, descargar, publicar, emitir, difundir, poner a disposicin del pblico ni 1
ESTE
utilizarDOCUMENTO
los contenidos paraCONTIENE LAdeSEMANA
fines comerciales 3
ninguna clase.
2
ESTE DOCUMENTO CONTIENE LA SEMANA 3
NDICE
3
ESTE DOCUMENTO CONTIENE LA SEMANA 3
MEDIDAS DE DISPERSIN
OBJETIVOS ESPECFICOS
Comprender los conceptos de medidas de dispersin.
Aplicar los conceptos y frmulas de las medidas de dispersin para datos agrupados y no
agrupados.
INTRODUCCIN
La primera propiedad que se puede desarrollar de un conjunto de datos es obtener las medidas de
tendencia central (promedio, moda y mediana), la segunda propiedad que describe a un conjunto
de datos es la dispersin. Se entiende por dispersin al grado de variacin o diseminacin de los
datos. Dos conjuntos de datos pueden diferir tanto en tendencia central como en dispersin o dos
conjuntos de datos pueden tener las mismas medidas de tendencia central, pero diferir mucho en
trminos de dispersin.
4
ESTE DOCUMENTO CONTIENE LA SEMANA 3
1. MEDIDAS DE DISPERSIN
Las medidas de dispersin son medidas que tienen como objetivo determinar qu tan disperso o
diseminado se encuentra el conjunto de observaciones, respecto a un punto, en el caso de la
desviacin estndar esta dispersin se calcula en relacin a la media (promedio). A continuacin
se definirn las principales medidas de dispersin:
Si los datos estn agrupados, para calcular el rango o recorrido, se tiene que revisar la tabla de
distribucin de frecuencias. Primero se selecciona el lmite superior del ltimo intervalo y, luego, el
lmite inferior del primer intervalo y se calcula la diferencia entre estos valores.
1.2. VARIANZA
La varianza de una distribucin de frecuencias es la media aritmtica de los cuadrados de las
diferencias entre los valores de la distribucin y su media aritmtica. El valor numrico de la
varianza cuantifica el grado de dispersin de los valores de una distribucin de frecuencias
respecto a su media aritmtica. Mientras mayor es la dispersin de las observaciones, mayor es la
magnitud de sus desviaciones respecto a la media aritmtica y, por ende, ms alto el valor
numrico de la varianza. La varianza no puede ser mayor que la media aritmtica. Se calcula de la
siguiente forma:
Si la variable es discreta:
S X2
(x 2
i )
X
2
Si la variable es continua:
S 2
(Mc 2
fi )
X
2
X
n
5
ESTE DOCUMENTO CONTIENE LA SEMANA 3
Una observacin importante de la varianza es que posee dos frmulas, una si es que se trata de
una poblacin (2 ) y otra si se trata de una muestra ( S 2 ) :
Si la variable es discreta:
(x (x
2
2
) 2 X)
X
2 i 2 i
S
n ; n 1
Si la variable es continua:
(Mc (Mc
2 2
2
fi ) n X 2
fi ) n X
2 S2
n ; n 1
Ejemplos:
N de cigarros N de funcionarios
30 7
35 12
40 10
41 15
45 6
Total 50
(X (X
2
fi ) n X fi )
2 2
2
2
i
i
X
n n
Sin embargo, se cambia Mc2 por Xi2, ya que a pesar de no ser una variable continua, al trabajar con
ella se reemplaza ese dato. Entonces, se construyen las columnas de la tabla para reemplazar los
datos en la frmula:
N de cigarros N de funcionarios
30 7 210 900 6.300
35 12 420 1.225 14.700
40 10 400 1.600 16.000
41 15 615 1.681 25.215
45 6 270 2.025 12.150
Total 50 1.915 7.431 74.365
6
ESTE DOCUMENTO CONTIENE LA SEMANA 3
Luego, se reemplaza en la frmula de la varianza para datos discretos (pues no hay intervalos), es
decir:
2
(x 2
i )
X
2
2
74.365 1.915
2
20,41
50 50
1.915
(*) Recordar que: X
50
s x S X2
s x S X2 20,41 4,51
Ejemplo:
7
ESTE DOCUMENTO CONTIENE LA SEMANA 3
Se debe calcular la varianza para variable discreta y despus sacar la raz cuadrada (suponiendo
que se tiene una poblacin):
2
(x 2
i )
X
2
Entonces:
(x 2
i )
1,812 1,75 2 1,59 2 1,89 2 1,56 2 1,8 2 18,1124
3,01873
n 6 6
As, se tiene:
2
(x 2
i ) 2
X
18,1124
1,732 3,01873 2,9929 0,02583
n 6
Por lo tanto:
X2 0,02583 0,1607
sx
CV
X
Observaciones:
8
ESTE DOCUMENTO CONTIENE LA SEMANA 3
Ejemplo:
CV = 10,36% CV = 9,3%
Solucin:
- Variable edad:
Edades (aos)
30-28-29-35-26
CV = 10,36%
30 28 29 35 26
X 29,6
5
Entonces:
(x 2
i )
30 2 28 2 29 2 35 2 26 2 4.426
885,2
n 5 5
2
(x 2
i ) 2
X 885,2 29,6 2 885,2 876,16 9,04
n
Por lo tanto:
X2 9,04 3,00665928
Finalmente:
3,0665928
CV 0,10360111
29,6
9
ESTE DOCUMENTO CONTIENE LA SEMANA 3
Para la variable sueldos, se tiene:
Sueldos (M$)
540-620-580-640-510
CV = 9,3%
Entonces:
(x 2
i )
540 2 620 2 580 2 640 2 510 2 1.682.100
336.420
n 5 5
As, se tiene:
2
(x 2
i ) 2
X 336.420 334.084 2 2.336
n
Por lo tanto:
X2 2.336 48,3321839
Finalmente:
48,3321839
CV 0,0836197
578
Conclusin: los sueldos son ms homogneos que las edades de estas cinco personas.
10
ESTE DOCUMENTO CONTIENE LA SEMANA 3
2. MEDIDAS DE DISPERSIN CON EXCEL
A continuacin, usando el archivo adjunto: ejemplo_coeficiente_variacion.xlsx, podr practicar el
clculo de las medidas de dispersin por medio de Excel:
Se ha registrado el siguiente listado de sueldos (en miles de pesos) de los trabajadores de una
empresa minera.
397,41 531,12 417,07 478,55 331,55 558,45 632,5 449,99 486,54 541,42
368,11 384,05 455,07 511,15 485,64 412,17 410,83 529,64 447,68 430,11
577,24 562,6 416,73 511,34 241,08 450,84 614,17 612,46 491,58 442,34
319,24 516,01 436,93 418,84 528,36 524,04 478,81 613,67 515,31 419,53
547,91 371,62 369,14 512,6 551,9 516,22 549,55 498,08 520,61 559,69
481,61 575,4 375,59 481,75 355,84 424,52 502,73 382,97 643,61 469,99
368,63 447,45 566,67 370,87 408,13 507,16 492,44 595,18 419,62 475,33
561,49 494,13 330,42 646,39 495,42 489,76 507,54 507 411,14 491,41
539,11 424,62 510,97 511,33 472,12 518,17 383,49 685,01 352,39 533,98
391,55 487,46 559,01 377,3 357,78 369,5 571,86 499,79 380,06 390,42
288,96 383,6 481,1 295,01 571,66 483,95 561,14 553,97 597,22 513,79
359,61 550,13 368,19 465,66 273,97 353,65 419,09 434,47 427,61 410,66
365,89 294,92 397,6 339,44 539,82 524,75 430,15 469,35 514,63 534,28
412,65 656,09 412,63 498,55 300,02 614,17 501,4 510,81 478,66 470,77
432,5 347,72 379,28 438,8 543,98 413,07 419,11 410,47 320,95 443,7
465,38 312,65 508,63 428,82 490,74 493,18 361,49 464,66 287,09 526,28
389,08 386,15 590,61 465,13 478,15 304,32 488,97 617,02 436,07 449,72
395,87 584,1 567,67 353,97 345,84 472,06 520,3 592,33 550,24 496,45
366,86 364,75 329,62 327,73 568,24 412,12 464,88 360,71 293,57 456,8
467,07 555,85 384,99 516,46 263,06 529,28 597,68 503,33 451,71 518,17
11
ESTE DOCUMENTO CONTIENE LA SEMANA 3
Frmulas funciones de Excel:
Rango:
= MAX(Celda_Inicial:Celda_Final) - MIN(Celda_Inicial:Celda_Final)
Rango 443,93
Si se quiere calcular el coeficiente de variacin, se tiene que sacar el promedio. Con la ayuda de
Excel, el resultado del promedio = 461,54525, por lo tanto:
12
ESTE DOCUMENTO CONTIENE LA SEMANA 3
COMENTARIO FINAL
Durante esta semana se aprendi a calcular las distintas medidas de dispersin tanto para datos
no agrupados como para datos agrupados, cuando la medida de las variables es la misma se
utilizar la desviacin estndar como el estadgrafo para realizar el anlisis e interpretacin de
resultados, ya que no cambia la magnitud de la variable, a diferencia de la varianza cuyos valores y
obviamente las unidades respectivas se encuentran al cuadrado. La ayuda de Excel permite
realizar clculos de manera ms rpida, optimizando tiempo, cuando existe gran cantidad de
datos.
13
ESTE DOCUMENTO CONTIENE LA SEMANA 3
REFERENCIAS
Anderson, D.; Sweeney, D. y Williams, T. (2008). Estadstica para administracin y economa. 10.
Thomson Editores.
Levin, R.; Rubin, D.; Balderas, M.; Del Valle, J. C. y Gmez, R. (2004). Estadstica para
http://www.academia.edu/9701898/Estad%C3%ADstica_para_Administraci%C3%B3n_y_E
conom%C3%ADa_7ma._Edici%C3%B3n_-_Richard_I._Levin_and_David_S._Rubin
Ross, S. (1997). A First Course in Probability. EE. UU. Universidad de California, Berkeley.
14
ESTE DOCUMENTO CONTIENE LA SEMANA 3
15
ESTE DOCUMENTO CONTIENE LA SEMANA 3