Академический Документы
Профессиональный Документы
Культура Документы
SEMANA 2
Medidas de tendencia
central y de posicin
Todos los derechos de autor son de la exclusiva propiedad de IACC o de los otorgantes de sus licencias. No est
permitido copiar, reproducir, reeditar, descargar, publicar, emitir, difundir, poner a disposicin del pblico ni 1
ESTE
utilizarDOCUMENTO
los contenidos paraCONTIENE LAdeSEMANA
fines comerciales 2
ninguna clase.
2
ESTE DOCUMENTO CONTIENE LA SEMANA 2
NDICE
3
ESTE DOCUMENTO CONTIENE LA SEMANA 2
MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
OBJETIVOS ESPECFICOS
Comprender los conceptos de medidas de tendencia central.
Aplicar los conceptos y frmulas de las medidas de tendencia central para datos agrupados
y no agrupados.
Aplicar los conceptos y frmulas de las medidas de posicin para datos agrupados y no
agrupados.
INTRODUCCIN
La estadstica nace de las necesidades reales del hombre. La variada y cuantiosa informacin con la
que este se relaciona y que es necesaria para la toma de decisiones hace que la estadstica sea hoy
una importante herramienta de trabajo.
4
ESTE DOCUMENTO CONTIENE LA SEMANA 2
1. MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central tienen como objetivo determinar dnde se concentran los datos
(cul es el centro de un histograma de frecuencias absolutas o frecuencias relativas). Entre las
medidas de tendencia central que se presentarn estn: la media aritmtica, la moda, la mediana
y los percentiles. Antes de comenzar es importante considerar la diferencia entre dos conceptos:
datos agrupados y datos no agrupados.
Datos no agrupados: son aquellos que son contables, como puede ser variable discreta.
X
x i
Siendo:
X = variable
n = tamao de la poblacin
Ejemplo:
X = notas de pertenecientes a Juan Prez: 6,3 5,8 7,0 3,3 4,0 5,1 6,3 6,5
X
x i
6,3 + 5,8 + 7,0 + 3,3 + 4,0 + 5,1 + 6,3 + 6,5
5,5
n 8
5
ESTE DOCUMENTO CONTIENE LA SEMANA 2
La interpretacin sera: el promedio de notas de Juan Prez es 5,5.
Para datos agrupados, se debe ver la tabla de frecuencias. Pero primero se deber entender lo que
es la marca de clase que se define como la mitad o punto medio del intervalo. La definicin de
este concepto es relevante, ya que es utilizado para la frmula del promedio de una variable
continua.
X
(Mc f )
i
Donde:
fi = frecuencia absoluta
n = tamao de la poblacin
Ejemplo:
Luego, X
(Mc f ) 3.550 17,7
i
n 200
6
ESTE DOCUMENTO CONTIENE LA SEMANA 2
1.2. MEDIANA
En un conjunto de observaciones ordenadas de menor a mayor, la mediana divide a la muestra o
la poblacin en dos partes iguales y las agrupa en: 50% menor a esa observacin y un 50% mayor a
esa observacin.
En el caso de datos no agrupadas, para obtener la mediana se debe ordenar de menor a mayor los
datos y ubicar el dato central (a la izquierda del dato central debe haber la misma cantidad de
datos que a la derecha).
Ejemplo:
X = notas de estadstica pertenecientes a Juan Prez: 6,4 5,8 3,3 4,0 5,1 6,3 6,5.
Al ordenar el conjunto, se obtiene: 3,3 4,0 5,1 5,8 6,3 6,4 6,5.
As, la mediana o Me = 5,8 (a la izquierda hay tres datos al igual que a la derecha).
Se debe tomar en cuenta que si el total de los datos es impar, la mediana est al centro, es decir,
la cantidad de datos a la izquierda coincide con la cantidad de datos de la derecha. Y si el conjunto
de datos es par, se consideran los dos centrales y se saca el promedio (es decir, sumar y dividir en
dos).
X = notas de Estadstica pertenecientes a Juana Estela: 6,3 5,7 3,0 4,5 7,0 5,6 6,6 6,5
Al ordenar el conjunto, se obtiene: 3,0 4,5 5,6 5,7 6,3 6,5 6,6 7,0.
Para el caso de datos agrupados , se necesita la tabla de frecuencias. Entonces, la clase mediana se
puede definir como el intervalo cuya frecuencia absoluta acumulada (Fi) contiene al 50% de la
poblacin. El lmite inferior de un intervalo es el nmero ms pequeo. La frmula es:
n
Fi 1
Me Lm. inf . 2 A
fi
7
ESTE DOCUMENTO CONTIENE LA SEMANA 2
Donde:
n = tamao poblacin
A = amplitud
Ejemplo:
Minutos de atraso
0-10 60 60
10-20 80 140
20-30 30 170
30-40 20 190
40-80 10 200
Primero hay que encontrar la mediana. Segn la definicin, se debe determinar qu frecuencia
absoluta acumulada contiene al 50% de la poblacin. El 50% de 200 es 100, ya que 200 * 0,5 = 100,
por lo tanto la clase mediana es el intervalo 10-20, ya que 140 es la primera que contiene al 50%
de la poblacin. El lmite inferior es 10, la y la amplitud es 10. Reemplazando se tiene:
n 200
Fi 1 60
Me Lm. inf . 2 A 10 2 10 15
fi 80
1.3. MODA
Esta se define como el valor observado con mayor frecuencia. Adems, puede existir ms de un
valor con igual nmero de frecuencia, por lo tanto, se tendra una distribucin con varias modas.
En el caso de datos no agrupados no se tiene frmula, pues solo se debe identificar el valor que
ms se repite dentro de una distribucin.
8
ESTE DOCUMENTO CONTIENE LA SEMANA 2
En el caso de datos agrupados, se define la clase modal como el intervalo que tiene ms datos. Y
se obtiene con la siguiente frmula:
d1
Mo Lm.. inf . A
1
d d 2
Donde:
Ejemplo:
Minutos de atraso
0-5 6 6
5-10 3 9
10-15 8 17
15-20 2 19
20-30 1 20
Total 20
Entonces, la clase modal es 10-15, ya que es la que tiene el nmero mayor. Su lmite inferior es 10,
, y la A = 5. Luego se tiene:
d1
Mo Lm.Inf . A 10 5 5 12,27
d d 56
1 2
As, los minutos de atraso que ms se repiten son 12 aproximadamente. Es decir, los alumnos de
Estadstica cuando llegan atrasados demoran la mayora de las veces unos 12 minutos.
Observacin: si en los datos no estn agrupados y existe ms de un valor con la misma frecuencia
mxima, todos sern tambin moda y se dice que la distribucin de la frecuencia es bimodal (si
son dos modas), trimodal (si son tres modas), etc.
9
ESTE DOCUMENTO CONTIENE LA SEMANA 2
2. MEDIDAS DE POSICIN
Son aquellas que dividen a la poblacin en grupos de cantidades iguales. Estas medidas permiten
conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Algunas
son las siguientes: cuartiles, percentiles, deciles y quintiles.
2.1. PERCENTILES
Cuando se tiene una muestra de valores perteneciente a datos no agrupados se pueden ordenar
los valores de menor a mayor, y de acuerdo a la posicin de cada valor numrico se puede
determinar el porcentaje de elementos (valores) que son menores o mayores a un determinado
punto de corte, por lo tanto, cuando se habla de percentiles se est dividiendo la muestra de
datos en 99 puntos de corte que dividen a la poblacin en 100 partes de igual frecuencia.
Entonces se tiene:
nk
A
100
Ejemplo:
Determinar los percentiles 25 y 60 de los siguientes datos: 3, 5, 5, 8, 12, 15, 21, 23, 25, 26, 29, 35.
Entonces, como la cantidad de datos es 12, se tiene n = 12.
n k 12 25
A 3
100 100
Posicin 1 2 3 4 5 6 7 8 9 10 11 12
Datos 3 5 5 8 12 15 21 23 25 26 29 35
10
ESTE DOCUMENTO CONTIENE LA SEMANA 2
Entonces:
58
P25 6,5
2
n k 12 60
A 7,2
100 100
Para datos agrupados se debe buscar la clase percentil, que es aquel intervalo cuya frecuencia
absoluta acumulada ( ) contiene al porcentaje asociado.
k
n Fi 1
Pk Lm. inf . A
100
fi
Donde:
= tamao de la poblacin
= percentil buscado
= amplitud
Ejemplo:
Cierto gerente de una empresa de construccin est interesado en averiguar los valores de venta
que ofrece la competencia en el sector. La informacin se resume en la siguiente tabla:
11
ESTE DOCUMENTO CONTIENE LA SEMANA 2
De acuerdo a estos datos:
Solucin:
a) Lo primero que hay que calcular es la clase percentil 85, es decir, el intervalo cuya frecuencia
absoluta acumulada contiene al 85% del nmero de empresas. La tabla se completa, entonces,
con la columna de las frecuencias absolutas acumuladas.
Ahora, al mirar la columna con los intervalos se puede notar que la clase percentil 85 es 40-45 (su
contiene al 85% = 42,5 de la variable). Luego, de acuerdo a los datos: = 40; = 50; =
85; = 40; = 6 y = 5, reemplazando en la frmula queda:
85
50 40
P85 40 100 5 42,08
6
b) Se tiene lo siguiente: el 30% de los mayores precios est al final de los intervalos, por lo que se
puede representar por el siguiente dibujo. Hay que imaginar que al interior del siguiente
rectngulo los datos estn ordenados de menor a mayor.
Se sabe que todo el rectngulo corresponde al 100%, por lo cual la diferencia es del 70%. As, el
30% de los mayores precios est entre y el valor ms grande del ltimo intervalo. Por lo que se
12
ESTE DOCUMENTO CONTIENE LA SEMANA 2
debe ocupar la frmula de percentil, donde: la clase percentil 70 es 35-40, pues el 70% de 50 es 35
(su de la poblacin). Luego, el = 35; = 50; = 70; = 21; = 19 y = 5, y
reemplazando queda:
70
50 21
P70 35 100 5 38,68
19
As, el 30% de los mayores precios se encuentra entre los 39 y 50 mil pesos.
c) El porcentaje de empresas que superan los $32.000. Se ocupa la misma frmula, ya que es la
nica herramienta: el dato 32 pertenece al intervalo del 30-35 por lo que esta sera la clase
percentil. Entonces se tiene: Se quiere encontrar k , por lo cual hay que despejar de la
frmula:
k
50 6
Pk 32 30 5 32
100
15
k
50 6
100 5 32 30
15
k
50 6
100 5 2
15
k
50 6
100 2
15 5
k 2
50 6 15
100 5
k
50 6 6
100
k
50 66
100
13
ESTE DOCUMENTO CONTIENE LA SEMANA 2
k
50 12
100
k 12
100 50
12 100
k 24
50
2.2. CUARTILES
Cuando se habla de cuartiles la definicin se basa en los percentiles, ya que los cuartiles generan 3
puntos de corte que dividen el conjunto de datos en cuatro grupos con la misma frecuencia.
Dividen a la poblacin en 4 partes iguales. Son un caso especial de los percentiles, es decir:
; y .
El primer cuartil Q1 es el valor que corresponde al punto por debajo del cual se encuentra el 25%
de las observaciones. El segundo cuartil Q2 corresponde a la mediana, es decir separa el 50%
superior de un conjunto de observaciones, del 50% inferior. Y el tercer cuartil Q3 corresponde al
punto que acumula al 75% de las observaciones.
Ejemplo:
X
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
14
ESTE DOCUMENTO CONTIENE LA SEMANA 2
2.3. DECILES
Los deciles dividen a la poblacin en 10 partes iguales. Se pueden obtener de la siguiente forma
con la ayuda de los percentiles:
; ; ; ; ; ; ;
Ejemplo:
fi Fi
40 -50 8 8
50 -60 10 18
60 -70 16 34
70 -80 14 48
80 -90 12 60
90 - 100 6 66
100 -110 4 70
Total 70
Solucin:
a) Primer decil:
b) Cuarto decil:
15
ESTE DOCUMENTO CONTIENE LA SEMANA 2
2.4. BOX PLOT (O DIAGRAMA DE CAJA Y BIGOTES)
Es una representacin grfica de los datos que permite analizar conjuntamente una serie de
medidas numricas, tales como el mnimo, el mximo, la mediana y los cuartiles (Qx). En este
grfico es posible observar caractersticas de los datos como simetra y observaciones atpicas. Los
pasos a seguir para la construccin del box plot son los siguientes:
c) Indicar todos los datos que estn fuera del intervalo admisible marcndolos como atpicos.
Ejemplo:
Fuente: https://goo.gl/9uOb7z
16
ESTE DOCUMENTO CONTIENE LA SEMANA 2
3. MEDIDAS DE TENDENCIA CENTRAL Y POSICIN CON EXCEL
Medidas de tendencia central:
La optimizacin o ayuda con Excel permite ocupar las frmulas que estn incluidas. Para esto
observar siguiente ejemplo (ver archivo adjunto
Datos_ejemplo_medidas_tendencia_central.xlsx):
21 18 23 24 25 44 37 24 28 14 36 45 39 22 17 21 35 33 18 16
37 38 44 25 13 39 26 42 41 13 15 14 45 24 42 20 16 41 36 12
29 21 18 25 20 35 45 25 19 14 16 17 16 19 21 23 14 29 38 31
15 43 18 19 18 45 43 43 37 34 50 36 35 39 23 33 15 37 16 23
27 15 30 26 20 24 39 34 45 30 43 43 28 21 17 20 31 36 17 43
44 16 35 33 22 32 24 33 27 24 17 29 43 38 21 28 14 44 41 34
23 38 12 30 27 23 23 26 32 16 43 27 12 23 26 24 30 24 42 13
45 35 12 26 21 44 12 13 48 34 19 37 26 42 34 38 38 40 28 32
24 23 27 25 38 36 37 45 34 40 34 39 26 39 22 26 31 44 37 15
Promedio (media):
= PROMEDIO (celda inicial : celda final)
Moda:
= MODA (celda inicial : celda final)
Mediana:
= MEDIANA (celda inicial : celda final)
Segn el ejemplo:
Medidas de posicin:
17
ESTE DOCUMENTO CONTIENE LA SEMANA 2
4,5 4,2 4,6 4,1 4,8 5,0 3,8 6,0 5,5 5,9 5,0 6,6 4,9 5,0 4,4 4,5 4,8 4,9 4,8 4,5
5,4 5,9 5,4 5,0 4,6 5,2 4,0 4,6 4,6 4,9 4,0 5,2 4,2 3,7 5,5 5,0 5,0 5,0 5,1 4,2
5,8 4,5 4,9 4,8 4,4 5,1 5,2 5,5 5,7 6,6 3,9 5,2 4,7 4,5 4,7 5,0 5,4 5,1 5,3 4,6
4,5 5,2 3,4 3,5 4,0 4,6 5,1 5,5 4,5 4,5 4,3 3,6 6,0 3,9 5,0 4,6 4,4 5,1 4,7 3,5
6,0 4,3 5,4 4,7 4,9 4,1 4,9 4,7 4,9 6,0 6,4 4,8 4,6 5,6 5,3 4,3 3,9 5,5 3,9 4,9
4,5 3,2 5,8 5,0 4,8 5,4 6,5 5,2 5,3 4,1 4,8 5,1 4,4 4,9 4,0 4,3 4,0 4,9 4,9 5,4
4,9 5,3 5,2 6,7 3,6 5,1 5,1 5,1 5,3 5,4 4,7 4,8 4,7 5,2 3,8 4,4 5,6 5,0 4,7 4,8
6,4 4,2 5,1 6,2 4,4 5,1 6,3 4,5 4,0 5,4 4,4 4,8 5,1 4,5 5,5 6,1 4,7 4,4 5,1 5,4
5,1 5,2 6,6 4,0 4,0 4,7 5,4 4,6 4,6 4,7 5,0 5,4 4,2 4,2 5,6 4,5 6,0 5,2 4,7 4,8
5,7 5,7 4,3 5,5 4,8 4,6 4,3 4,6 4,8 5,2 5,9 6,0 5,4 6,0 3,7 4,2 3,5 4,8 4,6 3,2
Clculo de percentil
= PERCENTIL (celda inicial : celda final ; porcentaje)
b) Una institucin de educacin superior, con el fin de ayudar a sus estudiantes, crear cursos de
reforzamiento para todos los alumnos cuya nota de presentacin a examen est en el 15% ms
bajo. Cul es rango de notas para que los alumnos sean beneficiados con esta medida?
c) Qu porcentaje de los alumnos tiene una nota de presentacin a examen entre 5,2 y 6,5?
18
ESTE DOCUMENTO CONTIENE LA SEMANA 2
COMENTARIO FINAL
En este contenido se ha aprendido sobre los conceptos ms comunes que existen en estadstica,
resaltando la importancia que tiene el programa Excel para ayudar con los clculos cuando hay
una gran cantidad de datos, lo que agiliza los resultados para un rpido empleo de estos en lo que
se necesite.
19
ESTE DOCUMENTO CONTIENE LA SEMANA 2
REFERENCIA
Anderson, D.; Sweeney, D. y Williams, T. (2008). Estadstica para administracin y economa. 10.
Thomson Editores.
Levin, R.; Rubin, D.; Balderas, M.; Del Valle, J. C. y Gmez, R. (2004). Estadstica para
http://www.academia.edu/9701898/Estad%C3%ADstica_para_Administraci%C3%B3n_y_E
conom%C3%ADa_7ma._Edici%C3%B3n_-_Richard_I._Levin_and_David_S._Rubin
Ross, S. (1997). A First Course in Probability. EE. UU.: Universidad de California, Berkeley.
20
ESTE DOCUMENTO CONTIENE LA SEMANA 2
21
ESTE DOCUMENTO CONTIENE LA SEMANA 2