Вы находитесь на странице: 1из 21

ESTADSTICA

SEMANA 2

Medidas de tendencia
central y de posicin

Todos los derechos de autor son de la exclusiva propiedad de IACC o de los otorgantes de sus licencias. No est
permitido copiar, reproducir, reeditar, descargar, publicar, emitir, difundir, poner a disposicin del pblico ni 1
ESTE
utilizarDOCUMENTO
los contenidos paraCONTIENE LAdeSEMANA
fines comerciales 2
ninguna clase.
2
ESTE DOCUMENTO CONTIENE LA SEMANA 2
NDICE

OBJETIVOS ESPECFICOS ........................................................................................................................... 4


INTRODUCCIN ...................................................................................................................................... 4
1. MEDIDAS DE TENDENCIA CENTRAL .................................................................................................... 5
1.1. MEDIA ARITMTICA............................................................................................................. 5
1.2. MEDIANA ............................................................................................................................. 7
1.3. MODA .................................................................................................................................. 8
2. MEDIDAS DE POSICIN .................................................................................................................. 10
2.1. PERCENTILES...................................................................................................................... 10
2.2. CUARTILES ......................................................................................................................... 14
2.3. DECILES .............................................................................................................................. 15
2.4. BOX PLOT (O DIAGRAMA DE CAJA Y BIGOTES) ................................................................. 16
3. MEDIDAS DE TENDENCIA CENTRAL Y POSICIN CON EXCEL ................................................................. 17
COMENTARIO FINAL.......................................................................................................................... 19
REFERENCIA....................................................................................................................................... 20

3
ESTE DOCUMENTO CONTIENE LA SEMANA 2
MEDIDAS DE TENDENCIA CENTRAL Y POSICIN

OBJETIVOS ESPECFICOS
Comprender los conceptos de medidas de tendencia central.

Aplicar los conceptos y frmulas de las medidas de tendencia central para datos agrupados
y no agrupados.

Comprender los conceptos de medidas de posicin.

Aplicar los conceptos y frmulas de las medidas de posicin para datos agrupados y no
agrupados.

INTRODUCCIN
La estadstica nace de las necesidades reales del hombre. La variada y cuantiosa informacin con la
que este se relaciona y que es necesaria para la toma de decisiones hace que la estadstica sea hoy
una importante herramienta de trabajo.

En esta semana se aprender a sacar conclusiones generales de la poblacin con la obtencin de


datos caractersticos (medidas de tendencia central y posicin) que permitirn tomar medidas en
beneficio de la misma.

4
ESTE DOCUMENTO CONTIENE LA SEMANA 2
1. MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central tienen como objetivo determinar dnde se concentran los datos
(cul es el centro de un histograma de frecuencias absolutas o frecuencias relativas). Entre las
medidas de tendencia central que se presentarn estn: la media aritmtica, la moda, la mediana
y los percentiles. Antes de comenzar es importante considerar la diferencia entre dos conceptos:
datos agrupados y datos no agrupados.

Datos agrupados: son aquellos cuya representacin es a travs de intervalos o rangos de


clases. Por lo corresponden a la variables continua.

Datos no agrupados: son aquellos que son contables, como puede ser variable discreta.

1.1. MEDIA ARITMTICA


La media aritmtica o promedio se define como el centro de gravedad de los datos. Para
obtenerla, va a depender del tipo de variable:

Para datos no agrupados, la frmula es la siguiente:

X
x i

Siendo:

X = variable

n = tamao de la poblacin

xi = y * + el conjunto de valores que toma la variable.

Ejemplo:

Se tiene la siguiente variable:

X = notas de pertenecientes a Juan Prez: 6,3 5,8 7,0 3,3 4,0 5,1 6,3 6,5

Luego, el promedio es:

X
x i

6,3 + 5,8 + 7,0 + 3,3 + 4,0 + 5,1 + 6,3 + 6,5
5,5
n 8

5
ESTE DOCUMENTO CONTIENE LA SEMANA 2
La interpretacin sera: el promedio de notas de Juan Prez es 5,5.

Para datos agrupados, se debe ver la tabla de frecuencias. Pero primero se deber entender lo que
es la marca de clase que se define como la mitad o punto medio del intervalo. La definicin de
este concepto es relevante, ya que es utilizado para la frmula del promedio de una variable
continua.

La frmula para la media si los datos estn agrupados es:

X
(Mc f )
i

Donde:

Mc = marca de clase (punto medio de cada intervalo)

fi = frecuencia absoluta

n = tamao de la poblacin

Ejemplo:

Calcular la media aritmtica o promedio de empleados que trabajan en una fbrica.

Sea X = cantidad de trabajadores de una fbrica.

Minutos de atraso Marca de clase (Mc) ( )


0-10 60 5 60 * 5 = 300
10-20 80 15 80 * 15 = 1.200
20-30 30 25 30 * 25 = 750
30-40 20 35 20 * 35 = 700
40-80 10 60 10 * 60 = 600
Total 200 3.550

Luego, X
(Mc f ) 3.550 17,7
i

n 200

La cantidad promedio de trabajadores es de 18 aproximadamente.

6
ESTE DOCUMENTO CONTIENE LA SEMANA 2
1.2. MEDIANA
En un conjunto de observaciones ordenadas de menor a mayor, la mediana divide a la muestra o
la poblacin en dos partes iguales y las agrupa en: 50% menor a esa observacin y un 50% mayor a
esa observacin.

En el caso de datos no agrupadas, para obtener la mediana se debe ordenar de menor a mayor los
datos y ubicar el dato central (a la izquierda del dato central debe haber la misma cantidad de
datos que a la derecha).

Ejemplo:

Se tiene la siguiente variable:

X = notas de estadstica pertenecientes a Juan Prez: 6,4 5,8 3,3 4,0 5,1 6,3 6,5.

Al ordenar el conjunto, se obtiene: 3,3 4,0 5,1 5,8 6,3 6,4 6,5.

As, la mediana o Me = 5,8 (a la izquierda hay tres datos al igual que a la derecha).

Se debe tomar en cuenta que si el total de los datos es impar, la mediana est al centro, es decir,
la cantidad de datos a la izquierda coincide con la cantidad de datos de la derecha. Y si el conjunto
de datos es par, se consideran los dos centrales y se saca el promedio (es decir, sumar y dividir en
dos).

X = notas de Estadstica pertenecientes a Juana Estela: 6,3 5,7 3,0 4,5 7,0 5,6 6,6 6,5

Al ordenar el conjunto, se obtiene: 3,0 4,5 5,6 5,7 6,3 6,5 6,6 7,0.

Datos centrales: 5,7 + 6,3

Para el caso de datos agrupados , se necesita la tabla de frecuencias. Entonces, la clase mediana se
puede definir como el intervalo cuya frecuencia absoluta acumulada (Fi) contiene al 50% de la
poblacin. El lmite inferior de un intervalo es el nmero ms pequeo. La frmula es:

n
Fi 1
Me Lm. inf . 2 A
fi

7
ESTE DOCUMENTO CONTIENE LA SEMANA 2
Donde:

Lm. inf. = lmite inferior del intervalo

n = tamao poblacin

frecuencia absoluta acumulada anterior a la clase mediana

frecuencia absoluta puntual de la clase mediana

A = amplitud

Ejemplo:

Si X = minutos de atraso de los trabajadores de una empresa.

Minutos de atraso
0-10 60 60
10-20 80 140
20-30 30 170
30-40 20 190
40-80 10 200

Primero hay que encontrar la mediana. Segn la definicin, se debe determinar qu frecuencia
absoluta acumulada contiene al 50% de la poblacin. El 50% de 200 es 100, ya que 200 * 0,5 = 100,
por lo tanto la clase mediana es el intervalo 10-20, ya que 140 es la primera que contiene al 50%
de la poblacin. El lmite inferior es 10, la y la amplitud es 10. Reemplazando se tiene:

n 200
Fi 1 60
Me Lm. inf . 2 A 10 2 10 15
fi 80

Luego, el valor central de esta variable es 15.

1.3. MODA
Esta se define como el valor observado con mayor frecuencia. Adems, puede existir ms de un
valor con igual nmero de frecuencia, por lo tanto, se tendra una distribucin con varias modas.
En el caso de datos no agrupados no se tiene frmula, pues solo se debe identificar el valor que
ms se repite dentro de una distribucin.

8
ESTE DOCUMENTO CONTIENE LA SEMANA 2
En el caso de datos agrupados, se define la clase modal como el intervalo que tiene ms datos. Y
se obtiene con la siguiente frmula:

d1
Mo Lm.. inf . A
1
d d 2

Donde:

frecuencia absoluta puntual de la clase modal, menos la frecuencia acumulada


puntual anterior.

frecuencia absoluta puntual de la clase modal, menos la frecuencia absoluta


puntual siguiente.

Ejemplo:

Sea X = minutos de atraso de los alumnos de Estadstica.

Minutos de atraso
0-5 6 6
5-10 3 9
10-15 8 17
15-20 2 19
20-30 1 20
Total 20

Entonces, la clase modal es 10-15, ya que es la que tiene el nmero mayor. Su lmite inferior es 10,
, y la A = 5. Luego se tiene:

d1
Mo Lm.Inf . A 10 5 5 12,27
d d 56
1 2

As, los minutos de atraso que ms se repiten son 12 aproximadamente. Es decir, los alumnos de
Estadstica cuando llegan atrasados demoran la mayora de las veces unos 12 minutos.

Observacin: si en los datos no estn agrupados y existe ms de un valor con la misma frecuencia
mxima, todos sern tambin moda y se dice que la distribucin de la frecuencia es bimodal (si
son dos modas), trimodal (si son tres modas), etc.

9
ESTE DOCUMENTO CONTIENE LA SEMANA 2
2. MEDIDAS DE POSICIN
Son aquellas que dividen a la poblacin en grupos de cantidades iguales. Estas medidas permiten
conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Algunas
son las siguientes: cuartiles, percentiles, deciles y quintiles.

2.1. PERCENTILES
Cuando se tiene una muestra de valores perteneciente a datos no agrupados se pueden ordenar
los valores de menor a mayor, y de acuerdo a la posicin de cada valor numrico se puede
determinar el porcentaje de elementos (valores) que son menores o mayores a un determinado
punto de corte, por lo tanto, cuando se habla de percentiles se est dividiendo la muestra de
datos en 99 puntos de corte que dividen a la poblacin en 100 partes de igual frecuencia.

Entonces se tiene:

nk
A
100

Si A es entero, entonces el percentil k corresponde al valor medio (promedio) de las observaciones


ubicadas en las posiciones A y A + 1. Si A no es entero, el percentil k corresponde a la observacin
ubicada en la posicin entera siguiente.

Ejemplo:

Determinar los percentiles 25 y 60 de los siguientes datos: 3, 5, 5, 8, 12, 15, 21, 23, 25, 26, 29, 35.
Entonces, como la cantidad de datos es 12, se tiene n = 12.

Hay que obtener A, esto es:

n k 12 25
A 3
100 100

Es un valor entero, por lo tanto es igual al promedio de las posiciones 3 y 4.

Posicin 1 2 3 4 5 6 7 8 9 10 11 12

Datos 3 5 5 8 12 15 21 23 25 26 29 35

10
ESTE DOCUMENTO CONTIENE LA SEMANA 2
Entonces:

58
P25 6,5
2

Para obtener el , se tiene:

n k 12 60
A 7,2
100 100

El entero siguiente a 7,2 es 8, luego la 8 posicin es 23.

Para datos agrupados se debe buscar la clase percentil, que es aquel intervalo cuya frecuencia
absoluta acumulada ( ) contiene al porcentaje asociado.

k
n Fi 1
Pk Lm. inf . A
100
fi

Donde:

= lmite inferior de la clase percentil

= tamao de la poblacin

= percentil buscado

= frecuencia absoluta acumulada anterior a la de la clase percentil

= frecuencia absoluta puntual de la clase porcentual

= amplitud

Ejemplo:

Cierto gerente de una empresa de construccin est interesado en averiguar los valores de venta
que ofrece la competencia en el sector. La informacin se resume en la siguiente tabla:

Precio (miles de pesos) Nmero de empresas


25-30 6
30-35 15
35-40 19
40-45 6
45-50 4

11
ESTE DOCUMENTO CONTIENE LA SEMANA 2
De acuerdo a estos datos:

a) Determine el percentil 85.

b) Determine entre qu valores est el 30% de los mayores precios.

c) Qu cantidad de empresas superan los $32.000 en el precio de venta del producto?

Solucin:

a) Lo primero que hay que calcular es la clase percentil 85, es decir, el intervalo cuya frecuencia
absoluta acumulada contiene al 85% del nmero de empresas. La tabla se completa, entonces,
con la columna de las frecuencias absolutas acumuladas.

Precio (miles de pesos)


25-30 6 6
30-35 15 21
35-40 19 40
40-45 6 46
45-50 4 50

As, se tiene que el 85% de 50 es 42,5.

Ahora, al mirar la columna con los intervalos se puede notar que la clase percentil 85 es 40-45 (su
contiene al 85% = 42,5 de la variable). Luego, de acuerdo a los datos: = 40; = 50; =
85; = 40; = 6 y = 5, reemplazando en la frmula queda:

85
50 40
P85 40 100 5 42,08
6

b) Se tiene lo siguiente: el 30% de los mayores precios est al final de los intervalos, por lo que se
puede representar por el siguiente dibujo. Hay que imaginar que al interior del siguiente
rectngulo los datos estn ordenados de menor a mayor.

Se sabe que todo el rectngulo corresponde al 100%, por lo cual la diferencia es del 70%. As, el
30% de los mayores precios est entre y el valor ms grande del ltimo intervalo. Por lo que se

12
ESTE DOCUMENTO CONTIENE LA SEMANA 2
debe ocupar la frmula de percentil, donde: la clase percentil 70 es 35-40, pues el 70% de 50 es 35
(su de la poblacin). Luego, el = 35; = 50; = 70; = 21; = 19 y = 5, y
reemplazando queda:

70
50 21
P70 35 100 5 38,68
19

As, el 30% de los mayores precios se encuentra entre los 39 y 50 mil pesos.

c) El porcentaje de empresas que superan los $32.000. Se ocupa la misma frmula, ya que es la
nica herramienta: el dato 32 pertenece al intervalo del 30-35 por lo que esta sera la clase
percentil. Entonces se tiene: Se quiere encontrar k , por lo cual hay que despejar de la
frmula:

k
50 6
Pk 32 30 5 32
100
15

k
50 6
100 5 32 30
15

k
50 6
100 5 2
15

k
50 6
100 2

15 5

k 2
50 6 15
100 5

k
50 6 6
100

k
50 66
100

13
ESTE DOCUMENTO CONTIENE LA SEMANA 2
k
50 12
100

k 12

100 50

12 100
k 24
50

Por lo que el precio de $32.000 representa el 24%.

2.2. CUARTILES
Cuando se habla de cuartiles la definicin se basa en los percentiles, ya que los cuartiles generan 3
puntos de corte que dividen el conjunto de datos en cuatro grupos con la misma frecuencia.
Dividen a la poblacin en 4 partes iguales. Son un caso especial de los percentiles, es decir:
; y .

El primer cuartil Q1 es el valor que corresponde al punto por debajo del cual se encuentra el 25%
de las observaciones. El segundo cuartil Q2 corresponde a la mediana, es decir separa el 50%
superior de un conjunto de observaciones, del 50% inferior. Y el tercer cuartil Q3 corresponde al
punto que acumula al 75% de las observaciones.

Ejemplo:

Si se tiene datos no agrupados, dada la siguiente distribucin en el nmero de hijos de 100


familias, calcular sus cuartiles.

X
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100

El primer cuartil: y como se tiene que el primer cuartil es 2.

El segundo cuartil: y como se tiene que el segundo cuartil es 3.

El tercer cuartil y como se tiene que el tercer cuartil es 4.

14
ESTE DOCUMENTO CONTIENE LA SEMANA 2
2.3. DECILES
Los deciles dividen a la poblacin en 10 partes iguales. Se pueden obtener de la siguiente forma
con la ayuda de los percentiles:

; ; ; ; ; ; ;

Primeramente, se busca la clase donde se encuentra , = 1,2,3,.9

Ejemplo:

Considerando la siguiente tabla, calcule el primer y cuarto decil:

fi Fi
40 -50 8 8
50 -60 10 18
60 -70 16 34
70 -80 14 48
80 -90 12 60
90 - 100 6 66
100 -110 4 70
Total 70

Solucin:

a) Primer decil:

b) Cuarto decil:

15
ESTE DOCUMENTO CONTIENE LA SEMANA 2
2.4. BOX PLOT (O DIAGRAMA DE CAJA Y BIGOTES)
Es una representacin grfica de los datos que permite analizar conjuntamente una serie de
medidas numricas, tales como el mnimo, el mximo, la mediana y los cuartiles (Qx). En este
grfico es posible observar caractersticas de los datos como simetra y observaciones atpicas. Los
pasos a seguir para la construccin del box plot son los siguientes:

a) Ordenar los datos y obtener: mn., max., y

b) Dibujar un rectngulo cuyos extremos sean , e indicar mediante una lnea.

c) Indicar todos los datos que estn fuera del intervalo admisible marcndolos como atpicos.

Ejemplo:

Fuente: https://goo.gl/9uOb7z

Para profundizar en este tema revisar el siguiente video:

Diagrama box plot

16
ESTE DOCUMENTO CONTIENE LA SEMANA 2
3. MEDIDAS DE TENDENCIA CENTRAL Y POSICIN CON EXCEL
Medidas de tendencia central:

La optimizacin o ayuda con Excel permite ocupar las frmulas que estn incluidas. Para esto
observar siguiente ejemplo (ver archivo adjunto
Datos_ejemplo_medidas_tendencia_central.xlsx):

21 18 23 24 25 44 37 24 28 14 36 45 39 22 17 21 35 33 18 16
37 38 44 25 13 39 26 42 41 13 15 14 45 24 42 20 16 41 36 12
29 21 18 25 20 35 45 25 19 14 16 17 16 19 21 23 14 29 38 31
15 43 18 19 18 45 43 43 37 34 50 36 35 39 23 33 15 37 16 23
27 15 30 26 20 24 39 34 45 30 43 43 28 21 17 20 31 36 17 43
44 16 35 33 22 32 24 33 27 24 17 29 43 38 21 28 14 44 41 34
23 38 12 30 27 23 23 26 32 16 43 27 12 23 26 24 30 24 42 13
45 35 12 26 21 44 12 13 48 34 19 37 26 42 34 38 38 40 28 32

24 23 27 25 38 36 37 45 34 40 34 39 26 39 22 26 31 44 37 15

Frmulas funciones de Excel:

Promedio (media):
= PROMEDIO (celda inicial : celda final)

Moda:
= MODA (celda inicial : celda final)

Mediana:
= MEDIANA (celda inicial : celda final)

Segn el ejemplo:

Promedio (media): 28,82


Moda: 23
Mediana: 27,5

Medidas de posicin:

Considere la siguiente base de datos (ver archivo adjunto


Datos_ejemplo_medidas_posicin.xlsx):

17
ESTE DOCUMENTO CONTIENE LA SEMANA 2
4,5 4,2 4,6 4,1 4,8 5,0 3,8 6,0 5,5 5,9 5,0 6,6 4,9 5,0 4,4 4,5 4,8 4,9 4,8 4,5
5,4 5,9 5,4 5,0 4,6 5,2 4,0 4,6 4,6 4,9 4,0 5,2 4,2 3,7 5,5 5,0 5,0 5,0 5,1 4,2

5,8 4,5 4,9 4,8 4,4 5,1 5,2 5,5 5,7 6,6 3,9 5,2 4,7 4,5 4,7 5,0 5,4 5,1 5,3 4,6
4,5 5,2 3,4 3,5 4,0 4,6 5,1 5,5 4,5 4,5 4,3 3,6 6,0 3,9 5,0 4,6 4,4 5,1 4,7 3,5
6,0 4,3 5,4 4,7 4,9 4,1 4,9 4,7 4,9 6,0 6,4 4,8 4,6 5,6 5,3 4,3 3,9 5,5 3,9 4,9
4,5 3,2 5,8 5,0 4,8 5,4 6,5 5,2 5,3 4,1 4,8 5,1 4,4 4,9 4,0 4,3 4,0 4,9 4,9 5,4
4,9 5,3 5,2 6,7 3,6 5,1 5,1 5,1 5,3 5,4 4,7 4,8 4,7 5,2 3,8 4,4 5,6 5,0 4,7 4,8
6,4 4,2 5,1 6,2 4,4 5,1 6,3 4,5 4,0 5,4 4,4 4,8 5,1 4,5 5,5 6,1 4,7 4,4 5,1 5,4
5,1 5,2 6,6 4,0 4,0 4,7 5,4 4,6 4,6 4,7 5,0 5,4 4,2 4,2 5,6 4,5 6,0 5,2 4,7 4,8
5,7 5,7 4,3 5,5 4,8 4,6 4,3 4,6 4,8 5,2 5,9 6,0 5,4 6,0 3,7 4,2 3,5 4,8 4,6 3,2

Clculo de percentil
= PERCENTIL (celda inicial : celda final ; porcentaje)

Clculo del % de la muestra


= RANGO.PERCENTIL (celda inicial : celda final ; dato)

Para practicar, calcule:

a) Calcular e interpretar el percentil 75.

PERCENTIL(B2:U11;75%) = 5,3 (el rango va a depender de dnde copie la base de datos).

b) Una institucin de educacin superior, con el fin de ayudar a sus estudiantes, crear cursos de
reforzamiento para todos los alumnos cuya nota de presentacin a examen est en el 15% ms
bajo. Cul es rango de notas para que los alumnos sean beneficiados con esta medida?

PERCENTIL(B2:U11;15%) = 4,2 (el rango va a depender de dnde copie la base de datos).

c) Qu porcentaje de los alumnos tiene una nota de presentacin a examen entre 5,2 y 6,5?

RANGO.PERCENTIL(B2:U11;6,5) - RANGO.PERCENTIL(B2:U11;5,2) = 29,1%

18
ESTE DOCUMENTO CONTIENE LA SEMANA 2
COMENTARIO FINAL
En este contenido se ha aprendido sobre los conceptos ms comunes que existen en estadstica,
resaltando la importancia que tiene el programa Excel para ayudar con los clculos cuando hay
una gran cantidad de datos, lo que agiliza los resultados para un rpido empleo de estos en lo que
se necesite.

19
ESTE DOCUMENTO CONTIENE LA SEMANA 2
REFERENCIA
Anderson, D.; Sweeney, D. y Williams, T. (2008). Estadstica para administracin y economa. 10.

edicin. Mxico: Cengage Learning.

Devore, J. (1998). Probabilidad y estadstica para ingeniera y ciencias. Mxico: International

Thomson Editores.

Levin, R.; Rubin, D.; Balderas, M.; Del Valle, J. C. y Gmez, R. (2004). Estadstica para

administracin y economa. 7. edicin. Mxico: Pearson, Prentice-Hall. Disponible en:

http://www.academia.edu/9701898/Estad%C3%ADstica_para_Administraci%C3%B3n_y_E

conom%C3%ADa_7ma._Edici%C3%B3n_-_Richard_I._Levin_and_David_S._Rubin

Ross, S. (1997). A First Course in Probability. EE. UU.: Universidad de California, Berkeley.

PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:

IACC (2016). Medidas de tendencia central y de posicin. Estadstica. Semana 2.

20
ESTE DOCUMENTO CONTIENE LA SEMANA 2
21
ESTE DOCUMENTO CONTIENE LA SEMANA 2

Вам также может понравиться