Вы находитесь на странице: 1из 49

Curso: Estadística

Medidas de Tendencia Central y


Posición
Estadística Descriptiva unidimensional

Profesor: Agustina Ramírez


Fecha: 15/09/2019
Caso: Consumo de agua en Lima Metropolitana

La Superintendencia Nacional de Servicios


de Saneamiento (SUNASS) en febrero de
2017, publicó el consumo medio de agua
de una persona al día por distrito.
Según la Organización Mundial de la Salud
(OMS), una persona debe consumir al día
alrededor de 100 litros de agua para
atender todas sus necesidades.
Los vecinos de San Isidro son los que más
consumen agua, una persona gasta en
promedio 447 litros al día; en Miraflores
395 litros y en La Molina 258 litros.
Mientras que, en Lurigancho -Chosica, son
los que menos gastan, una persona gasta,
en promedio, 15 litros al día.

Tomado de
https://www.facebook.com/Sunass.Regulador
¿Qué medida de resumen descriptivas
se considera en el siguiente caso?

¿Existirán otras medidas que se pueda


utilizar en los datos de consumo de
agua en Lima?
MEDIDAS DE RESUMEN DESCRIPTIVAS

1. Medidas de Tendencia Central 3. Medidas de Dispersión


2. Medidas de Posición 4. Medidas de Forma

1 3

2 4
LOGRO DE LA SESIÓN
Al finalizar la sesión, el
estudiante calcula e
interpreta medidas de
tendencia central y
posición de un conjunto
de datos sin agrupar y
agrupados en tablas de
frecuencias.
Sesión 5: Medidas de tendencia central y posición

1. Medidas descriptivas de tendencia central


• Media aritmética (promedio)
• Mediana
• Moda
2. Medidas descriptivas de posición
• Cuartiles
• Percentiles
5.1. MEDIDAS DE TENDENCIA CENTRAL
5.1. MEDIDAS DE TENDENCIA CENTRAL

Valores calculados que


describen el centro de una
distribución de datos, las
mas utilizadas son:

 Media aritmética
 Mediana
 Moda
5.1.1. MEDIA ARITMÉTICA (PROMEDIO)

• Se calcula para variables


medidas en escala de
intervalo o razón.
• Suma de todos los datos
numéricos y se divide entre el
total de datos de una
muestra o población.

Media para datos sin agrupar Media para datos agrupados


k

x
n
xi
X  i fi
i 1 n
X  i 1

n
Cálculo de un promedio para datos sin agrupar:
Ejemplo 1:
Una persona que trabaja en forma independiente en
un mes generó ingresos de S/. 200, otro mes S/.600 y
otro S/.400. ¿Cuánto es el ingreso promedio mensual
e interprételo?

Desarrollo:

200  600  400


X  400
3

Interpretación.- El ingreso promedio fue de 400 soles


mensuales.
Cálculo de un promedio para datos agrupados (tabulados):
Ejemplo 2:
La siguiente tabla muestra la distribución de las edades de
niños hospitalizados con alguna intervención quirúrgica en el
Hospital del niño.
Se pide calcular e interpretar la media de las edades.
Edades (Xi) fi Xifi
9 12
10 30
11 23
12 15

Recuerde:
X  x .fi i

n
Desarrollo:
Xi = edades fi Xi.fi
9 12 108
10 30 300
11 23 253
12 15 180
Total 80 841

Observa n=80 niños


Reemplazamos en la fórmula: La fórmula es:

108  300  253  180 X 


 x .f i i
X n
80
X  10 .512
Interpretación.- La edad promedio de los niños hospitalizados
con alguna intervención quirúrgica es de 11 años
aproximadamente.
Cálculo de un promedio para datos agrupados (tabulados):
Ejemplo 3:
La siguiente tabla de frecuencias muestra el gasto en compra de
recetas médicas de los pacientes que fueron atendidos en
Dermatología. En promedio ¿Cuánto gastaron en medicamentos?
Gasto en medicamentos Marca de clase
fi hi Xi.fi
(soles) (Xi)
[ 29.8 - 48.2 > 2 0.0571

[ 48.2 - 66.6 > 8 0.2286

[ 66.6 - 85.0 > 10 0.2857

[ 85.0 - 103.4 > 7 0.2000

[ 103.4 – 121.8 > 5 0.1429

[ 121.8 – 140.2> 3 0.0857


Total 35 1.0000
Recuerde:
X 
 x .f i i

n
Desarrollo:
Gasto en medicamentos
Marca de clase (Xi) fi hi Xi.fi
(soles)
[ 29.8 - 48.2 > 39 2 0.057 78
[ 48.2 - 66.6 > 57.4 8 0.228 459.2
[ 66.6 - 85.0 > 75.8 10 0.286 758
[ 85.0 - 103.4 > 94.2 7 0.200 659.4
[ 103.4 – 121.8 > 112.6 5 0.143 563
[ 121.8 – 140.2> 131 3 0.086 393
Total 35 1.000 2911

Reemplazando: X  x .f i i

2911
 83.16
n 35
Interpretación.- Los 35 pacientes de dermatología, en promedio gastaron la
suma de 83.16 soles en compra de sus medicamentos.
Media (promedio) Ponderada:
k
Pesos o ponderaciones n1, n i xi
n1 x1  n2 x 2  ...  nk xk
n2,... nk se define como: xp  i 1

n n1  n2  ...  nk

Ejemplo:
A continuación se presentan las notas finales de un alumno, obtenidas al
concluir el semestre académico y los créditos que tiene cada uno de los
cursos que ha llevado:

CURSOS N° de créditos Nota


Matemáticas 3 15
Comunicación 4 14
Inglés 2 16

¿Cuál es el PROMEDIO de las notas del estudiante?


5.1.2. MEDIANA (Me)
Valor central que divide en 2 un conjunto
de datos ordenados con la misma
cantidad de datos, donde el 50% de los
datos son menores a dicho valor y el otro
50% serán mayores. Altura
mediana
Se calcula para variables medida en
escala ordinal, intervalo y razón.
Si la variable Xi es cuantitativa, i= 1,2,3,…,n
- Si “n” es impar se tomará el valor central como
mediana.
- Si “n” es par, habrá dos términos centrales y la
mediana será la semisuma de dichos valores.
Ejemplo 4
Se ha registrado la talla de 5 alumnos: 1.60, 1.50, 1.55, 1.80 , 1.65
Se pide calcular e interpretar la estatura mediana.

Desarrollo:
El tamaño de muestra: n = 5, es un número impar

Primer paso: Ordenar los datos de menor a mayor


1° 2° 3° 4° 5°
1.50 1.55 1.60 1.65 1.80
Segundo paso: Ubicar el dato de posición central:
Posición de la mediana = (n+1)/2
Posición: (5+1)/2 = 3°
Tercer paso: Me = 1.60
50%
50%

Estatura
mediana 1.60

Interpretación.- El 50% de 5 alumnos tienen una talla máxima de


1.60 cm, y el otro 50% tienen una talla mayor a 1.60 cm.
Ejemplo 5
Se ha registrado las edades en años cumplidos a 6 alumnos
ingresantes a la escuela de Farmacia en una universidad, cuyos
datos son: 20, 21, 25, 20, 18, 27.
Se pide calcular la mediana de las edades (en este caso “n” es par,
dado que n=6)
Procedimiento:
1º Ordenar los datos de menor a mayor
18 20 20 21 23 25
1° 2° 3° 4° 5° 6°
50% Me 50%
2º Posición del valor mediano está entre la posición 3 y 4 que es x3 y x4
3º Calcular la mediana:
Me = (20+21)/2 = 20.5

Interpretación.- El 50% de 6 alumnos tienen una edad menor o igual a 20.5


años y el otro 50% restante tiene más de 20.5 años.
Mediana para datos agrupados es:

 n 
 F 
i  1
Me  LI  C  2 


f
Me 

 

Donde:
LI : Límite inferior de la posición de la clase mediana
C : Amplitud de clase mediana
Fi-1: Frecuencia absoluta acumulada anterior a la clase mediana
fMe: Frecuencia absoluta simple de la posición de la clase mediana
n : Tamaño de la muestra
Ejemplo 6:
De la muestra seleccionada se registró las edades de jubilados
que recibieron atención de salud en un policlínico del seguro,
cuyos datos están en la siguiente tabla de distribución de
frecuencias:
Edades de jubilados Xi fi Fi
[ 60 – 63 > 2
[ 63 – 66 > 6
[ 66 – 69 > 4
[ 69 – 72 > 6
[ 72 – 75 ] 2
Total
¿Cuál es la edad máxima del 50% de jubilados atendidos en el policlínico?
Desarrollo:
Edades de Xi fi Fi
jubilados
[60 - 63> 61.5 2 2
De 20 datos, la mitad
[63 - 66> 64.5 6 8 es 10 y corresponde
[66 - 69> 67.5 4 12 al intervalo [66;69>
[69 - 72> 70.5 6 18 que seria la clase
[72 - 75> 73.5 2 20 mediana.
Total 20
 n 
  F 
Formula: Me  LI  C  2
i 1 


f
Me 

 

Reemplazamos
Interpretación:
 20
8
Me  66  3 2
 El 50% de jubilados tiene una edad
 4  máxima de 67 años.
Me  67.5
5.1.3. MODA (Mo)
Es el dato que más veces se repite en una muestra o población.
Se calcula para variables medidas en escala nominal, ordinal,
intervalo o razón.
• Si no se repite ningún valor la moda no No hay Moda
existe. 8
6
6
4 4

• Cuando se repite un solo valor existe una


4
2 2
2
0

sola moda, es una distribución 1 2 3 4 5

UNIMODAL. 6

4
5

3
5
4

• Cuando se repiten dos valores, hay dos


2
2

modas y la distribución es BIMODAL.


1 2 3 4 5

6 5 5 5
• Cuando se repite más de dos valores 4 3
2

presenta varias modas, la distribución es 2

MULTIMODAL. 1 2 3 4 5
Moda para datos no agrupados:
Ejemplo 7: En cada uno de los casos calcule e interprete la moda:
1. Se ha registrado el peso de conservas en gramos del lote
producido en una semana para hacer un control de calidad
respecto a la exactitud de su peso en la etiqueta.

200.3, 199.8, 201.1, 199.3, 200.1, 199.7, 198.9 (no hay moda)
2. Edades de gestantes adolescentes en una comunidad.

14, 15, 16,15,16, 13, 15, 17 (Hay una moda)

3. Se registró diariamente el número de nacimientos en un


hospital durante 15 días:
4, 8, 7, 6, 7, 8, 9, 8, 8, 7, 8, 7, 6, 7, 3
(existe 2 modas)
Moda para datos agrupados:
Si los datos son cuantitativos continuos y están agrupados en
intervalos de clase, el intervalo que contiene a la moda es aquella que
tiene la mayor frecuencia absoluta (se llama clase modal o intervalo
modal).
La fórmula para calcular la moda estará dado por:

 fi  fi1 
Mo  LI  C 
 ( fi  fi1 )  ( fi  fi1 ) 

donde: LI : límite inferior del intervalo modal


fi : frecuencia absoluta del intervalo modal
fi-1 : frecuencia absoluta del intervalo anterior al intervalo modal
fi+1 : frecuencia absoluta del intervalo siguiente al intervalo modal
Moda para datos agrupados:
Ejemplo 8:
La siguiente tabla de frecuencias muestra el gasto en compra de recetas
médicas de los pacientes que fueron atendidos en Dermatología. ¿Cuánto
es el gasto frecuente en compra de sus medicamentos?

Gasto en medicamentos Marca de clase (Xi) fi hi


[ 29.8 - 48.2 > 39 2 0.0571

[ 48.2 - 66.6 > 57.4 8 0.2286

[ 66.6 - 85.0 > 75.8 10 0.2857

[ 85.0 - 103.4 > 94.2 7 0.2000

[ 103.4 – 121.8 > 112.6 5 0.1429

[ 121.8 – 140.2> 131 3 0.0857


Total 35 1.0000
Desarrollo:
Gasto en medicamentos fi hi
La mayor frecuencia está en el [ 29.8 - 48.2 > 2 0.0571
tercer intervalo [66.6;85.0> , [ 48.2 - 66.6 > 8 0.2286
para f3 = 10 y es la frecuencia
modal. [ 66.6 - 85.0 > 10 0.2857
Reemplazar en la fórmula: [ 85.0 - 103.4 > 7 0.2000

[ 103.4 – 121.8 > 5 0.1429


 fi  fi1 
Mo  LI  C  [ 121.8 – 140.2> 3 0.0857
 ( fi  fi1 )  ( fi  fi1 )  Total 35 1.0000

Interpretación:
 2  Con frecuencia los pacientes de
Mo  66.6  18.4  dermatología gastan en
 23 medicamentos la suma de 73.96
Mo  73.96 soles.
LA UBICACIÓN DE LAS MEDIDAS DE TENDENCIA CENTRAL
DETERMINAN LA FORMA DE DISTRIBUCIÓN
5.2. MEDIDAS DE TENDENCIA NO CENTRAL
(POSICIÓN)
5.2. MEDIDAS DE TENDENCIA NO CENTRAL (POSICIÓN)

Son medidas que dividen la


distribución de datos en partes
iguales:
•La mediana divide en dos partes
iguales
• Los cuartiles son tres valores que
dividen a la serie de datos en cuatro
partes iguales.
• los deciles en 10 y los percentiles
en 100 partes iguales.
Clasificación de las medidas de posición

MEDIDAS DE
POSICION

CUARTILES DECILES PERCENTILES


5.2.1. Los Cuartiles (Qk)
Son valores que dividen a la muestra en cuatro partes
iguales y se denotan por Qk , k = 1, 2, 3.

Q1 : Primer Cuartil
Donde:
Q2 : Segundo Cuartil
Q3 : Tercer Cuartil
Cuartiles con datos sin agrupar

Ejemplo 1:
Se ha recopilado los gastos de mano de obra (en miles de
soles) de 7 fábricas durante el último mes, cuyos datos son:

14 15 16 18 7 8 15

Calcular e interpretar:
a. El cuartil uno ( Q1 )
b. El cuartil tres ( Q3 )
Cálculo del Cuartil Uno (Q1 )
Los datos son:
14 15 16 18 7 8 15
Procedimiento

Primero : Ordenamos los datos en forma ascendente

1º 2º 3º 4º 5º 6º 7º

7 8 14 15 15 16 18
𝑛+1 7+1
Segundo : Determinamos la posición de Q1: 𝑘( ) =1 =2
4 4

Tercero : Como la posición de Q1 es 2°, tomamos la segunda observación


ordenada
Entonces Q1 = 8
Interpretación.- El 25% de las fábricas tuvieron un gasto máximo de 8 000 soles
en mano de obra en el último mes.
Cálculo del Cuartil Tres (Q3 )
Los datos son: 14 15 16 18 7 8 15
Primero : Ordenamos los datos en forma ascendente
1º 2º 3º 4º 5º 6º 7º

7 8 14 15 15 16 18
Segundo : Determinamos la posición de Q3 𝑛+1 7+1
𝑘( )=3 = 16
4 4

Tercero : Como la posición de Q3 es 6, tomamos la 6º observación ordenada

Entonces Q3 = 16

Interpretación.- El 75% de las fábricas tuvieron un gasto máximo de 16 000


soles en mano de obra en el último mes.
EJEMPLO 2: Se tiene los sueldos diarios de cada trabajador de
diferentes ocupaciones

S/. 22 S/. 22 S/. 25 S/. 20


S/.30

¿Cuánto gana como máximo el 25% de los trabajadores por día?


Se debe calcular el cuartil uno (Q1 ) con los datos:

30 22 22 25 20
Primero : Ordenamos los datos en forma ascendente

1º 2º 3º 4º 5º
20 22 22 25 30

Segundo : Determinamos la posición de Q1 , cuyo valor es:

Esto significa que el valor de Q1 es el primer dato (1°) más 50% de la diferencia
entre los valores de las observaciones 2º y 1º posición.
Entonces: Q1 = 20 +0.5 ( 22 – 20) = 21

Interpretación.- El 25% de los trabajadores ganan como máximo 21


soles diarios.
Cuartiles de datos Agrupados
Los cuartiles para datos agrupados se calcula usando la siguiente
formula:
 n 
 K ( )  Fi 1 
Q k  LI  C  4
f 
 Q K 
 
Donde:
LI : Limite inferior de la clase que contiene al k-ésimo cuartil
c : Amplitud interválica de la clase que contiene al k-ésimo cuartil
Fi-1 : Frecuencia absoluta acumulada del intervalo inmediatamente
anterior a la clase que contiene al k-ésimo cuartil
fQK : Frecuencia absoluta simple de la clase que contiene al k-ésimo cuartil
Ejemplo 3:
Se ha registrado la estatura de 100 personas del sexo masculino
que participaron en una maratón de 10k, cuyos datos se muestran
en la tabla de frecuencias agrupada.
Estatura fi hi Fi Hi
150 - 155 5 0.5 5 0.5
156 - 162 9 0.9 14 0.14
163 - 169 22 0.22 36 0.36
170 - 176 32 0.32 68 0.68
177 - 183 15 0.15 83 0.83
184 - 190 13 0.13 96 0.96
191 - 196 4 0.4 100 1.0
Total 100 1.0

¿Entre qué estaturas se encuentra el 50% de maratonistas con


una estatura estándar?
Desarrollo
•Se debe calcular elquartil1 y cuartil 3 (percentil 25 y percentil 75)
•Primero se calculará el Q1
1.- Calculando la posición del Q1: k(n/4) = 1(100/4)= 25
2.- Ubicar la posición 25 en la columna de frecuencias absolutas
acumuladas, Fi = 36
3.- Para reemplazar en la fórmula se necesita: C = 6, LI= 163, fQk = 22

Reemplazando para Q1:

Para Q3

Interpretación.- El 50% de maratonistas con estatura


estándar tienen miden más de 166 cm y menos de 179 cm.
5.2.2. Los Percentiles (Pk)

Son valores ordenados que dividen a la muestra en cien


partes iguales y se denotan por Pk , k = 1, 2,….99.

Primer Percentil ( P1)


Es un valor que estudia el 1% de las observaciones
Segundo Percentil ( P2)
Es un valor que estudia el 2% de las observaciones
Tercer Percentil ( P3)
Es un valor que estudia el 3% de las observaciones
.
.
Noventa y nueve ( P99)
Es un valor que estudia el 99% de las observaciones
Percentiles con datos sin agrupar

Ejemplo 4:
Se ha recopilado las notas de 11 estudiantes los cuales son:

13 15 16 18 7 8 15 10 5 15 7

Calcular e interpretar el Percentil setenta ( P70 )


Desarrollo
Los datos son: 13 15 16 18 7 8 15 10 5 15 7

Primero : Ordenamos los datos en forma ascendente

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
5 7 7 8 10 13 15 15 15 16 18

Segundo : Determinamos la posición de P70 , se usa el valor

Esto significa que el valor de P70 es el Octavo dato más 40% de la diferencia entre
los valores de las observaciones 9º y 8º .

Entonces: P70 = 15 + 0.4 ( 15 – 15) = 15


Interpretación.- El 70% de estudiantes tienen como nota
máxima de 15.
Percentiles de datos Agrupados
Los Percentiles se calculan utilizando la siguiente formula:

 n 
k (
 100 )  Fi 1 
Pk  LI  C   k = 1, 2, …99
 f Pk 
 

Donde:
LI : Limite inferior de la clase percentilica
C : Amplitud interválica de la clase percentilica
Fi-1 : Frecuencia absoluta acumulada del intervalo inmediatamente anterior a la clase
percentilica
fPk : Frecuencia absoluta simple de la clase percentilica
Ejemplo 5
Con los datos del ejemplo 3 ¿Cuál es la estatura mínima del 30% de
maratonistas con mayor estatura?

 Se debe calcular el percentil 70

P70: El percentil de orden 70 deja por debajo al 70% de las


observaciones y por encima queda el 30%.
Desarrollo

1.- Calculando la posición del P70: k(n/100) = 70(100/100)= 70


2.- Ubicar la posición 70 en la columna de frecuencias absolutas acumuladas, Fi = 83
3.- Para reemplazar en la fórmula se necesita: C = 6, LI= 177, fPk = 15

Estatura fi hi Fi Hi
150 - 155 5 0.5 5 0.5
156 - 162 9 0.9 14 0.14
163 - 169 22 0.22 36 0.36
170 - 176 32 0.32 68 0.68
177 - 183 15 0.15 83 0.83
184 - 190 13 0.13 96 0.96
191 - 196 4 0.4 100 1.0
Total 100 1.0
Reemplazando en la fórmula de percentiles tenemos:

Interpretación.- El 30% de maratonistas con mayor estatura miden


más de 177.8 cm.
REFERENCIAS BIBLIOGRÁFICAS

Córdova M. (2003). Estadística Descriptiva e Inferencial.


Aplicaciones. 5ª ed. Lima: Moshera.

Nel, L. (2012). Estadística con SPSS 20. 1ª ed. Lima:


Macro.

Daniel W. (2002). Bioestadística. Base para el Análisis de


las Ciencias de la Salud. México: Editorial Limusa S.A.
“Caminante no hay camino, se hace camino al
andar”.
Antonio Machado

¡Muchas gracias!

Вам также может понравиться