Вы находитесь на странице: 1из 60

Tema

1
PROMEDIOS
Un motivo para hacer sospechar que la
Estadística es más un arte que una
ciencia, gira en torno a la ambigüedad
con que se usa el término “promedio”.
OBJETIVOS

Al finalizar la Tema 1, el participante será capaz de:

1. Diferenciar los diversos tipos de medidas de resumen


que se pueden aplicar a un conjunto de datos

2. Calcular e interpretar las principales medidas de


tendencia central
CONTENIDO

1. Principales medidas de tendencia central


1.1 Medias
1.2 Mediana
1.3 Moda
1.4 Cuartiles
1.5 Percentiles
1. Las medidas de tendencia central
1. En general se denominan promedios.
2. Los más importantes son la media, la mediana y la moda.
Aritmética
Media Geométrica
Medidas de Mediana Armónica
tendencia central Moda

3. También es útil conocer los percentiles (o fractiles).


¿POR QUÉ SON IMPORTANTES LAS MEDIDAS DE
TENDENCIA CENTRAL?
Porque la mayor parte de los conjuntos de datos
muestran una tendencia a agruparse alrededor de un
dato central.
Las medidas de tendencia central son puntos en una
distribución, los valores medios o centrales de ésta y
nos ayudan a ubicarla dentro de la escala de medición.
1.1 La Media
(A) La media aritmética ( x )
a) Obtención: Se obtiene sumando los valores
registrados y dividiéndolos entre el número de datos.
Ejemplo:
La siguiente tabla muestra el número de reclamos
y quejas presentadas por pacientes en el Servicio de
Emergencias a lo largo de una semana. Calcule e
interprete la media.

Día/Semana Lun Mar Mier Jue Vier Sab


Reclamos/día 8 10 5 12 10 15
Media aritmética = 8  10  5  12  10  15 60

6 6
x = 10 reclamos
b) Interpretación: Si elige al azar un día de la semana, se
espera que los pacientes del servicio de emergencia
realicen 10 reclamos en ese día.
c) Simbología:
Tamaño Media aritmética
Muestra n (equis barra)
Población N  (mu)x
d) Cálculos : a partir de datos no agrupados, se
utilizan las siguientes formulas.
Para una muestra
n
donde: x : media muestral
 Xi
x  i 1
n
 X
i
: suma de todos los datos

n : número de datos (muestra)


Para una población
N donde:  : media poblacional
 Xi  X : suma de todos los datos
 i 1 i

N N : número de datos (población)


e) Cálculo a partir de datos agrupados:
El cálculo de la media aritmética, cuando los datos
disponibles se encuentran en tablas de distribución de
frecuencias, se realiza n utilizando la formula siguiente
 fi Xi
x  i 1
n
 fi
i 1
donde: x :media muestral
fi :frecuencia absoluta de la clase i
Xi :marca de la clase i
Ejemplo:
La distribución de frecuencias siguiente, representa los puntajes
obtenidos en una evaluación del desempeño, aplicado al
personal técnico de un Centro de Salud. El puntaje máximo en la
prueba es 50. Calcule e interprete en media.

Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularán las marcas de clase ( Xi);
es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase
clase ( xi ) absoluta(fi)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60

x
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10) x  1575
4 + 8 + 15 + 23 + 10 60
x  26.25
Interpretación: Si se elige al azar a un trabajador técnico de este
hospital, se espera que tenga un puntaje de 26,25 en su
evaluación de desempeño.

f) La media aritmética ponderada ( x p )


n
donde:
 wi X i
x p  i 1n wi = factor de ponderación
 wi
i 1

X i = datos
Ejemplo: Una empresa comercializadora de Seguros Médicos
dispone de 3 representantes para la zona de Miraflores, cada
uno de los cuales cobra diferente comisión por póliza vendida, y
realiza diferente número de contratos. Calcule e interprete el
valor medio de la comisión

Nº de polizas de Comisión
Vendedor Seguro Médico por venta $
wi Xi
Pedro 30 30
Juan 25 40
Pablo 20 50
30(30)  25(40)  20(50) 2900
xp    $38.67
30  25  20 75

Interpretación:

Si se elige al azar un representante se espera que cobre una


comisión de $38.67 por póliza vendida.
g)Ventajas y desventajas de la media aritmética
Ventajas:
Concepto familiar para muchas personas
Es única para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no están
agrupados, su cálculo es tedioso
Si los datos están agrupados en clases con
extremos abiertos, no es posible calcular la
media.
(B) La media geométrica ( xg )

Se utiliza para calcular tasas medias de variación, como la


tasa media de crecimiento poblacional, la tasa media de
inflación mensual, la tasa media de mortalidad, entre
otros.

a) Obtención Se obtiene extrayendo la raíz enésima


del producto de los n valores de una serie.

xg  n X1  X2  X3  .........Xn
Ejemplo:
La siguiente tabla muestra la tasa de aumento en las quejas
durante los últimos meses. Calcule e interprete la tasa media
mensual.

Meses Enero Febrero Marzo Abril Mayo


Aumento de
2.6% 5.4% 3.8% 0.5% 1.4%
quejas

La tasa 2,6% también se puede expresar como 0,026 , y


puesto que se refiere a un aumento a partir de una base
de 100%, el factor de variación será 1,026. Para los
otros datos se opera igual.
b) Cálculos

Por lo tanto, la media geométrica se calcula:


xg n x1, x 2, x3,......x
x g  5 (1.026) (1.054) (1.038) (1.005)(1.014)
x g  5 1.143903377
x g  1,0272540 ( Factorde crecim iento m edio)

Tasa media
= (x g  1) 100
de variación
= (1,0272540 - 1) x 100 = 2,72%
c) Interpretación

Si se selecciona al azar un mes entre enero y mayo,


se espera que las ventas se hayan incrementado
2.72% con respecto al mes anterior.
(C) La media armónica ( xh)
Se utiliza para calcular el tiempo medio, velocidad y
aceleración media, como por ejemplo, el tiempo medio
para realizar determinada cirugía.

a) Obtención: se obtiene calculando el inverso de la


media aritmética de los inversos de una serie.

1
xh  n 1

i 1
X
i
n
Ejemplo:
Los siguientes datos registran el tiempo que utilizan cuatro
médicos al realizar una cierta intervención quirúrgica. Calcule e
interprete el tiempo medio.

Médico A B C D
Tiempo
45 38 52 40
(minutos)

Conocer el tiempo medio permite contar con una


herramienta útil en la planeación de los recursos, como
la Sala de Operaciones. Además de poder comparar
nuestro desempeño con los estándares de calidad
internacionales.
4 4
xh  1 1 1 1

1976  2340  1710  2223
  
45 38 52 40 88920

4  88920
xh   43.117953 minutos
8249

xh  43 minutos 7 segundos

b) Interpretación:

Si se selecciona al azar a uno de los cuatro


médicos, se espera que realice este tipo de cirugía
en 43 minutos aproximadamente.
1.2 La Mediana
Es la medida que divide en dos subconjuntos iguales a
datos, de tal manera que 50% de los datos es menor a
la mediana y el otro 50% es mayor a la mediana.

a) Obtención: Se obtiene ordenando la serie de datos


(en forma ascendente o descendente) y ubicando el
dato central.
Ejemplo:
Los siguientes datos se refieren al número de pacientes
que llegaron a su cita, después de la hora programada
durante los últimos 11 días en el Servicio de Pediatría.
Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:


5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
5 datos menores 5 datos mayores
mediana
b) Interpretación: Durante 5 días llegaron menos de 11
pacientes tarde a su cita y durante 5 días, más de 11
pacientes llegaron tarde a su cita.

c) Reglas

1º Si la serie es impar, la mediana ocupa el lugar central de


la serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24


2º Si la serie es par, la mediana se obtiene de la semisuma de
los dos valores centrales de la serie previamente ordenada.

Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18  23
mediana   20.5
2
 n  1
3º Sea la serie par o impar, la mediana ocupa el lugar 
 2 
,de la serie previamente ordenada.
d) Cálculo a partir de datos agrupados.

 n 1 
 2   F  1 
Md  Li   c
 f Md 
donde:  
Md : mediana
L i : limite real (o frontera) inferior de la clase
mediana.
n : número total de datos.
F : suma de todas las frecuencias hasta, pero
sin incluir, la clase mediana.
f Md : frecuencia de la clase mediana
c : amplitud de clase
Ejemplo: La tabla siguiente muestra la experiencia laboral
(años) del personal de seguridad que labora en un gran
hospital. Calcule e interprete la mediana.

Lugar de la mediana:
Experiencia Número de n  1 69  1
laboral trabajadores   35o
(años) de seguridad 2 2
 69  1  (16) 
0-3 4
4-7 12
Clase Md  7,5   2 4
8 - 11 24  24 
Mediana  
12 - 15 16
16 - 19 10
 7 ,5 
 35  16  4
20 - 23 3
69
 24 
Mediana = 10,5 años
Interpretación:

La mitad del personal de seguridad que


labora en este hospital tienen una experiencia
laboral igual o menor a 10 años 6 meses. La
otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 años y
6 meses.
e) Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana como en el
caso de la media aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos, registrados
bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la serie de
datos.
Para una serie amplia de datos no agrupados, el proceso
de ordenamiento de los datos demanda tiempo y
usualmente provoca equivocaciones.
1.3 La Moda
La moda es el valor que más se repite dentro de un
conjunto de datos.
a) Obtención: se obtiene organizando la serie de datos y
seleccionando el o los datos que más se repiten.

Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de facturación
durante un mes, en una Clínica. Calcule e interprete la moda.

Errores de
facturación Días
0-3 6
 6
1
Clase
Clase moda : (4 - 7)
4-7 12
Modal
 6 
8 - 11 8  4 Mo  3.5    4
12 - 15 3
2
64
16 - 19 1
Total 30 Mo = 5,9
Interpretación: Durante un mes, el número más frecuente de
errores de facturación en esta clínica es 6.
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o más
clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribución amodal).
En otros casos la distribución tiene varias modas, lo
que dificulta su interpretación.
1.4 Los Percentiles
Son los valores que dividen en 100 partes iguales
a un conjunto de datos

a) Cálculo: para datos agrupados.

 100
 
 Kn  F  1 
i 
P L  c
K i  f 
 P
K

donde:
P : percentil
K
K : el percentil buscado
n : número de datos
Fi : frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el percentil K
f
P : frecuencia absoluta de la clase donde se ubica
K
el percentil K
c : amplitud de clase
Ejemplo:
La tabla muestra la experiencia (en años) de las
enfermeras de un gran centro hospitalario

Experiencia Trabajadores
(años)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
¿Sobre qué edad se ubica el 25% de las enfermeras de mayor
experiencia?

75 % 25 %

P75
Menor Mayor
Experiencia Experiencia
K = 75

Kn 75(334)
Lugar del P75    250,5o (de los números ordenados )
100 100

Para saber en cuál clase se halla este dato, se calculó la


frecuencia acumulativa.
Experiencia Nº Trabajadores Frec. Acumulada
(años) fi Fi
0-3 18 18
4-7 42 60 F=248
8 - 11 68 128
12 - 15 120 248 En esta clase
16 - 19 40 288 se localizan del
20 - 23 34 322 249º - 288º
24 - 27 12 334
334

 75(334)  248  1


 100  P  15.65 años
P  15 .5  4
75  40  75
 
Interpretación: Para que una enfermera esté
comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 15 años, 7 meses y 24 días.
MEDIDAS DE
DISPERSIÓN
OBJETIVOS

• Calcular e interpretar las principales medidas de dispersión:


A) Rango
B) Varianza
C) Desviación estándar
CONTENIDO

1. MEDIDAS DE DISPERSIÓN
1.1 Rango
1.2 Varianza
1.3 Desviación estándar
1.- Las medidas de dispersión

Llamadas también medidas de variabilidad


Son útiles porque:
1. Permiten juzgar la confiabilidad de la medida de tendencia central.
2. Los datos demasiados dispersos tienen un comportamiento especial.
3. Es posible comparar dispersión de diversas muestras.
1.1 El rango (R)

Llamado también recorrido, amplitud total o alcance.

a) Obtención: se obtiene de la influencia entre el dato mayor y


el dato menor más una unidad significativa, a fin de incluir ambos
valores extremos.
Ejemplo:

Los siguientes datos representan el peso de 10 niños al nacer, (en Kg.). Calcule e
interprete el rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120

Rango = (4,170 - 2,860) + 0.001


Rango = 1,311 Kg.
b) Interpretación
La diferencia entre el bebe de mayor peso y el bebe menor peso es
1,311 Kg.

c) Cálculo a partir de datos agrupados, se utiliza la siguiente fórmula:


R= (Ls - Li ) + 1
donde: : Limite superior de la
L clase
última
s
: Limite inferior de la
L clase
primera
i
Ejemplo:
La distribución de frecuencias siguiente representa el tiempo que espera un paciente
para ser atendido, en un consultorio externo. Calcule e interprete el rango

Tiempo Nº de PacientesRango = (36-12) + 1


(minutos) (por día)
12 - 16 4
17 - 21 8 R = 25 minutos
22 - 26 15
27 - 31 23
32 - 36 10
Total 60
Interpretación: la diferencia de tiempo entre el paciente que más espera y el que
menos espera para ser atendido es 25 minutos.
f) Ventajas y desventajas del rango
Ventajas
fácil de calcular
fácil de entender e interpretar

Desventajas
sólo considera los valores extremos
no toma en cuenta ni el número de datos ni el valor de estos
no es posible calcular en tablas con extremos abiertos.
1.2 La varianza

Es una medida de desviación promedio con respecto a la media


aritmética

a) Cálculos a partir de datos no agrupados.


n

 (X i  x )
2

para una muestra



2 i 1
S n 1
N

 (X i   )
2

 
2 i 1
para un población
N
Ejemplo:
La siguiente información se refiere al número de radiografías reprocesadas
durante una semana. Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma siguiente:

x Xi  x Xi  x  2

8 8 - 10 = 2 4 60
10 10 - 10 = 0 0 x
5 5 - 10 = 5 25 6
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25 x  10
 X  60  Xi  x   0  Xi  x 
2
 58
 Xi  x   58
2

 (X i  x )
2

S 
2

n 1

58
S  6  1  11.6
2
1.3 La desviación estándar
Llamada también desviación típica representa la variabilidad (o desviaciones)
promedio de los datos con respecto a la media aritmética. Es la raíz cuadrada de
la varianza, sea poblacional o muestral.
a) Cálculos a partir de datos no agrupados

 (X i  x )
2
para la muestra
S 
2 i 1
s n 1

N
 (Xi   )
2
para la población
  2  i 1
N
Ejemplo:
La siguiente información se refiere al número de radiografías reprocesadas
durante una semana. Calcule la desviación estándar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11,6 Entonces

S
2
s
S 11,6

S  3,4 radiografi as
El sordo cree
que los que bailan
están locos.
Si tu no escuchas,
es probable que puedas
estar pensando de una manera semejante.
…ESCUCHA!
Hoja de Comprobación

1. El valor de cada observación del conjunto de datos se toma en cuenta


cuando calculamos su mediana
2. Cuando la población esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posición, debido a
que siempre cae entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones están dispersas

4. Una medida de la agudeza de una curva de distribución es el sesgo

5. Con un conjunto de datos no agrupados, la moda se utiliza con mas


frecuencia como medida de tendencia central
6. Si organizamos las observaciones de un conjunto de datos en orden
descendente, el punto de datos que se encuentra en medio es la mediana
del conjunto de datos
7. Cuando se trabaja con datos agrupados, podemos calcular una
media aproximada si suponemos que cada valor de una clase dada es igual a
su punto medio

8. El valor que más se repite en un conjunto de datos se conoce como media


aritmética

9.Para un arreglo de datos con 50 observaciones, la mediana será el valor de la


observación numero 25 del arreglo

10.La desviación estándar se mide en las mismas unidades que las


observaciones del conjunto de datos

11.La varianza indica la distancia promedio de cualquier observación del


conjunto de datos con respecto a la media
12. Si la curva de una cierta distribución tiene el extremo mas largo
hacia la izquierda de la escala de medición del eje horizontal, se
dice que la distribución esta negativamente sesgada
13.Después de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero de
observaciones

14.Una media calculada a partir de un conjunto de datos agrupados siempre da


una buena estimación del valor real, aunque rara vez es exacto

15.Podemos calcular una media para cualquier conjunto de datos, si se nos da su


distribución de frecuencias

16.La moda siempre se encuentra en el punto mas alto de una gráfica de un


arreglo de datos

17. El numero de elementos de una población se denota con n


18.Los valores extremos de un conjunto de datos tienen un fuerte efecto
sobre la mediana

19.La diferencia entre las observaciones mas alta y mas baja de un conjunto de
datos se conoce como media geométrica

20.La dispersión de un conjunto de datos da una cierta visión de la confiabilidad


de la medida de tendencia central

21.La desviación estándar es igual a la raíz cuadrada de la varianza

22. .La diferencia entre las observaciones mas alta y mas baja de un conjunto de
datos se conoce como el alcance cuartil

23. El alcance intercuartil esta basado solamente en dos valores tomados del
conjunto de datos
24.Un fractil es una posición en una distribución de frecuencias en la
que una determinada fracción (o porción) de los datos esta situada
en ella o por encima
25.La varianza, al igual que la desviación estándar, toma en cuenta cada
una de las observaciones del conjunto de datos

26. .El coeficiente de variación es una medida absoluta de la dispersión

27. La medida de dispersión que con mas frecuencia utilizan los


especialistas en estadística es la desviación estándar
28.Una de las ventajas de las medidas de dispersión es que cualquier
estadística que mide variación absoluta, también mide variación relativa
29. Una desventajas de utilizar el alcance para medir la dispersión es que no
toma en cuenta la naturaleza de las variaciones entre la mayoría de las
observaciones
30. Cada población tiene una varianza que se simboliza con S2

31.De acuerdo con el teorema de Chebyshev, no mas de 11% de las


observaciones de una población puede tener resultados estándar de la
población mayores que 3 o menores que -3

32.El alcance intercuartil es un ejemplo especifico de un alcance interfractil

33.Es posible medir el alcance de una distribución de extremo abierto

34.El alcance intercuartil mide el alcance promedio de la cuarta parte más


baja de una distribución.
Algunas personas
sueñan con
alcanzar grandes logros...
mientras que otros
permanecen despiertos
y los realizan!

Вам также может понравиться