Вы находитесь на странице: 1из 7

ESTADISTICA II

Medidas de Tendencia Central


MEDIA, MODA Y MEDIANA

Muchas veces usamos un solo número o información para representar la tendencia de toda una serie
de datos: “La esperanza de vida de los chilenos es de 78 años”; “El salario promedio en Chile es de 660
dólares mensuales”; “La mayoría de los chilenos se declara creyente”.
Estos números se conocen como medidas de tendencia central y son la media, la moda y la mediana.
__
La Media aritmética o promedio (X)
La media aritmética (o simplemente “la media”) de un conjunto de datos es un valor que se obtiene
sumando todos los datos y luego dividiendo por el total. _
Se anota X

Consideremos los puntajes de 50 alumnos en la PSU


Datos no agrupados Datos Agrupados
Clase Xi fi
480 520 670 580 500 570 700 540 690 500 300-399 350 2
520 450 570 540 620 450 460 790 580 610 400-499 450 13
550 630 460 470 510 630 510 720 490 540 500-599 550 19
690 510 500 710 520 480 750 450 670 610 600-699 650 11
320 680 530 510 350 400 400 640 430 480 700-799 750 5

Total 50

Veamos un ejemplo de los puntajes PSU:


La suma de los 50 puntajes da 27.480. Por lo tanto el promedio de los 50 puntajes es:
_
X= 27480/50
_
X= =549,6

Si en vez de tener todos los datos, solamente disponemos de la tabla de frecuencias, podemos calcular
el promedio usando las marcas de clase. En vez de pensar, por ejemplo, que hay 13 puntajes entre 400
y 499, asumiremos que hay 13 personas que sacaron 450 puntos. Dado que puede que no tengamos
los datos reales, esto permite tener una buena aproximación al promedio.

Veamos: Si hay 2 puntajes de 350, 13 de 450 puntos, etc., el promedio que obtenemos es:
_
X= (2×350+13×450+19×550+11×650+5×750)/50
_
X= 27.900/50
_
x= =558

Por lo tanto, la fórmula para encontrar la media aritmética está dada por:
__
X=∑ (fi*xi)/n

Comparado con el promedio real (549,6) hay 8,4 puntos de diferencia, lo cual no es mucho y si
compruebas los dos promedios calculados, verás que el primero es muchísimo más largo de realizar,
por lo cual el segundo es preferible, aunque sea menos preciso.

La moda. (Mo)
La moda de un conjunto de datos es aquel que aparece más veces. Si se repite entre dos (o tres o más)
datos, el conjunto de datos se denomina bimodal (o trimodal o multimodal). Si ningún dato se repite,
diremos que no hay moda.
En el caso de los puntajes PSU, el intervalo modal es 500 – 599 (pues es el intervalo que presenta la
mayor frecuencia: 19).

Profesor Gary Vilches Campos 1


ESTADISTICA II
Con la siguiente fórmula podemos encontrar la moda:

Mo= Li + A*[fm – f(m-1) / 2fm - f(m-1) - f(m+1) ]


Donde: Li = límite inferior del intervalo modal
fm = frecuencia absoluta intervalo modal
f(m-1) = frecuencia absoluta intervalo anterior al modal
f(m+1) = frecuencia absoluta intervalo siguiente al modal
A = ancho del intervalo

La mediana. (Me)
Si ordenamos los datos desde el menor hasta el mayor, la mediana es un valor bajo el cual está el 50%
de los datos. Si hay dos datos que ocupan el lugar central, se calcula el promedio de ellos.
Por ejemplo:
a) La mediana de 1, 3, 5, 8, 9 es 5.
b) La mediana de 1, 3, 3, 5, 8, 8 es 4 (el promedio entre 3 y 5, pues estos son los datos del centro).

Para datos agrupados usaremos la siguiente fórmula:

Me= Li + A*[(n/2 - F(m-1) )/fm ]

Donde: Li = límite inferior del intervalo mediano


fm = frecuencia absoluta intervalo mediano
F(m-1) = frecuencia absoluta acumulada intervalo anterior al mediano
A = ancho del intervalo

n/2 = mitad de la muestra

Ejemplo: Se encuesta a un curso de 25 alumnos y se les pregunta “¿cuántos hermanos tienes?”.

La tabla siguiente muestra los resultados de la encuesta.

N° de hermanos N° alumnos
0 2
1 10
2 8
3 4
4 0
5 1

¿Cuál es la media, la moda y la mediana?


Solución:
a) Media.
0×2+1×10+2×8+3×4+4×0+5×1/25
_
X= 43/25
_
x= 1,72
Respuesta: Los alumnos del curso tienen, en promedio, 2 hermanos.

b) Moda.
La moda es 1, pues es el dato con la mayor frecuencia (10).
Respuesta: Los alumnos del curso tienen, en cuanto a moda, 1 hermano.

Profesor Gary Vilches Campos 2


ESTADISTICA II
c) Mediana.
Como son 25 alumnos, el del medio es el alumno número 13. Hay 2 alumnos que no tienen hermanos y
10 que tienen 1 hermano. Es decir, los primeros 12 alumnos tienen 0 ó 1 hermano. Por lo tanto el
alumno número 13 tiene 2 hermanos.
Respuesta: Los alumnos del curso tienen, en cuanto a mediana, 2 hermanos.

El ejemplo anterior te muestra que los valores de la media, la moda y la mediana pueden ser bastante
diferentes, por lo tanto hay que pensar bien cuál es el más representativo en cada caso.

Ejemplo 2:
La siguiente tabla muestra las atenciones médicas de un hospital durante un fin de semana,
considerando las edades de los pacientes:
Años f (N° de pacientes) F
[10-20[ 8 8
Intervalo modal y mediano
[20-30[ 20 28
[30-40[ 14 42
[40-50[ 8 50
[50-60[ 2 52
[60-70[ 2 54
[70-80[ 1 55

Encontrar Moda y Mediana

Mo= Li + A*[fm – f(m-1) / 2fm - f(m-1) - f(m+1) ]

Mo = 20 + 10[(20 – 8)/2*20 – 8 – 14)]


Mo = 20 + 10 [12/18]
Mo = 20 + 10*0, 67
Mo = 20 + 6,7
Mo = 26, 7 ≈ 27
Rp: La edad de las personas que más se atendieron ese fin de semana fue de alrededor de 27 años.

Me= Li + A*[(n/2 - F(m-1) )/fm ]

Me = 20 + 10[(55/2 –8)/20]
Me = 20 + 10[27,5 – 8)/20]
Me = 20 + 10[19, 5/20]
Me = 20 + 10*0,975
Me = 20 + 9,75
Me = 29, 75 ≈ 30

Rp. El 50% de los pacientes atendidos ese fin de semana eran menores de 30 años. (El otro 50% era
mayor de 30 años).

ACTIVIDADES

1. Un supermercado hace un estudio y descubre que las bolsas de mercadería que llevan las
personas pesan entre 500 gramos y 2 kilos. La siguiente tabla muestra los datos:
Peso de la bolsa N° de bolsas
(kg) Encontrar las Medidas de Tendencia Central e

Profesor Gary Vilches Campos 3


ESTADISTICA II
(0,5 - 0,8( 5 interpretar su valor.
(0,8 - 1,1( 32
(1,1 - 1,4( 26
(1,4 - 1,7( 11
(1,7 - 2,0) 6

2. Un colegio hace un estudio acerca de las estaturas de los alumnos. La siguiente tabla te
muestra los resultados.
Estatura N° alumnos
(cm) Encontrar e interpretar las Medidas de
150 - 155 4 Tendencia Central.
155 - 160 22
160 – 165 56
165 – 170 32
170 - 175 5

3. La siguiente tabla muestra el peso en kg de un grupo de jóvenes:

55 64 70 74 75 70 64 93 60 62 70 80
61 62 60 68 65 65 66 68 70 72 72 71
56 56 56 53 60 65 60 45 46 50 47 55
49 52 50 46 50 52 52 48 52 63 53 54
54 54 53 55 57 44 67 61 68 55 64 60

a) Elaborar Tabla de frecuencia


b) Encontrar e interpretar las medidas de tendencia central

MEDIDAS DE DISPERSIÓN.

PARA DATOS NO AGRUPADOS

ACTIVIDAD
Consideremos los siguientes conjuntos de valores referidos a las edades de los jugadores de dos
equipos de fútbol.
Equipo 1: 24,25,26,23,26,21,27,24,23,26,25
Equipo 2: 36,18,28,17,37,15,14,44,27,21,13

1. Calcula la media de las edades en los dos equipos.


2. ¿Qué puedes decir respecto de las edades del equipo 1 en relación a su media?
3. ¿Qué puedes decir respecto de las edades del equipo 2 en relación a su media?

En este caso, conformarnos solo con la media para informar sobre las edades de los jugadores es
insuficiente. Tal como habrás observado, en el equipo 1 todos los jugadores tienen edades cercanas a
los 24 años, y en cambio en el equipo 2 las edades son mucho más variables: varían entre los 13 y los
44 años.

Necesitamos entonces algún indicador estadístico que nos indique cuánto se separan algunos valores
de su media.

Las medidas de tendencia central que ya vimos (media, moda y mediana) sólo nos dicen parte de la
historia de un conjunto de datos. En general, no indican cómo están distribuidos los datos, es decir, si
estos son muy variables o no.

Las medidas de dispersión sí lo hacen. Las medidas de dispersión indican qué tanto se dispersa o
distribuye, alrededor de su media, un conjunto de datos. También entregan información sobre la
Profesor Gary Vilches Campos 4
ESTADISTICA II
variabilidad de las observaciones. Si los datos no son muy variables (como en el ejemplo 1), decimos
que hay homogeneidad; en caso contrario se habla de heterogeneidad del conjunto de datos.

Las medidas o estadígrafos de dispersión que estudiaremos son:


Rango, Varianza y Desviación Estándar.

1. Rango o recorrido

El rango de una variable es la diferencia entre el valor máximo y el valor mínimo de la distribución.
Aunque no es una medida muy significativa, nos indica cuán dispersos se encuentran los datos entre
los valores de los extremos.

 En nuestro ejemplo, ¿cuál es el rango en el equipo 1? ¿Y en el equipo 2?


 ¿Qué equipo es más disperso, es decir más heterogéneo?
 ¿Cómo interpretarías el valor del rango?

2. Varianza (S)

Si elevamos al cuadrado la suma de todas las diferencias entre cada variable con el promedio de la
muestra y luego dividimos por el número total de la muestra, obtenemos un número denominado
varianza.

Matemáticamente:
La varianza como medida de dispersión sólo tiene un inconveniente: Su
n _ valor está dado en unidades cuadradas. Por lo tanto, no es muy
s= ∑ (xi-x)2 recomendable su uso. Para solucionar esto, definimos un nuevo
i=1________
indicador estadístico, la Desviación Estándar.
n

3. Desviación estándar o típica (

La desviación estándar es la raíz cuadrada de la varianza, es decir:


 √s Observaciones: Entre más cercana a cero la los datos son más homogéneos.
consideraremos≤ 5 para indicar que los datos son homogéneos, de lo
contrario, los datos serán heterogéneos)

Una vez obtenido este valor, debemos encontrar el intervalo de concentración, que es donde se agrupa
la mayoría de los datos, lo que está dado por:
_ _
IC= [X - , X + 

También podemos encontrar el Coeficiente de variación, este nos permite determinar cuan dispersos
están los datos en general. Además, nos permite comparar distintos estudios, con relación a la
homogeneidad de sus datos.
CV = Ẍ

ACTIVIDADES

1. ¿Es posible que la desviación estándar sea negativa? ¿Puede ser cero? En ambos casos explica tu
respuesta.

2. ¿Qué se puede decir de un conjunto de datos, si sólo sabemos que su media es 67 y que tanto su
rango como su varianza son cero?

3. Camila obtuvo el primer semestre en matemática las siguientes notas :3,6-5,9-7,0-4,7-6,2-6,2


Profesor Gary Vilches Campos 5
ESTADISTICA II
3.1 Calcula el promedio de Camila el primer semestre en matemática.
3.2 Calcula la desviación estándar.
3.3 ¿Consideras que el rendimiento académico en matemática de Camila fue parejo? ¿Qué información
te permite justificar tu respuesta?

4. En el cuarto medio A de un colegio de Temuco el promedio de las estaturas es de 183 cm y la


desviación estándar 35 cm. En un colegio de Rancagua el cuarto medio B tiene un promedio de 174
cm y la desviación estándar es 5 cm. Son verdaderas o falsas las siguientes afirmaciones, justifica:
4.1 Los alumnos del cuarto B tienen una estatura más pareja que los alumnos del cuarto A.
4.2 De esta población, los alumnos más altos están en el cuarto A.
4.3 De esta población los alumnos más bajos están en el cuarto B.

5 Un profesor de matemática debe elegir entre sus dos mejores alumnos Andrés y Paula para una
Olimpiada de matemática. Las notas de ambos son:
Andrés 6,5- 6,6- 6,4- 6,6- 6,5- 6,7
Paula 7,0- 6,0- 6,3- 6,0- 7,0- 7,0

¿A cuál alumno le aconsejas que presente a la Olimpiada? Justifica.

6. A los dos 2° medios de un colegio se le aplica una misma prueba de matemática, obteniendo
los siguientes resultados:

Curso 2° medio A 2° medio B


Promedio 5,3 5,3
 0,8 0,3

Juan Pablo, alumno del 2° medio A, obtuvo un 6,7 y Gabriel, alumno del 2° medio B, obtuvo un 6,6.
¿Quién obtuvo un mejor rendimiento en la prueba en relación con su curso?

MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS

Cuando tenemos datos agrupados, el rango se calcula como la diferencia entre el mayor valor de la
última clase menos el menor valor de la primera clase.

Para calcular los otros parámetros estadísticos, varianza, y desviación estándar, a partir de datos
agrupados, consideremos las marcas de clases como si fueran los valores verdaderos, es decir xi.
Recuerda que la marca de clases corresponde al punto medio de una clase.

La Varianza está dada por la fórmula:

n _
 ∑ fi*(xi - x)2
S= i=1________ ____
n

Así:

Desviación estándar:
n _
 √ ∑ fi*(xi - x)2
i=1________ ____ o  √s (raíz cuadrada de la varianza)
n

ACTIVIDADES

1. Determina rango, varianza y desviación estándar en Notas Frecuencia


Profesor Gary Vilches Campos 6
ESTADISTICA II
la siguiente distribución, completando la tabla. [1-2[ 1
[2-3[ 2
[3-4[ 2
[4-5[ 5
[5-6[ 3
[6-7[ 5
Total 18

2. Se ha aplicado una prueba a dos grupos de Puntuación Grupo 1 Grupo 2


alumnos, obteniéndose las siguientes [15-20[ 2 3
puntuaciones: [20-25[ 8 6
[25-30[ 13 9
Aplicando lo visto en esta guía, ¿qué puedes decir [30-35[ 7 9
de ambos grupos? [35-40[ 6 6
[40-45[ 3 4
[45-50[ 3 4

3. En un curso se anotan los pesos en kilos de los alumnos obteniéndose los siguientes valores:
63- 56- 51- 81- 68- 69- 67- 65- 71- 56- 77- 73- 67- 65- 63- 71- 72- 67- 58- 68- 58-
69- 65-56-58-67-65- 66- 68- 71- 65- 69- 61- 72- 78- 65- 70-49-56-59-54-65-64-53-
69-70-64-64-63-62-61-67-67-65-64-60-60-56-47-56-71-44-55-65-53-61-63-45-49
a) Calcula la media, la moda y la mediana.
b) Calcula la desviación estándar.

4. Un supermercado desea saber cuánto gasta una familia cuando realiza sus compras (en miles de
pesos). Un día realiza una encuesta a 5000 de sus clientes. Este estudio nos aporta la siguiente tabla:

Intervalo Frecuencia
0-5 1000
5-10 1100
10-20 1600
20-50 1000
50-100 300
a. ¿Cuánto gastan en promedio?
b. Encontrar en coeficiente de variación.

Profesor Gary Vilches Campos 7

Вам также может понравиться