Вы находитесь на странице: 1из 13

1

MEDIDAS DE TENDENCIA CENTRAL


LA MEDIA ARITMETICA
Entre las medidas de tendencia central, la mas popular es la media
aritmtica, que comnmente se llama promedio
DEFINICION: La media aritmtica de un conjunto de N datos:
x1, x2, .., xN, se denota por x y se define as:
N

= x1 x 2 .....x N

x
i 1

NOTA: El smbolo es la letra griega sigma mayscula que corresponde a


la letra S.
EJEMPLO 1: Calcular la media de 8, 16, 4, 12 y 10
SOLUCION:
x

8 16 4 12 10 50

10
5
5

Advierta: la media es uno de los datos.


EJEMPLO 2: Calcular la media de
SOLUCION:
x

8, 16, 4, 12 y 5

8 16 4 12 5 45

9
5
5

La media, 9, no es uno de los datos


Si los nmeros x1 x 2 .....x N ocurren f 1 , f 2 ,....., f N veces, respectivamente (o
sea con frecuencias f 1 , f 2 ,....., f N ), la media aritmtica es
N

f x f x ........f N x N
x 1 1 2 2

f1 f 2 ..........f N

fi x i
i 1
N

f
i 1

f x
i 1

EJEMPLO 3: 5, 8, 6 y 2 ocurren con frecuencias 3, 2, 4 y 1 respectivamente.


Hallar la media.
SOLUCION:
3(5) 2(8) 4(6) 2 15 16 24 2 57
x

5.7
3 2 4 1
10
10

2
A veces asociamos con los nmeros x1 , x 2 ,....,.x N , unas ponderaciones (o
pesos) w1 , w2 ,....., w N , dependiente de la relevancia asignada a cada nmero
(no a su frecuencia). En este caso:
N

w x w2 x 2 .....wN x N
x 1 1

w1 w2 .....wN

w x
i 1
N

w
i 1

Se llama media aritmtica ponderada con pesos w1, w2,......, wn


EJEMPLO 4: El primer examen parcial vale el 20%, el segundo parcial, el 25%,
las tareas el 30% y el examen final el 25% de la nota final. Si un estudiante
tiene las calificaciones 1er. P: 3.0; 2.P: 5.8; tareas: 8.0 y EF: 6.4, Cul es la
media aritmtica ponderada (nota final)?
SOLUCION:
x

(0.2)(3.0) (0.25)(5.8) (0.3)(8.0) (0.25)(6.4)


6.05
0.2 0.25 0.30 0.25

VERIFICANDO SU COMPRENSIN
1. Calcule la media aritmtica para el conjunto de datos.
a) 6,8,3,9 y 5
b) 6,6,8,8,3,9,9,9,5 y 5
2. Calcule la media aritmtica ponderada para el conjunto de datos 3.0, 2.0,
6.5 y 8.4 con los pesos: 20%, 20%, 30% y 30% respectivamente.
1.5.2 LA MODA

DEFINICION: La moda de un conjunto de nmeros es el valor que ocurre con


mayor frecuencia (valor ms frecuente)

NOTA: La moda de un conjunto puede no existir, e incluso no ser nica, en


caso de existir.
EJEMPLO 5. El conjunto 1, 2, 3, 3 y 4 tienen moda 3
EJEMPLO 6. El conjunto 1, 2, 3, y 4 no tienen moda
EJEMPLO 7. El conjunto 1,1, 2, 2, 3 y 4 tiene dos modas: 1 y 2; se dice que
es bimodal.

3
1.5.3 LA MEDIANA
DEFINICION: La mediana (med) de un conjunto de nmeros ordenados en
sentido creciente (decreciente) es: el valor central, si el nmero de datos es
impar; o la media de los valores centrales, si el nmero de datos es par.
EJEMPLO 8. El conjunto de nmeros 3,4,4,5,6,8,8,8 y 10 tiene mediana 6
EJEMPLO 9. El conjunto de nmeros 5,5,6,8,9 y 10 tiene mediana x

68
7
2

EJEMPLO 10. Calcular la mediana del conjunto: 8,5,10,7,6,9,2,2,5 y 6


SOLUCION:
Primero se ordenan los nmeros (orden creciente): 2,2,5,5,6,6,7,8,9 y 10.
Como hay un nmero impar de datos, la mediana es 6 (la mediana es uno de
los datos)
EJEMPLO 11. Calcular la mediana del conjunto: 7,4,7,4,5,5,6,6,6,3,3,2,1 y 1
SOLUCION:
Primero se ordenan los nmeros (orden creciente): 1,1,2,3,3,4,4,5,5,6,6,6,7 y
7. Como hay un nmero par de datos, la mediana es

45
4.5 (la mediana
2

no es uno de los datos)


VERIFICANDO SU COMPRENSION
Calcule la mediana a cada uno de los conjuntos de nmeros dados.
a) 7,5,6,4,4,4,3,3,1 y 10
b) -4, -6, -1, 1, 4, 10 y 3
EJERCICIOS
1. Explicar que es una medida de tendencia central; cuales son y como se
definen.
2.

3.

4.
5.

Cul de las siguientes frmulas se utiliza para calcular la media de


x1 , x 2 y .x3 ?
x x 2 .x3
x .x 3
a) x x1 x 2 .x3
b) x 1
c) x 1
3
2
Encuentre la media, mediana y moda del conjunto de datos
a) 1,2,3,4 y 5
c) 4,7,10,6,9 y 10
b) 12,13,14 y 15
d) 79,90,95,95 y 96
e) 9,12,8,10,9,11,12,15,20,9,14,15,21 y 10
Considrese el conjunto de datos: 4,5,6,3,4,3,3,31 y 4.
a) Encontrar la media
b) Hallar la mediana
Elimine el 31 del conjunto de datos en 4.
c) encontrar la media;
d) Hallar la mediana

4
e) Comparar los resultados a), b), c) y diga Cul de las medidas de
tendencia central, la media o la mediana, es mejor para evitar la
distorsin
producida por un valor extremo?.
6. Se pidi a 30 reclutas de la Academia de Polica se sometieran a una
prueba que mide la capacidad para el ejercicio. Se midi esta capacidad
de cada recluta (en minutos)
25
27
30
33
30
32
30
34
30
27
26
25
29
31
31
32
34
32
33
30
27
30
31
36
28
30
31
26
29
32
Calcular la moda, media y mediana.

MEDIDAS DE DISPERSION
La localizacin o tendencia central no necesariamente proporciona
informacin para describir datos de manera adecuada. Para el caso,
consideramos los siguientes ejemplos.
EJEMPLO 1.
Suponga que en un hospital, el nivel de azcar en la sangre de cada
paciente se mide tres veces por semana. En cierta semana los registros de
dos pacientes indican:
Paciente A: 90, 100 y 110 miligramos por decilitro
Paciente B:
40, 100 y 160 miligramos por decilitro
El promedio de ambos pacientes es 100.
En efecto:

90 100 110 300

100
3
3
40 100 160 300

100
Paciente B:
3
3

Paciente A:

Observe la diferencia en variabilidad. Mientras que el paciente A es bastante


estable, el nivel del paciente B flucta ampliamente. Este resultado deber
tomarse en cuenta cuando se prescriba su tratamiento.
COMENTARIO: Un paciente con un nivel de azcar en la sangre de 40 mg/dl,
convulsiona; con un nivel de 160 mg/dl podra ser diabtico.
EJEMPLO 2.

5
Se va a seleccionar a un atleta para que represente a la Universidad en los
juegos estudiantiles, en la prueba de los 100 metros. Se tienen dos
candidatos: A y B. Para decidir por uno de ellos se les toman los tiempos que
se tardan en recorrer los 100 metros en cinco ocasiones. A continuacin de
detallan:
Atleta A:
Atleta B:

11.0, 11.8, 11.6, 11.3 y 12.3 segundos


11.5, 11.6, 11.6, 11.8 y 11.5 segundos

El tiempo promedio de ambos atletas es 11.6 segundos (verificarlo) pero el


grado de variabilidad del atleta B es menos que el del atleta A. Por tener
menos altibajos, el atleta B tendra que ser el seleccionado.
Casos como los anteriores (medicina, deportes) muestran la necesidad de
descripciones estadsticas que midan el grado en que se dispersan (o varan)
los datos, respecto a su centro; es decir; la necesidad de las medidas de
dispersin. Dos de ellas son: la amplitud (o rango) y la desviacin tpica.
AMPLITUD (RECORRIDO O RANGO)
DEFINICION: La amplitud (recorrido o rango) de un conjunto de datos
numricos es la diferencia entre el mayor y el menor de todos ellos.
EJEMPLO 3.
En el ejemplo 1, el rango para el nivel de azcar en la sangre del paciente A
es 110 90 = 20 y de 160 40 = 120, para el paciente B.
En el ejemplo 2, el rango para el tiempo del atleta A es de 12.3 11.0 = 1.3
segundos, y de 11.8 11.5 = 0.3 segundos, para el atleta B.
DESVIACION TIPICA (O ESTANDAR)
El rango se utiliza principalmente como indicacin fcil y rpida de la
variabilidad, pero por lo general, no es medida de dispersin til. Su
principal inconveniente radica en que nada se dice acerca de la dispersin de
los valores que estn entre el mayor y el menor valor.
Por ejemplo, cada uno de los conjuntos de datos siguientes:
Conjunto A:
Conjunto B:

3,4,5,6,11,16,17,18 y 19
3,8,9,10,11,12,13,14 y 19.

Tiene un rango de 19 - 3 = 16 ( y una media de 11); pero la dispersin (como


se ve en el diagrama adjunto) es completamente distinta en cada caso.
media
Conjunto A:
3
4
5 6
11
16
17 18 19

6
media
Conjunto B:
3

9 10 11 12

13

14

19

Observamos que la dispersin en un conjunto de datos:

Es pequea si los datos estn ubicados muy cerca alrededor de su


media aritmtica y
Es grande si los datos estn ubicados distantes alrededor de su media.

Por lo tanto, parece razonable tener una medida para la dispersin de un


conjunto de datos, en trminos de las cantidades por las que difieren de su
media aritmtica. A estas cantidades les asignaremos un nombre, en la
siguiente definicin.
DEFINICION: Si un conjunto de datos x1 , x 2 ,.....,.x N tiene la media x , las
diferencias x1 x, x 2 x,........,.x N x , se llaman desviaciones de la
media.
DEFINICION: La desviacin tpica de una poblacin de N datos:
denota por , (letra griega sigma) y se define como
N

(x

i 1

x) 2

N
Si
ocurren con frecuencias
desviacin tpica puede expresarse como

f 1 , f 2 ,..... f N respectivamente, la

x1 , x 2 ,.....,.x N

f (x
i 1

x) 2

se

donde N =

f
i 1

En palabras: es la raz cuadrada de la media aritmtica de los cuadrados


de las desviaciones.
DEFINICION: La desviacin tpica de una muestra de N datos:
por S y se define como
N

(x
i 1

x) 2

N 1
N

para datos sin agrupar

f (x
i 1

x) 2

N 1

para datos agrupados en tablas de frecuencia

se denota

7
NOTA: Muestra es el conjunto de datos que se pueden utilizar, en forma
razonable, para hacer generalizaciones acerca de la poblacin de la cual
provienen.
ADVIERTA: Las frmulas para S
denominador de las formulas para

se obtienen escribiendo

N-1

en el

CASO 1: Desviacin tpica para datos sin agrupar


EJEMPLO 1. Considrese cada una de las siguientes muestras:
Muestra A:
3,4,5,6,11,16,17,18 y 19
Muestra B:
3,8,9,10,11,12,13,14 y 19
Obtenga la desviacin tpica de cada muestra e indique cul de ellas es la
que presenta mayor dispersin.
SOLUCION.
Para la muestra A.
x

Paso 1.

3 4 5 6 11 16 17 18 19 99

11
9
9
9

Paso 2.

El clculo de

S ( xi x) 2

se facilita con una tabla como la que

i 1

sigue:
Variable x

Desviacin

3
4
5
6
11
16
17
18
19

-8
-7
-6
-5
0
5
6
7
8

( xi x )

Cuadrado
de
desviacin ( xi x) 2
64
49
36
25
0
25
36
49
64

la

S ( xi x) 2 = 64 + 49 + 36 + 25 + 0 + 25 + 36 + 49 + 64 = 348
i 1

(x
i 1

x) 2

N 1

348
=
9 1

348
= 6.6
9 1

Para la muestra B
Paso 1.

3 8 9 10 11 12 13 14 19 99

11
9
9
9

Paso 2. Calculamos

(x
i 1

x) 2

8
Variable x
3
8
9
10
11
12
13
14
19

-8
-3
-2
-1
0
1
2
3
8

(x
i 1

Cuadrado de la desviacin
( xi x) 2

64
9
4
1
0
1
4
9
64

x) 2 = 64 + 9 + 4 + 1 + 0 + 1 + 4 + 9 + 64 = 156
9

( xi x )

Desviacin

(x
i 1

x) 2

N 1

3156
=
9 1

3156
= 4.4
9 1

Puesto que la desviacin tpica del conjunta A es mayor que la del conjunto
B, concluimos que la muestra A es la ms dispersa.
DEFINICION: La varianza de un conjunto de datos se define como el
cuadrado de la desviacin tpica, de modo que 2 y S 2 representan la
varianza de la poblacin y la varianza de la muestra, respectivamente.
VERIFICANDO SU COMPRENSION
1. Determine cul de las siguientes muestras es la ms dispersa.
a) 6,3,12,5,8 y 9
b) 3,5,6,7,4,10 y 8
2. Determine cul de las siguientes muestras es la menos dispersa
a) 7,9,3,6,5,4 y 2
b) 8,7,4,11,2 y 5
3. Hallar, en cada caso, la desviacin tpica y la varianza
a) 3,6,2,1,7 y 5
b) 3,2,4,6,5 y 8
CASO 2: Desviacin tpica para datos agrupados
EJEMPLO 2. Supngase que en 9 grado hay 40 alumnos, cuyas edades se
resumen en la siguiente tabla de frecuencias
Edades x
14
15
16

No. de alumnos (f)


6
15
16

9
17
Hallar el valor de S.

SOLUCION
Para facilitar los clculos usamos la siguiente tabla

Lic. Mauro H. Henrquez Rauda

14
15
16
17
TOTAL

6
15
16
3
40

i 1

f i xi

f (x )

84
225
256
51
616

( xi x ) 2

f ( xi x) 2

-1.4
-0.4
0.6
1.6

1.96
0.16
0.36
2.56
N

616

15.4
40

f ( xi x) 2

f ( x x)
i 1

N 1

11.76
2.40
5.76
7.68
27.60
2

27.6
0.84
39

VERIFICANDO SU COMPRENSION
1. Hallar en cada caso, la desviacin tpica y la varianza.
a) 3,2,4,6,2,8,5,2,4 y 4
b) 0,0,0,0,0,1,1 y 1
2. Hallar el valor de S para los datos agrupados en las siguientes tablas de
frecuencia
a)

x
2
3
4
5

f
4
3
5
2

EJERCICIOS
Seleccione la respuesta correcta
1. El recorrido de un conjunto de datos:
a) Se obtiene con las desviaciones promedio de los datos y la media
b) Es la diferencia entre el dato mayor y el dato menor
c) Es una medida de tendencia central
d) Es el promedio de la moda y la mediana
2. La desviacin estndar de un conjunto de datos:
a) Est cerca de cero si los datos estn dispersos.
b) Promedia las desviaciones entre cada dato y la media

10
c) No toma en consideracin todos los datos
d) Promedia las desviaciones entre cada dato y la mediana
3. Explicar que es una medida de dispersin
4. Comparar la desviacin estndar y el recorrido
5. Explicar que representa la desviacin estndar de un conjunto de datos
6. Si la desviacin estndar fuese cero qu podras decir acerca del conjunto
de datos?
En los ejercicios 7 - 10. Encontrar el recorrido, la varianza y la desviacin
estndar del conjunto de datos
7.
1,2,3,4 y 5
9.
3,5,8,13 y 21
8.
21,22,23,24 y 25
10.
79,90,95,95 y 96
11. Realizar las operaciones indicadas con los siguientes datos

3,8,5,3,10,13

a)
b)
c)
d)

Encontrar el recorrido.
Hallar la media.
Determinar la desviacin estndar poblacional.
Determinar la desviacin estndar muestral.

MEDIDAS DE POSICIN
CUANTILES
Para muchos propsitos, es importante obtener valores que dividen un
conjunto de datos ordenados, en fracciones especificas. LA mediana es un
ejemplo de ste tipo de medida; ella divide al conjunto en dos partes iguales:
La mitad de los valores son inferiores a la mediana y la otra mitad superiores.
En forma similar se pueden calcular:
- Los cuartiles, que son valores de la variable que dividen a conjunto en
cuartas partes.

As, el primer cuartil, Q1, es un valor tal que una cuarta parte de los datos
son menores que l y tres cuartas partes son mayores. Q2, es igual a la
mediana y Q3, supera a los tres cuartos de los datos y solo es superado por
un cuarto de ellos.
Adems de la mediana y los cuartiles pueden calcularse tambin lo deciles:
D1, D2, ......D9, los cuales dividen al conjunto en dcimas. Los percentiles:
P1, P2,....P99, que lo dividen en centsimos. Todos estos valores reciben el
nombre de cuantiles y pueden resultar muy apropiados para apreciar la
posicin de los datos de un conjunto y su posicin.

11
Tanto la mediana como los cuartiles y los deciles constituyen casos
particulares de los percentiles y pueden expresarse como percentiles.
Por ejemplo: Mediana = P50, Q3 = P75, D4 = P40, etc.
Resulta entonces que tenindose una frmula para el clculo de la posicin
de los percentiles, puede obtenerse con ella, la posicin de cualquier cuantil.
Para el clculo de la posicin de los percentiles se debe, en primer lugar,
ordenar los datos.
Una vez hecho esto, puede aplicarse la frmula siguiente:
La posicin de k-simo percentil se encuentra calculando (

n
)k, donde n
100

es el nmero de datos. S el resultado es un nmero decimal, seleccione


como indicador del orden al entero prximo superior y el percentil a localizar
es Pi.
Si el resultado es un entero seleccione como indicadores de orden al entero
obtenido i y al siguiente i + 1. El percentil se obtiene haciendo Pk =
xi ( xi i)
2
Ejemplo.
Calcular Q2 y la mediana. Considrense para ello, los siguientes datos, que
se refieren a los pesos de 40 estudiantes de una escuela rural y que se
presentan en el orden en que fueron pesado los alumnos:
49
60
45
37
54
44
59
40
62
47
46
52
55
41
66
45
36
50
51
48
42
53
53
68
56
35
74
43
47
60
51
67
40
70
49
41
46
32
57
43
As como estn los datos resulta difcil sacar una conclusin, por lo tanto,
como no son muchos, puede iniciarse el anlisis haciendo una ordenacin en
forma creciente.
32
35
36
37
40
40
41
41

42
43
43
44
45
45
46
46

47
47
48
49
49
50
51
51

52
53
53
54
55
56
57
59

60
60
62
66
67
68
70
74

12
La posicin de Q2 es igual a la posicin de P 50, la cual se obtiene as:
=

20 Los datos a localizar son: X20 y X21. El valor de Q2 es:

Q2 =

X 20 X 21 50 53

2
2

40
x 50
100

51.5

La mediana es igual a P50 = Q2 = 51.5


EJERCICIOS
1. Calcule los cuartiles uno, dos y tres en la siguiente serie simple:
0.10, 0.12, 0.15, 0.15, 0.18, 0.20, 0.25.
2. La siguiente distribucin corresponde a salarios mensuales de un grupo de
56 personas.
Salarios (x)
500-599
600-699
700-799
800-899
900-999
1000-1099

f
8
12
18
10
6
2

Calcule:
a) El valor del cuartil uno.
b) El valor del cuartil dos.
c) El valor del cuartil tres.
d) El valor del decil cinco.
e) El valor del decil cinco.
f) El valor del percentil ochenta.
g) El valor del percentil cincuenta.
h) El salario que limita el 20% superior de la distribucin.
i) El salario que se deja sobre s, el 70% de los casos.
j) Entre qu salarios est el 60% central de la distribucin.
3. Determine la escala percentilar de la siguiente serie de puntajes de un
examen.
____Xi
f____
30
1
25
5
38
10
40
4
45
2

13
4. Calcule el percentil del punto medio de la clase 700-799 de la distribucin
del ejercicio 2. Luego comprubelo.