Вы находитесь на странице: 1из 5

Jess Reynaga Obregn

La sntesis estadstica como cuarta etapa del mtodo estadstico.


Medidas de resumen para variables cuantitativas.
Mediana y percentiles en series simples de datos.
Cuando se desea sintetizar una serie de datos cuantitativos discretos, tales como el nmero de embarazos, el nmero de convulsiones o el nmero de habitaciones que tienen un grupo de viviendas, debe
utilizarse a la mediana y a los percentiles. Estas medidas de resumen, a diferencia del promedio y la desviacin estndar, son perfectamente apropiados para sintetizar a las variables cuantitativas discretas.
Con el siguiente ejemplo debe quedar claro que el promedio y la desviacin estndar no son medidas de
resumen propias para sintetizar a las variables cuantitativas discretas: qu significara que el promedio
de hijos de un grupo de madres fue de 2.75 hijos?, significara que en promedio cada una de las madres
tuvo dos hijos completos y otro ms al que le falt un brazo?
A diferencia del promedio y la desviacin estndar, que solo deben usarse para sintetizar a variables
cuantitativas continuas, la mediana y los percentiles pueden utilizarse para resumir tanto a variables
cuantitativas discretas como a variables cuantitativas continuas.
La siguiente serie simple de valores se utilizar como ejemplo para ilustrar el clculo e interpretacin de la mediana y algunos percentiles:
Peso en kilogramos de un grupo de 20 nios
de un ao de edad
9.1
9.3

9.4
8.8

8.9
9.5

9.6
9.7

10.5
9.2

8.8
9.4

9.4
9.6

9.2
9.0

9.0
9.4

8.1
9.8

MEDIANA (o Percentil 50) :


Definicin: En una serie de valores ordenados de menor a mayor, o viceversa, es aquel valor que divide en dos partes de igual tamao a toda la serie.
.
Procedimiento: Ordenar la serie y localizar el valor que la divida en dos partes de igual tamao, de tal
manera que en una parte quede el 50% de los datos y en la otra el 50% restante.
8.1

8.8

8.8

8.9

9.0

9.0

9.1

9.2

9.2

9.3

9.4

9.4

9.4

9.4

9.5

9.6

9.6

9.7

9.8

10.5

En vista de que la serie es par no existe un valor que se ubique exactamente en el centro de la serie y
que la divida en dos partes. Por lo anterior se considera que el promedio de los dos valores centrales que
estn colocados en las posiciones 10 y 11 corresponde al valor de la mediana; es decir: la mediana
equivale al valor promedio de 9.3 y 9.4 (9.35)
Interpretacin: "La mitad de los nios tuvieron un peso igual o menor que 9.35 kilogramos y la otra mitad
pesaron 9.35 o ms kilogramos"

77

Jess Reynaga Obregn

PERCENTILES ( Pp ) :
Definicin: En una serie de valores ordenados, de menor a mayor o viceversa, es aquel valor que divide
en dos partes porcentualmente complementarias a toda la serie. Por ejemplo: el percentil 40 divide a
la serie en una parte que contiene al 40 % de los valores iguales o inferiores a l y, simultneamente, en
otra parte que contiene al 60% de los valores de la serie iguales o mayores a dicho percentil.
Procedimiento: Ordenar la serie y localizar el valor que la divida en los porcentajes complementarios
deseados.
Por ejemplo, para encontrar el valor del percentil 25 debe localizarse a aquel que deje a una cuarta parte
de los valores con menores o iguales magnitudes a l y a las tres cuartas partes restantes de los valores
con magnitudes ms grandes o iguales a l.
8.1

8.8

8.8

8.9

9.0

9.0

9.1

9.2

9.2

9.3

9.4

9.4

9.4

9.4

9.5

9.6

9.6

9.7

9.8

10.5

En esta serie, entre los valores 9.0 se debe encontrar un valor en una posicin tal que hasta l se encuentra el 25% de los casos y, simultneamente, desde l se encuentra el 75% restante de los casos.
Usualmente cualquier percentil se ubica en una posicin localizada mediante la siguiente frmula:
Lugar que ocupa el percentil buscado =

(p buscado ) (n + 1)
100

Para el caso del percentil 25, a la posicin

(p 25 ) (20 + 1)
(25) (21)
le corresponde el lugar
= 5.25
100
100
Lo anterior significa que el percentil 25 se encuentra entre el lugar 5 y el lugar 6. En estos casos, por
convencin, se considera posible obtener un promedio de los valores que se encuentren en las posiciones adyacentes. Como ya se observ, la quinta posicin est ocupada por un valor de 9.0 y la sexta por
un valor tambin de 9.0; por lo anterior, el promedio de ambos valores es igual a 9.0.
Interpretacin: (Vlida para el Percentil 25 o P25) :
" El 25% de los nios tuvo un peso de 9.0 kilogramos o menor y el 75% restante tuvo peso de 9.0 kilogramos mayor".
Como ejemplo adicional supongamos que se desea encontrar el valor del percentil 75. Para ello debe
localizarse a aquel que deje a tres cuartas partes de los valores con menores o iguales magnitudes a l y
a la cuarta parte restante de los valores con magnitudes ms grandes o iguales a l.
8.1

8.8

8.8

8.9

9.0

9.0

9.1

9.2

9.2

9.3

9.4

9.4

9.4

9.4

9.5

9.6

9.6

9.7

9.8

10.5

En esta serie, entre los valores 9.5 y 9.6 se debe encontrar un valor en una posicin tal que hasta l se
encuentra el 75% de los casos y, simultneamente, desde l se encuentra el 25% restante de los casos.

78

Jess Reynaga Obregn

Utilizando la frmula:
Lugar que ocupa el percentil buscado =

(p buscado ) (n + 1)
100

Se tiene que al percentil 75 le corresponde la posicin

(p 75 ) (20 + 1)
(75) (21)
que equivale a
= 15.75
100
100
Lo anterior significa que el percentil 75 se encuentra entre el lugar 15 y el lugar 16. Como ya se dijo, en
estos casos, y por convencin, se considera posible obtener un promedio de los valores que se encuentren en las posiciones adyacentes. Como ya se observ, la posicin 15 est ocupada por un valor de 9.5
y la posicin 16 por un valor tambin de 9.6; por lo anterior, el promedio de ambos valores es igual a
9.55.
" El 75% de los nios tuvo un peso de 9.55 kiloInterpretacin: (Vlida para el Percentil 75 o P75) :
gramos o menor y el 25% restante tuvo peso de 9.55 kilogramos mayor".

RANGO INTERCUARTLICO (RIC):


Se define al rango intercuartlico (RIC) como la diferencia entre los percentiles 75 y 25. El rango intercuartlico es una medida que abarca al 50% central de los valores de una serie ordenada de nmeros y viene
siendo una medida de sntesis que expresa el grado de homogeneidad o heterogeneidad de dicho porcentaje de datos.
Para el ejemplo que se ha venido siguiendo se tiene que la diferencia p75 p25 es igual a 9.55 9.0 =
0.55; lo anterior quiere decir que, especficamente refirindose al 50% central de los datos ya ordenados,
la diferencia entre el mayor y el menor de los datos de dicho 50% central de los valores es de 0.55 kilogramos.
El RIC es una medida que permite comparar con facilidad la homogeneidad o heterogeneidad de dos
series de datos semejantes; vease el siguiente ejemplo:
Peso al nacer de dos grupos de nios segn duracin de la gestacin
Nmero de
nios

Duracin de
la gestacin
en semanas

p25

p75

Diferencia
p75 p25

60

32

1,800

2,800

1,000

2,709

39

2,884

3,132

248

79

Comentario
El 50% central de la serie de
pesos de los 60 nios tiene
una diferencia entre el mayor
de los pesos y el menor de
ellos de 1,000 gramos. Puede hablarse de gran heterogeneidad
El 50% central de la serie de
pesos de los 2,709 nios
tiene una diferencia entre el
mayor de los pesos y el menor de ellos de 248 gramos.
Puede hablarse de gran
homogeneidad

Jess Reynaga Obregn

PROBLEMA RESUELTO

Luego de criar durante dos aos a un grupo de 20 cerdos en una granja modelo que funcionaba bajo el
rgimen de sociedad cooperativa, en condiciones de estricta higiene animal, se sacrificaron y observaron
sus cerebros en bsqueda de quistes de cisticercos. Los hallazgos se compararon con otro grupo de 20
cerdos criados en los patios de las casas de la misma localidad.
Cerdos provenientes de la granja modelo
Cerdo
No.
Quistes

10

11

12

13

14

1
5

1
6

1
7

18

19

20

Cerdos provenientes de patios de casas


Cerdo
No.
Quistes

10

11

12

13

14

1
5

1
6

1
7

18

19

20

Preguntas:
a) Para cada grupo identifique la mediana (o percentil 50) y emita una opinin con respecto a los resultados.
b) Para cada grupo identifique los valores mnimo y mximo, as como los percentiles 25 y 75 y llene la
siguiente tabla:
Valor mnimo

Percentil 25

Percentil 75

Valor mximo

Grupo "Granja"
Grupo "Patios"
c) Emita una opinin en relacin con los hallazgos en trminos de porcentajes de cada grupo considerando a los percentiles 25 y 75.
d) No olvide discutir los hallazgos para el 50% central de los animales de uno y otro grupo que se encontraron entre los percentiles 25 y 75 de cada uno de los grupos. Tambin, opine sobre la homogeneidad y
heterogeneidad de los grupos.

Para responder a las preguntas, primero se ordenan los datos y se localizan los percentiles buscados:
Cerdos provenientes de la granja modelo
Cerdo
No.

1
2

1
7

1
1

1
3

1
4

16

20

1
5

1
8

10

19

Quistes

P25 = (1+1) / 2 = 1

P50 = (1+1) / 2 = 1

80

P75 = (2+2) / 2 = 2

Jess Reynaga Obregn

Cerdos provenientes de patios de casas


Cerdo
No.

1
5

2
0

1
1

1
2

19

13

14

1
7

1
8

16

10

Quistes

P25 = (2+2) / 2 = 2

P50 = (3+4) / 2 = 3.5

P75 = (4+4) / 2 = 4

Respuestas:
a) La mediana del grupo granja fue 1 y la del grupo patios fue 3.5.
Se observ que la mitad de los cerdos del grupo granja tuvo 1 o menos quistes y la otra mitad de ellos
tuvieron 1 o ms quistes
Se observ que la mitad de los cerdos del grupo patios tuvo 3.5 o menos quistes y la otra mitad de ellos
tuvieron 3.5 o ms quistes
b)

Grupo "Granja"
Grupo "Patios"

Valor mnimo
0
0

Percentil 25
1
2

Percentil 75
2
4

Valor mximo
4
9

c)
En el grupo granja una cuarta parte de los cerdos tuvo hasta 1 quiste y las tres cuartas partes restantes
tuvieron desde 1 quiste en adelante.
En el grupo granja tres cuartas partes de los cerdos tuvieron hasta 2 quistes y la cuarta parte restante
tuvo desde 2 quistes en adelante.
En el grupo patios una cuarta parte de los cerdos tuvo hasta 2 quistes y las tres cuartas partes restantes
tuvieron desde 2 quistes en adelante.
En el grupo patios tres cuartas partes de los cerdos tuvieron hasta 4 quistes y la cuarta parte restante
tuvo desde 4 quistes en adelante.
d)
En el grupo granja el 50% central de los cerdos tuvieron entre 1 y 2 quistes, mientras que en el grupo
patios el 50% central de los cerdos tuvieron entre 2 y 4 quistes; por lo anterior puede decirse que los
cerdos del grupo granja fueron ms homogneos y los del grupo patios fueron ms heterogneos.

81