Вы находитесь на странице: 1из 7

UNED

Introduccin al anlisis de datos

TEMA 2

UNED

Introduccin al anlisis de datos

TEMA 2

1 PARTE
Medidas de Tendencia Central

MEDIDAS DE TENDENCIA
CENTRAL Y POSICIN

Una de las propiedades m


ms importantes a estudiar de una distribuci
distribucin de
frecuencias es la tendencia central de las puntuaciones: un valor
valor central que
act
acte como resumen num
numrico para representar al conjunto de datos. Los
ndices de tendencia central permiten representar toda la distribuci
n de
distribuci
frecuencias con un nico valor y, adem
adems, facilitan la comparaci
comparacin de
diferentes conjuntos de puntuaciones de una variable.
MEDIA ARITM
ARITMTICA MEDIANA MODA
2010

UNED

Centro Asociado A Coru


Corua

Carmen Voces

2010

Centro Asociado A Coru


Corua

Carmen Voces

TEMA 2

UNED

Introducci
Introduccin al an
anlisis de datos
EJERCICIOS

TEMA 2

Introducci
Introduccin al an
anlisis de datos
INDICES DE TENDENCIA CENTRAL

MEDIA ARITM
ARITMTICA (promedio o media): es la medida de tendencia central m
ms conocida y usada
en la pr
prctica debido, b
bsicamente, a la sencillez de su c
clculo y a que es el fundamento de un gran
nmero de t
tcnicas estad
estadsticas. La media indica la tendencia general de una distribuci
distribucin de
frecuencias de una variable y es el valor central alrededor del cual est
estn la mayor
mayora de las
observaciones.

La media aritmtica de una variable X, denotada como X , se define como la suma


de todos los valores observados de la variable divididos por el nmero total de
observaciones. Se expresa matemticamente de la siguiente manera:

X=

X 1 + X 2 + ... + X n
=
n

X=

ni X i

ni X i
n

X=

p X
i

xi es el valor que toma la variable u observacin del sujeto i

2010 FEBRERO (MODELO C)


6. La media en el test de memoria de la distribuci
distribucin de la Tabla 2 es igual a :
a) 28,50
b) 36,62
c) 31,71

ni

38 40

18

35 37

36

32 34

52

29 31

43

26 28

26

23 25

n es el nmero total de observaciones


ni es la frecuencia absoluta del valor o intervalo i
pi es la frecuencia relativa o proporcin de observaciones del valor o del intervalo i

Tabla 2: Puntuaciones en un test de memoria de una muestra de


200 personas

Slo puede calcularse para variables cuantitativas


2010

16
200

2010

UNED

Introducci
Introduccin al an
anlisis de datos
EJERCICIOS

TEMA 2

UNED

Introducci
Introduccin al an
anlisis de datos
EJERCICIOS

2010 FEBRERO (MODELO C)

2010 SEPTIEMBRE (MODELO A)

6. La media en el test de memoria de la distribuci


distribucin de la Tabla 2 es igual a :
a) 28,50
ni X i n1 X 1 + n2 X 2 + n3 X 3 + n4 X 4 + n5 X 5 + n6 X 6
b) 36,62
X =
=
n
n1 + n 2 + n 3 + n 4 + n 5 + n 6
c) 31,71

5. Con los datos de la Tabla 1, la media en X para las Mujeres es


es
a) Igual que la media para los varones
b) Mayor que la media para los varones
c) Menor que la media para los varones

ni

Xi

niXi

38 40

18

39

702

35 37

36

36

1296

32 34

52

33

1716

29 31

43

30

26 28

26

23 25

16

20

12

67

16

13

45

10

17

1380

23

10

27

864

0-1

24

384

60

60

6342

200

Tabla 1: Resultados obtenidos por un grupo de 60 mujeres y 60


hombres en una prueba de fluidez verbal X

Tabla 2: Puntuaciones en un test de memoria de una muestra de


200 personas
2010

UNED

Introducci
Introduccin al an
anlisis de datos
EJERCICIOS

2010

TEMA 2

UNED

5. Con los datos de la Tabla 1, la media en X para las Mujeres es


es
a) Igual que la media para los varones
b) Mayor que la media para los varones
MEDIA
c) Menor que la media para los varones

Xi

niM

XiniM

niH

89

8,5

20

170

12

102

67

6,5

16

104

13

84,5

45

4,5

10

45

17

76,5

0-1

2,5
0,5

8
6
60

20
3
342

Introducci
Introduccin al an
anlisis de datos
INDICES DE TENDENCIA CENTRAL

10
8
60

XiniH

XM

292

La media aritmtica aprovecha toda la informacin disponible en los datos, ya que para su clculo es
necesario utilizar todas las puntuaciones de los sujetos

2.

En una distribucin, la suma de las desviaciones de cada valor con respecto a su media es igual a 0
n

(X

n X
342
= i i =
= 5,7
n
60

X =0

i =1

3.

Si a los valores de la variable X les aplicamos la siguiente transformacin lineal: Yi = bXi + a, la


media de los nuevos valores Y ser Y = bX + a

EJEMPLO:

MEDIA Hombres (H)

25
4

1.

Mujeres (M):

XH

n X
292
= i i =
= 4,87
n
60

Se ha medido la variable aptitud espacial en 5 alumnos


de Enseanza Secundaria de un centro educativo.
Calculemos la media aritmtica

X=

X
n

133 + 120 + 125 + 115 + 122


= 123
5

Si aplicamos la transformacin Y = 2 Xi + 10, la


media de Y calculada a partir de las puntuaciones es

Tabla 1: Resultados obtenidos por un grupo de 60 mujeres y 60


hombres en una prueba de fluidez verbal X

Y = bX + a = 2123 + 10 = 256
2010

TEMA 2

PROPIEDADES de la media aritm


aritmtica:

2010 SEPTIEMBRE (MODELO A)

23

Mujeres Varones

89
n X
6324
X = i i =
= 31,71
n
200

TEMA 2

2010

Alumno

Xi

Xi X

133

10

120

-3

125

115

-8

122

-1

Xi = 615

(X i X ) = 0

n=5

UNED

Introducci
Introduccin al an
anlisis de datos
INDICES DE TENDENCIA CENTRAL

TEMA 2

LIMITACIONES de la media aritm


aritmtica:

1. Cuando los datos estn agrupados en intervalos, la media no se puede calcular si el


intervalo mximo no tiene lmite superior y/o el intervalo mnimo no lo tiene inferior.

UNED

ni

Xi

10 14

12

15 19

17

20 24

12

22

25 29

27

1. En primer lugar, se ordenan las n puntuaciones de menor a mayor

Ms de 30

2. En segundo lugar se observa si el nmero de observaciones n es impar o par

La mediana de una variable X, representada por Md, se define como el valor de la


variable que divide la distribucin de frecuencias en dos partes iguales, conteniendo
cada una el 50% de las observaciones. Procedimiento de clculo con pocos datos:

recogida o grabacin de los datos, o (2) valores que aportan informacin relevante de la variable. En
el primer caso, se eliminan estas observaciones y la distribucin se vuelve simtrica, por lo que
podra calcularse la media aritmtica. En el segundo caso, se recomienda aplicar otros ndices de
tendencia central menos sensibles a los valores extremos como la mediana, que la abordaremos en
el siguiente epgrafe.

2010

a) Si n es impar, el valor de la mediana es el de la observacin que ocupa


la posicin central, dentro del conjunto de observaciones ya ordenadas

Introducci
Introduccin al an
anlisis de datos
INDICES DE TENDENCIA CENTRAL

n
nd
Md = Li + 2
nc

Ejemplo: 115, 120, 122, 125, 133

Ejemplo: 16, 18, 20, 24, 28, 30

TEMA 2

UNED

Li = lmite exacto inferior del intervalo crtico


n = nmero de observaciones
nd = frecuencia absoluta acumulada por debajo del intervalo crtico
nc = frecuencia absoluta del intervalo crtico
I = amplitud del intervalo crtico
Cuando se trata de una distribucin de frecuencias pero los datos no estn
agrupados en intervalos, el clculo de la mediana es un caso particular de la
frmula anterior en la que la amplitud de los intervalos es igual a uno (I = 1)
11

Md = (20+24)/2 = 22

Se puede obtener con todo tipo de variables, excepto las variables cualitativas o nominales

2010

Md = 122

b) Sin embargo, si el nmero de observaciones n es par, la mediana es la


media aritmtica de las dos observaciones centrales de la distribucin

Procedimiento de c
clculo de la mediana con muchos datos y con datos agrupados en
intervalos: El intervalo en el que se encuentra la mediana se denomina intervalo cr
crtico y se
corresponde con aqu
aqul en el que la frecuencia absoluta acumulada na es igual o superior a n/2.

2010

TEMA 2

MEDIANA: Cuando la distribuci


distribucin es asim
asimtrica una buena alternativa a la media es la mediana. A
diferencia de la media, la mediana no se ve afectada por los valores
valores extremos que puede adoptar la
variable debido a que en su c
clculo no intervienen todos los valores la distribuci
distribucin sino nicamente
los que ocupan las posiciones centrales.

2. La media es sensible a la existencia de unas pocas observaciones con valores


extremos en la distribucin de frecuencias. Esta circunstancia se da en distribuciones
marcadamente asimtricas, por lo que no es recomendable la utilizacin de la media
en este tipo de distribuciones debido a que afecta a su representatividad como valor
central de la distribucin. Estos valores extremos pueden ser: (1) producto de errores en la

UNED

Introducci
Introduccin al an
anlisis de datos
INDICES DE TENDENCIA CENTRAL

10

Introducci
Introduccin al an
anlisis de datos
EJERCICIOS

TEMA 2

2010 FEBRERO (MODELO B)


5. La mediana de las puntuaciones obtenidas en la tabla 1 es:
a) 6,5
b) 7,5
c) 8

ni

10 11

89

67

45

Tabla 1: Nmero de palabras


recordadas en una subescala
del test Rivermead de
memoria. La tabla 1
corresponde a 20 ancianos
sanos
2010

n
nd
Md = Li + 2
nc

Li = lmite exacto inferior del intervalo crtico


n = nmero de observaciones
nd = frecuencia absoluta acumulada por debajo del intervalo crtico
nc = frecuencia absoluta del intervalo crtico
I = amplitud del intervalo crtico

12

UNED

Introducci
Introduccin al an
anlisis de datos
EJERCICIOS

TEMA 2

2010 FEBRERO (MODELO B)

UNED

ni

na

10 11

20

89

18

67

10

45

La moda de una distribucin, que se representa como Mo, se define como el valor o
categora de la variable con mayor frecuencia absoluta.
Cuando en una variable existe un nico valor con la frecuencia mxima, la distribucin
presenta una moda y es unimodal. Sin embargo, la distribucin de una variable no
tiene por qu tener una nica moda. De hecho, si son dos los valores con la frecuencia
ms alta la distribucin es bimodal, si son tres los valores sera trimodal, etc.
Tambin puede ocurrir que la distribucin no tenga moda, lo que se denomina
distribucin amodal. Esto sucede cuando todos los valores tienen la misma frecuencia
absoluta; en este caso no se puede calcular la moda.

El intervalo en el que se alcanzan o superan por


primera vez los 10 casos (frecuencias acumuladas), el
intervalo crtico en lmites exactos: {5,5 7,5}
Paso 2: Aplicar la frmula
n
nd
Md = Li + 2
nc

Tabla 1: Nmero de palabras


recordadas en una subescala
del test Rivermead de
memoria. La tabla 1
corresponde a 20 ancianos
sanos

20

2 = 5,5 + 2 = 7,5
Md = 5.5 +
8

Propiedades:
a) Es un ndice de clculo sencillo y de fcil interpretacin
b) De los tres ndices de tendencia central estudiados, la moda es el nico que,
adems de aplicarse a variables cuantitativas, se puede aplicar a variables
cualitativas
c) Cuando los datos estn agrupados en intervalos y existentes intervalos
abiertos, la moda se puede calcular excepto si el intervalo modal coincide con
el intervalo abierto.

Li = lmite exacto inferior del intervalo crtico


n = nmero total de observaciones
nd = frecuencia absoluta acumulada por debajo del intervalo crtico
nc = frecuencia absoluta del intervalo crtico
I = amplitud del intervalo crtico

Se puede obtener con todo tipo de variables

2010

UNED

Introducci
Introduccin al an
anlisis de datos
EJERCICIOS

13

2010

TEMA 2

UNED

14

Introducci
Introduccin al an
anlisis de datos
EJERCICIOS

2010 FEBRERO (MODELO A)

2010 FEBRERO (MODELO A)

1. Considerando la Figura 1, La Moda de la variable X es:


a) 5,5
b) 6,5
c) 50

1. Considerando la Figura 1, La Moda de la variable X es:


a) 5,5
b) 6,5
c) 50

60
50
40
30
20
10
0

60
50
40
30
20
10
0

2,5

4,5

6,5

8,5

40
30
20

Moda: Punto medio del intervalo


modal o intervalo con mayor
frecuencia (4,5 + 6,5)/2 = 5,5

10

2,5

4,5

6,5

8,5

10,5

Figura 1. Representacin grfica de las


calificaciones de 150 alumnos en una
asignatura (X)

10,5
X

Figura 1. Representacin grfica de las calificaciones de 150 alumnos en


una asignatura (X)
2010

TEMA 2

Intervalo Modal: Intervalo con mayor


frecuencia 4,5 6,5

50

0,5

0,5

TEMA 2

MODA

5. La mediana de las puntuaciones obtenidas en la tabla 1 es:


a) 6,5
b) 7,5
c) 8
Paso 1: Identificar el intervalo crtico: n/2 = 20/2 = 10.

Introducci
Introduccin al an
anlisis de datos
INDICES DE TENDENCIA CENTRAL

15

2010

16

UNED

UNED

Introduccin al anlisis de datos

Introducci
Introduccin al an
anlisis de datos
PERCENTILES (P
(Pk) O CENTILES (C
(Ck)

TEMA 2

TEMA 2

Se denomina percentiles o centiles, indistintamente, a los 99 valores de la


variable que dividen en 100 partes iguales la distribucin de frecuencias.
El percentil k, denotado como Pk, es un valor de la variable de inters que deja por
debajo de s un porcentaje k de sujetos, donde k = 1, 2, ..., 99

2 PARTE
Medidas de Posicin

Clculo:

ndices que nos permitan determinar qu


qu posici
posicin ocupa una
puntuaci
puntuacin concreta respecto del conjunto de puntuaciones.
puntuaciones.
ndices que permiten establecer la posici
posicin relativa de una
puntuaci
puntuacin respecto al grupo de puntuaciones, y que, de
manera gen
genrica, se denominan cuantiles.
cuantiles.

nk
nd

Pk = Li + 100

nc

Nmero total de observaciones: n


Intervalo cr
crtico: (k
(kn)/100
Lmite exacto inferior del intervalo cr
crtico: Li
Amplitud del intervalo cr
crtico: I = Ls - Li
Frecuencia acumulada por debajo del intervalo cr
crtico: nd
Frecuencia del intervalo cr
crtico: nc

Cuando en la distribucin de frecuencias los datos no estn agrupados en intervalos,


se aplica la frmula pero con la amplitud del intervalo igual a uno (I = 1)
2010

Centro Asociado A Coru


Corua

UNED

Carmen Voces

Introducci
Introduccin al an
anlisis de datos
PERCENTILES (P
(Pk) O CENTILES (C
(Ck)

TEMA 2

Recuerda que la mediana se corresponde con el percentil 50 (Md = P50)


2010

18

UNED

Introducci
Introduccin al an
anlisis de datos
PERCENTILES (P
(Pk) O CENTILES (C
(Ck)

2010 FEBRERO (Modelo A)

2010 FEBRERO (Modelo A)

6. El percentil 30, para los datos de la Figura 1, es:


a) 3
b) 4,7
c) 7,5

6. El percentil 30, para los datos de la Figura 1, es:


a) 3
b) 4,7
c) 7,5

nk
nd

Pk = Li + 100

nc

60
50
40
30
20
10
0
0,5

2,5

4,5

6,5

8,5

10,5

Figura 1. Representacin grfica de las


calificaciones de 150 alumnos en una
asignatura (X)

2010

ni

na

0,5 2,5

10

10

2,5 4,5

30

40

4,5 6,5

50

90

6,5 8,5

40

130

8,5 10,5

20

150

19

ni

na

0,5 2,5

10

10

2,5 4,5

30

40

4,5 6,5

50

90

6,5 8,5

40

130

8,5 10,5

20

150

n k
nd

Pk = Li + 100

nc

150 30

40

150
2 = 4,5 + 5 2
P30 = 4,5 +

50
50

P30 = 4,5 + 0,2 = 4,7

Percentil k.......................................................
k.......................................................
Nmero total de observaciones......................
Intervalo cr
crtico...............................................

pk = p30
n = 150
(kn)/100 = (30
(30150)/100 = 45

Lmite exacto inferior del intervalo cr


crtico.......
Amplitud del intervalo cr
crtico..........................
Frec.
Frec. acum. por debajo del intervalo cr
crtico...

Li = 4,5
I = Ls - Li = 6,5 - 4,5 = 2
nd = 40

Frec.
Frec. del intervalo cr
crtico................................

nc = 50

2010

TEMA 2

20

UNED

Introducci
Introduccin al an
anlisis de datos
PERCENTILES (P
(Pk) O CENTILES (C
(Ck)

TEMA 2

Con el mtodo descrito podemos calcular el valor de cualquiera de los 99


percentiles de una distribucin. Sin embargo, puede suceder que tengamos un
valor o puntuacin, Xi, y nos interese saber qu percentil ocupa ese valor en la
distribucin. Es decir que percentil le corresponde a la puntuacin del sujeto s,
Xs?. Realmente nos estn pidiendo el valor de k, dado el valor de Xi. Para realizar
ese clculo debemos despejar k en la ecuacin anterior y obtenemos la siguiente
frmula.
(Pk Li ) nc
+ nd

I
k=

100

Nmero total de observaciones: n


Lmite exacto inferior del intervalo cr
crtico: Li
Amplitud del intervalo cr
crtico: I = Ls - Li
Frecuencia acumulada por debajo del intervalo cr
crtico: nd
Frecuencia del intervalo cr
crtico: nc

2010

Introducci
Introduccin al an
anlisis de datos
PERCENTILES (P
(Pk) O CENTILES (C
(Ck)

5. En la Figura 1, la calificacin 6,5 corresponde al percentil:


a) 50
b) 60
c) 65
X

ni

na

0,5 2,5

10

10

2,5 4,5

30

40

4,5 6,5

50

90

6,5 8,5

40

130

8,5 10,5

20

150

Pk = 30
n = 150

Intervalo cr
crtico................................................
Lmite exacto inferior del intervalo cr
crtico.......

= 4,5 6,5
Li = 4,5

Amplitud del intervalo cr


crtico..........................
Frec.
Frec. acum. por debajo del intervalo cr
crtico...

I = Ls - Li = 6,5 4,5 = 2
nd = 40

Frec.
Frec. del intervalo cr
crtico.................................

nc = 50

2010

(Pk Li ) nc
+ nd

I
k=

60
50
40
30
20
10
0
2,5

4,5

6,5

8,5

10,5

Figura 1. Representacin grfica de las


calificaciones de 150 alumnos en una
asignatura (X)

2010

TEMA 2

UNED

100

ni

na

0,5 2,5

10

10

2,5 4,5

30

40

4,5 6,5

50

90

6,5 8,5

40

130

8,5 10,5

20

150

22

Introducci
Introduccin al an
anlisis de datos
DECILES (D
(Dk) Y CUARTILES (Q
(Qk)

TEMA 2

CUARTILES (Q
(Qk): Son los 3 valores que dividen la distribucin en 4 secciones,
cada una conteniendo el 25% de las observaciones.
(Pk Li ) nc
+ nd

I
k=

(6,5 4,5) 50

+ 40

2
100 = 90 100 = 60
k =
150
150

Puntuaci
Puntuacin correspondiente al percentil........
Nmero total de observaciones......................

TEMA 2

5. En la Figura 1, la calificacin 6,5 corresponde al percentil:


a) 50
b) 60
c) 65

21

2010 FEBRERO (Modelo A)

Introducci
Introduccin al an
anlisis de datos
PERCENTILES (P
(Pk) O CENTILES (C
(Ck)

2010 FEBRERO (Modelo A)

0,5

Cuando se calcula el percentil que corresponde a una puntuacin determinada, puede


ocurrir que obtengamos un valor con decimales. En este caso, y dado que los
percentiles son 99 valores enteros, tomamos la cantidad entera ms prxima.

UNED

UNED

100

a) El primer cuartil (Q1) deja por debajo s al 25% de los sujetos y por encima al
75% restante. Como se puede deducir fcilmente, se corresponde con el
percentil 25 (Q1 = P25)
b) El segundo cuartil (Q2) deja por debajo s al 50% de los sujetos y por encima al
50% restante. Es equivalente al percentil 50 (Q2 = P50 = Md)
c) El tercer cuartil (Q3) deja por debajo s al 75% de los sujetos y por encima al 25%
restante. Se corresponde con el percentil 75 (Q3 = P75)

DECILES (Dk): son 9 valores que dividen la distribucin en 10 secciones, cada


una conteniendo el 10% de las observaciones. Se representan por Dk (k = 1, 2,
3, 4, 6, 7, 8 o 9).
El primer decil, D1 deja por debajo de s al 10% de los sujetos, el D2 al 20%, el
D3 al 30% y as hasta el D9 que deja por debajo de s al 90% de los sujetos. De
este modo, D1 = P10; D2 = P20; D5 = P50 = Md; ...

23

2010

24

UNED

Percentiles
P1

P10

P15

P20

P25

P30

P35

P40

P45

P50

2010

Introducci
Introduccin al an
anlisis de datos
Medidas de Posici
Posicin
Deciles

D1

D2

Cuartiles

D3

D4

D5

Q1

Q2

Percentiles
P55

P60

P65

P70

P75

P80

P85

P90

P95

P99

TEMA 2

Deciles

D6

D7

Cuartiles

D8

D9

Q3

25

Вам также может понравиться