Вы находитесь на странице: 1из 9

Tambin es posible representar valores numricos (discretas o continuas) de

forma agrupada utilizando un mtodo simple e ingenioso introducido por J. W.


Tukey. Este mtodo a la vez numrico y grafico llamado Diagrama de Tallo y
Hojas

Ejemplo:
Los datos siguientes corresponden a las calificaciones de un grupo de 37
estudiantes del curso de Probabilidad y Estadstica

63
84
76
67
69

91
65
37
61
80

57
83
61
79
59

73
32
69
70
75

66
76
77
70
65

63
53
77
78
57

74
79
42
72
73

86
77

La primera cifra de la calificacin formara el tallo y la segunda ser la hoja. Los


tallos se ubican verticalmente y las hojas horizontalmente. As para representar
la nota 63, se escribir como tallo 6 y hoja 3

(nj
)
2
1
4
10
15
4
1

Tall
o
3
4
5
6
7
8
9

Hoj
a
7,
2
7,
3,
3,
0,
1

2
9,
5,
0,
4,

3,
1,
6,
3,

7
5,
7,
6,

9,
4,

3,
2,

1,
7,

9,
9,

Notas: Las calificaciones se expresan de 0 a 100

Tallo 9 l 1 Hoja

6
5,

,7

8,

9,

3,

6,

Ejemplo: Utilizando los datos del ejemplo de los pulgones con la definicin 7 I
81 = 0.781
(nj)
2
0
9
8
6
1
1
2
2
1

Tallo
s
7
8
9
10
11
12
13
14
15
16

Hoja
81
0
17
16
05
44
88
28
19
19

45
21
31

53
30
49

54
49
62

56
49
71

84
56
99

94
81

96
86

96

93
95

En este ejemplo se utilizaron tallos de 2 cifras y hojas de 2 cifras


A la izquierda de los tallos se puede escribir entre parntesis (nj) el nmero de
hojas que comprende este tallo. Se rectifica ms fcilmente el nmero de hojas

nj

= nmero de observaciones.

Si el conjunto de datos contiene datos negativos y positivos se debe utilizar:


Un tallo -0 para las hojas -9 a -1
Un tallo 0 para las hojas de 0 a 9

Ejemplo: considere las 36 observaciones siguientes con la definicin -4 l 3 =


-43

-43
-5
30
-20
-5
35

-18
0
38
-11
-5
50

-10
-5
45
50
-15
8

50
-15
8
50
-15
55

-3
5
55
0
20
60

0
15
0
0
15
0

(nj)
1
0
1
6
5
10
2
1
3
1
5
1

Tallo
-4
-3
-2
-1
-0
0
1
2
3
4
5
6

Hoja
3
0
8
5
0
5
0
0
5
0
0

1
5
0
5

0
5
0

5
5
0

5
3
0

5
0

Si el dominio de variacin es corto un diagrama de tallos y hojas proporcionara


la forma de distribucin. Por ello ser necesario afinar el nmero de tallos para
mejorar el anlisis
Ejemplo: Los datos siguientes representan la estatura de un grupo de 25
adultos hombres en cm.
178
182
171
166
174
(nj
)
4
17
4
(nj)
1
3
10
7
4

180
173
172
175
183
Tall
o
16
17
18

Hoj
a
4
8
2

Tallo
16
16
17
17
18

8
1
0

0-4
5-9
0-4
5-9
0-9

164
176
179
180
172

7
4
3

6
3
0

Hoja
4
8
1
8
2

Resmenes numricos

7
4
5
0

6
3
9
0

178
168
172
172
175

2
6
3

2
8

174
171
170
175
167

4
5

0
5

Mtodos de tendencia central


Media
La media

de un conjunto de datos x1, x2, xn est definido como:

x =

1
Xi
n i=1

Y representa el centro de gravedad de la muestra de datos.


Ejemplo: La media de las estaturas del grupo de 25 hombres
178
182
171
166
174

180
173
172
175
183

164
176
179
180
172

178
168
172
172
175

174
171
170
175
167

x =

1
Xi
n i=1
25

1
x = Xi
25 i=1
x =

1
( 178+182+171+166+174+ 180+ 173+172+ 175+183+164+176+ 179+180+172+178+168+172+17
25

x =

1
( 4347 )
25

x =173.88
Si los datos son presentados en forma de tabla (datos agrupados) la media
estar definida por
k

x = fj x j
j=1

Donde fj es la frecuencia relativa de la clase y donde

x j es el valor central

de la clase j.

Ejemplo: La medida de los pesos de los pulgones ser calculada como sigue:

x j

Clases

nj

fi

[0.6;0.8[
[.08;1.0[
[1.0;1.2[
[1.2;1.4[
[1.4;1.6[
[1.6:1.8[

1
9
14
2
4
4

0.029
0.265
0.412
0.059
0.118
.0118

fi( x j

0.7
0.9
1.1
1.3
1.5
1.7

0.020
0.239
0.453
0.77
.177
.201

Mediana
Cuando los datos x1, X2, , xn estn ordenados es decir en orden creciente la
mediana es el valor Q2 que reparte al conjunto de datos en dos subconjuntos
tal que al menos 50% de las observaciones son Q2 y que al menos el 50%
sean Q2
Cuando el tamao n de la muestra es impar el valor de Q2 corresponde a la

n+1

observacin central que tiene el orden

Q2=x

n+ 1
)
2

Si el tamao de la muestra es par la mediana ser la media de las dos


observaciones centrales
Un medio rpido para encontrar la mediana es ordenar el diagrama de tallos y
hojas
El diagrama de 5 tallos de los hombres adultos.
(nj)
1
3
10
7
4

Tallo
16
16
17
17
18

0-4
5-9
0-4
5-9
0-9

Hoja
4
6
0
5
0

7
1
5
0

8
1
5
2

2
6
3

2
8

2
8

2
9

Q 2=

n+1
2

Q 2=

25+1
2

Q2=x 13

Q2= 174cm

La frecuencia del tallo est indicada entre parntesis. Como que el tamao de
muestra es 25, la mediana corresponde al dato ubicado en el lugar (25+1/2)
Q2= 174
Cuartiles
Aunque propiamente dicho los cuartiles no son medidas de tendencia central
El primer cuartil

Q1 es la medicin de los datos inferiores a la mediana

Ejemplo: de los pulgones

Q 1=x

Q 1=x

1
(1+ ( n1 ) )
4

1
(1+ ( 341 ) )
4

Q1=x (9.25 )
.9961+0.25 (0.996*.0996)

Q1=0.996
Para las estaturas:

Q1=x

1
(1+ ( 251 ) )
4

Q1=x(7)
Q1=171
La mediana tambin hubiese podido ser definida de la siguiente manera:

Q2=x

(1+ (n1) 12 )

Q2

Sin olvidar que cuando el ndice resulta ser un par entonces ser necesario
hacer una interpolacin lineal entre 2 observaciones para el ejemplo del peso
de los pulgones se tiene:

Q 2=x

1
(1+ ( n1 ) )
2

Q2=x

1
(1+ ( 341) )
4

Q2=x(17.5)
Dato 17 +.5 (18-17) 1.081+.5 (1.086*1.081)
El tercer cuartil

Q 3=x

Q3=x

Q3

3
(1+ ( n1 ) )
4

3
(1+ ( 341) )
4

Q3=x (25.750)
X25+.75 (1.388-1.244)

Q3=1.352
Los 3 cuartiles

Q1 ,

Q2 ,

Q3

dividen los datos en cuatro partes iguales

donde cada una comprende el 25% de las observaciones.


Medidas de dispersin
Una medida de tendencia central (media, mediana) es frecuentemente
engaosa e insuficiente cuando esta no es acompaada por una medida de
dispersin de datos estudiados.
Por ejemplo: La informacin de la temperatura media proporcionada para un
sistema de refrigeracin destinado a la conservacin de los vino es totalmente
insuficiente.
Varianza

Para un conjunto de datos cuantitativos {x1, x2, xn} donde la mediana es

s2

la varianza muestral es
2

x 1 x

n
1
S 2=

n1 i=1

Con excepcin del divisor (n-1) de n,

s2

es simplemente la media de los

cuadrados de las desviaciones de cada una de las observaciones con respecto


a la media de los mismos.

x x 2

Es una medida global (tiene en cuenta todos los datos) y promedia (al dividir
por n-1)
Dado que esta medida de dispersin est formada por la desviacin de la
media, esta es ms apropiada cuando la media es la medida de la tendencia
central utilizada
Con la finalidad de profundizar sobre esta estadstica examinaremos sus
propiedades

1)

no puede ser un valor negativo y es igual con 0 nicamente cuando

todas las observaciones son iguales entre s.

s2

2)

puede ser afectada por algunas observaciones aberrantes (dato

atpico o falso) sobre todo cuando el tamao de la muestra es muy


pequea

Ejemplo
Los Datos
1)

2)

X
3.0
4.0

7.5
12.5

{1.0;2.0;3.0;4.0;5.0}

[1.0;2.0;3.0;4.0;10.0}

x =

1
Xi
n i=1

1.0+2.0+3.0+ 4.0+5.0+1.0+2.0+ 3.0+ 4.0+10.0


1
x =
10
x =3.5
n

1
s=
( x 1x )
n1 i=1
2

Вам также может понравиться