Вы находитесь на странице: 1из 27

1

TEMA 1
DESCRIPCIN DE DATOS:
ESTADSTICA DESCRIPTIVA


1.1 Introduccin: conceptos bsicos
1.2 Tablas estadsticas y representaciones
grficas
1.3 Caractersticas de variables estadsticas
unidimensionales
1.3.1 Caractersticas de posicin
1.3.2 Caractersticas de dispersin
1.3.3 Caractersticas de forma
1.4 Anlisis exploratorio de datos:
grfico de caja
2
* Estadstica descriptiva: parte de la
estadstica que se ocupa de las etapas 2 y 3
ESTADSTICA: Estudio de los mtodos de recogida y
descripcin de datos, as como del anlisis de esta
informacin
Poblacin: Conjunto de elementos a los que se les
estudia una caracterstica
Individuo: Cada uno de los elementos de la poblacin
Muestra: Subconjunto representativo de la poblacin
1.1. Introduccin : conceptos bsicos
Etapas de un estudio estadstico
Individuo, Poblacin, Muestra
1 Recogida de datos
2 Ordenacin, tabulacin y grficos*
3 Descripcin de caractersticas*
4 Anlisis formal
3
Variable estadstica (v.e.): Caracterstica propia
del individuo objeto del estudio estadstico

Modalidad: Cada una de las posibilidades o
estados diferentes de una variable estadstica
Exhaustivas e incompatibles
Variables estadsticas. Modalidades
Ejemplos:
- Estatura
- Salario
- Color del pelo
- Nivel de colesterol
- N de hijos de una familia

Ejemplo:
color del pelo:
- castao
- rubio
- negro
4
Cualitativas: Las caractersticas no son cuantificables
Cuantitativas: Caractersticas cuantificables o numricas
Discretas: Numricas numerables
Continuas: Numricas no numerables
Tipos de variables estadsticas
Ejemplos:
Grupo sanguineo
Profesin
Color del pelo
Ejemplos:
N de hijos de una familia
N de nidos de procesionarias por rbol
N de virus en un cultivo
Ejemplos:
Estatura
Salario
Nivel de colesterol
5
Frecuencias
+
+
+
+
1 2
1 2
Absolutas, (n individuos modalidad i)
Absolutas acumuladas, ...
Relativas, (proporcion indiv. modalidad i)
Relativas acumuladas, ...
i
i i
i i
i i
n
N n n n
f n n
F f f f
= + + +
=
= + + +
Absolutas, n
i

Relativas
f
i
= n
i
/ n
Relativas
acumuladas
F
i
= N
i
/ n
Absolutas
acumuladas, N
i

Variables discretas
x
i
n
i
N
i
f
i
F
i
x
1
...
x
i
...
x
k
n
1
...
n
i
...
n
k
N
1
...
N
i
...
N
k
f
1
...
f
i
...
f
k
F
1
...
F
i
...
F
k
n 1
1.2. Tablas estadsticas y representaciones
grficas
6





Variables continuas: Intervalos
Intervalo I
i
x
i
n
i
N
i
f
i
F
i
e
0
e
1
...
e
i-1
e
i
...
e
k

-1
e
k
x
1
...
x
i
...
x
k
n
1
...
n
i
...
n
k
N
1
...
N
i
...
N
k
f
1
...
f
i
...
f
k
F
1
...
F
i
...
F
k
n 1
Marca de clase x
i
(punto medio de cada intervalo)
Amplitud a
i
(distancia entre los extremos)
Intervalos cerrados por un extremo y abiertos por otro
7
V. E. Cualitativas: Grfico rectangular
20
10
Negro Gris Blanco Rojo Violeta
Grficos estadsticos
Color Plumaje N de Aves ( n
i

)
Negro 10
Gris 14
Blanco 20
Rojo 6
Violeta 4
54
8
V. E. Cualitativas: Grfico de sectores
rojo
violeta
negro
gris
blanco
Color Plumaje
N de Aves
n
i

f
i
Grados
Negro 10 0,185 66,6
Gris 14 0,259 93,24
Blanco 20 0,37 133,2
Rojo 6 0,111 39,96
Violeta 4 0,074 26,64
54
Grados de un sector = 360
0
x f
i

9
0
5
10
15
20
25
30
35
2 3 4 5 6
V. E. Discretas: Grfico de barras
N de cras
N animales: n
i

f
i
F
i
2 20 0.20 0.20
3 30 0.30 0.50
4 25 0.25 0.75
5 15 0.15 0.90
6 10 0.10 1
n = 100
10
Estatura
n
i
h
i
= n
i
/ a
i

140 160
30 1.5
160 170
22 2.2
170 180
20 2
180

190
18 1.8
190 200
10 1
100
V. E. Continuas: Histograma
El rea de
cada rectngulo
es proporcional
a la frecuencia
1
1,5
1,8
140 160 170 180 200
h
i
190
2.2
2
11
1
1
k
i i
k
i
i i
i
n x
f x
n
x
=
=
= =

1.3. Caractersticas de variables


estadsticas unidimensionales
1.3.1 Caractersticas de Posicin
Media aritmtica
Estatura N Personas
n
i
M. Clase
x
i

n
i

x
i
140 150
20 145 2900
150 160
100 155 15500
160 180
80 170 13600
180 200
10 190 1900
n = 210 33900
33900
1
161.42
210
:
k
i i
i
n x
Media
n
x
=
= = =


12
17 5
22 4
45 3
36 2
34 1
n
i
x
i
Ejemplo
Datos en tabla
Datos en serie
2, 2, 3, 3, 3, 3, 5, 6, 7 Mo = 3
Mo = 3
Valor de la variable ms frecuente
Puede haber ms de una moda Plurimodal
Moda
Variables discretas
13
( ) ( )
1
1 1
1
i
i i
i i
i i i
h h
Mo e a
h h h h

= +
+
x
i
n
i
h
i
= n
i

/ a
i
140 160 30 1.5
160 170 22 2,2
170 180 20 2
180 190 18 1,8
190 200 10 1
100
Variables continuas
Ejemplo
Observaciones:
1. Puede utilizarse la frecuencia relativa
2. Si las amplitudes son iguales, la moda se puede
obtener directamente con las frecuencias
( )
( ) ( )
2.2 1.5
160 10 167.777
2.2 1.5 2.2 2
Mo

= + =
+
14
Valor de la variable que ocupa el lugar central en una
serie de datos ordenados.
El 50% de los elementos de la poblacin tienen un valor
de la variable menor o igual que la mediana. El 50% de los
elementos de la poblacin tienen un valor de la variable
mayor o igual que la mediana.
N par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9
Me = 6 7 Indeterminada entre 6 y 7
Mediana
Variables discretas
Datos en serie
x
i
n
i
N
i

f
i
F
i

2 3 3 0,333 0,333
3 1 4 0,111 0,444
5 1 5 0,111 0,555
6 1 6 0,111 0,666
7 2 8 0,222 0,888
8 1 9 0,111 0,999
9 1
x
i
n
i
N
i

f
i
F
i

3 1 1 0,1 0,1
4 1 2 0,1 0,2
6 3 5 0,3 0,5
7 1 6 0,1 0,6
8 2 8 0,2 0,8
9 2 10 0,2 1
10 1
N impar de observaciones:
2, 2, 2, 3, 5, 6, 7, 7, 8 Me = 5
15
Datos en tabla
Variables discretas
n /2 = 14
F
i
= 0,5
Me = 2
Ejemplo
28
4
3
2
1
0
x
i
28
3
5
10
6
4
n
i
1
0.892
0.714
0.357
0.142
F
i

1
0.107
0.178
0.357
0.214
0.142
f
i

25
20
10
4
N
i
Observacin: Si n / 2 coincide con un N
i


la mediana est indeterminada entre x
i
y x
i+1

16
1
1
1 1
50
0, 5
100
i
i
i i i i
i i
n N
F
Me e a e a
f n

= + = +
0.5 0.45
160 10 160 2 162
0.25
Me

= + = + =
n/2 = 50
F
i
= 0,5
Variables continuas
Ejemplo
Observacin: Si n/2 coincide con un N
i

la mediana es el extremo superior del intervalo que le
corresponde
1
0.90
0.70
0.45
0.15
F
i
0.10
0.20
0.25
0.30
0.15
f
i
100
90
70
45
15
N
i
100
10 180 200
20 170 180
25 160 170
30 150 160
15 140 150
n
i
Estatura
17
Definicin: P
k

, k: 1,2,...,99, percentil k, valor de la
variable que deja por debajo, el k% de los valores de la
variable
Q
1
= P
25
Cuartil 1
Q
2
= P
50
Cuartil 2 = Me
Q
3
= P
75
Cuartil 3
D
1
= P
10
Decil 1
D
2
= P
20
Decil 2
.
D
9
= P
90
Decil 9
Percentiles
1 1
1 1
100 100
i i
k i i i i
i i
k k
F n N
P e a e a
f n



= + = +
Clculo para v.e. continuas:
Clculo para v.e. discretas:
Igual que la mediana, cambiando:
50

100 100
k
n por n
18
x
i
n
i
N
i
2 20 20
3 30 50
4 44 94
5 20 114
6 10 124
124
Percentil 40, P
40
= 3

Percentil 95, P
95
= 6

n k /100 =
124x25/100 = 31
n k /100 =
124x50/100 = 62
n k /100 =
124x75/100 = 93
Ejemplos percentiles v.e. discreta
Percentil 50, P
50
= 4 = Me = Q
2
Percentil 25, P
25

= 3 = Q
1
Percentil 75, P
75
= 4 = Q
3
40
124 49,6
100 100
k
n = =
95
124 117,8
100 100
k
n = =
19
1 1
1 1
100 100
i i
k i i i i
i i
k nk
F N
e a e a
f n
P



= + = +
75 3
0.75 0.70 75 70
170 10 170 10 172.5
0.20 20
Q P =

= + = + =
40
0.4 0.15 40 15
150 10 150 10 158.33
0.30 30
P =

+ = + =
40
P
75
P
Ejemplos percentiles v.e. continua
Tallas
n
i
N
i
f
i
F
i
140-150 15 15 0.15 0.15
150-160 30 45 0.30 0.45
160-170 25 70 0.25 0.70
170-180 20 90 0.20 0.90
180-200 10 100 0.10 1
100
20
Q
3
Q
1

Valor mximo menos valor mnimo de la variable
Miden la Homogeneidad de las observaciones
1.3.2. Caractersticas de Dispersin
Rango o recorrido
Recorrido intercuartlico
21
. . C V
x
o
=
2
o o =
( )
2
2
2
2
1 1
i
k k
i i i
i i
n x x n x
x
n n
o
= =

= =

Varianza
Desviacin tpica
Coeficiente de variacin
22
x
i
n
i
n
i
x
i
n
i
x
i
2

4 20 80 320
6 40 240 1440
8 44 352 2816
10 36 360 3600
12 22 264 3168
162 1296 11344
| |
2
2
2
2
1
11344 1296
6.02
162 162
k
i i
i
n x
Var X x
n
o
=
| |
= = = =
|
\ .

Ejemplo
2
6.02 2.4535 o o = = =
23
( )
1
i
k
r
i
i
r
n x x
n

=

=

( )
2
2
1
2
2
i
k
i
i
n x x
r
n
o
=

= = =

( )
1
1
1 0
i
k
i
i
n x x
r
n

=

= = =

Momentos centrales (Respecto a la media)


24
1.3.3 Caractersticas de forma
1
0 Si > Distribucin sesgada a la derecha

1
0 Si =
Distribucin simtrica

1
0 Si <
Distribucin sesgada a la izquierda

Coeficiente de Sesgo (Asimetra)
3
1
3

o
=
25
2
0 Si <
Distribucin ms aplastada que
la distribucin Normal

2
0 Si >
Distribucin menos aplastada
que la distribucin Normal

2
0 Si =
Distribucin igual de aplastada
que la distribucin Normal

4
2
4
3

o
=
Coeficiente de Curtosis (Aplastamiento)
26
1.4 Grfico de caja
Me Q
3
Q
1
f
1
F
1
mn f
2
F
2
mx
f
1
=Q
1
-1.5(Q
3
-Q
1
) frontera interior inferior
f
2
=Q
3
+1.5(Q
3
-Q
1
) frontera interior superior
F
1
=Q
1
-3(Q
3
-Q
1
) frontera exterior inferior
F
2
=Q
3
+3(Q
3
-Q
1
) frontera exterior superior

V.A.I.= Dato ms prximo, por exceso, a f
1
(valor adyacente inferior)
V.A.S.=Dato ms proximo, por defecto, a f
2
(valor adyacente superior)

Valores atpicos o anmalos: Datos inferiores a f
1

superiores a f
2
(distinguindose)
*
o
**
o
Me
Q
3
Q
1
v.a.i. anmalos v.a.s anmalos
v.a.i
. v.a.s
.
27
Ejemplo
Sea la variable estadstica n de hijos. Los
datos de 30 familias son los siguientes:
1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4
mn = 0
mx = 10
Q
1
= 1
Q
3
= 3
Me = 2
f
1
= -2
f
2
= 6
F
1
= -5
F
2
= 9
Vai = 0
Vas = 5
Valores anmalos = 8, 10
0 1 2 3 4
5
6 7 8 9 10
*
o
Datos ordenados:
00000011111111222223333444458 10

Вам также может понравиться