Вы находитесь на странице: 1из 27

TEMA 1

DESCRIPCIN DE DATOS:
ESTADSTICA DESCRIPTIVA

1.1 Introduccin: conceptos bsicos


1.2 Tablas estadsticas y representaciones
grficas
1.3 Caractersticas de variables estadsticas
unidimensionales
1.3.1 Caractersticas de posicin
1.3.2 Caractersticas de dispersin
1.3.3 Caractersticas de forma
1.4 Anlisis exploratorio de datos:
grfico de caja

1
1.1. Introduccin : conceptos bsicos

ESTADSTICA: Estudio de los mtodos de recogida y


descripcin de datos, as como del anlisis de esta
informacin

Etapas de un estudio estadstico

1 Recogida de datos
2 Ordenacin, tabulacin y grficos*
3 Descripcin de caractersticas*
4 Anlisis formal

* Estadstica descriptiva: parte de la


estadstica que se ocupa de las etapas 2 y 3

Individuo, Poblacin, Muestra

Poblacin: Conjunto de elementos a los que se les


estudia una caracterstica
Individuo: Cada uno de los elementos de la poblacin
Muestra: Subconjunto representativo de la poblacin

2
Variables estadsticas.

Variable estadstica (v.e.): Caracterstica propia


del individuo objeto del estudio estadstico

Ejemplos: - Estatura
- Salario
- Color del pelo
- Nivel de colesterol
- N de hijos de una familia

3
Tipos de variables estadsticas

Cualitativas: Las caractersticas no son cuantificables

Ejemplos:
Grupo sanguineo
Profesin
Color del pelo

Cuantitativas: Caractersticas cuantificables o numricas

Discretas: Numricas numerables

Ejemplos:
N de hijos de una familia
N de nidos de procesionarias por rbol
N de virus en un cultivo

Continuas: Numricas no numerables

Ejemplos:
Estatura
Salario
Nivel de colesterol
4
1.2. Tablas estadsticas y representaciones
grficas

Variables discretas

Frecuencias
Absolutas, n (n individuos modalidad i)
i
Absolutas acumuladas, N n n ... n
i 1 2 i

Relativas, fi ni n (proporcion indiv. modalidad i)

Relativas acumuladas, F i f1 f 2 ... fi

Absolutas, ni
xi ni Ni fi Fi
Absolutas
x1 n1 N1 f1 F1 acumuladas, Ni
... ... ... ... ...
xi ni Ni fi Fi
... ... ... ... ... Relativas
f i = ni / n
xk nk Nk fk Fk
n 1 Relativas
acumuladas
Fi = Ni / n
5
Variables continuas: Intervalos

Intervalo I i x i n i Ni fi Fi

[a,b) x1 n1 N1 f1 F1
... ... ... ... ... ...
[c,d) xi ni Ni fi Fi
... ... ... ... ... ...
[e,f] xk nk Nk fk Fk
n 1

Marca de clase xi (punto medio de cada intervalo)


Amplitud ai (distancia entre los extremos)
Intervalos cerrados por un extremo y abiertos por otro

6
Grficos estadsticos

V. E. Cualitativas: Grfico rectangular

Color Plumaje N de Aves ( n i )


Negro 10
Gris 14
Blanco 20
Rojo 6
Violeta 4
54

20

10

Negro Gris Blanco Rojo Violeta

7
V. E. Cualitativas: Grfico de sectores

Grados de un sector = 360 0 * fi

Color N de Aves fi Grados


fi%
Plumaje ni
Negro 10 0,19 19% 68
Gris 14 26%
Blanco 20
Rojo 6 0,11
Violeta 4
54

violeta
negro
rojo

blanco gris

8
V. E. Discretas: Grfico de barras

N de cras N animales: n i fi Fi
2 20 0.20 0.20
3 30 0.30 0.50
4 25 0.25 0.75
5 15 0.15 0.90
6 10 0.10 1
n = 100

35

30

25

20

15

10

0
2 3 4 5 6

9
V. E. Continuas: Histograma

Estatura ni hi = ni / ai
150 160 15 1.5
160 170 22 2.2
170 180 20 2
180 190 18
190 200 10

hi 85

2.2 El rea de
2 cada rectngulo
1,8 es proporcional
a la frecuencia
1,5

150 160 170 180 190 200


10
1.3. Caractersticas de variables
estadsticas unidimensionales

1.3.1 Caractersticas de Posicin

Media aritmtica

k
k ni x i
x fi x i i 1
i 1
n

Estatura N Personas M. Clase


ni xi ni xi
140 150 20 145 2900
150 160 100 155 15500
160 180 80 170 13600
180 200 10 190 1900
n = 210 33900

k
ni x i
Media : x i 1
33900
161.42
n 210
11
Moda

Valor de la variable ms frecuente


Puede haber ms de una moda Plurimodal

Variables discretas

Datos en serie
2, 2, 3, 3, 3, 3, 5, 6, 7 Mo = 3

Datos en tabla

Ejemplo xi ni
1 34
2 36
3 45 Mo = 3
4 22
5 17

12
Variables continuas

h i h i 1
Mo eLi
i 1
h i h i1 hi h i1
ai

Ejemplo xi ni hi = ni / ai
150 160 15 1.5
160 170 22 2,2
170 180 20 2
180 190 18 1,8
190 200 10 1
85

Mo 160
2.2 1.5
10 167.777
2.2 1.5 2.2 2

13
Mediana

Valor de la variable que ocupa el lugar central en una


serie de datos ordenados.
El 50% de los elementos de la poblacin tienen un valor
de la variable menor o igual que la mediana. El 50% de los
elementos de la poblacin tienen un valor de la variable
mayor o igualque la mediana.

Variables discretas

Datos en serie
N impar de observaciones:
2, 2, 2, 3, 5, 6, 7, 7, 8 Me = 5

N par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9
Me = ____ promedio entre los dos datos centrales

xi n N fi Fi xi n N fi Fi
i i i i
2 3 3 0,333 0,333 3 1 1 0,1 0,1
3 1 4 0,111 0,444 4 1 2 0,1 0,2
5 1 5 0,111 0,555 6 3 5 0,3 0,5
6 1 6 0,111 0,666 7 1 6 0,1 0,6
7 2 8 0,222 0,888 8 2 8 0,2 0,8
8 1 9 0,111 0,999 9 2 10 0,2 1
9 1 10 1
14
Variables discretas

Datos en tabla

Ejemplo

xi ni Ni fi Fi n /2 = 14
Fi = 0,5
0 4 4 0.142 0.142
1 6 10 0.214 0.357
2 10 20 0.357 0.714
3 5 25 0.178 0.892
Me = 2
4 3 28 0.107 1
28 1

Observacin: Si n / 2 coincide con un N i

la mediana est indeterminada entre x i y x i+1

15
Variables continuas

50
n N i 1
0,5 Fi 1 100
Me eLi
i 1 a i eLi
i 1 ai
fi ni

Ejemplo

Estatura ni Ni fi Fi n/2 = 50
Fi = 0,5
140 150 15 15 0.15 0.15
150 160 30 45 0.30 0.45
160 170 25 70 0.25 0.70
170 180 20 90 0.20 0.90
180 200 10 100 0.10 1
100

0.5 0.45
Me 160 10 160 2 162
0.25

Observacin: Si n/2 coincide con un Ni

la mediana es el extremo superior del intervalo que le


corresponde

16
Percentiles

Definicin: Pk , k: 1,2,...,99, percentil k, valor de la


variable que deja por debajo, el k% de los valores de la
variable

Q1 = P25 Cuartil 1
Q2 = P50 Cuartil 2 = Me
Q3 = P75 Cuartil 3

D1 = P10 Decil 1
D2 = P20 Decil 2
.
D9 = P90 Decil 9

Clculo para v.e. discretas:


Igual que la mediana, cambiando:
50 k
n por n
100 100

Clculo para v.e. continuas:


k k
Fi 1 n N i 1
Pk e i 1 100 a i ei 1 100 ai
fi ni

17
Ejemplos percentiles v.e. discreta

xi ni Ni
2 20 20 k 40
n 124 49,6
3 30 50 100 100
4 44 94
5 20 114 k 95
n 124 117,8
6 10 124 100 100
124

Percentil 40, P40 = 3 Percentil 95, P95 = 6

nk /100 = Percentil 25, P25 = 3 = Q1


124x25/100 = 31

nk /100 = Percentil 50, P50 = 4 = Me = Q2


124x50/100 = 62

nk /100 = Percentil 75, P75 = 4 = Q3


124x75/100 = 93

18
Ejemplos percentiles v.e. continua

Tallas ni Ni fi Fi
140-150 15 15 0.15 0.15
P40
150-160 30 45 0.30 0.45
160-170 25 70 0.25 0.70
P75
170-180 20 90 0.20 0.90
180-200 10 100 0.10 1
100

k nk
Fi 1 N i 1
Pk ei 1 100 a i ei 1 100 ai
fi ni

0.4 0.15 40 15
P40 150 10 150 10 158.33
0.30 30

0.75 0.70 75 70
P75 170 10 170 10 172.5 Q 3
0.20 20

19
1.3.2. Caractersticas de Dispersin

Miden la Homogeneidad de las observaciones

Rango o recorrido

Valor mximo menos valor mnimo de la variable

Recorrido intercuartlico

Q 3 Q1

20
Varianza

k k

2
ni x i x ii
n x 2

2
2
i 1 i 1 x
n n

Desviacin tpica

Coeficiente de variacin


C. V .
x

21
Ejemplo

xi ni nixi nixi2
4 20 80 320
6 40 240 1440
8 44 352 2816
10 36 360 3600
12 22 264 3168
162 1296 11344

k
ni x i 2 2
11344 1296
2 Var X i 1
2
x 6.02
n 162 162

2 6.02 2.4535

22
Momentos centrales (Respecto a la media)

k
ni x i x
r

r i 1
n

k
ni x i x
r 1 1 i 1 0
n

k
ni x i x
2

r 2 2 i 1 2
n

23
1.3.3 Caractersticas de forma

Coeficiente de Sesgo (Asimetra)

3
1
3

Si 1 0 Distribucin simtrica

Si 1 0 Distribucin sesgada a la derecha

Si 1 0 Distribucin sesgada a la izquierda

24
Coeficiente de Curtosis (Aplastamiento)

4
2 3
4

Distribucin igual de aplastada


Si 2 0
que la distribucin Normal

Distribucin menos aplastada


Si 2 0
que la distribucin Normal

Distribucin ms aplastada que


Si 2 0
la distribucin Normal

25
1.4 Grfico de caja
v.a.i. v.a.s.

mn F1 f1 Q1 Me Q3 f2 F2 mx

f1=Q1-1.5(Q3-Q1) frontera interior inferior


f2=Q3+1.5(Q3-Q1) frontera interior superior
F1=Q1-3(Q3-Q1) frontera exterior inferior
F2=Q3+3(Q3-Q1) frontera exterior superior

V.A.I.= Dato ms prximo, por exceso, a f1


(valor adyacente inferior)
V.A.S.=Dato ms proximo, por defecto, a f2
(valor adyacente superior)

Valores atpicos o anmalos: Datos inferiores a f1


superiores a f2 (distinguindose)

o ** * o

anmalos v.a.i. Q1 Me Q3 v.a.s anmalos

26
Ejemplo

Sea la variable estadstica n de hijos. Los


datos de 30 familias son los siguientes:

1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4

mn = 0
mx = 10 Datos ordenados:
00000011111111222223333444458 10
Q1 = 1
Q3 = 3
Me = 2
f1 = -2
f2 = 6
F1 = -5
F2 = 9
Vai = 0
Vas = 5
Valores anmalos = 8, 10

0 1 2 3 4 5 6 7 8 9 10

* o

27

Вам также может понравиться