Вы находитесь на странице: 1из 30

1 Estadstica: E.

Letn
DESCRIPTIVA
Emilio Letn
Dpto. Estadstica, UC3M
UNA VARIABLE CUALITATIVA
UNA VARIABLE CUANTITATIVA
DOS VARIABLES CUALITATIVAS
UNA V. CUALI. Y UNA V. CUANTI.
DOS VARIABLES CUANTITATIVAS
2 Estadstica: E. Letn
Dnde estamos?
1981
CLCULO
DE
PROBAB.
INFERENCIA DESCRIPTIVA
3 Estadstica: E. Letn
YT: SBTC
Standing in the dark
Oh I was waiting for man to come
I am beautiful and clean
To cut a long story short
4 Estadstica: E. Letn
YT: SBTC
To cut a long story short
I lost my mind
Questions, questions
Give me no answers
5 Estadstica: E. Letn
Frentes abiertos
Empezar
Llegar a las poblaciones
6 Estadstica: E. Letn
UNA VARIABLE CUANTITATIVA
Frecuencias, moda
Grficos de barras, de tartas
UNA VARIABLE CUALITATIVA
DOS VARIABLES CUALITATIVAS
UNA V. CUANTI. Y UNA V. CUALI.
DOS VARIABLES CUANTITATIVAS
7 Estadstica: E. Letn
UNA VARIABLE CUALITATIVA
Florence
Nightingale
(1820-1910)
PORTRAITS HISTORY STATISTICS
Estadsticos
vs. Parmetros
Grficos vs.
Grficos poblacionales
8 Estadstica: E. Letn
Frecuencias
1 (a)
1 (a)
1 (a)
3 (c)
3 (c)
1 (a)
1 (a)
1 (a)
2 (b)
1 (a)
1,0 10 0,2 2 3
0,8 8 0,1 1 2
0,7 7 0,7 7 1
fra faa fr fa
9 Estadstica: E. Letn
Resumen: frecuencias
10 Estadstica: E. Letn
Moda
1 (a)
1 (a)
1 (a)
3 (c)
3 (c)
1 (a)
1 (a)
1 (a)
2 (b)
1 (a)
1,0 10 0,2 2 3
0,8 8 0,1 1 2
0,7 7 0,7 7 1
fra faa fr fa
11 Estadstica: E. Letn
Resumen: moda
12 Estadstica: E. Letn
Grfico de barras
1 (a)
1 (a)
1 (a)
3 (c)
3 (c)
1 (a)
1 (a)
1 (a)
2 (b)
1 (a)
1,0 10 0,2 2 3
0,8 8 0,1 1 2
0,7 7 0,7 7 1
fra faa fr fa
13 Estadstica: E. Letn
Sin acumular
Barchart for Col_1
0
2
4
6
8
f
r
e
q
u
e
n
c
y
1 2 3
14 Estadstica: E. Letn
Acumulado
15 Estadstica: E. Letn
Simetra
16 Estadstica: E. Letn
Resumen: grfico de barras
17 Estadstica: E. Letn
Grfico de tartas
Piechart for Col_1
Col_1
1
2
3
70,00%
10,00%
20,00%
18 Estadstica: E. Letn
Resumen: grfico de tartas
19 Estadstica: E. Letn
UNA VARIABLE CUALITATIVA
DOS VARIABLES CUALITATIVAS
UNA V. CUANTI. Y UNA V. CUALI.
DOS VARIABLES CUANTITATIVAS
Media, mn, mx, dt, cuartiles, CAS
Histograma, box-plot
UNA VARIABLE CUANTITATIVA
20 Estadstica: E. Letn
UNA VARIABLE CUANTITATIVA
John Tukey
(1915-2000)
Estadsticos
vs. Parmetros
Grficos vs.
Grficos poblacionales
21 Estadstica: E. Letn
Media
10
7
6
6
6
5
5
5
4
1
( )

= =
= =
k
j
j j
n
i
i
x fr x x
n
x
1 1
1
22 Estadstica: E. Letn
Propiedades (1/3)
Medida de centralizacin
10
7
6
6
6
5
5
5
4
1
23 Estadstica: E. Letn
Propiedades (2/3)
Unidades?
10
7
6
6
6
5
5
5
4
1
24 Estadstica: E. Letn
Propiedades (3/3)
Sensible a atpicos?
10
7
6
6
6
5
5
5
4
1
100
7
6
6
6
5
5
5
4
1
25 Estadstica: E. Letn
Resumen: media
26 Estadstica: E. Letn
Mediana
10
7
6
6
6
5
5
5
4
1
7
6
6
6
5
5
5
4
1
27 Estadstica: E. Letn
Propiedades (1/3)
Medida de centralizacin
10
7
6
6
6
5
5
5
4
1
28 Estadstica: E. Letn
Propiedades (2/3)
Unidades?
10
7
6
6
6
5
5
5
4
1
29 Estadstica: E. Letn
Propiedades (3/3)
10
7
6
6
6
5
5
5
4
1
100
7
6
6
6
5
5
5
4
1
Sensible a atpicos?
30 Estadstica: E. Letn
Resumen: mediana
31 Estadstica: E. Letn
Mnimo, mximo y amplitud
10
7
6
6
6
5
5
5
4
1
32 Estadstica: E. Letn
Propiedades
10
7
6
6
6
5
5
5
4
1
Sensible a atpicos?
Medida de dispersin
Unidades?
33 Estadstica: E. Letn
Resumen: min, mx, amplitud
34 Estadstica: E. Letn
Varianza
10
7
6
6
6
5
5
5
4
1
10
9
8
7
6
5
4
3
2
1
10
10
10
10
10
1
1
1
1
1
35 Estadstica: E. Letn
Origen (1/2)
36 Estadstica: E. Letn
Origen (2/2)
22,50 9,17 5,17 s
2
n-1
20,25 8,25 4,65 s
2
D3 D2 D1
37 Estadstica: E. Letn
Propiedades (1/3)
10
7
6
6
6
5
5
5
4
1
Medida de dispersin
38 Estadstica: E. Letn
Propiedades (2/3)
10
7
6
6
6
5
5
5
4
1
Unidades?
39 Estadstica: E. Letn
Propiedades (3/3)
10
7
6
6
6
5
5
5
4
1
100
7
6
6
6
5
5
5
4
1
Sensible a atpicos?
40 Estadstica: E. Letn
Resumen: varianza
41 Estadstica: E. Letn
Desviacin tpica
10
7
6
6
6
5
5
5
4
1
10
9
8
7
6
5
4
3
2
1
10
10
10
10
10
1
1
1
1
1
42 Estadstica: E. Letn
Origen
4,74 3,03 2,27 s
n-1
4,50 2,87 2,16 s
D3 D2 D1
43 Estadstica: E. Letn
Propiedades
10
7
6
6
6
5
5
5
4
1
Sensible a atpicos?
Medida de dispersin
Unidades?
44 Estadstica: E. Letn
Resumen: desviacin tpica
45 Estadstica: E. Letn
Desigualdad de Chebyshev (1/2)
Pafnuty
Chebyshev
(1821-1894)
Alrededor de la media
muestral +/- k veces la dt
muestral hay al menos
%
1
1
2
|

\
|

k
46 Estadstica: E. Letn
Desigualdad de Chebyshev (2/2)
96,0% 10
93,8% 4
88,9% 3
75,0% 2
55,6% 1,5
0 1
%min.obs. k
47 Estadstica: E. Letn
Resumen: des. de Chebyshev
48 Estadstica: E. Letn
Cuartiles
10
7
6
6
6
5
5
5
4
1
49 Estadstica: E. Letn
Propiedades
10
7
6
6
6
5
5
5
4
1
Sensible a atpicos?
Medida de posicin
Unidades?
50 Estadstica: E. Letn
Resumen: cuartiles
51 Estadstica: E. Letn
Rango intercuartlico
10
7
6
6
6
5
5
5
4
1
10
9
8
7
6
5
4
3
2
1
10
10
10
10
10
1
1
1
1
1
52 Estadstica: E. Letn
Propiedades
10
7
6
6
6
5
5
5
4
1
Sensible a atpicos?
Medida de dispersin
Unidades?
53 Estadstica: E. Letn
Resumen: rango intercuartlico
54 Estadstica: E. Letn
Deciles y percentiles
( ) ( )
( )
( )

>
= +
=
+
+
0 ,
0 ,
2
1
1
1
f x
f x x
P
i
i i
P
] [np i = ] [np np f =
55 Estadstica: E. Letn
Propiedades
10
7
6
6
6
5
5
5
4
1
Sensible a atpicos?
Medida de localizacin
Unidades?
56 Estadstica: E. Letn
Resumen: deciles y percentiles
57 Estadstica: E. Letn
Coeficiente de asimetra
9
5
4
Puede haber dos conjuntos de
datos, de igual tamao, con todos
los valores distintos entre s, con
igual media y con igual dt?
7
3
58 Estadstica: E. Letn
( )
=

=
s
x x
n
n
i
i
1
1
( )
=

=
2
2
1
1
s
x x
n
n
i
i
Origen (1/3)
59 Estadstica: E. Letn
( )
CAS
s
x x
n
n
i
i
=

=
3
3
1
1
Origen (2/3)
60 Estadstica: E. Letn
( )( )
( )
3
3
1

2 1
s
x x
n n
n
CAS
n
i
i


=
Origen (3/3)
61 Estadstica: E. Letn
Propiedades (1/3)
10
7
6
6
6
5
5
5
4
1
Sensible a atpicos?
Medida de simetra
Unidades?
62 Estadstica: E. Letn
Propiedades (2/3)
Simetra implica
CAS=0
CAS=0 no implica
simetra
Simetra implica que media=mediana
media=mediana no implica simetra
63 Estadstica: E. Letn
Propiedades (3/3)
CAS>0 CAS<0
64 Estadstica: E. Letn
Resumen: coeficiente de asimetra
65 Estadstica: E. Letn
Des. Cheb. (sim. y unimodal) (1/2)
Alrededor de la media muestral +/- k
veces la dt muestral hay al menos
%
9 / 4
1
2
|

\
|

k
66 Estadstica: E. Letn
Des. Cheb. (sim. y unimodal) (2/2)
96,0%
93,8%
88,9%
75,0%
55,6%
0
%min.obs.
99,6% 10
97,2% 4
95,1% 3
88,9% 2
80,2% 1,5
55,6% 1
%min.obs.
(sim+unim)
k
67 Estadstica: E. Letn
Resumen: des. Che. (sim. y unim.)
68 Estadstica: E. Letn
Coeficiente de apuntamiento
Puede haber dos conjuntos
de datos, de igual tamao, con
todos los valores distintos
entre s, con igual media, con
igual dt y con igual CAS?
69 Estadstica: E. Letn
( )
CAP
s
x x
n
n
i
i
=

=
3
1
4
4
1
Origen
70 Estadstica: E. Letn
Propiedades (1/2)
10
7
6
6
6
5
5
5
4
1
Sensible a atpicos?
Medida de apuntamiento
Unidades?
71 Estadstica: E. Letn
Propiedades (2/2)
CAP<0
platicrtica
CAP=0
mesocrtica
CAP>0
leptocrtica
72 Estadstica: E. Letn
Resumen: coeficiente de apuntam.
73 Estadstica: E. Letn
Otros estadsticos
med i
x x Mediana MEDA =
x
s
CV =
s
x
CSR =
74 Estadstica: E. Letn
Resumen: otros estadsticos
75 Estadstica: E. Letn
Histograma
76 Estadstica: E. Letn
Sin acumular
77 Estadstica: E. Letn
Acumulado
78 Estadstica: E. Letn
Simetra
79 Estadstica: E. Letn
Resumen: histograma
80 Estadstica: E. Letn
Polgono de frecuencias
81 Estadstica: E. Letn
Sin acumular
82 Estadstica: E. Letn
Acumulado
83 Estadstica: E. Letn
Resumen: polgono de frecuencias
84 Estadstica: E. Letn
Box-Plot
BOX-PLOT WIKIPEDIA
John Tukey
(1977)
85 Estadstica: E. Letn
Sin datos atpicos
Box-and-Whisker Plot
150 160 170 180 190 200
MB
86 Estadstica: E. Letn
Con datos atpicos
Box-and-Whisker Plot
MB_descargados
120 140 160 180 200
87 Estadstica: E. Letn
Resumen: box-plot
88 Estadstica: E. Letn
UNA VARIABLE CUALITATIVA
UNA V. CUANTI. Y UNA V. CUALI.
DOS VARIABLES CUANTITATIVAS
Tabla de contingencia
Grfico de bloques
DOS VARIABLES CUALITATIVAS
UNA VARIABLE CUANTITATIVA
89 Estadstica: E. Letn
DOS VARIABLES CUALITATIVAS
Estadsticos
vs. Parmetros
Grficos vs.
Grficos poblacionales
2
2
2
2
2
2
1
1
1
1
x1
1
1
1
3
3
2
2
3
2
1
x2
90 Estadstica: E. Letn
Tabla de contingencia
2
2
2
2
2
2
1
1
1
1
x1
1
1
1
3
3
2
2
3
2
1
x2
91 Estadstica: E. Letn
Elementos
92 Estadstica: E. Letn
Notacin
n c
c
c
2
c
1
r
r
n
rc
n
r2
n
r1
Niv r

r
2
n
2c
n
22
n
21
Niv2 Var
2=y
r
1
n
1c
n
12
n
11
Niv1
Cat c Cat 2 Cat1
Var 1=x
93 Estadstica: E. Letn
Independencia (1/2)
( ) ( )
j
ind
i j
y fr x y fr
.
| =
( )
( )
( )
i
i j
i
ji
i j
x fr
x y fr
c
n
x y fr

= = |
( )
j
ind
y fr
.
=
94 Estadstica: E. Letn
Independencia (2/2)
( ) ( ) ( )
i j i j
x fr y fr x y fr =
n
c r
n
n
c
n
r
n
n
i j
ji
i
j ji
= =
95 Estadstica: E. Letn
Resumen: tabla de contingencia
96 Estadstica: E. Letn
Grfico de bloques
97 Estadstica: E. Letn
Resumen: grfico de bloques
98 Estadstica: E. Letn
UNA VARIABLE CUALITATIVA
DOS VARIABLES CUANTITATIVAS
Estadsticos por grupo
Grficos por grupo
UNA V. CUANTI. Y UNA V. CUALI.
UNA VARIABLE CUANTITATIVA
DOS VARIABLES CUALITATIVAS
99 Estadstica: E. Letn
UNA V. CUALI. Y UNA V. CUANTI.
Estadsticos por grupos
Grficos por grupos
2
2
2
2
2
2
1
1
1
1
x1
18
17
15
32
31
21
21
33
21
12
x2
100 Estadstica: E. Letn
Estadsticos por grupo
101 Estadstica: E. Letn
Resumen: estadsticos por grupo
102 Estadstica: E. Letn
Grficos por grupo
1 2 3
Box-and-Whisker Plot
30
40
50
60
70
80
f
i
m
_
i
n
i
sociales
103 Estadstica: E. Letn
Resumen: grficos por grupo
104 Estadstica: E. Letn
UNA VARIABLE CUALITATIVA
DOS VARIABLES CUALITATIVAS
UNA V. CUANTI. Y UNA V. CUALI.
Covarianza, correlacin
Diagrama de dispersin
DOS VARIABLES CUANTITATIVAS
UNA VARIABLE CUANTITATIVA
105 Estadstica: E. Letn
DOS VARIABLES CUANTITATIVAS
5
4
3
1
7
7
5
1
6
2
x
6
7
1
3
13
14
5
1
10
1
y
Pearson
(1857-1936)
Estadsticos
Grficos
106 Estadstica: E. Letn
Covarianza
5
4
3
1
7
7
5
1
6
2
x
6
7
1
3
13
14
5
1
10
1
y
107 Estadstica: E. Letn
Origen (1/2)
( )( ) y y x x
n
s
i
n
i
i xy
=

=1
1
108 Estadstica: E. Letn
Origen (2/2)
( )( ) y y x x
n
s
i
n
i
i xy

=

=1
1
1

109 Estadstica: E. Letn


Propiedades
Medida de variabilidad conjunta
Unidades?
110 Estadstica: E. Letn
Resumen: covarianza
111 Estadstica: E. Letn
Correlacin
5
4
3
1
7
7
5
1
6
2
x
6
7
1
3
13
14
5
1
10
1
y
9 , 0

= = =
y x
xy
y x
xy
s s
s
s s
s
r
% 81
2
= r
112 Estadstica: E. Letn
Propiedades
Medida de variabilidad conjunta
Unidades?
Rango de valores?
=0?
113 Estadstica: E. Letn
Resumen: correlacin
114 Estadstica: E. Letn
Grfico de dispersin
5
4
3
1
7
7
5
1
6
2
x
6
7
1
3
13
14
5
1
10
1
y
115 Estadstica: E. Letn
Tipos (1/2)
116 Estadstica: E. Letn
Tipos (2/2)
4
3
2
1
0
-1
-2
-3
-4
x
16
9
4
1
0
1
4
9
16
y
117 Estadstica: E. Letn
Resumen: grfico de dispersin
118 Estadstica: E. Letn
Causalidad
846 , 0 = r
3
2
2
1
0
7
8
6
2
x
18
20
14
6
7
30
60
20
4
y
119 Estadstica: E. Letn
Resumen: causalidad
120 Estadstica: E. Letn
Webgrafa: web de la asignatura
Software; Prcticas; ABP; Autoevaluacin;
Ejercicios; Mini-Vdeos; CPC; Tutoras; Webgrafa