Академический Документы
Профессиональный Документы
Культура Документы
Captulo 2
Anlisis de datos (Bivariados
(Bivariados))
Estadstica Computacional
I Semestre 2006
Parte II
Profesores:
Carlos Valle (cvalle@inf.utfsm.cl)
Pgina:
www.inf.utfsm.cl/~cvalle
Estadstica Bivariada
Supongamos que se toma una muestra de tamao n
de una poblacin y que se desea estudiar, dos
caractersticas de un mismo objeto .
Sean estas caractersticas X e Y. Siguiendo los
procedimientos habituales, la Muestra se divide en
r clases Ai para la variable X
s clases Bj para la variables Y
Existirn elementos que pertenecern simultneamente a AiBj. Los datos los podemos ordenar en
una tabla o matriz llamada Tabla de Contingencia
Profesor C.Valle
Tabla de Contingencia
Y
B1
B2
.....
Bj
.....
Bs
Total
A1
n11
n12
.....
n1j
.....
n1s
n1
A2
n21
n22
.....
n2j
.....
n2s
n2
Ai
ni1
ni2
.....
nij
.....
nis
n i
Ar
nr1
nr2
.....
nrj
.....
nrs
nr
Total
n1
n2
.....
nj
.....
ns
n
Profesor C.Valle
n _
=n
Tabla de Contingencia
Y
B1
B2
.....
Bj
.....
Bs
Total
A1
f11
f12
.....
f1j
.....
f1s
f1
A2
f21
f22
.....
f2j
.....
f2s
f2
Ai
fi1
fi2
.....
fij
.....
fis
f i
Ar
fr1
fr2
.....
frj
.....
frs
fr
Total
f1
f2
.....
fj
.....
fs
f
Profesor C.Valle
f =_ 1
Tabla de Contingencia
nij =
fij = nij
n
Frecuencia Relativa
conjunta de la clase
conjunta correspondiente a
la interseccin de Ai y Bj.
ij
=1
i =1 j =1
ni = nij
j =1
n j = nij
i =1
Frecuencias Marginales
Dado el experimento anterior, cuando slo interesa conocer la
frecuencia de ocurrencia de cada una de las variables por separado
se habla de Frecuencia Marginal de la variable X o Y
Frecuencia (relativa) marginal de la variable X,
Conjunto de valores pertenecientes a la clase Ai,
considerndola independientemente de la clase Bj
Profesor C.Valle
Estadstica Bivariada
Notacin: Sean
fij := frecuencia relativa conjunta AiBj = fr(xi,yj)
fi =
i
ij
f (x , y ) = f (x )
f j=
i
ij
f (x , y ) = f ( y )
fi/j =
fij
f j
/ yj) =
fr ( xi , y j )
fr ( y j )
Profesor C.Valle
Tabla de Contingencia
Para frecuencias
relativas , i = 1,....,r se tiene:
s
f i = f ij
j =1
r
f j = f ij
i =1
n
fi = i
n
f j =
n j
n
Profesor C.Valle
fi/j =
n
fij
= ij
f j n j
8
Tabla de Contingencia
Ejemplo
Una tela se clasifica en tres categoras A, B y C segn cantidad y
severidad de pequeas imperfecciones. La empresa tiene 5
telares, en un mes dado de produccin se registraron los
siguientes datos.
# piezas de tela en la clasificacin
A
B
C
Telar
1
2
3
4
5
Marginal
185
190
170
158
185
888
16
24
35
22
22
119
12
21
16
7
15
71
Marginal
213
235
221
187
222
1078
Profesor C.Valle
Frecuencia Condicional
Cuando se pregunta por la frecuencia relativa de una de las variables,
digamos X, restringida a los elementos observados de la clase Bj segn
Y; esto es, estudiar el comportamiento de una variable dado un valor fijo
de la otra. Se obtiene la frecuencia relativa condicional
fi/j =
fij
f j
nij
=n
f ,f ,f
1/j
2/j
3/j, ... ,
r/j
10
Independencia Estadstica
Se dice que X es independiente de Y si las frecuencias
condicionales de X/Y son todas iguales; es decir, no
dependen de la clase condicionante, esto es
i/1
i1
f
n
i/2
i2
i/3
i3
n 1 = n 2 = n 3
Luego
Como
= .... =
=.... =
fi/j = fi
fij
fi/j =
f j
is
n S
i/s
i = 1, 2, 3, ... , r
+
i1
+
i2
i3
+.... + n
n 1+ n 2 + n 3 +.... + niss = n i
f = f j
similarmente j/i
f = fi/j fj
ij
fij = fi f j
Profesor C.Valle
11
Estadstica Bivariada
Notacin:
Anlogamente, se tiene:
fj/i =
fij
fi
= frecuencia condicional = f
r ( y j / xi ) =
fr ( xi , y j )
fr ( xi )
Independencia Estadstica
X e Y son variables estadsticamente independientes ssi:
fr ( y j / xi ) = fr ( y j )
fi/j = fi
fr ( xi / y y ) = fr ( xi )
fj/i = f j
Profesor C.Valle
12
Estadstica Bivariada
Independencia Estadstica
como
fij = fj/i fi
fij = f j fi
Asociacin de Variables
Datos no agrupados Cov (x,y) =
Datos agrupados :
Cov(x,y) =
1
( xi x)( yi y)
n
fi ( xi x)( yi y )
13
Ejercicio
Fallas Anuales
Temperatura
120
140
160
Marginal
20
12
4
-
15
7
10
5
10
5
2
10
45
24
16
15
37
27
100
Averas
2
3
4
5
Marginal
36
Obtener :
Distribuciones marginales
Distribuciones condicionales (4 averas), Media
y Varianza condicional
Profesor C.Valle
14
Ejercicio
Fallas Anuales
Temperatura
120
140
160
Marginal
0,20
0,12
0,04
0
0,15
0,07
0,10
0,05
0,10
0,05
0,02
0,10
0,45
0,24
0,16
0,15
0,36
0,37
0,27
1,00
Averas
2
3
4
5
Marginal
15
ei = yi y i = yi 0 1 xi
Entonces
Profesor C.Valle
16
min ei = min ( yi 0 1 xi ) 2
0 1
0 1
i =1
i =1
n
SC E = ei
i =1
1 =
SC xy
0 = y 1 x
SC x
SC x = ( xi x )
SC xy = ( xi x )( yi y )
i =1
i =1
n
VNE = ei
=1
Profesor iC.Valle
17
Curvas de Regresin
t
V(t)
30
20
60
40
20
46
32
26
10
14
12
4
8
17
V(t)
25
40
46
29
12
17
Sea xt = sen t
Luego
yt = V(t)
y(t) = a + b xt + t
a ,b
Profesor C.Valle
18
cov( x, y )
b =
= 20
2
Sx
a = y b x = 25,3
( y
S y = 1276
y t ) 2 = 22,45
e
1
Sy
t
2
Profesor C.Valle
19
Transformaciones
Sea yi = h ( xi )
con
i = 1,...,n
1. Lineales
yi = axi + b
y = ax + b
Sy = a Sx
2. No lineales
yi = h( xi )
1
y = ln x - 2 ( Sx2 / x2 )
Sy2 ( Sx2 / x2 ) = CV 2
Profesor C.Valle
20
10
E2
n2 V2
X2
h =1
X1
nm
Xm
=n
Em
ph =
Vm
nh
n
m- estratos
22
11
n
fih = ih
nh
ih
=1
ih
i =1
= nh
i =1
k
Vh = fih ( X i X h ) 2
X h = fih X i
i =1
i =1
m
fi = phfih
h =1
Profesor C.Valle
23
X = ph X n
h =1
m
h =1
h =1
VT = phVh + ph ( X h X ) 2
VT = Vint ra + Vint er
Profesor C.Valle
24
12
Ejemplo
Se tiene 3 criaderos de aves. En el criadero (1) se ponen 50
pollos recin nacidos; en el (2) 200 pollos y en el (3) 100 pollos.
Al cabo de un cierto tiempo se pesan los 350 pollos,
encontrndose que algunos estn muertos y los vivos pesan
entre 1,00 [kg]. y 2,50 [kg]. Para los efectos del registro los pollos
muertos se supondrn de peso cero, y el cero actuar como
centro del supuesto intervalo. Los otros intervalos sern
[1,00 ; 1,50]] [1,50 ; 2,00]] [2,00 ; 2,50]].
Calcular
X h , Vh , X , VT
Vint er , Vint ra
Note que existen 3
estratos y 4 clases
Profesor C.Valle
25
0,7
0,6
0,5
Criadero 1
0,4
Criadero 2
0,3
Criadero 3
0,2
0,1
Peso
0
0
1,25
1,00
1,75
1,50
Profesor C.Valle
2,25
2,00
2,50
26
13
0,5
0,4
0,3
Criadero 1
Criadero 2
0,2
Criadero 3
0,1
Peso
0
0
1,25
1,75
1,00
1,50
2,25
2,00
2,50
Profesor C.Valle
Estrato (1)
P1=1/7
Xi
fi1
fi1X1
Xi-X1
0
1,25
1,75
2,25
0,1
0,2
0,6
0,1
0
0,250
1,050
0,225
-1,525
-0,275
0,225
0,725
Estrato (2)
0
1,25
1,75
2,25
( )2
fi1( )2
2,325
0,0756
0,0501
0,525
0,2325
0,0151
0,0304
0,0526
X1=1,525
V1=0,331
P2=4/7
fi2
fi2X1
Xi-X2
( )2
fi2( )2
0,05
0,10
0,75
0,10
0
0,125
1,312
0,225
-1,662
-0,412
0,088
0,588
2,76
0,17
0, 01
0,35
0,138
0,017
0,006
0,035
Estrato (3)
0
1,25
1,75
2,25
27
X2=1,662
V2=0,195
P3=2/7
fi3
fi3X1
0,10
0,30
0,50
0,10
0
0,375
0,875
0,225
Xi-X3
( )2
fi3( )2
-1,475
2,17
0,218
-0,225
0,05
0,015
0,275
0, 08
0,039
Profesor C.Valle
0,775
0,60
0,060
X3=1,475
V3=0,331
28
14
Estratos Ph
(1)
(2)
(3)
1/7
4/7
2/7
0,331
0,195
0,331
0,218
0,950
0,421
1,589
PhVh
Xh-X
0,047
0,111
0,095
0,253
-0,064
0,073
-0,114
(X-Xh)2 Ph( )2
0,004
0,005
0,013
0,00058
0,00305
0,00371
0,0073
Profesor C.Valle
29
Resultados
Se ha obtenido, entonces:
Media Total
X = 1,589
Varianza Total
VT= 0,2606
Profesor C.Valle
30
15