Вы находитесь на странице: 1из 15

Universidad Tcnica Federico Santa Mara

Universidad Tcnica Federico Santa Mara


Departamento de Informtica
ILI-280

Captulo 2
Anlisis de datos (Bivariados
(Bivariados))
Estadstica Computacional
I Semestre 2006
Parte II
Profesores:
Carlos Valle (cvalle@inf.utfsm.cl)
Pgina:
www.inf.utfsm.cl/~cvalle

Estadstica Bivariada
 Supongamos que se toma una muestra de tamao n
de una poblacin y que se desea estudiar, dos
caractersticas de un mismo objeto .
 Sean estas caractersticas X e Y. Siguiendo los
procedimientos habituales, la Muestra se divide en
 r clases Ai para la variable X
 s clases Bj para la variables Y

 Existirn elementos que pertenecern simultneamente a AiBj. Los datos los podemos ordenar en
una tabla o matriz llamada Tabla de Contingencia
Profesor C.Valle

Universidad Tcnica Federico Santa Mara

Tabla de Contingencia
Y

B1

B2

.....

Bj

.....

Bs

Total

A1

n11

n12

.....

n1j

.....

n1s

n1

A2

n21

n22

.....

n2j

.....

n2s

n2

Ai

ni1

ni2

.....

nij

.....

nis

n i

Ar

nr1

nr2

.....

nrj

.....

nrs

nr

Total

n1

n2

.....

nj

.....

ns

n 

Profesor C.Valle

n  _
=n

Tabla de Contingencia
Y

B1

B2

.....

Bj

.....

Bs

Total

A1

f11

f12

.....

f1j

.....

f1s

f1

A2

f21

f22

.....

f2j

.....

f2s

f2

Ai

fi1

fi2

.....

fij

.....

fis

f i

Ar

fr1

fr2

.....

frj

.....

frs

fr

Total

f1

f2

.....

fj

.....

fs

f 

Profesor C.Valle

f  =_ 1

Universidad Tcnica Federico Santa Mara

Tabla de Contingencia

nij =

Frecuencia Absoluta de la clase conjunta AiBj.


(Valor observado en la celda (i,j) de la Tabla de Contingencia)

fij = nij
n

Frecuencia Relativa

conjunta de la clase
conjunta correspondiente a
la interseccin de Ai y Bj.

ij

=1

i =1 j =1

ni = nij
j =1

Frecuencia Absoluta de la clase Ai; para i= 1, ,2, ... ,r


(Independiente de la clases Bj a la que estn asociadas
Suma de los valores de la fila i-sima )

n j = nij
i =1

Frecuencia Absoluta de la clase Bj; para j= 1, ,2, ... ,s


(Independiente de las clases Ai a la que estn asociadas.
Suma de los valores de la columna j-sima)
Profesor C.Valle

Frecuencias Marginales
Dado el experimento anterior, cuando slo interesa conocer la
frecuencia de ocurrencia de cada una de las variables por separado
se habla de Frecuencia Marginal de la variable X o Y
Frecuencia (relativa) marginal de la variable X,
Conjunto de valores pertenecientes a la clase Ai,
considerndola independientemente de la clase Bj

Frecuencia (relativa) marginal de la variable Y,


Conjunto de valores pertenecientes a la clase Bj,
considerndola independientemente de la clase Ai

Profesor C.Valle

Universidad Tcnica Federico Santa Mara

Estadstica Bivariada
Notacin: Sean
fij := frecuencia relativa conjunta AiBj = fr(xi,yj)
fi =
i

ij

f (x , y ) = f (x )

= frec relativa marginal =

f j=
i

ij

f (x , y ) = f ( y )

= frec. relativa marginal =

fi/j =

fij
f j

= frec. relativa condicional=fr ( xi

/ yj) =

fr ( xi , y j )
fr ( y j )

Profesor C.Valle

Tabla de Contingencia
Para frecuencias
relativas , i = 1,....,r se tiene:
s

f i = f ij
j =1
r

f j = f ij
i =1

(Suma de los valores de la fila i-sima


de la tabla de frecuencias conjuntas)
(Suma de los valores de la columna j-sima
de la tabla de frecuencias conjuntas)

Adems se verifica que:

n
fi = i
n

f j =

n j
n

Profesor C.Valle

fi/j =

n
fij
= ij
f j n j
8

Universidad Tcnica Federico Santa Mara

Tabla de Contingencia
Ejemplo
Una tela se clasifica en tres categoras A, B y C segn cantidad y
severidad de pequeas imperfecciones. La empresa tiene 5
telares, en un mes dado de produccin se registraron los
siguientes datos.
# piezas de tela en la clasificacin
A
B
C

Telar
1
2
3
4
5
Marginal

185
190
170
158
185
888

16
24
35
22
22
119

12
21
16
7
15
71

Marginal
213
235
221
187
222
1078

Profesor C.Valle

Frecuencia Condicional
Cuando se pregunta por la frecuencia relativa de una de las variables,
digamos X, restringida a los elementos observados de la clase Bj segn
Y; esto es, estudiar el comportamiento de una variable dado un valor fijo
de la otra. Se obtiene la frecuencia relativa condicional

fi/j =

fij
f j

nij
=n

f ,f ,f
1/j

2/j

Frecuencia (relativa) de la variable X en la


clase conjunta AiBj, dado que slo nos
interesa respecto a lo observado en la clase Bj
de la variable Y; para i = 1, 2, .., r

3/j, ... ,

r/j

Constituye la distribucin de frecuencia relativa


condicional de la variable X dada la clase Bj de
la variable Y.
Ntese que se trabaja condicionado sobre un
tamao de muestra reducido al nmero de
observaciones de la clase Bj dada
Profesor C.Valle

10

Universidad Tcnica Federico Santa Mara

Independencia Estadstica
Se dice que X es independiente de Y si las frecuencias
condicionales de X/Y son todas iguales; es decir, no
dependen de la clase condicionante, esto es
i/1

i1

f
n

i/2

i2

i/3

i3

n 1 = n 2 = n 3
Luego 

Como 

= .... =

=.... =

fi/j = fi
fij
fi/j =
f j

is

n S

i/s

i = 1, 2, 3, ... , r

+
i1

+
i2

i3

+.... + n

 n 1+ n 2 + n 3 +.... + niss = n i

f = f j

similarmente  j/i

f = fi/j fj

 ij

fij = fi f j

Profesor C.Valle

11

Estadstica Bivariada
Notacin:
Anlogamente, se tiene:
fj/i =

fij
fi

= frecuencia condicional = f

r ( y j / xi ) =

fr ( xi , y j )
fr ( xi )

Independencia Estadstica
X e Y son variables estadsticamente independientes ssi:

fr ( y j / xi ) = fr ( y j )

fi/j = fi

fr ( xi / y y ) = fr ( xi )

fj/i = f j

Profesor C.Valle

12

Universidad Tcnica Federico Santa Mara

Estadstica Bivariada
Independencia Estadstica
como

fij = fj/i fi

fij = f j fi

Asociacin de Variables
Datos no agrupados Cov (x,y) =
Datos agrupados :

Cov(x,y) =

1
( xi x)( yi y)
n
fi ( xi x)( yi y )

Coeficiente de Correlacin = r = Cov (x,y)


Sx Sy
Profesor C.Valle

13

Ejercicio
Fallas Anuales
Temperatura

120

140

160

Marginal

20
12
4
-

15
7
10
5

10
5
2
10

45
24
16
15

37

27

100

Averas

2
3
4
5
Marginal

36

Obtener :
Distribuciones marginales
Distribuciones condicionales (4 averas), Media
y Varianza condicional
Profesor C.Valle

14

Universidad Tcnica Federico Santa Mara

Ejercicio
Fallas Anuales
Temperatura

120

140

160

Marginal

0,20
0,12
0,04
0

0,15
0,07
0,10
0,05

0,10
0,05
0,02
0,10

0,45
0,24
0,16
0,15

0,36

0,37

0,27

1,00

Averas

2
3
4
5
Marginal

fj/4 ={ 2/8; 5/8; 1/8} Xj/4 =137,5


Vj/4= 2/8(120-137,5)2 +5/8(140-137,5)2
+1//8(160-137,5)2 =
Profesor C.Valle

15

Modelo Estadstico (Lineal)


y = 0 + 1x +

x , y son variables independiente y dependiente


respectivamente. Adems una variable estadstica
que representa el error.
Los parmetros 0 y 1 pueden ser estimados a
partir de los datos {(xi , yi)}i=1,...,n mediante mtodo de
mnimos cuadrados.
Sea ;

ei = yi y i = yi 0 1 xi
Entonces
Profesor C.Valle

16

Universidad Tcnica Federico Santa Mara

min ei = min ( yi 0 1 xi ) 2
0 1

0 1

i =1

i =1
n

SC E = ei

i =1

1 =

SC xy

0 = y 1 x

SC x

SC x = ( xi x )

SC xy = ( xi x )( yi y )

i =1

i =1
n

VNE = ei

=1
Profesor iC.Valle

17

Curvas de Regresin
t

V(t)

30
20

60
40
20

46

32
26

10
14
12

4
8

17

V(t)

25

40

46

29

12

17

Sea xt = sen t
Luego

yt = V(t)

y(t) = a + b xt + t

min Q( a, b) = min ( yt a bxt ) 2


a ,b

a ,b

Profesor C.Valle

18

Universidad Tcnica Federico Santa Mara

cov( x, y )
b =
= 20
2
Sx

a = y b x = 25,3

( y

S y = 1276

y t ) 2 = 22,45

% de Ajuste del Modelo =

e
1
Sy

t
2

= 0,98 100% = 98%

Profesor C.Valle

19

Transformaciones
Sea yi = h ( xi )

con

i = 1,...,n

1. Lineales

yi = axi + b
y = ax + b
Sy = a Sx

2. No lineales

yi = h( xi )
1

y = h(x) + 2 h(x) SX2


Sy2 Sx2 [ h (x)]]2
En particular
h(x) = ln x

y = ln x - 2 ( Sx2 / x2 )
Sy2 ( Sx2 / x2 ) = CV 2
Profesor C.Valle

20

10

Universidad Tcnica Federico Santa Mara

Universidad Tcnica Federico Santa Mara


Departamento de Informtica
ILI-280

Anlisis de una Bivariada


como muestra estratificada

Anlisis de una muestra estratificada


E1
n1 V
1

E2
n2 V2

X2

h =1

X1
nm

Xm

=n

Em

ph =

Vm

nh
n

m- estratos

Supongamos que la variable admite una clasificacin


en k
- clases, representadas por X1, X2,.....Xk.
Profesor C.Valle

22

11

Universidad Tcnica Federico Santa Mara

Anlisis de una muestra estratificada


nih = Cantidad de individuos de la submuestra del
estrato h que pertenece a Ci.
k

n
fih = ih
nh

ih

=1

ih

i =1

= nh

i =1
k

Vh = fih ( X i X h ) 2

X h = fih X i

i =1

i =1
m

fi = phfih
h =1
Profesor C.Valle

23

Anlisis de una muestra estratificada


Entonces:

X = ph X n
h =1
m

h =1

h =1

VT = phVh + ph ( X h X ) 2
VT = Vint ra + Vint er
Profesor C.Valle

24

12

Universidad Tcnica Federico Santa Mara

Ejemplo
Se tiene 3 criaderos de aves. En el criadero (1) se ponen 50
pollos recin nacidos; en el (2) 200 pollos y en el (3) 100 pollos.
Al cabo de un cierto tiempo se pesan los 350 pollos,
encontrndose que algunos estn muertos y los vivos pesan
entre 1,00 [kg]. y 2,50 [kg]. Para los efectos del registro los pollos
muertos se supondrn de peso cero, y el cero actuar como
centro del supuesto intervalo. Los otros intervalos sern
[1,00 ; 1,50]] [1,50 ; 2,00]] [2,00 ; 2,50]].

Calcular

Centros Frecuencias Absolutas


(1)
(2)
(3)
0
5
10
10
1,25
10
20
30
1,75
30
150
50
2,25
5
20
10

X h , Vh , X , VT
Vint er , Vint ra
Note que existen 3
estratos y 4 clases

Profesor C.Valle

25

Anlisis Muestra Estratificada


Frecuencia
Relativa

Histograma Apilado por Peso

0,7
0,6
0,5
Criadero 1

0,4

Criadero 2

0,3

Criadero 3

0,2
0,1
Peso

0
0

1,25
1,00

1,75
1,50
Profesor C.Valle

2,25
2,00

2,50
26

13

Universidad Tcnica Federico Santa Mara

Anlisis Muestra Estratificada


Frecuencia
Relativa

Histograma por Estrato y por Peso

0,5
0,4
0,3

Criadero 1
Criadero 2

0,2

Criadero 3

0,1
Peso

0
0

1,25

1,75

1,00

1,50

2,25
2,00

2,50

Profesor C.Valle

Estrato (1)

P1=1/7

Xi

fi1

fi1X1

Xi-X1

0
1,25
1,75
2,25

0,1
0,2
0,6
0,1

0
0,250
1,050
0,225

-1,525
-0,275
0,225
0,725

Estrato (2)

0
1,25
1,75
2,25

( )2

fi1( )2

2,325
0,0756
0,0501
0,525

0,2325
0,0151
0,0304
0,0526

X1=1,525
V1=0,331

P2=4/7

fi2

fi2X1

Xi-X2

( )2

fi2( )2

0,05
0,10
0,75
0,10

0
0,125
1,312
0,225

-1,662
-0,412
0,088
0,588

2,76
0,17
0, 01
0,35

0,138
0,017
0,006
0,035

Estrato (3)

0
1,25
1,75
2,25

27

X2=1,662
V2=0,195

P3=2/7

fi3

fi3X1

0,10
0,30
0,50
0,10

0
0,375
0,875
0,225

Xi-X3

( )2

fi3( )2

-1,475
2,17
0,218
-0,225
0,05
0,015
0,275
0, 08
0,039
Profesor C.Valle
0,775
0,60
0,060

X3=1,475
V3=0,331

28

14

Universidad Tcnica Federico Santa Mara

Estratos Ph
(1)
(2)
(3)

1/7
4/7
2/7

Media Varianza PhXh


Xh
Vh
1,525
1,662
1,475

0,331
0,195
0,331

0,218
0,950
0,421
1,589

PhVh

Xh-X

0,047
0,111
0,095
0,253

-0,064
0,073
-0,114

(X-Xh)2 Ph( )2
0,004
0,005
0,013

0,00058
0,00305
0,00371
0,0073

Profesor C.Valle

29

Resultados
Se ha obtenido, entonces:
 Media Total
 X = 1,589

 Varianza promedio dentro de los estratos


 Vintra= 0,253

 Varianza entre estratos


 Vinter= 0,0073

 Varianza Total
 VT= 0,2606
Profesor C.Valle

30

15

Вам также может понравиться