Академический Документы
Профессиональный Документы
Культура Документы
Capítulo 2
Análisis de datos (Bivariados
(Bivariados))
Estadística Computacional
I Semestre 2006
Parte II
Profesores:
Carlos Valle (cvalle@inf.utfsm.cl)
Página: www.inf.utfsm.cl/~cvalle
Estadística Bivariada
Profesor C.Valle 2
1
Universidad Técnica Federico Santa María
Tabla de Contingencia
Profesor C.Valle
n _
=n 3
Tabla de Contingencia
Profesor C.Valle
f =_ 1 4
2
Universidad Técnica Federico Santa María
Tabla de Contingencia
ni• = ∑ nij
Frecuencia Absoluta de la clase Ai; para i= 1, ,2, ... ,r
(Independiente de la clases Bj a la que estén asociadas
Suma de los valores de la fila i-ésima )
j =1
r
n• j = ∑ nij Frecuencia Absoluta de la clase Bj; para j= 1, ,2, ... ,s
(Independiente de las clases Ai a la que estén asociadas.
i =1 Suma de los valores de la columna j-ésima)
Profesor C.Valle 5
Frecuencias Marginales
Profesor C.Valle 6
3
Universidad Técnica Federico Santa María
Estadística Bivariada
Notación: Sean
fi =
i ∑fj
ij = frec relativa marginal = ∑ f (x , y ) = f (x )
j
r i j r i
f j=
i ∑fi
ij = frec. relativa marginal = ∑ f (x , y ) = f ( y )
i
r i j r j
fij fr ( xi , y j )
fi/j = = frec. relativa condicional=fr ( xi / yj) =
f• j fr ( y j )
Profesor C.Valle 7
Tabla de Contingencia
Para frecuencias
s
relativas , i = 1,....,r se tiene:
f i • = ∑ f ij (Suma de los valores de la fila i-ésima
j =1 de la tabla de frecuencias conjuntas)
r
f • j = ∑ f ij (Suma de los valores de la columna j-ésima
i =1 de la tabla de frecuencias conjuntas)
n n• j fij n
fi• = i• f• j = fi/j = = ij
n•• n•• f• j n• j
Profesor C.Valle 8
4
Universidad Técnica Federico Santa María
Tabla de Contingencia
Ejemplo
Una tela se clasifica en tres categorías A, B y C según cantidad y
severidad de pequeñas imperfecciones. La empresa tiene 5
telares, en un mes dado de producción se registraron los
siguientes datos.
Frecuencia Condicional
Profesor C.Valle 10
5
Universidad Técnica Federico Santa María
Independencia Estadística
n n n n n + n + n +.... + n n
i1
n• 1 = n• 2 = n• 3
i2 i3
=.... = n• S
is
n• 1+ n• 2 + n• 3 +.... + n•iss = n ••i•
i1 i2 i3
= f i•
Estadística Bivariada
Notación:
Análogamente, se tiene:
6
Universidad Técnica Federico Santa María
Estadística Bivariada
Independencia Estadística
Asociación de Variables
1
Datos no agrupados Cov (x,y) =
n
∑ ( xi − x)( yi − y)
Datos agrupados : Cov(x,y) = ∑ fi ( xi − x)( yi − y )
Coeficiente de Correlación = r = Cov (x,y)
Sx Sy
Profesor C.Valle 13
Ejercicio
Fallas Anuales
Temperatura 120 140 160 Marginal
Averías
2 20 15 10 45
3 12 7 5 24
4 4 10 2 16
5 - 5 10 15
Marginal 36 37 27 100
Obtener :
Distribuciones marginales
Distribuciones condicionales (4 averías), Media
y Varianza condicional
Profesor C.Valle 14
7
Universidad Técnica Federico Santa María
Ejercicio
Fallas Anuales
Temperatura 120 140 160 Marginal
Averías
2 0,20 0,15 0,10 0,45
3 0,12 0,07 0,05 0,24
4 0,04 0,10 0,02 0,16
5 0 0,05 0,10 0,15
Marginal 0,36 0,37 0,27 1,00
fj/4 ={ 2/8; 5/8; 1/8} Xj/4 =137,5
8
Universidad Técnica Federico Santa María
n n
min ∑ ei = min ∑ ( yi − β 0 − β1 xi ) 2
2
β 0 β1 β 0 β1
i =1 i =1
n
SC E = ∑ ei
2
i =1
SC xy
β̂1 = βˆ 0 = y − βˆ1 x
SC x
n n
SC x = ∑ ( xi − x ) 2
SC xy = ∑ ( xi − x )( yi − y )
i =1 i =1
n
VNE = ∑ ei
2
=1
Profesor iC.Valle 17
Curvas de Regresión
t 0 1 2 3 4 5 6
V(t) 30 60 46 32 10 4 17
20 40 26 14 8
20 12
V(t) 25 40 46 29 12 6 17
Luego y(t) = a + b xt + εt
9
Universidad Técnica Federico Santa María
cov( x, y )
aˆ = y − bˆ x = 25,3 bˆ = 2
= 20
Sx
2
S y = 1276 ∑( y t − yˆ t ) 2 = 22,45
∑ eˆ
2
t
1− 2
= 0,98 ∗100% = 98%
Sy
Profesor C.Valle 19
Transformaciones
10
Universidad Técnica Federico Santa María
E1 m
E2 n1 V
1 ∑n
h =1
h =n
n2 V2 X1
Em nh
nm ph =
X2 Vm n
Xm m- estratos
Profesor C.Valle 22
11
Universidad Técnica Federico Santa María
k k
n
fih = ih
nh ∑f
i =1
ih =1 ∑n
i =1
ih = nh
k k
X h = ∑ fih X i Vh = ∑ fih ( X i − X h ) 2
i =1 i =1
m
fi = ∑ phfih
h =1
Profesor C.Valle 23
Entonces: m
X = ∑ ph X n
h =1
m m
VT = ∑ phVh + ∑ ph ( X h − X ) 2
h =1 h =1
VT = Vint ra + Vint er
Profesor C.Valle 24
12
Universidad Técnica Federico Santa María
Ejemplo
Se tiene 3 criaderos de aves. En el criadero (1) se ponen 50
pollos recién nacidos; en el (2) 200 pollos y en el (3) 100 pollos.
Al cabo de un cierto tiempo se pesan los 350 pollos,
encontrándose que algunos están muertos y los vivos pesan
entre 1,00 [kg]. y 2,50 [kg]. Para los efectos del registro los pollos
muertos se supondrán de peso cero, y el cero actuará como
centro del supuesto intervalo. Los otros intervalos serán
[1,00 ; 1,50]] [1,50 ; 2,00]] [2,00 ; 2,50]].
Frecuencia
Relativa
Histograma Apilado por Peso
0,7
0,6
0,5
Criadero 1
0,4
Criadero 2
0,3 Criadero 3
0,2
0,1
0 Peso
13
Universidad Técnica Federico Santa María
0,4
0,3 Criadero 1
Criadero 2
0,2 Criadero 3
0,1
Peso
0
0 1,25 1,75 2,25
14
Universidad Técnica Federico Santa María
Profesor C.Valle 29
Resultados
Se ha obtenido, entonces:
Media Total
X = 1,589
Varianza promedio dentro de los estratos
Vintra= 0,253
Varianza entre estratos
Vinter= 0,0073
Varianza Total
VT= 0,2606
Profesor C.Valle 30
15