Академический Документы
Профессиональный Документы
Культура Документы
correlacin
Anlisis de correlacin
10
9
8
7
6
Y
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Correlacin positiva perfecta
10
9
8
7
6
Y
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Correlacin cero
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Correlacin positiva fuerte
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Frmula para r
( X X )(Y Y )
r
(n 1) s x s y
n(XY ) (X )(Y )
n ( X 2
) ( X ) n Y Y
2 2 2
Coeficiente de determinacin
100
90
Price ($)
80
70
60
400 500 600 700 800
Page
Ejemplo 1 (Continuacin)
Libro Pginas Precio ($)
X Y XY X2 Y2
Intr. a la Historia 500 84 42,000 250,000 7,056
lgebra 700 75 52,500 490,000 5,625
Intr. a la Psicologa 800 99 79,200 640,000 9,801
Intr. a la Sociologa 600 72 43,200 360,000 5,184
Mercadotecnia 400 69 27,600 160,000 4,761
Intr. a la Biologa 500 81 40,500 250,000 6,561
Fund. de Jazz 600 63 37,800 360,000 3,969
Intr. a la Enfermera 800 93 74,400 640,000 8,649
Total 4,900 636 397,200 3,150,000 51,606
Ejemplo 1 (Continuacin)
n(XY ) (X )(Y )
r
n ( X 2
) ( X ) n Y Y
2 2
2
8(397,200) (4,900)(636)
8(3,150,000 (4,900) 8(51,606) (636)
2 2
0.614
Ejemplo 1 (Continuacin)
La correlacin entre el nmero de pginas y el precio
de venta del libro es 0.614. Esto indica una asociacin
moderada entre las variables. Pruebe la hiptesis de
que no hay correlacin en la poblacin. Utilice un nivel
de la significancia del .02.
Paso 1: H0: La correlacin en la poblacin es cero.
H1: La correlacin en la poblacin no es cero.
Paso 2: H0 es rechazada si t>3.143 o si t<-3.143.
Hay 6 grados de libertad, encontrados cerca.
n2=82 = 6.
Ejemplo 1 (Continuacin)
Paso 3: Para encontrar el valor del estadstico
de prueba, utilizamos:
r n2 .614 8 2
t 1.905
2 2
1 r 1 (.614)
n( XY ) ( X )( Y )
b
n( X 2 ) ( X ) 2
Y X
a b
n n
Ejemplo 2 (Continuacin)
8(397,200) (4,900)(636)
b 2
.05143
8(3,150,000) (4,900)
636 4,900
a 0.05143 48.0
8 8
Ejemplo 2 (Continuacin)
Y 48.0 0.05143 X
48.0 0.05143(800) 89.14
El error estndar de estimacin
Y 2 aY bXY
s y. x
n2
51,606 48(636) 0.05143(397,200)
82
10.408
Suposiciones subyacentes en el
anlisis de regresin lineal
Para cada valor de X, hay un grupo de valores de Y, y
estos valores de Y se distribuyen normalmente.
Las medias de estas distribuciones normales de valores
Y, caen todas en la recta de regresin.
Las desviaciones estndar de estas distribuciones
normales son iguales.
Los valores de Y son estadsticamente
independendientes. Esto significa que en la seleccin de
una muestra, los valores de Y elegidos para un valor
particular de X no dependen de los valores de Y de
ningn otro valor de X.
Intervalo de confianza
1 ( X X )2
Y ts y. x 2
n ( X )
X 2
n
1 (800 612.5) 2
89.14 2.447(10.408)
8 (4900) 2
3,150,000
8
89.14 15.31
Intervalo de prediccin
1 ( X X )2
Y ts y. x 1
n 2 ( X ) 2
X
n
1 (800 612.5) 2
89.14 2.447(10.408) 1
8 (4900) 2
3,150,000
8
89.14 29.72
Ejemplo 3 (Continuacin)
Analysis of Variance
Source DF SS MS F P
Regression 1 393.4 393.4 3.63 0.105
Residual Error 6 650.6 108.4
Total 7 1044.0