Вы находитесь на странице: 1из 6

Repaso Minera de Datos Construir un modelo r RLM para la prediccion del salario inicial a partir del nivel educativo

y la experiencia previa empleando el mtodo forward con =0.05. Obtener e interpretar: rx,y, rx2,y,, DW (Durving Watson)INDEPENDENCIA, R2 Corregido, tablas de ANOVA y coeficientes (pruebas t), tolerancia, pruebas
de normalidad y K-S (komodoro Smirnof), pruebas de Homoscedasticidad.

CORRIDA BSICA: (Regresin lineal mltiple)

1)

Identificar la ecuacin del modelo


X1= Nivel Educativo X2= Experiencia Previa Se toma de la tabla coeficientes, y es el segundo resultado que nos arroja: ECUACIN: Y= 1878.21X1 + 16.4X2 - 69902.78

2)

Identificar la ecuacin del modelo


El nivel educativo se da en grados y la experiencia se da en aos, por eso es necesario utilizar los estadarizados: Aqu se ve realmente cuanto influyen las variables en la variable, quita el efecto de las escalas. Y= 0.688(X1) + 0.219(X2)

3)

Rx1y Rx2Y
Correlaciones Experiencia Salario inicial Nivel educativo .633 1.000 -.252 .000 . .000 474 474 474 previa (meses) .045 -.252 1.000 .163 .000 . 474 474 474

Correlacin de Pearson

Salario inicial Nivel educativo Experiencia previa (meses)

1.000 .633 .045 . .000 .163 474 474 474

Sig. (unilateral)

Salario inicial Nivel educativo Experiencia previa (meses)

Salario inicial Nivel educativo Experiencia previa (meses)

Rx1y: Como se relaciona X1 con Y pensando que la otra variable no existiera. Aqu es .63, esta
directamente relacionado (algo alto), ya que el rango es de -1 a 1, positivo es directamente relacionado. RELACION ALTA DIRECTA.

Rx2y: Como se relaciona X2 con Y pensando que la otra variable no existiera. Aqu es .045, esta
directamente relacionado (muy bajo), ya que el rango es de -1 a 1, positivo es directamente relacionado. RELACION BAJA DIRECTA.

4)

R2 corregido (Se usa este porque es mltiple, en el simple se utiliza ajustado)

R2 corregido = 0.443 44.3% del modelo es explicado (No es un buen modelo).

5)

DW (Durbin Watson)

Independencia Verificar independencia: que el coeficiente durbin Watson sea mayor o igual que 1.5 pero menor o igual que 2.5. En este caso fue 1.998, por lo que S cumple la Independencia.

6)

Tabla de ANOVA

Linealidad
El modelo se supone que se construy bajo el supuesto de Linealidad, pero, en realidad ser lineal? Esto explica la variacin del modelo con la residual. Ho: y<> 1x + o (El modelo no es lineal) sig=.000 <= Con esto podemos ver que se rechaza Ho, es decir, el modelo S Es lineal.

7)

Pruebas T (Si las Betas correspondientes sean 0 contra que no sean 0)


Beta Cero (Donde dice constante): valor p= 0.000. Se rechaza Ho .: El valor si es importante. Beta 1 (nivel Educativo): valor p=0.000. Se rechaza Ho .: El valor si es importante. Beta 2 (Experiencia previa): valor p = 0.000. Se rechaza Ho .: El valor si es importante.

Ho: 0=0 (1 es la ordenada al origen) Ho: 0<>0 (Como el sig fue .000, quiere decir que se r rechaza Ho, que quiere decir que no pasa por el origen)

Nuestro modelo si pasa la linealidad.

8)

Tolerancias
Se checa que la relacion entre las X no sea muy grande, porque si fuera muy grande, no seran independientes.

No colinealidad Comprobar que las X, aunque se supone que son independientes, tienen cierto grado de relacin. Buscamos que dicha relacin sea pequea, porque si estn muy relacionadas podemos quitar una de ellas del modelo. Valor: Tolerancia: grado de informacin no compartida entre las variables. Ve de Cero a 1, con que sea >.5 es vlida

Las tolerancias debern ser mayor a .5. En este caso fueron .936, por lo que se cumple el supuesto, eso quiere decir que hay un grado de independencia adecuado entre X1 y X2. El grado de informacin compartida entre ambas es .064, que es lo que tienen en comn las variables es poco.

9)

Normalidad (Como que este paso se da despues del siguiente :S)


Se rechaza Ho, por lo que la variable se disTribuye de manera normal. Sig .000.

10)

Kolmogorov-Smirnov
Hiptesis nula de Kolmogorov-Smirnov: Ho= La variable se distribuye como una normal. Ha=La variable no se distribuye de manera normal. Sig.=.003 =.05 Se rechaza Ho, es decir, La variable no se distribuye de manera normal.

11)

Prueba de homoscedasticidad
Homoscedasticidad

Debe ser una nube aleatoria para que se cumpla, aqu podemos ver que s se cumple.
Podemos observar que no hay una tendencia, si es azaroza.

Esto no es de este ejercicio pero presenta una alternativa:


Si quedada duda Yresid^2=(Ypred-Yobserv)^2

Si podemos observar tendencias. Podemos observar que SI hay una tendencia, no es azaroza. No pasa esta prueba XXXX

Conclusion: No es un buen modelo, porque no cumple todos los supuestos. No cumple normalidad ni homoscedasticidad. Adems, solo est explicando el 44.3%.

Вам также может понравиться