Академический Документы
Профессиональный Документы
Культура Документы
El anlisis de regresin permite predecir una variable dependiente o criterio (Y) a partir de una o ms variable(s) independiente(s) o predictoras (X1, X2,Xk). Regresin lineal simple: intenta explicar o predecir la variable dependiente Y a partir de una nica variable independiente, X1.
22-08-2013
Regresin lineal mltiple: Contamos con un conjunto de variables independientes, X1, X2, ... Xk, para estimar la variable dependiente Y. En ambos casos, tanto la variable dependiente como la/s independiente/s estn medidas en escala de intervalo o de razn.
Regresin Simple Y = 0 + X
Y= Variable Dependiente 0= Constante (Punto interseccin o intercept) = Coeficiente de regresin (slope) de la V. Independiente X= Variable Independiente
22-08-2013
Predecir como un grupo de estudiantes se va a desempear en un test de Estadsticas en 3 medio a partir de un test de Matemticas en 1 medio.
Ejemplo: Para un estudiante cuyo puntaje en Matemticas fue de fue 55 en 1medio se estima (predice) un puntaje en Estadsticas en 3 medio de: Y=-43 + 3*55 = 122 Luego debo evaluar la significancia estadstica del coeficiente de regresin, en este caso p<0,01 y la significancia del modelo de regresin, en este caso tambin es p<0,01.
22-08-2013
Regresin Mltiple
La regresin mltiple se puede usar para responder varias preguntas de investigacin.
a) Indica si un grupo de VIs es buen predictor de una VD. Ej: Queremos saber si un grupo de subescalas de un test de inteligencia predice el rendimiento acadmico. b) Indica qu VI del grupo es el mejor predictor. Ej: Qu subescala del test de inteligencia predice ms (tiene ms peso en la prediccin) del rendimiento acadmico.
predictiva cuando los efectos de otra(s) VI(s) se controla(n). Ej: Cunto del rendimiento acadmico predicen las subescalas de inteligencia cuando incluyo la variable horas de estudio en el modelo de regresin. En resumen, la regresin mltiple indica cunto predice el modelo de regresin total (considerando todas las VIs) y cunto predice cada una de las VIs. Adems, la regresin mltiple permite evaluar si agregar una VI (ej: motivacin) contribuye (o no) al poder predictivo del modelo ms all de las variables ya incluidas en el l.
22-08-2013
Y= Variable Dependiente 0= Constante (Punto interseccin) 1= Coeficiente de regresin de la V. Independiente 1 X1= Variable Independiente 1 2= Coeficiente de regresin de la V. Independiente 2 X2= Variable Independiente 2
22-08-2013
Tamao Muestral Diferentes autores dan diferentes recomendaciones respecto del nmero de sujetos que se requieren para una regresin mltiple.
Stevens (1996) recomienda 15 sujetos por cada VI
(predictor).
Tabachnick y Fidell (2001) dan la sgte. Frmula:
b) Multicolinealidad y singularidad
Se refiere a la relacin que existe entre las VIs. Existe multicolinealidad cuando las VIs tienen una alta correlacin entre s (0.7 o ms). La singularidad ocurre cuando una VI es una combinacin de otras VIs. Ej: cuando se incluyen como VI dos subescalas de un test y el puntaje total del mismo test. El modelo de regresin se altera si alguno de stos dos condiciones se dan en las VIs.
22-08-2013
c) Outliers
La regresin mltiple es muy sensible a los outliers (puntajes muy altos o muy bajos). Se debe chequear a travs de anlisis de frecuencias de las VIs y VD antes de realizar la regresin.
22-08-2013
EJEMPLO: Se realiz una encuesta que incluy varios instrumentos para explorar los factores que afectan la satisfaccin de las personas. En esta oportunidad, se desea explorar el impacto de las percepciones de control que tienen los sujetos sobre sus niveles de estrs percibido. En la encuesta hay dos instrumentos que miden control: Escala de Maestra: Mide el grado en que las personas sienten que tiene el control sobre los eventos de su vida. A mayor puntaje, mayor sensacin de control (tmaest en el archivo). Escala de Control Percibido sobre los Estados Internos: Mide el grado en que las personas sienten que tienen el control sobre sus estados internos (emociones, pensamientos y reacciones fsicas). A mayor puntaje, mayor sensacin de control (tcpei en el archivo).
Regresin Mltiple
Preguntas de Investigacin 1. Son las dos medidas de control (maestra y control percibido de estados internos) buenos predictores del estrs percibido?Cunta varianza del estrs percibido es explicada por los puntajes de las dos VIs? 2. Cul es el mejor predictor del estrs percibido: el control de eventos externos (maestra) o el control de eventos internos (control percibido de estados internos)? Datos para el anlisis Dos o ms VIs continuas (intervalar/de razn) (maestra y control percibido de estados internos). Una VD continua (estrs percibido). Objetivo Esta prueba indica cunto de la varianza de la VD es explicado por las VIs. Tambin indica la contribucin relativa de cada VI. Finalmente, entrega la significacin del modelo general (con todas las VIs) y la significacin de cada una de las VIs.
22-08-2013
SPSS tambin realiza diagnsticos de colinealidad que pueden detectar problemas no detectados en la matriz de correlaciones. Valores de Tolerancia es menor a 0.10, indica que la correlacin entre variables es alta, o sea, existe multicolinealidad. Valores de FIV mayores a 10, indican presencia de multicolinealidad.
Coeficientesa Modelo Estadsticos de colinealidad Tolerancia
1
(Constante) total maestra total control percibido de los estados internos ,729 ,729
22-08-2013
se ubican en una lnea diagonal razonablemente recta desde abajo hacia arriba y de izquierda a derecha
forma rectangular con la mayora de los puntajes concentrados en el centro (en el punto 0). Lo que no debiera verse es un patrn claro o sistemtico de los residuos (ej: curvilnea o ms alto en un lado que el otro).
10
22-08-2013
Outliers: En una distribucin normal se espera que slo el 1% de los valores de los residuos estandarizados caigan fuera del rango de 3,0 y -3,0.
Diagnsticos por caso Nmero de casos Residuo tp.
di men si on 0
151
-3,475
En esta muestra, se encontr slo un caso (nmero 151) con un valor residual de -3,475. Su puntaje total de estrs percibido fue de 14, pero el modelo de regresin predijo un valor de 28,85. Por lo tanto, este modelo de regresin no fue muy bueno para predecir el puntaje de estrs percibido de esta persona (quien est mucho menos estresado que lo pronosticado).
Para chequear si este caso extrao (outlier) est afectando los resultados del modelo de regresin, se debe chequear el valor de la Distancia de Cook (que se ubica al final de la Tabla de Estadsticos de Residuos). Casos con valores mayores a 1 son problemticos.
Estadsticos sobre los residuos
a
Desviacin Mnimo Valor pronosticado Valor pronosticado tip. Error tpico de valor pronosticado Valor pronosticado corregido Residual Residuo tp. Residuo estud. Residuo eliminado Residuo eliminado estud. Dist. de Mahalanobis Distancia de Cook Valor de influencia centrado -14,849 -3,475 -3,514 -15,190 -3,562 ,004 ,000 ,000 12,612 2,951 2,969 12,765 2,997 13,897 ,094 ,033 -,002 ,000 ,000 -,001 -,001 1,993 ,003 ,005 4,268 ,999 1,003 4,306 1,006 2,234 ,008 ,005 426 426 426 426 426 429 426 429 18,04 41,39 26,75 4,009 426 18,03 -2,174 ,207 Mximo 41,31 3,644 ,800 Media 26,74 ,002 ,341 tpica 4,001 1,000 ,111 N 429 429 429
En este ejemplo, el valor mximo de Distancia de Cook es de 0,09, sugiriendo que no hay mayores problemas. Cuando existe algn valor mayor a 1 hay que mirar la base de datos y chequear los valores en la nueva variable creada por SPSS llamada COO_1 .Luego se excluyen del anlisis los casos mayores a 1.
11
22-08-2013
R cuadrado R cuadrado
a
corregida ,466
,684
,468
me
nsi
on
a. Variables predictoras: (Constante), total control percibido de los estados internos, total maestra b. Variable dependiente: total estrs percibido
En este caso el valor es 0,468. Expresado como porcentaje significa que nuestro modelo de regresin explica un 46,8% de la varianza de estrs percibido. Este es una muy buena proporcin de varianza explicada. Cuando la muestra es pequea (digamos menor a 100) se debiera usar el valor de R cuadrado corregido.
Para evaluar la significacin estadstica del modelo de regresin, es necesario mirar la tabla titulada ANOVA.
ANOVA Modelo Suma de cuadrados 1 Regresin Residual Total 6806,728 7725,756 14532,484 gl 2 423 425
b
a. Variables predictoras: (Constante), total control percibido de los estados internos, total maestra b. Variable dependiente: total estrs percibido
12
22-08-2013
Chequear la columna Beta y encontrar qu valor de beta es el mayor (sin considerar el signo). En este caso el coeficiente beta ms grande es -0,424, que corresponde a Maestra. Esto significa que esta variable es la que mayormente contribuye a la explicacin del estrs percibido. El valor Beta para Control percibido de Estados Internos fue slo un poco ms bajo (-0,36), indicando un poder predictivo ms bajo..
Para cada una de las VIs se debe chequear el valor en la columna llamada Sig. Este valor indica si cada variable est haciendo una contribucin nica estadsticamente significativa al modelo. Si el valor es menor a 0,05, la VI est haciendo una contribucin nica estadsticamente significativa a la prediccin de la VD.
En resumen, el modelo de regresin que incluye Maestra y Control percibido de Estados Internos, explica un 46,8% de la varianza del Estrs Percibido. De estas dos VIs, Maestra tiene mayor peso predictivo (beta=0,42), aunque Control percibido de Estados Internos tambin contribuye significativamente (beta=0,36). IMPLICANCIAS?
13