Вы находитесь на странице: 1из 13

22-08-2013

El anlisis de regresin permite predecir una variable dependiente o criterio (Y) a partir de una o ms variable(s) independiente(s) o predictoras (X1, X2,Xk). Regresin lineal simple: intenta explicar o predecir la variable dependiente Y a partir de una nica variable independiente, X1.

22-08-2013

Regresin lineal mltiple: Contamos con un conjunto de variables independientes, X1, X2, ... Xk, para estimar la variable dependiente Y. En ambos casos, tanto la variable dependiente como la/s independiente/s estn medidas en escala de intervalo o de razn.

Regresin Simple Y = 0 + X
Y= Variable Dependiente 0= Constante (Punto interseccin o intercept) = Coeficiente de regresin (slope) de la V. Independiente X= Variable Independiente

22-08-2013

Predecir como un grupo de estudiantes se va a desempear en un test de Estadsticas en 3 medio a partir de un test de Matemticas en 1 medio.

Ejemplo: Para un estudiante cuyo puntaje en Matemticas fue de fue 55 en 1medio se estima (predice) un puntaje en Estadsticas en 3 medio de: Y=-43 + 3*55 = 122 Luego debo evaluar la significancia estadstica del coeficiente de regresin, en este caso p<0,01 y la significancia del modelo de regresin, en este caso tambin es p<0,01.

22-08-2013

Regresin Mltiple
La regresin mltiple se puede usar para responder varias preguntas de investigacin.
a) Indica si un grupo de VIs es buen predictor de una VD. Ej: Queremos saber si un grupo de subescalas de un test de inteligencia predice el rendimiento acadmico. b) Indica qu VI del grupo es el mejor predictor. Ej: Qu subescala del test de inteligencia predice ms (tiene ms peso en la prediccin) del rendimiento acadmico.

c) Indica si una VI especfica sigue teniendo capacidad

predictiva cuando los efectos de otra(s) VI(s) se controla(n). Ej: Cunto del rendimiento acadmico predicen las subescalas de inteligencia cuando incluyo la variable horas de estudio en el modelo de regresin. En resumen, la regresin mltiple indica cunto predice el modelo de regresin total (considerando todas las VIs) y cunto predice cada una de las VIs. Adems, la regresin mltiple permite evaluar si agregar una VI (ej: motivacin) contribuye (o no) al poder predictivo del modelo ms all de las variables ya incluidas en el l.

22-08-2013

Ecuacin de Regresin Mltiple

Y= Variable Dependiente 0= Constante (Punto interseccin) 1= Coeficiente de regresin de la V. Independiente 1 X1= Variable Independiente 1 2= Coeficiente de regresin de la V. Independiente 2 X2= Variable Independiente 2

Ejemplo: Qu factores predicen las necesidades no cubiertas en personas con demencia?


Estado civil

Compaa Necesidades no cubiertas Tamao de la Red Social

Sntomas conductuales y psicolgicos

22-08-2013

Supuestos de la Regresin Mltiple


Esta tcnica es bastante exigente respecto de los supuestos que los datos deben cumplir.
1.

Tamao Muestral Diferentes autores dan diferentes recomendaciones respecto del nmero de sujetos que se requieren para una regresin mltiple.
Stevens (1996) recomienda 15 sujetos por cada VI

(predictor).
Tabachnick y Fidell (2001) dan la sgte. Frmula:

N= 50 + 8m (donde m = nmero de VIs)

b) Multicolinealidad y singularidad

Se refiere a la relacin que existe entre las VIs. Existe multicolinealidad cuando las VIs tienen una alta correlacin entre s (0.7 o ms). La singularidad ocurre cuando una VI es una combinacin de otras VIs. Ej: cuando se incluyen como VI dos subescalas de un test y el puntaje total del mismo test. El modelo de regresin se altera si alguno de stos dos condiciones se dan en las VIs.

22-08-2013

c) Outliers

La regresin mltiple es muy sensible a los outliers (puntajes muy altos o muy bajos). Se debe chequear a travs de anlisis de frecuencias de las VIs y VD antes de realizar la regresin.

d) Normalidad, linealidad, homocedasticidad


Todos estos supuestos se refieren a varios aspectos de la distribucin de puntajes y la naturaleza de las relaciones subyacentes entre las variables. Estos supuestos se pueden chequear a travs de los grficos de dispersin de residuos que aparecen en los outputs del SPSS. Los grficos de dispersin permiten chequear:
Normalidad: los residuos deberan estar distribuidos normalmente respecto de los puntajes de la VD Linealidad: los residuos deberan tener una relacin de lnea recta con los puntajes de la VD Homocedasticidad: La varianza de los residuos respecto de los puntajes de la VD debera ser la misma para todos dichos puntajes.

22-08-2013

EJEMPLO: Se realiz una encuesta que incluy varios instrumentos para explorar los factores que afectan la satisfaccin de las personas. En esta oportunidad, se desea explorar el impacto de las percepciones de control que tienen los sujetos sobre sus niveles de estrs percibido. En la encuesta hay dos instrumentos que miden control: Escala de Maestra: Mide el grado en que las personas sienten que tiene el control sobre los eventos de su vida. A mayor puntaje, mayor sensacin de control (tmaest en el archivo). Escala de Control Percibido sobre los Estados Internos: Mide el grado en que las personas sienten que tienen el control sobre sus estados internos (emociones, pensamientos y reacciones fsicas). A mayor puntaje, mayor sensacin de control (tcpei en el archivo).

Regresin Mltiple
Preguntas de Investigacin 1. Son las dos medidas de control (maestra y control percibido de estados internos) buenos predictores del estrs percibido?Cunta varianza del estrs percibido es explicada por los puntajes de las dos VIs? 2. Cul es el mejor predictor del estrs percibido: el control de eventos externos (maestra) o el control de eventos internos (control percibido de estados internos)? Datos para el anlisis Dos o ms VIs continuas (intervalar/de razn) (maestra y control percibido de estados internos). Una VD continua (estrs percibido). Objetivo Esta prueba indica cunto de la varianza de la VD es explicado por las VIs. Tambin indica la contribucin relativa de cada VI. Finalmente, entrega la significacin del modelo general (con todas las VIs) y la significacin de cada una de las VIs.

22-08-2013

PASO 1: CHEQUEAR LOS SUPUESTOS


Multicolinealidad: Las VIs deben mostrar una correlacin con la VD de 0.3 hacia arriba. La correlacin entre las VIs no debe ser mayor a 0,7.
Correlaciones total control percibido de los total estrs percibido Correlacin de Pearson total estrs percibido total maestra total control percibido de los estados internos Sig. (unilateral) total estrs percibido total maestra total control percibido de los estados internos N total estrs percibido total maestra total control percibido de los estados internos 433 433 426 433 436 429 426 429 430 . ,000 ,000 . ,000 . ,000 ,000 ,000 1,000 -,612 -,581 total maestra -,612 1,000 ,521 estados internos -,581 ,521 1,000

SPSS tambin realiza diagnsticos de colinealidad que pueden detectar problemas no detectados en la matriz de correlaciones. Valores de Tolerancia es menor a 0.10, indica que la correlacin entre variables es alta, o sea, existe multicolinealidad. Valores de FIV mayores a 10, indican presencia de multicolinealidad.
Coeficientesa Modelo Estadsticos de colinealidad Tolerancia
1

FIV 1,372 1,372

(Constante) total maestra total control percibido de los estados internos ,729 ,729

a. Variable dependiente: total estrs percibido

22-08-2013

Outliers, Normalidad, Linealidad, Homocedasticidad


Normalidad: En el Grfico de Probabilidad Normal chequear que los puntos

se ubican en una lnea diagonal razonablemente recta desde abajo hacia arriba y de izquierda a derecha

En el Grfico de Dispersin chequear que los residuos estn distribuidos en

forma rectangular con la mayora de los puntajes concentrados en el centro (en el punto 0). Lo que no debiera verse es un patrn claro o sistemtico de los residuos (ej: curvilnea o ms alto en un lado que el otro).

10

22-08-2013

Outliers: En una distribucin normal se espera que slo el 1% de los valores de los residuos estandarizados caigan fuera del rango de 3,0 y -3,0.
Diagnsticos por caso Nmero de casos Residuo tp.
di men si on 0

total estrs percibido 14

Valor pronosticado 28,85 Residual -14,849

151

-3,475

a. Variable dependiente: total estrs percibido

En esta muestra, se encontr slo un caso (nmero 151) con un valor residual de -3,475. Su puntaje total de estrs percibido fue de 14, pero el modelo de regresin predijo un valor de 28,85. Por lo tanto, este modelo de regresin no fue muy bueno para predecir el puntaje de estrs percibido de esta persona (quien est mucho menos estresado que lo pronosticado).

Para chequear si este caso extrao (outlier) est afectando los resultados del modelo de regresin, se debe chequear el valor de la Distancia de Cook (que se ubica al final de la Tabla de Estadsticos de Residuos). Casos con valores mayores a 1 son problemticos.
Estadsticos sobre los residuos
a

Desviacin Mnimo Valor pronosticado Valor pronosticado tip. Error tpico de valor pronosticado Valor pronosticado corregido Residual Residuo tp. Residuo estud. Residuo eliminado Residuo eliminado estud. Dist. de Mahalanobis Distancia de Cook Valor de influencia centrado -14,849 -3,475 -3,514 -15,190 -3,562 ,004 ,000 ,000 12,612 2,951 2,969 12,765 2,997 13,897 ,094 ,033 -,002 ,000 ,000 -,001 -,001 1,993 ,003 ,005 4,268 ,999 1,003 4,306 1,006 2,234 ,008 ,005 426 426 426 426 426 429 426 429 18,04 41,39 26,75 4,009 426 18,03 -2,174 ,207 Mximo 41,31 3,644 ,800 Media 26,74 ,002 ,341 tpica 4,001 1,000 ,111 N 429 429 429

a. Variable dependiente: total estrs percibido

En este ejemplo, el valor mximo de Distancia de Cook es de 0,09, sugiriendo que no hay mayores problemas. Cuando existe algn valor mayor a 1 hay que mirar la base de datos y chequear los valores en la nueva variable creada por SPSS llamada COO_1 .Luego se excluyen del anlisis los casos mayores a 1.

11

22-08-2013

PASO 2: EVALUAR EL MODELO


Chequear en la tabla Resumen del Modelo el valor para R cuadrado. Este valor indica cunto de la varianza de la VD (estrs percibido) es explicado por el modelo (que incluye todas las VIs: Maestra y Control Percibido de Estados Internos).
Resumen del modelo Modelo R
di

R cuadrado R cuadrado
a

Error tp. de la estimacin 4,274

corregida ,466

,684

,468

me

nsi

on

a. Variables predictoras: (Constante), total control percibido de los estados internos, total maestra b. Variable dependiente: total estrs percibido

En este caso el valor es 0,468. Expresado como porcentaje significa que nuestro modelo de regresin explica un 46,8% de la varianza de estrs percibido. Este es una muy buena proporcin de varianza explicada. Cuando la muestra es pequea (digamos menor a 100) se debiera usar el valor de R cuadrado corregido.

Para evaluar la significacin estadstica del modelo de regresin, es necesario mirar la tabla titulada ANOVA.
ANOVA Modelo Suma de cuadrados 1 Regresin Residual Total 6806,728 7725,756 14532,484 gl 2 423 425
b

Media cuadrtica 3403,364 18,264 F 186,341 Sig. ,000


a

a. Variables predictoras: (Constante), total control percibido de los estados internos, total maestra b. Variable dependiente: total estrs percibido

12

22-08-2013

PASO 3: EVALUAR CADA UNA DE LAS VIs


Cul fue el poder predictivo de cada una de las VIs incluidas en el modelo a la prediccin de la VD? Cul tiene mayor poder predictivo? Esta informacin est en la Tabla llamada Coeficientes, en la columna Beta bajo los Coeficientes Tipificados.
Coeficientesa Modelo Coeficientes no estandarizados B 1 (Constante) total maestra total control percibido de los estados internos a. Variable dependiente: total estrs percibido 50,971 -,625 -,175 Error tp. 1,273 ,061 ,020 -,424 -,360 Coeficientes tipificados Beta t 40,035 -10,222 -8,660 Sig. ,000 ,000 ,000

Chequear la columna Beta y encontrar qu valor de beta es el mayor (sin considerar el signo). En este caso el coeficiente beta ms grande es -0,424, que corresponde a Maestra. Esto significa que esta variable es la que mayormente contribuye a la explicacin del estrs percibido. El valor Beta para Control percibido de Estados Internos fue slo un poco ms bajo (-0,36), indicando un poder predictivo ms bajo..

Para cada una de las VIs se debe chequear el valor en la columna llamada Sig. Este valor indica si cada variable est haciendo una contribucin nica estadsticamente significativa al modelo. Si el valor es menor a 0,05, la VI est haciendo una contribucin nica estadsticamente significativa a la prediccin de la VD.
En resumen, el modelo de regresin que incluye Maestra y Control percibido de Estados Internos, explica un 46,8% de la varianza del Estrs Percibido. De estas dos VIs, Maestra tiene mayor peso predictivo (beta=0,42), aunque Control percibido de Estados Internos tambin contribuye significativamente (beta=0,36). IMPLICANCIAS?

13

Вам также может понравиться