Вы находитесь на странице: 1из 11

CURSO: METODOLOGA DE INVESTIGACIN (TCNICAS DE ANLISIS DE DATOS)

EL ANLISIS DE REGRESIN MLTIPLE

Anlisis de regresin mltiple

EL ANLISIS DE REGRESIN MLTIPLE: CONCEPTO


Mtodo multivariante que analiza la relacin entre una nica variable dependiente (criterio) y varias variables independientes (predictores). El objetivo es predecir cambios en la variable dependiente en respuesta a cambios en varias de las variables independientes

Cada variable predictor es ponderada, indicando la ponderacin su


contribucin relativa a la prediccin conjunta

El conjunto de variables independientes ponderadas se denomina


valor terico de la regresin o ecuacin de regresin Y= b0 + b1X1 + b2X2 +.....+ bn Xn

Tcnica de dependencia en la que los datos deben ser mtricos o


apropiadamente transformados

Anlisis de regresin mltiple

DIAGRAMA DE DECISIN DE LA REGRESIN MLTIPLE (I)


Problema de investigacin

Primer paso

Seleccionar objetivo (s) - Prediccin - Explicacin

Seleccionar variables dep. e indep.

Segundo paso

Diseo de la investigacin Seleccin del tamao muestral Creacin de variables adicionales No

Tercer paso

Supuestos en la regresin mltiple Cumplen las variables individuales los supuestos de: normalidad linealidad homoscedasticidad?

Si

Anlisis de regresin mltiple

DIAGRAMA DE DECISIN DE LA REGRESIN MLTIPLE (II)


Estimacin del modelo de regresin especifica el investigador el modelo o se utiliza algn procedimiento de seleccin de las var. indep.?

Cuarto paso
Especificacin del investigador

Procedimiento de seleccin

Mtodo de estimacin secuencial Estimacin progresiva/regresiva Estimacin por etapas Mtodo de combinacin Examinar todas las combinaciones posibles para identificar la que mejor se ajusta Cumple el valor terico de regresin los supuestos del anlisis de regresin? Si Examinar significacin estadstica del modelo Coeficiente de determinacin (R2) Coeficiente de determinacin ajustado Significacin de los coeficientes de regresin No A segundo paso: Creacin de variables adicionales

Anlisis de regresin mltiple

DIAGRAMA DE DECISIN DE LA REGRESIN MLTIPLE (III)

Quinto paso

Interpretacin del valor terico de la regresin Evaluar importancia relativa de las variables independientes con los coeficientes beta Valoracin de la multicolinealidad

Sexto paso

Validacin de los resultados Contraste del modelo de regresin en una nueva muestra de la poblacin
Dividir la muestra en dos partes y utilizar una submuestra para crear el modelo y otra para contrastarlo

Anlisis de regresin mltiple

OBJETIVOS DE LA REGRESIN MLTIPLE

Prediccin de la variable criterio con un conjunto de variables independientes, de forma que se maximice el valor terico de la regresin. La prediccin del modelo elegido debe demostrar tanto significacin prctica como estadstica

Explicacin objetiva del grado y carcter de la relacin entre las variables independientes y la variable dependiente. Concretamente:

Determinacin de la importancia relativa de cada variable


independiente sobre la variable dependiente (magnitud y direccin de la relacin)

Evaluacin de la naturaleza de las relaciones entre las variables


independientes y la dependiente (lineal y/o curvilineal)

Evaluacin de las interrelaciones entre las variables independientes

Anlisis de regresin mltiple

CREACIN DE VARIABLES ADICIONALES

Transformaciones de las variables para cumplir los supuestos


Transformaciones ms comunes: inversa, raiz cuadrada y logaritmo

Incorporacin de datos no mtricos con variables ficticias


Cuando la variable dependiente se mide como una variable dicotmica (0,1) Anlisis discriminante Regresin logstica

Cuando las variables independientes son no mtricas, con dos o ms categoras

Se pueden sustituir por variables ficticias. Cualquier variable no mtrica con k categoras puede representarse con k-1 variables ficticias

Anlisis de regresin mltiple

SUPUESTOS EN LA REGRESIN MLTIPLE


NORMALIDAD El perfil de la distribucin de los datos se corresponde con una distribucin normal. Si la variacin respecto de la distribucin normal es amplia, los tests estadsticos resultantes no son vlidos, dado que se requiere la normalidad para el uso de los estadsticos de la t y de la F.

La normalidad univariante ayuda a obtener normalidad multivariante, pero no la garantiza. La normalidad multivariante implica que las variables individuales son normales.
cmo evaluarla? 1. Grfico de probabilidad normal de los residuos 2. Test de Kolmogorov-Smirnov sobre los residuos estandarizados LINEALIDAD Supuesto implcito en todas las tcnicas multivariantes basadas en medidas de correlacin. Resulta necesario identificar cualquier desplazamiento de la linealidad que pueda impactar la correlacin. cmo evaluarla? Examen visual de los residuos y Grfico de regresin parcial HOMOSCEDASTICIDAD Varianza constante del trmino de error. Se refiere al supuesto de que las variables dependientes exhiban iguales niveles de varianza a lo largo del rango de los valores de las variables independientes. cmo evaluarla? 1. Examen visual de los residuos 2. Test de Levene

Anlisis de regresin mltiple

MTODOS DE ESTIMACIN SECUENCIAL


Estimacin por etapas (paso a paso stepwise)
1. Empezar con modelo de regresin simple, seleccionando la variable independiente que tenga la mayor correlacin con la variable dependiente. Ecuacin: Y = b0 + b1X1 2. Examinar coeficientes de correlacin parcial para encontrar una variable adicional que explique la mayor parte del error que queda de la primera ecuacin de regresin 3. Recalcular la ecuacin de regresin utilizando las dos variables independientes, y examinar el valor parcial F de la variable original del modelo para ver si todava realiza una contribucin significativa. Si no lo hace, se elimina. Si lo hace, la ecuacin queda: Y = b0 + b1X1 + b2X2 4. Continuar este procedimiento con todas las variables independientes restantes para ver si deberan incluirse en la ecuacin. Si se incluye alguna, hay que examinar las variables previamente incluidas para juzgar si deben mantenerse

Estimacin progresiva (forward) y regresiva (backward)


El modelo de estimacin progresiva es similar a la estimacin por etapas, mientras que la estimacin regresiva implica calcular una ecuacin de regresin con todas las variables independientes, para a continuacin ir eliminando aqullas que no contribuyan significativamente. La diferencia con la estimacin por etapas es que en sta se pueden aadir o eliminar variables en cada etapa, mientras que una vez que se aade o elimina una variable en los procedimientos de estimacin progresiva o regresiva, no existe la posibilidad de revertir la accin posteriormente.

Anlisis de regresin mltiple

EVALUACIN DE LA MULTICOLINEALIDAD
Situacin ideal: Tener una cantidad de variables independientes altamente correlacionadas con la variable dependiente, pero con poca correlacin entre s Multicolinealidad: correlacin entre tres o ms variables independientes Efecto La multicolinealidad reduce el poder predictivo de cualquier variable independiente individual, en la medida en que est asociado con las otras variables independientes A mayor colinealidad, la varianza nica explicada por cada variable independiente se reduce y el porcentaje de prediccin compartida aumenta

Cmo detectar la existencia de multicolinealidad?


1. Examen de la matriz de correlacin de las variables independientes (altas correlaciones indican elevada colinealidad) 2. Estadsticos de colinealidad: valor de tolerancia (TOL) y factor de inflacin de la varianza (FIV) (valores de TOL prximos a 0 y elevados valores de FIV, superiores a 4, denotan multicolinealidad)

Anlisis bivariante

TABULACIN CRUZADA Mtodo de anlisis comnmente usado para clasificar variables categricas. A travs de una tabla de contingencia, se cruzan dos variables y se interpretan los porcentajes.

Proporciona un valor chi-cuadrado, que permite contrastar si existe relacin entre las variables que se cruzan. Valores significativos del estadstico indican que existe relacin.

EL ANLISIS DE LA VARIANZA (ANOVA) Procedimiento para valorar las diferencias de grupo. Se utiliza para constrastar la hiptesis de que varias medias muestrales son iguales. Las variables dependientes son mtricas, mientras que el factor (variable independiente) es una variable categrica. Proporciona un estadstico F. Valores significativos de F indican que existen diferencias significativas entres las muestras.

REGRESIN SIMPLE Mtodo univariante que analiza la relacin entre una variable dependiente (criterio) y una nica variable independiente (predictor). El objetivo es predecir cambios en la variable dependiente en respuesta a cambios en la variable independiente.

Вам также может понравиться