Вы находитесь на странице: 1из 5

ESTIMACIN

Para estimar la lnea de regresin poblacional a partir de la nube de puntos se utiliza el mtodo de los mnimos cuadrados ordinarios (MCO), que considera como recta que mejor se ajusta a la que minimiza la suma de los cuadrados de los resduos.

Si la recta de mejor ajuste es

los errores o resduos se definen como: , y de la pendiente, , son:

los estimadores por MCO de la ordenada en el origen,

Para evaluar la bondad del ajuste se calcula el coeficiente de determinacin R 2 y, para medir la dispersin de los puntos alrededor de la recta estimada, el error tpico de la estimacin S u. Estas medidas se definen como:

Donde SCT o suma total de cuadrados es la variacin total de Y en la muestra y SCR o suma de cuadrados de la regresin es la parte de la variacin total explicada por la recta ajustada. Por lo tanto, R 2 indica la proporcin de variacin total explicada mediante larelacin lineal entre X e Y, y toma valores entre 0 y 1. Un valor de R2 prximo a 1 indica que la recta ajustada es un buen modelo para explicar el comportamiento de la variable Y, y por lo tanto existe relacin lineal entre X e Y. Por el contrario, un valor prximo a 0 indica que la recta ajustada no explica la variacin observada en Y.

Para establecer el intervalo de confianza para la pendiente de la recta de regresin,

, y contrastar si el

valor de este parmetro es o no significativamente diferente a cero es necesario calcular el error tpico de b que se define como:

El estadstico de prueba del contraste es Student con n-2 grados de libertad.

que presenta una distribucin de probabilidad t de

Para la obtencin de la recta de regresin la secuencia es:

Analizar

Regresin

Lineal

Se abre el cuadro de dilogo Regresin lineal donde se seleccionan las variables Dependiente e Independientes.

La opcin Mtodo permite elegir el mtodo de estimacin. Si se trata de una regresin lineal simple (con una sola variable independiente) se conserva la definida por defecto (Introducir) siendo el resto de opciones para modelos con ms de una variable explicativa.

Cuando se desee realizar un ajuste lineal basado nicamente en los casos que pertenecen a un subgrupo determinado por un valor o conjunto de valores de otra variable, sta se deber indicar en Variable de seleccin del cuadro de dilogo Regresin lineal e introducir la Regla o condicin que debe verificar un caso para ser incluido en el anlisis.

Opcionalmente se puede seleccionar la variable que recoge las etiquetas de los casos indicndola en Etiquetas de caso.

El botn MCP hace referencia a la estimacin por mnimos cuadrados ponderados.

Este cuadro de dilogo adems permite ampliar el anlisis de regresin activando las opciones incluidas en Estadsticos, Grficos y Opciones. ESTADSTICOS

El botn Estadsticos abre el cuadro de dilogo Regresin lineal: Estadsticos que por defecto tiene activadas las opciones Estimaciones y Ajuste del modelo.

- La opcin Estimaciones proporciona las estimaciones de los coeficientes de la recta ajustada por el mtodo de los mnimos cuadrados ordinarios y sus correspondientes errores

tpicos, as como los coeficientes estandarizados (beta), los valores del estadstico t y el nivel de significacin crtico.

- La opcin Ajuste del modelo muestra en el resumen delmodelo la bondad del ajuste o coefiente de determinacin y en elcuadro ANOVA la descomposicin de la suma total de cuadrados oinformacin total observada.

Otras opciones que presenta este cuadro de dilogo son:

- Intervalos de confianza de los coeficientes de regresin que por defecto se calculan al 95\%.

- Matriz de covarianzas y de varianzas, y la matriz de correlaciones de los coeficientes del modelo que se analiza en el contexto de la regresin mltiple.

- Cambio en R cuadrado. Cuantifica la variacin del coeficiente de determinacin que se produce al aadir o eliminar alguna variable independiente en un modelo de regresin mltiple.

- Descriptivos incluye las medias y las desviaciones tpicas de las variables seleccionadas y la matriz de correlaciones.

- Diagnsticos por caso. Esta opcin presenta dos alternativas para el anlisis de los residuos:

- la obtencin de Valores atpicos a ms de (por defecto 3) desviaciones tpicas. Identifica aquellos casos para los cuales el valor estandarizado de los residuos difiere en (por defecto 3) o ms desviaciones tpicas de su media. Para estos casos tambin presenta el valor observado, el valor pronosticado y el residuo sin estandarizar. Incluye un cuadro de estadsticos de los residuos con la media y desviacin tpica de los valores pronosticados y de los residuos, tipificados y no tipificados, diferenciando entre los casos incluidos y los excluidos del anlisis. La identificacin de casos atpicos es importante porque su presencia en la muestra puede distorsionar los resultados de la regresin.

- la obtencin de predicciones de Y para Todos los casos. Genera las predicciones de Y y sus correspondientes residuos para todos los casos.

El resto de opciones hacen referencia al modelo de regresin lineal mltiple. GRFICOS

El botn Grficos abre el cuadro de dilogo Regresin Lineal: Grficos.

Este cuadro de dilogo permite seleccionar los grficos a incluir en los resultados.

El recuadro superior presenta una serie de nuevas variables relacionadas con las predicciones y los residuos. stas pueden ser seleccionadas para definir los ejes X e Y de los diagramas de dispersin que se quieren elaborar. Pulsando el botn Siguiente el programa va numerando los diagramas que incluir en los resultados.

El recuadro Grficos de residuos tipificados presenta dos opciones: Histograma que muestra un histograma de los residuos tipificados superponindole la distribucin normal y Grfico de prob. normal que crea un grfico P-P til para comprobar la hiptesis de normalidad a partir de los residuos tipificados. La comprobacin de esta hiptesis es fundamental para la correcta interpretacin de las estimaciones por intervalo, tanto de los coeficientes de la recta como de las predicciones. OPCIONES

El botn Opciones abre el cuadro de dilogo Regresin Lineal: Opciones.

Permite desactivar Incluir constante en la ecuacin que elimina el trmino independiente y proporciona la recta de regresin que pasa por el origen de coordenadas. Por lo que se refiere a los Valores perdidos, adems de las dos posibilidades Excluir casos segn lista, activada por defecto, y Excluir casos segn pareja, comentadas en el epgrafe 3.6, hay la posibilidad de Reemplazar por la media, opcin que sustituye los valores missing por la media de la variable correspondiente.