Вы находитесь на странице: 1из 16

ANTECEDENTE HISTORICO DE LA REGRESION El trmino regresin fue introducido por Francis Galton.

En un famoso artculo, Galton hall que aunque exista una tendencia a que los padres de alta estatura tuvieran asimismo, hijos altos, y de igual forma a que los padres de baja estatura tuvieran hijos de baja estatura, la estatura promedio de los nios que nacan de padres con una determinada estatura tenda a moverse o "regresar" hacia la altura promedio de la poblacin total. En otras palabras, la estatura de los hijos de padres inusualmente altos o inusualmente bajos, tenda a estar ms cerca de la estatura promedio de la poblacin la ley de regresin universal de Galton fue confirmada por su amigo Karl Pearson, quien coleccion ms de mil registros de estatura promedio de los miembros de diferentes grupos familiares. Pearson encontr que la estatura promedio de los hijos de un grupo de padres altos era inferior a la estatura de sus padres de baja estatura era mayor que la estatura de sus respectivos padres, generndose un fenmeno el cual los hijos altos y bajos de estatura "regresaban" hacia la estatura promedio de todos los hombres. Para utilizar las palabras de Galton, sta era una "regresin de mediocridad". LA REGRESION El anlisis de regresin est relacionado con el estudio de la dependencia de una variable dependiente de una o ms variables adicionales, las variables explicativas con la perspectiva de estimar y/o predecir el valor medio o promedio (poblacional) de la variable dependiente Y en base a los valores fijos o conocidos de la(s)

variable(s) explicativa(s) Xi obtenidos en muestreos repetidos. El xito de su aplicacin depende mucho de la informacin utilizada.

LINEAS GENERALES DE ACCION EN EL ANALISIS DE REGRESION 1. Enunciado de la teora de hiptesis Es lo que se piensa intuitivamente y se pretende probar a partir de una hiptesis. (Ho : hiptesis nula) frente a una hiptesis alternativa (H1). 2. Especificacin del modelo dirigido a probar la teora, es una ecuacin matemtica Modelo de ecuacin lineal Y=B1+B2X 0<B<1 Donde : Y = variable dependiente o a ser estimada, variable endgena, variable respuesta Bo= intercepto o valor en que se intercepta con el eje Y B1= pendiente X = variable independiente, variable exgena, variable regresora Pero, en realidad pueden surgir otros factores que pueden ejercer cierta influencia en los patrones de la variable Y, y todas aquellas

fuerzas que la afectan a Y, que no se tienen en cuenta de manera explcita en la ecuacin es denotada con u. Y=Bo+B1X+u 0<B1<1

Adems se puede hablar de una variable que depende de ms de una variable independiente o explicativa, siendo el modelo as : Modelo de ecuacin no lineal Y=Bo+B1X+......+BnXn 0<B1<1 Luego el modelo se representa de la siguiente manera : Y=Bo+B1X+...+BnXn+u 0<B1<1 Donde : u = representa el trmino de perturbacin o error, siendo una variable aleatoria (estocstica) con propiedades probabilsticas bien definidas y que tienen valores esperados. 3. Estimacin de los parmetros del modelo escogido Para obtener las estimaciones (valores numricos) de los parmetros B1 y B2 del modelo, los cuales son conocidos tambin como coeficientes de correlacin se obtienen ya sea por el mtodo de los mnimos cuadrados o por el mtodo de mxima verosimilitud. El modelo de regresin lineal clsico, se desarrolla con el mtodo de los mnimos cuadrados y se exponen sus supuestos en base a u.

4. Verificacin o inferencia estadstica Desarrolla criterios apropiados para establecer si las estimaciones obtenidas estn de acuerdo con lo que se espera de la teora que se est verificando, haciendo uso de la inferencia estadstica con la prueba de hiptesis (Ho : hiptesis nula) frente a una hiptesis alternativa (H1), fijando como contraste el F (estimado) calculado de acuerdo a la tabla ANOVA y el F de la tabla de Snedecor (observado) siendo rechazada la hiptesis nula si es que F F tabla. 5. Predicciones o pronstico Si el modelo escogido confirma la hiptesis o teora que se est investigando, se puede entonces proceder a predecir el (los) valor(es) futuro(s) de la variable dependiente Y en base a valores futuros, conocidos o esperados, para la(s) variable(s) explicativa(s) X. 6. Utilizacin del modelo para fines de control o formulacin de polticas. Se puede controlar o manipular la variable de control X, dirigida a producir el nivel deseado para la variable objetivo Y, siempre y cuando estos parmetros no escapen de la realidad.

ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL Se trata de un modelo clsico de regresin lineal con k variables (Y y X2, X3,...,Xk), en notacin de lgebra matricial. La ventaja de ste modelo es que al trabajar con el lgebra matricial proporciona un mtodo compacto de manejar los modelos de regresin que involucran cualquier nmero de variables; una vez formulado y solucionado el modelo con k variables mediante la utilizacin de notacin matricial, la solucin puede ser aplicada a cualquier nmero de variables. MODELO DE REGRESION LINEAL CON K VARIABLES. Generalizando el modelo para k variables tenemos el modelo : Yi = o + 1X1i + 2X2i + ...+ kXki + ui i = 1,2,.., N Donde o = interseccin 1,..., k = coeficientes parciales de la pendiente u = trmino de perturbacin estocstica i = i-sima observacin N = tamao de la poblacin

Representacin matricial Y1 Y2 . . . YN 1 1 X21 X31. . .Xk1 X22 x32. . . 1 u1

Descriptive Statistics Std. Mean Deviation FONPENSI 1514335 368769.28 NUMAFIL 456043.12 37356.16 PROMO 519.81 87.04 N 26 26 26

ESTADISTICA DESCRIPTIVA (Desciptive Statistics) : La presente tabla muestra las respectivas Medias (Means) y Desviaciones Estndares (Std. Deviation) para cada una de las variables utilizadas : FONPENSI : Fondo de Pensiones (V. Dependiente) NUMAFIL : Nmero de Afiliados (V. Independiente) PROMO : Nmero de Promotores (V. Independiente) Para el tamao de datos N = 26 INTERPRETACION :

El valor medio de FONPENSI es S/.1514,335 nuevos soles As mismo podemos apreciar que la Desviacin estndar es aproximadamente para cada mes es S/.368,769.28 nuevos soles, de lo que se desprende que la varianza es S/. significa que tiene una variabilidad de Nuevos soles, lo que

b Model Summary

Model 1

R R Square a .992 .985

Adjusted R Square .983

Std. Error of the Estimate 47607.96

a. Predictors: (Constant), PROMO, NUMAFIL b. Dependent Variable: FONPENSI

RESUMEN DEL MODELO (Model Summary) R Square, R2 : Coeficiente de Determinacin (0R21) R2 = 0.985 Error Estndar de la Estimacin (Std. Error of the Estimate) = 47607.96 INTERPRETACION : En esta tabla podemos observar que el R 2 tiene un valor alto, muy cercano a 1, lo cual nos indica que el modelo se encuentra explicado en un 98.5% de acuerdo a las variables explicativas escogidas para el anlisis, lo cual demuestra que el modelo es bueno. El error estndar de la estimacin seala que hay S/.47,607.96 nuevos soles del Fondo de Pensiones que no se encuentran explicadas por el modelo.

ANOVAb Model 1 Sum of Squares 3.3E+12 5.2E+10 3.4E+12 df 2 23 25 Mean Square 1.7E+12 2.3E+09 F 738.498 Sig. .000 a

Regression Residual Total

a. Predictors: (Constant), PROMO, NUMAFIL b. Dependent Variable: FONPENSI

ANOVA df F

: : :

Anlisis de Varianza sin considerar los trminos para la media (corregido por la media) Grados de Libertad (Negree Freedom) F calculado

Ho : = 0 (hiptesis nula) H1 : 0 (hiptesis alternativa) INTERPRETACION : F (2, 23) segn la tabla de la funcin F de Snedecor = 0.29, este valor lo comparamos con el valor del F que se ha calculado con la tabla y si F > F(2,23) rechazamos la hiptesis nula; para nuestro ejemplo rechazamos Ho es decir que nos indica que todos los regresores son importantes para el modelo.

a Coefficient Correlations

Model 1

Correlations Covariances

PROMO NUMAFIL PROMO 1.000 .461 NUMAFIL .461 1.000 PROMO 15203.684 16.342 NUMAFIL 16.342 8.253E-02

a. Dependent Variable: FONPENSI

Aqu podemos notar que la correlacin que existe entre PROMO y NUMAFILI es de 0.461 lo cual es muy bajo y nos indicara que aunque el nmero de promotores de ventas aumente no necesariamente el nmero de afiliados tiende a aumentar.(De acuerdo a los datos utilizados).

Normal P-P Plot of Regression Standard


1.00

Dependent Variable: Fondo de Pension

.75

Expected Cum Prob

.50

.25

0.00 0.00 .25 .50 .75 1.00

Observed Cum Prob

En el grfico vemos que a pesar que nuestros datos no provienen de una distribucin normal, tienen una tendencia a esta distribucin y adems no existe un punto o puntos que tengan una distancia relativamente considerable alejados de la recta (outliers)

Fondo de Pensiones
2200000 2000000 1800000 1600000 1400000 1200000 1000000 800000 380000 400000 420000 440000 460000 480000 500000 520000

Observed Linear

Nmero de Afiliados

Este grfico nos muestra la tendencia que tiene la variable nmero de afiliados durante el perodo de 1997 - 31/06/1999 (Tendencia Creciente positiva).

a Coefficients

Unstandardized Coefficients Model 1 B -2386340 9.161 -532.934 Std. Error 170610.6 .287 123.303

Standardi zed Coefficien ts Beta .928 -.126 t -13.987 31.887 -4.322 Sig. .000 .000 .000

(Constant) NUMAFIL PROMO

95% Confidence Interval for B Lower Upper Bound Bound -2739275 -2033405 8.566 9.755 -788.006 -277.862

a. Dependent Variable: FONPENSI

Esta tabla nos permite observar el valor para cada uno de los regresores: o = -2386340 1 = 9.161 2 = -532.934 Modelo de Regresin: Y = -2386340 + 9.161X1 - 532.934X2 INTERPRETACION : 1 : nos indica que por cada afiliado(X1) existe un 9.16 de aumento en el fondo de pensiones. 2 : Mientras que por cada promotor (X2) existe una disminucin de 532.94 soles en el fondo de pensiones.

Fondo de Pensiones
2200000 2000000 1800000 1600000 1400000 1200000 1000000 800000 300 400 500 600 700

Observed Linear

Numero de Promotores ilidad del Afiliado

INTERPRETACION : El nmero de promotores tiene una tendencia decreciente en relacin al fondo de pensiones.

Histogram Dependent Variable: Fondo de Pensiones


5 4

Frequency

1 0 -2.00 -1.50 -1.00 -.75 -.50 -.25 0.00 .25 .50 .75 1.00 1.50 -1.75 -1.25 1.25

Std. Dev = .96 Mean = 0.00 N = 26.00

Regression Standardized Residual

En el grfico de residuos observamos que no siguen una distribucin normal por lo que podemos suponer que esto se deba a que el nmero de datos utilizados es pequeo, ya que lo ms adecuado sera tomar una muestra de n 30.

Conclusin Final De acuerdo a lo visto anteriormente podemos concluir que nuestro modelo es ptimo para las variables que hemos escogido y que representan en alto grado el comportamiento de lo que significa nmero de afiliados, nmero de promotores y el fondo de pensiones. An as nuestros datos son pocos lo cual podra mejorar si es que consideramos una muestra mayor lo que nos ayudara a interpretar con mayor precisin las estimaciones.

Вам также может понравиться