Вы находитесь на странице: 1из 9

REGRESION LINEAL Objetivo General: El objeto de un anlisis de regresin es investigar la relacin estadstica que existe entre una variable

e dependiente (Y) y una o ms variables independientes ( , ... ).

Marco Terico: Es un mtodo matemtico que modeliza la relacin entre una variable dependiente Y, las variables independientes Xi y un trmino aleatorio . Este modelo puede ser expresado como:

donde 0 es la interseccin o trmino "constante", las son los parmetros respectivos a cada variable independiente, y p es el nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal puede ser contrastada con la regresin no lineal. Las observaciones se dispondrn en dos columnas, de modo que en cada fila figuren la abscisa x y su correspondiente ordenada y. La importancia de las distribuciones bidimensionales radica en investigar como influye una variable sobre la otra. Esta puede ser una dependencia causa efecto, por ejemplo, la cantidad de lluvia (causa), da lugar a un aumento de la produccin agrcola (efecto). O bien, el aumento del precio de un bien, da lugar a una disminucin de la cantidad demandada del mismo. Si utilizamos un sistema de coordenadas cartesianas para representar la distribucin bidimensional, obtendremos un conjunto de puntos conocido con el diagrama de dispersin, cuyo anlisis permite estudiar cualitativamente, la relacin entre ambas variables tal como se ve en la figura. El siguiente paso, es la determinacin de la dependencia funcional entre las dos variables x e y que mejor ajusta a la distribucin bidimensional. Se denomina regresin lineal cuando la funcin es lineal, es decir, requiere la determinacin de dos parmetros: la pendiente y la ordenada en el origen de la recta de regresin, y=ax+b.

La regresin nos permite adems, determinar el grado de dependencia de las series de valores X e Y, prediciendo el valor y estimado que se obtendra para un valor x que no est en la distribucin.

Vamos a determinar la ecuacin de la recta que mejor ajusta a los datos representados en la figura. Se denomina error ei a la diferencia yi-y, entre el valor observado yi, y el valor ajustado y= axi+b, tal como se ve en la figura inferior. El criterio de ajuste se toma como aqul en el que la desviacin cuadrtica media sea mnima, es decir, debe de ser mnima la suma

El extremos de una funcin: mximo o mnimo se obtiene cuando las derivadas de s respecto de a y de b sean nulas. Lo que da lugar a un sistema de dos ecuaciones con dos incgnitas del que se despeja a y b.

El coeficiente de correlacin es otra tcnica de estudiar la distribucin bidimensional, que nos indica la intensidad o grado de dependencia entre las variables X e Y. El coeficiente de correlacin r es un nmero que se obtiene mediante la frmula.

El numerador es el producto de las desviaciones de los valores X e Y respecto de sus valores medios. En el denominador tenemos las desviaciones cuadrticas medias de X y de Y. El coeficiente de correlacin puede valer cualquier nmero comprendido entre -1 y +1. Cuando r=1, la correlacin lineal es perfecta, directa. Cuando r=-1, la correlacin lineal es perfecta, inversa Cuando r=0, no existe correlacin alguna, independencia total de los valores X e Y

Aplicaciones de la regresin lineal Lneas de tendencia Una lnea de tendencia representa una tendencia en una serie de datos obtenidos a travs de un largo perodo. Este tipo de lneas puede decirnos si un conjunto de datos en particular (como por ejemplo, el PBI, el precio del petrleo o el valor de las acciones) han aumentado o decrementado en un determinado perodo. Se puede dibujar una lnea de tendencia a simple vista fcilmente a partir de un grupo de puntos, pero su posicin y pendiente se calcula de manera ms precisa utilizando tcnicas estadsticas como las regresiones lineales. Las lneas de tendencia son generalmente lneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la lnea. Medicina En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco vinieron de estudios que utilizaban la regresin lineal. Los investigadores incluyen una gran cantidad de variables en su anlisis de regresin en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias. En el caso del tabaquismo, los investigadores incluyeron el estado socio-econmico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educacin o posicin econmica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresin. En el ejemplo del tabaquismo, un hipottico gen podra aumentar la mortalidad y aumentar la propensin a adquirir enfermedades relacionadas con el consumo de tabaco. Por esta razn, en la actualidad las pruebas controladas aleatorias son consideradas mucho ms confiables que los anlisis de regresin.

Programa Desarrollado: El programa desarrollado bajo el Lenguaje Visual Basic tiene como objetivo el realizar la regresin lineal de la relacin entre una variable dependiente Y, las variables independientes. Utilizando comandos bsicos se ha podido establecer los clculos a realizarse, de esta manera se ha logrado obtener una regresin lineal ya sea cuadrticas o con ecuacin de tercer grado.

A continuacin mostramos imgenes del software puesto en marcha. Pantalla Principal:

Pantalla Solucin de la regresin Lineal. (Ecuaciones cuadrticas)

Pantalla Solucin de la regresin Lineal. (Ecuaciones de tercer grado)

Ejercicio de Aplicacin ANTECEDENTES DEL PROBLEMA Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observ el peso de una persona seleccionada de entre el grupo con dicha estatura, resultando: X Y 152 155 152 155 157 152 157 165 162 178 183 178 50 61.5 54.5 57.5 63.5 59 61 72 66 72 84 82

Con estos datos vamos a plantear una ecuacin de regresin simple que nos permita pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, DESARROLLO

Representacin matemtica y grfica de los datos:

Representacin Matemtica I.C. para la I. C. media individual L. S. L. I. L. S. 53.07 59.79 47.30 65.56 56.09 61.97 50.05 68.02 53.07 59.79 47.30 65.56 56.09 61.97 50.05 68.02 58.05 63.48 51.85 69.68 53.07 59.79 47.30 65.56 58.05 63.48 51.85 69.68 65.17 70.24 58.85 76.57 62.65 67.56 56.27 73.94 74.65 83.33 69.45 88.52 78.01 88.64 73.31 93.34 74.65 83.33 69.45 88.52

estatura pesos datos x 1 2 3 4 5 6 7 8 9 10 11 12 152 155 152 155 157 152 157 165 162 178 183 178 y 50 x ^2

Regresin Lineal y ^2 xy 7600 23104 2500 56.43 -6.43 56.43 -1.93

y est. Residual L. I.

61.5 24025 3782.3 9532.5 59.03 2.47 54.5 23104 2970.3 8284 57.5 24025 3306.3 8912.5 59.03 -1.53 63.5 24649 4032.3 9969.5 60.77 2.73 59 61 72 66 72 84 82 23104 3481 24649 3721 27225 5184 26244 4356 31684 5184 33489 7056 31684 6724 8968 9577 56.43 2.57 60.77 0.23

11880 67.71 4.29 10692 65.11 0.89 12816 78.99 -6.99 15372 83.32 0.68 14596 78.99 3.01

Representacin Grfica

Se obtiene un valor F = 73.08 > 4.96, con lo cual se rechaza la hiptesis nula y aceptamos que la variable estatura est relacionada con la variable peso con un 95% de confianza.

De acuerdo al desarrollo matemtico hemos obtenido los siguientes clculos:

Lo que nos permite obtener los coeficientes a y b. Luego, b = 1223 / 1409.667 = 0.8676 a = 65.25 (0.8676) (162.167) = -75.446

INTERPRETACIN

La ecuacin de regresin estimada es:

Coeficiente de correlacin: R= 0.9379 Coeficiente de determinacin: R=0.8796 El valor de b = 0.8676 indica el incremento del peso en kilogramos, en promedio, por cada centmetro de aumento en la estatura de los hombres adultos. El valor de a, no tiene interpretacin prctica en el ejemplo, se interpretara como el valor obtenido, en promedio, para el peso Y, cuando la estatura es 0. Utilizando la ecuacin de regresin para estimar o predecir valores de la variable Y: Para una talla de 180 se obtiene un peso de 80.7 kg. Cunto se espera que pese (en promedio) una persona que mide 1.60 m? Sustituyendo el valor de inters en la ecuacin:

Se obtiene:

Conclusiones La ecuacin de Regresin Lineal estimada para las variables estatura y peso muestran, de acuerdo a la prueba F, relacin. Esta relacin se ha estimado en un R = 93.7, que indica una fuerte relacin positiva. Adems si consideramos el coeficiente de determinacin R = 87.9 podemos indicar que el 87.9% de las variaciones que ocurren en el peso se explicaran por las variaciones en la variable estatura.

Bibliografa:
http://www.sc.ehu.es/sbweb/fisica/cursoJava/numerico/regresion/regresion.htm http://www.eumed.net/cursecon/medir/introd.htm http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal http://www.ugr.es/~ramongs/sociologia/tema4_regresion http://www.monografias.com/trabajos27/regresion-simple/regresion-simple.shtml

Вам также может понравиться