Вы находитесь на странице: 1из 11

Universidad Mariano Glvez

Ingeniera en Sistemas de Informacin


4to. Semestre
Seccin A
Estadstica I
Ing. Rudy Santisteban

Regresin y Correlacin

Alvin Steve
Padilla Meza
3090-10-11973
Mazatenango 1 de Agosto del 2015

Objetivos
General:
Destacar la importancia y la utilidad de la Regresin y Correlacin para modelar
e investigar la relacin entre dos variables.

Especficos:

Definir lo que es Regresin y Correlacin.


Conocer los tipos de Regresin y Correlacin que existen.
Conocer las ecuaciones de Regresin que existen como son.

Regresin
La regresin es una tcnica estadstica utilizada para simular la relacin
existente entre dos o ms variables. Por lo tanto se puede emplear para
construir un modelo que permita predecir el comportamiento de una variable
dada.
La regresin es muy utilizada para interpretar situaciones reales, pero
comnmente se hace de mala forma, por lo cual es necesario realizar una
seleccin adecuada de las variables que van a construir las ecuaciones de la
regresin, ya que tomar variables que no tengan relacin en la prctica, nos
arrojar un modelo carente de sentido, es decir ilgico.
En estadstica, el anlisis de la regresin es un proceso estadstico para la
estimacin de relaciones entre variables. Incluye muchas tcnicas para el
modelado y anlisis de diversas variables, cuando la atencin se centra en la
relacin entre una variable dependiente y una o ms variables independientes.
Ms especficamente, el anlisis de regresin ayuda a entender cmo el valor
tpico de la variable dependiente cambia cuando cualquiera de las variables
independientes es variada, mientras que se mantienen las otras variables
independientes fijas. Ms comnmente, el anlisis de regresin estima la
esperanza condicional de la variable dependiente dadas las variables
independientes - es decir, el valor promedio de la variable dependiente cuando
se fijan las variables independientes. Con menor frecuencia, la atencin se
centra en un cuantil, u otro parmetro de localizacin de la distribucin
condicional de la variable dependiente dadas las variables independientes. En
todos los casos, el objetivo es la estimacin de una funcin de las variables
independientes llamada la funcin de regresin. En el anlisis de regresin,
tambin es de inters para caracterizar la variacin de la variable dependiente
en torno a la funcin de regresin que puede ser descrito por una distribucin
de probabilidad.
Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano,
pueden darse alguna de las siguientes relaciones, Lineal, Logartmica,
Exponencial, Cuadrtica, entre otras. Las ecuaciones de cada relacin se
presentan en la siguiente tabla.
Tabla 1. Ecuaciones de regresin

REGRESIN ECUACIN
Lineal

y = A + Bx

Logartmica

y = A + BLn(x)

Exponencial

y = Ae(Bx)

Cuadrtica

y = A + Bx +Cx2

Modelos de regresin

Regresin lineal

Regresin lineal simple

Dadas dos variables (Y: variable dependiente; X: independiente) se trata de


encontrar una funcin simple (lineal) de X que nos permita aproximar Y mediante:
= a + bX
a (ordenada en el origen, constante)
b (pendiente de la recta)
A la cantidad e=Y- se le denomina residuo o error residual.
As, en el ejemplo de Pearson: = 85 cm + 0,5X
Donde es la altura predicha del hijo y X la altura del padre: En media,
el hijo gana 0,5 cm por cada cm del padre.

Regresin lineal mltiple

Regresin no lineal
REGRESIN LINEAL
A pesar de la sencillez de las funciones lineales tiene una importancia
fundamental. La regresin ser lineal cuando la funcin de ajuste seleccionada
sea una funcin lineal, una recta, se habla tambin de recta de regresin.
Recta de regresin de Y/X (M.C.O)
Pretendemos obtener como funcin de regresin que nos explique la variable Y
en funcin de los valores de X una funcin lineal, con el criterio de que minimice

los cuadrados de las diferencias entre los valores reales y los tericos (segn la
regresin).
La funcin de regresin a obtener es y* = a + b X con la pretensin de que
(yj - (a+b xi) ) 2.nij sea mnima .
Habr que encontrar los valores de los parmetros a y b que minimizan esa
expresin. Es decir que anulan simultneamente las derivadas parciales de la
funcin: (a,b)=

(yj - (a+b xi) ) 2.nij: (Sistema de ecuaciones normales)

=0

(yj -a-b xi ) . nij (-1)= 0

=0

2[

yj -a-b xi ) . nij ].[-

yj nij =a
yj xi nij = a

nij +b
xi nij +b

xi nij ] = 0

xi nij
xi2 nij

(*1)

Restando la segunda ecuacin por la primera multiplicada por -x, quedar:


Sxy=b S2x (*2)
De forma que d (*1) y de (*2) se concluye que los valores de a y b que
minimizan los cuadrados de los residuos y que, por tanto son los parmetros del
ajuste mnimo-cuadrtico sern:

La ecuacin de la recta de regresin Y/X quedar, por lo tanto como:

De (*1), o de la propia ecuacin de la recta se deduce que la recta de regresin


de Y/X pasa por el centro de gravedad de la distribucin.
Otra expresin alternativa de la recta de regresin de regresin Y/X es:

REGRESIN MNIMO-CUADRTICA
Consiste en explicar una de las variables en funcin de la otra a travs de un
determinado tipo de funcin (lineal, parablica, exponencial, etc.), de forma que
la funcin de regresin se obtiene ajustando las observaciones a la funcin
elegida, mediante el mtodo de Mnimos-Cuadrados (M.C.O.).
resin concreta se obtendr

minimizando la expresin:

(yj -

) ) 2. nij en el caso de la regresin de Y/X

(xi -

) ) 2. nij en el caso de la regresin de X/Y

Puede probarse que es equivalente ajustar por mnimos cuadrados la totalidad


de las observaciones (toda la nube de puntos) que realizar el ajuste de los puntos
obtenidos por la regresin de la media; de forma que la regresin mnimocuadrtica viene ser, en cierto modo, la consecucin de una expresin analtica
operativa para la regresin en sentido estricto.

REGRESIN MNIMO CUADRTICA NO-LINEAL


La regresin mnimo-cuadrtica puede plantearse de forma que la funcin de
ajuste se busca no sea una funcin lineal. El planteamiento general sera similar,
aunque obviamente habra que minimizar el cuadrado de los residuos entre los
datos originales y los valores tericos obtenibles a travs de la funcin no-lineal
considerada.

Regresin exponencial
Ser aquella en la que la funcin de ajuste ser una funcin exponencial del tipo
y = a.bx
La regresin exponencial aunque no es lineal es linealizable tomando logaritmos
ya que haciendo el cambio de variable.
v = log y tendremos que la funcin anterior nos generara:
v = log y = log( a.bx) = log a + x log b
La solucin de nuestro problema vendra de resolver la regresin lineal entre v
x, y una vez obtenida supuesta sta:
V* = A + B x; obviamente la solucin final ser:
a = antilog A y b = antilog B.
Regresin potencial.
Ser aquella en la que la funcin de ajuste sea una funcin potencial del tipo:
y = a. xb
Tambin en este caso se resuelve linealizando la funcin tomando logaritmos ya
que:
log y = log a + b log x
Considerando las nuevas variables v = log y u= log x resolveramos la regresin
lineal entre ellas de forma que si el resultado fuera: v*= A +B u

La solucin final quedara como a= antilog A y b= B


Regresin parablica .Desarrollaremos someramente la regresin Y/X y debe
quedar claro que la regresin X/Y resultara anloga.
Supongamos para simplificar que los datos no estn agrupados por frecuencias.
En tal caso, obtener la funcin parablica y* = a0+a1x+a2 x2 se llevar a cabo
determinado los valores de los tres parmetros a0,a1,a2 que minimicen :
0= (a0,a1,a2)=0 (yi- (a0+a1x+a2 x2)) 2
Igualando a cero las tres derivadas parciales se obtendr las ecuaciones
normales, que convenientemente manipuladas acaban siendo:

yj =N a0 + a1
yjxi = a0
yjxi2 = a0

xi + a2
xi + a1
xi2 + a1

xi 2
xi2 + a2
xi3 + a2

xi3
xi4

Sistema de ecuaciones del que se pueden despejar los valores de los coeficientes
de regresin.

Correlacin
En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de una
relacin lineal y proporcionalidad entre dos variables estadsticas. La correlacin
estadstica determina la relacin o dependencia que existe entre las dos variables
que intervienen en una distribucin bidimensional. Se considera que dos variables
cuantitativas estn correlacionadas cuando los valores de una de ellas varan
sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos
variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin
los de B y viceversa. La correlacin entre dos variables no implica, por s misma,
ninguna relacin de causalidad.

Es decir, determinar si los cambios en una de las variables influyen en los


cambios de la otra. En caso de que suceda, diremos que las variables estn
correlacionadas o que hay correlacin entre ellas.
Coeficiente de correlacin
El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades
1. El coeficiente de correlacin no vara al hacerlo la escala de medicin.
Es decir, si expresamos la altura en metros o en centmetros el coeficiente de
correlacin no vara.
2. El signo del coeficiente de correlacin es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.

3. El coeficiente de correlacin lineal es un nmero real comprendido entre


menos 1 y 1.
1 r 1
4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin
es dbil.
7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente.
Entre ambas variables hay dependencia funcional.

Conclusiones

En esta investigacin fue utilizada para llegar a la conclusin en este caso el


tema se relacionaba con Regresin y Correlacin y fueron los siguientes
aspectos:
Se concluy que Regresin es una tcnica estadstica utilizada para
simular la relacin existente entre dos o ms variables. Tambin se puede
decir es muy utilizada para interpretar situaciones reales, pero
comnmente se hace de mala forma, por lo cual es necesario realizar una
seleccin adecuada de las variables que van a construir las ecuaciones de
la regresin, ya que tomar variables que no tengan relacin en la prctica,
nos arrojar un modelo carente de sentido, es decir ilgico.
Tambin se defini algunos de los tipos de Regresin que existen en este
caso son: Regresin Lineal, Regresin Potencial, Regresin Logartmica,
Regresin Exponencial y Cuadrtica, etc.
Tambin se conoci las ecuaciones que se utiliza en los diferentes tipos
de regresin que existen y estas son:
REGRESIN ECUACIN
Lineal

y = A + Bx

Logartmica

y = A + BLn(x)

Exponencial

y = Ae(Bx)

Cuadrtica

y = A + Bx +Cx2

Вам также может понравиться