Академический Документы
Профессиональный Документы
Культура Документы
lineal o ajuste
relacin
entre
lineal es
unavariable
dependiente Y,
las variables independientes Xi y un trmino aleatorio . Este modelo puede ser expresado
como:
respectivos
cada
variable
independiente,
es
nmero
de
parmetros
(k =
(2)
donde
controlables u observables y que por tanto se asocian con el azar, y es la que confiere al
modelo su carcter estocstico. En el caso ms sencillo, con una sola variable explicita,
el hiperplano es una recta:
(3)
El problema de la regresin consiste en elegir unos valores determinados para los
parmetros
desconocidos
de
modo
que
la ecuacin quede
completamente
especificada. Para ello se necesita un conjunto de observaciones. En una observacin isima (i= 1,... I) cualquiera, se registra el comportamiento simultneo de la variable
dependiente y las variables explicitas (las perturbaciones aleatorias se suponen no
observables).
(4)
Los valores escogidos como estimadores de los parmetros
regresin sin que se pueda garantizar que coincida n con parmetros reales del proceso
generador. Por tanto, en
(5)
Los valores
donde
que
con
(media
igual
un
).
Anlisis[editar]
Dado el modelo de regresin simple, si se calcula la esperanza (valor esperado) del
valor Y, se obtiene:5
(7)
Derivando respecto a
(9)
(10)
Obteniendo
dos
ecuaciones
denominadas ecuaciones
normales que
generan
la
(11)
(12)
La interpretacin del parmetro medio
incrementar en
Regresin lineal mltiple[editar]
La regresin lineal permite trabajar con una variable a nivel de intervalo o razn. De la
misma manera, es posible analizar la relacin entre dos o ms variables a travs de
ecuaciones, lo que se denomina regresin mltiple o regresin lineal mltiple.
modo que
con
).
Rectas de regresin[editar]
Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos (o
tambin llamado diagrama de dispersin) generada por una distribucin binomial.
Matemticamente, son posibles dos rectas de mximo ajuste:7
(14)
(15)
La correlacin ("r") de las rectas determinar la calidad del ajuste. Si r es cercano o igual
a 1, el ajuste ser bueno y las predicciones realizadas a partir del modelo obtenido sern
muy fiables (el modelo obtenido resulta verdaderamente representativo); si r es cercano o
igual a 0, se tratar de un ajuste malo en el que las predicciones que se realicen a partir
del modelo obtenido no sern fiables (el modelo obtenido no resulta representativo de la
realidad). Ambas rectas de regresin se intersecan en un punto llamado centro de
gravedad de la distribucin.
Aplicaciones de la regresin lineal[editar]
Lneas de tendencia[editar]
Vase tambin: Tendencia
Una lnea de tendencia representa una tendencia en una serie de datos obtenidos a
travs de un largo perodo. Este tipo de lneas puede decirnos si un conjunto de datos en
particular (como por ejemplo, el PBI, el precio del petrleo o el valor de las acciones) han
aumentado o decrementado en un determinado perodo.8 Se puede dibujar una lnea de
tendencia a simple vista fcilmente a partir de un grupo de puntos, pero su posicin y
pendiente se calcula de manera ms precisa utilizando tcnicas estadsticas como las
regresiones lineales. Las lneas de tendencia son generalmente lneas rectas, aunque
algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura
deseada en la lnea.
Medicina[editar]
En medicina,
las
primeras
evidencias
relacionando
la mortalidad con
el fumar tabaco9 vinieron de estudios que utilizaban la regresin lineal. Los investigadores
incluyen una gran cantidad de variables en su anlisis de regresin en un esfuerzo por
eliminar
factores
que
pudieran
producir correlaciones
espurias.
En
el
caso
De manera equivalente, otra formulacin del modelo de regresin lineal simple sera:
si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde,
entonces
La forma establece el tipo de lnea que define el mejor ajuste: la lnea recta,
la curva monotnica o la curva no monotnica
Coeficientes de correlacin[editar]
Correlacin cannica
Interpretacin geomtrica[editar]
Dados
los
valores
muestrales
de
dos
variables
aleatorias
e
, que pueden ser consideradas como vectores en un espacio
a n dimensiones, pueden construirse los "vectores centrados" como:
e
El coseno del ngulo alfa entre estos vectores es dada por la frmula siguiente:
Pues
es el coeficiente de correlacin muestral de Pearson. El coeficiente de
correlacin es el coseno entre ambos vectores centrados:
Si r = 1, el ngulo
Si r = 0, el ngulo
Si r =-1, el ngulo
opuesto.
Ms generalmente:
Por supuesto, del punto vista geomtrica, no hablamos de correlacin lineal: el coeficiente
de correlacin tiene siempre un sentido, cualquiera si que sea su valor entre -1 y 1. Nos
informa de modo preciso, no tanto sobre el grado de dependencia entre las variables, que
sobre su distancia angular en la hiperesfera a n dimensiones.
La Iconografa de las correlaciones es un mtodo de anlisis multidimensional que reposa
en esta idea. La correlacin lineal se da cuando en una nube de puntos estos se
encuentran o se distribuyen alrededor de una recta.
La frmula de correlacin para dos series distintas con cierto desfase "k", est dada por la
frmula:
donde:
es la distribucin gamma
es la funcin gaussiana hipergeomtrica.
Ntese que
de .
for
Aunque, la solucn:
buscando el mximo de la
, i.e.
En el caso especial de que
como:
donde
es la funcin beta.
http://es.wikipedia.org/wiki/Correlaci%C3%B3n
La correlacin estadstica constituye una tcnica estadstica que nos indica si dos
variables estn relacionadas o no.
Por ejemplo, considera que las variables son el ingreso familiar y el gasto familiar. Se
sabe que los aumentos de ingresos y gastos disminuyen juntos. Por lo tanto, estn
relacionados en el sentido de que el cambio en cualquier variable estar acompaado por
un cambio en la otra variable.
De la misma manera, los precios y la demanda de un producto son variables
relacionadas; cuando los precios aumentan la demanda tender a disminuir y viceversa.
Si el cambio en una variable est acompaado de un cambio en la otra, entonces se dice
que las variables estn correlacionadas. Por lo tanto, podemos decir que el ingreso
familiar y gastos familiares y el precio y la demanda estn correlacionados.
Relacin Entre las Variables
La correlacin puede decir algo acerca de la relacin entre las variables. Se utiliza para
entender:
1.
2.
la fuerza de la relacin.
Valor de r
Fuerza de relacin
Fuerte
Moderada
Dbil
-0,1 A 0,1
Ninguna o muy dbil
La correlacin es solamente apropiada para examinar la relacin entre datos
cuantificables significativos (por ejemplo, la presin atmosfrica o la temperatura) en vez
de datos categricos, tales como el sexo, el color favorito, etc.
Desventajas
Si bien 'r' (coeficiente de correlacin) es una herramienta poderosa, debe ser utilizada con
cuidado.
1.
Los coeficientes de correlacin ms utilizados slo miden una relacin lineal. Por
lo tanto, es perfectamente posible que, si bien existe una fuerte relacin no lineal entre
las variables, r est cerca de 0 o igual a 0. En tal caso, un diagrama de dispersin
puede indicar aproximadamente la existencia o no de una relacin no lineal.
2.
Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podra calcular
'r' entre el nmero de calzado y la inteligencia de las personas, la altura y los ingresos.
Cualquiera sea el valor de 'r', no tiene sentido y por lo tanto es llamado correlacin de
oportunidad o sin sentido.
3.
'R' no debe ser utilizado para decir algo sobre la relacin entre causa y efecto.
Dicho de otra manera, al examinar el valor de 'r' podramos concluir que las variables X
e Y estn relacionadas. Sin embargo, el mismo valor de 'r no nos dice si X nfluencia a
Y o al revs. La correlacin estadstica no debe ser la herramienta principal
paraestudiar la causalidad, por el problema con las terceras variables.
https://explorable.com/es/la-correlacion-estadistica