Вы находитесь на странице: 1из 4

40

REGRESIN LINEAL SIMPLE




1. INTODUCCION
En muchas aplicaciones estadstica se debe resolver problemas que contiene un conjunto de
variables y que se sabe existe alguna asociacin entre ellas. En este conjunto de variables muy a
menudo se tiene una sola variable dependiente, que depende de una o ms variable
independiente.

La primera forma del estudio de la asociacin entre las variables X e Y es la regresin, que
consiste en determinar una relacin funcional entre ellas, con el fin de que se pueda predecir
el valor de una variable en base a la otra. La variable que se va predecir se denomina
variable dependiente y la variable que es la base de la preedicin se denomina variable
independiente.

La segunda forma del estudio de la asociacin entre las variables X e Y, es denominada
correlacin, que consiste en determinar la variacin conjunta de las dos variables, su grado de
relacin y su sentido. La medida del grado de la relacin se denomina coeficiente de
correlacin. El cuadrado del ndice de correlacin se denomina coeficiente de determinacin.

Se realizara un estudio de la regresin lineal en el sentido que, la ecuacin de regresin que se
calcula ser valida, solo si hay la seguridad de que existe un alto nivel de correlacin entre las
variable medido por el coeficiente de determinacin.

Los mtodos de regresin y de correlacin se clasifican por el numero de variable independiente
en simple o mltiple. El anlisis de asociacin se denomina simple, si hay una sola variable
independiente. Si hay dos o mas variable independiente se denomina anlisis de asociacin
mltiple.

2. DIAGRAMA DE DISPERSIN
Se denomina diagrama de dispersin o nube de puntos, a la grafica de los valores (x,y) de
las variables X e Y en el sistema cartesiano.
Es frecuente visualizar el tipo de relacin existente entre dos variables a partir del diagrama de
dispersin.

3. LA COVARIANZA
La covarianza de los datos observado en una muestra es la estadstica que mide el nivel de la
variabilidad conjunta de los datos de las variables en pareja con respecto a sus medias
respectivas.
___ __ ____
) , cov( y x xy y x

4. EL COEFICIENTE DE CORRELACION
El coeficiente de correlacin lineal de Pearson de los n pares de valores de una variable
bidimensional (x,y) es el numero abstracto o relativo r que se calcula por:

y x
y x
r
) , cov(


El coeficiente de correlacin de la muestra es un nmero real comprendido entre -1 y 1
El grado o nivel de ajuste de la ecuacin a los datos se analiza en forma descriptiva aplicando el
coeficiente de determinacin que se define como el cuadrado del coeficiente de correlacin.


Direccin de Formacin General

41
5. REGRESIN LINEAL SIMPLE.
Dados n pares de valores de una variable bidimensional, la regresin lineal simple Y con
respecto a X, consiste en determinar la ecuacin de la recta:

Y = a + bx

Que mejor se ajusta a los valores de la muestra, con el fin de poder predecir o estimar Y a
partir de X.

El proceso de predecir o estimar Y a partir de la variables X , es la regresin. Hallar la
funcin lineal, consiste en determinar las constante a y b a partir de los datos de la
muestra.

2
) , cov(
x
y x
b



__ __
x b y a

El proceso de predecir o estimar Y a partir de la variables X , es la regresin. Hallar la
funcin lineal, consiste en determinar las constante a y b a partir de los datos de la
muestra.

6. COEFICIENTE DE DETERMINACION.
El coeficiente de determinacin es una medida de la proximidad del ajuste de la recta de regresin.
Cuanto mayor sea el valor, mejor ser el ajuste y mas til la recta de regresin como instrumento
de prediccin; para calcular el coeficiente de determinacin se eleva al cuadrado el coeficiente de
correlacin.

7. VARIANZA ESTIMADA DE REGRESION
El segundo mtodo para medir el ajuste de la estimacin del modelo de regresin a los datos de la
muestra, es aplicar el error estndar de la estimacin, que desarrollaremos a continuacin:

2 2
2
2


n
xy b y a y
n
SCE
s

La raz cuadrada positiva de la varianza de regresin es la desviacin estndar de la regresin, y
se le denomina error estndar de estimacin.
El error estndar de la estimacin al igual que la varianza, es una medida de la dispersin o
concentracin de los valores observados alrededor del modelo de regresin.
Mientras mas pequeo sea el valor del error estndar de estimacin, mas cercano a la lnea de
regresin estarn los valores estimados.

8. INFERENCIA ACERCA DE LOS COEFIENCIENTE DE REGRESION
No trataremos las inferencia acerca del parmetro a porque a menudo carece de importancia,
pues a es la ordenada en el origen y representa la interseccin de los ejes cuando x = 0
Nos referimos a la inferencia acerca del parmetro b la pendiente de la lnea de regresin en la
poblacin.
Antes de aplicar el modelo estimado de la regresin lineal para realizar predicciones de Y en
funcin de X, se debe analizar si el valor de la pendiente B es o no es significativo.
Entonces para evaluar el parmetro se puede utilizar cualquiera de los tres mtodos:
Intervalo de confianza b
Prueba de hiptesis b
Anlisis de varianza para b



INTERVALO DE CONFIANZA
Para poder calcular el intervalo de confianza se debe realizar los siguientes pasos:

Diferencia cuadrada de x con respecto ala media:


2
___
2
X n X S
XX


42
Varianza estimada de b:
xx
b
s
s
S
2


Error estndar de b:
2
b b
s S

Limite inferior: E b LI

Limite superior: E b LS

Error de estimacin:
b
s n t E ) 2 ;
2
1 (



Si el valor cero pertenece al intervalo entonces decimos que la b es igual a cero que no es
significativo en el modelo.

PRUEBA DE HIPOTESIS
Si se plantea la hiptesis que b es igual a cero; esta hiptesis se rechazara si el valor
encontrado en la tabla es menor que el valor del estadstico.

Valor de la tabla: ) 2 ;
2
1 ( n t



Valor del estadstico:
b
s
b
t

ANALISIS DE VARIANZA
El mtodo del ANOVA de la regresin lineal simple plantea la hiptesis nula si b es igual a cero:

SUMA CUADRADO TOTAL


2
___
2
y n y SCT

SUMA CUADRADO DE REGRESION

) (
___ __
y x n xy b SCR

SUMA CUADRADO DEL ERROR SCR SCT SCE

CUDRADO MEDIO DE REGRESION SCR CMR

CUADRADO MEDIO DEL ERROR
2

n
SCE
CME

VALOR DEL ESTADISTICO
CME
CMR
F


VALOR DE LA TABLA ) 1 , 2 , 1 (

n F

Si el valor del estadstico es mayor que el valor de la tabla entonces se rechaza la hiptesis nula.

9 APLICACIN DEL MODELO
Despus de haber analizado la validez del modelo de regresin lineal calculado de la muestra y
comprobado la existencia de regresin lineal en la poblacin de la cual se ha obtenido la muestra, o
mas especficamente despus de haber concluido que el modelo lineal estimado es adecuado
para describir la relacin lineal entre X e Y , se puede aplicar esta estimacin del modelo de
regresin, para pronosticar o predecir el valor y para un valor especifico de x.

43
El primero es estimar el valor medio de todo los valores de y que corresponde al valor x en un
intervalo de confianza.
El segundo es predecir un solo valor y de todo los valores de y que corresponde a x y calcular
los extremo de esta preedicin.

INTERRVALO DE CONFIANZA PARA EL VALOR MEDIO DE Y

Limite inferior: E Y LI
0


Limite superior: E Y LS
0


Error de estimacin:
xx
s
x x
n
s n t E
2
__
0
) ( 1
) 2 ;
2
1 (





INTERVALO DE CONFIANZA PARA UN SOLO VALOR DE Y

Limite inferior: E Y LI
0


Limite superior: E Y LS
0


Error de estimacin:
xx
s
x x
n
s n t E
2
__
0
) ( 1
1 ) 2 ;
2
1 (





Ejemplo 1
El gerente de la empresa estudia la relacin que existe entre las variables gastos (y) y salario
(x) de un personal obrero, a la vez trata de encontrar la ecuacin de regresin para hacer
estimaciones.

x y
28 25
25 20
35 32
40 37
45 40
35 30
70 55
80 60

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

Вам также может понравиться