Академический Документы
Профессиональный Документы
Культура Документы
GUADALAJARA
Introduccin
Regresin
El conjunto de tcnicas que utilizamos para construir y
evaluar modelos que describen la relacin entre variables y
para formular inferencias basadas en los modelos obtenidos
se conocen colectivamente como Tcnicas de Regresin, y al
anlisis estadstico que resulta de aplicarlas se le denomina
Anlisis de Regresin.
En general, el anlisis de regresin permite estudiar la
influencia de una o ms variables que llamamos independientes
sobre otra que llamamos dependiente.
Si se incluyen dos o ms variables independientes se tiene
un modelo de regresin mltiple, situacin que no ser cubierta
en esta breve introduccin, sino que nicamente se hace
mencin del modelo de regresin simple, concretamente al
modelo de Regresin Lineal Simple.
Tipos de Regresin
En primer lugar, en funcin del nmero de variables independientes:
Regresin simple: Cuando la variable Y depende de una nica
variable X.
Regresin mltiple: Cuando la variable Y depende de varias
variables (X1, X2, ..., Xr).
En segundo lugar, con respecto al tipo de funcin f(X):
Regresin lineal: Cuando f(X) es una funcin lineal.
Regresin no lineal: Cuando f(X) no es una funcin lineal.
Dentro de sta clasificacin podemos encontrar: regresin
cuadrtica, cbica, logartmica, entre otras.
Correlograma
El primer paso en un anlisis de regresin es elaborar el
diagrama de dispersin (correlograma) de los datos, ya que ste
puede ayudar en la bsqueda de un modelo que describa la
relacin entre la variable independiente (x) y la dependiente (y).
Con frecuencia en la prctica se presentan problemas que
consideran el estudio de dos variables. Tal cuestin obliga a
explorar grficas que permiten explorar asociacin entre
variables. El grfico ms antiguo conocido para representar
datos bivariados es el correlograma.
Un correlograma es una grfica de puntos que nos representa
un conjunto de datos bivariados en un plano cartesiano. El
correlograma es una de las herramientas ms potentes para
investigar la dependencia de una variable Y sobre una variable
X.
Ejemplo:
Tabla 1. Nmero de horas dedicadas a preparar un examen (x) y
calificacin obtenida en dicha prueba (y).
2 3 3 4 4 5 5 6 6 6 7 7
8 8
5 5 7 5 7 7 8 4 9 8 7 9 10 8 9
Correlacin Lineal
El objetivo central del anlisis de correlacin lineal es medir la
intensidad de una relacin lineal entre dos variables
La intensidad mencionada es medida por medio del coeficiente
de correlacin lineal r.
El coeficiente refleja el grado de relacin o efecto que tiene el
cambio de una variable sobre otra.
El valor del coeficiente de correlacin lineal ayuda a contestar la
pregunta: Existe correlacin lineal entre las dos variables
consideradas? El coeficiente de correlacin lineal r siempre
tiene un valor entre -1 y +1.
Un valor igual a +1 indica una correlacin perfecta positiva.
Mientras que un valor igual a -1 indica una correlacin perfecta
negativa.
xi yi
i =1
r=
xy
n 2
n 2
xi
yi
i =1 x 2 i =1 y 2
n
n
Ejemplo: Tabla
Calificacin
(y)
xy
10
25
15
25
21
49
20
16
25
28
16
49
35
25
49
40
25
64
24
36
16
54
36
81
10
48
36
64
11
49
49
49
12
63
49
81
13
10
70
49
100
14
64
64
64
15
72
64
81
Total
81
108
613
487
822
Promedio
5.4
7.2
40.9
32.47
54.8
No.
Solucin:
r=
40.9 38.88
=
(32.47 29.16)(54.8 51.84)
2.02
2.02
=
= 0.65
(3.31)(2.96) 3.13
y = + x
0
y = b0 + b1 x
donde las estimaciones b0 y b1 representan la intercepcin y
pendiente de x , representativamente.
GASTOS (Y)
80
70
100
65
120
90
140
95
160
110
180
115
200
120
220
140
240
155
10
260
150
X^2
Y^2
XY
1
2
3
4
5
6
7
8
9
10
80
100
120
140
160
180
200
220
240
260
1700
70
65
90
95
110
115
120
140
155
150
1110
6400
10000
14400
19600
25600
32400
40000
48400
57600
67000
322000
4900
4225
8100
9025
12100
13225
14400
19600
24025
22500
132100
5600
6500
10800
13300
17600
20700
24000
30800
37200
39000
205500
-41
-46
-21
-16
-1
4
9
29
44
39
0
3690
3220
1050
480
10
40
270
1450
3080
3510
16800
Y est
yi-Y est
65.18
75.36
85.54
95.72
105.91
116.09
126.27
136.45
146.63
156.82
1110.01
4.81
-10.36
4.45
-0.72
4.08
-1.09
-6.27
3.54
8.36
-6.82
-0.015
{(
n
n
n X i Y i X i Y i
i =1
i =1
b1 = i =1
2
n
n
2
n X X i
i =1
i =1
y
b0 =
Y
i =1
b1 X i
i =1
Normalidad
Independencia No autocorrelacin de los errores
Homogeneidad de varianzas
donde
donde
y
0
Intervalos de confianza
y
0
y
0
Prueba de hiptesis
En la regresin lineal simple es de gran inters e importancia probar
la hiptesis sobre si el valor verdadero de 1 es cero, ya que si 1
fuese cero el modelo se reducira, lo que indicara que la variable X
no incrementa la explicacin del comportamiento de la variable Y,
haciendo intil el anlisis de regresin entre estas dos variables.
Estadstico de prueba:
Decisin:
Estadstico de prueba:
Decisin:
Estadstico de prueba:
Decisin:
Estadstico de prueba:
Decisin:
Coeficiente de Determinacin
donde
(101.106,110.712)
LI
56.38
67.9
79.27
90.39
101.1
111.29
120.93
130.18
139.17
148.02
65.18
75.36
85.55
95.73
105.91
116.09
126.27
136.46
146.64
156.82
Aspecto Importante
Transformaciones lineales
Regresin Cuadrtica
Un modelo cuadrtico es de la forma:
Grficas de Regresin