Вы находитесь на странице: 1из 5

EJEMPLO DE REGRESIÓN LINEAL Y NO LINEAL

A partir de las siguientes observaciones para 5 años de las variables X e Y,


ajústese el modelo de regresión de Y en función de X más idóneo.
Donde,
Y: producción nacional de un subsector industrial, en millones de toneladas.
X: tiempo
Año X Y
1995 1 1,25
1996 2 5
1997 3 11,25
1998 4 20
1999 5 30,5

1.- Ajuste de una función lineal: Y* = a + b X


X Y X2 XY Y2 Y* e=Y-Y* e2
1 1,25 1 1,25 1,56 -1,1 2,35 5,5225
2 5 4 10 25 6,25 -1,25 1,5625
3 11,25 9 33,75 126,56 13,6 -2,35 5,5225
4 20 16 80 400 20,95 -0,95 0,9025
5 30,5 25 152,5 930,25 28,3 2,2 4,84
 15 68 55 277,5 1483,3 68 0 18,35
1/5  3 13,6 11 55,5 296,67 13,6 0 3,67

S XY 1/5 XY - X Y 55,5 - (3  13,6) 14,7


b     7,35
S 2X 1/5 X 2  X 2 11  3 2 2

a  Y - b X  13,6 - 7,35  3  - 8,45

Y * = -8,45 + 7,35 X

Bondad del Ajuste:

2
S2 * S e2 3,67
2
Coeficiente de determinación: R = r XY = Y
2
 1- 2
 1-  0,9671
S Y S Y
111,715

S 2Y  1/5 Y 2  Y 2  296,675 - 13,6 2  111,715

S e  ECM1
2

e 2

 3,67
N

1
2.- Ajuste de una función parabólica: Y* = a + b X + c X2
X Y X2 X3 X4 XY X2Y Y* e=Y-Y* e2
1 1,25 1 1 1 1,25 1,25 1,18 0,07 0,0049
2 5 4 8 16 10 20 5,11 -0,11 0,0121
3 11,25 9 27 81 33,75 101,5 11,32 -0,07 0,0049
4 20 16 64 256 80 320 19,81 0,19 0,0361
5 30,5 25 125 625 152,5 762,5 30,58 -0,08 0,0064
 15 68 55 225 979 277,5 1205 68 0 0,0644
1/5 3 13,6 11 55,5 13,6 0 0,0128

Aplicando el método de los mínimos cuadrados se obtiene el siguiente sistema de


ecuaciones:

 Y  Na  b  X  c  X 2


68  5a  15b  55c 

 XY  a X  b X  c  X 2 3
  277,5  15a  55b  225c 
 1205  55a  225b  979c 
 X Y  a X  b X  c  X
2 2 3 4

Resolviendo este sistema se obtiene: a= -0,47 b= 0,51 c= 1,14
Y * = -0,47 + 0,51 X + 1,14 X2

Bondad del Ajuste:


S2 * S 2e 0,01288
2
Coeficiente de determinación: R = Y
2
 1- 2
 1-  0,9998
S Y S Y
111,715

S e  ECM 2
2

e 2

 0,01288
N

3.- Ajuste de una función potencial: Y* = a Xb


En primer lugar linealizamos: lnY* = lna + b lnX  V* = A + b U
X Y U=lnX V=lnY U2 UV Y* e=Y-Y* e2
1 1,25 0 0,2231 0 0 1,2557 -0,0057 0,0000
2 5 0,6931 1,6094 0,4803 1,1156 4,9888 0,0112 0,0001
3 11,25 1,0986 2,4203 1,2069 2,6590 11,18 0,0697 0,0049
4 20 1,3863 2,9957 1,9215 4,1530 19,82 0,1799 0,0324
5 30,5 1,6094 3,4177 2,5901 5,5006 30,901 -0,4012 0,1610
 15 68 4,7875 10,666 6,1988 13,428 68,146 -0,1461 0,1984
1/5 3 13,6 0,9575 2,1332 1,2397 2,6856 13,629 -0,0292 0,0397

e0

2
S UV 1/5 UV - U V 2,6856 - 0,9575  2,1332
b    1,9902
S U2 1/5 U2  U 2 1,2397  0,9575 2

A  V - b U  2,1332 - 1,9902  0,9575  0,2277

Deshacemos el cambio efectuado: a= antilnA = antiln 0,2277 = 1,2557


Por lo que el ajuste efectuado es: Y* = 1,2557 X 1,9902

Bondad del Ajuste:

ECM3 
e 2

 0,0397
N
Nótese que al haber transformado la variable dependiente ya no se minimiza

e 2
sino  (lnY - lnY * ) 2 , de ahí que e  0.

4.- Ajuste de una función exponencial: Y* = a bX


En primer lugar linealizamos: lnY* = lna + X lnb  V* = A + B X
X Y V=lnY X2 XV Y* e=Y-Y* e2
1 1,25 0,2231 1 0,2231 1,7794 -0,529 0,2798
2 5 1,6094 4 3,2188 3,86 1,138 1,2950
3 11,25 2,4203 9 7,2609 8,37 2,88 8,2944
4 20 2,9957 16 11,983 18,18 1,82 3,3124
5 30,5 3,4177 25 17,088 39,45 -8,95 80,102
 15 68 10,666 55 39,774 71,64 -3,641 95,803
1/5 3 13,6 2,1332 11 7,9548 14,328 -0,728 19,16

e0
S XV 1/5 XV - X V 7,9548 - 2,1332  3
B    0,7776
S 2
X 1/5 X  X 2 2
11  3 2

A  V - b X  2,1332 - 0,7776  3  - 0,1996

Deshacemos los cambios efectuados: a= antilnA = antiln-0,1996 = 0,819

b= antilnB =antiln 0,7776 = 2,176


Por lo que el ajuste efectuado es: Y* = 0,819 . 2,176 X

Bondad del Ajuste:

ECM 4 
e 2

 19,16
N

3
La comparación de la bondad de modelos de regresión mediante el coeficiente de
determinación sólo es correcta cuando la variable dependiente no ha sido
sometida a transformaciones no lineales (por ejemplo, una transformación
logarítmica). En este ejercicio, mediante R2 sólo podemos comparar la regresión
lineal y la parabólica. Por eso, para comparar los cuatro ajustes efectuados
utilizamos el Error Cuadrático Medio. El mejor ajuste resulta ser el parabólico
puesto que presenta el menor valor para el ECM.

4
Producción observada en función del tiempo
40

30
Y (producción)

20

10

0
1 2 3 4 5

X (tiempo)

Representación de los 4 modelos de regresión


40
Y real y teóricas (Producción)

30
Y (producción)
X (tiempo)

20 Y*1 lineal
X (tiempo)

Y*2 parábola
10
X (tiempo)

Y*3 potencial
0 X (tiempo)

Y*4 exponencial
-10 X (tiempo)
1 2 3 4 5

X (tiempo)

Вам также может понравиться