Вы находитесь на странице: 1из 33

UNIVERSIDAD NACIONAL ABIERTA

VICERRECTORADO ACADMICO
COORDINACIN DE EVALUACIN ACADMICA

TAREA:
TRABAJO PRCTICO: X
ASIGNATURA: Estadstica Aplicada
CDIGO: 746
FECHA DE ENTREGA AL ESTUDIANTE: 04/03/2013
FECHA DE DEVOLUCIN:
NOMBRE DEL ESTUDIANTE:
CDULA DE IDENTIDAD:
CENTRO LOCAL:
CARRERA:
NUMERO DE ORIGINALES:
FIRMA DEL ESTUDIANTE:
DIRECCIN DE CORREO ELECTRONICO:
UTILICE ESTA MISMA PAGINA COMO CARATULA DE SU
TAREA O TRABAJO PRCTICO

RESUMEN

Una empresa inmobiliaria solicita, a una empresa consultora, un estudio del


mercado inmobiliario de un municipio de alta oferta y demanda. Para ello, la empresa
consultora toma en cuenta una serie de variables, se analizaron los datos con un
programa computarizado bajo la plataforma Windows XP con Office Excel 2003, el
cual recopil los datos por columnas tomando en cuenta las variables que
intervinieron en el estudio.
Se analizaron los datos con un programa computarizado bajo la plataforma
Windows XP con Office Excel 2003, el cual recopil los datos por columnas
tomando en cuenta las variables que intervinieron en el estudio. Cabe destacar que de
ellas se aplic un estudio de parmetros probabilsticos, entre ellos un anlisis de
varianza y un anlisis residual, donde se grafic la relacin de cada variable
independiente con la dependiente, obtenindose de ellas una serie de identificaciones
que permitieron evaluar el mtodo que mejor relacionaba la variable independiente
con las dems.

INDICE

Pp.
Resumen.. 2
ndice..

Introduccin

Mtodo

Instrumentos/Materiales.. 22
Procedimientos 23
Resultados..

23

Discusin

44

Conclusiones..

46

Referencias

48

Apndices 49

INTRODUCCIN

La regresin estadstica o regresin a la media es la tendencia de una medicin


extrema a presentarse ms cercana a la media en una segunda medicin. La regresin
se utiliza para predecir una medida basndonos en el conocimiento de otra. El
trmino regresin fue introducido por Francis Galton en su libro Natural inheritance
(1889), partiendo de los anlisis estadsticos de Karl Pearson. Su trabajo se centr en
la descripcin de los rasgos fsicos de los descendientes a partir de los de sus padres.
Los tipos de regresin ms comunes entre dos variables son la regresin:
lineal, logartmica, exponencial, cuadrtica y cbica. Cuando hay ms de una variable
independiente x, la regresin ms utilizada es la regresin mltiple.
A menudo en una investigacin el objetivo es explicar el comportamiento de
una variable en trminos de ms de una variable, por ejemplo sea la variable y, cuyo
comportamiento explicaremos en trminos de las variables x1 , x 2 ,..., x k ; ahora
estudiaremos la situacin donde el comportamiento de la variable y (llamada
dependiente o respuesta) se explicar mediante una relacin lineal en funcin de las
variables x1 , x 2 ,..., x k (llamadas independientes o tambin explicativas). La variable
respuesta es de tipo cuantitativa y las variables explicativas deben ser cuantitativas
y/o categricas. (Sifuentes, V. 2002)
Sea y una variable respuesta y x1 , x 2 ,..., x k variables independientes; deseamos
describir la relacin que hay entre la variable respuesta y las variables explicativas, si
entre ellas hay una relacin lineal se espera que:

Yi 0 1 X i1 2 X i 2 ... k X ik
la0 variable
respuesta
Yi es

1 X i1
2 X i 2 cuantitativa
... k X ik para el i-simo objeto, este es un valor
estimado.
, ikson los parmetros poblacionales (valores constantes fijos) llamados
0 1 X i1 2 X i 2 ... k X
coeficientes. Siendo k el nmero de de variables independientes. Se espera que la
variable dependiente vare linealmente con las variables independientes.

MTODO

Una empresa inmobiliaria solicita, a una empresa consultora, un estudio del


mercado inmobiliario de un municipio de alta oferta y demanda. Para ello, la empresa
consultora toma en cuenta las siguientes variables:

VARIABLES DEL ESTUDIO:


Y: Precio de venta del metro cuadrado del inmueble (Bs/1000)
X1: Impuestos Municipales y de servicio al ao (Bs/1000).
X2: Cantidad de baos.
X3: Tamao del terreno (m2/100).
X4: Metros cuadrados de construccin (m2/100).
X5: Zona
(1) Zona 1
(2) Zona 2
(3) Zona 3
(4) Zona 4
(5) Zona 5
X6: Cantidad de puestos de estacionamiento.
X7: Cantidad de habitaciones.
X8: Cantidad de reas sociales

X9: Edad de la construccin.

X10: Anexo para el personal de servicio


(0) No
(1) S

OBJETIVO 6:
6.1. Obtener los siguientes modelos de regresin lineal mltiple,
Modelo

1:

Modelo 2:
6.2. Explicar cul de los modelos anterior es considerara para realizar el
estudio.
6.3. Estudiar la posibilidad de colinealidad o multicolinealidad en el modelo
considerado en la pregunta anterior. Si existe, corregir este problema y obtener el
nuevo modelo.
6.4. Partiendo del modelo obtenido en la pregunta 6.3, explicar todos los
resultados arrojados por el programa (coeficientes y estadsticos).
6.5. Utilizar el procedimiento de regresin paso a paso (eliminacin hacia atrs)
para encontrar el modelo que mejor se ajusta. Interprete los coeficientes de este
ltimo modelo.
6.6. Considere una nueva variable,
(

Construir el siguiente modelo,

Realizar el procedimiento indicado en 6.5.


6.7. Explicar cul de los modelos obtenidos en 6.5 y 6.6 representa mejor la
situacin bajo estudio.
6.8. Realizar un anlisis de residuos para los modelos obtenidos en los puntos
6.5 y 6.6.
6.9. Explicar los fundamentos tericos que justifican o no, todos los pasos
seguidos desde el tem 6.1 hasta el tem 6.8.
Observacin: Trabaje las pruebas de hiptesis con nivel de significancia =
0.05.

Poblacin
Y
26
27,4
26
28
40,1
44,9
28
32
34,6
32
26,8
43,8
31,9
29
44,7
33,1
42,3
39,3
41,2
45,5
27,7
28,8
34
30,1
44,5
29,2
33,7
28,9
34,8
38,8
42,3
33,2
41,4
28,2
40,8
34,6
37,9
44
37,3
31,7
28,7

X1
5,0272
7,2776
8,4363
5,0693
7,2021
8,4797
7,6385
7,6085
6,3991
5,7779
5,6824
8,5769
8,0594
5,1378
6,4044
7,5029
7,2736
5,2323
6,3185
6,338
5,1594
8,5772
7,0555
7,6865
6,446
6,6293
7,0092
5,3487
7,1498
6,9719
6,838
7,4858
8,0134
7,9333
7,8241
7,0253
9,0243
5,2479
8,8907
5,5499
8,3176

X2
1
2
1
2
2
2
1,5
3
2
2
1
3
2
2
1,5
1
1
1,5
1
1
2,5
2
1
1
1
1,5
2
2
2
2
1
2
2
1,5
1
2
2
2
2
1,5
2,5

X3
3,716
5,119
5,5219
5,4851
5,0847
7,8289
6,8681
7,8155
8,5793
6,0094
4,7184
8,8413
3,5853
6,7836
7,4829
3,7615
7,8811
6,6111
5,3736
7,1818
7,6309
6,1104
3,0557
6,3276
9,2318
3,4299
8,5924
7,0533
5,0648
8,7507
5,8922
10,0185
5,6233
9,502
4,4981
6,8007
9,3329
7,3702
8,3448
8,7642
8,5381

X4
0,4405
1,632
1,1191
1,9886
1,6594
1,5268
1,3597
2,1814
2,0151
1,8839
1,083
2,0898
1,8294
1,569
1,2955
0,4668
0,8859
1,3787
1,028
1,0668
2,6891
1,4837
0,9622
0,2523
0,3674
1,3965
1,5917
1,6417
1,681
1,688
1,0674
1,7624
1,4902
1,3622
0,7619
1,6886
1,9437
1,9775
1,5769
1,2926
2,1295

X5
1
3
2
4
3
3
2
5
4
4
2
4
4
3
2
1
1
2
2
2
5
3
1
1
1
3
3
3
3
3
2
4
3
2
1
3
4
4
3
2
5

X6
2
5
3
6
5
4
4
6
6
6
3
6
6
5
4
2
2
4
3
3
7
4
3
2
2
4
5
5
5
5
3
5
4
4
2
5
6
6
5
4
6

X7
3
6
4
7
6
5
5
7
7
7
4
7
7
6
5
3
3
5
4
4
8
5
4
3
3
5
6
6
6
6
4
6
5
5
3
6
7
7
6
5
7

X8
2
3
2
4
3
3
3
4
4
3
2
4
3
3
3
2
2
3
2
2
4
3
2
2
2
3
3
3
3
3
2
3
3
3
2
3
4
4
3
3
4

X9 X10 X11
17 1 2,07825
32 0 3,3755
17 1 3,3205
18 0 3,73685
25 0 3,37205
38 0 4,67785
19 0 4,1139
27 0 4,99845
46 0 5,2972
29 0 3,94665
20 1 2,9007
46 0 5,46555
46 0 2,70735
37 0 4,1763
33 0 4,3892
35 1 2,11415
44 1 4,3835
33 0 3,9949
22 1 3,2008
20 1 4,1243
26 0
5,16
48 0 3,79705
29 1 2,00895
45 1 3,28995
18 1 4,7996
32 0 2,4132
25 0 5,09205
38 0 4,3475
20 0 3,3729
44 0 5,21935
44 1 3,4798
26 0 5,89045
20 0 3,55675
33 0 5,4321
43 1
2,63
46 0 4,24465
47 0 5,6383
27 0 4,67385
18 0 4,96085
26 0 5,0284
31 0 5,3338

40,1
39,8
44,6
30,2
27
27
36,4
29,1
29,6
38,6
31,6
26,6
26,6
41
35,1
27,4
37,2
28,7
39,1

6,1618
6,0085
5,2897
6,1111
7,8429
8,0303
5,404
8,1321
6,1579
6,752
7,8334
8,5768
8,1617
5,8991
7,0945
8,8785
7,2138
5,6268
6,3859

2
2,5
3
2
1
2
1
2,5
1
2
3
2,5
2,5
2
1,5
1
1
2,5
1

8,0796
4,5505
7,6318
7,6551
4,7629
7,3877
8,4007
4,3561
7,1066
8,9504
7,9297
5,2589
4,7944
5,8733
6,4968
3,2997
6,4344
6,045
9,178

1,8534
2,4045
2,2743
1,6014
1,0171
1,5044
1,1913
2,0972
1,1481
1,9375
2,0568
2,915
3,2656
1,6936
1,4155
1,2398
1,2859
2,0495
0,561

4
5
5
3
2
3
2
4
2
4
4
5
5
3
3
2
2
4
1

6
7
7
5
3
4
3
6
3
6
6
7
7
5
4
3
3
6
2

7
8
8
6
4
5
4
7
4
7
7
8
8
6
5
4
4
7
3

3
4
4
3
2
3
2
4
2
4
4
4
4
3
3
3
3
4
2

18
39
42
46
30
19
30
24
37
38
46
23
36
24
19
26
40
39
46

0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1

4,9665
3,4775
4,95305
4,62825
2,89
4,44605
4,796
3,22665
4,12735
5,44395
4,99325
4,08695
4,03
3,78345
3,95615
2,26975
3,86015
4,04725
4,8695

Instrumentos/Materiales

Para el desarrollo de este trabajo fue necesaria la aplicacin de programas


(software) Office Excel 2003, en un computador Pentium IV, bajo el sistema
operativo Windows XP.

Procedimiento y Resultados

6.1. Obtener los siguientes modelos de regresin lineal mltiple,


Modelo

1:

Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,39360107
Coeficiente de determinacin R^2
0,1549218
R^2 ajustado
0,02193051
Error tpico
6,03514955
Observaciones
60

ANLISIS DE VARIANZA
Grados de
Suma de
libertad
cuadrados
Regresin
8
347,2122659
Residuos
52
1893,997567
Total
60
2241,209833

Coeficientes
Intercepcin 31,65202173
X1
-0,448426252
X2
1,000450063
X3
1,028932824
X4
-3,032448805
X6
0,546608811
X7
0
X8
-0,927649658
X9
0,071008229

Error tpico
6,899417685
0,757142568
3,391510914
0,463570546
4,581297352
2,271659282
0
2,75951695
0,080963517

Promedio de
Valor crtico
F
los cuadrados
de F
43,40153324 1,3618239 0,235718504
36,42303014

Estadstico t
4,587636693
-0,592261314
0,294986538
2,219581967
-0,661919228
0,240620948
65535
-0,336163783
0,877039834

Probabilidad
2,86106E-05
0,556242282
0,769178734
0,030832961
0,51094581
0,810795078
#NUM!
0,738100122
0,384499005

Inferior 95% Superior 95%


17,80732758 45,49671588
-1,967743934
1,07089143
-5,805114327 7,806014452
0,09871049 1,959155159
-12,2254943 6,160596687
-4,011808929 5,105026551
0
0
-6,465025406
4,60972609
-0,091456949 0,233473407

Modelo 2:

Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,986972188
Coeficiente de determinacin R^2 0,974114099
0,95139869
R^2 ajustado
6,035149554
Error tpico
60
Observaciones

ANLISIS DE VARIANZA
Grados de
Suma de
Promedio de
F
libertad
cuadrados
los cuadrados
Regresin
8
71273,15243 8909,144054 244,601946
Residuos
52
1893,997567 36,42303014
Total
60
73167,15

Intercepcin
X1
X2
X3
X4
X6
X7
X8
X9

Coeficientes
0
-0,448426252
1,000450063
1,028932824
-3,032448805
-31,10541292
31,65202173
-0,927649658
0,071008229

Error tpico
#N/A
0,757142568
3,391510914
0,463570546
4,581297352
7,912604947
6,899417685
2,75951695
0,080963517

Estadstico t
#N/A
-0,592261314
0,294986538
2,219581967
-0,661919228
-3,931121688
4,587636693
-0,336163783
0,877039834

Probabilidad
#N/A
0,556242282
0,769178734
0,030832961
0,51094581
0,000251136
2,86106E-05
0,738100122
0,384499005

Valor crtico
de F
6,7704E-38

Inferior 95%
#N/A
-1,967743934
-5,805114327
0,09871049
-12,2254943
-46,983216
17,80732758
-6,465025406
-0,091456949

Superior 95%
#N/A
1,07089143
7,806014452
1,959155159
6,160596687
-15,22760983
45,49671588
4,60972609
0,233473407

6.2. Explicar cul de los modelos anterior se considerara para realizar el


estudio.

Se hace escogencia del modelo I


Modelo 1:
El factor * X7 est altamente correlacionado con otras variables X.
* X7 se ha eliminado de la ecuacin.
La ecuacin de regresin es
Y = 31,7 - 0,448 X1 + 1,00 X2 + 1,03 X3 - 3,03 X4 + 0,55 X6 - 0,93 X8
+ 0,0710 X9

Predictor
Constante
X1
X2
X3
X4
X6
X8
X9

Coef
31,652
-0,4484
1,000
1,0289
-3,032
0,547
-0,928
0,07101

S = 6,03515

Coef. de EE
6,899
0,7571
3,392
0,4636
4,581
2,272
2,760
0,08096

R-cuad. = 15,5%

PRESS = 2434,35

T
4,59
-0,59
0,29
2,22
-0,66
0,24
-0,34
0,88

P
0,000
0,556
0,769
0,031
0,511
0,811
0,738
0,384

VIF
1,233
7,021
1,133
11,848
19,410
6,690
1,074

R-cuad.(ajustado) = 4,1%

R-cuad.(pred) = 0,00%

Anlisis de varianza
Fuente
Regresin
Error residual
Total
Fuente
X1
X2
X3
X4
X6
X8
X9

Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

GL
1
1
1
1
1
1
1

X1
5,03
7,28
8,44
5,07
7,20
8,48
7,64
7,61
6,40
5,78
5,68
8,58
8,06
5,14
6,40
7,50
7,27
5,23
6,32
6,34
5,16
8,58
7,06

GL
7
52
59

SC
347,21
1894,00
2241,21

MC
49,60
36,42

F
1,36

P
0,241

SC sec.
24,55
3,03
242,79
45,19
0,81
2,83
28,02

Y
26,000
27,400
26,000
28,000
40,100
44,900
28,000
32,000
34,600
32,000
26,800
43,800
31,900
29,000
44,700
33,100
42,300
39,300
41,200
45,500
27,700
28,800
34,000

Ajuste
33,331
32,930
32,149
31,840
32,348
35,378
33,424
34,154
36,336
34,088
32,880
36,403
31,943
36,148
35,798
33,466
37,176
35,175
33,578
35,170
33,499
34,407
31,559

Ajuste SE
2,848
1,387
2,234
2,632
1,429
1,821
1,644
2,536
2,372
2,166
1,895
2,533
3,352
1,723
1,255
2,229
2,355
1,720
1,591
1,825
2,418
2,071
1,993

Residuo
-7,331
-5,530
-6,149
-3,840
7,752
9,522
-5,424
-2,154
-1,736
-2,088
-6,080
7,397
-0,043
-7,148
8,902
-0,366
5,124
4,125
7,622
10,330
-5,799
-5,607
2,441

Residuo
estndar
-1,38
-0,94
-1,10
-0,71
1,32
1,65
-0,93
-0,39
-0,31
-0,37
-1,06
1,35
-0,01
-1,24
1,51
-0,07
0,92
0,71
1,31
1,80
-1,05
-0,99
0,43

24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60

7,69
6,45
6,63
7,01
5,35
7,15
6,97
6,84
7,49
8,01
7,93
7,82
7,03
9,02
5,25
8,89
5,55
8,32
6,16
6,01
5,29
6,11
7,84
8,03
5,40
8,13
6,16
6,75
7,83
8,58
8,16
5,90
7,09
8,88
7,21
5,63
6,39

30,100
44,500
29,200
33,700
28,900
34,800
38,800
42,300
33,200
41,400
28,200
40,800
34,600
37,900
44,000
37,300
31,700
28,700
40,100
39,800
44,600
30,200
27,000
27,000
36,400
29,100
29,600
38,600
31,600
26,600
26,600
41,000
35,100
27,400
37,200
28,700
39,100

37,385
38,663
31,150
36,249
36,182
31,931
37,486
35,321
37,056
32,150
36,988
33,753
35,596
36,221
34,373
34,699
37,012
34,521
35,358
31,734
36,335
37,149
32,867
33,844
37,175
29,902
36,134
36,227
35,898
28,627
28,196
33,569
33,116
29,010
33,836
33,973
40,036

2,612
2,585
1,860
1,601
1,621
1,587
1,660
1,959
2,092
2,034
1,915
2,119
1,548
3,239
2,291
2,596
1,823
1,780
2,547
2,154
2,440
1,685
1,779
2,088
2,435
2,206
1,966
2,334
2,450
2,741
3,861
1,449
1,500
3,013
2,654
2,064
2,317

-7,285
5,837
-1,950
-2,549
-7,282
2,869
1,314
6,979
-3,856
9,250
-8,788
7,047
-0,996
1,679
9,627
2,601
-5,312
-5,821
4,742
8,066
8,265
-6,949
-5,867
-6,844
-0,775
-0,802
-6,534
2,373
-4,298
-2,027
-1,596
7,431
1,984
-1,610
3,364
-5,273
-0,936

-1,34
1,07
-0,34
-0,44
-1,25
0,49
0,23
1,22
-0,68
1,63
-1,54
1,25
-0,17
0,33
1,72
0,48
-0,92
-1,01
0,87
1,43
1,50
-1,20
-1,02
-1,21
-0,14
-0,14
-1,15
0,43
-0,78
-0,38
-0,34 X
1,27
0,34
-0,31
0,62
-0,93
-0,17

X denota una observacin cuyo valor X le concede gran influencia.


Estadstico de Durbin-Watson = 2,00688

6.3. Estudiar la posibilidad de colinealidad o multicolinealidad en el modelo


considerado en la pregunta anterior. Si existe, corregir este problema y obtener el
nuevo modelo.
El factor * X7 est altamente correlacionado con otras variables X.
* X7 se ha eliminado de la ecuacin.
La ecuacin de regresin es
Y = 31,7 - 0,448 X1 + 1,00 X2 + 1,03 X3 - 3,03 X4 + 0,55 X6 - 0,93 X8
+ 0,0710 X9

6.4. Partiendo del modelo obtenido en la pregunta 6.3, explicar todos los
resultados arrojados por el programa (coeficientes y estadsticos).
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,39360107
Coeficiente de determinacin R^2
0,1549218
R^2 ajustado
0,04116128
Error tpico
6,03514955
Observaciones
60
ANLISIS DE VARIANZA
Grados de
Suma de
Promedio de
Valor crtico
libertad
cuadrados los cuadrados
F
de F
Regresin
7 347,2122659 49,60175227 1,36182388 0,241228062
Residuos
52 1893,997567 36,42303014
Total
59 2241,209833
Coeficientes
31,65202173
-0,448426252
1,000450063
1,028932824
-3,032448805
0,546608811
-0,927649658
0,071008229

Intercepcin
X1
X2
X3
X4
X6
X8
X9

Error tpico
Estadstico t Probabilidad Inferior 95% Superior 95%
6,899417685 4,587636693 2,86106E-05 17,80732758 45,49671588
0,757142568 -0,592261314 0,556242282 -1,96774393 1,07089143
3,391510914 0,294986538 0,769178734 -5,80511433 7,806014452
0,463570546 2,219581967 0,030832961 0,09871049 1,959155159
4,581297352 -0,661919228 0,51094581 -12,2254943 6,160596687
2,271659282 0,240620948 0,810795078 -4,01180893 5,105026551
2,75951695 -0,336163783 0,738100122 -6,46502541 4,60972609
0,080963517 0,877039834 0,384499005 -0,09145695 0,233473407

6.5. Utilizar el procedimiento de regresin paso a paso (eliminacin hacia atrs)


para encontrar el modelo que mejor se ajusta. Interprete los coeficientes de este
ltimo modelo.
La respuesta es Y en 8 predictores, con N = 60
Paso
Constante

1
27,22

X3
Valor T
Valor P

1,08
2,53
0,014

S
R-cuad.
R-cuad.(ajustado)
PRESS
R-cuad. (pred)

5,90
9,95
8,40
2142,63
4,40

El modelo es
La ecuacin de regresin es
Y = 40,0 - 0,793 X1 + 2,48 X2 - 1,09 X7 - 0,57 X8 + 0,0997 X9
Predictor
Constante
X1
X2
X7
X8
X9

Coef
40,039
-0,7928
2,478
-1,090
-0,569
0,09973

S = 6,25015

Coef. de EE
6,730
0,7464
3,447
1,587
2,810
0,08292

R-cuad. = 5,9%

PRESS = 2626,67

T
5,95
-1,06
0,72
-0,69
-0,20
1,20

P
0,000
0,293
0,475
0,495
0,840
0,234

VIF
1,117
6,763
8,827
6,466
1,050

R-cuad.(ajustado) = 0,0%

R-cuad.(pred) = 0,00%

Anlisis de varianza
Fuente
Regresin
Error residual
Total
Fuente
X1
X2
X7
X8
X9

GL
1
1
1
1
1

GL
5
54
59

SC
131,74
2109,47
2241,21

MC
26,35
39,06

F
0,67

P
0,645

SC sec.
24,55
3,03
47,12
0,53
56,51

6.6. Considere una nueva variable,


(

Construir el siguiente modelo,

Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple

0,98052448

Coeficiente de determinacin R^2

0,96142825

R^2 ajustado

0,93933828

Error tpico

7,22929332

Observaciones
ANLISIS DE
VARIANZA
Grados de
libertad

Suma de
cuadrados

Promedio de
los cuadrados

Regresin

70344,96518

Residuos

54

2822,18482

Total

60

73167,15

Valor crtico
de F

11724,16086 224,331405 7,76393E-36


52,26268185

Coeficientes

Error tpico

Estadstico t

Probabilidad

Inferior 95%

Superior 95%

#N/A

#N/A

#N/A

#N/A

#N/A

2,010772829

Intercepcin
X1

60

0,58329744

3,447251248 0,001104579

0,841331879

3,180213778

X2

-5,850553784 3,629959264

-1,611740892 0,112848493

-13,12818388

1,427076314

X7

1,71176797 1,720319543

0,995029079 0,324160094

-1,737265028

5,160800969

X8

0,014828285

3,2565024

0,004553439 0,996383674

-6,514065886

6,543722455

X9

0,176569534 0,093641617

1,885588252 0,064734627

-0,011170604

0,364309672

X11

3,717414637 1,038220732

3,580562901 0,000734751

1,635907408

5,798921865

Realizar el procedimiento indicado en 6.5.


La ecuacin de regresin es
Y = 34,5 - 0,648 X1 + 1,39 X2 - 0,95 X7 - 1,28 X8 + 0,0766 X9 + 2,09 X11
Predictor
Constante
X1
X2
X7
X8
X9
X11

Coef
34,500
-0,6480
1,394
-0,954
-1,281
0,07660
2,0947

S = 6,02382

Coef. de EE
6,931
0,7222
3,357
1,530
2,726
0,08057
0,9245

R-cuad. = 14,2%

PRESS = 2423,27

T
4,98
-0,90
0,42
-0,62
-0,47
0,95
2,27

P
0,000
0,374
0,680
0,536
0,640
0,346
0,028

VIF
1,126
6,903
8,841
6,553
1,067
1,329

R-cuad.(ajustado) = 4,5%

R-cuad.(pred) = 0,00%

Anlisis de varianza
Fuente
Regresin
Error residual
Total
Fuente
X1
X2
X7
X8
X9
X11

GL
1
1
1
1
1
1

GL
6
53
59

SC
318,03
1923,18
2241,21

MC
53,00
36,29

F
1,46

P
0,210

SC sec.
24,55
3,03
47,12
0,53
56,51
186,29

Estadstico de Durbin-Watson = 1,99821

6.7. Explicar cul de los modelos obtenidos en 6.5 y 6.6 representa mejor la
situacin bajo estudio.
La ecuacin de regresin es
Y = 40,0 - 0,793 X1 + 2,48 X2 - 1,09 X7 - 0,57 X8 + 0,0997 X9
Predictor
Constante
X1
X2
X7
X8
X9

Coef
40,039
-0,7928
2,478
-1,090
-0,569
0,09973

S = 6,25015

Coef. de EE
6,730
0,7464
3,447
1,587
2,810
0,08292

R-cuad. = 5,9%

T
5,95
-1,06
0,72
-0,69
-0,20
1,20

P
0,000
0,293
0,475
0,495
0,840
0,234

VIF
1,117
6,763
8,827
6,466
1,050

R-cuad.(ajustado) = 0,0%

6.8. Realizar un anlisis de residuos para los modelos obtenidos en los puntos
6.5 y 6.6.

Modelo del 6.5


Obs
1
2
3
4
5

X1
5,03
7,28
8,44
5,07
7,20

Y
26,000
27,400
26,000
28,000
40,100

Ajuste
35,819
34,171
32,027
32,867
33,533

Ajuste SE
2,566
1,130
2,303
2,595
1,258

Residuo
-9,819
-6,771
-6,027
-4,867
6,567

Residuo
estndar
-1,72
-1,10
-1,04
-0,86
1,07

6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60

8,48
7,64
7,61
6,40
5,78
5,68
8,58
8,06
5,14
6,40
7,50
7,27
5,23
6,32
6,34
5,16
8,58
7,06
7,69
6,45
6,63
7,01
5,35
7,15
6,97
6,84
7,49
8,01
7,93
7,82
7,03
9,02
5,25
8,89
5,55
8,32
6,16
6,01
5,29
6,11
7,84
8,03
5,40
8,13
6,16
6,75
7,83
8,58
8,16
5,90
7,09
8,88
7,21
5,63
6,39

44,900
28,000
32,000
34,600
32,000
26,800
43,800
31,900
29,000
44,700
33,100
42,300
39,300
41,200
45,500
27,700
28,800
34,000
30,100
44,500
29,200
33,700
28,900
34,800
38,800
42,300
33,200
41,400
28,200
40,800
34,600
37,900
44,000
37,300
31,700
28,700
40,100
39,800
44,600
30,200
27,000
27,000
36,400
29,100
29,600
38,600
31,600
26,600
26,600
41,000
35,100
27,400
37,200
28,700
39,100

34,906
32,439
34,230
34,605
33,971
34,509
35,357
33,858
36,366
34,814
35,652
36,731
35,743
34,204
33,990
33,742
35,826
34,318
36,504
34,794
34,536
33,686
36,299
33,076
35,610
35,987
33,408
33,481
33,602
36,195
35,767
32,623
33,623
31,496
34,793
32,827
32,570
34,366
36,474
36,492
33,794
33,368
35,727
32,276
35,828
33,527
35,946
30,734
32,360
34,466
32,870
32,005
34,721
35,758
37,634

1,734
1,634
2,596
2,337
2,131
1,786
2,585
2,840
1,764
1,222
1,665
1,925
1,742
1,615
1,678
2,049
2,050
1,548
1,994
2,046
1,165
1,236
1,676
1,489
1,483
1,966
1,285
2,022
1,335
1,927
1,601
2,860
2,316
2,220
1,617
1,695
2,296
1,833
2,504
1,719
1,781
2,076
1,742
1,846
1,684
2,055
2,533
2,334
2,021
1,451
1,550
2,838
2,556
1,981
2,127

Estadstico de Durbin-Watson = 1,93603

9,994
-4,439
-2,230
-0,005
-1,971
-7,709
8,443
-1,958
-7,366
9,886
-2,552
5,569
3,557
6,996
11,510
-6,042
-7,026
-0,318
-6,404
9,706
-5,336
0,014
-7,399
1,724
3,190
6,313
-0,208
7,919
-5,402
4,605
-1,167
5,277
10,377
5,804
-3,093
-4,127
7,530
5,434
8,126
-6,292
-6,794
-6,368
0,673
-3,176
-6,228
5,073
-4,346
-4,134
-5,760
6,534
2,230
-4,605
2,479
-7,058
1,466

1,66
-0,74
-0,39
-0,00
-0,34
-1,29
1,48
-0,35
-1,23
1,61
-0,42
0,94
0,59
1,16
1,91
-1,02
-1,19
-0,05
-1,08
1,64
-0,87
0,00
-1,23
0,28
0,53
1,06
-0,03
1,34
-0,88
0,77
-0,19
0,95
1,79
0,99
-0,51
-0,69
1,30
0,91
1,42
-1,05
-1,13
-1,08
0,11
-0,53
-1,03
0,86
-0,76
-0,71
-0,97
1,07
0,37
-0,83
0,43
-1,19
0,25

Modelo del 6.6


Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57

X1
5,03
7,28
8,44
5,07
7,20
8,48
7,64
7,61
6,40
5,78
5,68
8,58
8,06
5,14
6,40
7,50
7,27
5,23
6,32
6,34
5,16
8,58
7,06
7,69
6,45
6,63
7,01
5,35
7,15
6,97
6,84
7,49
8,01
7,93
7,82
7,03
9,02
5,25
8,89
5,55
8,32
6,16
6,01
5,29
6,11
7,84
8,03
5,40
8,13
6,16
6,75
7,83
8,58
8,16
5,90
7,09
8,88

Y
26,000
27,400
26,000
28,000
40,100
44,900
28,000
32,000
34,600
32,000
26,800
43,800
31,900
29,000
44,700
33,100
42,300
39,300
41,200
45,500
27,700
28,800
34,000
30,100
44,500
29,200
33,700
28,900
34,800
38,800
42,300
33,200
41,400
28,200
40,800
34,600
37,900
44,000
37,300
31,700
28,700
40,100
39,800
44,600
30,200
27,000
27,000
36,400
29,100
29,600
38,600
31,600
26,600
26,600
41,000
35,100
27,400

Ajuste
32,868
32,526
32,307
31,407
32,032
35,889
33,100
34,487
35,958
33,511
33,442
36,293
30,739
35,974
35,549
32,717
38,309
35,483
33,811
35,580
34,685
34,747
31,373
35,827
37,725
31,188
35,760
36,272
31,684
37,506
35,744
37,200
32,464
36,743
34,203
35,583
35,048
33,943
33,729
36,906
34,340
34,556
31,606
36,090
36,979
32,785
34,239
38,358
29,510
37,005
35,424
35,786
29,993
31,139
33,661
33,122
29,227

Ajuste SE
2,795
1,309
2,223
2,583
1,382
1,726
1,601
2,504
2,330
2,064
1,784
2,526
3,064
1,709
1,221
2,062
1,982
1,682
1,566
1,763
2,018
2,032
1,979
1,945
2,359
1,856
1,502
1,615
1,561
1,656
1,898
2,082
1,999
1,892
2,055
1,545
2,957
2,236
2,355
1,816
1,765
2,380
2,145
2,420
1,671
1,774
2,037
2,041
2,158
1,704
2,151
2,442
2,273
2,021
1,442
1,498
2,997

Residuo
-6,868
-5,126
-6,307
-3,407
8,068
9,011
-5,100
-2,487
-1,358
-1,511
-6,642
7,507
1,161
-6,974
9,151
0,383
3,991
3,817
7,389
9,920
-6,985
-5,947
2,627
-5,727
6,775
-1,988
-2,060
-7,372
3,116
1,294
6,556
-4,000
8,936
-8,543
6,597
-0,983
2,852
10,057
3,571
-5,206
-5,640
5,544
8,194
8,510
-6,779
-5,785
-7,239
-1,958
-0,410
-7,405
3,176
-4,186
-3,393
-4,539
7,339
1,978
-1,827

Residuo
estndar
-1,29
-0,87
-1,13
-0,63
1,38
1,56
-0,88
-0,45
-0,24
-0,27
-1,15
1,37
0,22
-1,21
1,55
0,07
0,70
0,66
1,27
1,72
-1,23
-1,05
0,46
-1,00
1,22
-0,35
-0,35
-1,27
0,54
0,22
1,15
-0,71
1,57
-1,49
1,17
-0,17
0,54
1,80
0,64
-0,91
-0,98
1,00
1,46
1,54
-1,17
-1,00
-1,28
-0,35
-0,07
-1,28
0,56
-0,76
-0,61
-0,80
1,25
0,34
-0,35

58
59
60

7,21
5,63
6,39

37,200
28,700
39,100

34,710
34,001
40,055

2,464
2,060
2,312

2,490
-5,301
-0,955

0,45
-0,94
-0,17

6.9. Explicar los fundamentos tericos que justifican o no, todos los pasos
seguidos desde el tem 6.1 hasta el tem 6.8.
Regresin lineal mltiple
La regresin lineal mltiple estima los coeficientes de la ecuacin lineal,
con una o ms variables independientes, que mejor prediga el valor de la
variable dependiente. Por ejemplo, se puede intentar predecir el total de
facturacin lograda por servicios prestados en una IPS cada mes (la variable
dependiente) a partir de variables independientes tales como: Tipo de
servicio, edad, frecuencia del servicio, tipo de usuario y los aos de
antigedad en el sistema del usuario.
Mtodos de seleccin de variables en el anlisis de regresin lineal
La seleccin del mtodo permite especificar cmo se introducen las
variables independientes en el anlisis. Utilizando distintos mtodos se
pueden construir diversos modelos de regresin a partir del mismo conjunto
de variables.
Para introducir las variables del bloque en un slo paso seleccione
Introducir. Para eliminar las variables del bloque en un solo paso, seleccione
Eliminar. La seleccin de variables Hacia adelante introduce las variables
del bloque una a una basndose en los criterios de entrada. La eliminacin
de variables Hacia atrs introduce todas las variables del bloque en un nico
paso y despus las elimina una a una basndose en los criterios de salida.
La entrada y salida de variables mediante Pasos sucesivos examina las
variables del bloque en cada paso para introducirlas o excluirlas. Se trata de
un procedimiento hacia adelante por pasos.
Los valores de significacin de los resultados se basan en el ajuste de
un nico modelo. Por ello, estos valores no suele ser vlidos cuando se

emplea un mtodo por pasos (Pasos sucesivos, Hacia adelante o Hacia


atrs).
Todas las variables deben superar el criterio de tolerancia para que
puedan ser introducidas en la ecuacin, independientemente del mtodo de
entrada especificado. El nivel de tolerancia por defecto es 0,0001. Tampoco
se introduce una variable si esto provoca que la tolerancia de otra ya
presente en el modelo se site por debajo del criterio de tolerancia.
Todas las variables independientes seleccionadas se aaden a un
mismo modelo de regresin. Sin embargo, puede especificar distintos
mtodos de introduccin para diferentes subconjuntos de variables. Por
ejemplo, puede introducir en el modelo de regresin un bloque de variables
que utilice la seleccin por pasos sucesivos, y un segundo bloque que
emplee la seleccin hacia adelante. Para aadir al modelo de regresin un
segundo bloque de variables, pulse en Siguiente.

Colinealidad o multicolinealidad.
Una de las hiptesis del modelo de regresin lineal mltiple establece
que no existe relacin lineal exacta entre los regresores, o, en otras palabras,
establece que no existe multicolinealidad perfecta en el modelo. Esta
hiptesis es necesaria para el clculo del vector de estimadores mnimo
cuadrticos, ya que en caso contrario la matriz X'X ser no singular. La
multicolinealidad perfecta no se suele presentar en la prctica, salvo que se
disee mal el modelo.
En cambio, s es frecuente que entre los regresores exista una relacin
aproximadamente lineal, en cuyo caso los estimadores que se obtengan
sern en general poco precisos, aunque siguen conservando la propiedad de
lineales, insesgados y ptimos. En otras palabras, la relacin entre
regresores hace que sea difcil cuantificar con precisin el efecto que cada
regresor ejerce sobre el regresando, lo que determina que las varianzas de
los estimadores sean elevadas. Cuando se presenta una relacin

aproximadamente

lineal

entre

los

regresores,

se

dice

que

existe

multicolinealidad no perfecta.
Es importante sealar que el problema de multicolinealidad, en mayor o
menor grado, se plantea porque no existe informacin suficiente para
conseguir una estimacin precisa de los parmetros del modelo. El problema
de la multicolinealidad hace referencia, en concreto, a la existencia de
relaciones aproximadamente lineales entre los regresores del modelo,
cuando los estimadores obtenidos y la precisin de stos se ven seriamente
afectados.
Como la multicolinealidad es un problema muestral, ya que va asociada
a la configuracin concreta de la matriz X, no existen contrastes estadsticos,
propiamente dichos, que sean aplicables para su deteccin. En cambio, se
han desarrollado numerosas reglas prcticas que tratan de determinar en
qu medida la multicolinealidad afecta gravemente a la estimacin y
contraste de un modelo. Estas reglas no son siempre fiables, siendo en
algunos casos muy discutibles.
A continuacin se van a exponer dos procedimientos (el factor de
agrandamiento de la varianza y el nmero de condicin) que son los que
gozan de mayor soporte - especialmente el segundo - en la literatura
economtrica actual.
Factor de agrandamiento de la varianza. En un modelo de regresin
mltiple, si el regresor j-simo fuera ortogonal con respecto a los dems
regresores (es decir, si la correlacin con el resto de los regresores fuera
nula), la frmula para la varianza de un estimador

quedara reducida a

El cociente entre ellas es precisamente el factor de agrandamiento de la


varianza (FAV), cuya expresin ser

As, pues, el FAV es la razn entre la varianza observada y la que


habra sido en caso de que Xj estuviera incorrelacionada con el resto de
regresores del modelo. Dicho de otra forma, el FAV muestra en qu medida
se agranda la varianza del estimador como consecuencia de la no
ortogonalidad de los regresores. Algunos autores consideran que existe un
problema grave de multicolinealidad cuando el FAV de algn coeficiente es
mayor de 10, es decir, cuando el Rj2 >0,90. Anlogamente se puede decir
que existe un problema de multicolinealidad cuando la tolerancia <0,10.
El problema que tiene el FAV(o el Rj2 o la tolerancia) es que no
suministra ninguna informacin que pueda utilizarse para corregir el
problema.
Nmero de condicin. Este procedimiento de deteccin de la
multicolinealidad es el ms adecuado entre los actualmente disponibles,
segn afirman Judge et at. (1985) Fue planteado inicialmente por Rachudel
(1971) y desarrollado posteriormente por Belsley et al.(1980), y Belsley
(1982). El nmero de condicin, K(x), es igual a la raz cuadrada de la razn
entre la raz caracterstica ms grande
pequea

y la raz caracterstica ms

. De la matriz XX, es decir


( )

Como la matriz XX es de dimensin k . k, se obtienen k races


caractersticas, pudindose calcular para cada una de ellas un ndice de
condicin definido de la siguiente forma:

( )

El nmero de condicin mide la sensibilidad de las estimaciones


mnimo-cuadrticas ante pequeos cambios en los datos. De acuerdo con
los estudios realizados por Belsley y otros (op. cit.), y Belsley (op. cit.), tanto
con datos observados como con datos simulados, el problema de la
multicolinealidad es grave cuando el nmero de condicin toma un valor
entre 20 y 30.
Naturalmente, si este indicador superase el valor de 30, el problema
sera ya manifiestamente grave. Estos valores vienen generalmente referidos
a regresores medidos con escala de longitud unidad (es decir, con los
regresores divididos por la raz cuadrada de la suma de los valores de las
observaciones), pero no centrados. Parece que no es conveniente centrar los
datos (es decir, restarles sus correspondientes medias), ya que esta
operacin oscurece cualquier dependencia lineal que implique al trmino
independiente.
Una

informacin

de

inters

para

identificar

el

origen

de

la

multicolinealidad es la proporcin que tiene cada raz caracterstica en cada


uno de los regresores.

Regresin paso a paso (RPP).


Los mtodos de seleccin algortmica del modelo se han concebido
para identificar aquellas variables que habrn de integrar la funcin que a la
postre ser empleada como modelo resumen del proceso bajo estudio. El
ms popular es el que se conoce como regresin paso a paso RPP(stepwise method), susceptible de ser aplicado segn diversas variantes.
Bsicamente, se van incorporando variables al modelo (forward selection), o
se van eliminando variables de l (backward elimination). Virtualmente todos

los grandes paquetes informticos para el tratamiento estadstico de datos


brindan la posibilidad de aplicar estas dos posibilidades.
La lgica subyacente de tal recurso consiste en conservar las variables
independientes que contienen informacin relevante y a la vez prescindir de
aquellas que resulten redundantes respecto de las que quedaron en el
modelo. Se trata de procedimientos de ndole exclusivamente estadstica,
que discurren segn algoritmos programables en los que, una vez elegido el
conjunto inicial de variables, no intervienen los juicios tericos de los
investigadores.
Si este procedimiento se emplea para construir un modelo predictivo a
travs de un proceso acorde con el llamado Principio de Parsimonia (tratar
de que figure la menor cantidad posible de variables), no hay objecin de
peso al empleo de la RPP, ya que la prediccin es un proceso para cuya
valoracin el nico mecanismo de inters es estrictamente pragmtico. Sin
embargo, por lo general la RPP se usa para identificar los factores
verdaderamente influyentes y no para construir modelos de prediccin.
Tras la aplicacin de la RPP, los resultados suelen ser interpretados
como sigue: las variables que se quedan dentro del modelo final son
parcialmente responsables (quiz las principales y hasta las nicas
responsables)

de

las

modificaciones

que

experimenta

la

variable

dependiente; las que no permanecen, no influyen causalmente en el proceso,


o su influencia no es apreciable. En tal caso, la seleccin algortmica de
modelos se emplea con la aspiracin de obtener de manera automtica
conclusiones explicativas sobre el proceso causal que estudian. La
esperanza de que el uso de este procedimiento contribuya a "entender" o
"explicar" la realidad es, en el mejor de los casos, estril o quimrica; y, no
con baja probabilidad, contraproducente y descabellada.
Anlisis de Correlacin
Es el conjunto de tcnicas estadsticas empleado para medir la
intensidad de la asociacin entre dos variables. El principal objetivo del

anlisis de correlacin consiste en determinar que tan intensa es la relacin


entre dos variables. Normalmente, el primer paso es mostrar los datos en
un diagrama de dispersin.
Diagrama de Dispersin
Es aquel grafico que representa la relacin entre dos variables.
Variable Dependiente
Es la variable que se predice o calcula. Cuya representacin es "Y"
Variable Independiente
Es la variable que proporciona las bases para el clculo. Cuya
representacin es: X1, X2, X3,..., Xn.
Coeficiente de Correlacin
Describe la intensidad de la relacin entre dos conjuntos de variables
de nivel de intervalo. Es la medida de la intensidad de la relacin lineal entre
dos variables. El valor del coeficiente de correlacin puede tomar valores
desde menos uno hasta uno, indicando que mientras ms cercano a uno sea
el valor del coeficiente de correlacin, en cualquier direccin, ms fuerte ser
la asociacin lineal entre las dos variables. Mientras ms cercano a cero sea
el coeficiente de correlacin indicar que ms dbil es la asociacin entre
ambas variables. Si es igual a cero se concluir que no existe relacin lineal
alguna entre ambas variables.
Anlisis de regresin
Es la tcnica empleada para desarrollar la ecuacin y dar las
estimaciones.
Ecuacin de Regresin
Es una ecuacin que define la relacin lineal entre dos variables.
Ecuacin de regresin Lineal:
Y = a + Bx
Ecuacin de regresin Lineal Mltiple
Y = a + b1X1 + b2X2 + b3X3...

Principio de Mnimos Cuadrados


Es la tcnica empleada para obtener la ecuacin de regresin,
minimizando la suma de los cuadrados de las distancias verticales entre los
valores verdaderos de "Y" y los valores pronosticados "Y".
Anlisis de regresin y Correlacin Mltiple
Consiste en estimar una variable dependiente, utilizando dos o ms
variables independientes.

DISCUSIN
Un aspecto que se olvida frecuentemente es que los modelos de
regresin se basan en hacer unas determinadas suposiciones sobre los
datos y que stas no siempre se cumplen, por lo que es preciso comprobar si
las hiptesis bsicas del modelo se dan en nuestros datos. Es lo que se
conoce como diagnstico del modelo. En el caso de los modelos de
regresin multivariable se utiliza el concepto de residuo: diferencia entre el
valor observado y el valor estimado por la ecuacin de regresin, es decir lo
que la ecuacin de regresin no explica para cada unidad de observacin.
En un modelo de regresin lineal que sea adecuado los residuos deben
seguir una distribucin normal con media 0 y varianza constante, por lo que
un posible diagnstico puede ser comprobar esa situacin. Se puede
efectuar de manera formal o mediante una grfica en la que se representa el
valor de los residuos frente al valor estimado
Los modelos de regresin pueden ser validados en otro conjunto de
datos de similares caractersticas, con el fin de evaluar su fiabilidad. Otra
posibilidad,

cuando

se

trabaja

con

muestras

grandes,

es

dividir

aleatoriamente la muestra en dos grupos y utilizarlos para obtener dos


modelos con el fin compararlos para comprobar si se obtienen similares
resultados.
Un ndice empleado para validar el modelo se basa en estimar la
ecuacin de regresin en una de las submuestras y calcular el coeficiente de
correlacin Ra entre los valores observados y los valores estimados por la
ecuacin (este coeficiente coincide con el valor del coeficiente de correlacin
mltiple). Despus aplicamos la ecuacin de regresin al otro grupo para
calcular el valor estimado de Y para cada unidad de observacin y
calculamos el coeficiente de correlacin Rb entre ese valor estimado y el
valor realmente observado. La diferencia entre el cuadrado de ambos
coeficientes

se denomina ndice de reduccin en la validacin cruzada.

Valores de este ndice inferiores a 0.1 indican que el modelo es muy fiable
mientras que valores superiores a 0.9 corresponden a modelos muy poco
fiables.
La hiptesis para probar la significancia desde cualquier coeficiente de
regresin es

Si la hiptesis nula no es rechazada, es un indicador de que la variable


regresora puede ser eliminada del modelo.

CONCLUSIONES

La regresin lineal mltiple estima los coeficientes de la ecuacin lineal,


con una o ms variables independientes, que mejor prediga el valor de la
variable dependiente.
Es importante observar que si las variables explicativas X estn muy
correlacionadas entre s, la matriz (X*X ) va a tener el determinante con valor
cero o muy cercano a cero.
Si hay al menos una variable que puede ser expresada como
combinacin lineal del resto (ingresos mensuales, ingresos anuales) el
determinante de esta matriz es cero y dicha matriz ser singular y por lo tanto
no tendr inversa.
Si no hay variables que sean combinacin lineal de las dems, pero
estn fuertemente correlacionadas, el determinante no ser cero pero tendr
un valor muy prximo a cero; este caso va a producir una inestabilidad en la
solucin del estimador, en general, se va a producir un aumento en su
varianza. En estos casos se impone la utilizacin de un mtodo de seleccin
de variables explicativas.
A los problemas provocados por la fuerte correlacin entre las variables
explicativas se les llama multicolinealidad.
La hiptesis nula es que todos los coeficientes menos son nulos y la
hiptesis alternativa o complementaria es que existe al menos uno que es
distinto de 0, puede haber varios que sean nulos, pero al menos existe uno
distinto de cero. Se denomina contraste de regresin al estudio de la
posibilidad de que el modelo de regresin sea nulo, es decir, los valores de
las variables explicativas X no van a influir en la variable
En general si el p-value es menor de 0.05 se acepta que el modelo de
regresin es significativo; en caso contrario no podemos hablar de regresin,
pues el modelo sera nulo.

Los procedimientos para seleccionar las variables regresoras son los


siguientes: Eliminacin progresiva. Introduccin progresiva. Regresin paso
a paso (Stepwise Regression). Este ltimo mtodo es una combinacin de
los procedimientos anteriores. Parte del modelo sin ninguna variable
regresora y en cada etapa se introduce la ms significativa, pero en cada
etapa examina si todas las variables introducidas en el modelo deben de
permanecer. Termina el algoritmo cuando ninguna variable entra o sale del
modelo.
La obtencin de estimadores, intervalos de confianza y contrastes de
hiptesis para los coeficientes de regresin involucran expresiones
matriciales y distribuciones multivariantes que complican notablemente las
operaciones las hiptesis habituales de independencia, homocedasticidad,
normalidad y linealidad se calculan expresiones para el error estndar de
cada coeficiente estimado e intervalos de confianza de modo anlogo al caso
de la regresin simple. La significacin estadstica de cada variable se
obtiene simplemente calculando el cociente entre el coeficiente estimado y
su error tpico, y comparndolo con el cuantil correspondiente de una
distribucin t de Student con n-p-1 grados de libertad. La bondad de ajuste
del modelo se puede valorar mediante la varianza residual y el estadstico R 2
(coeficiente de determinacin), definidos de la forma habitual. Tambin aqu
puede utilizarse el contraste F global de la regresin, calculado a partir de las
sumas de cuadrados explicada y no explicada para valorar la utilidad del
modelo.

REFERENCIAS

Crdova, Jorge Herramientas Estadsticas para la Gestin en Salud. JC


ediciones. Versin electrnica (formato CD) Mayo 2003.
Gujarati, Damodar N. (1997). Econometra. Tercera Edicin. Mc Graw Hill.
(Captulo I. Pg. 15-30)
Hildebrand, David y Ott, Lyman. Estadstica Aplicada a la administracin y a
la economia. Addison wesley Iberoamericana SA. 1997. Cap. 13,14 y 15.
Lind, Douglas y Marchal, William y MASON, Robert. Estadstica para
administracin y economia. Alfaomega. Colombia 11 edicin. 2004
Cap.13 y 14
Pulido San Romn, Antonio. (1983). Modelos Economtricos. Ediciones
Pirmide S.A. - Madrid (Primera parte)

APNDICE

Datos. Las variables dependiente e independientes deben ser


cuantitativas. Las variables categricas, como la religin, estudios principales
o el lugar de residencia, han de recodificarse

como variables binarias

(dummy) o como otros tipos de variables de contraste.


Supuestos. Para cada valor de la variable independiente, la
distribucin de la variable dependiente debe ser normal. La varianza de
distribucin de la variable dependiente debe ser constante para todos los
valores de la variable independiente. La relacin entre la variable
dependiente y cada variable independiente debe ser lineal y todas las
observaciones deben ser independientes.
Estadsticos. Para cada variable: nmero de casos vlidos, media y
desviacin tpica. Para cada modelo: coeficientes de regresin, matriz de
correlaciones, correlaciones parciales y semiparciales, R mltiple, R
cuadrado, R cuadrado corregida, cambio en R cuadrado, error tpico de la
estimacin, tabla de anlisis de la varianza, valores pronosticados y residuos.
Adems, intervalos de confianza al 95% para cada coeficiente de regresin,
matriz de varianza-covarianza, factor de inflacin de la varianza, tolerancia,
prueba de Durbin-Watson, medidas de distancia (Mahalanobis, Cook y
valores de influencia), DfBeta,

DfAjuste, intervalos de prediccin y

diagnsticos por caso. Diagramas: diagramas de dispersin, grficos


parciales, histogramas y grficos de probabilidad normal.
Grficos. Los grficos pueden ayudar a validar los supuestos de
normalidad, linealidad e igualdad de las varianzas. Tambin son tiles para
detectar valores atpicos, observaciones poco usuales y casos de influencia.
Tras guardarlos como nuevas variables, dispondr en el Editor de datos de
los valores pronosticados, los residuos y otros valores diagnsticos, con los
cuales podr poder crear grficos respecto a las variables independientes.
Se encuentran disponibles los siguientes grficos:

Diagramas de dispersin. Puede representar cualquier combinacin


por parejas

de la lista siguiente: la variable dependiente, los valores

pronosticados tipificados, los residuos tipificados, los residuos eliminados, los


valores pronosticados corregidos, los residuos estudentizados o los residuos
eliminados estudentizados. Represente los residuos tipificados frente a los
valores pronosticados tipificados para contrastar la linealidad y la igualdad de
las varianzas.
Generar todos los grficos parciales. Muestra los diagramas de
dispersin de los residuos de cada variable independiente y los residuos de
la variable dependiente cuando se regresan ambas variables por separado
sobre las restantes variables independientes. En la ecuacin debe haber al
menos dos variables independientes para que se generen

los grficos

parciales.
Grficos de residuos tipificados. Puede obtener histogramas de los
residuos tipificados y grficos de probabilidad normal que comparen la
distribucin de los residuos tipificados con una distribucin normal.
La regresin a la media es la tendencia de una medicin extrema a
presentarse ms cercana a la media en una segunda medicin.
La regresin se utiliza para predecir una medida basndonos en el
conocimiento de otra. A menudo en una investigacin el objetivo es explicar
el comportamiento de una variable en trminos de ms de una variable
Tipos de regresin: lineal, logartmica, exponencial, cuadrtica y
cbica.
Regresin mltiple. Cuando hay ms de una variable independiente
x.
Un residual

es la diferencia entre el valor observado

estimado por la lnea de regresin , es decir, que

y el valor

Вам также может понравиться