Академический Документы
Профессиональный Документы
Культура Документы
ESTADISTICA INFERENCIAL II
UNIDAD 1
EJERCICIO 12.5
a)
^y =26.7+ 0.572(400)
^y =228.82
^y =228.82 x 1000
^y =228826
d)
b0
igual a cero
b1
Es el cambio esperado de las ventas auditadas por unidad de cambio en las ventas reportadas en
0.572
e)
r =90.1
El 90.1
de variacin de las ventas auditadas se explica por la variabilidad de las ventas reportadas
H0
, y concluimos que existe una relacin lineal entre las variables rdenes y
H 1 : B1 0
F= 73.22
fc> fu73.22>5.32
H0
Sb 1=0.06683
b1=0.572
t n2 =2.31
b1 t n2 Sb1
0.572 ( 2.31 ) ( 0.06683 )
0.572+0.1543=0.7263
0.5720.1543=0.4177
Intervalo de confianza
(41.77 , 72.63)
Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
41.77 , 72.63 , estos valores estn por encima de cero por lo tanto se concluye que existe una relacin
lineal significativa entre las ventas auditadas y las reportadas
EJERCICIO 12.6
Anlisis de regresin: Horas de trabajo vs. Pies cbicos
La ecuacin de regresin es
Horas de trabajo = - 2.37 + 0.0501 Pies cbicos
Predictor
Coef Coef. De EE
T
P
Constante
-2.370
2.073 -1.14 0.261
Pies cbicos 0.050080 0.003031 16.52 0.000
S = 5.03143 R-cuad. = 88.9% R-cuad. (Ajustado) = 88.6%
Anlisis de varianza
Fuente
GL
SC
MC
F
P
Regresin
1 6910.7 6910.7 272.99 0.000
Error residual 34 860.7 25.3
Total
35 7771.4
Estadstico de Durbin-Watson = 1.65068
a)
b)
c)
d)
e)
0.05
a)
b) y= -2.37 + 0.0501 x
Horas de trabajo = - 2.37 + 0.0501 Pies cbicos
c) y= -2.37 + 0.0501 (500)
y= -2.37+25.05 =22.68Horas de trabajo.
d)
b0: Es la interseccin en el eje y. Representa el promedio de las horas de trabajo cuando los pies
cbicos son iguales a cero.
e)
b1: La pendiente nos indica el cambio en los pies cbicos de cada unidad por cada unidad de
cambio. Es decir, por cada unidad de cambio en los pies cbicos hay un aumento de
0.0501unidades en horas de trabajo
2
r =88.9
significa que el 88.9% de la variacin de las horas trabajadas se explica por la variabilidad
en los pies cbicos de la mudanza. Indica una relacin lineal positiva entre las dos variables, el modelo
de regresin predice horas trabajadas en un 88.9% y el otro 11.1% se debe a otros factores.
f) Prueba t
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstico de prueba t= 16.52
16.52
=0.05 , rechazamos
H 0 : B1=0
, por lo tanto concluimos que existe relacin lineal entre las horas de trabajo y los pies
cbicos de la mudanza. Hay evidencias necesarias para determinar que la ecuacin de la relacin lineal
de este modelo es aceptable.
Valor P
De acuerdo al valor p se rechaza
H0
y se acepta
H1,
Prueba f
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba f= 272.99
H0
y se acepta
H1
significacin hay suficiente evidencia estadstica para afirmar que hay relacin entre las horas de trabajo
y los pies cbicos de la mudanza.
g)
Prueba de normalidad, de acuerdo a la grfica como los datos estn cerca de la pendiente concluimos
que no se viola el supuesto de normalidad.
Observando la grfica no hay patrones de comportamiento por lo tanto se concluye que las varianzas son
iguales, por tal razn no hay razn, para sospechar una violacin al supuesto de independencia y
homogeneidad.
h) Puesto que el valor DW=1.65068 se encuentra entre 1.5 y 2.5, podemos asumir que los residuos son
independientes.
I)
b1 t n2 s b 1
b1= 0.0501
n=36 gl=n2=34
t 34 =2.302
tn-2 =
s b1=0.003031
EJERCICIO 12.7
a)
c)
^y =0.191+0.0297 ( 50 )
^y =0.191+1.485
^y =1.676
d)
b0
Es la interseccin en y, representa el promedio de las ordenes en miles cuando el peso del correo
Es el cambio esperado de las rdenes en miles en el peso del correo en libras en 0.0297
e)
r =97.2
El 97.2
de variacin de las ordenes en miles se explica por la variabilidad del peso del correo en libras
f) Prueba T
=0.05
H 0 : B1=0
H 1 : B1 0
Estadstico de prueba
t=28.82
gl=252=23
tc>t 28.82>2.07
H0
, y concluimos que existe una relacin lineal entre las variables rdenes y
Prueba F
H 0 : B1=0
H 1 : B1 0
F= 830.82
Sb 1=0.001030
b1=0.0297
t n2 =2.07
b1 t n2 Sb1
0.02970.00213=0.0275
Intervalo de confianza
(0.0275, 0.0318)
Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
0.0275, 0.0318 , estos valores estn por encima de cero por lo tanto se concluye que existe una relacin
lineal significativa entre las ordenes y el peso del correo
EJERCICIO 12.8
Anlisis de regresin: Valor estimado vs. Ingresos anuales
La ecuacin de regresin es
Valor estimado = - 246 + 4.19 Ingresos anuales
Coef.
Predictor
Coef de EE
T
P
Constante
-246.26 26.04 -9.46 0.000
Ingresos anuales 4.1897 0.1957 21.41 0.000
a)
b)
c)
d)
e)
a)
b) y= -246 + 4.19x
0.05
e)
b0: Es la interseccin en el eje y. Representa el promedio del valor estimado cuando los ingresos
anuales son igual a cero.
b1: La pendiente nos indica el cambio en el valor estimado de cada unidad por cada unidad de
cambio en los ingresos anuales. Es decir, por cada unidad de cambio en los ingresos anules hay
un aumento de 0.0297unidades en el valor estimado
r 2=94.2
significa que el 94.2% de la variacin del valor de las franquicias se explica por la
variabilidad en los ingresos anuales. Indica una relacin lineal positiva entre las dos variables, el modelo
de regresin predice el valor de las franquicias en un 94.2% y el otro 5.8% se debe a otros factores.
f) Prueba t
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba t= 21.41
significancia de
=0.05 , rechazamos
H 0 : B1=0
Con un nivel de
H 1 : B1 0
, por lo tanto
concluimos que existe relacin lineal entre el valor de las franquicias y los ingresos anules. Hay
evidencias necesarias para determinar que la ecuacin de la relacin lineal de este modelo es aceptable.
Valor P
De acuerdo al valor p se rechaza
H0
y se acepta
H1,
Prueba f
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba f= 458.28
H0
y se acepta
H1
significacin hay suficiente evidencia estadstica para afirmar que hay relacin entre el valor de la
franquicia y los ingresos anuales.
g)
Prueba de normalidad, de acuerdo a la grfica como los datos estn cerca de la pendiente concluimos
que no se viola el supuesto de normalidad.
Observando la grfica no hay patrones de comportamiento por lo tanto se concluye que las varianzas son
iguales, por tal razn no hay razn, para sospechar una violacin al supuesto de independencia y
homogeneidad.
h) Puesto que el valor DW=1.61617 se encuentra entre 1.5 y 2.5, podemos asumir que los residuos son
independientes.
I)
b1 t n2 s b 1
b1= 4.19
n=30 gl=n2=28
tn-2 =
t 28 =2.048
s b1=0.1957
4.59x1000000=4590000
L.I=4.19 - 0.4007=3.79
3.79x1000000=3790000
Se estima con un nivel de confianza de 95% que la pendiente de la poblacin se encuentra entre (3.79,
4.59) y como estos valores estn por encima del cero, se concluye que si existe una relacin entre el
valor de la franquicia y los ingresos anuales.
Esto indica que por cada aumento de
EJERCICIO 12.9
Anlisis de regresin: Renta mensual vs. Tamao
La ecuacin de regresin es
Renta mensual = 177 + 1.07 Tamao
Coef.
Predictor Coef de EE T
P
Constante 177.1 161.0 1.10 0.283
Tamao 1.0651 0.1376 7.74 0.000
S = 194.595 R-cuad. = 72.3% R-cuad. (Ajustado) = 71.1%
Anlisis de varianza
Fuente
GL
SC
MC
F
P
Regresin
1 2268777 2268777 59.91 0.000
Error residual 23 870949 37867
Total
24 3139726
Estadstico de Durbin-Watson = 2.43833
a)
b)
c)
d)
e)
a)
0.05
b) y= 177+ 1.07x
Renta mensual= 177 + 1.07 Tamao en pies
c) y= 177 + 1.07 (1000)
y= 177+1070= $1247
y= 177 + 1.07 (1200)
y= 177+1284= $1461
A Jim y a Jennifer les conviene ms firmar el contrato de 1200 pies cuadrados y renta mensual de $1425
ya que la renta es menos que la esperada
d)
e)
el tamao. Indica una relacin lineal positiva entre las dos variables, el modelo de regresin predice la
renta mensual en un 72.3% y el otro 27.7% se debe a otros factores.
f) Prueba t
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
=0.05 , rechazamos
H 0 : B1=0
, por lo tanto concluimos que existe relacin lineal entre la renta mensual y el tamao. Hay
evidencias necesarias para determinar que la ecuacin de la relacin lineal de este modelo es aceptable.
Valor P
De acuerdo al valor p se rechaza
H0
y se acepta
H1,
Prueba f
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba f= 59.91
H0
y se acepta
H1
significacin hay suficiente evidencia estadstica para afirmar que hay relacin entre la renta mensual y el
tamao.
g)
Prueba de normalidad, de acuerdo a la grfica como los datos estn cerca de la pendiente concluimos
que no se viola el supuesto de normalidad.
Observando la grfica no hay patrones de comportamiento por lo tanto se concluye que las varianzas son
iguales, por tal razn no hay razn, para sospechar una violacin al supuesto de independencia y
homogeneidad.
h) Puesto que el valor DW=2.43833 se encuentra entre 1.5 y 2.5, podemos asumir que los residuos son
independientes.
I)
b1 t n2 s b 1
b1= 1.07
n=25 gl=n2=23
tn-2 =
t 23 =2.068
s b1=0.1376
EJERCICIO 12.74
Anlisis de regresin: Tiempo de entrega vs. Numero de cajas
La ecuacin de regresin es
Tiempo de entrega = 24.8 + 0.140 Numero de cajas
Predictor
Coef Coef. De EE
T
P
Constante
24.835
1.054 23.56 0.000
Numero de cajas 0.140026 0.005627 24.88 0.000
S = 1.98650 R-cuad. = 97.2% R-cuad. (Ajustado) = 97.0%
Anlisis de varianza
Fuente
GL
SC
MC
F
P
Regresin
1 2443.5 2443.5 619.20 0.000
Error residual 18 71.0 3.9
Total
19 2514.5
Estadstico de Durbin-Watson = 1.79361
a)
b)
c)
d)
e)
0.05
a)
b) y= 24.8+ 0.140x
Tiempo de entrega= 24.8 + 0.140 Numero de cajas
c) y= 24.8 + 0.140 (150)
y= 24.8+21= 45.8min
d)
e)
b0: Es la interseccin en el eje y. Representa el promedio del tiempo de entrega cuando el nmero
de cajas es igual a cero.
b1: La pendiente nos indica el cambio en el tiempo de entrega de cada unidad por cada unidad de
cambio en el tamao. Es decir, por cada unidad de cambio en el nmero de cajas hay un aumento
de 0.140 unidades en el tiempo de entrega.
r 2=97.2
significa que el 97.2% de la variacin del tiempo de entrega se explica por la variabilidad
en el nmero de cajas. Indica una relacin lineal positiva entre las dos variables, el modelo de regresin
predice el tiempo de entrega en un 97.2% y el otro 2.8% se debe a otros factores.
f) Prueba t
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
=0.05 , se rechaza
H 0 : B1=0
H 1 : B1 0
, por lo tanto concluimos que existe relacin lineal entre el tiempo de entrega y el nmero de cajas. Hay
evidencias necesarias para determinar que la ecuacin de la relacin lineal de este modelo es aceptable.
Valor P
De acuerdo al valor p se rechaza
Prueba f
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba f= 619.20
H0
y se acepta
H1,
H0
y se acepta
H1
significacin hay suficiente evidencia estadstica para afirmar que hay relacin entre el tiempo de entrega
y el nmero de cajas.
g)
Prueba de
normalidad, de acuerdo a la grfica como los datos estn cerca de la pendiente concluimos que no se
viola el supuesto de normalidad.
Observando la grfica no hay patrones de comportamiento por lo tanto se concluye que las varianzas son
iguales, por tal razn no hay razn, para sospechar una violacin al supuesto de independencia y
homogeneidad.
h) Puesto que el valor DW=1.79361 se encuentra entre 1.5 y 2.5, podemos asumir que los residuos son
independientes. No hay correlacin.
i)
b1 t n2 s b 1
tn-2 =
t 18 =2.10
s b1=0.005627
EJERCICIO 12.75
Una casa de corredura desea predecir el nmero de negocios realizados por da utilizando el nmero de
llamadas telefnicas entrantes como una variable predictiva. Los datos fueron recolectados a lo largo de
un periodo de 35 das. TRADES
DIAS
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
LLAMADAS
2591
2146
2185
2245
2600
2510
2394
2486
2483
2297
2106
2035
1936
1951
2292
2094
1897
2237
2328
2078
2134
2192
1965
NEGOCIOS
417
321
362
364
442
386
370
376
463
389
302
266
339
369
403
319
306
397
365
330
312
340
339
24
25
26
27
28
29
30
31
32
33
34
35
2147
2015
2046
2073
2032
2108
1923
2069
2061
2010
1913
1904
364
295
292
379
294
329
274
326
306
352
290
283
Trades
400
350
300
250
1900
2000
2100
2200
2300
Calls
2400
2500
2600
R.
O
^y =63.0+0.1890 x
C) Predecir los promedios indicadas en cada uno de los ejercicios. (prediga el nmero de negocios
realizados para un da en el que el nmero de llamadas telefnicas entrantes fue de 2000.
R.
^y =63.0+0.1890 ( 2000 )=63.0+378=
^y =315 numero de negocio por llamadastelefonicas
D) Interprete el significado de
b0
b1
R.
b0 = Representa la interseccin el nmero de negocios (y), cuando el nmero de llamadas (x) es cero,
ser de -63.0.
b1 = La pendiente representa el cambio esperado en el nmero de llamadas (y) por unidad de cambio
en el nmero de llamadas (x), por cada cambio en el nmero de negocios, el nmero de llamadas
incrementa en un 0.1890.
E) Calcular
r2
de interprete el resultado
2
R. r = 63.01%
Significa que el 63.01 % de la variacin del nmero de negocios se explica por la variabilidad del nmero
de llamadas, indicando fuerte relacin lineal positiva entre las dos variables. El modelo de regresin
predice el nmero de negocios en un 63.01 % y el otro 36.99 se debe a otros factores.
F) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de
0.05
R.
Prueba t
H o :B1 =0
H 1 : B1 0
t c =7.50
t c =7.50
t c>
Prueba F
(H o )
t
=7.50>2.0345
2
f =56.21
Grfica de distribucin
F, df1=1, df2=33
1.2
Densidad
1.0
0.8
0.6
f =56.21
0.4
0.2
0.0
0.05
0
4.139
f > f =56.21>4.139
(H o ) y se concluye que el
vs. ajustes
50
90
Residuo
Porcentaje
99
50
10
0
-25
-50
1
-80
-40
40
80
300
360
390
Valor ajustado
Histograma
vs. orden
50
25
4
2
0
330
Residuo
Residuo
Frecuencia
25
420
0
-25
-50
-60
-30
30
Residuo
60
10
15
20
25
30
35
Orden de observacin
De acuerdo a la grfica de probabilidad normal, los datos estn cerca de la pendiente, por lo tanto
se concluye que no se viola el supuesto de normalidad, aunque el histograma no este distribuido
de manera normal.
En la grfica vs. Ajuste, no se observa ningn patrn aparente en los residuos, los puntos estn en
una distancia igual a la recta, por lo tanto se concluye que no se violan los supuestos de linealidad
y homocedasticidad.
En la grfica de Vs. Orden no se observa un patrn, por lo tanto no se viola el supuesto de
independencia, pero se analizara ms adecuadamente una prueba del estadstico de Durbin
Watson.
H) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
R. D = 1.96073
0.1890 (2.0345)(0.0252)
0.1890+( 2.0345)(0.0252)=0.2402
0.1890(2.0345)(0.0252)=0.1377
Intervalo de confianza
( 0.2402, 0.1377 )
Por lo tanto se estima que con un nivel de confianza del 95% que la pendiente de la poblacin se
encuentra entre (0.22402, 0.1377) estos valores estn por encima de cero por lo tanto se concluye
que existe que existe una relacin lineal significativa entre el nmero de negocios y el nmero de las
llamadas.
Esto indica que por cada aumento de los pies cbicos se estima que las horas de trabajo
incrementen a por lo menos 0.1377 pero no ms de 0.2402.
se
EJERCICIO 12.76
Usted desea desarrollar un modelo para predecir el precio de venta de casas con base en el valor del
avalu. Se selecciona una muestra de 30 casas unifamiliares recientemente vendidas en una pequea
ciudad, para estudiar la relacin entre el precio de venta (en miles de dlares) y el precio del avalu (en
miles de dlares). Las casa en la ciudad fueron reevaluadas a su valor total un ao antes del estudio. Los
resultados se encuentran en el ejercicio HOUSE1.
Price
94.10
Value
78.17
New
1
Time
10
101.90
88.65
115.50
87.50
72.00
91.50
113.90
69.34
96.90
96.00
61.90
93.00
109.50
93.75
106.70
81.50
94.50
69.00
96.90
86.50
97.90
83.00
97.30
100.80
97.90
90.50
97.00
92.00
95.90
80.24
74.03
86.31
75.22
65.54
72.43
85.61
60.80
81.88
79.11
59.93
75.27
85.88
76.64
84.36
72.94
76.50
66.28
79.74
72.78
77.90
74.31
79.85
84.78
81.61
74.92
79.98
77.96
79.07
1
0
0
0
0
0
0
0
1
0
0
0
1
0
0
0
1
0
1
0
1
0
1
1
1
0
1
0
1
Coef
-44.172
1.78171
Coef. de EE
7.346
0.09546
R-cuad. = 92.6%
T
-6.01
18.66
P
0.000
0.000
R-cuad.(ajustado) = 92.3%
Anlisis de varianza
Fuente
Regresin
Error residual
Total
GL
1
28
29
SC
4206.7
338.1
4544.8
MC
4206.7
12.1
F
348.37
P
0.000
10
11
2
5
4
17
13
6
5
7
4
11
10
17
12
5
14
1
3
14
12
11
12
2
6
12
4
9
12
B)
85
Value
80
75
70
65
60
60
70
80
90
100
110
120
Price
R.
O
avaluo=28.65+ 0.5195 precio
D) Predecir los promedios indicadas en cada uno de los ejercicios. (prediga el valor de avalo para
una casa cuyo valor es de $70,000.
^y =28.65+ 0.5195 x=28.65+ 0.5195 ( 70000 ) =$ 36,393.65
E) Interprete el significado de
R.
b0
b1
b0 = Representa la interseccin en el valor del avalo (y), cuando el precio de la casa (x) es cero,
ser de 28.65.
b1 = La pendiente representa el cambio esperado en el valor del avalo (y), por unidad de cambio
en el precio de la casa (x), por cada cambio en el valor del avalo, el precio de la casa incrementara
un 0.5195.
F) Calcular
de interprete el resultado
R.
r2
= 92.56%
Significa que el 92.56% de la variacin del valor del avalo se explica por la variabilidad del precio de la
casa, indicando fuerte relacin lineal positiva entre las dos variables. El modelo de regresin predice el
valor del avalo en 92.56% y el otro en 7.44 % se debe a otros factores.
G) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de
R.
Prueba t
H o :B1 =0
H 1 : B1 0
gl=28
Estadistico de prueba t c =18.66
0.05
Grfica de distribucin
T, df=28
0.4
Densidad
0.3
0.2
0.1
0.025
0.0
0.025
-2.048
2.048
t c>
t
=18.66>2.048
2
Se rechaza la hiptesis nula y se concluye que existe una relacin lineal entre el valor del avalo y el
precio de la casa.
Prueba F
H o :B1 =0
H 1 : B1 0
gl=28
f =348.37
Grfica de distribucin
F, df1=1, df2=28
1.2
1.0
Densidad
0.8
0.6
f =348.37
0.4
0.2
0.0
0.05
0
4.196
90
Residuo
Porcentaje
50
10
0
-2
-4
1
-5.0
-2.5
0.0
2.5
5.0
60
Residuo
Histograma
90
vs. orden
4
Residuo
Frecuencia
80
Valor ajustado
4
2
0
70
0
-2
-4
-4
-2
Residuo
2 4
6 8 10 12 14 16 18 20 22 24 26 28 30
Orden de observacin
EJERCICIO 12.77
Usted desea desarrollar un modelo de prediccin del valor del avalo de las casa con base en un rea
de calefaccin. Se selecciona una muestra de 15 casas unifamiliares en una ciudad. El valor de avalo
(en miles de dlares) y el rea de calefaccin delas casa (en miles de pies cuadrados) se registran con
los siguientes resultados: HOUSE2.
Value
84.4
77.4
75.7
85.9
HeatArea
2.00
1.71
1.45
1.76
Age
3.42
11.50
8.33
0.00
79.1
1.93
70.4
1.20
75.8
1.55
85.9
1.93
78.5
1.59
79.2
1.50
86.7
1.90
79.3
1.39
74.5
1.54
83.8
1.89
76.8
1.59
A) Construir un diagrama de dispersin
R.
7.42
32.00
16.00
2.00
1.75
2.75
0.00
0.00
12.58
2.75
7.17
Value
82
80
78
76
74
72
70
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
HeatArea
D) Interprete el significado de
R.
b0
b1
b0 = Representa la interseccin en el valor del avalo de las casas (y), cuando el rea de
calefaccin (x) es cero, ser de 51.92 (miles)
b1 = La pendiente representa el cambio esperado en el valor del avalo de las casas (Y) por
unidad de cambio en el rea de calefaccin (X), por cada cambio en el valor del avalo de las
casas, el rea de calefaccin incrementara en un 16.63.
E) Calcular
r2
de interprete el resultado
R.
r 2=65.93
Significa que el 65.93% de la variacin del valor del avalo de las casas se explica por la variabilidad
del rea de calefaccin, indicando fuerte relacin lineal positiva entre las dos variables. El modelo de
regresin predice el valor el avalo en un 65.93% y el otro 34.07% se debe a otros factores.
0.05
Grfica de distribucin
T, df=13
0.4
Densidad
0.3
0.2
0.1
0.025
0.0
0.025
-2.160
2.160
t c>
( H o ) y se concluye que existe una relacin lineal entre el valor del avalo
Prueba F
H o :B1 =0
H 1 : B1 0
gl=13
f =25.16
t
=5.02>2.160
2
Grfica de distribucin
F, df1=1, df2=13
0.8
0.7
Densidad
0.6
0.5
0.4
f =25.16
0.3
0.2
0.1
0.0
0.05
0
4.667
90
2.5
Residuo
Porcentaje
50
10
1
0.0
-2.5
-5.0
-5.0
-2.5
0.0
2.5
5.0
70
75
Residuo
Histograma
vs. orden
Residuo
Frecuencia
85
5.0
80
Valor ajustado
2.5
0.0
-2.5
-5.0
-4
-2
Residuo
1 2 3
7 8 9 10 11 12 13 14 15
Orden de observacin
H) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
R. No es necesario realizar la prueba de Durbin Watson, porque el clculo no requiere o especifica
periodos de tiempos anteriores al interesado.
( 23.80,9.45 )=(23,800,9450)
Por lo tanto se estima que con un nivel de confianza del 95% que la pendiente de la poblacin se
encuentra entre (23,800, 9450), estos valores estn por encima de cero por lo tanto se concluye que
existe que existe una relacin lineal significativa entre el valor del avalo de las casas y el rea de la
calefaccin.
Esto indica que por cada aumento del valor del avalo de la casa se estima que el rea de calefaccin
se incremente a por lo menos 9450 pero no ms de 23800.
EJERCICO 12.78
Al director de postgrado en una facultad de administracin le gustara predecir el ndice de puntos de
calificacin (GPI) de los estudiantes en un programa de MBA con base en la puntuacin de la prueba de
aptitudes gerenciales del graduado (GMAT). Se seleccion una muestra de 20 estudiantes que haban
completado dos aos de ese programa. Los resultados son los siguientes:
Observacin
1
2
3
4
5
GMAT
688
647
652
608
680
GPI
3.72
3.44
3.21
3.29
3.91
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
617
557
599
616
594
567
542
551
573
536
639
619
694
718
759
3.28
3.02
3.13
3.45
3.33
3.07
2.86
2.91
2.79
3.00
3.55
3.47
3.60
3.88
3.76
GPI
700
650
600
550
500
2.8
3.0
3.2
3.4
3.6
3.8
4.0
GMAT
B)
regresin
R.
^y =76.7+163.8 GMAT
R.
^y =76.8+ 98,280
^y =98,356.8
Calcular
la
ecuacin
de
D) Interprete el significado de b0 y b1
R.
b0
Representa la interseccin del GPI (Y) cuando (X) el GMAT tiene un valor igual a cero. No
b1
La pendiente representa el cambio esperado de (Y) por el GMAT (X), por cada proceso el
tiempo incrementaran en un
163.8
Significa que el
78.66
de la variacin de los puntos de calificacin indica una relacin lineal entre las
78.66
y el otro
21.34
Prueba t
H o :B1 =0
H 1 : B1 0
gl=18
t c =8.43
0.05
de
Grfica de distribucin
T, df=18
0.4
Densidad
0.3
0.2
0.1
0.025
0.0
0.025
-2.101
2.101
t c>
t
=8.43>2.101
2
Prueba F
H o :B1 =0
H 1 : B1 0
gl=18
f =71.03
Grfica de distribucin
F, df1=1, df2=18
1.0
0.025
Densidad
0.8
0.6
0.4
0.2
0.0
0.025
0.001010
0
5.978
f > f =71.03>5.978
Cae en la regin de rechazo por lo tanto se rechaza la hiptesis nula
90
25
Residuo
Porcentaje
50
10
1
0
-25
-50
-50
-25
25
50
Residuo
300
vs. orden
50
10.0
25
7.5
Residuo
Frecuencia
200
Valor ajustado
Histograma
5.0
2.5
0.0
100
0
-25
-50
-40
R.
-20
Residuo
20
40
2 4
6 8 10 12 14 16 18 20 22 24 26 28 30
Orden de observacin
Prueba de normalidad: De acuerdo a las grficas los datos de la pendiente estn cerca de la
pendiente y tambin se hacen una grfica de gauss, por lo tanto podemos decir que no se viola el
supuesto de normalidad.
Prueba de linealidad y homocedasticidad: No existe patrn evidente en los residuos, por lo tanto
decimos que no se viola el supuesto de linealidad y homocedasticidad.
Prueba de independencia: No se halla un patrn (modelo), entonces se conoce que no se viola el
supuesto de independencia.
H) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
R. D.W = 1.64219
D>d u=1.64219>1.41 no hay evidencia de autocorrelacin el metodo de minimos cuadrados es apropiado
R.
b1 t n2 Sb1
163.8 (2.101)(19.4)
163.8+(2.101)(19.4)=203.7594
163.8( 2.101 ) ( 19.4 ) =122.2406
Intervalo de confianza
( 122.2406 ,203.7594 )
Por lo tanto se estima que con un nivel de confianza del 95% que la pendiente de la poblacin se
encuentra entre ( 122.2406 ,203.7594 ) estos valores estn por encima de cero por lo tanto se concluye
que existe que existe una relacin lineal significativa entre las GPI y el GMAT.
Esto indica que por cada aumento GPI se incrementen a por lo menos 122.2406 pero no ms de
203.7594
EJERCICIO 12.79
El gerente del departamento de compras en una gran organizacin bancaria quisiera desarrollar un
modelo para predecir el tiempo que toma procesar facturas. Se recolectaron datos provenientes de una
muestra de 30 das y se registr el nmero de facturas procesadas y el tiempo en que se completaron, en
horas.
Process
149
60
188
19
201
Time
2.1
1.8
2.3
0.3
2.7
58
77
222
181
30
110
83
60
25
173
169
190
233
289
45
193
70
241
103
163
120
201
135
80
29
1.0
1.7
3.1
2.8
1.0
1.5
1.2
0.8
0.4
2.0
2.5
2.9
3.4
4.1
1.2
2.5
1.8
3.8
1.5
2.8
2.5
3.3
2.0
1.7
0.5
250
Process
200
150
100
50
0
0
Time
B) Ecuacin de regresin
R. ^y =0.402+0.012607 Process
C) Predecir la cantidad de tiempo que tomara procesar 150 facturas.
^y =0.402+0.012607 (150)
^y =0.402+1.89105
^y =2.292
D) Interprete el significado de
R
b0
b0
b1
Representa la interseccin del tiempo (Y) cuando (X) el proceso tiene un valor igual a cero.
La pendiente representa el cambio esperado (Y) por el tiempo (X), por cada proceso el
tiempo incrementaran en un
D) Calcular
R.
r2
0.012607 .
e interprete el resultado
r 2=88.86
Significa que el 88.86% de la variacin de los procesos se explica por la variabilidad del
tiempo, indicando fuerte relacin lineal positiva entre las dos variables. El modelo de regresin predice las
horas de trabajo en un 88.86% y el otro 11.14% se debe a otros factores.
E) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de
0.05
H o :B1 =0
H 1 : B1 0
gl=28
Estadistico de prueba t c =15.24
Grfica de distribucin
T, df=28
0.4
Densidad
0.3
0.2
0.1
0.025
0.0
0.025
-2.048
2.048
t c>
Prueba F
t
=15.24>2.048
2
H o :B1 =0
H 1 : B1 0
gl=28
f =232.22
Grfica de distribucin
F, df1=1, df2=28
1.2
1.0
Densidad
0.8
0.6
0.4
0.2
0.0
0.05
0
4.196
f > f =73.22>5.318
Cae en la regin de rechazo por lo tanto se rechaza la hiptesis nula
relacionan con el proceso
( H o ) y se concluye el tiempo se
vs. ajustes
0.50
90
Residuo
Porcentaje
99
50
10
0.25
0.00
-0.25
-0.50
-0.8
-0.4
0.0
0.4
0.8
Valor ajustado
Histograma
vs. orden
0.50
Residuo
Frecuencia
Residuo
6
4
2
0.25
0.00
-0.25
-0.50
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
Residuo
G)
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Orden de observacin
R.
J) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
R. D=1.78231
D>d u=1.78231>1.49 no hay evidencia de autocorrelacin el metodo de minimos cuadrados es apropiado
K) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%
b1 t n2 Sb1
0.012607 (2.048)(0.000827)
0.012607+ ( 2.048 ) ( 0.000827 ) =0.014300696
0.012607(2.048)(0.000827)=0.010913304
Intervalo de confianza
( 0.010913304,0.014300696 )
Por lo tanto se estima que con un nivel de confianza del 95% que la pendiente de la poblacin se
encuentra entre ( 0.010913304,0.014300696 ) estos valores estn por encima de cero por lo tanto se
concluye que existe que existe una relacin lineal significativa entre el tiempo y el proceso de factura
Esto indica que por cada aumento del tiempo se incrementara a por lo menos 0.0143 pero menos de
0.01430
EJERCICIO 12.80
a)
d) Interpretar
b0
b0
=18.0 y
b1
=0.240
: Representa el cambio esperado en el ndice de dao de los anillos O por unidad de cambio en los
2
e) Calcular r e interpretar
r 2=38.6
Significa que el 38.6% de la variacin en el ndice de dao de los anillos O, se explica por la variabilidad
de los grados de temperatura. Indica dbil relacin lineal positiva entre las dos variables.
f) Inferencias sobre la pendiente
Prueba t
H 0 : B1=0
H 1 : B1 0
Estadstico de prueba
3.64 <2.080
t c =3.64
Prueba F
F= 13.22
H0
13.22>4.32
Por lo tanto, se rechaza
H0
temperatura.
De acuerdo a la grfica los datos no estn cerca de la pendiente por lo tanto se viola el supuesto de
normalidad.
De acuerdo a la grfica hay un patrn evidente en los residuos, por lo tanto se violan los supuestos
De acuerdo a la grfica existe un patrn evidente en los residuos por lo tanto se viola el supuesto de
independencia.
Intervalo (0.37,0.10)
EJERCICIO 12.81
a)
^y =765+160 (4.50)
^y =1485
d)
b0
lanzamientos
e)
r 2=90.1
El 90.1
H0
y la ejecucin de lanzamientos
Prueba F
, y concluimos que existe una relacin lineal entre las las carreras ganadas
H 0 : B1=0
H 1 : B1 0
F= 73.22
fc> fu73.22>5.32
H0
relacionan
g) Anlisis residual y no violacin de los supuestos
Sb 1=159.99
b1=160
t n2 =2.05
b1 t n2 Sb1
160 ( 2.05 ) ( 159.99 )
160+327.97=487.97
160327.97=167.97
Intervalo de confianza
(41.77 , 72.63)
Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
41.77 , 72.63 , estos valores estn por encima de cero por lo tanto se concluye que existe una relacin
lineal significativa entre las carreras ganadas y la ejecucin de lanzamientos
EJERCICIO 12.82
Durante la temporada de cosecha del otoo en Estados Unidos, se venden grandes cantidades de
calabaza en los puestos de las granjas. Con frecuencia, en lugar de pesar las calabazas antes de su
venta, el grajero solo coloca la calabaza en el recorte circular apropiado en el mostrador. Cuando se le
pregunto por qu se hace esto, el granjero respondi: puedo decir el peso de la calabaza a partir de su
circunferencia. Para determinar si esto es realmente cierto, se midi la circunferencia de una muestra de
23 calabazas y estas se pesaron con los siguientes resultados. PUMPKIN
Circunferencia
(cm)
Peso
(gramos)
Circunferencia
(cm)
Peso
(gramos)
50
55
54
52
37
52
53
47
51
63
33
43
1,200
2,000
1,500
1,700
500
1,000
1,500
1,400
1,500
2,500
500
1,000
57
66
82
83
70
34
51
50
49
60
59
2,000
2,500
4,600
4,600
3,100
600
1,500
1,500
1,600
2,300
2,100
Weight
4000
3000
2000
1000
0
30
40
50
60
70
80
90
Circumference
^y =2,319.2
F) Interprete el significado de b0 y b1
b
R. 0 es la interseccin en el peso de las calabazas, cuando la circunferencia es cero el peso
ser de -2629 gr.
b1 Por cada cm de incremento en la circunferencia hay 82.47 gr de aumento en el peso de la
calabaza.
93.72
Indica una relacin lineal positiva entre las dos variables. El modelo de regresin predice peso de
calabazas en un 93.72 y el otro 6.28 de variacin se debe a otros factores.
H) Realizar inferencias sobre la pendiente prueba t y prueba f con nivel de significancia de
0.05
R. Prueba T
t c =17.71
Grfica de distribucin
T, df=21
0.4
Densidad
0.3
0.2
t c =17.71
0.1
0.025
0.0
0.025
-2.080
2.080
t c >t
2
17.71>2.080
Rechazamos la
H0
Grfica de distribucin
F, df1=1, df2=21
1.0
Densidad
0.8
0.6
0.4
F=313.65
0.2
0.0
0.05
0
4.325
Como
F> Fu
313.65>4.325
H0
90
250
Residuo
Porcentaje
50
10
1
0
-250
-500
-500
-250
250
500
1000
Residuo
2000
3000
4000
Valor ajustado
Histograma
vs. orden
500
250
Residuo
Frecuencia
10.0
7.5
5.0
2.5
0.0
0
-250
-500
-600
-400
-200
Residuo
200
400
10 12
14
16
18 20 22
Orden de observacin
t n2 =2.080
b1 t n2 Sb1
82.47 9.6928
82.47+9.6928=92.1628
82.479.6928=72.7772
(72.7772 ,92.1628)
Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
72.7772 y 92.1628, estos valores estn por encima de cero por lo tanto se concluye que existe una
relacin lineal significativa entre la circunferencia y el peso de las calabazas.
Esto indica que el peso de las calabazas ronda por lo menos 72.77772 gramos pero no ms de
92.1628 gramos.
EJERCICIO 12.83
Es til la informacin demogrfica para predecir las ventas de productos deportivos en las tiendas? Los
datos del archivo SPORTING representan las ventas totales de una muestra aleatoria de 38 tiendas de
una cadena a nivel nacional de productos deportivos. Todas las tiendas de la franquicia, y por lo tanto
dentro de la muestra, tienen aproximadamente el mismo tamao y venden la misma mercanca. Se
denomina base de clientes al condado o, en algunos casos, los condados de los que la tienda extrae la
mayor parte de sus clientes. Se dispone de informacin demogrfica sobre la base de clientes para cada
una de las 38 tiendas. Los datos son reales, pero el nombre de la franquicia no se usa a peticin de la
empresa. Las variables para este conjunto de datos son:
Ventas (y): total de ventas mensuales en el ltimo mes (en dlares).
Edad: edad promedio de la base de clientes (en aos).
Hs: porcentaje de la base de clientes con diploma de bachillerato.
Universidad: porcentaje de clientes con diploma universitario.
Crecimiento: tasa de crecimiento anual de la poblacin en los ltimos 10 aos.
Ingreso (x): ingreso promedio familiar de la base de clientes (en dlares).
TABLA DE DATOS
VENTAS
1695713
3403862
2710353
529215
663687
2546324
2787046
612696
891822
1124968
909501
2631167
882973
1078573
844320
1849119
3860007
826574
604683
1903612
2356808
2788572
634878
2371627
2627838
1868116
2236797
1318876
1868098
1695219
2700194
1156050
643858
HS
73.5949
88.4557
73.5362
79.1780
84.1838
93.4996
78.0234
70.2949
70.6674
63.7395
76.9059
82.9452
65.2127
73.4944
80.2201
87.5973
85.3041
65.5884
80.6176
80.3790
79.8526
81.2371
70.2244
87.1046
80.2057
75.2914
77.6162
85.1753
74.1792
81.6991
73.4140
73.7161
78.6493
UNIVERSIDAD
17.8350
31.9439
18.6198
20.6284
35.2032
41.7057
28.0250
15.0882
10.9829
13.2458
19.5500
20.8135
16.9796
32.9920
22.3185
24.5670
30.8790
17.4545
18.6356
38.3249
23.7780
16.9300
19.1429
30.8843
26.5570
28.3600
19.2490
35.4994
18.6375
41.1130
17.8566
26.5426
29.8734
2188687
830352
1226906
566904
826518
34.7315
30.5613
33.5183
32.3952
29.9108
0.1353
0.3848
0.7417
0.6693
0.1111
46514.8
27030.8
42910.1
40561.4
22326.0
80.9503
66.8057
77.8905
79.3622
58.3610
24.5374
14.1390
20.8340
19.0309
10.6729
A) Construir diagrama de dispersin utilizando las ventas como la variable dependiente (y) y el
ingreso familiar promedio como la variable independiente (x)
R.
Grfica de dispersin de Sales vs. Income
4000000
3500000
Sales
3000000
2500000
2000000
1500000
1000000
500000
20000
25000
30000
35000
40000
45000
50000
55000
Income
C) Interprete el significado de b0 y b1
b
R. 0 es la interseccin en las ventas, cuando el ingreso es cero las ventas sern de 29998.77
dlares.
b1 Por cada incremento en el ingreso hay 39.2 dlares de aumento en las ventas de artculos
deportivos.
D) Calcular r2 e interprete el resultado
2
R. r =14.72
Significa que el
14.72
variacin de los ingresos. Indica dbil relacin lineal entre las dos variables. El modelo de
regresin predice Ventas de productos deportivos en un 14.72 y el otro 85.28 de variacin se
debe a otros factores.
0.05
R. Prueba T
t c =2.49
Grfica de distribucin
T, df=36
0.4
Densidad
0.3
0.2
t c =2.49
0.1
0.025
0.0
0.025
-2.028
2.028
t c >t
2.49>2.028
Rechazamos la
H0
H 1 : B1 0
F=6.21
Grfica de distribucin
F, df1=1, df2=36
1.4
0.025
1.2
Densidad
1.0
0.8
0.6
0.4
F=6.21
0.2
0.025
0.0
0.0009958
0
5.471
Como
F> Fu
6.21>5.471
H0
ventas.
F) Realizar anlisis residual y compruebe la no violacin de los supuestos
R.
Grficas de residuos para Sales
Grfica de probabilidad normal
vs. ajustes
2000000
90
Residuo
Porcentaje
99
50
10
1000000
0
-1000000
1
-2000000
-1000000
1000000
2000000
1000000
1500000
Residuo
2500000
vs. orden
2000000
1000000
Residuo
Frecuencia
Histograma
8
4
2
0
2000000
Valor ajustado
0
-1000000
-1600000
-800000
800000
1600000
Residuo
10
15
20
25
30
35
Orden de observacin
39.2 31.8396
39.2+31.8396=71.0396
39.231.8396=7.3604
(7.3604 , 71.0396)
Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
7.3604 y 71.0396, estos valores estn por encima de cero por lo tanto se concluye que existe una
relacin lineal significativa entre el ingreso familiar y las ventas mensuales.
Esto indica que las ventas mensuales incrementan por lo menos $7.3604 dlares pero no ms de
$71.0396 dlares.