Вы находитесь на странице: 1из 80

1.

TECNOLGICO NACIONAL DE MXICO


INSTITUTO TECNOLGICO DE ACAPULCO
Ingeniera en Gestin Empresarial
Ciencias Econmico Administrativas

ESTADISTICA INFERENCIAL II
UNIDAD 1

EJERCICIO 12.5

a)

b) Calcule la ecuacin de regresin


^y =26.7+ 0.572 x
c)

^y =26.7+ 0.572(400)

^y =228.82
^y =228.82 x 1000

^y =228826
d)
b0

Es la interseccin en y, representa el promedio de las ventas auditadas cuando las reportadas es

igual a cero
b1

Es el cambio esperado de las ventas auditadas por unidad de cambio en las ventas reportadas en

0.572
e)

r =90.1

El 90.1

de variacin de las ventas auditadas se explica por la variabilidad de las ventas reportadas

indica relacin lineal positiva.


f) Prueba T
=0.05
H 0 : B1=0
H 1 : B1 0
Estadstico de prueba
t=8.56
gl=102=8

tc>t 8.56 >2.31


Por lo tanto rechazamos
el peso del correo
Prueba F
H 0 : B1=0

H0

, y concluimos que existe una relacin lineal entre las variables rdenes y

H 1 : B1 0
F= 73.22

fc> fu73.22>5.32

Por lo tanto rechaza

H0

y se concluye las ventas auditadas con las ventas reportadas.

g) Anlisis residual y no violacin de los supuestos

1) Prueba de normalidad: de acuerdo a la grfica los datos estn cerca de la pendiente,


concluimos que no se violan los supuestos de normalidad.
2) Linealidad y Homocedasticidad: no hay patrn evidente en los residuos, no se violan los
supuestos de linealidad ni Homocedasticidad.
3) De acuerdo a la grfica no se viola el supuesto de independencia porque no hay un patrn.
4) El histograma no muestra una distribucin normal.
h) Durbin Watson no se aplica porque los datos no se conectan en periodo de tiempo

i) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%

Sb 1=0.06683
b1=0.572
t n2 =2.31
b1 t n2 Sb1
0.572 ( 2.31 ) ( 0.06683 )
0.572+0.1543=0.7263
0.5720.1543=0.4177

Intervalo de confianza

(41.77 , 72.63)

Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
41.77 , 72.63 , estos valores estn por encima de cero por lo tanto se concluye que existe una relacin
lineal significativa entre las ventas auditadas y las reportadas

EJERCICIO 12.6
Anlisis de regresin: Horas de trabajo vs. Pies cbicos
La ecuacin de regresin es
Horas de trabajo = - 2.37 + 0.0501 Pies cbicos
Predictor
Coef Coef. De EE
T
P
Constante
-2.370
2.073 -1.14 0.261
Pies cbicos 0.050080 0.003031 16.52 0.000
S = 5.03143 R-cuad. = 88.9% R-cuad. (Ajustado) = 88.6%
Anlisis de varianza
Fuente
GL
SC
MC
F
P
Regresin
1 6910.7 6910.7 272.99 0.000
Error residual 34 860.7 25.3
Total
35 7771.4
Estadstico de Durbin-Watson = 1.65068

a)
b)
c)
d)
e)

Construir diagrama de dispersin


Calcular la ecuacin de regresin
Predecir los promedios indicados en cada uno de los ejercicios.
Interprete el significado de b0 y b1
Calcular r2 e interprete el resultado

f) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de


g) Realizar anlisis residual y compruebe la no violacin de los supuestos
h) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
i) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%

0.05

a)
b) y= -2.37 + 0.0501 x
Horas de trabajo = - 2.37 + 0.0501 Pies cbicos
c) y= -2.37 + 0.0501 (500)
y= -2.37+25.05 =22.68Horas de trabajo.
d)
b0: Es la interseccin en el eje y. Representa el promedio de las horas de trabajo cuando los pies
cbicos son iguales a cero.

e)

b1: La pendiente nos indica el cambio en los pies cbicos de cada unidad por cada unidad de
cambio. Es decir, por cada unidad de cambio en los pies cbicos hay un aumento de
0.0501unidades en horas de trabajo
2

r =88.9

significa que el 88.9% de la variacin de las horas trabajadas se explica por la variabilidad

en los pies cbicos de la mudanza. Indica una relacin lineal positiva entre las dos variables, el modelo
de regresin predice horas trabajadas en un 88.9% y el otro 11.1% se debe a otros factores.

f) Prueba t
H 0 : B1=0(No existe relacin lineal)

H 1 : B1 0 (Existe relacinlineal )
Estadstico de prueba t= 16.52

16.52

Con un nivel de significancia de


H 1 : B1 0

=0.05 , rechazamos

H 0 : B1=0

, por lo tanto aceptamos

, por lo tanto concluimos que existe relacin lineal entre las horas de trabajo y los pies

cbicos de la mudanza. Hay evidencias necesarias para determinar que la ecuacin de la relacin lineal
de este modelo es aceptable.
Valor P
De acuerdo al valor p se rechaza

H0

y se acepta

H1,

porque p < ; 0.000< 0.05

Prueba f
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba f= 272.99

Se obtiene un valor 272.99 > 4.13. Se rechaza

H0

y se acepta

H1

. Se concluye que al 95% de

significacin hay suficiente evidencia estadstica para afirmar que hay relacin entre las horas de trabajo
y los pies cbicos de la mudanza.

g)
Prueba de normalidad, de acuerdo a la grfica como los datos estn cerca de la pendiente concluimos
que no se viola el supuesto de normalidad.

Observando la grfica no hay patrones de comportamiento por lo tanto se concluye que las varianzas son
iguales, por tal razn no hay razn, para sospechar una violacin al supuesto de independencia y
homogeneidad.
h) Puesto que el valor DW=1.65068 se encuentra entre 1.5 y 2.5, podemos asumir que los residuos son
independientes.
I)

b1 t n2 s b 1

b1= 0.0501

n=36 gl=n2=34

t 34 =2.302

tn-2 =

s b1=0.003031

0.0501 (2.302) (0.003031)


L.S=0.0501 + 0.00697=0.057
L.I=0.0501 - 0.00697=0.043
Se estima con un nivel de confianza de 95% que la pendiente de la poblacin se encuentra entre
(0.043,0.057) y como estos valores estn por encima del cero, se concluye que si existe una relacin
entre las horas de trabajo y los pies cbicos de la mudanza.
Esto indica que por cada aumento de

, se estima que las horas trabajadas se incrementan a por lo

menos 0.043hrs. Pero no ms de 0.057hrs.

EJERCICIO 12.7

a)

b) Calcule la ecuacin de regresin


^y =0.191+0.0297 x

c)

^y =0.191+0.0297 ( 50 )

^y =0.191+1.485
^y =1.676

d)
b0

Es la interseccin en y, representa el promedio de las ordenes en miles cuando el peso del correo

en libras es igual a cero


b1

Es el cambio esperado de las rdenes en miles en el peso del correo en libras en 0.0297

e)

r =97.2

El 97.2

de variacin de las ordenes en miles se explica por la variabilidad del peso del correo en libras

indica relacin lineal positiva

f) Prueba T
=0.05
H 0 : B1=0
H 1 : B1 0
Estadstico de prueba
t=28.82
gl=252=23

tc>t 28.82>2.07

Por lo tanto rechazamos


el peso del correo

H0

, y concluimos que existe una relacin lineal entre las variables rdenes y

Prueba F
H 0 : B1=0
H 1 : B1 0
F= 830.82

fc>fu 830.82> 4.28


Se concluye que las rdenes se relacionan con el peso del correo.

g) Anlisis residual y no violacin de los supuestos

5) Prueba de normalidad: de acuerdo a la grfica los datos estn cerca de la pendiente,


concluimos que no se violan los supuestos de normalidad.
6) Linealidad y Homoscedasticidad: no hay patrn evidente en los residuos, no se violan los
supuestos de linealidad ni Homoscedasticidad.
7) De acuerdo a la grfica no se viola el supuesto de independencia porque no hay un patrn.
8) El histograma no muestra una distribucin normal.

h) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%

Sb 1=0.001030
b1=0.0297
t n2 =2.07
b1 t n2 Sb1

0.0297 (2.07 )( 0.001030 )


0.0297+0.00213=0.0318

0.02970.00213=0.0275

Intervalo de confianza

(0.0275, 0.0318)

Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
0.0275, 0.0318 , estos valores estn por encima de cero por lo tanto se concluye que existe una relacin
lineal significativa entre las ordenes y el peso del correo

EJERCICIO 12.8
Anlisis de regresin: Valor estimado vs. Ingresos anuales
La ecuacin de regresin es
Valor estimado = - 246 + 4.19 Ingresos anuales
Coef.
Predictor
Coef de EE
T
P
Constante
-246.26 26.04 -9.46 0.000
Ingresos anuales 4.1897 0.1957 21.41 0.000

S = 33.7876 R-cuad. = 94.2% R-cuad. (Ajustado) = 94.0%


Anlisis de varianza
Fuente
GL
SC
MC
F
P
Regresin
1 523174 523174 458.28 0.000
Error residual 28 31965 1142
Total
29 555139
Estadstico de Durbin-Watson = 1.61617

a)
b)
c)
d)
e)

Construir diagrama de dispersin


Calcular la ecuacin de regresin
Predecir los promedios indicados en cada uno de los ejercicios.
Interprete el significado de b0 y b1
Calcular r2 e interprete el resultado

f) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de


g) Realizar anlisis residual y compruebe la no violacin de los supuestos
h) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
i) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%

a)
b) y= -246 + 4.19x

0.05

Valor estimado= -246 + 4.19 Ingresos anuales


c) y= -246 + 4.19 (150000000)
y= -246+628500000= 628499754
d)

e)

b0: Es la interseccin en el eje y. Representa el promedio del valor estimado cuando los ingresos
anuales son igual a cero.
b1: La pendiente nos indica el cambio en el valor estimado de cada unidad por cada unidad de
cambio en los ingresos anuales. Es decir, por cada unidad de cambio en los ingresos anules hay
un aumento de 0.0297unidades en el valor estimado
r 2=94.2

significa que el 94.2% de la variacin del valor de las franquicias se explica por la

variabilidad en los ingresos anuales. Indica una relacin lineal positiva entre las dos variables, el modelo
de regresin predice el valor de las franquicias en un 94.2% y el otro 5.8% se debe a otros factores.

f) Prueba t
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba t= 21.41

significancia de

=0.05 , rechazamos

H 0 : B1=0

, por lo tanto aceptamos

Con un nivel de
H 1 : B1 0
, por lo tanto

concluimos que existe relacin lineal entre el valor de las franquicias y los ingresos anules. Hay
evidencias necesarias para determinar que la ecuacin de la relacin lineal de este modelo es aceptable.
Valor P
De acuerdo al valor p se rechaza

H0

y se acepta

H1,

porque p < ; 0.000< 0.05

Prueba f
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba f= 458.28

Se obtiene un valor 458.28 > 4.196. Se rechaza

H0

y se acepta

H1

. Se concluye que al 95% de

significacin hay suficiente evidencia estadstica para afirmar que hay relacin entre el valor de la
franquicia y los ingresos anuales.

g)

Prueba de normalidad, de acuerdo a la grfica como los datos estn cerca de la pendiente concluimos
que no se viola el supuesto de normalidad.

Observando la grfica no hay patrones de comportamiento por lo tanto se concluye que las varianzas son
iguales, por tal razn no hay razn, para sospechar una violacin al supuesto de independencia y
homogeneidad.
h) Puesto que el valor DW=1.61617 se encuentra entre 1.5 y 2.5, podemos asumir que los residuos son
independientes.
I)

b1 t n2 s b 1

b1= 4.19

n=30 gl=n2=28

tn-2 =

t 28 =2.048

s b1=0.1957

4.19 (2.048) (0.1957)


L.S=4.19 + 0.4007=4.59

4.59x1000000=4590000

L.I=4.19 - 0.4007=3.79

3.79x1000000=3790000

Se estima con un nivel de confianza de 95% que la pendiente de la poblacin se encuentra entre (3.79,
4.59) y como estos valores estn por encima del cero, se concluye que si existe una relacin entre el
valor de la franquicia y los ingresos anuales.
Esto indica que por cada aumento de

, se estima que el valor de la franquicia se incrementan a por

lo menos $3790000 dlares pero no ms de $4590000 dlares.

EJERCICIO 12.9
Anlisis de regresin: Renta mensual vs. Tamao
La ecuacin de regresin es
Renta mensual = 177 + 1.07 Tamao
Coef.
Predictor Coef de EE T
P
Constante 177.1 161.0 1.10 0.283
Tamao 1.0651 0.1376 7.74 0.000
S = 194.595 R-cuad. = 72.3% R-cuad. (Ajustado) = 71.1%
Anlisis de varianza
Fuente
GL
SC
MC
F
P
Regresin
1 2268777 2268777 59.91 0.000
Error residual 23 870949 37867
Total
24 3139726
Estadstico de Durbin-Watson = 2.43833

a)
b)
c)
d)
e)

Construir diagrama de dispersin


Calcular la ecuacin de regresin
Predecir los promedios indicados en cada uno de los ejercicios.
Interprete el significado de b0 y b1
Calcular r2 e interprete el resultado

f) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de


g) Realizar anlisis residual y compruebe la no violacin de los supuestos
h) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
i) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%

a)

0.05

b) y= 177+ 1.07x
Renta mensual= 177 + 1.07 Tamao en pies
c) y= 177 + 1.07 (1000)
y= 177+1070= $1247
y= 177 + 1.07 (1200)
y= 177+1284= $1461
A Jim y a Jennifer les conviene ms firmar el contrato de 1200 pies cuadrados y renta mensual de $1425
ya que la renta es menos que la esperada
d)

e)

b0: Es la interseccin en el eje y. Representa el promedio la renta mensual cuando el tamao de


pies cuadrados es igual a cero.
b1: La pendiente nos indica el cambio en la renta mensual de cada unidad por cada unidad de
cambio en el tamao. Es decir, por cada unidad de cambio en el tamao hay un aumento de 1.07
unidades en la renta mensual
r 2=72.3

significa que el 72.3% de la variacin de la renta mensual se explica por la variabilidad en

el tamao. Indica una relacin lineal positiva entre las dos variables, el modelo de regresin predice la
renta mensual en un 72.3% y el otro 27.7% se debe a otros factores.
f) Prueba t
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )

Estadstica de prueba t= 7.74

Con un nivel de significancia de


H 1 : B1 0

=0.05 , rechazamos

H 0 : B1=0

, por lo tanto aceptamos

, por lo tanto concluimos que existe relacin lineal entre la renta mensual y el tamao. Hay

evidencias necesarias para determinar que la ecuacin de la relacin lineal de este modelo es aceptable.
Valor P
De acuerdo al valor p se rechaza

H0

y se acepta

H1,

porque p < ; 0.000< 0.05

Prueba f
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba f= 59.91

Se obtiene un valor 59.91 > 4.279. Se rechaza

H0

y se acepta

H1

. Se concluye que al 95% de

significacin hay suficiente evidencia estadstica para afirmar que hay relacin entre la renta mensual y el
tamao.
g)

Prueba de normalidad, de acuerdo a la grfica como los datos estn cerca de la pendiente concluimos
que no se viola el supuesto de normalidad.

Observando la grfica no hay patrones de comportamiento por lo tanto se concluye que las varianzas son
iguales, por tal razn no hay razn, para sospechar una violacin al supuesto de independencia y
homogeneidad.
h) Puesto que el valor DW=2.43833 se encuentra entre 1.5 y 2.5, podemos asumir que los residuos son
independientes.
I)

b1 t n2 s b 1

b1= 1.07

n=25 gl=n2=23

tn-2 =

t 23 =2.068

s b1=0.1376

1.07 (2.068) (0.1376)


L.S=1.07 + 0.284=1.354
L.I=1.07 - 0.284=0.786
Se estima con un nivel de confianza de 95% que la pendiente de la poblacin se encuentra entre (0.786,
1.354) y como estos valores estn por encima del cero, se concluye que si existe una relacin entre la
renta mensual y el tamao.
Esto indica que por cada aumento de

, se estima que la renta mensual se incrementan a por lo

menos $0.786 pero no ms de $1.354.

EJERCICIO 12.74
Anlisis de regresin: Tiempo de entrega vs. Numero de cajas

La ecuacin de regresin es
Tiempo de entrega = 24.8 + 0.140 Numero de cajas
Predictor
Coef Coef. De EE
T
P
Constante
24.835
1.054 23.56 0.000
Numero de cajas 0.140026 0.005627 24.88 0.000
S = 1.98650 R-cuad. = 97.2% R-cuad. (Ajustado) = 97.0%
Anlisis de varianza
Fuente
GL
SC
MC
F
P
Regresin
1 2443.5 2443.5 619.20 0.000
Error residual 18 71.0 3.9
Total
19 2514.5
Estadstico de Durbin-Watson = 1.79361
a)
b)
c)
d)
e)

Construir diagrama de dispersin


Calcular la ecuacin de regresin
Predecir los promedios indicados en cada uno de los ejercicios.
Interprete el significado de b0 y b1
Calcular r2 e interprete el resultado

f) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de


g) Realizar anlisis residual y compruebe la no violacin de los supuestos
h) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
i) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%

0.05

a)
b) y= 24.8+ 0.140x
Tiempo de entrega= 24.8 + 0.140 Numero de cajas
c) y= 24.8 + 0.140 (150)
y= 24.8+21= 45.8min
d)

e)

b0: Es la interseccin en el eje y. Representa el promedio del tiempo de entrega cuando el nmero
de cajas es igual a cero.
b1: La pendiente nos indica el cambio en el tiempo de entrega de cada unidad por cada unidad de
cambio en el tamao. Es decir, por cada unidad de cambio en el nmero de cajas hay un aumento
de 0.140 unidades en el tiempo de entrega.
r 2=97.2

significa que el 97.2% de la variacin del tiempo de entrega se explica por la variabilidad

en el nmero de cajas. Indica una relacin lineal positiva entre las dos variables, el modelo de regresin
predice el tiempo de entrega en un 97.2% y el otro 2.8% se debe a otros factores.

f) Prueba t
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )

Estadstica de prueba t= 24.88

Con un nivel de significancia de

=0.05 , se rechaza

H 0 : B1=0

, por lo tanto aceptamos

H 1 : B1 0

, por lo tanto concluimos que existe relacin lineal entre el tiempo de entrega y el nmero de cajas. Hay
evidencias necesarias para determinar que la ecuacin de la relacin lineal de este modelo es aceptable.
Valor P
De acuerdo al valor p se rechaza
Prueba f
H 0 : B1=0(No existe relacin lineal)
H 1 : B1 0 (Existe relacinlineal )
Estadstica de prueba f= 619.20

H0

y se acepta

H1,

porque p < ; 0.000< 0.05

Se obtiene un valor 619.20 > 4.41. Se rechaza

H0

y se acepta

H1

. Se concluye que al 95% de

significacin hay suficiente evidencia estadstica para afirmar que hay relacin entre el tiempo de entrega
y el nmero de cajas.

g)
Prueba de
normalidad, de acuerdo a la grfica como los datos estn cerca de la pendiente concluimos que no se
viola el supuesto de normalidad.
Observando la grfica no hay patrones de comportamiento por lo tanto se concluye que las varianzas son
iguales, por tal razn no hay razn, para sospechar una violacin al supuesto de independencia y
homogeneidad.
h) Puesto que el valor DW=1.79361 se encuentra entre 1.5 y 2.5, podemos asumir que los residuos son
independientes. No hay correlacin.
i)

b1 t n2 s b 1

b1= 0.140 n=20 gl=n2=18

tn-2 =

t 18 =2.10

s b1=0.005627

0.140 (2.10) (0.005627)


L.S=0.140 + 0.0118= 0.1518
L.I=0.140 - 0.0118= 0.1282
Se estima con un nivel de confianza de 95% que la pendiente de la poblacin se encuentra entre
(0.1282, 0.1518) y como estos valores estn por encima del cero, se concluye que si existe una relacin
entre el nmero de cajas y el tiempo de entrega.

Esto indica que por cada aumento de

y 2 , se estima que el tiempo de entrega se incrementan a por lo

menos 0.1218min pero no ms de 0.1518min.

EJERCICIO 12.75
Una casa de corredura desea predecir el nmero de negocios realizados por da utilizando el nmero de
llamadas telefnicas entrantes como una variable predictiva. Los datos fueron recolectados a lo largo de
un periodo de 35 das. TRADES
DIAS
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

LLAMADAS
2591
2146
2185
2245
2600
2510
2394
2486
2483
2297
2106
2035
1936
1951
2292
2094
1897
2237
2328
2078
2134
2192
1965

NEGOCIOS
417
321
362
364
442
386
370
376
463
389
302
266
339
369
403
319
306
397
365
330
312
340
339

24
25
26
27
28
29
30
31
32
33
34
35

2147
2015
2046
2073
2032
2108
1923
2069
2061
2010
1913
1904

364
295
292
379
294
329
274
326
306
352
290
283

A) Construir un diagrama de dispersin

Grfica de dispersin de Trades vs. Calls


450

Trades

400

350

300

250
1900

2000

2100

2200

2300

Calls

2400

2500

2600

B) Calcular la ecuacin de regresin


TRADES=63.0+0. 1890 CALLS

R.

O
^y =63.0+0.1890 x

C) Predecir los promedios indicadas en cada uno de los ejercicios. (prediga el nmero de negocios
realizados para un da en el que el nmero de llamadas telefnicas entrantes fue de 2000.
R.
^y =63.0+0.1890 ( 2000 )=63.0+378=
^y =315 numero de negocio por llamadastelefonicas

D) Interprete el significado de

b0

b1

R.
b0 = Representa la interseccin el nmero de negocios (y), cuando el nmero de llamadas (x) es cero,
ser de -63.0.
b1 = La pendiente representa el cambio esperado en el nmero de llamadas (y) por unidad de cambio
en el nmero de llamadas (x), por cada cambio en el nmero de negocios, el nmero de llamadas
incrementa en un 0.1890.

E) Calcular

r2

de interprete el resultado

2
R. r = 63.01%

Significa que el 63.01 % de la variacin del nmero de negocios se explica por la variabilidad del nmero
de llamadas, indicando fuerte relacin lineal positiva entre las dos variables. El modelo de regresin
predice el nmero de negocios en un 63.01 % y el otro 36.99 se debe a otros factores.
F) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de

0.05

R.
Prueba t
H o :B1 =0
H 1 : B1 0
t c =7.50

t c =7.50

t c>

Se rechaza la hiptesis nula


negocios y las llamadas.

Prueba F

(H o )

t
=7.50>2.0345
2

y se concluye que existe una relacin lineal entre el nmero de

f =56.21

Grfica de distribucin
F, df1=1, df2=33
1.2

Densidad

1.0

0.8

0.6

f =56.21
0.4

0.2

0.0

0.05
0

4.139

f > f =56.21>4.139

Cae en la regin de rechazo por lo tanto se rechaza la hiptesis nula

(H o ) y se concluye que el

nmero de negocios se relacionan con el nmero de llamadas.

G) Realizar anlisis residual y compruebe la no violacin de los supuestos


R.

Grficas de residuos para Trades


Grfica de probabilidad normal

vs. ajustes
50

90

Residuo

Porcentaje

99

50
10

0
-25
-50

1
-80

-40

40

80

300

360

390

Valor ajustado

Histograma

vs. orden

50

25

4
2
0

330

Residuo

Residuo

Frecuencia

25

420

0
-25
-50

-60

-30

30

Residuo

60

10

15

20

25

30

35

Orden de observacin

Explicacin de los supuestos

De acuerdo a la grfica de probabilidad normal, los datos estn cerca de la pendiente, por lo tanto
se concluye que no se viola el supuesto de normalidad, aunque el histograma no este distribuido
de manera normal.
En la grfica vs. Ajuste, no se observa ningn patrn aparente en los residuos, los puntos estn en
una distancia igual a la recta, por lo tanto se concluye que no se violan los supuestos de linealidad
y homocedasticidad.
En la grfica de Vs. Orden no se observa un patrn, por lo tanto no se viola el supuesto de
independencia, pero se analizara ms adecuadamente una prueba del estadstico de Durbin
Watson.

H) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
R. D = 1.96073

D>d u=1.96073>1.52 no hay evidencia de autocorrelacin elmetodo de minimos cuadrados es apropiado

I) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%


R.
b1 t n2 Sb1

0.1890 (2.0345)(0.0252)
0.1890+( 2.0345)(0.0252)=0.2402

0.1890(2.0345)(0.0252)=0.1377
Intervalo de confianza

( 0.2402, 0.1377 )
Por lo tanto se estima que con un nivel de confianza del 95% que la pendiente de la poblacin se
encuentra entre (0.22402, 0.1377) estos valores estn por encima de cero por lo tanto se concluye
que existe que existe una relacin lineal significativa entre el nmero de negocios y el nmero de las
llamadas.
Esto indica que por cada aumento de los pies cbicos se estima que las horas de trabajo
incrementen a por lo menos 0.1377 pero no ms de 0.2402.

se

EJERCICIO 12.76
Usted desea desarrollar un modelo para predecir el precio de venta de casas con base en el valor del
avalu. Se selecciona una muestra de 30 casas unifamiliares recientemente vendidas en una pequea
ciudad, para estudiar la relacin entre el precio de venta (en miles de dlares) y el precio del avalu (en
miles de dlares). Las casa en la ciudad fueron reevaluadas a su valor total un ao antes del estudio. Los
resultados se encuentran en el ejercicio HOUSE1.
Price
94.10

Value
78.17

New
1

Time
10

101.90
88.65
115.50
87.50
72.00
91.50
113.90
69.34
96.90
96.00
61.90
93.00
109.50
93.75
106.70
81.50
94.50
69.00
96.90
86.50
97.90
83.00
97.30
100.80
97.90
90.50
97.00
92.00
95.90

80.24
74.03
86.31
75.22
65.54
72.43
85.61
60.80
81.88
79.11
59.93
75.27
85.88
76.64
84.36
72.94
76.50
66.28
79.74
72.78
77.90
74.31
79.85
84.78
81.61
74.92
79.98
77.96
79.07

1
0
0
0
0
0
0
0
1
0
0
0
1
0
0
0
1
0
1
0
1
0
1
1
1
0
1
0
1

A) Construir un diagrama de dispersin


Anlisis de regresin: Precio vs. Valor del avaluo
La ecuacin de regresin es
Precio = - 44.2 + 1.78 Valor del avaluo
Predictor
Constante
Valor del avaluo
S = 3.47493

Coef
-44.172
1.78171

Coef. de EE
7.346
0.09546

R-cuad. = 92.6%

T
-6.01
18.66

P
0.000
0.000

R-cuad.(ajustado) = 92.3%

Anlisis de varianza
Fuente
Regresin
Error residual
Total

GL
1
28
29

SC
4206.7
338.1
4544.8

MC
4206.7
12.1

F
348.37

Estadstico de Durbin-Watson = 1.81487

P
0.000

10
11
2
5
4
17
13
6
5
7
4
11
10
17
12
5
14
1
3
14
12
11
12
2
6
12
4
9
12

B)

Grfica de dispersin de Value vs. Price


90

85

Value

80

75

70

65

60
60

70

80

90

100

110

120

Price

C) Calcular la ecuacin de regresin


^y =28.65+ 0.5195 x

R.

O
avaluo=28.65+ 0.5195 precio

D) Predecir los promedios indicadas en cada uno de los ejercicios. (prediga el valor de avalo para
una casa cuyo valor es de $70,000.
^y =28.65+ 0.5195 x=28.65+ 0.5195 ( 70000 ) =$ 36,393.65

E) Interprete el significado de
R.

b0

b1

b0 = Representa la interseccin en el valor del avalo (y), cuando el precio de la casa (x) es cero,
ser de 28.65.
b1 = La pendiente representa el cambio esperado en el valor del avalo (y), por unidad de cambio
en el precio de la casa (x), por cada cambio en el valor del avalo, el precio de la casa incrementara
un 0.5195.

F) Calcular

de interprete el resultado

R.
r2

= 92.56%

Significa que el 92.56% de la variacin del valor del avalo se explica por la variabilidad del precio de la
casa, indicando fuerte relacin lineal positiva entre las dos variables. El modelo de regresin predice el
valor del avalo en 92.56% y el otro en 7.44 % se debe a otros factores.
G) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de
R.
Prueba t
H o :B1 =0
H 1 : B1 0
gl=28
Estadistico de prueba t c =18.66

0.05

Grfica de distribucin
T, df=28
0.4

Densidad

0.3

0.2

0.1

0.025
0.0

0.025
-2.048

2.048

t c>

t
=18.66>2.048
2

Se rechaza la hiptesis nula y se concluye que existe una relacin lineal entre el valor del avalo y el
precio de la casa.
Prueba F
H o :B1 =0
H 1 : B1 0
gl=28

f =348.37

Grfica de distribucin
F, df1=1, df2=28
1.2

1.0

Densidad

0.8

0.6

f =348.37

0.4

0.2

0.0

0.05
0

4.196

f > f =348.37> 4.196


Cae en la regin de rechazo por lo tanto se rechaza la hiptesis nula

( H o ) y se concluye que el valor

del avalo se relacionan con el precio de las casa.

H) Realizar anlisis residual y compruebe la no violacin de los supuestos


R.

Grficas de residuos para Value


vs. ajustes
4

90

Residuo

Porcentaje

Grfica de probabilidad normal


99

50
10

0
-2
-4

1
-5.0

-2.5

0.0

2.5

5.0

60

Residuo

Histograma

90

vs. orden
4

Residuo

Frecuencia

80

Valor ajustado

4
2
0

70

0
-2
-4

-4

-2

Residuo

2 4

6 8 10 12 14 16 18 20 22 24 26 28 30

Orden de observacin

Explicacin de los supuestos


De acuerdo a la grfica de probabilidad normal, los datos estn cerca de la pendiente, y se
observa que el histograma est distribuido de manera normal, si existieran ms datos se podra
apreciar perfectamente, por lo tanto se concluye que no se viola el supuesto de normalidad.
En la grfica de vs. Ajustes, no se observa un patrn evidente en los residuos, y los puntos estn
distribuido a una distancia igual a la recta, por lo tanto se concluye que no se violan los supuestos
de linealidad y homocedasticidad.
En la grfica de vs. Orden no se observa un modelo (patrn), por lo tanto no se viola el supuesto
de independencia
I) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
R. No es necesario realizar la prueba de Durbin Watson, porque el clculo no requiere o especifica
periodos de tiempos anteriores al interesado.

J) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%


R.
b1 t n2 Sb1
0.5195 (2.048)(0.0278)

0.5195+ ( 2.048 ) ( 0.0278 )=0.5764


0.5195 (2.048 )( 0.0278 )=0.4625
Intervalo de confianza

( 0.4625 , 0.5764 )=(462.5 , 576.4)


Por lo tanto se estima que con un nivel de confianza del 95% que la pendiente de la poblacin se
encuentra entre ( 462.5 , 576.4 ), estos valores estn por encima de cero por lo tanto se concluye que
existe que existe una relacin lineal significativa entre el valor del avalo y el precio de la casas.
Esto indica que por cada aumento del valor del avalo se estima que el precio de la casa se
incremente a por lo menos 462.5 pero no ms de 576.4.

EJERCICIO 12.77
Usted desea desarrollar un modelo de prediccin del valor del avalo de las casa con base en un rea
de calefaccin. Se selecciona una muestra de 15 casas unifamiliares en una ciudad. El valor de avalo
(en miles de dlares) y el rea de calefaccin delas casa (en miles de pies cuadrados) se registran con
los siguientes resultados: HOUSE2.
Value
84.4
77.4
75.7
85.9

HeatArea
2.00
1.71
1.45
1.76

Age
3.42
11.50
8.33
0.00

79.1
1.93
70.4
1.20
75.8
1.55
85.9
1.93
78.5
1.59
79.2
1.50
86.7
1.90
79.3
1.39
74.5
1.54
83.8
1.89
76.8
1.59
A) Construir un diagrama de dispersin
R.

7.42
32.00
16.00
2.00
1.75
2.75
0.00
0.00
12.58
2.75
7.17

Grfica de dispersin de Value vs. HeatArea


88
86
84

Value

82
80
78
76
74
72
70
1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

2.0

HeatArea

B) Calcular la ecuacin de regresin


R.
avaluo=51.92+16.63 aires acondicionado
^y =51.92+16.63 x
C) Predecir los promedios indicadas en cada uno de los ejercicios. (prediga el valor de avalu de las
casas con un rea de calefaccin de 1750 pies cuadrados.
R.
^y =51.92+16.63 x=51.92+16.63 (1750 )=29,154.42

D) Interprete el significado de
R.

b0

b1

b0 = Representa la interseccin en el valor del avalo de las casas (y), cuando el rea de
calefaccin (x) es cero, ser de 51.92 (miles)
b1 = La pendiente representa el cambio esperado en el valor del avalo de las casas (Y) por
unidad de cambio en el rea de calefaccin (X), por cada cambio en el valor del avalo de las
casas, el rea de calefaccin incrementara en un 16.63.

E) Calcular

r2

de interprete el resultado

R.
r 2=65.93
Significa que el 65.93% de la variacin del valor del avalo de las casas se explica por la variabilidad
del rea de calefaccin, indicando fuerte relacin lineal positiva entre las dos variables. El modelo de
regresin predice el valor el avalo en un 65.93% y el otro 34.07% se debe a otros factores.

F) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de


R.
Prueba t
H o :B1 =0
H 1 : B1 0
gl=13
Estadistico de prueba t c =5.02

0.05

Grfica de distribucin
T, df=13
0.4

Densidad

0.3

0.2

0.1

0.025
0.0

0.025
-2.160

2.160

t c>

Se rechaza la hiptesis nula

( H o ) y se concluye que existe una relacin lineal entre el valor del avalo

de las casas y el rea de calefaccin.

Prueba F
H o :B1 =0
H 1 : B1 0
gl=13

f =25.16

t
=5.02>2.160
2

Grfica de distribucin
F, df1=1, df2=13
0.8
0.7

Densidad

0.6
0.5
0.4

f =25.16

0.3
0.2
0.1
0.0

0.05
0

4.667

f > f =25.16> 4.667


Cae en la regin de rechazo por lo tanto se rechaza la hiptesis nula

(H o ) y se concluye que el valor

del avalo de las casas y el rea de calefaccin.

G) Realizar anlisis residual y compruebe la no violacin de los supuestos


R.

Grficas de residuos para Value


vs. ajustes
5.0

90

2.5

Residuo

Porcentaje

Grfica de probabilidad normal


99

50
10
1

0.0
-2.5
-5.0

-5.0

-2.5

0.0

2.5

5.0

70

75

Residuo

Histograma

vs. orden

Residuo

Frecuencia

85

5.0

80

Valor ajustado

2.5
0.0
-2.5
-5.0

-4

-2

Residuo

1 2 3

7 8 9 10 11 12 13 14 15

Orden de observacin

Explicacin de los supuestos


Prueba de normalidad: De acuerdo a la grfica de probabilidad normal, los datos no estn
completamente cerca de la pendiente, por lo tanto se concluye que se viola el supuesto de
normalidad, y el histograma no este distribuido de manera normal. Se necesitan realizar ms
pruebas.
Prueba de linealidad y homocedasticidad: En la grfica de vs. Ajustes, no se observa un patrn
evidente en los residuos, y los puntos estn en una distancia igual a la recta, por lo tanto se
concluye que no se violan los supuestos de linealidad y homocedasticidad.
Prueba de independencia: En la grfica de vs. Orden no se observa un modelo (patrn), por lo
tanto no se viola el supuesto de independencia.

H) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
R. No es necesario realizar la prueba de Durbin Watson, porque el clculo no requiere o especifica
periodos de tiempos anteriores al interesado.

I) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%


R.
b1 t n2 Sb1
16.63 (2.160)( 3.32)
16.63+ ( 2.160 ) ( 3.32 )=23.80

16.63( 2.160 )( 3.32 )=9.45


Intervalo de confianza

( 23.80,9.45 )=(23,800,9450)
Por lo tanto se estima que con un nivel de confianza del 95% que la pendiente de la poblacin se
encuentra entre (23,800, 9450), estos valores estn por encima de cero por lo tanto se concluye que
existe que existe una relacin lineal significativa entre el valor del avalo de las casas y el rea de la
calefaccin.
Esto indica que por cada aumento del valor del avalo de la casa se estima que el rea de calefaccin
se incremente a por lo menos 9450 pero no ms de 23800.

EJERCICO 12.78
Al director de postgrado en una facultad de administracin le gustara predecir el ndice de puntos de
calificacin (GPI) de los estudiantes en un programa de MBA con base en la puntuacin de la prueba de
aptitudes gerenciales del graduado (GMAT). Se seleccion una muestra de 20 estudiantes que haban
completado dos aos de ese programa. Los resultados son los siguientes:
Observacin
1
2
3
4
5

GMAT
688
647
652
608
680

GPI
3.72
3.44
3.21
3.29
3.91

6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

617
557
599
616
594
567
542
551
573
536
639
619
694
718
759

3.28
3.02
3.13
3.45
3.33
3.07
2.86
2.91
2.79
3.00
3.55
3.47
3.60
3.88
3.76

A) Construir diagrama de dispersin


Grfica de dispersin de GPI vs. GMAT
750

GPI

700

650

600

550

500
2.8

3.0

3.2

3.4

3.6

3.8

4.0

GMAT

B)
regresin
R.

^y =76.7+163.8 GMAT

C) Predecir el GPI para un estudiante con una puntuacin GMAT 600


^y =76.8+(163.8) ( 600 )

R.
^y =76.8+ 98,280

^y =98,356.8

Calcular

la

ecuacin

de

D) Interprete el significado de b0 y b1
R.

b0

Representa la interseccin del GPI (Y) cuando (X) el GMAT tiene un valor igual a cero. No

es vlido, si no hay medida no hay validez.


R.

b1

La pendiente representa el cambio esperado de (Y) por el GMAT (X), por cada proceso el

tiempo incrementaran en un

163.8

E) Calcular r2 e interprete el resultado


2
R. r =78.66

Significa que el

78.66

de la variacin de los puntos de calificacin indica una relacin lineal entre las

dos variables. El modelo de regresin predice que las calificaciones en un

78.66

y el otro

21.34

variacin se deben a otros factores

F) Realizar inferencias sobre la pendiente prueba t y prueba f con nivel de significancia de

Prueba t
H o :B1 =0
H 1 : B1 0
gl=18

t c =8.43

0.05

de

Grfica de distribucin
T, df=18
0.4

Densidad

0.3

0.2

0.1

0.025
0.0

0.025
-2.101

2.101

t c>

Se rechaza la hiptesis nula

t
=8.43>2.101
2

( H o ) y se concluye que existe una relacin lineal entre las rdenes de


correo y las libras del peso del correo

Prueba F

H o :B1 =0
H 1 : B1 0
gl=18

f =71.03

Grfica de distribucin
F, df1=1, df2=18
1.0

0.025

Densidad

0.8

0.6

0.4

0.2

0.0

0.025
0.001010
0

5.978

f > f =71.03>5.978
Cae en la regin de rechazo por lo tanto se rechaza la hiptesis nula

( H o ) y se concluye que GPI se

relacionan con GMAT.

G) Realizar anlisis residual y compruebe la no violacin de los supuestos

Grficas de residuos para Process


vs. ajustes
50

90

25

Residuo

Porcentaje

Grfica de probabilidad normal


99

50
10
1

0
-25
-50

-50

-25

25

50

Residuo

300

vs. orden
50

10.0

25

7.5

Residuo

Frecuencia

200

Valor ajustado

Histograma

5.0
2.5
0.0

100

0
-25
-50

-40

R.

-20

Residuo

20

40

2 4

6 8 10 12 14 16 18 20 22 24 26 28 30

Orden de observacin

Prueba de normalidad: De acuerdo a las grficas los datos de la pendiente estn cerca de la
pendiente y tambin se hacen una grfica de gauss, por lo tanto podemos decir que no se viola el
supuesto de normalidad.
Prueba de linealidad y homocedasticidad: No existe patrn evidente en los residuos, por lo tanto
decimos que no se viola el supuesto de linealidad y homocedasticidad.
Prueba de independencia: No se halla un patrn (modelo), entonces se conoce que no se viola el
supuesto de independencia.

H) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
R. D.W = 1.64219
D>d u=1.64219>1.41 no hay evidencia de autocorrelacin el metodo de minimos cuadrados es apropiado

I) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%

R.
b1 t n2 Sb1
163.8 (2.101)(19.4)

163.8+(2.101)(19.4)=203.7594
163.8( 2.101 ) ( 19.4 ) =122.2406
Intervalo de confianza

( 122.2406 ,203.7594 )
Por lo tanto se estima que con un nivel de confianza del 95% que la pendiente de la poblacin se
encuentra entre ( 122.2406 ,203.7594 ) estos valores estn por encima de cero por lo tanto se concluye
que existe que existe una relacin lineal significativa entre las GPI y el GMAT.
Esto indica que por cada aumento GPI se incrementen a por lo menos 122.2406 pero no ms de
203.7594

EJERCICIO 12.79
El gerente del departamento de compras en una gran organizacin bancaria quisiera desarrollar un
modelo para predecir el tiempo que toma procesar facturas. Se recolectaron datos provenientes de una
muestra de 30 das y se registr el nmero de facturas procesadas y el tiempo en que se completaron, en
horas.
Process
149
60
188
19
201

Time
2.1
1.8
2.3
0.3
2.7

58
77
222
181
30
110
83
60
25
173
169
190
233
289
45
193
70
241
103
163
120
201
135
80
29

A) Construir diagrama de dispersin


R.

1.0
1.7
3.1
2.8
1.0
1.5
1.2
0.8
0.4
2.0
2.5
2.9
3.4
4.1
1.2
2.5
1.8
3.8
1.5
2.8
2.5
3.3
2.0
1.7
0.5

Grfica de dispersin de Process vs. Time


300

250

Process

200

150

100

50

0
0

Time

B) Ecuacin de regresin
R. ^y =0.402+0.012607 Process
C) Predecir la cantidad de tiempo que tomara procesar 150 facturas.
^y =0.402+0.012607 (150)

^y =0.402+1.89105
^y =2.292

D) Interprete el significado de
R

b0

b0

b1

Representa la interseccin del tiempo (Y) cuando (X) el proceso tiene un valor igual a cero.

No es vlido, si no hay medida no hay validez.


b1

La pendiente representa el cambio esperado (Y) por el tiempo (X), por cada proceso el

tiempo incrementaran en un

D) Calcular
R.

r2

0.012607 .

e interprete el resultado

r 2=88.86

Significa que el 88.86% de la variacin de los procesos se explica por la variabilidad del

tiempo, indicando fuerte relacin lineal positiva entre las dos variables. El modelo de regresin predice las
horas de trabajo en un 88.86% y el otro 11.14% se debe a otros factores.
E) Realizar inferencias sobre la pendiente prueba t y prueba F con nivel de significancia de

0.05

H o :B1 =0
H 1 : B1 0
gl=28
Estadistico de prueba t c =15.24

Grfica de distribucin
T, df=28
0.4

Densidad

0.3

0.2

0.1

0.025
0.0

0.025
-2.048

2.048

t c>

Se rechaza la hiptesis nula


proceso

Prueba F

t
=15.24>2.048
2

( H o ) y se concluye que existe una relacin lineal entre el tiempo y el

H o :B1 =0
H 1 : B1 0
gl=28
f =232.22

Grfica de distribucin
F, df1=1, df2=28
1.2

1.0

Densidad

0.8

0.6

0.4

0.2

0.0

0.05
0

4.196

f > f =73.22>5.318
Cae en la regin de rechazo por lo tanto se rechaza la hiptesis nula
relacionan con el proceso

( H o ) y se concluye el tiempo se

F) Realizar anlisis residual y compruebe la no violacin de los supuestos

Grficas de residuos para Time


Grfica de probabilidad normal

vs. ajustes
0.50

90

Residuo

Porcentaje

99

50
10

0.25
0.00
-0.25
-0.50

-0.8

-0.4

0.0

0.4

0.8

Valor ajustado

Histograma

vs. orden

0.50

Residuo

Frecuencia

Residuo

6
4
2

0.25
0.00
-0.25
-0.50

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

Residuo

G)

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30

Orden de observacin

R.

Explicacin de los supuestos


Prueba de normalidad: De acuerdo a las grficas los datos de la pendiente estn cerca de la
pendiente y tambin se hacen una grfica de gauss, por lo tanto podemos decir que no se
viola el supuesto de normalidad.
Prueba de linealidad y homocedasticidad: En la grfica de vs. Ajustes, no se observa un patrn
evidente en los residuos, y los puntos estn en una distancia igual a la recta, por lo tanto se
concluye que no se violan los supuestos de linealidad y homocedasticidad.
Prueba de independencia: En la grfica de vs. Orden no se observa un modelo (patrn), por lo
tanto no se viola el supuesto de independencia.

J) En los problemas que sea necesario aplique la prueba del estadstico de Durbin Watson
R. D=1.78231
D>d u=1.78231>1.49 no hay evidencia de autocorrelacin el metodo de minimos cuadrados es apropiado
K) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%
b1 t n2 Sb1
0.012607 (2.048)(0.000827)
0.012607+ ( 2.048 ) ( 0.000827 ) =0.014300696
0.012607(2.048)(0.000827)=0.010913304

Intervalo de confianza

( 0.010913304,0.014300696 )
Por lo tanto se estima que con un nivel de confianza del 95% que la pendiente de la poblacin se
encuentra entre ( 0.010913304,0.014300696 ) estos valores estn por encima de cero por lo tanto se
concluye que existe que existe una relacin lineal significativa entre el tiempo y el proceso de factura
Esto indica que por cada aumento del tiempo se incrementara a por lo menos 0.0143 pero menos de
0.01430

EJERCICIO 12.80

a)

b) Calcule la ecuacin de regresin


La ecuacin de regresin es:
ndice de dao anillos O y= 18.0 0.240 temperatura

c) No pide predecir ningn promedio

d) Interpretar

b0

b0

=18.0 y

b1

=0.240

: Representa la interseccin en y, y es el promedio del indice de dao de los anillos O, cuando el

grado de temperatura es O, el resultado ser de 18.0.


b1

: Representa el cambio esperado en el ndice de dao de los anillos O por unidad de cambio en los

grados de temperatura en 0.240.

2
e) Calcular r e interpretar

r 2=38.6
Significa que el 38.6% de la variacin en el ndice de dao de los anillos O, se explica por la variabilidad
de los grados de temperatura. Indica dbil relacin lineal positiva entre las dos variables.
f) Inferencias sobre la pendiente
Prueba t

H 0 : B1=0

No hay relacin lineal

H 1 : B1 0

Hay relacin lineal

Estadstico de prueba
3.64 <2.080

t c =3.64

, por lo tanto rechazamos

variables del ndice de dao y la temperatura.

Prueba F
F= 13.22

H0

, y concluamos que existe una relacin lineal entre las

13.22>4.32
Por lo tanto, se rechaza

H0

y se concluye que el ndice de dao se relaciona con el grado de

temperatura.

g) Anlisis residual y comprobar no violacin de los supuestos

De acuerdo a la grfica los datos no estn cerca de la pendiente por lo tanto se viola el supuesto de
normalidad.

De acuerdo a la grfica hay un patrn evidente en los residuos, por lo tanto se violan los supuestos

De acuerdo a la grfica existe un patrn evidente en los residuos por lo tanto se viola el supuesto de
independencia.

h) No se aplica, porque los datos no fueron recolectados en un periodo de tiempo.

i) Intervalo de confianza con un nivel de confianza del 95%


b1=0.24
t 232=2.08
S b1=0.06601
0.24 ( 2.08 )( 0 0.06601 )
0.24+0.1373= -0.1027
0.240.1373=0.3773

Intervalo (0.37,0.10)

EJERCICIO 12.81

a)

b) Calcule la ecuacin de regresin


^y =765+160 x
c)
^y =765+160 x

^y =765+160 (4.50)
^y =1485
d)
b0

Es la interseccin en y, representa el promedio de las carreras ganadas cuando la ejecucin de

lanzamientos es igual a cero


b1

Es el cambio esperado de las carreras ganadas por unidad de cambio en la ejecucin de

lanzamientos
e)

r 2=90.1

El 90.1

de variacin de las carreas ganas se explica por la variabilidad de la ejecucin de

lanzamientos indica relacin lineal positiva.


f)
Prueba t
=0.05
H 0 : B1=0
H 1 : B1 0
Estadstico de prueba
t=8.56
gl=102=8

tc>t 8.56 >2.31

Por lo tanto rechazamos

H0

y la ejecucin de lanzamientos

Prueba F

, y concluimos que existe una relacin lineal entre las las carreras ganadas

H 0 : B1=0
H 1 : B1 0
F= 73.22

fc> fu73.22>5.32

Por lo tanto rechaza

H0

y se concluye que las carreras ganadas y los lanzamientos ejecutadas se

relacionan
g) Anlisis residual y no violacin de los supuestos

9) Prueba de normalidad: de acuerdo a la grfica los datos estn cerca de la pendiente,


concluimos que no se violan los supuestos de normalidad.
10)Linealidad y Homoscedasticidad: no hay patrn evidente en los residuos, no se violan los
supuestos de linealidad ni Homoscedasticidad.
11) De acuerdo a la grfica no se viola el supuesto de independencia porque no hay un patrn.
12)El histograma no muestra una distribucin normal.

h) Durbin Watson no se aplica porque los datos no se conectan en periodo de tiempo


i) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%

Sb 1=159.99
b1=160
t n2 =2.05
b1 t n2 Sb1
160 ( 2.05 ) ( 159.99 )
160+327.97=487.97
160327.97=167.97

Intervalo de confianza

(41.77 , 72.63)

Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
41.77 , 72.63 , estos valores estn por encima de cero por lo tanto se concluye que existe una relacin
lineal significativa entre las carreras ganadas y la ejecucin de lanzamientos

EJERCICIO 12.82
Durante la temporada de cosecha del otoo en Estados Unidos, se venden grandes cantidades de
calabaza en los puestos de las granjas. Con frecuencia, en lugar de pesar las calabazas antes de su
venta, el grajero solo coloca la calabaza en el recorte circular apropiado en el mostrador. Cuando se le
pregunto por qu se hace esto, el granjero respondi: puedo decir el peso de la calabaza a partir de su
circunferencia. Para determinar si esto es realmente cierto, se midi la circunferencia de una muestra de
23 calabazas y estas se pesaron con los siguientes resultados. PUMPKIN
Circunferencia
(cm)

Peso
(gramos)

Circunferencia
(cm)

Peso
(gramos)

50
55
54
52
37
52
53
47
51
63
33
43

1,200
2,000
1,500
1,700
500
1,000
1,500
1,400
1,500
2,500
500
1,000

57
66
82
83
70
34
51
50
49
60
59

2,000
2,500
4,600
4,600
3,100
600
1,500
1,500
1,600
2,300
2,100

C) Construir diagrama de dispersin


Grfica de dispersin de Weight vs. Circumference
5000

Weight

4000

3000

2000

1000

0
30

40

50

60

70

80

90

Circumference

D) Calcular la ecuacin de regresin


^y =2629+82.47 x i
R.
E) Prediga la media del peso de una calabaza con una circunferencia de 60 cm.
^y =2629+82.47 x i
R.
^y =2629+ ( 82.47 )( 60 )
^y =2629+ 4,948.2

^y =2,319.2
F) Interprete el significado de b0 y b1
b
R. 0 es la interseccin en el peso de las calabazas, cuando la circunferencia es cero el peso
ser de -2629 gr.
b1 Por cada cm de incremento en la circunferencia hay 82.47 gr de aumento en el peso de la
calabaza.

G) Calcular r2 e interprete el resultado


2
R. r =93.72
Significa que el

93.72

de la variacin del peso se explica por la variacin de la circunferencia.

Indica una relacin lineal positiva entre las dos variables. El modelo de regresin predice peso de
calabazas en un 93.72 y el otro 6.28 de variacin se debe a otros factores.
H) Realizar inferencias sobre la pendiente prueba t y prueba f con nivel de significancia de

0.05

R. Prueba T
t c =17.71

Grfica de distribucin
T, df=21
0.4

Densidad

0.3

0.2

t c =17.71

0.1

0.025
0.0

0.025
-2.080

2.080

t c >t
2

17.71>2.080

Rechazamos la

H0

y se acepta la alternativa, se concluye que existe una relacin lineal

entre la circunferencia y el peso de las calabazas.


Prueba F
H 0 : B1=0 H 1 : B1 0
F=313.65

Grfica de distribucin
F, df1=1, df2=21
1.0

Densidad

0.8

0.6

0.4

F=313.65

0.2

0.0

0.05
0

4.325

Como

F> Fu

313.65>4.325
H0

Cae en la regin de rechazo de

por tanto se concluye que el peso de la calabaza se

relaciona con la circunferencia.


I) Realizar anlisis residual y compruebe la no violacin de los supuestos
R.
Grficas de residuos para Weight
vs. ajustes
500

90

250

Residuo

Porcentaje

Grfica de probabilidad normal


99

50
10
1

0
-250
-500

-500

-250

250

500

1000

Residuo

2000

3000

4000

Valor ajustado

Histograma

vs. orden
500
250

Residuo

Frecuencia

10.0
7.5
5.0
2.5
0.0

0
-250
-500

-600

-400

-200

Residuo

200

400

10 12

14

16

18 20 22

Orden de observacin

13)Prueba de normalidad: de acuerdo a la grfica los datos estn cerca de la pendiente,


concluimos que no se violan los supuestos de normalidad.
14)Linealidad y Homocedasticidad: no hay patrn evidente en los residuos, no se violan los
supuestos de linealidad ni homocedasticidad.
15)De acuerdo a la grfica no se viola el supuesto de independencia porque no hay un patrn.
16)El histograma no muestra una distribucin normal.

J) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%


Sb 1=4.66
R.
b1=82.47

t n2 =2.080
b1 t n2 Sb1

82.47 ( 2.080 )( 4.66 )

82.47 9.6928

82.47+9.6928=92.1628

82.479.6928=72.7772
(72.7772 ,92.1628)
Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
72.7772 y 92.1628, estos valores estn por encima de cero por lo tanto se concluye que existe una
relacin lineal significativa entre la circunferencia y el peso de las calabazas.
Esto indica que el peso de las calabazas ronda por lo menos 72.77772 gramos pero no ms de
92.1628 gramos.

EJERCICIO 12.83

Es til la informacin demogrfica para predecir las ventas de productos deportivos en las tiendas? Los
datos del archivo SPORTING representan las ventas totales de una muestra aleatoria de 38 tiendas de
una cadena a nivel nacional de productos deportivos. Todas las tiendas de la franquicia, y por lo tanto
dentro de la muestra, tienen aproximadamente el mismo tamao y venden la misma mercanca. Se
denomina base de clientes al condado o, en algunos casos, los condados de los que la tienda extrae la
mayor parte de sus clientes. Se dispone de informacin demogrfica sobre la base de clientes para cada
una de las 38 tiendas. Los datos son reales, pero el nombre de la franquicia no se usa a peticin de la
empresa. Las variables para este conjunto de datos son:
Ventas (y): total de ventas mensuales en el ltimo mes (en dlares).
Edad: edad promedio de la base de clientes (en aos).
Hs: porcentaje de la base de clientes con diploma de bachillerato.
Universidad: porcentaje de clientes con diploma universitario.
Crecimiento: tasa de crecimiento anual de la poblacin en los ltimos 10 aos.
Ingreso (x): ingreso promedio familiar de la base de clientes (en dlares).
TABLA DE DATOS
VENTAS
1695713
3403862
2710353
529215
663687
2546324
2787046
612696
891822
1124968
909501
2631167
882973
1078573
844320
1849119
3860007
826574
604683
1903612
2356808
2788572
634878
2371627
2627838
1868116
2236797
1318876
1868098
1695219
2700194
1156050
643858

EDAD CRECIMIENTO INGRESOS


33.1574
0.8299
26748.5
32.6667
0.6619
53063.8
35.6553
0.9688
36090.1
33.0728
0.0821
32058.1
35.7585
0.4646
47843.4
33.8132
2.1796
50181.0
30.9797
1.8048
30710.1
30.7843
-0.0569
29141.7
32.3164
-0.1577
25980.2
32.5312
0.3664
18730.9
31.4400
2.2256
31109.2
33.1613
1.5158
35614.1
31.8736
0.1413
23038.4
33.4072
-1.0400
34531.7
34.0470
1.6836
30350.4
28.8879
2.3596
38964.9
36.1056
0.7840
49392.8
32.8083
0.1164
25595.7
33.0538
1.1498
29622.6
33.4996
0.0606
31586.1
32.6809
1.6338
39674.6
28.5166
1.1256
28879.0
32.8945
1.4884
24287.1
30.5024
4.7937
46711.2
30.2922
1.8922
33449.8
31.2911
1.8667
31694.5
33.0498
1.7896
25459.2
32.9348
0.2707
47047.3
31.8381
3.0129
26433.2
31.0794
23.4630
33396.7
32.1807
0.7041
26179.4
31.6944
-0.1569
33454.6
34.0263
0.7084
42271.5

HS
73.5949
88.4557
73.5362
79.1780
84.1838
93.4996
78.0234
70.2949
70.6674
63.7395
76.9059
82.9452
65.2127
73.4944
80.2201
87.5973
85.3041
65.5884
80.6176
80.3790
79.8526
81.2371
70.2244
87.1046
80.2057
75.2914
77.6162
85.1753
74.1792
81.6991
73.4140
73.7161
78.6493

UNIVERSIDAD
17.8350
31.9439
18.6198
20.6284
35.2032
41.7057
28.0250
15.0882
10.9829
13.2458
19.5500
20.8135
16.9796
32.9920
22.3185
24.5670
30.8790
17.4545
18.6356
38.3249
23.7780
16.9300
19.1429
30.8843
26.5570
28.3600
19.2490
35.4994
18.6375
41.1130
17.8566
26.5426
29.8734

2188687
830352
1226906
566904
826518

34.7315
30.5613
33.5183
32.3952
29.9108

0.1353
0.3848
0.7417
0.6693
0.1111

46514.8
27030.8
42910.1
40561.4
22326.0

80.9503
66.8057
77.8905
79.3622
58.3610

24.5374
14.1390
20.8340
19.0309
10.6729

A) Construir diagrama de dispersin utilizando las ventas como la variable dependiente (y) y el
ingreso familiar promedio como la variable independiente (x)
R.
Grfica de dispersin de Sales vs. Income
4000000
3500000

Sales

3000000
2500000
2000000
1500000
1000000
500000
20000

25000

30000

35000

40000

45000

50000

55000

Income

B) Calcular la ecuacin de regresin


^y =299877+ 39.2 x i
R.

C) Interprete el significado de b0 y b1
b
R. 0 es la interseccin en las ventas, cuando el ingreso es cero las ventas sern de 29998.77
dlares.
b1 Por cada incremento en el ingreso hay 39.2 dlares de aumento en las ventas de artculos
deportivos.
D) Calcular r2 e interprete el resultado
2
R. r =14.72
Significa que el

14.72

de la variacin de las ventas de productos deportivos se explica por la

variacin de los ingresos. Indica dbil relacin lineal entre las dos variables. El modelo de
regresin predice Ventas de productos deportivos en un 14.72 y el otro 85.28 de variacin se
debe a otros factores.

E) Realizar inferencias sobre la pendiente prueba t y prueba f con nivel de significancia de

0.05

R. Prueba T
t c =2.49
Grfica de distribucin
T, df=36
0.4

Densidad

0.3

0.2

t c =2.49

0.1

0.025
0.0

0.025
-2.028

2.028

t c >t

2.49>2.028

Rechazamos la

H0

y se acepta la alternativa, se concluye que existe una relacin lineal

entre los ingresos y las ventas.


Prueba F
H 0 : B1=0

H 1 : B1 0

F=6.21
Grfica de distribucin
F, df1=1, df2=36
1.4

0.025
1.2

Densidad

1.0
0.8
0.6
0.4

F=6.21

0.2

0.025

0.0

0.0009958
0

5.471

Como

F> Fu

6.21>5.471
H0

Cae en la regin de rechazo de

por tanto se concluye que los ingresos se relaciona con las

ventas.
F) Realizar anlisis residual y compruebe la no violacin de los supuestos
R.
Grficas de residuos para Sales
Grfica de probabilidad normal

vs. ajustes
2000000

90

Residuo

Porcentaje

99

50
10

1000000
0
-1000000

1
-2000000

-1000000

1000000

2000000

1000000

1500000

Residuo

2500000

vs. orden
2000000

1000000

Residuo

Frecuencia

Histograma
8

4
2
0

2000000

Valor ajustado

0
-1000000

-1600000

-800000

800000

1600000

Residuo

10

15

20

25

30

35

Orden de observacin

17)Prueba de normalidad: de acuerdo a la grfica los datos estn cerca de la pendiente,


concluimos que no se violan los supuestos de normalidad.
18)Linealidad y Homocedasticidad: no hay patrn evidente en los residuos, no se violan los
supuestos de linealidad ni homocedasticidad.
19)De acuerdo a la grfica no se viola el supuesto de independencia porque no hay un patrn.
20)El histograma no muestra una distribucin normal.
G) Estimar el intervalo de confianza para la pendiente con un nivel de confianza de 95%
Sb 1=15.7
R.
b1=39.2
t n2 =2.028
b1 t n2 Sb1

39.2 ( 2.028 ) ( 15.7 )

39.2 31.8396

39.2+31.8396=71.0396

39.231.8396=7.3604
(7.3604 , 71.0396)

Se estima un nivel de confianza del 95% que la pendiente de la poblacin se encuentra entre
7.3604 y 71.0396, estos valores estn por encima de cero por lo tanto se concluye que existe una
relacin lineal significativa entre el ingreso familiar y las ventas mensuales.

Esto indica que las ventas mensuales incrementan por lo menos $7.3604 dlares pero no ms de
$71.0396 dlares.

Вам также может понравиться