Вы находитесь на странице: 1из 37

FACULTAD DE INGENIERÍA

ESCUELA DE INGENIERÍA CIVIL

ESTADISTICA Y PROBABILIDAD

DOCENTE:
Romero Paredes, Rolando Ronald

ALUMNO:

Cavero Santa Cruz Manuel Eduardo

Chiclayo, Junio de 2016


EJERCICIOS DE REGRESIÓN MULTIPLE
EJERCICIO 6
En el béisbol, el éxito de un equipo se suele considerar en función del
desempeño en bateo y en lanzamiento del equipo. Una medida del
desempeño en el bateo es la cantidad de cuadrangulares que anota el
equipo y una medida del desempeño en lanzamiento es el promedio
de carreras ganadas por el equipo que lanza. En general, se cree que
los equipos que anotan más cuadrangulares (home run) y tienen un
promedio menor de carreras ganadas ganan un mayor porcentaje de
juegos. Los datos siguientes pertenecen a 16 equipos que
participaron en la temporada de la Liga Mayor de Béisbol de 2003; se
da la proporción de juegos ganados, la cantidad de cuadrangulares
del equipo (HR, por sus siglas en inglés) y el promedio de carreras
ganadas (ERA, por sus siglas en inglés) (www.usatoday.com, 17 de
enero de 2004).

a. Obtenga la ecuación de regresión estimada para predecir la


proporción de juegos ganados en función de la cantidad de
cuadrangulares.
b. Obtenga la ecuación de regresión estimada para predecir la
proporción de juegos ganados en función del promedio de
carreras ganadas por los miembros del equipo que lanza.
c. Obtenga la ecuación de regresión estimada para predecir la
proporción de juegos ganados en función de la cantidad de
cuadrangulares y del promedio de carreras ganadas por los
miembros del equipo que lanza.
d. En la temporada de 2003, San Diego ganó sólo el 39.5% de sus
juegos, siendo el más bajo de la liga nacional. Para mejorar
para el año siguiente, el equipo trató de adquirir nuevos
jugadores que hicieran que la cantidad de cuadrangulares
aumentara a 180 y que el promedio de carreras ganadas por el
equipo que lanza disminuyera a 4.0. Use la ecuación de
regresión estimada obtenida en el inciso para estimar el
porcentaje de juegos que ganaría San Diego si tuviera 180
cuadrangulares y su promedio de carreras ganadas fuera 4.0.
a. Obtenga la ecuación de regresión estimada para
predecir la proporción de juegos ganados en función de
la cantidad de cuadrangulares.

1. LA RELACIÓN ESPERADA(TEÓRICA)
 HR-Proporción de ganados: relación Directa
1. DIAGRAMA DE DISPERSIÓN

Según lo esperado podemos observar la proporción de ganados tiene


una relación directa con respecto a HR, ver el siguiente diagrama

2. CORRELACIÓN
H0: ρ=0; h1: ρ ≠0

Según lo observado en la siguiente tabla.


Con un p-value mayor al 0.05, se acepta hipótesis nula, no presenta una
relación significativa.

3. EL COEFICIENTE DE CORRELACIÓN: r=0.391, existe un correlación


Significativamente baja entre la HR con la proporción de ganados.

4. COEFICIENTE DE DETERMINACIÓN AJUSTADO

r2adj=0.093; el HR explica en 9.30 % a la estimación de la proporción


de ganados y no es explicado en 91.00%

5. PRUEBA DE VALIDEZ DEL MODELO

H0: ρ=0 : la correlación no es significativa

Ha: ρ ≠0 : la correlación es significativa

o Con 5% de n.s, se acepta Ho. El modelo es NO significativo


6. EL MODELO
β i=0 ; βi≠ 0
Ho: Ha:

Proporción de ganados=0.354+0.001*HR
b. Obtenga la ecuación de regresión estimada para
predecir la proporción de juegos ganados en función del
promedio de carreras ganadas por los miembros del
equipo que lanza.

1. LA RELACIÓN ESPERADA(TEÓRICA)

ERA – Proporción de ganados: relación inversa

2. DIAGRAMA DE DISPERSIÓN

Según lo esperado podemos observar que la proporción de ganados


con respecto a ERA presentan una relación inversa, ver el siguiente
diagrama

3. CORRELACIÓN

H0: ρ=0; h1: ρ ≠0


Según lo observado en la siguiente tabla.
La proporción de ganados con ERA si presenta relación
significativa al 5% de

4. EL EFICIENTE DE CORRELACIÓN:

r=0.709, existe un correlación alta significativa entre ERA con la


proporción de ganados.
5. COEFICIENTE DE DETERMINACIÓN AJUSTADO

r2adj=0.467; ERA explica en 46,7 % a la estimación de la proporción


de ganados y no es explicado en 53.3%

6. PRUEBA DE VALIDEZ DEL MODELO

H0: ρ=0 : la correlación no es significativa

Ha: ρ ≠0 : la correlación es significativa

o Con 5% de n.s, se rechaza Ho. El modelo es significativo

7. EL MODELO –EVALUACION DE LOS PARÁMETROS.


β i=0 ; βi≠ 0
Ho: Ha:

Proporción de ganados=0.865-0.084*ERA

c. Obtenga la ecuación de regresión estimada para predecir la


proporción de juegos ganados en función de la cantidad de
cuadrangulares y del promedio de carreras ganadas por los
miembros del equipo que lanza.

1. LA RELACIÓN ESPERADA (TEÓRICA)

o HR-Proporción de ganados: relación directa


o ERA – Proporción de ganados: relación inversa

2. DIAGRAMA DE DISPERSIÓN

Según lo esperado podemos observar la proporción de ganados tiene


una relación directa con respecto a HR, ver el siguiente diagrama

Según lo esperado podemos observar que la proporción de ganados


con respecto a ERA presentan una relación inversa, ver el siguiente
diagrama
3. CORRELACIÓN

H0: ρ=0; h1: ρ ≠0


Según lo observado en la siguiente tabla.

o La proporción de ganados con ERA si presenta relación


significativa al 5% de n.s.
o La proporción de ganados con HR no presenta relación de
significativa.

4. EL EFICIENTE DE CORRELACIÓN

r=0.926, existe un correlación alta significativa entre la HR y era con


la proporción de ganados.
5. COEFICIENTE DE DETERMINACIÓN AJUSTADO

r2adj=0.837; ERA y HR explica en 83,7 % a la estimación de la


proporción de ganados y no es explicado en 16.3%
6. PRUEBA DE VALIDEZ DEL MODELO

H0: ρ=0 : la correlación no es significativa

Ha: ρ ≠0 : la correlación es significativa

o Con 5% de n.s, se rechaza Ho. El modelo es significativo

7. EL MODELO –EVALUACION DE LOS PARÁMETROS.


β i=0 ; βi≠ 0
Ho: Ha:

Proporción de ganados= 0.709+0.001*HR-0.103*ERA

d. En la temporada de 2003, San Diego ganó sólo el 39.5%


de sus juegos, siendo el más bajo de la liga nacional.
Para mejorar para el año siguiente, el equipo trató de
adquirir nuevos jugadores que hicieran que la cantidad
de cuadrangulares aumentara a 180 y que el promedio
de carreras ganadas por el equipo que lanza
disminuyera a 4.0. Use la ecuación de regresión
estimada obtenida en el inciso para estimar el
porcentaje de juegos que ganaría San Diego si tuviera
180 cuadrangulares y su promedio de carreras ganadas
fuera 4.0.
Proporción de ganados= 0.709+0.001*HR-0.103*ERA
Proporción de ganados= 0.709+0.001*180-0.103*4
Proporción de ganados= 0.709+0.252 -0.412
Proporción de ganados= 0.549
Proporción de ganados= 54,9%

EJERCICIO 7
Los diseñadores de mochilas usan materiales exóticos como supernailon
Derlin, polietileno de alta densidad, aluminio para aviones o espumas
termo-moldeadas para hacer que las mochilas sean más confortables y que
el peso se distribuya uniformemente eliminándose así los puntos de mayor
presión. En los datos siguientes se proporciona capacidad (en pulgadas
cúbicas), evaluación del confort, y precio de 10 mochilas probadas por
Outside Magazine. El confort está medido con una escala del 1 al 5, en la
que 1 denota un confort mínimo y 5 un confort excelente. (Outside Buyer’s
Guide, 2001).

Solución
a. Obtenga la ecuación de regresión estimada que permita
predecir el precio de una mochila, dada su capacidad y la
evaluación de su confort.

1. LA RELACIÓN ESPERADA (TEÓRICA)


o Capacidad – precio: Relación directa
o Confort – precio: Relación directa
o Capacidad – confort: No hay relación

2. DIAGRAMAS DE DISPERSIÓN:

o Capacidad – precio: Contra lo esperado podemos observar que


los datos no presentan relación alguna, ver el siguiente
diagrama:

o Confort – precio: Según lo esperado podemos observar que los


datos presentan relación directa, con algunos puntos dispersos,
ver el siguiente diagrama:

o Capacidad – confort: Contra lo esperado podemos observar que


los datos presentan relación directa, con algunos puntos
dispersos, ver el siguiente diagrama:
3. CORRELACIÓN - PRUEBA DE HIPÓTESIS ENTRE VARIABLES

o Ho: ρ=0: la correlación no es significativa


o Ha: ρ≠0: la correlación es significativa
o Según lo observado en la siguiente tabla:

 La capacidad no tiene relación significativa con el confort.


 El confort y el precio si presentan correlación significativa al 5%
de n.s.
 La capacidad y el confort no tienen una relación significativa.

4. COEFICIENTE DE CORRELACIÓN R=0.912

Existe una correlación alta significativa entre el confort y la capacidad


con el precio.
5. COEFICIENTE DE DETERMINACIÓN AJUSTADO: R2ADJ=0.784

El confort y la capacidad explican en 78.4% a la estimación del costo,


y no es explicado en 21.6%

6. PRUEBA DE VALIDEZ DEL MODELO:

Ho: El modelo no es significativo


Ha: El modelo es significativo.

Como p-value=0.002, entonces con 5% de n.s. se rechaza Ho. El


modelo es significativo.

7. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS.

Ho: βi=0; Ha: βi≠0

o Para Ho: β1=0, Ha: β1≠0, la capacidad NO contribuye


significativamente para estimar el precio en el modelo.
o Para Ho: β2=0, Ha: β2≠0, el confort si contribuye
significativamente para estimar el precio en el modelo.
Por lo tanto, rediseñamos el modelo con una variable menos, donde el
nuevo modelo a buscar es:
Precio = b0+ b1*Confort

8. COEFICIENTE DE CORRELACIÓN NUEVO R=0.849

Existe una correlación alta significativa entre el confort con el precio.


9. COEFICIENTE DE DETERMINACIÓN AJUSTADO NUEVO: R2ADJ=0.721

El confort explica en 72.1% a la estimación del precio, y no es


explicado en 27.9%

10. PRUEBA DE VALIDEZ DEL MODELO:

Ho: El modelo no es significativo


Ha: El modelo es significativo.

Como p-value=0.002, entonces con 5% de n.s. se rechaza Ho. El


modelo es significativo.

11. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS.

Ho: βi=0; Ha: βi≠0

o Para Ho: β1=0, Ha: β1≠0, el confort si contribuye significativamente


para estimar el precio en el modelo.

12. EL MODELO ES:

Precio de la mochila = -41.618 + 93.876*Confort

El precio de la mochila sin nivel de significancia y con las dos


variables es:
Precio = 356.121 -0.099*Capacidad +122.867*Confort
Sin embargo, con nivel de significancia al 5%, el modelo
estimado es:
Precio = -41.618 + 93.876*Confort

b. Interprete b1 y b2.
o Con el primer modelo en el que el primer coeficiente (capacidad) no
contribuye significativamente al modelo:
0.099 es la estimación del decremento esperado en el precio
que corresponde al aumento en una pulgada cúbica en la
capacidad cuando el confort permanece constante.
122.867 es la estimación del aumento esperado en el precio que
corresponde al aumento de la evaluación del confort cuando la
capacidad permanece constante.

o Con el segundo modelo en el que si hay nivel de significancia:


93.876 es la estimación del aumento esperado en el precio que
corresponde al aumento de la evaluación del confort cuando la
capacidad permanece constante.

c. Diga cuál será el precio de una mochila cuya


capacidad sea 4500 pulgadas cúbicas y la evaluación
de su confort sea 4.
o Con el primer modelo en el que el primer coeficiente (capacidad) no
contribuye significativamente al modelo:
Precio = 356.121 -0.099*(4500) +122.867*(4) = 402.09 = 402

o Con el segundo modelo en el que si hay nivel de significancia:


Precio = -41.618 + 93.876*(4) = 333.89 = 334

EJERCICIO 8
En la siguiente tabla se da el rendimiento anual, la evaluación de la
seguridad (0=de alto riesgo, 10 segura) y el coeficiente de gastos anuales
de 20 fondos extranjeros (Mutual Funds, marzo del 2000).
Solución

a. Obtenga la ecuación de regresión estimada que


relaciona el rendimiento anual con la evaluación de la
seguridad y con el coeficiente de gastos anuales.
1. RELACIÓN ESPERADA (teórica):

o Rendimiento anual vs. Evaluación de seguridad: relación inversa.


o Rendimiento vs. coeficiente de gastos anuales: relación directa.
o Evaluación de seguridad vs. coeficiente de gastos anuales: no hay
relación.
2. DIAGRAMA DE DISPERSIÓN:
 Rendimiento vs Factor de seguridad: como se puede observar,
no hay relación entre estas variables.

Diagrama de dispersión 1
150

100
Rendimiento Anual
50

0
6 6.2 6.4 6.6 6.8 7 7.2 7.4 7.6 7.8
Factor de Seguridad

o Rendimiento vs coeficiente de gasto: como se puede observar,


no hay relación entre estas variables.

Diagrama de dispersión 2
140
120
100
80
Rendimiento Anual 60
40
20
0
0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4

Coeficiente de gastos anuales


o Coeficiente de gasto vs Factor de seguridad: como se puede
observar, no hay relación entre estas variables.

Diagrama de dispersión 3
2.5

1.5
Coeficiente de variación
1

0.5

0
6 6.2 6.4 6.6 6.8 7 7.2 7.4 7.6 7.8

Factor de seguridad

3. CORRELACIÓN:
o Ho : p=0 :lacorrelacion no es significativa

o Ha : p ≠ 0:la correlacion es significativa

Segun lo observado enla siguiente tabla :

Correlaciones

FS COEFA RENDA

Correlación de Pearson 1 -,513* -,659**

FS Sig. (bilateral) ,021 ,002

N 20 20 20
*
Correlación de Pearson -,513 1 ,668**
COEFA Sig. (bilateral) ,021 ,001
N 20 20 20
** **
RENDA Correlación de Pearson -,659 ,668 1
Sig. (bilateral) ,002 ,001

N 20 20 20

*. La correlación es significante al nivel 0,05 (bilateral).


**. La correlación es significativa al nivel 0,01 (bilateral).

o El factor de seguridad no tiene relación de significancia con el


coeficiente anual. Con el rendimiento anual presenta correlación
significativa del 5%.
o El coeficiente anual tiene correlación de significancia al 5% de n.s con
el rendimiento anual.

4. COEFICIENTE DE CORRELACIÓN: r=0,763

Resumen del modelo

Modelo R R cuadrado R cuadrado Error típ. de la


corregida estimación
a
1 ,763 ,582 ,533 16,97705

a. Variables predictoras: (Constante), COEFA, FS

5. COEFICIENTE DE CORRELACIÓN AJUSTADO:

r2 adj=0,533, el factor de seguridad y el coeficiente anual explican en


53,3% al rendimiento anual y no es explicado en 46,7%.
Resumen del modelo

Modelo R R cuadrado R cuadrado Error típ. de la


corregida estimación

1 ,763a ,582 ,533 16,97705

a. Variables predictoras: (Constante), COEFA, FS

6. PRUEBA DE VALIDEZ DEL MODELO:


o Ho: ρ=0 : la correlación no es significativa

Ha: ρ ≠0 : la correlación es significativa

7. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS:


o Ho: B1=0

o Ha: B1 ≠ 0

o Para Ho: B1=0 ; Ha: B1 ≠ 0 , El factor de seguridad si contribuye

significativamente para estimar los rendimiento anuales.


o Para Ho: B2=0 ; Ha : B2 ≠ 0 , El coeficiente anual si contribuye

significativamente para estimar los rendimiento anuales.


Rendimiento=b 0+ b1∗FS+ b2∗Coeficiente anual

Rendimiento=247.358−32.845∗FS+34.589∗Coeficiente anual

8. Estime el rendimiento anual de una empresa cuya evaluación de


seguridad es de 7.5 y el coeficiente de gastos anuales es 2.

Rendimiento=247.358−32.845∗FS+34.589∗Coeficiente anual

Rendimiento=247.358-32.845*7.5+34.589*2

Rendimiento=70,2

EJERCICIO 9
El ski acuático y el wakeboarding son dos deportes acuáticos muy
actuales. Ya sea que se trate de ski acuático, de wakeboarding o de
navegación, hallar el modelo que mejor se ajuste a las necesidades, puede
no ser una tarea sencilla. La revista Water Ski probó 88 lanchas y
proporcionó una amplia información como ayuda para los consumidores. A
continuación se presenta una parte de los datos que publicaron sobre 20
lanchas de 20 y 22 pies longitud (Water Ski, enero/febrero 2006). La manga
es el ancho máximo de la lancha (en pulgadas), HP son los caballos de
fuerza del motor y velocidad máxima es la velocidad máxima que alcanza la
lancha, en millas por hora.
Solución
Empleando estos datos obtenga la ecuación de regresión
estimada que relaciona la velocidad máxima con la manga y
los caballos de fuerza de la lancha.

1. LA RELACIÓN ESPERADA (TEÓRICA)

o Manga-Velocidad Máxima : Relación directa


o Hp-Velocidad Máxima: Relación directa
o Manga - Hp: No hay relación
2. DIAGRAMA DE DISPERSIÓN

o Manga-Velocidad Máxima: Según lo esperado podemos


observar que los datos no tienen comportamiento directo, sino
que estos no presentan relación, ver el siguiente diagrama:

o Hp-Velocidad Máxima: Según lo esperado podemos observar


que los datos no tienen comportamiento directo, sino que estos
no presentan relación, ver el siguiente diagrama:
o Manga - Hp: Según lo esperado podemos observar que los
datos no poseen ninguna relación, ver el siguiente diagrama:

3. CORRELACIÓN – PRUEBA DE HIPÓTESIS ENTRE VARIABLES


 Ho : p=0 :la correlacion no es significativa

 Ho : p ≠ 0:la correlacion es significativa

 Segun lo observado enla siguiente tabla


La manga no tiene relación significativa con el Hp. Con Velocidad_Maxima
presenta correlación significativa al 5% de n.s.

o 1.2 Hp también presenta una correlación significativa al 5% de


n.s con Velocidad_Maxima.

4. COEFICIENTE DE CORRELACIÓN: r=0.773 ,

Existe una correlación alta significativa entre la manga y hp con el


costo:
Resumen del modelo

Modelo R R cuadrado R cuadrado Error típ. de la


corregida estimación
1 ,773a ,597 ,550 1,59538

a. Variables predictoras: (Constante), Hp, Manga


5. PRUEBA DE VALIDEZ DEL MODELO

Ho: El modelo no es significativo


H 1 : El modelo es significativo.

6. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS

Ho: B1=0
Ha: B1 ≠ 0

o Para Ho: B1=0 ; Ha: B1 ≠ 0, El manga si contribuye


significativamente para estimar la velocidad de máxima del modelo.

o Para Ho: B2=0 ; Ha: B2 ≠ 0, El Hp si contribuye significativamente


para estimar los la velocidad de máxima del modelo.

Velocidad=b0 + b1∗Manga+ b2∗Hp

a. La Svfara SV 609 tiene una manga de 85 pulgadas y


motor de 330 caballos de fuerza. Utilice la ecuación de
regresión estimada obtenida en el inciso a) para estimar
la velocidad máxima de la Svfara SV609.

Velocidad=b0 + b1∗Manga+ b2∗Hp

Velocidad=64.966−0.39∗85+0.051∗330

Velocidad=48.646
EJERCICIO 25
Borron’s realiza revisiones anuales de los corredores de bolsa en línea,
en la que se incluyen tanto corredores a los que se les puede contactar vía
un explorador de Internet, así como corredores que tienen acceso directo y
que ponen al cliente en contacto directo con el servidor de una red de
corredores de bolsa. La oferta y el desempeño de cada corredor se evalúan
en seis áreas, empleando para cada área una escala de 0 a 5. Los resultados
se ponderan para obtener una evaluación general y a cada corredor se le
asigna una evaluación final que va de cero a cinco estrellas. Tres de las
áreas evaluadas son ejecución de la operación, facilidad de uso y gama de
ofertas. Un 5 en ejecución de la operación significa que la llegada del pedido
y el proceso de ejecución fluyeron con facilidad de un paso a otro. En
facilidad de uso, 5 significa que el sitio es de fácil uso y que se puede
ajustar para ver lo que le interesa al usuario ver. Un 5 en gama de ofertas
significa que todas las transacciones pueden realizarse en línea. En los
datos siguientes se presentan las puntuaciones obtenidas en ejecución de la
operación, facilidad de uso y gama de ofertas y el número de estrellas
obtenidas por los integrantes de una muestra de 10 corredores de bolsa
(Barron’s, 10 de marzo de 2003).

Solución
Determine la ecuación de regresión estimada que se puede usar para
predecir el número de estrellas dadas las evaluaciones a ejecución,
facilidad de uso y gama de ofertas.
a. Emplee la prueba F para determinar la significancia global de la relación.
Empleando como nivel de significancia 0.95, ¿cuál es la conclusión?
b. Emplee la prueba t para determinar la significancia de cada una de las
variables independientes. Empleando como nivel de significancia 0.05, ¿cuál
es la conclusión?
c. Elimine cualquiera de las variables independientes que no sea significativa
para la ecuación de regresión estimada. ¿Cuál es la ecuación de regresión
estimada que recomienda? Compare R2 con el valor de R2 para el inciso a).
Analice las diferencias.

1. LA RELACIÓN ESPERADA (TEÓRICA)

o Ejecución de la operación - Estrellas: Relación Directa


o Uso - Estrellas: Relación Directa
o Gama - Estrellas: Relación Directa
o Ejecución de la operación – Uso: Relación Directa
o Ejecución de la operación – Gama: Relación Directa
o Uso – Gama : Relación Directa

2. DIAGRAMA DE DISPERSIÓN

o Según lo esperado podemos observar que los datos si tienen


comportamiento directo entre la Gama, Uso y la ejecución de la
operación con las estrellas.
o También se observa que el uso no tiene relación con la ejecución de
la operación.
o Además, la gama con el uso tampoco presentan relación.
o A sí mismo, la gama con la ejecución de la operación no tienen
relación aparente.
3. CORRELACIÓN: PRUEBA DE HIPÓTESIS

Ho: p=0: La correlación no es significativa

Ha: p≠0: La correlación es significativa

o Las estrellas presentan correlación significativa al 5% de nivel


de significancia con la ejecución y la gama, mientras que con el
uso no presenta relación significativa.
o Entre la ejecución de la operación-uso, ejecución de la
operación-gama y la gama-uso no se encuentra relación
significativa.
4. COEFICIENTE DE CORRELACIÓN

R= 0.941, Existe una correlación alta significativa entre la ejecución


de la operación, uso y la gama.
Resumen del modelo
Modelo R R cuadrado R cuadrado Error típ. de la
corregida estimación
a
1 ,941 ,886 ,828 2,43100

a. Variables predictoras: (Constante), Gama, Uso, Ejecución de la


operación
5. COEFICIENTE DE CORRELACIÓN AJUSTADO

R2 adj = 0.828, la ejecución de la operación, uso y la gama


explican en 82.8% a la estimación de las estrellas, y no es explicado en
17.2%

6. PRUEBA DE VALIDEZ DEL MODELO

Ho: ρ =0: el modelo no es significativo

Ha: ρ ≠0: La correlación es significativa

Se prueba que el modelo es significativo.

7. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS

Ho: βi =0: El modelo no es significativo


Ha: βi ≠0: El modela es significativo
o Para Ho: β1 =0; Ha: β1 ≠0, La ejecución de la operación si
contribuye significativamente para estimar las estrellas del modelo.
o Para Ho: β2 =0; Ha: β2 ≠0, el uso NO contribuye significativamente
para estimar las estrellas del modelo.
o Para Ho: β3 =0; Ha: β3 ≠0, el uso si contribuye significativamente
para estimar las estrellas del modelo.
El modelo es:
Estrellas=3.415+0.255∗ejecución+0.132∗Uso+ 0.459∗Gama

8. COEFICIENTE DE CORRELACIÓN

R= 0.932, Existe una correlación alta significativa entre la ejecución


de la operación, uso y la gama.

9. COEFICIENTE DE CORRELACIÓN AJUSTADO

R2 adj = 0.831, la ejecución de la operación, uso y la gama explican en

83.2% a la estimación de las estrellas, y no es explicado en 16.8%.

10. PRUEBA DE VALIDEZ DEL MODELO

Ho: ρ=0: el modelo no es significativo


Ha: ρ≠0: La correlación es significativa

Se prueba que el modelo es significativo.

11. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS

Ho: βi =0: El modelo no es significativo


Ha: βi ≠0: El modela es significativo
o Para Ho: β1 =0; Ha: β1 ≠0, La ejecución de la operación si contribuye
significativamente para estimar las estrellas del modelo.
o Para Ho: β3 =0; Ha: β3 ≠0, el uso si contribuye significativamente para
estimar las estrellas del modelo.
El modelo es:
Estrellas=6.718+0.264∗ejecución+ 0.485∗Gam

RESULTADOS
a. Determine la ecuación de regresión estimada que se
puede usar para predecir el número de estrellas dadas
las evaluaciones a ejecución, facilidad de uso y gama de
ofertas.
Estrellas=3.415+0.255∗ejecución+0.132∗Uso+ 0.459∗Gama

b. Emplee la prueba F para determinar la significancia


global de la relación. Empleando como nivel de
significancia 0.95, ¿cuál es la conclusión?
Utilizando la prueba F en el Análisis 1:

Ho: ρ=0: el modelo no es significativo


Ha: ρ≠0: La correlación es significativa

Se obtiene para F=15.485, y un p-value de 0.003 que con un 5% de


significancia se rechaza Ho. Por ello, se concluye que el la prueba
proporciona evidencia estadística suficiente para concluir que los
parámetros no son igual a cero y que la relación global entre las estrellas y
el conjunto de variables independientes es significativa.
c. Emplee la prueba t para determinar la significancia de
cada una de las variables independientes. Empleando
como nivel de significancia 0.05, ¿cuál es la conclusión?
Ho: βi =0: El modelo no es significativo
Ha: βi ≠0: El modela es significativo

o Para Ho: β1 =0; Ha: β1 ≠0, La ejecución de la operación si contribuye


significativamente para estimar las estrellas del modelo.
o Para Ho: β2 =0; Ha: β2 ≠0, el uso NO contribuye significativamente
para estimar las estrellas del modelo.
o Para Ho: β3 =0; Ha: β3 ≠0, el uso si contribuye significativamente para
estimar las estrellas del modelo.

d. Elimine cualquiera de las variables independientes que


no sea significativa para la ecuación de regresión
estimada. ¿Cuál es la ecuación de regresión estimada
que recomienda? Compare R2 con el valor de R2 para el
inciso a). Analice las diferencias.
Por lo tanto rediseñamos el modelo con una variable menos, donde el
nuevo modelo a buscar es:
Estrellas= β0 + β1 * La ejecución de la operación + β2 * Gama
Comparando R2:
Del primer análisis: R2=0.828
Del segundo análisis: R2=0.831
Se observa que cuando se eliminó la variable que no era significante
para el modelo, aumento el R2 lo que explica que hay menor porcentaje de
variabilidad de las estrellas cuando se usan las variables de ejecución de
la operación y la Gama.
EJERCICIO 31
La sección “Guía para el usuario” del sitio en la Red de la revista Car and
Driver proporciona información sobre pruebas viales (road test) de
automóviles, camiones, SUV (acrónimo en inglés de Sport Utility Vehicle) y
vans. Abajo se presentan las puntuaciones generales para calidad general,
modelo de vehículo, frenado, manejo, economía de combustible, confort
interior, aceleración, confiabilidad, ajuste y terminado, transmisión dadas a
diversos vehículos empleando una escala del 1 (lo peor) a 10 (lo mejor).
Aquí se presenta una parte de los datos de 14 automóviles Deportivos/GT
(www.caranddriver.com, 7 de enero de 2004).
Solución
a. Dé una ecuación de regresión estimada usando manejo,
confiabilidad, y ajuste y terminado para predecir la
calidad general.
1. LA RELACIÓN ESPERADA:

Manejo-General: relación directa


Confiabilidad-General: relación directa
Ajuste y terminado-General: relación directa
Manejo – Confiabilidad: relación directa
Manejo – Ajuste: relación directa
Ajuste – Confiabilidad: relación directa

2. DIAGRAMA DE DISPERSIÓN

Manejo-General: Según lo esperado los datos tienen comportamiento


directo, ver el siguiente diagrama:
Confiabilidad-General: Según lo esperado los datos tienen
comportamiento directo, ver el siguiente diagrama:

Ajuste y terminado-General: Según lo esperado los datos tienen


comportamiento directo, ver el siguiente diagrama:
Entre las variables independientes se espera que exista cierta relación
y lo observado es:
Manejo – Confiabilidad: sin relación
Manejo – Ajuste: relación directa
Ajuste – Confiabilidad: sin relación
3. CORRELACIÓN POR CADA PAR DE VARIABLES

o La puntuación de la calidad general tiene relación con el manejo,


confiabilidad y ajuste terminado.
o El ajuste y el manejo existe cierta relación significativa, por lo tanto
puede afectar al modelo.
o Entre el manejo y la confiabilidad no existe relación

4. COEFICIENTE DE CORRELACIÓN: R=0.93


Coeficiente de correlación: r=0.93, existe una correlación alta
significativa entre la Ajuste y terminado, Confiabilidad y manejo con el
general.

5. COEFICIENTE DE DETERMINACIÓN AJUSTADO: R2ADJ=0.824

Ajuste y terminado, Confiabilidad y manejo explican en 82.4% a la


estimación del costo, y no es explicado en 17.6%

6. VALIDEZ DEL MODELO

P-value =0, entonces el modelo es significativo con 5% de nivel de


significancia.

7. EL MODELO - EVALUACIÓN DE LOS PARÁMETROS

Para ho: B1=0, Ha: B1≠o, El manejo si contribuye significativa para


estimar los costos en el modelo.
Para ho: B2=o, Ha: B2≠o , La confiabilidad si contribuye
significativamente para estimar los costos en el modelo.
Para Ho: B3=o, HA: B3≠o El ajuste y terminado si contribuye
significativamente para estimar los costos en el modelo.
Por lo tanto el modelo a usar es:
General=-
0.55+0.276*Manejo+0.447*Confiabilidad+0.270*Ajuste
b) Otro de los automóviles deportivos/GT evaluados por Car
and Driver es el Honda Accord. Las evaluaciones de manejo,
confiabilidad, y ajuste y terminado dadas a este automóvil
fueron 8.28, 9.06 y 8.07, respectivamente. Estime la
evaluación general dada a este automóvil

General=-0.55+0.276*8.28+0.447*9.06+0.270*8.07=7.964

Вам также может понравиться