Вы находитесь на странице: 1из 23

INGENIERÍA INDUSTRIAL

ESTADISTICA INFERENCIAL II

ACTIVIDAD 1 TEMA 1

Profesor: Verónica Del Roció Silva Olvera


Alumno: Ricardo Daniel López Estrada
Fecha: 21/02/2019
1.1 Un estadístico que trabaja para un fabricante estadounidense de automóviles
desearía desarrollar un modelo estadístico para predecir el tiempo de entrega (la
cantidad de días transcurridos entre el pedido de un automóvil y la entrega real del
mismo) de los pedidos de automóviles nuevos. El estadístico piensa que existe una
relación lineal entre el número de opciones pedidas y el tiempo de entrega. Se
seleccionó una muestra aleatoria de 16 automóviles y se obtuvieron los resultados
que se presentan a continuación:

Relación del tiempo de entrega con las opciones


ordenadas

Número de opciones Tiempo de entrega,


Automóvil pedidas, X Y (en días)
1 3 25
2 4 32
3 4 26
4 7 38
5 7 34
6 8 41
7 9 39
8 11 46
9 12 44
10 12 51
11 14 53
12 16 58
13 17 61
14 20 64
15 23 66
16 25 70

a) Construya un diagrama de dispersión.


b) Utilice el método de mínimos cuadrados para encontrar los coeficientes de
regresión b0 y b1.

c) Interprete el significado de la intersección con el eje Y, b 0, y la pendiente, b1, de


este problema

d) Si se tiene un pedido de un automóvil con 16 opciones, ¿cuántos días predecirá


usted que tardará la entrega?
e) Calcule el error estándar de la estimación.

f) Calcule el coeficiente de determinación, r2, e interprete su significado en el


problema.

g) Calcule el coeficiente r2 ajustado y compárelo con el coeficiente de determinación


r2.
h) Calcule el coeficiente de correlación, r.

i) Establezca una estimación de intervalo de confianza de 95% del tiempo promedio


de entrega para todos los automóviles pedidos con 16 opciones.

j) Establezca una estimación de intervalo de predicción del tiempo de entrega para


un automóvil individual que fue pedido con 16 opciones.
k) Al nivel de significación de 0.05, ¿existe evidencia de que haya una relación lineal
entre el número de opciones y el tiempo de entrega?

l) Establezca una estimación de intervalo de confianza de 95% de la pendiente


verdadera,

m) Lleve a efecto un análisis de residuos de los resultados obtenidos y determine lo


adecuado del ajuste del modelo,
n) Lleve a efecto un análisis de influencia y determine si se debe eliminar del modelo
alguna observación. Si es necesario hacerlo, vuelva a analizar el modelo de
regresión después de haber eliminado la o las observaciones y compare los
resultados con los del modelo original,

o) ¿Qué suposiciones con respecto a la relación entre el número de opciones y el


tiempo de entrega necesitaría hacer el estadístico con el propósito de utilizar este
modelo de regresión para fines de predicción en el futuro?

1. Los datos deben estar normalizados.


2. La ecuación de regresión lineal debe representar de manera adecuada el
3. Comportamiento de los datos.
4. El análisis residual debe ser homogéneo y no presentar algún patrón.
5. El análisis de influencia no debe presentar una observación atípica
1.3 Al dueño de una gran cadena de expendios de helados le gustaría estudiar el efecto
de la temperatura ambiente sobre las ventas de sus productos durante la temporada
de verano. Se seleccionó una muestra aleatoria de 21 días y se obtuvieron los
resultados que se presentan a continuación:

Temperatura Venta por


alta diaria Tienda
Día (°F) (en $000)
1 63 1.52
2 70 1.68
3 73 1.80
4 75 2.05
5 80 2.36
6 82 2.25
7 85 2.68
8 88 2.90
9 90 3.14
10 91 3.06
11 92 3.24
12 75 1.92
13 98 3.40
14 100 3.28
15 92 3.17
16 87 2.83
17 84 2.58
18 88 2.86
19 80 2.26
20 82 2.14
21 76 1.98
a) Construya un diagrama de dispersión.

b) Suponiendo que haya una relación lineal, utilice el método de mínimos cuadrados
para encontrar los coeficientes de regresión b0 y b1.
c) Interprete el significado de la pendiente b1 de este problema.

d) Prediga las ventas por tienda para un día en el que la temperatura es de 83° F.

e) Calcule el error estándar de la estimación.


f) Calcule el coeficiente de determinación, r2 e interprete su significado en este
problema.

g) Calcule el coeficiente de correlación, r.


h) Calcule el coeficiente ajustado r2 y compárelo con el coeficiente de determinación
r2.

i) Calcule la estadística de Durbin-Watson y, al nivel de significación de 0.05,


determine si existe alguna autocorrelación en los residuos.

j) Basándose en los resultados del inciso (i), ¿a qué conclusiones puede usted llegar
con respecto a la validez del modelo ajustado en el inciso (b)?

El modelo ajustado es correcto ya que la temperatura si afecta las ventas.


k) Establezca una estimación de intervalo de confianza de 95% de las ventas
promedio por tienda para todos los días en los que la temperatura es de 83°F.

l) Establezca un intervalo de predicción para las ventas por tienda en un día en el


cual la temperatura es de 83° F.

m) Al nivel de significación de 0.05, ¿existe evidencia de que haya una relación lineal
entre la temperatura ambiental y las ventas?
n) Establezca una estimación de intervalo de confianza de 95% de la pendiente
verdadera.

El intervalo de confianza de 95% de la pendiente verdadera es: 0.5333≤ b1≤ 0.00808

o) Explique qué tan diferentes podrían ser los resultados obtenidos si el modelo
estuviera basado en una medida de la temperatura en la escala Celcius (°C).

p) Efectúe un análisis de residuos de los resultados obtenidos y determine lo


adecuado del ajuste del modelo.

Hay una relación entre ŷ y los residuos el modelo no se ajusta bien

q) Lleve a efecto un análisis de influencia y determine si debería eliminarse del


modelo alguna observación. Si esto es necesario, vuelva a analizar el modelo de
regresión después de eliminar la o las observaciones y compare los resultados
con los obtenidos con el modelo original.

Se aprecia ninguna observación alejada de la media por lo que el modelo original se


ajusta bien
1.5 Suponga que una compañía grande de productos de consumo desea medir la
efectividad de los diferentes medios de propaganda en la promoción de sus productos.
En especial, se van a estudiar dos tipos de medios de promoción: propaganda en radio
y televisión y propaganda en periódicos (incluyendo el costo de los cupones de
descuento). Se seleccionó una muestra de 22 ciudades cuya población es
aproximadamente igual para realizar un estudio durante un periodo de prueba de un mes.
A cada ciudad se le asignó un nivel de gastos específico para publicidad en radio y
televisión y para publicidad en periódicos. Se registraron las ventas del producto (en
miles de dólares) durante el mes de prueba, junto con los niveles de gastos de los
medios, y se tuvieron los siguientes resultados:

Problema sobre medios de publicidad

Ventas Publicidad en
Publicidad en
Ciudad (miles de radio y televisión Periódicos
(miles de dólares)
dólares) (miles de dólares)

1 973 0 40
2 1,119 0 40
3 875 25 25
4 625 25 25
5 910 30 30
6 971 30 30
7 931 35 35
8 1,177 35 35
9 882 40 25
10 982 40 25
11 1,628 45 45
12 1,577 45 45
13 1,044 50 0
14 914 50 0
15 1,329 55 25
16 1,330 55 25
17 1,405 60 30
18 1,436 60 30
19 1,521 65 35
20 1,741 65 35
21 1,866 70 40
22 1,717 70 40
Utilice un paquete de computación y lleve a cabo un análisis de regresión lineal
múltiple. Basándose en los resultados obtenidos:

a) Establezca la ecuación de regresión múltiple.

b) Interprete el significado de las pendientes en este problema.

B 1 = 13.08: si aumentamos en mil dólares la publicidad en radio y tv además


manteniendo la de periódicos aumentamos en 13.08 miles de dólares.

B2 = 16.79: si aumentamos en mil dólares la publicidad en periódicos además


mantenemos la de radio y tv las ventas aumentan en 16.79 miles de dólares.

c) Prediga las ventas para una ciudad en la cual el costo de la publicidad en radio y
televisión es de $20,000, y el de la publicidad en periódicos es también de
$20,000.

d) Calcule el coeficiente de regresión múltiple r2 e interprete su significado.

r2 nos indica que el modelo así ajustado explica 80.87% la variabilidad en ventas.
e) Lleve a cabo un análisis de residuos y determine lo adecuado del ajuste del
modelo.

Tienden a ajustarse bien a la línea recta.

No se tiene ningún patrón

El modelo se ajusta de igual manera a lo largo de los valores de Y.


f) Determine si existe una relación significativa entre las ventas y las dos variables
explicativas (publicidad en radio y televisión y publicidad en periódicos), al nivel
significación de 0.05.

Ho : B1=B2 = 0 H1: uno o más parámetros son diferentes de 0

Se rechazara Ho si F cal ≥ Fa

F , 𝑘, 𝑛 − 𝑘 − 1 = 𝑓 0.025; 2.19 = 4.77 estadística Fa = 40.16
2

40.16 >4.77 se rechaza Ho: B1=B2 = 0

Existe una relación significativa entre las ventas y las variables publicidad de radio tv y periódicos.

g) Obtenga el valor P e interprete su significado.

La distinta publicidad si afecta la ventas.

h) Determine si cada una de las variables explicativas hace una contribución


significativa al modelo de regresión. Basándose en estos resultados, indique el
modelo de regresión que debería utilizarse en el problema.

H0: B1 = 12.08 Hipótesis nula


H1: B1 = 12.08 Hipótesis alternativa

Significancia 10% t = 1.729 Se acepta Ho , no existe una diferencia significativa.

i) Establezca una estimación de intervalo de confianza del 95% para la pendiente


poblacional entre las ventas y la publicidad en radio y televisión.

tα= 2.093 b2 =13.08 b2 =1.76 b2 ± tα Sb2 = 13.08±2.093 (1.76)

9.39 ≤Bi≥ 16.76


1.7 El director de operaciones de transmisión de una estación de televisión desea
estudiar la cuestión de las "horas de reserva", tiempo que se les paga a los artistas
gráficos sindicalizados que trabajan en la estación, pero durante el cual realmente no
existe ninguna actividad. Las variables que se van a tomar en cuenta son:
Horas de reserva (Y): número total de horas de reserva por semana.
Personal total presente (X1): total por semana de los días-persona trabajados
durante una semana de siete días.
Horas remotas (X2): número total de horas trabajadas por los empleados en
locaciones fuera de la planta central.
Los resultados para un periodo de 26 semanas son los siguientes:
Problema sobre horas de reserva

Horas de Personal Horas


Semana total remotas
reserva presente
1 245 338 414
2 177 333 598
3 271 358 656
4 211 372 631
5 196 339 528
6 135 289 409
7 195 334 382
8 118 293 399
9 116 325 343
0 147 311 338
1 154 304 353
2 146 312 289
3 115 283 388
14 161 307 402
15 274 322 151
16 245 335 228
17 201 350 273
18 183 339 440
19 237 327 475
20 175 328 347
21 152 319 449
22 188 325 336
23 188 322 267
24 197 317 235
25 261 315 164
26 232 331 270
Utilice un paquete de computación y lleve a cabo un análisis de regresión lineal
múltiple. Basándose en los resultados obtenidos:

a) Establezca la ecuación de regresión múltiple.

b) Interprete el significado de las pendientes en este problema.

c) Prediga las horas de reserva para una semana en la que el personal total presente
es de 310 días-persona y las horas remotas son 400.

d) Calcule el coeficiente de regresión múltiple r2 e interprete su significado.

El estadístico r2 indica que el modelo así ajustado explica 49.04% de la variabilidad


En horas de reserva.

e) Lleve a cabo un análisis de residuos y determine lo adecuado del ajuste del


modelo.

tienden a ajustarse razonablemente bien


no siguen ningún patrón

El Modelo se ajusta de igual manera a lo largo de los valores de Y.

f) Grafique los residuos en función del tiempo (en semanas). ¿Existe alguna
evidencia de que haya un patrón en los resultados? Explique su respuesta.

No hay evidencia de algún patrón en los resultados.

g) Calcule la estadística de Durbin-Watson.


h) Al nivel de significancia del 5%, ¿existe evidencia de autocorrelación positiva en
los residuos?

i) Obtenga el valor P e interprete su significado.

Las horas de reserva, afectan al personal presente y a las horas remotas.

j) Determine si existe una relación significativa entre las horas de reserva y las dos
variables explicativas (personal total presente y horas remotas), al nivel significación
de 0.05.

Ho: B1=B2 = 0 H1: uno o más parámetros son diferentes de 0

Se rechazara Ho si F cal ≥ Fa

F , 𝑘, 𝑛 − 𝑘 − 1 = 𝑓 0.025; 2.23 = 4.46 estadística Fa = 11.107
2

11.07 >4.46 se rechaza Ho: B1=B2 = 0 por lo cual hay una relación significativa entre las hora de
reserva.
k) Obtenga el valor P e interprete su significado.

Las horas de reserva, afectan al personal presente y a las horas remotas.

l) Determine si cada una de las variables explicativas hace una contribución


significativa al modelo de regresión. Basándose en estos resultados, indique el
modelo de regresión que debería utilizarse en el problema.

H0: B1 = 0.124 Hipótesis nula


H1: B1 = 0.124 Hipótesis alternativa

Significancia 10% t = 1.714

Se acepta Ho, no existe una diferencia significativa.

Debe usarse el modelo de regresión múltiple ya que se expresan varias variables.

m) Establezca una estimación de intervalo de confianza del 95% para la pendiente


poblacional entre las horas de reserva semanales y el personal total presente.

tα= 2.069

b=1.767

Sb =0.379

b ± tαSb= 1.767±2.069 (0.379)

0.9828 ≤Bi≥ 2.5511

Вам также может понравиться