Академический Документы
Профессиональный Документы
Культура Документы
1
En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta
sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para
predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro
promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una
herramienta se muestran a continuación:
Horas de uso Diámetro (mm)
16 26.2
32 25.7
48 26.0
64 27.7
80 28.3
96 29.5
112 30.1
128 31.8
144 31.4
160 33.4
176 33.6
192 32.7
208 35.0
224 36.1
240 35.7
256 36.2
272 36.8
288 39.1
304 38.7
320 39.2
grafica de dispersion
b) Diagrama de dispersión: se puede observar que existe una correlación lineal positiva entre las
horas de uso y el diámetro, ya que conforme aumentan las horas de uso aumenta el diámetro.
40
37
34
Diámetro
31
28
25
0 100 200 300 400
Horas de uso
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
las horas de uso y el diámetro está dada por:
Diámetro = 24.8632 + 0.0464098*Horas de uso
La cual se puede observar en el grafico del modelo ajustado:
40
37
34
Diámetro
31
28
25
0 100 200 300 400
Horas de uso
Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables horas de uso y diámetro si existe una relación.
Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 24.8632 0.323206 76.9267 0.0000
Pendiente 0.0464098 0.00168629 27.5218 0.0000
Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 366.674 1 366.674 757.45 0.0000
Residuo 8.71365 18 0.484092
Total (Corr.) 375.388 19
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al
nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza
la hipótesis nula.
Verificación de supuestos:
El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los
predichos, los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algún patrón
definido. Gráfico de Residuos
Diámetro = 24.8632 + 0.0464098*Horas de uso
1.2
0.8
0.4
residuo
-0.4
-0.8
-1.2
25 28 31 34 37 40
predicho Diámetro
1.2
0.8
0.4
residuo
-0.4
-0.8
-1.2
0 4 8 12 16 20
número de fila
d) el coeficiente de determinación R2ajustado es de 97.6788% lo cual indica que nuestro modelo tiene
una calidad de ajuste satisfactoria, ya que explica el 97.6% de la variabilidad en Diámetro.
e) El valor sería de 433.89 horas a un diámetro de 45 mm, sin embargo realizar una extrapolación la
cual está más allá de la región que contiene a las observaciones originales está mal ya que
probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región
de estudio va de 25.7 a 39.2 mm de diámetro.
f) el valor de la pendiente es de 0.0464098, esto nos indica la razón de cambio en el diámetro (y)
con respecto al cambio de las horas de uso (x), es decir cuánto va a variar el diámetro cuando se
varíen las horas de uso.
g) El error estándar de la estimación fue de 0.695767, lo cual indica que la calidad de ajuste de
nuestro modelo es buena, ya que si el error estándar de estimación es menor la calidad del ajuste
será mayor.
Problema No. 2
Se piensa que el número de libras de
Mes Temperatura Consumo/1000
vapor consumidas Enero 21 185.79 mensualmente por
una planta química Febrero 24 214.47 se relaciona con la
temperatura Marzo 32 288.03 ambiente promedio
(en °F) de ese mes. Abril 47 424.84 En la tabla siguiente
se muestra la Mayo 50 454.58 temperatura y el
consumo anual: Junio 59 539.03
Julio 68 621.55
Agosto 74 657.06
Septiembre 62 562.03
Octubre 50 452.93
Noviembre 41 369.95
Diciembre 30 273.98
Y x
240 1.6
181 9.4
193 15.5
155 20.0
172 22.0
110 35.5
113 43.0
75 40.5
94 33.0
R= 62.3768
d) Obtenga el valor ajustado de y cuando x=22.0 y calcule el residual
correspondiente.
Y=172
Residual= 15.11749821
Problema No. 4
En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los
datos obtenidos se muestran en la siguiente tabla.
84
R en dim ie n to
80
76
72
68
64
8 10 12 14 16 18 20
Tiempo
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
el tiempo y el porcentaje de rendimiento está dada por:
Rendimiento = 57.9578 + 1.19492*Tiempo
88
84
Rendimiento
80
76
72
68
64
8 10 12 14 16 18 20
Tiempo
Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables tiempo y porcentaje de rendimiento si existe una relación.
Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 57.9578 6.28403 9.22303 0.0000
Pendiente 1.19492 0.414959 2.87962 0.0164
Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 243.684 1 243.684 8.29 0.0164
Residuo 293.872 10 29.3872
Total (Corr.) 537.557 11
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al
nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza
la hipótesis nula.
Verificación de supuestos:
Gráfico de Residuos
Rendimiento = 57.9578 + 1.19492*Tiempo
7.5
4.5
res id u o
1.5
-1.5
-4.5
-7.5
67 70 73 76 79 82
predicho Rendimiento
Gráfico de Residuos
El supuesto de independencia siRendimiento
se cumple= 57.9578
ya que+ 1.19492*Tiempo
los puntos o residuos se encuentran dispersos
7.5
de forma arbitraria dentro del gráfico de residuos vs número de corrida, sin cumplir ninguna
4.5
tendencia.
1.5
residuo
-1.5
-4.5
-7.5
0 2 4 6 8 10 12
número de fila
d) el coeficiente de determinación R 2ajustado es de .3986 lo cual indica que nuestro modelo no tiene una
buena calidad de ajuste, ya que solo nos explica el 39.865% de la variabilidad en Rendimiento.
Además en general, para fines de predicción se recomienda un R 2ajustado de al menos 0.7 o 70% de
explicación del modelo.
e) el valor de la pendiente es de 1.19492, esto nos indica la razón de cambio en el %Rendimiento (y)
con respecto al cambio de Tiempo(x), es decir cuánto va a variar el Rendimiento cuando se varíe el
tiempo.
f) Se podría calcular el valor que piden con respecto a los 2 min, sin embargo realizar una
extrapolación la cual está más allá de la región que contiene a las observaciones originales está mal
ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra
región de estudio va de 8 a 20 min de Tiempo.
Problema No. 5
En un artículo de Journal of Environmental Energineering se reportan los
resultados de un estudio sobre la presencia de sodio y cloruros en corrientes
superficiales de la parte central de Rhode Island. Los datos que se presentan a
continuación corresponden a la concentración de cloruros y (en mg/l) y al área de
carretera de la vertiente x (en %).
x y
0.19 4.4
0.15 6.6
0.57 9.7
0.70 10.6
0.67 10.8
0.63 10.9
0.47 11.8
0.70 12.1
0.60 14.3
0.78 14.7
0.81 15.0
0.78 17.3
0.69 19.2
1.30 23.1
1.05 27.4
1.06 27.7
1.74 31.8
1.62 39.5
R= 20.567