Вы находитесь на странице: 1из 12

U NIVERSIDAD D EL N ORTE

D EPARTAMENTO DE I NGENIERÍA I NDUSTRIAL


BARRANQUILLA , ATLÁNTICO , C OLOMBIA

Análisis de Datos en Ingeniería II


Taller No 2: “R EGRESIÓN N O L INEAL”
Resultados de simulación de un análisis de modelo de regresión no lineal para dos procesos industriales.

Integrantes:
Samira Abidaud Rojas
abidauds@uninorte.edu.co
Carlos Albarracin Buendía
caalbarracin@uninorte.edu.co
Melissa Vergara Vigna
vignam@uninorte.edu.co

Profesor:
Jorge Ivan Velez Valbuena

Fecha de entrega:
16 de Septiembre, 2019
I

Índice
1 Resumen 1

2 Mecanismo de uso para prueba destructiva de bloques de aluminio 1


2.1 Simulación del estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.2 Análisis de resultado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.3 Uso del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3 Proceso de cebollas 4
3.1 Simulación del estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.1 Recolección de datos e identificación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.2 Construcción del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.3 Estimación de y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2 Análisis de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2.1 Distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.2 Media 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.3 Homocedasticidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.4 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.5 Gráficos de los valores predichos por el modelo vs. los valores tomados de muestra. . . . . . . . . . . 8
3.3 Uso del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3.1 Predicción sobre cosechas futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

4 Conclusiones 9

5 Referencias bibliográficas 10
1

1. Resumen
Identificar la relación cuantitativa que tiene una variable de interés y un conjunto de datos permite que se ajuste a un modelo
de regresión avanzada, en este caso un modelo de regresión no lineal RNL. En este trabajo se abordó dos ajustes de regresión no
lineal para dos procesos.

Al momento de producir bloques de aluminio es importante tener en cuenta la calidad en la que se están produciendo, por lo
tanto se le aplica a un grupo de bloques producidos una prueba destructiva que en la cual se da uso de un mecanismo electro-
magnético que tiene la función de detectar fallas debajo de la superficie de cada bloque. La sensibilidad de este mecanismo es
importante para la calidad de los bloques, por lo que se procedió a realizar un ajuste de un modelo de regresión no lineal para así
poder predecir la relación entre la sensibilidad y el espesor del cable.

También sabemos que la cebolla al ser uno de los ingredientes principales de la hamburguesa, es muy importante para los
restaurantes que sirven este plato en cualquier presentación, ya que la hamburguesa ocupa un gran porcentaje en el consumo
de alimentos en la población estadounidense. Por eso mismo, a fines de aumentar la producción diaria de cebolla, planteamos
dos estados que posiblemente se conviertan en los mayores productores de la planta, el estado de Virginia y el estado de
Purnong Landing, South Australia. Determinaremos en cuál de los dos estados es más conveniente producir la verdura, por
medio de la construcción de un modelo de regresión que sea conveniente para predecir la cosecha esperada de cebolla dado
un factor controlable que mencionaremos más adelante.

2. Mecanismo de uso para prueba destructiva de bloques de aluminio


El estudio consta de dos variables, una variable dependiente denotada como SensibilidadY que da los valores de la
sensibilidad del mecanismo representadas con unidades adimensionales, de la cual esta depende de otra variable denotada
como EspesordelcableX que son los valores del espesor del cable usado en el mecanismo en unidades de milímetros.

2.1. Simulación del estudio


En esta sección se debe tener en cuenta también la recolección de datos de dichas variables, por lo tanto se tiene los
siguientes datos del mecanismo:

Tabla 1. Datos recolectados.


2

Estos datos se conforman a través de la función:


−(β2 +β3 x)
Y = β1 (1 − e−e ) (1)

Donde los βj son los valores que darán personalidad a la ecuación.

2.2. Análisis de resultado


Se procedió a agregar los datos en el software RStudio, se usó la siguiente función nls en la cual realizó 10 iteraciones
dando valores iniciales de β1 = 1,5 , β2 = −1,3, β3 = 10 sacados viendo el comportamiento de la función con GeoGebra
Calculadora gráfica, y la función summary, que con ella se obtuvo los siguientes datos:

Figura 1. Tabla Summary del modelo ajustado.

Donde se pudo obtener los valores de los βj estimados, siendo β1 = 1,9483, β2 = −1,2699, β3 = 14,3631. Por lo tanto,
el modelo ajustado está dado como:
−(−1,2699+14,3631x)
Y = 1,9483(1 − e−e ) (2)
Una forma de saber si el modelo obtenido se ajusta de buena manera es realizando el método gráfico, donde se procede a
graficar los datos reales sobre la función (2).

Figura 2. Valores reales vs. predichos.

Podemos mirar el error medio del modelo, la media del valor absoluto de la resta de los valores de y reales con los valores
de y estimados. Dió un valor de 0.08096312, siendo este un valor considerablemente bueno. También antes de dar uso al
modelo, se continuó haciendo la validación de supuestos haciendo pruebas a los residuales, normalidad e independencia con
ACF.
3

Figura 3. Pruebas de residuales, Normalidad y ACF.

Se puede observar en la prueba ACF del cuarto gráfico de la figura 3. que los residuos no son independientes del todo pero
eso no nos descarta de que el modelo esté bien ajustado. Los residuos son homocedásticos porque los primeros dos gráficos
no se ve que los residuos siguen una secuencia alguna, y normales ya que siguen una tendencia lineal. También se obtuvo un
valor de p-value = 0.5515, siendo este un poco alto, dando a entender que los residuos no son independientes del todo.

2.3. Uso del modelo


A pesar de que el modelo no superó todas las pruebas y también sabiendo los valores de los βj podemos predecir qué pasa
con la sensibilidad del mecanismo si el grosor del cable tiende a 0, E(y|x = 0).
−β2 1,2699
θ = E(y|x = 0) = β1 (1 − e−e ) = 1,9483(1 − e−e ) (3)

No importa que tan delgado sea el cable, la sensibilidad del mecanismo nunca será cero. Tendrá el valor de 1.892964. A
continuación en la figura 4. se observa los intervalos de confianza del 95 % de los βj :

Figura 4.Intervalos de confianza del 95 % de los βj .

Teniendo en cuenta los intervalos de confianza del β1 y β2 se procedió a estimar los valores mínimos y máximos para la
función θ.

Valor mínimo= 1.022342


Valor máximo= 1.748658
4

3. Proceso de cebollas
3.1. Simulación del estudio
3.1.1. Recolección de datos e identificación de variables
Primero, para construir el modelo de regresión deseado se buscó en la base de datos que brinda RStudio, donde se identificó
a la unidad experimental como la cebolla, a la cual se quiere estudiar los gramos de cebolla que existen por planta. Para esto se
nombró la variable aleatoria Yield (y) la cual se desea estudiar si es influenciada por el factor controlable, número de plantas
por metro cuadrado, cuyo nombre se define como Density(x). Este estudio posee dos formas para ejecutarlo, puesto que cuenta
con una variable diferenciadora de lugar donde se cosecharán las cebollas, una es Virginia y otra es Purnong Landing, por lo
tanto, se harán las comparaciones pertinentes para cada locación.

3.1.2. Construcción del modelo


Para tener un modelo confiable, se graficó los datos a fin de tener una pequeña idea de la ecuación que se podría ajustar con
menor error a nuestros datos. Con el fin de descartar, se verificó si los datos se ajustan a una regresión lineal por medio de la
figura 5 para el caso de Virginia y figura 6 para el caso de Purnong Landing. De esto se puede apreciar que existe la posibilidad
de construir un modelo de regresión lineal simple, sin embargo, la varianza del modelo podría ser alta y la variabilidad
explicada por la variable aleatoria ‘y’ podría tener una baja proporción. Con esta conclusión, se procede a construir un modelo
de regresión no lineal buscando una ecuación que se ajuste lo mayor posible a los datos.

Figura 5. No linealidad del proceso de cosecha en locación Virginia.

Figura 6. No linealidad del proceso de cosecha en locación Purnong Landing.


5

Asimismo, se sospechó que la variable aleatoria ‘yield’, se puede predecir mediante el modelo teórico propuesto:

yield = θ1 ∗ density θ2 + , donde N (0; σ 2 )

Para comprobar la hipótesis, se procedió a utilizar un lenguaje estadístico llamado RStudio para construir el modelo.

3.1.3. Estimación de y
Se procedió a estimar los supuestos con RStudio y se muestran los resultados en la Figura 7 y Figura 8. Se observa
entonces que RStudio utilizó 20 iteraciones para converger en el descubrimiento de los θj con una tolerancia de 3,633 ∗ 10−7 ,
la cual garantiza hasta 6 decimales de exactitud, se observa que θ1 equivale a 2653.78704 y θ2 equivale a -0.81366. Mientras
que en locación Purnong Landing que RStudio utilizó 21 iteraciones para converger en el descubrimiento de los βj con una
tolerancia de 8 − 708 ∗ 10−7 , la cual garantiza hasta 6 decimales de exactitud, se observa que β1 equivale a 2309.80932 y β2
equivale a -0.69665.

Figura 7. Resumen del modelo para locación Virginia.

Figura 8. Resumen del modelo para locación Purnong Landing.

Por medio de estos resultados, se concluye que ambas locaciones, a nivel poblacional, son significativos para realizar
predicciones sobre la cosecha de cebolla. Por lo tanto, se logró construir el modelo de regresión no lineal que se utilizará para
predecir los valores esperados del peso por planta de la cosecha y para comparar el rendimiento de la cosecha entre Virginia
y Purnong Landing. El modelo ajustado se presentará a continuación donde ‘y’ es el peso por planta y ‘x’ es planta por metro
cuadrado, para Virginia y Purnong Landing respectivamente:

ŷ = 2653,78704 ∗ x−0,81366
ŷ = 2309,80932 ∗ x−0,69665
6

3.2. Análisis de resultados


Para verificar qué tan bueno son ambos modelos para predecir se hizo las validaciones de los supuestos planteando dos
hipótesis. Las figuras 9 y 10 se muestran a continuación.

Ho= Los residuales de locación Virginia siguen una distribución normal, con media 0, son homocedásticos y son
independientes.
H1= Los residuales de locación Virginia no siguen una distribución normal, con media distinta de 0, son hetecedásticos y
son dependientes.

Figura 9. Validación de supuestos para locación Virginia.

Ho= Los residuales de locación Purnong Landing siguen una distribución normal, con media 0, son homocedásticos y son
independientes.
H1= Los residuales de locación Purnong Landing no siguen una distribución normal, con media distinta de 0, son
hetecedásticos y son dependientes.

Figura 10. Validación de supuestos para locación Purnong Landing.


7

3.2.1. Distribución normal


Mediante la prueba Shapiro-Wilks, se probó que los residuales siguen una distribución normal. Al observar las gráficas,
se notó que la mayor proporción de residuales se ajustan a la línea recta, además se notó que el valor p es mayor al nivel de
significancia, por lo tanto, los residuales de ambas locaciones siguen una distribución normal.

3.2.2. Media 0
Por medio de Rstudio, se verificó si los residuales del modelo ajustado de Virginia y Purnong Landing tienen una media
poblacional igual a 0. Las figuras 11 y 12 se muestran a continuación.

Figura 11. Validación de media 0 para locación Virginia.

Figura 12. Validación de media 0 para locación Purnong Landing.

Los valores p de locación Virginia y Purnong Landing son 0.9302 y 0.84 respectivamente. Debido a que el valor p es
mayor a el nivel de significancia (0.05), se concluyó que los residuales de ambas locaciones, poblacionalmente, tienen una
media de 0.

3.2.3. Homocedasticidad
Queremos verificar que no exista algún patrón en el gráfico de residuales versus el valor estimado de ‘y’. Haciendo solo
un análisis gráfico, sostenemos que los residuales de ambas locaciones tienen varianza constante.

3.2.4. Independencia
Se realizó la prueba ACF para verificar si los residuales de ambas locaciones dependen unos de otros y se concluyó que
los residuales son independientes. Luego de realizar un análisis gráfico de los residuales, se procedió a no rechazar nuestra
hipótesis nula, lo cual quiere decir que los residuales siguen una distribución normal, tienen media poblacional igual a 0,
tienen varianza constante y son independientes. Y con base a estos resultados se sostiene que los modelos construidos son
significativos para realizar predicciones del peso por planta de la cosecha de cebolla a nivel poblacional.
8

3.2.5. Gráficos de los valores predichos por el modelo vs. los valores tomados de muestra.
En las figuras 13 y 14, de Virginia y Purnong Landing, se observa que el modelo se ajusta a los datos dados en la muestra
con los que nuestro modelo arroja, por lo tanto, se concluye que también es válido para hacer predicciones.

Figura 13. Valores predichos por modelo Purnong Landing vs. los valores tomados de muestra.

Figura 14. Valores predichos por modelo Purnong Landing vs. los valores tomados de muestra.
9

3.3. Uso del modelo


3.3.1. Predicción sobre cosechas futuras
Ahora que se tiene el modelo ajustado, se procede a calcular el valor esperado del peso por planta de una cosecha, dado
unas condiciones nuevas de 25 plantas por metro cuadrado, 50 plantas por metro cuadrado y 100 plantas por metro cuadrado.
En las figuras 15 y 16 se muestran dichas predicciones para locación Virginia y Purnong Landing respectivamente.

Figura 15. Predicciones de cosecha en locación Virginia.

Figura 16. Predicciones de cosecha en locación Purnong Landing.

De las figuras se puede observar que, para un número de 25 plantas por metro cuadrado, se espera que el peso por planta de
la cosecha de cebolla sea de 193.3847 para Virginia y 245.3006 para Purnong Landing. Así mismo para un valor de 50 plantas
por metro cuadrado, el valor esperado del peso por planta es de 110.0238 para Virginia y 151.351 para Purnong Landing. Tam-
bién, para un número de 100 plantas por metro cuadrado, se espera una cosecha con 62.5971 gramos por planta para Virginia y
93.38396 para Purnong Landing.

Estos resultados implican que aumentar la cantidad de plantas por metro cuadrado, causa que la cosecha disminuye su peso por
planta promedio, por ende, se recomienda mantener el número de plantas por metros cuadrados relativamente bajo ajustado
al nivel de producción para así obtener un mejor rendimiento en cuanto a la cosecha de la cebolla. Así mismo se recomienda
que la mejor locación para plantar es Purnong Landing puesto que es la que da una mayor cosecha según las predicciones.

4. Conclusiones
El método de RNL sirve para ajustar un proceso en relación a sus variables cuantitativas. Este método es altamente pro-
bable a que se acomode puesto que cuenta con diferentes herramientas para su ajuste. En cuanto al mecanismo usado para la
prueba destructiva de bloques de aluminio se realizó una relación que tiene el grosor del cable con la sensibilidad, y gracias a
eso pudimos llegar a la conclusión de que no importa si el cable es muy delgado, la sensibilidad nunca va a ser igual a cero.

Por otro lado, luego de concluir que ambos modelos construidos son confiables para realizar predicciones acerca de los
valores futuros de la cosecha de cebolla, y analizar los resultados de las predicciones hechas anteriormente, finalizamos con
que es mucho mejor cultivar cebolla en Purnong Landing, South Australia, debido a que con menor cantidad de plantas por
metro cuadrado, se espera cosechar mucha mas cantidad en comparación con el estado de Virginia.
10

5. Referencias bibliográficas
[1] RStudio Team (2015). RStudio: Integrated Development for R. RStudio, Inc., Boston.

Вам также может понравиться