Академический Документы
Профессиональный Документы
Культура Документы
Integrantes:
Samira Abidaud Rojas
abidauds@uninorte.edu.co
Carlos Albarracin Buendía
caalbarracin@uninorte.edu.co
Melissa Vergara Vigna
vignam@uninorte.edu.co
Profesor:
Jorge Ivan Velez Valbuena
Fecha de entrega:
16 de Septiembre, 2019
I
Índice
1 Resumen 1
3 Proceso de cebollas 4
3.1 Simulación del estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.1 Recolección de datos e identificación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.2 Construcción del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.3 Estimación de y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2 Análisis de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2.1 Distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.2 Media 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.3 Homocedasticidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.4 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.5 Gráficos de los valores predichos por el modelo vs. los valores tomados de muestra. . . . . . . . . . . 8
3.3 Uso del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3.1 Predicción sobre cosechas futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4 Conclusiones 9
5 Referencias bibliográficas 10
1
1. Resumen
Identificar la relación cuantitativa que tiene una variable de interés y un conjunto de datos permite que se ajuste a un modelo
de regresión avanzada, en este caso un modelo de regresión no lineal RNL. En este trabajo se abordó dos ajustes de regresión no
lineal para dos procesos.
Al momento de producir bloques de aluminio es importante tener en cuenta la calidad en la que se están produciendo, por lo
tanto se le aplica a un grupo de bloques producidos una prueba destructiva que en la cual se da uso de un mecanismo electro-
magnético que tiene la función de detectar fallas debajo de la superficie de cada bloque. La sensibilidad de este mecanismo es
importante para la calidad de los bloques, por lo que se procedió a realizar un ajuste de un modelo de regresión no lineal para así
poder predecir la relación entre la sensibilidad y el espesor del cable.
También sabemos que la cebolla al ser uno de los ingredientes principales de la hamburguesa, es muy importante para los
restaurantes que sirven este plato en cualquier presentación, ya que la hamburguesa ocupa un gran porcentaje en el consumo
de alimentos en la población estadounidense. Por eso mismo, a fines de aumentar la producción diaria de cebolla, planteamos
dos estados que posiblemente se conviertan en los mayores productores de la planta, el estado de Virginia y el estado de
Purnong Landing, South Australia. Determinaremos en cuál de los dos estados es más conveniente producir la verdura, por
medio de la construcción de un modelo de regresión que sea conveniente para predecir la cosecha esperada de cebolla dado
un factor controlable que mencionaremos más adelante.
Donde se pudo obtener los valores de los βj estimados, siendo β1 = 1,9483, β2 = −1,2699, β3 = 14,3631. Por lo tanto,
el modelo ajustado está dado como:
−(−1,2699+14,3631x)
Y = 1,9483(1 − e−e ) (2)
Una forma de saber si el modelo obtenido se ajusta de buena manera es realizando el método gráfico, donde se procede a
graficar los datos reales sobre la función (2).
Podemos mirar el error medio del modelo, la media del valor absoluto de la resta de los valores de y reales con los valores
de y estimados. Dió un valor de 0.08096312, siendo este un valor considerablemente bueno. También antes de dar uso al
modelo, se continuó haciendo la validación de supuestos haciendo pruebas a los residuales, normalidad e independencia con
ACF.
3
Se puede observar en la prueba ACF del cuarto gráfico de la figura 3. que los residuos no son independientes del todo pero
eso no nos descarta de que el modelo esté bien ajustado. Los residuos son homocedásticos porque los primeros dos gráficos
no se ve que los residuos siguen una secuencia alguna, y normales ya que siguen una tendencia lineal. También se obtuvo un
valor de p-value = 0.5515, siendo este un poco alto, dando a entender que los residuos no son independientes del todo.
No importa que tan delgado sea el cable, la sensibilidad del mecanismo nunca será cero. Tendrá el valor de 1.892964. A
continuación en la figura 4. se observa los intervalos de confianza del 95 % de los βj :
Teniendo en cuenta los intervalos de confianza del β1 y β2 se procedió a estimar los valores mínimos y máximos para la
función θ.
3. Proceso de cebollas
3.1. Simulación del estudio
3.1.1. Recolección de datos e identificación de variables
Primero, para construir el modelo de regresión deseado se buscó en la base de datos que brinda RStudio, donde se identificó
a la unidad experimental como la cebolla, a la cual se quiere estudiar los gramos de cebolla que existen por planta. Para esto se
nombró la variable aleatoria Yield (y) la cual se desea estudiar si es influenciada por el factor controlable, número de plantas
por metro cuadrado, cuyo nombre se define como Density(x). Este estudio posee dos formas para ejecutarlo, puesto que cuenta
con una variable diferenciadora de lugar donde se cosecharán las cebollas, una es Virginia y otra es Purnong Landing, por lo
tanto, se harán las comparaciones pertinentes para cada locación.
Asimismo, se sospechó que la variable aleatoria ‘yield’, se puede predecir mediante el modelo teórico propuesto:
Para comprobar la hipótesis, se procedió a utilizar un lenguaje estadístico llamado RStudio para construir el modelo.
3.1.3. Estimación de y
Se procedió a estimar los supuestos con RStudio y se muestran los resultados en la Figura 7 y Figura 8. Se observa
entonces que RStudio utilizó 20 iteraciones para converger en el descubrimiento de los θj con una tolerancia de 3,633 ∗ 10−7 ,
la cual garantiza hasta 6 decimales de exactitud, se observa que θ1 equivale a 2653.78704 y θ2 equivale a -0.81366. Mientras
que en locación Purnong Landing que RStudio utilizó 21 iteraciones para converger en el descubrimiento de los βj con una
tolerancia de 8 − 708 ∗ 10−7 , la cual garantiza hasta 6 decimales de exactitud, se observa que β1 equivale a 2309.80932 y β2
equivale a -0.69665.
Por medio de estos resultados, se concluye que ambas locaciones, a nivel poblacional, son significativos para realizar
predicciones sobre la cosecha de cebolla. Por lo tanto, se logró construir el modelo de regresión no lineal que se utilizará para
predecir los valores esperados del peso por planta de la cosecha y para comparar el rendimiento de la cosecha entre Virginia
y Purnong Landing. El modelo ajustado se presentará a continuación donde ‘y’ es el peso por planta y ‘x’ es planta por metro
cuadrado, para Virginia y Purnong Landing respectivamente:
ŷ = 2653,78704 ∗ x−0,81366
ŷ = 2309,80932 ∗ x−0,69665
6
Ho= Los residuales de locación Virginia siguen una distribución normal, con media 0, son homocedásticos y son
independientes.
H1= Los residuales de locación Virginia no siguen una distribución normal, con media distinta de 0, son hetecedásticos y
son dependientes.
Ho= Los residuales de locación Purnong Landing siguen una distribución normal, con media 0, son homocedásticos y son
independientes.
H1= Los residuales de locación Purnong Landing no siguen una distribución normal, con media distinta de 0, son
hetecedásticos y son dependientes.
3.2.2. Media 0
Por medio de Rstudio, se verificó si los residuales del modelo ajustado de Virginia y Purnong Landing tienen una media
poblacional igual a 0. Las figuras 11 y 12 se muestran a continuación.
Los valores p de locación Virginia y Purnong Landing son 0.9302 y 0.84 respectivamente. Debido a que el valor p es
mayor a el nivel de significancia (0.05), se concluyó que los residuales de ambas locaciones, poblacionalmente, tienen una
media de 0.
3.2.3. Homocedasticidad
Queremos verificar que no exista algún patrón en el gráfico de residuales versus el valor estimado de ‘y’. Haciendo solo
un análisis gráfico, sostenemos que los residuales de ambas locaciones tienen varianza constante.
3.2.4. Independencia
Se realizó la prueba ACF para verificar si los residuales de ambas locaciones dependen unos de otros y se concluyó que
los residuales son independientes. Luego de realizar un análisis gráfico de los residuales, se procedió a no rechazar nuestra
hipótesis nula, lo cual quiere decir que los residuales siguen una distribución normal, tienen media poblacional igual a 0,
tienen varianza constante y son independientes. Y con base a estos resultados se sostiene que los modelos construidos son
significativos para realizar predicciones del peso por planta de la cosecha de cebolla a nivel poblacional.
8
3.2.5. Gráficos de los valores predichos por el modelo vs. los valores tomados de muestra.
En las figuras 13 y 14, de Virginia y Purnong Landing, se observa que el modelo se ajusta a los datos dados en la muestra
con los que nuestro modelo arroja, por lo tanto, se concluye que también es válido para hacer predicciones.
Figura 13. Valores predichos por modelo Purnong Landing vs. los valores tomados de muestra.
Figura 14. Valores predichos por modelo Purnong Landing vs. los valores tomados de muestra.
9
De las figuras se puede observar que, para un número de 25 plantas por metro cuadrado, se espera que el peso por planta de
la cosecha de cebolla sea de 193.3847 para Virginia y 245.3006 para Purnong Landing. Así mismo para un valor de 50 plantas
por metro cuadrado, el valor esperado del peso por planta es de 110.0238 para Virginia y 151.351 para Purnong Landing. Tam-
bién, para un número de 100 plantas por metro cuadrado, se espera una cosecha con 62.5971 gramos por planta para Virginia y
93.38396 para Purnong Landing.
Estos resultados implican que aumentar la cantidad de plantas por metro cuadrado, causa que la cosecha disminuye su peso por
planta promedio, por ende, se recomienda mantener el número de plantas por metros cuadrados relativamente bajo ajustado
al nivel de producción para así obtener un mejor rendimiento en cuanto a la cosecha de la cebolla. Así mismo se recomienda
que la mejor locación para plantar es Purnong Landing puesto que es la que da una mayor cosecha según las predicciones.
4. Conclusiones
El método de RNL sirve para ajustar un proceso en relación a sus variables cuantitativas. Este método es altamente pro-
bable a que se acomode puesto que cuenta con diferentes herramientas para su ajuste. En cuanto al mecanismo usado para la
prueba destructiva de bloques de aluminio se realizó una relación que tiene el grosor del cable con la sensibilidad, y gracias a
eso pudimos llegar a la conclusión de que no importa si el cable es muy delgado, la sensibilidad nunca va a ser igual a cero.
Por otro lado, luego de concluir que ambos modelos construidos son confiables para realizar predicciones acerca de los
valores futuros de la cosecha de cebolla, y analizar los resultados de las predicciones hechas anteriormente, finalizamos con
que es mucho mejor cultivar cebolla en Purnong Landing, South Australia, debido a que con menor cantidad de plantas por
metro cuadrado, se espera cosechar mucha mas cantidad en comparación con el estado de Virginia.
10
5. Referencias bibliográficas
[1] RStudio Team (2015). RStudio: Integrated Development for R. RStudio, Inc., Boston.