Академический Документы
Профессиональный Документы
Культура Документы
2. (5 puntos) Función de costo. Supongamos que tenemos un conjunto de datos donde cada
datos, está ponderado por un factor escalar λn tal que λn > 0. φ(xi) representa una
transformación. Esto hace que la suma de la función de costo tenga el siguiente aspecto:
1
UNIVERSIDAD NACIONAL DE INGENIERÍA
FACULTAD DE INGENIERÍA MECÁNICA
Escuela Profesional de Ingeniería Mecatrónica
El dataset
En esta tarea, debe entrenar los modelos de regresión en el set de datos de Beijing PM2.5.
Este conjunto de datos por hora contiene los datos de PM2.5 de la Embajada de EE. UU. en
Beijing. También se incluyen los datos meteorológicos del Aeropuerto Internacional de Pekín.
day: day of data in this row Iws: Cumulated wind speed (m/s)
hour: hour of data in this row Is: Cumulated hours of snow
pm2.5: PM2.5 concentration (ug/m^3) Ir: Cumulated hours of rain
DEWP: Dew Point (℃)
Hipótesis : el cbwd no mejora las predicciones del modelo. Prueba de hipótesis: Que
hacemos para mejorar el error.
2
UNIVERSIDAD NACIONAL DE INGENIERÍA
FACULTAD DE INGENIERÍA MECÁNICA
Escuela Profesional de Ingeniería Mecatrónica
Tip:
El error es algo que queremos minimizar, por lo que un número menor para MSE es mejor. Si
quisiéramos realizar cambios y mejoras el modelo, el MSE debería ser menor si el modelo está
mejorando.
Reference:
a. Liang, X., Zou, T., Guo, B., Li, S., Zhang, H., Zhang, S., Huang, H. and Chen, S. X.
(2015). Assessing Beijing's PM2.5 pollution: severity, weather impact, APEC and
winter heating. Proceedings of the Royal Society A, 471, 20150257. Proceedings of the
Royal Society A, 471, 20150257.
b. http://archive.ics.uci.edu/ml/datasets/Beijing+PM2.5+Data#