Академический Документы
Профессиональный Документы
Культура Документы
CASO PRCTICO
Resumen: Los mtodos de regresin no paramtricos son una gran herramienta estadstica para obtener parmetros
biofsicos a partir de medidas realizadas mediante teledeteccin. Pero los resultados obtenidos se pueden ver
afectados por los datos utilizados en la fase de entrenamiento del modelo. Para asegurarse de que los modelos
son robustos, se hace uso de varias tcnicas de validacin cruzada. Estas tcnicas permiten evaluar el modelo con
subconjuntos de la base de datos de campo. Aqu, se evalan dos tipos de validacin cruzada en el desarrollo de
modelos de regresin no paramtricos: hold-out y k-fold. Los mtodos de regresin lineal seleccionados fueron: Linear
Regression (LR) y Partial Least Squares Regression (PLSR). Y los mtodos no lineales: Kernel Ridge Regression (KRR) y
Gaussian Process Regression (GPR). Los resultados de la validacin cruzada mostraron que LR ofrece los resultados
ms inestables, mientras KRR y GPR llevan a resultados ms robustos. Este trabajo recomienda utilizar algoritmos de
regresin no lineales (como KRR o GPR) combinando con la validacin cruzada k-fold con un valor de k igual a 10 para
hacer la estimacin de una manera robusta.
Palabras clave: Hold-Out, k-fold, validacin cruzada, aprendizaje automtico, procesos gausianos, regresin de Kernel
Ridge.
*
Autor para la correspondencia: Lluis.Perez@uv.es
Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) 55
Prez-Planells et al.
Kernel Ridge Regression (KRR) y el Gaussian En cuanto al mtodo GPR, genera el modelo me-
Process Regression (GPR). diante un proceso similar al KRR, pero teniendo
tambin en cuenta la varianza de los datos y la
El mtodo LR es el ms simple de los mtodos
maximizacin del margen de probabilidad en
lineales existentes, basado en la obtencin de
los datos de entrenamiento. En este caso se hace
relaciones lineales entre los pares de datos me-
uso de una funcin kernel Gausiana anistropa
diante ajustes de mnimos cuadrados (Shao, 1993).
escalada:
Consideramos X e y los datos de entrada y salida
siendo matrices nd y nl respectivamente, don- 2
x (i b) - x (jb)
de d es la dimensin de los datos, en nuestro caso K ^ x i, x jh = y exp f - / b = 1 p (5)
B
El otro mtodo utilizado, k-fold, est basado en el c) Obtencin de LAI con validacin cruzada con
mtodo anterior, pero con mayor utilidad cuando mtodo k-fold. En el caso de k-fold, se ha apli-
el conjunto de datos es pequeo (Yang y Huang, cado para los distintos mtodos no paramtricos
2014). En este caso, el total de los datos se divi- generando distintos subconjuntos de datos de
den en k subconjuntos, de manera que aplicamos entrenamiento-test, variando k desde 5hasta 30,
el mtodo hold-out k veces, utilizando cada vez de 5en 5.
un subconjunto distinto para validar el modelo
d) Comparacin entre hold-out y k-fold utilizando
entrenado con los otros k-1 subconjuntos (Jung y
el mismo porcentaje de datos de entrenamien-
Hu, 2015). El error medio obtenido de los k anlisis
to. Para realizar una comparacin ms realista
realizados nos proporciona el error cometido por el
entre los estadsticos obtenidos con ambos
mtodo, permitiendo as evaluar su validez.
mtodos de validacin cruzada, dado que en los
Si comparamos los dos mtodos, el mtodo k-fold experimentos anteriores se han utilizado distintos
tiene la ventaja de que todos los datos son utilizados porcentajes de datos, se ha aplicado el mtodo de
para entrenar y validar, por lo que se obtienen resul- validacin cruzada hold-out con 10repeticiones
tados ms representativos a priori. Mientras que, y los porcentajes de datos correspondientes a
para el mtodo hold-out, se realiza el proceso n ve- los distintos valores de k (implementados en el
ces de manera aleatoria, lo que no garantiza que los mtodo k-fold). En este caso, la comparacin se
casos de entrenamiento y validacin no se repitan. realiza utilizando los mtodos de regresin no
paramtricos no lineales (KRR y GPR).
2.4.Procedimiento experimental e) Aplicacin de los mejores mtodos a una imagen
HyMap. Para las mejores configuraciones de
Para el desarrollo de la parte experimental se han
cada uno de los mtodos de validacin cruzada
realizado cinco experimentos distintos:
obtenidos, se ha aplicado el modelo generado
a) Obtencin de LAI sin validacin cruzada. Antes a una imagen obtenida con el sensor HyMap,
de analizar los valores estadsticos que se obtie- obteniendo de esta las imgenes de LAI y la
nen al aplicar los distintos mtodos de validacin desviacin estndar.
cruzada, es interesante conocer los obtenidos sin
Todas las comparaciones se han hecho haciendo uso
aplicar dichos mtodos, ya que son la referencia
del RMSE como medida estadstica de referencia.
para saber si la aplicacin de los mtodos de
validacin cruzada nos da mejores estadsticos
sobre el modelo generado. En este caso, se ha 3.Resultados
obtenido el valor de RMSE obtenido al generar
los modelos mediante los mtodos de regresin 3.1.Datos sin validacin cruzada
no paramtricos haciendo uso de distintos por-
La Figura1muestra los valores de RMSE obtenidos
centajes de datos para entrenar y validar. Se ha
tras aplicar los distintos mtodos no paramtricos
calculado este trmino haciendo variaciones de
para realizar el entrenamiento con distintos por-
10% en la cantidad de datos de entrenamiento,
centajes de datos y realizando la validacin con el
variando estos desde el 10% hasta el 90%.
subconjunto de datos restante escogido al azar.
b) Obtencin de LAI con validacin cruzada hold-
out. Tomando la alternativa del mtodo hold-out
explicada en la seccin 2.3, se ha aplicado el
mtodo hold-out para distintos nmeros de
repeticiones del proceso, concretamente para re-
peticiones desde 5hasta 30, de 5en 5. Adems,
dado que el porcentaje de datos de entrenamiento
se mantiene constante durante las repeticiones,
se ha repetido todo el proceso para distintos por-
centajes de datos de entrenamiento (50%, 60% y
70%). Figura 1. RMSE obtenido del entrenamiento-test sin hacer
uso de la validacin cruzada.
Observamos que los valores de RMSE de los m- disponibles para entrenar el modelo, y del 30%
todos PLSR, KRR y GPR son considerablemente restante para validar.
menores que los obtenidos con el mtodo LR.
Se puede ver que el valor de RMSE disminuye li-
geramente a medida que aumenta el porcentaje de
datos de entrenamiento utilizado para los mtodos
PLSR, KRR y GPR. Para PLSR y GPR el mejor
valor se obtiene haciendo uso del 80% de datos de
entrenamiento, mientras que para KRR se obtiene
con el 90% de datos de entrenamiento.
Cabe destacar que en este caso los resultados
dependen del subconjunto escogido, y no del to-
tal de los datos, por lo que estadsticamente los
resultados son menos fiables que en los casos pos- Figura 3. RMSE obtenido de la validacin cruzada
teriores, ya que adems, no disponen de un rango hold-out con el 70 % de datos para entrenar los modelos
GPR, KRR, LR y PLSR.
de incertidumbre.
3.2.Validacin cruzada hold-out Para poder visualizar mejor las diferencias entre
los mtodos que tienen valores ms cercanos, se
Se ha aplicado la validacin cruzada hold-out a muestra en la Figura4los mismos resultados que
cada uno de los mtodos no paramtricos emplea- en la Figura3pero, en este caso, tan solo para los
dos, con distinto nmero de repeticiones hold-out modelos GPR, KRR y PLSR.
y haciendo uso del 50%, 60% y 70% de datos de
entrenamiento. Estos resultados se muestran en
la Figura 2, donde podemos analizar el impacto
en trminos de RMSE en el caso del modelo de
regresin GPR.
el GPR. Esta diferencia en el tiempo de ejecu- utilizados en la validacin cruzada con 10repeti-
cin podemos apreciarla en la Tabla1, donde se ciones del modelo para GPR.
muestra el tiempo que ha tardado cada uno de los
Cada uno de los colores mostrados en la
modelos en generarse y validarse segn el nmero
Figura5representa las medidas de un subconjun-
de repeticiones realizadas.
to al que se le aplica el mtodo hold-out. Debido
Tabla 1. Tiempo de ejecucin del mtodo hold-out para los a esto se diferencian 10colores, ya que la grfica
mtodos de regresin GPR y KRR en las distintas repeti- mostrada corresponde al caso de 10repeticio-
ciones realizadas. nes. Observamos que la mayora de medidas se
5 10 15 20 25 30 aproximan bastante a la recta 1:1. Visualmente
GPR (s) 30,13 30,62 27,65 26,31 28,99 24,82 se observa una desviacin similar a lo largo de
KRR (s) 0,49 0,62 0,51 0,43 0,49 0,43 todos los valores y conjuntos de datos.
haciendo uso del 80% de datos para entrenar el 3.5.Aplicacin a una imagen HyMap
modelo, mientras que para el resto de mtodos
Una vez analizados por separado los distintos
nuevamente observamos que el RMSE obtenido
mtodos, se va a realizar la comparacin entre la
difiere muy poco al variar el porcentaje de datos
mejor configuracin de cada uno de ellos. Por ello,
de entrenamiento. Adems, se obtiene que los me-
se va a realizar la comparacin entre el mtodo de
jores mtodos son KRR y GPR, mientras que los
validacin cruzada hold-out con 10repeticiones y
errores obtenidos con PLSR son siempre un poco
el mtodo k-fold con k igual a 10(10-fold). Los
superiores a estos.
modelos obtenidos con estos mtodos han sido
Se observa por tanto que las diferencias son m- aplicados a una imagen HyMap para ver el efecto
nimas para un mismo mtodo no paramtrico de de su implementacin en una imagen.
regresin comparando los dos tipos de validacin
En las figuras 10y 11se muestra la comparacin
cruzada empleados. En cambio, s que se observan
entre estos dos mtodos de validacin cruzada,
notables diferencias entre los distintos mtodos
aplicando el MLRA GPR con la validacion cruza-
de regresin utilizados, especialmente entre los
da 10-fold y hold-out, respectivamente, sobre una
mtodos lineales y los no lineales. Entre los m-
imagen de 500500pxeles tomada con el sensor
todos lineales utilizados, el LR ofrece trminos
HyMap.
de RMSE muy elevados, tal como se ha visto,
por lo que su uso no es recomendable en estas
aplicaciones. Mientras que en el caso del PLSR,
aunque con resultados de RMSE mayores que los
mtodos no lineales, la diferencia con stos lti-
mos es relativamente pequea, por lo que puede
ser un algoritmo a tener en cuenta. Por otra parte,
la comparacin entre los mtodos no lineales KRR
y GPR no muestra diferencias a destacar entre
ambos mtodos, ya que los dos mtodos ofrecen
resultados en el mismo rango, tal como puede
observarse en la Tabla2.
La Tabla2muestra los datos numricos de RMSE
mostrados grficamente en las secciones 3.1 y
3.2para los dos casos de anlisis actuales.
Tabla 2. RMSE obtenido para los mtodos de validacin Figura 10. Mapa de LAI (m2/m2) obtenida aplicando la va-
cruzada: hold-out con 10 repeticiones y 10-Fold. lidacin cruzada 10-fold con el MLRA GPR.
hold-out (m2/m2) 10-fold
MLRA (10 repeticiones) (m2/m2)
GPR 0,48 0,40
KRR 0,48 0,41
LR 2,17 2,54
PLSR 0,63 0,62
Los resultados obtenidos estn en conformidad utilizamos el 70% de los datos para entrenar y el
con los obtenidos en Rivera etal. (2014b), donde 30% restante para validar. En este caso, el mtodo
se consideran los MLRAs KRR (con RMSE de LR ofrece sus mejores valores cuando utilizamos
0,42m2/m2 para la imagen HyMap) y GPR (con el mtodo hold-out repitindolo 10veces.
RMSE de 0,30 m2/m2 para la imagen HyMap)
Para la mejor configuracin de cada uno de los
como los algoritmos de regresin ms robustos,
mtodos, es decir, haciendo uso de k=10para
mientras que los algoritmos no paramtricos linea-
k-fold, y 10 repeticiones y un 70% de los datos
les como el PLSR se consideran sistemticamente
para entrenar en el caso de hold-out, se han apli-
inferiores a estos.
cado los modelos obtenidos a una imagen HyMap,
Este trabajo ha sido realizado con datos del sensor llegando a determinar que en zonas con mayor va-
hiperespectral HyMap, por lo que es de inters lor de LAI, los valores obtenidos con 10-fold son
realizar el anlisis en sensores con otras caracte- mayores que con hold-out, as como la desviacin
rsticas espectrales, as como analizar con mayor estndar es menor, lo que nos lleva a determinar
profundidad la aplicacin de los mtodos no pa- que el mtodo 10-fold ofrece resultados con
ramtricos no lineales, los cuales ofrecen mejores una incertidumbre menor que los obtenidos con
resultados (Rivera etal., 2014b). hold-out.
Por lo tanto, podemos concluir que a pesar del
5.Conclusiones coste computacional que requiere aplicar el m-
todo k-fold, es conveniente su uso ya que ofrece
Conocida la importancia de la obtencin de
mejores resultados, con menor incertidumbre,
parmetros biofsicos para el seguimiento de la
especialmente cuando el conjunto de datos dispo-
fenologa y salud de la vegetacin, en este trabajo
nible no es excesivamente grande.
se ha analizado mediante distintos mtodos de
validacin cruzada el error obtenido al aplicar di-
versos mtodos de regresin no paramtricos. Los Agradecimientos
mtodos estudiados han sido el LR y PLSR como
Este estudio ha contado con financiacin de la
ejemplos lineales y KRR y GPR como no lineales,
Generalitat Valenciana (a travs del contrato
todos ellos desde la toolbox ARTMO.
Gernimo Forteza de Ll. Prez, FPA/2015/081) en
Del anlisis realizado, se ha obtenido que, por una el marco del proyecto CGL2011-30433-C02-02
parte, los mtodos de regresin MLRAs no linea- financiado por el Ministerio de Economa y
les ofrecen resultados con errores menores que los Competitividad.
mtodos lineales. Adems, entre los dos mtodos
no lineales analizados, no existe diferencia en Referencias
cuanto a valores de RMSE, pero la desviacin es-
tndar del RMSE es mayor en el caso del MLRA Arlot, S., Celisse, A. 2010. A Survey of Cross-validation
KRR respecto al GPR, sin embargo, este ltimo Procedures for Model Selection. Statistics Surveys,
necesita ms tiempo para ejecutarse. 4, 40-79. http://dx.doi.org/10.1214/09-SS054
Bazi, Y., Alajlan, N., Melgani, F., AlHichri, H., Yager,
Por otro lado, en referencia a los mtodos de vali- R.R. 2014. Robust estimation of water chlorophyll
dacin cruzada aplicados, el mtodo k-fold ofrece concentrations with gaussian process regression
valores de RMSE para cada uno de los mtodos and IOWA aggregation operators. IEEE Journal of
ligeramente mejores, por lo que realiza la valida- Selected Topics in Applied Earth Observations and
cin con una mayor precisin. Ms concretamente, Remote Sensing, 7(7), 3019-3028. http://dx.doi.
en el caso del LR obtenemos el mejor resultado org/10.1109/JSTARS.2014.2327003
para un valor de k igual a 10, mientras que para los Delegido, J., Verrels, J., Rivera, J.P., Ruiz-Verd, A.,
otros mtodos el valor de k tiene una menor im- Moreno, J. 2015. Brown and green LAI mapping
portancia ya que todos obtienen un error similar. through spectral indices. International Journal of
Si analizamos el mtodo hold-out, aunque los va- Applied Earth Observation and Geoinformation,
35, 350-358. http://dx.doi.org/10.1016/j.
lores de RMSE que obtiene son un poco mayores,
jag.2014.10.001
estos siguen siendo aceptables para los mtodos
no lineales y para el PLSR, especialmente cuando
Guerschman, J.P., Scarth, P.F., McVicar, T.R., Renzullo, Verrelst, J., Rivera, J.P., Leonenko, G., Alonso, L.,
L.J., Malthus, T.J., Stewart, J.B., Rickards, J.E., Moreno, J. 2014a. Optimizing LUT-Based RTM
Trevithick, R. 2015. Assessing the effects of site Inversion for Semiautomatic Mapping of Crop
heterogeneity and soil properties when unmixing Biophysical Parameters from Sentinel-2 and -3
photosynthetic vegetation, non-photosynthetic Data: Role of Cost Functions. IEEE Transactions
vegetation and bare soil fractions from Landsat and on Geoscience and Remote Sensing, 52(1), 257-269.
MODIS data. Remote Sensing of Environment, 161, http://dx.doi.org/10.1109/TGRS.2013.2238242
12-26. http://dx.doi.org/10.1016/j.rse.2015.01.021 Verrelst, J., Alonso, L., Rivera, J.P., Moreno, J.,
Hawkins, D.M., Basak, S.C., Mills, D. 2003. Assessing Camps-Valls, G. 2014b. Gaussian Process
Model Fit by Cross-Validation. Journal of Chemical Retrieval of Chlorophyll Content from Imaging
Information and Computer Sciences, 43(2), 579- Spectroscopy Data. IEEE Journal of Selected
586. http://dx.doi.org/10.1021/ci025626i Topics in Applied Earth Observations and Remote
Sensing, 6(2), 867-874. http://dx.doi.org/10.1109/
Jung, Y., Hu, J. 2015. A k-fold averaging crossvalidation
JSTARS.2012.2222356
procedure. Journal of Nonparametric Statistics,
27(2), 167-179. http://dx.doi.org/10.1080/1048525 Verrelst, J., Rivera, J.P., Moreno, J., Camps-Valls, G.,
2.2015.1010532 2014c. Gaussian Processes uncertainty estimates
in experimental Sentinel-2 LAI and leaf Chlorofyll
Kozak, A., Kozak, R. 2003. Does cross validation content retrieval. ISPRS Journal of Photogrammetry
provide additional information in the evaluation and Remote Sensing, 86, 157-167. http://dx.doi.
of regression models? Canadian Journal of Forest org/10.1016/j.isprsjprs.2013.09.012
Research, 33(6), 976-987. http://dx.doi.org/10.1139/ Verrelst, J., Camps-Valls, G., Muoz-Mar, J., Rivera,
x03-022 J.P., Veroustraete, F., Clevers, J., Moreno, J. 2015.
Lzaro-Gredilla, M., Verrelst, J., Camps-Valls, Optical remote sensing and the retrieval of terrestrial
G. 2014. Retrieval of Biophysical Parameters vegetation bio-geophysical attributes A review.
With Heteroscedastic Gaussian Processes. IEEE ISPRS Journal of Photogrammetry and Remote
Geoscience and Remote Sensing Letters, 11(4), 838- Sensing, 108, 273-290. http://dx.doi.org/10.1016/j.
842. http://dx.doi.org/10.1109/LGRS.2013.2279695 isprsjprs.2015.05.005
Rasmussen, C.E., Williams, C.K.I. 2006. Gaussian
Wittenberghe, S.V., Verrelst, V., Rivera, J.P., Alonso, L.,
Processes for Machine Learning. The MIT Press,
Moreno, J., Samson, R. 2014. Gaussian processes
New York, US.
retrieval of leaf parameters from a multi-species
Rivera, J.P., Verrelst, J., Delegido, J., Veroustraete, F., reflectance, absorbance and fluorescence dataset.
Moreno, J. 2014a. On the Semi-Automatic Retrieval Journal of Photochemistry and Photobiology B:
of Biophysical Parameters Based on Spectral Index Biology, 134, 37-48. http://dx.doi.org/10.1016/j.
Optimization. Remote Sensing, 6, 4927-4951. http:// jphotobiol.2014.03.010
dx.doi.org/10.3390/rs6064927
Yang, Y. y Huang, S., 2014. Suitability of five cross
Rivera, J.P., Verrelst, J., Muoz-Mar, J., Moreno, J.,
validation methods for performance evaluation of
Camps-Valls, G. 2014b. Toward a Semiautomatic
nonlinear mixed-effecs forest models a case study.
Machine Learning Retrieval of Biophysical
Forestry, 87, 654-662. http://dx.doi.org/10.1093/
Parameters. IEEE Journal of Selected Topics in
forestry/cpu025
Applied Earth Observations and Remote Sensing,
7(4), 1249-1259. http://dx.doi.org/10.1109/
JSTARS.2014.2298752
Shao, J. 1993. Linear Model Selection by Cross-
Validation. Journal of the American Statistical
Association, 88(422), 486-494. http://dx.doi.org/
10.1080/01621459.1993.10476299
Verrelst, J., Alonso, L., Camps-Valls, G. 2012. Retrieval
of Vegetation Biophysical Parameters Using
Gaussian Process Techniques. IEEE Transactions on
Geoscience and Remote Sensing, 50(5), 1832-1843.
http://dx.doi.org/10.1109/TGRS.2011.2168962