Análisis de Métodos de Validación Cruzada

Recibido: 08/10/2015 REVISTA DE TELEDETECCIN
Aceptado: 01/12/2015 Asociacin Espaola de Teledeteccin

(2015) 44, 55-65
ISSN 1133-0953
EISSN 1988-8740
http://dx.doi.org/10.4995/raet.2015.4153
CASO PRCTICO
Anlisis de mtodos de validacin cruzada para la

obtencin robusta de parmetros biofsicos
Prez-Planells, Ll.*1, Delegido, J.2, Rivera-Caicedo, J.P.2, Verrelst, J.2
1
Dpto. Fsica de la Tierra y Termodinmica, Facultad de Fsica, Universitat de Valncia, 46100 Valncia, Spain.
2
Image Processing Laboratory (IPL), Parc Cientfic, Universitat de Valncia, 46980 Paterna, Spain.
Resumen: Los mtodos de regresin no paramtricos son una gran herramienta estadstica para obtener parmetros
biofsicos a partir de medidas realizadas mediante teledeteccin. Pero los resultados obtenidos se pueden ver
afectados por los datos utilizados en la fase de entrenamiento del modelo. Para asegurarse de que los modelos
son robustos, se hace uso de varias tcnicas de validacin cruzada. Estas tcnicas permiten evaluar el modelo con
subconjuntos de la base de datos de campo. Aqu, se evalan dos tipos de validacin cruzada en el desarrollo de
modelos de regresin no paramtricos: hold-out y k-fold. Los mtodos de regresin lineal seleccionados fueron: Linear
Regression (LR) y Partial Least Squares Regression (PLSR). Y los mtodos no lineales: Kernel Ridge Regression (KRR) y
Gaussian Process Regression (GPR). Los resultados de la validacin cruzada mostraron que LR ofrece los resultados
ms inestables, mientras KRR y GPR llevan a resultados ms robustos. Este trabajo recomienda utilizar algoritmos de
regresin no lineales (como KRR o GPR) combinando con la validacin cruzada k-fold con un valor de k igual a 10 para
hacer la estimacin de una manera robusta.
Palabras clave: Hold-Out, k-fold, validacin cruzada, aprendizaje automtico, procesos gausianos, regresin de Kernel
Ridge.
Analysis of cross-validation methods for robust retrieval of biophysical parameters

Abstract: Non-parametric regression methods are powerful statistical methods to retrieve biophysical parameters
from remote sensing measurements. However, their performance can be affected by what has been presented during
the training phase. To ensure robust retrievals, various cross-validation sub-sampling methods are often used, which
allow to evaluate the model with subsets of the field dataset. Here, two types of cross-validation techniques were
analyzed in the development of non-parametric regression models: hold-out and k-fold. Selected non-parametric linear
regression methods were least squares Linear Regression (LR) and Partial Least Squares Regression (PLSR), and
nonlinear methods were Kernel Ridge Regression (KRR) and Gaussian Process Regression (GPR). Cross-validation
results showed that LR performed most unstable, while KRR and GPR led to more robust results. This work recommends
using a nonlinear regression algorithm (e.g., KRR, GPR) in combination with a k-fold cross-validation technique with
k=10 to realize robust retrievals.
Key words: Hold-Out, k-fold, cross-validation, MLRA, Gaussian Process Regression, Kernel Ridge Regression.
*
Autor para la correspondencia: Lluis.Perez@uv.es
Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) 55
Prez-Planells et al.
1.Introduccin Los distintos mtodos de regresin y de validacin

cruzada comentados pueden implementarse direc-
La obtencin de parmetros biofsicos de la ve-
tamente desde ARTMO (Automated Radiative
getacin a partir de las observaciones de la Tierra
Transfer Model Operator), una toolbox con inter-
desde satlite es un tema de gran inters debido a
faz grfica generada en MATLAB (Rivera etal.,
la importancia de estos parmetros, como son el
2014a). ARTMO tiene incorporados distintos
ndice de rea foliar (LAI, por sus siglas en ingls)
mtodos de regresin no paramtricos y, adems,
o la cantidad de clorofila en la hoja (Chl), ya que
permite aplicar a cada uno de los mtodos las dis-
dan informacin directa sobre el estado fenolgi-
tintas maneras de validacin cruzada comentadas,
co y de salud tanto de bosques como de zonas de
permitiendo comparar la validacin de los distin-
cultivo (Verrelst etal., 2014a).
tos mtodos utilizados.
Para obtener los distintos parmetros biofsicos a
El objetivo principal de este trabajo consiste en
partir de imgenes de satlite es necesario aplicar
determinar el mtodo de validacin cruzada que
un modelo fsico o estadstico que relacione las
ofrece un mejor resultado para distintos mtodos
medidas de radiancia o reflectividad obtenidas con
de regresin no paramtricos. Para ello se apli-
el parmetro de estudio (Lzaro-Gredilla etal.,
carn, para cuatro algoritmos no paramtricos
2014; Verrelst etal., 2015). En el presente estudio
distintos, el mtodo de validacin cruzada k-fold
vamos a centrarnos en mtodos estadsticos no
aplicando distintos valores de k, y el mtodo
paramtricos, los cuales relacionan las medidas de
hold-out aplicando distintos porcentajes para los
satlite con el valor de la variable de inters. De
datos de entrenamiento y de validacin.
esta manera se crean modelos que se ajustan para
obtener la mejor estimacin a partir de una serie
de pares de datos de entrenamiento que contie- 2.Metodologa
nen informacin para cada pxel de la medida de
satlite y del valor del parmetro biofsico que se
2.1.Datos utilizados
analiza (Verrelst etal., 2012).
Los datos utilizados para realizar el trabajo perte-
En funcin del modelo de regresin utilizado dis-
necen a la campaa SPARC-2003, que tuvo lugar
tinguimos dos tipos de mtodos no paramtricos:
durante el 12-14 de julio en Barrax, La Mancha,
lineales y no lineales. Dentro del grupo de mtodos
Espaa (coordenadas 303N, 286W, 700m de
no lineales se encuentran los conocidos Machine
altitud). En esta campaa se hicieron medidas
Learning Regression Algorithms (MLRAs). Estos
de diferentes parmetros biofsicos en distintos
constan de distintos algoritmos que permiten la
cultivos, entre ellas 110muestras medidas con el
obtencin de modelos no paramtricos con bas-
Licor LAI (Delegido etal., 2015) que usaremos en
tante rapidez, hecho que, junto a la robustez de los
este estudio. Estas son comparadas con una ima-
modelos que se generan, hace que estos mtodos
gen obtenida a partir de las medidas espectrales
sean de gran inters para su implementacin en
realizadas con el sensor hiperespectral aerotrans-
teledeteccin (Bazi etal., 2014).
portado HyMap (Hyperspectral Mapper), el cual
Con la finalidad de poder analizar los distintos est configurado con 125bandas entre 450nm y
mtodos, se realiza una posterior validacin del 2490nm con un tamao de pxel de 5m (Delegido
modelo obtenido (Guerschman etal., 2015). Para etal., 2015). Esta imagen ha sido posteriormente
ello, existen diversas tcnicas, entre las cuales corregida atmosfrica y geomtricamente (Rivera
destacamos los mtodos de validacin cruzada. etal., 2014a).
La validacin cruzada hace uso de distintos sub-
conjuntos de los datos disponibles para realizar 2.2.Mtodos de regresin no
el entrenamiento del modelo y su posterior vali-
paramtricos
dacin (Arlot y Celisse, 2010). En este estudio,
haremos uso de los mtodos hold-out y k-fold para Entre los mejores mtodos de regresin no para-
validar el modelo. mtricos existentes destacan cuatro: dos lineales,
el Lineal Regression (LR) y Partial Least Squares
Regression (PLSR) y dos no lineales que son el
56 REVISTA DE TELEDETECCIN (2015) 44, 55-65

Anlisis de mtodos de validacin cruzada para la obtencin robusta de parmetros biofsicos
Kernel Ridge Regression (KRR) y el Gaussian En cuanto al mtodo GPR, genera el modelo me-
Process Regression (GPR). diante un proceso similar al KRR, pero teniendo
tambin en cuenta la varianza de los datos y la
El mtodo LR es el ms simple de los mtodos
maximizacin del margen de probabilidad en
lineales existentes, basado en la obtencin de
los datos de entrenamiento. En este caso se hace
relaciones lineales entre los pares de datos me-
uso de una funcin kernel Gausiana anistropa
diante ajustes de mnimos cuadrados (Shao, 1993).
escalada:
Consideramos X e y los datos de entrada y salida
siendo matrices nd y nl respectivamente, don- 2
x (i b) - x (jb)
de d es la dimensin de los datos, en nuestro caso K ^ x i, x jh = y exp f - / b = 1 p (5)
B
las longitudes de onda, n es el nmero de datos 2v 2b

y l el nmero de parmetros biofsicos a estimar.
Con estas matrices se pretende ajustar a un modelo donde es un factor de escalado, B es el nme-
lineal para predecir las variables de salida a partir ro de bandas, y b es un parmetro que controla
de las caractersticas de los datos de entrada: la propagacin de la relacin entre cada una de
las bandas espectrales (Verrelst etal., 2014b,c;
y=Xw(1)
Wittenberghe etal., 2014).
Donde w contiene los coeficientes de los modelos
de regresin, con un tamao ld. 2.3.Validacin cruzada
El mtodo PLSR generaliza y combina caracte-
Existen diversas tcnicas para validar los mtodos
rsticas del anlisis de componentes principales
de regresin, como son la comparacin de los
y regresiones mltiples, de manera que realiza
parmetros obtenidos con los obtenidos mediante
combinaciones lineales pero a partir de las com-
modelos fsicos tericos o con simulaciones, uti-
ponentes principales de los datos (Rivera etal.,
lizar nuevos conjuntos de datos conocidos para
2014a).
comparar con los obtenidos o el uso de tcnicas
En cuanto a los mtodos no lineales utilizados, el de validacin cruzada (Kozak and Kozak, 2003).
mtodo KRR minimiza los residuos del ajuste de Las tcnicas que vamos a analizar en este trabajo
mnimos cuadrados ampliando las dimensiones pertenecen a este ltimo grupo. Concretamente,
de las caractersticas del espacio. Se considera vamos a ver los mtodos hold-out y k-fold.
una aproximacin a la versin kernel del mtodo
El mtodo hold-out es el ms sencillo de los distin-
LR. En este caso los pesos se expresan como una
tos mtodos de validacin cruzada. Este separa el
combinacin lineal de muestras localizadas:
conjunto de datos disponibles en dos subconjuntos,
w = / i = 1 a i { ^ x ih (2)
n
uno utilizado para entrenar el modelo y otro para

realizar el test de validacin (Arlot y Celisse, 2010).
La prediccin para una muestra de test x* se De esta manera, se crea un modelo nicamente con
obtiene como una funcin a partir de los pesos los datos de entrenamiento. Con el modelo creado
=[1,n] (una por muestra), de la siguiente se generan datos de salida que se comparan con
manera: el conjunto de datos reservados para realizar la
E 6 f ^ x *h@ = k <* ,: ^ K + mI h-1 y = k <* ,: a
validacin (que no han sido utilizados en el entre-
(3)
namiento, por lo que no han sido utilizados para
generar el modelo (Hawkins etal., 2003)). Los
donde k <* ,: contiene las similitudes entre los datos
estadsticos obtenidos con los datos del subconjun-
test y los puntos de entrenamiento. Haciendo uso
to de validacin son los que nos dan la validez del
de la siguiente funcin matricial, con componen-
mtodo empleado en trminos de error. Una aplica-
tes [K]ij:
cin alternativa de este mtodo consiste en repetir
el proceso hold-out, tomando distintos conjuntos de
K ^ x i, x j h = exp a - x i - x j 2
^2v 2hk (4) datos de entrenamiento (aleatorios) un determinado
nmero de veces, de manera que se calculan los
siendo un parmetro a ajustar de la funcin. estadsticos de la regresin a partir de la media de
los valores en cada una de las repeticiones.
ASOCIACIN ESPAOLA DE TELEDETECCIN 57

El otro mtodo utilizado, k-fold, est basado en el c) Obtencin de LAI con validacin cruzada con
mtodo anterior, pero con mayor utilidad cuando mtodo k-fold. En el caso de k-fold, se ha apli-
el conjunto de datos es pequeo (Yang y Huang, cado para los distintos mtodos no paramtricos
2014). En este caso, el total de los datos se divi- generando distintos subconjuntos de datos de
den en k subconjuntos, de manera que aplicamos entrenamiento-test, variando k desde 5hasta 30,
el mtodo hold-out k veces, utilizando cada vez de 5en 5.
un subconjunto distinto para validar el modelo
d) Comparacin entre hold-out y k-fold utilizando
entrenado con los otros k-1 subconjuntos (Jung y
el mismo porcentaje de datos de entrenamien-
Hu, 2015). El error medio obtenido de los k anlisis
to. Para realizar una comparacin ms realista
realizados nos proporciona el error cometido por el
entre los estadsticos obtenidos con ambos
mtodo, permitiendo as evaluar su validez.
mtodos de validacin cruzada, dado que en los
Si comparamos los dos mtodos, el mtodo k-fold experimentos anteriores se han utilizado distintos
tiene la ventaja de que todos los datos son utilizados porcentajes de datos, se ha aplicado el mtodo de
para entrenar y validar, por lo que se obtienen resul- validacin cruzada hold-out con 10repeticiones
tados ms representativos a priori. Mientras que, y los porcentajes de datos correspondientes a
para el mtodo hold-out, se realiza el proceso n ve- los distintos valores de k (implementados en el
ces de manera aleatoria, lo que no garantiza que los mtodo k-fold). En este caso, la comparacin se
casos de entrenamiento y validacin no se repitan. realiza utilizando los mtodos de regresin no
paramtricos no lineales (KRR y GPR).
2.4.Procedimiento experimental e) Aplicacin de los mejores mtodos a una imagen
HyMap. Para las mejores configuraciones de
Para el desarrollo de la parte experimental se han
cada uno de los mtodos de validacin cruzada
realizado cinco experimentos distintos:
obtenidos, se ha aplicado el modelo generado
a) Obtencin de LAI sin validacin cruzada. Antes a una imagen obtenida con el sensor HyMap,
de analizar los valores estadsticos que se obtie- obteniendo de esta las imgenes de LAI y la
nen al aplicar los distintos mtodos de validacin desviacin estndar.
cruzada, es interesante conocer los obtenidos sin
Todas las comparaciones se han hecho haciendo uso
aplicar dichos mtodos, ya que son la referencia
del RMSE como medida estadstica de referencia.
para saber si la aplicacin de los mtodos de
validacin cruzada nos da mejores estadsticos
sobre el modelo generado. En este caso, se ha 3.Resultados
obtenido el valor de RMSE obtenido al generar
los modelos mediante los mtodos de regresin 3.1.Datos sin validacin cruzada
no paramtricos haciendo uso de distintos por-
La Figura1muestra los valores de RMSE obtenidos
centajes de datos para entrenar y validar. Se ha
tras aplicar los distintos mtodos no paramtricos
calculado este trmino haciendo variaciones de
para realizar el entrenamiento con distintos por-
10% en la cantidad de datos de entrenamiento,
centajes de datos y realizando la validacin con el
variando estos desde el 10% hasta el 90%.
subconjunto de datos restante escogido al azar.
b) Obtencin de LAI con validacin cruzada hold-
out. Tomando la alternativa del mtodo hold-out
explicada en la seccin 2.3, se ha aplicado el
mtodo hold-out para distintos nmeros de
repeticiones del proceso, concretamente para re-
peticiones desde 5hasta 30, de 5en 5. Adems,
dado que el porcentaje de datos de entrenamiento
se mantiene constante durante las repeticiones,
se ha repetido todo el proceso para distintos por-
centajes de datos de entrenamiento (50%, 60% y
70%). Figura 1. RMSE obtenido del entrenamiento-test sin hacer
uso de la validacin cruzada.

Observamos que los valores de RMSE de los m- disponibles para entrenar el modelo, y del 30%
todos PLSR, KRR y GPR son considerablemente restante para validar.
menores que los obtenidos con el mtodo LR.
Se puede ver que el valor de RMSE disminuye li-
geramente a medida que aumenta el porcentaje de
datos de entrenamiento utilizado para los mtodos
PLSR, KRR y GPR. Para PLSR y GPR el mejor
valor se obtiene haciendo uso del 80% de datos de
entrenamiento, mientras que para KRR se obtiene
con el 90% de datos de entrenamiento.
Cabe destacar que en este caso los resultados
dependen del subconjunto escogido, y no del to-
tal de los datos, por lo que estadsticamente los
resultados son menos fiables que en los casos pos- Figura 3. RMSE obtenido de la validacin cruzada
teriores, ya que adems, no disponen de un rango hold-out con el 70 % de datos para entrenar los modelos
GPR, KRR, LR y PLSR.
de incertidumbre.
3.2.Validacin cruzada hold-out Para poder visualizar mejor las diferencias entre
los mtodos que tienen valores ms cercanos, se
Se ha aplicado la validacin cruzada hold-out a muestra en la Figura4los mismos resultados que
cada uno de los mtodos no paramtricos emplea- en la Figura3pero, en este caso, tan solo para los
dos, con distinto nmero de repeticiones hold-out modelos GPR, KRR y PLSR.
y haciendo uso del 50%, 60% y 70% de datos de
entrenamiento. Estos resultados se muestran en
la Figura 2, donde podemos analizar el impacto
en trminos de RMSE en el caso del modelo de
regresin GPR.
Figura 4. RMSE obtenido de la validacin cruzada hold-

out con el 70 % de datos para entrenar los modelos GPR,
KRR y PLSR.
Figura 2. RMSE obtenido de la validacin cruzada

hold-out y el mtodo de regresin GPR utilizando el 50 %, En las figuras 3 y 4 podemos ver que las dife-
60 % y 70 % de datos para entrenar el modelo. rencias entre los valores de RMSE obtenidas
entre los dos mtodos lineales son considerables,
siendo bastante menor el obtenido con el mtodo
De la Figura2podemos ver que para los modelos
PLSR, que presenta valores cercanos a los obte-
obtenidos haciendo uso del 70% de datos para
nidos con los mtodos no lineales. En cuanto a
entrenar el modelo se obtienen valores de RMSE
los mtodos no lineales, se puede observar que no
menores.
hay diferencias apreciables entre ambos mtodos
En la Figura3se muestran los valores de RMSE en trminos de RMSE. Sin embargo, s hay que
obtenidos haciendo uso del 70% de los datos destacar la diferencia temporal de ejecucin del
modelo, donde el MLRA KRR es ms rpido que

el GPR. Esta diferencia en el tiempo de ejecu- utilizados en la validacin cruzada con 10repeti-
cin podemos apreciarla en la Tabla1, donde se ciones del modelo para GPR.
muestra el tiempo que ha tardado cada uno de los
Cada uno de los colores mostrados en la
modelos en generarse y validarse segn el nmero
Figura5representa las medidas de un subconjun-
de repeticiones realizadas.
to al que se le aplica el mtodo hold-out. Debido
Tabla 1. Tiempo de ejecucin del mtodo hold-out para los a esto se diferencian 10colores, ya que la grfica
mtodos de regresin GPR y KRR en las distintas repeti- mostrada corresponde al caso de 10repeticio-
ciones realizadas. nes. Observamos que la mayora de medidas se
5 10 15 20 25 30 aproximan bastante a la recta 1:1. Visualmente
GPR (s) 30,13 30,62 27,65 26,31 28,99 24,82 se observa una desviacin similar a lo largo de
KRR (s) 0,49 0,62 0,51 0,43 0,49 0,43 todos los valores y conjuntos de datos.
Se observa que a partir de las 10repeticiones del 3.3.Validacin cruzada k-fold

modelo, el valor de RMSE en el mtodo LR se
Se ha realizado la validacin cruzada con el m-
estabiliza a un valor RMSE de 2m2/m2, mientras
todo k-fold para valores de k entre 5y 30en cada
que para el resto de mtodos no tiene una gran in-
uno de los mtodos utilizados. En la Figura6se
fluencia el nmero de repeticiones empleadas, ya
muestran los valores de RMSE obtenidos al
que las variaciones que se obtienen en trminos de
aplicar cada valor de k. Igual que ocurra con el
RMSE son muy pequeas. De la misma manera,
mtodo hold-out, el mtodo LR obtiene valores
las barras de error muestran la desviacin estn-
de RMSE considerablemente superiores a los
dar de las medidas, obteniendo valores cercanos
otros MLRAs. El mtodo lineal PLSR tiene un
a 0,7 m2/m2en el mtodo LR. En cambio, para
error ligeramente superior a los mtodos no li-
los otros tres mtodos las desviaciones obtenidas
neales, aunque con valores aceptables. En cuanto
son muy pequeas comparando con las de LR,
a los mtodos no lineales, nuevamente obtienen
obteniendo valores menores en el caso del mtodo
valores similares, siendo la principal diferencia
lineal PLSR, alrededor de 0,05m2/m2, y prximos
el tiempo de ejecucin del mtodo.
a 0,1m2/m2para los mtodos GPR y KRR, aunque
son menores en el primero de ellos. Para poder visualizar mejor las diferencias entre
los mtodos que tienen valores ms cercanos, se
Adicionalmente, se muestra en la Figura5la
muestra en la Figura7los mismos resultados que
representacin grfica de cada uno de los puntos
en la Figura6pero, en este caso, tan solo para los
modelos GPR, KRR y PLSR.
Observamos en las figuras 6 y 7 observamos
que para LR se obtienen valores de RMSE en un
rango entre 2 y 3 m2/m2, entre 0,56 y 0,62 m2/
Figura 5. Representacin grfica de los valores estimados

de LAI comparados con los medidos al aplicar la valida-
cin cruzada hold-out, haciendo uso de 10 repeticiones con
el mtodo de regresin GPR y el 70 % de datos de entrena- Figura 6. RMSE obtenido de la validacin cruzada k-fold
miento. Los puntos de un mismo color muestran los valores con el 70 % de datos para entrenar los modelos GPR,
de una misma repeticin. KRR, LR y PLSR.

Cada uno de los colores de la Figura8pertenece

a uno de los k subconjuntos distintos utilizados
para validar. Concretamente, debido a que se
muestra la representacin para k igual a 10, se
observan 10colores distintos. Se puede observar
que en este caso la desviacin de los puntos es
menor que el que se apreciaba en la Figura5. Tan
solo un punto azul, localizado aproximadamente
en el punto (3,1), se separa en mayor medida de
la lnea 1:1.
Figura 7. RMSE obtenido de la validacin cruzada k-fold
con el 70 % de datos para entrenar los modelos GPR, KRR
3.4.Comparacin entre mtodos
y PLSR.
hold-out y k-fold utilizando el mismo
porcentaje de datos de entrenamiento
m2para PLSR, entre 0,36y 0,43m2/m2para KRR
y entre 0,38y 0,48m2/m2para GPR. En este caso, Dado que los porcentajes de datos de entrenamien-
para k=10el valor de RMSE para LR empieza a to utilizados en cada uno de los casos anteriores
estabilizarse. Por otra parte, aunque para k=5el no son iguales, se ha realizado un nuevo clculo
valor es menor, hay que tener en cuenta que la en el que se ha aplicado el mtodo hold-out para
dispersin es mucho mayor, por lo que no se con- realizar la validacin con el porcentaje de datos
sidera que sea un buen valor de k para utilizar el de entrenamiento equivalente al utilizado en cada
mtodo LR. En cuanto a los otros tres mtodos, una de las distintas medidas realizadas con el m-
podemos ver en las figuras 6y 7que la diferencia todo k-fold, es decir, el porcentaje equivalente a
que se observa para cada k es mnima. Adems, utilizar un nmero distinto de k. Se ha aplicado el
los k con menor RMSE obtienen un mayor valor mtodo de validacin cruzada hold-out con 10re-
de desviacin estndar, siendo 10y 15los valo- peticiones, obteniendo as la grfica mostrada en
res de k con menor desviacin estndar. la Figura9.
En la Figura8se muestra la representacin gr- Vemos en la Figura 9 que los valores de RMSE
fica de los valores de LAI estimados comparados para LR se encuentran entre 2 y 3 m2/m2, entre
con los medidos aplicando los datos de valida- 0,51y 0,56m2/m2para PLSR, entre 0,35y 0,45m2/
cin cruzada k-fold para k igual a 10. m2para KRR y entre 0,39y 0,42m2/m2para GPR.
Si comparamos los resultados de la Figura9con
los de la Figura6, observamos que para el mtodo
LR, en este caso es para k = 5donde obtenemos el
RMSE ms bajo y con menor dispersin, es decir,
Figura 8. Representacin grfica de los valores estimados

de LAI comparados con los medidos al aplicar la valida-
cin cruzada k-fold, haciendo uso de k = 10 para el mtodo Figura 9. RMSE obtenido tras aplicar el mtodo hold-out
de regresin GPR y el 70 % de datos de entrenamiento. con 10 repeticiones para los porcentajes de datos de entre-
Los puntos de un mismo color muestran los valores de un namiento equivalentes a los utilizados cuando se hace uso
mismo subconjunto. del mtodo k-fold.

haciendo uso del 80% de datos para entrenar el 3.5.Aplicacin a una imagen HyMap
modelo, mientras que para el resto de mtodos
Una vez analizados por separado los distintos
nuevamente observamos que el RMSE obtenido
mtodos, se va a realizar la comparacin entre la
difiere muy poco al variar el porcentaje de datos
mejor configuracin de cada uno de ellos. Por ello,
de entrenamiento. Adems, se obtiene que los me-
se va a realizar la comparacin entre el mtodo de
jores mtodos son KRR y GPR, mientras que los
validacin cruzada hold-out con 10repeticiones y
errores obtenidos con PLSR son siempre un poco
el mtodo k-fold con k igual a 10(10-fold). Los
superiores a estos.
modelos obtenidos con estos mtodos han sido
Se observa por tanto que las diferencias son m- aplicados a una imagen HyMap para ver el efecto
nimas para un mismo mtodo no paramtrico de de su implementacin en una imagen.
regresin comparando los dos tipos de validacin
En las figuras 10y 11se muestra la comparacin
cruzada empleados. En cambio, s que se observan
entre estos dos mtodos de validacin cruzada,
notables diferencias entre los distintos mtodos
aplicando el MLRA GPR con la validacion cruza-
de regresin utilizados, especialmente entre los
da 10-fold y hold-out, respectivamente, sobre una
mtodos lineales y los no lineales. Entre los m-
imagen de 500500pxeles tomada con el sensor
todos lineales utilizados, el LR ofrece trminos
HyMap.
de RMSE muy elevados, tal como se ha visto,
por lo que su uso no es recomendable en estas
aplicaciones. Mientras que en el caso del PLSR,
aunque con resultados de RMSE mayores que los
mtodos no lineales, la diferencia con stos lti-
mos es relativamente pequea, por lo que puede
ser un algoritmo a tener en cuenta. Por otra parte,
la comparacin entre los mtodos no lineales KRR
y GPR no muestra diferencias a destacar entre
ambos mtodos, ya que los dos mtodos ofrecen
resultados en el mismo rango, tal como puede
observarse en la Tabla2.
La Tabla2muestra los datos numricos de RMSE
mostrados grficamente en las secciones 3.1 y
3.2para los dos casos de anlisis actuales.
Tabla 2. RMSE obtenido para los mtodos de validacin Figura 10. Mapa de LAI (m2/m2) obtenida aplicando la va-
cruzada: hold-out con 10 repeticiones y 10-Fold. lidacin cruzada 10-fold con el MLRA GPR.
hold-out (m2/m2) 10-fold
MLRA (10 repeticiones) (m2/m2)
GPR 0,48 0,40
KRR 0,48 0,41
LR 2,17 2,54
PLSR 0,63 0,62
En la Tabla 2 se observa que el mtodo que ob-

tiene un menor valor de RMSE es el GPR con
la validacin cruzada 10-fold, aunque con una
diferencia muy pequea respecto al mtodo KRR.
En el caso de la validacin cruzada hold-out, los
mtodos GPR y KRR tienen el mismo valor. Hay
que destacar que en el caso del LR el valor de
RMSE obtenido con hold-out es menor que con
10-fold, pero es el nico mtodo con el que ocurre Figura 11. Mapa de LAI (m2/m2) obtenida aplicando la va-
este hecho. lidacin cruzada hold-out (10 repeticiones) con el MLRA
GPR.

En las figuras 10 y 11 podemos observar que,

en ciertas zonas con vegetacin (valores de LAI
alrededor de 3m2/m2), el valor representado en la
Figura8es mayor que en la Figura9, por lo que
puede decirse que en estos casos el modelo ge-
nerado con el mtodo 10-fold da como resultado
valores ligeramente mayores que el generado con
el mtodo hold-out.
Las figuras 12 y 13 muestran la desviacin
estndar obtenida al elaborar el mapa de LAI
con los diferentes mtodos (10-fold y hold-out,
respectivamente).
Tal como se puede observar en las figuras 12y 13,
se obtienen imgenes muy similares a simple vista,
lo que implica que las diferencias son pequeas. Figura 14. Desviacin estndar de la imagen obtenida con
10-fold frente a hold-out. Los puntos con tonos ms clidos
indican una mayor densidad de puntos mientras que los to-
nos ms fros indican una menor densidad de puntos.
Para analizar con una mayor claridad que mtodo

ofrece valores de desviacin estndar menores,
representamos en la Figura14la desviacin estn-
dar obtenida mediante el mtodo 10-fold frente a
la obtenida con el mtodo hold-out.
Se observa en la Figura14que existe una mayor
densidad de pxeles con una diferencia sistemtica
en la que la desviacin estndar obtenida mediante
el mtodo 10-fold da generalmente valores meno-
res que los obtenidos con el mtodo hold-out.
Figura 12. Desviacin estndar del mapa de LAI (m2/m2)

obtenida aplicando la validacin cruzada 10-fold con el 4.Discusin
MLRA GPR.
En el presente trabajo se han evaluado distintos
mtodos de regresin MLRAs haciendo uso de
las tcnicas de validacin cruzada existentes en
la toolbox ARTMO. En concreto se han analizado
los mtodos lineales LR y PLSR y los no lineales
KRR y GPR, haciendo uso de un conjunto de
datos de la campaa SPARC-2003 realizada en
Barrax (Espaa). Estos datos contienen medidas
de LAI de diferentes cultivos e informacin de
reflectividad de las 125 bandas espectrales del
sensor hiperespectral HyMap.
La principal diferencia entre los mtodos de
regresin GPR y KRR reside en las propias ca-
ractersticas de los modelos, ya que el mtodo
Figura 13. Desviacin estndar del mapa de LAI (m2/m2) GPR permite conocer las bandas ms relevantes
obtenida aplicando la validacin cruzada hold-out (10 repe- as como los intervalos de confianza de la predic-
ticiones) con el MLRA GPR. cin realizada (Rasmussen and Williams, 2006).

Los resultados obtenidos estn en conformidad utilizamos el 70% de los datos para entrenar y el
con los obtenidos en Rivera etal. (2014b), donde 30% restante para validar. En este caso, el mtodo
se consideran los MLRAs KRR (con RMSE de LR ofrece sus mejores valores cuando utilizamos
0,42m2/m2 para la imagen HyMap) y GPR (con el mtodo hold-out repitindolo 10veces.
RMSE de 0,30 m2/m2 para la imagen HyMap)
Para la mejor configuracin de cada uno de los
como los algoritmos de regresin ms robustos,
mtodos, es decir, haciendo uso de k=10para
mientras que los algoritmos no paramtricos linea-
k-fold, y 10 repeticiones y un 70% de los datos
les como el PLSR se consideran sistemticamente
para entrenar en el caso de hold-out, se han apli-
inferiores a estos.
cado los modelos obtenidos a una imagen HyMap,
Este trabajo ha sido realizado con datos del sensor llegando a determinar que en zonas con mayor va-
hiperespectral HyMap, por lo que es de inters lor de LAI, los valores obtenidos con 10-fold son
realizar el anlisis en sensores con otras caracte- mayores que con hold-out, as como la desviacin
rsticas espectrales, as como analizar con mayor estndar es menor, lo que nos lleva a determinar
profundidad la aplicacin de los mtodos no pa- que el mtodo 10-fold ofrece resultados con
ramtricos no lineales, los cuales ofrecen mejores una incertidumbre menor que los obtenidos con
resultados (Rivera etal., 2014b). hold-out.
Por lo tanto, podemos concluir que a pesar del
5.Conclusiones coste computacional que requiere aplicar el m-
todo k-fold, es conveniente su uso ya que ofrece
Conocida la importancia de la obtencin de
mejores resultados, con menor incertidumbre,
parmetros biofsicos para el seguimiento de la
especialmente cuando el conjunto de datos dispo-
fenologa y salud de la vegetacin, en este trabajo
nible no es excesivamente grande.
se ha analizado mediante distintos mtodos de
validacin cruzada el error obtenido al aplicar di-
versos mtodos de regresin no paramtricos. Los Agradecimientos
mtodos estudiados han sido el LR y PLSR como
Este estudio ha contado con financiacin de la
ejemplos lineales y KRR y GPR como no lineales,
Generalitat Valenciana (a travs del contrato
todos ellos desde la toolbox ARTMO.
Gernimo Forteza de Ll. Prez, FPA/2015/081) en
Del anlisis realizado, se ha obtenido que, por una el marco del proyecto CGL2011-30433-C02-02
parte, los mtodos de regresin MLRAs no linea- financiado por el Ministerio de Economa y
les ofrecen resultados con errores menores que los Competitividad.
mtodos lineales. Adems, entre los dos mtodos
no lineales analizados, no existe diferencia en Referencias
cuanto a valores de RMSE, pero la desviacin es-
tndar del RMSE es mayor en el caso del MLRA Arlot, S., Celisse, A. 2010. A Survey of Cross-validation
KRR respecto al GPR, sin embargo, este ltimo Procedures for Model Selection. Statistics Surveys,
necesita ms tiempo para ejecutarse. 4, 40-79. http://dx.doi.org/10.1214/09-SS054
Bazi, Y., Alajlan, N., Melgani, F., AlHichri, H., Yager,
Por otro lado, en referencia a los mtodos de vali- R.R. 2014. Robust estimation of water chlorophyll
dacin cruzada aplicados, el mtodo k-fold ofrece concentrations with gaussian process regression
valores de RMSE para cada uno de los mtodos and IOWA aggregation operators. IEEE Journal of
ligeramente mejores, por lo que realiza la valida- Selected Topics in Applied Earth Observations and
cin con una mayor precisin. Ms concretamente, Remote Sensing, 7(7), 3019-3028. http://dx.doi.
en el caso del LR obtenemos el mejor resultado org/10.1109/JSTARS.2014.2327003
para un valor de k igual a 10, mientras que para los Delegido, J., Verrels, J., Rivera, J.P., Ruiz-Verd, A.,
otros mtodos el valor de k tiene una menor im- Moreno, J. 2015. Brown and green LAI mapping
portancia ya que todos obtienen un error similar. through spectral indices. International Journal of
Si analizamos el mtodo hold-out, aunque los va- Applied Earth Observation and Geoinformation,
35, 350-358. http://dx.doi.org/10.1016/j.
lores de RMSE que obtiene son un poco mayores,
jag.2014.10.001
estos siguen siendo aceptables para los mtodos
no lineales y para el PLSR, especialmente cuando

Guerschman, J.P., Scarth, P.F., McVicar, T.R., Renzullo, Verrelst, J., Rivera, J.P., Leonenko, G., Alonso, L.,
L.J., Malthus, T.J., Stewart, J.B., Rickards, J.E., Moreno, J. 2014a. Optimizing LUT-Based RTM
Trevithick, R. 2015. Assessing the effects of site Inversion for Semiautomatic Mapping of Crop
heterogeneity and soil properties when unmixing Biophysical Parameters from Sentinel-2 and -3
photosynthetic vegetation, non-photosynthetic Data: Role of Cost Functions. IEEE Transactions
vegetation and bare soil fractions from Landsat and on Geoscience and Remote Sensing, 52(1), 257-269.
MODIS data. Remote Sensing of Environment, 161, http://dx.doi.org/10.1109/TGRS.2013.2238242
12-26. http://dx.doi.org/10.1016/j.rse.2015.01.021 Verrelst, J., Alonso, L., Rivera, J.P., Moreno, J.,
Hawkins, D.M., Basak, S.C., Mills, D. 2003. Assessing Camps-Valls, G. 2014b. Gaussian Process
Model Fit by Cross-Validation. Journal of Chemical Retrieval of Chlorophyll Content from Imaging
Information and Computer Sciences, 43(2), 579- Spectroscopy Data. IEEE Journal of Selected
586. http://dx.doi.org/10.1021/ci025626i Topics in Applied Earth Observations and Remote
Sensing, 6(2), 867-874. http://dx.doi.org/10.1109/
Jung, Y., Hu, J. 2015. A k-fold averaging crossvalidation
JSTARS.2012.2222356
procedure. Journal of Nonparametric Statistics,
27(2), 167-179. http://dx.doi.org/10.1080/1048525 Verrelst, J., Rivera, J.P., Moreno, J., Camps-Valls, G.,
2.2015.1010532 2014c. Gaussian Processes uncertainty estimates
in experimental Sentinel-2 LAI and leaf Chlorofyll
Kozak, A., Kozak, R. 2003. Does cross validation content retrieval. ISPRS Journal of Photogrammetry
provide additional information in the evaluation and Remote Sensing, 86, 157-167. http://dx.doi.
of regression models? Canadian Journal of Forest org/10.1016/j.isprsjprs.2013.09.012
Research, 33(6), 976-987. http://dx.doi.org/10.1139/ Verrelst, J., Camps-Valls, G., Muoz-Mar, J., Rivera,
x03-022 J.P., Veroustraete, F., Clevers, J., Moreno, J. 2015.
Lzaro-Gredilla, M., Verrelst, J., Camps-Valls, Optical remote sensing and the retrieval of terrestrial
G. 2014. Retrieval of Biophysical Parameters vegetation bio-geophysical attributes A review.
With Heteroscedastic Gaussian Processes. IEEE ISPRS Journal of Photogrammetry and Remote
Geoscience and Remote Sensing Letters, 11(4), 838- Sensing, 108, 273-290. http://dx.doi.org/10.1016/j.
842. http://dx.doi.org/10.1109/LGRS.2013.2279695 isprsjprs.2015.05.005
Rasmussen, C.E., Williams, C.K.I. 2006. Gaussian
Wittenberghe, S.V., Verrelst, V., Rivera, J.P., Alonso, L.,
Processes for Machine Learning. The MIT Press,
Moreno, J., Samson, R. 2014. Gaussian processes
New York, US.
retrieval of leaf parameters from a multi-species
Rivera, J.P., Verrelst, J., Delegido, J., Veroustraete, F., reflectance, absorbance and fluorescence dataset.
Moreno, J. 2014a. On the Semi-Automatic Retrieval Journal of Photochemistry and Photobiology B:
of Biophysical Parameters Based on Spectral Index Biology, 134, 37-48. http://dx.doi.org/10.1016/j.
Optimization. Remote Sensing, 6, 4927-4951. http:// jphotobiol.2014.03.010
dx.doi.org/10.3390/rs6064927
Yang, Y. y Huang, S., 2014. Suitability of five cross
Rivera, J.P., Verrelst, J., Muoz-Mar, J., Moreno, J.,
validation methods for performance evaluation of
Camps-Valls, G. 2014b. Toward a Semiautomatic
nonlinear mixed-effecs forest models a case study.
Machine Learning Retrieval of Biophysical
Forestry, 87, 654-662. http://dx.doi.org/10.1093/
Parameters. IEEE Journal of Selected Topics in
forestry/cpu025
Applied Earth Observations and Remote Sensing,
7(4), 1249-1259. http://dx.doi.org/10.1109/
JSTARS.2014.2298752
Shao, J. 1993. Linear Model Selection by Cross-
Validation. Journal of the American Statistical
Association, 88(422), 486-494. http://dx.doi.org/
10.1080/01621459.1993.10476299
Verrelst, J., Alonso, L., Camps-Valls, G. 2012. Retrieval
of Vegetation Biophysical Parameters Using
Gaussian Process Techniques. IEEE Transactions on
Geoscience and Remote Sensing, 50(5), 1832-1843.
http://dx.doi.org/10.1109/TGRS.2011.2168962

Análisis de Métodos de Validación Cruzada

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Análisis de Métodos de Validación Cruzada

Загружено:

Авторское право:

Доступные форматы

Recibido: 08/10/2015 REVISTA DE TELEDETECCIN

Aceptado: 01/12/2015 Asociacin Espaola de Teledeteccin

Anlisis de mtodos de validacin cruzada para la

Analysis of cross-validation methods for robust retrieval of biophysical parameters

1.Introduccin Los distintos mtodos de regresin y de validacin

56 REVISTA DE TELEDETECCIN (2015) 44, 55-65

las longitudes de onda, n es el nmero de datos 2v 2b

ASOCIACIN ESPAOLA DE TELEDETECCIN 57

58 REVISTA DE TELEDETECCIN (2015) 44, 55-65

Figura 4. RMSE obtenido de la validacin cruzada hold-

Figura 2. RMSE obtenido de la validacin cruzada

ASOCIACIN ESPAOLA DE TELEDETECCIN 59

Se observa que a partir de las 10repeticiones del 3.3.Validacin cruzada k-fold

Figura 5. Representacin grfica de los valores estimados

60 REVISTA DE TELEDETECCIN (2015) 44, 55-65

Cada uno de los colores de la Figura8pertenece

Figura 8. Representacin grfica de los valores estimados

ASOCIACIN ESPAOLA DE TELEDETECCIN 61

En la Tabla 2 se observa que el mtodo que ob-

62 REVISTA DE TELEDETECCIN (2015) 44, 55-65

En las figuras 10 y 11 podemos observar que,

Para analizar con una mayor claridad que mtodo

Figura 12. Desviacin estndar del mapa de LAI (m2/m2)

ASOCIACIN ESPAOLA DE TELEDETECCIN 63

64 REVISTA DE TELEDETECCIN (2015) 44, 55-65

ASOCIACIN ESPAOLA DE TELEDETECCIN 65

Вам также может понравиться