Академический Документы
Профессиональный Документы
Культура Документы
(
(
(
(
(
=
(
(
(
(
(
n p n p p
n
n
p
C
C
C
X X X
X X X
X X X
y
y
y
.
....
. .. . .
....
....
.
.
1
1
, , 2 , 1
1 , 1 , 2 1 , 1
1 , 1 , 2 1 , 1
2
1
3-4
En forma abreviada XC Y = , donde Y es el vector 1 p de observaciones de la variable
dependiente, X es la matriz n p formada por las p observaciones de cada una de las n
variables independientes y C es el vector 1 n de los parmetros de ajuste desconocidos. El
vector de parmetros C puede ser estimado minimizando
i e
2
, donde
j i
p
j
j i i i i
X C y y y e
,
1
=
= = , y
j
C
es el valor estimado de
j
C usando mnimos cuadrados.
Finalmente, luego de derivar e igualar a cero, se obtiene la siguiente expresin para estimar
C :
( ) Y X X X C
T T
1
= 3-5
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-4
El modelo de regresin lineal asume que los errores
i
e son independientes y estn
idnticamente distribuidos, adems se requiere que las variables
ij
X sean independientes (no
estn correlacionadas) y que la observaciones de variable dependiente
i
y estn normalmente
distribuidas.
Pese a sus hiptesis, el modelo de regresin lineal mltiple es fcilmente programable y puede
ser ampliamente utilizado en problemas relacionados con el aprovechamiento de los recursos
hidrulicos. Algunos trabajos como el de Carvajal et al. (1998), Poveda et al. (2002), Smith
et al. (2004), Rojo y Carvajal (2010) han usado la regresin lineal mltiple para la prediccin
de caudales medios mensuales, ya sea utilizando una regresin general (que ajuste toda la
muestra) o mediante una regresin peridica (que ajusta una regresin por mes). Como
antecedente, en el trabajo de Poveda et al. (2002) los modelos PREBEO (RLM + ONDITAS)
y RLM fueron en su orden los de mayor habilidad de pronstico puesto que exhiben los
menores errores de prediccin, para todos los ros y todas las ventanas de pronstico.
3.2.2 Modelos de series de tiempo
Los modelos de series temporales buscan representar el hecho de que los datos tomados a
travs del tiempo pueden tener una estructura interna (como la persistencia, la tendencia o la
variacin estacional) que deben tenerse en cuenta a la hora de elaborar un pronstico, dado
que, en la modelacin de la trayectoria dinmica de una variable, se pueden mejorar las
previsiones mediante la proyeccin de dicha estructura interna. La primera aproximacin a los
modelos estocsticos son los denominados procesos autorregresivos construidos sobre
variables estandarizadas
i
z de la serie de los
i
y . Es decir:
k
k k i
k i
y
z
=
,
,
3-6
Donde
k
y
k
corresponden a la media y la varianza del mes k al que pertenece la i -sima
observacin de los
k i
y
,
.
Los modelos auto-regresivos de orden p AR(p) pueden describirse como aquellos en los que
una variable estandarizada
t
z en el tiempo t se explica, al menos en parte, en funcin de los
valores pasados de esa misma variable, as por ejemplo:
t p t p t t t
z z z z + + + + =
...
2 2 1 1
3-7
Donde:
t
z : Es el valor de la variable estandarizada en el instante t , y
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-5
t
: Ruido independiente de
k t
z
para todo 1 k .
Los parmetros de la ecuacin,
i
, presentes en la expresin 3-7 se estiman mediante las
ecuaciones de Yule-Walker, que en forma matricial se expresan como:
(
(
(
(
(
(
(
+ + + =
+ + + =
+ + + =
+ + + =
p p p p
p
p
p
...
..... .......... .......... .......... ..........
...
...
...
2 1
3 3 2 3 1 3
2 2 2 1 2
1 1 2 1 1
3-8
Donde los
k
corresponden a los coeficientes de auto-correlacin de orden k .
Los modelos ARMA son modelos estocsticos que combinan los modelos autorregresivos
(AR) con los modelos de media mvil (MA), cuya forma general est dada por:
q t q t t p t
z
+ + + = ... ... z z
1 1 p 1 - t 1 t
3-9
Donde los parmetros
i
,
q
y
i
tienen el mismo significado que para los modelos AR(p) y
MA(q).
Una manera eficiente de garantizar la estacionalidad de una serie consiste en diferenciarla la
cantidad d de veces que sea necesaria, En general, la diferenciacin de orden d tiene la
forma:
d t t t
z z a
= 3-10
Los modelos autorregresivos integrados de media mvil (ARIMA), equivalen a aplicar un
modelo ARMA sobre la serie de caudales no estacionaria diferenciada y su representacin es
como se muestra a continuacin:
t t
d
a B z B ) ( ) ( = 3-11
Donde
t
z corresponde a la serie estandarizada, ) (B son los coeficientes de la parte auto-
regresiva, ) (B los coeficientes de media mvil del modelo y
d
el diferenciador de orden
d .
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-6
Quizs los modelos autorregresivos fueron los primeros en ser usados en la prediccin de
caudales medios mensuales en Colombia, trabajos como el de Mesa et al (1995), Poveda et al
(2002), Smith et al (2004), muestran que los modelos autoregresivos lineales han sido poco
eficientes pese a su facilidad en la programacin; sin embargo el desempeo de dichos
modelos mejora contundentemente cuando se estima el ruido mediante una tcnica bilineal
(Cadavid, 2009) o cuando se combinan con una tcnica espectral (Carvajal, 1994; Carmona
2010).
3.2.3 Redes Neuronales Artificiales RNA
Una tpica red neuronal consiste en una estructura conformada por un nmero de elementos
(nodos) y las lneas de conexiones entre stos. Los nodos correspondes a los elementos
computacionales de la red y usualmente son conocidos como neuronas pues su diseo se basa
en el funcionamiento de las neuronas que se encuentran en el cerebro humano. Las lneas de
conexin transfieren informacin entre un par de neuronas y sobre cada conexin se designa
un valor denominado peso de la conexin.
Una red neuronal usualmente posee una matriz de datos de entrada, que constituyen la
denominada capa de entrada, las neuronas en la red acumulan los datos de entrada
multiplicados por los pesos en las conexiones y mediante frmulas de transformacin
matemtica, conocidas como funciones de transferencia, convierte dichas acumulaciones en
las salidas de cada neurona. Las salidas de cada neurona generalmente son distribuidas (pero
no divididas) segn el numero de conexiones a fin de proveer de entradas a otras neuronas que
se encuentran en una nueva capa denominada capa oculta. Por ltimo las salidas de la capa
oculta son trasformadas y llevadas por medio de conexiones a la neurona de salida.
A manera de ejemplo en la Figura 3-1 se propone una topologa de red neuronal para predecir
una variable dependiente y , dadas las variables explicativas ( )
3 2 1
, , X X X , la red sugerida
posee seis neuronas esquematizadas por los crculos, cada par de neuronas se conecta con una
flecha o conexin sobre la cual existe un peso
n m
w
,
siendo m la neurona de partida de la
conexin y n la neurona de llegada. El nmero de neuronas de la capa de entrada es de tres
(neuronas 1, 2 y 3), el nmero de neuronas en la capa oculta es de dos (neuronas 4 y 5) y
existe una sola neurona de salida (neurona 6). Los valores que ingresan a la red (inputs)
corresponden a la variables independientes ( )
3 2 1
, , X X X y la salida de la red corresponde al
valor estimado de y .
Existen varios tipos de redes neuronales pero el utilizado en el presente trabajo se denomina:
Perceptrn Multicapa de Retropropagacin , una red especialmente aplicada en la prediccin
hidrolgica (Maier & Dandy, 2000). El perceptrn multicapa es un tipo de red neuronal con
una capa de entrada, una capa de salida y varias capas ocultas, para ste caso solo
consideramos una capa oculta. La capa de entrada tendr un nmero de neuronas igual al
nmero de entradas externas a la red. Las entradas a cada neurona son trasformadas utilizando
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-7
una funcin de transferencia () g . Por ejemplo, en la capa de entrada, las variables externas
i
X son trasformadas por una funcin que las deja idnticas.
Figura 3-1 Topologa de red neuronal para pronstico de Caudales
i i
X X g = ) ( 3-12
Las neuronas de la capa oculta suman las salidas trasformadas de las neuronas en la capa de
entrada multiplicadas por el peso de las conexiones, y transforman dicha sumatoria mediante
una funcin de trasferencia de la forma:
|
\
|
=
=
n
i
i m i m m out
X w g y
1
, , ,
3-13
Donde
m out
y
,
corresponde a la salida de la neurona m,
i m
X
,
es la entrada a la neurona m
proveniente de la neurona i y () g es la funcin de transferencia que en este caso corresponde
a la sigmoidea bipolar dada por la ecuacin:
1
) 1 (
2
) (
2
+
=
x
e
x g 3-14
Los pesos de la red neuronal deben ser ajustados mediante un entrenamiento que consiste en
comparar las salidas de la red con datos histricos de un perodo previamente elegido, el
algoritmo de ajuste de los pesos se conoce como algoritmo de retropropagacin , el lector
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-8
podr consultarlo en el trabajo de Hammerstrom (1993). La ecuacin del perceptrn multicapa
para la prediccin de una variable y dependiente de los datos ( )
n
X X X ,....., ,
2 1
:
=
=
|
|
\
|
=
H
j
m
i
i j i j i
l
X w g w y
1
1
0
, ,
3-15
Siendo H el nmero de neuronas en la capa oculta, () g la funcin de transferencia y
j i
w
,
el
peso de la conexin entre la neurona i de la capa j .
La primera aproximacin de prediccin de caudales medios mensuales utilizando las redes
neuronales fue presentada por Carvajal (1994), en adelante sera un mtodo obligado para la
prediccin de caudales en trabajos posteriores. En el trabajo de Poveda et al (2002) la RNA
mostraba los resultados mas deficientes seguido por los mtodos Auto regresivos, adems una
observacin preliminar de los resultados permite afirmar que el RMSE (raz del error
cuadrtico medio) no es proporcional con el tamao de la ventana ( se esperara que a menor
tamao de ventana menor RMS), y si bien el modelo puede ser competitivo para ventanas de
12 meses a horizontes de pronstico inferiores su eficiencia puede ser equiparada a la de los
modelos auto-regresivos para los ros Alicachin, San Carlos, Salvajina, Betania, Guavio y
Nare (Velasquez, 2009).
3.2.4 Polinomios Adaptivos de regresin Multivariada (MARS)
El modelo MARS (acrnimo de Multivariate adaptive regression splines) es una forma de
anlisis de regresin introducida por Jerome Friedman en 1991, una tcnica no paramtrica
caracterizada por el ajuste de una funcin global basado en varias funciones paramtricas
simples, generalmente polinomios de bajo orden, definidas sobre una subregin del dominio
mediante ajuste por tramos. El problema de este tipo de modelamiento se presenta en las
discontinuidades y cambios bruscos dependientes en los lmites de las funciones, que debe ser
controlado limitando el nmero de subregiones y estableciendo derivadas continuas en los
lmites de cada subregin.
El mtodo MARS es una generalizacin del particionamiento recursivo, el cual resulta
adecuado para la expansin de funciones de altas dimensiones y que consiste en la
aproximacin de una funcin diferente en cada subregin al ser dividida ptimamente
(minimizando la falta de ajuste) en dos regiones: regin izquierda y regin derecha. Se
optimiza la particin en todas las variables ) (n y en todos los puntos t usando un buen criterio
de ajuste. Las subregiones son entonces recombinadas hasta que se encuentra un ptimo que
tenga el mnimo de subregiones posibles.
La funcin de aproximacin del modelo MARS puede ser de la forma (Rendon, 1997):
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-9
) ( ) (
1
X B a X f
m
M
m
m
=
= 3-16
Donde M es el nmero de subregiones,
m
a son los coeficientes de la funcin y ) (X B
m
es una
funcin bsica o base, dada por:
( ) [ ]
+ =
=
M
K
k
KM KM m
t m k X S H X B
1
) , ( ) ( 3-17
Donde H es una funcin de paso que va desde 1 = k hasta
M
k , el nmero de divisiones
resultantes en la funcin bsica,
KM
S es igual a 1 segn sea la divisin derecha izquierda
respectivamente,
KM
t es el nudo o particin de la variable y X es la variable predictora. El
signo ( + ) como subndice de dicha expresin significa que slo se toma como resultado
cuando el argumento de la funcin es positivo, de lo contrario se hace igual a cero. Esta
metodologa de aproximacin de funciones bsicas o bases se conoce entonces con el nombre
de particionamiento recursivo de regresin revisada (Rendn, 1997).
MARS, al igual que las dems herramientas de ajuste usadas en prediccin, trata de encontrar
la mejor relacin de dependencia entre la variable por predecir y las variables de apoyo o
variables predictoras. Es un mtodo que ajusta el mejor modelo de prediccin mediante una
bsqueda de minimizacin de errores de ajuste de los datos, y utilizando criterios de
penalizacin por un mayor nmero de variables predictoras. En general, si y es la variable por
predecir y X es el vector de variables predictoras (
n
X X X ,..., ,
2 1
), se trata de ajustar una
funcin del tipo 3-16. El ajuste por tramos posibilita la inclusin o la exclusin de una
determinada variable en el modelo de ajuste, dentro de un sub-dominio determinado. Sin
embargo, en la modelacin no paramtrica estar siempre presente la competencia entre la
suavidad de la funcin ajustada y la flexibilidad del ajuste. Adems, la modelacin no
paramtrica presenta dificultades en la aproximacin de funciones en dominios de alta
dimensin, asociados con la gran cantidad de datos necesarios en el dominio, cuando hay un
nmero considerable de variables predictoras.
Las estrategias para mejorar la aproximacin de funciones en espacios de alta
dimensionalidad, estn basadas en la computacin adaptiva (de la minera de datos), la cual
ajusta dinmicamente los polinomios teniendo en cuenta el comportamiento de la funcin por
aproximar. Una de las bases de la computacin adaptiva es el particionamiento recursivo, cuyo
objetivo es usar los datos para estimar simultneamente un buen conjunto de subregiones y
parmetros asociados con cada una de las funciones de cada subregin. La particin recursiva
tiene la capacidad de detectar la baja dimensionalidad de las funciones de ajuste. Una funcin
puede depender fuertemente de un gran nmero de parmetros de manera global, pero
localmente la dependencia es fuerte slo en unas pocas variables. El problema de sta
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-10
herramienta es que la funcin aproximada es discontinua en los lmites de las subregiones del
dominio. Otra dificultad es que cierto tipo de funciones simples son difciles de aproximar.
Las dificultades aparecen cuando las interacciones dominantes involucran una pequea
fraccin del nmero total de variables. En Friedman (1991) se detallan los aspectos
relacionados con la modelacin no paramtrica y la computacin adaptiva. All se presenta
completamente el algoritmo de ajuste de MARS.
En general, MARS intenta superar las limitaciones de la modelacin no paramtrica y el
particionamiento recursivo, generalizando los procedimientos. Por ejemplo, garantizando
modelos continuos y derivadas continuas. El modelo de ajuste de MARS se puede escribir de
la forma:
( ) ( ) ( ) ( )
= = =
+ + + + =
3 2 1
0
........ , , ,
m m m
k
k j i ijk
k
j i ij
k
i i
X X X f X X f X f a X f 3-18
Donde
0
a es una constante, el segundo trmino representa la suma de todas las funciones
bsicas que involucran slo una variable, el tercer trmino representa la suma de todas las
funciones bsicas que involucran dos variables y as sucesivamente. Si ( ) ( ) { }
m
k
m k v m V
1
, = es
el conjunto de variables asociadas con la m-sima funcin base
m
B , cada funcin en el
segundo trmino de la ecuacin se puede expresar segn la ecuacin 3-17. Cada funcin
bivariada en el tercer trmino de la ecuacin puede ser expresada como:
( ) ( )
( )
=
=
m V i
m
k
j i m m j i ij
X X B a X X f
2
, ,
3-19
Que es la suma de todas las funciones bsicas bivariadas que involucran un par determinado
de variables
i
X y
j
X . Si a la expresin se le suman los correspondientes aportes univariados,
expresin de cada variable que conforma un par, se obtiene:
( ) ( ) ( ) ( )
j j i i j i ij j i ij
X f X f X X f X X f + + = , ,
*
3-20
Que representa la contribucin bivariada al modelo global de las variables
i
X y
j
X .
Para la seleccin del modelo final se tiene en cuenta el criterio de falta de ajuste, (Lack Of
Fit), definido como el mximo nmero de funciones bsicas
max
M . Adicionalmente, el criterio
de falta de ajuste usado depende de la funcin de prdida delta especificada como el error
integral o el error esperado. Una funcin para dicho error est definida como:
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-11
( ) [ ]
=
(
= =
N
i
i M i
M
N
M C
X f y
N
M GCV f LOF
1
2
2
) (
1
1
) ( )
( 3-21
El criterio ) (M GCV es el promedio de los residuos al cuadrado afectado por un factor de
penalizacin, el cual se presenta en el denominador. La penalizacin se relaciona por el
nmero de parmetros por ajustar al modelo, en este caso por la cantidad de funciones bsicas,
y que es una funcin de costo dada por la siguiente expresin.
1 ) ) ( ( ) (
1
+ =
T T
B B B B traza M C 3-22
Donde B es la matriz de datos de las M funciones bsicas ( ) (
j i ij
X B B = ). La reduccin en
la desviacin es directamente reflejada en reduccin del error promedio esperado al cuadrado
(numerador). El denominador depende del incremento en varianza debido al nmero adicional
de parmetros.
Friedman y Silverman (1989) sugieren usar un incremento en la funcin de costo dM para
reflejar los parmetros adicionales (Funciones Bsicas), que con los coeficientes de expansin
( ) (M C ) se ajustan a los datos. Esta funcin de costo puede ser expresada como:
dM M C M C + = ) ( ) ( ' 3-23
Donde M es el nmero de funciones bsicas no constantes en el modelo MARS y d
representa el costo para cada una de las funciones bsicas de optimizacin, el cual es un
parmetro del procedimiento. Friedman y Silverman (1989) sugieren 2 = d , pero tambin
puede ser hallado por tcnicas de remuestreo.
Los conceptos aqu presentados corresponden a una seleccin de los presentados por Friedman
en 1991 y pueden ser ampliamente consultados en el trabajo de Rendn (1997). Al respecto de
la aplicacin de dicho mtodo para la prediccin de caudales medios mensuales en Colombia
MARS ha sido un modelo obligado y de bastante trascendencia dada su habilidad para
modelar series no estacionarias de manera no paramtrica, al respecto de la aplicacin del
mtodo, Rendn (1997,2001) utiliz el MARS para valorar los beneficios de la prediccin
Hidrolgica en el sector elctrico Colombiano, considerando la variabilidad climtica. Poveda
et al (2001, 2004) MARS demostr ser un modelo muy eficiente.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-12
3.3 ESTRATEGIA DE VALIDACIN E INTERVALOS DE CONFIANZA
3.3.1 Validacin de los modelos de pronstico
El objeto del anlisis de regresin es la construccin de una funcin ( )
n
X X X f ,....., ,
2 1
que
sea una aproximacin razonable de ( )
n
X X X f ,....., ,
2 1
en el dominio D de inters. La nocin
de razonable depende del propsito para el cual la funcin aproximada f
=
D
dx x f x f x w I ,
) ( 3-24
O el error esperado:
( ) ( ) [ ]
=
=
N
i
i i i
x f x f x w
N
E
1
,
) (
1
3-25
Donde es el operador distancia y w es una funcin de ponderacin. El error integral 3-24
caracteriza la aproximacin sobre todo el dominio de inters, mientras la discretizacin 3-25
refleja solo la precisin en relacin al conjunto de puntos ( )
n
X X X ,....., ,
2 1
que componen la
muestra de informacin. Cabe recordar que el inters de los modelos de pronstico es estimar
valores futuros que por defecto no se encuentran en la historia siendo el error 3-24 mucho ms
importante. Se vuelve entonces necesario definir una estrategia de validacin que permita
confrontar la habilidad de pronstico de f
=
=
T
t
t
e SSE
1
2
3-26
Error cuadrtico medio o varianza del predictor:
T
SSE
MSE = 3-27
La raz del error cuadrtico medio:
MSE RMSE = 3-28
Si y corresponde al valor medio de la serie de datos entonces, el error cuadrtico medio
expresado como porcentaje del valor medio de los datos ser:
100 % =
y
RMSE
RMSE 3-29
Y el promedio del error porcentual absoluto esta dado por:
=
=
T
i
t
p
T
MAPE
1
1
3-30
Otro mtodo utilizado para estimar la bondad de ajuste de un modelo es el coeficiente de
determinacin, o de correlacin de Pearson, el cual consiste en establecer la correlacin que
existe entre los valores predichos y los valores histricos durante el periodo de validacin; As
por ejemplo los resultados del pronstico de caudales en validacin retroactiva usando el
modelo de regresin lineal mltiple para el ro Guadalupe con ventana de un mes, durante el
periodo comprendido entre enero de 2000 y diciembre de 2007 se presentan en la Figura 3-4,
Se tiene una correlacin de Pearson de 0.67 y un error medio cuadrtico medio del 17.95%, y
un promedio en el error porcentual de 16.1%.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-15
Figura 3-4 Prediccin de los caudales medios mensuales del ro Guadalupe usando RLM para una
ventana de un mes, perodo 2000-2007.
3.3.2 Pronsticos probabilsticos e intervalos de confianza
La indicacin de los diversos valores que puede adoptar la variable y y su probabilidad de
ocurrencia son el objeto de las predicciones probabilsticas, una prediccin probabilstica
aade valor a la prediccin al incorporar informacin de la confianza que el sujeto que elabora
la prediccin le otorga al pronstico obtenido, sta confianza debera recoger las fuentes de
incertidumbre de los sistemas de prediccin y es expresada en trminos de intervalos y/o
percentiles. Una prediccin probabilstica se define como un sesgo en la distribucin de
probabilidad de la variable de inters con respecto a su distribucin histrica, as pues, la
calidad los pronsticos puede ser medida de forma objetiva mediante la utilizacin de los
siguientes criterios:
Fidelidad: mide el grado de cumplimiento de los intervalos de confianza (la capacidad de
saber distinguir a priori entre situaciones inciertas y ciertas).
Precisin: mide la desviacin entre los valores predichos y los realmente obtenidos.
En la Figura 3-5 se muestra un esquema de las predicciones probabilsticas para el caudal
medio de enero de 2006 en el ro Guadalupe utilizando la historia y otros dos modelos. El
modelo 1 representa un sesgo con respecto a la distribucin histrica, sin embargo su rango de
variabilidad es muy alto con respecto al modelo 2, por ello se considera que el modelo 2 es el
ms preciso. El caudal histrico para dicho mes fue de 23 m3/s y se encuentra dentro de los
intervalos de confianza de los modelos 1-2 por tanto ambos modelos cumplen con el criterio
de confiabilidad.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-16
Figura 3-5 Esquema de pronstico probabilstico para el ro Guadalupe en enero de 2006.
Existen diferentes formas para convertir los pronsticos arrojados por los modelos (valores
determinsticos) en pronsticos probabilsticas, pero la manera mas fiable consiste en utilizar
la varianza de los errores en el perodo de validacin para ajustar una distribucin de
probabilidades que permitan la definicin de los intervalos de confianza. Si se supone que los
residuos de validacin poseen media cero y distribucin Gaussiana, las probabilidades podrn
ser integradas usando la distribucin t de Student tomando como media de la distribucin la
esperanza condicional arrojada por un modelo de regresin (el valor predicho) y la varianza
igual a la varianza de los residuos del modelo de regresin para el mes especifico de la
prediccin (Simon & Baddour, 2007).
3.4 TCNICAS PARA MEJORAR LOS PRONSTICOS DE CAUDALES
3.4.1 Sobre el pre-procesamiento de los datos
Ya sea para optimizar el rendimiento de los algoritmos de ajuste, o para cumplir ciertas
hiptesis de los modelos de regresin, algunas transformaciones a los datos son requeridas y
en si mismas mejoran la precisin de los resultados. Bsicamente el pre-procesamiento de los
datos consiste en algunas adecuaciones que se hacen a la informacin para poder calibrar los
modelos, por ejemplo, el algoritmo de retropropagacin requiere que los datos hidrolgicos se
encuentren escalados para optimizar los pesos de las conexiones. Tambin los modelos
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-17
lineales RML, AR, ARMA, ARIMA, ARMAX, requieren datos estandarizados, normales y
estacionarios que deben ser provistos bajo dichas condiciones para evitar errores en los
clculos; sin embargo es importante resaltar que no todos los modelos requieren un pre-
procesamiento de la informacin y por lo general es decisin del modelador el uso de los
diferentes tipos de transformacin. A continuacin se enumeran algunos de los tipos de
transformacin.
3.4.1.1 Algunos tipos de transformacin
Para la operacin eficiente de algunos de los modelos propuestos es necesario un tratamiento
previo de los datos que incluye un proceso de normalizacin y escalonamiento de los datos
(Ochoa, 2002). Un primer paso consiste en remover de la serie original el coeficiente de
asimetra con el objeto de obtener una distribucin de probabilidades que se encuentre
centrada en la media, para tal efecto se aplica la siguiente trasformacin:
( )
Q c Q X
v v
= log 3-31
Donde
2
g
a
c = 3-32
Siendo
v
Q el caudal medio para el mes ( 12 ,..., 1 = ) y ao v (
a
N v ,..., 1 = ) con
a
N el
nmero de aos de la series;
g y
c ;
Q
v
v
s
Q Q
Y
= 3-33
Donde
Q y
Q
s son la media y la desviacin estndar de la serie de caudales para el mes ,
y
v
Y son los valores estandarizados para el ao v y el mes .
Finalmente una trasformacin adicional es aplicada a la serie
v
Q para llevar los datos a una
escala conveniente que permita su procesamiento en alguno de los mtodos de ajuste
propuestos. El rango de variacin ser reducido al intervalo [0,1] usando la siguiente
trasformacin:
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-18
m M
m t
t
Q Q
Q Q
Z
= 3-34
Siendo
t
Q el valor del caudal con ( ) + = 1 12 v t ;
M
Q es el mximo valor de la serie
v
Q ;
m
Q es el mnimo valor de la serie, Este proceso ayuda a eliminar las inhabilidades internas de
la red neuronal (ASCE-TCAANNH, 2000) y el modelo MARS durante su operacin.
3.4.2 Estacionariedad de los datos.
Dada su sencillez, los modelos lineales no son aptos para reconocer patrones relacionados con
la falta de estacionariedad de los datos, de hecho los datos deben ser estacionarios para
evaluar cualquier modelo lineal. El procedimiento tpico para anlisis de estacionariedad
utiliza mtodos cuantitativos que se basan en el uso de las pruebas de hiptesis de la
estadstica muestral; una hiptesis estadstica es una afirmacin que se hace acerca de la
distribucin de una poblacin basado en una muestra de ella; en una prueba de hiptesis
definimos una hiptesis nula (Ho) y una hiptesis alternativa (Ha), la prueba consiste en
comparar un valor analizado asociado a Ho o a Ha contra un valor crtico que define la
aceptacin o el rechazo de la hiptesis evaluada. Para las pruebas de hiptesis aqu usadas
intervienen generalmente las siguientes caractersticas de la serie:
Una caracterstica estadstica del parmetro analizado.
Un nivel de significancia de la prueba (), que corresponde a la probabilidad de rechazar
la hiptesis nula cuando era verdadera, o en trminos mas sencillos nos da una
indicacin de cuanta es la probabilidad de equivocarnos en la toma de decisin basados en
la prueba. Generalmente se usa un nivel de significancia de un 5% de probabilidad.
Grados de libertad de la prueba. La incertidumbre asociada a la medicin de un parmetro
depende del tamao de la muestra, los grados de libertad son una indicacin de esta
incertidumbre debido al tamao muestral.
As pueden encontrarse cambios en la media, cambios en la varianza y tendencias, el
procedimiento clsico implica una remocin de los cambios y tendencias encontrados para
aplicar cualquier modelo lineal de ajuste, en la Figura 3-6. Se presenta el procedimiento
clsico basado en pruebas de hiptesis aplicado en la prediccin de la serie de caudales del ro
Tenche con una ventana de 12 meses.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-19
Figura 3-6 Anlisis de estacionariedad clsico aplicado a la prediccin de caudales del ro Tenche
con un modelo Lineal
Las series hidrolgicas son no estacionarias por naturaleza y en muchas ocasiones las
tendencias encontradas suelen depender de la cantidad de datos analizados, es as como en
ocasiones no basta suponer tendencias lineales o polinmicas para describir los cambios en las
series hidrolgicas; en el ejemplo hipottico de la Figura 3-7 (Koutsoyiannis, 2006) se ilustra
como vara la estacionalidad con la ventana de informacin, en la ventana A se asume que los
datos son estacionarios en la media, en la ventana B se puede ajustar una ley parablica para
explicar la tendencia de los datos, pero en la ventana C donde la historia es mucho mas amplia
se muestra que en el largo plazo el comportamiento es peridico sinusoidal.
As pues, no basta solo con ajustar polinomios o usar pruebas de hiptesis para caracterizar las
evidencias de cambio en series que por naturaleza son no estacionarias, un procedimiento
alternativo fue presentado por Carmona (2010) para el anlisis de tendencias de las
oscilaciones de baja frecuencia de la serie usando la descomposicin espectral,
especficamente la trasformada de Hilbert Huang. Dicho procedimiento aplicado a la serie de
caudales del ro Tenche se presenta en la Figura 3-8. Los resultados indican una disminucin
en el porcentaje de error (%RMS) en los modelos lineales incorporando la no estacionariedad.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-20
Figura 3-7 Evolucin de la estacionariedad con el tamao de la ventana en una serie de tiempo
(Koutsoyiannis, 2006).
Figura 3-8 Anlisis de estacionariedad usando la descomposicin en modos intrnsecos para la
prediccin de caudales del ro Tenche.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-21
3.4.3 Modelos peridicos de pronstico
Dada la dependencia de las variables hidrolgicas de los diferentes ciclos astronmicos y
macro-climticos las series de caudales y precipitacin poseen una estructura cuasi-peridica
caracterizada por ciclos anuales y semianuales muy marcados. Por ejemplo, en el caso del rio
Grande la magnitud y variabilidad de los caudales cambia con el transcurrir de los meses,
incidiendo en la habilidad de pronstico de los modelos. En la Figura 3-9 se superpone el ciclo
anual del ro Grande (en azul) y el coeficiente de correlacin de Pearson obtenido para cada
mes utilizando el mtodo de regresin lineal mltiple con variables macro-climticas, puede
notarse que los meses de menor capacidad de pronstico corresponden a los meses de invierno
cuya variabilidad es mayor. Tal observacin es consecuente con los comentarios de Poveda et
al (2002) relacionando el ciclo anual y la estacionalidad del error.
Figura 3-9 Estacionalidad en el error
Dichas observaciones permiten justificar la construccin de modelos especializados para el
pronstico de meses especficos, lo que equivaldra a un modelo de regresiones peridicas, los
cuales se definen a continuacin:
Sea
v
Q corresponde al caudal medio mensual para el mes ( 12 ,..., 1 = ) y ao v
(
a
N v ,..., 1 = ) siendo
a
N el nmero de aos de la serie. Al agrupar los caudales por mes se
pueden formular la funcin de ajuste por tramos:
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL
3-22
( )
( )
( )
( )
( )
=
=
=
= =
12 ... ,
... ,
2 ... ,
1 ... ,
,
12 , 12 , 2 12 , 1 12
, , 2 , 1
2 , 2 , 2 2 , 1 2
1 , 1 , 2 1 , 1 1
n
n
n
n
v
X X X f
X X X f
X X X f
X X X f
X f Q
M
M
3-35
Donde
N
k
k
T
k k
x t y w
1
2
4-8
Con ( )
k query k
x x w w , = , usando mnimos cuadrados:
( ) y X X X
T T
1
= 4-9
Siendo ( ) X X
T
una matriz de longitud M M y y X
T
una matriz de 1 M donde:
( ) ( ) ( )
=
=
N
k
k j k i k j i
T
x t x t w X X
1
,
4-10
( ) ( )
=
=
N
k
i k i k i
T
y x t w y X
1
4-11
4.1.2 Funciones de influencia Radial (RBF)
Considere la relacin que existe entre los caudales medios mensuales del ro Guadalupe y las
temperaturas superficiales del ocano (SST) en las regiones Nio 1-2 y Nio 3-4, dicha
relacin puede ser presentada en un esquema tridimensional tal como se ilustra en la Figura 4-
2. La escala de colores permite definir la localizacin de los caudales segn su magnitud en
funcin de las SST, por ejemplo los caudales mximos (los puntos de color rojo y anaranjado)
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-5
parecen concentrarse en la regin donde las SST para ambas regiones Nio son ms bajas, es
decir, los eventos ms altos de caudal se presentan cuando las temperaturas en la regin Nio
1-2 varan entre 18C y 21C y simultneamente las temperaturas en la regin Nio 3-4 varan
entre 24C y 27C. As mismo pueden definirse otras regiones para la existencia de caudales
bajos (en Azul oscuro) e intermedios (en amarillo y azul claro). La Figura 4-2 muestra que los
datos evidentemente coexisten en una vecindad y por tanto puede ser usada la informacin de
de la vecindad para estimar la magnitud de los caudales para distintos valores de las SST.
Figura 4-2 Caudales del rio Guadalupe Vs SST Nio 1-2 y Nio 3-4
As pues, el problema del pronstico en hidrologa puede ser entendido como un problema de
interpolacin, muy comn en geoestadstica, el cual dependen de la distancia o norma a los
puntos en una determinada vecindad. En el subcampo matemtico del anlisis numrico, se
denomina interpolacin a la obtencin de nuevos puntos partiendo del conocimiento de un
conjunto discreto de puntos. Las funciones de influencia radial son un mtodo de interpolacin
basado en un tipo especial de funciones cuya principal caracterstica es que reducen (o
aumentan) su respuesta montonamente con su distancia a un punto central (Queipo et al.
2005). El centro, la distancia escalar y la forma precisa de la funcin de base radial son
parmetros del modelo. Un modelo RBF puede ser expresado como:
( ) ( )
=
+ =
N
i
i i
x x x y
1
4-12
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-6
Donde es una constante o un polinomio ponderado, son los coeficientes calculados
mediante la resolucin de ecuaciones lineales, ( ) es la funcin de base,
i
x x
corresponde a la distancia radial (
i
x x dist = ) y N representa a la cantidad de datos
presentes en la muestra.
puede definirse como un promedio (simple o ponderado) de la informacin en la vecindad
y ( )
N
i
i i
x x
1
es una correccin a dicho promedio que depende de la distancia del punto
evaluado al conjunto discreto de puntos en la vecindad.
Volviendo al caso del ro Guadalupe, supngase que se desea conocer el valor da caudal para
condiciones de las SST que no estn presentes en la muestra de datos, para ello son usadas las
funciones de influencia radial; en un punto establecido x se calcula la norma hacia todos los
puntos de la vecindad
i
x (Figura 4-3), buscando obtener el caudal para el punto x como una
ponderacin de los datos en la vecindad en funcin de la distancia radial.
Figura 4-3 El concepto de influencia Radial
Existen diferentes tipos de funciones de influencia radial ( ) , entre ellos la funcin
biarmnica, la multicuadrtica, multicuadrtica inversa, poliarmnica, Gausiana, etc. una
completa revisin de los tipos de RB son presentados en Powell (1987) y Gutmann (2001) y
algunas de sus ecuaciones son:
B.F Biarmnica (lineal):
( ) dist dist = 4-13
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-7
B.F Multicuadrtica:
( )
2 2
c dist dist + = 4-14
B.F Multicuadrica inversa:
( )
2 2
1
c dist
dist
+
= 4-15
B.F Poliarmnica:
( ) ( ) ( )
2 2 2 2
ln c dist c dist dist + + = 4-16
B.F Gausiana:
( )
|
|
\
|
=
2
2
2
exp
dist
dist 4-17
Donde c es una constante de forma, que puede tomar el valor de 1 (Acar & Rais-Rohani
2009), y es la ventana (o radio) de ponderacin. Ser un valor constante definido como
el promedio de y , es decir:
=
=
n
i
i
y
n
1
1
4-18
Y en algunos casos, con el fin de evitar singularidad en la matriz para el clculo de los
parmetros , la RBF puede ser aumentada mediante la inclusin de una funcin polinmica
de la forma:
( )
=
=
M
j
j j
x t
1
4-19
Donde ( ) x t
j
son los trminos del polinomio y
j
sus correspondientes coeficientes. Ntese
que 4-19 corresponde a una regresin local (de la forma 4-5), con lo que se puede afirmar que
las funciones de influencia radial son una generalizacin mejorada de los mnimos cuadrados
locales. Como la ecuacin 4-11 es indeterminada (hay ms parmetros a encontrar que numero
de ecuaciones), entonces se imponen la condicin de ortogonalidad a los coeficientes de la
siguiente manera:
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-8
( ) 0
1
=
=
N
i
i j i
x t 4-20
Combinando las ecuaciones 4-11 y 4-19 se obtiene el sistema matricial:
(
=
(
0 0
y
t
t A
T
4-21
Donde ( )
j i j i
x x A =
,
con n i ,..., 2 , 1 = y n j ,..., 2 , 1 = , ( )
i j j i
x t t =
,
, [ ]
T
n
,..., ,
2 1
= y
[ ]
T
n
,..., ,
2 1
= .
La solucin del sistema (4-21) permite obtener los parmetros de ponderacin de las RBF y
los coeficientes del polinomio.
La aplicacin de la RBF multicuadrtica sobre toda la regin de la Figura 4-3, permite estimar
mediante interpolacin, valores de caudal para puntos que no estn dentro de la muestra de
datos. En la Figura 4-4 se muestran los resultados de interpolacin para el ro Guadalupe.
Finalmente la ecuacin 4-12 puede ser aplicada usando ms de tres variables dado que
depende solo de la norma
j i
x x cuyo clculo pueden ser extendido a cualquier dimensin,
as pues, 4-12 es directamente una funcin de regresin. Las variables explicativas a usar en el
modelo deben corresponder con rezagos de las variables independientes para asegurar la
prediccin del futuro en funcin de datos actuales o precedentes, y son usadas para definir la
vecindad a usar en la ponderacin.
Figura 4-4 Aplicacin de RBF Multicuadrtica para el pronstico de caudales.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-9
4.2 REDES POLINMICAS
En el ao 1971 del acadmico Alexis G. Ivakhnenko de instituto Sovitico de Control
Automtico (Avlomatika) present su trabajo sobre la teora polinmica de sistemas
complejos usando una estructura de red tipo perceptrn multicapa, donde cada neurona ajusta
una funcin no lineal que usualmente es un polinomio de segundo grado, cada neurona acepta
dos entradas y la funcin implementada es de la forma:
( )
2 1 5
2
2 4
2
1 3 2 2 1 1 0 2
X X a X a X a X a X a a X A z + + + + + = = 4-22
Donde ( ) X A
2
denota una transformacin de segundo orden; en la Figura 4-2, tomada del
trabajo original de Ivakhnenko, se presenta el diagrama de flujo de las redes polinmicas cuyo
esquema se conoce como el mtodo de agrupacin para el tratamiento de datos (en ingls
Group Method of Data Handling, GMDH).
Figura 4-5 Algoritmo de agrupacin para el tratamiento de datos. I: primer capa de auto-selecciones,
II segunda capa de autoseleccin, III: seleccin de todas las soluciones, IV: optimizacin.
4.2.1 Algoritmo de agrupacin para el tratamiento de Datos (GMDH).
El algoritmo de agrupacin para el tratamiento de datos tiene por objeto ajustar polinomios
mediante funciones bsicas de regresin involucrando a pequeos subconjuntos de las
variables de entrada, cada uno de los polinomios obtenidos conforman lo que se denomina
descripcin parcial de la informacin (PD) (Oh et al, 2002). Si y es la variable a predecir y
X es el vector de variables predictoras (
n
X X X ,..., ,
2 1
), un polinomio bsico para la
construccin de una PD esta dado por:
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-10
( ) Fuv Ev Du Cv Bu A v u A z + + + + + = =
2 2
2
, 4-23
Donde F E D C B A , , , , , son los parmetros de la PD y v u, corresponden a un par de variables
extradas de X tales que z corresponda al polinomio que mejor se ajusta a la variable
dependiente y .
El proceso iterativo de construccin de cada capa del GMDH requiere tres pasos bsicos a
seguir:
Paso 1: se toman dos variables del conjunto de variables independientes
n
X X X ,..., ,
2 1
, de
esta manera el nmero total de polinomios que pueden ser construidos usando 4-22 es igual a
( ) 2 / 1 n n ; como resultado, se obtiene una columna con los
m
z ( ( ) 2 / 1 ,..., 2 , 1 = n n m ) los
cuales corresponden a nuevas variables mejoradas altamente correlacionadas con la variable
y de mayor habilidad de pronstico en comparacin con las variables iniciales del sistema
n
X X X ,..., ,
2 1
.
Paso 2: Se identifican las mejores
m
z utilizando como criterio de seleccin el mnimo error
cuadrtico medio hallado por validacin cruzada en relacin a la variable de salida y , el
mtodo de seleccin podr eliminar aquellas
m
z cuyo ajuste no supere un umbral predefinido
con lo que al final se obtiene un grupo reducido de variables z que servirn de entradas a otra
capa de la red.
Los pasos 1 y 2 corresponden a una iteracin del algoritmo GMDH, luego las variables
independientes
n
X X X ,..., ,
2 1
cambian de posicin en la red para generar nuevas PD en la
siguiente iteracin.
Paso 3: este paso busca comprobar si el conjunto de ecuaciones del modelo, obtenidas en cada
iteracin se puede mejorar. El valor ms bajo del criterio de bondad de ajuste obtenido durante
la presente iteracin es comparado con el valor ms pequeo en la pasada iteracin. Los pasos
1 y 2 se repiten hasta conseguir el menor error. Al final se llega a la obtencin de un
polinomio conocido como el polinomio de Ivakhnenko que esta dado por:
= = = = = =
+ + + + =
m
i
m
j
m
k
k j i ij
m
i
j
m
j
i ij
m
i
i i
X X X c X X c X b a y
1 1 1 1 1 1
... 4-24
4.2.2 Topologa y pasos para la construccin de una red neuronal polinmica
El algoritmo de las redes neuronales polinmicas est basado en el mtodo GMDH y utiliza
polinomios como el lineal, cuadrtico, cbico etc. para la construccin de las descripciones
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-11
parciales de los datos. Al elegir las variables de entrada ms significativas y el orden del
polinomio se pueden obtener las mejores descripciones parciales de datos (PD) cuya capacidad
de ajuste depende del nmero de capas y neuronas definidas en la red. As pues una red
polinmica busca una relacin del tipo:
( )
+ + + + = =
3 2 1
3 2 1 3 2 1
2 1
2 1 2 1
1
1 1 0 2 1
... ,... ,
k k k
k k k k k k
k k
k k k k
k
k k n
X X X c X X c X c c X X X f y 4-25
Donde los s c
k
' denotan los coeficientes del modelo.
Un esquema general de red polinmica se presenta en la Figura 4-6, para determinar el valor
de y , se construir una PD para cada par de variables independientes en la primera interaccin
usando el mtodo de los mnimos cuadrados; las PD ptimas sern seleccionadas mediante un
criterio de bondad de ajuste y los valores ajustados
mi
z han de ser utilizados como entradas en
una nueva capa de la red, el proceso se repetir hasta obtener el mejor ajuste posible. Una vez
la capa final haya sido construida aquel nodo caracterizado por el mejor criterio de ajuste ser
seleccionado como el nodo de salida del modelo, los nodos restantes de dicha capa se
descartan, y, adems, todos los nodos de las capas anteriores que no tienen influencia sobre el
nodo de salida son eliminados al trazar la trayectoria del flujo de datos en cada iteracin.
Mltiples iteraciones son requeridas para obtener el mejor ajuste y es por ello que la
construccin de una red polinmica consta se los siguientes pasos:
Paso 1: determinar las variables de entrada del sistema:
n
X X X ,..., ,
2 1
se toman como predictores del sistema.
Paso 2: formar grupos de datos para el entrenamiento y la validacin del modelo:
Las variables de entrada y salida del modelo ( ) ( )
ni i i i i i
X X X y X y ,..., , , ,
2 1
= con p i ,..., 2 , 1 =
(siendo p el nmero de observaciones) sern divididas en dos partes que denotan los
conjuntos de datos para el entrenamiento
ent
p y la validacin
val
p de la red, obviamente
val ent
p p p + = . Los datos de entrenamiento de la red sirven para la construccin de la red
Polinmica (incluyendo el clculo de los coeficientes de las PD en cada nodo) y los datos de la
validacin para la estimacin del error de la red.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-12
Figura 4-6 Descripcin general de una red Polinmica
Paso 3: seleccin de la topologa de red Polinmica: la estructura de la red polinmica es
seleccionada en funcin del nmero de variables de entrada y el orden de la PD en cada capa.
Existen bsicamente dos tipos de estructuras (Figura 4-7) llamadas red bsica y red
Modificada, que se pueden clasificar de la siguiente manera:
(a) Estructura de red bsica: cuando el nmero de variables de entrada en cada PD es el
mismo en todas las capas.
Caso 1: el orden del polinomio de las PD es el mismo en cada capa de la red.
Caso 2: el orden del polinomio de las PD vara en las capas de la red.
(b) Estructura de red Modificada: cuando el nmero de variables de entrada de cada PD
cambia en las diferentes capas.
Caso 1: el orden del polinomio de las PD es el mismo en cada capa de la red.
Caso 2: el orden del polinomio de las PD vara en las capas de la red.
Paso 4: Determinar el nmero de variables de entrada y el orden del polinomio para formar la
descripcin parcial de los datos (PD):
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-13
Figura 4-7 Topologa de una red polinmica
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-14
La determinacin del orden de del polinomio y el numero de de variables de cada PD se
establece en funcin de la arquitectura de la red seleccionada. En la Tabla 4-1 se presenta el
tipo de polinomio a usar segn el nmero de variables de entrada en cada PD.
Tabla 4-1 Estructuras de una red polinmica
Los tipos de polinomios son los siguientes:
Bilineal:
( ) Cv Bu A v u A + + = ,
1
4-26
Bicuadrtico:
( ) ( ) Fuv Ev Du v u A v u A + + + =
2 2
1 2
, , 4-27
Bicbico:
( ) ( )
2 2 3 3
2 3
, , Juv v Iu Hv Gu v u A v u A + + + + = 4-28
Trilineal:
( ) Dw Cv Bu A w v u A + + + = , ,
1
4-29
Tricuadrtico:
( ) ( ) Jvw Iuw Huv Gw Fv Eu w v u A w v u A + + + + + + =
2 2 2
1 2
, , , , 4-30
Tricbico:
( ) ( ) Nuvw Mw Lv Ku w v u A w v u A + + + + =
3 3 3
2 3
, , , , 4-31
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-15
Paso 5: Estimacin de los coeficientes de la PD.
El vector de coeficientes
i
C para cada PD es obtenido minimizando el error cuadrtico medio
E , entre
i
y y
mi
z .
( )
=
=
tr
N
i
mi i
tr
z y
N
E
0
2
1
4-32
Siendo
i i i mi
X C y z = =
)
4-33
Utilizando la porcin de informacin para calibrar el modelo se establece un conjunto de
ecuaciones lineales de la forma:
i i
X C Y = 4-34
Y mediante la tcnica de mnimos cuadrados, los coeficientes de las PD en cada nodo se
estiman como:
( ) Y X X X C
T
i i
T
i i
1
= 4-35
Siendo [ ]
T
n
tr
y y y Y ,..., ,
2 1
= , [ ]
T
i n ki i i i
tr
X X X X X ,..., ,..., ,
2 1
= , [ ]
T
i n i i i
c c c C
= ,..., ,
1 0
con la siguiente
notacin: i : nmero del nodo, k : nmero del dato,
tr
n nmero de datos en el periodo de
calibracin y n el nmero total de coeficientes estimados. El proceso es implementado en
forma repetitiva para todos los nodos de cada capa y para todas las capas de la red Polinmica.
Paso 6: Seleccionar las PDs con mejor capacidad predicativa.
Cada PD es estimada y evaluada usando los datos en el periodo de calibracin, luego se hace
una comparacin entre los valores obtenidos y se seleccionan aquellas PDs con la mejor
capacidad predicativa. Usualmente se seleccionan un nmero predefinido (W ) de PDs o en su
defecto se define un umbral (ndice) de capacidad predicativa para seccionar las PDs bajo la
siguiente condicin:
+ = <
*
E E
j
4-36
Donde
j
E es el menor error de ajuste en la capa actual,
*
E es el menor error de ajuste en la
capa anterior y es una constante positiva especificada por el modelador.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-16
Paso 7: Chequear el criterio para detener el entrenamiento de la red.
La corrida de una red neuronal Polinmica se puede terminar cuando:
*
E E
j
4-37
El algoritmo de la RNP tambin puede terminar cuando el nmero de iteraciones definidas por
el usuario es excedido.
Paso 8: Determinar las variables de entrada para la prxima capa de la red.
Si
j
E (el menor error de ajuste en la capa actual) no satisface la condicin 4-36 entonces la
red puede ser expandida definiendo una nueva capa.
4.3 APLICACIN DE LAS NUEVAS TCNICAS AL PRONSTICO DE
CAUDALES MEDIOS MENSUALES EN COLOMBIA.
Las tcnicas de pronstico del presente captulo son funciones de regresin que pueden ser
combinadas con cualquier mtodo espectral para formar nuevos modelos de prediccin.
Igualmente pueden ser implementados en esquema peridico utilizando el protocolo propuesto
en el captulo 3. Se propone la combinacin de los polinomios ponderados (PPON), en este
caso las RBFs en un esquema peridico (P) combinados con la transformada de Hilbert Huang
(HH) y las redes neuronales polinmicas (RNPOL) en un esquema peridico (P) con el
Anlisis espectral Singular (AES). Inicialmente la serie estandarizada de caudales se
descomponen en sus principales armnicos usando uno de los mtodos espectrales del Anexo
1, la serie descompuesta es parcialmente reconstruida para eliminar el ruido, por ejemplo la
descomposicin en modos intrnsecos (IMFs) para la serie del ro Guatap se presenta en la
Figura 4-5. El uso de RBFs de forma adjunta con un mtodo espectral permite aumentar de
forma significativa la habilidad de pronstico del modelo como se muestra en la Figura 4-6.
Las variables explicativas, en el caso de los polinomios ponderados usando RBFs, son usadas
para establecer la coexistencia de los caudales dados diferentes valores de variables
macroclimticas. Para el caso del ro Guatap, la serie de caudales reconstruida usando la
trasformada de Hilbert-Huang es analizada de manera conjunta con las anomalas de
temperatura rezagadas (con dos retardos) para las regiones Nio 1-2 y Nio 3-4 usando RBFs
(Figura 4-7). Los valores ms altos en las anomalas estandarizadas de caudales se presentan
cuando las anomalas de temperaturas en la regin Nio 1-2 estn en el rango [ ] 1 , 2 y las
anomalas de la regin Nio 3-4 se encuentran sobre la regin [ ] 1 , 2 .
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-17
Figura 4-5 Aplicacin de la descomposicin en modos intrnsecos para la serie de caudales del ro
Guatap (a) Descomposicin; (b) Reconstruccin.
Figura 4-6: Incorporacin de un mtodo espectral en la prediccin con polinomios ponderados
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-18
Figura 4-7: Incorporacin de un mtodo espectral en la prediccin con polinomios ponderados
Finalmente para todos los horizontes de pronstico se evala el uso de las diferentes tcnicas
espectrales y se selecciona la mejor para ser usada en la prediccin de caudales. En la Tabla 4-
2
Tabla 4-2 Comparacin de los PPON usando diferentes mtodos espectrales
1 mes 3 meses 6 meses
PPON
+
AES.
PPON
+
OND.
PPON
+
IMFS
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-19
Para la aplicacin de las redes polinmicas al pronstico de caudales se seleccionan aquellas
variables explicativas cuya correlacin con la serie de caudales sea significativa, dichas
variables pueden corresponder a varios rezagos de caudal, rezagos de lluvia, y variables
macro-climticas. Las mltiples variables seleccionadas son adoptadas como la capa de
entrada de la red polinomica (Figura 4-8).
Figura 4-8: Incorporacin de un mtodo espectral en la prediccin con polinomios ponderados
En la Tabla 4-3 se presenta una comparacin entre el mejor de los modelos tradicionales
(MARS), los polinomios ponderados y las redes polinmicas para la prediccin de los
caudales del ro Guadalupe con ventanas de 1, 3 6, y 12, meses; en la Anlisis de los
resultados
Se han propuesto como nuevas tcnicas para la prediccin de caudales medios mensuales en
Colombia los polinomios ponderados y las redes neuronales polinmicas. Al igual que el
modelo de regresin MARS las metodologas aqu expuestas tienen la ventaja de ser no-
paramtricas, por lo que el clculo de los parmetros de calibracin no depende de la
distribucin probabilstica de los datos, lo que convierte a los modelos aqu expuestos en
excelentes candidatos para la modelacin de procesos no lineales y no estacionarios como los
caudales.
Al igual que los dems mtodos de regresin presentados en el captulo anterior, los
polinomios ponderados y las redes polinmicas pueden ser combinadas con un mtodo
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-20
espectral para generar modelos de pronstico ms robustos, los mejores hbridos fueron
obtenidos combinando los polinomios ponderados con la transformada de Hilbert Huang
(PPON +HH) y las redes polinmicas con el Anlisis espectral singular (RNPOL +AES),
ambos usando un esquema peridico ((P)).
Tabla 4-4 se presenta igualmente los resultados para el ro Bat. La aplicacin de las
metodologas aqu presentadas en los dems ros puede ser consultada en el Anexo 2.
Tabla 4-3 Prediccin de caudales ro Guadalupe con Polinomios ponderados y Redes polinmicas
1 mes 3 meses 6 meses 12 meses
M
A
R
S
(
P
)
+
O
N
D
P
P
O
N
(
P
)
+
H
H
R
N
P
O
L
(
P
)
+
A
E
S
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-21
4.4 ANLISIS DE LOS RESULTADOS
Se han propuesto como nuevas tcnicas para la prediccin de caudales medios mensuales en
Colombia los polinomios ponderados y las redes neuronales polinmicas. Al igual que el
modelo de regresin MARS las metodologas aqu expuestas tienen la ventaja de ser no-
paramtricas, por lo que el clculo de los parmetros de calibracin no depende de la
distribucin probabilstica de los datos, lo que convierte a los modelos aqu expuestos en
excelentes candidatos para la modelacin de procesos no lineales y no estacionarios como los
caudales.
Al igual que los dems mtodos de regresin presentados en el captulo anterior, los
polinomios ponderados y las redes polinmicas pueden ser combinadas con un mtodo
espectral para generar modelos de pronstico ms robustos, los mejores hbridos fueron
obtenidos combinando los polinomios ponderados con la transformada de Hilbert Huang
(PPON +HH) y las redes polinmicas con el Anlisis espectral singular (RNPOL +AES),
ambos usando un esquema peridico ((P)).
Tabla 4-4 Prediccin de caudales ro Bat con Polinomios ponderados y Redes polinmicas
1 mes 3 meses 6 meses 12 meses
M
A
R
S
(
P
)
+
O
N
D
P
P
O
N
(
P
)
+
H
H
R
N
P
O
L
(
P
)
+
A
E
S
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-22
En las Figuras 4-6, 4-7, 4-8 y 4-9 se presenta la comparacin entre el mejor de los modelos del
captulo 3 y los nuevos modelos propuestos. Dicha comparacin demuestra una disminucin
significativa en los indicadores de error (RMSE y MAPE) y un aumento en el coeficiente de
Pearson para todos los ros al usar los mtodos propuestos en el presente captulo (ver anexo
2), analizando solo la ventana de doce meses y tomando como indicador el MAPE, el ro
Guadalupe pasa del 17% al 16%, el Rio Grande del 21% al 18.6%, el ro Porce del 16% al
15% , en el Guatap del 18.1 al 17.5% , Nare del 21.5% al 18.8%, San Carlos del 33% al
31%, en San Lorenzo del 23% al 22%, Miel del 23.9% al 22.2%; Magdalena del 22.6% al
20.5%, Guavio del 27% al 24% y Bat del 34% a 28%. Para las dems ventanas los esquemas
de prediccin propuestos casi siempre son mejores que el MARS (P)+OND, lo que sugiere
que los mtodos no paramtricas expuestos en el presente captulo poseen una habilidad de
pronstico que supera la de los mtodos tradicionales. As pues, los mtodos aqu expuestos
constituyen un avance significativo en la implementacin de tcnicas no paramtricas para el
pronstico de caudales medios mensuales en Colombia.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-23
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
9.00
10.00
11.00
12.00
13.00
14.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUDALUPE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
9.00
10.00
11.00
12.00
13.00
14.00
15.00
16.00
17.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUDALUPE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
12.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUDALUPE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
12.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUDALUPE V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
13.50
14.00
14.50
15.00
15.50
16.00
16.50
17.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO TENCHE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO TENCHE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
23.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO TENCHE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
23.00
24.00
25.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO TENCHE V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
11.00
11.50
12.00
12.50
13.00
13.50
14.00
14.50
15.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GRANDE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
13.50
14.00
14.50
15.00
15.50
16.00
16.50
17.00
17.50
18.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GRANDE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GRANDE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
23.00
24.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GRANDE V=12
%RMSE MAPE R2
Figura 4-6: Comparacin de modelos ros Guadalupe, Tenche y Grande.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-24
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
16.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO PORCE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
13.50
14.00
14.50
15.00
15.50
16.00
16.50
17.00
17.50
18.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO PORCE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO PORCE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
15.50
16.00
16.50
17.00
17.50
18.00
18.50
19.00
19.50
20.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO PORCE V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
12.00
12.50
13.00
13.50
14.00
14.50
15.00
15.50
16.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUATAP V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUATAP V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUATAP V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUATAP V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
11.00
12.00
13.00
14.00
15.00
16.00
17.00
18.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO NARE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO NARE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RONARE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO NARE V=12
%RMSE MAPE R2
Figura 4-7 Comparacin de modelos para los ros Porce, Guatap y Nare
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-25
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
15.00
20.00
25.00
30.00
35.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN CARLOS V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
31.00
33.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN CARLOS V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
18.00
23.00
28.00
33.00
38.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN CARLOS V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
20.00
25.00
30.00
35.00
40.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN CARLOS V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN LORENZO V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN LORENZO V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN LORENZO V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN LORENZO V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MIEL V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MIEL V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MIEL V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MIEL V=12
%RMSE MAPE R2
Figura 4-8 Comparacin de modelos para los ros San Carlos, San Lorenzo y Miel.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-26
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
11.00
12.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MAGDALENA V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS ROMAGDALENA V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MAGDALENA V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MAGDALENA V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
26.00
28.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUAVIO V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUAVIO V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
18.00
23.00
28.00
33.00
38.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUAVIO V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
31.00
33.00
35.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUAVIO V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
26.00
28.00
30.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO BATA V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
31.00
33.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO BATA V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
18.00
23.00
28.00
33.00
38.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO BATA V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
20.00
25.00
30.00
35.00
40.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO BATA V=12
%RMSE MAPE R2
Figura 4-9 Comparacin de modelos para los ros San Carlos, San Lorenzo y Miel.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-27
Referencias
Cleveland, W. S. (1979) Robust locally weighted regression and smoothing scatterplots,
Journal of American Statistical Association, 74 (368), 829-836.
Cleveland, W. S. and Devlin, S. J. (1988) Locally weighted regression: an approach to
regression analysis by local fitting, Journal of American Statistical Association., 83 (403),
596-610.
Cleveland, W. S., Devlin, S. J, and Grosse, E. (1988) Regression by local fitting, Journal of
Econometrics, 37, 87-114. Craven, P. and Wahba, G. (1979) Smoothing noise data with spline
functions, Numerische Mathematik, 31, 377-403.
Hardy R.L. Multiquadratic equations of topography and other irregular surfaces (1971).
Journal of Geophysical Research, Vol. 76, pp. 1905-1915
Ivahnenko AG. Polynomial theory of complex systems (1971). IEEE Trans Systems Man
Cybernet;SMC-1:36478.
Poveda G., "Aplicacin de los mtodos MARS, Holt-Winters y ARIMA generalizado en el
pronstico de caudales medios mensuales en ros de Antioquia"(2006). En: Colombia
Meteorologia Colombiana, ISSN: 0124-6984 ed: Gente Nueva v.10 fasc.1 p.36 - 46 ,
Powell M.J.D. (1987) Radial basis functions for multivariable interpolation: a review,
Algorithms for Approximation, Mason J.C., Cox M.G. (eds.), London, Oxford University
Press,
PRIESTLEY, M. B. y CHAO, M. T. (1972): "Non-parametric function fitting". J. Royal Stat.
Soc, B, 34, 385-392.
SCHMERLING, S. y PEIL, J. (1986): ' Improvement of the method of kernel estimation by
local polynomial approximation of the empirical distribution function and this application to
empirical regression". Gegenbaurs morphologisches Jahrbuch, 132,29-35.
Sk Oh, W P. Identification of fuzzy systems by means of an auto-tuning algorithm and its
application to nonlinear systems. Fuzzy Sets and Systems. 2000;115(2):205-30.
S.J. Farlow, The GMDH algorithm, in: S.J. Farlow (Ed.) (1984). Self-organizing Methods in
Modeling: GMDH Type Algorithms, Marcel Dekker, New York, pp. 124.