Вы находитесь на странице: 1из 128

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA



Julin David Rojo Hernndez PARH -UNAL


Desarrollo de un sistema experto para la
prediccin de caudales medios mensuales en
Colombia



Julin David Rojo Hernndez




Universidad Nacional de Colombia
Facultad de Minas Escuela de Geociencias y Medio Ambiente
Medelln-Colombia
2011
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH -UNAL
Desarrollo de un sistema experto para la
prediccin de caudales medios mensuales en
Colombia

Julin David Rojo Hernndez

Tesis presentada como requisito parcial para optar al ttulo de:
Maestra en Ingeniera Recursos Hidrulicos


Director:
I.C Msc. Luis Fernando Carvajal Serna

Lneas de investigacin:
Hidrometeorologa - Hidrologa Estocstica - Planeamiento y Manejo de Recursos
Hidrulicos

Posgrado en Aprovechamiento de Recursos Hidrulicos (PARH)


Universidad Nacional de Colombia
Facultad de Minas Escuela de Geociencias y Medio Ambiente
Medelln-Colombia
2011
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH -UNAL











A la memoria de mi abuela Alicia

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA


Julin David Rojo Hernndez PARH -UNAL
AGRADECIMIENTOS

El presente trabajo hace parte de un gran esfuerzo por salir adelante, en el cual, directa o
indirectamente, participaron muchas personas enseando, orientando, leyendo, opinando,
corrigiendo, tenindome paciencia, dndome nimo y apoyndome en todas las
circunstancias.
Agradezco inmensamente al profesor Luis Fernando Carvajal, por su dedicacin, apoyo y
cercana, por haber confiado en mi trabajo y por sus consejos. Al profesor Juan David
Velsquez, director de la escuela de Sistemas, por sus recomendaciones, a los profesores de la
escuela de Geociencias y Medio Ambiente por sus enseanzas y orientaciones y a mis
compaeros del posgrado por la amistad brindada.
Al Departamento Administrativo de Ciencia, Tecnologa e Innovacin de Colombia
(COLCIENCIAS) y la Universidad Nacional de Colombia, por financiar mediante el
programa Jvenes Investigadores Generacin del Bicentenario, el desarrollo del presente
trabajo y al instituto Interamericano para la investigacin del cambio global (IAI), por su
cooperacin.
A mi familia, por su apoyo incondicional, por entender mis ausencias y brindarme lo
necesario. Ellos son la razn de mis esfuerzos. A Leidy Andrea que desde el primer da hasta
hoy apoya de forma incondicional todos mis emprendimientos.

Gracias a todos.



DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL

Resumen

La estrecha relacin no lineal entre la hidrologa de Colombia y los procesos climticos a
escala global justifican el estudio de modelos no lineales de pronstico de caudales. El
presente trabajo presenta la prediccin de caudales medios mensuales en Colombia usando
modelos matemticos ( mtodos espectrales y de regresin) y juicio experto. El horizonte de
pronstico es de 1, 3, 6 y 12 meses. Las regresiones localmente ponderadas y las redes
neuronales polinmicas son presentadas como dos nuevas tcnicas para el pronstico de
caudales medios mensuales en Colombia.
El mtodo del promedio simple (MPS), el mtodo del promedio ponderado (MPP), el mtodo
de redes neuronales artificiales (MRN) y el mtodo ANFIS son presentados como tcnicas de
combinacin de pronsticos. La comparacin de los resultados muestra que el mtodo ANFIS
es el ms eficiente en la combinacin de pronsticos de caudales medios mensuales.
Finalmente lo rboles de regresin- decisin son expuestos para incorporar el juicio experto en
los pronsticos de caudales.
Palabras Clave: Hidro-climatologa de Colombia, Prediccin no lineal de caudales,
Modelacin de series de tiempo, prediccin con variables explicativas, juicio experto.

Abstract

The close nonlinear relationship between Colombian hydrology and global climatic processes
justifies the study of nonlinear river flow models. This work shows the nonlinear river flow
dynamics in Colombia using mathematical models (regression and spectral methods) and
expert opinions. The prediction window length is 1, 3, 6 and 12 months. The locally weighted
regression and the polynomial neural networks are present are presented as new techniques of
river flow forecast in Colombia.
The simple average method (SAM), the weighted average method (WAM), the neural network
method (NNM) and the first order Takagui-Sugeno Fuzzy system are explained to combine
together the simulations results of different conceptual modes to river flow forecasting. The
comparison of the forecast simulation efficiency of the Takagui-Sugeno method with the other
three combination methods demonstrates that the first order Takagui-Sugeno method is the
most efficient. Finally the regression-decision tress are presented for incorporate the expert
opinions in the forecast process.
Keywords: Hydro-climatology of Colombia, time series modeling, nonlinear river flow
prediction, prediction with exogenous variables, expert opinions.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL

TABLA DE CONTENIDO
Pg.
1 PROBLEMTICA DE LA PREDICCIN DE CAUDALES 1-1
1.1 SOBRE LA NECESIDAD DEL PRONSTICO DE CAUDALES 1-1
1.2 EXPERIENCIAS EN EL ANLISIS Y LA PREDICCIN DE CAUDALES
MEDIOS MENSUALES EN COLOMBIA.
1-2
1.3 SOBRE LA NECESIDAD DE MEJORAR LOS PRONSTICOS 1-3
1.4 BARRERAS QUE DIFICULTAN LA PREDICCIN DE CAUDALES
MEDIOS MENSUALES EN COLOMBIA.
1-4
1.5 DELIMITACIN DEL PROBLEMA DE INVESTIGACIN 1-5
1.5.1 En cuanto a los modelos considerados. 1-6
1.5.2 En cuanto al protocolo de prediccin. 1-6
1.5.3 En cuanto a los casos de aplicacin y el horizonte de pronstico. 1-6
1.6 OBJETIVOS 1-8
1.6.1 Objetivo general: 1-8
1.6.2 Objetivos especficos: 1-8
1.7 IMPACTOS, APORTES Y CONTRIBUCIN 1-8
1.8 SOBRE LA ORGANIZACIN DEL DOCUMENTO 1-9
1.9 DIFUSIN DE LOS RESULTADOS 1-9
1.9.1 Artculos 1-9
1.9.2 Ponencias en eventos 1-9
1.9.3 Otros 1-10

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
2 RELACIONES ENTRE LOS CAUDALES DE COLOMBIA Y LA
CLIMATOLOGA GLOBAL
2-1
2.1 HIDROCLIMATOLOGA DE COLOMBIA A DIFERENTES ESCALAS
ESPACIO-TEMPORALES
2-1
2.2 VARIABILIDAD ANUAL DE LOS CAUDALES EN COLOMBIA 2-5
2.2.1 El efecto de la ZCIT 2-5
2.2.2 El chorro del Occidente Colombiano (Chorro del Choc) 2-6
2.2.3 Adveccin de humedad desde el Amazonas 2-11
2.3 variabilidad de los caudales medios mensuales a escala inter-anual 2-13
2.4 VARIABILIDAD DE LOS CAUDALES MEDIOS MENSUALES A
ESCALA INTER-DECADAL
2-18
2.4.1 La Oscilacin Decadal del Pacfico (PDO) 2-18
2.4.2 Oscilacin del Atlntico Norte 2-19
2.5 TCNICAS ESPECTRALES PARA LA CUANTIFICACIN DEL EFECTO
DEL MACROCLIMA SOBRE LA HIDROLOGA DE COLOMBIA
2-20
2.6 SOBRE LA AUTO-CORRELACIN Y LA PERSISTENCIA EN LAS
SERIES DE CAUDALES
2-24
2.7 ANLISIS DE RESULTADOS 2-24

3 MTODOS ACTUALES PARA EL PRONSTICO DE CAUDALES 3-1
3.1 INTRODUCCIN AL ANLISIS PREDICTIVO 3-1
3.2 TCNICAS DE ANLISIS PREDICTIVO APLICADAS EN LA
PREDICCIN DE CAUDALES
3-2
3.2.1 Regresin lineal Mltiple (RLM) 3-2
3.2.2 Modelos de series de tiempo 3-4
3.2.3 Redes Neuronales Artificiales RNA 3-6
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
3.2.4 Polinomios Adaptivos de regresin Multivariada (MARS) 3-8
3.3 ESTRATEGIA DE VALIDACIN E INTERVALOS DE CONFIANZA 3-12
3.3.1 Validacin de los modelos de pronstico 3-12
3.3.2 Pronsticos probabilsticos e intervalos de confianza 3-15
3.4 TCNICAS PARA MEJORAR LOS PRONSTICOS DE CAUDALES 3-16
3.4.1 Sobre el pre-procesamiento de los datos 3-16
3.4.2 Estacionariedad de los datos. 3-18
3.4.3 Modelos peridicos de pronstico 3-21
3.4.4 Incorporacin de los mtodos espectrales en la prediccin. 3-23
3.5 METODOLOGIA GENERAL PARA LA PREDICCIN DE CAUDALES 3-24
3.5.1 Protocolo de prediccin 3-24
3.6 ANLISIS DE RESULTADOS 3-30

4 INCORPORACIN DE NUEVAS TCNICAS DE PRONSTICO 4-1
4.1 POLINOMIOS LOCALMENTE PONDERADOS 4-1
4.1.1 Polinomios localmente ponderados - mnimos cuadrados mviles 4-2
4.1.2 Funciones de influencia Radial (RBF) 4-4
4.2 REDES POLINMICAS 4-9
4.2.1 Algoritmo de agrupacin para el tratamiento de Datos (GMDH). 4-9
4.2.2 Topologa y pasos para la construccin de una red neuronal polinmica 4-10
4.3 APLICACIN DE LAS NUEVAS TCNICAS AL PRONSTICO DE
CAUDALES MEDIOS MENSUALES EN COLOMBIA.
4-16
4.4 ANLISIS DE LOS RESULTADOS 4-20
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL

5 COMPARACIN Y COMBINACIN DE PRONSTICOS
HIDROLGICOS
5-1
5.1 INTRODUCCIN 5-1
5.2 COMPARACIN DE PRONSTICOS 5-2
5.2.1 Test de Diebold y Mariano 5-2
5.2.2 Aplicaciones del test de Diebold y Mariano en la prediccin de caudales 5-4
5.3 COMBINACIN DE PRONSTICOS 5-8
5.3.1 Esquema general de la combinacin de pronsticos 5-9
5.3.2 Mtodo del promedio simple (MPS) 5-10
5.3.3 Mtodo del promedio ponderado (MPP) 5-11
5.3.4 Mtodo de las Redes Neuronales (MRNA). 5-12
5.3.5 Mtodo ANFIS. 5-13
5.3.6 Aplicacin de los mtodos de combinacin a los pronsticos de los caudales
medios mensuales de algunos ros en Colombia.
5-15
5.4 ANLISIS DE RESULTADOS 5-20

6 PREDICCIN BASADA EN REGLAS DE JUICIO 6-1
6.1 RBOLES DE DESICIN 6-1
6.2 RBOLES DE REGRESIN-DESICIN 6-2
6.2.1 Aspectos generales del algoritmo de clasificacin M5. 6-2
6.2.2 Variables usadas en el algoritmo M5 6-6
6.2.3 Propuesta metodolgica para la incorporacin de informacin climtica
mediante reglas de juicio.
6-7
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
6.2.4 Aplicacin del modelo M5 sobre los pronsticos de caudales 6-11
6.3 RBOLES DECISIN DERIVADOS EMPRICAMENTE 6-15
6.3.1 Matriz de Validacin 6-16
6.3.2 Sobre el signo de error de validacin 6-19
6.3.3 Construccin de rboles de decisin 6-21
6.4 ANLISIS DE RESULTADOS 6-24

















DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
LISTA DE FIGURAS
Pg.
Figura 1 1 Series de caudal y su ubicacin aproximada 1-7
Figura 2 1 Tipos de eventos macro-climticos que afectan la hidrologa de
Colombia.
2-2
Figura 2 2 Suma vectorial de los ciclo anual y semianual de la precipitacin en
Colombia, Meja et al. (1999).
2-6
Figura 2 3 Ciclo anual de los caudales medios mensuales usados en el presente
trabajo
2-7
Figura 2 4 Magnitud y direccin de los vientos a 925 mb (m/s) para la estacin
SON. Poveda et al (2006).
2-9
Figura 2 5 Componentes zonal y meridional de la adveccin de humedad en 5N-
530 N & 77W-7730.
2-10
Figura 2 6 Ciclo anual del trasporte de humedad por los vientos de la corriente del
chorro del Choch y su comportamiento durante los eventos de El
Nio y La Nia (Rendn, 2001).
2-11
Figura 2 7 Correlacin entre los ndices zonal y meridional del chorro del Choc y
los caudales del presente estudio.
2-11
Figura 2 8 Interaccin Suelo-Atmsfera en la cuenca del Amazonas. Poveda et al.
(2006)
2-12
Figura 2 9 Componente meridional de la adveccin de humedad desde el
Amazonas y su ciclo anual.
2-12
Figura 2 10 Anlisis de correlacin entre la adveccin de humedad desde el
Amazonas (componente meridional) y los caudales del presente
estudio.
2-13
Figura 2 11 Correlacin entre las anomalas de temperatura en los ocanos y la
primera componente principal de las series de caudales de los grupos
RVP, RVNRVM,ROC.
2-15
Figura 2 12 Anlisis de correlacin entre el ndice de Oscilacin del Sur (SOI) y
los caudales
2-16
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
Figura 2 13 Fases e ndice de la Oscilacin Decadal del Pacfico (PDO)
(http://jisao.washington.edu/pdo/PDO.latest).
2-18
Figura 2 14 Anlisis de correlacin entre la PDO (-2) y los caudales del presente
estudio.
2-19
Figura 2 15 Fases e ndice de la NAO, adaptado de http://www.atmosphere.mpg.de 2-20
Figura 2 16 Anlisis de correlacin cruzada entre el ndice NAO y los caudales de
los ros en Colombia.
2-21
Figura 2 17 Aplicacin de la transformada continua en onditas usando la ondita
Morlet para el ro Magdalena en Calamar (Poveda et al, 2002)
2-22
Figura 2 18 Aplicacin de la trasformada discreta en onditas para 6 niveles de
descomposicin usando la ondita discreta de Meyer
2-23
Figura 2 19 Autocorrelogramas de las series de caudales estandarizadas 2-25
Figura 3 1 Topologa de red neuronal para pronstico de Caudales 3-7
Figura 3 2 Esquema de validacin cruzada 3-13
Figura 3 3 Esquema de validacin retroactiva 3-13
Figura 3 4 Prediccin de los caudales medios mensuales del ro Guadalupe usando
RLM para una ventana de un mes, perodo 2000-2007.
3-15
Figura 3 5 Esquema de pronstico probabilstico para el ro Guadalupe en enero
de 2006.
3-16
Figura 3 6 Anlisis de estacionariedad clsico aplicado a la prediccin de
caudales del ro Tenche con un modelo Lineal
3-19
Figura 3 7 Evolucin de la estacionariedad con el tamao de la ventana en una
serie de tiempo (Koutsoyiannis, 2006).
3-20
Figura 3 8 Anlisis de estacionariedad usando la descomposicin en modos
intrnsecos para la prediccin de caudales del ro Tenche.
3-20
Figura 3 9 Estacionalidad en el error 3-21
Figura 3 10 Comparacin entre modelo lineal y un modelo lineal peridico para la
prediccin de caudales del ri Grande con horizonte de un mes
3-22
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
Figura 3 11 Incorporacin de mtodos espectrales en el pronstico hidrolgico,
caso ro Bata
3-23
Figura 3 12 Protocolo para la prediccin de caudales medios mensuales en
Colombia
3-25
Figura 3 13 Esquema general para la construccin de modelos de pronstico 3-26
Figura 3 14 El problema del pronstico de los caudales mximos 3-31
Figura 3 15 Comparacin indicadores de error para los ros Guadalupe, Tenche y
Grande
3-32
Figura 3 16 Comparacin indicadores de error para los ros Porce, Guatap y Nare 3-33
Figura 3 17 Comparacin indicadores de error para los ros San Carlos, San
Lorenzo y Miel.
3-34
Figura 3 18 Comparacin indicadores de error para los ros Magdalena, Guavio y
Bat.
3-35
Figura 3 19 Error MAPE para MARS (p) +OND a diferentes horizontes de
pronstico
3-36
Figura 4 1 Comparacin entre una regresin global y una regresin local. 4-3
Figura 4 2 Caudales del rio Guadalupe Vs SST Nio 1-2 y Nio 3-4 4-5
Figura 4 3 El concepto de influencia Radial 4-6
Figura 4 3 Aplicacin de RBF Multicuadrtica para el pronstico de caudales. 4-8
Figura 4 2 Algoritmo de agrupacin para el tratamiento de datos. I: primer capa
de auto-selecciones, II segunda capa de autoseleccin, III: seleccin de
todas las soluciones, IV: optimizacin.
4-9
Figura 4 3 Descripcin general de una red Polinmica 4-12
Figura 4 4 Topologa de una red polinmica 4-13
Figura 5 1 Comparacin entre casos de prediccin del ro guadalupe con ventanas
de un mes usando variables explicativas del enso
5-5
Figura 5 2 Introduccin de rezagos de la serie de caudales como variable 5-6
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
Explicativa en el ro guadalupe-comparacin.
Figura 5 3 Procedimiento general para la combinacin de pronsticos 5-10
Figura 5 4 Esquema de red neuronal usada en la combinacin de pronsticos. 5-12
Figura 5 5 Modelo anfis para la combinacin de pronsticos. 5-14
Figura 5 6 Pronsticos a un mes del ro miel arrojados por los diferentes modelos. 5-16
Figura 5 7 Resultados de combinacin de pronsticos 5-17
Figura 6 1 Modelo de rbol binario 6-2
Figura 6 2 Esquema de un rbol de regresin por induccin. 6-3
Figura 6 3 Esquema de un rbol de regresin por induccin. 6-4
Figura 6 4 Pronstico de las SST en la regin Nio 3.4 usando un modelo
marcoviano
(http://www.cpc.ncep.noaa.gov/products/people/yxue/SL_forecast_cli
m71-00_godas.html).
6-8
Figura 6 5 Pronstico probabilstico del ENSO elaborado por el IRI 6-9
Figura 6 6 Variables utilizadas en la construccin del rbol de decisin para el ro
Guadalupe
6-11
Figura 6 7 rbol de decisin generado por el Algoritmo M5 para el ro Guadalupe 6-12
Figura 6 8 Validacin de la correccin de los pronsticos usando un rbol de
Decisin M5
6-13
Figura 6 9 rboles de decisin para la prediccin de los ros Guadalupe, Tenche,
Grande, Porce
6-16
Figura 6 10 rboles de decisin para la prediccin de los ros Guadalupe, Tenche,
Grande, Porce
6-20
Figura 6 11 rboles de decisin para la prediccin de los ros Guadalupe, Tenche,
Grande, Porce
6-21
Figura 6 12 rboles de decisin para el pronstico la prediccin de los ros Nare y
Guatap
6-22
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
Figura 6 13 rboles de decisin para el pronstico de los ros San Carlos y San
Lorenzo
6-22
Figura 6 14 rboles de decisin para el pronstico de los ros Miel y Magdalena en
Betania
6-23
Figura 6 15 rboles de decisin para el pronstico de los ros Bat y Guavio 6-23



















DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
LISTA DE TABLAS
Pg.
Tabla 1 1 Informacin de caudales 1-6
Tabla 2 1 Ciclo anual y variabilidad de los caudales medios mensuales del los
ros analizados
2-8
Tabla 2 2 El ciclo anual de los caudales para periodos Nia, Nio y Normal
segn el ONI.
2-17
Tabla 2 3 Periodos asociados a las componentes principales en algunos ros de
Colombia (Rojo & Carvajal 2007)
2-22
Tabla 3 1 Validacin 2000-2007, Ro Guadalupe con los diferentes modelos de
pronstico
3-28
Tabla 3 2 Validacin 2000-2007, Ro Bat con los diferentes modelos de
pronstico
3-29
Tabla 4 1 Estructuras de una red polinmica 4-14
Tabla 4 2 Comparacin de los PPON usando diferentes mtodos espectrales 4-18
Tabla 4 2 Prediccin de caudales ro Guadalupe con Polinomios ponderados y
Redes polinmicas
4-20
Tabla 4 3 Prediccin de caudales ro Bat con Polinomios ponderados y Redes
polinmicas
4-21
Tabla 5 1
Valores del estimador S del test de de Diebold y Mariano para casos
de pronstico usando diferentes variables explicativas
5-5
Tabla 5 2
Valores de S obtenidos en la comparacin entre modelos de
pronstico con variables macro-climticas y rezagos de caudal para el
ro Guadalupe
5-6
Tabla 5 3
Valores de S obtenidos en la comparacin de pronsticos de caudales
en el ro Guadalupe v=1;
5-7
Tabla 5 4
Valores de S obtenidos en la comparacin de pronsticos de
5-7
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL
caudales en el ro Guadalupe v=3;
Tabla 5 5
Valores de S obtenidos en la comparacin de pronsticos de caudales
en el ro Guadalupe v=6;
5-8
Tabla 5 6
Valores de S obtenidos en la comparacin de pronsticos de caudales
en el ro Guadalupe v=12
5-8
Tabla 5 7 combinacin de pronsticos para el ro Guadalupe validacin 2000-
2007
5-18
Tabla 5 8 Combinacin de pronsticos para el ro Bat validacin 2000-2007 5-19
Tabla 6 1 Clasificacin de las fases del ENSO para los pronsticos
probabilsticos del IRI
6-10
Tabla 6 2 Tipos de variables utilizadas para la correccin de pronsticos usando
M5
6-10
Tabla 6 3 Correccin de pronsticos usando M5 para los ros Tenche y Guatap. 6-13
Tabla 6 4 Correccin de pronsticos usando M5 para los ros Nare, San Carlos y
san Lorenzo.
6-14
Tabla 6 5 Correccin de pronsticos usando M5 para los ros Magdalena, Guavio
y Bat.
6-15
Tabla 6 6 Matriz de Validacin para los ros Guadalupe, Tenche , Porce y
Grande, para pronsticos durante eventos El Nio, Normales (Neutros)
y La Nia
6-17
Tabla 6 7 Matriz agregada de validacin para los ros del Grupo 1. 6-18
Tabla 6 8 Matriz de validacin y signo del error para los ros del Grupo 1
(Guadalupe, Tenche, Porce y Riogrande)
6-20

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL

Captulo 1:

Problemtica de la
prediccin de caudales



. . . it is always very difficult to predict the future on the basis of the
past. Indeed it has been likened to driving a car blindfolded while
following directions given by a person looking out of the back window
. . .
Harvey (1989, p. xi)
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-1
1 PROBLEMTICA DE LA PREDICCIN DE CAUDALES
RESUMEN
El presente captulo tiene por objeto exponer la necesidad que existe de mejorar la prediccin
de caudales medios mensuales en Colombia. Se explica la importancia de las predicciones
hidrolgicas en el planeamiento y manejo de los recursos hdricos y a su vez se hace un
resumen de las diferentes experiencias que ha tenido Colombia en la materia. Como las
condiciones de pronstico son dependientes de la hidro-climatologa del pas a diferentes
escalas espacio-temporales, se exponen algunas de las barreras que dificultan la obtencin de
predicciones acertadas permitiendo identificar la prediccin de caudales medios mensuales
como un problema difcil, relevante y oportuno.
Segn los objetivos, el presente trabajo pretende abordar el reto de mejorar el pronstico de
los caudales medios mensuales en Colombia utilizando nuevos modelos y reglas de juicio
experto. Para ello se desarrollar un protocolo de prediccin aplicado a las series de
caudales de los doce ros ms relevantes dentro del sector elctrico nacional. Finalmente se
espera que los resultados y metodologas obtenidas en el presente trabajo sirvan para
entregar a los usuarios finales de las predicciones pronsticos ms acertados y acordes con la
realidad hidro-climatolgica del pas.
1.1 SOBRE LA NECESIDAD DEL PRONSTICO DE CAUDALES
De todos los elementos del ciclo hidrolgico los caudales de los ros pueden ser los que
mayores consecuencias tienen sobre la vida de los seres humanos. La seguridad alimentara
depende de hectreas de tierras irrigadas con el agua proveniente de ros y los embalses que
regulan su flujo, en muchas zonas del planeta los diferentes cursos de agua representan la
fuente primaria para el consumo domstico y la generacin de hidroelectricidad, gran parte de
la industria y el comercio requiere del agua de los ros para su abastecimiento, innumerables
poblaciones desarrollan su vida cotidiana y hacen de los ros su va de comunicacin, motivos
suficientes para convertir los pronsticos de caudales en el objetivo principal de muchos tipos
de estudios relacionados con el planeamiento y manejo de los recursos hdricos.
Son muchos los sectores de la economa nacional que estn estrechamente ligados a la oferta
hdrica provista por los ros del pas; el caso particular del sector elctrico cobra relevancia en
pocas donde las sequas golpean con severidad los ros que surten los embalses de Colombia.
La disminucin de las lluvias y la reduccin del nivel de los embalses han llevado en muchas
ocasiones a las autoridades de la nacin a proponer planes de ahorro de energa y cortes de
agua ante la amenaza de un posible racionamiento, los periodos de sequa han puesto al Sector
Elctrico en condiciones criticas que recuerdan el racionamiento de los aos 1992-1993 donde
los niveles de los embalses llegaron al catorce por ciento de su capacidad y cuyas
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-2
consecuencias llevaron a una profunda reforma del sistema elctrico nacional; desde entonces
el mercado mayorista de la energa en Colombia utiliza la prediccin de caudales medios
mensuales como un insumo de gran importancia que permite inferir precios futuros de la
electricidad valorando as los beneficios econmicos derivados de la aplicacin de tales
predicciones en la operacin del Sistema Elctrico Nacional.
Pese a ser el sector elctrico el principal usuario de los pronsticos de caudales medios
mensuales en Colombia, en pases desarrollados tales previsiones tambin son utilizadas en la
planificacin y manejo de distritos de riego, los sistemas de agua potable, de navegacin
fluvial, el Control de inundaciones, la previsin de los rendimientos de cultivos, y el
aprovechamiento de los recursos hdricos en general.
1.2 EXPERIENCIAS EN EL ANLISIS Y LA PREDICCIN DE CAUDALES
MEDIOS MENSUALES EN COLOMBIA.
En cuanto a los modelos utilizados para predecir caudales medios mensuales en Colombia, en
el sector elctrico colombiano fue comn durante los aos setenta y ochenta el uso de modelos
tipo AR, ARMA y ARIMA para la generacin de series sintticas de tiempo (Mnera, 1983)
pretendiendo representar comportamientos futuros de la hidrologa que pueden ocurrir en
periodos de tiempo indeterminados, algo no muy convencional para efectos de la prediccin
pues dichos modelos solo requieren de registros de caudales para su ejecucin desconociendo
la dinmica externa no lineal asociada a los fenmenos macro-climticos, adems son
construidos bajo el supuesto de la normalidad y linealidad de los datos. La no linealidad de los
procesos hidrolgicos ha hecho necesario el estudio de nuevos modelos de prediccin no
lineal asociados a novedosas tcnicas de tratamiento matemtico y estadstico de los datos; la
primera apuesta en dicho sentido fue aplicada a la hidrologa colombiana por Carvajal y
Salazar (1994) presentando el Anlisis Espectral Singular, las Redes Neuronales y los
modelos dependientes del rgimen (RAR).
Los modelos auto-regresivos dependientes del rgimen (RAR) (Salazar, 1994) son una clase
de modelos no lineales cuya idea bsica consiste en asumir que el rgimen hidrolgico est
claramente ligado a las variaciones macro-climticas, explorando la posibilidad de que las
series de precipitacin y caudal tengan propiedades estadsticas dependientes del estado que
presentan las variables macro-climticas, as pues, el objeto de los modelos tipo RAR es el de
ajustar las propiedades estocsticas de una serie dependiendo del estado de una variable
externa que se considera influyente en el comportamiento del fenmeno analizado.
Dada la complejidad en los problemas de pronsticos Carvajal (1994-1998) combin el
Anlisis Espectral Singular (AES) con mtodos auto-regresivos y regresiones lineales
mltiples para el desarrollo de una nueva herramienta de prediccin de caudales, cuya
aplicacin corresponde a la primera aplicacin de los mtodos espectrales en la prediccin
hidrolgica de Colombia. Posteriormente Hoyos (1999) introdujo algunas aplicaciones del
mtodo espectral basado en la descomposicin en onditas y Poveda et al. (2002) presentan el
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-3
modelo PREBEO (Prediccin en Bandas Espectrales usando Onditas) para pronsticos de
caudales, cuyo funcionamiento combina la descomposicin en ndulas de una serie con
regresiones lineales mltiples. Finalmente el trabajo de Carmona (2010) introdujo la
trasformada de Hilbert Huang en el estudio de series hidro-climticas y su aplicacin en la
prediccin hidrolgica.
Desde el PARH de la Universidad Nacional de Colombia se han propuesto adems: Las redes
neuronales artificiales (RNA), introducidas por Carvajal (1994) para la prediccin de caudales
medios mensuales en Colombia, como un modelo de regresin no lineal y no paramtrico que
puede desarrollar un buen trabajo de ajuste tolerando adecuadamente componentes caticas
generadoras de ruido en la serie; los Modelos Lineales Inversos (MLI) para la prediccin de
diferentes condiciones del ENSO (Ceballos, 2005); las tcnicas de regresin no paramtrica
como las regresiones Kernel (Poveda et al, 2002), los polinomios Multivariados y adaptivos
conocidos como MARS (Rendn,1997) y las funciones Holt Winters (Poveda, 2006) cuya
aplicacin busca capturar la no estacionalidad presente en las series de caudales, as mismo
las redes adaptivas Neuro-Difusas (ANFIS) que aparecen en los 90 como sistemas capaces de
combinar los sistemas de inferencia difusos con redes neuronales fueron propuestas como
tcnicas de regresin para la prediccin de caudales (Smith et al, 2004); los sistemas de
inferencia difusos proveen un mecanismo intuitivo de alto nivel para representar el
conocimiento mediante reglas de juicio IF/THEN y las redes neuronales poseen un alto grado
de adaptabilidad, capacidad de aprendizaje y de generalizacin, siendo una aproximacin
idnea al problema del pronstico hidrolgico.
As pues, los investigadores del tema a nivel nacional han conseguido recopilar una notable
cantidad de modelos utilizados para la prediccin de caudales, sin embargo en muchas
ocasiones los pronsticos no son los ms acertados en el tiempo y espacio por lo que se
requiere de la aplicacin de varios modelos para manejar la incertidumbre a fin de tomar una
decisin.
1.3 SOBRE LA NECESIDAD DE MEJORAR LOS PRONSTICOS
La prediccin mensual de caudales medios se ve seriamente afectada por las condiciones
climatolgicas cambiantes del ao, en consecuencia los pronsticos no siempre coinciden en
tiempo y espacio con los eventos reales. Los grandes cambios en la hidrologa de Colombia
suelen estar relacionadas con la alta variabilidad espacio-temporal de fenmenos macro-
climticos a gran escala (Poveda, 2004) y por ello la capacidad de prediccin para los caudales
de los ros de Colombia cambia segn las condiciones en las que se encuentre el ao analizado
(Smith et al. 2004). De manera anloga tambin debe tenerse en cuenta la dinmica no lineal
de la hidro-climatologa para modelar el comportamiento de los caudales dado que la
prediccin est sujeta a un alto grado de incertidumbre derivada del caos inherente a la
naturaleza. Las relaciones existentes entre la hidrologa del pas y la climatologa global no
son del todo claras en trminos de su intensidad espacio-temporal, por cuanto no existen
formas de cuantificar el efecto no lineal con el que acta el macro-clima sobre la hidrologa
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-4
del pas; para mejorar la prediccin de caudales se deben establecer una serie de metodologas
tendientes a evaluar ms a fondo las relaciones entre la hidro-climatologa a gran escala y la
variabilidad espacio-temporal de nuestra hidrologa permitiendo potenciar las posibilidades de
los modelos de prediccin que hasta ahora son utilizados.
Algunas de las dificultades ms notorias en los procesos y aleatoriedad de prediccin tienen
relacin con la ventana de pronstico, al aumentar dicho horizonte la incertidumbre es mayor
y el desconocimiento de la variable a predecir aumenta. La experiencia muestra que todos los
modelos aplicados hasta el momento arrojan buenos pronsticos para caudales mnimos, pero
para los mximos los resultados no son los ms acertados. La mayora de los modelos para el
pronstico de caudales medios mensuales en Colombia, se reducen a un tipo de regresin
matemtica cuya calidad se ve afectada por las posibles discriminaciones del modelo a la hora
de involucrar variables explicativas, en relacin a lo anterior suele pasar que los modelos
matemticos aprecian mas la persistencia de la propia serie que a las variables macro-
climticas, por lo que el efecto futuro del macro-clima sobre los caudales suele ser
subvalorado, en adicin, muchos de los modelos poseen dificultades para reconocer relaciones
causales simultneamente, y en especial, cuando ellas son no-lineales. Por otro lado, los
pronsticos basados en juicios son ms crebles que aquellos basados en sofisticados modelos
matemticos (Bunn y Wright, 1991), sin embargo, la calidad del pronstico se ve afectada a
falta de un proceso sistemtico de razonamiento que los hace poco defendibles,
argumentables, estando soportados en las evidencias difciles documentar (Velsquez, 2008).
El desarrollo de un sistema basado en modelos matemticos y juicio experto para la prediccin
de caudales medios mensuales en Colombia pretende mejorar la capacidad y la eficiencia de
los modelos actualmente utilizados para predecir caudales en el pas. Su propsito ser el de
articular atributos hidro-climticos a los pronsticos mensuales de caudales mediante la
incorporacin de nuevas tcnicas de pronstico as como decisiones inteligentes obtenidas en
forma de reglas basadas en la experiencia y el juicio de un experto. Una investigacin de esta
naturaleza es del todo necesario porque se requiere obtener un mejor entendimiento de la
relacin existente entre la hidro-climatologa global y los caudales de los ros colombianos,
adems, sus resultados permitirn establecer criterios de planeacin que sirvan de apoyo en la
toma de decisiones para el sector elctrico, el sector agrcola, y entidades relacionadas con la
prevencin de desastres y la gestin del riesgo climtico en Colombia.
1.4 BARRERAS QUE DIFICULTAN LA PREDICCIN DE CAUDALES MEDIOS
MENSUALES EN COLOMBIA.
Los caudales de un determinado ro son el resultado de una interaccin compleja, e incluso
catica, entre muchas variables; la principal barrera para el pronstico de caudales radica en la
complejidad del sistema hidrolgico y su interrelacin con los procesos climticos de gran
escala, dicha complejidad suele minimizarse cuando se plantea un modelo matemtico cuyas
hiptesis tienen una influencia directa sobre la eficiencia de los pronsticos puesto que solo
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-5
capturan ciertas partes del comportamiento hidrolgico, adems, a los modelos matemticos
les resulta difcil incorporar informacin cualitativa, subjetiva y contextual en los pronsticos.
Las caractersticas particulares de las series de caudales medios mensuales, relacionadas con
sus propiedades estadsticas (no estacionalidad, cuasi-periodicidad, etc.), la complejidad y el
gran nmero de factores que los afectan, imponen los siguientes requerimientos en la
formulacin de modelos para el pronstico de caudales (Velsquez, 2008):
Modelacin no lineal.
Capacidad para manejar simultneamente una gran cantidad de variables explicativas.
Capacidad de ponderar la informacin disponible en el tiempo.

La aplicacin de los modelos matemticos en prediccin hidrolgica posee una dificultad
directamente relacionada con la cantidad de informacin utilizada para entrenar el modelo,
poder describir de manera adecuada un proceso requiere los datos suficientes para hacerlo y en
muchas ocasiones ocurre que el ajuste de la muestra de entrenamiento es muy preciso mientras
que el modelo de toda la poblacin es relativamente pobre, este peligro ha sido sealado por
Velsquez (2008) citando las palabras de Harvey (1989, p. xi):
. . . it is always very difficult to predict the future on the basis of the past. Indeed it has been
likened to driving a car blindfolded while following directions given by a person looking out
of the back window . . .
En resumen, todos los modelos estn limitados por la influencia de los eventos macro-
climticos, la cantidad de datos utilizados, la longitud de la ventana de prediccin, adems de
la capacidad matemtica y estadstica para reconocer la dinmica no lineal del sistema
analizado, en ese sentido las predicciones varan segn los modelos, requiriendo de varios
resultados para tomar una decisin.
1.5 DELIMITACIN DEL PROBLEMA DE INVESTIGACIN
Se ha identificado la prediccin de caudales medios mensuales como un problema difcil,
relevante y oportuno; no obstante, es imposible intentar dar respuesta a todos los interrogantes
planteados arriba en una nica tesis, por lo tanto es necesario delimitar la investigacin de tal
forma que sea alcanzable en los tiempos y la dedicacin estipulados.
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-6
1.5.1 En cuanto a los modelos considerados.
En cuanto a los modelo de prediccin de caudales, se espera describir de forma general los
modelos existentes y de uso ms frecuente, proponiendo algunas tcnicas que permitan
mejorar sustancialmente su capacidad de pronstico. Dos nuevas tcnicas matemticas, los
polinomios ponderados y las redes polinmicas, sern propuestas e implementadas para la
prediccin de caudales medios mensuales en Colombia.
1.5.2 En cuanto al protocolo de prediccin.
De manera paralela se presenta una secuencia metodolgica que permite orientar el proceso de
prediccin de caudales, mediante la comparacin de los resultados, la combinacin de
informacin y la incorporacin del juicio experto durante la elaboracin de los pronsticos.
1.5.3 En cuanto a los casos de aplicacin y el horizonte de pronstico.
Los modelos y procedimientos aqu presentados sern aplicados al pronstico de los caudales
medios mensuales de doce de los ros ms relevantes para la generacin elctrica del pas,
ellos son: Guadalupe, Tenche, Riogrande, Porce, Nare, Guatap, San Carlos y San Lorenzo en
el departamento de Antioquia; Miel en el departamento de Caldas, Magdalena en el sitio
Betania del departamento del Huila; el ro Guavio en Cundinamarca y el ro Bat en Boyac.
Dicha informacin es provista de forma libre por las diferentes compaas oferentes del sector
elctrico nacional y administrada por la compaa de Expertos en Mercados XM. En la Figura
1-1 se presenta la localizacin aproximada de las estaciones de medicin de caudal en el
territorio nacional y en la Error! No se encuentra el origen de la referencia. se hace una
descripcin de los datos. Los horizontes de pronstico planteados para el desarrollo del
presente estudio sern de uno (1), tres (3), seis (6) y doce (12) meses.
Tabla 1-1 Informacin de caudales
NOMBRE DATO INICIAL DATO FINAL TOTAL DATOS (meses)
GUADALUPE 1-1936 12-2008 816
TENCHE 1-1955 12-2008 648
REIOGRANDE 1-1942 12-2008 804
PORCE 1-1973 12-2008 432
NARE 1-1956 12-2008 636
GUATAP 1-1959 12-2008 600
SAN CARLOS 1-1965 12-2008 528
SAN LORENZO 1-1967 12-2008 504
MIEL 1-1965 12-2008 528
MAGDALENA 1-1961 12-2008 576
GUAVIO 1-1963 12-2008 552
BATA 1-1956 12-2008 636


DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-7


Figura 1-1 Series de caudal y su ubicacin aproximada
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-8
1.6 OBJETIVOS
1.6.1 Objetivo general:
Mejorar la prediccin de caudales medios mensuales mediante la utilizacin de un
prototipo basado en modelos matemticos y juicio experto.
1.6.2 Objetivos especficos:
Establecer un Benchmark del estado actual de prediccin de caudales medios mensuales en
el pas.
Incorporar en la construccin del modelo el uso de variables explicativas que reflejen el
comportamiento macro-climtico
Revisar los ltimos avances en temas relacionados con la prediccin en hidrologa e
incorporar aquellos que sean relevantes para caso colombiano.
Ajustar los pronsticos mediante reglas de juicio.
Desarrollar un Prototipo de Software para la prediccin de caudales medios mensuales
basado en modelos matemticos y reglas de juicio.
1.7 IMPACTOS, APORTES Y CONTRIBUCIN
Se pretende que los resultados y metodologas obtenidas mediante el presente proyecto sirvan
para desarrollar un procedimiento que permita entregar a los usuarios finales de las
predicciones valores ms acertados y acordes con la realidad hidro-climatolgica del pas.
Las medidas para mitigar los efectos de eventos macro-climticos sobre la oferta hdrica
nacional solo podrn ser mas efectivas al pronosticar con mayor certidumbre el impacto que
tiene dichos eventos sobre la magnitud de los caudales de los ros del pas, una correcta
previsin de dichas condiciones permitira al Sector Elctrico (y dems interesados) operar sus
sistemas de forma ms ptima; entre los impactos indirectos se pueden contabilizar las
ganancias derivadas de una operacin acertada del sector elctrico colombiano acorde con la
hidrologa del pas.

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-9
1.8 SOBRE LA ORGANIZACIN DEL DOCUMENTO
El capitulo 2 del presente documento describe de forma general las relaciones entre la
climatologa global y la hidrologa de Colombia y propone algunas tcnicas de diagnstico
climtico que permiten establecer la correspondencia entre los caudales de Colombia y
diversos sistemas macro-climticos; en el captulo 3 presenta una explicacin general de los
modelos de pronstico de caudales con mayor relevancia en el caso Colombiano, se
introducen algunas tcnicas de validacin y de pronstico probabilstico, as como algunas
tcnicas para mejorar la eficiencia de los modelos actuales concluyendo con la prediccin y
validacin de los esquemas de pronstico propuesto. En el captulo 4 se introducen dos
nuevas tcnicas para el pronstico de caudales, los polinomios localmente ponderados (o de
mnimos cuadrados mviles) y las redes Polinmicas y se comparan sus resultados con lo
modelos actuales de pronstico. El capitulo 5 introduce el concepto de comparacin y
combinacin de pronsticos y se aplican dichas metodologas al caso de los pronsticos de
caudales medios mensuales en Colombia, El captulo 6 introduce los rboles de regresin y
decisin aplicados al mejoramiento de los pronsticos y finalmente todos los captulos sern
concatenados en la construccin de un protocolo para pronosticar caudales usando modelos
matemticos y juicio experto, se hace un anlisis general de los resultados y las conclusiones
del trabajo.
1.9 DIFUSIN DE LOS RESULTADOS
Los trabajos y contribuciones de esta tesis han sido difundidos mediante la presentacin de
ponencias en congresos, y la publicacin de artculos en revistas especializadas, los cuales son
detallados a continuacin.
1.9.1 Artculos
ROJO, J. D. y L. F. CARVAJAL. 2010. Prediccin no lineal de caudales usando variables
macro-climticas y anlisis espectral singular. Tecnologa y Ciencias del Agua antes
Ingeniera Hidrulica de Mxico, vol 1, num 4, oct-dic de 2010, Mxico, pp 59-73.
1.9.2 Ponencias en eventos
Rojo J.D. Carvajal, L.F. Velsquez, J.D. (2010). Combinacin de pronsticos de Caudales
Medios Mensuales en el ro Guadalupe-Colombia. XXIV Congreso Latinoamericano de
Hidrulica. Punta del este-Uruguay.
Rojo J.D. Carvajal, L.F.( 2010). Simulacin no lineal de Caudales usando la trasformada en
Onditas. XXIV Congreso Latinoamericano de Hidrulica. Punta del este-Uruguay.
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-10
Rojo, J.D. 2010. Streamflow forecasting using CPT. A comparison with others Models and
incorporate the results in a Multimodel Ensemble; IAI Training Institute on the use of
seasonal climate predictions for applications in Latin America. Buenos Aires-Argentina.
1.9.3 Otros
http://www.agenciadenoticias.unal.edu.co/nc/detalle/article/optimizacion-de-metodos-para-
prediccion-de-caudales/
http://www.caracol.com.co/nota.aspx?id=1384587

















DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL 1-11
Referencias
Ceballos, L. I., y G. Poveda (2005), Diagnstico y Prediccin de El Nio 2002-2003, Avances
en Recursos Hidrulicos, No. 12, 183-198.
Carvajal, L.F., (1994), Acerca de la prediccin no lineal en hidrologa. Tesis de Maestra,
Universidad Nacional de Colombia, Facultad de Minas, Medelln, Colombia. 136 pp.
Carvajal, Luis F, Mesa, Oscar y Poveda, Germn. Prediccin Hidrolgica en Colombia
mediante Anlisis Espectral Singular y Mxima Entropa.(1998). En: Ingeniera Hidrulica en
Mxico. Vol. XII, Nm. 1, II poca, (enero-abril de 1998); p. 7-16.
Mnera, L. (1983). Modelos Estocsticos para las series Hidrolgicas, Universidad Nacional
de Colombia, Sede Medelln
Poveda, G., Mesa, O.J, L.F Carvajal, C.D Hoyos, J.F. Meja, L.A Cuartas y A. Pulgarn.
(2002). Prediccin de caudales medios mensuales en ros colombianos usando mtodos no
lineales. Meteorologa Colombiana, 6, 101-110.
Poveda, G. (2004), La Hidroclimatologa de Colombia: Una sntesis desde la escala
interdecadal hasta la escala diurna. Revista Academia Colombiana de Ciencias, Vol 28 (107),
201-222.

Rendn, L.( 1997). Beneficios de la prediccin Hidrolgica en el sector elctrico Colombiano,
considerando la variabilidad climtica. Tesis de Maestra Ingeniera Recursos Hidrulicos,
Facultad de Minas, Universidad Nacional de Colombia, Sede Medelln.
Smith R.A. et al. (2001). Modelos de prediccin de caudales mensuales para el sector
Elctrico Colombiano. Avances en recursos Hidrulicos, 11, Facultad de Minas, septiembre
de 2004. P 91-102.
Hoyos, C. (1999), Algunas aplicaciones de la transformada de Fourier y la descomposicin en
onditas a seales hidrolgicas y ssmicas. Tesis Ingeniera Civil, Universidad Nacional de
Colombia, Medelln.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA


Julin David Rojo Hernndez PARH -UNAL


Captulo 2:

Relaciones entre los caudales
de Colombia y la climatologa
global.

Las estaciones se suceden de la misma manera que en la mayor
parte de la zona trrida; esto es, se conocen dos, verano invierno: la
ltima cuando llueve y la otra cuando deja de llover.
Los meses de lluvia en Antioquia principian a mediados de Marzo y
terminan a mediados de Junio, para comenzar luego en Septiembre y
acabar en los primeros das de Diciembre; pero esta regla est sujeta a
numerosas variaciones, pues con frecuencia se invierten los tiempos,
volvindose lluviosos los das de verano y viceversa. A veces el ao
es hmedo en su mayor parte, y en ocasiones notable por su excesiva
sequedad, muchos de los viejos habitantes del pas creen haber
observado, y an lo afirman por la tradicin de sus mayores, que los
tiempos de lluvia abundante y de gran sequedad, estn divididos por
perodos casi fijos de siete a ocho aos. Nos parece que tienen razn.
Manuel Uribe ngel (1881).
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-1
2 RELACIONES ENTRE LOS CAUDALES DE COLOMBIA Y LA
CLIMATOLOGA GLOBAL
RESUMEN
En este captulo se analiza la variabilidad espacio-temporal de los caudales de los ros del
presente estudio. Se describen las relaciones que existen entre la climatologa global y las
series de caudales a escalas anuales, interanuales e interdecadales. Los resultados de los
anlisis de correlacin y de evaluacin espectral permiten afirmar que la magnitud y la
variabilidad del ciclo anual de los ros analizados est estrechamente ligado con el ciclo de la
precipitacin en el pas y depende de la ubicacin de sus cuencas sobre la geografa nacional,
la humedad del Chorro del Occidente Colombiano afecta principalmente los ros de norte y el
oriente antioqueo y que existe una fuerte dependencia de los ros Guavio y Bat de la
adveccin de humedad desde el amazonas.
A escala Interanual el sistema ENSO posee una fuerte influencia en los ros del presente
trabajo, y la variabilidad de los caudales en el pas est estrechamente vinculada a la
variabilidad de la temperatura del ocano Pacfico en las regiones Nio 3 y Nio 4. El ENSO
posee una mayor influencia sobre los ros del norte y el oriente antioqueo y su efecto
disminuye de occidente a oriente en el pas. El acoplamiento entre el sistema ENSO y el ciclo
anual de los caudales analizados muestra que la fase clida de dicho sistema provoca una
disminucin en la magnitud de los caudales ubicados en el centro occidente del pas.
A escala interdecadal se destaca la relacin existente entre los caudales del presente trabajo y
la PDO; los mtodos espectrales aplicados en el presente estudio detectaron los ciclos de 10-
12 aos, 5-3 aos, 2 aos, 6-12 meses 1 y 3 meses y finalmente el estudio de la persistencia
en las series de caudales permite demostrar que los caudales son altamente autodependientes.

2.1 HIDROCLIMATOLOGA DE COLOMBIA A DIFERENTES ESCALAS
ESPACIO-TEMPORALES
Los caudales de los ros en Colombia estn ligados a la alta variabilidad de los fenmenos
macro-climticos que influyen sobre la hidrologa a diversas escalas espacio-temporales;
cualquier evento hidrolgico que se desee modelar posee un carcter altamente no lineal y su
prediccin estar sujeta a cambios drsticos definidos por las condiciones iniciales y la
ubicacin espacio-temporal en la que se analicen las variables y fenmenos involucrados.
En trminos de la variabilidad a diferentes escalas temporales de la hidrologa en Colombia se
sabe que el clima del pas responde a tres tipos de eventos macro-climticos: el primero de
ellos relaciona aquellos sistemas de carcter astronmico que contribuyen forzando el clima
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-2
mediante procesos peridicos como los ciclos anuales y diurno de insolacin, en segunda
instancia se encuentran las oscilaciones climticas auto-reguladas derivadas de la
retroalimentacin no lineal entre distintos subsistemas y un tercer grupo de procesos
relacionados con las fluctuaciones aleatorias de los factores fsicos o qumicos que componen
el sistema climtico (Figura 2-1).

Figura 2-1 Tipos de eventos macro-climticos que afectan la hidrologa de Colombia.

Una sntesis de la hidrologa-climatologa de Colombia desde la escala inter-decadal hasta la
escala diurna fue presentada por Poveda en 2004 donde se pone en evidencia que el clima de
Colombia vara en todas las escalas temporales. A escala inter-decadal el cambio climtico por
accin antropognica ha aumentado la complejidad del sistema climtico puesto que el ser
humano se ha convertido en una nueva fuerza geofsica con capacidad para alterar los balances
naturales de gases trazadores como el CO
2
, en este sentido la amenaza ms evidente para
Colombia se ve reflejada en la inminente deforestacin de los bosques y las selvas y sus
consecuentes perturbaciones sobre los regmenes hidrolgicos. A escalas interde-cadales
tambin existen algunos fenmenos auto-regulados no lineales de importante influencia sobre
el clima de Colombia tales como la denominada Oscilacin Decadal del Pacfico (PDO) y la
Oscilacin del Atlntica Norte (NAO).
A escalas de tiempo inter-anuales la variabilidad climtica global est fuertemente controlada
por el evento El Nio/Oscilacin de sur (ENSO) el cual puede resumirse en un aumento de
las temperaturas superficiales del Pacifico tropical generando grandes alteraciones en los
patrones de circulacin de vientos, presiones atmosfricas superficiales, precipitacin y
nubosidad sobre el ocano Pacifico, la fase fra del ENSO se conoce como La Nia y tambin
altera de ostensiblemente el sistema climtico global. Los cambios en los balances de agua y
energa derivados del ENSO dan origen a fuertes perturbaciones hidro-climticas sobre la
geografa colombiana con altas repercusiones sociales, econmicas y ambientales que pueden
resumirse de la siguiente manera: durante El Nio se presenta una disminucin de
precipitacin y en consecuencia de los caudales de los ros as como la humedad del suelo y la
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-3
actividad vegetal, durante La Nia los eventos intensos de precipitacin son el comn
denominador y en consecuencia las frecuentes inundaciones, avalanchas, prdidas de vidas
humanas, cosechas e infraestructuras se convierten en la realidad nacional.
Desde el punto de vista temporal, la migracin meridional de la Zona de Convergencia
Intertropical (ZCIT) es uno de los mecanismos preponderantes para explicar la variabilidad
anual y semianual de la precipitacin en Colombia. La bimodalidad o unimodalidad de la
distribucin de la precipitacin en el ciclo anual est asociada al paso de la ZCIT por la
geografa Colombiana, as como de su interaccin con las circulaciones de los ocanos
Pacfico, Atlntico y de la cuenca del Amazonas. La distribucin espacial de la lluvia sobre
Colombia est asociada a la poca del ao. Cuando la ZCIT se encuentra ms al sur (en el
verano del hemisferio sur), la zona de la costa sobre el Caribe sufre una disminucin en las
lluvias; lo mismo sucede en la zona sur durante el verano del hemisferio norte (Julio-Agosto).
La ZCIT pasa dos veces por encima del territorio Colombiano; en su camino hacia el sur en la
poca de octubre- noviembre y hacia el norte en la poca de abril-mayo, produciendo dos
temporadas de ms alta pluviosidad (bimodalidad) en el centro de Colombia debido a la
presencia de la cordillera de los Andes (Meja et al. 1999).
A escalas de tiempo intra-anuales el paso de frentes sobre la geografa Colombiana puede
explicar buena parte del tiempo Atmosfrico en nuestro pas (aunque no todo). Las
oscilaciones de 30-60 das (Madden y Julian, 1971) caracterizadas por las anomalas de los
campos de presin y precipitacin en forma de ondas que afectan fuertemente el ciclo diurno
de precipitacin en Colombia. Otro tipo de frentes son las llamadas Ondas Tropicales del Este
que estn estrechamente ligadas a la formacin de tormentas y huracanes sobre el mar Caribe
y ocano Atlntico, se describen como ondas atmosfricas de circulacin ciclnica que se
desplazan desde el occidente de frica hacia el Atlntico con una longitud de onda de 2000
km, tienen adems un periodo de 4 a 8 das, otras viajan por la ZCIT con velocidad de
propagacin de 8 a10 m/s, longitud de onda entre 3000 y 4000 km y perodo en el rango entre
4-5 das (Mesa et al., 2007).
A escala diurna los grandes cambios de temperatura derivados del ciclo de insolacin (tambin
astronmico) representan un factor determinante en la formacin, desarrollo e intensidad de la
conveccin, mecanismo muy importante en la gnesis de la lluvia tropical. Se han observado
diferentes comportamientos cclicos diurnos segn las condiciones locales, y adems, estos
ciclos varan durante los distintos meses del ao dado que los mecanismos fsicos que explican
tales comportamientos tambin varan segn el tiempo y las condiciones macro-climticas
influyentes (Agudelo et al. 2001, Poveda, 2004).
Desde el punto de vista espacial los anlisis hidro-climticos tienen su fundamento en la
siguiente afirmacin: Colombia est situada en el trpico Americano Como una isla entre tres
ocanos (Snow, 1976) donde se incluye la cuenca del Amazonas; la presencia de los Andes
induce a la formacin de climas locales y regionales de alta complejidad y difcil
entendimiento por lo que cada pronostico hidrolgico varia de un lugar a otro (Mesa, Poveda
y Carvajal, 1997).
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-4
El ocano Pacifico es quizs uno de los mayores controladores del clima planetario y
Colombia no queda exento de su influencia. Adems de los ya mencionados fenmenos auto-
regulados como el ENSO y la PDO que afectan nuestra climatologa a diferentes escalas de
tiempo tambin existen otros aspectos como la corriente de vientos en chorro o Chorro del
Choc (Poveda & Mesa 1999,2000) que tiene alta influencia sobre el occidente y centro del
pas, es el responsable de que el Choc colombiano sea una de las regiones ms lluviosas del
mundo y est ligado a la formacin de sistemas convectivos de meso escala (Poveda, 1998)
sobre gran parte del pas.
Cuando los vientos alisios pasan por el istmo de Panam stos se recurvan y generan una
nueva corriente en chorro conocida como Chorro de San Andrs que trae consigo humedad
del ocano Atlntico y afecta la hidrologa de la costa Caribe Colombiana. Desde la cuenca del
Amazonas tambin se transportan grandes cantidades de humedad con incidencia directa en el
pie de monte llanero contribuyendo a la formacin de los grandes ros en la Orinoqua.
Para las cuencas tropicales la precipitacin reciclada es quizs uno de los aspectos que ms
influyen sobre la hidrologa, se estima que entre el 35% y el 50% de la lluvia tropical es
autogenerada (Cuartas y Poveda, 2002) y se sabe que la vegetacin del pas es muy eficaz en
la formacin de ncleos de condensacin para la activacin de la lluvia, en consecuencia
cualquier proceso de prediccin hidrolgica debera incluir la doble retroalimentacin biota-
clima y de ah la importancia de nuestra regin amaznica en el contexto internacional y de los
bosques tropicales para Colombia.
Los Andes como precursores en gran parte de nuestro paisaje contribuyen orogrficamente a
la modelacin del clima y la hidrologa del pas. La existencia en los valles interandinos del
ptimo pluviomtrico es un rasgo caracterstico en relacin al cambio de la precipitacin
segn la altura sobre el nivel del mar. Adems muchos de los frentes que transportan
humedad desde el ocano deben enfrentar la barrera impuesta por la cordillera y por ello la
distribucin de los regmenes hidrolgicos vara de un lado a otro del pas.
Lo anterior conlleva a que los intentos por predecir la hidrologa o la climatologa de nuestro
pas arrojen mucha incertidumbre y que los resultados dependan en gran medida de las
condiciones en las que se encuentre el ao analizado y la escala espacio temporal a la que se
desee predecir (Smith et al, 2004).

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-5
2.2 VARIABILIDAD ANUAL DE LOS CAUDALES EN COLOMBIA
2.2.1 El efecto de la ZCIT
El ciclo anual de la hidro-climatologa de Colombia est dominado por fenmenos fsicos
como la migracin latitudinal de la zona de convergencia intertropical (ZCIT), asociada con la
dinmica trans-ecuatorial de los vientos alisios del este, la actividad del chorro del Choc y los
sistemas convectivos de meso escala (Poveda, 2004).
La zona de convergencia intertropical (ZCIT) es un cinturn de baja presin que cie el globo
terrestre en la regin ecuatorial. Est formado, como su nombre indica, por la convergencia de
aire clido y hmedo de latitudes por encima y por debajo del Ecuador. El aire es empujado a
la zona por la accin de la clula de Hadley, un rasgo atmosfrico de escala sinptica que
forma parte del sistema planetario de distribucin del calor y la humedad; las regiones situadas
en esta rea reciben precipitacin ms de 200 das al ao; La posicin de esta regin vara con
el ciclo estacional siguiendo la posicin del sol en el cenit y alcanza su posicin ms al norte
(8 N) durante el verano del hemisferio norte, y su posicin ms al sur (1 N) durante el verano
del hemisferio sur.
La ZCIT constituye el mecanismo fsico de mayor relevancia en la explicacin del ciclo anual
(o semi-anual) de la hidroclimatologa de Colombia sobre el centro y el occidente de
Colombia dada la existencia de dos temporadas lluviosas (abril-mayo y octubre-noviembre) y
dos temporadas secas (diciembre-febrero y junio-agosto) como resultado del doble paso de la
ZCIT sobre el territorio nacional (Eslava 1993; Meja et al. 1999; Len et al. 2000; Poveda
2004, Poveda et al. 2007).
En el trabajo de Meja et al. (1999) se desarroll un estudio sobre la distribucin espacio-
temporal del ciclo anual de la precipitacin en Colombia cuyos resultados se muestran en la
Figura 2-2. All se esquematiza la suma vectorial del ciclo anual (correspondiente a un periodo
de doce meses) y semianual (con periodo de seis meses) para representar los mximos
absolutos de cada ciclo debidos a la variabilidad anual y semianual de la precipitacin en
Colombia, que se asocian directamente con la migracin de la ZCIT. El tamao de las flechas
representa la amplitud y la direccin de los vectores seala al mximo de cada ciclo dentro del
ao, con enero hacia el norte, julio hacia el sur, abril hacia el este y octubre al oeste. Cuando el
ngulo entre los vectores que salen de cada punto sea ms parecido a 180, el ciclo semianual
es ms importante que el anual. Cuando ambos vectores estn aproximadamente superpuestos
la explicacin es el predominio del ciclo anual sobre el semianual del dicho punto. Meja et al.
encontraron que el paso de la ZCIT por Colombia, ocasiona sobre la regin andina en el
centro del pas dos mximos temporales en la precipitacin, adems se observa que la
presencia de las cordilleras ejerce gran importancia en la direccin del mximo del ciclo anual.
En la Figura 2-3 se muestra la forma del ciclo anual para las diferentes series de caudal
estudiadas en el presente trabajo, es posible observar un comportamiento bimodal en las
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-6
estaciones ubicadas en las regiones centro y centro-occidente de Colombia, con valores
mximos en los periodos Abril-Mayo, y Octubre-Noviembre por lo que existe una
correspondencia entre los ciclos anuales de la precipitacin y de caudal. Los ros Guavio y
Bat ubicados en el extremo oriental de la cordillera oriental se ven fuertemente influenciados
por el efecto monznico de los vientos alisios y por tanto poseen un ciclo anual que
corresponde con la precipitacin en el oriente del pas. La magnitud y variabilidad del ciclo
anual de los caudales analizados en el presente trabajo se muestra en la Tabla 1, puede
constatarse que los meses de invierno son los ms variables dentro del ciclo anual.

Figura 2-2 Suma vectorial de los ciclo anual y semianual de la precipitacin en Colombia, Meja et al.
(1999).

2.2.2 El chorro del Occidente Colombiano (Chorro del Choc)
La corriente de vientos en chorro del occidente colombiano, o chorro del Choc (Poveda,
1998; Poveda & Mesa, 1999, 2000), es una corriente de vientos que ejerce una fuerte
influencia sobre la climatologa de Colombia, particularmente en las regiones occidental y
central del pas.
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-7

Figura 2-3 Ciclo anual de los caudales medios mensuales usados en el presente trabajo


DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-8
Tabla 2-1 Ciclo anual y variabilidad de los caudales medios mensuales del los ros analizados







DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-9
La distribucin de los vientos alrededor del trpico americano durante los meses de
septiembre, octubre y noviembre (Estacin SON) se presenta en la Figura 2-4. Es de notarse la
circulacin de oeste a este sobre el Pacfico oriental en la latitud de Colombia. Dichos vientos
se recurvan al pasar el Ecuador adoptando la direccin noreste en la costa pacfica colombiana.
El ciclo anual juega un papel muy importante en la dinmica de estos vientos ya que se
debilita durante El Nio y se intensifica durante La Nia. Los mecanismos fsicos que regulan
la posicin e intensidad de la corriente del Choco se describen a continuacin (Poveda, 1998,
Poveda y Mesa, 1997, 2000, Rendn, 2001, Mejia y Poveda 2005, Poveda et al., 2006):
Recurvatura de los vientos alisios: los vientos alisios que soplan sobre la costa del ocano
Pacfico de Sur Amrica cruzan la lnea ecuatorial en direccin primordial de sur a norte
asociados con la posicin casi permanente de la ZCIT al norte del ecuador. El cruce de
hemisferio de los vientos alisios significa un cambio en el signo de la aceleracin de Coriolis
que a su vez se ve reflejado en la ecuacin que describe la dinmica de los flujos trans-
ecuatoriales (Hastenrath, 1991 pp. 176).
Gradiente de temperaturas tierra-ocano: El calentamiento diferencial aumenta la energa
potencial del sistema continente-ocano al establecer una diferencia de presin entre las partes
de cada uno de los componentes del sistema. Dicho gradiente de presiones obliga a que el aire
ms frio y denso del ocano se mueva hacia el continente dando lugar a la entrada vigorosa de
aire hmedo procedente del ocano pacfico.
Gradiente de temperaturas en el ocano: la corriente del chorro del Choc obtiene su energa
del gradiente de temperaturas superficiales existente entre la zona de temperaturas mas fras de
la llamada Lengua fra en las aguas del Pacfico en Ecuador y Per, y las temperaturas mas
clidas del pacfico al frente de las costas de Colombia.

Figura 2-4 Magnitud y direccin de los vientos a 925 mb (m/s) para la estacin SON. Poveda et al
(2006).
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-10
La corriente de vientos del Chorro del Choc tiene su entrada principal hacia los 5N adems
est confinada en las capas ms superficiales de la atmsfera (1000 a 850 hPa), y satisface
todos los requerimientos que Stensrud (1996) le exige a las corrientes de bajo nivel y que son
enumeradas a continuacin: (1) Alcanza sus mximas velocidades de viento alrededor de 900-
1000hPa; (2) Est asociado con fuertes gradientes de temperatura ocano-tierra y por lo tanto
con baroclinidad superficial (Inestabilidad de presiones); (3) Exhibe considerable esfuerzo
cortante vertical y horizontal; (4) Est relacionado con el origen y desarrollo de fuerte
conveccin profunda; (5) Est asociado con fuerte transporte de humedad sobre el Pacfico
tropical del este; (6) Est intervenido por el desarrollo de sistemas convectivos de mesoescala
sobre el ocano Pacfico que penetran a Colombia e interactan con la ZCIT; (7) Est asociado
con el estrecho topogrfico que existe en el ramal occidental de los Andes entre 5N y 530
N, conocido como el Paso de Mistrat, donde el promedio de las alturas decrece desde
aproximadamente 3.000 a 1.500 m. Se considera que este estrecho acta como una boquilla de
convergencia de flujo, donde la velocidad de los vientos se incrementa y la presin decrece,
contribuyendo as a enfocar, sostener y desarrollar la corriente en forma de chorro.
Un indicador para la caracterizacin del chorro del Choc puede ser construido usando la
adveccin de humedad por el Paso de Mistrat, en la regin 5N-530 N & 77W-7730; La
adveccin de humedad se obtiene de multiplicar cada componente de los vientos (zonal y
meridional) por la humedad especfica en ese punto, la Figura 2-5 presenta los ndices Choc
zonal y Choc Meridional obtenidos a partir de los datos del re-anlisis NCEP-NCAR, y un
esquema del ciclo anual del chorro del Choc se presenta en la Figura 2-6. Durante la estacin
SON (Septiembre, Octubre, Noviembre) el trasporte de humedad por la corriente de vientos
del Choc alcanza sus mximos niveles por lo que el segundo periodo de inverno en Colombia
(SON) es mucho ms intenso en el centro occidente del pas (Poveda, 2004). La Figura 2-7
presenta los coeficientes de correlacin con rezago de un mes entre los caudales utilizados en
el presente estudio y las series de Choc zonal y Choc meridional. Los resultados muestran
fuertes dependencias (correlaciones > 0.6) entre los ros del occidente del pas y el Chorro del
Choc mientras en el centro y el oriente del pas la dependencia es menos evidente.

Figura 2-5 Componentes zonal y meridional de la adveccin de humedad en 5N-530 N & 77W-
7730.
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-11


Figura 2-6 Ciclo anual del trasporte de humedad por los vientos de la corriente del chorro del
Choch y su comportamiento durante los eventos de El Nio y La Nia (Rendn, 2001).


Figura 2-7 Correlacin entre los ndices zonal y meridional del chorro del Choc y los caudales del
presente estudio.

2.2.3 Adveccin de humedad desde el Amazonas
La cuenca del rio Amazonas es un excelente ejemplo de la interaccin existente entre el
sistema tierra-atmsfera. Debido a su gran tamao (> a 6.4 millones de kilmetros cuadrados)
su carcter tropical y su compleja dinmica eco-hidro-climtologica la cuenca del amazonas
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-12
ejerce una influencia a escala global (Poveda et al. 2006). Colombia posee en su territorio una
parte importante de la cuenca del rio amazonas, se sabe adems que gracias a la
retroalimentacin que existe entre los Andes y el Amazonas (Figura 2-8) el pie de monte
llanero corresponde a la regin ms lluviosa de dicha cuenca (Poveda, 2006). La humedad del
Amazonas es trada con mayor intensidad durante los meses de mayo a septiembre donde la
barrera orogrfica de los Andes la convierte en precipitacin convectiva afectando a buena
parte del oriente de Colombia. Del mismo modo que en el caso del Chorro del Choc, para la
humedad del amazonas puede ser construido un ndice de adveccin que permita cuantificar el
efecto de la cuenca del amazonas sobre los caudales del los ros de Colombia. Dicho ndice se
muestra en la Figura 2-9 y fue construido usando la adveccin de humedad en la regin 4N-
430 N & 72W-7230. Un anlisis de correlacin entre la componente meridional de la
adveccin de humedad desde el Amazonas y los caudales medios mensuales del presente
estudio se muestran en la Figura 2-10. Las mximas correlaciones se presentan con los ros del
oriente colombiano (superiores a 0.6).

Figura 2-8 Interaccin Suelo-Atmsfera en la cuenca del Amazonas. Poveda et al. (2006)


Figura 2-9 Componente meridional de la adveccin de humedad desde el Amazonas y su ciclo anual.

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-13

Figura 2-10 Anlisis de correlacin entre la adveccin de humedad desde el Amazonas (componente
meridional) y los caudales del presente estudio.
2.3 VARIABILIDAD DE LOS CAUDALES MEDIOS MENSUALES A ESCALA
INTER-ANUAL
La variabilidad climtica a escala de tiempo inter-anual a nivel global est fuertemente
controlada por el sistema El Nio/Oscilacin del Sur (ENSO). En general, la fase clida del
ENSO (El Nio), que inicia en la primavera boreal, se caracteriza por el aumento en la
temperatura superficial del ocano pacfico generando alteraciones importantes en la
circulacin de los vientos, las presiones atmosfricas y la precipitacin en todo el ocano
Pacfico, la fase fra se conoce como La Nia y en ambos casos las distorsiones en los
balances globales de agua y energa ocasionan fuertes perturbaciones hidr-climticas con
amplias repercusiones sociales, ambientales, ecolgicas y econmicas (Poveda, 2004).
La dinmica del ENSO y su relacin con la hidrologa de Colombia ha sido ampliamente
estudiada, por mencionar algunos trabajos: Poveda, (1994, 2004), Poveda & Mesa (1995,
1996, 1997) Poveda et al. (1998, 1999, 2001a, 2001b, 2010). En general, durante El Nio se
presenta una disminucin de la precipitacin en el pas, as como una disminucin en la
humedad del suelo y la actividad vegetal (Poveda et al, 2001a) acompaada de un aumento en
las temperaturas del aire. Durante La Nia ocurren anomalas con efectos contrarios
caracterizados por excesos en las lluvias.
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-14
Los mecanismos fsicos por los cuales se presentan dficits hidrolgicos durante El Nio se
pueden resumir como (Poveda, 2004): (1) debilitamiento del chorro del Choc. (2) el
debilitamiento de la corriente de chorro ecuatorial (700 hPa.). (3) la reduccin en la intensidad
y nmero de ondas tropicales del este sobre el Atlntico tropical norte. (4) el desplazamiento
de la ZCIT hacia el suroeste de su posicin normal como consecuencia de una celda de Hadley
anmala sobre el trpico americano, (5) la alteracin del balance de humedad atmosfrica, en
particular en los niveles ms bajos de la atmsfera (Cuartas y Poveda, 2002), los dficits de
humedad en el suelo afectan la evapotranspiracin de las plantas y por consiguiente
disminuyen la precipitacin reciclada.
En el presente trabajo es utilizado el Anlisis de Componentes principales y la correlacin
cruzada para cuantificar la relacin existente entre los caudales medios mensuales de los ros
en Colombia y el sistema ENSO. Los ros fueron reunidos en cuatro grupos a saber: ros de la
vertiente del Porce (RVP : Guadalupe, Tenche, Riogrande, Porce), ros de la vertiente del Nare
(RVN: Nare, Guatap, San Carlos, San Lorenzo); ros del valle del Magdalena (RVM:
Magdalena-Betania, Miel), y los ros del oriente Colombiano (ROC: Bat, Guavio). Con el
objeto de obtener la variabilidad conjunta de los ros se estim la primera componente
principal de las series de caudales estandarizados de cada grupo y esta se correlacion con las
anomalas de temperatura en los ocanos del planeta. Los resultados se muestran en la Figura
2-11. Las mximas correlaciones (0.5-0.6) se presentan en la zona de desarrollo del sistema
ENSO sobre el ocano pacfico, especficamente sobre la regin Nio-3.4 lo que evidencia la
fuerte dependencia que existe entre los caudales del occidente del pas y la variabilidad en
dicha regin del ocano pacfico.
Un anlisis de correlacin cruzada entre los rezagos de las series de caudales estandarizadas y
el ndice de oscilacin del sur (SOI) se muestra en la Figura 2-12. El ndice de oscilacin del
sur corresponde a la diferencia de los valores de presin estandarizados entre Tahiti y Darwin
y representa la componente de presiones del ENSO. Los resultados del anlisis de correlacin
indican que el sistema ENSO acta como una onda que se propaga de occidente a oriente en el
pas perdiendo intensidad en dicha direccin; el efecto del ENSO es casi inmediato sobre los
caudales del occidente del pas (mxima correlacin para rezagos de un mes) mientras en el
centro- oriente del pas el efecto del ENSO suele ser retardado y de menor intensidad
(mximas correlaciones para rezagos de cinco a seis meses). Se aprecia adems una
persistencia en el efecto de ENSO de ms de 6 meses sobre los caudales del occidente del pas.
El acoplamiento entre el sistema ENSO y el ciclo anual de los caudales, afecta la amplitud del
ciclo anual, mas no su fase (Poveda et al, 2010). La Tabla 2-2 presenta el ciclo anual de los
caudales medios mensuales durante los periodos La Nia, Normal y El Nio clasificados
segn el ndice ocenico de El Nio ONI (Oceanic Nio Index,: el promedio de tres meses
corridos de las anomalas de temperatura sobre la regin nio 3-4,
http://www.cpc.ncep.noaa.gov/products/analysis_monitoring/ensostuff/ensoyears.shtml) a
excepcin de los ros Guavio y Bat, la amplitud del ciclo incrementa durante la Nia y
decrece durante El Nio, sin embargo los efectos varan segn el rio y las condicin hidro-
climtica analizada.
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-15


Figura 2-11 Correlacin entre las anomalas de temperatura en los ocanos y la primera componente
principal de las series de caudales de los grupos RVP, RVNRVM,ROC.

El efecto de La Nia es ms intenso en el segundo periodo de invierno (SON) sobre los ros
del centro-occidente del pas, ello debido a una intensificacin en el trasporte de humedad por
el chorro del Choc (Poveda, 2004), mientras el efecto del Nio es mucho ms intenso durante
el primer periodo verano (DEF) donde se presentan los mnimos caudales (Tabla 2-2)




DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-16

Figura 2-12 Anlisis de correlacin entre el ndice de Oscilacin del Sur (SOI) y los caudales




DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-17

Tabla 2-2 El ciclo anual de los caudales para periodos Nia, Nio y Normal segn el ONI.






DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-18
2.4 VARIABILIDAD DE LOS CAUDALES MEDIOS MENSUALES A ESCALA
INTER-DECADAL
2.4.1 La Oscilacin Decadal del Pacfico (PDO)
La Oscilacin Decadal del Pacifico (PDO) puede describirse como un patrn de la variabilidad
climtica en el ocano Pacifico de caractersticas similares al fenmeno macro-climtico El
Nio/La Nia, ya que exhibe aproximadamente las mismas relaciones en cuanto a las
anomalas o desviaciones en las temperaturas superficiales del mar; pero a diferencia de ste,
la PDO tiene un perodo de oscilacin de ms o menos 10-20 aos y sus efectos se encuentran
localizados ms al Pacifico Norte.
Varios estudios independientes encuentran la evidencia considerable para apenas dos ciclos
completos de PDO en el ltimo siglo: los regmenes "fros" de PDO prevalecieron a partir de
1890-1924 y otra vez a partir de 1947-1976, mientras que los regmenes "calientes" de PDO
dominados a partir de 1925-1946 y a partir del 1977. As mismo, la predictibilidad para esta
oscilacin es bastante incierta, pero en la actualidad existen modelos de simulacin del clima
que ayudan a explicar la naturaleza y el comportamiento de este fenmeno macro-climtico.
El ndice PDO se obtiene tomando la primera componente principal de las anomalas de
temperatura en el ocano Pacfico Norte desde la latitud 20N hacia el polo norte (Figura
2-13).


Figura 2-13 Fases e ndice de la Oscilacin Decadal del Pacfico (PDO)
(http://jisao.washington.edu/pdo/PDO.latest).

Un anlisis de correlacin entre los caudales medios mensuales de los ros del presente estudio
y el ndice de la PDO muestra que existe una dependencia significativa entre los caudales y las
oscilaciones decadales para un rezago de dos meses y sus efectos son ms notorios en los ros
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-19
del occidente del pas donde se presentan las mayores correlaciones (correlaciones
significativas superiores 0.3). En la Figura 2-14 se presentan los coeficientes de correlacin
entre los caudales del presente estudio y la PDO para rezagos de dos meses.

Figura 2-14 Anlisis de correlacin entre la PDO (-2) y los caudales del presente estudio.
2.4.2 Oscilacin del Atlntico Norte
Es la alternacin de la masa atmosfrica entre las regiones subtropical y subpolar del ocano
Atlntico Norte; se caracteriza por variaciones en el gradiente de presiones a nivel del mar en
escalas mensual y estacional, en los vientos del oeste en las latitudes medias, en las
temperaturas superficiales del mar y en el clima de las regiones continentales adyacentes. Se
define en trminos de la variabilidad de la presin en dos sitios claves, un centro de presin en
las islas Azores, influenciado por el centro de alta presin subtropical, y el otro centro de
presin sobre Islandia, lugar donde predominan las bajas de presiones. Cuando la alta presin
subtropical est anormalmente fuerte y simultneamente est anormalmente profunda la baja
presin de Islandia, se presenta el modo positivo de la NAO y es cuando los vientos del oeste
del Atlntico estn anormalmente fuertes. Por otro lado, la fase negativa se da cuando ambos
centros de presin estn anormalmente dbiles lo que implica disminucin en los vientos. Se
sugiere que la precipitacin promedio sobre el Caribe y las Amricas tropicales podra variar
significativamente en los extremos de la NAO (Rogers, 1988). Esta observacin nos muestra
una primera evidencia del posible vnculo entre la situacin hidro-climatolgica de Colombia
y la NAO dada la influencia que estara ejerciendo la hidro-climatologa del norte de Amrica
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-20
del sur sobre la situacin del mar Caribe y el ocano Atlntico (Poveda y Mesa, 1996b).
Aunque los valores de las correlaciones no son muy altos, no son despreciables
estadsticamente. Adems, como los registros del SOI y la NAO parecen no correlacionados,
puede ser til involucrar la NAO como variable para tener en cuenta en modelos para
prediccin de la hidrologa colombiana. Un anlisis de correlacin cruzada entre la NAO y los
caudales de los ros usados para el desarrollo del presente trabajo se muestra en la Figura 2-16.



Figura 2-15 Fases e ndice de la NAO, adaptado de http://www.atmosphere.mpg.de
2.5 TCNICAS ESPECTRALES PARA LA CUANTIFICACIN DEL EFECTO DEL
MACROCLIMA SOBRE LA HIDROLOGA DE COLOMBIA
Fsicamente los caudales de los ros Colombianos deben ser tratados como un sistema
dinmico, no lineal y no estacionario cuya modelacin requiere del estudio y de la
incorporacin de los principales ciclos que afectan la produccin de escorrenta en cuencas
tropicales (Rojo, 2010). Con el objeto de Analizar a mayor profundidad el efecto de la
actividad macro-climtica en trminos del tiempo y la frecuencia sobre la hidrologa del pas
se han aplicado diversas metodologas espectrales como el anlisis espectral singular
(Carvajal, 1994 ;Rojo, 1998 Rojo & Carvajal, 2010) la transformada en onditas (Hoyos, 1999;
Poveda et al 2002, Rojo & Carvajal, 2010.) y la trasformada de hilbert Huang (Carmona,
2010). Dichas tcnicas permiten descomponer las series de caudales en el dominio tiempo-
frecuencia a fin de determinar los modos dominantes de la variabilidad para asociarlos a
diversos fenmenos fsicos. Por ejemplo ciclos anuales, semianuales, o de 30-60 dias (1-3
meses) pueden ser detectados con dichas tcnicas.
Usando el Anlisis Espectral Singular y la transformada en onditas Rojo y Carvajal (2010)
hallaron los modos de variabilidad ms importantes de los ros San Carlos, Grande, Nare,
Guavio y Betania (Tabla 2-3), en la Figura 2-18 se presentan los resultados de dicho anlisis
para la estacin RG8 del ro Riogrande usando la transformada en onditas; las componentes de
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-21
ms baja frecuencia suelen aportar una mayor cantidad de varianza dentro del sistema
dinmico en comparacin con las componentes de alta frecuencia consideradas ruido dentro
del anlisis espectral.


Figura 2-16 Anlisis de correlacin cruzada entre el ndice NAO y los caudales de los ros en
Colombia.
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-22
Tabla 2-3 Periodos asociados a las componentes principales en algunos ros de Colombia (Rojo &
Carvajal 2007)
1CP 2CP 3CP 4CP 5CP 6CP 7CP 8CP 9CP 10CP 11CP 12CP
RIO SAN CARLOS 128-256 32 14 8 4 8 - 3 5 4 3 4 - 2 3 4
RIO GRANDE 128 - 64 32 - 64 16 8 6 5 4 3 2 3 3 3
RIO NARE 128 - 64 32 16 8 8 6 5 4 4 3 3 2
RIO GUAVIO 128 - 64 16 64-12 6 5 4 4 2 3 2 2 2
RIO BETANIA 128 - 64 32-12 32-16 8 6 4 5 8 - 4 - 2 2 4 3 3

La utilizacin del espectro de potencias con onditas continas, especficamente la ondita de
Morlet, fue presentada en el trabajo de Poveda et al (2002) para cuantificar la influencia de los
fenmenos macro-climticos sobre la hidrologa de Colombia, dicha tcnica permiti localizar
en tiempo y en frecuencia, fenmenos fsicos presentes en las series de caudales; en la Figura
2-17 se presenta el espectro de potencias usando la ondita continua de Morlet para la serie de
caudales medios mensuales del ro Magdalena en la estacin Calamar, all se observan
perodos importantes de 6 y 12 meses (ciclo anual y semianual) y de 50 a 64 meses (asociados
al ENSO); en general, en todas las estaciones analizadas en dicho trabajo se observaron los
anteriores perodos como los de mayor importancia.


Figura 2-17 Aplicacin de la transformada continua en onditas usando la ondita Morlet para el ro
Magdalena en Calamar (Poveda et al, 2002)



DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-23
La trasformada en onditas tambin puede ser usada de forma discreta para descomponer una
seal en dos seales mediante el algoritmo de multiresolucin conocido como filtro de dos
bandas (Mallat,1989), de las dos componentes obtenidas una ser de alta frecuencia y la otra
de baja frecuencia. La aplicacin sucesiva del filtro a dos bandas sobre las componentes de
baja frecuencia permite descomponer una seal en mltiples niveles cuyos periodos
igualmente pueden ser asociados a diferentes eventos macro-climticos. En la Figura 2-18 se
presenta la descomposicin de la serie de caudales de la estacin RG8 (de Rio grande) usando
la transformada discreta de onditas con la ondita de Meyer.


Figura 2-18 Aplicacin de la trasformada discreta en onditas para 6 niveles de descomposicin usando
la ondita discreta de Meyer



DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-24
2.6 SOBRE LA AUTO-CORRELACIN Y LA PERSISTENCIA EN LAS SERIES
DE CAUDALES
La autocorrelacin es una herramienta matemtica utilizada frecuentemente en el
procesamiento de seales. La auto-correlacin se define como la correlacin cruzada de la
seal consigo misma. La funcin de auto-correlacin resulta de gran utilidad para encontrar
patrones repetitivos dentro de una seal, como por ejemplo, la periodicidad de una seal
enmascarada bajo el ruido o para identificar la frecuencia fundamental de una seal que no
contiene dicha componente, pero aparecen numerosas frecuencias armnicas de esta.
Otra caracterstica de inters de las series de caudales es aquella relacionada con el
almacenamiento de embalses a largo plazo. Los primeros anlisis fueron desarrollados por
Hurst (1951) empleando un estadstico conocido con el nombre de rango reajustado a las
desviaciones acumuladas o rango de fluctuacin. El rango de fluctuacin ) ( * n R puede
considerarse como la capacidad que un embalse debera tener para suplir una demanda igual a
la media sin incurrir en vertimientos o dficit durante un periodo de n aos, por ello es un
indicativo de la intensidad y duracin de las sequas que presenta la serie de caudales.
En sus investigaciones Hurst (1957) calcul el valor de ) ( * n R para mltiples series del ro
Nilo, de los ms diversos tamaos y cada valor de ) ( * n R lo dividi por la desviacin tpica
de la serie de n observaciones, obteniendo el estadstico ) ( / ) ( * n S n R conocido con el
nombre del rango ajustado reescalado. Hurst encontr que este estadstico variaba con el
tamao de la muestra n de manera exponencial (Poveda, 1993). El hecho de que el exponente
h no sea igual a 0.5 es lo que se conoce como fenmeno de Hurst y dicho exponente se le
relaciona con la persistencia en la serie, una medida que indica el grado de influencia del
presente sobre el futuro. Las series con un 5 . 0 > h son series persistentes donde la auto
dependencia juega un rol importante en el proceso, as por ejemplo 7 . 0 5 . 0 < < h implica
persistencia es de corto plazo y 7 . 0 > h implica persistencia de largo plazo. 5 . 0 = h
correspondera a series con distribucin normal no persistentes, lo que equivale a un ruido
blanco, y 5 . 0 < h corresponde a series antipersistentes.
2.7 ANLISIS DE RESULTADOS
El ciclo anual de los ros analizados est estrechamente ligado con el ciclo anual de la
precipitacin en el pas y depende de la ubicacin de las cuencas sobre la geografa nacional.
Los caudales de los ros ubicados en el centro-occidente del pas (Tenche, Guadalupe,
Riogrande, Porce, Nare, San Carlos, San Lorenzo, Guatap, Miel y Betania) poseen un ciclo
bimodal dada la fuerte influencia de la ZCIT sobre los andes colombianos, mientras los ros
del oriente del pas (Guavio y Bat) poseen un ciclo unimodal reflejando la dependencia que
poseen con los procesos ocurrentes en las estribaciones cordillera oriental. Finalmente los
caudales en los meses de invierno poseen una mayor variabilidad que los caudales en meses de
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-25
verano por lo que el ciclo anual no solo est ligado a la magnitud de las descargas sino
tambin a su varianza.


Figura 2-19 Autocorrelogramas de las series de caudales estandarizadas


Segn el anlisis de correlacin entre los ndices zonal y meridional del Chorro del Choc y
los ros analizados, la humedad del Chorro del Occidente Colombiano afecta principalmente
los ros de norte y el oriente Antioqueo (Occidente del pas) pues se obtienen correlaciones
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-26
significativas superiores a 0.6. El anlisis de correlacin tambin demuestra que el efecto del
chorro del Choc se disipa de occidente a oriente con correlaciones inferiores (aunque
significativas) para los ros Magdalena, Miel, Guavio y Bata. La intensificacin del Chorro del
Choc durante la estacin SON coincide con las estacin ms lluviosa de los ros Tenche,
Guadalupe, Riogrande, Porce, Nare, San Carlos, San Lorenzo y Guatap lo que refuerza la
hiptesis de que el chorro del Choc hace que la segunda temporada invernal (OND) sea de
mayor magnitud que la primera temporada invernal en los meses MAM.
La estrecha relacin entre los Andes de Colombia y la cuenca del Amazonas explica de forma
significativa la variabilidad de los caudales del oriente del pas. La intensificacin de la
adveccin de humedad desde el Amazonas entre mayo y septiembre coincide con un
incremento significativo en los caudales de los ros Bat y Guavio. El anlisis de correlacin
entre la componente meridional de adveccin de humedad desde el Amazonas y los caudales
de los ros involucrados en el presente trabajo muestra que los ros Guavio y Bat poseen una
fuerte dependencia (correlaciones superiores a 0.6) con la humedad proveniente del
Amazonas. Los ros Magdalena y Miel son moderadamente afectados por la humedad del
Amazonas y los ros del occidente Colombiano poseen baja correlacin (inferior a 0.3) con
dicha variable.
A escala Interanual el sistema ENSO posee una fuerte influencia en los ros del presente
estudio. El anlisis de correlacin entre las componentes principales de los diferentes
conjuntos de ros y las anomalas de temperaturas en el pacfico demuestran la vinculacin que
existen entre la variabilidad de los caudales y la variabilidad de la temperatura del ocano
Pacfico en las regiones Nio 3 y Nio 4 dado que all se presentan las mximas
correlaciones. Espacialmente el ENSO posee una mayor influencia sobre los ros del norte y el
oriente antioqueo y su efecto disminuye de occidente a oriente. Las correlacin entre el
ndice SOI y los caudales del presente trabajo muestran que la dependencia entre el ENSO y
las descargas de los ros varia temporalmente, mientras los ros del occidente del pas se ven
afectados por el ENSO casi inmediatamente (mxima correlacin para rezagos de un mes) los
caudales del oriente del pas se ven afectados cinco o seis meses despus. El acoplamiento
entre el sistema ENSO y el ciclo anual de los caudales analizados muestra que la fase clida de
dicho sistema provoca una disminucin en la magnitud de los caudales del centro-oriente del
pas y en el oriente del pas los efectos se observan poco significativos. La fase Fra del ENSO
(La Nia) incrementa la intensidad del Chorro del Choc y provoca un aumento en los valores
del ciclo anual de caudales en el occidente del pas. A escala interanual existe una relacin
significativa (correlaciones superiores a 0.3) entre la PDO y los caudales del cetro-occidente
del pas mientras las correlaciones con la NAO son muy bajas.
La localizacin temporal y de frecuencia de los mtodos espectrales, permite el estudio de
fenmenos transitorios, y ayuda a entender el comportamiento no lineal existente entre la
climatologa global y la hidrologa de Colombia. Es posible asociar los picos espectrales con
fenmenos fsicos con mayor claridad. Con los mtodos espectrales se detectaron los ciclos de
10-12 aos, 5-3 aos, 2 aos, 6-12 meses 1 y 3 meses. A manera de diagnstico se pueden
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-27
relacionar los periodos de las componentes de baja frecuencia con los ciclos que presentan las
variables macro-climticas cuya influencia es de carcter interanual como por ejemplo la PDO
(10 aos), el ENSO (Entre 3 y 5 aos), el ciclo anual y semi-anual con perodos de 12 y 6
meses. Los perodos menores pueden estar relacionados con variaciones intranuales como el
paso de la zona de convergencia intertropical (ZCIT) y los diferentes periodos de verano e
invierno en el pas; Las componentes de alta frecuencia pueden relacionarse con variables
como las oscilaciones de Madden-Julian (1-3 meses). En la mayora de los casos las
componentes de baja frecuencia (10,5, 3 aos) son las de mayor aporte a la variabilidad de los
caudales los resultados del anlisis espectral Singular.
El estudio de la autocorrelacin y la persistencia permite demostrar que los caudales
analizados en el presente trabajo son altamente autodependientes y poseen persistencias muy
altas.
















DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-28
Referencias
Agudelo P.A, Arias, Salazar L.F (2002). Caracterizacin del ciclo diurno de precipitacin en
los andes tropicales de Colombia, Regin Centro. Trabajo dirigido de grado, Ingeniera Civil,
Universidad Nacional de Colombia, sede Medelln.
Carmona M.A. (2010). Identificacin de modos principales de variabilidad hidroclimtica en
Colombia y la cuenca Amaznica. Tesis de Maestra en Ingeniera - Recursos Hidrulicos.
Universidad Nacional de Colombia.
Cuartas, L. A., y G. Poveda (2002), Balance atmosferico de humedad y estimacion de la
precipitacin reciclada en Colombia segn el Reanalisis NCEP/NCAR. Meteorologa
Colombiana 5:49-57.
Hastenrath, S., (1991). Climate Dynamics of the Tropics. Kluwer Academic Publishers,
Dordrecht, The Netherlands, 488 pp.
Hoyos, C. (1999)., Algunas Aplicaciones de la Transformada de Fourier y la Descomposicin
en Onditas a Seales Hidrolgicas y Ssmicas. Trabajo Dirigido de Grado, Ingeniera Civil,
Facultad de Minas, Universidad Nacional de Colombia, Sede Medelln.
Eslava, J. (1993). Algunas particularidades climticas de la regin pacfica Colombiana.
Atmsfera 17:4563
Meja, J.F.; Mesa, O.J.; Poveda G. (1999) Distribucin especial de los ciclos anual y
semianual de la precipitacin en Colombia. DYNA 127:726
Len, G.E. Zea, J.A., Eslava J.A. (2000). General circulation and the intertropical convergence
zone in Colombia (in Spanish). Meteorol Colomb 1:3138.
Poveda, G., y Mesa, O.J.. (1993). Metodologas de prediccin de la hidrologa Colombiana
considerando el evento El Nio-Oscilacin del Sur (ENOS). Revista Atmsfera, 17, Sociedad
Colombiana de Meteorologa, Bogot.
Poveda, G., and Mesa O. J. (1994), Estimation of the Hurst exponent and GEOS diagrams for
a non-stationary stochastic process. In: Time Series Modelling of Water Resources and
Environmental Systems, K. W. Hipel y A. I. McLeod (Eds.), Kluwer Academic Publisher,
Amsterdam, pp. 409-420.
Poveda, G., Cuantificacin del Efecto de El Nio y La Nia sobre los caudales en Colombia,
Memorias del XVI Congreso Latinoamericano de Hidrulica e Hidrologa, IAHR, Santiago de
Chile, 107-117, 1994b.
Poveda, G., Funciones Ortogonales Empricas en el Anlisis de la Relacin entre los Caudales
Medios en Colombia y las Temperaturas de los Ocanos Pacfico y Atlntico, Memorias del
DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-29
XVI Congreso Latinoamericano de Hidrulica e Hidrologa, IAHR, Santiago de Chile,
Volumen 4, 131-144, 1994c.
Poveda, G., y Mesa, O.J.,(1995) .The Relationship between ENSO and the Hydrology of
Tropical South America,. The Case of Colombia, Proceedings of the Fifteenth Annual
American Geophysical Union Hydrology Days, Atherton, CA, USA, Hydrology Days
Publications, 227- 236,,.
Poveda, G. (1996), Modulacin de la Hidroclimatologa de Colombia por el ENSO y otros
Fenmenos de Gran Escala, Trabajo de promocin a profesor Asociado, Posgrado en
Aprovechamiento de Recursos Hidrulicos, Universidad Nacional de Colombia, Medelln,.
Poveda, G., Mesa, O.J. (1997). Feedbacks between hydrological processes in tropical South
America and large-scale oceanicatmospheric phenomena. J Clim 10:26902702.
Poveda G, Gil MM, Quiceno N (1998) El ciclo anual de la hidrologa de Colombia en relacin
con el ENSO y la NAO. Bull Inst Fr Etud And 27(3):721731.
Poveda, G. Mesa, O.J. (1999) The low level westerly jet (CHOCO jet) and two other jets in
Colombia: climatology and variability during ENSO phases (in Spanish). Rev Acad Colomb
Cienc 23(89):517528
Poveda G, Gil MM, Quiceno N (1999) The relationship between ENSO and the annual cycle
of Colombias hydro-climatology. 10th Symposium on Global Change Studies. Am Met Soc,
Dallas.
Poveda, G., Mesa, O.J. (2000). On the existence of Llor (the rainiest locality on Earth):
enhanced ocean-atmosphere-land interaction by a low-level jet. Geophys Res Lett 27:1675
1678.
Poveda G, Jaramillo A, Gil MM, Quiceno N, Mantilla R (2001a) Seasonality in ENSO related
precipitation, river discharges, soil moisture, and vegetation index (NDVI) in Colombia.
Water Resour Res 37(8):21692178
Poveda G, Rojas W, Vlez ID, et al (2001b) Coupling between annual and ENSO timescales in
the malaria-climate association in Colombia. Environ Health Persp 109:489493
Poveda G, Salazar LF (2004) Annual and interannual (ENSO) variability of spatial scaling
properties of a vegetation index (NDVI) in Amazonia. Rem Sens Environ 93:391401.
Poveda, G. (2004), La Hidroclimatologa de Colombia: Una sntesis desde la escala
interdecadal hasta la escala diurna. Revista Academia Colombiana de Ciencias, Vol 28 (107),
201-222.

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONSTICO
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julin David Rojo Hernndez PARH-UNAL


2-30
Poveda, G. Waylen, P., Pulwarty R. (2006). Annual and inter-annual variability of the present
climate in northern South America and southern Mesoamerica/ Palaeogeography,
Palaeoclimatology, Palaeoecology 234 327.
Poveda, G. Vlez, J.I., Mesa, O.J. (2007). Linking long-term water balances and statistical
scaling to estimate river flows along the drainage network of Colombia. Jour Hydrol Eng
12(1):413
Rojo, J. D. & Carvajal L.F.( 2010). Prediccin no lineal de caudales usando variables macro-
climticas y anlisis espectral singular. Tecnologa y Ciencias del Agua antes Ingeniera
Hidrulica de Mxico, vol 1, num 4, oct-dic de 2010, Mxico, pp 59-73.
Stensrud DJ (1996) Importance of low-level jets to climate: a review. J Clim 9:16981711.
Snow JW (1976) The climate of northern South America. In: Schwerdtfeger W (ed) Climates
of Central and South America. Elsevier, Amsterdam, pp 295403
Nepstad DC, de Carvalho CR, Davidson EA., and co-authors (1994) The role of deep roots in
the hydrological and carbon cycles of Amazonian forests and pastures. Nature 372:666669
Madden, R.A., y P. R. Julian, (1971). Detection of a 40-50 day oscillation in the zonal wind in
the tropical Pacific. J. Atmos. Sci. 28, 702-708.
Mesa, O. J., and G. Poveda (1993), The Hurst Effect: The scale of fluctuation approach, Water
Resources Research, Vol. 29, No. 12, 3995-4002.
Mesa, O. J., Poveda, G. y Carvajal, L.F (1997). Introduccin al Clima de Colombia, Imprenta
Universidad Nacional de Colombia, Bogot.
Mallat, S.(1989) "Multiresolution approximation and wavelet orthonormal bases of L2,
Trans. Amer. Math. Soc., June.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA


Julin David Rojo Hernndez PARH -UNAL


Captulo 3:

Mtodos actuales para el
pronstico de caudales


Fsicamente los caudales de los ros en Colombia deben ser tratados
como un sistema dinmico, no lineal y no estacionario cuya
modelacin requiere del estudio y de la incorporacin de los
principales ciclos que afectan la produccin de escorrenta en cuencas
tropicales. Dado que no se conoce a ciencia cierta el proceso de
formacin de la variable dinmica que se desea modelar, el anlisis de
regresin se convierte en la herramienta bsica del presente trabajo.
Pese a tener fundamento en muchas suposiciones que se hacen sobre el
proceso dinmico, el anlisis de regresin perite corroborar dichas
suposiciones si se tiene una cantidad suficiente de datos, adems los
modelos de regresin suelen ser tiles an cuando los supuestos sean
violados moderadamente, aunque no pueden lograr un rendimiento
ptimo.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-1
3 METODOS ACTUALES PARA EL PRONSTICO DE CAUDALES
RESUMEN
En el presente captulo se introducen los modelos matemticos ms aplicados en la prediccin
de caudales medios mensuales en Colombia. Se describen las ecuaciones fundamentales de
los diferentes esquemas de regresin y se explica brevemente la estrategia de validacin
utilizada para comparar la habilidad de pronstico de los modelos expuestos, adems se
introduce el procedimiento usado en la estimacin los intervalos de confianza y las
previsiones probabilsticas. Se proponen algunas tcnicas para mejorar la capacidad de
pronstico de los diferentes modelos entre ellas el tratamiento y manejo de la informacin, la
inclusin de esquemas peridicos y el uso de tcnicas de descomposicin espectral.
Finalmente se presenta un protocolo para la prediccin de caudales medios mensuales en
Colombia usando los mtodos de regresin existentes. Los resultados de la aplicacin de
dicho procedimiento sugieren que se puede lograr un buen ajuste si se combinan esquemas
peridicos de pronstico con mtodos espectrales; un modelo hbrido entre el MARS y la
transformada en onditas es el ms eficiente de los modelos convirtindose en el referente ante
eventuales mejoras propuestas durante la tesis.
3.1 INTRODUCCIN AL ANLISIS PREDICTIVO
En la prediccin de caudales medios mensuales en Colombia diversas tcnicas han sido
exploradas, todas surgidas del anlisis predictivo, un rea del anlisis estadstico que se refiere
a la extraccin de informacin a partir de datos histricos para usarla en la inferencia de
futuras tendencias y patrones de comportamiento. Bsicamente el anlisis predictivo busca
captar las relaciones entre variables explicativas y una variable de inters usando diversas
tcnicas que relacionan los hechos histricos y actuales para hacer predicciones sobre
acontecimientos futuros.
Una amplia cantidad de mtodos surgidos de la matemtica aplicada (Funciones multivariadas
de aproximacin), el anlisis estadstico (regresiones no paramtricas), la inteligencia artificial
(redes neuronales, sistemas de aprendizaje), y la minera de datos (tcnicas de seleccin y
agrupamiento de datos) han sido sugeridas para abordar dicho problema y todas ellas
conducen al denominado anlisis de regresin, considerado como la herramienta bsica del
anlisis predictivo cuando la atencin se centra en conocer la relacin que existe entre una
variable dependiente y una o ms variables independientes. Ms concretamente, el anlisis de
regresin ayuda a entender cmo cambia el valor tpico de la variable dependiente cuando
cambia cualquiera de las variables independientes. Por lo general, el anlisis de regresin
estima el valor esperado (esperanza condicional) de una variable dependiente y dadas las
variables independientes ( )
n
X X X ,....., ,
2 1
, y, con menos frecuencia (pero no menos
importante), la atencin se centra en un cuantil u otros parmetros de localizacin de la
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-2
distribucin condicional de la variable dependiente en funcin de las variables independientes,
algo que comnmente se conoce como prediccin probabilstica. En todos los casos, el
objetivo es el de desarrollar una funcin de estimacin denominada funcin de regresin, cuya
forma general es la siguiente:
( ) + =
n
X X X f y ,....., ,
2 1
3-1

Sobre el dominio( )
n
n
R D X X X ,....., ,
2 1
que contiene los datos. El valor determinstico
obtenido de la evaluacin del vector n dimensional de argumentos en la funcin f refleja la
relacin conjunta de y sobre ( )
n
X X X ,....., ,
2 1
. La componente estocstica se define de
forma tal que su valor esperado sea cero, reflejando la dependencia de y con otros valores
( )
* *
2
*
1
,....., ,
n
X X X que no son controlados por el observador, ni estn presentes en la muestra
histrica.
Dado que no se conoce a ciencia cierta el proceso de formacin de la variable dinmica que se
desea modelar, el anlisis de regresin se fundamenta en muchas suposiciones que se hacen
del proceso, las cuales pueden ser corroboradas si se tiene una cantidad suficiente de datos, sin
embargo los modelos de regresin son tiles an cuando los supuestos sean violados
moderadamente, aunque no pueden lograr un rendimiento ptimo.
A continuacin se presenta de forma general algunos mtodos se regresin utilizados para el
pronstico de caudales medios mensuales en Colombia, con sus hiptesis bsicas y los
conceptos generales usados en la creacin de las diversas herramientas computacionales.

3.2 TCNICAS DEL ANLISIS PREDICTIVO APLICADAS EN LA PREDICCIN
DE CAUDALES
3.2.1 Regresin lineal Mltiple (RLM)
En el modelo de regresin lineal se analiza una relacin entre una variable dependiente y un
conjunto de variables independientes o de prediccin expresada como una funcin lineal. Los
parmetros son ajustados minimizando el tamao de los residuos buscando que su distribucin
corresponda a un ruido blanco.
El modelo lineal general determinstico (sin variable aleatoria) es de la forma:
n n
X C X C X C y + + + = ...
2 2 1 1
3-2

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-3
Donde y es el valor estimado de la variable dependiente, el conjunto ( )
n
X X X ,...., ,
2 1

contiene las variables independientes y el vector ( )
n
C C C ,...., ,
2 1
representa los parmetros de
ajuste desconocidos.
En general se tienen p observaciones de la variable dependiente y p observaciones para cada
una de las variables independientes, obtenindose p ecuaciones para n coeficientes
desconocidos, por lo que el nmero de observaciones p debe ser mayor o igual a n . En la
prctica, p debe ser por lo menos cuatro o cinco veces n . Las p ecuaciones son de la forma:
p n n p p p
n n
n n
X C X C X C y
X C X C X C y
X C X C X C y
, , 2 2 , 1 1
1 , 2 , 2 2 2 , 1 1 1
1 , 1 , 2 2 1 , 1 1 1
...
...... .......... .......... .......... .......... ..........
...
...
+ + + =
+ + + =
+ + + =
3-3

Donde
i
y es la i -sima observacin de la variable dependiente y
ij
X es la i -sima
observacin de la j -sima variable independiente. Las ecuaciones anteriores se pueden
rescribir de forma matricial como:
(
(
(
(

(
(
(
(
(

=
(
(
(
(
(

n p n p p
n
n
p
C
C
C
X X X
X X X
X X X
y
y
y
.
....
. .. . .
....
....
.
.
1
1
, , 2 , 1
1 , 1 , 2 1 , 1
1 , 1 , 2 1 , 1
2
1
3-4

En forma abreviada XC Y = , donde Y es el vector 1 p de observaciones de la variable
dependiente, X es la matriz n p formada por las p observaciones de cada una de las n
variables independientes y C es el vector 1 n de los parmetros de ajuste desconocidos. El
vector de parmetros C puede ser estimado minimizando

i e
2
, donde
j i
p
j
j i i i i
X C y y y e
,
1


=
= = , y
j
C

es el valor estimado de
j
C usando mnimos cuadrados.
Finalmente, luego de derivar e igualar a cero, se obtiene la siguiente expresin para estimar
C :
( ) Y X X X C
T T
1


= 3-5

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-4
El modelo de regresin lineal asume que los errores
i
e son independientes y estn
idnticamente distribuidos, adems se requiere que las variables
ij
X sean independientes (no
estn correlacionadas) y que la observaciones de variable dependiente
i
y estn normalmente
distribuidas.
Pese a sus hiptesis, el modelo de regresin lineal mltiple es fcilmente programable y puede
ser ampliamente utilizado en problemas relacionados con el aprovechamiento de los recursos
hidrulicos. Algunos trabajos como el de Carvajal et al. (1998), Poveda et al. (2002), Smith
et al. (2004), Rojo y Carvajal (2010) han usado la regresin lineal mltiple para la prediccin
de caudales medios mensuales, ya sea utilizando una regresin general (que ajuste toda la
muestra) o mediante una regresin peridica (que ajusta una regresin por mes). Como
antecedente, en el trabajo de Poveda et al. (2002) los modelos PREBEO (RLM + ONDITAS)
y RLM fueron en su orden los de mayor habilidad de pronstico puesto que exhiben los
menores errores de prediccin, para todos los ros y todas las ventanas de pronstico.
3.2.2 Modelos de series de tiempo
Los modelos de series temporales buscan representar el hecho de que los datos tomados a
travs del tiempo pueden tener una estructura interna (como la persistencia, la tendencia o la
variacin estacional) que deben tenerse en cuenta a la hora de elaborar un pronstico, dado
que, en la modelacin de la trayectoria dinmica de una variable, se pueden mejorar las
previsiones mediante la proyeccin de dicha estructura interna. La primera aproximacin a los
modelos estocsticos son los denominados procesos autorregresivos construidos sobre
variables estandarizadas
i
z de la serie de los
i
y . Es decir:
k
k k i
k i
y
z


=
,
,
3-6

Donde
k
y
k
corresponden a la media y la varianza del mes k al que pertenece la i -sima
observacin de los
k i
y
,
.
Los modelos auto-regresivos de orden p AR(p) pueden describirse como aquellos en los que
una variable estandarizada
t
z en el tiempo t se explica, al menos en parte, en funcin de los
valores pasados de esa misma variable, as por ejemplo:
t p t p t t t
z z z z + + + + =

...
2 2 1 1
3-7
Donde:
t
z : Es el valor de la variable estandarizada en el instante t , y
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-5
t
: Ruido independiente de
k t
z

para todo 1 k .
Los parmetros de la ecuacin,
i
, presentes en la expresin 3-7 se estiman mediante las
ecuaciones de Yule-Walker, que en forma matricial se expresan como:
(
(
(
(
(
(
(

+ + + =
+ + + =
+ + + =
+ + + =
p p p p
p
p
p




...
..... .......... .......... .......... ..........
...
...
...
2 1
3 3 2 3 1 3
2 2 2 1 2
1 1 2 1 1
3-8

Donde los
k
corresponden a los coeficientes de auto-correlacin de orden k .
Los modelos ARMA son modelos estocsticos que combinan los modelos autorregresivos
(AR) con los modelos de media mvil (MA), cuya forma general est dada por:
q t q t t p t
z

+ + + = ... ... z z
1 1 p 1 - t 1 t
3-9

Donde los parmetros
i
,
q
y
i
tienen el mismo significado que para los modelos AR(p) y
MA(q).
Una manera eficiente de garantizar la estacionalidad de una serie consiste en diferenciarla la
cantidad d de veces que sea necesaria, En general, la diferenciacin de orden d tiene la
forma:
d t t t
z z a

= 3-10

Los modelos autorregresivos integrados de media mvil (ARIMA), equivalen a aplicar un
modelo ARMA sobre la serie de caudales no estacionaria diferenciada y su representacin es
como se muestra a continuacin:
t t
d
a B z B ) ( ) ( = 3-11

Donde
t
z corresponde a la serie estandarizada, ) (B son los coeficientes de la parte auto-
regresiva, ) (B los coeficientes de media mvil del modelo y
d
el diferenciador de orden
d .
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-6
Quizs los modelos autorregresivos fueron los primeros en ser usados en la prediccin de
caudales medios mensuales en Colombia, trabajos como el de Mesa et al (1995), Poveda et al
(2002), Smith et al (2004), muestran que los modelos autoregresivos lineales han sido poco
eficientes pese a su facilidad en la programacin; sin embargo el desempeo de dichos
modelos mejora contundentemente cuando se estima el ruido mediante una tcnica bilineal
(Cadavid, 2009) o cuando se combinan con una tcnica espectral (Carvajal, 1994; Carmona
2010).
3.2.3 Redes Neuronales Artificiales RNA
Una tpica red neuronal consiste en una estructura conformada por un nmero de elementos
(nodos) y las lneas de conexiones entre stos. Los nodos correspondes a los elementos
computacionales de la red y usualmente son conocidos como neuronas pues su diseo se basa
en el funcionamiento de las neuronas que se encuentran en el cerebro humano. Las lneas de
conexin transfieren informacin entre un par de neuronas y sobre cada conexin se designa
un valor denominado peso de la conexin.
Una red neuronal usualmente posee una matriz de datos de entrada, que constituyen la
denominada capa de entrada, las neuronas en la red acumulan los datos de entrada
multiplicados por los pesos en las conexiones y mediante frmulas de transformacin
matemtica, conocidas como funciones de transferencia, convierte dichas acumulaciones en
las salidas de cada neurona. Las salidas de cada neurona generalmente son distribuidas (pero
no divididas) segn el numero de conexiones a fin de proveer de entradas a otras neuronas que
se encuentran en una nueva capa denominada capa oculta. Por ltimo las salidas de la capa
oculta son trasformadas y llevadas por medio de conexiones a la neurona de salida.
A manera de ejemplo en la Figura 3-1 se propone una topologa de red neuronal para predecir
una variable dependiente y , dadas las variables explicativas ( )
3 2 1
, , X X X , la red sugerida
posee seis neuronas esquematizadas por los crculos, cada par de neuronas se conecta con una
flecha o conexin sobre la cual existe un peso
n m
w
,
siendo m la neurona de partida de la
conexin y n la neurona de llegada. El nmero de neuronas de la capa de entrada es de tres
(neuronas 1, 2 y 3), el nmero de neuronas en la capa oculta es de dos (neuronas 4 y 5) y
existe una sola neurona de salida (neurona 6). Los valores que ingresan a la red (inputs)
corresponden a la variables independientes ( )
3 2 1
, , X X X y la salida de la red corresponde al
valor estimado de y .
Existen varios tipos de redes neuronales pero el utilizado en el presente trabajo se denomina:
Perceptrn Multicapa de Retropropagacin , una red especialmente aplicada en la prediccin
hidrolgica (Maier & Dandy, 2000). El perceptrn multicapa es un tipo de red neuronal con
una capa de entrada, una capa de salida y varias capas ocultas, para ste caso solo
consideramos una capa oculta. La capa de entrada tendr un nmero de neuronas igual al
nmero de entradas externas a la red. Las entradas a cada neurona son trasformadas utilizando
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-7
una funcin de transferencia () g . Por ejemplo, en la capa de entrada, las variables externas
i
X son trasformadas por una funcin que las deja idnticas.

Figura 3-1 Topologa de red neuronal para pronstico de Caudales

i i
X X g = ) ( 3-12

Las neuronas de la capa oculta suman las salidas trasformadas de las neuronas en la capa de
entrada multiplicadas por el peso de las conexiones, y transforman dicha sumatoria mediante
una funcin de trasferencia de la forma:
|

\
|
=

=
n
i
i m i m m out
X w g y
1
, , ,
3-13

Donde
m out
y
,
corresponde a la salida de la neurona m,
i m
X
,
es la entrada a la neurona m
proveniente de la neurona i y () g es la funcin de transferencia que en este caso corresponde
a la sigmoidea bipolar dada por la ecuacin:
1
) 1 (
2
) (
2

+
=
x
e
x g 3-14

Los pesos de la red neuronal deben ser ajustados mediante un entrenamiento que consiste en
comparar las salidas de la red con datos histricos de un perodo previamente elegido, el
algoritmo de ajuste de los pesos se conoce como algoritmo de retropropagacin , el lector
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-8
podr consultarlo en el trabajo de Hammerstrom (1993). La ecuacin del perceptrn multicapa
para la prediccin de una variable y dependiente de los datos ( )
n
X X X ,....., ,
2 1
:

=

=
|
|

\
|
=
H
j
m
i
i j i j i
l
X w g w y
1
1
0
, ,
3-15

Siendo H el nmero de neuronas en la capa oculta, () g la funcin de transferencia y
j i
w
,
el
peso de la conexin entre la neurona i de la capa j .
La primera aproximacin de prediccin de caudales medios mensuales utilizando las redes
neuronales fue presentada por Carvajal (1994), en adelante sera un mtodo obligado para la
prediccin de caudales en trabajos posteriores. En el trabajo de Poveda et al (2002) la RNA
mostraba los resultados mas deficientes seguido por los mtodos Auto regresivos, adems una
observacin preliminar de los resultados permite afirmar que el RMSE (raz del error
cuadrtico medio) no es proporcional con el tamao de la ventana ( se esperara que a menor
tamao de ventana menor RMS), y si bien el modelo puede ser competitivo para ventanas de
12 meses a horizontes de pronstico inferiores su eficiencia puede ser equiparada a la de los
modelos auto-regresivos para los ros Alicachin, San Carlos, Salvajina, Betania, Guavio y
Nare (Velasquez, 2009).
3.2.4 Polinomios Adaptivos de regresin Multivariada (MARS)
El modelo MARS (acrnimo de Multivariate adaptive regression splines) es una forma de
anlisis de regresin introducida por Jerome Friedman en 1991, una tcnica no paramtrica
caracterizada por el ajuste de una funcin global basado en varias funciones paramtricas
simples, generalmente polinomios de bajo orden, definidas sobre una subregin del dominio
mediante ajuste por tramos. El problema de este tipo de modelamiento se presenta en las
discontinuidades y cambios bruscos dependientes en los lmites de las funciones, que debe ser
controlado limitando el nmero de subregiones y estableciendo derivadas continuas en los
lmites de cada subregin.
El mtodo MARS es una generalizacin del particionamiento recursivo, el cual resulta
adecuado para la expansin de funciones de altas dimensiones y que consiste en la
aproximacin de una funcin diferente en cada subregin al ser dividida ptimamente
(minimizando la falta de ajuste) en dos regiones: regin izquierda y regin derecha. Se
optimiza la particin en todas las variables ) (n y en todos los puntos t usando un buen criterio
de ajuste. Las subregiones son entonces recombinadas hasta que se encuentra un ptimo que
tenga el mnimo de subregiones posibles.
La funcin de aproximacin del modelo MARS puede ser de la forma (Rendon, 1997):
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-9
) ( ) (

1
X B a X f
m
M
m
m
=
= 3-16

Donde M es el nmero de subregiones,
m
a son los coeficientes de la funcin y ) (X B
m
es una
funcin bsica o base, dada por:
( ) [ ]
+ =

=
M
K
k
KM KM m
t m k X S H X B
1
) , ( ) ( 3-17

Donde H es una funcin de paso que va desde 1 = k hasta
M
k , el nmero de divisiones
resultantes en la funcin bsica,
KM
S es igual a 1 segn sea la divisin derecha izquierda
respectivamente,
KM
t es el nudo o particin de la variable y X es la variable predictora. El
signo ( + ) como subndice de dicha expresin significa que slo se toma como resultado
cuando el argumento de la funcin es positivo, de lo contrario se hace igual a cero. Esta
metodologa de aproximacin de funciones bsicas o bases se conoce entonces con el nombre
de particionamiento recursivo de regresin revisada (Rendn, 1997).
MARS, al igual que las dems herramientas de ajuste usadas en prediccin, trata de encontrar
la mejor relacin de dependencia entre la variable por predecir y las variables de apoyo o
variables predictoras. Es un mtodo que ajusta el mejor modelo de prediccin mediante una
bsqueda de minimizacin de errores de ajuste de los datos, y utilizando criterios de
penalizacin por un mayor nmero de variables predictoras. En general, si y es la variable por
predecir y X es el vector de variables predictoras (
n
X X X ,..., ,
2 1
), se trata de ajustar una
funcin del tipo 3-16. El ajuste por tramos posibilita la inclusin o la exclusin de una
determinada variable en el modelo de ajuste, dentro de un sub-dominio determinado. Sin
embargo, en la modelacin no paramtrica estar siempre presente la competencia entre la
suavidad de la funcin ajustada y la flexibilidad del ajuste. Adems, la modelacin no
paramtrica presenta dificultades en la aproximacin de funciones en dominios de alta
dimensin, asociados con la gran cantidad de datos necesarios en el dominio, cuando hay un
nmero considerable de variables predictoras.
Las estrategias para mejorar la aproximacin de funciones en espacios de alta
dimensionalidad, estn basadas en la computacin adaptiva (de la minera de datos), la cual
ajusta dinmicamente los polinomios teniendo en cuenta el comportamiento de la funcin por
aproximar. Una de las bases de la computacin adaptiva es el particionamiento recursivo, cuyo
objetivo es usar los datos para estimar simultneamente un buen conjunto de subregiones y
parmetros asociados con cada una de las funciones de cada subregin. La particin recursiva
tiene la capacidad de detectar la baja dimensionalidad de las funciones de ajuste. Una funcin
puede depender fuertemente de un gran nmero de parmetros de manera global, pero
localmente la dependencia es fuerte slo en unas pocas variables. El problema de sta
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-10
herramienta es que la funcin aproximada es discontinua en los lmites de las subregiones del
dominio. Otra dificultad es que cierto tipo de funciones simples son difciles de aproximar.
Las dificultades aparecen cuando las interacciones dominantes involucran una pequea
fraccin del nmero total de variables. En Friedman (1991) se detallan los aspectos
relacionados con la modelacin no paramtrica y la computacin adaptiva. All se presenta
completamente el algoritmo de ajuste de MARS.
En general, MARS intenta superar las limitaciones de la modelacin no paramtrica y el
particionamiento recursivo, generalizando los procedimientos. Por ejemplo, garantizando
modelos continuos y derivadas continuas. El modelo de ajuste de MARS se puede escribir de
la forma:
( ) ( ) ( ) ( )

= = =
+ + + + =
3 2 1
0
........ , , ,

m m m
k
k j i ijk
k
j i ij
k
i i
X X X f X X f X f a X f 3-18

Donde
0
a es una constante, el segundo trmino representa la suma de todas las funciones
bsicas que involucran slo una variable, el tercer trmino representa la suma de todas las
funciones bsicas que involucran dos variables y as sucesivamente. Si ( ) ( ) { }
m
k
m k v m V
1
, = es
el conjunto de variables asociadas con la m-sima funcin base
m
B , cada funcin en el
segundo trmino de la ecuacin se puede expresar segn la ecuacin 3-17. Cada funcin
bivariada en el tercer trmino de la ecuacin puede ser expresada como:
( ) ( )
( )

=
=
m V i
m
k
j i m m j i ij
X X B a X X f
2
, ,
3-19
Que es la suma de todas las funciones bsicas bivariadas que involucran un par determinado
de variables
i
X y
j
X . Si a la expresin se le suman los correspondientes aportes univariados,
expresin de cada variable que conforma un par, se obtiene:
( ) ( ) ( ) ( )
j j i i j i ij j i ij
X f X f X X f X X f + + = , ,
*
3-20

Que representa la contribucin bivariada al modelo global de las variables
i
X y
j
X .
Para la seleccin del modelo final se tiene en cuenta el criterio de falta de ajuste, (Lack Of
Fit), definido como el mximo nmero de funciones bsicas
max
M . Adicionalmente, el criterio
de falta de ajuste usado depende de la funcin de prdida delta especificada como el error
integral o el error esperado. Una funcin para dicho error est definida como:
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-11
( ) [ ]

=
(

= =
N
i
i M i
M
N
M C
X f y
N
M GCV f LOF
1
2
2
) (
1

1
) ( )

( 3-21

El criterio ) (M GCV es el promedio de los residuos al cuadrado afectado por un factor de
penalizacin, el cual se presenta en el denominador. La penalizacin se relaciona por el
nmero de parmetros por ajustar al modelo, en este caso por la cantidad de funciones bsicas,
y que es una funcin de costo dada por la siguiente expresin.
1 ) ) ( ( ) (
1
+ =
T T
B B B B traza M C 3-22

Donde B es la matriz de datos de las M funciones bsicas ( ) (
j i ij
X B B = ). La reduccin en
la desviacin es directamente reflejada en reduccin del error promedio esperado al cuadrado
(numerador). El denominador depende del incremento en varianza debido al nmero adicional
de parmetros.
Friedman y Silverman (1989) sugieren usar un incremento en la funcin de costo dM para
reflejar los parmetros adicionales (Funciones Bsicas), que con los coeficientes de expansin
( ) (M C ) se ajustan a los datos. Esta funcin de costo puede ser expresada como:
dM M C M C + = ) ( ) ( ' 3-23

Donde M es el nmero de funciones bsicas no constantes en el modelo MARS y d
representa el costo para cada una de las funciones bsicas de optimizacin, el cual es un
parmetro del procedimiento. Friedman y Silverman (1989) sugieren 2 = d , pero tambin
puede ser hallado por tcnicas de remuestreo.
Los conceptos aqu presentados corresponden a una seleccin de los presentados por Friedman
en 1991 y pueden ser ampliamente consultados en el trabajo de Rendn (1997). Al respecto de
la aplicacin de dicho mtodo para la prediccin de caudales medios mensuales en Colombia
MARS ha sido un modelo obligado y de bastante trascendencia dada su habilidad para
modelar series no estacionarias de manera no paramtrica, al respecto de la aplicacin del
mtodo, Rendn (1997,2001) utiliz el MARS para valorar los beneficios de la prediccin
Hidrolgica en el sector elctrico Colombiano, considerando la variabilidad climtica. Poveda
et al (2001, 2004) MARS demostr ser un modelo muy eficiente.


DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-12
3.3 ESTRATEGIA DE VALIDACIN E INTERVALOS DE CONFIANZA
3.3.1 Validacin de los modelos de pronstico
El objeto del anlisis de regresin es la construccin de una funcin ( )
n
X X X f ,....., ,

2 1
que
sea una aproximacin razonable de ( )
n
X X X f ,....., ,
2 1
en el dominio D de inters. La nocin
de razonable depende del propsito para el cual la funcin aproximada f

vaya a ser utilizada


y en casi todas las aplicacin esta ligado a una medida de la precisin que a menudo est dada
por el error integral:
( ) ( ) [ ]

=
D
dx x f x f x w I ,

) ( 3-24
O el error esperado:
( ) ( ) [ ]

=
=
N
i
i i i
x f x f x w
N
E
1
,

) (
1
3-25

Donde es el operador distancia y w es una funcin de ponderacin. El error integral 3-24
caracteriza la aproximacin sobre todo el dominio de inters, mientras la discretizacin 3-25
refleja solo la precisin en relacin al conjunto de puntos ( )
n
X X X ,....., ,
2 1
que componen la
muestra de informacin. Cabe recordar que el inters de los modelos de pronstico es estimar
valores futuros que por defecto no se encuentran en la historia siendo el error 3-24 mucho ms
importante. Se vuelve entonces necesario definir una estrategia de validacin que permita
confrontar la habilidad de pronstico de f

cuando los datos no se encuentran en la muestra


usada para calibrar los parmetros del modelo.
Como encontrar el error en todos los puntos del dominio es una tarea casi imposible, se
requiere disear un procedimiento que permita evaluar la bondad de ajuste de los modelos
para aquellos datos que no necesariamente se encuentran en la historia, es as como un
conjunto de datos se extraen de la informacin histrica cuando se calibra un determinado
modelo para ser usados despus en la validacin del mismo. La literatura general muestra dos
procedimientos bsicos para la verificacin de los modelos de pronstico: el primero se
conoce como validacin cruzada y el segundo como validacin retroactiva.
En la validacin cruzada (Figura 3-2) se omite un periodo de informacin con tamao igual al
de la ventana de pronstico para un ao especfico, el resto de la informacin se utiliza en la
calibracin del modelo; luego se elaboran pronsticos para los aos omitidos y al final los
datos predichos se comparan con los datos histricos a fin de estimar el error de ajuste.
En contraste la validacin retroactiva define claramente las porciones de informacin
correspondientes a la calibracin y la validacin del modelo, y suele ser un ejercicio mas
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-13
exigente que predice cada dato del periodo de validacin sin incluirlo dentro de la muestra de
calibracin como lo muestra la Figura 3-3.
.


Figura 3-2 Esquema de validacin cruzada



Figura 3-3 Esquema de validacin retroactiva


DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-14
La precisin de las predicciones durante el perodo de validacin puede estimarse mediante las
diferentes medidas del error presentadas en la literatura de series de tiempo, muchas de ellas
expuestas en el trabajo de Velsquez (2008), cuyo clculo se basa en la siguiente notacin:
t
y
denota la observacin histrica en el tiempo t y
t
y corresponde al valor esperado de la
prediccin para el periodo t donde T t ,..., 2 , 1 = . Se define entonces el error (o residuo) de la
prediccin como
t t t
y y e = , y el error porcentual como
t t t
y e p / 100 = . Con base en la
anterior notacin se definen las siguientes medidas del error:
Sumatoria de errores al cuadrado:

=
=
T
t
t
e SSE
1
2
3-26

Error cuadrtico medio o varianza del predictor:
T
SSE
MSE = 3-27
La raz del error cuadrtico medio:
MSE RMSE = 3-28

Si y corresponde al valor medio de la serie de datos entonces, el error cuadrtico medio
expresado como porcentaje del valor medio de los datos ser:
100 % =
y
RMSE
RMSE 3-29
Y el promedio del error porcentual absoluto esta dado por:

=
=
T
i
t
p
T
MAPE
1
1
3-30

Otro mtodo utilizado para estimar la bondad de ajuste de un modelo es el coeficiente de
determinacin, o de correlacin de Pearson, el cual consiste en establecer la correlacin que
existe entre los valores predichos y los valores histricos durante el periodo de validacin; As
por ejemplo los resultados del pronstico de caudales en validacin retroactiva usando el
modelo de regresin lineal mltiple para el ro Guadalupe con ventana de un mes, durante el
periodo comprendido entre enero de 2000 y diciembre de 2007 se presentan en la Figura 3-4,
Se tiene una correlacin de Pearson de 0.67 y un error medio cuadrtico medio del 17.95%, y
un promedio en el error porcentual de 16.1%.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-15


Figura 3-4 Prediccin de los caudales medios mensuales del ro Guadalupe usando RLM para una
ventana de un mes, perodo 2000-2007.
3.3.2 Pronsticos probabilsticos e intervalos de confianza
La indicacin de los diversos valores que puede adoptar la variable y y su probabilidad de
ocurrencia son el objeto de las predicciones probabilsticas, una prediccin probabilstica
aade valor a la prediccin al incorporar informacin de la confianza que el sujeto que elabora
la prediccin le otorga al pronstico obtenido, sta confianza debera recoger las fuentes de
incertidumbre de los sistemas de prediccin y es expresada en trminos de intervalos y/o
percentiles. Una prediccin probabilstica se define como un sesgo en la distribucin de
probabilidad de la variable de inters con respecto a su distribucin histrica, as pues, la
calidad los pronsticos puede ser medida de forma objetiva mediante la utilizacin de los
siguientes criterios:
Fidelidad: mide el grado de cumplimiento de los intervalos de confianza (la capacidad de
saber distinguir a priori entre situaciones inciertas y ciertas).
Precisin: mide la desviacin entre los valores predichos y los realmente obtenidos.
En la Figura 3-5 se muestra un esquema de las predicciones probabilsticas para el caudal
medio de enero de 2006 en el ro Guadalupe utilizando la historia y otros dos modelos. El
modelo 1 representa un sesgo con respecto a la distribucin histrica, sin embargo su rango de
variabilidad es muy alto con respecto al modelo 2, por ello se considera que el modelo 2 es el
ms preciso. El caudal histrico para dicho mes fue de 23 m3/s y se encuentra dentro de los
intervalos de confianza de los modelos 1-2 por tanto ambos modelos cumplen con el criterio
de confiabilidad.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-16


Figura 3-5 Esquema de pronstico probabilstico para el ro Guadalupe en enero de 2006.

Existen diferentes formas para convertir los pronsticos arrojados por los modelos (valores
determinsticos) en pronsticos probabilsticas, pero la manera mas fiable consiste en utilizar
la varianza de los errores en el perodo de validacin para ajustar una distribucin de
probabilidades que permitan la definicin de los intervalos de confianza. Si se supone que los
residuos de validacin poseen media cero y distribucin Gaussiana, las probabilidades podrn
ser integradas usando la distribucin t de Student tomando como media de la distribucin la
esperanza condicional arrojada por un modelo de regresin (el valor predicho) y la varianza
igual a la varianza de los residuos del modelo de regresin para el mes especifico de la
prediccin (Simon & Baddour, 2007).

3.4 TCNICAS PARA MEJORAR LOS PRONSTICOS DE CAUDALES
3.4.1 Sobre el pre-procesamiento de los datos
Ya sea para optimizar el rendimiento de los algoritmos de ajuste, o para cumplir ciertas
hiptesis de los modelos de regresin, algunas transformaciones a los datos son requeridas y
en si mismas mejoran la precisin de los resultados. Bsicamente el pre-procesamiento de los
datos consiste en algunas adecuaciones que se hacen a la informacin para poder calibrar los
modelos, por ejemplo, el algoritmo de retropropagacin requiere que los datos hidrolgicos se
encuentren escalados para optimizar los pesos de las conexiones. Tambin los modelos
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-17
lineales RML, AR, ARMA, ARIMA, ARMAX, requieren datos estandarizados, normales y
estacionarios que deben ser provistos bajo dichas condiciones para evitar errores en los
clculos; sin embargo es importante resaltar que no todos los modelos requieren un pre-
procesamiento de la informacin y por lo general es decisin del modelador el uso de los
diferentes tipos de transformacin. A continuacin se enumeran algunos de los tipos de
transformacin.
3.4.1.1 Algunos tipos de transformacin
Para la operacin eficiente de algunos de los modelos propuestos es necesario un tratamiento
previo de los datos que incluye un proceso de normalizacin y escalonamiento de los datos
(Ochoa, 2002). Un primer paso consiste en remover de la serie original el coeficiente de
asimetra con el objeto de obtener una distribucin de probabilidades que se encuentre
centrada en la media, para tal efecto se aplica la siguiente trasformacin:
( )

Q c Q X
v v
= log 3-31
Donde
2

g
a
c = 3-32

Siendo
v
Q el caudal medio para el mes ( 12 ,..., 1 = ) y ao v (
a
N v ,..., 1 = ) con
a
N el
nmero de aos de la series;

Q es el caudal medio mensual del mes y a es un parmetro


adimensional cuyo valor es de 0.35 (Ochoa, 2002) el cual resulta de un anlisis de regresin
entre

g y

c ;

g es el coeficiente de asimetra para el conjunto


Na s
Q Q Q ,..., ,
1
; y
v
X es la
serie normalizada de los caudales para el ao v y el mes .
Para eliminar la periodicidad, la serie de caudales es estandarizada mediante la siguiente
ecuacin:

Q
v
v
s
Q Q
Y

= 3-33
Donde

Q y
Q
s son la media y la desviacin estndar de la serie de caudales para el mes ,
y
v
Y son los valores estandarizados para el ao v y el mes .
Finalmente una trasformacin adicional es aplicada a la serie
v
Q para llevar los datos a una
escala conveniente que permita su procesamiento en alguno de los mtodos de ajuste
propuestos. El rango de variacin ser reducido al intervalo [0,1] usando la siguiente
trasformacin:
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-18
m M
m t
t
Q Q
Q Q
Z

= 3-34

Siendo
t
Q el valor del caudal con ( ) + = 1 12 v t ;
M
Q es el mximo valor de la serie
v
Q ;
m
Q es el mnimo valor de la serie, Este proceso ayuda a eliminar las inhabilidades internas de
la red neuronal (ASCE-TCAANNH, 2000) y el modelo MARS durante su operacin.
3.4.2 Estacionariedad de los datos.
Dada su sencillez, los modelos lineales no son aptos para reconocer patrones relacionados con
la falta de estacionariedad de los datos, de hecho los datos deben ser estacionarios para
evaluar cualquier modelo lineal. El procedimiento tpico para anlisis de estacionariedad
utiliza mtodos cuantitativos que se basan en el uso de las pruebas de hiptesis de la
estadstica muestral; una hiptesis estadstica es una afirmacin que se hace acerca de la
distribucin de una poblacin basado en una muestra de ella; en una prueba de hiptesis
definimos una hiptesis nula (Ho) y una hiptesis alternativa (Ha), la prueba consiste en
comparar un valor analizado asociado a Ho o a Ha contra un valor crtico que define la
aceptacin o el rechazo de la hiptesis evaluada. Para las pruebas de hiptesis aqu usadas
intervienen generalmente las siguientes caractersticas de la serie:
Una caracterstica estadstica del parmetro analizado.
Un nivel de significancia de la prueba (), que corresponde a la probabilidad de rechazar
la hiptesis nula cuando era verdadera, o en trminos mas sencillos nos da una
indicacin de cuanta es la probabilidad de equivocarnos en la toma de decisin basados en
la prueba. Generalmente se usa un nivel de significancia de un 5% de probabilidad.
Grados de libertad de la prueba. La incertidumbre asociada a la medicin de un parmetro
depende del tamao de la muestra, los grados de libertad son una indicacin de esta
incertidumbre debido al tamao muestral.

As pueden encontrarse cambios en la media, cambios en la varianza y tendencias, el
procedimiento clsico implica una remocin de los cambios y tendencias encontrados para
aplicar cualquier modelo lineal de ajuste, en la Figura 3-6. Se presenta el procedimiento
clsico basado en pruebas de hiptesis aplicado en la prediccin de la serie de caudales del ro
Tenche con una ventana de 12 meses.


DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-19


Figura 3-6 Anlisis de estacionariedad clsico aplicado a la prediccin de caudales del ro Tenche
con un modelo Lineal

Las series hidrolgicas son no estacionarias por naturaleza y en muchas ocasiones las
tendencias encontradas suelen depender de la cantidad de datos analizados, es as como en
ocasiones no basta suponer tendencias lineales o polinmicas para describir los cambios en las
series hidrolgicas; en el ejemplo hipottico de la Figura 3-7 (Koutsoyiannis, 2006) se ilustra
como vara la estacionalidad con la ventana de informacin, en la ventana A se asume que los
datos son estacionarios en la media, en la ventana B se puede ajustar una ley parablica para
explicar la tendencia de los datos, pero en la ventana C donde la historia es mucho mas amplia
se muestra que en el largo plazo el comportamiento es peridico sinusoidal.
As pues, no basta solo con ajustar polinomios o usar pruebas de hiptesis para caracterizar las
evidencias de cambio en series que por naturaleza son no estacionarias, un procedimiento
alternativo fue presentado por Carmona (2010) para el anlisis de tendencias de las
oscilaciones de baja frecuencia de la serie usando la descomposicin espectral,
especficamente la trasformada de Hilbert Huang. Dicho procedimiento aplicado a la serie de
caudales del ro Tenche se presenta en la Figura 3-8. Los resultados indican una disminucin
en el porcentaje de error (%RMS) en los modelos lineales incorporando la no estacionariedad.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-20



Figura 3-7 Evolucin de la estacionariedad con el tamao de la ventana en una serie de tiempo
(Koutsoyiannis, 2006).


Figura 3-8 Anlisis de estacionariedad usando la descomposicin en modos intrnsecos para la
prediccin de caudales del ro Tenche.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-21
3.4.3 Modelos peridicos de pronstico
Dada la dependencia de las variables hidrolgicas de los diferentes ciclos astronmicos y
macro-climticos las series de caudales y precipitacin poseen una estructura cuasi-peridica
caracterizada por ciclos anuales y semianuales muy marcados. Por ejemplo, en el caso del rio
Grande la magnitud y variabilidad de los caudales cambia con el transcurrir de los meses,
incidiendo en la habilidad de pronstico de los modelos. En la Figura 3-9 se superpone el ciclo
anual del ro Grande (en azul) y el coeficiente de correlacin de Pearson obtenido para cada
mes utilizando el mtodo de regresin lineal mltiple con variables macro-climticas, puede
notarse que los meses de menor capacidad de pronstico corresponden a los meses de invierno
cuya variabilidad es mayor. Tal observacin es consecuente con los comentarios de Poveda et
al (2002) relacionando el ciclo anual y la estacionalidad del error.

Figura 3-9 Estacionalidad en el error
Dichas observaciones permiten justificar la construccin de modelos especializados para el
pronstico de meses especficos, lo que equivaldra a un modelo de regresiones peridicas, los
cuales se definen a continuacin:
Sea
v
Q corresponde al caudal medio mensual para el mes ( 12 ,..., 1 = ) y ao v
(
a
N v ,..., 1 = ) siendo
a
N el nmero de aos de la serie. Al agrupar los caudales por mes se
pueden formular la funcin de ajuste por tramos:


DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-22
( )
( )
( )
( )
( )

=
=
=
= =
12 ... ,

... ,

2 ... ,

1 ... ,

,

12 , 12 , 2 12 , 1 12
, , 2 , 1
2 , 2 , 2 2 , 1 2
1 , 1 , 2 1 , 1 1

n
n
n
n
v
X X X f
X X X f
X X X f
X X X f
X f Q
M
M
3-35

Donde

corresponde a la funcin de ajuste estimada con uno de los modelos ya descritos


para el mes ( 12 ,..., 1 = ) y los
, n
X son las n variables independientes utilizadas para crear
la funcin de regresin correspondiente al mes . Bsicamente se propone construir funciones
de regresin especializadas en la prediccin de cada mes a fin de capturar con mayor fidelidad
la variabilidad de los caudales. En Figura 3-10 se presenta una comparacin de la prediccin
de caudales para el ro Grande con horizonte de un mes utilizando regresin lineal mltiple y
regresiones lineales mltiples peridicas, los resultados muestran que el modelo peridico es
ms eficiente (posee mejor ajuste y menor error) que un modelo global de regresin.


Figura 3-10 Comparacin entre modelo lineal y un modelo lineal peridico para la prediccin de
caudales del ri Grande con horizonte de un mes


DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-23
3.4.4 Incorporacin de los mtodos espectrales en la prediccin.
La dinmica no lineal del sistema imprime un comportamiento catico sobre la serie y por
tanto sta puede dividirse en dos partes: la seal propiamente dicha y el ruido, clasificacin
derivada de los periodos que posee cada oscilador y su aporte a la varianza total de la serie
(Vautard, et al, 1992), en tanto la dinmica global de la serie puede ser parcialmente
reconstruida utilizando aquellas componentes de baja frecuencia que mayor aporte hacen a la
variabilidad de la serie de tiempo, la reconstruccin equivale a la aplicacin de un filtro que
elimina el ruido de la serie; las series filtradas reflejan la dinmica general de la variable y al
mismo tiempo son mas predecibles (Carvajal 1994, Rojo & Carvajal 2010). Esquemas
hbridos de pronstico han demostrado ser muy eficientes en diferentes ventanas de
pronstico.
Los mtodos espectrales presentados en el Anexo 1 pueden ser utilizados como filtros para la
reconstruccin de la serie de tiempo. Por ejemplo, en la Figura 3-11 se muestra la
reconstruccin de la serie estandarizada de caudales del el ro Bata usando nueve componentes
principales del Anlisis Espectral Singular (AES), en dicha figura se evidencia que utilizar un
mtodo espectral conjuntamente con regresiones peridicas mejora ostensiblemente la
capacidad de pronstico de los caudales.

Figura 3-11 Incorporacin de mtodos espectrales en el pronstico hidrolgico, caso ro Bata

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-24
3.5 METODOLOGIA GENERAL PARA LA PREDICCIN DE CAUDALES
3.5.1 Protocolo de prediccin
El procedimiento propuesto en este trabajo para la prediccin de los caudales medios
mensuales en los diferentes ros de Colombia se esquematiza en la Figura 3-12, los datos de
caudales y variables explicativas (variables macro-climticas, lluvia, etc.) deben ser provistos
por el modelador siendo almacenado en la memoria; para efectos del pronstico de caudales se
definen los siguientes procesos:
Anlisis de estacionariedad: una vez ingresan los datos dentro del modelo de pronstico,
han de ser analizados usando los procesos predefinidos de anlisis de homogeneidad y el
de anlisis espectral. Ambos tienen por objeto analizar la estacionariedad de la series y
establecer puntos de cambio, tendencias o componentes que puedan ser incorporadas para
mejorar el pronostico de series de Caudales.
Trasformacin: con los parmetros hallados en el proceso anterior y los tipos de
trasformacin existentes el usuario podr indicar los tipos de transformacin sobre las
series de caudales a fin de mejorar el rendimiento de los modelos de pronstico, como
resultado se obtendr una serie trasformada y parmetros de dicha trasformacin.
Eleccin del modelo de prediccin: cuenta con dos procesos predefinidos (o libreras) que
permiten escoger entre diferentes mtodos de regresin y de anlisis espectral para la
construccin del modelo predictivo. El usuario deber fijar los parmetros bsicos del
modelo (periodicidad, componentes para la reconstruccin espectral, orden auto regresivo,
nmero de capas y neuronas, nmero de tramos, etc.) as como el horizonte (o ventana) de
pronstico y los periodos de calibracin y validacin. Al final del proceso se obtienen las
predicciones para la serie trasformada.
Trasformada inversa: sobre los pronsticos de la serie trasformada se aplican las
trasformaciones inversas de acuerdo a los tipos y parmetros de trasformacin establecidos
dos pasos atrs a fin de obtener los pronsticos preliminares.
Evaluacin de los resultados: con los pronsticos preliminares se plantea un esquema de
validacin que permita establecer algunas medidas estadsticas sobre la habilidad del
modelo propuesto para el pronstico de la serie de caudales. Si los indicadores estadsticos
satisfacen las expectativas del modelador se aceptan dichas predicciones, de lo contrario
deben cambiarse los parmetros del modelo seleccionado o las variables explicativas.

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-25

Figura 3-12 Protocolo para la prediccin de caudales medios mensuales en Colombia
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-26
Para la construccin de los modelos de pronstico el modelador podr combinar los modelos
de regresin con alguno de los mtodos de reconstruccin espectral (Anlisis Espectral
Singular (AES), descomposicin mediante la trasformada en onditas (OND), o la
descomposicin en modos empricos de la trasformada de Hilbert Huang (HH)) pudiendo
tambin optar por un esquema general o peridico (P) de regresin. En la Figura 3-13 se
muestra la diversidad de modelos que pueden ser construidos usando la metodologa
propuesta.


Figura 3-13 Esquema general para la construccin de modelos de pronstico

As pues, se tienen cuatro mtodos de regresin y tres mtodos espectrales, que pueden ser
usados o no para crear hbridos (combinaciones de modelos de regresin con mtodos
espectrales), lo que permite generar 16 modelos diferentes (12 modelos hbridos y 4 de solo
regresin); si adems se considera la posibilidad de usar esquemas peridicos de regresin, en
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-27
total se pueden construir 32 modelos que son en principio completamente diferentes
(probablemente unos modelos sern ms eficientes que otros).
Quizs uno de los aportes ms significativos del presente trabajo sea el haber construido sobre
el entorno de MATLAB una gran cantidad de funciones que permiten tener en una sola
plataforma todos los mtodos de regresin y los mtodos espectrales expuestos en el presente
documento, as como funciones intermedias que permiten acoplar fcilmente los mtodos
espectrales a los esquemas de regresin y optar por funciones generales o peridicas para
calibrar y validar los modelos de pronstico. Todas las combinaciones expuestas en la Figura
3-13 se pueden recrear con el prototipo desarrollado, pero ante la enorme cantidad de modelos
posibles, se han elegido los siguientes para continuar con la investigacin:
AR (2) Modelo auto-regresivo de orden 2.
RLM Regresin lineal mltiple.
RNA (P) + HH Modelo peridico de regresin basado RNA y HH.
RLM (P) + AES Modelo peridico de regresin basado RLM y AES.
MARS (P) + OND Modelo peridico de regresin basado MARS y OND.
Los primeros dos son ampliamente utilizados en el medio y en la literatura como mtodos
generales de pronstico. Los ltimos tres son combinaciones de modelos de regresin, con
mtodos espectrales en esquemas peridicos.
Finalmente para la calibracin y validacin de los modelos propuestos se seleccionaron los
siguientes perodos:
Perodo de Calibracin: desde Ao inicial de la serie hasta 1989.
Perodo de Validacin: desde 1990 hasta el 2007.
Tipo de validacin: Validacin retroactiva.

Los resultados de validacin para los ros descritos en esta tesis de maestra para el perodo
comprendido entre 2000-2007 con ventanas de pronsticos de 1, 3, 6 y 12 meses se presentan
en el Anexo 2, y a manera de ejemplo, en Tabla 3-1 se muestran los resultados de la validacin
de los diferentes modelos para el ro Guadalupe y en Tabla 3-2 para el ro Bata.


DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-28
Tabla 3-1 Validacin 2000-2007, Ro Guadalupe con los diferentes modelos de pronstico
1 MES 3 MESES 6 MESES 12 MESES
A
R
(
2
)



R
L
M



R
N
A

(
P
)

+

H
H




R
L
M

(
P
)
+
A
E
S



M
A
R
S

(
P
)
+
O
N
D




DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-29
Tabla 3-2 Validacin 2000-2007, Ro Bat con los diferentes modelos de pronstico
1 MES 3 MESES 6 MESES 12 MESES
A
R
(
2
)


R
L
M


R
N
A

(
P
)

+

H
H


R
L
M

(
P
)
+
A
E
S


M
A
R
S

(
P
)
+
O
N
D





DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-30
3.6 ANLISIS DE RESULTADOS
En el presente captulo han sido descritos los diferentes aspectos de los modelos ms
utilizados en la prediccin de caudales medios mensuales en Colombia, se ha dado un repaso
general por las principales metodologas aplicadas durante los ltimos 20 aos para el
pronstico de los caudales medios mensuales. Actualmente existe un nmero considerable de
esquemas de regresin cuya aplicacin ha sido ampliamente difundida en el pronstico de
caudales medios mensuales en Colombia. Los mtodos lineales (ARIMA, RLM) son
fcilmente programables y sus resultados pueden ser considerados como una primera
aproximacin en la obtencin de los caudales futuros, la relacin existente entre la
climatologa global y la hidrologa del pas no es lineal por lo que se justifica la utilizacin de
modelos no lineales. Estos modelos aunque mucho ms elaborados, son ms eficientes.
Con el objeto de evaluar la eficiencia de los modelos usando criterios aplicables a todos los
modelos se ha propuesto la validacin retroactiva como el mtodo general para la evaluacin
de los pronsticos hidrolgicos. El esquema de validacin retroactivo es el ms exigente de los
mtodos de validacin y los diferentes indicadores derivados de dicha evaluacin (el %RMSE,
el MAPE y el coeficiente de correlacin de Pearson) son una herramienta til para comparar
los resultados de los diferentes modelos. Usando los residuos de validacin se pueden generar
predicciones probabilsticas y los intervalos de confianza. Los pronsticos probabilsticos
permiten estimar los diversos cuantiles de la distribucin de los pronsticos.
La transformacin de la informacin, es un paso obligado en muchas de las metodologas
planteadas, dado que mejoran la eficiencia de los modelos y permiten que los diversos
algoritmos de regresin tengan un mejor desempeo. Algunas hiptesis como normalidad,
estacionariedad, etc, tambin deben ser seriamente estudiadas en la formulacin de los
esquemas de regresin puesto que se debe cumplir con los requerimientos bsicos de los
modelos, y, si bien puede generarse una discusin sobre la naturaleza de los datos
hidrolgicos, la diversidad de modelos aqu presentados permite ensayar diferentes esquemas
de manejo de la informacin a fin de de obtener la mejor representacin de la naturaleza.
El uso de esquemas peridicos de pronstico busca resolver (al menos en parte) el problema
de la estacionalidad en el error que poseen las predicciones como fruto de la variabilidad intra-
anual en las series de tiempo. La especializacin de esquemas de regresin mediante la
elaboracin de modelos peridicos para el pronstico de meses especficos amplia la gama de
posibilidades para manejar la no-estacionalidad de los datos y su aplicacin implica una
reduccin considerable en los indicadores de error. La aplicacin de los esquemas peridicos
puede aumentar el nmero de parmetros de los modelos (aunque puede abrirse una discusin
de si existe un modelo global de muchos parmetros o doce modelos de pocos parmetros)
aumentando el tiempo de cmputo. Al respecto se puede argumentar que la reduccin en los
indicadores de error es tan significativa que se justifica el uso de modelos ms elaborados.
La aplicacin de la descomposicin espectral incrementa de forma sustancial la capacidad de
la prediccin de los diferentes modelos, incluso esquemas peridicos de modelos lineales
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-31
alcanzan indicadores de error aceptables cuando se utilizan mtodos espectrales para
reconstruir las seales hidrolgicas. Un aspecto destacable de los modelos analizados en el
presente captulo es su habilidad para el pronstico de los caudales mnimos, los caudales
mximos son mucho ms difciles de predecir, como se muestra en la Figura 3 14.

Figura 3-14 El problema del pronstico de los caudales mximos
En trminos generales el mejor de los modelos de pronstico para los cuatro horizontes de
prediccin y los doce ros del presente estudio es el MARS combinado con la transformada en
onditas, seguido por las regresiones lineales mltiples con el AES, ambos usando un esquema
peridico. Adems, es evidente que los mtodos no lineales (Redes neuronales y MARS) son
mucho ms eficientes que las regresiones lineales mltiples y los mtodos auto-regresivos.
En general los pronsticos para los ros del Norte y Oriente Antioqueo (con excepcin de San
Carlos) poseen errores inferiores al 20% para ventanas de 12 meses. La incorporacin de
variables asociadas al ENSO y al chorro del Choc contribuyen significativamente a la
obtencin de dichos errores. En el pronstico de los ros del centro y el oriente del pas se
obtiene errores del 20% al 30% para ventanas de 12 meses incorporando variables asociadas al
ENSO y a la humedad desde la cuenca Amaznica. EL caso particular del rio San Carlos
donde los errores no son semejantes a los obtenidos en ros vecinos puede evidenciar
condiciones climticas locales o errores en la construccin de la serie de tiempo, el presente
trabajo solo se limita a reportar el caso. Una comparacin de los diferentes criterios de error
para todos los ros se muestran en las Figuras 3-15, 3.16, 3-17 y 3-18.
Segn los diferentes criterios para evaluar la habilidad de pronstico de los modelos, los ros
de menor error en las predicciones son Guadalupe y Porce y los de mayor error son san Carlos
y Bat, pese a ello el ro Bat posee unos coeficientes de determinacin muy altos. La
distribucin del error medio porcentual (MAPE) para los diferentes ros con horizontes de
pronsticos de uno, tres, seis y doce meses se muestran en la Figura 3 19.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-32
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
26.00
28.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUDALUPE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUDALUPE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUDALUPE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUDALUPE V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO TENCHE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO TENCHE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO TENCHE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO TENCHE V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GRANDE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GRANDE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GRANDE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GRANDE V=12
%RMSE MAPE R2

Figura 3-15 Comparacin indicadores de error para los ros Guadalupe, Tenche y Grande
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-33
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO PORCE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO PORCE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO PORCE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO PORCE V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUATAP V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUATAP V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUATAP V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUATAP V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO NARE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO NARE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO NARE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO NARE V=12
%RMSE MAPE R2

Figura 3-16 Comparacin indicadores de error para los ros Porce, Guatap y Nare
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-34
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
53.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO SAN CARLOS V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
53.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO SAN CARLOS V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
53.00
58.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO SAN CARLOS V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
53.00
58.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO SAN CARLOS V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO SAN LORENZO V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO SAN LORENZO V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO SAN LORENZO V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO SAN LORENZO V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO MIEL V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO MIEL V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO MIEL V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO MIEL V=12
%RMSE MAPE R2

Figura 3-17 Comparacin indicadores de error para los ros San Carlos, San Lorenzo y Miel.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-35
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO MAGDALENA V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO MAGDALENA V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO MAGDALENA V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO MAGDALENA V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
53.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUAVIO V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUAVIO V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUAVIO V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO GUAVIO V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO BATA V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO BATA V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
53.00
AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO BATA V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
13.00
18.00
23.00
28.00
33.00
38.00
43.00
48.00
53.00
AR(2) RLM RNA(P) + HH RLM (P) + AES MARS (P) +
OND
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MODELOS DE PRONSTICO RO BATA V=12
%RMSE MAPE R2

Figura 3-18 Comparacin indicadores de error para los ros Magdalena, Guavio y Bat.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-36



Figura 3-19 Error MAPE para MARS (p) +OND a diferentes horizontes de pronstico

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-37
Referencias
ASCE Task Committee on Application of Artificial Neural Networks in Hydrology (2000):
Artificial neural networks in hydrology II: hydrologic applications, J. Hydrol. Eng., 5, 124
137, 2000b.
Box, G. E. P., G. M. Jenkins, y G.C Reinsel. (1994). Time Series Analysis: Forecasting and
Control, Prentice-Hall, Englewood Cliffs, New Jersey.
Cadavid, J.D. (2009). Modelo auto-regresivo bilineal aplicado a la prediccin mensual de
caudales en Colombia. Tesis de grado Ingeniera Civil- Facultad de Minas. Universidad
Nacional de Colombia, Medelln.
Carmona M.A. (2010). Identificacin de modos principales de variabilidad hidroclimtica en
Colombia y la cuenca Amaznica. Tesis de Maestra en Ingeniera - Recursos Hidrulicos.
Universidad Nacional de Colombia-Medelln.
Carvajal, L.F., (1994). Acerca de la prediccin no lineal en hidrologa. Tesis de Maestra,
Universidad Nacional de Colombia, Facultad de Minas, Medelln, Colombia. 136 pp.
Carvajal, Luis F, Mesa, Oscar y Poveda, Germn (1998). Prediccin Hidrolgica en Colombia
mediante Anlisis Espectral Singular y Mxima Entropa. En: Ingeniera Hidrulica en
Mxico. Vol. XII, Nm. 1, II poca, (enero-abril de 1998); p. 7-16.
Friedman, J. H., Multivariate Adaptive Regression Splines (1991). Ann. Stat., 19, 1-142.
Hammerstrom D.W.& Rehfus S. (1993). Neurocomputing hardware: present and future.
Artif. Intell. Rev. 7(5): 285-300.
Hoyos, C. (1999). Algunas aplicaciones de la transformada de Fourier y la descomposicin en
onditas a seales hidrolgicas y ssmicas. Tesis Ingeniera Civil, Universidad Nacional de
Colombia, Medelln,
Koutsoyiannis D. (2006). Nonstationarity versus scaling in hydrology, Journal of hydrology.
Volume: 324. Issue: 1-4. Pages: 239-254.
Mesa O., Smith, R., Salazar, J.E. y Carvajal, L.F. (1995). Modelos de prediccin de caudales
para el sector elctrico colombiano. Parte I. Avances en Recursos Hidrulicos, 3. Agosto de
1995. Universidad Nacional de Colombia. Sede Medelln. Facultad de Minas.
Mesa, O. et al. Streamflows Prediction Models for the Colombian Generation System
Considering El Nio Effect (1996). Conference Procceding Paper in North and Environment
Congress & Destructive Water, ASCE Publications, New York, 1477-1482.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-38
Mesa, O. et al. Beneficios de la Prediccin no lineal de la Hidroclimatologa en la Operacin
de un Sistema Hidrotrmico (2002). VI Congreso de Meteorologa, Bogot, Colombia.
MESA, O.J. et al. (2002). Prediccin de caudales medios mensuales usando mtodos no
lineales. VI Congreso de Meteorologa, Bogot, Colombia.
Maier, H. and Dandy, G. (2000). Neural networks for the prediction and forecasting of water
resources variables: A review of modeling issues and applications. Environ. Modell. Softw.,
15(1), 101 104.
Poveda, G., y Mesa, O.J.. (1993). Metodologas de prediccin de la hidrologa Colombiana
considerando el Fenmeno El Nio-Oscilacin del Sur (ENOS). Revista Atmsfera, 20,
Sociedad Colombiana de Meteorologa pp. 26-39, Bogot.
Poveda, G., Mesa, O.J, L.F Carvajal, C.D Hoyos, J.F. Meja, L.A Cuartas y A. Pulgarn.
(2002). Prediccin de caudales medios mensuales en ros colombianos usando mtodos no
lineales. Meteorologa Colombiana, 6, 101-110.
Poveda, Germn et al. (2001). Prediccin no lineal de la hidrometeorologa de Colombia. Caso
de estudio, caudales del Ro Nare. IX Congreso Latinoamericano e Ibrico de Meteorologa y
VIII Congreso Argentino de Meteorologa. Buenos Aires, 10 p.
Poveda, G., C. Hoyos, J. F. Meja, L. F. Cavajal, O. J. Mesa, A. Cuartas, y J. Barco, (2001).
Prediccin no lineal de los caudales medios mensuales del rio Nare. Revista Avances Recursos
Hidrulicos, Posgrado en Aprovechamiento de Recursos Hidrulicos, no 8, septiembre de
2001. p 65-76.
ROJO, J. D. y L. F. CARVAJAL (2010). Prediccin no lineal de caudales usando variables
macro-climticas y anlisis espectral singular. Tecnologa y Ciencias del Agua antes
Ingeniera Hidrulica de Mxico, vol 1, num 4, oct-dic, Mxico, pp 59-73.
Smith R. A, Vlez J. I., Velsquez J. D., Ceballos A., Correa P. L., Gez C., Hernndez O,
Salazar L.F y Zapata E. (2004). Modelos de prediccin de caudales mensuales para el sector
Elctrico Colombiano. Avances en recursos Hidrulicos, 11, Facultad de Minas, septiembre
de 2004. P 91-102.
SMITH, Ricardo, Mesa, Oscar, Salazar, Jos y Carvajal Luis F. (1998).Modelos de Prediccin
de Caudales mensuales considerando anomalas climticas. Aceptado para publicacin en el
XV III Congreso Latinoamericano de Hidrulica. Octubre.
SMITH, Ricardo, Mesa, Oscar, Salazar, Jos, Carvajal Luis F., Restrepo, Pedro y Juan D.
Velzquez. (1998) Prediccin de Caudales diarios para el Sector Elctrico Colombiano.
Aceptado para publicacin en el XV III Congreso Latinoamericano de Hidrulica. Octubre.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH-UNAL

3-39
Rendn, L. (1997). Beneficios de la prediccin Hidrolgica en el sector elctrico Colombiano,
considerando la variabilidad climtica. Tesis de Maestra Ingeniera Recursos Hidrulicos,
Facultad de Minas, Universidad Nacional de Colombia, Sede Medelln.
Troccoli A.. (2007), Seasonal Climate: Forecasting and Managing Risk, Springer. Printed
in the Netherlands.
VAUTARD, R., YIOU and GHIL (1992). Singular-spectrum analysis: A toolkit for shot,
noisy chaotic signals. Physica. D 58, 1992, pp. 95-126.
Velasquez, J.D. (2008). Construccin de Escenarios de Pronstico del Precio de Elctricidad
en Mercados de Corto Plazo. Programa de Doctorado en Ingeniera rea Sistemas
Energticos. Universidad Nacional de Colombia.
Velsquez N. (2009). Redes neuronales aplicadas a la prediccin de caudales. Tesis de
pregrado, Ingeniera Civil. Universidad Nacional de Colombia sede Medelln.

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA


Julin David Rojo Hernndez PARH -UNAL


Captulo 4:

Incorporacin de nuevas
tcnicas de pronstico

En los ltimos aos, la frecuente aplicacin del anlisis estadstico a
todo tipo de problemas ha originado la bsqueda de soluciones no
habituales que se adapten a los requerimientos y circunstancias
actuales de prediccin no lineal y no estacionaria. El campo no
paramtrico es uno de los ms populares y est siendo empleado como
una nueva herramienta de anlisis estadstico. Esta herramienta ofrece
una alternativa ms sofisticada en comparacin con los modelos
paramtricos tradicionales en la exploracin de datos univariados o
multivariados sin presuponer ninguna distribucin especfica de los
datos.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-1
4 INCORPORACIN DE NUEVAS TCNICAS DE PRONSTICO
RESUMEN
El presente captulo tiene por objeto introducir dos nuevas metodologas para la prediccin
de caudales medios mensuales en Colombia. La primera de ellas son los polinomios
localmente ponderados que pueden ser divididos en dos grandes grupos: El mtodo de
mnimos cuadrados mviles y las funciones de influencia radial, ambos esquemas de
regresin tienen por idea bsica ponderar con mayor valor aquellas observaciones ms
cercanas al momento de elaborar un pronstico; se presentan las ecuaciones bsicas de cada
mtodo y el procedimiento para encontrar los parmetros de la regresiones locales. Las redes
neuronales polinmicas son un algoritmo de regresiones polinmicas sucesivas sobre un
conjunto de variables independientes cuyo objeto es el de combinar pronsticos parciales de
la variable dependiente mediante un algoritmo de agrupacin de datos basado en los
polinomios de Ivakhnenko y la teora de mnimos cuadrados.
La aplicacin de dichas tcnicas de regresin en un esquema peridico de manera conjunta
con los mtodos espectrales, permiten desarrollar una poderosa herramienta de pronstico
que est por encima de los mtodos tradicionalmente usados en el pas para la prediccin de
caudales medios mensuales.
4.1 POLINOMIOS LOCALMENTE PONDERADOS
En los ltimos aos, la frecuente aplicacin del anlisis estadstico a todo tipo de problemas ha
originado la bsqueda de soluciones no habituales que se adapten a los requerimientos y
circunstancias actuales de prediccin no lineal y no estacionaria. El campo no paramtrico es
uno de los ms populares y est siendo empleando como una nueva herramienta de anlisis
estadstico. Esta herramienta ofrece una alternativa ms sofisticada en comparacin con los
modelos paramtricos tradicionales en la exploracin de datos univariados o multivariados sin
presuponer ninguna distribucin especfica de los datos. La estimacin no paramtrica de la
distribucin de probabilidades ha llegado a ser un importante objeto de investigacin
estadstica, aunque los primeros intentos de estimacin no paramtrica de la densidad
comenzaron en la dcada de los treinta, la preocupacin por desarrollar este tema no surge
hasta los aos ochenta, siendo numerosas las publicaciones de trabajos realizados sobre los
aspectos tericos de este tipo de estimacin.
A este tipo de estimaciones no paramtricas corresponden las funciones Kernel (Priestley &
Chao, 1972), los polinomios localmente ponderados (mnimos cuadrados locales, polinomios
mviles) (Cleveland 1979,1988) y las funciones de influencia radial (Powell, 1987). Dichas
metodologas son conocidas como tcnicas de interpolacin y alisado porque perfeccionan el
ajuste asignando diferentes pesos a los datos que coexisten en una vecindad. La idea consiste
en ponderar con mayor valor aquellas observaciones ms cercanas al momento de elaborar un
pronstico y con menor valor aquellas que quedan ms lejos. En el caso de la prediccin de
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-2
caudales medios mensuales en Colombia se han aplicado tcnicas de alisado como las
funciones Kernel (Poveda et al, 2002) y Holt Winters (Poveda, 2006). En el presente trabajo
se estudian y aplican los polinomios localmente ponderados a la prediccin de caudales
medios mensuales en Colombia.
4.1.1 Polinomios localmente ponderados - mnimos cuadrados mviles
Los polinomios localmente ponderados (tambin llamados regresin polinomial mvil) o LWP
(Locally Weighted Polynomials) fueron desarrollados por Cleveland (1979) como mtodo de
interpolacin y luego mejorados por el autor (Cleveland, 1988) implementando las
aproximaciones polinmicas locales. Algunos ejemplos de sus aplicaciones aparecen en
Schmerling y Peil (1985). La aproximacin LWP se elabora mediante un ajuste puntual de
polinomios de bajo grado en subconjuntos localizados de datos, la idea bsica es usar un
polinomio ordinario para la regresin local eligiendo intervalos [ ] b x b x + , siendo b el
ancho de banda; en cada intervalo se estima una funcin ( ) x y . Los coeficientes del polinomio
ajustado son hallados mediante mnimos cuadrados ponderados dando mayor peso en la
ponderacin a los puntos de datos ms cercanos y menor peso a los puntos ms alejados dentro
del intervalo [ ] b x b x + , .
Dado un modelo localizado, por ejemplo un polinomio de primer grado:
( ) x x y
1 0
+ = 4-1

Los coeficientes suelen ser estimados minimizando la expresin:
( ) ( ) ( )

= =
+ = =
N
k
k k
N
k
k k
x y x y y
1
2
1 0
1
2
min min 4-2

Para el ajuste de una regresin lineal localmente ponderada debe suministrarse un punto de
referencia
query
x con base al cual se construye un nuevo ajuste lineal que est mucho ms
influenciado por puntos en la vecindad del
query
x segn la distancia euclidiana entre dichos
puntos. La regresin local es obtenida mediante la ponderacin de cada punto en la vecindad
del
query
x en funcin de su distancia euclidiana, as pues un punto que se encuentre alejado del
query
x tendr una ponderacin de cero y un punto ms cercano tendr una ponderacin alta.
Los parmetros de la regresin pueden ser estimados como:
( ) ( ) ( ) ( )( )

= =
+ = =
N
k
k k k query
N
k
k k k query
x y x x w x y y x x w
1
2
1 0
1
2
, min , min 4-3
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-3
El lado derecho de la Figura 4-1 , muestra el efecto de la ponderacin, cerca del punto de
referencia (marcado con una X), los residuos ms grandes son penalizados fuertemente,
mientras con aquellos lejanos la ponderacin es despreciable. Si el punto de referencia
cambia de posicin entonces los pesos sobre los datos podran cambiar generando un nuevo
ajuste lineal, por lo que el mtodo tambin recibe el nombre de mnimos cuadrados mviles.

Figura 4-1 Comparacin entre una regresin global y una regresin local.

La funcin de ponderacin w depende de la distancia euclidiana entre el punto de referencia
query
x y las observaciones en la vecindad x , una de las funciones de ponderacin ms
utilizadas es la funcin Gaussiana dada por:
( ) ( )
2
exp ,
i i query
x x w = 4-4

Siendo
farthest query
x x , = 4-5


Donde es el operador de la distancia euclidiana,
farthest
x es el punto ms lejano de la
vecindad; cada aproximacin local se controla variando el valor del coeficiente y el mejor
valor de dicho parmetro se obtiene automticamente por validacin cruzada.
En trminos generales supngase que una regresin polinmica local, construida alrededor de
un punto de referencia
query
x est dada por:
( ) ( ) ( ) ( ) x t x t x t x y
M M
+ + + = ...
2 2 1 1
4-6

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-4
Donde ( ) x t
j
es una funcin que genera el j -simo trmino del polinomio de regresin, por
ejemplo, para un polinomio bicuadrtico con datos de entrada ( )
2 1
, x x se tiene: ( ) 1
1
= x t ,
( )
1 2
x x t = , ( )
2 3
x x t = , ( )
2
1 4
x x t = , ( )
2
2 5
x x t = , ( )
2 1 6
x x x t = . La ecuacin 4-5 puede ser reescrita
ms compactamente como:
( ) ( ) x t x y
T
= 4-7

Donde ( ) x t es el vector de los trminos del polinomio ( ) ( ) ( ) ( ) [ ] x t x t x t x t
M
,..., ,
2 1
= . La
ponderacin para el k -simo dato es computada como una funcin decreciente de la distancia
euclidiana entre el
k
x y el
query
x . Los valores de los coeficientes son estimados
minimizando la expresin:
( ) ( )

N
k
k
T
k k
x t y w
1
2
4-8

Con ( )
k query k
x x w w , = , usando mnimos cuadrados:
( ) y X X X
T T
1
= 4-9

Siendo ( ) X X
T
una matriz de longitud M M y y X
T
una matriz de 1 M donde:
( ) ( ) ( )

=
=
N
k
k j k i k j i
T
x t x t w X X
1
,
4-10

( ) ( )

=
=
N
k
i k i k i
T
y x t w y X
1
4-11

4.1.2 Funciones de influencia Radial (RBF)
Considere la relacin que existe entre los caudales medios mensuales del ro Guadalupe y las
temperaturas superficiales del ocano (SST) en las regiones Nio 1-2 y Nio 3-4, dicha
relacin puede ser presentada en un esquema tridimensional tal como se ilustra en la Figura 4-
2. La escala de colores permite definir la localizacin de los caudales segn su magnitud en
funcin de las SST, por ejemplo los caudales mximos (los puntos de color rojo y anaranjado)
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-5
parecen concentrarse en la regin donde las SST para ambas regiones Nio son ms bajas, es
decir, los eventos ms altos de caudal se presentan cuando las temperaturas en la regin Nio
1-2 varan entre 18C y 21C y simultneamente las temperaturas en la regin Nio 3-4 varan
entre 24C y 27C. As mismo pueden definirse otras regiones para la existencia de caudales
bajos (en Azul oscuro) e intermedios (en amarillo y azul claro). La Figura 4-2 muestra que los
datos evidentemente coexisten en una vecindad y por tanto puede ser usada la informacin de
de la vecindad para estimar la magnitud de los caudales para distintos valores de las SST.

Figura 4-2 Caudales del rio Guadalupe Vs SST Nio 1-2 y Nio 3-4

As pues, el problema del pronstico en hidrologa puede ser entendido como un problema de
interpolacin, muy comn en geoestadstica, el cual dependen de la distancia o norma a los
puntos en una determinada vecindad. En el subcampo matemtico del anlisis numrico, se
denomina interpolacin a la obtencin de nuevos puntos partiendo del conocimiento de un
conjunto discreto de puntos. Las funciones de influencia radial son un mtodo de interpolacin
basado en un tipo especial de funciones cuya principal caracterstica es que reducen (o
aumentan) su respuesta montonamente con su distancia a un punto central (Queipo et al.
2005). El centro, la distancia escalar y la forma precisa de la funcin de base radial son
parmetros del modelo. Un modelo RBF puede ser expresado como:
( ) ( )

=
+ =
N
i
i i
x x x y
1
4-12

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-6
Donde es una constante o un polinomio ponderado, son los coeficientes calculados
mediante la resolucin de ecuaciones lineales, ( ) es la funcin de base,
i
x x
corresponde a la distancia radial (
i
x x dist = ) y N representa a la cantidad de datos
presentes en la muestra.
puede definirse como un promedio (simple o ponderado) de la informacin en la vecindad
y ( )

N
i
i i
x x
1
es una correccin a dicho promedio que depende de la distancia del punto
evaluado al conjunto discreto de puntos en la vecindad.
Volviendo al caso del ro Guadalupe, supngase que se desea conocer el valor da caudal para
condiciones de las SST que no estn presentes en la muestra de datos, para ello son usadas las
funciones de influencia radial; en un punto establecido x se calcula la norma hacia todos los
puntos de la vecindad
i
x (Figura 4-3), buscando obtener el caudal para el punto x como una
ponderacin de los datos en la vecindad en funcin de la distancia radial.


Figura 4-3 El concepto de influencia Radial

Existen diferentes tipos de funciones de influencia radial ( ) , entre ellos la funcin
biarmnica, la multicuadrtica, multicuadrtica inversa, poliarmnica, Gausiana, etc. una
completa revisin de los tipos de RB son presentados en Powell (1987) y Gutmann (2001) y
algunas de sus ecuaciones son:
B.F Biarmnica (lineal):
( ) dist dist = 4-13

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-7
B.F Multicuadrtica:
( )
2 2
c dist dist + = 4-14

B.F Multicuadrica inversa:
( )
2 2
1
c dist
dist
+
= 4-15

B.F Poliarmnica:
( ) ( ) ( )
2 2 2 2
ln c dist c dist dist + + = 4-16

B.F Gausiana:
( )
|
|

\
|
=
2
2
2
exp

dist
dist 4-17

Donde c es una constante de forma, que puede tomar el valor de 1 (Acar & Rais-Rohani
2009), y es la ventana (o radio) de ponderacin. Ser un valor constante definido como
el promedio de y , es decir:

=
=
n
i
i
y
n
1
1
4-18
Y en algunos casos, con el fin de evitar singularidad en la matriz para el clculo de los
parmetros , la RBF puede ser aumentada mediante la inclusin de una funcin polinmica
de la forma:
( )

=
=
M
j
j j
x t
1
4-19
Donde ( ) x t
j
son los trminos del polinomio y
j
sus correspondientes coeficientes. Ntese
que 4-19 corresponde a una regresin local (de la forma 4-5), con lo que se puede afirmar que
las funciones de influencia radial son una generalizacin mejorada de los mnimos cuadrados
locales. Como la ecuacin 4-11 es indeterminada (hay ms parmetros a encontrar que numero
de ecuaciones), entonces se imponen la condicin de ortogonalidad a los coeficientes de la
siguiente manera:
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-8
( ) 0
1
=

=
N
i
i j i
x t 4-20

Combinando las ecuaciones 4-11 y 4-19 se obtiene el sistema matricial:
(

=
(

0 0
y
t
t A
T

4-21

Donde ( )
j i j i
x x A =
,
con n i ,..., 2 , 1 = y n j ,..., 2 , 1 = , ( )
i j j i
x t t =
,
, [ ]
T
n
,..., ,
2 1
= y
[ ]
T
n
,..., ,
2 1
= .
La solucin del sistema (4-21) permite obtener los parmetros de ponderacin de las RBF y
los coeficientes del polinomio.
La aplicacin de la RBF multicuadrtica sobre toda la regin de la Figura 4-3, permite estimar
mediante interpolacin, valores de caudal para puntos que no estn dentro de la muestra de
datos. En la Figura 4-4 se muestran los resultados de interpolacin para el ro Guadalupe.
Finalmente la ecuacin 4-12 puede ser aplicada usando ms de tres variables dado que
depende solo de la norma
j i
x x cuyo clculo pueden ser extendido a cualquier dimensin,
as pues, 4-12 es directamente una funcin de regresin. Las variables explicativas a usar en el
modelo deben corresponder con rezagos de las variables independientes para asegurar la
prediccin del futuro en funcin de datos actuales o precedentes, y son usadas para definir la
vecindad a usar en la ponderacin.

Figura 4-4 Aplicacin de RBF Multicuadrtica para el pronstico de caudales.

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-9
4.2 REDES POLINMICAS
En el ao 1971 del acadmico Alexis G. Ivakhnenko de instituto Sovitico de Control
Automtico (Avlomatika) present su trabajo sobre la teora polinmica de sistemas
complejos usando una estructura de red tipo perceptrn multicapa, donde cada neurona ajusta
una funcin no lineal que usualmente es un polinomio de segundo grado, cada neurona acepta
dos entradas y la funcin implementada es de la forma:
( )
2 1 5
2
2 4
2
1 3 2 2 1 1 0 2
X X a X a X a X a X a a X A z + + + + + = = 4-22

Donde ( ) X A
2
denota una transformacin de segundo orden; en la Figura 4-2, tomada del
trabajo original de Ivakhnenko, se presenta el diagrama de flujo de las redes polinmicas cuyo
esquema se conoce como el mtodo de agrupacin para el tratamiento de datos (en ingls
Group Method of Data Handling, GMDH).

Figura 4-5 Algoritmo de agrupacin para el tratamiento de datos. I: primer capa de auto-selecciones,
II segunda capa de autoseleccin, III: seleccin de todas las soluciones, IV: optimizacin.

4.2.1 Algoritmo de agrupacin para el tratamiento de Datos (GMDH).
El algoritmo de agrupacin para el tratamiento de datos tiene por objeto ajustar polinomios
mediante funciones bsicas de regresin involucrando a pequeos subconjuntos de las
variables de entrada, cada uno de los polinomios obtenidos conforman lo que se denomina
descripcin parcial de la informacin (PD) (Oh et al, 2002). Si y es la variable a predecir y
X es el vector de variables predictoras (
n
X X X ,..., ,
2 1
), un polinomio bsico para la
construccin de una PD esta dado por:
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-10
( ) Fuv Ev Du Cv Bu A v u A z + + + + + = =
2 2
2
, 4-23

Donde F E D C B A , , , , , son los parmetros de la PD y v u, corresponden a un par de variables
extradas de X tales que z corresponda al polinomio que mejor se ajusta a la variable
dependiente y .
El proceso iterativo de construccin de cada capa del GMDH requiere tres pasos bsicos a
seguir:
Paso 1: se toman dos variables del conjunto de variables independientes
n
X X X ,..., ,
2 1
, de
esta manera el nmero total de polinomios que pueden ser construidos usando 4-22 es igual a
( ) 2 / 1 n n ; como resultado, se obtiene una columna con los
m
z ( ( ) 2 / 1 ,..., 2 , 1 = n n m ) los
cuales corresponden a nuevas variables mejoradas altamente correlacionadas con la variable
y de mayor habilidad de pronstico en comparacin con las variables iniciales del sistema
n
X X X ,..., ,
2 1
.
Paso 2: Se identifican las mejores
m
z utilizando como criterio de seleccin el mnimo error
cuadrtico medio hallado por validacin cruzada en relacin a la variable de salida y , el
mtodo de seleccin podr eliminar aquellas
m
z cuyo ajuste no supere un umbral predefinido
con lo que al final se obtiene un grupo reducido de variables z que servirn de entradas a otra
capa de la red.
Los pasos 1 y 2 corresponden a una iteracin del algoritmo GMDH, luego las variables
independientes
n
X X X ,..., ,
2 1
cambian de posicin en la red para generar nuevas PD en la
siguiente iteracin.
Paso 3: este paso busca comprobar si el conjunto de ecuaciones del modelo, obtenidas en cada
iteracin se puede mejorar. El valor ms bajo del criterio de bondad de ajuste obtenido durante
la presente iteracin es comparado con el valor ms pequeo en la pasada iteracin. Los pasos
1 y 2 se repiten hasta conseguir el menor error. Al final se llega a la obtencin de un
polinomio conocido como el polinomio de Ivakhnenko que esta dado por:

= = = = = =
+ + + + =
m
i
m
j
m
k
k j i ij
m
i
j
m
j
i ij
m
i
i i
X X X c X X c X b a y
1 1 1 1 1 1
... 4-24

4.2.2 Topologa y pasos para la construccin de una red neuronal polinmica
El algoritmo de las redes neuronales polinmicas est basado en el mtodo GMDH y utiliza
polinomios como el lineal, cuadrtico, cbico etc. para la construccin de las descripciones
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-11
parciales de los datos. Al elegir las variables de entrada ms significativas y el orden del
polinomio se pueden obtener las mejores descripciones parciales de datos (PD) cuya capacidad
de ajuste depende del nmero de capas y neuronas definidas en la red. As pues una red
polinmica busca una relacin del tipo:
( )

+ + + + = =
3 2 1
3 2 1 3 2 1
2 1
2 1 2 1
1
1 1 0 2 1
... ,... ,
k k k
k k k k k k
k k
k k k k
k
k k n
X X X c X X c X c c X X X f y 4-25

Donde los s c
k
' denotan los coeficientes del modelo.
Un esquema general de red polinmica se presenta en la Figura 4-6, para determinar el valor
de y , se construir una PD para cada par de variables independientes en la primera interaccin
usando el mtodo de los mnimos cuadrados; las PD ptimas sern seleccionadas mediante un
criterio de bondad de ajuste y los valores ajustados
mi
z han de ser utilizados como entradas en
una nueva capa de la red, el proceso se repetir hasta obtener el mejor ajuste posible. Una vez
la capa final haya sido construida aquel nodo caracterizado por el mejor criterio de ajuste ser
seleccionado como el nodo de salida del modelo, los nodos restantes de dicha capa se
descartan, y, adems, todos los nodos de las capas anteriores que no tienen influencia sobre el
nodo de salida son eliminados al trazar la trayectoria del flujo de datos en cada iteracin.
Mltiples iteraciones son requeridas para obtener el mejor ajuste y es por ello que la
construccin de una red polinmica consta se los siguientes pasos:
Paso 1: determinar las variables de entrada del sistema:
n
X X X ,..., ,
2 1
se toman como predictores del sistema.
Paso 2: formar grupos de datos para el entrenamiento y la validacin del modelo:
Las variables de entrada y salida del modelo ( ) ( )
ni i i i i i
X X X y X y ,..., , , ,
2 1
= con p i ,..., 2 , 1 =
(siendo p el nmero de observaciones) sern divididas en dos partes que denotan los
conjuntos de datos para el entrenamiento
ent
p y la validacin
val
p de la red, obviamente
val ent
p p p + = . Los datos de entrenamiento de la red sirven para la construccin de la red
Polinmica (incluyendo el clculo de los coeficientes de las PD en cada nodo) y los datos de la
validacin para la estimacin del error de la red.

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-12

Figura 4-6 Descripcin general de una red Polinmica

Paso 3: seleccin de la topologa de red Polinmica: la estructura de la red polinmica es
seleccionada en funcin del nmero de variables de entrada y el orden de la PD en cada capa.
Existen bsicamente dos tipos de estructuras (Figura 4-7) llamadas red bsica y red
Modificada, que se pueden clasificar de la siguiente manera:
(a) Estructura de red bsica: cuando el nmero de variables de entrada en cada PD es el
mismo en todas las capas.
Caso 1: el orden del polinomio de las PD es el mismo en cada capa de la red.
Caso 2: el orden del polinomio de las PD vara en las capas de la red.
(b) Estructura de red Modificada: cuando el nmero de variables de entrada de cada PD
cambia en las diferentes capas.
Caso 1: el orden del polinomio de las PD es el mismo en cada capa de la red.
Caso 2: el orden del polinomio de las PD vara en las capas de la red.

Paso 4: Determinar el nmero de variables de entrada y el orden del polinomio para formar la
descripcin parcial de los datos (PD):
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-13

Figura 4-7 Topologa de una red polinmica


DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-14
La determinacin del orden de del polinomio y el numero de de variables de cada PD se
establece en funcin de la arquitectura de la red seleccionada. En la Tabla 4-1 se presenta el
tipo de polinomio a usar segn el nmero de variables de entrada en cada PD.
Tabla 4-1 Estructuras de una red polinmica


Los tipos de polinomios son los siguientes:
Bilineal:
( ) Cv Bu A v u A + + = ,
1
4-26

Bicuadrtico:
( ) ( ) Fuv Ev Du v u A v u A + + + =
2 2
1 2
, , 4-27

Bicbico:
( ) ( )
2 2 3 3
2 3
, , Juv v Iu Hv Gu v u A v u A + + + + = 4-28

Trilineal:
( ) Dw Cv Bu A w v u A + + + = , ,
1
4-29

Tricuadrtico:
( ) ( ) Jvw Iuw Huv Gw Fv Eu w v u A w v u A + + + + + + =
2 2 2
1 2
, , , , 4-30


Tricbico:
( ) ( ) Nuvw Mw Lv Ku w v u A w v u A + + + + =
3 3 3
2 3
, , , , 4-31
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-15
Paso 5: Estimacin de los coeficientes de la PD.
El vector de coeficientes
i
C para cada PD es obtenido minimizando el error cuadrtico medio
E , entre
i
y y
mi
z .
( )

=
=
tr
N
i
mi i
tr
z y
N
E
0
2
1
4-32
Siendo
i i i mi
X C y z = =
)
4-33

Utilizando la porcin de informacin para calibrar el modelo se establece un conjunto de
ecuaciones lineales de la forma:
i i
X C Y = 4-34
Y mediante la tcnica de mnimos cuadrados, los coeficientes de las PD en cada nodo se
estiman como:
( ) Y X X X C
T
i i
T
i i
1
= 4-35

Siendo [ ]
T
n
tr
y y y Y ,..., ,
2 1
= , [ ]
T
i n ki i i i
tr
X X X X X ,..., ,..., ,
2 1
= , [ ]
T
i n i i i
c c c C

= ,..., ,
1 0
con la siguiente
notacin: i : nmero del nodo, k : nmero del dato,
tr
n nmero de datos en el periodo de
calibracin y n el nmero total de coeficientes estimados. El proceso es implementado en
forma repetitiva para todos los nodos de cada capa y para todas las capas de la red Polinmica.
Paso 6: Seleccionar las PDs con mejor capacidad predicativa.
Cada PD es estimada y evaluada usando los datos en el periodo de calibracin, luego se hace
una comparacin entre los valores obtenidos y se seleccionan aquellas PDs con la mejor
capacidad predicativa. Usualmente se seleccionan un nmero predefinido (W ) de PDs o en su
defecto se define un umbral (ndice) de capacidad predicativa para seccionar las PDs bajo la
siguiente condicin:
+ = <
*
E E
j
4-36
Donde
j
E es el menor error de ajuste en la capa actual,
*
E es el menor error de ajuste en la
capa anterior y es una constante positiva especificada por el modelador.

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-16
Paso 7: Chequear el criterio para detener el entrenamiento de la red.
La corrida de una red neuronal Polinmica se puede terminar cuando:
*
E E
j
4-37
El algoritmo de la RNP tambin puede terminar cuando el nmero de iteraciones definidas por
el usuario es excedido.
Paso 8: Determinar las variables de entrada para la prxima capa de la red.
Si
j
E (el menor error de ajuste en la capa actual) no satisface la condicin 4-36 entonces la
red puede ser expandida definiendo una nueva capa.
4.3 APLICACIN DE LAS NUEVAS TCNICAS AL PRONSTICO DE
CAUDALES MEDIOS MENSUALES EN COLOMBIA.
Las tcnicas de pronstico del presente captulo son funciones de regresin que pueden ser
combinadas con cualquier mtodo espectral para formar nuevos modelos de prediccin.
Igualmente pueden ser implementados en esquema peridico utilizando el protocolo propuesto
en el captulo 3. Se propone la combinacin de los polinomios ponderados (PPON), en este
caso las RBFs en un esquema peridico (P) combinados con la transformada de Hilbert Huang
(HH) y las redes neuronales polinmicas (RNPOL) en un esquema peridico (P) con el
Anlisis espectral Singular (AES). Inicialmente la serie estandarizada de caudales se
descomponen en sus principales armnicos usando uno de los mtodos espectrales del Anexo
1, la serie descompuesta es parcialmente reconstruida para eliminar el ruido, por ejemplo la
descomposicin en modos intrnsecos (IMFs) para la serie del ro Guatap se presenta en la
Figura 4-5. El uso de RBFs de forma adjunta con un mtodo espectral permite aumentar de
forma significativa la habilidad de pronstico del modelo como se muestra en la Figura 4-6.
Las variables explicativas, en el caso de los polinomios ponderados usando RBFs, son usadas
para establecer la coexistencia de los caudales dados diferentes valores de variables
macroclimticas. Para el caso del ro Guatap, la serie de caudales reconstruida usando la
trasformada de Hilbert-Huang es analizada de manera conjunta con las anomalas de
temperatura rezagadas (con dos retardos) para las regiones Nio 1-2 y Nio 3-4 usando RBFs
(Figura 4-7). Los valores ms altos en las anomalas estandarizadas de caudales se presentan
cuando las anomalas de temperaturas en la regin Nio 1-2 estn en el rango [ ] 1 , 2 y las
anomalas de la regin Nio 3-4 se encuentran sobre la regin [ ] 1 , 2 .

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-17

Figura 4-5 Aplicacin de la descomposicin en modos intrnsecos para la serie de caudales del ro
Guatap (a) Descomposicin; (b) Reconstruccin.

Figura 4-6: Incorporacin de un mtodo espectral en la prediccin con polinomios ponderados

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-18

Figura 4-7: Incorporacin de un mtodo espectral en la prediccin con polinomios ponderados
Finalmente para todos los horizontes de pronstico se evala el uso de las diferentes tcnicas
espectrales y se selecciona la mejor para ser usada en la prediccin de caudales. En la Tabla 4-
2
Tabla 4-2 Comparacin de los PPON usando diferentes mtodos espectrales
1 mes 3 meses 6 meses
PPON
+
AES.

PPON
+
OND.

PPON
+
IMFS


DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-19
Para la aplicacin de las redes polinmicas al pronstico de caudales se seleccionan aquellas
variables explicativas cuya correlacin con la serie de caudales sea significativa, dichas
variables pueden corresponder a varios rezagos de caudal, rezagos de lluvia, y variables
macro-climticas. Las mltiples variables seleccionadas son adoptadas como la capa de
entrada de la red polinomica (Figura 4-8).


Figura 4-8: Incorporacin de un mtodo espectral en la prediccin con polinomios ponderados

En la Tabla 4-3 se presenta una comparacin entre el mejor de los modelos tradicionales
(MARS), los polinomios ponderados y las redes polinmicas para la prediccin de los
caudales del ro Guadalupe con ventanas de 1, 3 6, y 12, meses; en la Anlisis de los
resultados
Se han propuesto como nuevas tcnicas para la prediccin de caudales medios mensuales en
Colombia los polinomios ponderados y las redes neuronales polinmicas. Al igual que el
modelo de regresin MARS las metodologas aqu expuestas tienen la ventaja de ser no-
paramtricas, por lo que el clculo de los parmetros de calibracin no depende de la
distribucin probabilstica de los datos, lo que convierte a los modelos aqu expuestos en
excelentes candidatos para la modelacin de procesos no lineales y no estacionarios como los
caudales.
Al igual que los dems mtodos de regresin presentados en el captulo anterior, los
polinomios ponderados y las redes polinmicas pueden ser combinadas con un mtodo
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-20
espectral para generar modelos de pronstico ms robustos, los mejores hbridos fueron
obtenidos combinando los polinomios ponderados con la transformada de Hilbert Huang
(PPON +HH) y las redes polinmicas con el Anlisis espectral singular (RNPOL +AES),
ambos usando un esquema peridico ((P)).
Tabla 4-4 se presenta igualmente los resultados para el ro Bat. La aplicacin de las
metodologas aqu presentadas en los dems ros puede ser consultada en el Anexo 2.



Tabla 4-3 Prediccin de caudales ro Guadalupe con Polinomios ponderados y Redes polinmicas
1 mes 3 meses 6 meses 12 meses
M
A
R
S

(
P
)
+
O
N
D


P
P
O
N

(
P
)
+
H
H




R
N
P
O
L

(
P
)
+
A
E
S




DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-21
4.4 ANLISIS DE LOS RESULTADOS
Se han propuesto como nuevas tcnicas para la prediccin de caudales medios mensuales en
Colombia los polinomios ponderados y las redes neuronales polinmicas. Al igual que el
modelo de regresin MARS las metodologas aqu expuestas tienen la ventaja de ser no-
paramtricas, por lo que el clculo de los parmetros de calibracin no depende de la
distribucin probabilstica de los datos, lo que convierte a los modelos aqu expuestos en
excelentes candidatos para la modelacin de procesos no lineales y no estacionarios como los
caudales.
Al igual que los dems mtodos de regresin presentados en el captulo anterior, los
polinomios ponderados y las redes polinmicas pueden ser combinadas con un mtodo
espectral para generar modelos de pronstico ms robustos, los mejores hbridos fueron
obtenidos combinando los polinomios ponderados con la transformada de Hilbert Huang
(PPON +HH) y las redes polinmicas con el Anlisis espectral singular (RNPOL +AES),
ambos usando un esquema peridico ((P)).
Tabla 4-4 Prediccin de caudales ro Bat con Polinomios ponderados y Redes polinmicas

1 mes 3 meses 6 meses 12 meses
M
A
R
S

(
P
)
+
O
N
D


P
P
O
N

(
P
)
+
H
H


R
N
P
O
L

(
P
)
+
A
E
S



DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-22
En las Figuras 4-6, 4-7, 4-8 y 4-9 se presenta la comparacin entre el mejor de los modelos del
captulo 3 y los nuevos modelos propuestos. Dicha comparacin demuestra una disminucin
significativa en los indicadores de error (RMSE y MAPE) y un aumento en el coeficiente de
Pearson para todos los ros al usar los mtodos propuestos en el presente captulo (ver anexo
2), analizando solo la ventana de doce meses y tomando como indicador el MAPE, el ro
Guadalupe pasa del 17% al 16%, el Rio Grande del 21% al 18.6%, el ro Porce del 16% al
15% , en el Guatap del 18.1 al 17.5% , Nare del 21.5% al 18.8%, San Carlos del 33% al
31%, en San Lorenzo del 23% al 22%, Miel del 23.9% al 22.2%; Magdalena del 22.6% al
20.5%, Guavio del 27% al 24% y Bat del 34% a 28%. Para las dems ventanas los esquemas
de prediccin propuestos casi siempre son mejores que el MARS (P)+OND, lo que sugiere
que los mtodos no paramtricas expuestos en el presente captulo poseen una habilidad de
pronstico que supera la de los mtodos tradicionales. As pues, los mtodos aqu expuestos
constituyen un avance significativo en la implementacin de tcnicas no paramtricas para el
pronstico de caudales medios mensuales en Colombia.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-23
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
9.00
10.00
11.00
12.00
13.00
14.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUDALUPE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
8.00
9.00
10.00
11.00
12.00
13.00
14.00
15.00
16.00
17.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUDALUPE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
12.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUDALUPE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
12.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUDALUPE V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
13.50
14.00
14.50
15.00
15.50
16.00
16.50
17.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO TENCHE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO TENCHE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
23.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO TENCHE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
23.00
24.00
25.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO TENCHE V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
11.00
11.50
12.00
12.50
13.00
13.50
14.00
14.50
15.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GRANDE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
13.50
14.00
14.50
15.00
15.50
16.00
16.50
17.00
17.50
18.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GRANDE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GRANDE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
23.00
24.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GRANDE V=12
%RMSE MAPE R2

Figura 4-6: Comparacin de modelos ros Guadalupe, Tenche y Grande.

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-24
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
16.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO PORCE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
13.50
14.00
14.50
15.00
15.50
16.00
16.50
17.00
17.50
18.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO PORCE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO PORCE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
15.50
16.00
16.50
17.00
17.50
18.00
18.50
19.00
19.50
20.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO PORCE V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
12.00
12.50
13.00
13.50
14.00
14.50
15.00
15.50
16.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUATAP V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUATAP V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUATAP V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUATAP V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
11.00
12.00
13.00
14.00
15.00
16.00
17.00
18.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO NARE V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO NARE V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RONARE V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO NARE V=12
%RMSE MAPE R2

Figura 4-7 Comparacin de modelos para los ros Porce, Guatap y Nare
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-25
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
15.00
20.00
25.00
30.00
35.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN CARLOS V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
31.00
33.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN CARLOS V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
18.00
23.00
28.00
33.00
38.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN CARLOS V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
20.00
25.00
30.00
35.00
40.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN CARLOS V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN LORENZO V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN LORENZO V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN LORENZO V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO SAN LORENZO V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MIEL V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MIEL V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MIEL V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MIEL V=12
%RMSE MAPE R2

Figura 4-8 Comparacin de modelos para los ros San Carlos, San Lorenzo y Miel.
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-26
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
11.00
12.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MAGDALENA V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
14.00
15.00
16.00
17.00
18.00
19.00
20.00
21.00
22.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS ROMAGDALENA V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MAGDALENA V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO MAGDALENA V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
26.00
28.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUAVIO V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUAVIO V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
18.00
23.00
28.00
33.00
38.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUAVIO V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
31.00
33.00
35.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO GUAVIO V=12
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
10.00
12.00
14.00
16.00
18.00
20.00
22.00
24.00
26.00
28.00
30.00
MARS (P) + OND PPON (P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO BATA V=1
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
15.00
17.00
19.00
21.00
23.00
25.00
27.00
29.00
31.00
33.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO BATA V= 3
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
13.00
18.00
23.00
28.00
33.00
38.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO BATA V=6
%RMSE MAPE R2
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
15.00
20.00
25.00
30.00
35.00
40.00
MARS (P) + OND PPON(P) + HH RNPOL (P) +AES
R
2
E
R
R
O
R
(
%
R
M
S
E
, M
A
P
E
)
MTODOS PROPUESTOS RO BATA V=12
%RMSE MAPE R2

Figura 4-9 Comparacin de modelos para los ros San Carlos, San Lorenzo y Miel.

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIN
DE CAUDALES MEDIOS MENSUALES EN COLOMBIA
Julin David Rojo Hernndez PARH -UNAL 4-27
Referencias
Cleveland, W. S. (1979) Robust locally weighted regression and smoothing scatterplots,
Journal of American Statistical Association, 74 (368), 829-836.
Cleveland, W. S. and Devlin, S. J. (1988) Locally weighted regression: an approach to
regression analysis by local fitting, Journal of American Statistical Association., 83 (403),
596-610.
Cleveland, W. S., Devlin, S. J, and Grosse, E. (1988) Regression by local fitting, Journal of
Econometrics, 37, 87-114. Craven, P. and Wahba, G. (1979) Smoothing noise data with spline
functions, Numerische Mathematik, 31, 377-403.
Hardy R.L. Multiquadratic equations of topography and other irregular surfaces (1971).
Journal of Geophysical Research, Vol. 76, pp. 1905-1915
Ivahnenko AG. Polynomial theory of complex systems (1971). IEEE Trans Systems Man
Cybernet;SMC-1:36478.
Poveda G., "Aplicacin de los mtodos MARS, Holt-Winters y ARIMA generalizado en el
pronstico de caudales medios mensuales en ros de Antioquia"(2006). En: Colombia
Meteorologia Colombiana, ISSN: 0124-6984 ed: Gente Nueva v.10 fasc.1 p.36 - 46 ,
Powell M.J.D. (1987) Radial basis functions for multivariable interpolation: a review,
Algorithms for Approximation, Mason J.C., Cox M.G. (eds.), London, Oxford University
Press,
PRIESTLEY, M. B. y CHAO, M. T. (1972): "Non-parametric function fitting". J. Royal Stat.
Soc, B, 34, 385-392.
SCHMERLING, S. y PEIL, J. (1986): ' Improvement of the method of kernel estimation by
local polynomial approximation of the empirical distribution function and this application to
empirical regression". Gegenbaurs morphologisches Jahrbuch, 132,29-35.
Sk Oh, W P. Identification of fuzzy systems by means of an auto-tuning algorithm and its
application to nonlinear systems. Fuzzy Sets and Systems. 2000;115(2):205-30.
S.J. Farlow, The GMDH algorithm, in: S.J. Farlow (Ed.) (1984). Self-organizing Methods in
Modeling: GMDH Type Algorithms, Marcel Dekker, New York, pp. 124.

Вам также может понравиться