Вы находитесь на странице: 1из 9

TRANSPORTE DE INFORMACION DE CRECIENTES

MEDIANTE REGRESION LINEAL

Daniel Francisco Campos Aranda.


Profesor Jubilado de la U.A.S.L.P.
Genaro Codina # 240. 78280 San Luis Potos, S.L.P.
campos_aranda@hotmail.com

Resumen
Se describe el procesamiento probabilstico de crecientes, destacando la ventaja de
contar con registros ms largos. Se plantea la posibilidad de ampliar registros cortos
con base en secuencias largas a travs de regresin. En seguida, se expone con
detalle la tcnica ms simple para realizar el transporte de informacin hidromtrica, la
regresin lineal, se citan sus ecuaciones y se establecen los criterios que definen si es
conveniente o no la ampliacin. Posteriormente, se detalla su aplicacin para la
ampliacin del registro de crecientes de la estacin Platn Snchez con base en
Tempoal, ambas del Ro Tempoal, Veracruz. Por ltimo, se formula una conclusin que
destaca la sencillez y exactitud del mtodo.

Introduccin.
Cuando se requieren predicciones de crecientes, los registros hidromtricos disponibles
sobre gastos mximos anuales instantneos, son procesados probabilsticamente por
medio de una funcin de distribucin de probabilidades, la cual es ajustada a tales
datos con base en los parmetros estadsticos obtenidos del registro. Lgicamente,
tales parmetros (media, desviacin estndar y coeficiente de asimetra) son ms
confiables cuanto mayor es la secuencia de gastos utilizada.
Por otra parte, las mediciones sobre crecientes que son simultneas en dos o ms
estaciones hidromtricas se pueden utilizar para extender o ampliar registros cortos,
con base en la(s) serie(s) larga(s). Para que lo anterior sea conveniente desde un punto
de vista estadstico, el grado de dependencia o asociacin en el periodo comn entre
los registros corto y largo debe superar unos determinados valores crticos para
asegurar que los nuevos parmetros estadsticos (media y variancia) mejoran con la
extensin.
Las tcnicas estadsticas disponibles para transferencia de informacin hidromtrica, se
pueden emplear para: (1) mejorar las estimaciones de los parmetros estadsticos, (2)
ampliar o extender registros cortos de crecientes y (3) estimar observaciones faltantes
(Salas, 1980).
1

Modelo de regresin lineal.


El modelo de regresin lineal simple es la tcnica ms comnmente utilizada para
transporte de informacin hidromtrica entre dos estaciones de aforos. Considerando
que N1 es el nmero de aos del registro corto (y) y tambin el periodo simultneo o
concurrente, entonces, N1 + N2 es la longitud de la serie larga (x), es decir que:
y 1 , y 2 , , y N1
x1 , x 2 , , x N1 , x N1 1 , , x N1 N2

Las variables aleatorias x y y se acepta que tienen una distribucin conjunta o bivariada
de probabilidad Normal con parmetros x, x, y, y y r, donde los dos primeros son la
media y variancia poblacionales de x, los dos siguientes corresponden a y y r es el
coeficiente de correlacin cruzada de x y y. Si las variables x y y no estn normalmente
distribuidas, lo cual es comn con las crecientes, la transformacin logartmica conduce,
en la mayora de los casos, a una buena aproximacin (Salas, 1980).
El modelo de regresin lineal simple entre las variables x y y es:
yt = a + bxt

(1)

en el cual, yt es el valor estimado correspondiente a xt, a y b son los parmetros


poblaciones de la regresin, cuyas estimaciones muestrales son:
a y 1 b x 1

(2)

b r s1 y / s1 x

(3)

el coeficiente de correlacin r es calcula con la expresin:


N

1
1
x x 1 y t y 1
N1 1 t 1 t
r
s1 x s1 y

(4)

donde y 1 y x 1 son las medias aritmticas estimadas con el registro simultneo, cuyas
desviaciones estndar insesgadas son s1(y) y s1(x), por ejemplo:
N1
1

y t y 1 2
s1 y
N1 1 t 1

1/ 2

(5)

Usar como modelo de transporte la ecuacin 1 origina un aumento en el sesgo de la


variancia de y, lo cual es debido al hecho de que tal frmula no explica toda la variancia
del registro corto, sino nicamente un porcin correspondiente a r 2. Tal aumento de
2

sesgo puede ser removido introduciendo una variancia extra definida como:
(1 r 2) s12 y . Ahora el modelo de transporte ser (Salas, 1980):
y t a b x t 1 r 2 s1 y t

(6)

en el cual es empleado para remover el sesgo en el estimador de la variancia de y, su


expresin es:
2

N 2 N1 1N1 4
N 2 1N1 2N1 3

(7)

toma valores de uno o cero, segn si se emplea el trmino aleatorio o no; por ltimo,
t es la variable normal con media cero y variancia unitaria, la cual se obtiene mediante
un procedimiento especfico, por ejemplo el propuesto por Box y Mller (Clarke, 1973),
que consiste en generar dos nmeros aleatorios con distribucin uniforme en el
intervalo 01, Ru1 y Ru2, los cuales se transforman en dos desviaciones normales con
media cero y variancia unitaria RN1 y RN2, con base en las ecuaciones:
RN1 = - 2 ln Ru 1 cos (2 Ru2)

(8)

RN2 = - 2 ln Ru 1 sen (2 Ru2)

(9)

Debido a que RN puede tomar valores negativos, el procedimiento de generacin dado


por la ecuacin 6 podr conducir a magnitudes negativas. De acuerdo a las
caractersticas del registro histrico (xt), esto es, si presenta o no valores nulos, las
magnitudes negativas se toman como ceros o se descartarn, segn el caso. Escalante
y Reyes (2002) sugieren generar 10,000 secuencias sintticas con la ecuacin 6 y
descartar las series con valores negativos, para obtener los valores medios de cada
ao.

Criterios de mejora de los parmetros estadsticos.


La media y la variancia de la secuencia extendida (y) sern (Salas, 1980):
y y1

N2
b x 2 x 1
N1 N 2

NUM N1 1 s12 y N 2 1 b 2 s 22 x
s 2 y

(10)

N1 N 2 2
2
b x 2 x 1 N 2 1 2 1 r 2 s12 y
N1 N 2

NUM
N1 N 2 1

(11)

Una pregunta que surge cuando se transportan N2 trminos al registro corto, es si stos
mejoran las estimaciones de los parmetros estadsticos; es decir que es necesaria una
medida sobre la confiabilidad de tales estimaciones antes y despus del transporte o
3

extensin del registro. Por ejemplo, si la variancia de un parmetro calculado con la


secuencia ampliada excede a la original utilizando N1 datos, es claro que el transporte
no es conveniente. Otro enfoque es el contenido de informacin relativa (I), definido
como el cociente de la variancia de un parmetro estimado con el registro original de N1
valores o Var(1), entre la estimada con la secuencia ampliada o Var(); cuando I
excede a la unidad resulta conveniente el transporte (Fiering, 1963; Campos, 1999).
Tambin se ha utilizado como criterio de mejora la llamada longitud efectiva del registro
ampliado o Ne, estimada como (Beard, 1962; Salas, 1980):
Ne

N1 N 2
N2
1
1 r 2
N1 2

(10)

entonces, cuando Ne > N1 la ampliacin resulta conveniente. Bajo tales enfoques, la


media aritmtica mejora cuando se cumple la ecuacin siguiente:
r 1 / N1 2

(11)

en cambio, la variancia mejora cuando al considerar el valor menor de N1 N2, r


excede al valor crtico tabulado, segn sea = 1 = 0:
N1 N2

10

12

14

16

18

20

25

30

35

40

45

50

55

60

rc ( = 1) 0.82 0.72 0.65 0.59 0.55 0.52 0.49 0.47 0.42 0.39 0.36 0.34 0.32 0.30 0.29 0.28
rc ( = 0)

N1

N2

10

12

14

16

18

20

25

30

35

40

45

50

55

60

6
12
20
30
40
60

0.81
0.82
0.83
0.83
0.83
0.83

0.69
0.75
0.77
0.78
0.79
0.79

0.63
0.74
0.77
0.78
0.79
0.80

0.63
0.75
0.78
0.79
0.80
0.81

0.63
0.75
0.79
0.80
0.81
0.82

0.64
0.76
0.79
0.81
0.82
0.83

0.65
0.76
0.80
0.82
0.83
0.83

0.65
0.77
0.80
0.82
0.83
0.84

0.66
0.78
0.81
0.83
0.84
0.85

0.67
0.78
0.82
0.84
0.85
0.86

0.68
0.79
0.83
0.85
0.86
0.87

0.68
0.79
0.83
0.85
0.86
0.87

0.69
0.79
0.83
0.85
0.86
0.88

0.69
0.80
0.84
0.86
0.87
0.88

0.69
0.80
0.84
0.86
0.87
0.88

0.69
0.80
0.84
0.86
0.87
0.89

Aplicacin numrica.
En el Ro Tempoal en Veracruz, la estacin hidromtrica Platn Snchez (clave: 26433)
drena un rea de 4,700 km2 y tiene un registro disponible de 25 gastos mximos
anuales instantneos de 19782002 de acuerdo al sistema BANDAS (IMTA, 2003), los
cuales se tienen en la Tabla 1. La estacin de aforos Tempoal (clave: 26248) tiene una
cuenca de 5,275 km2, es decir, est aguas abajo de la anterior y cuenta con un registro
de 49 gastos mximos de 19542002, mismos que tambin se presentan en la Tabla 1.
Con el objeto de ampliar el registro de la estacin Platn Snchez, se propone
transportar la informacin de 19541977 (N2 = 24) de Tempoal por medio de regresin
lineal. A partir de la informacin hidromtrica del periodo comn de 19782002
4

(N1 = 25) y adoptando una transformacin basada en los logaritmos naturales, se


obtuvieron los valores siguientes:
y 1 7.21578
x 1 7.29025
s1 y 0.69489
s1 x 0.69863
s 2 x 0.70666
a 0.6536
b 0.9001
r 0.9050

(5)

(2)
(3)
(4)
(7)

= 1.0195

siendo, los valores crticos de r para mejorar la media 0.209 (ecuacin 11), con 0.423 y
0.83 para la variancia (ver tabulacin), cuando = 1 y = 0, respectivamente; como
r = 0.905 el transporte de informacin resulta conveniente. El modelo para el transporte
es:
yt = 0.6536 + 0.9001xt + 0.3014t

(6)

y los parmetros estadsticos de la serie extendida son:


y 7.24908

(10)
(11)

s 2 y 0.47195

En la Tabla 2 se presentan 5 secuencias sintticas obtenidas con base en las


ecuaciones 6, 8 y 9, as como la serie obtenida cuando = 0. En cambio, en la Tabla 3
se presentan las predicciones obtenidas con la distribucin GVE ajustada con el mtodo
de momentos L (Stedinger et al., 1993; Campos, 2001) para el registro disponible
indicadas con (1), as como las del registro ampliado con la serie sin componente
aleatoria designadas por (2).

Conclusin.
El procedimiento de transporte de informacin hidromtrica con base en la regresin
lineal es bastante simple. Cuando el coeficiente de correlacin de periodo comn ( r )
supera los valores crticos tabulados, la ampliacin del registro corto resulta
conveniente desde un punto de vista estadstico; incluso cuando esto no sucede se
puede intentar el transporte a nivel mensual, como se detalla en Salas (1980). Tambin
se puede plantear un modelo de regresin mltiple, para emplear los registros largos
disponibles en la regin (Salas, 1980). En el ejemplo expuesto, el registro ampliado
conduce a predicciones ligeramente menores que el registro original, lo cual desde un
enfoque regional es ms exacto (Campos, 2007).

Referencias.
Beard, L. R. (1962). Statistical Methods in Hydrology. Section 5: Flood peak frequency
Analytical adjustment, pp. 2325. U. S. Army Corps of Engineers. Sacramento,
California, U.S.A.
Campos A., D. F. (1999). Uso de la correlacin y la regresin lineal para ampliar
registros de volmenes escurridos anuales. Ingeniera. Investigacin y Tecnologa. Vol.
I, No. 2, enero-marzo, pginas 5971.
Campos A., D. F. (2001). Contraste de cinco mtodos de ajuste de la distribucin GVE
en 31 registros histricos de eventos mximos anuales. Ingeniera Hidrulica en Mxico,
Vol. XVI, nmero 2, pginas 7792, abriljunio.
Campos A., D. F. (2007). Contraste de mtodos regionales para prediccin de
crecientes basado en la distribucin GVE, en la cuenca baja del Ro Pnuco. Nota
Tcnica). Ingeniera Hidrulica en Mxico, Vol. XXII, nmero 2, pginas 91105, abril
junio.
Clarke, R. T. (1973). Mathematical Models in Hydrology. Chapter 2: The generation of
synthetic sequences of a single hydrological variable, pp. 1972. Irrigation and Drainage
Paper No. 19. FAO. Rome, Italy. 282 p.
Escalante S., C. y Reyes CH., L. (2002). Tcnicas Estadsticas en Hidrologa. Captulo
6: Anlisis de correlacin y regresin lineal, pginas 105128. Facultad de Ingeniera de
la UNAM. Mxico, D. F. 298 pginas.
Fiering, M. B. (1963). Use of correlation to improve estimates of the mean and variance.
Professional Paper 434C. U. S. Geological Survey. Washington, D. C., U.S.A. 11 p.
Instituto Mexicano de Tecnologa del Agua. (2003). Banco Nacional de Datos de
Aguas Superficiales (BANDAS). Hidrometra y Sedimentos hasta 2002. 8 CDs. CNA
SEMARNAT. IMTA. Jiutepec, Morelos. 2003.
Salas, J. D. (1980). Transfer of information to improve estimates of flood frequencies.
Chapter 17, pp. 592653 in Hydrology for Transportation Engineers, edited by Thomas
G. Sanders. Federal Highway Administration. Washington, D. C., U.S.A. 736 p.
Stedinger, J. R., Vogel, R. M. & FoufoulaGeorgiou, E. (1993). Frequency Analysis of
Extreme Events. Chapter 18, pp. 18.118.66 in the Handbook of Hydrology, editor in
chief David R. Maidment. McGraw-Hill, Inc. New York, U.S.A.

Tabla 1
Gastos mximos anuales (m /s) disponibles en las estaciones hidromtricas
Platn Snchez y Tempoal, del Ro Tempoal, Veracruz.
3

Ao

Tempoal
Gasto
Ao

Gasto

Platn Snchez
Ao
Gasto

1954
1955
1956
1957
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977

2,110.0
6,000.0
4,424.0
449.0
4,100.0
1,507.6
1,277.0
852.9
739.2
1,800.0
748.0
792.7
1,778.0
2,245.0
1,145.0
1,948.0
1,418.0
1,630.0
989.0
1,668.0
4,950.0
4,040.0
1,275.0
514.0

3,725.0
1,655.9
1,162.0
2,020.0
539.6
868.0
4,030.0
1,882.0
476.0
1,765.0
3,265.0
649.0
1,611.0
3,532.0
2,291.0
6,120.0
1,133.0
742.0
683.0
905.0
1,266.9
2,693.7
641.2
1,847.9
926.4

1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002

1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002

2,898.0
1,040.0
976.0
1,940.0
589.8
827.3
4,530.0
1,608.0
462.0
1,773.0
3,653.0
653.0
4,115.0
1,916.0
1,494.9
4,380.0
1,153.8
537.0
758.0
1,217.5
1,259.3
2,776.6
580.4
1,201.3
774.8

Tabla 2
Secuencias de gastos estimados en la estacin Platn Snchez
como transporte de informacin de la estacin Tempoal.
Ao

Sec. 1
( = 1)

Sec. 2
( = 1)

Sec. 3
( = 1)

Sec. 4
( = 1)

Sec. 5
( = 1)

Sec. 6
( = 0)

1954
1955
1956
1957
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977

1,320.3
2,919.8
3,603.8
400.3
4,114.6
1,527.3
850.9
924.9
1,347.3
1,347.1
579.7
744.1
1,568.8
2,132.9
1,183.4
1,695.3
968.7
1,310.9
882.3
1,181.7
3,621.6
2,768.1
991.4
734.7

1,796.5
2,714.3
2,730.6
544.7
3,731.6
679.1
872.5
729.2
649.9
1,342.3
449.2
877.6
881.6
2,115.4
679.0
3,046.3
1,815.7
1,467.7
736.5
1,027.9
3,764.2
3,646.2
1,252.9
461.1

1,807.0
5,290.6
2,572.9
562.7
3,594.3
1,763.1
1,257.4
495.7
694.7
1,265.4
736.1
874.3
1,150.9
2,119.8
599.4
1,868.9
1,508.4
1,959.4
968.7
2,395.7
4,590.2
2,520.5
2,218.2
548.6

2,657.3
8,815.1
2,878.4
451.1
3,152.1
1,297.4
1,128.4
606.3
1,002.8
2,067.4
927.8
534.5
1,430.9
2,073.8
1,381.0
1,074.8
1,589.7
1,156.6
1,780.7
1,418.5
3,217.1
2,752.5
1,399.3
431.0

1,998.2
7,323.7
2,410.0
820.9
2,267.4
1,093.2
1,614.5
1,476.6
451.3
1,566.2
650.3
846.1
882.9
1,649.7
709.4
1,858.1
1,701.3
1,338.8
1,058.2
2,314.8
5,550.9
2,691.3
1,140.4
650.8

1,888.2
4,836.9
3,676.7
469.0
3,433.4
1,395.2
1,201.5
835.5
734.6
1,636.5
742.4
782.2
1,618.5
1,996.6
1,089.1
1,757.2
1,320.3
1,496.7
954.6
1,528.1
4,067.9
3,388.1
1,199.8
529.7

y2
s 2 y

1,613.3
1,036.9

1,583.8
1,109.4

1,806.8
1,254.5

1,884.4
1,697.2

1,836.0
1,567.7

1,774.1
1,202.8

Tabla 3
Predicciones en la estacin Platn Snchez del Ro Tempoal, Veracruz.
Prediccin
segn
distribucin
GVE:
(1) Registro
original.
(2) Registro
ampliado.

10

Periodos de retorno en aos


25
50
100
500

1,000 10,000

1,350 2,406 3,289 4,669 5,926 7,413 12,025 14,655 27,512


1,409 2,429 3,260 4,529 5,659 6,970 10,903 13,079 23,252
8

Вам также может понравиться