Вы находитесь на странице: 1из 21

DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGA

El comportamiento de las variables aleatorias discretas o continuas se describe


con la ayuda de Distribuciones de Probabilidad. La variable se designa por
mayscula y un valor especfico de ella por minscula.
Por P(x = a) se denota la probabilidad de que un evento asuma el valor a;
similarmente P(a x b) denota la probabilidad de que un evento se encuentre
en el intervalo (a,b). Si conocemos la probabilidad P(a x b) para todos los
valores de a y b, se dice que conocemos la Distribucin de Probabilidades de la
variable x.
Si x es un nmero dado y consideramos la probabilidad P(X x):
F(x)= P(X x):
y llamamos F(x) la funcin de distribucin acumulada.
Ejemplo
Se tienen las probabilidades de que haya 1, 2, 3, ... etc, das nublados por semana
en un determinado lugar, con ellos calcule la distribucin de probabilidades
x
0
1
2
3
4
5
6
7
Total

P(x)
0.05
0.15
0.25
0.20
0.15
0.10
0.08
0.02
1.0

F(x)
0.05
0.20
0.45
0.65
0.80
0.90
0.98
1.00

Si se tiene una variable aleatoria continua, la figura presenta el histograma de 85


aos de registro de caudales de crecientes (mximos instantneos) en el ro
Magdalena, agrupados en 9 intervalos de clase.
x
1
2
3
4
5
6
7
8
9
Total

P(x)
0.05
0.10
0.15
0.20
0.10
0.10
0.15
0.10
0.05
1.00

F(x)
0.05
0.15
0.30
0.50
0.60
0.70
0.85
0.95
1.00

Cuando el nmero de observaciones se incrementa, el tamao de los intervalos


decrece y se puede tener algo s

donde f(x) es la llamada funcin de densidad de probabilidades y tiene las


siguientes caractersticas
i)
ii)
iii)
Lo que implica que las probabilidades se definen slo como REAS bajo la
funcin de densidad de probabilidad (FDP) entre lmites finitos.
1.1

MOMENTOS DE LAS DISTRIBUCIONES

Las propiedades de las distribuciones pueden ser definidas completamente en


trminos de los momentos. Los momentos en estadstica son similares a los
momentos en fsica (rotacin respecto al origen)
para la variable continua

para la variable discreta


o respecto a la media (eje de rotacin diferente al origen)
para la variable continua

para la variable discreta

1.2

PARMETROS ESTADSTICOS

Los estadsticos extraen informacin de una muestra, indicando las caractersticas


de la poblacin. Los principales estadsticos son los momentos de primer,
segundo y tercer orden correspondiente a la media, varianza, y asimetra
respectivamente.
1.2.1 Media :
es el valor esperado de la variable misma . Primer momento respecto a la
origen. Muestra la tendencia central de la distribucin

el valor estimado de la media a partir de la muestra es

1.2.2 Varianza :
mide la variabilidad de los datos. Es el segundo momento respecto a la media.

el valor estimado de la varianza a partir de la muestra es

en el cual el divisor es n-1 en lugar de n para asegurar que la estadstica de la


muestra no sea sesgada, es decir, que no tenga una tendencia, en promedio, a ser
mayor o menor que el valor verdadero. Las unidades de la varianza son la media
al cuadrado, la desviacin estndar s es una medida de la variabilidad que tiene
las mismas dimensiones que la media y simplemente es la raz cuadrada de la
varianza, se estima por s. El significado de la desviacin estndar se ilustra en la
siguiente figura

Efectos de la funcin de densidad de probabilidad causados por cambios en la


desviacin estndar.

Coeficiente de variacin

es una medida adimensional de la variabilidad

su estimado es

1.2.3 Coeficiente de asimetra


la distribucin de los valores de una distribucin alrededor de la media se mide
por la asimetra. Se obtiene a partir del tercer momento alrededor de la media,
dividindolo por el cubo de la desviacin estndar para que sea adimensional.

tercer momento respecto a la media

Un estimativo del coeficiente de asimetra est dado por

Ejemplo
Encontrar el valor medio de la precipitacin si se tiene
Intervalo (mm)
100
110
120
130
140
150
160

110
120
130
140
150
160
170

Xi medio
105
115
125
135
145
155
165

Frecuencia Frecuencia
absoluta
relativa
10
0.1
16
0.16
9
0.09
10
0.1
20
0.2
15
0.15
20
0.2
Total=100

x f(x)
10.5
18.4
11.25
13.5
29
23.25
33
= 138.9

ANALISIS DE FRECUENCIA

El anlisis de frecuencia es una herramienta utilizada para, predecir el


comportamiento futuro de los caudales en un sitio de inters, a partir de la
informacin histrica de caudales. Es un mtodo basado en procedimientos
estadsticos que permite calcular la magnitud del caudal asociado a un perodo de
retorno. Su confiabilidad depende de la longitud y calidad de la serie histrica,
adems de la incertidumbre propia de la distribucin de probabilidades
seleccionada. Cuando se pretende realizar extrapolaciones, perodo de retorno
mayor que la longitud de la serie disponible, el error relativo asociado a la
distribucin de probabilidades utilizada es ms importante, mientras que en
interpolaciones la incertidumbre est asociada principalmente a la calidad de los
datos a modelar; en ambos casos la incertidumbre es alta dependiendo de la
cantidad de datos disponibles (Ashkar, et al. 1994). La extrapolacin de
frecuencias extremas en una distribucin emprica de crecientes es
extremadamente riesgosa (Garcon, 1994).
Para determinar la magnitud de eventos extremos cuando la distribucin de
probabilidades no es una funcin fcilmente invertibles se requiere conocer la
variacin de la variable respecto a la media. Chow en 1951 propus determinar
esta variacin a partir de un factor de frecuencia KT que puede ser expresado:

y se puede estimar a partir de los datos

Para una distribucin dada, puede determinarse una relacin entre K y el perodo
de retorno Tr. Esta relacin puede expresarse en trminos matemticos o por
medio del uso de una tabla.
El anlisis de frecuencia consiste en determinar los parmetros de las
distribuciones de probabilidad y determinar con el factor de frecuencia la
magnitud del evento para un perodo de retorno dado.
A continuacin se describen las principales distribuciones de probabilidad
utilizadas en hidrologa, la forma de estimar sus parmetros, el factor de
frecuencia y los lmites de confianza. Estos ltimos son indicadores de que tanta
incertidumbre se tiene con las extrapolaciones, puesto que determinar el rango de
valores donde realmente estara la variables, si el rango es muy grande la
incertidumbre es muy alta y si es pequeo, por el contrario, habr mucha
confianza en el valor estimado.

3 DISTRIBUCIONES
CONTINUAS
3.1

DE

PROBABILIDAD

PARA

VARIABLES

DISTRIBUCION NORMAL

La distribucin normal es una distribucin simtrica en forma de campana,


tambin conocida como Campana de Gauss. Aunque muchas veces no se ajusta
a los datos hidrolgicos tiene amplia aplicacin por ejemplo a los datos
transformados que siguen la distribucin normal.
3.1.1 Funcin de densidad:

La funcin de densidad est dada por

Los dos parmetros de la distribucin son la media m y desviacin


estndar s para los cuales (media) y s (desviacin estndar) son derivados de
los datos.

3.1.2 Estimacin de parmetros:

3.1.3 Factor de frecuencia:

1. Si se trabaja con los X sin transformar el K se calcula como

este factor es el mismo de la variable normal estndar


3.1.4 Limites de confianza:

donde a es el nivel de probabilidad


es el cuantil de la distribucin normal
estandarizada para una probabilidad acumulada de 1-a y Se es el error estndar
3.2

DISTRIBUCIN LOGNORMAL DE DOS PARMETROS

Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se


dice que X se distribuye normalmente.
Esta distribucin es muy usada para el calculo de valores extremos por ejemplo
Qmax, Qmnimos, Pmax, Pmnima (excelentes resultados en Antioquia). Tiene
la ventaja que X>0 y que la transformacin Log tiende a reducir la asimetra
positiva ya que al sacar logaritmos se reducen en mayor proporcin los datos
mayores que los menores.

Limitaciones: tiene solamente dos parmetros, y requiere que los logaritmos de la


variables estn centrados en la media
3.2.1 Funcin de densidad:

y = ln x
donde,
my : media de los logaritmos de la poblacin (parmetro escalar), estimado
sy : Desviacin estndar de los logaritmos de la poblacin, estimado sy.
3.2.2 Estimacin de parmetros:

3.2.3 Factor de frecuencia:

Puede trabajarse en el campo original y en el campo transformado.


2. Campo transformado: Si se trabaja en el campo transformado se trabaja con
la media y la desviacin estndar de los logaritmos, as:
Ln(XTr) = xTr+KSy
de donde,
XTr = eln (xTr)
con K con variable normal estandarizada para el Tr dado, xy media de los
logaritmos y Sy es la desviacin estndar de los logaritmos.
3. Campo original: Si se trabaja con los X sin transformar el K se calcula como

K es la variable normal estandarizada para el Tr dado,


es el coeficiente de
variacin, x media de los datos originales y s desviacin estndar de los datos
originales.
3.2.4 Limites de confianza:

En el campo transformado.

en donde, n numero de datos, Se error estndar, K T variable normal


estandarizada.
EJEMPLO: En un ro se tienen 30 aos de registros de Qmximos instantneos
anuales con x= 15 m3/s, S = 5 m3/s (media y desviacin estndar para los datos
originales). xy=2.655, sy = 0.324 (media y desviacin estndar de los datos
transformados). Encontrar el caudal para un periodo de retorno de 100 aos y los
limites de confianza para un a = 5%. Calcular la probabilidad de que un caudal de
42.5 m3/s no sea igualado o excedido P(Q 4.25).
Solucin:
n=30
x= 15 m3/s
s = 5 m3/s
En el campo original

xy=2.655
sy = 0.324

= 5/15 = 0.33
K = F-1(1-1/Tr) = F-1(1-1/100) = F-1(0.99)
de la tabla de la normal se obtiene KT=2.33

KT = 3.06
QTr = 15 + 5 * 3.028
QTr = 30.14 m3/s
En el campo transformado se tiene que:
LnQTr100 = 2.655 + 2.33*0.324
LnQTr100 = 3.40992
QTr100 = Exp (3.40992)
Q Tr100 = 30.26 m3/s
Limites de confianza
Ln (QTr) t(1-a) Se

d = 1.93

t(1-a) = t(0.95) = 1.645 (Ledo de la tabla de la normal)


Ln(30.28) (1.645 ) (0.11)
3.41 0.18095
[3.22905
[e3.22905
[25.26

3.59095]
e3.59095]
36.29]

Intervalos de confianza para QTr100

b) Calcular la probabilidad de que un caudal de 45 m3/s no se igualado o


excedido P(Q4.25).
Ln(42.5) = 3.75
t = (3.75 - 2.655)/0.324
F(3.38) = 0.9996 Ledo de la tabla de la normal
P(Q 4.25) = 99.9%
3.3

DISTRIBUCION GUMBEL O EXTREMA TIPO I

Una familia importante de distribuciones usadas en el anlisis de frecuencia


hidrolgico es la distribucin general de valores extremos, la cual ha sido
ampliamente utilizada para representar el comportamiento de crecientes y sequas
(mximos y mnimos).
3.3.1 Funcin de densidad:

En donde a y b son los parmetros de la distribucin.

3.3.2 Estimacin de parmetros

donde

son la media y la desviacin estndar estimadas con la muestra.

3.3.3 Factor de frecuencia:

Donde Tr es el periodo de retorno. Para la distribucin Gumbel se tiene que el


caudal para un perodo de retorno de 2.33 aos es igual a la media de los
caudales mximos.
3.3.4 Limites de confianza

Xt t(1-a) Se

KT es el factor de frecuencia y t(1-a) es la variable normal estandarizada para una


probabilidad de no excedencia de 1-a.
EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 aos de periodo de
retorno y los intervalos de confianza. x= 15 m3/s, s = 5 m3/s

QTr100 = x + KT s

KT = 3.14
QTr100 = 15 + 3.14*5
QTr100 = 30.7 m3/s
Intervalos de confianza
t(1-a) = t(0.95) = 1.645 (Ledo de la tabla de la normal)

d = 3.93

Xt t(1-a) Se
30.7 m3/s (1.64) (3.58)
[24.83 m3/s

3.4

36.58 m3/s]

Intervalo de confianza para QTr100

DISTRIBUCION GAMMA DE TRES PARMETROS O PEARSON TIPO 3

Esta distribucin ha sido una de las mas utilizadas en hidrologa. Como la


mayora de las variables hidrolgicas son sesgadas, la funcin Gamma se utiliza
para ajustar la distribucin de frecuencia de variables tales como crecientes
mximas anuales, Caudales mnimos, Volmenes de flujo anuales y estacionales,
valores de precipitaciones extremas y volmenes de lluvia de corta duracin. La
funcin de distribucin Gamma tiene dos o tres parmetros.

3.4.1 Funcin de densidad:

donde,
x0 x < para > 0
< x x0 para < 0
y son los parmetros de escala y forma, respectivamente , y x 0 es el
parmetro de localizacin.

3.4.2 Estimacin de parmetros:

Cs es el coeficiente de asimetra,
de la muestra respectivamente.

son la media y la desviacin estndar

3.4.3 Factor de frecuencia:

donde z es la variable normal estandarizada


Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la
muestra.
3.4.4 Intervalos de confianza:

Xt t(1-a) Se

Donde S es la desviacin estndar de la muestra, n es el nmero de datos y d se


encuentra tabulado en funcin de Cs y Tr.
EJEMPLO: Se tiene una estacin con 30 aos de registros de caudales mximos
instantneos con Media de 4144 pie3/s y desviacin estndar de 3311 pie3/s. Si el
coeficiente de asimetra de los caudales es de 1.981 pie3/s cual es caudal para un
periodo de retorno de 100 aos y su intervalo de confianza.
QTr100 = X+ SK
K es F(1.981, 100)
3.553

de tablas se obtiene K=3.595

(1.9,100) =
(2.0,100)

3.605

QTr100 = 4144+ (3.595) (3311)


QTr100 = 16050 pie3/s
Intervalos de confianza
Xt t(1-a) Se

d = F(1.981,100)
8.2196

de tablas se obtiene d =8.4922

(1.9,100) =
(2.0,100)

8.5562

Se = 5133.56 pie3/s
t(1-a) = t(0.95) = 1.645 (Ledo de la tabla de la normal)

16050 (5133.56) (1.645)


[7605.29 pie3/s
QTr100

3.5

24494.71pie3/s]

Intervalos de confianza para

DISTRIBUCIN LOG GAMMA O LOGPEARSON DE 3 PARMETROS

Si los logaritmos Y de una variable aleatoria X se ajustan a una distribucin


Pearson tipo III, se dice que la variable aleatoria X se ajusta a una distribucin
Log Pearson Tipo III. Esta distribucin es ampliamente usada en el mundo para
el anlisis de frecuencia de Caudales mximos. Esta se trabaja igual que para la
Pearson Tipo III pero con Xy y Sy como la media y desviacin estndar de los
logaritmos de la variable original X.
3.5.1 Funcin de densidad:

donde,
y0 y < para > 0
y y0 para < 0
y son los parmetros de escala y forma, respectivamente , y y 0 es el
parmetro de localizacin.

3.5.2 Estimacin de parmetros:

Cs es el coeficiente de asimetra,
son la media y la desviacin estndar
de los logaritmos de la muestra respectivamente.
3.5.3 Factor de frecuencia:

donde z es la variable normal estandarizada


Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la
muestra.
3.5.4 Intervalos de confianza:

Xt t(1-a) Se

Donde Sy es la desviacin estndar de los logaritmos de la muestra, n es el


nmero de datos y se encuentra tabulado en funcin de Cs y Tr.
4

AJUSTE DE DISTRIBUCIONES

Para la modelacin de caudales mximos se utilizan, entre otras, las


distribuciones Log - Normal, Gumbel y Log-Gumbel principalmente. Para
seleccionar la distribucin de probabilidades de la serie histrica se deben tener
en cuenta algunas consideraciones.

Cuando en la serie histrica se observan outliers[1] es necesario verificar la


sensibilidad del ajuste debido a la presencia de estos, (Ashkar, et al. 1994)

Para el ajuste a las distribuciones Log-Normal, Log-Gumbel y Log-Pearson se


requiere transformar la variable al campo logartmico para modelarla, con lo que se
disminuye la varianza muestral, pero tambin se filtran las variaciones reales de los
datos.

Las distribuciones de dos parmetros fijan el valor del coeficiente de asimetra, lo


que en algunos casos puede no ser recomendable. La distribucin Log - Normal de
dos parmetros slo es recomendable s el coeficiente de asimetra es cercano a
cero. Las distribuciones Gumbel y Log - Gumbel son recomendables si el
coeficiente de asimetra de los eventos registrados es cercano a 1.13

Para ajustar distribuciones de tres parmetros (Log Normal III, Log Pearson) se
requiere estimar el coeficiente de asimetra de la distribucin; para ello es necesario
disponer de una serie con longitud de registros larga, mayor de 50 aos, (Kite,
1988). Las distribuciones de dos parmetros son usualmente preferidas cuando se
dispone de pocos datos, porque reducen la varianza de la muestra, (Ashkar, et al.
1994).

Para seleccionar la distribucin de probabilidades adecuada se debe tratar de utilizar


informacin adicional del proceso hidrolgico que permita identificar la forma en
que se distribuye la variable. Usualmente es muy difcil determinar las propiedades
fsicas de los procesos hidrolgicos para identificar el tipo de distribucin de
probabilidad que es aplicable.

Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la
distribucin que mejor se ajusta a los caudales mximos y recomiendan seleccionar
el mejor ajuste a criterio del modelador con la prueba de ajuste grfico o basado en
el comportamiento de las pruebas estadsticas de bondad del ajuste (por ejemplo Chi
Cuadrado, Smirnov-Kolmogorov, Cramer-Von Mises) en las que se calcula un
estimador y se compara con un valor tabulado para determinar si el ajuste es
adecuado o no. En la prueba de ajuste grfica se dibujan los valores registrados en
la serie contra la distribucin terica de probabilidades y de manera visual
(subjetiva) se determina si el ajuste es adecuado o no.

Cuando la informacin es adecuada el anlisis de frecuencia es la metodologa


ms recomendable para la evaluacin de eventos extremos, ya que la estimacin
depende solamente de los caudales mximos anuales que han ocurrido en la
cuenca y no da cuenta de los procesos de transformacin de la precipitacin en
escorrenta. Obviamente tiene algunas limitaciones relacionadas con el
comportamiento de la serie histrica y con el tamao y calidad de los datos de la
muestra.

Cuando se presenten cambios o tendencias en la serie histrica se deben utilizar


tcnicas estadsticas que permitan removerlos para poder realizar el anlisis de
frecuencias (Kite, 1988; Mamdouh, 1993; Ashkar, et al. 1994).

La seleccin inadecuada de la distribucin de probabilidades de la serie histrica


arrojar resultados de confiabilidad dudosa, (Ashkar, et al. 1994).

El tamao de la muestra influye directamente en la confiabilidad de los resultados,


as a mayor perodo de retorno del estimativo mayor longitud de registros necesaria
para mejor confiabilidad en los resultados.

El ajuste a distribuciones se puede hacer de dos tcnicas, con el factor de


frecuencia como se refiri en el numeral 2 o hallando la distribucin emprica de
los datos muestrales, por el mtodo de Plotting Position.

4.1

Plotting Position

Trabaja con la probabilidad de excedencia asignada a cada valor de la


muestra. Se han propuesto numerosos mtodos empricos. Si n es el total de
valores y m es el rango de un valor en una lista ordenada de mayor a menor (m=1
para el valor mximo) la probabilidad de excedencia se puede obtener por medio
de las siguientes expresiones

California

Weibull

Hazen
La expresin ms utilizada es la Weibull. Con las anteriores expresiones se halla
lo que se conoce como la distribucin emprica de una muestra, esta luego se
puede ajustar a una de las distribuciones tericas presentadas anteriormente. Los
resultados pueden ser dibujados en el papel de probabilidad; este es diseado
para que los datos se ajusten a una lnea recta y se puedan comparar los datos
muestrales con la distribucin terica (lnea recta).
4.2

Pruebas de Ajuste

Para determinar que tan adecuado es el ajuste de los datos a una distribucin de
probabilidades se han propuesto una serie de pruebas estadsticas que determinan
si es adecuado el ajuste. Estos son anlisis estadsticos y como tal se deben
entender, es decir, no se puede ignorar el significado fsico de los ajustes.

4.2.1 Prueba Smirnov Kolmogorov

El estadstico Smirnov Kolmogorov D considera la desviacin de la funcin de


distribucin de probabilidades de la muestra P(x) de la funcin de probabilidades
terica, escogida Po(x) tal que
.
La prueba requiere que el valor Dn calculado con la expresin anterior sea menor
que el valor tabulado Dn para un nivel de probabilidad requerido.
Esta prueba es fcil de realizar y comprende las siguientes etapas:

El estadstico Dn es la mxima diferencia entre la funcin de distribucin


acumulada de la muestra y la funcin de distribucin acumulada terica escogida.
Se fija el nivel de probabilidad a, valores de 0.05 y 0.01 son los ms usuales.
El valor crtico D de la prueba debe ser obtenido de tablas en funcin de y n.
Si el valor calculado Dn es mayor que el D, la distribucin escogida se debe
rechazar.

4.2.2 Prueba Chi Cuadrado

Una medida de las discrepancia entre las frecuencias observadas (fo) y las
frecuencias calculadas (fc) por medio de una distribucin terica esta dada por el
estadstico
en donde
si el estadstico =0 significa que las distribuciones terica y emprica ajustan
exactamente, mientras que si el estadstico >0, ellas difieren. La distribucin
del estadstico se puede asimilar a una distribucin Chi-cuadrado con (k-n-1)
grados de libertad, donde k es el nmero de intervalos y n es el nmero de los
parmetros de la distribucin terica. La funcin se encuentra
tabulada. Supongase que una hiptesis Ho es aceptar que una distribucin
emprica se ajusta a una distribucin Normal. Si el valor calculado de por la
ecuacin anterior es mayor que algn valor crtico de , con niveles de
significancia a de 0.05 y 0.01 (el nivel de confianza es 1-a) se puede decir que las
frecuencias observadas difieren significativamente de las frecuencias esperadas
(o calculadas) y entonces la hiptesis Ho se rechaza, si ocurre lo contrario
entonces se acepta.