Вы находитесь на странице: 1из 22

DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGA

El comportamiento de las variables aleatorias discretas o continuas se describe con la ayuda de


Distribuciones de Probabilidad. La variable se designa por mayscula y un valor especfico de ella
por minscula.

Por P(x = a) se denota la probabilidad de que un evento asuma el valor a;
similarmente P(a x b) denota la probabilidad de que un evento se encuentre en el intervalo
(a,b). Si conocemos la probabilidad P(a x b) para todos los valores de a y b, se dice que
conocemos la Distribucin de Probabilidades de la variable x.

Si x es un nmero dado y consideramos la probabilidad P(X x):

F(x)= P(X x):

y llamamos F(x) la funcin de distribucin acumulada.

Ejemplo

Se tienen las probabilidades de que haya 1, 2, 3, ... etc, das nublados por semana en un
determinado lugar, con ellos calcule la distribucin de probabilidades

x P(x) F(x)
0 0.05 0.05
1 0.15 0.20
2 0.25 0.45
3 0.20 0.65
4 0.15 0.80
5 0.10 0.90
6 0.08 0.98
7 0.02 1.00
Total 1.0



Si se tiene una variable aleatoria continua, la figura presenta el histograma de 85 aos de registro
de caudales de crecientes (mximos instantneos) en el ro Magdalena, agrupados en 9 intervalos
de clase.

x P(x) F(x)
1 0.05 0.05
2 0.10 0.15
3 0.15 0.30
4 0.20 0.50
5 0.10 0.60
6 0.10 0.70
7 0.15 0.85
8 0.10 0.95
9 0.05 1.00
Total 1.00



Cuando el nmero de observaciones se incrementa, el tamao de los intervalos decrece y se
puede tener algo s



donde f(x) es la llamada funcin de densidad de probabilidades y tiene las siguientes
caractersticas
.1 MOMENTOS DE LAS DISTRIBUCIONES

Las propiedades de las distribuciones pueden ser definidas completamente en trminos de los
momentos. Los momentos en estadstica son similares a los momentos en fsica (rotacin
respecto al origen)

para la variable continua

para la variable discreta

o respecto a la media (eje de rotacin diferente al origen)

para la variable continua

para la variable discreta


1.2 PARMETROS ESTADSTICOS

Los estadsticos extraen informacin de una muestra, indicando las caractersticas de la
poblacin. Los principales estadsticos son los momentos de primer, segundo y tercer orden
correspondiente a la media, varianza, y asimetra respectivamente.

1.2.1 Media m:
es el valor esperado de la variable misma . Primer momento respecto a la origen. Muestra la
tendencia central de la distribucin


el valor estimado de la media a partir de la muestra es

1.2.2 Varianza s:
mide la variabilidad de los datos. Es el segundo momento respecto a la media.


el valor estimado de la varianza a partir de la muestra es

en el cual el divisor es n-1 en lugar de n para asegurar que la estadstica de la muestra no sea
sesgada, es decir, que no tenga una tendencia, en promedio, a ser mayor o menor que el valor
verdadero. Las unidades de la varianza son la media al cuadrado, la desviacin estndar s es una
medida de la variabilidad que tiene las mismas dimensiones que la media y simplemente es la raz
cuadrada de la varianza, se estima por s. El significado de la desviacin estndar se ilustra en la
siguiente figura


Efectos de la funcin de densidad de probabilidad causados por cambios en la desviacin
estndar.

Coeficiente de variacin es una medida adimensional de la variabilidad su estimado
es


1.2.3 Coeficiente de asimetra g
la distribucin de los valores de una distribucin alrededor de la media se mide por la
asimetra. Se obtiene a partir del tercer momento alrededor de la media, dividindolo por el cubo
de la desviacin estndar para que sea adimensional.

tercer momento respecto a la media


Un estimativo del coeficiente de asimetra est dado por


Ejemplo

Encontrar el valor medio de la precipitacin si se tiene

Intervalo (mm) Xi medio
Frecuencia
absoluta
Frecuencia
relativa
x f(x)
100 110 105 10 0.1 10.5
110 120 115 16 0.16 18.4
120 130 125 9 0.09 11.25
130 140 135 10 0.1 13.5
140 150 145 20 0.2 29
150 160 155 15 0.15 23.25
160 170 165 20 0.2 33
Total=100 = S138.9


2 ANALISIS DE FRECUENCIA

El anlisis de frecuencia es una herramienta utilizada para, predecir el comportamiento futuro de
los caudales en un sitio de inters, a partir de la informacin histrica de caudales. Es un mtodo
basado en procedimientos estadsticos que permite calcular la magnitud del caudal asociado a un
perodo de retorno. Su confiabilidad depende de la longitud y calidad de la serie histrica, adems
de la incertidumbre propia de la distribucin de probabilidades seleccionada. Cuando se pretende
realizar extrapolaciones, perodo de retorno mayor que la longitud de la serie disponible, el error
relativo asociado a la distribucin de probabilidades utilizada es ms importante, mientras que en
interpolaciones la incertidumbre est asociada principalmente a la calidad de los datos a modelar;
en ambos casos la incertidumbre es alta dependiendo de la cantidad de datos disponibles (Ashkar,
et al. 1994). La extrapolacin de frecuencias extremas en una distribucin emprica de crecientes
es extremadamente riesgosa (Garcon, 1994).

Para determinar la magnitud de eventos extremos cuando la distribucin de probabilidades no es
una funcin fcilmente invertibles se requiere conocer la variacin de la variable respecto a la
media. Chow en 1951 propus determinar esta variacin a partir de un factor de frecuencia
K
T
que puede ser expresado:



y se puede estimar a partir de los datos



Para una distribucin dada, puede determinarse una relacin entre K y el perodo de retorno
Tr. Esta relacin puede expresarse en trminos matemticos o por medio del uso de una tabla.

El anlisis de frecuencia consiste en determinar los parmetros de las distribuciones de
probabilidad y determinar con el factor de frecuencia la magnitud del evento para un perodo de
retorno dado.

A continuacin se describen las principales distribuciones de probabilidad utilizadas en hidrologa,
la forma de estimar sus parmetros, el factor de frecuencia y los lmites de confianza. Estos
ltimos son indicadores de que tanta incertidumbre se tiene con las extrapolaciones, puesto que
determinar el rango de valores donde realmente estara la variables, si el rango es muy grande la
incertidumbre es muy alta y si es pequeo, por el contrario, habr mucha confianza en el valor
estimado.


3 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS

3.1 DISTRIBUCION NORMAL

La distribucin normal es una distribucin simtrica en forma de campana, tambin conocida
como Campana de Gauss. Aunque muchas veces no se ajusta a los datos hidrolgicos tiene amplia
aplicacin por ejemplo a los datos transformados que siguen la distribucin normal.

3.1.1 Funcin de densidad:

La funcin de densidad est dada por


Los dos parmetros de la distribucin son la media m y desviacin estndar s para los
cuales (media) y s (desviacin estndar) son derivados de los datos.

3.1.2 Estimacin de parmetros:





3.1.3 Factor de frecuencia:

1. Si se trabaja con los X sin transformar el K se calcula como



este factor es el mismo de la variable normal estndar

3.1.4 Limites de confianza:



donde a es el nivel de probabilidad es el cuantil de la distribucin normal estandarizada para
una probabilidad acumulada de 1-a y S
e
es el error estndar


3.2 DISTRIBUCIN LOGNORMAL DE DOS PARMETROS

Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X se
distribuye normalmente.

Esta distribucin es muy usada para el calculo de valores extremos por ejemplo Qmax, Qmnimos,
Pmax, Pmnima (excelentes resultados en Antioquia). Tiene la ventaja que X>0 y que la
transformacin Log tiende a reducir la asimetra positiva ya que al sacar logaritmos se reducen en
mayor proporcin los datos mayores que los menores.

Limitaciones: tiene solamente dos parmetros, y requiere que los logaritmos de la variables estn
centrados en la media

3.2.1 Funcin de densidad:



y = ln x
donde,
m
y
: media de los logaritmos de la poblacin (parmetro escalar), estimado s
y
:
Desviacin estndar de los logaritmos de la poblacin, estimado s
y
.

3.2.2 Estimacin de parmetros:





3.2.3 Factor de frecuencia:

Puede trabajarse en el campo original y en el campo transformado.

2. Campo transformado: Si se trabaja en el campo transformado se trabaja con la media y la
desviacin estndar de los logaritmos, as:

Ln(X
Tr
) = x
Tr
+KS
y

de donde,
XT
r
= e
ln (x
Tr
)

con K con variable normal estandarizada para el Tr dado, x
y
media de los logaritmos y S
y
es la
desviacin estndar de los logaritmos.


3. Campo original: Si se trabaja con los X sin transformar el K se calcula como





K es la variable normal estandarizada para el Tr dado, es el coeficiente de variacin, x
media de los datos originales y s desviacin estndar de los datos originales.

3.2.4 Limites de confianza:

En el campo transformado.





en donde, n numero de datos, Se error estndar, K
T
variable normal estandarizada.

EJEMPLO: En un ro se tienen 30 aos de registros de Qmximos instantneos anuales con x= 15
m
3
/s, S = 5 m
3
/s (media y desviacin estndar para los datos originales). x
y
=2.655, s
y
= 0.324
(media y desviacin estndar de los datos transformados). Encontrar el caudal para un periodo de
retorno de 100 aos y los limites de confianza para un a = 5%. Calcular la probabilidad de que un
caudal de 42.5 m
3
/s no sea igualado o excedido P(Q 4.25).

Solucin:

n=30
x= 15 m
3
/s x
y
=2.655
s = 5 m
3
/s s
y
= 0.324

En el campo original



= 5/15 = 0.33

K = F
-1
(1-1/Tr) = F
-1
(1-1/100) = F
-1
(0.99)

de la tabla de la normal se obtiene KT=2.33



K
T
= 3.06


QTr = 15 + 5 * 3.028
QTr = 30.14 m
3
/s

En el campo transformado se tiene que:

LnQ
Tr100
= 2.655 + 2.33*0.324

LnQ
Tr100
= 3.40992

Q
Tr100
= Exp (3.40992)

Q
Tr100
= 30.26 m
3
/s

Limites de confianza

Ln (QTr) t
(1-a)
Se




d = 1.93



t
(1-a)
= t
(0.95)
= 1.645 (Ledo de la tabla de la normal)

Ln(30.28) (1.645 ) (0.11)

3.41 0.18095
[3.22905 3.59095]
[e
3.22905
e
3.59095
]
[25.26 36.29] Intervalos de confianza para Q
Tr100


b) Calcular la probabilidad de que un caudal de 45 m
3
/s no se igualado o excedido P(Q 4.25).

Ln(42.5) = 3.75

t = (3.75 - 2.655)/0.324

F(3.38) = 0.9996 Ledo de la tabla de la normal

P(Q 4.25) = 99.9%

3.3 DISTRIBUCION GUMBEL O EXTREMA TIPO I

Una familia importante de distribuciones usadas en el anlisis de frecuencia hidrolgico es la
distribucin general de valores extremos, la cual ha sido ampliamente utilizada para representar el
comportamiento de crecientes y sequas (mximos y mnimos).

3.3.1 Funcin de densidad:




En donde a y b son los parmetros de la distribucin.


3.3.2 Estimacin de parmetros



donde son la media y la desviacin estndar estimadas con la muestra.

3.3.3 Factor de frecuencia:



Donde Tr es el periodo de retorno. Para la distribucin Gumbel se tiene que el caudal para un
perodo de retorno de 2.33 aos es igual a la media de los caudales mximos.

3.3.4 Limites de confianza

Xt t
(1-a)
Se



K
T
es el factor de frecuencia y t
(1-a)
es la variable normal estandarizada para una probabilidad de
no excedencia de 1-a.

EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 aos de periodo de retorno y los
intervalos de confianza. x= 15 m
3
/s, s = 5 m
3
/s

Q
Tr100
= x + K
T
s



K
T
= 3.14

Q
Tr100
= 15 + 3.14*5
Q
Tr100
= 30.7 m
3
/s

Intervalos de confianza

t
(1-a)
= t
(0.95)
= 1.645 (Ledo de la tabla de la normal)



d = 3.93



Xt t
(1-a)
Se

30.7 m
3
/s (1.64) (3.58)

[24.83 m
3
/s 36.58 m
3
/s] Intervalo de confianza para QTr100


i)
ii)
iii)

Lo que implica que las probabilidades se definen slo como REAS bajo la funcin de densidad de
probabilidad (FDP) entre lmites finitos.
4 AJUSTE DE DISTRIBUCIONES

Para la modelacin de caudales mximos se utilizan, entre otras, las distribuciones Log - Normal,
Gumbel y Log-Gumbel principalmente. Para seleccionar la distribucin de probabilidades de la
serie histrica se deben tener en cuenta algunas consideraciones.

Cuando en la serie histrica se observan outliers[1] es necesario verificar la sensibilidad
del ajuste debido a la presencia de estos, (Ashkar, et al. 1994)

Para el ajuste a las distribuciones Log-Normal, Log-Gumbel y Log-Pearson se requiere
transformar la variable al campo logartmico para modelarla, con lo que se disminuye la
varianza muestral, pero tambin se filtran las variaciones reales de los datos.

Las distribuciones de dos parmetros fijan el valor del coeficiente de asimetra, lo que en
algunos casos puede no ser recomendable. La distribucin Log - Normal de dos
parmetros slo es recomendable s el coeficiente de asimetra es cercano a cero. Las
distribuciones Gumbel y Log - Gumbel son recomendables si el coeficiente de asimetra de
los eventos registrados es cercano a 1.13

Para ajustar distribuciones de tres parmetros (Log Normal III, Log Pearson) se requiere
estimar el coeficiente de asimetra de la distribucin; para ello es necesario disponer de
una serie con longitud de registros larga, mayor de 50 aos, (Kite, 1988). Las
distribuciones de dos parmetros son usualmente preferidas cuando se dispone de pocos
datos, porque reducen la varianza de la muestra, (Ashkar, et al. 1994).

Para seleccionar la distribucin de probabilidades adecuada se debe tratar de utilizar
informacin adicional del proceso hidrolgico que permita identificar la forma en que se
distribuye la variable. Usualmente es muy difcil determinar las propiedades fsicas de los
procesos hidrolgicos para identificar el tipo de distribucin de probabilidad que es
aplicable.

Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la
distribucin que mejor se ajusta a los caudales mximos y recomiendan seleccionar el
mejor ajuste a criterio del modelador con la prueba de ajuste grfico o basado en el
comportamiento de las pruebas estadsticas de bondad del ajuste (por ejemplo Chi
Cuadrado, Smirnov-Kolmogorov, Cramer-Von Mises) en las que se calcula un estimador y
se compara con un valor tabulado para determinar si el ajuste es adecuado o no. En la
prueba de ajuste grfica se dibujan los valores registrados en la serie contra la distribucin
terica de probabilidades y de manera visual (subjetiva) se determina si el ajuste es
adecuado o no.

Cuando la informacin es adecuada el anlisis de frecuencia es la metodologa ms recomendable
para la evaluacin de eventos extremos, ya que la estimacin depende solamente de los caudales
mximos anuales que han ocurrido en la cuenca y no da cuenta de los procesos de transformacin
de la precipitacin en escorrenta. Obviamente tiene algunas limitaciones relacionadas con el
comportamiento de la serie histrica y con el tamao y calidad de los datos de la muestra.

Cuando se presenten cambios o tendencias en la serie histrica se deben utilizar tcnicas
estadsticas que permitan removerlos para poder realizar el anlisis de frecuencias (Kite,
1988; Mamdouh, 1993; Ashkar, et al. 1994).

La seleccin inadecuada de la distribucin de probabilidades de la serie histrica arrojar
resultados de confiabilidad dudosa, (Ashkar, et al. 1994).

El tamao de la muestra influye directamente en la confiabilidad de los resultados, as a
mayor perodo de retorno del estimativo mayor longitud de registros necesaria para mejor
confiabilidad en los resultados.

El ajuste a distribuciones se puede hacer de dos tcnicas, con el factor de frecuencia como se
refiri en el numeral 2 o hallando la distribucin emprica de los datos muestrales, por el mtodo
de Plotting Position.
6.8.4 Distribucin exponencial
La distribucin exponencial es el equivalente continuo de la distribucin geomtrica discreta. Esta
ley de distribucin describe procesos en los que:
Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo que,
el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello ocurra en un
instante t
f
, no depende del tiempo transcurrido anteriormente en el que no ha pasado
nada.
Ejemplos de este tipo de distribuciones son:
El tiempo que tarda una partcula radiactiva en desintegrarse. El conocimiento de la ley
que sigue este evento se utiliza en Ciencia para, por ejemplo, la datacin de fsiles o
cualquier materia orgnica mediante la tcnica del carbono 14, C
14
;
El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de un
paciente;
En un proceso de Poisson donde se repite sucesivamente un experimento a intervalos de
tiempo iguales, el tiempo que transcurre entre la ocurrencia de dos sucesos consecutivos
sigue un modelo probabilstico exponencial. Por ejemplo, el tiempo que transcurre entre
que sufrimos dos veces una herida importante.
Concretando, si una v.a. continua X distribuida a lo largo de , es tal que su funcin de
densidad es


se dice que sigue una distribucin exponencial de parmetro , .


Figura: Funcin de densidad, f, de una .

Вам также может понравиться