Вы находитесь на странице: 1из 48

PARTE III: APLICACIÓN DE LA DISTRIBUCIÓN NORMAL DE

PROBABILIDADES

PARTE III-A: APLICACIÓN DE LA DISTRIBUCIÓN NORMAL DE


PROBABILIDADES DE LOS VALORES MAXIMOS DE CAUDALES DEL RIO
FONCE

a) Recordemos inicialmente el comportamiento de la variable aleatoria hidrológica


(valores máximos de los caudales del río Fonce) a lo largo del tiempo desde
1955 hasta 2016.
b) Revisamos nuestro histograma empírico de frecuencias de los valores máximos
anuales de los caudales del río Fonce en San Gil (Santander, Colombia).
c) Estudiamos las propiedades de la Ley de Moivre, también llamada curva
simétrica, campana de Gauss, ley normal, entre muchos otros nombres.

La ecuación de la ley de Moivre se presenta mediante la curva de distribución de


la densidad de probabilidades:
2
−1 (xi − X́ )
1 2 S
2
P ( X )= e
S √2 π
P(X) es la densidad de probabilidades de X
X es la variable aleatoria con una distribución Moivre o Normal
S es la desviación estándar
xi es un valor concreto de la variable aleatoria X
X́ es la media o el valor promedio de los datos
En la antigüedad para los ejercicios prácticos, Laplace logró estandarizar esa
ecuación mediante la integración; para lo cual estableció una nueva variable que
denominó “z”. Más adelante se estudiará la transformación que realizó Laplace
para los usos prácticos de la ley de Moivre o ley Normal. Hace dos siglos se
consideraba que la ecuación de la densidad de distribución de la probabilidad no
se podía resolver fácilmente y por eso se hicieron muy famosas las tablas de
Laplace.
Veamos un ejemplo que ilustra mejor el comportamiento de una variable
hidrológica con la ley de Moivre o campana de Gauss. Supóngase que usted a la
serie de datos de los valores máximos anuales de los caudales del río Fonce le
extrae dos funciones: a) una función con tendencia lineal y b) otra función
netamente aleatoria que tiene una distribución Moivre.
En el siguiente gráfico tenemos la serie temporal de datos de los valores máximos
anuales de los caudales del río Fonce, el cual ya conocemos.
Esa función de caudales la vamos a descomponer en dos funciones, que al
sumarlas nos la devuelva a la misma.
Tomamos para nuestro ejemplo, los valores de los datos residuales o residuos
(función netamente aleatoria):

Giro Q® Giro Q®
1955 0.542 1986 64.2032
1956 48.364 1987 126.0404
1957 45.422 1988 159.3142
1958 -93.328 1989 -70.5527
1959 133.750 1990 -77.0194
1960 -3.821 1991 114.5031
1961 19.267 1992 -211.7650
1962 26.468 1993 19.3635
1963 -57.741 1994 76.4095
1964 -218.337 1995 241.8552
1965 262.446 1996 23.3078
1966 -140.487 1997 -15.0697
1967 -113.387 1998 33.7948
1968 -16.353 1999 328.4161
1969 47.032 2000 -104.0513
1970 210.584 2001 -86.4804
1971 98.712 2002 -33.4138
1972 90.530 2003 26.3223
1973 -43.119 2004 15.6859
1974 163.923 2005 -6.3514
1975 67.188 2006 31.6256
1976 -108.089 2007 -97.4746
1977 -122.795 2008 -125.4563
1978 37.323 2009 107.2575
1979 -10.312 2010 14.2567
1980 -91.917 2011 -2.6089
1981 81.679 2012 -44.7748
1982 -110.216 2013 -199.1409
1983 -148.542 2014 -110.4952
1984 -41.195 2015 -26.2156
1985 -94.866 2016 -56.5923

La media de estos valores es de 0.50, mientras que la desviación estándar es de


113.70, el coeficiente de asimetría es cercano a cero. A la vista se asemeja a una
curva simétrica.
Ahora revisaremos algunas propiedades básicas de la ley de Moivre o campana
de Gauss o ley Normal.
1) Se requieren las características estadísticas de la media y la desviación
estándar para su aplicación.
2) La asimetría y sus coeficientes son nulos en la ecuación teórica o casi nulos
en la práctica.
3) La curtosis también es nula en la ecuación teórica o casi nula en la práctica.

Si analizamos en teoría la relación entre la media, la desviación estándar y la


frecuencia (casos), entonces se puede afirmar en teoría que:
1) Un 99.0% de los casos se encuentran en el intervalo
⌊ X́−3 S , X́ +3 S ⌋ o X́ −3 S ≤ x i ≤ X́ +3 S

2) Un 95.4% de los casos se encuentran en el intervalo


⌊ X́−2 S , X́ +2 S ⌋ o X́ −2 S ≤ x i ≤ X́ +2 S

3) Un 68.2% de los casos se encuentran en el intervalo


⌊ X́−S , X́ + S ⌋ o X́ −S ≤ x i ≤ X́ + S
Desde la ecuación teórica de la ley de Moivre, se establece que en el rango de la
media más la desviación estándar se encuentra el 34.1% de los casos. Es decir, si
se asume que el proceso hidrológico se describe adecuadamente mediante la ley
Moivre, entonces se puede aseverar que el 68.2% de los casos (de los datos de la
serie) están en el intervalo de la media más o menos una desviación estándar.
¿Quién de nosotros ha entrado a un casino?
¿Quién de nosotros ha lanzado un dado?
¿Quién de nosotros ha lanzado la pirinola?
¿Quién de nosotros ha jugado naipes?
En la actualidad se sabe que muchos procesos naturales y humanos se pueden
describir adecuadamente mediante el modelo estadístico Moivre o Normal o
Campana de Gauss.
Por ejemplo, se sabe que el coeficiente intelectual de los seres humanos, los
errores de las mediciones astronómicas y la altura de los españoles, se modelan
en forma satisfactoria con la ley Moivre.
Veamos algunas conclusiones de la interpretación del coeficiente intelectual de los
seres humanos que arroja el modelo estadístico de Moivre:
1. Hay un 0.1% de seres humanos con insuficiencia mental y otro 0.1%
superdotados.
2. Hay un 2% de población con insuficiencia mental y otro 2% con inteligencia
superior.
3. Hay un 13.6% con inteligencia débil y otro 13.6% con gran inteligencia.
4. El 34.1% de las gentes tiene un coeficiente intelectual promedio bajo y otro
34.1% promedio alto.
Si la media (valor promedio) del coeficiente intelectual es igual a 100, entonces
existe un 68.2% de personas que está en el intervalo entre 85 y 115, dado que la
desviación estándar es 15.
Revisemos otras cualidades o características del modelo estadístico Moivre.
La ecuación de la ley de Moivre se presenta mediante la curva de distribución de
la densidad de probabilidades:
2
−1 (xi − X́ )
1 2 S
2
P ( X )= e
S √2 π

La ecuación de la función de densidad P(X) dibuja la campana simétrica; sin


embargo, en la práctica de ingeniería se requiere calcular probabilidades y por ello
se hace uso es de la función de distribución F(X), es decir, el área bajo la curva, la
cual se obtiene haciendo la integral de la forma:

2
x −1 (x i − X́ )
1 2 S
2
F ( X )= ∫ e dx
−∝ S √2 π

El área bajo la curva se estableció igual a 1 o al 100%. Basta con conocer la


media y la desviación estándar para estudiar la ley y aplicarla en ingeniería civil.
En este caso, los eventos no son equiprobables, por el contrario, hay unos con
mayor probabilidad que otros.
d) Identificación de la probabilidad de excedencia y no excedencia
En su momento no se logró solucionar esa integral y por lo tanto desde Laplace se
establecieron unas tablas especiales con las cuales se puede hallar el área bajo la
curva para cualquiera de los intervalos de la variable aleatoria X.
La solución dada por Laplace y vigente a la fecha se explica de la siguiente
manera.
2
x −1 (x i − X́ )
1 2 S
2
F ( X )= ∫ e dx
−∝ S √2 π

(x i− X́ )
Z=
S
z −1
1
2
Z
F ( X )= ∫ e2 dz
−∝ S √2 π

F ( X )=1 , F ( X )=100 %

Se desea calcular el área en la siguiente situación.

P [ x1 ≤ X ≤ x 2 ] =P [ x1 < X ≤ x 2 ] =P [ x 1 ≤ X < x2 ]

P [ x1 ≤ X < x 2 ]=P [ x 1 < X < x 2 ] =P [ X ≤ x2 ] −P [ X ≤ x1 ]

P [ X ≤ x 2 ] −P [ X ≤ x 1 ] =F ( x2 ) −F ( x 1 )

Los valores de la función de distribución de cada x concreto se toman de las


tablas.
Por definición, la función de distribución F(X), da la probabilidad de los eventos de
la forma:
2
x −1 (x i − X́ )
1 2 S
2
P [ X ≤ x ] =P [ X < x ] =F ( x )=∫ e dx
−∝ S √2π

Se desea calcular el área en la siguiente situación.


P [ X > x ] =1−P [ X ≤ x ] =1−F ( x )

e) Entropía de la ley Moivre.


La entropía H(X) de una variable aleatoria con una distribución de probabilidades
es una medida de la indeterminación o incertidumbre del experimento que produjo
a la variable aleatoria.
La entropía de una variable aleatoria X que tiene una función de densidad de
probabilidad f(X) es:
+∞
H ( X )=∫ f ( X ) log a f ( X ) dx +c
−∝

H(X) es la entropía de la variable aleatoria en unidades de la base a del logaritmo;


la base a del algoritmo puede ser a=2 o a=10.
c es un valor constante, el cual define el valor inicial de la entropía de la variable
aleatoria; se asume c=0.
Para una variable aleatoria con una distribución Moivre de probabilidades la
entropía se estima mediante la fórmula:
H ( X )=log [ S √ 2 πe ]
A mayor entropía en la variable, mayor será la incertidumbre: los eventos con altas
probabilidades de suceder arrojarán una baja entropía y viceversa. Si se tienen
solo dos eventos equiprobables, entonces la probabilidad de cada evento es 0.5 y
su entropía H(X) se ilustra en el gráfico así: H(X)=log (0.5)=0.30

Cuando la probabilidad es f=1/n, entonces H(X)=log(n). Si n=10, H(X)=1.


f) Ejercicio de la aplicación de la distribución normal

1) Tenemos los datos originales del IDEAM

Los datos de los valores máximos en giros de traslación del río Fonce en la
estación hidrológica de San Gil (Santander, Colombia) fueron otorgados de
manera gratuita por el instituto IDEAM.

Giro Q Giro Q
1955 451.00 1986 594.60
1956 502.00 1987 657.50
1957 523.00 1988 814.60
1958 407.50 1989 598.80
1959 615.80 1990 558.80
1960 496.00 1991 582.10
1961 545.50 1992 404.20
1962 538.00 1993 567.20
1963 470.50 1994 569.40
1964 292.50 1995 946.80
1965 754.00 1996 633.30
1966 347.60 1997 734.20
1967 440.50 1998 689.00
1968 485.50 1999 941.60
1969 553.00 2000 504.40
1970 758.00 2001
1971 650.50 2002 633.30
1972 650.50 2003 642.20
1973 566.00 2004 713.40
1974 693.70 2005 713.40
1975 608.00 2006 726.40
1976 521.60 2007 584.10
1977 359.80 2008 576.90
1978 548.70 2009 858.70
1979 688.00 2010 640.70
1980 449.00 2011 675.70
1981 720.00 2012 662.10
1982 465.00 2013 619.40
1983 485.00 2014 466.50
1984 554.80 2015 629.10
1985 469.00 2016 567.70

2) Tenemos el histograma de frecuencia o distribución de probabilidad

3) Tenemos los valores de algunas características estadísticas


Nombre de la característica Símbolo Valor (Excel) Valor
Media (promedio aritmético) X́ 592.07 592.07
Varianza S² 17033 17033
Desviación estándar S 130.51 130.51
Coeficiente de asimetría Cs 0.398 0.385
Coeficiente de curtosis Ck 0.671 0.466
Valores adecuados para los eventos equiprobables: frecuencia=1/n

4) Tenemos la ecuación de la función de probabilidad de la ley Moivre


2
−1 (xi − X́ )
1 2 S
2
P ( X )= e
S √2 π
También conocemos la ecuación de la función de distribución de
probabilidades
2
x −1 (x i − X́ )
1 2 S
2
F ( X ) =∫ e dx
−∝ S √2 π

( x i− X́ )
Z=
S
z −1 2
1 2
Z
F ( X ) =∫ e dz
−∝ S √2 π

Entonces ahora procedemos a ajustar la ley Moivre (Campana de Gauss o Ley


Normal) al histograma empírico de frecuencias o probabilidades de nuestra
variable aleatoria de valores máximos de caudales del río Fonce en San Gil
(Santander).
(x i− X́ )
Z=
S
x ies el valor máximo en cada intervalo de clase del histograma empírico.

Intervalo de la clase
Frecuencia
Posición Límite Límite
Fe
inferior superior
1 292.5 423.36 5
2 423.36 554.22 18
3 554.22 685.08 25
4 685.08 815.94 11
5 815.94 946.8 3
Sumatoria 62

Intervalo de la clase
Frecuenci
Clase Límite Límite xi
a Fe
inferior superior
423.3
1
292.5 423.36 5 6
554.2
2
423.37 554.22 18 2
685.0
3
554.23 685.08 25 8
815.9
4
685.09 815.94 11 4
5 815.95 946.8 3 946.8
Sumatoria 62  

( x i− X́ )
Zi =
S

 Frecuencia  Densidad  Densidad acumulada


 Clase x i    Zi
Fe f (x i) Σf ( xi )
1 423.36 5 0.080 0.08 -1.29
2 554.22 18 0.290 0.37 -0.29
3 685.08 25 0.403 0.77 0.71
4 815.94 11 0.177 0.95 1.72
5 946.8 3 0.048 1 2.72

 Densidad Función teórica de Densidad


 Densidad acumulada
 Clase empírica   Zi distribución teórica
Σf ( xi )
f (x i) F(X) f (x i)
1 0.080 0.08 -1.29 0.152 0.152
2 0.290 0.37 -0.29 0.489 0.337
3 0.403 0.77 0.71 0.761 0.272
4 0.177 0.95 1.72 0.957 0.196
5 0.048 1 2.72 0.996 0.039

Los valores de la función teórica acumulada de distribución de probabilidades se


tomaron de una tabla (Cuadro No. A2. Distribución normal acumulada, página 418)
del libro de Máximo Villón “Hidrología Estadística”.
La densidad teórica se estima restando cada valor subsiguiente en la función
teórica acumulada: 0.489-0.152=0.337, 0.761-0.489=0.272 y así sucesivamente.
 Densidad Densidad
 Clase empírica teórica
f (x i) f (x i)
1 0.080 0.152
2 0.290 0.337
3 0.403 0.272
4 0.177 0.196
5 0.048 0.039
En color se presentan las frecuencias obtenidas mediante el modelo estadístico
Moivre.
¿Cómo saber o establecer que el modelo estadístico de Moivre se ajusta de
manera adecuada al comportamiento empírico?
Existen diversos criterios para determinar si el ajuste de un modelo estadístico es
adecuado al comportamiento de la distribución empírica de probabilidades de una
variable aleatoria hidrológica.
Un criterio inicial corresponde al análisis visual que se le puede brindar a los dos
gráficos de la distribución de probabilidad. En nuestro caso, vemos ciertas
diferencias entre los valores de las probabilidades en varias clases.

Otro criterio se denomina “Prueba de Smirnov-Kolmogorov”, la cual toma la


máxima diferencia de las probabilidades de todas las clases. En nuestro caso esa
diferencia se ubica en la clase 3. Se denomina estadístico de la prueba al valor
absoluto de:
|∆|=f ( x i ) empiricaacumulada−f ( x i ) teorica acumulada
|∆|=0.403−0.272=0.131
Ese valor corresponde al estadístico empírico de la prueba, ahora se estima el
valor del estadístico teórico para el intervalo de confianza α=0.05 y para N=5
clases. En el Cuadro 5.3. del libro de Hidrología Estadística de Máximo Villón se
obtiene un valor del Δ teórico = 0.565.
Para concluir que el modelo estadístico teórico se ajusta de manera adecuada o
que el ajuste es bueno al modelo estadístico empírico se debe cumplir la relación:
|∆|empirico<∆ teorico
Para concluir que el modelo estadístico teórico se ajusta de manera inadecuada o
que el ajuste no es bueno al modelo estadístico empírico se debe cumplir la
relación:
|∆|empirico ≥ ∆ teorico
Es importante recordar que en este ejemplo N=5 corresponde a la cantidad de
clases. En nuestro caso, el modelo Moivre se ajusta de manera adecuada. Favor
tener en cuenta que en el ejercicio del libro de Máximo Villón el valor de N es
diferente.
5) Estimación del valor de la probabilidad de excedencia
Recordemos nuestra función de distribución de probabilidades que estudiamos
recientemente.

En esa distribución podemos plantear diferentes áreas


El área subrayada en rojo se estima mediante la relación
P [ X ≤ x ] =P [ X < x ] =F ( x )

La siguiente área se estima mediante la relación

P [ X > x ] =1−P [ X ≤ x ] =1−F ( x )

P [ X > x ] =P [ X ≥ x ] =1−P [ X ≤ x ] =1−F ( x )

Se conoce como probabilidad de excedencia a la relación


P [ X ≥ x ] =1−P [ X ≤ x ] =1−F ( x )
Resolveremos la pregunta ¿Cuál es la probabilidad de excedencia según el
modelo estadístico Moivre de que se presente un caudal mayor o igual a 900
metros cúbicos/segundo en el río Fonce?
( x i− X́ )
Zi =
S
x ies el valor máximo que podría causar algún daño en la obra sobre el río Fonce.

900−592.07
Zi = =−2.36
130.51
El valor de la función teórica acumulada de distribución de probabilidades F(X) se
toma de una tabla (Cuadro No. A2. Distribución normal acumulada, página 418)
del libro de Máximo Villón “Hidrología Estadística”:
F ( x ) teorica=1−0.99086=0.009 0.01
La probabilidad de excedencia de que en el río Fonce se presente un caudal igual
o mayor a 900 metros cúbicos / segundo es del 1% según el modelo estadístico
Moivre.
Resolveremos la pregunta ¿Cuál es la probabilidad de excedencia según el
modelo estadístico Moivre de que se presente un caudal mayor o igual a 1000
metros cúbicos/segundo en el río Fonce?
( x i− X́ )
Zi =
S
x ies el valor máximo que podría causar algún daño en la obra sobre el río Fonce.

1000−592.07
Zi = =−3.12
130.51
El valor de la función teórica acumulada de distribución de probabilidades F(X) se
toma de una tabla (Cuadro No. A2. Distribución normal acumulada, página 418)
del libro de Máximo Villón “Hidrología Estadística”:
F ( x ) teorica=1−0.99910=0.0009 0.001
La probabilidad de excedencia de que en el río Fonce se presente un caudal igual
o mayor a 1000 metros cúbicos/segundo es del 0.1% según el modelo estadístico
Moivre.

6) Estimación del periodo de retorno


De acuerdo con las normas técnicas vigentes en nuestro país, el concepto de
periodo de retorno (ver el Manual de Drenajes de Carreteras del INVIAS en el
capítulo 2.4.) es una relación de la forma
1 1
T= =
P ( X ≥ x ) 1−F( X)
Resolveremos la pregunta ¿Cuál es el periodo de retorno de un caudal con una
probabilidad de excedencia F(X)=0?01 en el río Fonce?
1 1
T= = 111
1−F ( X ) 0.009
1 1
T= = 100
1−F ( X ) 0.01
El período de retorno en el río Fonce en San Gil para un caudal de 900 metros
cúbicos/segundo es de 100 años según el Manual de Drenajes del INVIAS.
Resolveremos la pregunta ¿Cuál es el periodo de retorno de un caudal con una
probabilidad de excedencia F(X)=0.001 en el río Fonce?
1 1
T= = 1000
1−F ( X ) 0.001
El período de retorno en el río Fonce en San Gil para un caudal de 1000 metros
cúbicos/segundo es de aproximadamente un milenio (1000 años) según el Manual
de Drenajes del INVIAS.
Es importante retomar el concepto de periodo de retorno que expresa el Manual
de Drenajes de Carreteras del INVIAS:

Como se puede ver claramente, el periodo de retorno según ese concepto es un


valor promedio; es decir, si se obtiene T=111 años, entonces quiere decir que en
realidad según el Manual:
T =± 111
Ese más o menos es un intervalo, en el cual en su medio está el valor de 111
años,
[ −∇ ≤ T ≤+ ∇ ]
También es importante revisar el concepto de periodo de retorno que plantea el
ingeniero civil Ven Te Chow en su libro Hidrología Aplicada (página 392):

Según esa definición, se tienen las consideraciones siguientes en el concepto de


periodo de retorno:
1) Se tiene un número de ocurrencias suficientemente grande. Aquí no se
establece que quiere decir en ingeniería civil la expresión “suficientemente
grande”, es decir, no sabemos cuántos datos debe tener la serie de datos.
2) El periodo de retorno es un valor esperado (en estadística se habla de la
esperanza matemática para el caso de una población y se habla de media
para la muestra), es decir, es en la práctica un valor promedio.
3) Al tratarse de un valor promedio, está claro que existen otros valores por
encima y por debajo de la media.
Si se asume que el periodo de retorno es una variable aleatoria con valor
promedio y desviación estándar, entonces también podría decirse que su
comportamiento podría describirse mediante la ley Moivre. En este caso, en
nuestro ejemplo podría afirmarse: En el río Fonce un caudal de 900 metros
cúbicos/segundo tiene una probabilidad del 1% y un período de retorno igual a 111
años en promedio con una desviación estándar desconocida.
PARTE III-B: APLICACIÓN DE LA DISTRIBUCIÓN NORMAL DE
PROBABILIDADES DE LOS VALORES MINIMOS DE CAUDALES DEL RIO
FONCE

a) Recordemos inicialmente el comportamiento de la variable aleatoria


hidrológica (valores mínimos de los caudales del río Fonce) a lo largo del
tiempo desde 1955 hasta 2016.
b) Revisamos nuestro histograma empírico de frecuencias de los valores
mínimos anuales de los caudales del río Fonce en San Gil (Santander,
Colombia).
c) Estudiamos las propiedades de la Ley de Moivre, también llamada curva
simétrica, campana de Gauss, ley normal, entre muchos otros nombres.

La ecuación de la ley de Moivre se presenta mediante la curva de distribución de


la densidad de probabilidades:
2
−1 (xi − X́ )
1 2 S
2
P ( X )= e
S √2 π
P(X) es la densidad de probabilidades de X
X es la variable aleatoria con una distribución Moivre o Normal
S es la desviación estándar
xi es un valor concreto de la variable aleatoria X
X́ es la media o el valor promedio de los datos
En la antigüedad para los ejercicios prácticos, Laplace logró estandarizar esa
ecuación mediante la integración; para lo cual estableció una nueva variable que
denominó “z”. Más adelante se estudiará la transformación que realizó Laplace
para los usos prácticos de la ley de Moivre o ley Normal. Hace dos siglos se
consideraba que la ecuación de la densidad de distribución de la probabilidad no
se podía resolver fácilmente y por eso se hicieron muy famosas las tablas de
Laplace.
Veamos un ejemplo que ilustra mejor el comportamiento de una variable
hidrológica con la ley de Moivre o campana de Gauss. Supóngase que usted a la
serie de datos de los valores máximos anuales de los caudales del río Fonce le
extrae dos funciones: a) una función con tendencia lineal y b) otra función
netamente aleatoria que tiene una distribución Moivre.
En el siguiente gráfico tenemos la serie temporal de datos de los valores máximos
anuales de los caudales del río Fonce, el cual ya conocemos.

Esa función de caudales la vamos a descomponer en dos funciones, que al


sumarlas nos la devuelva a la misma.
Tomamos para nuestro ejemplo, los valores de los datos residuales o residuos
(función netamente aleatoria):

Giro Q® Giro Q®
1955 0.542 1986 64.2032
1956 48.364 1987 126.0404
1957 45.422 1988 159.3142
1958 -93.328 1989 -70.5527
1959 133.750 1990 -77.0194
1960 -3.821 1991 114.5031
1961 19.267 1992 -211.7650
1962 26.468 1993 19.3635
1963 -57.741 1994 76.4095
1964 -218.337 1995 241.8552
1965 262.446 1996 23.3078
1966 -140.487 1997 -15.0697
1967 -113.387 1998 33.7948
1968 -16.353 1999 328.4161
1969 47.032 2000 -104.0513
1970 210.584 2001 -86.4804
1971 98.712 2002 -33.4138
1972 90.530 2003 26.3223
1973 -43.119 2004 15.6859
1974 163.923 2005 -6.3514
1975 67.188 2006 31.6256
1976 -108.089 2007 -97.4746
1977 -122.795 2008 -125.4563
1978 37.323 2009 107.2575
1979 -10.312 2010 14.2567
1980 -91.917 2011 -2.6089
1981 81.679 2012 -44.7748
1982 -110.216 2013 -199.1409
1983 -148.542 2014 -110.4952
1984 -41.195 2015 -26.2156
1985 -94.866 2016 -56.5923

La media de estos valores es de 0.50, mientras que la desviación estándar es de


113.70, el coeficiente de asimetría es cercano a cero. A la vista se asemeja a una
curva simétrica.
Ahora revisaremos algunas propiedades básicas de la ley de Moivre o campana
de Gauss o ley Normal.
1) Se requieren las características estadísticas de la media y la desviación
estándar para su aplicación.
2) La asimetría y sus coeficientes son nulos en la ecuación teórica o casi nulos
en la práctica.
3) La curtosis también es nula en la ecuación teórica o casi nula en la práctica.

Si analizamos en teoría la relación entre la media, la desviación estándar y la


frecuencia (casos), entonces se puede afirmar en teoría que:
1) Un 99.0% de los casos se encuentran en el intervalo
⌊ X́−3 S , X́ +3 S ⌋ o X́ −3 S ≤ x i ≤ X́ +3 S

2) Un 95.4% de los casos se encuentran en el intervalo


⌊ X́−2 S , X́ +2 S ⌋ o X́ −2 S ≤ x i ≤ X́ +2 S

3) Un 68.2% de los casos se encuentran en el intervalo


⌊ X́−S , X́ + S ⌋ o X́ −S ≤ x i ≤ X́ + S
Desde la ecuación teórica de la ley de Moivre, se establece que en el rango de la
media más la desviación estándar se encuentra el 34.1% de los casos. Es decir, si
se asume que el proceso hidrológico se describe adecuadamente mediante la ley
Moivre, entonces se puede aseverar que el 68.2% de los casos (de los datos de la
serie) están en el intervalo de la media más o menos una desviación estándar.
¿Quién de nosotros ha entrado a un casino?
¿Quién de nosotros ha lanzado un dado?
¿Quién de nosotros ha lanzado la pirinola?
¿Quién de nosotros ha jugado naipes?
En la actualidad se sabe que muchos procesos naturales y humanos se pueden
describir adecuadamente mediante el modelo estadístico Moivre o Normal o
Campana de Gauss.
Por ejemplo, se sabe que el coeficiente intelectual de los seres humanos, los
errores de las mediciones astronómicas y la altura de los españoles, se modelan
en forma satisfactoria con la ley Moivre.
Veamos algunas conclusiones de la interpretación del coeficiente intelectual de los
seres humanos que arroja el modelo estadístico de Moivre:
1) Hay un 0.1% de seres humanos con insuficiencia mental y otro 0.1%
superdotados.
2) Hay un 2% de población con insuficiencia mental y otro 2% con inteligencia
superior.
3) Hay un 13.6% con inteligencia débil y otro 13.6% con gran inteligencia.
4) El 34.1% de las gentes tiene un coeficiente intelectual promedio bajo y otro
34.1% promedio alto.
Si la media (valor promedio) del coeficiente intelectual es igual a 100, entonces
existe un 68.2% de personas que está en el intervalo entre 85 y 115, dado que la
desviación estándar es 15.
Revisemos otras cualidades o características del modelo estadístico Moivre.
La ecuación de la ley de Moivre se presenta mediante la curva de distribución de
la densidad de probabilidades:
2
−1 (xi − X́ )
1 2 S
2
P ( X )= e
S √2 π

La ecuación de la función de densidad P(X) dibuja la campana simétrica; sin


embargo, en la práctica de ingeniería se requiere calcular probabilidades y por ello
se hace uso es de la función de distribución F(X), es decir, el área bajo la curva, la
cual se obtiene haciendo la integral de la forma:

2
x −1 (x i − X́ )
1 2 S
2
F ( X )= ∫ e dx
−∝ S √2 π

El área bajo la curva se estableció igual a 1 o al 100%. Basta con conocer la


media y la desviación estándar para estudiar la ley y aplicarla en ingeniería civil.
En este caso, los eventos no son equiprobables, por el contrario, hay unos con
mayor probabilidad que otros.
d) Identificación de la probabilidad de excedencia y no excedencia
En su momento no se logró solucionar esa integral y por lo tanto desde Laplace se
establecieron unas tablas especiales con las cuales se puede hallar el área bajo la
curva para cualquiera de los intervalos de la variable aleatoria X.
La solución dada por Laplace y vigente a la fecha se explica de la siguiente
manera.
2
x −1 (x i − X́ )
1 2 S
2
F ( X )= ∫ e dx
−∝ S √2 π

(x i− X́ )
Z=
S
z −1
1
2
Z
F ( X )= ∫ e2 dz
−∝ S √2 π

F ( X )=1 , F ( X )=100 %

Se desea calcular el área en la siguiente situación.

P [ x1 ≤ X ≤ x 2 ] =P [ x1 < X ≤ x 2 ] =P [ x 1 ≤ X < x2 ]

P [ x1 ≤ X < x 2 ]=P [ x 1 < X < x 2 ] =P [ X ≤ x2 ] −P [ X ≤ x1 ]

P [ X ≤ x 2 ] −P [ X ≤ x 1 ] =F ( x2 ) −F ( x 1 )

Los valores de la función de distribución de cada x concreto se toman de las


tablas.
Por definición, la función de distribución F(X), da la probabilidad de los eventos de
la forma:
2
x −1 (x i − X́ )
1 2 S
2
P [ X ≤ x ] =P [ X < x ] =F ( x )=∫ e dx
−∝ S √2π

Se desea calcular el área en la siguiente situación.


P [ X > x ] =1−P [ X ≤ x ] =1−F ( x )
e) Entropía de la ley Moivre.
La entropía H(X) de una variable aleatoria con una distribución de probabilidades
es una medida de la indeterminación o incertidumbre del experimento que produjo
a la variable aleatoria.
La entropía de una variable aleatoria X que tiene una función de densidad de
probabilidad f(X) es:
+∞
H ( X )=∫ f ( X ) log a f ( X ) dx +c
−∝

H(X) es la entropía de la variable aleatoria en unidades de la base a del logaritmo;


la base a del algoritmo puede ser a=2 o a=10.
c es un valor constante, el cual define el valor inicial de la entropía de la variable
aleatoria; se asume c=0.
Para una variable aleatoria con una distribución Moivre de probabilidades la
entropía se estima mediante la fórmula:
H ( X )=log [ S √ 2 πe ]
A mayor entropía en la variable, mayor será la incertidumbre: los eventos con altas
probabilidades de suceder arrojarán una baja entropía y viceversa. Si se tienen
solo dos eventos equiprobables, entonces la probabilidad de cada evento es 0.5 y
su entropía H(X) se ilustra en el gráfico así: H(X)=log (0.5)=0.30
Cuando la probabilidad es f=1/n, entonces H(X)=log(n). Si n=10, H(X)=1.

f) Ejercicio de la aplicación de la distribución normal

1) Tenemos los datos originales del IDEAM

Los datos de los valores máximos en giros de traslación del río Fonce en la
estación hidrológica de San Gil (Santander, Colombia) fueron otorgados de
manera gratuita por el instituto IDEAM.

GIRO Q MIN GIRO Q MIN


1955 91.39 1987 79.76
1956 74.97 1988 102.83
1957 70.48 1989 99.14
1958 47.25 1990 85.50
1959 70.88 1991 68.97
1960 68.06 1992 48.15
1961 69.43 1993 76.25
1962 79.44 1994 97.06
1963 69.82 1995 86.39
1964 73.40 1996 96.70
1965 68.19 1997 76.99
1966 83.90 1998 92.59
1967 75.37 1999 117.40
1968 98.54 2000 81.04
1969 80.74 2001 70.64
1970 81.15 2002 77.93
1971 126.03 2003 85.25
1972 99.81 2004 83.85
1973 81.79 2005 90.89
1974 100.33 2006 99.87
1975 91.14 2007 95.17
1976 77.06 2008 95.78
1977 66.65 2009 77.77
1978 86.47 2010 107.67
1979 96.41 2011 123.65
1980 61.95 2012 84.43
1981 108.27 2013 72.67
1982 100.71 2014 71.89
1983 83.08 2015 54.80
1984 91.05 2016 64.15
1985 82.63 2017 43.74
1986 92.32 2018 49.02
2) Tenemos el histograma de frecuencia o distribución de probabilidad

3) Tenemos los valores de algunas características estadísticas

X CARACTERÍSTICA SÍMBOLO VALOR EXCEL


MEDIA-PROMEDIO  82.92
VARIANZA S2 294.02
DESVIACIÓN ESTÁNDAR S 17.15
COEFICIENTE DE ASIMETRÍA CS 0.063
COEFICIENTE DE CURTOSIS CK 0.35
valores adecuados para los eventos equiprobables: frecuencia = 1/n
4) Tenemos la ecuación de la función de probabilidad de la ley Moivre
2
−1 (xi − X́ )
1 2 S
2
P ( X )= e
S √2 π
También conocemos la ecuación de la función de distribución de
probabilidades
2
x −1 (x i − X́ )
1 2 S
2
F ( X ) =∫ e dx
−∝ S √2 π

( x i− X́ )
Z=
S
z −1 2
1 2
Z
F ( X ) =∫ e dz
−∝ S √2 π

Entonces ahora procedemos a ajustar la ley Moivre (Campana de Gauss o Ley


Normal) al histograma empírico de frecuencias o probabilidades de nuestra
variable aleatoria de valores máximos de caudales del río Fonce en San Gil
(Santander).
(x i− X́ )
Z=
S
x ies el valor máximo en cada intervalo de clase del histograma empírico.

Intervalo de clase
Posición Frecuencia Fe
Límite inferior Límite superior
1 43.74 60.20 5
2 60.20 76.66 17
3 76.66 93.11 25
4 93.11 109.57 14
5 109.57 126.03 3
SUMATORIA 64
Intervalo de clase
Clase Frecuencia Fe Xi
Límite inferior Límite superior
1 43.74 60.20 5 60.20
2 60.21 76.66 17 76.66
3 76.67 93.11 25 93.11
4 93.12 109.57 14 109.57
5 109.58 126.03 3 126.03
SUMATORIA 64  

( x i− X́ )
Zi =
S
Densidad
Frecuencia Densidad
Clase Xi acumulada Zi
Fe f ( Xi ) Σ f ( Xi )
1 60.201 5.000 0.078 0.078 -1.325
2 76.658 17.000 0.266 0.344 -0.365
3 93.114 25.000 0.391 0.734 0.595
4 109.571 14.000 0.219 0.953 1.554
5 126.028 3.000 0.047 1.000 2.514

Densidad Densidad
Función teórica de Densidad teórica
Clase empírica acumulada Zi
distribución F(x)
f ( Xi ) Σ f ( Xi ) f ( Xi )
1.000 0.078 0.078 -1.325 0.093 0.093
2.000 0.266 0.344 -0.365 0.356 0.262
3.000 0.391 0.734 0.595 0.722 0.367
4.000 0.219 0.953 1.554 0.939 0.217
5.000 0.047 1.000 2.514 0.994 0.054

Los valores de la función teórica acumulada de distribución de probabilidades se


tomaron de una tabla (Cuadro No. A2. Distribución normal acumulada, página 418)
del libro de Máximo Villón “Hidrología Estadística”.
La densidad teórica se estima restando cada valor subsiguiente en la función
teórica acumulada: 0.355-0.093=0.262, 0.722-0.355=0.366 y así sucesivamente.
Clase Densidad empírica Densidad teórica
f ( Xi ) f ( Xi )
1.000 0.078 0.093
2.000 0.266 0.262
3.000 0.391 0.367
4.000 0.219 0.217
5.000 0.047 0.054

0.400
0.350
0.300
PROBABILIDAD

0.250
0.200
0.150

0.100
0.050
0.000
1.000 2.000 3.000 4.000 5.000
CLASES

En color se presentan las frecuencias obtenidas mediante el modelo estadístico


Moivre.
¿Cómo saber o establecer que el modelo estadístico de Moivre se ajusta de
manera adecuada al comportamiento empírico?
Existen diversos criterios para determinar si el ajuste de un modelo estadístico es
adecuado al comportamiento de la distribución empírica de probabilidades de una
variable aleatoria hidrológica.
Un criterio inicial corresponde al análisis visual que se le puede brindar a los dos
gráficos de la distribución de probabilidad. En nuestro caso, vemos ciertas
diferencias entre los valores de las probabilidades en varias clases.
0.400
0.350

PROBABILIDAD 0.300
0.250
0.200
0.150

0.100
0.050
0.000
1.000 2.000 3.000 4.000 5.000
CLASES

Otro criterio se denomina “Prueba de Smirnov-Kolmogorov”, la cual toma la


máxima diferencia de las probabilidades de todas las clases. En nuestro caso esa
diferencia se ubica en la clase 3. Se denomina estadístico de la prueba al valor
absoluto de:
|∆|=f ( x i ) empiricaacumulada−f ( x i ) teorica acumulada
|∆|=0.391−0.367=0.024
Ese valor corresponde al estadístico empírico de la prueba, ahora se estima el
valor del estadístico teórico para el intervalo de confianza α=0.05 y para N=5
clases. En el Cuadro 5.3. del libro de Hidrología Estadística de Máximo Villón se
obtiene un valor del Δ teórico = 0.565.
Para concluir que el modelo estadístico teórico se ajusta de manera adecuada o
que el ajuste es bueno al modelo estadístico empírico se debe cumplir la relación:
|∆|empirico<∆ teorico
Para concluir que el modelo estadístico teórico se ajusta de manera inadecuada o
que el ajuste no es bueno al modelo estadístico empírico se debe cumplir la
relación:
|∆|empirico ≥ ∆ teorico
Es importante recordar que en este ejemplo N=5 corresponde a la cantidad de
clases. En nuestro caso, el modelo Moivre se ajusta de manera adecuada. Favor
tener en cuenta que en el ejercicio del libro de Máximo Villón el valor de N es
diferente.
5) Estimación del valor de la probabilidad de excedencia
Recordemos nuestra función de distribución de probabilidades que estudiamos
recientemente.

En esa distribución podemos plantear diferentes áreas

El área subrayada en rojo se estima mediante la relación


P [ X ≤ x ] =P [ X < x ] =F ( x )

La siguiente área se estima mediante la relación

P [ X > x ] =1−P [ X ≤ x ] =1−F ( x )


P [ X > x ] =P [ X ≥ x ] =1−P [ X ≤ x ] =1−F ( x )

Se conoce como probabilidad de excedencia a la relación


P [ X ≥ x ] =1−P [ X ≤ x ] =1−F ( x )
Resolveremos la pregunta ¿Cuál es la probabilidad de excedencia según el
modelo estadístico Moivre de que se presente un caudal mayor o igual a 900
metros cúbicos/segundo en el río Fonce?
( x i− X́ )
Zi =
S
x ies el valor máximo que podría causar algún daño en la obra sobre el río Fonce.

900−82.92
Zi = =47.64
17.15
El valor de la función teórica acumulada de distribución de probabilidades F(X) se
toma de una tabla (Cuadro No. A2. Distribución normal acumulada, página 418)
del libro de Máximo Villón “Hidrología Estadística”:
F ( x ) teorica=1−0.99086=0.009 0.01
La probabilidad de excedencia de que en el río Fonce se presente un caudal igual
o mayor a 900 metros cúbicos / segundo no se puede calcular debido a que el
valor de Zi obtenido es muy alto y no se puede verificar su valor en el Cuadro No.
A2 y de la misma forma se concluye que el modelo no se puede emplear bien para
este caudal.
Resolveremos la pregunta ¿Cuál es la probabilidad de excedencia según el
modelo estadístico Moivre de que se presente un caudal mayor o igual a 1000
metros cúbicos/segundo en el río Fonce?
( x i− X́ )
Zi =
S
x ies el valor máximo que podría causar algún daño en la obra sobre el río Fonce.

1000−82.92
Zi = =53.47
17.15
El valor de la función teórica acumulada de distribución de probabilidades F(X) se
toma de una tabla (Cuadro No. A2. Distribución normal acumulada, página 418)
del libro de Máximo Villón “Hidrología Estadística”:
F ( x ) teorica=1−0.99910=0.0009 0.001
La probabilidad de excedencia de que en el río Fonce se presente un caudal igual
o mayor a 1000 metros cúbicos / segundo no se puede calcular debido a que el
valor de Zi obtenido es muy alto y no se puede verificar su valor en el Cuadro No.
A2 y de la misma forma se concluye que el modelo no se puede emplear bien para
este caudal.

6) Estimación del periodo de retorno

Debido a que no se puede calcular un F(x) teórico de los caudales no se


pueden hallar los periodos de retorno.
De acuerdo con las normas técnicas vigentes en nuestro país, el concepto de
periodo de retorno (ver el Manual de Drenajes de Carreteras del INVIAS en el
capítulo 2.4.) es una relación de la forma
1 1
T= =
P ( X ≥ x ) 1−F( X)
Resolveremos la pregunta ¿Cuál es el periodo de retorno de un caudal con una
probabilidad de excedencia F(X)=0.001 en el río Fonce?
1 1
T= = 111
1−F ( X ) 0.009
1 1
T= = 100
1−F ( X ) 0.01
El período de retorno en el río Fonce en San Gil para un caudal de 900 metros
cúbicos/segundo es de 100 años según el Manual de Drenajes del INVIAS.
Resolveremos la pregunta ¿Cuál es el periodo de retorno de un caudal con una
probabilidad de excedencia F(X)=0.001 en el río Fonce?
1 1
T= = 1000
1−F ( X ) 0.001
El período de retorno en el río Fonce en San Gil para un caudal de 1000 metros
cúbicos/segundo es de aproximadamente un milenio (1000 años) según el Manual
de Drenajes del INVIAS.
Es importante retomar el concepto de periodo de retorno que expresa el Manual
de Drenajes de Carreteras del INVIAS:

Como se puede ver claramente, el periodo de retorno según ese concepto es un


valor promedio; es decir, si se obtiene T=111 años, entonces quiere decir que en
realidad según el Manual:
T =± 111
Ese más o menos es un intervalo, en el cual en su medio está el valor de 111
años,
[ −∇ ≤ T ≤+ ∇ ]
También es importante revisar el concepto de periodo de retorno que plantea el
ingeniero civil Ven Te Chow en su libro Hidrología Aplicada (página 392):
Según esa definición, se tienen las consideraciones siguientes en el concepto de
periodo de retorno:
1) Se tiene un número de ocurrencias suficientemente grande. Aquí no se
establece que quiere decir en ingeniería civil la expresión “suficientemente
grande”, es decir, no sabemos cuántos datos debe tener la serie de datos.
2) El periodo de retorno es un valor esperado (en estadística se habla de la
esperanza matemática para el caso de una población y se habla de media
para la muestra), es decir, es en la práctica un valor promedio.
3) Al tratarse de un valor promedio, está claro que existen otros valores por
encima y por debajo de la media.
Si se asume que el periodo de retorno es una variable aleatoria con valor
promedio y desviación estándar, entonces también podría decirse que su
comportamiento podría describirse mediante la ley Moivre. En este caso, en
nuestro ejemplo podría afirmarse: En el río Fonce un caudal de 900 metros
cúbicos/segundo tiene una probabilidad del 1% y un período de retorno igual a 111
años en promedio con una desviación estándar desconocida.

Вам также может понравиться