Вы находитесь на странице: 1из 50

TALLER HIDROLOGA

ESTACIN PLUVIOGRFICA EL GRANIZO (EAB-ESP)

ANDRES DAVID MORENO FONSECA 201322277


JAVIER EDUARDO MARULANDA LOPEZ 201412169
JULIAN YESID MORALES GALINDO 201322738
ROGER ALEXANDER VIASUS RODRIGUEZ 201322487

Presentado a:
INGENIERO MSC EDISSON RAMIRO CEPEDA ARIAS

UNIVERSIDAD PEDAGGICA Y TECNOLGICA DE COLOMBIA


FACULTAD DE INGENIERA
ESCUELA DE INGENIERA AMBIENTAL
TUNJA
2016

PRECIPITACIN TOTAL MENSUAL

Tabla N 1. Precipitacin total mensual 1976-2005


Fuente: Estacin Pluviogrfica el Granizo
1. Estadsticos Bsicos
Estos clculos se usan para identificar ciertos comportamientos en la totalidad de
los datos que puedan indicar ciertas situaciones que se puedan presentar, en este
caso con respecto a la precipitacin en la zona estudiada Para facilitar el clculo de
los estadsticos bsicos se tomaron los datos de la serie de manera agrupada, por lo
que las ecuaciones que se mostrarn son aplicadas especficamente para datos
agrupados.
Para agrupar los datos se utilizaron los siguientes clculos:
K(Nmero de intervalos)
K=1+3.3 log(N ), siendo N el nmero total de datos(360)
Al hacer el clculo se obtuvo un nmero de intervalos de 9,4357 el cual se aproxim
a 9 intervalos.
Rango (R)
R= Xmax-Xmin = 230,1 mm - 0 mm 230,1

Tamao del intervalo de clase (C)


C=

R 230,1
=
=25,57 , es decir aproximadamente un tamao de intervalo de 26
K
9

A partir de esos resultados se hizo la determinacin de los lmites superiores (Ls) y


lmites inferiores (Li), como se mostrar en la tabla siguiente
1.1. Media (Momento 1, respecto al origen)

Tabla N2 Media
Fuente: Autores
Para realizar el clculo de la media se parti de la agrupacin de los 360 datos
segn el rango y el nmero de intervalos mencionados anteriormente, se cont el
nmero de datos por cada intervalo y se calcul una marca de clase la cual se trata
de un promedio entre el lmite inferior y el lmite superior para cada intervalo.
Ejemplo de clculo Marca de clase (Xj)
Intervalo 3
(Ls+Li)/2 =Xj
(78,2+52,2)/2 = 65,2
Luego de esto, se realiz una sumatoria del producto del nmero de datos por
intervalos y la marca de clase para cada uno de estos, para as calcular la media
aritmtica:

x=

23602,5
360

x =65,5625
La media es bsicamente un promedio de los datos que se tienen en la serie, que
para este caso, es una serie de precipitaciones; en la serie de datos, 192 datos, es
decir el 53,3%, se encuentran por debajo de la media de 65,56, por lo que se puede
decir que dicho valor es representativo de la serie, aunque en dicho valor influyen
los datos con valores extremos
1.2. Mediana (Me o Xm)
La mediana de una serie de datos es un valor del recorrido de una variable que
divide dicha serie a la mitad, es decir, que contara como aquel valor cuya
frecuencia acumulada igual a N/2 y dicho valor no es sensible a valores extremos de
las variables. Para el clculo de la mediana se usaron los siguientes datos:

Tabla N3 Mediana
Fuente: Autores
Primero, se crea una columna aparte, la cual contiene las frecuencias absolutas
acumuladas (Ni) de los intervalos.
Luego, se determina el valor de N/2, que es 360/2 = 180; se buscan los valores que
contienen al 180, dentro de la columna Ni, para determinar los intervalos que
contienen a la mediana, dichos intervalos son los de 26,1-52,1 y 78,3-104,3.
Luego se aplica la siguiente frmula:

Donde Li, es el punto medio de los lmites que contienen a la mediana, C es el


tamao del intervalo (26), Ni-1 es la frecuencia acumulada del intervalo anterior al

que contiene la mediana (intervalo 2) y ni es la frecuencia relativa el intervalo que


contiene la mediana (intervalo 3).
Xm=52,2+26(

180140
)=62,297
103

1.3. Moda
Es una medida de posicin, que sacrifica una gran cantidad de informacin, definido
como el valor de la serie que ms se repita, es decir, el valor con la mxima
frecuencia; sin embargo dada la naturaleza de los valores de precipitacin es muy
poco probable que un valor de precipitacin se repita
Por lo que el valor de la moda es muy poco significativo (pero se hace como
estadstico bsico, y para corroborar resultados posteriores con respecto a la
asimetra); adems, como se tomaron los datos agrupados, se tiene en cuenta la
siguiente frmula:

Donde Li, es el lmite inferior del intervalo con la mayor frecuencia de datos, I es el
tamao del intervalo, D1 es la diferencia entre la frecuencia del intervalo de mayor
frecuencia y la del intervalo inferior, y D2 es la diferencia entre la frecuencia del
intervalo de mayor frecuencia a la del intervalo superior.

Tabla N 4 Moda
Fuente: Autores
Mo=52,2+ 26(

(10384)
)=62,57
(10384)+(10363)

1.4. Media geomtrica (Mg)


La media geomtrica, es una variable que se calcula para series de datos que
varan con respecto al tiempo, con el fin de probar si estos presentan un crecimiento
geomtrico. Para el clculo de este variable se tiene en cuenta la siguiente frmula y
los correspondientes datos:

Donde Ni, es la frecuencia de los datos en los intervalos, Xj es la marca de clase de


cada intervalo y N es el nmero total de datos.

Tabla N5 Media Geomtrica


Fuente: Autores
Mg=10

620,6786985
360

=52,97

Dado que la media geomtrica, difiere de la media aritmtica y no se acerca al valor


del mismo, se puede afirmar que la serie no tiene un crecimiento geomtrico, es
decir, que los valores de precipitacin no presentan un orden especfico, y difieren
en su valor para cada ao; adems solo el 42% de los datos estn bajo esta media,
por lo que su valor es menos representativo que el de la media aritmtica para esta
serie de datos.
1.5. Desviacin estndar o tpica (S, Momento 2 respecto a la media)
Se utiliza como una medida de la dispersin de los datos con respecto a la media
aritmtica, y en el caso de la precipitacin podra dar una idea de si se llegase a
presentar ms probablemente un valor intermedio en vez de valores extremos. La
frmula usada para hallar este parmetro en datos agrupados fue la siguiente:

Donde Xj es la marca de clase de cada intervalo, x es la media de los datos, ni es el


nmero de datos en cada intervalo y N es el nmero total de datos.

Tabla N6 Desviacin Estndar


Fuente: Autores
522440,766
360

S=
Teniendo en cuenta la gran cantidad de datos procesados, se puede decir que la
desviacin es bastante baja, lo que indica que los datos estn cerca de la media a
una distancia de 38,0949, teniendo en cuenta que 285 datos de la serie, se
encuentran en el intervalo de 38,0949 por debajo y por encima de la media,
indicando que la serie sigue una tendencia de agrupacin hacia la media hacia la
media.
Por lo tanto, el valor de la media es representativa de toda la serie de datos, por lo
que en el caso de estudios hidrolgicos o de diseo de estructuras se podra dar un
concepto concreto con respecto a este valor, para la realizacin de dichos diseos,
pero solamente con respecto a niveles de precipitacin medios; pero se podra
utilizar otra configuracin de datos dependiendo del fin del estudio.

1.7. Coeficiente de variacin


Es el cociente entre la desviacin tpica o estndar y la media aritmtica, de la
variable estadstica. Cuanto ms prximo es a cero el valor hallado, menos
dispersos estarn los datos con respecto a la media; en muchos casos se utiliza
para comparar la dispersin de 2 distribuciones, independientemente del valor de
sus medias. La frmula que se utiliza para calcular este valor es la siguiente:

Donde S es la desviacin estndar, y es la media aritmtica de los datos; para los


datos usados se tiene una desviacin estndar de 38,0949 y una media de 65,25,
por lo tanto:
Cs=

38,0949
= 0,581
65,25

Si tenemos en cuenta que entre ms cerca est el valor, de 0, menor ser la


dispersin, se puede corroborar que la dispersin es grande, dado que el coeficiente
arroj un resultado del 58,1% de dispersin relativa. Lo cual quiere decir, que
aunque la serie presenta una agrupacin de datos con respecto a la media, los
valores de estos datos son muy diferentes entre s.
Es decir varan mucho uno respecto del otro, y no se concentran en puntos
especficos alrededor de la media, por lo que se puede decir que la precipitacin no
sigue un patrn especfico a lo largo del tiempo (independientemente de si se ajusta
a una distribucin de probabilidad)
1.8. Coeficiente de asimetra (Ca)
Es considerada una medida de forma, que mide el sesgo de los datos, considerando
una tendencia de los mismos hacia valores especficos, es decir, mide qu tan
concentrados estn los datos hacia valores menores o mayores de la serie, teniendo
en cuenta la media como referente.
Una asimetra negativa (Ca<0), indicar que la serie de datos tiende a moverse
hacia los valores mayores; mientras que la asimetra positiva (Ca>0) indicar que la
serie tiende hacia lo valores menores. Por supuesto, lo anterior no que todos los
datos, se encuentren sesgados hacia un valor, pero si la mayora. Para calcular el
coeficiente se us la siguiente frmula:

Donde s es la desviacin estndar, N es el nmero total de datos, Xj es la marca de


clase del intervalo y x es la media aritmtica de la serie agrupada. Los datos usados
para los clculos fueron los siguientes:

Tabla N7 Coeficiente de Asimetra


Fuente: Autores
Se obtuvo un coeficiente de asimetra de 0,3855, que siendo mayora 0, indica una
asimetra positiva, es decir, que la mayora de los datos se concentran en la zona de
valores menores, teniendo en cuenta que al menos 242 datos se encuentran por
debajo de una precipitacin por debajo de 80 mm, comprobando el correcto valor e
interpretacin de la desviacin estndar obtenida, por lo que se puede decir que
seran ms probables lluvias con valores de menos de 80 mm.
Para corroborar el valor del Ca, se pueda usar la mediana la media y la moda, ya
que segn la teora, en una asimetra positiva, la media es mayor a la mediana y
esta a su vez es mayor a la moda, lo cual es el caso para esta serie de datos.
Adems, esta asimetra se puede observar, en la siguiente grfica:

Grfica N1 Coeficiente de Asimetra


Fuente: Autores

Como se puede observar, la mayora de los datos se concentran en los primeros


intervalos de la serie (valores ms pequeos), corroborando la asimetra positiva
hallada.

1.9. Curtosis (Cu)


Es una medida de apuntamiento que analiza si una distribucin de frecuencias es
ms apuntada o menos, al compararla con una distribucin normal con su misma
media y varianza. El apuntamiento de una distribucin depende de la cantidad de
valores de la variable que se encuentren en torno a la zona central, es decir a la
media. Si Cu<3.
La distribucin es platicrtica, es decir, es ms achatada que la distribucin normal
(mayor dispersin con respecto a la media) y si Cu>3, la distribucin es leptocrtica,
es decir, que es ms apuntada que la normal (mayor concentracin de datos con
respecto a la media. Para calcular la curtosis, se us la siguiente frmula:

Donde s es la desviacin estndar y m4 es el cuarto momento con respecto a la


media, y se calcula de la siguiente manera:

Donde Ni es el nmero de datos presentes en cada intervalo, Xj es la marca de


clase del intervalo, x es la media aritmtica y N es el nmero total de datos. A
continuacin se presentan lo datos usados:

Tabla N8 Curtosis

Fuente: Autores
Dado que se obtuvo un valor mayor a 3, se puede decir que la distribucin es
leptocrtica, y presenta una buena dispersin alrededor de la media, corroborando
el dato de la desviacin estndar obtenida.

2. PRUEBAS DE AJUSTE Y BONDAD


2.1. DISTRIBUCIN NORMAL
Para realizar estas pruebas, debido al gran nmero de datos se agruparon como se
mencion en el punto anterior, para poder darle un mejor manejo a estos. Adems
de esto el punto de partida para estas pruebas de ajuste y bondad sern los
parmetros estadsticos que se calcularon anteriormente, especialmente la media y
la desviacin estndar, la media tomada como el primer momento, este con
respecto al origen que es bsicamente el promedio de los datos y la desviacin
estndar como segundo momento tomado con respecto a la media.
CHI CUADRADO
Para realizar esta prueba es necesario calcular las frecuencias relativas y
acumuladas, basndose en la cantidad de datos por cada intervalo, calculando
primero la frecuencia relativa como el nmero de datos por cada intervalo dividido
entre el nmero total de datos.
Ejemplo intervalo 1 (56 es el nmero de datos entre 0 y 26 mm)
56/360 = 0,1556
La probabilidad acumulada hace referencia a la suma de todas las probabilidades
relativas de tal manera que para el ltimo intervalo se obtenga un valor de 1.

Tabla N9 Chi Cuadrado


Fuente: Autores
Como la finalidad de aplicar esta prueba es observar si se ajusta a la distribucin
normal, es necesario calcular la variable normal estndar z, la cual tiene en cuenta
los momentos mencionados (media y desviacin estndar), que se calcul como:
z=

Que para este caso, al tratarse de una serie muestral se tomaron la media y la
desviacin estndar como x(barra) y s respectivamente y el valor de x ser tomado
como el lmite superior de cada intervalo, puesto que al trabajarse una frecuencia
esperada este valor es el ms idneo para poder calcularla.
Ejemplo clculo de Z para el intervalo 1 y el intervalo 3
En este caso se harn dos ejemplos de clculo puesto que para cada intervalo el
valor de z puede ser negativo o positivo dependiendo de hacia qu lado de la
campana de Gauss se encuentra esta funcin de probabilidad.
z para el intervalo 1 (lmite superior = 26)
z=

2665,5625
38,0949386
z=-1,0385

z para el intervalo 3 (lmite superior = 78,2)

z=

78,265,5625
38,0949386
z=0,3317

Tabla N10 Valores de Z


Fuente Autores
Luego a partir del valor z, se pueden hallar los valores de la funcin de distribucin
de probabilidad estndar sin evaluar la integral si no usando una frmula de B, que
es un polinomio que ayuda a aproximar el valor de la frecuencia absoluta esperada
o terica.
z2 +0,000344z3 +0,019527z4
4
1+0,196854z+0,115194

1
B=
2
Esta distribucin de probabilidad o frecuencia absoluta tender a:
F( z )=B para z<0
F( z )=1B para z 0

Para el caso de la serie de precipitaciones registrada por la estacin El Granizo, se


obtuvieron dos valores de z negativos por lo que el valor hallado de B se estableci
como la funcin de probabilidad mientras que para los dems intervalos se hizo la
resta indicada anteriormente.
Ejemplos clculos de frecuencia absoluta esperada para intervalos 1 y 3
Intervalo 1(z=-1,0385)

1,0385 +0,0003441,0385 +0,0195271,0385


4
1+0,1968541,0835+0,115194

1
B=
2
B = 0,1497
Intervalo 3(z=0,3317)

Como z es mayor a 0 es necesario restar el valor obtenido de a 1.


0,33172+ 0,0003440,33173 +0,0195270,33174
4
1+ 0,1968540,3317+ 0,115194

1
B=
2
Por lo tanto:
Frecuencia acumulada = 1 - B
Frecuencia acumulada = 0,6301

Tabla N11 Frecuencia Absoluta


Fuente: Autores
A partir de la frecuencia acumulada esperada se pueden obtener las frecuencias
relativas restando cada dato de estos el dato inmediatamente anterior.

Tabla N12 Frecuencia Relativa


Fuente: Autores
Finalmente para obtener el valor de Chi cuadrado se aplica la frmula:
2

[fs( xi)f ( xi)]


Xi =
f (xi)
2

Por lo que para calcularlo se toma la sumatoria del cuadrado de la resta entre la
frecuencia relativa observada y la frecuencia relativa esperada dividido entre la
frecuencia relativa esperada, obtenindose:
Xi 2 =26,37731656
Una vez obtenido este dato, se obtiene un estimador que depende de un nivel de
significancia, de los momentos asumidos y el nmero de intervalos tomados para
agrupar los datos. Este estimador se busca en las tablas de chi cuadrado a partir de
un valor de v que se calcula as:
v = k-1-p
Donde k es el nmero de intervalos tomados que para este caso segn el criterio de
Sturges fue 9 con un tamao de 26, y p es el nmero de parmetros o momentos,
que como se mencion anteriormente fueron la media y la desviacin estndar (2).
v=9-1-2
v=6
Donde este v representa los grados de libertad que se deben tomar para la prueba
de bondad chi cuadrado
Luego de esto se asume un nivel de confianza a criterio, el cual en este caso se
tom del 95 % ya que es el nivel ms comn, y este es expresado como 1- ,
donde es el nivel de significancia que es calculado como:

1 (nivel de confianza)
2

10,95
2

=0,025
Ya teniendo estos dos valores se busca en las tablas de Chi cuadrado, el dato
tabulado para 6 grados de libertad y un nivel de significancia de 0,025.

Tabla N13 Grados de libertad y nivel de significancia


Fuente: Autores
El valor obtenido mediante la tabla de Chi cuadrado es de 14,4494 por lo que al ser
menor que el valor obtenido mediante frmula (26,3773) se puede decir que los
datos se ajustan a una distribucin normal, por lo que estos pueden tender a y
a debido a que los datos son variables aleatorias continuas, adems de esto
la media, la moda y la mediana tendern a ubicarse aproximadamente en el pico de
la campana de gauss que representa este tipo de probabilidad.
PRUEBA DE KOLMOGOROV-SMIRNOV
Para esta prueba tambin son usados los datos calculados para la anterior puesto
que la base de su clculo son las probabilidades observadas y las probabilidades
esperadas, donde la resta entre las probabilidad esperadas y las observadas
arrojar un valor que puede ser tomado como el estimador de esta prueba siempre
que este sea el mayor. La frmula para calcularlo es la siguiente:
D=max[(Fs(xi)-F(xi)]

Las frecuencias utilizadas para este clculo, corresponden a las frecuencias


absolutas, basado en esto, se obtuvieron los siguientes resultados:

Tabla N14 Kolmogorov Smirnov


Fuente: Autores
De estos valores obtenidos se toma el dato ms alto y este ser el estimador de la
prueba de Kolmogorov-Smirnov.
Para poder comprobar si los datos se ajustan a la distribucin normal mediante esta
prueba es necesario tener un valor de significancia que para la prueba de Chi
cuadrado se calcul, y se determin como 0,025 y el nmero de datos que es 360,
sin embargo como no se encuentra este nmero en la tabla ni de datos ni de
significancia, lo que se hizo fue calcular valores para 0,05 y 0,02 con las siguientes
frmulas:
Para 0,05

1,36
=0,0717
360

Para 0,02

1,52
=0,0801
360
Una vez conseguidos estos datos, lo que se realiza es una interpolacin para el
nivel de significancia de 0,025, a partir de la frmula ya conocida de interpolacin
lineal:

Reemplazando:
0,0250,05
yx=0,0717+
(0,08010,0717)
0,020,05
yx=0,0787
El valor obtenido se compara con el valor mximo que es de 0,04498, por lo que al
ser mayor el valor de las tablas que el valor mximo de la prueba se asume que los
datos se ajustan a la distribucin normal.

PRUEBA GRFICA
Finalmente para la prueba grfica se calcula el valor de R^2 ya que este indica la
correlacin de los datos grficamente, por lo que si su valor se acerca a 1 quiere
decir que estos datos se ajustarn a la distribucin normal grficamente. Para
calcularla se usa:
1(Fs(xi)F (xi))2
R2=
( Fs ( xi)Fs (xi) prom)2

Tabla N15
Fuente: Autores
Los clculos se realizaron en excel para el numerador y el denominador de la
frmula y ya realizada la sumatoria:
R2=1

0,00310321
0,76766913
R^2=0,99595762

Al observar este valor se puede determinar que los datos se ajustan a la distribucin
normal puesto que la correlacin entre ellos da un valor cercano a 1.
Para poder observar el comportamiento de estos datos con probabilidades de
excedencia se organizan los 360 datos de mayor a menor con el fin de darles un
nmero de orden que ir de 1 a 360 siendo 1 el valor ms y 360 el valor ms bajo.
A partir de esto se utiliz la frmula de Blom para calcular la probabilidad de
excedencia, la cual indica la probabilidad de que un evento supere un valor
determinado que en este caso este valor estar determinado por los datos de
precipitacin para los 12 meses por ao desde 1976 a 2005, se usa esta frmula
debido a que se ajusta a datos de distribucin normal, sta es:
3
8
Probabilidad de excedencia=
1
N+
4
m

Para el mayor valor con orden 1 (230,1 mm) se calcul:


3
8
P=
1
360+
4
1

P = 0,001734906
En este caso el valor obtenido muestra que la probabilidad de exceder una
precipitacin de 230,1 mm en la estacin el Granizo es muy baja, de alrededor del
0,17 %, por lo que es probable que un evento de esta magnitud no se presente en
un gran perodo de tiempo, lo cual se comprobar con el clculo del perodo de
retorno.
Para el valor ms bajo, con orden 360 (0 mm)
3
8
P=
1
360+
4
360

P = 0,998265094
Para este caso su probabilidad de excedencia es muy grande acercndose al 100
%, por lo cual es muy probable que un evento supere esta magnitud de 0 mm que
se present en enero de 1977.
Para determinar los perodos de retorno, es decir el tiempo en el que se presentar
un evento que supere esta magnitud como lo indica la probabilidad de excedencia,
se hallar el inverso de esta probabilidad, por lo cual se obtendr un valor en aos.
Siguiendo con los ejemplos para el valor ms alto y el ms bajo se obtiene:
Orden 1: 1/0,001734906=576,4
Orden 360: 1/0,998265094=1,001737921
Como se puede ver en los resultados para estos dos ejemplos, para una
probabilidad de excedencia baja se obtiene un perodo de retorno muy grande que
para este caso es de 576,4 aos, por lo que se puede afirmar que es muy probable
que una magnitud de 230,1 mm de precipitacin se vuelva a presentar dentro de
576,4 aos mientras que para el dato de 0 mm la probabilidad de se presente un
evento que supere esta magnitud es muy alta en un periodo de un ao.

Finalmente a partir de las probabilidades de excedencia se pueden calcular la


probabilidad acumulada que entre menor sea la probabilidad de excedencia mayor
ser la probabilidad acumulada ya que es una resta de 1 que representa el 100 %
menos la probabilidad de excedencia. Para observar el comportamiento de las
probabilidades de excedencia para los 360 datos se grafic precipitacin mensual
(mm) vs probabilidad de excedencia:

Grfica N2 Precipitacin mensual vs Probabilidad de excedencia


Fuente: Autores
En la grfica se puede ver que entre ms grande sea la magnitud del evento, menor
ser la probabilidad de excedencia y por la tanto mayor ser su perodo de retorno.
Adems se puede ver que se correlacionan bien las dos variables dejando ver que
tiene una cercana con el valor hallado para R^2, sin embargo para comprobarlo
mejor se realiz una grfica de las frecuencias absolutas vs marca de clase (Media
de intervalos de precipitaciones)

Grfica N3 Frecuencia absoluta vs Marca de clase


Fuente: Autores
Al graficarse se observ el ajuste entre las frecuencias observadas y esperadas
estando muy cercanas, y se estableci una lnea de tendencia polinmica de 4
grado para observar la correlacin entre estos datos y di un valor cercano a 1, por
lo que concuerdo con el valor obtenido por el clculo de R^2.
2.2. DISTRIBUCIN LOG NORMAL
Para la distribucin log normal, se realizaron los mismos procedimientos que en la
distribucin, con la diferencia de que se aplicaron a los logaritmos de los datos, por
lo cual, a continuacin solamente se mostrarn los resultados tabulados y las
grficas; sin embargo, toda la informacin estar disponible en el archivo excel
adjunto, en la hoja Punto 2 (Distribucin LogNormal). Adems del cambio de datos,
se hizo necesario, cambiar el tamao de los intervalos, para ajustarlos a la escala
logartmica, con un tamao de 0,27 como se muestra a continuacin:

Tabla N 16 Intervalos distribucin Log Normal


Fuente: Autores
CHI CUADRADO
Para realizar esta prueba es necesario calcular las frecuencias relativas y
acumuladas, basndose en la cantidad de datos por cada intervalo, calculando
primero la frecuencia relativa como el nmero de datos por cada intervalo dividido
entre el nmero total de datos. Las frecuencias relativas y acumuladas de la
distribucin Lognormal se muestran a continuacin:

Tabla N 17 Frecuencia relativa acumulada

Fuente: Autores
En esa distribucin se observa que la organizacin de los datos ha cambiado con
respecto a la distribucin normal, ya que en esta ltima, la mayora de los datos se
encontraban en los primeros intervalos (lo que explica la asimetra positiva
encontrada), mientras que en la lognormal, los datos se encuentran ms agrupados
en los ltimos intervalos, creando una asimetra negativa, que redujo la proporcin
de valores extremos con respecto a los valores pequeos de la serie (adems de
reducir notoriamente la desviacin estndar de la serie), lo cual se puede observar
en las frecuencias relativas de los ltimos intervalos (que son las ms grandes).
Como la finalidad de aplicar esta prueba es observar si se ajusta a la distribucin
normal, es necesario calcular la variable normal estndar z, la cual tiene en cuenta
los momentos mencionados (media y desviacin estndar), que se calcul como:
x

Que para este caso, al tratarse de una serie muestral se tomaron la media y la
desviacin estndar como x(barra) y s respectivamente y el valor de x ser tomado
como el lmite superior de cada intervalo, puesto que al trabajarse una frecuencia
esperada este valor es el ms idneo para poder calcularla. A continuacin se
muestran los valores de Z para la distribucin lognormal:
z=

Tabla N 18 Valores de Z
Fuente: Autores
Luego a partir del valor z, se pueden hallar los valores de la funcin de distribucin
de probabilidad estndar sin evaluar la integral si no usando una frmula de B, que

es un polinomio que ayuda a aproximar el valor de la frecuencia absoluta esperada


o terica.
z2 +0,000344z3 +0,019527z4
1+0,196854z+0,115194 4

1
B=
2
Esta distribucin de probabilidad o frecuencia absoluta tender a:
F( z )=B

Para z<0

F( z )=1B Para z

A partir de estas condiciones se obtuvieron los siguientes resultados:

Tabla N 19 Frecuencia absoluta


Fuente: Autores
Con respecto a estos resultados se puede decir que se perdi algo de informacin,
debido a que la frecuencia acumulada dio como resultado final 0,9760 y no 1, lo cual
puede deberse, al efecto de la transformacin de los datos y las limitaciones que
tiene esta distribucin con los valores muy cercanos a 0 o los valores negativos, por
lo tanto los resultados de las pruebas pueden verse afectados.
A partir de la frecuencia acumulada esperada se pueden obtener las frecuencias
relativas restando cada dato de estos el dato inmediatamente anterior.

Tabla N 20 Frecuencia relativa


Fuente: Autores
Finalmente para obtener el valor de Chi cuadrado se aplica la frmula:
2

[fs( xi)f ( xi)]


Xi =
f (xi)
2

Por lo que para calcularlo se toma la sumatoria del cuadrado de la resta entre la
frecuencia relativa observada y la frecuencia relativa esperada dividido entre la
frecuencia relativa esperada, obtenindose:
Xi 2 =591,918
Como se mencion antes, la prdida de informacin, pudo haber afectado
gravemente esta prueba arrojando este resultado de tal magnitud, y aunque se
verificaron los clculos varias veces, este sigui siendo el resultado final para esta
prueba, por lo tanto se puede decir que segn la prueba de chi cuadrado, los datos
no se ajustan a la distribucin lognormal, teniendo en cuenta el resultado de chi
cuadrado sacado de las tablas para la distribucin normal.
PRUEBA DE KOLMOGOROV-SMIRNOV
Para esta prueba tambin son usados los datos calculados para la anterior puesto
que la base de su clculo son las probabilidades observadas y las probabilidades
esperadas, donde la resta entre las probabilidad esperadas y las observadas
arrojar un valor que puede ser tomado como el estimador de esta prueba siempre
que este sea el mayor. La frmula para calcularlo es la siguiente:

D=max[(Fs(xi)-F(xi)]
Las frecuencias utilizadas para este clculo, corresponden a las frecuencias
absolutas, basado en esto, se obtuvieron los siguientes resultados:

Tabla N 21 Kolmogorov Smirnov


Fuente: Autores
Teniendo en cuenta el valor del K-S estimado de las tablas para la distribucin
normal con un valor de 0,0787, se tiene que los datos no se ajustan a la distribucin
lognormal, debido a que el valor estimador mximo de K-s obtenido de los datos
(0,11925209), es mucho mayor que el resultado de las tablas.
PRUEBA GRFICA
Finalmente para la prueba grfica se calcula el valor de R^2 ya que este indica la
correlacin de los datos grficamente, por lo que si su valor se acerca a 1 quiere
decir que estos datos se ajustarn a la distribucin normal grficamente. Para
calcularla se usa:
1(Fs(xi)F (xi))2
R =
( Fs ( xi)Fs (xi) prom)2
2

Tabla N 22 Prueba grfica


Fuente: Autores
Usando las sumatorias de estas dos columnas (correspondientes a las 2 ltimas
fila), se aplica la frmula, con la que se obtuvo el siguiente resultado
R^2=0,98344
Al observar este valor se puede determinar que los datos se ajustan a la distribucin
normal puesto que la correlacin entre ellos da un valor cercano a 1. Para
corroborar este resultado, se hace el mismo procedimiento que en la distribucin
normal, al organizar los 360 datos de mayor a menor, darles un nmero de orden,
aplicar la frmula de Blom y obtener los periodos de retorno, los clculos y
resultados se muestran en el archivo adjunto de Excel. Con dichos resultados, se
conform la siguiente grfica:

Grfica N4 Precipitacin total vs Probabilidad de excedencia


Fuente: Autores
En la grfica se puede ver que entre ms grande sea la magnitud del evento, menor
ser la probabilidad de excedencia y por lo tanto mayor ser su perodo de retorno.
Adems se puede ver que se correlacionan bien las dos variables dejando ver que
tiene una cercana con el valor hallado para R^2.Con este resultado, se us una
lnea de tendencia polinmica de orden 4, ya que con otro tipo de lnea de
tendencia, el resultado de la correlacin era de aproximadamente 0,8 (indicando que
la serie no se ajusta a la distribucin lognormal, dado que la grfica arrojara un
valor menor al calculado en las tablas)
Sin embargo, con la lnea polinmica, los datos si se ajustan a la distribucin
lognormal. Para comprobarlo mejor se realiz una grfica de las frecuencias
absolutas vs marca de clase (Media de intervalos de precipitaciones).

Grfica N5 Frecuencia absoluta vs Marca de clase


Fuente: Autores
En la grfica se observa discrepancia entre las frecuencias observadas y las
esperadas, debido a la prdida de informacin que se mencion anteriormente, sin
embargo, al aplicar una lnea de tendencia polinmica de orden 3, se obtiene una
correlacin similar a la obtenida en las tablas

3. Series de duracin y excedencia

Grfica N 6 Distribucin serie duracin completa Mensual


Fuente: Autores
3.1 . Serie de duracin completa (anual)
Se dice que es una serie de duracin completa ya que est basada en los 360 datos
mensuales que se muestran en la Grfica N6 reportados durante los 30 aos, de
los cuales se obtuvieron 30 datos respectivamente ya que esta serie se trata de
obtener los valores de la sumatoria de datos mensuales por ao y reportar este
nuevo dato as mismo se sigue el proceso con todos los datos obteniendo una serie
nueva con el total por aos.
Sobre los resultados obtenidos en esta serie se puede decir que para el ao 2004
se registraron los datos ms altos 1000,6 en cuanto a mm de precipitacin respecta
sobre la serie de los ltimos 30 aos destacndose como el ao con mayor lmina
de agua y concluyendo que dicho ao la poca invernal se manifest con bastante
intensidad. Junto con el ao 1996 en el cual se registraron 969,5 mm y como se
puede apreciar en la grfica son los dos picos ms altos.

Tabla N 22 Serie de duracin completa anual (mm)


Fuente: Autores

Grfica N7 Comportamiento Serie duracin completa


Fuente: Autores
3.2. Serie de duracin parcial (anual)
En esta serie de datos es en la cual uno mismo fija un umbral basndose en algn
propsito en particular como por ejemplo al analizar tormentas slo se van a tener
en cuenta los valores mensuales ms altos que superan el umbral para no trabajar
con los datos bajos siendo como un filtro en el que se buscan solo los datos que
cumplan esta condicin razn por la cual no en todos los aos se reporta un dato.
Entonces solo se tienen en cuenta aquellos eventos superiores a un nivel de
precipitacin, partiendo de este lmite se busca encontrar los valores mensuales que
se encuentren por encima de dicho umbral, para este caso el umbral establecido fue
de 700 mm ya que se considera que a partir de este valor los datos que clasifiquen
son aquellos en los que se registr un ao con altos niveles de precipitaciones ya
que dejando un umbral con valores ms altos o ms bajos excluira mayor cantidad
de datos, despreciando gran cantidad de informacin.

Tabla N 23 Serie de duracin parcial


Fuente: Autores

Grfica N 8 Comportamiento Serie de duracin parcial


Fuente: Autores
3.3.

Serie de excedencia anual

En este caso tambin se establece un valor basado en el inters por datos anuales
que superan los 550 mm dicho valor fue establecido ya que es aquel que est justo
por debajo del ltimo valor o valor ms bajo, la idea es que todos los datos cumplan
y lograr obtener un valor anual, una nueva serie con 30 datos los cuales todos
pasaron dicho umbral.
En este caso partiendo de los datos anuales, cumpliendo con el requisito de superar
el umbral para obtener un dato anual y como segundo requisito se debe obtener
una serie exactamente igual al nmero de aos como se muestra en las grficas, la
excedencia anual se da porque el nmero de datos de la serie cumple con el umbral
y al mismo tiempo el nmero de datos es igual al nmero de aos, esta serie es
similar a la obtenida de la serie de duracin completa anual.

Tabla N 24 Valores de Excedencia anual


Fuente: Autores

3.4.

Grfica N 9 Comportamiento Excedencia anual


Fuente: Autores
Serie de excedencia anual mxima

Esta serie consiste en que se debe reportar ao tras ao un valor el cual debe ser el
mximo para dicho ao pero est basado en los datos mensuales para ese ao,
entonces se debe mirar cual es el dato mximo de los 12 meses por cada ao y
registrarlo en la nueva serie que se busca obtener, garantizando que todos los aos
reportan un valor, obteniendo una nueva serie con 30 datos los mayores para su
respectivo ao.
En este caso los valores obtenidos oscilan desde 73,6 mm en el ao 1997
concluyendo que en dicho ao se presentaron bajos niveles en las precipitaciones
siendo probablemente un ao afectado por un verano intenso hasta valores de 230
mm como el mximo registrado segn la grfica para el ao 2005 pudiendo dar a
entender que este ao present gran cantidad de lluvias o que ese ao justo en ese
mes llovi demasiado fuerte ya que usualmente los datos muy altos de tormentas
fuertes no tienden a durar mucho tiempo y que de los ltimos 30 aos fue en l en el
que ms cantidad de precipitacin cay.

Tabla N 25 Valores de Excedencia anual mxima


Fuente: Autores

Grfica N 10 Comportamiento Excedencia anual mxima


Fuente: Autores

3.5.

Serie de excedencia anual mnima

En este caso es exactamente el proceso contrario al anterior punto en el cual lo que


se busca es encontrar el valor mnimo por cada mes, y reportarlo anualmente
asegurando tener un valor por cada ao sea 30 valores, en este caso sucedi algo
curioso y es que segn el reporte de precipitacin total de la estacin El Granizo
para el ao 1977 se obtuvo un valor de 0 mm lo cual es un poco improbable ya que
estara dando a inferir que en todo un mes del ao 1977 no se registr ni una sola
lluvia.
Datos corroborados con los registrados en los aos 1979, 1988, 1998, 2001 y 2003
donde indica que tambin se presentaron meses bastante secos como se muestran
las cadas en la grfica a continuacin y que durante estos aos los valores de
precipitaciones fueron demasiado bajos pudiendo depender de las condiciones
meteorolgicas o tal vez de errores en el registro de los datos en la estacin.
En cuanto a los diferentes tipos de series que se pueden hallar se concluye que hay
varias formas de agrupar los datos y de conformar series para hacer anlisis
hidrolgicos, durante este punto se abordaron diferentes maneras con el fin de
familiarizarse con estos conceptos, de la manera en que se pueden agregar las
series temporalmente para pasar de obtener valores diarios de precipitaciones a
valores mensuales y a su vez pasar de estos datos de precipitacin promedio
mensual por ejemplo a obtener valores anuales y clasificarlos como en este caso la
serie de 30 aos.

Tabla N 26 Valores de Excedencia anual mnima


Fuente: Autores

Grfica N 11 Comportamiento Excedencia anual mnima


Fuente: Autores

4. Serie Anual Mxima de perodos de Retorno

Tabla N 27 Serie anual mxima de perodos de retorno


Fuente: Autores

4.1 Datos estadsticos


Para los clculos de Media, Desviacin, Coeficiente de variacin y coeficiente de
asimetra estn explicados en el primer punto de este taller.

Tabla N 28 Media Desviacin Coeficiente de variacin coeficiente de asimetra


Fuente: Autores
4.2 Clculo de las magnitudes para distribucin normal

Tabla N 29 Magnitudes
Fuente: Autores
Probabilidad=1 /T

Probabilidad=1 /25=0,04
W = [ ln(1/ p2 ) ]

0,5

W = [ ln (1/(0,042 ))]
Z =W

0,5

= 2,537

2,515517+ 0,802853W + 0,010328W 2


2
3
1+1,432788W +0,189269 W +0,001308 W

Z =Kt=2,53

2,515517+0,8028532,53+ 0,0103282,53 2
= 1,75108
1+1,4327882,53+0,189269 2,532+ 0,0013082,53 3

X T =X + K T
X T =(141,84 )+(1,7510831,0507)=196,212mm
X T es el periodo de retorno de la precipitacin en 25,50 y 100 para la distribucin
de la normal.
4.3 Clculo de las magnitudes para distribucin Log normal
Para esta distribucin se hace el mismo procedimiento de clculo, que el anterior
punto, con la diferencia de que los datos obtenidos, corresponden a un Yt=Log(Xt)
por lo que para hallar X T se hace con el antilogaritmo (Potencia 10)

Tabla N 30 Serie Log Normal


Fuente: Autores
4.4 Clculo de las magnitudes para distribucin Log EVI I

Para esta distribucin, el valor del factor de frecuencia Kt se saca con la tabla de
frecuencias de gumbel teniendo en cuenta la mnima cantidad de datos y el tiempo
que se proyecta y para hallar X T se hace lo mismo que la distribucin normal.

Tabla N 31 Serie Log EVI


Fuente: Autores
4.5 Clculo de las magnitudes para distribucin Pearson tipo III
Para el clculo de la magnitud con la distribucin Pearson tipo III, es necesario
sacar el valor del factor de frecuencia Kt, de tablas especficas para esta
distribucin, teniendo en cuenta el coeficiente de asimetra obtenido (en este caso el
de la distribucin normal), y el periodo de retorno analizado; los datos fueron los
siguientes:

Tabla N 32 Serie Pearson tipo III


Fuente: Autores

Como se mencion antes los valores de Kt de se obtuvieron de la tabla, con un


Coeficiente de asimetra de 0,53422 y los distintos periodos de retorno, pero fue
necesario interpolar debido a que ese valor de coeficiente no se encuentra
directamente en la tabla.

4.6 Clculo de las magnitudes para distribucin Log Pearson tipo III.
En el caso de log Pearson tipo III, se usan los estadsticos de la serie logartmica; se
realiza el mismo procedimiento que en la distribucin normal para hallar el valor de z
(incluyendo el clculo intermedio de w); luego se calcula otro valor intermedio, y
luego se aplica una frmula especial para hallar el factor de frecuencia Kt. A
continuacin se presentan los resultados obtenidos:

Tabla N 33 Serie Log Pearson tipo III


Fuente: Autores
K=

Coef . asimetra 0,398122133


=
=0,066353689
6
6

Para un periodo de retorno de 25 aos


1
1
Kt=z +( z2 1)k + ( z 36 z) k 2(z 21)k 3+ z k 4 + k 5
3
3
Kt=1,5973687

Y T =X + K T
Y T =log ( X T )=(2,141608)+(1,59736870,0968532)=2,2963186
X T =10Y =102,2963186=197,84206 mm
T

Tanto la distribucin pearson tipo III, como la log pearson tipo III, se utilizan
principalmente con valores mximos, sin embargo, al comparar los datos, al usar los
logaritmos de los mismos, se redujo notoriamente la desviacin estndar y el
coeficiente de variacin, adems de cambiar la asimetra positiva de la serie, por
una asimetra negativa y de menor magnitud, por lo que deberan ajustarse mejor
los datos, siendo su resultado ms confiable que la de otras distribuciones teniendo
en cuenta que en el clculo de log Pearson se utiliza el valor.
Sin embargo, se tuvo un resultado similar en la distribucin normal, por lo que se
podra decir que los datos se ajustan a la distribucin normal (aunque esta es ms
usada para valores medios), aunque debe comprobarse por medio de pruebas de
ajustes de bondad si esta afirmacin es veraz.
A pesar de la denotacin de la distribucin de Gumbel como de valores extremos,
que en este caso toma las mximas precipitaciones anuales para conformar la serie
de datos, segn la teora sta se ajusta mejor a una serie cuando la cantidad de
datos es considerablemente grande, por lo que la limitada cantidad de datos de
precipitacin mxima anual, hace que estos resultados pierdan un poco de validez
y veracidad.
Adems de que en los clculos solo se tienen en cuenta 2 parmetros estadsticos,
y que los resultados mostrados difieren en gran medida de los resultados de los
otras distribuciones; sin embargo, dado que presentan los resultados ms grandes
de las distribuciones, pueden tenerse en cuenta para proyecciones de sucesos
extremos con una gran magnitud de precipitacin
Algo que tienen en comn los resultados de todas las distribuciones es que para
periodos de retorno grandes (100 aos), se presentan los mayores valores de
precipitacin, as como una menor probabilidad de excedencia, indicando que los
eventos con mayor magnitud son menos probables independientemente de la
distribucin que se adopte.
A continuacin se muestra una grfica que relaciona los resultados de todas las
distribuciones:

Grfica N 12 Comportamiento Precipitacin Mxima vs Periodo de Retorno


Fuente: Autores
En la grfica se puede observar que la distribucin normal y Log Pearson presentan
resultados similares, por lo que sera adecuado tomar esos valores como correctos,
es decir, que las distribuciones pueden extrapolar valores correctamente. Aunque
las otras distribuciones pueden tener buenos resultados ya que todas se usan para
valores extremos, el escoger una depende de los fines el estudio hidrolgico.
5. Determinar los lmites de confianza del 95% para los valores de
precipitacin total mensual correspondientes a un perodo de retorno de 100
aos y una distribucin Normal. En todos los numerales de este punto
analizar los resultados obtenidos.
Nota: para los clculos de Media, Desviacin y Coeficiente de variacin estn
explicados en el primer punto de este taller.

Tabla: N 34 Media, Desviacin y Coeficiente de variacin


Fuente: Autores
Para estos clculos se muestran en punto 4 del presente taller

Tabla N 35 Serie Normal


Fuente: Autores
Para este punto se necesita conocer los lmites de confianza sabiendo que nuestro
valor de confianza es del 95% por tato =0,95 para hallar se necesita
proceder con la siguiente frmula.
=

1
2

10,95
=0,025
2

Por lo tanto = 0,025 luego se localiza Z en las tablas de la distribucin normal


obteniendo el valor de z=1,96 luego procedemos por calcular a y b.

Los lmites de confianza se calculan

Los caudales obtenidos en la parte superior e inferior son 163,12 y 147,12


respectivamente comparados con el caudal obtenido de la distribucin normal son
valores de confianza, teniendo en cuenta de que a medida que el tamao de la
muestra aumenta, el ancho del intervalo de confianza alrededor de la magnitud de la
creciente es menor.

Вам также может понравиться