Академический Документы
Профессиональный Документы
Культура Документы
Presentado a:
INGENIERO MSC EDISSON RAMIRO CEPEDA ARIAS
R 230,1
=
=25,57 , es decir aproximadamente un tamao de intervalo de 26
K
9
Tabla N2 Media
Fuente: Autores
Para realizar el clculo de la media se parti de la agrupacin de los 360 datos
segn el rango y el nmero de intervalos mencionados anteriormente, se cont el
nmero de datos por cada intervalo y se calcul una marca de clase la cual se trata
de un promedio entre el lmite inferior y el lmite superior para cada intervalo.
Ejemplo de clculo Marca de clase (Xj)
Intervalo 3
(Ls+Li)/2 =Xj
(78,2+52,2)/2 = 65,2
Luego de esto, se realiz una sumatoria del producto del nmero de datos por
intervalos y la marca de clase para cada uno de estos, para as calcular la media
aritmtica:
x=
23602,5
360
x =65,5625
La media es bsicamente un promedio de los datos que se tienen en la serie, que
para este caso, es una serie de precipitaciones; en la serie de datos, 192 datos, es
decir el 53,3%, se encuentran por debajo de la media de 65,56, por lo que se puede
decir que dicho valor es representativo de la serie, aunque en dicho valor influyen
los datos con valores extremos
1.2. Mediana (Me o Xm)
La mediana de una serie de datos es un valor del recorrido de una variable que
divide dicha serie a la mitad, es decir, que contara como aquel valor cuya
frecuencia acumulada igual a N/2 y dicho valor no es sensible a valores extremos de
las variables. Para el clculo de la mediana se usaron los siguientes datos:
Tabla N3 Mediana
Fuente: Autores
Primero, se crea una columna aparte, la cual contiene las frecuencias absolutas
acumuladas (Ni) de los intervalos.
Luego, se determina el valor de N/2, que es 360/2 = 180; se buscan los valores que
contienen al 180, dentro de la columna Ni, para determinar los intervalos que
contienen a la mediana, dichos intervalos son los de 26,1-52,1 y 78,3-104,3.
Luego se aplica la siguiente frmula:
180140
)=62,297
103
1.3. Moda
Es una medida de posicin, que sacrifica una gran cantidad de informacin, definido
como el valor de la serie que ms se repita, es decir, el valor con la mxima
frecuencia; sin embargo dada la naturaleza de los valores de precipitacin es muy
poco probable que un valor de precipitacin se repita
Por lo que el valor de la moda es muy poco significativo (pero se hace como
estadstico bsico, y para corroborar resultados posteriores con respecto a la
asimetra); adems, como se tomaron los datos agrupados, se tiene en cuenta la
siguiente frmula:
Donde Li, es el lmite inferior del intervalo con la mayor frecuencia de datos, I es el
tamao del intervalo, D1 es la diferencia entre la frecuencia del intervalo de mayor
frecuencia y la del intervalo inferior, y D2 es la diferencia entre la frecuencia del
intervalo de mayor frecuencia a la del intervalo superior.
Tabla N 4 Moda
Fuente: Autores
Mo=52,2+ 26(
(10384)
)=62,57
(10384)+(10363)
620,6786985
360
=52,97
S=
Teniendo en cuenta la gran cantidad de datos procesados, se puede decir que la
desviacin es bastante baja, lo que indica que los datos estn cerca de la media a
una distancia de 38,0949, teniendo en cuenta que 285 datos de la serie, se
encuentran en el intervalo de 38,0949 por debajo y por encima de la media,
indicando que la serie sigue una tendencia de agrupacin hacia la media hacia la
media.
Por lo tanto, el valor de la media es representativa de toda la serie de datos, por lo
que en el caso de estudios hidrolgicos o de diseo de estructuras se podra dar un
concepto concreto con respecto a este valor, para la realizacin de dichos diseos,
pero solamente con respecto a niveles de precipitacin medios; pero se podra
utilizar otra configuracin de datos dependiendo del fin del estudio.
38,0949
= 0,581
65,25
Tabla N8 Curtosis
Fuente: Autores
Dado que se obtuvo un valor mayor a 3, se puede decir que la distribucin es
leptocrtica, y presenta una buena dispersin alrededor de la media, corroborando
el dato de la desviacin estndar obtenida.
Que para este caso, al tratarse de una serie muestral se tomaron la media y la
desviacin estndar como x(barra) y s respectivamente y el valor de x ser tomado
como el lmite superior de cada intervalo, puesto que al trabajarse una frecuencia
esperada este valor es el ms idneo para poder calcularla.
Ejemplo clculo de Z para el intervalo 1 y el intervalo 3
En este caso se harn dos ejemplos de clculo puesto que para cada intervalo el
valor de z puede ser negativo o positivo dependiendo de hacia qu lado de la
campana de Gauss se encuentra esta funcin de probabilidad.
z para el intervalo 1 (lmite superior = 26)
z=
2665,5625
38,0949386
z=-1,0385
z=
78,265,5625
38,0949386
z=0,3317
1
B=
2
Esta distribucin de probabilidad o frecuencia absoluta tender a:
F( z )=B para z<0
F( z )=1B para z 0
1
B=
2
B = 0,1497
Intervalo 3(z=0,3317)
1
B=
2
Por lo tanto:
Frecuencia acumulada = 1 - B
Frecuencia acumulada = 0,6301
Por lo que para calcularlo se toma la sumatoria del cuadrado de la resta entre la
frecuencia relativa observada y la frecuencia relativa esperada dividido entre la
frecuencia relativa esperada, obtenindose:
Xi 2 =26,37731656
Una vez obtenido este dato, se obtiene un estimador que depende de un nivel de
significancia, de los momentos asumidos y el nmero de intervalos tomados para
agrupar los datos. Este estimador se busca en las tablas de chi cuadrado a partir de
un valor de v que se calcula as:
v = k-1-p
Donde k es el nmero de intervalos tomados que para este caso segn el criterio de
Sturges fue 9 con un tamao de 26, y p es el nmero de parmetros o momentos,
que como se mencion anteriormente fueron la media y la desviacin estndar (2).
v=9-1-2
v=6
Donde este v representa los grados de libertad que se deben tomar para la prueba
de bondad chi cuadrado
Luego de esto se asume un nivel de confianza a criterio, el cual en este caso se
tom del 95 % ya que es el nivel ms comn, y este es expresado como 1- ,
donde es el nivel de significancia que es calculado como:
1 (nivel de confianza)
2
10,95
2
=0,025
Ya teniendo estos dos valores se busca en las tablas de Chi cuadrado, el dato
tabulado para 6 grados de libertad y un nivel de significancia de 0,025.
1,36
=0,0717
360
Para 0,02
1,52
=0,0801
360
Una vez conseguidos estos datos, lo que se realiza es una interpolacin para el
nivel de significancia de 0,025, a partir de la frmula ya conocida de interpolacin
lineal:
Reemplazando:
0,0250,05
yx=0,0717+
(0,08010,0717)
0,020,05
yx=0,0787
El valor obtenido se compara con el valor mximo que es de 0,04498, por lo que al
ser mayor el valor de las tablas que el valor mximo de la prueba se asume que los
datos se ajustan a la distribucin normal.
PRUEBA GRFICA
Finalmente para la prueba grfica se calcula el valor de R^2 ya que este indica la
correlacin de los datos grficamente, por lo que si su valor se acerca a 1 quiere
decir que estos datos se ajustarn a la distribucin normal grficamente. Para
calcularla se usa:
1(Fs(xi)F (xi))2
R2=
( Fs ( xi)Fs (xi) prom)2
Tabla N15
Fuente: Autores
Los clculos se realizaron en excel para el numerador y el denominador de la
frmula y ya realizada la sumatoria:
R2=1
0,00310321
0,76766913
R^2=0,99595762
Al observar este valor se puede determinar que los datos se ajustan a la distribucin
normal puesto que la correlacin entre ellos da un valor cercano a 1.
Para poder observar el comportamiento de estos datos con probabilidades de
excedencia se organizan los 360 datos de mayor a menor con el fin de darles un
nmero de orden que ir de 1 a 360 siendo 1 el valor ms y 360 el valor ms bajo.
A partir de esto se utiliz la frmula de Blom para calcular la probabilidad de
excedencia, la cual indica la probabilidad de que un evento supere un valor
determinado que en este caso este valor estar determinado por los datos de
precipitacin para los 12 meses por ao desde 1976 a 2005, se usa esta frmula
debido a que se ajusta a datos de distribucin normal, sta es:
3
8
Probabilidad de excedencia=
1
N+
4
m
P = 0,001734906
En este caso el valor obtenido muestra que la probabilidad de exceder una
precipitacin de 230,1 mm en la estacin el Granizo es muy baja, de alrededor del
0,17 %, por lo que es probable que un evento de esta magnitud no se presente en
un gran perodo de tiempo, lo cual se comprobar con el clculo del perodo de
retorno.
Para el valor ms bajo, con orden 360 (0 mm)
3
8
P=
1
360+
4
360
P = 0,998265094
Para este caso su probabilidad de excedencia es muy grande acercndose al 100
%, por lo cual es muy probable que un evento supere esta magnitud de 0 mm que
se present en enero de 1977.
Para determinar los perodos de retorno, es decir el tiempo en el que se presentar
un evento que supere esta magnitud como lo indica la probabilidad de excedencia,
se hallar el inverso de esta probabilidad, por lo cual se obtendr un valor en aos.
Siguiendo con los ejemplos para el valor ms alto y el ms bajo se obtiene:
Orden 1: 1/0,001734906=576,4
Orden 360: 1/0,998265094=1,001737921
Como se puede ver en los resultados para estos dos ejemplos, para una
probabilidad de excedencia baja se obtiene un perodo de retorno muy grande que
para este caso es de 576,4 aos, por lo que se puede afirmar que es muy probable
que una magnitud de 230,1 mm de precipitacin se vuelva a presentar dentro de
576,4 aos mientras que para el dato de 0 mm la probabilidad de se presente un
evento que supere esta magnitud es muy alta en un periodo de un ao.
Fuente: Autores
En esa distribucin se observa que la organizacin de los datos ha cambiado con
respecto a la distribucin normal, ya que en esta ltima, la mayora de los datos se
encontraban en los primeros intervalos (lo que explica la asimetra positiva
encontrada), mientras que en la lognormal, los datos se encuentran ms agrupados
en los ltimos intervalos, creando una asimetra negativa, que redujo la proporcin
de valores extremos con respecto a los valores pequeos de la serie (adems de
reducir notoriamente la desviacin estndar de la serie), lo cual se puede observar
en las frecuencias relativas de los ltimos intervalos (que son las ms grandes).
Como la finalidad de aplicar esta prueba es observar si se ajusta a la distribucin
normal, es necesario calcular la variable normal estndar z, la cual tiene en cuenta
los momentos mencionados (media y desviacin estndar), que se calcul como:
x
Que para este caso, al tratarse de una serie muestral se tomaron la media y la
desviacin estndar como x(barra) y s respectivamente y el valor de x ser tomado
como el lmite superior de cada intervalo, puesto que al trabajarse una frecuencia
esperada este valor es el ms idneo para poder calcularla. A continuacin se
muestran los valores de Z para la distribucin lognormal:
z=
Tabla N 18 Valores de Z
Fuente: Autores
Luego a partir del valor z, se pueden hallar los valores de la funcin de distribucin
de probabilidad estndar sin evaluar la integral si no usando una frmula de B, que
1
B=
2
Esta distribucin de probabilidad o frecuencia absoluta tender a:
F( z )=B
Para z<0
F( z )=1B Para z
Por lo que para calcularlo se toma la sumatoria del cuadrado de la resta entre la
frecuencia relativa observada y la frecuencia relativa esperada dividido entre la
frecuencia relativa esperada, obtenindose:
Xi 2 =591,918
Como se mencion antes, la prdida de informacin, pudo haber afectado
gravemente esta prueba arrojando este resultado de tal magnitud, y aunque se
verificaron los clculos varias veces, este sigui siendo el resultado final para esta
prueba, por lo tanto se puede decir que segn la prueba de chi cuadrado, los datos
no se ajustan a la distribucin lognormal, teniendo en cuenta el resultado de chi
cuadrado sacado de las tablas para la distribucin normal.
PRUEBA DE KOLMOGOROV-SMIRNOV
Para esta prueba tambin son usados los datos calculados para la anterior puesto
que la base de su clculo son las probabilidades observadas y las probabilidades
esperadas, donde la resta entre las probabilidad esperadas y las observadas
arrojar un valor que puede ser tomado como el estimador de esta prueba siempre
que este sea el mayor. La frmula para calcularlo es la siguiente:
D=max[(Fs(xi)-F(xi)]
Las frecuencias utilizadas para este clculo, corresponden a las frecuencias
absolutas, basado en esto, se obtuvieron los siguientes resultados:
En este caso tambin se establece un valor basado en el inters por datos anuales
que superan los 550 mm dicho valor fue establecido ya que es aquel que est justo
por debajo del ltimo valor o valor ms bajo, la idea es que todos los datos cumplan
y lograr obtener un valor anual, una nueva serie con 30 datos los cuales todos
pasaron dicho umbral.
En este caso partiendo de los datos anuales, cumpliendo con el requisito de superar
el umbral para obtener un dato anual y como segundo requisito se debe obtener
una serie exactamente igual al nmero de aos como se muestra en las grficas, la
excedencia anual se da porque el nmero de datos de la serie cumple con el umbral
y al mismo tiempo el nmero de datos es igual al nmero de aos, esta serie es
similar a la obtenida de la serie de duracin completa anual.
3.4.
Esta serie consiste en que se debe reportar ao tras ao un valor el cual debe ser el
mximo para dicho ao pero est basado en los datos mensuales para ese ao,
entonces se debe mirar cual es el dato mximo de los 12 meses por cada ao y
registrarlo en la nueva serie que se busca obtener, garantizando que todos los aos
reportan un valor, obteniendo una nueva serie con 30 datos los mayores para su
respectivo ao.
En este caso los valores obtenidos oscilan desde 73,6 mm en el ao 1997
concluyendo que en dicho ao se presentaron bajos niveles en las precipitaciones
siendo probablemente un ao afectado por un verano intenso hasta valores de 230
mm como el mximo registrado segn la grfica para el ao 2005 pudiendo dar a
entender que este ao present gran cantidad de lluvias o que ese ao justo en ese
mes llovi demasiado fuerte ya que usualmente los datos muy altos de tormentas
fuertes no tienden a durar mucho tiempo y que de los ltimos 30 aos fue en l en el
que ms cantidad de precipitacin cay.
3.5.
Tabla N 29 Magnitudes
Fuente: Autores
Probabilidad=1 /T
Probabilidad=1 /25=0,04
W = [ ln(1/ p2 ) ]
0,5
W = [ ln (1/(0,042 ))]
Z =W
0,5
= 2,537
Z =Kt=2,53
2,515517+0,8028532,53+ 0,0103282,53 2
= 1,75108
1+1,4327882,53+0,189269 2,532+ 0,0013082,53 3
X T =X + K T
X T =(141,84 )+(1,7510831,0507)=196,212mm
X T es el periodo de retorno de la precipitacin en 25,50 y 100 para la distribucin
de la normal.
4.3 Clculo de las magnitudes para distribucin Log normal
Para esta distribucin se hace el mismo procedimiento de clculo, que el anterior
punto, con la diferencia de que los datos obtenidos, corresponden a un Yt=Log(Xt)
por lo que para hallar X T se hace con el antilogaritmo (Potencia 10)
Para esta distribucin, el valor del factor de frecuencia Kt se saca con la tabla de
frecuencias de gumbel teniendo en cuenta la mnima cantidad de datos y el tiempo
que se proyecta y para hallar X T se hace lo mismo que la distribucin normal.
4.6 Clculo de las magnitudes para distribucin Log Pearson tipo III.
En el caso de log Pearson tipo III, se usan los estadsticos de la serie logartmica; se
realiza el mismo procedimiento que en la distribucin normal para hallar el valor de z
(incluyendo el clculo intermedio de w); luego se calcula otro valor intermedio, y
luego se aplica una frmula especial para hallar el factor de frecuencia Kt. A
continuacin se presentan los resultados obtenidos:
Y T =X + K T
Y T =log ( X T )=(2,141608)+(1,59736870,0968532)=2,2963186
X T =10Y =102,2963186=197,84206 mm
T
Tanto la distribucin pearson tipo III, como la log pearson tipo III, se utilizan
principalmente con valores mximos, sin embargo, al comparar los datos, al usar los
logaritmos de los mismos, se redujo notoriamente la desviacin estndar y el
coeficiente de variacin, adems de cambiar la asimetra positiva de la serie, por
una asimetra negativa y de menor magnitud, por lo que deberan ajustarse mejor
los datos, siendo su resultado ms confiable que la de otras distribuciones teniendo
en cuenta que en el clculo de log Pearson se utiliza el valor.
Sin embargo, se tuvo un resultado similar en la distribucin normal, por lo que se
podra decir que los datos se ajustan a la distribucin normal (aunque esta es ms
usada para valores medios), aunque debe comprobarse por medio de pruebas de
ajustes de bondad si esta afirmacin es veraz.
A pesar de la denotacin de la distribucin de Gumbel como de valores extremos,
que en este caso toma las mximas precipitaciones anuales para conformar la serie
de datos, segn la teora sta se ajusta mejor a una serie cuando la cantidad de
datos es considerablemente grande, por lo que la limitada cantidad de datos de
precipitacin mxima anual, hace que estos resultados pierdan un poco de validez
y veracidad.
Adems de que en los clculos solo se tienen en cuenta 2 parmetros estadsticos,
y que los resultados mostrados difieren en gran medida de los resultados de los
otras distribuciones; sin embargo, dado que presentan los resultados ms grandes
de las distribuciones, pueden tenerse en cuenta para proyecciones de sucesos
extremos con una gran magnitud de precipitacin
Algo que tienen en comn los resultados de todas las distribuciones es que para
periodos de retorno grandes (100 aos), se presentan los mayores valores de
precipitacin, as como una menor probabilidad de excedencia, indicando que los
eventos con mayor magnitud son menos probables independientemente de la
distribucin que se adopte.
A continuacin se muestra una grfica que relaciona los resultados de todas las
distribuciones:
1
2
10,95
=0,025
2