Академический Документы
Профессиональный Документы
Культура Документы
Conceptos bsicos
Poblacin y muestra
Poblacin es el conjunto total de datos que queremos estudiar.
A veces disponemos de medidas de toda la poblacin estudiada, pero generalmente, esto sera muy difcil (medir la
estatura de todos los espaoles) o imposible (estudiando el caudal de un ro tendramos que medir los caudales de todos
los aos pasados y futuros). En estos casos debemos conformarnos con medir una parte de la poblacin (una muestra). A
partir de la muestra, intentamos extraer estimaciones vlidas para toda la poblacin.
Muestra es una pequea parte de la poblacin que debera ser representativa del total de la
poblacin.
Si yo midiera la estatura de mis alumnos para conocer la estatura media del curso, ellos seran toda la poblacin
estudiada. Pero si, a partir de ellos, yo quiero extraer conclusiones sobre la estatura de toda la juventud espaola, mis
alumnos seran solamente una muestra representativa de la 30
poblacin estudiada. convertido el nmero de casos de cada
25
intervalo en
Distribucin de los datos
% casos
20
20
Al observar una serie de datos numricos 15 porcentaje. Su representacin
% casos
1
(caudales anuales de un ro, estatura de 10
5 grfica sera similar a la figura
personas,...) comprobamos que los valores 5 1.
intermedios son ms frecuentes, mientras que los Si en la figura 1 hacemos los
valores elevados o pequeos se presentan con 0
intervalos ms
menor frecuencia. 10
Supongamos que hemos medido la estatura de
pequeos y aumentamos el nmero de
un gran grupo de personas, y hemos distribuido los
valores
30 5
valores en grupos de 5 en 5 cm.; despus hemos medidos, el grfico continuara con esa
forma de
25 0
F. Javier Snchez San Romn--Dpto. Geologa--Univ. Salamanca (Espaa) http://hidrologia.usal.es (Junio-13) Pg. 1
Figura 1
Figura 2
F. Javier Snchez San Romn--Dpto. Geologa--Univ. Salamanca (Espaa) http://hidrologia.usal.es (Junio-13) Pg. 2
campana , pero se suavizara progresivamente hasta convertirse en una curva continua, como la
mostrada en la figura 2.
Una distribucin de datos como la figura 2 es muy frecuente en la naturaleza, se denomina
1
distribucin de Gauss o normal . Su ecuacin es conocida , lo que nos permitir calcular qu
porcentaje se encuentra por encima o por debajo de un valor determinado (por ejemplo, qu
porcentaje supera una estatura de 180 cm) .
90
80 Fig. 3
% casos acumulado
80
70
60
70
Fig. 4
60
50
50
40
40
30
30
20 20
10
10
0 0
150 160 170 180 190
abcisas. F(x)=0,9
% casos
15
% casos acumulado
80 30
70 20
60 10
50 0
F(x)=0,9 150 160 170 180 190
Fig. 5.- Funcin de densidad y funcin de distribucin
1
Gauss hizo la justificacin matemtica en 1809, aunque haba sido descrita mucho antes por Moivre en 1733
%
casos
Distribuciones simtricas y
asimtricas
Muchas variables naturales se ajustan a la
distribucin simtrica normal o de Gauss, pero no
todas. En ocasiones no hay la misma proporcin de
valores pequeos que de grandes, Ingresos
eso dar lugar a una distribucin asimtrica. Figura 6.- Distribucin asimtrica (esta curva
Por ejemplo, si representramos los ingresos de la corresponde a la ecuacin de Gumbel).
poblacin de un pais, probablemente la
campana no sera simtrica: la riqueza se distribuye con menor equidad que la estatura, y mientras que la proporcin
de altos y bajos es similar, no as la de ricos y pobres (hay pocos ricos y muchos pobres). Quiz la campana
correspondiente tendra una forma similar a la figura 6. Los matemticos han encontrado las ecuaciones de muchas
de estas campanas asimtricas (Gumbel, Pearson III, etc.). En otras ocasiones, los valores no se ajustan a la
distribucin de Gauss, pero sus logaritmos s: se denomina entonces log-normal.
En las distribuciones asimtricas el pico de la curva puede estar desviado hacia la izquierda (como la figura 6) o hacia la derecha. Se
denominan respectivamente positivas y negativas, o se dice que tienen sesgo positivo o negativo.
En Hidrologa, los valores medios (las precipitaciones o caudales anuales) suelen ajustarse a la distribucin
simtrica de Gauss, pero los valores mximos, no: si consideramos el da ms caudaloso o el ms lluvioso de cada
ao de una serie larga de aos, no se ajustarn la distribucin normal, sino probablemente a la campana asimtrica
descrita por Gumbel o alguna similar.
sn (1)
n
Por ejemplo, las dos series de datos siguientes tienen la misma media pero obviamente son muy distintas, en la
segunda los datos estn ms dispersos respecto de la media:
Cuando el nmero de datos (n) es grande las frmulas (1) y (2) proporcionan valores casi
idnticos. Estas dos frmulas se incluyen en las calculadoras cientficas como n y n-1
El cuadrado de la desviacin estndar es la varianza ( s , ) , y el cuadrado del estimador que
2 2
n n
2 2
utilizamos para las muestras se denomina quasivarianza ( s , n1 n1 ).
Normalmente se utiliza la notacin (s griega) cuando se ha calculado con los datos de la poblacin y se
escribe como s si se ha calculado con una muestra. (Anlogamente, suele usarse para la media aritmtica calculada
sobre la poblacin y x para la calculada sobre una muestra).
Coeficiente de Variacin
Si dos series tienen la misma media, su desviacin estndar nos indica en cual de las dos los valores est ms
dispersos a ambos lados de la media. Pero si las medias son distintas, la comparacin de las desviaciones estndar no
sirve. Supongamos que deseamos saber cul de las dos series siguientes est ms dispersa a ambos lados de su media:
Puntuaciones estandarizadas
En los clculos de los siguientes apartados, en lugar de trabajar con puntuaciones brutas,
debemos utilizar puntuaciones estandarizadas o tipificadas. La puntuacin estandarizada nos indica
cuntas desviaciones estndar se encuentra un valor individual por encima o por debajo de la media.
3
Ejemplo: Hemos calculado la media y la desviacin estndar de los caudales de un ro: caudal medio= 97 m /seg;
3 3
desviacin estndar 13,4 m /seg. En un ao hmedo el caudal fue de 112 m /seg. Convertir ese valor en puntuacin
estndar.
3 3
Solucin: El valor 112 m /s supera a la media en: 112-97=15 m /s. Calculamos cuntas desviaciones estndar est
por encima de la media:
112 97
El caudal del ro super a su media en : =1,12 desviaciones estndar .
13, 4
Por tanto, si hablamos de un caudal 0 (valor estandarizado) no significa que el ro est seco, sino
que su caudal es igual a la media. La expresin general es:
Esto significa que ese dato individual est 1,26 desviaciones estndar por encima de la media.
2) Calculamos la probabilidad de que z>1,26. Como aplicar la ecuacin de Gauss no es simple,
sto puede hacerse de dos maneras:
Con la Hoja de Clculo, escribiendo en EXCEL la siguiente frmula:
=1-DISTR.NORM.ESTAND(1,26)
Aplicando la Tabla que se presenta al final (Esta Tabla se construye aplicando la frmula de
Gauss a todos los posibles valores de z).
Para nuestro caso (z =1,26) por cualquiera
Fig. 8
de los dos procedimientos obtenemos el valor:
0,10383. Por tanto, el 10,38% de los aos
3
tendrn un caudal igual o superior a 40 m /seg.
El caudal citado se superar en promedio cada
10 aos.
En la figura 8 vemos que por encima del
valor estndar +1,26 se encuentra el 10,38% de
la superficie total bajo la curva.
1) Calculamos a qu valor de z
corresponde la probabilidad 0,90 (o sea: 90%):
Aplicando la Tabla, buscamos dentro de
ella la probabilidad requerida (0,90), pero ese
valor no existe en la tabla, as que buscamos el
complementario: 1-0,90 =0,10 ; o el ms
prximo a ese valor, y desde el interior de la
tabla, leemos el valor de z correspondiente en
los bordes de la Tabla: 1,28 . Pero z = 1,28
corresponde a una probabilidad de 0,10; para
la probabilidad 0,90 tomamos z = 1,28
Con la Hoja de Clculo, escribiendo en EXCEL la frmula: =DISTR.NORM.ESTAND.INV(0,10) se
obtiene directamente el valor 1,28
Periodo de retorno 1
Probabilidad
Como : [Probabilidad de que NO se supere] = 1 [Probabilidad de que se supere], tambin se cumple:
1 ; 1
Probabilidad de que se supere Probabilidad de que NO se supere 1
Periodo de Periodo de retorno
retorno
Para el clculo de probabilidades de valores extremos se utilizan diversas distribuciones, entre las que destacan,
como ms utilizadas, la log-normal (los logaritmos de los valores son los que se ajustan a la ley de Gauss) o la ley
Pearson III, adoptada por las agencias federales en USA. Ver, por ejemplo en Viessman, 2003, captulo 3.
4
En Espaa los organismos oficiales para precipitaciones mximas aplican la distribucin SQRT-max
Riesgo de fallo
Se denomina riesgo de fallo a la probabilidad de que se produzca un suceso con un periodo de
retorno T en alguno de los prximos n aos.
Supongamos que hemos calculado un cierto caudal que corresponde al retorno de 50 aos. La
probabilidad de que se produzca el ao prximo ser de 0,02 (=1/50); y la probabilidad de que se
produzca el siguiente ao ser de 0,02 y as cada ao. Queremos conocer la probabilidad de que se
alcance ese caudal en los prximos n aos:
Probabilidad de que un suceso de retorno T se produza el prximo ao ...........................1/T
5
NO se produzca el prximo ao ................. 1-(1/T)
6
NO se produzca los prximos dos aos ....[1-(1/T)]. [1-(1/T)]
n
NO se produzca los prximos n aos .........[1-(1/T)]
5 n
SI se produzca los prximos n aos ........1-[1-(1/T)]
Vamos a denominar a la ltima expresin obtenida arriba es el riesgo de fallo (R), es decir: la
probabilidad de que s se produzca alguna vez un suceso de periodo de retorno T a lo largo de un
periodo de n aos:
4
Imposible el clculo manual, ver una aproximacin con Excel en http://hidrologia.usal.es (Secin Complementos)
5
Las probabilidades de dos sucesos complementarios (debe suceder uno u otro) suman 1. Por ejemplo: probabilidad
de obtener un 3 en un dado= 1/6. Probabilidad de obtener un valor distinto de 3= 1-1/6 = 5/6
6
La probabilidad de que se produzcan dos sucesos independientes es el producto de sus probabilidades; por ejemplo:
probabilidad de obtener un 3 en un dado= 1/6. Probabilidad de obtener dos 3 seguidos = 1/6.1/6 =1/36
1 n
R 1 1
T
Ejemplo: Se va a construir un canal cuya vida til es de 75 aos. Si el caudal supera el valor
correspondiente al periodo de retorno de 100 aos, se desbordar. Calcular la probabilidad de que se
produzca un desbordamiento en alguno de los prximos 75 aos
75
1
R 1 1 0,529 52,9%
100
Por tanto, existe un 52,9% de probabilidad de que el caudal de retorno 100 aos se alcance en
alguno de los prximos 75 aos.
Se produce la siguiente paradoja: si consideramos un caudal con retorno de 100 aos, parece
seguro que se presente en alguno de los prximos 100 aos. Pero si aplicamos la frmula anterior,
haciendo T= 100 y n=100, y obtenemos 0,633 , es decir solamente un 63,3 %
Ejemplo: Se est diseando una obra cuya vida til se calcula en 50 aos y se admite que en ese
periodo el riesgo sea de un 10% (probabilidad de que en esos 50 aos se produzca un caudal superior
a un valor determinado). Calcular dicho caudal.
En la frmula anterior basta con hacer: R = 0,10; n = 50 aos; y despejar T. Con estos datos
obtenemos un periodo de retorno T = 475 aos.
En este ejemplo, el paso siguiente sera estudiar estadsticamente las series histricas de caudales
de ese cauce para evaluar el caudal correspondiente a un retorno de 475 aos.
Ley de Gauss: Probabilidad de que z sea mayor o igual a ...
(Las columnas indican la segunda decimal. Ejemplo: Probabilidad de que z sea > 1,41 es 0,07927)
Para valores de z negativos, tomar 1-tabla. Ejemplo: Probabilidad de que z sea > 1,41 es 1 0,07927 = 0,92073
Para probabilidades > 0,50, el valor de z ser el indicado por la tabla para la probabilidad complementaria, pero con signo
Ejemplo : Valor de z con probabilidad de ser superado de 0,80. Para la probabilidad complementaria (0,20) la tabla
indica z=0,84. Por tanto para probabilidad 0,80 adoptaremos 0,84
0 1 2 3 4 5 6 7 8 9
0,0 0,50000 0,49601 0,49202 0,48803 0,48405 0,48006 0,47608 0,47210 0,46812 0,46414
0,1 0,46017 0,45620 0,45224 0,44828 0,44433 0,44038 0,43644 0,43251 0,42858 0,42465
0,2 0,42074 0,41683 0,41294 0,40905 0,40517 0,40129 0,39743 0,39358 0,38974 0,38591
0,3 0,38209 0,37828 0,37448 0,37070 0,36693 0,36317 0,35942 0,35569 0,35197 0,34827
0,4 0,34458 0,34090 0,33724 0,33360 0,32997 0,32636 0,32276 0,31918 0,31561 0,31207
0,5 0,30854 0,30503 0,30153 0,29806 0,29460 0,29116 0,28774 0,28434 0,28096 0,27760
0,6 0,27425 0,27093 0,26763 0,26435 0,26109 0,25785 0,25463 0,25143 0,24825 0,24510
0,7 0,24196 0,23885 0,23576 0,23270 0,22965 0,22663 0,22363 0,22065 0,21770 0,21476
0,8 0,21186 0,20897 0,20611 0,20327 0,20045 0,19766 0,19489 0,19215 0,18943 0,18673
0,9 0,18406 0,18141 0,17879 0,17619 0,17361 0,17106 0,16853 0,16602 0,16354 0,16109
1,0 0,15866 0,15625 0,15386 0,15151 0,14917 0,14686 0,14457 0,14231 0,14007 0,13786
1,1 0,13567 0,13350 0,13136 0,12924 0,12714 0,12507 0,12302 0,12100 0,11900 0,11702
1,2 0,11507 0,11314 0,11123 0,10935 0,10749 0,10565 0,10383 0,10204 0,10027 0,09853
1,3 0,09680 0,09510 0,09342 0,09176 0,09012 0,08851 0,08692 0,08534 0,08379 0,08226
1,4 0,08076 0,07927 0,07780 0,07636 0,07493 0,07353 0,07215 0,07078 0,06944 0,06811
1,5 0,06681 0,06552 0,06426 0,06301 0,06178 0,06057 0,05938 0,05821 0,05705 0,05592
1,6 0,05480 0,05370 0,05262 0,05155 0,05050 0,04947 0,04846 0,04746 0,04648 0,04551
1,7 0,04457 0,04363 0,04272 0,04182 0,04093 0,04006 0,03920 0,03836 0,03754 0,03673
1,8 0,03593 0,03515 0,03438 0,03362 0,03288 0,03216 0,03144 0,03074 0,03005 0,02938
1,9 0,02872 0,02807 0,02743 0,02680 0,02619 0,02559 0,02500 0,02442 0,02385 0,02330
2,0 0,02275 0,02222 0,02169 0,02118 0,02068 0,02018 0,01970 0,01923 0,01876 0,01831
2,1 0,01786 0,01743 0,01700 0,01659 0,01618 0,01578 0,01539 0,01500 0,01463 0,01426
2,2 0,01390 0,01355 0,01321 0,01287 0,01255 0,01222 0,01191 0,01160 0,01130 0,01101
2,3 0,01072 0,01044 0,01017 0,00990 0,00964 0,00939 0,00914 0,00889 0,00866 0,00842
2,4 0,00820 0,00798 0,00776 0,00755 0,00734 0,00714 0,00695 0,00676 0,00657 0,00639
2,5 0,00621 0,00604 0,00587 0,00570 0,00554 0,00539 0,00523 0,00508 0,00494 0,00480
2,6 0,00466 0,00453 0,00440 0,00427 0,00415 0,00402 0,00391 0,00379 0,00368 0,00357
2,7 0,00347 0,00336 0,00326 0,00317 0,00307 0,00298 0,00289 0,00280 0,00272 0,00264
2,8 0,00256 0,00248 0,00240 0,00233 0,00226 0,00219 0,00212 0,00205 0,00199 0,00193
2,9 0,00187 0,00181 0,00175 0,00169 0,00164 0,00159 0,00154 0,00149 0,00144 0,00139
3,0 0,00135 0,00131 0,00126 0,00122 0,00118 0,00114 0,00111 0,00107 0,00104 0,00100