Вы находитесь на странице: 1из 7

Introduction

Même si les méthodes d'analyse conceptuelle sont basées sur des principes théoriques, le
développement de presque toutes les méthodes relatives aux études hydrologiques utilisent des formes
d'analyse de données. Dans certains cas, une analyse théorique est utilisée pour identifier les variables
d'entrée et les équations de prédiction mais les méthodes d'analyse ne sont rendues opérationnelles
qu'après l'analyse des données hydrologiques recueillies. Compte tenu de l'importance de l'analyse des
données en hydrologie il est important de se familiariser avec les méthodes d'analyse des données les
plus utilisées. La connaissance d'analyse de données est nécessaire pour apprécier les limitations et les
exactitudes des méthodes de calculs hydrologiques existantes et pour en développer de nouvelles
méthodes requérant des procédés de calibration pour mesurer les données hydrologiques.

V.I. Terminologie statistique

L'analyse des données statistiques concerne l'ensemble des méthodes qui permettent aux investigateurs
de généraliser au sujet des populations en utilisant les informations venant d'échantillons aléatoires.
Les méthodes statistiques permettent de collecter, organiser, résumer et analyser ces informations
quantitatives.

V.I.1. Probabilité

La probabilité est utilisée pour décrire la possibilité d'un événement là où un événement est défini
comme l'occurrence d'une valeur spécifique d'une variable aléatoire. L'intervalle où est mesurée cette
probabilité est comprise entre 0 et 1 inclusivement.
Le plus souvent, la probabilité est exprimée en pourcentage. Quand on mentionne qu'il y a 30% de
risque de pluie, l'expérience démontre que sous des conditions météorologiques similaires il a plu 3 fois
sur 10. Dans cet exemple, la probabilité a été trouvée en utilisant le concept de fréquence relative,
, (4.1)

dans lequel n est le nombre d'observations sur la variable aléatoire x qui donne x 0, et N est le nombre
total d'observations sur x.
Comme exemple, considérons le cas de la modélisation d'une digue autour du site où les piles d'un
pont sont en construction. La hauteur à laquelle la digue est construite dépend en partie du niveau
d'inondation pouvant être atteint durant la construction. Par exemple, assumons que la construction des
piles durera un an. Assumons également que sur le site les informations sur les plus grandes crues des
dix dernières années soient disponibles. Assumons également que l'analyse des coûts et bénéfices
suggère que la hauteur du barrage soit de telle sorte qu'il y ait uniquement 10% de chance que le niveau
de l'inondation excède celui du barrage durant la période de construction. En utilisant l'équation 5.1,
nous savons que la probabilité, p(x=x0) = 0.1 et que N=10;
Alors, dans notre échantillon de 10, nous voudrions que la hauteur du barrage soit choisie de telle sorte
que 1 des 10 crues identifiées dépasserait la hauteur du barrage. Ainsi, nous serions amenés à choisir la
hauteur du barrage entre la plus grande crue et la deuxième plus grande crue de l'échantillon des dix
crues disponibles.
Hydrologues et ingénieurs doivent prendre leurs décisions sous le coup de l'incertitude. Par exemple,
les ingénieurs qui doivent évaluer la qualité de l'eau pour en estimer le degré de pollution utilisent des
échantillons. Ces échantillons sont analysés dans les laboratoires et les résultats sont utilisés pour
prendre des décisions. Beaucoup de programmes d'échantillonnage de l'eau ne prennent que dix et
parfois moins de mesures et dans ce cas, le niveau d'incertitude augmente.
1
V.I.2 Variables aléatoires

Deux types de variables doivent être considérés. Premièrement les variables discrètes sont celles qui
peuvent être considérées comme distinctes, généralement des nombres entiers. Par exemple, le résultat
en jetant un dé ne peut être qu'un nombre entier entre 1 et 6 et ainsi il s'agit d'une variable discrète. Si
l'on définit une variable aléatoire d'être si oui ou non les berges d'une rivière seront inondées en une
année quelconque, alors la variable est discrète parce qu'on ne peut avoir qu'une variable discrète
comme résultat à savoir les berges seront inondées ou ne le seront pas durant l'année.
Deuxièmement, les variables continues. Par exemple la moyenne de tous les scores durant un test dont
le score maximal est de 100 peut prendre plusieurs valeurs pas forcément des nombres entiers inclus
entre 0 et 100, ainsi la moyenne d'une classe est un exemple de variable continue.

V.I.3 Probabilité des variables aléatoires discrètes.

La probabilité des variables aléatoires discrètes s'exprime de la sorte:

) (4.2)

La probabilité a deux importantes conditions d'intervalle. Premièrement la probabilité d'un événement


xk doit être moins ou égal à 1 et deuxièmement il doit être supérieur ou égal à zéro:

(4.3)

Cette propriété doit être valide pour toutes les valeurs de k. Additionnellement, la somme de toutes les
probabilités doit être égale à 1:

(4.4)

N est le nombre total de résultats. Par exemple pour les dés la valeur de N est de 6.

(4.5)

Le nombre de crues d’une certaine magnitude pendant la durée de service d’une structure hydraulique
est un bon exemple de variable discrète.

V.I.4 Probabilité pour les variables aléatoires continues

Une fonction de densité de probabilité permet est utilisée pour représenter l’occurrence d’une variable
aléatoire continue.
(4.6)

f(x) étant une fonction de densité. Si l’intervalle est infiniment petit et que et
approche 0, cela illustre la propriété différenciant les variables discrètes des variables
continues spécialement le fait que la probabilité continue prenne une valeur qui l’égale à zéro.
Les variables discrètes peuvent prendre différentes valeurs leur probabilité sera non nulle.
Il faut également noter :
2
(4.7)

Il s’ensuit :
(4.8)

La fonction de distribution cumulative d’une variable continue est définie de la manière suivante :

(4.9)

C’est une fonction telle que:


(4.10)

Avec:
La fonction est égale à 0 à et 1 à

V.II Moments d’un échantillon ou d’une fonction de distribution

Pour résumer les données ou trouver une population, il faut caractériser l’échantillon. D’où
l’importance des moments qui sont :
1) La moyenne : moment de premier ordre.
2) La variance : moment du deuxième ordre.
3) L’écart-type : moment du troisième ordre.

V.II.1. La moyenne

La moyenne est le moment de premier ordre.


Pour une variable continue nous avons :

(4.11)

Pour une variable discrète la moyenne est donnée par la relation suivante :

(4.12)

Si toutes les observations ont un poids égal alors f(xi) est égal à donc, la moyenne vaut :

(4.13)

V.II.2. La variance

La variance est le second moment.


La variance d’une population est dénotée et celle d’un échantillon S2. Leur unité est le carré de

3
l’unité de la moyenne. Si la moyenne est exprimée et m, la variance sera exprimée en m2.
Pour une variable continue, la variance est :

(4.14)

Si toutes les n observations ont le même poids,

(4.15)

V.II.2. L’écart-type

L’écart-type est la racine carrée de la variance. Il a la même unité que la variable aléatoire de même
que la moyenne. Il est utilisé pour décrire la dispersion d’un échantillon ou d’une fonction de
distribution. L’écart type d’une population est dénoté et celui d’un échantillon S.

V.II.4. Le coefficient de dissymétrie

Le moment d’ordre trois de la variable centrée réduite est le coefficient de dissymétrie.


On le dénotera g quand on fera référence à l’échantillon et γ pour la population.

(4.16)

Pour une variable discrète, ce coefficient peut-être calculé de la manière suivante :


(4.17)

Ce coefficient a pour unité le cube de l’unité de la variable aléatoire.


Une estimation standardisée de la dissymétrie est :

(4.18)

Ce coefficient mesure l’asymétrie. Pour une distribution symétrique sa valeur sera nulle. Si la queue
droite (ayant les plus grandes valeurs) est plus longue, l’asymétrie de la distribution sera positive. Si la
queue de gauche est la plus longue, l’asymétrie de la distribution sera négative.

V.II. Fonctions de distributions

Toute variable aléatoire discrète ou continue a une fonction de probabilité sous-jacente. Il existe
différente fonctions de probabilité pouvant être utilisées pour représenter la variable aléatoire. Nous
parlerons des trois plus utilisées dans le domaine de l’hydrologie : la loi binomiale, la loi de Gauss et la
loi de Fisher.

4
V.III.1. La loi binomiale

La loi binomiale est utilisée pour définir la probabilité de variables discrètes. Il peut-être utilisé
quand ces quatre conditions suivantes sont réunies :

1) L’échantillon contient n occurrences ou expériences des variables aléatoires


2) Les n expériences sont indépendants
3) Seulement deux résultats sont possibles pour chaque expérience
4) La probabilité de chaque résultat est constante d’expérience en expérience.
Soit : n le nombre d’expériences et k le nombre d’occurrence.

(4.19)

V.III.2. La loi binomiale exemple d’application, analyse de risque

La crue qui est égale ou dépassée en moyenne chaque T années a une probabilité d’arriver quelque soit
l’année:
(4.20)
Par exemple, une crue de 100 ans (T=100) a une probabilité p=0.01 d’arriver dans quelque soit l’année
considérée.
Le risque qu’il y ait i crues de probabilité p dans n année est :

n! (4.21)
R(i, n, p)  p i (1  p) ni
i!(n  i)!

Par exemple, le risque de 2 (i=2), crues de 100 ans (p=0.01) en 20 (n=20) ans est :

20!
R(2, 20, 0.01)  (0.01) 2 (1  0.01)18  0.016
2!(20  2)!
Ainsi, le risque qu’il n’y ait pas d’inondation en n année:

R(0, n, p)  (1  p) n (4.22)

Le risque de 1 ou plus de crues (R1+) en n années est le même que 1 moins le risque qu’il n’y ait pas de
crue:

R1  1  R(0, n, p)  1  (1  p) n (4.23)

Le risque de 2 ou plus de crues (R2+) en n années est le risque au dessus moins le risque d’une crue en n
5
années:
R2  R1  R(1, n, p)
R2  1  (1  p) n  np(1  p) n 1 (4.24)

Le risque de 2 ou plus pour des crues de 100-ans en 20 ans sera:

R2  1  (0.99) 20  (20)(0.01)(0.99)19


R2  0.01686 ou approximativement 2%

V.III.2. La loi de Gauss

Une variable aléatoire X suit une loi normale si sa densité de probabilité a pour équation :
pour (4.25)

Il s’agit de la plus fréquente densité de probabilité utilisée. Elle a une distribution symétrique, son
graphe est la "courbe en cloche", et dépend de deux paramètres μ et σ qui sont la moyenne et l'écart-
type de X.
La distribution est symétrique par rapport à μ qui caractérise donc la tendance centrale. Quant à σ, il
caractérise la dispersion de la distribution. Plus il est grand, plus la distribution est étalée de part et
d'autre de μ.
Le plus souvent, nous avons :
(4.26)

Dans la pratique, les moments des échantillons : peuvent être utilisés en lieu et place de μ et de
σ. Nous aurons ainsi :
(4.27)

La variable transformée a pour moyenne 0 et 1 pour écart-type.

La probabilité que z soit comprises entre 0.5 et 2.25 pourrait être déterminée en utilisant :

(4.28)

Cette probabilité peut être calculée en utilisant les tableaux disponibles :


(4.29)

6
L’exemple précédent devient :

V.III.3. La loi de Fisher

La loi de Fisher est utilisée fréquemment en analyse statistique pour les hypothèses et le calcul des
intervalles de confidence. C’est une fonction ayant deux paramètres υ1 et υ2. Sa limite à gauche est
zéro et n’a pas de limite à droite (son intervalle variant de 0 à ).
Les axes ne peuvent pas être transposés, ainsi F(υ1,υ2) F(υ2,υ1)
Les tables sont disponibles pour différentes probabilités mais 5% et 1% sont les plus fréquents.

Вам также может понравиться