Вы находитесь на странице: 1из 37

Cours : BIOMETRIE

Dpartement : GENIE RURAL

CHAP3 : ANALYSE DE VARIANCE


ENSA 2015

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 1 / 34


Plan

1 ANALYSE DE VARIANCE (ANOVA) A UN


FACTEUR

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 2 / 34


Plan

1 ANALYSE DE VARIANCE (ANOVA) A UN


FACTEUR
2 ANALYSE DE VARIANCE (ANOVA) A DEUX
FACTEURS

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 2 / 34


Plan

1 ANALYSE DE VARIANCE (ANOVA) A UN


FACTEUR
2 ANALYSE DE VARIANCE (ANOVA) A DEUX
FACTEURS
3 SERIE DEXERCICES

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 2 / 34


ANALYSE DE VARIANCE (ANOVA) A UN FACTEUR

Denition
En Statistique, lanalyse de variance ANOVA un facteur est une
methode pour tester lgalit de moyennes de trois populations ou plus
en analysant leurs variances.
lanalyse de variance ANOVA un facteur gnralise le test- t pour 2
chantillons indpendants plus de deux chantillons. Elle teste lgalit
de toutes les moyennes dune variable aux dirents niveaux du facteur.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 3 / 34


CONDITIONS POUR UTILISER LANOVA A 1 FACTEUR

1 Les populations ont des distributions approximativement Normales.


2 Les populations ont la mme Variance. ( presque gales )
3 Les echantillons sont issus de tirages aleatoirement simples de
variables quantitatives.
4 Les echantillons sont independants.
5 Les dierents echantillons sont issus de populations catgorisees par
un facteur.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 4 / 34


FORMULATION DU TEST

Les hypothses statistiques :


Lhypothse nulle : il ny a pas deet du facteur A et les k moyennes sont
gales une mme moyenne .
Lhypothse alternative : Au moins une des moyennes est dierente des
autres
H0 : 1 = 2 = ..... = k = .
H1 : i 6= j , pour au moins un i et j.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 5 / 34


LA DEMARCHE DUNE ANALYSE DE VARIANCE A 1
FACTEUR

Supposons que nous avons un facteur avec k traitements (modalits). On


pose :
k : nombre de populations compares
ni : nombre de valeurs dans le i eme chantillon ; N = ni : Nombre total
de valeurs.
xij : Les observations prleves dans les k chantillons indpendants de
taille nl , n2 , ..., nk .
ni
xi = 1
ni xij : La moyenne des valeurs dans le i eme chantillon.
j =1
x : La moyenne gnrale de toutes les observations (valeurs) combines.
Avant de dcrire la dmarche dune analyse de variance un facteur,
prsentons la situation exprimentale dans le tableau suivant.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 6 / 34


LA DEMARCHE DUNE ANOVA A 1 FACTEUR

Traitements
1 2 .. i .. k
x11 x21 xi 1 xk 1
x12 x22 xi 2 xk 2
.. .. .. ..
x1j x2j xij xkj
.. .. .. ..
x1n1 x2n2 xini xknk
Total x1. x2. xi . xk . x.. = Total general
Moyenne x1 x2 xi xk x = Moyenne Generale

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 7 / 34


LA DEMARCHE DUNE ANOVA A 1 FACTEUR

Dsignons par :
SST : La somme des carrs total (est une mesure de la dispersion totale
autour de x,de tous les echantillons combins, donne par la formule :
k ni
SST = (xij x )2
i =1 j =1

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 8 / 34


LA DEMARCHE DUNE ANOVA A 1 FACTEUR

SStr : La somme des carrs (Traitements) ou (Facteur) ou


(Intergroupes ) ou (entre chantillons) .cest une mesure de dispersion
entre les moyennes des chantillons.donne par la formule :
k
SStr = ni ( x i x )2
i =1

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 9 / 34


LA DEMARCHE DUNE ANOVA A 1 FACTEUR

SSres : La somme des carrs (erreur) ou (Intragroupes) ou


(dans les chantillons) .cest une mesure de dispersion presume
commune toutes les populations considres. donne par la formule :
k ni
SSres = (xij x i )2
i =1 j =1

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 10 / 34


LA DEMARCHE DUNE ANOVA A 1 FACTEUR

Etant donn les expressions prcdentes, la relation suivante sera toujours


vrie :
SST = SStr + SSres
Les valeurs SST, SStr et SSres sont des sommes des carrs. Une fois
divises par les nombres de degrs de libert correspondants, elle donnent
des carrs moyens (Mean Square). On a :

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 11 / 34


LA DEMARCHE DUNE ANOVA A 1 FACTEUR

MST : Le carr moyen pour la dispersion totale, calcule par :


SST
MST =
N 1
MStr : Le carr moyen pour le Traitement, calcule par :
SStr
MStr =
k 1
SSres : Le carr moyen pour les erreurs, calcule par :
SSres
MSres =
N k

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 12 / 34


ANALYSE DE VARIANCE (ANOVA) A UN FACTEUR

Pour rsumer les rsultats principaux dune ANOVA, on utilise le tableau


suivant :

Tableau ANOVA 1 Facteur


Source Somme Degrs Carr Statistique
de variation des carr (SS) de libert moyen (MS) de test F
MStr
traitements SStr k 1 MStr MSres
erreur SSres N k MSres
Total SST N 1

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 13 / 34


ANALYSE DE VARIANCE (ANOVA) A UN FACTEUR

MStr
La statistique de test : F =
MSres
La valeur critique : F(k 1,N k ) lue dans la table de la loi de Fisher.
Rgle de dcision : Si F F(k 1,N k ) =) H0 est vraie :

On conclut quil ny a pas de dierence entre les moyennes des dierents


traitements

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 14 / 34


ANALYSE DE VARIANCE (ANOVA) A UN FACTEUR
EXEMPLE

Exemple
Le tableau suivant donne les poids de peupliers (en kg) soumis dirents
types de traitements (aucun traitement, Traitement par engrais, irrigation,
Engrais et irrigation). Les poids de peupliers sont separes selon les
categories du traitement ( ou facteur). Le terme traitement est utilise car
dierents lots de terrain sont traits avec dierents engrais.
Les exprimentateurs observent si le poids moyen varie dun terrain
lautre en fonction du traitement appliqu.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 15 / 34


ANALYSE DE VARIANCE (ANOVA) A UN FACTEUR
EXEMPLE

Tableau : Poids (kg) de peupliers


Traitement
Aucun Engrais Irrigation Engrais et irrigation
0, 15 1, 34 0, 23 2, 03
0, 02 0, 14 0, 04 0, 27
0, 16 0, 02 0, 34 0, 92
0, 37 0, 08 0, 16 1, 07
0, 22 0, 08 0, 05 2, 38

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 16 / 34


SOLUTION

Tableau : Poids (kg) de peupliers


Traitement
Aucun Engrais Irrigation Engrais et irrig
0, 15 1, 34 0, 23 2, 03
0, 02 0, 14 0, 04 0, 27
0, 16 0, 02 0, 34 0, 92
0, 37 0, 08 0, 16 1, 07
0, 22 0, 08 0, 05 2, 38
n 5 5 5 5
xi 0, 184 0, 332 0, 164 1, 334 x = 0, 5035
xi x 0, 3195 0, 1715 0, 3395 0, 8305 SStr = 4, 6824

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 17 / 34


SOLUTION

Tableau : Poids (kg) de peupliers


Traitement
x1j x x2j x x3j x x4j x
0, 3535 0, 8365 0, 2735 1, 5265
0, 4835 0, 3635 0, 4635 0, 2335
0, 3435 0, 4835 0, 1635 0, 4165
0, 1335 0, 4235 0, 3435 0, 5665
0, 2835 0, 4235 0, 4535 1, 8765
0, 57492125 1, 42434125 0, 64002125 6, 40037125 SST = 9, 039

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 18 / 34


ANALYSE DE VARIANCE (ANOVA) A UN FACTEUR

Pour rsumer les rsultats principaux dune ANOVA, on utilise le tableau


suivant :

Tableau ANOVA 1 Facteur


Source Somme Degrs Carr Statistique
de variation des carr (SS) de libert moyen (MS) de test F
MStr
traitements 4, 682415 k 1=3 1, 5608 MSres = 5, 7314
erreur 4, 3572 N k = 16 0, 2723
Total 9, 039655 N 1 = 19

Conclusion : Statistique de test F F(3,16 ) Valeur critique=) rejeter H0


Il ny a pas galit des moyennes : le facteur traitement a un eet sur les
pois de peupliers.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 19 / 34


ANALYSE DE VARIANCE A 2 FACTEURS

Denition
En Statistique, lanalyse de variance ANOVA 2 ou plusieurs
facteurs generalise lANOVA 1 facteur lorsque nous avons plus dun
critre de classication.
Nous appellerons le premier facteur, le facteur F1 et le second, le facteur
F2. Une cellule correspond un certain niveau du facteur F1 et un certain
niveau du facteur F2.

Denition
On dit quil ya une interaction entre deux facteurs si leet dun facteur
change selon les dierentes categories de lautre facteur.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 20 / 34


PRINCIPES DE LANOVA A 2 FACTEURS

On se propose de tester trois hypothses direntes :

1
H0 : il ny a pas dinteraction entre les facteurs F 1 et F 2
H1 : il y a une interaction entre les facteurs F 1 et F 2

2
H0 : il ny a pas deet principal du facteur F 1
H1 : il y a un eet principal du facteur F 1

3
H0 : il ny a pas deet principal du facteur F 2
H1 : il y a un eet principal du facteur F 2

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 21 / 34


CONDITIONS POUR UTILISER LANOVA A 2
FACTEUR

1 Les populations ont des distributions approximativement Normales.


2 Les populations ont la mme Variance. ( presque gales )
3 Les echantillons sont issus de tirages aleatoirement simples de
variables quantitatives.
4 Les echantillons sont independants.
5 Les dierents echantillons sont issus de populations catgorisees par
2 facteurs.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 22 / 34


EXEMPLE

Nous nous proposons danalyser linuence du temps et de trois espces


ligneuses darbre sur la dcomposition de la masse dune litire constitue
de feuilles de Lierre.
Pour ce faire, 24 sachets dune masse identique de feuilles de lierre ont t
constitus, sachets permettant une dcomposition naturelle. Puis une
premire srie de 8 sachets, choisis au hasard, a t dpose sous un
chne, une deuxime sous un peuplier, et la dernire srie sous un frne.
Aprs 2, 7, 10 et 16 semaines respectivement, deux sachets sont prlevs
au hasard sous chaque arbre et la masse rsiduelle est dtermine pour
chacun deux. Cette masse est exprime en pourcentage de la masse
initiale.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 23 / 34


Les donnes

Les valeurs observes sont donnes dans le tableau suivant :

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 24 / 34


LE BUT

Nous nous proposons dutiliser lanalyse de la variance deux facteurs.


Nous observons trois variables :
1 deux dentre elles sont des variables contrles, larbre, qualitative
trois modalits, et la semaine qui peut tre considre comme
qualitative quatre modalits.
2 La troisime variable est une rponse quantitative. Donc lanalyse de
la variance deux facteurs (semaine et espce darbre) croiss, avec
interaction, peut convenir, entre autres mthodes danalyse de ces
donnes.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 25 / 34


Lide

Pour mettre en vidence les ventuelles dirences entre le comportement


de la variable Y dans les I modalits du premier facteur, dans les J
modalits du deuxime facteur, ou encore dans linteraction entre les deux
facteurs, nous considrons des chantillons indpendants de mme taille K
de la variable Y dans chacune des IJ populations , soit au total un
n-chantillon
avec n = IJK :

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 26 / 34


Le contexte

Dans ltude des eets simultans dun facteur I modalits et dun


facteur J modalits sur une variable quantitative Y, supposons que Y
suive des lois normales, a priori direntes dans les IJ populations disjointes
dtermines par la conjonction de deux modalits des facteurs tudis.
Supposons que, dans la population correspondant la modalit dordre i
du premier facteur et la modalit dordre j du deuxime facteur, nous
ayons :
pour tout i = 1; :::; I ; j = 1; :::; J et k = 1 :::; K .

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 27 / 34


NOTATIONS ET FORMULES

La moyenne dans la cellule ij :


K
xij. = 1
K xijk
k =1
La moyenne sur la colonne i :
J K
xi.. = 1
JK xijk
j =1 k =1

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 28 / 34


NOTATIONS ET FORMULES

La moyenne sur la ligne j :


I K
x.j. = 1
IK xijk
i =1 k =1
La moyenne generale:
I J K
x= 1
IJK xijk
i =1 j =1 k =1

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 29 / 34


CALCULS DES SOMMES DES CARREES

I
SSF1 = JK (xi.. x )2
i =1
J
SSF2 = IK (x.j . x )2
j =1

I J K
SST = (xijk x )2
i =1 j =1 k =1
I J K
SSRES = (xijk xij. )2
i =1 j =1 k =1
SSF1 F2 = SST SSF1 SSF2 SSRES

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 30 / 34


CALCULS DES CARRES MOYENS

SSF1
MSF1 =
I 1
SSF2
MSF2 =
J 1
SSF1 F2
MSF1 F2 =
(I 1) (J 1)
SSres
MSres =
IJ (K 1)

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 31 / 34


TABLEAU DANOVA A 2 FACTEURS

Tableau ANOVA 2 Facteur


Source Som ddl Carr moy Stat FTAB
variation car (SS) (MS) test
MSF1
F1 SS F1 I 1 MS F1 MSres F((I 1);IJ(K 1))
MSF2
F2 SS F2 J 1 MS F2 MSres F((J 1);IJ(K 1))
MSF1 F2
F1 F 2 SS F1 F2 (I 1)(J 1) MS F1 F2 MSres F((I 1)(J 1);IJ(K
Res SS res IJ (K 1) MS res
Total SST IJK 1

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 32 / 34


ANALYSE DE VARIANCE (ANOVA) A 2 FACTEURS

On commence par tester linteraction :


MSF1 F2
La statistique de test : F =
MSres
La valeur critique : F((I 1)(J 1);IJ(K 1)) lue dans la table de la loi de
Fisher.
Rgle de dcision :
Si F F((I 1)(J 1);IJ(K 1)) =) On rejette H0 =) Il y a interaction
entre les deux facteurs, on peut pas tudier leet dun facteur sans
prendre en considration leet de lautre facteur. on arrete le test.
Si F F((I 1)(J 1);IJ(K 1)) =) On accepte H0 =) Il y a pas
interaction entre les deux facteurs=) on test linuence du premier
facteur puis celle du deuxieme :

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 33 / 34


ANALYSE DE VARIANCE (ANOVA) A 2 FACTEURS

MS F1
- Premier facteur : Si MSres F((I 1);IJ(K 1)) =) On rejette H00 =) Il y a
un eet principal du facteur 1.
MSF2
- Deuxieme facteur : Si MSres F((J 1);IJ(K 1)) =) On rejette H0" =) Il y
a un eet principal du facteur 2.

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 34 / 34


Merci pour
votre attention

Mme.SAIDI () MODULE BIOMETRIE 04 AVRIL 2015 34 / 34

Вам также может понравиться