Вы находитесь на странице: 1из 54

1

Chapitre 1
LE TEST DU KHI-DEUX

I. Prsentation de la statistique khi - carr ( )

Une somme de carr de variables indpendantes normalement distribues de moyenne 0 et
de variance 1 suit une loi normale dite du khi-deux ou du khi-carr note .

2
2
1
2
0

= e Y Y

avec Y
0
constante telle que laire sous la courbe soit gale 1
nombre de degrs de libert




















Figure 1 : distributions pour = 1, 2, 4 et 8


II. Les tables du khi-deux

Ces lois ont t tabules pour variant de 1 100. La table correspondant au nombre de
degrs de libert fournit le fractile dordre p not

p



III. Le test du khi deux

III. 1. Mode de calcul

( ) ( )
( )
( )

+ +

i
i i
p
p p
e
e o
e
e o
e
e o
e
e o
2
2
2
2
2 2
1
2
1 1
.....

avec o
i
= effectifs observs et e
i
= effectifs thoriques
2

N e o
i i
= =

effectif total

On montre que
( ) ( )
( )
( )
N
e
o
e
e o
e
e o
e
e o
e
e o
i
i
i
i i
p
p p
=

+ +


2 2
2
2
2
2 2
1
2
1 1
.....

III. 2. Exemple de calcul de khi deux dajustement

Pour tester si un d nest pas truqu, on le jette 150 fois et on note les rsultats obtenus :
1 2 3 4 5 6
17 26 38 22 25 22

En posant comme hypothse nulle le d nest pas truqu , on sattend ce que les effectifs
observs ne diffrent pas des effectifs thoriques, qui sont 25, 25, 25, , 25 (150 divis par 6)

( ) ( ) ( ) ( ) ( ) ( )
08 . 10
25
25 22
25
25 25
25
25 22
25
25 38
25
25 26
25
25 17
2 2 2 2 2 2
2
=

= observ

ou 08 . 10 150
25
22
25
25
25
22
25
38
25
26
25
17
2
= + + + + + = observ

On fixe le seuil de significativit 10% par exemple
Le nombre de degrs de libert est gal 6-1=5
On lit dans la table :

2
0.90
= 5 : 9.24
Si le
2
observ > 9.24, on rejette
Si le
2
observ < 9.24, on ne peut pas rejeter H
0
(et on ne conclut pas) ;
Dans notre cas, 10.08 > 9.24, on rejette H
0
(et on conclut que le d est truqu) avec 10 chances
sur 100 de se tromper.
Si on travaille 5%, on lit
2
0.95
= 5 : 11.1 et dans ce cas 10.08 < 9.24, on ne peut rejeter H
0

(et on ne conclut pas).

III. 3. Exemple de calcul de khi deux de croisement

On travaille partir du tableau de contingence qui sert calculer les effectifs thoriques :

A B
totaux marginaux
totaux de ligne
X e
11
e
12
L
1

Y e
21
e
22
L
2

totaux marginaux
totaux de colonne
C
1
C
2
N

e
11
= (L
1
C
1
)/N

e
21
= (L
2
C
1
)/N


3
Exemple avec nombreuses modalits de variables

Soit la rpartition de 200 familles selon le nombre denfants (X) et le nombre de pices du lieu
dhabitation (Y). Testez 5% lindpendance de ces deux variables nominales.

X

Y

0

1

2

3

4 et +

n.
j


2

5
4.2

7
6.6

8
10.4

9
10

11
8.8

40

3

8
4.2

7
6.6

9
10.4

8
10

8
8.8

40

4

2
4.2

9
6.6

13
10.4

10
10

6
8.8

40

5

3
4.2

6
6.6

12
10.4

12
10

7
8.8

40

6 et +

3
4.2

4
6.6

10
10.4

11
10

12
8.8

40

n
i
.


21

33

52

50

44
n..
200

On inscrit en rouge les effectifs thoriques dans chacune des cases du tableau.

Ho : il y a indpendance entre ces deux variables (= il ny a pas de lien entre le nombre
denfants et le nombre de pices de lhabitation)
= 5%
= (5-1)(5-1) = 16

0.95
= 26.3

Si
observ
> 26.3 on rejette Ho
Si
observ
< 26.3 on ne peut pas rejeter Ho

13 . 13 200
8 . 8
144 49 36 64 121
10
121 144 100 64 81
4 . 10
100 144 169 81 64
6 . 6
16 36 81 49 49
2 . 4
9 9 4 64 25
2
=
+ + + +
+
+ + + +
+
+ + + +
+
+ + + +
+
+ + + +
= observ

13.13 < 26.3 donc on ne peut pas conclure lindpendance entre les variables





4
Mode de calcul pour le cas particulier de 2 variables 2 modalits

Dans ce cas particulier, on na pas besoin de calculer les effectifs thoriques.

X1 X2
totaux marginaux
totaux de ligne
Y1 a b n.
1

Y2 c d n.
2

totaux marginaux
totaux de colonne
n
1
. n
2
. n..


( )
. . . .
..
. . . .
..

2 1 2 1
2
2 1 2 1
2
n n n n
cb ad n
n n n n
cd
ab
n


=

=


IV. Conditions dapplication du khi-deux

Les frquences thoriques

Lindpendance des observations

Linclusion des non-occurrences

Khi-deux : test unilatral ou bilatral ?


V. Les mesures dassociation

Exemples sur lesquels on va travailler (issus de Howell)

1) relation entre tabagisme et sexe

non-fumeurs

fumeurs

hommes 350 150 500
femmes 400 100 500
750 250 1000


( )
33 . 13
250 750 500 500
150 400 100 350 1000
2
2
=


=





5
2) relation entre responsabilit des courses alimentaires et sexe

oui non

hommes 4 15 19
femmes 15 4 19
19 19 38

( )
74 . 12
19 19 19 19
15 15 4 4 38
2
2
=


=

Le coefficient de contingence

N
C
+
=
2
2




exemples : 11 .
1000 33 . 13
33 . 13
1
=
+
= C 50 . 0
38 74 . 12
74 . 12
2
=
+
= C


Le coefficient Phi ()

Dans le cas des tables 22, le coefficient phi est une bonne mesure de corrlation entre deux
variables dichotomiques.
N
2

=

exemples : 12 .
1000
33 . 13
1
= = 58 .
38
74 . 12
2
= =


Le coefficient Phi (ou V) de Cramr (
c
)

( ) 1
2

=
k N
c

avec N taille de lchantillon et k plus petite valeur entre L (nbre de
lignes) et C (nbre de colonnes)


La mesure daccord : le kappa de Cohen (K)

Cette statistique ne se base pas sur le khi-deux mais sur le tableau de contingence et sur le
calcul des effectifs attendus.






6
Exemple (Howell) :


JUGE 1
JUGE 2 Pas de problmes Intriorisation Extriorisation
Pas de problmes 15 2 3 20
Intriorisation 1 3 2 6
Extriorisation 0 1 3 4
16 6 8 30

On voit les accords : les entres en diagonales (15, 3 et 3)
Les dsaccords se sont toutes les autres cases.


JUGE 1
JUGE 2 Pas de problmes Intriorisation Extriorisation
Pas de problmes 15 (10.67) 2 3 20
Intriorisation 1 3 (1.2) 2 6
Extriorisation 0 1 3 (1.07) 4
16 6 8 30


La formule du kappa est :

=
i
i i
e N
e o
avec o
i
les effectifs observs en diagonale
et e
i
les effectifs thoriques (attendus) en diagonale


( ) ( )
( )
25 . 47
07 . 1 2 . 1 67 . 10 30
07 . 1 2 . 1 67 . 10 3 3 15
=
+ +
+ + + +
=

















7

















































8
Chapitre 2
COEFFICIENTS DE CORRELATION POUR VARIABLES ORDINALES


I. Le coefficient rho de Spearman ()

Exemple : 15 copies dexamen classes selon 2 critres (X : cohrence argumentative et Y :
nombre de connecteurs logiques utiliss)


r
X
6 8 9 7 1 13 14 15 2 3 4 5 10 11 12
r
Y
8 9 7 6 2 15 14 12 1 4 3 5 11 10 13

Formule de rho :
( ) ) 1
6
1
2
2
1

=

N N
d


Exemple : Calcul de rho :

r
X
6 8 9 7 1 13 14 15 2 3 4 5 10 11 12
r
Y
8 9 7 6 2 15 14 12 1 4 3 5 11 10 13
r
X
-r
Y
-2 -1 2 1 -1 -2 0 3 1 -1 1 0 -1 1 1
d
i
4 1 4 1 1 4 0 9 1 1 1 0 1 1 -1

d
i
= 30

( )
95 . 0
1 15 15
30 6
1 =

=


Remarques :

Si les classements sont identiques : = 1

Exemple de classements identiques :

r
X
3 5 2 6 1 4
r
Y
3 5 2 6 1 4
r
X
-r
Y
0 0 0 0 0 0
d
i
0 0 0 0 0 0

( )
1
1 6 6
0 6
1 =

=





9
Si les classements sont inverss : = -1

r
X
3 5 2 6 1 4
r
Y
4 2 5 1 6 3
r
X
-r
Y
-1 3 -3 5 -5 1
d
i
1 9 9 25 25 1

( )
1 2 1
1 6 6
70 6
1 = =

=

cas des ex-aequo

Exemple : donnes brutes sur 7 individus selon deux critres X et Y
1) on range X, on garde les couples
2) on attribue des rangs aux donnes de X
3) on attribue des rangs aux donnes de Y
4) on calcule d
5) on calcule d

X
i
2.1 3.5 1 2.1 5 3.5 2.1
Y
i
97 105 99 105 155 95 92
X
i
rangs 1 2.1 2.1 2.1 3.5 3.5 5
Y
i
99 97 105 92 105 95 155
r
X
1 3 3 3 5.5 5.5 7
r
Y
4 3 5.5 1 5.5 2 7
r
X
-r
Y
-3 0 -2.5 2 0 3.5 0
d
i
9 0 6.25 4 0 12.25 0


d
i
= 31.5

( )
44 .
1 7 7
5 . 31 6
1 =

=


II. Le coefficient tau de Kendall ()

Exemple : 5 individus statistiques classs selon 2 critres X et Y

r
X
3 5 1 2 4
r
Y
2 3 4 1 5


1
re
mthode

1) on range par ordre croissant selon le premier critre
2) on conserve les couples de donnes
3) on dtermine les z
ij

10
z
ij
= 1 si r
yj
> r
yi
z
ij
= -1 si r
yj
r
yi


exemple :

r
X
3 5 1 2 4
r
Y
3 4 2 1 5

r
X rangs
1 2 3 4 5

r
Y rangs
2 1 3 5 4
z
2.
-1 1 1 1 2
z
1.
1 1 1 3
z
3.
1 1 2
z
5.
-1 -1

z
ij
6

) 1 (
2

=

n n
z
ij
avec n nombre de sujets

6 . 0
) 1 5 ( 5
6 2
=

=


2
me
mthode

1) on range par ordre croissant selon le premier critre
2) on conserve les couples de donnes
3) on calcule pour chaque donne range combien on a de donnes strictement
suprieures cette donne (on compte 1 point pour chaque donne de rang suprieur)
et combien on a de donnes de rang gal ou infrieur (on compte -1 chaque fois) ; on
fait la diffrence entre ces deux nombres et on linscrit en dessous de la donne.
4) On fait la somme de ces diffrences : S

Exemple :

r
X
3 5 1 2 4
r
Y
3 4 2 1 5

r
X rangs
1 2 3 4 5

r
Y rangs
2 1 3 5 4
2 3 2 -1 / S 6

) 1 (
2

=
n n
S
6 . 0
) 1 5 ( 5
6 2
=

=
11
Le cas des ex quo

Y X
T n n T n n
S

=
) 1 ( ) 1 (
2


avec

= ) 1 (
2
1
t t T
X
et

= ) 1 (
2
1
t t T
Y


t = nombre dex quo dans chaque groupe

Exemple :

X
i
2.1 3.5 1 2.1 5 3.5 2.1
Y
i
97 105 99 105 155 95 92

X
i
rangs 1 2.1 2.1 2.1 3.5 3.5 5
Y
i
99 97 105 92 105 95 155

r
X
1 3 3 3 5.5 5.5 7
r
Y
4 3 5.5 1 5.5 2 7
0 1 -2 3 0 1 / 3



Tx = [ 3 (3-1) + 2 (2-1) ] = 4
T
Y
= [ (2 (2-1) ] = 1

Y X
T n n T n n
S

=
) 1 ( ) 1 (
2


15 . 0
1 ) 1 7 ( 7 4 ) 1 7 ( 7
3 2
=


=

Remarque : il y a plusieurs calculs de possibles, selon la position des r
X
ex aequo et les r
Y

correspondant.

III. Le coefficient de concordance de Kendall (W)

Exemple : 6 examinateurs classent 5 candidats
E1 E2 E3 E4 E5 E6 r
i
C1 1 2 2 1 3 2 11
C2 4 1 3 3 2 5 18
C3 5 5 4 5 5 4 28
C4 3 4 5 2 4 3 21
C5 2 3 1 4 1 1 12

90
12

) 1 (
12
2 2

=
n n k
VarR n
W avec k nombre de juges et n nombre dindividus

Exemple :

E1 E2 E3 E4 E5 E6 r
i
r
i

C1 1 2 2 1 3 2 11 121
C2 4 1 3 3 2 5 18 324
C3 5 5 4 5 5 4 28 784
C4 3 4 5 2 4 3 21 441
C5 2 3 1 4 1 1 12 144

90 1814
Moy R = 90/5 varR = 1814/5 (90/5)

54 . 0
) 1 5 ( 5 6
5
90
5
1814
5 12
2 2
2
=

(
(

|
.
|

\
|

= W


Remarque

1
1

=
k
kW


Le cas des ex quo

=
T k
n n k
nVarR
W
12
) 1 (
(rappel :
) 1 (
12
2 2

=
n n k
VarR n
W )

avec

= ) (
12
1
3
t t T t nombre dex quo dans chaque groupe dex aequo


Exemple :

Soit 10 individus classs selon 3 critres. Les rangs sont les suivants :

r
X
1 4.5 2 4.5 3 7.5 6 9 7.5 10
r
Y
2.5 1 2.5 4.5 4.5 8 9 6.5 10 6.5
r
Z
2 1 4.5 4.5 4.5 4.5 8 8 8 10

r
i
5.5 6.5 9 13.5 12 20 23 23.5 25.5 26.5 165
r
i
30.25 42.25 81 182.25 144 400 529 552.25 650.25 702.15 3313.5

13
Tx = 1/12 [ (2
3
-2) + (2
3
-2) ] = 1

T
Y
= 1/12 [ (2
3
-2) + (2
3
-2) + (2
3
-2) ] = 1.5

T
Z
= 1/12 [ (4
3
4) + (3
3
3) ] = 7

=
T k
n n k
nVarR
W
12
) 1 (


83 . 0
) 7 5 . 1 1 ( 3
12
) 1 10 ( 10 3
10
165
10
5 . 3313
10
2
2
=
+ +

(
(

|
.
|

\
|

= W


IV. Significativit des coefficients

1. Coefficient rho de Spearman

Si 4 N 30
























Table des valeurs critiques du de Spearman


14

Si N 10

La valeur
2
1
2

=
N
t est distribue selon la loi de Student = N-2 degrs de libert







































Table de la loi de Student




15
2. Coefficient de corrlation par rang de Kendall (tau, )

L () = N (0,
) 1 ( 9
) 5 2 ( 2

+
N N
N
)





































Table de la loi normale







z 0 1 2 3 4 5 6 7 8 9
0,0 ,0000 ,0040 ,0080 ,0120 ,0160 ,0199 ,0239 ,0279 ,0319 ,0359
0,1 ,0398 ,0438 ,0478 ,0517 ,0557 ,0596 ,0636 ,0675 ,0714 ,0754
0,2 ,0793 ,0832 ,0871 ,0910 ,0948 ,0987 ,1026 ,1064 ,1103 ,1141
0,3 ,1179 ,1217 ,1255 ,1293 ,1331 ,1368 ,1406 ,1443 ,1480 ,1517
0,4 ,1554 ,1591 ,1628 ,1664 ,1700 ,1736 ,1772 ,1808 ,1844 ,1879
0,5 ,1915 ,1950 ,1985 ,2019 ,2054 ,2088 ,2123 ,2157 ,2190 ,2224
0,6 ,2258 ,2291 ,2324 ,2357 ,2389 ,2422 ,2454 ,2486 ,2518 ,2549
0,7 ,2580 ,2612 ,2642 ,2673 ,2704 ,2734 ,2764 ,2794 ,2823 ,2852
0,8 ,2881 ,2910 ,2939 ,2967 ,2996 ,3023 ,3051 ,3078 ,3106 ,3133
0,9 ,3159 ,3186 ,3212 ,3238 ,3264 ,3289 ,3315 ,3340 ,3365 ,3389
1,0 ,3413 ,3438 ,3461 ,3485 ,3508 ,3531 ,3554 ,3577 ,3599 ,3621
1,1 ,3643 ,3665 ,3686 ,3708 ,3729 ,3749 ,3770 ,3790 ,3810 ,3830
1,2 ,3849 ,3869 ,3888 ,3907 ,3925 ,3944 ,3962 ,3980 ,3997 ,4015
1,3 ,4032 ,4049 ,4066 ,4082 ,4099 ,4115 ,4131 ,4147 ,4162 ,4177
1,4 ,4192 ,4207 ,4222 ,4236 ,4251 ,4265 ,4279 ,4292 ,4306 ,4319
1,5 ,4332 ,4345 ,4357 .4370 ,4382 ,4394 ,4406 ,4418 ,4429 ,4441
1,6 ,4452 ,4463 ,4474 ,4484 ,4495 ,4505 ,4515 ,4525 ,4535 ,4545
1,7 ,4554 ,4564 ,4573 ,4582 ,4591 ,4599 ,4608 ,4616 ,4625 ,4633
1,8 ,4641 ,4649 ,4656 ,4664 ,4671 ,4678 ,4686 ,4693 ,4699 ,4706
1,9 ,4713 ,4719 ,4726 ,4732 ,4738 ,4744 ,4750 ,4756 ,4761 ,4767
2,0 ,4772 ,4778 ,4783 .4788 ,4793 ,4798 ,4803 ,4808 ,4812 ,4817
2,1 ,4821 ,4826 ,4830 ,4834 ,4838 ,4842 ,4846 ,4850 ,4854 ,4857
2,2 ,4861 ,4864 ,4868 ,4871 ,4875 ,4878 ,4881 ,4884 ,4887 ,4890
2,3 ,4893 ,4896 ,4898 ,4901 ,4904 ,4906 ,4909 ,4911 ,4913 ,4916
2,4 ,4918 ,4920 ,4922 ,4925 ,4927 ,4929 ,4931 ,4932 ,4934 ,4936
2,5 ,4938 ,4940 ,4941 ,4943 ,4945 ,4946 ,4948 ,4949 ,4951 ,4952
2,6 ,4953 ,4955 ,4956 ,4957 ,4959 ,4960 ,4961 ,4962 ,4963 ,4964
2,7 ,4965 ,4966 ,4967 ,4968 ,4969 ,4970 ,4971 ,4972 ,4973 ,4974
2,8 ,4974 ,4975 ,4976 ,4977 ,4977 ,4978 ,4979 ,4979 ,4980 ,4981
2,9 ,4981 ,4982 ,4982 ,4983 ,4984 ,4984 ,4985 ,4985 ,4986 ,4986
3,0 ,4987 ,4987 ,4987 ,4988 ,4988 ,4989 ,4989 ,4989 ,4990 ,4990
3,1 ,4990 ,4991 ,4991 ,4991 ,4992 ,4992 ,4992 ,4992 ,4993 ,4993
3,2 ,4993 ,4993 ,4994 ,4994 ,4994 ,4994 ,4994 ,4995 ,4995 ,4995
3,3 ,4995 ,4995 ,4995 ,4996 ,4996 ,4996 ,4996 ,4996 ,4996 ,4997
3,4 ,4997 ,4997 ,4997 ,4997 ,4997 ,4997 ,4997 ,4997 ,4997 ,4998
3,5 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998
3,6 ,4998 ,4998 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999
3,7 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999
3,8 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999
3,9 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000
16
3. Coefficient de concordance de Kendall (W)

N 7

On confronte nVar avec la valeur donne dans une table pour k (nombre de juges) et n
(nombre de sujets).

Si la valeur calcule > valeur lue on rejette Ho



N
Valeurs supplmentaires
pour N=3
k
3 4 5 6 7 k s
Valeurs .05
3 64.4 103.9 157.3 9 54.0
4 49.5 88.4 143.3 217.0 12 71.9
5 62.6 112.3 182.4 276.2 14 83.8
6 75.7 136.1 221.4 335.2 16 95.8
8 48.1 101.7 183.7 299.0 453.1 18 107.7
10 60.0 127.8 231.2 376.7 571.0
15 89.8 192.9 349.8 570.5 864.9
20 119.7 258.0 468.5 764.4 1158.7
Valeurs .01
3 75.6 122.8 185.6 9 75.9
4 61.4 109.3 176.2 265.0 12 103.5
5 80.5 142.8 229.4 343.8 14 121.9
6 99.5 176.1 282.4 422.6 16 140.2
8 66.8 137.4 242.7 388.3 579.9 18 158.6
10 85.1 175.3 309.1 494.0 737.0
15 131.0 269.8 475.2 758.2 1129.5
20 177.0 364.2 641.2 1022.2 1521.9

Table des valeurs critiques de s (nVar) dans le coefficient de concordance de Kendall



N > 7

L (k (n 1) W) =
= n-1









17
Chapitre 3
TESTS NON PARAMETRIQUES
CAS DUN ECHANTILLON




I. Le test binomial

On utilise le test binomial lorsque la variable nominale prsente 2 modalits et que leffectif
de lchantillon est petit.

Exemple :

La consigne dun exprimentateur propose au sujet de choisir entre deux options A et B
(question ferme) ; 16 sujets rpondent

A : 12
B : 4


Il pose donc comme hypothse nulle quil ny a pas de diffrence entre le nombre de
rponses A et B (comme si on avait obtenu 8 et 8).
Une table a t tablie pour rejeter ou ne pas rejeter cette hypothse nulle en fonction des
rsultats observs si N < 25

Voici la procdure :
N = nombre total de cas observs 16
x = plus petit effectif (des deux) observs 4

on fixe le seuil : 0.05

On regarde dans la table la probabilit dapparition de cette valeur 4 ; elle est de .038
.038 < .05 donc on rejette lhypothse nulle au risque de 5%


Si on navait que 10 sujets :
N = 10
A = 8
B = 2 x = 2 proba lue = .055 > .05 donc non significatif 5%









18


x

N

0

1

2

3

4

5


6

7

8

9

10

11

12

13

14

15
5 .031 .188 .500 .812 .969
6 .016 .109 .344 .656 .891 .984
7 .008 .062 .227 .500 .773 .938 .992
8 .004 .035 .145 .363 .637 .855 .965 .996
9 .002 .020 .090 .254 .500 .746 .910 .980 .998
10 .001 .011 .055 .172 .377 .623 .828 .945 .989 .999
11 .006 .033 .113 .274 .500 .726 .887 .967 .994
12 .003 .019 .073 .194 .387 .613 .806 .927 .981 .997
13 .002 .011 .046 .133 .291 .500 .709 .867 .954 .989 .998
14 .001 .006 .029 .090 .212 .395 .605 .788 .910 .971 .994 .999
15 .004 .018 .059 .151 .304 .500 .696 .849 .941 .982 .996
16 .002 .011 .038 .105 .227 .402 .598 .773 .895 .962 .989 .998
17 .001 .006 .025 .072 .166 .315 .500 .685 .834 .928 .975 .994 .999
18 .001 .004 .015 .048 .119 .240 .407 .593 .760 .881 .952 .985 .996 .999
19 .002 .010 .032 .084 .180 .324 .500 .676 .820 .916 .968 .990 .998
20 .001 .006 .021 .058 .132 .252 .412 .588 .748 .868 .942 .979 .994
21 .001 .004 .013 .039 .095 .192 .332 .500 .668 .808 .905 .961 .987
22 .002 .008 .026 .067 .143 .262 .416 .584 .738 .857 .933 .974
23 .001 .005 .017 .047 .105 .202 .339 .500 .661 .798 .895 .953
24 .001 .003 .011 .032 .076 .154 .271 .419 .581 .729 .846 .924
25 .002 .007 .022 .054 .115 .212 .345 .500 .655 .788 .885


Table of probabilities associated with values as small as observed values of x in the BINOMIAL TEST
Given in the body of this table are one-tailed probabilities under Ho for the binomial test when P = Q =


II. Le test de Kolmogorov-Smirnov

Ce test est un test dajustement entre la distribution dune variable observe sur un
chantillon et une distribution thorique. Il permet de dire si un chantillon peut
raisonnablement tre constitu comme provenant dune population prsentant la
distribution thorique.
Il concerne les variables ordinales.
Il porte sur la distribution cumule des effectifs et permet de dterminer la probabilit de
lcart entre lobserv et le thorique.

Exemple : observation dorigine sociologique ; les noirs amricains semblent
prfrer un teint clair (une couleur de peau)
10 personnes de couleur sont photographies et chaque photo est tire
en 5 versions diffrentes en intensit de noir ; ces versions peuvent tre
ranges de 1 5 (de la plus noire la moins noire).
Chaque sujet choisit sa propre photo parmi les 5 versions

Si lhypothse (les personnes de couleurs amricaines prfrent une couleur de peau plus
claire) est fausse alors on ne devrait pas observer de diffrence entre les choix. Ces choix
devraient se distribuer de faon gale avec la mme probabilit dapparition.

Ho : les effectifs des modalits des photos choisies sont gaux
Seuil = 5%
N = 10


19
rang de la modalit choisie
1 2 3 4 5
o
i 0 1 0 5 4
o
i
0 1 1 6 10
S
N
(x) 0 1/10 1/10 6/10 10/10
e
i
2 2 2 2 2
e
i
2 4 6 8 10
F
O
(x) 2/10 4/10 6/10 8/10 10/10
|F
O
(x) - S
N
(x)| 2/10 3/10 5/10 2/10 0

S
N
(x) = frquences observes cumules croissantes
F
O
(x) = frquences thoriques cumules croissantes

On calcule D = sup |F
O
(x) - S
N
(x)|

D = 5/10 = 0.5

La table donne les valeurs de ce D en fonction du nombre de sujets et du seuil de
significativit ; les valeurs lues peuvent tre considres comme des valeurs ne pas
dpasser si lon veut Ho ; si la valeur calcule est suprieure la valeur lue, on rejette Ho.

Dans notre exemple, on lit une valeur dans la table de 0.410
0.5 > 0.410 donc on rejette Ho 5% (et dailleurs aussi 1%)



20
































Au-del de 35
N
22 . 1

N
36 . 1

N
63 . 1



Table pour le test de Kolmogorov-Smirnov

















N .10 .05 .01

1 .950 .975 .995
2 .776 .842 .929
3 .642 .708 .828
4 .564 .624 .733
5 .510 .565 .669

6 .470 .521 .618
7 .438 .486 .577
8 .411 .457 .543
9 .388 .432 .514
10 .368 .410 .490

11 .352 .391 .468
12 .338 .375 .450
13 .325 .361 .433
14 .314 .349 .418
15 .304 .338 .404

16 .295 .328 .392
17 .286 .318 .381
18 .278 .309 .371
19 .272 .301 .363
20 .264 .294 .356

25 .24 .27 .32
30 .22 .24 .29
35 .21 .23 .27

21
III. Le test des squences


Exemple : Soient les squences suivantes de pile ou face lors de 20 lancers successifs dune
mme pice de monnaie par un mme joueur :

P F P P P F F P P F F F P F F P P F F P 10 P 10 F
P P P P P P P P P P F F F F F F F F F F 10 P 10 F
P F P F P F P F P F P F P F P F P F P F 10 P 10 F

Un test permet de savoir si lordre dapparition des piles et les faces est alatoire ou non.

Il repose sur le calcul du nombre de squence (r) de symboles identiques.
Exemple : 1) r = 11
2) r = 2
3) r = 20


Exemple : un financier sintresse la variation du CAC 40 ; il note les rsultats suivants

+0.12 ; -0.43 ; -0.52 ; +1.21 ; +1.32 ; -0.02 ; -0.03 ; +0.83 ; +0.54 ; +1.25 ; -0.23 ; -1.28 ;
-1.49 ; -2.32 ; -3.31 ; -1.01 ; +0.05 ; +0.95 ; +0.87 ; -0.01

Il sintresse une ventuelle structure de lensemble de ces variations oppose une
variation alatoire.

+ - - + + - - + + + - - - - - - + + + -
1 2 3 4 5 6 7 8

On notera n
1
le nombre de + et n
2
le nombre de . On relve r = 8




















22
Toute valeur r infrieure ou gale celle trouve dans la table (a) ou suprieure celle trouve dans la
table (b) cause le rejet de Ho au seuil de 0.05














































VALEURS CRITIQUES DE r DANS UN TEST DE SEQUENCES




(a) n
2

n
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
2 2 2 2 2 2 2 2 2 2
3 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3
4 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4
5 2 2 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5
6 2 2 3 3 3 3 4 4 4 4 5 5 5 5 5 5 6 6
7 2 2 3 3 3 4 4 5 5 5 5 5 6 6 6 6 6 6
8 2 3 3 3 4 4 5 5 5 6 6 6 6 6 7 7 7 7
9 2 3 3 4 4 5 5 5 6 6 6 7 7 7 7 8 8 8
10 2 3 3 4 5 5 5 6 6 7 7 7 7 8 8 8 8 9
11 2 3 4 4 5 5 6 6 7 7 7 8 8 8 9 9 9 9
12 2 2 3 4 4 5 6 6 7 7 7 8 8 8 9 9 9 10 10
13 2 2 3 4 5 5 6 6 7 7 8 8 9 9 9 10 10 10 10
14 2 2 3 4 5 5 6 7 7 8 8 9 9 9 10 10 10 11 11
15 2 3 3 4 5 6 6 7 7 8 8 9 9 10 10 11 11 11 12
16 2 3 4 4 5 6 6 7 8 8 9 9 10 10 11 11 11 12 12
17 2 3 4 4 5 6 7 7 8 9 9 10 10 11 11 11 12 12 13
18 2 3 4 5 5 6 7 8 8 9 9 10 10 11 11 12 12 13 13
19 2 3 4 5 6 6 7 8 8 9 10 10 11 11 12 12 13 13 13
20 2 3 4 5 6 6 7 8 9 9 10 10 11 12 12 13 13 13 14
(b) n
2

n
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
2 6 6 6 6 6 6 6 6 6
3 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8
4 9 9 10 10 10 10 10 10 10 10 10 10 10 10 10 10
5 9 10 10 11 11 12 12 12 12 12 12 12 12 12 12 12 12
6 8 9 10 11 12 12 13 13 13 13 14 14 14 14 14 14 14 14
7 8 10 11 12 13 13 14 14 14 14 15 15 15 16 16 16 16 16
8 8 10 11 12 13 14 14 15 15 16 16 16 16 17 17 17 17 17
9 8 10 12 13 14 14 15 16 16 16 17 17 18 18 18 18 18 18
10 8 10 12 13 14 15 16 16 17 17 18 18 18 19 19 19 20 20
11 8 10 12 13 14 15 16 17 17 18 19 19 19 20 20 20 21 21
12 6 8 10 12 13 14 16 16 17 18 19 19 20 20 21 21 21 22 22
13 6 8 10 12 14 15 16 17 18 19 19 20 20 21 21 22 22 23 23
14 6 8 10 12 14 15 16 17 18 19 20 20 21 22 22 23 23 23 24
15 6 8 10 12 14 15 16 18 18 19 20 21 22 22 23 23 24 24 25
16 6 8 10 12 14 16 17 18 19 20 21 21 22 23 23 24 25 25 25
17 6 8 10 12 14 16 17 18 19 20 21 22 23 23 24 25 25 26 26
18 6 8 10 12 14 16 17 18 19 20 21 22 23 24 25 25 26 26 27
19 6 8 10 12 14 16 17 18 20 21 22 23 23 24 25 26 26 27 27
20 6 8 10 12 14 16 17 18 20 21 22 23 24 25 25 26 27 27 28
23
Cas des petits chantillons : n
1
et n
2
20

Pour ces chantillons, une table donne les valeurs permettant de rejeter Ho 5%

Si r r
a
(valeur de r donne dans la table a) ou
Si r r
b
(valeur de r donne dans la table b)

alors on rejette Ho 5%

Exemples :

1) la pice de monnaie : n
1
et n
2
= 10
cas 1 : r = 11 Ho 5%
cas 2 : r = 2 rejet de Ho
cas 3 : r = 20 rejet de Ho
2) le CAC 40 : n
1
= 9 n
1
et n
2
= 11 r = 8
table a : 8 > 6 et 8 < 16 donc pas de rejet de Ho 5%



Cas des grands chantillons

Si n
1
ou n
2
> 20 , on ne peut plus utiliser la table.

On sait quune bonne approximation de la distribution de r est une loi normale :

( )
(
(

+ +

+
+
=
) 1 ( ) (
) 2 ( 2
; 1
2
2 1
2
2 1
2 1 2 1 2 1
2 1
2 1
n n n n
n n n n n n
n n
n n
N r L

Exemple : 50 personnes, 30 hommes et 20 femmes forment une file dattente
Ho : il ny a pas de structure, lordre MF est alatoire dans cette file
H1 : lordre nest pas alatoire dans cette file

M F M F M M M F F M F M F M F M M M M F M F M F M M F F F M F M F M F
M M F M M F M M M M F M F M M
n
1
= 30 et n
2
= 20 r = 35
Le centrage rduction de r donne :
Ecart type = 3.36
Moyenne = 25

98 . 2
36 . 3
25 35
=

= z

seuil = 5%

2.98 > 1.96 donc rejet de Ho (lordre nest pas alatoire)


24
Chapitre 4
TESTS NON PARAMETRIQUES
CAS DE DEUX ECHANTILLONS APPARIES



I. Test de Mac Nmar

On utilise ce test lorsquun ensemble de sujets est mesur de faon ordinale ou nominale
deux moments spars par un certain traitement (au sens large) : une formation, un lecture
de texte, une visite dun tablissement, une vision dun document, un apprentissage, etc.
Ce test analyse le changement du sujet sur un certain point entre lavant et laprs.


Aprs

t
1
t
0

0 1
1 A B
avant

0 C D

Le nombre dindividus qui changent est A+D
Sous lhypothse nulle, leffectif thorique est (A+D)/2 dans les deux cases qui nous
intressent.

) (
2 2
2 2
2
D A
D A
D
D A
A
+
|
.
|

\
| +
+
|
.
|

\
| +
=

D A
D A
D A
D A D A
+

=
+
+ +
=
2 2 2 2
2
) ( ) ( 2 2


En fait, on applique une correction (par continuit) qui consiste calculer :

D A
D A
+

=
2
2
) 1 (
et on le confronte la table du khi deux


Attention : si 5
2
<
+ D A
on utilise prfrentiellement le test binomial
avec N = A+D
x la plus petite valeur entre A et D






25
Exemples :

1
er
cas : 30 sujets
3 sujets ont donn la bonne rponse au pr test et au post test
21 sujets se sont tromps lors du pr test
12 sujets ont donn la bonne rponse au post test

Aprs

t
1
t
0

0 1
1 3
avant 0 21
12


Aprs

t
1
t
0

0 1
1 6 3 9
avant 0 12 9 21
18 12 30

A = 6
D = 9
A+D = 15 (15/2 > 5 donc on utilise le test de Mac Nmar)

Ho : la probabilit de passer de 0 1 est gale celle de passer de 1 0 (autrement dit 6
pas diffrent de 9 ; ou encore pas deffet dapprentissage)
H
1
: probabilit de passer dchec russite (de 0 1) est suprieure celle de passer
de russite chec (autrement dit, 9 > 6, effet de lapprentissage)
= 1
seuil = 5%

( )
26 . 0
9 6
1 9 6
2
2
=
+

=

0.26 < 3.84, on ne peut pas rejeter Ho

2
me
cas : 15 sujets

Aprs

t
1
t
0

0 1
1 2 2
avant 0 4 7
15
A = 2
D = 7
26
A + D = 9 9/2 < 5 test binomial


N = 9
x = 2

probabilit lue dans la table: .09 > .05 donc on ne peut pas rejeter Ho (pas deffet de
lapprentissage)


II. Test de signe

On utilise le test de signe lorsque lon veut comparer des valeurs ordinales pour un couple
de donnes.
Il est utile lorsquil ny a pas de quantification possible mais il faut videmment pouvoir
ordonner les valeurs.
Cest le cas lorsque lon veut savoir si un groupe prfre tel ou tel objet (sur une chelle
ordinale), vnement, traitement ou autre.

Petit chantillon : N 25

Exemple :
On demande 15 enfants dune classe de juger les deux enseignants qui enseignent mi-
temps. Ils utilisent une chelle gradue de 1 10 pour chacun des deux enseignants.

On attribue le signe + lorsque la valeur de la 1
re
colonne est suprieure celle de la seconde ;
0 ou = lorsque les deux valeurs sont quivalentes.

Melle X Melle Y
9 7 +
8 5 +
5 7 -
2 6 -
9 3 +
7 6 +
5 5 =
9 9 =
2 8 -
7 6 +
8 4 +
9 7 +
3 6 -
4 4 =
5 3 +

Ho La frquence dapparition de + est gale la frquence dapparition de - = 1/2

27
Remarque : les couples o il ny a pas de diffrence entre les deux valeurs compares ne sont
pas dcompts (on ne les prend pas en compte) car leur jugement ne sont ni lavantage de
lune, ni de lautre.

Remarque : si on prdit une valuation meilleure pour lune ou lautre, on effectuera un test
unilatral ; si on prdit une diffrence entre les deux, ce sera un test bilatral.
Dans cet exemple, on prdit une valuation meilleure en faveur de Melle X ; donc test
unilatral.

H
1
La frquence dapparition de + est suprieure celle de -
(= Melle X est plus apprcie par les lves que Melle Y)

On est dans les conditions dapplication du test binomial (nombre de modalits = 2 ; p = q =
1/2 ; N 25) :

o Attention, on utilise pour N, le nombre total de couples moins le nombre de
couples nayant pas produit de diffrence ; cela signifie quil faut avoir valuer
les carts (en +, = ou -) avant de savoir si on peut utiliser le test binomial ou
non)
N = 15 3 = 12

o x est le plus petit des 2 effectifs (ici cest le nombre de - )
x = 4

o lecture : p = .194 donc on ne peut pas conclure (on ne peut pas rejeter Ho) car
.194 > .05

Grand chantillon : N > 25

On procde dans un 1
er
temps de la mme manire, cest--dire on attribue les signes +, = ou
-.
Puis on comptabilise le nombre de + que lon appelle R.
On sait que L (Z) = N (0, 1) avec

N
N
R
Z
2
1
2
) 5 . 0 (
= avec R + 0.5 si R N/2
R 0.5 si R > N/2
Exemple :
La classe compte 35 lves et que lon a obtenu les rsultats suivants :
21+ 7= 7-

N = 35 7 = 28
R = 21

R > N/2 (14) donc on utilise la formule avec R 0.5

28
46 . 2
28
2
1
2
28
) 5 . 0 21 (
=

= Z

Le test est unilatral droit ; dans la table de la loi normale, z = 2.46 correspond .4931 donc
un de 0.007.
On rejette donc Ho au profit de lhypothse alternative au seuil de .007, Melle X est plus
apprcie par ses lves que Melle Y.


III. Test de Wilcoxon

Dans lexemple prcdent, on sest intress la seule diffrence de jugement des deux
enseignants pour chaque lve. On pourrait, de plus, vouloir connatre limportance de
lcart entre les couples dvaluation.
Pour ce faire, on utilise le test de Wilcoxon : on aura alors accs la significativit de la
diffrence ventuelle autant au niveau des signes que de la grandeur de lcart.
Le test de Wilcoxon est plus puissant que le test de signe, car par exemple il donnera plus
dimportance lavis de llve qui a attribu 9 et 3, qu lavis de celui qui a attribu 7 et 6.

Petit chantillon N 25

Mme exemple :
Ho les deux enseignantes sont galement apprcies
H
1
Melle X est plus apprcie que Melle Y

Melle X Melle Y Rang en
valeur
absolue
Rang
positif
Rang
ngatif
9 7 +2 4.5 +4.5
8 5 +3 7.5 +7.5
5 7 -2 4.5 -4.5
2 6 -4 9.5 -9.5
9 3 +6 11.5 +11.5
7 6 +1 1.5 +1.5
5 5 0 /
9 9 0 /
2 8 -6 11.5 -11.5
7 6 +1 1.5 +1.5
8 4 +4 9.5 +9.5
9 7 +2 4.5 +4.5
3 6 -3 7.5 -7.5
4 4 0 /
5 3 +2 4.5 +4.5
= + 45 = - 33

29
1) on calcule la diffrence entre les deux valeurs pour chaque couple (en considrant
toujours la 1
re
colonne 9 7 ; 8 5 ; etc)

2) on range ces diffrences en valeur absolue :
on a deux fois 1 ; on attribue donc deux fois le rang 1.5
on a ensuite +2, -2, +2, +2 : on attribue chacune de ces valeurs le rang 4.5
on a +3, -3 : rang 7.5
on a -4, +4 : rang 9.5
on a +6, -6 : rang 11.5

3) dans les deux colonnes suivantes, on redistribue les rangs en leur attribuant leur signe

4) On somme les rangs positifs et les rangs ngatifs

Ho se traduit par rangs positifs = rangs ngatifs

T = plus petite des deux valeurs en valeur absolue
T = 33

N = nombre de rangs pris en compte (nombre total de paires moins nombre de paires
nayant pas produit de diffrence)
N = 12



























30
unil.
bil.

N
.025
.05
.01
.02
.005
.01


6 0
7 2 0
8 4 2 0
9 6 3 2
10 8 5 3

11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16

16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38

21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68

Table de Wilcoxon pour sries apparies

Si T calcul est infrieur ou gal au T lu, on rejette Ho
Si T calcul suprieur au T lu, on ne peut pas conclure

Dans notre exemple, pour N = 12, on a T calcul (33) > tout T lu ; donc on ne peut pas
conclure (on garde Ho)

Grand chantillon N > 25

On procde avec le mme calcul mais on ne peut pas utiliser la table ; on sait que T suit une
loi normale :

)
24
) 1 2 )( 1 (
;
4
) 1 (
( ) (
+ +
+
=
N N N
N N
N T L

Exemple :
N = 27
rangs positifs = 276
rangs ngatifs = -102
31

T = inf (276 ; |-102|) = 102

189
4
) 1 27 ( 27
=
+
=
T


62 . 41
24
1 27 2 ( ) 1 27 ( 27
=
+ +
=
T


donc T suit la loi normale L (T) = (189 ; 41.62)

On calcule le rapport critique :

09 . 2
62 . 41
189 102
=

= RC

-2.09 < -1.645 donc rejet de Ho 5%
-2.09 < -1.96 donc rejet de Ho 1%































32
Chapitre 5
TESTS NON PARAMETRIQUES
CAS DE DEUX ECHANTILLONS INDEPENDANTS


I. Test de Fischer


On utilise le test de Fischer
lorsque deux chantillons indpendants diffrent quant une variable discrte
(nominale ou ordinale) qui ne prend que deux valeurs
lorsque la somme des tailles des deux chantillons est infrieure ou gale 30.

Le test de Fischer apparat comme se substituant au test du khi-deux dans le cas dune
hypothse dindpendance dune table 2 2 avec (2-1)(2-1)=1 degr de libert.
Mais dans ce test (contrairement au binomial) on prend en compte les 4 cases du tableau et
les effectifs peuvent tre trs petits.

Exemple :
Dans une enqute, on veut savoir si les femmes et les hommes sont daccord sur certains
items ; chaque item est prsent sous la forme dune question ferme de type daccord ou
pas daccord .
Item : les femmes au foyer doivent tre rmunres pour leur travail mnager

14 femmes entre 20 et 30 ans 10 daccord 4 pas daccord
12 hommes entre 20 et 30 ans 4 daccord 8 pas daccord

X1 X2
Y1 (fem) 10 4
Y2 (hom) 4 8


Ho il ny a pas de diffrence de proportion de sujets daccord ou pas daccord dans
lun ou lautre groupe
H
1
Il y a une diffrence

Une table donne les significations des diffrences

Utilisation de la table

Notation :

X1 X2
Y1 (fem) A (10) B (4) A+B (14)
Y2 (hom) C (4) D (8) C+D (12)
A+C (14) B+D (12) A+B+C+D (26)
1) calculer A+B et C+D
2) reprer la valeur de A+B dans la table, puis reprer la valeur C+D
33
3) parmi les valeurs donnes de B, reprer celle du tableau. Sur la mme ligne, on lit les
valeurs de D dpasser si on ne veut pas rejeter Ho
Cest--dire, si la valeur de D est plus petite ou gale la valeur lue dans le
tableau, un seuil donn, on peut rejeter Ho au seuil donn.
4) Si on ne trouve pas la valeur de B, on prend celle de A ; dans ce cas, le tableau donne
la valeur de C quil faut comparer celle des nos rsultats.

Le niveau de significativit est donn pour un test unilatral ; sil sagit dun test bilatral,
il faut doubler les seuils.

Si on peut lire B, on aura les valeurs limites pour D
Si on peut lire A, on aura les valeurs limites pour C


Dans notre exemple :
A+B = 14
C+D = 12
B = 4 on ne le trouve pas dans la table
A = 10 C devrait tre (pour pouvoir rejeter Ho) infrieur ou gal 3 (pour
unilatral 5% ou bilatral 10%)
Or, C = 4, donc on ne peut pas rejeter Ho ; pas de conclusion

Contrainte :
Il faut que A+B 15 et C+D 15, sinon on ne peut pas lire la table. Si ce nest pas le cas, on
inverse le tableau de contingence.

Exemple :

X1 X2
Y1 9 7 16
Y2 3 4 7
12 11 23

A+B = 16 donc on ne pourra pas lire la table

On inverse le tableau

Y1 Y2
X1 9 3 12
X2 7 4 11
16 7
A+B = 12 C+D = 11
On ne trouve pas B ; on lit A = 9 ; on compare 9 C (=7) ; C devrait tre 3 pour rejeter Ho,
donc pas de conclusion





34
II. Le test de Mann Whitney

Lorsque deux chantillons indpendants sont mesurs de faon ordinale, on utilise un test de
Mann Whitney (le test U) pour tester le fait quils proviennent ou non dune mme
population.
Lhypothse nulle est quil ny a pas de diffrence entre les deux populations dont sont issus
ces deux chantillons quant la variable ordinale observe.

La mise en uvre du test diffre selon que :
n1 et n2 8 (cas A)
9 n1 et n2 20 (cas B)
n2 > 20 (cas C)

avec n1 et n2 taille des deux chantillons, n1 < n2

n1 et n2 8

Un psycholinguiste, travaillant sur la comprhension des consignes lors dexercices de
mathmatiques en classe de seconde, manipule la forme syntaxique de ces textes. Aprs il
note la comprhension de llve avec un score entre 0 et 50

Texte classique A 45 28 32 25 44 24 30

Texte travaill selon
hypothse linguistique
B 38 43 46 41 39 48


Ho : il ny a pas de diffrence de comprhension selon le texte
H
1
: il y a une meilleure comprhension dans le groupe B
On applique un test unilatral ; si bilatral, on aurait pos comme H
1
il y a une diffrence
de comprhension selon le type de texte.
= 5%


o On range les deux chantillons confondus par ordre croissant en identifiant
chacune des donnes (chantillons A ou B)

24 25 28 30 32 38 39 41 43 44 45 46 48
A A A A A B B B B A A B B



o Pour chaque note de A, on compte le nombre de notes de B infrieures ou
gales elle. On fait le total. Cest U

24 25 28 30 32 38 39 41 43 44 45 46 48
A A A A A B B B B A A B B
0 0 0 0 0 / / / / 4 4 / / 8

35

o On lit une des tables appropries

Ici n1 = 6 et n2 = 7 (n1 toujours infrieur n2)
U = 8

Dans les tables, on lit directement la probabilit de U calcul quand n2 8 ; si la probabilit
lue est infrieure au seuil dcid, on rejette Ho.

Dans la table, on lit une probabilit de .037
.037 < .05, donc on rejette Ho au seuil de 5%

Si test bilatral, on double la probabilit lue ( = .074), si = .1, rejet.

Remarque :
Si on avait compt pour chaque note de B le nombre de notes de A infrieures ou gales, on
aurait obtenu :

24 25 28 30 32 38 39 41 43 44 45 46 48
A A A A A B B B B A A B B
/ / / / / 5 5 5 5 / / 7 7 34

Cette valeur est note U ; elle napparat pas dans la table
Si vous avez commenc par calculer la valeur qui napparat pas dans la table, il est inutile de
recommencer en comptant le nombre de lautre groupe.
On sait que :
U + U = n1 n2
8 + 34 = 6 7

Donc si dans les tables, la valeur calcule est suprieure la plus grande valeur de U donne
dans la table, cest que vous avez calcul U et il faut prendre pour U :

U = n
1
n
2
U


9 n1, n2 20

Mme exemple mais plus de sujets

Texte classique A 45 28 32 25 44 24 30 15 16 22 49
Texte travaill B 38 43 46 41 39 48 47 19 21

n1 = 9 n2 = 11


o On attribue un rang chacune des valeurs, les deux chantillons tant
confondus ; on fait la somme des rangs (R) des valeurs de lchantillon A ainsi
que celle des valeurs de lchantillon B
Pour des raisons pratiques, on calcule ainsi :
36
A B
valeur rang valeur rang
45 16 38 11
28 8 43 14
32 10 46 17
25 7 41 13
44 15 39 12
24 6 48 19
30 9 47 18
15 1 19 3
16 2 21 4
22 5
49 20
n2=11 R
2
=99

n1=9 R
1
=111


o On calcule U1 et U2 :

1
1 1
2 1 1
2
) 1 (
R
n n
n n U
+
+ =

2
2 2
2 1 2
2
) 1 (
R
n n
n n U
+
+ =

33 111
2
10 9
11 9
1
=

+ = U 66 99
2
12 11
11 9
1
=

+ = U

U = inf (U1 ; U2)
U = 33


o On lit les tables

Les tables donnent les valeurs maximales que doit prendre U pour pouvoir rejeter Ho.

Dans notre exemple, on utilise un test unilatral :

1
re
table = .05 U lu = 27 33 > 27 pas de rejet
2
me
table = .025 U lu = 23
3
me
table = .01 U lu = 18


n
2
> 20

Les tables sont inutilisables.
)
12
) 1 (
;
2
( ) (
2 1 2 1 2 1
+ +
=
n n n n n n
N U L
U sera calcul avec R1 et on calcule le rapport critique.
37

Ex quo
Lcart type de la distribution est :
|
|
.
|

\
|

+ +

+ +

T
n n n n
n n n n
n n
12
) ( ) (
) 1 )( (
2 1
3
2 1
2 1 2 1
2 1

avec
12
3
t t
T

= et t nombre dex quo pour une valeur

Exemple

valeur rang valeur rang
45 29.5 38 19
28 12 43 27
32 14.5 46 31
25 9.5 41 23.5
44 28 39 20.5
24 8 48 33.5
30 13 47 32
15 1 19 5
16 2 21 6
22 7 18 4
49 35 17 3
25 9.5 35 17.5
26 11 42 25.5
39 20.5 48 33.5
40 22
42 25.5
32 14.5
35 17.5
41 23.5
33 16
45 29.5
n2 = 21 349 n1=14 281
9.5 : 2 fois
14.5
17
20.5
23.5
25.5
29.5
33.5

Remarque : inutile de calculer la somme de n
2


118 281
2
15 14
21 14
2
) 1 (
1
1 1
2 1
=

+ =
+
+ = R
n n
n n U

38
147
2
21 14
=

= m
=

12
2 2
8
3
T


68 . 29 4
12
) 21 14 ( ) 21 14 (
) 1 21 14 )( 21 14 (
21 14
3
=
|
|
.
|

\
|

+ +

+ +

=

98 . 0
68 . 29
147 118
=

= RC

-1.96 < -0.98 < 1.96 donc compris dans la zone o on ne rejette pas Ho ; donc pas de
conclusion


III. Le test mdiane

On utilise le test de la mdiane lorsquon veut tester la diffrence entre deux groupes
indpendants quant une variable ordinale ou par intervalle.
Plus prcisment, il sagit de tester lhypothse selon laquelle les deux groupes proviennent
de deux populations prsentant la mme mdiane ou non.

La procdure est la suivante :

On dtermine la mdiane de lensemble des valeurs prises par la variable

On dichotomise lensemble des valeurs prises par la variable dans chaque groupe en :
o Valeur infrieure strictement la mdiane
o Valeur suprieure strictement la mdiane

On rassemble dans un tableau de la forme

G1 G2
< md A B A+B
>md C D C+D
A+C B+D A+B+C+D
=
n1+n2=N

Selon les effectifs, on applique le test du khi-deux dindpendance de deux variables
nominales ou le test de Fischer

Remarque :

Si le nombre dindividus prsentant exactement la valeur mdiane est petit par rapport
n1+n2, on les limine (de lordre de 10%).
Si le nombre dindividus prsentant exactement la valeur mdiane est plus important, on
dichotomise de la sorte :
mdiane et > mdiane
39
Exemples

1) variable ordinale

G1 : 1 10 9 8 5 2 1 3 2
G2 : 2 5 8 8 9 10 7 6 1 3 4 7 7

n1=9 n2 = 13

On cherche la mdiane de lensemble ; on classe donc toutes les valeurs :

1 1 1 2 2 2 3 3 4 5 5

6 7 7 7 8 8 8 9 9 10 10

Lintervalle mdian est (5 ; 6) ; la mdiane est de 5.5

On fait le tableau suivant : on dnombre combien de valeurs < 5.5 et > dans le G1, ainsi que
dans le G2.

G1 G2
< 5.5 6 5 11
> 5.5 3 8 11
9 13 22


On applique le test de Fischer :

A+B = 11
C+D = 11
B = 5 donc D doit tre <0 si on veut rejeter Ho
D = 8 donc pas de conclusion


2) variable par intervalle

Soient deux distributions X et Y

x
i
n
i n
i

[0 ; 5[ 3 3
[5 ; 10[ 8 11
[10 ; 15[ 10 21
[15 ; 20[ 7 28
[20 ; 25[ 4 32
32




40
y
i
n
i n
i

[0 ; 5[ 1 1
[5 ; 10[ 3 4
[10 ; 15[ 9 13
[15 ; 20[ 12 25
[20 ; 25[ 10 35
35


Il faut dabord calculer la mdiane de lensemble ; on refait donc un tableau en additionnant
pour chaque intervalle les effectifs correspondant de X et de Y

z
i
n
i n
i

[0 ; 5[ 4 4
[5 ; 10[ 11 15
[10 ; 15[ 19 34
[15 ; 20[ 19 53
[20 ; 25[ 14 67
67

La mdiane se situe dans la classe [10 ; 15[ car 67/2=33.5

On fait une interpolation linaire ; on associe 15 deffectif cumul 10, 34 15 et on cherche
la valeur de la variable entre 10 et 15 correspondant 33.5 :


87 . 14
15 34
15 5 . 33
10 15
10
=

m
m


Donc la mdiane de lensemble est de 14.87
Il sagit maintenant de connatre exactement le nombre de sujets de chacun des groupes qui
prsentent une valeur < et > 14.87
Pour cela, il faudra refaire des interpolations linaires, avec un raisonnement inverse de celui
que lon vient de faire : on connat les valeurs de la variable, on cherche les effectifs cumuls
correspondants.

1
er
groupe :
x
i
n
i n
i

[0 ; 5[ 3 3
[5 ; 10[ 8 11
[10 ; 15[ 10 21
[15 ; 20[ 7 28
[20 ; 25[ 4 32
32

La m de lensemble est situ dans la classe [10 ; 15[ ; la valeur 10 correspond 11 sujets ( =
11 sujets ont un score strictement infrieur 10) ; la valeur 15 correspond 21 sujets ;
combien de sujets correspond la valeur 14.87. On va appeler A ce nombre de sujets :
41

74 . 20
10 15
10 87 . 14
11 21
11
=

A
A


Comme n1 = 32, C = 32-20.74 = 11.26

2
me
groupe :
y
i
n
i n
i

[0 ; 5[ 1 1
[5 ; 10[ 3 4
[10 ; 15[ 9 13
[15 ; 20[ 12 25
[20 ; 25[ 10 35
35

La mdiane de lensemble est toujours dans la classe [10 ; 15[ ; on associe 10 4 , 15 13 et on
cherche 14.87 combien ?

77 . 12
10 15
10 87 . 14
4 13
4
=

B
B


Comme n2 = 35, D = 35-12.77=22.23
On peut maintenant faire le tableau :


G1 G2
< 14.87 20.74 12.77 33.51
> 14.87 11.26 22.23 33.49
32 35 67


( )
36 . 5
49 . 33 51 . 33 35 32
67 26 . 11 77 . 12 23 . 22 74 . 20
67
49 . 33 51 . 33 35 32
23 . 22 26 . 11
77 . 12 74 . 20
2
2
2
=


=

=

= 1

Khi-deux lu .05 = 3.84
5.36 > 3.84 donc on rejette Ho au profit de H1 5% (S, p<.05)








42
Chapitre 6
ANALYSE DE LA VARIANCE



I. Introduction

Exemple :

Soit lhypothse selon laquelle le temps de raction un stimulus peut tre affect par la
teneur de la consigne.

C1 groupe contrle : Appuyez sur la touche le plus rapidement possible aprs
lallumage de la lampe rouge.
C2 groupe exprimental Appuyez sur la touche le plus rapidement possible aprs
lallumage de la lampe rouge ; attention la lampe peut
sallumer dans une autre couleur, nappuyez que si elle est
rouge.

m
Gpe contrle 32 24 28 29 25 20 22 19 24 27 250 25
Gpe exp 20 15 18 25 17 32 18 17 19 19 200 20
Temps en ms

Variances intra et inter

Lide gnrale est la suivante : on travaille non seulement sur lcart entre les deux
moyennes, mais aussi sur la variabilit gnrale.

La variabilit intra est mesure par la variance intra qui donne une mesure de lerreur
exprimentale (cf. cours 1
re
anne, variations alatoires des mesures) ; elle explique les
variations, pour une mme situation exprimentale, du temps de raction au sein dun mme
groupe de sujets (ou de plusieurs mesures pour un mme sujet). Elle natteint pas du tout la
diffrence entre les deux situations.

La variabilit inter est mesure par la variance inter qui exprime laction ventuelle de la VI
(variable indpendante) et celles de facteurs alatoires (erreur exprimentale et fluctuation
dchantillonnage) ; elle prend en compte les variations entre les deux situations (les deux
groupes).

On sintresse au rapport :

ra Var
er Var
F
cal
int
int
= cest lindice deffet de la VI

Si il ny a pas deffet de la VI :
la var inter se rduit lerreur exprimentale
la var intra est, par dfinition, lerreur exprimentale
et donc F
cal
1
43
Sil y a un effet de la VI :
la var inter contient lerreur exprimentale mais quelque chose de chose en plus qui
est bien plus important (en termes de quantit) que seule cette erreur
la var intra est, par dfinition, lerreur exprimentale
et donc F
cal
> 1

Evidemment, cest la valeur de lcart entre F
cal
et 1 qui sera ou non significatif.


II. Notation

Pour le moment, nous travaillons avec des groupes de mme effectif.
Un plan exprimental simple est not S (A)
S ensemble des individus statistiques pour un groupe cardinal de S = S
A ensemble des modalits prises par la VI cardinal de A = A

Dans notre exemple, on noterait S
10
(A
2
)

On note : a une modalit de la VI (dans notre exemple, a=1 ou 2, on
attribue une modalit arbitraire car variable nominale)

Y
a s
valeur de la variable (VD) pour un individu prcis qui
appartient un groupe prcis (donc pour une valeur
prcise de la VI)

=
=
=
S s
s
as a
Y Y
1
.
somme des valeurs de la variable (VD) pour les individus
qui ont a pour modalit de la VI



=
=
=
=
=
S s
s
as
A a
a
Y Y
1 1
..
somme de toutes les valeurs de la variable (VD)
pour toutes les modalits de la VI


S
Y
M
a
a
.
.
= moyenne des valeurs de la variable VD pour une
modalit prcise de la variable VI


SA
Y
M
..
..
= moyenne de toutes les valeurs de la variable VD
pour toutes les modalits de la VI

Dans notre exemple :
a = 1 groupe contrle
a = 2 groupe exprimental
Y
12
24
Y
27
18
Y
1.
= 32+24+38++27 = 250
Y
2.
= 20+15++19 = 200
44
Y
..
= Y
1.
+ Y
2.
= 450

M
1.
= 250/10 = 25
M
2.
= 200/10 = 20

5 . 22
10 2
450
..
=

= M


Les sommes des carrs

Dans lanova, les variances inter (entre) et intra (dans) se ramnent des sommes de carrs
rapportes des degrs de libert.

On travaille sur des carts entre les valeurs de la variable et les moyennes.

Y
a s
M
..
= (Y
a s
M
a.
) + (M
a.
- M
..
)

(Y
a s
M
..
) = (Y
a s
M
a.
) + (M
a.
- M
..
) + 2(Y
a s
M
a.
) (M
a.
- M
..
)

On veut la somme des carrs des carts la moyenne (cf. formule variance)


=
=
=
=
S s
s
A a
a 1 1
(Y
a s
M
..
) =

=
=
=
=
S s
s
A a
a 1 1
(Y
a s
M
a.
) +

=
=
=
=
S s
s
A a
a 1 1
(M
a.
- M
..
) +


=
=
=
=
S s
s
A a
a 1 1
2(Y
a s
M
a.
) (M
a.
- M
..
)

or, on montre (cf Abdi Introduction au traitement statistique des donnes exprimentales),
que la somme du dernier terme est nulle (car somme des Y
a s
= somme des M
a.
)

on a donc


=
=
=
=
S s
s
A a
a 1 1
(Y
a s
M
..
) =

=
=
=
=
S s
s
A a
a 1 1
(Y
a s
M
a.
) +

=
=
=
=
S s
s
A a
a 1 1
(M
a.
- M
..
)


(Y
a s
M
a.
) = lcart entre un sujet et la moyenne dans son groupe ; donc la somme de tous
ces carts (donc pour tous les sujets) leve au carr reprsente ce qui se rapproche de la
variance intra groupe ; on lappelle SC
dans

(M
a.
- M
..
) = cart entre la moyenne dun groupe et la moyenne gnrale ; la somme leve au
carr reprsente ce qui se rapproche de la variance inter ; on lappelle SC
entre
.

(Y
a s
M
..
) = cart entre le score dun individu et la moyenne gnrale ; la somme leve au
carr est SC
tot


donc on voit que SC
tot
= SC
dans
+ SC
entre

45
somme des carrs totale = somme des carrs dans les groupes + somme des carrs entre les
groupes.


Les degrs de libert

En regardant les formules prcdentes, on saperoit quelles dpendent du nombre de sujets
(plus le nombre de sujets augmente, plus la somme des carr dans les groupes augmente). Si
on veut comparer ces sommes, il faut les exprimer sur une mme chelle ; il faut donc les
normer selon le nombre de sujets, donc selon le degr de libert.

SC
entre
est calcul partir des carts des moyennes de groupes la moyenne gnrale ; si
nous avons A groupes, nous avons A moyennes donc :
ddl
entre
= A-1

SC
dans
est calcul partir des carts des scores de chaque groupe la moyenne du groupe.
Nous avons S observations par groupe (donc ddl = S-1) et nous avons une moyenne par
groupe, donc A moyennes.
ddl
dans
= A (S-1) = AS A = N A avec N nombre total de sujets

SC
tot
se calcule partir des carts de chacun des scores la moyenne gnrale ; nous avons N
scores (ou S A) :
ddl
tot
= N 1


Remarque :

SC
tot
= SC
dans
+ SC
entre
ddl
tot
= ddl
dans
+ ddl
entre

N 1 = N A + A-1

Ces deux relations sont fondamentales dans lanalyse de variance.


Les carrs moyens

On dfinit donc les carrs moyens comme le rapport des sommes des carrs sur le nombre de
degrs de libert correspondant :

dans
dans
dans
ddl
SC
CM =
entre
entre
entre
ddl
SC
CM =

Attention CM
tot
CM
dans
+ CM
entre







46
Exemple :

m
Gpe contrle 32 24 28 29 25 20 22 19 24 27 Y
1.
=
250
M
1.
=
25
Gpe exp 20 15 18 25 17 32 18 17 19 19 Y
2.
=
200
M
2.
=
20

SC
dans
est la somme des carts au carr entre les sujets et la moyenne de son groupe :
SC
dans
= (32-25) + (24-25) + .. + (27-25) + (20-20) + (15-20) + + (19-20) = 372

SC
entre
est la somme des carts entre la moyenne dun groupe et la moyenne
gnrale (attention, pondre par le nombre dindividus dans chaque groupe)
5 . 22
10 2
450
..
=

= M
SC
entre
= 10 (25-22.5) + 10 (20-22.5) = 125


SC
tot
est la somme des carts au carr entre le score dun individu et la moyenne gnrale :
SC
tot
= (32-22.5) + .. + (27-22.5) + (20-22.5) + . + (19-22.5)
= SC
dans
+ SC
entre

= 372 + 125 = 497

ddl
dans
= A (S-1) = AS A = N A avec N nombre total de sujets
= 20 2 = 18
ddl
entre
= A-1 = 2-1 = 1
ddl
tot
= N 1 = 19


125
1
125
= = =
entre
entre
entre
ddl
SC
CM 67 . 20
18
372
= = =
dans
dans
dans
ddl
SC
CM



III. Lindice deffet

exp
exp
erreur
erreur VI effet
CM
CM
F
dans
entre
czl
+
= =

dans notre exemple : 05 . 6
67 . 20
125
= =
cal
F

Cet indice deffet suit une loi de Fisher-Sndcor double degr de libert :

1
= A 1 cest le ddl du numrateur (ddl
entre
)

2
= A (S-1) = N A cest le ddl du dnominateur (ddl
dans
)

Il y a donc autant de tables possibles que de couples de degr de libert ; on se contente de
travailler avec deux tables, celle du seuil de 5% et celle du seuil de 1%.
47
Si F
cal
F
table
rejet de Ho
Si F
cal
< F
table
pas de conclusion

Lhypothse nulle consiste affirmer que, dans lensemble de la population (rappel que les
hypothses ne concernent pas lchantillon considr, mais la population dont provient
lchantillon), la VI na pas deffet sur la VD. La valeur observe du critre sattribue au
hasard (erreur exprimentale).
Lhypothse alternative considre que dans lensemble de la population, la VI a un effet sur
la VD. La valeur observe du critre sattribue leffet de la VI sur la VD.


Dans notre exemple :

On regarde dans la table la valeur de F
table
5% pour
1
= 1 et
2
= 18 ; on lit 4.41
6.05 > 4.41 on rejette Ho

Au seuil de 1%, on lit 8.28
6.05 < 8.28 pas de conclusion


IV. Prsentation des rsultats

Les rsultats sont classiquement reprsents dans un tableau

Source SC ddl CM F
cal
entre 125 1 125 6.05
dans 372 18 20.67
total 497 19 (S, p<.05)
*

(S, p<.01) ** ns
On trouve aussi une notation plus gnrale pour la premire colonne qui rappelle le plan
exprimental :

A (ou encore consigne ) pour entre
Renvoie lensemble des modalits prises par les groupes, donc au nombre de groupes ; cest
donc bien la variabilit due aux groupes ; traduit leffet de la VI

S (A) (ou encore erreur ) pour dans
Cest la variabilit dans les groupes ; cest le facteur sujet, lerreur exprimentale.

Autre exemple :

Hypothse sur lutilisation dimages mentales favorise la mmorisation. Apprentissage de
paires de mots ; ensuite on donne le premier mot, le sujet doit donner le second. Deux
groupes de 15 sujets :
Groupe exprimental : consigne pour imager (lier les deux mots de la paire avec une mme
image : chat + cigare : imaginer un chat fumant un cigare)
Groupe contrle : mmoriser les couples de mots.
48
On relve le nombre de mots rappels par sujet.

GE 13-9-10-8-9-12-8-12-10-9-10-12-11-8-9
GC 5-3-4-4-6-1-3-4-6-4-6-2-5-3-4

Ho la VI na pas deffet sur la VD
La manipulation exprimentale naffecte pas le comportement des sujets
Limagerie ninfluence pas la mmorisation
Le GC et le GE ne diffrent pas pour le nombre de mots rappels ; seul le hasard est
responsable des diffrences observes
Dans lensemble de la population, la moyenne GC est gale la moyenne GE

H1 La VI a un effet sur la VD
Etc..

S = 15 A=2
SC
entre
ou SC
A
= 270
SC
dans
ou SC
S(A)
= 68
SC
tot
= 338
ddl
entre
= ddl
A
= 2-1 = 1
ddl
dans
= ddl
S(A)
= 30-2 = 28
ddl
tot
= 29

270
1
270
= = = =
entre
entre
A entre
ddl
SC
CM CM 43 . 2
28
68
) (
= = = =
dans
dans
A S dans
ddl
SC
CM CM
18 . 111
43 . 2
270
= =
cal
F

1
= 1

2
= 28

5% on lit 4.20
1% on lit 7.64

source SC ddl CM F
cal
A
270 1 270 111.18
S (A) 68 28 2.43
total 338 29 **


Avec SPSS :

Analyse comparer les moyennes moyennes dfinir VD et VI choisir option tableau
anova et ta

49
Tableau de bord
VAR00001
10,0000 15 1,6475
4,0000 15 1,4639
7,0000 30 3,4140
VAR00002
1,00
2,00
Total
Moyenne N Ecart-type

Tableau ANOVA
270,000 1 270,000 111,176 ,000
68,000 28 2,429
338,000 29
Combin Inter-groupes
Intra-classe
Total
VAR00001 * VAR00002
Somme
des carrs df
Moyenne
des carrs F Signification



V. Autres modes de calcul

Mode 1

Il est fond sur le tableau suivant avec les nombres dans le carr .

source SC ddl CM F
cal
A
(entre)
A - 1 A-1 A 1
A-1

S (A)
(dans)
AS - A AS - A AS A
AS-A

total AS - 1 AS - 1


On calcule 7 quantits :

Q1 = Grand total = Y
..
= somme de toutes les valeurs

Q2 = AS = Y
..
= somme du carr de toutes les valeurs

Q3 = A = Y
a.
/S = on calcule la somme des valeurs des individus pour le 1
er
groupe ; on
llve au carr et on la divise par le nombre dindividus dans le groupe ; on fait de mme
pour tous les groupes et on somme le tout.
Q4 = 1 = Y
..
/AS = Q1/AS

Q5 = SC
tot
= AS 1 = Q2 - Q4

Q6 = SC
entre
= SC
A
= A 1 = Q3 Q4
Q7 = SC
dans
= SC
S(A)
= AS A = Q2 Q3




50
Exemple :

Deux mthodes pdagogiques I et II ; 5 tudiants dans chaque groupe ; mme preuve

I 75 62 71 58 73
II 81 85 68 92 90

Q1 = Y
..
= 75 + 62 + .. + 73 + 81 + 85 + .. + 90 = 755

Q2 = AS = Y
..
= 75 + 62 + . + 73 + 81 + . + 90 = 58177

Q3 = A = Y
a.
/S = (75 + + 73) /5 + (81 + + 90) / 5 = 339/5 + 416/5=57595.4
Q4 = 1 = Y
..
/AS = Q1/AS = 755 / 25 = 57002.5

Q5 = SC
tot
= AS 1 = Q2 - Q4 = 58177 57002.5 = 1174.5

Q6 = SC
entre
= SC
A
= A 1 = Q3 Q4 = 57595.4 57002.5 = 592.9

Q7 = SC
dans
= SC
S(A)
= AS A = Q2 Q3 = 58177 57595.4 = 581.6

On vrifie que 592.9 + 581.6 = 1174.5

On calcule (ddl
entre
= 1 ; ddl
dans
= 10-2 = 8)

CM
entre
= 592.9 / 1 = 592.9
CM
dans
= 581.6 / 8 = 72.7

F
cal
= 592.9/72.7 = 8.16

source SC ddl CM F
cal
A
(entre)
592.9 1 592.9 8.16
S (A)
(dans)
581.6 8 72.7
total 1174.5 9 *

Mode 2

On peut galement simplifier les calculs en faisant une translation la variable.

Dans notre exemple, on pose Y = Y 70

I 5 -8 1 -12 3
II 11 15 -2 22 20

Y
..
= 5 8 + 1 12 + 3 + 11 + 15 2 + 22 + 20 =55

AS = Y
..
= 5 + 8 + 1 + . + 22 + 20 =1477
A = Y
a.
/S = (5 - 8 + 1 - 12 + 3) / 5 + (11 + 15 - 2 + 22 + 20) / 5 = -11 + 66 / 5 = 895.4
51

1 = Y
..
/AS = Q1/AS = 55 / 25 = 302.5


source SC ddl CM F
cal
A
(entre)
A 1

895.4-302.5
=592.9
A-1

1
A 1
A-1

592.9

8.16
S (A)
(dans)
AS A

1477-895.4
=581.6
AS A

8
AS A
AS-A

581.6/8
=72.7

total AS 1

1477.302.5 =
1174.5
AS 1

9

*


Autre exemple :

3 groupes de 5 tudiants ; 3 mthodes de mmorisation selon consigne. Peut-on conclure un
effet de la consigne ?

image construite (dfinition du mot mmoriser + dessin du mot faire soi-mme)
image donne (dfinition + dessin donn recopier)
contrle (dfinition)
On relve le nombre de mots mmoriss

I 23 19 25 24 25 = 116
II 14 10 14 19 21 = 78
III 6 9 12 14 15 = 56

Le plan exprimental est de la forme S (A) avec S = 5 et A = 3
Nous navons quun facteur de variation.

Y
..
= 116 + 78 + 56 = 250
AS = Y
..
= 23 + 19 + ..+ 19 + 21 + . + 14 + 15 = 4692
A = Y
a.
/S = (116 + 78 + 56) / 5 = 4535.2
1 = Y
..
/AS = 250 / 35 = 4166.67






source SC ddl CM F
cal
52
A
(entre)
A 1

4535.2-4166.67
=368.53
A-1

2
A 1
A-1

184.27
184.27/13.07
=
14.1
S (A)
(dans)
AS A

4692-4535.2
=156.8
AS A

12
AS A
AS-A

13.07

total AS 1

4692-4166.67 =
525.33
AS 1

14

**


VI. Lien entre lANOVA et le test de Student


Nous venons de comparer grce lANOVA les moyennes de deux ou plusieurs groupes
exprimentaux. Lanne dernire, nous avons vu que le T-test permet aussi de comparer
deux groupes exprimentaux. Ce ne sont pas deux tests diffrents car le t
cal
est li au F
cal
.

Exemple :

Deux groupes de 8 souris ; G1 produit suppos inhibiteur, G2 groupe contrle ; on mesure le
temps de passation dans une preuve de labyrinthe.
G1 14 15.5 15 16 14.5 15 15.5 16
G2 16 18 15.5 17 17 16.5 18 17.5

1) T-test

Rappel:
) ; ( ) (
2 1 2 1
2 1
X X X X
St X X L

=



avec
2 1 2 1
2
2 2
2
1 1
1 1
2
2 1
n n n n
s n s n
X X
+
+
+
=

et = n
1
+ n
2
-2

19 . 15
8
5 . 121
1
= = x 43 .
8
5 . 121
8
16 ... 5 . 15 14
2
2
1
=
|
.
|

\
|

+ + +
=

94 . 16
8
5 . 135
2
= = x 71 .
8
5 . 135
8
5 . 17 ... 18 16
2
2
2
=
|
.
|

\
|

+ + +
=
403 .
8
1
8
1
2 8 8
71 . 8 43 . 8
2 1
= +
+
+
=
X X



53
34 . 4
403 .
94 . 16 19 . 15
=

= RC

= n
1
+ n
2
-2 = 14 t
.995
=-2.98 rejet de Ho


2) ANOVA

G1 14 15.5 15 16 14.5 15 15.5 16 =121.5
G2 16 18 15.5 17 17 16.5 18 17.5 =135.5

Y
..
= 121.5 + 135.5 = 257
AS = Y
..
= 14 + 15.5 + + 18 + 17.5 = 4149.5
A = Y
a.
/S = (121.5 + 135.5) / 8 = 4140.31
1 = Y
..
/AS = 257 / 28 = 4128.06

source SC ddl CM F
cal
A
(entre)
4140.31-4128.06
=12.25

1

12.25
18.56
S (A)
(dans)
4149.5-4140.31
=9.19

14

.66

total 4149.5-4128.06
=21.44
15
**


t
cal
2
F
cal
4.34
2
= 18.83 18.56
Avec SPSS :

Exemple prcdent (deux groupes de 15 sujets avec utilisation ou non dimages mentales)
Tableau ANOVA
270,000 1 270,000 111,176 ,000
68,000 28 2,429
338,000 29
Combin Inter-groupes
Intra-classe
Total
VAR00001 * VAR00002
Somme
des carrs df
Moyenne
des carrs F Signification


T-test
Test d'chantillons indpendants
,615 ,439 10,544 28 ,000 6,0000 ,5690 4,8344 7,1656
10,544 27,618 ,000 6,0000 ,5690 4,8336 7,1664
Hypothse de
variances gales
Hypothse de
variances ingales
VAR00001
F Sig.
Test de Levene sur
l'galit des variances
t ddl
Sig.
(bilatrale)
Diffrence
moyenne
Diffrence
cart-type Infrieure Suprieure
Intervalle de confiance
95% de la diffrence
Test-t pour galit des moyennes


On lit le t = 10.544 F = 111.167 = t


54
VII. Estimation de lintensit de leffet de la VI

Quand on rejette Ho, on sait que la VI affecte la VD mais on ne mesure pas lintensit de cet
effet. Cette intensit na rien voir avec le seuil de rejet, ni avec le nombre de sujets de
lexprience. Pour complter et affiner lanalyse de variance, on estime lintensit de leffet de
la VI. Lide est dexprimer la part de variance de la VD attribuable la VI par rapport
toutes les sources de variance.

Le coefficient le plus utilis est ta carr :
On la dj vu lan pass : cest le rapport de corrlation non linaire. Il avait t dfini par


globale
er ou lique
var
) int var ( exp var

=

Dans lANOVA, ta carr exprime leffet de la VI comme le rapport de la Somme des Carrs
de A la Somme des Carrs totale

tot
entre
tot
A
SC
SC
SC
SC
= =
2


Il varie de 0 1 ; multipli par 100, il donne le pourcentage de variance de la VD expliqu par
la VI.
Exemples :

Les 2 groupes de souris : 57 .
44 . 21
25 . 12
2
= = =
tot
A
SC
SC


Les 15 sujets (mmorisation avec utilisation ou non dimages mentales) :

79 .
338
270
2
= = =
tot
A
SC
SC


Mesures des associations
,894 ,799 VAR00001 * VAR00002
Eta Eta carr

Вам также может понравиться