Вы находитесь на странице: 1из 6

4.

Tests
4.1. Contrôle de qualité
L’exemple classique suivant permet d’introduire la problématique de
tests dans le contexte de ce chapitre : une machine fabrique des pièces
dont une proportion est défectueuse. On admet que cette proportion
varie très peu pendant un intervalle de temps pas trop long et par suite,
en prélevant un échantillon de taille n de la productionles v.a. dé…nies
par : Xi = 1; si la pièce numéro i est défectueuse, Xi = 0; si celle-ci
est bonne, sont i.i.d. selon la loi B(1; ):
Beaucoup plus tard, c’est à dire, à une autre échelle de temps, la
proportion a pu devenir 0 : Si 0 est jugé trop grand, il y a lieu de faire
un réglage, car on ne veut pas que la proportion dépasse un certain
seuil, disons 0 ; …xé à l’avance. Désignons par H0 l’ensemble des
réglages acceptables : H0 = f 2 ]0; 1[ ; 0 g. Si le paramètre
appartient à : H1 = f 2 ]0; 1[ ; > 0 g ;on devra e¤ectuer un réglage.
Le problème posé est de détecter à l’aide d’un échantillon si H0 est
réalisée, ou bien H1 :
4.2. Méthodologie générale
La méthodologie décrite ci-dessous s’adapte à d’autres situations
usuelles qui seront examinées ultérieurement.
Dé…nition 4.2.?. Soit f 0 ; 1 g une partition de l’espace des
paramètres = ]0; 1[ :Un test de l’hypothèse : H0 = f 2 0 g contre
l’alternative : H1 = f 2 1 g est une règle de décision consistant à
choisir un sous-ensemble R de l’espace des observations possibles
n
= f0; 1g où l’on décidera de rejeter l’hypothèse H0 (et donc
d’accepter l’hypothèse H1 ). Un test s’identi…e donc à la v.a. :
(X1 ; :::Xn ) ! (X1 ; :::Xn ) = 1R (X1 ; :::Xn ) et R se nomme la région
critique du test.
Autrement dit, si l’on observe la réalisation (x1 ; :::xn ) de l’échantillon
(X1 ; :::Xn ) alors on décide de rejeter H0 lorsque (x1 ; :::xn ) 2 R:
La question du choix de R se pose naturellement. La suite de cette
partie est dédiée à cette question.
Observons d’abord qu’au test sont associées deux types d’erreurs :
- l’erreur de première espèce qui consiste à rejeter H0 lorsqu’elle
est vraie. Elle est quanti…ée par les probabilités :

! ( ) = P f(X1 ; :::Xn ) 2 Rg = E f (X1 ; :::Xn )g ; 2 0:

- L’erreur de seconde espèce consiste au contraire à accepter H1


lorsqu’elle est fausse. Elle est chi¤rée par les probabilités :

! ( ) = P f(X1 ; :::Xn ) 2 Rc g = 1 E f (X1 ; :::Xn )g ; 2 1:

L’erreur maximum de première espèce, à savoir,

max ( ) = sup f ( ); 2 0g

1
est la taille du test ; tandis que la fonction : ! ( )=1 ( ) pour
2 est sa fonction puissance.
Généralement, les hypothèses H0 et H1 ne jouent pas le même rôle,
comme dans l’exemple du contôle de qualité. Le statisticien considère
toujours que l’erreur de première espèce est plus grave que celle de
seconde espèce, ce qui le conduit à adopter la méthodologie suivante
pour déterminer R:Il …xe un seuil 2 ]0; 1[ ; = 0:05 ou = 0:001,
à titre d’exemple, et n’envisagera que les tests de niveau inférieur ou
égal à ;c’est à dire, véri…ant : max ( ) :Ceci fait, il tentera en même
temps de minmiser l’erreur de seconde espèce, ou ce qui revient au
même, de maximiser la fonction puissance du test : ! ( ) sous H1 :
Le minimum à demander à un test est d’être sans biais, c’est à dire,
de véri…er :

8 2 1; ( ) sup f ( ); 2 0g = max ( );

autrement dit, " la probabilité d’accepter H1 lorsqu’elle est vraie est


supérieure à celle de la choisir alors qu’elle est fausse ".
Les deux lemmes suivants vont nous permettre de justi…er l’idée tout à
fait heuristique
nP suivante consistant
o à choisir une région de rejet de la
k=n
forme R = k=1 xk > s lorsqu’il s’agit de tester l’hypothèse
H0 : " 0 " contre l’alternative H1 :" > 0 ". Elle s’appuie sur la
propriété : E Xn = et le fait qu’en un certain sens une v.a. positive
est du même ordre de grandeur que son espérance mathématique.
Lemme 4.2.?. Etant donnés et
deux points de l’espase des
0 1
Ln ( 1 )
paramètres ;avec 0 < 1 :Alors le rapport de vraisemblance est
Ln ( 0 )
une fonction croissante de la statistique exhaustive : Sn = X1 + ::: + Xn :
Plus précisément, on a :

Ln ( 1 )
= exp 0; 1
(Sn )
Ln ( 0 )
avec :

0; 1
(s) = C( 0 ; 1) s + n D( 0 ; 1 );

1 1 0 1 1
C( 0 ; 1) = Log > 0; D( 0 ; 1) = Log :
0 1 1 1 0

Preuve. Elle est immédiate. La positivité de C( 0 ; 1 ) s’obtient en


x
remarquant que la fonction : x ! &(x) = est strictement croissante
1 x
sur l’intervalle [0; 1[ et par suite l’inégalité 0 < 1 implique que :
1 1 0 &( 1 )
= > 1.
0 1 1 &( 0 )
Lemme 4.2.?. Dans le cadre du lemme 4.2.?, pour tout > 0 …xé, la borne

2
inférieure :
inf f P 0 (R) + P 1 (Rc ) g
R

est atteinte par les sous- ensembles R véri…ant :fp0 < p1 g R fp0 p1 g
et uniquement par ses sous- ensembles où l’on note :

Q
k=n Pk=n Pk=n
xk n xk
pj (x1 ; :::xn ) = f ( j ; xk ) = j
k=1
(1 j) k=1

k=1

x
pour j = 0; 1 et f ( ; x) = (1 )1 x
pour 2 et x 2 f0; 1g :
Preuve. On a :
X X
P 0 (R) + P 1 (Rc ) = p0 (x1 ; :::xn ) + p1 (x1 ; :::xn )
(x1 ;:::xn )2R (x1 ;:::xn )2Rc
X
= f p0 1R (x1 ; :::xn ) + p1 1Rc (x1 ; :::xn ) g
(x1 ;:::xn )2
X
inf fp0 ; p1 g (x1 ; :::xn )
(x1 ;:::xn )2

et l’égalité n’a lieu que si et seulement si :

p0 1R + p1 1Rc = inf fp0 ; p1 g :

Grâce aux deux lemmes précédents on peut énoncer le théorème suivant :


Théorème 4.2.?. Etant donnés 0 et 1 deux points de l’espace des
paramètres ;avec 0 < 1 :Pour tester l’hypothèse H0 : " = 0 " contre
l’alternative H1 : " = 1 ";tout test de la forme = 1R de région critique R
véri…ant les inclusions
(k=n ) (k=n )
X X
xk > s R xk s ; 0 s n 1
k=1 k=1

est de puissance maximum parmi tous les tests 0 = 1R0 ; R0 ; de


niveau inférieur ou égal à P 0 (R) 2 [H 0 (s); H 0 (s 1)[ où

X k=n
X
n k
H (s) = P fSn > sg = (1 )n k
, Sn = Xk :
k
k s+1 k=1

En outre, pour tout 0 s n 1, la fonction ! H (s) croit strictement


de 0 à 1 quand croit de 0 à 1; donc est sans biais.
n
Preuve. Soit R un sous-ensemble de = fo; 1g véri…ant les inclusions
du théorème. D’après le lemme 4.2.?, on a

p1 p1
(x1 ; :::xn ) > exp 0; 1
(s) R (x1 ; :::xn ) exp 0; 1
(s) ;
p0 p0

3
donc en posant : = exp 0; 1
(s) , on a

fp0 < p1 g R fp0 p1 g :

Compte tenu du lemme 4.2.?, pour tout sous-ensemble R0 ; on a :

P 0 (R0 ) + P 1 (R0c ) P 0 (R) + P 1 (Rc ):

Par conséquent, l’inégalité : P 0 (R0 ) P 0 (R) [resp P 0 (R0 ) < P 0 (R)]


ne peut avoir lieu sans que P 1 (R0c ) P 1 (Rc ) [resp P 1 (R0c ) > P 1 (Rc )],
ou ce qui revient au même, sans que P 1 (R0 ) P 1 (R)
[resp P 1 (R0 ) < P 1 (R)]: Ainsi, = 1R est de puissance maximum parmi
les tests 0 = 1R0 0 de niveau P 0 (R0 ) P 0 (R); en outre, un test 0 = 1R0 0
pour R0 quelconque ne peut être strictement meilleur que à savoir :

P 0 (R0 ) < P 0 (R) =) P 1 (R0 ) < P 1 (R):

Pour montrer la dernière assertion du théorème, on utilise les formules


classiques

n n 1 n n 1
k =n et (n k) =n
k k 1 k k
n
avec la convention = 0 pour k < 0 ou k > n; a…n d’établir que la
k
dérivée de la fonction : ! H (s) = P fSn > sg
P n k
= k s+1 (1 )n k véri…e la formule
k

dH
(s) = n [ P fSn 1 >s 1g P fSn 1 > sg] = n P fSn 1 = sg :
d
La dernière quantité est toujours positive ou nulle et elle est strictement
positive si 0 < < 1 et 0 s n 1: Il en résulte que est un test sans
biais. Le théorème est établi.
Corollaire 4.2.?.Etant donnés 0 et 1 deux points de l’espace des
paramètres ;avec 0 < 1 et 2 ]0; 1[ : Pour tester l’hypothèse
H0 : " 0 " contre l’alternative H1 : " > 0 ";le test de la forme
= 1R dont la région critique est dé…nie par :
(k=n )
X
R= xk > sn ( 0 ; )
k=1

où sn ( 0 ; ) est l’unique entier vérifant

H 0 (sn ( 0 ; )) < H 0 (sn ( 0 ; ) 1)


0
est de puissance maximum parmi tous les tests = 1R 0 ; R 0 ; de

4
niveau inférieur ou égal à .

Preuve. On remarque d’abord que pour tout 2 ]0; 1[ …xé, la fonction


P n k
s ! H (s) = P fSn > sg = k s+1 (1 )n k est strictement
k
décroissante de 1 à 0 avec la convention

H ( 1) = P fSn > 1g = P fSn 0g = 1; H (n) = P fSn > ng = 0.

Ainsi, n ( ) = f0; H (n 1); :::; H (0); 1g forme une subdivision de


l’intervalle [0; 1] :Et par conséquent, pour tous 2 ]0; 1[ et n …xés; il
existe un entier unique sn ( ; ) = s( ; ) véri…ant
X n X n
k k
(1 )n k
< (1 )n k
:
k k
k s( ; ) +1 k s( ; )

La croissance stricte de la fonction : ! H (s) = P fSn > sg


pour 0 s n 1 …xé, permet d’a¢ rmer que pour 0 > ;
0
n( ) n ( ); donc pour 2 ]0; 1[ et n …xés, on a :
sn ( ; ) sn ( 0 ; ): Cette propriété permet aussi de voir que la taille du
test = 1R , à savoir, max ( ) = sup fP fSn > sg ; 0 g est égale à
P 0 fSn > sn ( 0 ; )get est donc majorée par . On conclut en exploitant
le théorème 4.2.?.
Remarques
i.En fait, on a
8 9
< X n =
k
sn ( ; ) = inf s; 0 s n 1; (1 )n k
: k ;
k s +1
( k=s
)
X n k n k
= inf s; 0 s n ; (1 ) 1 ;
k
k =0

on dit que sn ( ; ) est le quantile d’ordre 1 de la v.a. Sn ou de sa


fonction de répartition :
Pk=s n k
s ! FSn (s) = P fSn sg = k =0 (1 )n k et on écrit que
k
sn ( ; ) = FSn1 (1 ): On peut donc calculer aisément ce quantile par
machine.
ii. Lorsque la taille n de l’échantillon est grande , on peut , selon que 0
est très petit ou non, exploiter l’approximation par la loi de Poisson ou
par la loi gaussienne de la distribution binomiale B(n; 0 ) que suit la

5
statistique exhaustive Sn sous P 0 Plus précisément, on écrit que :
X n k n k
P 0
fSn > sg = 0 (1 0)
k
k s +1
X n
' exp( ) ; lorsque n 0 ' ; et sinon :
n!
k s +1
( )
Sn n 0 s n 0
P 0
fSn > sg = P 0
p >p
n 0 (1 0) n 0 (1 0)
r
n s n 0
= P 0 (Xn 0) > x ; avec x = p
0 (1 0) n 0 (1 0)
Z x 2
1 t
' 1 G(x); avec G(x) = p exp( )dt:
1 2 2

iii. En reprenant l’exemple du contrôle de qualité, un marchand des pièces


fabriquées, peut avoir un avis di¤érent de celui du fournisseur; il pourrait
décider de n’accepter que des lots de pièces ne contenant qu’au plus une
proportion ? de pièces défectueuses. A partir d’un échantillon, de taille n,
prélevé dans chaque lot, il cherchera donc à tester l’hpothèse :" > ? "
?
contre l’alternative " ". Dans ce cas, il rejettera l’hypothèse nulle,
quand fSn sg. Le seuil s est alors déterminé par la condition de niveau
P ? fSn sg ; vu que pour tout s, 1 s n 1; la fonction :
! P fSn sg = 1 P fSn > sg décroît strictement de 1 à 0:
vi. En pratique, on peut-être amené à tester l’hypothèse : " = 0 " contre
l’alternative : " 6= 0 ".(Par exemple, tester qu’un n échantillon obtenu par
simulation obéit à la loi B(n; 0 )). Nous admettons provisoirement que,
dans ce cas, un "bon test", de niveau Pk=n, est de la forme = 1R où
1
R = fp xn 0 p> cg avec xn = n k=1 xk , c étant déterminé par la
condition de niveau : P 0 p Xn 0 p> c , qui s’écrit :
P 0 fSn > n( 0 + c)g et P 0 fSn < n( 0 c)g : Pour n assez
2 2
grand, il convient d’utiliser l’approximation gaussienne
r
n
P 0 p Xn 0 p> c = P 0 p Xn 0 p> c ;
0 (1 0)
' 2 [1 G(x)] ' ;
r r
n 0 (1 0)
avec : c = c ;donc : c = G 1 (1 )
0 (1 0) n 2

Вам также может понравиться