Вы находитесь на странице: 1из 8

STT 2700 - TP 8

Rébecca Privé
Modié le 9 novembre 2018

Chapitre 8 : Exercices 16 d), 17 e), 68, 69 et 70.


Chapitre 9 : Exercices 1, 2, 3, 5 et 6 c) d).

Exercice 8.16

Considérons un échantillon de variables aléatoires i.i.d. de densité


 
1 |x|
f (x|σ) = exp − .
2σ σ

d) Trouver une statistique exhaustive pour σ .


Il a été trouvé en a) et b) que
n
r
µ̂2 1X
σ̂M = et σ̂V = |Xi | .
2 n i=1

Calculons maintenant la vraisemblance de l'échantillon an d'en extraire par le théo-


rème de factorisation une statistique T (X ) exhaustive pour σ . Notons que tel qu'à
l'habitude, X représente l'échantillon, soit l'ensemble {X1 , · · · , Xn }.
n n     n n
!
Y Y 1 |Xi | 1 1X
f (X |σ) = f (Xi |σ) = exp − = exp − |Xi |
i=1 i=1
2σ σ 2σ σ i=1
n
!
−n 1X
|Xi | 2−n := g T (X ), σ h(X ),

= σ exp −
σ i=1

en posant
n  
t
et h(X ) = 2−n .
X
−n
T (X ) = |Xi | , g(t, σ) = σ exp −
i=1
σ

|Xi | est donc une statistique exhaustive pour σ .


Pn
T (X ) = i=1

1
Exercice 8.17

Considérons un échantillon de variables aléatoires i.i.d. de densité


Γ(2α)
f (x|α) = 2
[x(1 − x)]α−1 , α > 0.
Γ(α)
e) Trouver une statistique exhaustive pour α.
Calculons la vraisemblance de l'échantillon an d'en extraire par le théorème de facto-
risation une statistique T (X ) exhaustive pour α.
n  n
n Y  n "Yn
#α−1
Y Γ(2α)  α−1 Γ(2α)
f (X |α) = f (Xi |α) = Xi (1 − Xi ) = Xi (1 − Xi )
i=1
Γ(α)2 i=1
Γ(α)2 i=1

:= g T (X ), α h(X ),
en posant
n  n
Γ(2α)
et h(X ) = 1.
Y
T (X ) = Xi (1 − Xi ), g(t, α) = tα−1
i=1
Γ(α)2

Xi (1 − Xi ) est donc une statistique exhaustive pour α.


Qn
T (X ) = i=1

Exercice 8.68

Soit X1 , · · · , Xn un échantillon i.i.d. de distribution Poisson de moyenne λ et T = Xi .


Pn
i=1

λk −λ
X ∼ Poisson(λ) =⇒ P(X = k) = e .
k!
a) Montrer que la distribution de X1 , · · · , Xn étant donné T est indépendante de λ et
conclure que T est une statistique exhaustive pour λ.
Nous cherchons à calculer P(X = x|T = t). À cette n, notons A, l'événement que
X = x et B l'événement que T = t. Par les propriétés des probabilités conditionnelles,
on trouve que
P(A, B) P(B|A)P(A) P(T = t|X = x)P(X = x) P(X = x)
P(A|B) = = = =
P(B) P(B) P(T = t) P(T = t)
Nous avons en eet que P(T = t|X = x) = 1 étant donné que c'est à partir de
l'échantillon X = x, que la statistique T = t a été calculée. Calculons maintenant
P(X = x) et P(T = t). Notons d'abord que puisque T est la somme de variables
aléatoires de Poisson indépendantes alors T est aussi de distribution Poisson, mais de
paramètre nλ.
n n  xi Pn
λ i=1 xi −nλ

Y Y λ −λ
P(X = x) = P(Xi = xi ) = e = n
Q e
i=1 i=1
xi ! i=1 xi !
Pn
(nλ)t −nλ (nλ) i=1 xi −nλ
P(T = t) = e = Pn e
t! ( i=1 xi )!

2
On trouve par conséquent que
Pn Pn −1
λ i=1 xi −nλ (nλ) i=1 xi −nλ ( ni=1 xi )!
  P
P(X = x)
P(X = x|T = t) = = Qn e e = Pn x Qn .
( ni=1 xi )!
P
P(T = t) i=1 xi ! n i=1 i i=1 xi !

Puisque P(X = x|T = t) est indépendante de λ, on a bien par la dénition d'une


statistique exhaustive que T = i=1 Xi est une statistique exhaustive pour λ.
Pn

b) Montrer que X1 n'est pas une statistique exhaustive pour λ.


Calculons la distribution de X étant donné X1 = x1 et montrons qu'elle dépend de λ.
Par le même argument que précédemment, nous avons que
Pn −1 Pn
λ i=1 xi −nλ λx1 −λ λ i=2 xi −(n−1)λ
 
P(X = x)
P(X = x|X1 = x1 ) = = Qn e e = Qn e .
P(X1 = x1 ) i=1 xi ! x1 ! i=2 xi !

Puisque P(X = x|X1 = x1 ) dépend du paramètre λ, on a par dénition d'une statis-


tique exhaustive que X1 n'est pas une statistique exhaustive pour λ.
c) Utiliser le théorème A de la section 8.8.1 pour montrer que T est une statistique ex-
haustive pour λ. Identier les fonctions g et h de ce théorème.
Nous savons que le probabilité conjointe de l'échantillon est donnée par
Pn
λ i=1 xi −nλ 
P(X = x) = Qn e := g T (X ), λ h(X ),
i=1 xi !

en posant :
n
1
et h(X ) = Qn
X
T (X ) = Xi , g(t, λ) = λt e−nλ .
i=1 i=1 xi !

Xi est donc une statistique exhaustive pour λ.


Pn
T (X ) = i=1

Exercice 8.69

Utiliser le théorème A de la section 8.8.1 pour conclure que T = Xi est une statistique
Pn
i=1
exhaustive quand les Xi sont i.i.d de distribution géométrique.

X ∼ Géométrique(p) =⇒ P(X = k) = (1 − p)k−1 p, k ≥ 0.

On trouve alors que


n n n P
i=1 xi
n (1 − p)
Y Y
xi −1

P(X = x) = P(Xi = xi |p) = (1 − p) p=p n
:= g T (X ), p h(X ),
i=1 i=1
(1 − p)
n  n
p
en posant T (X ) = (1 − p)t et h(X ) = 1.
X
Xi , g(t, p) =
i=1
1 − p

3
Exercice 8.70

Utiliser le théorème A de la section 8.8.1 an de trouve une statistique exhaustive pour la
distribution exponentielle.
X ∼ Exponentielle(λ) =⇒ f (x|λ) = λe−λx , x > 0.
On trouve alors que
n n
Y Y Pn
λe−λXi = λn e−λ xi

f (X |λ) = f (Xi |λ) = i=1 := g T (X ), λ h(X ),
i=1 i=1
n
en posant T (X ) = et h(X ) = 1.
X
Xi , g(t, λ) = λn e−λt
i=1

Xi est donc une statistique exhaustive pour λ.


Pn
T (X ) = i=1

Exercice 9.1

Une pièce de monnaie est lancée 10 fois de façon indépendante an de tester l'hypothèse que
la probabilité d'obtenir face est 1/2 contre l'hypothèse alternative que cette probabilité n'est
pas 1/2. Le test rejette l'hypothèse nulle si 0 ou 10 faces sont obtenues.
Notons alors X le nombre de faces obtenues suite aux 10 lancés indépendants et p la réelle
probabilité (inconnue) d'obtenir face.
a) Quel est le niveau de signication du test ?
Le niveau α de signication d'un test est la probabilité de rejeter faussement H0 . Par
conséquent,
α = P(Rejeter H0 |H0 vraie) = P(X ∈ {0, 10}|p = 0,5)
= P(X = 0|p = 0,5) + P(X = 10|p = 0,5) = (0,5)10 + (0,5)10 ≈ 0,00195.

b) Si en fait, la réelle probabilité d'obtenir face est de 0,1, quelle est la puissance du test ?
La puissance d'un test est la probabilité de rejeter H0 sous l'alternative. L'alternative
ici considérée est que la vraie probabilité soit p = 0,1. On trouve alors que
β(p = 0,1) = P(Rejeter H0 |p = 0,1) = P(X ∈ {0, 10}|p = 0,1)
= P(X = 0|p = 0,1) + P(X = 10|p = 0,1) = (0,9)10 + (0,1)10 ≈ 0,349.

Exercice 9.2

Parmi les hypothèses suivantes, lesquelles sont simples et lesquelles sont composites ?
Une hypothèse simple est une hypothèse sous laquelle la distribution de probabilité de la
variable aléatoire d'intérêt est entièrement spéciée.

4
1. X est de distribution uniforme sur [0, 1]. Simple
2. Un dé est non biaisé. Simple
3. X est de distribution normale de moyenne 0 et variance σ 2 > 10. Composite
4. X est de distribution normale de moyenne µ = 0. Composite

Exercice 9.3

Supposons que X ∼ Binomiale(100, p). Considérons un test qui rejette H0 : p = 0,5 en


faveur de l'hypothèse HA : p 6= 0,5 pour |X − 50| > 10. Utiliser l'approximation normale de
la distribution binomiale an de répondre aux questions suivantes :

Si X ∼ Binomiale(n, p), alors E(X) = np et V(X) = np(1 − p). L'approximation normale


nous donne alors que
X ∼ N (np, np(1 − p)).
a) Quel est le niveau de signiaction du test ?
Le niveau α de signication d'un test est la probabilité de rejeter faussement H0 . Or,
sous l'hypothèse nulle que p = 0,5, l'approximation normale devient
 X − 50
X ∼ N 100p, 100p(1 − p) = N (50, 25) =⇒ Z = ∼ N (0, 1).
5
Par conséquent,
 
|X − 50| 10
α = P(Rejeter H0 |H0 vraie) = P(|X − 50| > 10|p = 0,5) = P > p = 0,5
5 5
≈ P(|Z| > 2) = 2P(Z > 2) = 2(1 − Φ(2)) ≈ 0,0455.

b) Tracer le graphique de la puissance du test en fonction de p.


La puissance d'un test est la probabilité de rejeter H0 sous l'alternative. L'alternative
étant composite, nous calculerons la puissance du test pour plusieurs valeurs possible
de p, toujours sous l'alternative. Si on exprime la puissance comme une fonction de p,
on trouve que
β(p) = P(|X − 50| > 10|p = p) = P(X − 50 < −10|p = p) + P(X − 50 > 10|p = p)
= P(X < 40|p = p) + P(X > 60|p = p) := A + B
! !
X − 100p 40 − 100p 40 − 100p
A=P p <p p = p ≈ P Z < p
100(p)(1 − p) 100(p)(1 − p) 100(p)(1 − p)
! !
X − 100p 60 − 100p 60 − 100p
B=P p >p p = p ≈ P Z > p
100(p)(1 − p) 100(p)(1 − p) 100(p)(1 − p)

Si on trace maintenant la fonction β(p) avec le logiciel R, on trouve :

5
Puissance du test selon p

1,0
0,8
Puissance

0,6
0,4
0,2

0,0 0,2 0,4 0,6 0,8 1,0

Exercice 9.5

Vrai ou faux avec justications


1. Le niveau de signication d'un test statistique correspond à la probabilité que l'hypothèse
nulle soit vraie.
Faux. Le niveau de signication correspond à la probabilité de rejeter faussement H0 .
C'est-à-dire la probabilité de rejeter H0 si H0 est vraie.
2. Plus le niveau de signicativité d'un test statistique diminue, plus on s'attend à ce que
sa puissance augmente.
Faux. Diminuer les niveau de signicativité d'un test statistique signie diminuer la
probabilité de rejeter faussement H0 . Il devient alors plus dicile de rejeter l'hypothèse
nulle. On s'attend donc à ce que la puissance du test diminue également, c'est-à-dire
que la probabilité de rejeter H0 lorsque H0 est fausse diminue.
3. Si un test est rejeté au niveau de signication α, alors la probabilité que l'hypothèse
nulle soit vraie est α.
Faux. Cela signie que si l'hypothèse nulle était vraie, la probabilité d'obtenir une
statistique de test aussi/plus en désaccord avec H0 que celle qui a été obtenue est
inférieure à α.
4. La probabilité que l'hypothèse nulle soit faussement rejetée correspond à la puissance
du test.
Faux. La probabilité que l'hypothèse nulle soient faussement rejetée correspond au
niveau de signication du test, communément noté α. La puissance correspond plutôt
à la probabilité de rejeter H0 si H0 est fausse.
5. Une erreur de type I se produit lorsque le test rejette l'hypothèse nulle.
Faux. Une erreur de type I se produit lorsque le test rejette l'hypothèse nulle alors que
l'hypothèse nulle est vraie.

6
6. Une erreur de type II est une erreur plus grave qu'une erreur de type I.
Faux. En général c'est l'inverse. Il est plus grave de rejeter faussement une hypothèse
nulle que de ne pas la rejeter lorsqu'elle est fausse.
7. La puissance d'un test est déterminée par la distribution de la statistique de test sous
l'hypothèse nulle.
Faux. Elle est déterminée par la distribution de la statistique de test sous l'hypothèse
alternative.
8. Le rapport des vraisemblances est une variable aléatoire.
Vrai. Le rapport des vraisemblances est un ratio de fonctions de vraisemblance, où la
fonction de vraisemblance est par exemple la vraisemblance d'un certain paramètre
étant donné l'échantillon X observé.

Exercice 9.6

Considérons la situation du lancé de pièce de l'exercice 9.1. Supposons qu'à la place de lancer
la pièce 10 fois, on lance plutôt la pièce jusqu'à l'obtention de la première face et que le nombre
total de lancés requis, X , soit noté.
c) Quel est le niveau de signication d'un tel test qui rejette H0 si X ≥ 8 ?
Le niveau α de signication d'un test est la probabilité de rejeter faussement H0 . Or,
sous l'hypothèse nulle que la pièce est bien balancée, on trouve que
P(Rejeter H0 |H0 vraie) = P(X ≥ 8|p = 0,5) = P(7 premiers lancés soient piles|p = 0,5)
= (0,5)7 ≈ 0,00781.

d) Quelle est la puissance de ce test ?


La puissance du test est la probabilité de rejeter H0 sous l'alternative que la vraie
probabilité une face est p. On trouve que
β(p) = P(Rejeter H0 |p = p) = P(X ≥ 8|p = p) = P(7 premiers lancés soient piles|p = p)
= (1 − p)7 .

Exercice9.3.R
1 # ########################### Largeur cible ###########################

3 # STT 2700 - TP 7
# Par : Rébecca Privé
5
# Pour utiliser la fonction xtable
7 library ( " xtable " , lib . loc = " ~ / R / win - library / 3.3 " )
options ( OutDec = ' , ')
9
# #########################################################################
11 # ##### Exercice 9.3 ######

7
# #########################################################################
13

15 setwd ( " C : / Users / USER / Dropbox / Maitrise / STT 2700 / TP8 " )

17 # Implémentons la fonction Beta qui retourne pour une valeur de paramètre


# p donnée la puissance du test .
19
Beta = function ( p )
21 {
# pnorm ( x ) = p (Z < x )
23 A = pnorm ((40 -100 * p ) / sqrt (100 * p * (1 - p ) ) )
B = 1 - pnorm ((60 -100 * p ) / sqrt (100 * p * (1 - p ) ) )
25 return ( A + B )
}
27
pdf ( " Puissance . pdf " , height = 4 , width = 6)
29 p = seq (0 , 1 , by = 0.01) # Vecteur de p pour lesquels Beta ( p ) sera calculé
plot ( Beta ( p ) ~p , type = 'l ' , main = ' Puissance du test selon p ' , ylab = '
Puissance ')
31 dev . off ()

Вам также может понравиться