Вы находитесь на странице: 1из 7

Chapitre 12

Rappel de concepts statistiques


12.2

Mesures de qualit
e pour un estimateur

12.2.1

Biais

Exercice 1

Soit 1 et 2 deux estimateurs sans biais de . Supposons que Var(1 ) =


4, Var(2 ) = 2 et Cov(1 , 2 ) = 1.75. Determinez les valeurs des constantes c1 et c2 qui
minimisent la variance de la combinaison lineaire 3 = c1 1 + c2 2 et qui font de 3 un
estimateur sans biais de . R
eponse c1 = 0.1 et c2 = 0.9.

Exercice 2

Soit 1 et 2 deux estimateurs de 1/.On suppose que 1 et 2 sont independants


et identiquement distribues (i.i.d) ayant comme densite (evaluee au point x)
 2
2 x si 0 < x < 1/,
f1 (x) = f2 (x) =
0
sinon.
Soit lestimateur 3 = c(1 + 22 ). Determinez la constante c pour que 3 soit un estimateur
sans biais de 1/. R
eponse c = 1/2.

Exercice 3

Soit S1 et S2 deux statistiques (i.e. des variables aleatoires qui sont fonctions dun echantillon aleatoire X1 , . . . , Xn et qui peuvent servir destimateur pour un param`etre) qui sont independantes et telles que E(S1 ) = 1, E(S2 ) = 2 et Var(S1 ) =Var(S2 ) =
2 . Determinez la valeur de la constante k afin que la statistique k(S12 S22 ) + S22 soit un
estimateur non biaise de 2 . R
eponse k = 4/3.

Exercice 4

Soit 5 variables aleatoires X1 , . . . , X5 i.i.d. ayant comme distribution une


Bin(1, p), soit une binomiale avec une moyenne de p et une variance de p(1p), quon appelle

aussi une
u
P5Bernoulli. On veut estimer la variance de X par lestimateur Q = k X(1 X), o`
1

X = 5 i=1 Xi est lui-meme un estimateur sans biais de la moyenne p. Determinez la valeur


de k afin que Q soit un estimateur sans biais. (Rappel : E(Z 2 ) =Var(Z) + (E(Z))2 pour une
variable aleatoire Z.) R
eponse k = 5/4.

Exercice 5

Soit une variable aleatoire Y ayant comme distribution une Bin(3, p).
(Rappel : une Bin(3, p) a une moyenne de 3p et une variance de 3p(1 p).) On veut estimer
1

CHAPITRE 12. RAPPEL DE CONCEPTS STATISTIQUES

p(1 p) par lestimateur Q = Y3 1


R
eponse BQ (p = 1/4) = 1/16.

Y
3

. Determinez le biais de lestimateur Q si p = 1/4.

Exercice 6

Soit n variables aleatoires X1 , . . . , Xn i.i.d. suivant une distribution


F
Pn
1
2
(fonction de repartition). Dans un tel contexte, on peut montrer que Sn1 = n1 i=1 (Xi
2 est un estimateur sans biais de Var(X). Determinez le biais de lestimateur Sn2 =
X)
Pn
1
2
i=1 (Xi X) lorsquon estime Var(X), si sa vraie valeur (inconnue) est Var(X) = 2
n
et que la taille de lechantillon est n = 6. R
eponse BSn2 ( 2 ) = 1/3.

Exercice 7

Si X1 , . . . , Xn i.i.d. U (0, ), calculez le biais de lestimateur de , donne

par n = X(n) = max (X1 , . . . , Xn ). Est-il sans biais ? Asymptotiquement sans biais ? (Rappel : X(k) est la k e plus petite valeur dun echantillon X1 , . . . , Xn . Lechantillon ordonne est
donc donne par les statistiques dordre X(1) X(2) . . . X(n) .)

12.2.2

Estimateur convergent

Exercice 8

Soit n variables aleatoires X1 , . . . , Xn i.i.d. suivant une distribution N (, 2 ).


est convergent en tant questimateur de , en utilisant la definition de la
Montrez que X
convergence en probabilite, soit > 0, , lim Pr[ |n | ] = 1, pour un estimateur
n
n .

Exercice 9

Soit n variables aleatoires X1 , . . . , Xn i.i.d. suivant une distribution U (0, ).


Montrez que X(n) est convergent en tant questimateur de , en utilisant la definition de la
convergence en probabilite, soit > 0, , lim Pr[ |n | ] = 1 pour un estimateur n .
n

Exercice 10

Si la distribution de n , un estimateur de , est donnee par Pr[n =


1] = Pr[n = + 1] = 1/2, montrez que n est sans biais, puis quil nest pas convergent.

Exercice 11

Si la distribution de n , un estimateur de , est donnee par Pr[n = ] =


Pr[n = +1/n] = 1/2, montrez que n est biaise mais asymptotiquement sans biais. Verifiez
aussi sil est convergent.

Exercice 12

Si la distribution de n , un estimateur de , est donnee par Pr[n = ] =

1 1/n et Pr[n = + n] = 1/n, montrez que n est biaise et aussi asymptotiquement biaise,
puis quil est convergent.

12.2.3

Erreur quadratique moyenne (EQM)

Exercice 13

X1 , . . . , Xn i.i.d. U (0, ) E(X) =

de
1.
2.
3.

1 = 2X,

2 = X(n) = max(X1 , . . . , Xn )
3 = n+1 X(n) .
n

et Var(X) =

2
.
12

Comparez les EQM

POUR UN ESTIMATEUR
12.2. MESURES DE QUALITE

Exercice 14

Soit lestimateur = 5, i.e. Pr[ = 5] = 1. Autrement dit, peu importe


lechantillon observe, on estime par 5. Determinez son EQM.

Exercice 15

Soit 1 et 2 deux estimateurs de . Supposons que E(1 ) = 0.8,

E(2 ) = , Var(1 ) = 1.22 , Var(2 ) = 1.52 et Cor(1 , 2 ) = 0.6. Determinez les valeurs
des constantes c1 et c2 qui minimisent lerreur quadratique moyen de 3 = c1 1 + c2 2 et
qui font de 3 un estimateur sans biais de . (Supposons > 0.) R
eponse c1 = 0.452986,
c2 = 0.637611.

Exercice 16

Sachant que lesperance dun estimateur est 2, sa variance est 3 et son


biais (pour ) est 1.5, determinez lerreur quadratique moyenne de . R
eponse 5.25.

Exercice 17

Soit 3 variables aleatoires X1 , X2 , X3 i.i.d. suivant une distribution Exp().


(Rappel : E(X) = et Var(X) = 2 si X Exp().) On veut estimer la moyenne de X par
= k X.

k+1
a) Si
b) Si

EQM ()
2
EQM ()
2

= 31 , determinez la constante k. R
eponse k = 1.
= 14 , determinez la constante k. R
eponse k = 3.

Exercice 18 Soit 4 variables aleatoires X1, . . . , X4 i.i.d. suivant une distribution U (, ).


On peut estimer par
1 = X(1)
et par
2 = max(X(1) , X(4) ) = max(|X1 |, . . . , |X4 |),
o`
u X(i) est la ie statistique dordre, cest-`a-dire la ie plus grande valeur parmi lechantillon
X1 , . . . , Xn . Ainsi X(1) = min(X1 , . . . , Xn ) et X(n) = max(X1 , . . . , Xn ). Si la vraie valeur
(inconnue) de est de 6,
a) Determinez le biais de 1 . (Indice : travaillez avec E(1 +) au lieu de E(1 ).) R
eponse
E(1 ) = 3.6 et B1 () = 2.4.
2
b) Determinez lEQM de 1 . (Indice : travaillez avec E((1 + )2 ) au lieu de E(1 ).)
R
eponse EQM1 () = 9.6.
c) Determinez le biais et lEQM de 2 . R
eponse E(2 ) = 4.8, B2 () = 1.2 et
EQM2 () = 2.4.

Exercice 19

Soit une variable aleatoire X ayant une distribution uniforme sur le


domaine ( 5, + 5). Determinez lEQM de la mediane dun echantillon de taille 5 si on
veut estimer . (Indice : La densite de la mediane X(k+1) dun echantillon de taille 2k + 1
(impaire) X(1) , . . . , X(k) , X(k+1) , X(k+2) , . . . , X(2k+1) , evaluee au point y, est donnee par
fX(k+1) (y) =

(2k + 1)!
FX (y)k fX (y)(1 FX (y))k ,
k!k!

o`
u fX (y) et FX (y) sont respectivement la densite et la fonction de repartition de la variable
aleatoire X evaluees au point y.) R
eponse EQM () = 25/7.

CHAPITRE 12. RAPPEL DE CONCEPTS STATISTIQUES

Exercice 20

Soit X1 , X2 , X3 , X4 un echantillon de variables aleatoires i.i.d. selon une

loi uniforme definie sur le domaine [2, 6]. On veut estimer le param`etre par = 0.3X.

Determinez lerreur quadratique moyenne (EQM) de evaluee au point = 5. Notez que


eponse EQM () = 1.75.
E(X) = 4 et Var(X) = 43 2 . R

Exercice 21

Soit 5 variables aleatoires X1 , . . . , X5 i.i.d. suivant une distribution


PnExp().
k
2
1
(Rappel : E(X ) = k! si k = 1, 2, 3, . . . si X Exp().) On veut estimer par n i=1 Xi2 .
Determinez lEQM de cet estimateur si la vraie valeur (inconnue) de est 2. R
eponse
EQM () = 80.
k

12.3

Estimation par intervalle de confiance

Exercice 22

Un echantillon aleatoire de taille 6 provenant dune distribution normale


de moyenne inconnue et de variance inconnue est observe avec les valeurs 5, 6, 9, 10, 12 et
18. Un intervalle de confiance de niveau 92% pour la moyenne de la forme (k, ) est calcule
comme pivot. Determinez la valeur de k.
avec X
On vous donne que Pr(T4 < 1, 7229) = Pr(T5 < 1, 6493) = Pr(T6 < 1, 6033) = 0, 92, o`
u
les variables aleatoires T4 , T5 et T6 suivent une loi Student avec respectivement 4, 5, et 6
degres de liberte.
R
eponse k = 6.84183.

Exercice 23

Un echantillon aleatoire de taille n provenant dune distribution normale


de moyenne inconnue et de variance connue egale `a 25 est observe avec les valeurs x1 , . . . , xn .
Determinez la taille minimum de lechantillon permettant dobtenir une longueur dintervalle
dune valeur de 3 ou moins, pour un intervalle de confiance bilateral de niveau 96% pour la
comme pivot. R
moyenne, en choisissant X
eponse n = 47.

Exercice
24
P

On observe
P51 un echantillon i.i.d. X1 , . . . , X51 de loi inconnue. On calcule
2
eterminez un intervalle de confiance bilateral
X
=
520200
et
que 51
i
i=1
i=1 Xi = 5100. D
de niveau 90% pour la vraie moyenne inconnue E(X), en estimant la vraie variance de X
n
P
1
2
2 , en choisissant X
comme pivot.
(Xi X)
par Sn1
= n1
i=1

R
eponse E(X) (96.7103, 103.2897).

Exercice 25 On observe un echantillon i.i.d. X1, . . . , X50 de loi exponentielle avec


= 20. Determinez un intervalle de confiance bilateral `a 95%
moyenne . On a calcule que X
comme pivot.
pour la moyenne de X en prenant X
a) En ayant recours `a lapproximation par le theor`eme limite central pour la distribution du pivot et en estimant le param`etre dans la variance du pivot. R
eponse
(14.45638, 25.54362).
b) En ayant recours `a lapproximation par le theor`eme limite central pour la distribution
du pivot et en travaillant avec la variance exacte du pivot. R
eponse (15.65949, 27.6694).
c) En travaillant avec la distribution exacte du pivot. R
eponse (15.43672, 26.94621).

`
12.4. TESTS DHYPOTHESES

Pn
Indice : Si X1 , . . . , Xn i.i.d. de loi Exp(), alors
i=1 Xi a une distribution gamma
g(n, ). Aussi si Y suit une loi g(a, b), alors Y /b a une distribution g(a, 1). Utilisez eventuellement les quantiles dune g(50, 1) en prenant 0.025 `a chaque extremite de la densite, soient
g50,1;0.975 et g50,1;0.025 tels que Pr[g50,1;0.975 G g50,1;0.025 ] = 0.95, o`
u G g(50, 1). En
R, utilisez g50,1;0.975 =qgamma(1-0.975,50)*1 et g50,1;0.025 =qgamma(1-0.025,50)*1. En Excel, utilisez g50,1;0.975 =loi.gamma.inverse(1-0,975 ;50 ;1) et g50,1;0.025 =loi.gamma.inverse(10,025 ;50 ;1).

Exercice 26

On observe un echantillon i.i.d., X1 = 15, X2 = 8, X3 = 10, provenant


dune loi exponentielle avec moyenne . Determinez un intervalle de confiance bilateral `a
70% pour la moyenne de X. Utilisez = kX(2) comme pivot, o`
u k est tel que est un
estimateur sans biais de . Supposez que la distribution du pivot est approximativement
normale et en estimant le param`etre dans la variance du pivot si celle-ci depend de .
R
eponse (3.031407, 20.96859).

Exercice 27

On observe un echantillon i.i.d. X1 , . . . , X50 de loi uniforme sur le domaine (0, ). Determinez un intervalle de confiance unilateral de la forme (0, k) `a 99% pour
. Utilisez k X(50) comme pivot, o`
u k est une constante qui en fait un estimateur sans biais de
. Supposez que la distribution du pivot est approximativement normale. Estimez la variance
du pivot en remplacant par son pivot si la variance depend de . La plus grande valeur
observee de lechantillon est 100. R
eponse (0, 106.6536).

Exercice 28 Un echantillon aleatoire de taille 6 provenant dune distribution normale


de moyenne inconnue et de variance inconnue est observe avec les valeurs x1 , . . . , x6 . Un
intervalle de confiance de niveau 90% pour la moyenne de la forme (, k) est calcule `a
(, 10.5125). LIC est bati autour de la moyenne echantillonnale. Determinez la variance
2
echantillonnale sans biais si x = 8.83333. R
eponse Sn1
= 7.7667.
12.4

Tests dhypoth`
eses

Exercice 29

Soit la variable aleatoire X ayant comme densite f (x|) = ( + 2)x+1


si 0 < x < 1 et f (x|) = 0 sinon, avec > 2. On veut tester H0 : = 3 versus H1 : = 13.
On observe un echantillon de taille 1 et la forme de la region critique est X k pour une
constante 0 < k < 1.
a) Determinez la probabilite que lerreur de type II survienne lorsque le niveau du test
est 0.05. R
eponse 0.857375.
b) Si on a observe X = 0.98, determinez la valeur-p du test. R
eponse valeur-p =
0.0960792.

Exercice 30

Soit un echantillon aleatoire de taille n, X1 , . . . , Xn , provenant dune


distribution normale avec une moyenne inconnue et un ecart-type de 5. On veut tester
lhypoth`ese nulle = 3 contre lhypoth`ese alternative > 3 avec un niveau de test de
= 0.05. Determinez la taille de lechantillon minimale pour que la puissance du test soit
au minimum de 97.5%, en supposant que la valeur exacte de sous lhypoth`ese alternative
est 5. R
eponse n = 82.

CHAPITRE 12. RAPPEL DE CONCEPTS STATISTIQUES

Exercice 31

Soit la variable aleatoire X, prenant la valeur 1 si un item tire au hasard


dune chane de montage fonctionne bien, et prenant la valeur 0 sinon. La probabilite quun
item fonctionne bien est p, 0 < p < 1. Cette probabilite est presentement de p = 0.36. Nous
voulons tester si une nouvelle chane de montage est efficace pour ameliorer la proportion
ditems qui fonctionnent bien. Pour cela, on tire au hasard un echantillon (i.i.d.) de 8 items
de la nouvelle chane de montage, et on observe x1 , . . . , x8 . On veut tester H0 : p = 0.36
versus H1 : p > 0.36. (Note : on suppose ici quon sait davance que la nouvelle chane ne
peut faire pire que lactuelle, sinon on aurait teste H0 : p = 0.36 versus H1 : p 6= 0.36.) On
va conclure que la nouvelle chane de montage est significativement meilleure que lactuelle
si le nombre ditems fonctionnant bien dans lechantillon est plus grand ou egal `a un certain
k entier (k (0, 1, 2, . . . , 8)). Si la probabilite acceptable de faire lerreur de type I peut aller
jusqu`a 0.06, determinez la puissance maximale du test si le vrai p de la nouvelle chane de
montage etait de p = 0.5. R
eponse 1 = 0.1445312.

Exercice 32

Supposons que la variable aleatoire X a une densite donnee par f (x) =


si 0 < x < 2, et f (x) = 0 sinon. Afin de tester H0 : = 10 vs H1 : = 20, on recueille
un echantillon de taille 1, soit une seule observation de X.
a) Determinez la probabilite deffectuer lerreur de type II () si le niveau du test est
de = 0.20 et que la region critique du test est de la forme X k pour une constante k.
R
eponse = 0.40.
b) Si on a observe X = 19.5, determinez la valeur-p du test. R
eponse valeur-p = 0.025.
1
2

Exercice 33

Soit des variables aleatoires X1 , . . . , X10 provenant dune premi`ere population qui sont i.i.d. N (x , 32 ) et dautres variables aleatoires Y1 , . . . , Y10 provenant dune
deuxi`eme population independante qui sont i.i.d. N (y , 42 ). On veut tester H0 : x = y vs
Y .
H1 : x > y `a laide de la statistique X
= 11 et Y = 8, est-ce quon rejette H0 ? R
a) Si le niveau du test est = 0.04, X
eponse
Oui, car 11 8 2.768078, et donc on conclut H1 : x > y .
= 11 et Y = 8, est-ce quon rejette
b) Si le niveau du test est = 0.0288897855618, X
H0 ? R
eponse Oui, mais cas limite.
= 10 et Y = 8, determinez la valeur-p du test. R
c) Si X
eponse valeur-p = 0.1029516.
d) Si le niveau du test est = 0.04, determinez la puissance du test si on veut detecter
une difference de moyenne de x y = 4. R
eponse 1 = 0.7820502.

Exercice 34

Soit des variables aleatoires X1 , . . . , X10 provenant dune premi`ere population qui sont i.i.d. N (x , 32 ) et dautres variables aleatoires Y1 , . . . , Y10 provenant dune
deuxi`eme population independante qui sont i.i.d. N (y , 42 ). On veut tester H0 : x = y vs
Y .
H1 : x 6= y `a laide de la statistique X
= 8 et Y = 11, est-ce quon rejette H0 ? R
a) Si le niveau du test est = 0.04, X
eponse
Non, car |8 11| < 3.247262, et donc on conclut par defaut H0 : x = y .
= 8 et Y = 11, est-ce quon rejette H0 ?
b) Si le niveau du test est = 0.05777957, X
R
eponse Oui, mais cas limite.
= 8 et Y = 10, determinez la valeur-p du test. R
c) Si X
eponse valeur-p = 0.2059032.
d) Si le niveau du test est = 0.04, determinez la puissance du test si on veut detecter
une difference de moyenne de |x y | = 4. R
eponse 1 = 0.6829912.

`
12.4. TESTS DHYPOTHESES

Exercice 35

Soit des variables aleatoires X1 , . . . , Xn i.i.d. provenant dune distribution Pareto ayant la densite
f (x) =

12
, x > 0, > 0.
(x + 12)+1


12

On a aussi que F (x) = 1 x+12


. On veut tester H0 : = 5 vs H1 : < 5. Comme X
12
12
(si > 1), et quen isolant , on a = 1 + E(X)
, on peut estimer
estime E(X) = 1
12
par = 1 + X (methode des moments quon verra plus tard) et utiliser comme pivot du
test pour determiner la forme appropriee de la region critique. Supposons que la taille de
lechantillon est n = 1.
a) Determinez la region critique du test si le niveau du test est = 0.10. R
eponse On
rejette H0 : = 5 si X1 7.018718.
b) Determinez la valeur-p du test si on a observe X1 = 6. Conclut-on H0 ou H1 si
= 0.10 ? R
eponse valeur-p=0.1316872. On accepte H0 par defaut car valeur-p > 0.10 (ou
par a) parce que 6 < 7.018718).
c) Determinez la puissance du test de niveau = 0.10 si la vraie valeur de est 1.
R
eponse 1 = 0.6309573.

Exercice 36

Soit des variables aleatoires X1 , . . . , X100 i.i.d. provenant dune distribution Pareto ayant la densite
f (x) =

12
, x > 0, > 0.
(x + 12)+1


12

On a aussi que F (x) = 1 x+12


. On veut tester H0 : = 5 vs H1 : < 5. Comme X
12
12
estime E(X) = 1
(si > 1), et quen isolant , on a = 1 + E(X)
, on peut estimer par
12
= 1 + (methode des moments quon verra plus tard) et utiliser comme pivot du test
X
pour determiner la forme appropriee de la region critique. Utilisez le theor`eme limite central
122
Notez que Var(X) =
pour estimer la distribution de X.
, si > 2.
(1)2 (2)
a) Determinez la region critique du test si son niveau est = 0.10. R
eponse On rejette
3.496343.
H0 : = 5 si X
= 3.6. On conclut H0 ou H1 si
b) Determinez la valeur-p du test si on a observe X
= 0.10 ? R
eponse valeur-p = 0.06066763. On rejette H0 car valeur-p 0.10 (ou par a)
parce que 3.6 3.496343.
c) Determinez la puissance du test de niveau = 0.10 si la vraie valeur de est 4.
R
eponse 1 = 0.8133605.

Вам также может понравиться