Академический Документы
Профессиональный Документы
Культура Документы
Soit une population de taille N sur laquelle est observe une caractristique dont on connat
la moyenne et la variance . Lorsqu'on prlve un individu dans cette population le
rsultat observ est alatoire et constitue donc une observation d'une v.a. X de moyenne et
de variance .
On supposera que la taille de la population est infinie, ou que le taux de sondage est faible
(n/N < 10 %).
La premire observation x1 peut tre considre comme une observation d'une variable
alatoire X1 de mme loi que X;
La deuxime observation x2 peut tre considre comme une observation d'une variable
alatoire X2 de mme loi que X;
..
La nime observation xn peut tre considre comme une observation d'une variable alatoire
Xn de mme loi que X;
Dfinition: Les v.a. (X1, X2, ...., Xn) indpendantes et de mme loi constituent un chantillon
Dfinition: Toute application dfinie sur l'chantillon est appele statistique
Exemples de statistiques importantes:
1) MOYENNE d'chantillon
Soit (X1, X2, ..., Xn) un chantillon d'une v.a. X de loi quelconque.
Notons = E(X) = E(Xi) ; = V(X) = V(Xi)
2) VARIANCE d'chantillon
Soit (X1, X2, ..., Xn) un chantillon d'une v.a. X de loi quelconque.
Notons = E(X) = E(Xi) ; = V(X) = V(Xi)
dans le cas particulier o les Xi suivent des lois de Bernouilli de paramtre p (c..d. prennent
la valeur 1 avec une probabilit p et la valeur 0 avec une probabilit 1-p)
ESTIMATION
Introduction
Lestimation consiste donner la valeur la plus probable dune grandeur. Cest le problme
inverse de lchantillonnage. On dispose de renseignements sur un ou plusieurs chantillons et
on cherche connatre des informations sur la population mre.
On peut faire deux types destimation :
- Lestimation ponctuelle qui consiste proposer une valeur pour la grandeur considre,
- Lestimation par intervalle de confiance qui donne la probabilit que la grandeur soit
comprise dans un intervalle donn.
On remarque que la probabilit quune estimation ponctuelle soit parfaitement exacte est ...
nulle, ou enfin voisine de zro. Il y a donc lieu quand cest possible, de prfrer lestimation
par intervalle de confiance.
I- Estimation ponctuelle :
La dfinition d'un estimateur tant trs vague, nous ne retiendrons que les estimateurs ayant
de bonnes proprits dont les deux principales sont les suivantes:
Dfinition: Un estimateur T d'un paramtre est dit sans biais si et seulement si E(T) =
Dfinition: Un estimateur T d'un paramtre est dit convergent si et seulement si
Exemples importants:
a) Estimateur de la moyenne :
(dans le cas particulier o les Xi suivent des lois de Bernouilli de paramtre p) est un
estimateur sans biais et convergent d'une proportion p.
loi de la population
Paramtre
estimer
Statistique
Loi
connu
N(0 ; 1)
inconnu
Student (n1)
connu
~ N(0 ; 1)
inconnu
~ N(0 ; 1)
Normale
Moyenne
quelconque
n > 30
Variance
n d.d.l.
connu
normale
n-1
d.d.l.
inconnu
Proportion
~ N(0 ; 1)
n > 50
D'aprs la table de la loi N(0 ; 1), tant fix, il est possible de trouver u tel que
Si
Remarque: A priori il existe une infinit de couples (a ; b) vrifiant P[ a < N(0 ; 1) < b] = 1-
On a pris un intervalle symtrique (-u ; u) car pour une loi symtrique comme la loi
normale, c'est celui qui donne un intervalle d'amplitude minimale, donc la plus grande
prcision.
b) Rechercher un intervalle de confiance d'une moyenne d'une population normale dont la
variance est inconnue.
qui est un bon estimateur de la moyenne
D'aprs la table de la loi de Student, tant fix, il est possible de trouver t tel que
Si
Remarque: A priori il existe une infinit de couples (a ; b) vrifiant P[ a < T(n-1) < b] = 1- .
On a pris un intervalle symtrique (-t ; t) car pour une loi symtrique comme la loi de
Student, c'est celui qui donne un intervalle d'amplitude minimale, donc la plus grande
prcision.
De plus,
D'aprs la table de la loi du , tant fix, il est possible de trouver a et b tels que
,
appel intervalle de confiance, contient la valeur inconnue avec une probabilit 1-
D'aprs la table de la loi , tant fix, il est possible de trouver u tel que
D'aprs la table de la loi N(0 ; 1), tant fix, il est possible de trouver u tel que
Si
Remarque: A priori il existe une infinit de couples (a ; b) vrifiant P[ a < N(0 ; 1) < b] = 1-
. On a pris un intervalle symtrique (-u ; u) car pour une loi symtrique comme la loi
normale, c'est celui qui donne un intervalle d'amplitude minimale, donc la plus grande
prcision.
10
D'aprs la table de la loi N(0 ; 1), tant fix, il est possible de trouver u tel que
Si
Remarque: A priori il existe une infinit de couples (a ; b) vrifiant P[ a < N(0 ; 1) < b] = 1-
On a pris un intervalle symtrique (-u ; u) car pour une loi symtrique comme la loi
normale, c'est celui qui donne un intervalle d'amplitude minimale, donc la plus grande
prcision.
11
12
Tests statistiques
Dfinition : Un test est un mcanisme qui permet de trancher entre deux hypothses H0 et H1
partir des rsultats dun chantillon.
H0 est appele hypothse nulle et H1 hypothse alternative.
On se fixe donc a priori un risque (probabilit de rejet de l'hypothse qui serait ralise malgr
les apparences) . La loi de probabilit de la grandeur considre permet de dterminer une
zone de probabilit 1-, niveau de signification du test, dont le complment, de probabilit ,
est appel rgion critique. Si l'estimation tombe dans cette rgion critique, l'hypothse doit
tre rejete avec le risque de se tromper.
Etapes suivre pour un test statistique :
1. nonc de l'hypothse nulle H0 et de l'hypothse alternative H1.
2. Calcul d'une variable de dcision correspondant une mesure de la distance entre les
deux chantillons dans le cas de l'homognit, ou entre l'chantillon et la loi
statistique dans le cas de la conformit. Plus cette distance sera grande et moins
l'hypothse nulle H0 sera probable.
3. Calcul de la probabilit d'obtenir une valeur de la variable de dcision aussi extrme
ou plus extrme que la valeur obtenue, en supposant que H0 soit vraie. Cette
probabilit, gnralement appele risque de premire espce et note , correspond
au risque de rejeter tort H0 si H0 est en fait vraie.
4. Conclusion du test, en fonction d'un risque seuil seuil, en dessous duquel on est prt
rejeter H0. Souvent, un risque de 5% est considr comme acceptable (c'est--dire que
dans 5% des cas quand H0 est vraie, l'exprimentateur se trompera et la rejettera).
Mais le choix du seuil employer dpendra de la certitude dsire et de la
vraisemblance des alternatives.
La probabilit pour que H0 soit accepte alors qu'elle est fausse est , le risque de deuxime
espce. C'est le risque de ne pas rejeter H0 quand on devrait la rejeter. Sa valeur dpend du
contexte, et est trs difficilement valuable (voire impossible valuer), c'est pourquoi seul le
risque est utilis comme critre de dcision.
Tests dajustement :
Principe :
On se demande si un chantillon extrait d'une population correspond raisonnablement
une loi de probabilit hypothtique de distribution connue F(x).
Soit F(x) la fonction de rpartition de la variable chantillonne.
Soit X le caractre tudi. On fait n observations et on obtient un chantillon (x1, x2,.. ., xIII)
deffectifs (n1, n2 ,.,n I).
13
au risque .
Remarque : D2n reprsente d'une certaine manire la distance entre les donnes empiriques et
la loi de probabilit suppose. Sous H0 , D2n suit une loi de probabilit de 2 I-r-1 degrs de
libert o r dsigne le nombre de paramtres estims (de la loi connue F(x)) .
Les tables de 2 permettent de dterminer s'il y a lieu de rejeter l'hypothse en prenant le
risque, fix l'avance, de se tromper.
Rgle de dcision : Si d2n > k on rejette lhypothse dajustement H0 au risque
(o k est tel que P(2 < k) = 1- ; le chi deux tant de degr I-r-1)
Tests dindpendance :
II-
B1
B2
.. Bj
BJ
n11
n21
n12
n22
n1j
n1J
n1.
nI1
n.1
nI2
n.2
nIj
n.j
nIJ
n.J
nI.
n
14
On veut tester :
H0 : X et Y indpendantes contre H1 : X et Y ne sont pas indpendantes.
Do le test suivant : H0 : pij = pi. p.j pour tout i et j contre H1 : pij pi. p.j pour au moins
un couple (i, j)
Notons pij =P(X Ai et Y Bj) ; pi.=P(X Ai) ; p.j = P(Y Bj)
pij est estim par nij /n ; pi. est estim par ni. /n et p.j est estim par n.j /n
On introduit la distance d 2n = (nij-ni. n.j)2/(ni. n.j)/n ralisation de
D2n = (Nij-Ni. N.j)2/(Ni. N.j)/n
Remarque : Sous H0, D2n suit (quand n tend vers linfini) la loi 2 (I-1) (J-1) degrs de
libert.
Dcision du test : Si d2n > k on rejette lhypothse dindpendance H0 au risque (o k est
tel que P(2 < k) = 1- ; le chi deux tant de degr (I-1) (J-1) )
B) Tests paramtriques :
Dfinition : Un test est dit paramtrique si son objet est de tester certaine hypothse relative
un ou plusieurs paramtres dune variable alatoire spcifie ou non.
En gnral, les tests sont bass sur la loi normale.
Comme toujours, l'erreur de premire espce est fixe. Par ailleurs, la moyenne
sera
estime par la moyenne arithmtique . La construction du test est similaire ce que nous
avons vu pour le cas du test simple d'une moyenne. On aboutit :
15
sous
La variable Y suit une loi normale (en effet est connue et joue donc le rle d'une constante)
centre et rduite. La valeur du seuil sera donc dduite d'une table de la loi normale. Il en est
de mme pour l'erreur de deuxime espce et pour la puissance du test.
Comme toujours, l'erreur de premire espce est fixe. Par ailleurs, la moyenne
sera
estime par la moyenne arithmtique . La construction du test est obtenue en remarquant que
l'hypothse H1 peut se dcomposer en deux hypothses lmentaires:
La dtermination des seuils est simple puisque les deux hypothses H et Hsont disjointes.
On a :
16
~ N (0, 1).
Dcision du test :
La valeur critique infrieure vaut t1- /2 et la valeur critique suprieure t1- /2
Si -t1-/2y t1-/2 on accepte lhypothse H0 sinon on la rejette au profit de H1
( P( Y t1-/2) = 1-/2 ; t1-/2 est lu sur la table de N(0,1) )
b) 2 inconnue :
On procde de la mme faon en remplaant 2 par son estimateur S2
Et la nouvelle variable de dcision Y devient :
17
Exercice 1 :
On pense que la moyenne (sur 100) lexamen de math est de 70. On a choisi un chantillon de 50 lves et
on a trouv une moyenne de 68 avec un cart type de 15.
Tester H0 : m= 70
contre HA : m 70
Au niveau de confiance de 95%.
Exercice 2 :
Une socit de Bourse affirme quune nouvelle formule assure votre placement 90%. Dans un chantillon
de 200 personnes soumis cette formule, 160 en sont contents.
Laffirmation de la socit est-elle lgitime un seuil de signification de 0,01 ?
Exercice 3 : (Application au test sur une proportion)
On veut sintresser la proportion p de mnages qui possdent une automobile dans une catgorie
socioprofessionnelle.
On hsite entre deux hypothses : p=p0 et p=p1
Afin de prendre une dcision, on choisit un chantillon de taille 625.
Sur les 625 mnages, 300 possdent une automobile.
1) Tester lhypothse H0 : p=p0 contre H1 : p p0.
2) Application : p0= 50% et p1= 55% ; = 5%
H0 : 2 = 20
19
Dcision du test :
-Test unilatral droit: On rejette H0 si y > t1-
-Test unilatral gauche: On rejette H0 si y < -t
-Test bilatral : On accepte H0 si t1-/2<y<t1-/2
Avec P(Y t1-) =1- ; P(Y -t)= et P(Y t1-/2)= 1-/2 (lecture sur la table de
Student n1+n2-2 ddl)
Exercice :
25 ingnieurs de la compagnie A gagnent un salaire moyen de 9000DH avec un cart type de 1500 DH ; 36
ingnieurs de la compagnie B gagnent un salaire moyen de 11000DH avec un cart type de 2000 DH.
Peut-on conclure que la compagnie B paie mieux ses ingnieurs que la compagnie A ?
On prendra 0,02 comme seuil de signification.
20