Академический Документы
Профессиональный Документы
Культура Документы
Statistiques et probabilits
Ces documents peuvent tre utiliss et modifis librement dans le cadre des activits
d'enseignement scolaire, hors exploitation commerciale.
Toute reproduction totale ou partielle dautres fins est soumise une autorisation
pralable du Directeur gnral de lenseignement scolaire.
La violation de ces dispositions est passible des sanctions dictes larticle L.335-2
du Code la proprit intellectuelle.
fvrier 2012
MENJVA/DGESCO eduscol.education.fr/prog
Introduction
La place des probabilits et des statistiques dans lenseignement des mathmatiques en collge
et en lyce sest considrablement accrue depuis ces dernires annes. Pour les lves entrant en classe
de premire, lapprentissage des probabilits dbute dsormais ds la classe de troisime.
Au collge, lobjectif de cet enseignement est de dvelopper une rflexion sur lalatoire en gnral et
de sensibiliser les lves au fait que les situations alatoires peuvent faire lobjet dun traitement
mathmatique. Un vocabulaire spcifique est introduit et quelques rgles du calcul des probabilits
sont mises en place.
La classe de seconde est loccasion pour llve dapprofondir la formalisation de ces notions en
dgageant notamment la notion de modle probabiliste, et dtre sensibilis, travers des situations de
prise de dcision ou destimation dune proportion, aux premiers lments de statistique infrentielle
comme la notion dintervalle de fluctuation et celle dintervalle de confiance, introduites sous des
conditions de validit qui les rendent rapidement oprationnelles.
Avec la notion de variable alatoire et la dcouverte de la loi binomiale, le programme de Premire
fournit les outils mathmatiques qui permettent, en prenant appui sur la rflexion initie en Seconde
autour de la prise de dcision, de construire un intervalle de fluctuation et dtablir une dmarche de
prise de dcision valables en toute gnralit pour une proportion et une taille dchantillon
quelconques. Ce thme se prte en particulier la mise en uvre dalgorithmes et de raisonnements
logiques et, au-del, une adaptation de ces raisonnements au domaine de lalatoire et de lincertain.
En Terminale, la problmatique de prise de dcision sera travaille nouveau, et la rflexion initie en
Seconde sur lestimation sera approfondie avec lintroduction doutils mathmatiques
supplmentaires.
Dans ce document ressource, le professeur trouvera des complments thoriques et un ensemble de
situations dveloppes dans le cadre du programme officiel. Laccent est surtout mis sur les notions
nouvelles par rapport aux prcdents programmes de Premire : rptition dexpriences identiques et
indpendantes, loi gomtrique tronque, loi binomiale, chantillonnage et prise de dcision avec la loi
binomiale.
Les exemples dapplication ont t choisis pour montrer la varit, la richesse et lactualit des
applications possibles des probabilits et de la statistique. Ils ne prtendent pas lexhaustivit et ne
sont pas conus comme des activits pdagogiques cl en main , tout comme le plan adopt pour
les exposer ne se veut pas une progression pdagogique. Ces situations visent plutt ouvrir des pistes
de travail susceptibles dtre exploites par le professeur ; cest pourquoi elles sont traites de faon
suffisamment dtaille afin de permettre au professeur de sen inspirer pour laborer, partir de la
connaissance de sa classe et de sa pratique professionnelle, des activits pdagogiques ajustes au
niveau de ses lves.
Enfin les points prsents dans les annexes du document ne sont pas des attendus du programme. Ils
doivent tre considrs comme des complments dinformation lattention du professeur sur les
notions introduites. Ils permettent de mieux situer le cadre mathmatique plus gnral dans lequel
sinscrivent les notions au programme.
xmin Q1 Me Q3 xmax
25 % 50 % 75 %
Au-del de la ralisation dun diagramme en bote, il est surtout important de savoir interprter et
dutiliser ces diagrammes pour des comparaisons pertinentes de deux sries statistiques.
1
Dfinition du dcile Dk : pour k de l 9, le ke dcile not Dk est la plus petite valeur dune srie statistique telle quau
moins (k 10) % des valeurs de la srie sont infrieures ou gales Dk .
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 4 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
II. Variables alatoires discrtes
Afin dinterprter lesprance comme la valeur moyenne dans le cas dun grand nombre de
rptitions, on considre lexprience alatoire consistant lancer un d suppos quilibr six faces
et noter le numro observ. On considre ensuite la variable alatoire discrte note X qui prend la
valeur 1 si on observe 1, la valeur 2 si on observe 2, 3 ou 4 et enfin la valeur 4 si on observe 5 ou 6.
Son esprance est
E ( X ) = 1 P( X = 1) + 2 P ( X = 2) + 4 P( X = 4) = 1 1 / 6 + 2 (1 / 6 + 1 / 6 + 1 / 6) + 4 (1 / 6 + 1 / 6) = 15 / 6
,soit E ( X ) = 2,5 .
laide dune simulation, on rpte un grand nombre de fois cette exprience alatoire lidentique et
on peut ainsi observer un grand nombre de ralisations de la variable alatoire X. Le graphique suivant
montre lvolution de la moyenne observe en fonction du nombre n de rptitions.
3,40
3,20
MoyenneobserveetesprancedeX
3,00
2,80
2,60
2,40
2,20
2,00
1,80
0 200 400 600 800 1000
Valeurden
1,80
1,60
VarianceobserveetvariancedeX
1,40
1,20
1,00
0,80
0,60
0 200 400 600 800 1000
Valeurden
0,50
FrquenceobserveetprobabilitdeA
0,40
0,30
0,20
0,10
0 100 200 300 400 500 600 700 800 900 1000
Valeurden
Ainsi le phnomne de stabilisation (expression du registre du langage courant pour dire quune suite
de rels converge) est lillustration de la loi des grands nombres et ce phnomne nest justifiable
que lorsque le modle probabiliste est donn.
2
Un nonc et une preuve de la loi faible des grands nombres sont proposs dans lannexe 2.
3
Ces frquences peuvent tre interprtes comme des moyennes, cest--dire la moyenne des valeurs observes.
1 (R, 1)
R 2 (R, 2)
3 (R, 3)
1 (B, 1)
B 2 (B, 2)
3 (B, 3)
Figure 1
Une fois les issues toutes identifies, il sagit de trouver la probabilit des vnements lmentaires
dtermins par chacune des issues. Il est clair que lquiprobabilit nest pas une rponse possible. En
effet, on a des raisons de penser que la couleur Bleu sera plus probable que la couleur Rouge et
que le chiffre 2 a plus de chances de sortir que les autres ; en consquence, lissue (B,2) a plus de
chances de sortir que lissue (R,1).
Pour affecter une probabilit chacune des issues, nous allons considrer un autre modle (qualifi par
la suite de modle intermdiaire) qui prend en compte, pour la boule extraite, sa couleur et aussi son
numro ventuel, et pour la carte, le chiffre mentionn mais aussi sa couleur. On peut recenser tous les
rsultats par larbre reprsentant les issues possibles ci-aprs.
1 (b2, 1)
2 (b2, 2)
2 (b2, 2)
b2
2 (b2, 2)
3 (b2, 3)
3 (b2, 3)
1 (b3, 1)
2 (b3, 2)
2 (b3, 2)
b3 (b3, 2)
2
3 (b3, 3)
3 (b3, 3)
Figure 2
On obtient 4 6 rsultats possibles. On peut les noter de la faon suivante : (r,1) ; (r,2) ; (r,2) ; (r,2) ;
(r,3) ; (r,3) ; ( b1 ,1) ; ( b1 ,2) ; ( b1 ,2) ; ( b1 ,2) ; ( b1 ,3) ; ( b1 ,3) ; ( b2 ,1) ; ( b2 ,2) ; ( b2 ,2) ; ( b2 ,2) ; ( b2 ,3) ;
( b2 ,3) ; ( b3 ,1) ; ( b3 ,2) ; ( b3 ,2) ; ( b3 ,2) ; ( b3 ,3) ; ( b3 ,3).
Chaque branche de larbre reprsente une issue, et compte tenu des conditions du tirage quiprobable
de la boule, puis du tirage quiprobable de la carte, il ny a pas de raison de penser quune branche de
larbre ait plus de chances dtre parcourue quune autre. On peut donc considrer que chacune des
1
issues prcdentes a la mme probabilit, gale , dtre ralise.
24
Dans le modle intermdiaire, par exemple, lvnement Tirer une boule bleue puis une carte
portant le chiffre 2 se reprsente mathmatiquement par le sous-ensemble des issues {( b1 ,2) ;
( b1 ,2) ; ( b1 ,2) ; ( b2 ,2) ; ( b2 ,2) ; ( b2 ,2) ; ( b3 ,2) ; ( b3 ,2) ; ( b3 ,2)}. Par suite, la probabilit de cet
9
vnement sera gale . Revenant alors au premier modle o lvnement Tirer une boule
24
bleue puis une carte portant le chiffre 2 se reprsente mathmatiquement par lvnement
9
lmentaire {(B,2)}, on prendra pour la probabilit dobtenir lissue (B,2). On peut faire de mme
24
pour les cinq autres issues : (R,1) ; (R,3) ; (B,1) ; (B,2) ; (B,3).
1 (R, 1)
R 2 (R, 2)
3 (R, 3)
1 (B, 1)
B 2 (B, 2)
3 (B, 3)
Figure 3
2. tape 2
On peut alors simplifier davantage larbre de la figure 3, en reprsentant chaque branche par un seul
trait pondr par le nombre de traits composant la branche correspondante dans larbre de la figure 3.
On obtient alors larbre pondr de la figure 4 qui suit :
3
R 2 (R, 2) 1 3
1
2
3 (R, 3) 1 2
1 (B, 1) 3 1
3 1
3
B 2 (B, 2) 3 3
2
3 (B, 3) 3 2
Figure 4
On remarque alors que le produit des nombres rencontrs le long dun chemin reprsentant une issue
du premier modle est gal au nombre de chemins de larbre de la figure 2 qui ralisent lvnement
correspondant dans le modle intermdiaire. Ainsi, pour lvnement Tirer une boule bleue puis une
carte portant le chiffre 2 , cest--dire (B, 2), le produit 3 3 est gal au nombre de chemins dans le
modle intermdiaire, soit 9.
3. tape 3
Cette tape consiste pondrer chaque branche de larbre, non plus avec le nombre de traits
composant la branche correspondante dans larbre de la figure 3, mais avec le quotient de ce nombre
par le nombre total de branches dun mme niveau. On obtient ainsi larbre pondr suivant :
1 1 1 1
1 (R, 1) =
6 4 6 24
3
1 1 3 3
R 6 2 (R, 2) =
4 4 6 24
2 1 2 2
3 (R, 3) =
6 4 6 24
3 1 (B, 1) 3 1 3
1 =
4 6 4 6 24
3
3 3 9
B 6 2 (B, 2) =
4 6 24
2
3 2 6
6 3 (B, 3) =
4 6 24
Figure 5
On remarque alors que le produit des quotients affects aux diverses branches dun chemin aboutissant
3 3
une issue donne du premier modle, par exemple pour (B,2) le produit , est gal la
4 6
9
probabilit, dans cet exemple , que cette issue se ralise. Cette remarque est valable pour toutes les
24
branches de larbre. Au final, on peut constater que larbre de la figure 5 nest rien dautre que larbre
de probabilits associ larbre des possibles de la figure 1.
4
Une issue de lexprience E est une suite ( 1 , 2 ,, k ,, n ) o k est une issue de lexprience E k .
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 11 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
IV. Loi gomtrique tronque
Les situations de rptition dune mme exprience alatoire, reproduite dans des conditions
identiques constituent un lment fort du programme de Premire.
Lintroduction de la loi gomtrique tronque prsente de nombreux avantages :
On a relev ci-dessous, sur tableur, 10 sries de 200 temps dattente. La moyenne et lcart-type de
chaque srie sont affichs. Cela permet de constater combien la dispersion des valeurs individuelles
est grande alors que celle des moyennes est petite.
4. Algorithme de simulation
Le processus li la loi gomtrique tronque est ais mettre en uvre avec un algorithme. Il suffit
de remarquer que linstruction ent(NbrAlat + p) gnre un nombre alatoire entier qui vaut 1 avec la
probabilit p, et 0 avec la probabilit 1 p.
a) En langage naturel
Entres : valeur de n
valeur de p
Initialisations : a prend la valeur 0
k prend la valeur 0
Traitement : Tant que a = 0 et k < n
a prend la valeur ent(NbrAlat + p)
k prend la valeur k + 1
Fin de la boucle "tant que"
Sortie : Si a = 0
Alors afficher message "X = "
valeur de a
Sinon afficher message "X = "
valeur de k
Fin de linstruction conditionnelle
5
La convention, X = 0 si aucun succs na t obtenu, permet dassurer les mmes valeurs pour P(X = k) et
P(Y = k) pour k [ 1 , n1 ] si X suit la loi gomtrique tronque de paramtres n1 et p, Y la loi gomtrique
tronque de paramtres n2 et p, avec n1 < n2.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 13 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
b) Avec une calculatrice (modle TI 84+)
Linstruction "et" se trouve dans le catalogue.
Ainsi, pour les diagrammes correspondant aux valeurs n = 30 et n = 60, il nest pas surprenant de ne
voir figurer aucune ralisation de la valeur 0. De mme, les btons correspondant aux valeurs de k
suprieures ou gales 13 ont une hauteur pratiquement nulle.
Pour p = 0,8 , on obtient en fonction de n :
P ( X = 0) = (0,2) n et pour 1 k n , P( X = k ) = 0,8 (0,2) k 1 .
(0,2) n < 0,002 pour n > 3 et 0,8 (0,2) k 1 < 0,0005 pour k > 5 .
Les diagrammes correspondants sont compatibles avec ces valeurs seuil. En particulier, pour n = 5, on
nobserve pas de ralisation de la valeur 0.
[ ]
n n
1. Montrer que E ( X ) = p
k =1
k (1 p ) k 1 = p kq
k =1
k 1
= p 1 + 2q + 3q 2 + L + nq n 1 .
b. Vrifier que la fonction f est drivable sur lintervalle ] 0 ,1 [ et calculer deux expressions
diffrentes de f ( x) pour tout rel x lment de lintervalle ] 0 ,1 [ .
n
c. En dduire le calcul de la somme 1 + 2 x + 3x 2 + L + nx n 1 = k x
k =1
k 1
pour tout rel x de
lintervalle ] 0 ,1 [ .
3. Prouver lgalit E ( X ) =
1
p
[
1 (1 + np )(1 p) n . ]
4. Utiliser un outil numrique ou graphique pour mettre une conjecture sur la limite de E ( X ) lorsque
n tend vers linfini.
Remarque :
1
La limite de E ( X ) semble tre gale (voir les illustrations en annexe 3).
p
u n +1
Pour cela, on peut considrer la suite (v n ) dfinie par v n = . Elle converge vers 1 p qui est
un
strictement infrieur 1. On obtient la limite de la suite (u n ) par comparaison avec une suite
gomtrique de limite nulle.
a) nonc
Pour limiter le nombre de filles dans un pays (imaginaire ?), on dcide que :
chaque famille aura au maximum 4 enfants ;
chaque famille arrtera de procrer aprs la naissance dun garon.
On considre que chaque enfant a une chance sur deux dtre un garon ou une fille et que, pour
chaque couple de parents, le sexe dun enfant est indpendant du sexe des prcdents.
Ce choix a-t-il la consquence attendue, savoir de diminuer le nombre de filles dans la population ?
Il nest pas inintressant de solliciter dabord une rponse a priori, cest une faon dentrer dans le
problme et de motiver son tude.
On entre en A4 : =ENT(ALEA()+0,5)
Il reste recopier les formules de la ligne 4 jusqu la ligne 1003. Le calcul de N, G et P est alors
immdiat.
La simulation montre clairement que la proportion de garons semble bien rester voisine de 0,5. La
politique nataliste mise en place naurait donc aucun effet sur la modification de cette proportion.
On observerait la mme chose lorsque la probabilit de naissance dun garon est gale p.
1/2 F
1/2 G famille G
15 15 E (G ) 1
E(N ) = , E (G ) = , donc = .
8 16 E(N ) 2
Cette situation peut se prter une diffrenciation pdagogique selon que lon envisage la valeur
p = 0,5 ou p quelconque, selon que lon sen tienne 4 enfants au plus ou que lon gnralise n
enfants au plus.
d) Gnralisation
On considre lexprience alatoire qui consiste rpter dans des conditions identiques une exprience
de Bernoulli de paramtre p avec au maximum n rptitions et arrt du processus au premier succs. On
note toujours X la variable alatoire qui reprsente le rang du 1er succs et qui vaut 0 si aucun succs na
t obtenu. La variable alatoire X suit la loi gomtrique tronque de paramtres n et p.
On considre les variables alatoires A, nombre de succs et B, nombre dtapes du processus
alatoire.
La loi de la variable alatoire A est trs simple, elle ne prend que deux valeurs 0 et 1 avec :
P ( A = 0) = P ( X = 0) = (1 p) n
k =n
P ( A = 1) = P( X = k ) = 1 (1 p)
k =1
n
[ ]
n 1
E ( B) = k p(1 p)
k =1
k 1
+ n p(1 p) n 1 + (1 p) n ,
n
soit E ( B) = k p(1 p)
k =1
k 1
+ n (1 p) n , ou encore E ( B) = E ( X ) + n (1 p) n .
gale p. Il est remarquable de retrouver cette probabilit de succs, quel que soit le nombre maximal
dtapes du processus.
2. Le paradoxe de Saint-Ptersbourg
Formul par Nicolas Bernoulli en 1713, ce problme a t approfondi par son cousin Daniel Bernoulli
dans louvrage Les transactions de lAcadmie de Saint-Ptersbourg, ce qui lui a valu son nom.
a) nonc
Un joueur joue contre la banque au jeu de pile ou face , en misant toujours sur face . Il adopte la
stratgie suivante : il mise un euro au premier coup, et sil perd, double la mise au coup suivant, tant
que face ne sort pas. Sil gagne, il rcupre sa mise augmente dune somme quivalente cette
mise. Le joueur dispose dune fortune limite, qui lui permet de perdre au maximum n coups
conscutifs et, si pile sort n fois de suite, le joueur ne peut plus miser et arrte le jeu. La fortune de
la banque, elle, nest pas limite.
Une partie consiste pour le joueur jouer, si sa fortune le lui permet, jusqu ce que face sorte.
Il sagit de dterminer la probabilit qua le joueur de gagner une partie, son gain algbrique moyen
par partie, et danalyser lintrt pour le joueur de jouer ce jeu.
b) Traitement mathmatique
Pour modliser la situation, on suppose que le joueur lance la pice n fois : si face sort avant le n-
ime coup, le joueur ne mise rien les coups suivants. Lorsquil joue n fois de suite pile ou face ,
on note :
1
La variable alatoire X suit la loi gomtrique tronque de paramtres 9 et . Elle prend les valeurs
2
1
entires de 0 9, avec P ( X = 0) = P ( A 9 ) = et, pour k compris entre 1 et 9 :
29
1 1 1
P( X = k ) = k 1
1 = k .
2 2 2
9
1 1 1 1
On vrifie bien que P( X = k ) = 2 + 2
k =0
2
+ ... + + =1.
29 29
Si face ne sort pas, le joueur a perdu toutes ses mises, soit (en euro) 1 + 2 + ... + 28 = 29 1 = 511 .
Valeurs de Y +1 (29 1)
1 1
Probabilits 1
29 29
1 1
E (Y ) = 1 1 9 (2 1) 9 = 0 .
9
2 2
Quoique faible, la probabilit de perdre nest pas ngligeable. Sur la simulation prcdente, on
saperoit que le joueur perd effectivement 6 parties sur 1000. Il perd donc six fois 511 , soit 3066 .
Il a gagn 994 parties qui lui rapportent chacune 1 , soit un gain total de 994 . Il a donc perdu 2972
euros sur 1000 parties, soit environ 3 euros par partie en moyenne.
Cependant, puisque E (Y ) = 0 , le jeu est honnte. La stratgie mise en place donne une esprance de
gain identique celle du simple jeu de pile ou face. Cest un premier paradoxe.
Par ailleurs, ce problme montre la limite de la notion desprance pour juger si un jeu est favorable.
En effet, la simulation prcdente a rvl que la perte est importante, et quelle se produit plusieurs
fois sur 1000 parties. Peu de joueurs saventureraient dans un jeu pourtant honnte o lon risque de
perdre gros, mme si ce risque est faible, alors que lon gagne peu. Cest l le deuxime paradoxe.
La notion de risque, lie celle de la dispersion de la variable alatoire gain , est un lment dcisif
dapprciation dun jeu. Le paradoxe de Saint-Ptersbourg est lun des problmes ayant donn
naissance la thorie de la dcision en conomie. Dans cette thorie, on formalise en particulier la
notion de fonction dutilit, qui mesure le degr de satisfaction dun consommateur.
Le joueur est gagnant lorsque la flche sarrte sur la zone bleue comme sur la figure
ci-contre. rouge
On dcide de noter S (comme succs) cette ventualit et de noter E (comme chec) lventualit
contraire cest--dire la flche tombe sur la zone rouge .
Une exprience deux issues, succs ou chec, est appele preuve de Bernoulli . La loi de
Bernoulli de paramtre p est la loi de la variable alatoire qui prend la valeur 1 en cas de succs
et 0 en cas dchec, o p dsigne la probabilit du succs.
Consigne aux lves : on joue trois fois de suite dans des conditions identiques et on dsigne par X la
variable alatoire qui donne le nombre de succs obtenus. Raliser un arbre pondr reprsentant cette
situation et en dduire la loi de la variable alatoire X puis son esprance mathmatique.
{X = 0} {X = 4} {X = 1} {X = 2}.
Il faut observer que les probabilits P ( X = 1) et P ( X = 2) sobtiennent en comptant les chemins qui
conduisent respectivement 1 et 2 succs.
S
S
E
S S
E
E
S S
S E
E S
E E
S
S E
S S
E
E
E S
S
E
E S
E
E
Par dfinition, la loi binomiale de paramtres n et p, note B(n, p), est la loi de la variable alatoire
X qui donne le nombre de succs dans la rptition de n preuves de Bernoulli de paramtre p.
Lvnement {X = 0} est ralis sur lunique chemin de larbre qui ne comporte que des checs, cest-
-dire le dernier chemin de larbre qui est constitu de n branches qui ont toutes la probabilit 1 p .
Do le rsultat : P ( X = 0) = (1 p) n .
Lvnement {X = n} est ralis sur lunique chemin de larbre qui ne comporte que des succs, cest-
-dire le premier chemin de larbre qui est constitu de n branches qui ont toutes la probabilit p.
Do le rsultat : P ( X = n) = p n .
Calcul de P ( X = 1) et de P ( X = n 1)
Lvnement {X = 1} est ralis sur les chemins de larbre qui comportent exactement un succs et
n 1 checs. La probabilit de chacun de ces chemins est : p (1 p) n 1 .
Il reste dterminer combien de chemins de ce type figurent dans larbre pondr. Cette question est
assez simple dans la mesure o il suffit de reprer quel niveau de larbre figure lunique succs. Il y
a donc n possibilits et ainsi n chemins qui ralisent lvnement {X = 1} .
Do le rsultat : P ( X = 1) = n p (1 p) n 1 .
Lvnement {X = n 1} est ralis sur les chemins de larbre qui comportent exactement n 1
succs et 1 chec. La probabilit de chacun de ces chemins est : p n 1 (1 p ) .
Il reste dterminer combien de chemins de ce type figurent dans larbre pondr. Comme
prcdemment, il suffit de reprer quel niveau de larbre figure lunique chec. Il y a donc encore n
possibilits et ainsi n chemins qui ralisent lvnement {X = n 1} .
Do le rsultat : P ( X = n 1) = n p n 1 (1 p ) .
3. Coefficients binomiaux
Pour dterminer par exemple, P ( X = 2) on procderait de la mme faon : la probabilit de chaque
chemin qui ralise exactement deux succs est : p 2 (1 p )
n2
. Il faut ensuite multiplier cette
n
probabilit par le nombre de chemins qui prsentent exactement deux succs. Ce nombre est not
2
et on lit 2 parmi n . Il peut tre obtenu avec une calculatrice ou avec un tableur.
n
Si n est un entier naturel et si k est un entier compris entre 0 et n, on note et on lit
k
k parmi n le nombre de chemins qui ralisent exactement k succs dans larbre n niveaux,
associ un schma de Bernoulli. Ces nombres sont appels coefficients binomiaux.
n
Ces nombres sont par construction des entiers et ltude prcdente nous fournit quelques valeurs :
k
n n
quel que soit n, entier naturel : = 1 ; = 1 ,
0 n
n n
quel que soit n, entier naturel non nul : = n ; = n ,
1 n 1
4 4 5
= 4 ; = 6 ; = 10 .
1 2 2
B. Proprits
1. Expression de la loi binomiale
n
Remarque : les coefficients binomiaux interviennent comme coefficients dans la formule
k
gnrale ci-dessus, mais aussi dans la formule du binme de Newton qui donne le dveloppement de
(a + b ) n pour tous rels a et b.
2. Proprits des coefficients binomiaux
Symtrie
Le nombre de chemins ralisant n k succs est aussi le nombre de chemins ralisant k checs. Par
symtrie, on obtient autant de chemins ralisant k succs que de chemins ralisant k checs.
n n
Si n est un entier naturel et si k est un entier compris entre 0 et n, alors = .
k n k
n + 1
Le coefficient binomial donne le nombre de chemins qui ralisent exactement k + 1 succs.
k + 1
- Si la dernire tape donne un succs, il faut compter les chemins qui au niveau prcdent
n
conduisaient exactement k succs. On sait que chemins sont dans ce cas.
k
n n
En conclusion, + chemins de larbre des n + 1 rptitions conduisent k + 1 succs, do
k k + 1
le rsultat :
n + 1 n n
Si n est un entier naturel et si k est un entier compris entre 0 et n 1, alors = + .
k + 1 k k + 1
n
chemins
k + 1
k + 1 succs chec
On pourra se reporter lannexe 5 pour lutilisation de quelques outils de calcul avec la loi binomiale.
n = 10 ; p = 0,15 n = 15 ; p = 0,85
Grandes binomiales
n = 40 ; p = 0,25 n = 80 ; p = 0,85
Lobservation des diffrentes reprsentations graphiques permet de constater les comportements suivants :
dplacement vers la droite du diagramme n fix en fonction de la croissance de p ;
constatation analogue si p est fix et n augmente ;
allure symtrique en cloche des grandes binomiales ; il est facile de dmontrer lexacte
symtrie de la reprsentation lorsque p = 0,5 ;
dispersion maximale lorsque p = 0,5 .
4. Esprance et cart-type
Il sagit ici de proposer une activit conduisant une conjecture sur lexpression de lesprance et de
lcart-type dune loi binomiale.
On utilisera le tableur pour calculer, laide de linstruction SOMMEPROD, lesprance et la variance
de la loi B(n, p) pour diffrentes valeurs de n et p. La variance est obtenue partir de la relation
V ( X ) = E ( X 2 ) E ( X ) 2 (cette formule nest pas un attendu du programme).
Pour la copie dcran ci-dessous la valeur de p est 0,2 et les valeurs de n vont de 5 50 avec un pas de
5 units.
3 2,5
2,5
2
2
1,5
1,5
1
1
0,5 0,5
0 0
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
10 3
8 2,5
2
6
1,5
4
1
2
0,5
0 0
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
16 4
14 3,5
12 3
10 2,5
8 2
6 1,5
4 1
2 0,5
0 0
0 0,2 0,4 0,6 0,8 1 1,2 0 0,2 0,4 0,6 0,8 1 1,2
Lorsque la valeur de n est fixe, on observe que lesprance de la loi binomiale semble aussi tre une
fonction linaire de p. De plus, on peut noter que la valeur obtenue avec le cas particulier p = 1
correspond la valeur de n qui a t fixe. Do la conjecture E ( X ) = n p que le professeur validera
dans le cours.
En revanche, la variance se comporte comme une fonction du second degr en p. On peut noter aussi
que la variance semble bien tre maximale pour p = 0,5 comme lobservation des reprsentations
graphiques le laissait prvoir.
Un rinvestissement des notions danalyse permet, par exemple, de dterminer les fonctions
polynmes du second degr qui sont maximales en 0,5 et qui sannulent en 0 et 1. La linarit selon la
variable n incite chercher un coefficient multiple de n et quelques essais permettent daboutir
lexpression V ( X ) = np (1 p ) que le professeur validera dans le cours.
a) Appariement
On a reprsent ci-dessous la distribution de probabilit de quatre variables alatoires suivant les lois
binomiales B (30 ; 0,1), B (30 ; 0,5), B (30 ; 0,9), B (29 ; 0,5).
b) Le quorum
Une association comprenant 30 adhrents organise chaque anne une assemble gnrale. Les
statistiques montrent que chaque adhrent assiste lassemble avec la probabilit 80 %. Les dcisions
prises par lassemble nont de valeur lgale que lorsque plus de la moiti des adhrents assiste
lassemble.
Quelle est la probabilit que, lors de la prochaine assemble, le quorum soit atteint ?
c) Paradoxe ?
Paul affirme : Avec un d rgulier, on a autant de chance dobtenir au moins un six en 4 lancers que
dobtenir au moins deux six avec 8 lancers .
Sara objecte : Pas du tout. Dans le premier cas, la probabilit est suprieure 0,5, dans le deuxime
cas, elle est infrieure 0,5. .
Qui a raison ?
e) Lancers de pice
On lance une pice quilibre n fois. On sintresse la probabilit dobtenir face dans 60 % des
cas ou plus.
Envisager les cas n = 10 , puis n = 100 , puis n = 1000 .
Donner dabord, sans calcul, une estimation spontane du rsultat, puis solliciter la calculatrice
( n = 10 ) ou un algorithme de calcul ( n = 100 et n = 1000 ).
a) Contrle de production
Une entreprise fabrique chaque jour 10 000 composants lectroniques. Chaque composant prsente un
dfaut avec la probabilit 0,002. Si le composant est repr comme tant dfectueux, il est dtruit par
lentreprise, et chaque composant dtruit fait perdre 1 lentreprise.
a) Les composants sont contrls un un, et chaque contrle cote 0,1 . Quel est le cot moyen
journalier pour lentreprise (contrles et destruction des composants dfectueux) ?
b) Les composants sont regroups par lots de 10, et on effectue un unique contrle automatique
de chaque lot, qui cote lui aussi 0,1 . lissue de ce contrle, le lot est accept si tous les
composants sont sains, et globalement dtruit si lun au moins des 10 composants prsente un
dfaut. Quel est le cot moyen journalier pour lentreprise de ce nouveau dispositif (contrles
et destruction des composants dfectueux) ?
b) Le QCM
Un QCM comporte 20 questions. Pour chaque question, quatre rponses sont proposes dont une seule
est juste. Chaque rponse juste rapporte un point et il ny a pas de pnalit pour une rponse fausse.
Un candidat rpond au hasard chaque question.
Quel nombre total de points peut-il esprer ?
Quelle pnalit doit-on attribuer une rponse fausse pour que le total espr, en rpondant
entirement au hasard, soit gal 2 sur 20 ?
c) Correction de fautes
Un texte contient n erreurs. Lors dune relecture, on considre que chaque erreur a 80 % de chances
dtre corrige.
Peut-on prvoir, en moyenne, le nombre derreurs restantes aprs une relecture, , aprs k relectures,
k tant un entier suprieur 1 ?
Il existe une valeur k de X telle que P ( X k ) = 0, 025 P( X k ) < 0, 025 et P( X k + 1) > 0, 025
k k
2,5 % a = k +1 2,5 % a = k +1
a a
Valeurs entires croissantes prises par X Valeurs entires croissantes prises par X
Dtermination de b
Il existe une valeur k de X telle que P ( X k ) = 0,975 P( X k ) < 0,975 et P( X k + 1) > 0,975
a a
97,5 % k 97,5 % k
b=k b = k +1
Remarques :
1. Ce jeu sur les ingalits strictes est d au caractre discret de la variable alatoire X considre
(on pourra sen convaincre dans la partie C).
2. Les entiers a et b dpendent de la taille n de lchantillon.
La connaissance de la loi binomiale de la variable alatoire X rend maintenant possible le calcul de la
a b
probabilit P F = P(a X b ) .
n n
a b
On remarque que lintervalle , est quasiment centr sur p ds que n est assez grand et que
n n
a b 1 1
lintervalle , est quasiment le mme que lintervalle p ,p+ donn dans le
n n n n
programme de seconde pour les grandes binomiales ( n > 25 et 0,2 < p < 0,8 o n est la taille de
lchantillon prlev et p est la proportion dans la population du caractre tudi, conditions nonces
dans le programme de seconde).
On trouvera des exemples dans le sous-paragraphe C ci-aprs.
a b a b
Lintrt de lintervalle , (quil conviendrait de noter n , n pour tre prcis), calcul
n n n n
partir de la loi binomiale, est de fournir un intervalle convenable pour toutes les valeurs de n et de p,
1 1
alors que lintervalle p ,p+ nest pas adapt pour les petites binomiales .
n n
0,12
0,1
Intervalle de
0,08 fluctuation :
0,06 au moins
95 %
0,04
0,02
0
0 5 10 15 20 25 30 35 40
Dun point de vue algorithmique, il est plus efficace de travailler avec les probabilits cumules
croissantes, que la calculatrice ou le tableur fournissent facilement. En tabulant les probabilits
cumules P ( X k ) , pour k allant de 0 100, il suffit de dterminer le plus petit entier a tel que
P( X a ) > 0,025 et le plus petit entier b tel que P(X b) 0,975.
a b
Le calcul, laide de la loi binomiale, de lintervalle de fluctuation au seuil de 95 %, , , de la
n n
frquence des chantillons alatoires de taille n, correspondant la zone dacceptation dune
hypothse sur une proportion, peut ainsi faire lobjet dune recherche dalgorithme.
On peut, par exemple, procder sur un tableur comme le montre limage dcran ci-dessous.
La cellule B3 contient la valeur de n, taille de lchantillon. La cellule D3 contient la valeur de p,
proportion suppose dans la population.
On a entr en B6 la formule =SI(A6<=B$3;LOI.BINOMIALE(A6;B$3;D$3;VRAI);"")
pour tabuler les probabilits P(X k) lorsque X suit la loi binomiale de paramtres n et p.
On a entr en C6 la formule =SI(B6>0,025;A6/B$3;"")
pour afficher les valeurs de k telles que P(X k) dpasse strictement 0,025.
On a entr en D6 la formule =SI(B6>=0,975;A6/B$3;"")
pour afficher les valeurs de k telles que P(X k) gale ou dpasse 0,975.
Ces trois formules ont t ici recopies vers le bas jusqu la ligne 1 006 (lalgorithme fonctionne pour
une valeur maximale de n gale 1 000, mais on peut, en cas de besoin, recopier plus bas).
Lintervalle de fluctuation au seuil de 95 % est affich en cellules F8 et G8 contenant les formules
=MIN(C6:C1006) et =MIN(D6:D1006).
D. Exemples dactivits
1. Exemple 1 : politique dans un pays lointain
Monsieur Z, chef du gouvernement dun pays lointain, affirme que 52 % des lecteurs lui font confiance.
On interroge 100 lecteurs au hasard (la population est suffisamment grande pour considrer quil sagit
de tirages avec remise) et on souhaite savoir partir de quelles frquences, au seuil de 95 %, on peut
mettre en doute le pourcentage annonc par Monsieur Z, dans un sens, ou dans lautre.
1. On fait lhypothse que Monsieur Z dit vrai et que la proportion
des lecteurs qui lui font confiance dans la population est 0,52. k P(X k)
Montrer que la variable alatoire X, correspondant au nombre 40 0,0106
dlecteurs lui faisant confiance dans un chantillon de 100 41 0,0177
lecteurs, suit la loi binomiale de paramtres n = 100 et p = 0,52.
42 0,0286
2. On donne ci-contre un extrait de la table des probabilits 43 0,0444
cumules P(X k) o X suit la loi binomiale de paramtres n = 100 ... ...
et p = 0,52.
61 0,9719
a. Dterminer a et b tels que : 62 0,9827
a est le plus petit entier tel que P(X a) > 0,025 ; 63 0,9897
b est le plus petit entier tel que P(X b) 0,975. 64 0,9941
b. Comparer lintervalle de fluctuation au seuil de 95 %,
a b 1 1
n , n , ainsi obtenu grce la loi binomiale, avec lintervalle p , p+ .
n n
0,09
0,08 Intervalle de
0,07 fluctuation :
0,06 au moins
0,05 95 %
0,04
0,03
0,02
0,01
0
25 30 35 40 45 50 55 60 65 70 75 80
k P(X k) frquence k / n
672 0,0245 0,772
673 0,0296 0,774
... ... ...
718 0,9733 0,825
719 0,9783 0,826
Entreprise A 57 43 100
Peut-on suspecter lune des deux de ne pas respecter la parit hommes-femmes lembauche ?
6. Exemple 6 : gnrateur de nombres alatoires
1. Sur un tableur, on entre dans la cellule A1 la formule = ENT(ALEA()*2), que lon recopie vers le
bas jusquen A100. On dnombre alors que le nombre 1 apparat 58 fois dans la plage de cellules A1 :
A100. Au seuil de 95 %, peut-on rejeter lhypothse selon laquelle le gnrateur de nombres alatoires
du tableur fonctionne bien ?
2. Mme question si lon recopie la formule vers le bas jusquen A1000, et que lon dnombre 580
occurrences du nombre 1 dans la plage de cellules A1 : A1000.
a b
La notation n , n retenue ici rappelle que les entiers a n et bn dpendent de lentier n.
n n
Les programmes demandent de comparer, pour une taille de lchantillon importante, cet intervalle
1 1
avec lintervalle de fluctuation p ,p+ exploit en classe de seconde. Ce dernier
n n
0,9
0,8
Frquence f observe
0,7
a/n
0,6
b/n
0,5
p - 1/rac(30)
0,4 p + 1/rac(30)
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
0,7
0,6 a /n
0,5
b /n
p - 1/rac(100)
0,4
p + 1/rac(100)
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
6
Voir lannexe 8.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 40 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Intervalle de fluctuation au seuil de 95 % pour des chantillons de taille 1 000
1
0,9
0,8
Frquence f observe
0,7
0,6 a /n
0,5
b /n
p - 1/rac(1000)
0,4
p + 1/rac(1000)
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
a b
On observe que lintervalle de fluctuation n , n est sensiblement le mme que lintervalle
n n
1 1
p ,p+ lorsque n est assez grand et p ni trop petit ni trop grand : pour n = 30 , cest le cas
n n
lorsque p est compris entre 0,3 et 0,7 ; pour n = 100 , cest le cas lorsque p est compris entre 0,2 et 0,8 ;
pour n = 1000 , cest le cas lorsque p est compris entre 0,05 et 0,95.
On se donne une srie statistique quantitative x1 , x 2 , K , x n , que lon veut rsumer par un couple
dindicateurs donnant un renseignement sur la position et sur la dispersion de la srie.
Supposons dabord que n = 2 pour dgager lide.
Si le point M ( x,..., x) prcdemment dcrit existe, nous convenons de nommer indicateur de position
de la srie le nombre x, et indicateur de dispersion associ la distance d ( A, M ) .
Il existe plusieurs distances dans Rn. Recherchons les couples dindicateurs correspondant trois
distances classiques :
n n
1 1
d1 ( A, M ) =
n
x
i =1
i x , d 2 ( A, M ) =
n
(x
i =1
i x) ,
2
d ( A, M ) = max x i x .
i =1,K, n
Ces trois expressions dpendent uniquement de la variable relle x. Dans la suite, nous les notons plus
simplement d1 ( x) , d 2 ( x) et d (x) .
(( x ) 1n ( x x)(2 x
n n
1
x x ) = (x x ) 0 .
2
d 2 ( x) d 2 ( x ) = i x) 2 ( xi x ) 2 = i
n i =1 i =1
Donc d 2 ( x) d 2 ( x ) 0 .
Le cas de la fonction d1 est moins courant dans la littrature. On commence par ordonner par ordre
croissant les observations, et on suppose donc dsormais que x1 x 2 K x n . Un calcul un peu plus
fastidieux amne distinguer deux cas :
Dans les deux cas, une valeur qui minimise d1 est une mdiane Me de la srie statistique. Comme on
lavait dj not dans les classes du collge, dans le cas dune srie comportant un nombre pair
dobservations, une mdiane nest pas dfinie de manire univoque et il appartient donc de choisir une
convention si on veut dfinir "la" mdiane. Nanmoins, on peut remarquer que la valeur minimale de
1 n
d 1 obtenue est d1 (Me ) =
n i =1
xi Me qui est lcart absolu moyen la mdiane. Ainsi une mdiane
est associe naturellement cet cart moyen. Bien entendu, cet indicateur de dispersion est bien moins
utilis que lcart interquartile Q 3 Q1 .
Conclusion : avec la distance d1 , le couple dindicateurs associ la srie est le couple (mdiane,
cart moyen la mdiane).
1
La fonction d admet un unique minimum en x = (x1 + x n ) , milieu des deux valeurs extrmes.
2
Cest un indicateur de position qui nest pas rpandu, mais il est associ un paramtre de dispersion
qui, lui, est plus connu : la valeur minimale de d obtenue en x est gale la moiti de ltendue
x n x1 .
Conclusion : avec la distance d , le couple dindicateurs associ la srie est le couple (milieu des
extrmes, demi-tendue).
Pour une suite ( X k )k 1 de variables alatoires indpendantes et de mme loi admettant comme
esprance commune m et comme variance 2 , la loi faible des grands nombres tablit que pour tout
1 n
> 0 , la probabilit que la moyenne empirique
n k =1
X k scarte de m dau moins tend vers 0
1
> 0, lim P
n n
X k m = 0.
k =1
On propose de montrer ce rsultat dans le cas particulier dun schma de Bernoulli et on note S n la
variable alatoire comptant le nombre de succs. La variable alatoire S n suit la loi binomiale B(n, p)
o p est la probabilit dobtenir un succs.
On se donne > 0 et on majore :
1 n 1 n
P X k m = P S n p = P ( S n np n ) = P ( S n E ( S n ) n ) o S n = X
n n
k
k =1 k =1
1 n
[
Var(S n ) E (S n E ( S n ) )2 ]
P
n Xk m
n 2 2
=
n 2 2
k =1
o on a utilis lingalit de Tchebychev qui stipule que pour une variable alatoire Z admettant une
variance, on a pour tout nombre rel a > 0 : P ( Z E ( Z ) a )
Var( Z )
.
a2
Comme la variance dune loi binomiale de paramtres n et p est gale np(1 p) et que son
esprance est np , on en dduit que :
1 np (1 p )
lim P
n n
X k p lim
n n 2 2
=0.
k =1
1 n
On dit aussi que
n k =1
X k converge en probabilit 7 vers p quand n tend vers linfini. Ceci prouve la
thorme indique comment se comporte, lorsque n tend vers linfini, la probabilit que lerreur
1 n
X k m appartienne un intervalle [a , b] quelconque.
n k =1
7
Il existe une loi forte qui correspond un autre type de convergence, la convergence presque sre.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 44 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
C. Esprance de la loi gomtrique tronque : approches exprimentales
1. Calculatrice
1
On peut faire tablir lgalit E ( X ) =
p
[ ]
1 (1 + np )(1 p) n , puis utiliser un outil numrique ou
graphique pour mettre une conjecture sur la limite de E ( X ) lorsque n tend vers linfini.
Pour p = 0,2 par exemple, il semble que les valeurs se stabilisent autour de 5, do lide de tracer la
1
droite dquation y = .
p
p = 0,15 p = 0,25
La variable X prend ses valeurs dans N* et pour tout entier naturel k non nul : P ( X = k ) = (1 p ) k 1 p .
1 1 p
On montre que : E ( X ) = (en utilisant la drive dune srie gomtrique) et que V ( X ) = 2 (en
p p
utilisant entre autre la drive seconde dune srie gomtrique).
Il est noter que lesprance de la loi gomtrique de paramtre p est la limite de lesprance de la loi
gomtrique tronque de paramtres n et p.
2. Prcautions en classe de Premire
La variable X prend toutes les valeurs entires sauf 0. Lunivers associ nest donc pas fini et ne figure
pas aux programmes du lyce.
3. Une approche laide de lalgorithmique
Le processus au cours duquel on rpte dans des conditions identiques une preuve de Bernoulli de
paramtre p et que lon arrte au premier succs obtenu, est trs facile mettre en uvre avec un
algorithme. Linstruction ent(NbrAlat + p) gnre un nombre alatoire entier qui vaut 1 avec une
frquence de p et 0 avec une frquence de (1 p) . On notera que, dans la pratique, le programme
correspondant sarrte toujours.
4. Langage naturel
Entre : valeur de p
Initialisation : X prend la valeur 0
k prend la valeur 0
Traitement : tant que k = 0
k prend la valeur ent(NbrAlat p)
X prend la valeur X + 1
Fin du "while"
Sortie : valeur de X
5. Sur calculatrice
modle TI 84+
7. Sous Scilab
n
La syntaxe COMBIN(n; k) donne la valeur du coefficient binomial .
k
n
Lalgorithme ci-dessus affiche les coefficients pour k compris entre 0 et n, la valeur de n tant
k
celle introduite au dpart. (Les colonnes dune matrice sont repres partir de 1, ce qui explique la
prsence du n + 1 ).
- Probabilit de lvnement {X = k }
Instruction DISTR (touches 2ND VARS ) puis slectionner .binomFdp( .
- Probabilit de lvnement {X k }
Instruction DISTR (touches 2ND VARS ) puis slectionner .binomFRp( .
- Probabilit de lvnement {X = k }
Icne STAT, choisir DIST (touche F5 ) et BINM (touche F5 ). Enfin, Bpd (touche F1 ) et Var
(touche F2 ).
- Probabilit de lvnement {X k }
Icne STAT puis saisir dans la liste 1 les valeurs prises par k : 0, 1, , n.
Pour chaque valeur de k, la valeur de la probabilit de lvnement { X k } est affiche dans une liste.
La variable X qui comptabilise le nombre de face suit une loi binomiale de paramtres n et 0,5.
Larbre correspondant aura n + 1 terminaisons correspondant au rsultat k faces, n k piles , cest-
-dire lvnement { X = k } , pour tout k tel que 0 k n .
n n
n 1 1
On sait que P ( X = k ) = et que chaque trajet a pour probabilit . Il en rsulte que,
k 2 2
n
pour 0 k n , le nombre de trajets aboutissant la terminaison { X = k } est gal .
k
n
1 face, n 1 piles : = n trajets
1
Pile
n-k
1 n
k faces, n k piles : trajets
k
Face
k n
n 1 faces, 1 pile : = n trajets
n 1
n-1
n
n faces, 0 pile : = 1 trajet
n n
Faisons tourner la figure de 45 dans le sens trigonomtrique : les nuds du schma prcdent
deviennent des points coordonnes entires dans un repre orthogonal naturel .
n
= 1 trajet
0 n
= n trajets
1
n
n-1
n
trajets
k
n-k
n
= n trajets
n 1
1
n
= 1 trajet
0 k n n
1 n-1
Les trajets considrs sont ceux partant de lorigine et aboutissant aux points de coordonnes
(k , n k ) , en suivant toujours les directions vers la droite ou vers le haut (lun dentre eux est
reprsent sur la figure).
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 52 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
2. Interprtation des coefficients binomiaux
Retenons le rsultat suivant : n
n k
Le nombre reprsente le nombre de trajets
n-k
k
reliant lorigine au point de coordonnes
(k , n k ) , en suivant toujours les directions vers la
droite ou vers le haut. 1
Lun de ces trajets est reprsent ci-contre.
0 1 k
3. Formule de Pascal
Cette interprtation fournit une dmonstration gomtrique simple de la formule de Pascal.
n 1
k 1
n
k
n-k n 1
n-k-1 k
0 1 k-1 k
Supposons que 1 k n 1 .
n 1
ceux passant par le point de coordonnes (k , n k 1) , qui sont au nombre de ;
k
n 1
ceux passant par le point de coordonnes (k 1, n k ) , qui sont au nombre de .
k 1
n n 1 n 1
On en dduit que, pour 1 k n 1 : = + (formule de Pascal).
k k k 1
Remarque
Cette interprtation des coefficients binomiaux permet lobtention de plusieurs formules sommatoires
classiques. Le dveloppement de ce point de vue nest pas un objectif du programme.
4. Application : le problme des pilules
Argan se croit malade, il doit prendre 2n pilules dans la journe. Il dispose de deux botes identiques
A et B et, chaque matin, il place n pilules dans chacune de ses deux botes. chaque prise, il choisit
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 53 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
une des deux botes de faon quiprobable, puis prend tant que cest possible une pilule dans la bote
choisie. Au bout dun certain temps lune des botes est vide.
Combien lautre bote contient-elle de pilules en moyenne ce moment-l ?
5. Simulation de lexprience sur Algobox
Voici un algorithme simulant 1000 expriences, avec n = 10 .
6. Traitement mathmatique
On peut dabord envisager un traitement exhaustif pour une petite valeur de n ( n = 3 par exemple).
Pour une valeur plus leve ( n = 10 ), il est intressant de visualiser chaque exprience comme une
marche alatoire sur un carr. Un bord est atteint ( droite ou en haut) lorsquune bote est vide.
Ainsi une exprience pour laquelle il ne reste plus aucune pilule dans la bote A et 10 pilules dans la
bote B correspond lunique marche alatoire aboutissant au point de coordonnes (10, 0).
Si 1 k 9 , une exprience pour laquelle il ne reste plus aucune pilule dans la bote A et 10 k
pilules dans la bote B correspond une marche aboutissant au point de coordonnes (10, k), sans
passer par le point de coordonnes (10, k 1) .
10 + k
Nombre de trajets :
10
(10, k)
9+ k
Nombre de trajets :
10
1 1
P ( X = 10) = 2 = ;
210 29
9 + k 9 + k
9 9
pour 1 k 9 , P ( X = 10 k ) = 2 10+ k = 9 + k .
2 2
Remarquons que la dernire galit englobe la premire pour k = 0 .
9 + k
9 9
9
On peut utiliser un logiciel de calcul formel pour vrifier que : P ( X = 10 k ) = 9 + k = 1 .
k =0 k =0 2
9 + k
9
9
Il en est de mme pour le calcul de lesprance E ( X ) =
k =0
(10 k ) 9 + k 3,524 .
2
Une petite ville des tats-Unis, Woburn, a connu 9 cas de leucmie parmi les 5969 garons de moins
de 15 ans sur la priode 1969-1979. La frquence des leucmies pour cette tranche dge aux tats-
Unis est gale 0,00052. (Source : Massachussetts Department of Public Health).
Les autorits concluent quil ny a rien dtrange dans cette ville. Quen pensez-vous ?
De faon plus prcise, on peut reformuler la question sous la forme suivante : le nombre de cas
observs est-il significatif dune situation anormale pour cette ville ou bien peut-on considrer quil
est simplement le fruit du hasard ?
Pour mieux faire comprendre le contexte dexprience alatoire sous-jacent cette situation, on la
transpose en termes de schma durne : la population des garons de moins de 15 ans sur la priode
1969-1979 des tats-Unis sera assimile une urne contenant 100 000 boules rouges ou vertes o
les boules rouges, au nombre de 52, reprsentent les personnes atteintes de leucmie,
les boules vertes reprsentent les personnes non atteintes.
On peut considrer, en premire approximation, que la population des 5969 garons de moins de 15
ans sur la priode 1969-1979 Woburn est assimilable lobservation dun chantillon (au sens de la
dfinition donne en Seconde) de 5969 boules, prleves de faon quiprobable et avec remise dans
lurne.
La question pose relve alors dun problme de prise de dcision. Nous ne pouvons pas utiliser la
dmarche prconise dans le programme de Seconde car les conditions de sa validit ne sont pas
satisfaites. En effet ici n vaut 5969, n > 25 , mais p vaut 0,00052, valeur trs infrieure 0,2.
Daprs le schma durne adopt, lexprience alatoire de dpart E : Extraire une boule de lurne et
noter sa couleur , est une exprience de Bernoulli de paramtre p = 0,00052 . Lexprience alatoire
attache la situation est lexprience alatoire obtenue par 5969 rptitions lidentique de E. On
associe cette nouvelle exprience alatoire un modle probabiliste (, P ) et la variable alatoire X
qui, toute issue de lexprience fait correspondre le nombre (entier), not X ( ) , de boules rouges
obtenues dans lissue . La variable alatoire X suit la loi binomiale B (n ; p) o n vaut 5969 et o p
est inconnu.
Fig. 1 : Diagramme en btons et probabilits cumules de la loi binomiale pour n=5969 et p=0,00052
Un raisonnement analogue celui fait pour les exemples prcdents de prise de dcision conduit un
intervalle de fluctuation, que nous qualifierons par la suite de bilatral, au seuil de 95% gal [0 ; 7]
pour la variable de dcision X. On pourrait de mme dfinir en adaptant les raisonnements prcdents
un intervalle de fluctuation bilatral au seuil de 90% : cest lintervalle [1 ; 6]. Les frquences
correspondantes sont donnes dans le tableau de la figure 2 :
Seuil de 95 %
Seuil de 90 %
1 1 1 1
p0 , p0 + = 0,00052 ,0,00052 + = [ 0,0124 ; 0,0135]
n n 5969 5969
8
Ce diagramme (Fig. 1) nest pas obtenu par simulation mais par calcul en utilisant la fonctionnalit
LOI.BINOMIALE du tableur.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 57 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Il est clair, comme on la dj not, que la formulation donne en seconde nest pas du tout adapte au
contexte de cette situation, ni aux conditions de lobservation, pour prendre la dcision.
Les rgles de dcision correspondant chacun des intervalles de fluctuation aux seuils respectifs de
95% et de 90% sont reprsentes dans les deux figures 3 et 4 :
IF bilatral au seuil de 95 %
Probabilit Probabilit
infrieure ou infrieure ou
gale 2,5 % gale 2,5 %
IF bilatral au seuil de 90 %
Probabilit Probabilit
infrieure ou infrieure ou
gale 5 % gale 5 %
Il en est tout autrement dans la situation de Woburn o il sagit dun problme qui touche la sant
publique. En cas de rejet de lhypothse p = p 0 , le cas p < p 0 signifie, certes que la situation est
anormale, mais concrtement quil y a, toute proportion garde, moins de cas de leucmie que dans le
reste du pays. Ce qui est une bonne chose en soi et peut rendre la ville de Woburn agrable vivre et
attractive. En revanche le cas p > p 0 signifie galement que la situation est anormale, mais
concrtement quil y a, toute proportion garde, plus de cas de leucmie que dans le reste du pays. Ce
qui rend la ville de Woburn plus dangereuse habiter quailleurs.
On voit ainsi que les enjeux ne sont pas les mmes des deux cts de lintervalle de fluctuation. Aussi,
plutt que de se demander si la situation est normale, ce qui formellement revient trancher entre les
hypothses p = p 0 et p p 0 , il vaut mieux se demander si la situation Woburn ne serait pas, au vu
du nombre de cas observ, plutt dangereuse pour la sant publique.
Pour statuer, on trace le diagramme en btons de la variable alatoire X qui suit la loi binomiale pour
n = 5969 et p = 0,00052 . Si le nombre de cas observ x est faible, il ny aura pas lieu de penser un
danger. En revanche, si le nombre de cas observ x est trs lev, il y aura lieu de penser un danger.
Mais on sait que si p = 0,00052 , on peut quand mme avoir des chantillons pour lesquels la valeur
observe x de X est relativement leve. La question est de dterminer une valeur b au-del de
laquelle on estimera que la valeur leve de x nest plus le fruit de la fluctuation due au hasard,
mais est plutt rvlatrice dune situation dangereuse.
Lide est de partager laxe de valeurs de la variable de dcision X seulement en deux intervalles,
[0 , b] et ]b , n], au lieu de trois comme dans les prises de dcision prcdentes. Tant que la valeur x
observe sera proche de 0 (i.e. dans [0 , b]), il ny aura pas lieu de dclarer la situation dangereuse.
Au-del de b, cest--dire si x est dans ]b , n], on dclarera la situation dangereuse. Dans cette
approche, [0 , b] sera lintervalle de fluctuation. On parlera alors dintervalle de fluctuation unilatral
pour le distinguer de lintervalle de fluctuation utilis en classe quon a qualifi de bilatral. Si on fixe
le seuil 95 %, b sera choisi pour que [0 , b] soit le plus petit intervalle tel que P( X > b) 0,05) .
La lecture des probabilits cumules de la loi binomiale pour n = 5969 et p = 0,00052 de la figure 1
donne b = 6 . Ce qui conduit, comme x = 9 , dcider que la situation est dangereuse pour la sant
Woburn.
De plus, par construction de lintervalle de fluctuation [0 , 6], on peut affirmer quen prenant cette
dcision on a moins de 5 % de chances de se tromper. Plus prcisment, la probabilit de dcider que
la situation est dangereuse, alors quelle ne lest pas, est gale P ( X > 6) = 1 P ( X 6) 1 0,9610 ,
soit environ 4,9 %.
Probabilit
infrieure ou
gale 5 %
Seuil de 90 %
c) Commentaires
Alors que les autorits locales et les experts gouvernementaux ont conclu, dans un premier temps,
quil ny avait rien dtrange dans le nombre de cas de leucmie observs, la suite dactions et
dtudes entreprises par les familles avec leurs propres experts, le Dpartement de Sant Publique du
Massachusetts a officiellement confirm en avril 1980 que le taux de leucmie constat tait
anormalement lev. La recherche des causes a conduit souponner leau de la ville pollue par le
trichlorthylne. Cette petite histoire illustre bien les enjeux de la dmarche statistique.
On a vu dans cet exemple quune mme situation peut donner lieu plusieurs questionnements
possibles et, en consquence, des traitements mathmatiques diffrents :
Concernant par exemple la situation Woburn, comme lobservation donne x = 9 , on dcidera que la
situation est, avec le mme seuil de 95 %, anormale en utilisant lintervalle de fluctuation bilatral, et
dangereuse en utilisant lintervalle de fluctuation unilatral. Mais si lobservation avait donn x = 0
ou x = 7 , on aurait t amen dclarer la situation anormale avec lintervalle de fluctuation bilatral
au seuil de 90 %, mais normale avec lintervalle de fluctuation bilatral au seuil de 95 %. De mme,
avec le mme seuil de 95 %, si lobservation avait donn x = 7 , on aurait t amen dclarer la
situation normale en utilisant lintervalle de fluctuation bilatral, mais dangereuse en utilisant
lintervalle de fluctuation unilatral.
On voit bien que le choix de la question poser (La situation est-elle normale ? La situation prsente-
t-elle un danger pour la sant ?), le choix du seuil (90 % ou 95 % par exemple), la forme de
lintervalle de fluctuation (bilatral ou unilatral) vont influer sur la rgle de dcision adopter, et par
consquent sur la dcision elle-mme.
Dans une dmarche de prise de dcision, il est donc ncessaire de clarifier en premier lieu le choix des
hypothses pour formaliser un questionnement qui, lui-mme, dpend des proccupations du dcideur
lies aux enjeux (conomiques, sociaux, sanitaires, politiques, ) de la situation. Le seuil devra
galement tre dfini en amont de la mise en forme mathmatique. Ce choix des hypothses
dterminera ensuite la forme de lintervalle de fluctuation utiliser. Il est donc ncessaire de veiller
ce que la forme de lintervalle de fluctuation utilis soit toujours en cohrence avec le questionnement
naturellement induit par la situation concrte, mme si pour des raisons pdagogiques on se limite en
classe aux intervalles de fluctuation bilatraux.
Dans la ralit, toute prise de dcision statistique suppose, en prliminaire la mise en uvre
mathmatique, une analyse approfondie de la signification concrte des risques encourus qui ne peut
tre que le fruit dune concertation interdisciplinaire entre les divers acteurs professionnels (dont le
statisticien nest quun des lments) concerns par cette prise de dcision.
d) Bibliographie
Ministre ducation nationale-DGESCO : Ressources pour la classe en baccalaurat professionnel
extrait : Probabilits et statistiques, Document de travail, avril 2009.
Ministre ducation nationale-DGESCO : Ressources pour la classe de Seconde extrait :
Probabilits et statistiques, 2009.
2. Radioactivit ou bruit de fond ?
Lactivit suivante est inspire 9 de prsentations effectues par Monsieur Alain VIVIER, enseignant-
chercheur lINSTN 10 , institut dpendant du Commissariat lnergie atomique Saclay. Convaincu
de lintrt pdagogique des exprimentations sur tableur, Monsieur VIVIER dclare : pour ma part
je naurais jamais approfondi ces aspects [de statistique et probabilits], indispensables en physique,
9
Avec laimable autorisation de Monsieur Alain Vivier.
10
Institut national des sciences et techniques nuclaires.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 61 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
sans le tableur. Cela ma t utile non seulement pour des aspects denseignement, mais aussi de
recherche, notamment dans le domaine de la problmatique du seuil de dcision, qui peut savrer
parfois difficile .
Une activit sur le thme de la radioactivit, consistant rechercher un seuil de diffrence significative
avec le modle binomial, peut se prsenter comme suit.
On mesure en laboratoire, avec un compteur Geiger, un objet pouvant tre radioactif . Le compteur
est rgl selon une certaine sensibilit et on effectue une mesure un mtre de lobjet, pendant dix
secondes. Linstrument compte 37 dsintgrations ou coups . Cependant, avec ce rglage et dans
ces conditions, une mesure de bruit de fond (correspondant lenvironnement du laboratoire)
donne en moyenne un comptage de 30 coups. La question qui se pose est de savoir si la diffrence
observe est assez importante pour considrer lobjet comme radioactif .
On suppose que dans le laboratoire, durant chaque centime de seconde, le compteur est alatoirement
susceptible de compter un coup de bruit de fond avec une probabilit 0,03, ce que lon simulera
laide dun tableur avec linstruction =ENT(ALEA()+0,03).
1. a. Simuler en colonne A un comptage de bruit de fond pendant 10 secondes, puis recopier vers la
droite pour obtenir la simulation de 100 comptages.
b. Calculer la moyenne des 100 comptages simuls. Est-elle proche de 30 coups ? (Faire F9 pour
obtenir dautres simulations.)
c. Un comptage suprieur ou gal 37 coups vous semble-t-il exceptionnel ?
2. a. Dterminer les paramtres n et p de la loi binomiale suivie par la variable alatoire X modlisant
un comptage de bruit de fond pendant dix secondes.
b. Sur une nouvelle feuille, calculer une table fournissant P(X k) pour k allant de 0 1 000.
3. Soit N est le plus petit entier tel que : P(X N) 0,95. On dira quil y a radioactivit significative si
le nombre de coups est suprieur ou gal N + 1.
a. Dterminer la valeur de N.
b. On observe un comptage de 37 coups. Peut-on considrer que la radioactivit est significative ?
c. Quelle est la probabilit de considrer que la radioactivit est significative alors que cest un bruit de
fond ?
4. On considre un objet radioactif pour lequel, durant chaque centime de seconde, le compteur est
alatoirement susceptible de compter un coup avec la probabilit 0,05. On considre la variable
alatoire Y modlisant le comptage des dsintgrations pendant dix secondes.
a. Donner les paramtres de la loi binomiale suivie par Y.
b. Dterminer la probabilit de ne pas dtecter comme radioactif lobjet considr.
lments de rponse
3. a. N = 39.
k P(X k)
37 0,9142
38 0,9381
39 0,9563
40 0,9698
b. Un comptage de 37 coups nest pas significatif. On considre quil y a radioactivit partir dun
comptage de 40 coups.
4. a. n = 1000 et p = 0,05 .
b. Lobjet nest pas dtect comme radioactif correspond lvnement {Y 39 } dont la probabilit
vaut environ 0,06.
Remarques :
On a deux faons de se tromper :
dclarer quun objet est radioactif alors que cest un bruit de fond (cest lobjet de la question 3) ;
dclarer quil ny a que du bruit de fond alors que lobjet est radioactif (cest lobjet de la question 4).
Il est utile dappuyer le raisonnement sur lobservation des diagrammes en btons des lois binomiales
B (1 000 ; 0,03) et B (1 000 ; 0,05).
3. Cartes de contrle 11
Dans lindustrie automobile, certains vhicules, aprs leur passage en peinture, prsentent un dfaut de type
grains ponctuels . Ce dfaut est pratiquement imperceptible, mais constitue un tmoin de la qualit du
processus de peinture.
On dit que le processus est sous contrle lorsque 20 % des capots produits ont ce type de dfaut. Des
modifications apportes au processus de fabrication sont susceptibles de modifier ce pourcentage, dans un
sens ou dans lautre.
On contrle la production en prlevant des chantillons de 50 capots. La production est suffisamment
importante pour considrer quil sagit de tirages au hasard avec remise.
On choisit de fixer le seuil de dcision de sorte que la probabilit de rejeter lhypothse tort soit infrieure
5 %.
On accepte lhypothse selon laquelle la proportion dans la production est p = 0,2, lorsque la frquence f
observe sur lchantillon se situe dans lintervalle de fluctuation au seuil de 95 %.
11
Mises au point en 1924 la Bell Telephone Company par Walter Shewhart (1891-1967), les cartes de
contrle sont la base de la matrise statistique des procds . Toujours utilises en raison de leur simplicit
(on reporte les valeurs observes sur le graphique de la carte), elles dfinissent des limites de contrle de certains
paramtres de la production, comme la frquence, la moyenne ou lcart-type, telles que si ces limites sont
dpasses, des actions de correction puissent tre menes.
lments de rponse
1. Les limites de contrle sont 0,1 et 0,32 correspondant des effectifs de 5 et 16 capots prsentant le
dfaut.
2.
12
Le questionnement sur les erreurs nest pas un attendu du programme. Aucune connaissance ce propos nest
donc exigible. Cette question peut cependant tre pose dans un cadre de rflexion ou de recherche.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 64 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Remarques :
On peut, dans un premier temps, observer par simulation la frquence des erreurs (points
situs entre les lignes de contrle alors que p 0,2 ) en introduisant la valeur 0,3 en cellule C1
et en actionnant de nombreuses fois la touche F9.
Il est difficile de distinguer p = 0,2 et p = 0,3 avec un seul chantillon de taille 50. La
procdure de dcision a tendance tre conservatrice et privilgie lhypothse p = 0,2 qui
nest rejete que si la diffrence observe est rellement significative. Il est utile dappuyer le
raisonnement sur lobservation des diagrammes en btons des lois binomiales B (50 ; 0,2) et
B (50 ; 0,3).