Академический Документы
Профессиональный Документы
Культура Документы
N 48 - juillet 2002
MOYENNE,
MEDIANE,
ECART-TYPE
Quelques regards sur lhistoire
pour clairer lenseignement
des statistiques
Anne BOY
Marie-Cline COMAIRAS
Irem des Pays de la Loire
Introduction
Si lon mesure limportance dun enseignement au nombre de pages quil occupe
dans les programmes et commentaires, les statistiques occupent une place de choix dans ceux
qui se mettent en place dans nos lyces, trop
envahissante, penseront certains. Mais en
examinant les choses avec un peu de recul, il
apparat que cette importance est relativiser. Ce nest sans doute pas lapparition des
statistiques dans les programmes qui va bouleverser lenseignement des mathmatiques
dans nos collges et lyces, mais peut-tre
plutt la sollicitation quotidienne lusage des
outils informatiques, dans tous les domaines,
et pas seulement dans celui qui nous proccupe ici.
Ces questions, essentielles, ne seront pas
lobjet de nos rflexions. Cependant, tout ce
27
furent-ils vraiment justifis par les mathmatiques ? Lhistoire donne du sens, permet
de comprendre certains obstacles, et de ne pas
se contenter dapprendre bien utiliser des
formules.
Lhistoire des mots mathmatiques est
souvent clairante, elle lest trs particulirement dans le domaine des statistiques.
Elle permettra de mettre en lumire quil
nest pas tout fait quivalent dvaluer statistiquement la distance entre deux toiles,
qui fera intervenir un certain nombre de
mesures dune mme grandeur, ou de vouloir connatre la taille moyenne dun enfant
de quatre ans, qui fait intervenir des donnes sur plusieurs individus. Le premier problme a fait natre la thorie des erreurs,
qui fut un moteur essentiel dans le dveloppement des statistiques.
Nous avons choisi de rester dans le cadre
des programmes de lyce, et nous aborderons trs peu lhistoire des lois, elles seront
cependant voques, puisque ce sont les lois
des erreurs qui ont fait merger les mots que
nous utilisons.
Aprs avoir rappel les dfinitions
actuelles et officielles des diffrentes
notions voques (et nous verrons que ce nest
pas toujours limpide), nous montrerons
pourquoi la moyenne, la mdiane et lcarttype ont sans doute t privilgis pour
rsumer une srie statistique.
Les dfinitions :
Voici quelques dfinitions des mots que
nous avons retenus, trouves au fil de manuels,
ou dans les programmes et commentaires
officiels 1 .
28
Mode : Ce mot nest dfini ni dans les programmes de seconde, ni dans les commentaires
Il semble que lon attache peu dimportance
ce paramtre, en dpit, ou cause de sa simplicit, et qui, pour cela, est un des plus
anciens. On peut trouver cependant des dfinitions dans les manuels, comme, par exemple,
celles qui suivent :
Le mode, pour un caractre discret, not
M0 , est la valeur qui correspond au plus grand
effectif.
(Fractale 2, 2000, Bordas)
On appelle mode toute valeur du caractre
dont la frquence est la plus grande. Une population na pas toujours un mode unique.
(Point math 2, 2000, Hatier).
Moyenne arithmtique : ce mot nest pas non
plus prcis dans les programmes et commentaires. Il peut sembler bien sr quil va
de soi. Lhistoire nous apprendra quil nest ni
si vident, ni si simple. La difficult provient
essentiellement de lusage qui en sera fait. Cest
videmment le problme essentiel. Notons
cependant quil nest plus fait mention dans
nos classes dune certaine sorte de moyenne,
le midrange , moyenne arithmtique des
valeurs extrmes, alors mme que cest elle
qui vient souvent le plus naturellement
lesprit de nos lves.
La moyenne arithmtique pondre, note
x , est dfinie par :
x=
n1 x1 + n2 x2 + n3 x3 + ... + nk xk ,
n
ce qui scrit :
x=
i=k
1
ni xi
n i =1
X=
x1 + x2 + x3 + ... + x N
N
29
Mdiane :
Dfinition : on appelle mdiane dune srie
statistique tout nombre m tel que
Au moins la moiti des valeurs du caractre sont infrieures ou gales m
Au moins la moiti des valeurs du caractre sont suprieures ou gales m
Exemple et convention de calcul :
Pour calculer la mdiane dune srie de n
valeurs, on range ces n valeurs dans lordre
croissant. Quand n est impair, la valeur
centrale est la mdiane. Quand il est pair,
tout nombre compris entre les deux valeurs
centrales est une mdiane. La convention
est de prendre la demi-somme des deux
valeurs centrales 3.
Remarque
Les calculatrices et les ordinateurs nutilisent pas forcment les conventions de calcul
faites dans le cours, et peuvent donc donner
des rsultats lgrement diffrents.
30
31
32
en e
k x
a
sur
x
y = log
y = e k x , ou
a
(voir leur reprsentation schx
distribution semi-circulaire
distribution semi-elliptique
distribution parabolique
distribution en e
k x
distribution en log
a
x
33
1
e
h
x2
h2
34
o h est un
moyenne
mdiane
Le terme mdiane est introduit par Cournot en 1843.(Exposition de la thorie des chances et des probabilits).
Laplace parlait de milieu de probabilit .
1757 Roger Joseph Boscovitch est un des premiers souligner lintrt de
cette valeur centrale.
1885 Galton, dans le cadre des statistiques morales , propose de substituer lusage de la mdiane celui de la moyenne, susceptible de trop grande variabilit.
variance,
cart-type
carts entre
les quartiles
7 Cf. annexe 2.
35
sieurs raisons. Il est toujours dlicat, voire impossible dtablir avec certitude lapparition dun
mot, qui nest souvent que laboutissement dune
longue recherche sur un problme. En particulier le vocabulaire des statistiques a t
unifi et standardis relativement tard. En France, par exemple, les connaissances accumules par lcole anglaise de statistiques ne
seront pas vraiment diffuses avant les annes
1925-1930.
Le premier mot, peut-tre, quil faudrait
tudier serait justement celui de statistiques . Mais il peut recouvrir tellement de
sens diffrents que nous avons choisi de lviter.
Les proccupations diffrent assez largement entre ce que certains appelrent les
statistiques administratives, la thorie des
erreurs, que lon peut considrer comme la source des statistiques mathmatiques et les statistiques morales de Qutelet, que lon peut
considrer comme point de dpart des statistiques infrentielles .
Lobjet de la thorie des erreurs est dvaluer la vraie valeur dune grandeur
laquelle on sintresse. Lobjet des statistiques morales est de donner une valeur fictive, thorique, qui pourrait tre le rfrent
unique, partir des mesures de plusieurs
objets ou individus diffrents.
Ces diffrences ont des retentissements
profonds dans lhistoire des mots.
En guise de conclusion
Nous en sommes au dbut de nos rflexions,
et les nouveaux programmes viennent tout juste
datteindre les classes de premire ; aussi,
36
37
ANNEXE 1
(extrait de Mthode des moindres carrs - 1821)
La question qui nous occupe a, dans sa nature mme, quelque chose de vague et ne
peut tre bien prcise que par un principe jusqu un certain point arbitraire 8. La
dtermination dune grandeur par lobservation peut se comparer, avec quelque justesse,
un jeu dans lequel il y aurait une perte craindre et aucun gain esprer : chaque erreur
commise tant assimile une perte que lon fait, la crainte relative un pareil jeu doit
sexprimer par la perte probable, cest--dire par la somme des produits des diverses pertes
possibles par leurs probabilits respectives. Mais quelle perte doit-on assimiler une
erreur dtermine ? Cest ce qui nest pas clair en soi ; cette dtermination dpend en
partie de notre volont 9. Il est vident, dabord, que la perte ne doit pas tre regarde
comme proportionnelle lerreur commise ; car, dans cette hypothse, une erreur positive
reprsentant une perte, lerreur ngative devrait tre regarde comme un gain : la grandeur de la perte doit, au contraire, svaluer par une fonction de lerreur dont la valeur
soit toujours positive. Parmi le nombre infini de fonctions qui remplissent cette condition,
il semble naturel de choisir la plus simple, qui est, sans contredit, le carr de lerreur, et,
de cette manire, nous sommes conduits au principe propos plus haut.
Laplace a considr la question dune manire analogue, mais en adoptant, pour mesure de la perte, lerreur elle-mme prise positivement. Cette hypothse, si nous ne nous
faisons pas dillusion, nest pas moins arbitraire que la ntre 10 : faut-il, en effet,
regarder une erreur double comme plus ou moins regrettable quune erreur simple rpte deux fois, et faut-il, par suite, lui assigner une importance double ou plus que double ?
Cest une question qui nest pas claire, et sur laquelle les arguments mathmatiques nont aucune prise ; chacun doit la rsoudre son gr 11. On ne peut nier pourtant que lhypothse de Laplace ne scarte de la loi de continuit et ne soit, par consquent,
moins propre une tude analytique ; la ntre, au contraire, se recommande par la gnralit et la simplicit de ses consquences.
38
ANNEXE 2
Lambert-Adolphe-Jacques Qutelet (1796-1874) est n Gand, en Belgique. Devenu mathmaticien un peu par hasard, il a lide, en 1823, de fonder un observatoire ; afin
de sinitier lastronomie il rencontre Fourier, Laplace, Poisson lObservatoire de Paris
et dcouvre cette occasion les statistiques. En 1832 il sinstalle lObservatoire de Bruxelles
o il restera jusquen 1856. Paralllement ses travaux en astronomie et climatologie il
sintresse de plus en plus la statistique. Il est linitiateur du premier Congrs international de Statistique Bruxelles en 1853.
Qutelet utilise les statistiques pour tudier lhomme aussi bien dun point de vue physique (taille, poids, force) que dun point de vue intellectuel et moral (penchant au crime,
au mariage,).
Voici ce quil crit dans Recherches sur le penchant au crime dans les diffrents ges
(1832) :
Aprs avoir vu la marche quont suivie les sciences lgard des mondes, ne pouvonsnous essayer de la suivre lgard des hommes ; ne serait-il pas absurde de croire que
pendant que tout se fait daprs des lois si admirables, lespce humaine seule reste abandonne aveuglment elle-mme et quelle ne possde aucun principe de conservation ?
Nous ne craignons pas de dire quune pareille supposition serait plus injurieuse la divinit que la recherche mme que nous nous proposions de faire.
Il dfend le principe dune statistique scientifique sappuyant sur le calcul des probabilits.
La thorie des probabilits devrait servir de base toutes les sciences dobservation,
prcise Qutelet.
Il donne une place prpondrante la moyenne ; il fait la diffrence entre la moyenne
objective , qui correspond quelque chose de rel, et la moyenne arithmtique.
Ainsi, avec lui, les statistiques se sont orientes dans une voie nouvelle : les statistiques
morales, dont la postrit retiendra particulirement linvention de lhomme moyen .
Citons de nouveau Qutelet ( Physique sociale ou Essai sur le dveloppement des facults de lhomme -1869-)
En runissant les individus dun mme ge et dun mme sexe et en prenant la moyenne de leurs constantes particulires, on obtient des constantes que jattribue un tre
fictif que je nomme lhomme moyen chez ce peuple.[]
Lhomme moyen, en effet, est dans une nation ce que le centre de gravit est dans un corps ;
cest sa considration que se ramne lapprciation de tous les phnomnes de lquilibre et du mouvement.
Cette thorie de lhomme moyen, qui annonce par exemple la normalisation des qualits, de mme que lutilisation outrance des mathmatiques pour justifier des prises de
dcision sociales , ont provoqu un dferlement de critiques. On doit cependant reconnatre que Qutelet a su donner la statistique du 19 s. une impulsion dont linfluence
ultrieure est indniable.
39
40