Академический Документы
Профессиональный Документы
Культура Документы
5eme Anne
Introduction
Exp : l'effet des activateurs de croissance mandibulaire est similaire celui des TIM
de classe II
Puis on confronte cette hypothse aux observations faites sur les sujets d'une
enqute pour dcider de l'accepter ou de la rejeter.
L'tape de la formulation de l'hypothse est importante. Elle conditionne le choix de
l'enqute qui sera entreprise et des mthodes statistiques qui seront employes .elle
demande que le problme soit pos avec prcision : il ne suffit pas de se demander si
un traitement est efficace, il faut spcifier ce que cela signifie : une efficacit plus
grande ; ou une stabilit plus grande ou .....
cette exigence de rigueur n'est pas propre la statistique , ce qui l'est plus ce sont
les risques d'erreur attachs aux conclusions et la faon d'envisager la causalit .
Les risques d'erreur sont lis aux fluctuations d'chantillonnage .les variations d'un
chantillon l'autre empchent de tirer des conclusions coup sr d'observations
faites sur un chantillon , il y a une certaine probabilit de se tromper , un certain
risque d'erreur .
!-Notions de base :
-Pooulation et chantillon :
-Une population est un ensemble d'units sur lesquelles une carnctristique
peut tre releve le plus souvent ,en pidmiologie , les units sont des
personnes , mais cela peut tre aussi un groupe de personnes ,ou encore des
Unitt>s binlonin1 s f anat-orn1que
1 11 ""' 1...,1 !::Jl"1'-,,a"'-" Il '- Ill (
\
'a mand"1hul
1 1 1 IJ '""' f
l'orill
1 '-111'-" j '\
Trs souvent la population est de grande taille
Les questions que l1on se pose , les hypothses que l'on formule concernent ia
population .
Les observations que l'on fait sur un chantillon servent rpondre aux
questions que l'on s'est pos au niveau de la population . Il est donc important
roue 11 'e'c1 ha1...n.+-"1"IIVI
\.,j "n ;:,
roit1 ,..o
\., 1... r+-itu,!.
1;:,u d" +-ell"
l. sorte
l. ,,, ,'ilIl j,J
\.,jU ....UI,isse I.."...,.. ...l;Il.. \..,..e 1..o"1I
I .., "
( chantillon reprsentatif).
-L'chantillon reprsentatif :est un chantillon dont la composition est conforme
ce!!e de !a population
La faon la plus simple de constituer un chantillon reprsentatif, est de tirer
au sort les sujets de l'chantiilon au sein de ia population .
Il est important dans toute enqute pidmiologique de bien dfinir la population
et l'chantillon .
-Variable alatoire
Une variable alatoire ( qui sera souvent dnomme variable )associe une valeur
chaque sujet de la population.
Cette valeur peut tre numrique ( over jet, angle ANB ... ) ;ou ne pas l'tre : malade /non
malade.
II-Statistiques descriptives
But:
Toute srie d'observation comporte un certain nombre de donnes relatives
Un Ou nl11c:io1urs \/::aria bloc:
1 ...,1\,,,411.._,1'-" 1 Y\.,,l 1 '-"...,
-Variables qualitatives
Variables quantitatives :
Les variables quantitatives reprsentent la mesure d'une quantit , elles
prennent des valeurs numriques qui ont une signification concrte
Exp :la taille ,le poids , le rsultat d'un dosage biologique .
L'cart entre deux valeurs d'une variable quantitative est interprtable et peut
tre compar avec l'cart entre deux autres valeurs .
On distingue les valeurs quantitatives discrtes et continues .
Exemple:
On a dnombr sur un ensemble de 180 sujets, les individus qui appartenaient
aux diffrentes classes squelettiques
98 52 30
54 29 17
Frquences relatives exprimes en pourcentage et arrondis l'unit
1 350 70 70
2 110 22 92
3 30 6 98
4 10 2 100
On peut reprsenter les effectifs absolus ou relatifs des classes par des secteurs
de cercle dont la surface est proportionnelle l'effectif.
Le diagramme camembert ainsi construit est bien adapt la
reprsentation des donnes qualitatives pures
Yeux verts
Yeux bleus 10%
Diagramme Camembert
Frquences
350 ............... .
llO
30 Stade
10'-----'------'-------------.L---
l 2 3 4
Mode
Sur l'exemple de la figure, la classe caractrise par le stade 1 est la classe qui
contient le plus grand nombre de sujets ; c'est le mode ou classe modale. Le
mode est la classe (catgorie) qui offre la plus grande frquence
Dans le cas de variables ordinales, si les donnes montrent plusieurs classes
d'effectifs suprieurs aux effectifs des classes adjacentes, on dit que le
diagramme reprsente une distribution multimodale : bi-modale, tri-modale, ...
Dans le cas contraire, on dit que la distribution est uni-modale.
S+ 90 30 120
S 30 50 80
total 120 80 200
-Les effectifs dnombrs pour chacune des modalits, pour chacun des deux
caractres tudis ;
-Les effectifs de chaque modalit d'un caractre, quelles que soient les
modalits de l'autre caractre. Ces effectifs sont situs dans la dernire colonne
et la dernire ligne.
Exemple:
Soit la srie de mesures reprsentant les ges de 20 individus, ranges par
ordre croissant :
3, 5, 6, 7, 8, 11, 15, 20, 21, 22, 23, 23, 23, 30, 31, 32, 35, 36, 40, 45.
On peut dcider de dterminer des classes d'ge de 10 ans en 10 ans : O - 10 ans,
10 - 20 ans, 20 - 30 ans, 30 - 40 ans, 40 - 50 ans. On transforme ainsi la srie qui
peut se reprsenter dans le tableau des frquences
0-10 ans 5
10-12 ans 2
20-30 ans 6
30-40 ans 5
40-50 ans 2
Histogramme :
Effectifs
6 f
5 ---1 -1
4 l
....____._
0 lO
____.20____
30
__._40__50....I _ Ans
Moyenne:
L'indice de position le plus frquemment utilis pour une variable quantitative
est la moyenne arithmtique, dfinie de la faon suivante :
Soit une population de N sujets pour lesquels les valeurs d'une variable X sont
:Xl ,X2,X3, ........ Xn.
Par dfinition la moyenne de X est :
Xl+X2+X3+Xn
N
La mdiane :est la valeur telle que 50% des sujets ont une valeur de X qui la
dpasse .cet indice ne s'applique qu'aux variables ordonnes (quantitative ou
qualitative ordinale)
Le mode : qui est la valeur de X prise par le plus grand nombre de sujets, cet
indice ne s'applique qu'aux variables en classe (qualitatives ou quantitatives
aprs groupement des valeurs )
La variance
Il existe plusieurs indices numriques pour quantifier la dispersion des valeurs
prises par l'ensemble des sujets d'une population,le plus utilis est la variance
qui se dfinit comme suit:
Soit une population de N sujets pour lesquels les valeurs d'une variable X sont
Xl,X2,X3,... Xn. Par dfinition la variance de X est
cr 2 = Lf=z(Xi - ) 2
La variance est donc gale la moyenne des carrs des carts entre les valeurs
de X et leur moyenne .
Plus ces carts sont grands , plus la variance est grande .
A l'extrme inverse , dans une population o tous les sujets ont la mme valeur
de X ( ce qui correspond l'absence totale de variabilit )la moyenne est gale
cette valeur commune et la variance est nulle .
Cependant lorsqu'on veut quantifier la variabilit entre individus par un nombre
, on est contraint de partir de variables numriques ;quelques soit leur nature
initiale .
Pour une variable qualitative , il faut attribuer une valeur chiffre ces
diffrentes modalits(codage)
L'cart-type
La racine carr de la variance cr s'appelle l'cart-type , lorsqu'on ne dispose que
d'un chantillon de n sujets tirs au hasard dans la population , la variance cr 2
de l'chantillon ne peut tre calcule .
-Lois de distribution:
Loi normale :
! '(, cr)
Moyenne
= Mdiane
= Mode
La loi t de student .
La loi du X 2
La loi f de Fisher .
Etant donn un rsultat obtenu partir d'un chantillon, que peut-on dduire sur la
population dont il est issu, quelle infrence statistique peut-on faire ? Par exemple, si
le paramtre tudi est la moyenne, quelle est la valeur que l'on doit admettre pour
la population partir de la valeur calcule sur l'chantillon Nous sommes ici dans un
problme d'estimation ponctuelle.
Dans cette situation, il est possible de commettre deux erreurs : conclure que
HO est vraie alors qu'en ralit c'est Hl qui est vrifie, et vice versa.
Dfinitions :
On appelle erreur de premire espce ou erreur de type I la quantit
a = P{accepterHOIHl est vraie} .