Вы находитесь на странице: 1из 39

Mthodologie de lobservation

Partie B Statistiques Cours 4

Recherche de description
Rappel = dcrire les caractristiques (les distributions) dune ou plusieurs variables mesures sur un chantillon ou une population. 2 caractristiques dgager : les indices de tendance centrale des donnes les indices de dispersion Prsentation des informations et donnes les transformations possibles et ncessaires des donnes les reprsentations graphiques des rsultats

Lindice de tendance centrale


= indique la caractristique la plus reprsentative de tous les individus du groupe en la ramenant un individu type qui se situerait au centre de la distribution Il rend possible la comparaison entre des groupes dindividus diffrents sur base de la mesure dune mme variable Ex : les lphants dAfrique ont en moyenne une masse suprieure celle des lphants dAsie

Lindice de dispersion
= exprime ltendue de la variabilit des observations Les donnes peuvent tre concentres autour de la tendance centrale ou au contraire trs disperses Exemple : un groupe dlves (classe A) avec une moyenne de 10/20 mais dont les rsultats en fin danne stendent de 5/20 18/20 un groupe dlves (classe B) avec une moyenne de 10/20 mais dont les cotes stabliraient de 9/20 14/20 La classe A a un indice de dispersion suprieur la classe B

Les indices de tendance centrale

Echelle nominale le mode


Echelle ordinale la mdiane Echelle intervalle la moyenne

Pour les chelles nominales : le mode


Le mode (Mo) = la modalit de la variable nominale dont la frquence (absolue et relative) est la plus leve 2 modes distribution bimodale 3 modes distribution trimodale
Exemple : tableau des frquences pour la variable type dtude
Le mode de la variable type dtude est la modalit mdecine

Modalits
conomie mdecine droit philo Total

Frquenc es (fi)
40 80 30 50 200

Pourcenta ges (Pi)


20 40 15 25 100

Pour les chelles ordinales : la mdiane


La mdiane (Md) = la valeur qui divise exactement en deux la distribution de lchantillon, de manire quil y ait 50% des observations qui la prcdent et 50% qui la suivent (les catgories ou les scores tant rangs au pralable). Remarque: Le mode (Mo) peut galement tre utilis pour rsumer une distribution constitue de catgories ordonnes . Il dfinit la modalit qui recueille la plus haute frquence.

Calcul du mdian
Il faut commencer par classer les modalits par ordre croissant !! Si n est pair, le rang mdian tombe mi-chemin entre les deux rsultats centraux. On choisit de considrer comme mdian, celui qui est immdiatement au-dessus Md = (N/2) +1 Si n est impair, la mdiane est exactement lobservation du milieu : Md = (N+1) /2

Exemple
On examine, sur base dun chantillon de 20 tudiants, quel serait leur degr de motivation suivre une session de formation : 1= trs peu motiv , 2 = peu motiv , 3 = motiv , 4 = trs motiv

N = 20 = pair
N/2 +1 = 11 lobservation prendre en considration est la 11me. la modalit mdiane = la catgorie 2 (peu motiv)

Modalits Effectifs (fi) 1 2 3 4 Total 4 8 6 2 20

Effectifs cumuls 4 12 18 20

Exemple
Scores

On classe un chantillon de 15 lves en fonction dun score (sur 200 points) obtenu un test N = 15 = impair (N+1) /2 = 8 lobservation qui nous intresse est la 8me La valeur de ce 8me rang est de 170 La mdiane = 170

Effectifs (fi)
1 1 1 1 2 1 1 3 1 2 1 15

effectifs
cumuls 1 2 3 4 6 7 8 11 12 14

156 160 162 166 167 169 170 175 177 182

185
Total

15

Pour les chelles dintervalle : la moyenne


La Moyenne est lindice le plus frquemment utilis dans le cas des chelles dintervalle. Pour calculer la moyenne, il suffit dadditionner tous les rsultats et de diviser cette somme par leffectif : m = (Somme Xi/n) Remarque:
Le mode peut galement tre utilis La mdiane = la valeur de la variable telle quil existe autant de mesures qui lui soient infrieures que de mesures qui lui soient suprieures

Exemple
On a relev la taille exprime en cm de 30 individus adultes = 5198 / 30 La moyenne = 173.27 cm La mdiane = 175 cm Le mode = la modalit 175 cm

Tailles 158 160 162 164 168 170 172 175 179 180 183 185 188 189 Total

Effectifs 2 1 3 1 4 1 3 5 2 2 1 1 3 1 30

effectifs c. 2 3 6 7 11 12 15 20 22 24 25 26 29 30

Remarques
La moyenne est trs fort influence par les extrmes Ex : Calculer le salaire moyen de 5 joueurs de foot 4 joueurs gagnent 100.000 Euros par anne, le 5me joueur gagne 1.000.000 par anne. Le salaire moyen = 280.000 Euros Dans ce cas, la moyenne ne reflte pas ncessairement bien toute la ralit La mdiane permettra alors de synthtiser ces donnes sous un autre angle

Remarques
Le mode est facilement reprable et interprtable. Cependant, il ne tient pas compte de toutes les donnes et ne se prte pas au traitement arithmtique La mdiane est facilement interprtable et aise dterminer mais elle ne se prte pas aux traitements arithmtiques La moyenne est facilement interprtable, aise calculer et se prte bien aux traitements arithmtiques

Les indices de dispersion


Les indices de dispersion nous fournissent une information sur la faon dont les donnes sont distribues autour de la tendance centrale
Deux sries statistiques peuvent avoir une mme moyenne mais prsenter un talement diffrent autour de cette valeur moyenne

Les indices de dispersion


Echelle nominale (lentropie) Echelle ordinale lespace interquartile Echelle intervalle lcart-type

Pour les chelles nominales


Sil existe un indice de dispersion appropri une chelle nominale (lentropie), dans la pratique, il est rarement calcul et utilis Une distribution dune variable caractrise par des effectifs gaux dans toutes les classes sera considre comme peu homogne, fort disperse Une distribution o une des modalits reoit tout leffectif de lchantillon sera dfinie comme trs homogne, non disperse

Pour les chelles ordinales


Lespace interquartile = comprend 50% des observations, celles qui sont les plus centrales
espace interquartile I----------------I--------------------I---------------------I----------------------I 0 25% 50% 75% 100%

= lespace compris entre les quartiles 1 et 3

Q1 = la valeur en dessous de laquelle se trouvent 25%


des observations infrieurs Q3 = la valeur en dessous de laquelle se trouvent 75% des observations infrieures

Calcul de lespace interquartile


Le rang de Q1 on calcule N/4, puis on cherche dans leffectif cumul quelle modalit ce rang appartient Le rang de Q3 on calcule (N/4) x 3, puis on cherche dans leffectif cumul quelle modalit ce rang appartient Espace interquartile = Q3-Q1 Exemple: Le rang de Q1 est : n/4 = 20/4 = 5 modalit 2 Le rang de Q3 est 3*n/4 = 3*20/4 = 15 modalit 3 Lespace interquartile = Q3-Q1 = 3-2=1

Modalits
1 2 3 4 Total

Effectifs (fi)
4 8 6 2 20

effectif cumul
4 12 18 20

Autre exemple
Scores Le rang de Q1 = 3.75 = rang 4 Le rang 4 correspond un score de 166 Le rang de Q3 = 11.25 = rang 11 Le rang 4 correspond un score de 175 156 160 162 166 167 169 170 175 177 182 185 Total Effectifs (fi) 1 1 1 1 2 1 1 3 1 2 1 15 effectifs cumuls 1 2 3 4 6 7 8 11 12 14 15

Q3-Q1 = 175-166 = 9
cest sur lespace de 9 intervalles que se rpartissent les 50% dobservations les plus centrales

Pour les chelles dintervalle


Lcart-type est lindice de dispersion qui, correspondant la moyenne, est le plus utilis pour les chelles dintervalle Lcart-type nous donne un indice de la dispersion des observations Il correspond la racine carre de la variance. La variance = la moyenne arithmtique des carrs des carts la moyenne

= ( (xi m) / n 1 )

Lcart-type
Il sert caractriser lcart plus ou moins grand de

lensemble des valeurs par rapport la valeur moyenne


Si la dispersion est faible, cela signifie que les rsultats sont groups autour de la moyenne. Si la dispersion est forte, cela signifie que les rsultats sont fort disperss autour de la moyenne. Remarque : lcart-type est diffrent de ltendue. Ltendue est la diffrence entre la plus grande et la plus petite de s valeurs observes

Exemple
Imaginons que deux professeurs procdent la correction de 5 copies La moyenne des deux professeurs est la mme : 11/20

Pourtant les 2 profs ont cot de manire diffrente : les notes du prof A se situent entre 6 et 16 les notes du prof B se situent entre 3 et 19.
Lcart type des notes pour le prof A = 3.81 Lcart-type des notes pour le prof B = 6.20 A

Elves B C D

Prof A 9
Prof B 8

11
10

9
3

13
15

16
19

Exemple
Moyenne Ensemble 1 : 20, 20, 20 Ensemble 2 : 10, 20, 30 Ensemble 3 : 1, 2, 39 20 20 20 Mdiane 20 20 20 Ecart-type 0 8.16 15.51

Dans les trois cas, la moyenne est gale 20, ainsi que la valeur de la mdiane. On ne saurait pour autant conclure que les trois ensemble sont identiques.
la variabilit des donnes est plus grande dans lensemble 3 que dans lensemble 2 et 1

Les Transformations de donnes


Pour les chelles nominales la transformation de frquence absolue en frquence relative (%) le pourcentage = (frquence / n) *100
Modalits A B C D Total Frquence absolue 50 40 30 80 200 Frquence relative (%) 25 20 15 40 100

Les Transformations de donnes


Pour les chelles ordinales Pour comparer plusieurs variables ordinales observes sur un mme chantillon, on peut dterminer, pour chacune de ces variables, les dciles ou les centiles Le premier dcile (D1) = la valeur correspondant lobservation telle que 10% des observations soient infrieurs et 90% des observations suprieures Rang de D1 = (n*1)/10 Les centiles sont obtenus en divisant leffectif par 100 et en le multipliant par le nombre correspondant au centile voulu : Rang du C35=(n*35)/100

Les Transformations de donnes


Pour les chelles dintervalle Pour comparer deux distributions obtenues sur des chelles dintervalle dun mme chantillon, on transforme les donnes de chaque distribution en scores centrs rduits. Cette transformation consiste essentiellement exprimer les donnes dans un systme de mesure standard, correspondant la courbe normale rduite, symbolis par Z Zi = (Xi m) /

Caractristiques de la distribution normale rduite


mode = mdiane = moyenne = 0 lcart-type vaut toujours 1 ( =1) la distribution est symtrique par rapport la moyenne On peut considrer que: 68% des sujets ont un score compris entre 1 et +1

95% ont un score compris entre 2 et +2 99,8 % ont un score compris entre 3 et +3

Caractristiques de la distribution normale rduite


graphique de cette courbe : courbe de Gauss

Les reprsentations graphiques


le graphique barres (histogramme)
pour les chelles nominales, ordinales et dintervalle

le diagramme circulaire (pie, tarte)


pour les chelles nominales et ordinales

la ligne brise des frquences


pour les chelles ordinales et dintervalle

Graphique barres
Graphique barres
50 40

Pourcentages

30 20 10 0 A B Modalits C D

Diagramme circulaire
Diagramme circulaire

25%

20%

A B C D 15% 40%

La ligne brise des frquences


La ligne brise des frquences
10 8

Effectif

6 4 2 0 1 2 Motivation 3 4

Tableau de synthse
Nominale Indice de tendance centrale Indice de dispersion Transformation de donnes Graphiques % mode Ordinale mdiane Intervalle moyenne

Espace interquartile

cart-type

Dciles, centiles Scores centrs rduits Histogramme, tarte, ligne Histogramme, tarte, ligne

Histogramme, tarte

Techniques spcifiques
Quelques techniques souvent utilises en statistiques descriptives Uniquement dans le cas des chelles dintervalle ! Les taux de croissance Les indices Les tableaux et figures Les transformations de donnes

Les taux de croissance


permet dtudier lvolution ou la variation dun phnomne dans le temps Ex: le nombre dtudiants luniversit Calcul de lcart relatif = (valeur darrive valeur de dpart) / valeur de dpart =0.221 Calcul du taux de croissance = lcart relatif *100 = 22%

Anne scolaire
1990-91 1991-92 1992-93 1993-94 1994-95 1995-96 1996-97 1997-98

Nombre dtudiants
1.182.784 1.237.616

1.469.423 1.444.038

Les indices
Il est frquent dutiliser lindice en base 100. Celui-ci est obtenu en multipliant par 100 la valeur darrive divise par la valeur de dpart Indice en base 100 = (valeur darrive / valeur de dpart )*100 Dans notre exemple: lindice en base 100 = (1.444.038 / 1.182.784) *100 = 122

Les tableaux et figures


Pour les tableaux, figures, etc.: Une lgende permet de prciser les diffrentes variables et leurs modalits respectives En dessous, indiquer les sources des donnes recueillies (ONSS, FOREM, ) Prciser les caractristiques essentielles de la population concerne Un titre clair

Les transformations de donnes


1) proportion et pourcentage Ex: dans un chantillon, le nombre dhommes = 20 en valeur relative, les hommes reprsentent donc 2/5 de lchantillon (20/50) soit 40% 2) Taux, parts, coefficients = proportions sous dautres noms Ex: taux de scolarit 3) Les rapports une donne extrieure on rapport la partie une donne extrieure Ex: ratio financier, densit de population, rendement

Вам также может понравиться