Академический Документы
Профессиональный Документы
Культура Документы
Recherche de description
Rappel = dcrire les caractristiques (les distributions) dune ou plusieurs variables mesures sur un chantillon ou une population. 2 caractristiques dgager : les indices de tendance centrale des donnes les indices de dispersion Prsentation des informations et donnes les transformations possibles et ncessaires des donnes les reprsentations graphiques des rsultats
Lindice de dispersion
= exprime ltendue de la variabilit des observations Les donnes peuvent tre concentres autour de la tendance centrale ou au contraire trs disperses Exemple : un groupe dlves (classe A) avec une moyenne de 10/20 mais dont les rsultats en fin danne stendent de 5/20 18/20 un groupe dlves (classe B) avec une moyenne de 10/20 mais dont les cotes stabliraient de 9/20 14/20 La classe A a un indice de dispersion suprieur la classe B
Modalits
conomie mdecine droit philo Total
Frquenc es (fi)
40 80 30 50 200
Calcul du mdian
Il faut commencer par classer les modalits par ordre croissant !! Si n est pair, le rang mdian tombe mi-chemin entre les deux rsultats centraux. On choisit de considrer comme mdian, celui qui est immdiatement au-dessus Md = (N/2) +1 Si n est impair, la mdiane est exactement lobservation du milieu : Md = (N+1) /2
Exemple
On examine, sur base dun chantillon de 20 tudiants, quel serait leur degr de motivation suivre une session de formation : 1= trs peu motiv , 2 = peu motiv , 3 = motiv , 4 = trs motiv
N = 20 = pair
N/2 +1 = 11 lobservation prendre en considration est la 11me. la modalit mdiane = la catgorie 2 (peu motiv)
Effectifs cumuls 4 12 18 20
Exemple
Scores
On classe un chantillon de 15 lves en fonction dun score (sur 200 points) obtenu un test N = 15 = impair (N+1) /2 = 8 lobservation qui nous intresse est la 8me La valeur de ce 8me rang est de 170 La mdiane = 170
Effectifs (fi)
1 1 1 1 2 1 1 3 1 2 1 15
effectifs
cumuls 1 2 3 4 6 7 8 11 12 14
156 160 162 166 167 169 170 175 177 182
185
Total
15
Exemple
On a relev la taille exprime en cm de 30 individus adultes = 5198 / 30 La moyenne = 173.27 cm La mdiane = 175 cm Le mode = la modalit 175 cm
Tailles 158 160 162 164 168 170 172 175 179 180 183 185 188 189 Total
Effectifs 2 1 3 1 4 1 3 5 2 2 1 1 3 1 30
effectifs c. 2 3 6 7 11 12 15 20 22 24 25 26 29 30
Remarques
La moyenne est trs fort influence par les extrmes Ex : Calculer le salaire moyen de 5 joueurs de foot 4 joueurs gagnent 100.000 Euros par anne, le 5me joueur gagne 1.000.000 par anne. Le salaire moyen = 280.000 Euros Dans ce cas, la moyenne ne reflte pas ncessairement bien toute la ralit La mdiane permettra alors de synthtiser ces donnes sous un autre angle
Remarques
Le mode est facilement reprable et interprtable. Cependant, il ne tient pas compte de toutes les donnes et ne se prte pas au traitement arithmtique La mdiane est facilement interprtable et aise dterminer mais elle ne se prte pas aux traitements arithmtiques La moyenne est facilement interprtable, aise calculer et se prte bien aux traitements arithmtiques
Modalits
1 2 3 4 Total
Effectifs (fi)
4 8 6 2 20
effectif cumul
4 12 18 20
Autre exemple
Scores Le rang de Q1 = 3.75 = rang 4 Le rang 4 correspond un score de 166 Le rang de Q3 = 11.25 = rang 11 Le rang 4 correspond un score de 175 156 160 162 166 167 169 170 175 177 182 185 Total Effectifs (fi) 1 1 1 1 2 1 1 3 1 2 1 15 effectifs cumuls 1 2 3 4 6 7 8 11 12 14 15
Q3-Q1 = 175-166 = 9
cest sur lespace de 9 intervalles que se rpartissent les 50% dobservations les plus centrales
= ( (xi m) / n 1 )
Lcart-type
Il sert caractriser lcart plus ou moins grand de
Exemple
Imaginons que deux professeurs procdent la correction de 5 copies La moyenne des deux professeurs est la mme : 11/20
Pourtant les 2 profs ont cot de manire diffrente : les notes du prof A se situent entre 6 et 16 les notes du prof B se situent entre 3 et 19.
Lcart type des notes pour le prof A = 3.81 Lcart-type des notes pour le prof B = 6.20 A
Elves B C D
Prof A 9
Prof B 8
11
10
9
3
13
15
16
19
Exemple
Moyenne Ensemble 1 : 20, 20, 20 Ensemble 2 : 10, 20, 30 Ensemble 3 : 1, 2, 39 20 20 20 Mdiane 20 20 20 Ecart-type 0 8.16 15.51
Dans les trois cas, la moyenne est gale 20, ainsi que la valeur de la mdiane. On ne saurait pour autant conclure que les trois ensemble sont identiques.
la variabilit des donnes est plus grande dans lensemble 3 que dans lensemble 2 et 1
95% ont un score compris entre 2 et +2 99,8 % ont un score compris entre 3 et +3
Graphique barres
Graphique barres
50 40
Pourcentages
30 20 10 0 A B Modalits C D
Diagramme circulaire
Diagramme circulaire
25%
20%
A B C D 15% 40%
Effectif
6 4 2 0 1 2 Motivation 3 4
Tableau de synthse
Nominale Indice de tendance centrale Indice de dispersion Transformation de donnes Graphiques % mode Ordinale mdiane Intervalle moyenne
Espace interquartile
cart-type
Dciles, centiles Scores centrs rduits Histogramme, tarte, ligne Histogramme, tarte, ligne
Histogramme, tarte
Techniques spcifiques
Quelques techniques souvent utilises en statistiques descriptives Uniquement dans le cas des chelles dintervalle ! Les taux de croissance Les indices Les tableaux et figures Les transformations de donnes
Anne scolaire
1990-91 1991-92 1992-93 1993-94 1994-95 1995-96 1996-97 1997-98
Nombre dtudiants
1.182.784 1.237.616
1.469.423 1.444.038
Les indices
Il est frquent dutiliser lindice en base 100. Celui-ci est obtenu en multipliant par 100 la valeur darrive divise par la valeur de dpart Indice en base 100 = (valeur darrive / valeur de dpart )*100 Dans notre exemple: lindice en base 100 = (1.444.038 / 1.182.784) *100 = 122