Вы находитесь на странице: 1из 9

BTS DOMOTIQUE

Statistiques une variable

2008-2010

STATISTIQUES UNE VARIABLE

Table des matires


I Mthodes de reprsentation I.1 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.2 Tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.3 Graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 3 5 5 6 8 8 8 8 9 9

II Caractristiques de position II.1 Moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II.2 Mdiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II.3 Quartiles, dciles ... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . III Caractristiques de dispersion III.1 tendue . . . . . . . . . . . . . . III.2 Intervalle interquartille . . . . . . III.3 Variance dune srie statistique . III.4 cart-type dune srie statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

http://nathalie.daval.free.fr

-1-

BTS DOMOTIQUE

Statistiques une variable

2008-2010

Dans tout ce chapitre, on considrera les 3 sries statistiques suivantes : Srie A : Notes obtenues un contrle dans une classe de 30 lves : 2 3 3 4 5 6 6 7 7 7 8 8 8 8 8 9 9 9 9 9 9 10 10 11 11 11 13 13 15 16 Srie B : Salaires en euros des employs dune entreprise : Salaires Eectif [900; 1200] 30 [1200; 1400] 30 [1400; 1600] 60 [1600; 1800] 80 [1800; 2000] 40 [2000; 2400] 40 TOTAL 280

Srie C : Proportion dadhrents un club sportif dans direntes sections : 17% jouent au handball, 25% houent au rugby, 58% jouent au tennis.

I
I.1

Mthodes de reprsentation
Vocabulaire

La population est lensemble des individus sur lesquels portent ltude statistique. (Par exemple la classe de BTS domotique, la popolation fminine, les fonctionnaires . . .) dont chaque lment est appel individu. Un chantillon est une partie de la population considre. Le caractre (ou variable) dune srie statistique est une proprit tudie sur chaque individu : Lorsque le caractre ne prend que des valeurs (ou modalits) numriques, il est quantitatif : discret sil ne peut prendre que des valeurs isoles (notes, ge . . .) continu dans le cas contraire (poids, taille . . .). Dans ce cas on eectue souvent un regroupement des valeurs par classes. Sinon, on dit quil est qualitatif (couleur des yeux, sport pratiqu . . .) : les modalits ne sont pas des nombres. A chaque valeur (ou classe) est associe un eectif n : cest le nombre dindividus associs cette valeur. Faire des statistiques, cest recueillir, organiser, synthtiser, reprsenter et exploiter des donnes, numriques ou non, dans un but de comparaison, de prvision, de constat . . . Les plus gros "consommateurs" de statistiques sont les assureurs (risques daccidents, de maladie des assurs), les mdecins (pidmiologie), les dmographes (populations et leur dynamique), les conomistes (emploi, conjoncture conomique), les mtorologues . . .

http://nathalie.daval.free.fr

-2-

BTS DOMOTIQUE

Statistiques une variable

2008-2010

I.2

Tableaux

Dnition 1 On considre une srie statistique X caractre quantitatif, dont les p valeurs sont donnes par x1 , x2 , . . ., xp deectifs associs n1 , n2 , . . ., np avec n1 + n2 + ... + np = N . A chaque valeur (ou classe) est associe une frquence fi : cest la proportion dindividus associs cette valeur. ni est un nombre compris entre 0 et 1, que lon peut crire sous forme de pourcentage. fi = N Lensemble des frquences de toutes les valeurs du caractre sappelle la distribution des frquences de la srie statistique.

Exemple 1 On peut reprsenter la srie A par un tableau deectifs, et le complter par la distribution des frquences : Notes E. Frq. en % 1 0 0 2 1 3 3 2 7 4 1 3 5 1 3 6 2 7 7 3 10 8 5 17 9 6 20 10 2 7 11 3 10 12 0 0 13 2 7 14 0 0 15 1 3 16 1 3 17 0 0 18 0 0 19 0 0

Remarque 1 On peut vrier que la somme des frquences est gale 1 (ou 100 si on les exprime en pourcentages). On peut aussi faire un regroupement par classe, ce qui rend ltude moins prcise, mais qui permet davoir une vision plus globale.
Exemple 2 Toujours pour la srie A, si on regroupe les donnes par classes damplitude 5 points, on obtient : Notes Eectif Frquence [0; 5[ 4 0, 13 [ 5 ; 10 [ 17 0, 57 [ 10 ; 15 [ 7 0, 23 [ 15 ; 20 [ 2 0, 07 total 30 1

I.3

Graphiques

Lorsque le caractre tudi est quantitatif et discret, on peut reprsenter la srie statistique tudie par un diagramme en btons : la hauteur de chaque bton est alors proportionnelle leectif (ou la frquence) associ chaque valeur.
Exemple 3 Voici le diagramme en btons reprsentant la srie des notes de la srie A : Eectif 5 4 3 2 1 ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 -3Notes

http://nathalie.daval.free.fr

BTS DOMOTIQUE

Statistiques une variable

2008-2010

Lorsque on peut leectif Lorsque

le caractre tudi est quantitatif et continu, et lorsque les modalits sont regroupes en classes, reprsenter la srie par un histogramme : laire de chaque rectangle est alors proportionnelle (ou la frquence) associe chaque classe. les classes ont la mme amplitude, cest la hauteur qui est proportionnelle leectif.

Exemple 4 Pour la srie B, on obtient par exemple lhistogramme suivant : Lgende : 5 salaris

900

1200

1400

1600

1800

2000

2400

Enn, lorsque le caractre est qualitatif, on peut reprsenter la srie par : Un diagramme circulaire ( camemberts ) : La mesure de chaque secteur angulaire est proportionnelle leectif associ. Un diagramme en tuyaux dorgue : Chaque classe est reprsente par un rectangle de mme largeur et de longueur proportionnelle leectif, donc la frquence. un diagramme en bandes : Chaque classe est reprsente par un rectangle de mme largeur et de longueur proportionnelle leectif, donc la frquence.
Exemple 5 Diagrammes de la srie C Handball 17% Rugby Handball 58% Tennis 17% Handball 25% Rugby 25%

Tennis 58% Tennis

Rugby

Diagramme circulaire

Diagramme en tuyau dorgue Diagramme en bandes http://nathalie.daval.free.fr -4-

BTS DOMOTIQUE

Statistiques une variable

2008-2010

II

Caractristiques de position

Dans le premier paragraphe, on a commenc condenser les informations pour les rendre plus lisibles. Dans ce deuxime paragraphe, on va synthtiser encore davantage linformation pour les caractres quantitatifs en cherchant quelques nombres permettant de dcrire au mieux la population observe.

II.1

Moyenne

Dnition 2 Soit une srie statistique caractre quantitatif, dont les p valeurs sont donnes par x1 , x2 , . . ., xp deectifs associs n1 , n2 , . . ., np avec n1 + n2 + ... + np = N . La moyenne pondre de cette srie est le nombre not x qui vaut x= n1 x1 + n2 x2 + ... + np xp 1 = n1 + n2 + ... + np N
p

ni xi .
i=1

Remarque 2 Lorsque la srie est regroupe en classes, on calcule la moyenne en prenant pour valeurs xi le centre de chaque classe ; ce centre est obtenu en faisant la moyenne des deux extrmits de la classe.
Exemple 6 254 Dans la srie A, la moyenne du contrle est gale m = 8, 47. 30 Dans la srie B, une estimation du salaire moyen est donn par : S =

460500 1644, 64. 280

Remarque 3 On peut aussi calculer une moyenne partir de la distribution de frquences :


p

x = f1 x1 + f2 x2 + + fp xp =

fi xi .
i=1

Proprit 1 (Linarit de la moyenne) o Si on ajoute (ou soustrait) un mme nombre k toutes les valeurs dune srie, alors la moyenne de cette srie se trouve augmente (resp. diminue) de k. o Si on multiplie (ou divise) par un mme nombre non nul k toutes les valeurs dune srie, alors la moyenne de cette srie se trouve multiplie (resp. divise) par k.

Exemple 7 On considre la srie A : Si on ajoute 1, 5 points chaque note du contrle, alors la moyenne de classe devient m = 8, 47 + 1, 5 = 9, 97. Si on augmente chaque note de 10%, cela revient multiplier chaque note par 1, 1, ce qui donne m = 8, 47 1, 1 = 9, 32.

http://nathalie.daval.free.fr

-5-

BTS DOMOTIQUE

Statistiques une variable

2008-2010

Proprit 2 (Moyenne par sous-groupes) Soit une srie statistique, deectif total N , de moyenne x. Si on divise cette srie en deux sous-groupes disjoints deectifs respectifs p et q (avec p + q = N ) de moyennes respectives x1 et x2 , alors on a : x= p q x1 + x2 . N N

Exemple 8 On suppose par exemple que les 12 garons de la classe de la srie A ont obtenu une moyenne globale de 8 sur 20. 12 18 La moyenne du groupe form par les lles de la classe vrie : 9, 47 = 8+ mf . 30 30 30 12 Soit mf = 9, 47 8 = 10, 45. 18 30

II.2

Mdiane

Dnition 3 Soit une srie statistique ordonne dont les n valeurs sont x1 x2 x3 xn . La mdiane est un nombre M qui permet de diviser cette srie en deux sous-groupes de mme eectif. Si n est impair, n est la valeur de cette srie qui est situe au milieu, savoir la valeur dont le n+1 rang est , note x n+1 . 2 2 Si n est pair, n est le centre lintervalle mdian, qui est lintervalle form par les deux nombres situs au milieu de la srie, savoir x n et x n +1 . 2 2

Exemple 9 La mdiane de la srie 2 5 6 8 9 9 10 est 8. La mdiane de la srie 2 5 6 8 9 9 est 7. La mdiane de la srie 2 5 6 6 9 10 est 6. Exemple 10 On souhaite calculer la mdiane de la srie A. Pour cela, on commence par remplir le tableau des eectifs cumuls croissants : Notes E. 01 0 02 1 03 2 04 1 05 1 06 2 07 3 08 09 10 11 12 13 14 15 16 17 18 19

5 6 2 3 0 2 0 1 1 0 0 0 ECC. 0 1 3 4 5 7 10 15 21 23 26 26 28 28 29 30 30 30 30 Ensuite, leectif tant de 30, on chosit la moyenne entre la 15ime et la 16ime note. 8+9 On obtient M ed = = 8, 5. 2 Ce qui signie que la moiti des notes est infrieure ou gale 8, 5, et que lautre moiti des notes est suprieure ou gale 8, 5.

http://nathalie.daval.free.fr

-6-

BTS DOMOTIQUE

Statistiques une variable

2008-2010

Dans le cas de rpartition par classes, la mdiane peut tre value soit graphiquement, soit par interpolation ane laide dun polygne des eectifs cumuls.
Exemple 11 On choisit la rpartition par classes de la srie A : On commence par crer le tableau des frquences cumules croissantes : (On en prote aussi pour indiquer les frquences cumules dcroissantes). Notes Frq. en % F.c.c. F.c.d. [0; 5[ 13 13 87 [ 5 ; 10 [ 57 70 43 [ 10 ; 15 [ 23 93 7 [ 15 ; 20 [ 7 100 0

Puis on place les points correpondants aux extrmits de chaque classe sur un graphique : Eectif en % 100 F.c.d. 80

F.c.c.

60

40

20

Med.

10

15

Notes

On dtermine le point du polygne dordonne 50% et on trouver eniron 8, 2. Pour trouver la mdiane, on peut aussi tracer le polygne des frquences cumules dcroissantes et lire labscisse du point de concours des deux polygnes. On trouve aussi 8, 2. Enn, par le calcul, 50% se situe dans lintervalle [ 5 ; 10 [. On fait lhypothse que les longeurs des axes sont uniformment rparties dans cette classe. On peut alors procder une interpolation linaire daprs le thome de Thals : 70

50

13 5 10

50 13 M 5 37 37 470 M 5 = = M = 5 +5= 8, 25. 10 5 70 13 5 57 57 57 http://nathalie.daval.free.fr -7-

BTS DOMOTIQUE

Statistiques une variable

2008-2010

II.3

Quartiles, dciles ...

Dnition 4 Soit une srie statistique. On appelle quartiles de la srie un triplet de rels ( Q1 ; Q2 ; Q3 ) qui spare la srie en quatre groupes de mme eectif. On appelle dciles de la srie un 9-uplet de rels ( D1 ; D2 ; ... ; D9 ) qui spare la srie en dix groupes de mme eectif.

Remarque 4 Par dnition, si X est une srie statistique, Q2 = D5 = M ed(X ). Le calcul des valeurs des quartiles ou des dciles se fait en gnral partir des graphiques des eectifs (ou frquences) cumuls croissants, par interpolation linaire. La calculatrice donne les valeurs de Q1 , M ed et Q3 .
Exemple 12 Pour la srie A, la calculatrice nous donne Q1 = 7, M d = 8, 5 et Q3 = 10. Graphiquement, on trouve D1 3, 8 et D9 14, 2. Pour la srie B, on trouve Q1 = 1500, M ed = 1700 et Q3 = 1900.

III
III.1

Caractristiques de dispersion
tendue

Il sagit de la premire mesure de la dispersion dune srie statistique. Son principal mrite a longtemps t dexister, et de fournir une information sur la dispersion trs simple obtenir. Dnition 5 Soit X une srie statistique discrte. On appelle tendue de la srie le rel, dni par Etd(X ) = max(X ) min(X ).
Exemple 13 Ltendue de la srie A est de 16 2 = 14.

III.2

Intervalle interquartille

Dnition 6 On appelle intervalle inter-quartiles lintervalle [ Q1 ; Q3 ]. Lamplitude de cet intervalle est appele cart inter-quartiles.

Exemple 14 Dans la srie A, lintervalle interquartile est lintervalle [ 7 ; 10 ] dont lcart vaut 10 7 = 3. Cet intervalle comprend donc la moiti des notes de la srie situe au centre de celle-ci.

http://nathalie.daval.free.fr

-8-

BTS DOMOTIQUE

Statistiques une variable

2008-2010

III.3

Variance dune srie statistique

Dnition 7 La variance dune srie statistique est le nombre not V (x) obtenu comme moyenne des carrs des carts constats par rapport la moyenne de la srie : V (X ) = 1 n1 (x1 x )2 + n2 (x2 x )2 + ... + np (xp x )2 = n1 + n2 + ... + np N
p i=1

ni (xi x )2 .

Remarque 5 Cette formule sapplique bien sr au cas dune srie statistique sans coecients : on est ramen une srie pour laquelle tous les coecients valent 1.
Exemple 15 La variance de la srie B vaut : 30(1050 1645)2 + 30(1300 1645)2 + ... + 40(2200 1645)2 109346. V (X ) = 280

Proprit 3 On utilise aussi la formule : 1 V (X ) = N


p i=1

ni x2 2 . i x

III.4

cart-type dune srie statistique

Dnition 8 Lcart-type dune srie statistique X , not (X ), est la racine carre de la variance de cette srie : (X ) = V (X ).

Exemple 16 Lcart-type de la srie B vaut : (X ) = 109561 = 331.

Proprit 4 La variance et lcart-type prsentent les proprits suivantes : o La variance et lcart-type sont des nombres positifs ou nuls, o Une variance nulle ou un cart-type nul signient que toutes les valeurs de la srie son gales sa moyenne, o Plus la variance (ou lcart-type) dune srie est grande, plus cette srie est disperse autour de sa moyenne,

http://nathalie.daval.free.fr

-9-

Вам также может понравиться