You are on page 1of 4

TD1 : Exercices de statistiques descriptives

A- Statistiques descriptives unidimensionnelles

Exercice 1 : Soit x une srie statistique. Dmontrer la formule de Koenig pour la variance :
s x2 = x - x .

Exercice 2 : Soit une srie statistique de taille n, classe suivant la partition


[d1 , d 2 [,...,[ d k , d k +1[,...,[ d m -1 , d m [ . On note nk , N k , ak respectivement leffectif, leffectif cumul
et lamplitude de la classe [d k , d k +1[ . Soit [d j , d j +1[ la premire classe contenant au moins
50% des effectifs cumuls. Dmontrer que lon peut approcher la mdiane par interpolation
n / 2 - N j -1
linaire : Me d j + .a j . De faon analogue, trouver des formules approches pour
nj
les premier et troisimes quartiles.

Exercice 3 : Au poste de page, on compte le nombre de voitures se prsentant sur une


priode de 5mn. Sur 100 observations de 5mn, on obtient les rsultats suivants :

Nombre de 1 2 3 4 5 6 7 8 9 10 11 12
voitures
Nombre 2 8 14 20 19 15 9 6 2 3 1 1
doservations

1) Construire la table des frquences et le diagramme en btons en frquences de la srie


du nombre de voitures.
2) Calculer la moyenne et lcart-type de cette srie.
3) Dterminer la mdiane, les quartiles et tracer le box-plot.
4) Etudier la symtrie de la srie.

Exercice 4 : On donne la srie unidimensionnelle suivante, correspondant la rpartition des


entreprises du secteur automobile en fonction de leur chiffre daffaire en millions deuros.

a) Calculer le chiffre daffaire moyen et lcart-type de la srie.


b) Construire lhistogramme des frquences
c) Construire les deux polygones des frquences cumules
d) Calculer la mdiane et la proportion dentreprises dont le chiffre daffaire est suprieur
3 millions deuros.
Exercice 5 : La distribution des demandeurs demploi selon le sexe et la classe dge dans
une localit est la suivante :

a) Tracer les deux courbes de frquences cumules croissantes.


b) Dterminer les quartiles de la variable X associant chaque demandeur demploi
masculin son ge. Mme question pour les demandeurs demploi de sexe fminin.
c) Conclusions.

B- Statistiques descriptives bidimensionnelles

Exercice 6 : On cherche tudier la relation entre le nombre denfants dun couple et son
salaire. On dispose de la srie bidimensionnelle suivantes :

Salaire en euros Nombre denfants (X)


(Y)
510 4
590 3
900 2
1420 1
2000 0
600 5
850 6
1300 7
2200 8

a) Calculer le coefficient de corrlation linaire entre ces deux variables statistiques.


Conclusion ?
b) Un expert en dmographie affirme que les deux caractristiques sont indpendantes.
Quen pensez-vous ?

Exercice 7 : Lindice moyen dun salaire a volu de la faon suivante :

a) Reprsenter cette srie statistique par un nuage de points.


b) En utilisant la mthode des moindres carres, calculer lquation de la droite
reprsentant lindice en fonction de lanne.
c) Comment pourrait-on prvoir lindice lanne 9 ?

Exercice 8 : Soit X une variable statistique qualitative k modalits et Y une variable


statistique quantitative. Chaque modalit de X dfinit une sous-population : celle des
individus ayant cette modalit. On note n j leffectif correspondant la modalit j de X,
y j (resp. s j ( y ) ) la moyenne (resp. la variance) des valeurs de la variable Y pour les
individus de la modalit j. Montrer que s Y = sE2 + sR2 o
1 k 1 k
s E2 =
n j =1
n j ( y j - y ) et s 2R = n j s 2j ( y ) . On les appelle respectivement variances inter et
n j =1
intra-catgories.

Exercice 9 : On observe le nombre denfants Y sur un ensemble de 12 individus rpartis entre


les sexes (variable X) :

F 3 4 5 4 2 5
H 10 7 6 3 4 2

1) Reprsenter graphiquement cette srie.


2) Calculer les moyennes arithmtiques dans chaque classe
3) Calculer les variances inter et intra-catgories.
4) Calculer et interprter le rapport de corrlation entre X et Y. Conclusion ?

Exercice 10 : Soient x et y deux sries statistiques de taille n. On note rx et ry les sries des
rangs correspondantes.
n +1
a) Montrer que rx = .
2
n - 1
b) Montrer que srx = .
12
1 n
c) En posant d i = rxi - ry i , montrer que 2s(rx, ry ) = srx + sry2 - d i .
n i =1
d) En dduire lexpression du coefficient linaire entre ces deux sries, appel
n
6 d i
i =1
coefficient de corrlation des rangs de Spearman : rs = 1 - .
n(n - 1)

Exercice 11 : Dix chantillons de cidre ont t classs par ordre de prfrence par deux
gastronomes. On obtient les classements suivants :

A 1 2 3 4 5 6 7 8 9 10
B 3 1 4 2 6 5 9 8 10 7

1) Calculer le coefficient de corrlation des rangs de Spearman. Conclusion ?


2) Une autre faon dvaluer le lien entre les rangs de deux sries consiste utiliser le
coefficient de corrlation des rangs de Kendall. Ce coefficient est dfini par :
2S
t= , o S est obtenue de la faon suivante : on considre tous les couples
n(n - 1)
dindividus de la srie. On note 1 si les individus i et j sont dans le mme ordre
pour les deux variables considres (ici ai < a j et bi < b j ). On note -1 si les
deux classements discordent (ici ai < a j et bi > b j ). S est la somme les valeurs
n(n - 1)
obtenues pour les couples distincts. Montrer que t est compris entre -1 et
2
1 et quil est dautant plus proche de 1 que les classements sont semblables.
Calculer t pour les donnes dont on dispose.

Exercice 12 : On considre un chantillon de 797 tudiants dune universit ayant obtenu le


DEUG. On tudie le lien entre lage dobtention du Bac (variable Y), 4 modalits (moins de
18 ans, 18 ans, 19 ans, plus de 19 ans), et la dure dobtention du DEUG (variable X), 3
modalits (2 ans, 3 ans, 4 ans). On a la table de contingence ci-dessous :

X Y Moins de 18 ans 18 ans 19 ans Plus de 19 ans


2 ans 84 224 73 19
3 ans 35 137 75 27
4 ans 14 59 34 16

1) Dterminer le tableau des profils colonnes en pourcentage


2) Reprsenter graphiquement le diagramme en barre de ces profils
3) Dterminer le tableau des effectifs thoriques
4) Calculer lindice du Chi2 et les contributions de chaque case. Conclusion ?