You are on page 1of 6

SO10FM11 / SO30EM22, Statistiques bivaries, N. Cauchi-Duval, M.

Ouardani, 2014/2015

Page 1

Universit de Strasbourg
Facult des Sciences sociales
SO10FM11 / SO30EM22, TD STATISTIQUES BIVARIES,
EXERCICES, SRIE 1

EXERCICE 1

RVISION DE QUELQUES LMENTS DE STATISTIQUES DESCRIPTIVES

Considrez la srie statistique suivante relative aux ges des 50 membres dune association daccueil
priscolaire :
17
25
28
30
33

18
26
28
30
34

19
26
28
31
35

20
27
29
31
35

22
27
29
31
36

22
27
29
31
36

23
27
29
31
38

23
27
30
32
39

24
28
30
32
40

25
28
30
32
41

1. Donnez le mode et la mdiane de cette srie statistique, puis calculer sa moyenne et son cart-

type. Commentez chacun de ces paramtres.


2. Regroupez cette srie en une srie de 5 classes sous la forme dun tableau. Fates-en une

reprsentation graphiquement.
3. Une association similaire dune ville voisine est compose de 150 bnvoles. Daprs le registre

des bnvoles de cette association lge moyen des 150 bnvoles est de 22,3 ans et lcart-type
de 3,5 ans. Donner lge moyen des bnvoles dans lhypothse dune fusion des deux
associations.

SO10FM11 / SO30EM22, Statistiques bivaries, N. Cauchi-Duval, M. Ouardani, 2014/2015

Page 2

EXERCICE 2.1 RVISION DES CONVENTIONS DE NOTATION DES PARAMTRES DE LA POPULATION ET DE LCHANTILLON
Pour chacun des noncs suivants, identifier la population tudie P, la variable alatoire X et son type, ainsi que les valeurs dcrites :
Population

Une enqute sur les nouvelles technologies a t


mene durant lanne 2005/2006 auprs des jeunes
de 15 24 ans habitant dans le Bas Rhin. 997
jeunes ont t interrogs. Nous leur avons demand
combien dheures ils avaient pass sur internet la
dernire semaine : 911 ont donn une rponse
diffrente de 0. On sintresse aux jeunes qui ont
pass au moins 1 minute sur internet. Les 911
tudiants concerns ont pass en moyenne 10,2 h
sur internet dans la semaine avec un cart-type
observ de 12,6 h.

Dans cette mme enqute, 975 jeunes ont dj


utilis internet. Un certain nombre de phrases ont
t nonces pour mesurer leur degr de
dpendance par rapport Internet : Jutilise
Internet pour parler avec dautres personnes lorsque
je me sens isol a t cit par 43% des 975
jeunes utilisant internet (soit 424 jeunes qui sont
daccord avec cet nonc).

lanne universitaire 2004/2005, 1790 tudiants


taient inscrits lUFR des Sciences Sociales. 483
parmi eux taient inscrits en premire anne, soit
27% de la population des tudiants de lUFR.

Une enqute sur lquipement informatique des


tudiants a t mene en 2003. Environ 9500
tudiants au total taient inscrits lUniversit Marc
BLOCH cette anne l en premier et deuxime
cycle. Sur les 778 tudiants interrogs, on a
observ un retard moyen de 1,29 an avec un carttype de 1,72 an.

Variable
alatoire (VA)

Valeurs

Type de VA
Quali

Quanti

SO10FM11 / SO30EM22, Statistiques bivaries, N. Cauchi-Duval, M. Ouardani, 2014/2015

Population

Mondialisation : 52% des franais la redoutent.


Cette information est tire du journal Libration du
lundi 12/12/2005 et cest le rsultat dun sondage
ralis par lInstitut BVA, par tlphone du 2 au 3
dcembre, auprs dun chantillon de 950
personnes de 18 ans ou plus.

Dbut janvier, des tudiants de DEUG de


luniversit de Marc BOCH prsents en cours ont
rpondu quelques questions sur leur soire du 31
dcembre. Au total 364 tudiants ont rpondu au
questionnaire. On compte environ 6 850 tudiants
inscrits en DEUG Marc Bloch. 70% des tudiants
de DEUG lUniversit Marc Bloch sont des filles.

En 1995/96, une enqute sur le vieillissement du


personnel soignant des hpitaux Universitaires de
Strasbourg (HUS) a t entreprise par le CRESS
(4900 personnes). Dans la population de ce
personnel, lge moyen est de 37 ans. Nous avons
envoy les questionnaires par courrier et 534 sont
revenus. Dans lchantillon, sur les 521 personnes
qui ont donn leur ge (13 non-rponses) on a
trouv un ge moyen de 36,8 ans avec un carttype observ de 8,3 ans.

Deux semaines avant llection prsidentielle de


1995 opposant M. Chirac M. Jospin, partir dun
chantillon de 1000 personnes reprsentatif des
votants en France, lestimation des votes en faveur
de M. Chirac tait de 52 %. Aux lections Mr. Chirac
a obtenu 52,2 % (on suppose que les intentions de
vote nont pas chang).

Dans une enqute mene en 2001 auprs de 1350


mnages en France, on a demand le revenu
disponible du mnage. Nous avons calcul un
revenu mensuel moyen slevant 2402 et un
cart-type de 1786,5 . Nous souhaitons juger de la
reprsentativit de notre chantillon du revenu
mensuel moyen du mnage. Or, les estimations de
lINSEE donnaient un revenu mensuel moyen de
2394 .

Variable
alatoire (VA)

Quanti

Page 3

Valeurs

Type de VA
Quali

SO10FM11 / SO30EM22, Statistiques bivaries, N. Cauchi-Duval, M. Ouardani, 2014/2015

Page 4

Pralable : Il sagit de vous rappeler le calcul dune estimation par intervalle dun paramtre calcul dans un chantillon

reprsentatif, avec un risque dtermin. Il ne sagit donc pas, comme en deuxime anne, de faire toute la dmonstration
mais de vrifier au moins que les conditions dapplication du thorme central-limite sont bien runies avant de calculer
lintervalle. Vous devez galement bien savoir lire les tables dune loi normale.
EXERCICE 2.2
Nous avons demand lanne 2000 un chantillon de 48 tudiants de licence de nous donner lge de
leur mre la naissance de leur premier enfant. Ces mres sont toutes nes entre 1940 et 1960. Nous
avons obtenu dans lchantillon une moyenne de 23,3 ans et un cart-type de 3,5 ans.
1. Que reprsentent les valeurs obtenues dans lchantillon ?
2. Donner une estimation, sous forme dun intervalle bilatral, de lge moyen des mres dans la

population totale concerne, au seuil 80%, 90%, 95%, 99%. Commenter.


3. Peut-on dire que ces estimations sont de bonnes estimations pour lensemble des femmes nes entre

1940 et 1960 et vivant en France en 2000. Argumenter.


EXERCICE 2.3
Dans un chantillon de 418 jeunes de 18 24 ans vivant dans le Bas-Rhin, les nombres de personnes
habitant la CUS est de 210.
1. Que reprsentent les valeurs obtenues dans lchantillon ?
2. Donner une estimation, sous forme dun intervalle bilatral, de la proportion des 18-24 ans du Bas-

Rhin vivant dans la CUS au seuil 90%.


o0o
EXERCICE 3.1 TIRAGE DUN CHANTILLON ET VRIFICATION DE LA REPRSENTATIVIT
Nous avons men une tude sur la russite en premire anne au sein de notre universit. La promotion
de lanne en cours compte 600 tudiants dont 100 se sont dclares comme salaris auprs de
ladministration. Luniversit a mis notre disposition le fichier des adresses des tudiants inscrits. Nos
moyens tant limits nous choisissons de mener lenqute auprs dun chantillon de 100 tudiants qui
nous avons envoy notre enqute.
Une des hypothses mise stipulait quil tait difficile de concilier tudes et emploi. Afin de pouvoir
comparer les tudiants salaris avec les autres, nous avons choisi dinterroger respectivement 50 tudiants
salaris et 50 tudiants non-salaris tirs au hasard parmi le fichier des adresses.
Lenqute tait mene ds la publication des rsultats dexamens de lanne en cours, et nous avons
construit une variable X (russite aux examens) telle que X valle 1 si russite et 0 si chec. Les
rsultats sont les suivants : parmi les tudiants salaris, 40 ont chou contre 25 tudiants chez les nonsalaris.
1. Comment appelle-t-on ce mode de tirage ?
2. Donner la proportion de russite dans lchantillon des 100 tudiants interrogs.
3. Calculer une estimation (pas en intervalle mais ponctuelle) du taux de russite aux examens daprs

lchantillon.
4. Le taux de russite rel est de 38%. Commenter.

SO10FM11 / SO30EM22, Statistiques bivaries, N. Cauchi-Duval, M. Ouardani, 2014/2015

Page 5

EXERCICE 3.2
Voulant tester sil tait pip, un joueur a jet son d 600 fois et a obtenu les rsultats suivants :
Face du d
Nombre doccurrences

Total

115

100

125

95

85

80

600

Peut-on dmontrer, au risque de 5%, que le d est pip ?


EXERCICE 3.3
Des parents de groupe sanguin AB, mettront au monde des enfants de 3 types diffrents : AA, AB et BB.
Si lhypothse de la loi de Mendel sur lhrdit est vraie, long terme, ces 3 groupes se rpartiront,
respectivement, en 25%, 50% et 25% des cas.
Sur un chantillon de 284 enfants, ns de couples AB, nous avons dnombr 22,89% dont le groupe
sanguin est AA, 53,52% dont le groupe sanguin est AB et 23,59% dont le groupe sanguin est BB. Peut-on
rejeter lhypothse de Mendel au risque de 5% ?
EXERCICE 3.4
Dans une enqute effectue en 1996 par la facult des Sciences sociales, portant sur le vieillissement du
personnel soignant, nous avons interrog un chantillon de 534 agents des Hpitaux Universitaires de
Strasbourg (HUS). 270 infirmires ont fait partie de lchantillon, les autres taient soit des aidessoignantes (AS), des aides puricultrices (AP) ou des agents de service hospitalier (ASH).
Nous avons demand ces infirmires leur ge et seules 265 ont rpondu. Leur rpartition selon les
4 classes dge est consigne dans le tableau suivant :
Moins de 30 ans

[ 30 ans ; 40 ans[

[ 40 ans ; 50 ans[

50 ans et plus

71

106

74

14

laide du fichier fourni par les HUS, nous avons comptabilis 1 983 infirmires dont rpartition par
groupes dge est la suivante :
Moins de 30 ans

[ 30 ans ; 40 ans[

[ 40 ans ; 50 ans[

50 ans et plus

29,9%

38,5%

26,1%

5,5%

Peut-on, au seuil de 5% puis de 1%, dire que lchantillon de 265 infirmires est reprsentatif de la
population ( savoir les infirmires des HUS) selon ces quatre classes dge ?

SO10FM11 / SO30EM22, Statistiques bivaries, N. Cauchi-Duval, M. Ouardani, 2014/2015

Page 6

EXERCICE 3.5
Pour le besoin dune enqute, commande par la mairie de Strasbourg, et ralise en 2005 auprs de
1 000 mnages, nous avons choisi de tirer au hasard 50 rues dans un registre des rues de Strasbourg, puis il
tait convenu dinterroger 20 mnages dans chacune des rues tire au hasard (on entend par mnage lensemble
des personnes vivant dans un mme logement).
Pour le tirage alatoire des logements dans une rue, nous avons utilis un d de telle sorte que :

le rsultat dun premier lanc donne le numro de ladresse du premier logement ;


le rsultat du deuxime lanc indique le pas du tirage des autres logements.

Si lenquteur arrivait devant une adresse avec plusieurs logements (immeuble, coproprit), le
protocole lui indiquait :

si ladresse en question il y avait plusieurs niveaux, de tirer alatoirement un niveau puis


dinterroger tous les mnages du niveau indiqu ;
si ladresse en question il y avait un seul nivaux, dinterroger tous les mnages du niveau
indiqu.

1. Comment qualifier ce mode de tirage ?


2. lissue de la collecte 995 mnages ont t enquts. Nous avons voulu jug la reprsentativit de cet

chantillon selon trois critres : le nombre moyen de personnes par mnage ; la proportion de
propritaires ; et la rpartition par sexe et par ge de lchantillon.
a) Nous avons calcul, dans notre chantillon, une moyenne de 1,9 personne par mnage, avec un

cart-type de 0,8 personne. Or daprs le Recensement de la population de 2005 le nombre moyen


de personne par mnage Strasbourg est de 2,1. Que conclure au seuil 98% ?
b) La proportion de logements occups par son propritaire est de 28,5% dans lchantillon, contre

26% daprs le Recensement. Que conclure au seuil 98% ?


c) Enfin daprs le Recensement de la population (de 1999), la rpartition par sexe et groupe dge

Strasbourg tait la suivante :


0-19 ans

20-39 ans

40-59 ans

60 ans et plus

Hommes

12,0%

17,8%

11,1%

6,4%

Femmes

11,9%

19,0%

11,7%

10,2%

Or les 1 891 individus que nous avons enquts se rpartissent de la manire suivante :
0-19 ans

20-39 ans

40-59 ans

60 ans et plus

Hommes

8,20%

16,70%

11,40%

10,2%

Femmes

8,10%

18,20%

11,90%

15,30%

Vrifier la reprsentativit de lchantillon selon ce troisime critre.