Вы находитесь на странице: 1из 8

ECHANTILLONNAGE

Jean-Paul AIMETTI - Valrie CHARRIERE EXERCICE 1 : On considre les quantits vendues dun produit donn, dans une population fictive de dix supermarchs. Supermarchs Ventes mensuelles 1 60 2 600 3 180 4 360 5 420 6 540 7 120 8 240 9 300 10 480 1) Calculer la moyenne des quantits vendues. (60+600+180+ +300+480)/10 = 330 units 2) Calculez la moyenne des ventes estime par les 2 chantillons suivants : Echantillon 1 : supermarchs 1 et 7 => 90, sous estimation de la vraie valeur, car on a pris 2 petits magasins. Echantillon 2 : supermarchs 5 et 10 => 450, sur estimation de la vraie valeur, car on a pris 2 gros magasins. Ces deux chantillons vous paraissent-ils pertinents ? non 3) Prconisez un choix plus adapt de 2 supermarchs pouvant constituer un chantillon convenable. Il conviendrait de prendre 1 magasin parmi les petits et 1 magasin parmi les gros

EXERCICE 2 : 1) Vous devez interroger un chantillon de 1200 personnes, rparties galement dans 2 rgions A et B et comprenant, dans chaque rgion 50% dhommes et 50% de femmes. Dans la rgion A, les enquteurs ont interrog, en ralit, 320 femmes 280 dhommes. Cette diffrence est-elle gnante ? A priori on ne peut pas le voir lil nu. Essayez de construire un indicateur total derreurs. Si lon mesure lcart commis pour les femmes entre les effectifs thoriques et les effectifs observs, on constate un cart de + 20 (320-300). En ce qui concerne les hommes, lcart est de -20 (300-280). Si lon somme ces deux carts, on en conclut que lindicateur total dcarts gal 0.

________________________________________________________________________ 1 ___ UE ESC 101 Exercices Dirigs CNAM JPA VCG

Pour ne plus avoir ces problmes de plus et de moins qui annulent les carts, on dcide dlever ces derniers au carr. Ainsi on constate un cart pour les femmes de 400 et un pour les hommes de 400, soit un indicateur total dcarts gal 800. Dautre part, un cart de +/- 20 est-il grave ? 1. oui 2. non 3. cela dpend, si oui de quoi _de leffectif thorique___________ Il faut donc relativiser lcart. Un cart de 20, si on avait demand lenquteur dinterroger 10 femmes serait norme. Un cart de 20, si lobjectif tait de sonder 200000 femmes serait ridiculement petit. Il faut donc relativiser les carts et levs au carr ces derniers, do lindicateur gnral des carts suivant : (effectif thorique-effectif observ)/effectif thorique eff tho 300 300 600 eff obs 320 280 600 eff theo-eff obs 20 -20 0 (eff theo-eff obs) 400 400 800

Femmes Hommes Total

(eff theo-eff obs)/eff tho 1,33 1,33 2,67

On a construit une espce derreur relative au carr, gale dans la rgion A 2,67. Pour linstant je ne sais pas comment interprter cette valeur. 2) Dans la rgion B, les enquteurs ont interrog 330 femmes et 270 hommes. Rpondre aux mmes questions. A priori lindicateur total derreur va tre plus grand, puisque les effectifs observs sont plus loigns des effectifs attendus dans la rgion B que dans la rgion A. eff tho 300 300 600 eff theo-eff obs 30 -30 0 (eff theo-eff obs) 900 900 1800 (eff theo-eff obs)/eff tho 3,00 3,00 6,00

femmes hommes Total

eff obs 330 270 600

On constate que lindicateur, gal 6, est bien construit car il est plus grand pour la rgion B que pour la rgion A 3) Pour la rgion A, vous devez obtenir une quipartition des effectifs dans les 4 tranches dge : 18-24 ans, 25-49 ans, 50-65 ans et plus de 65 ans. Lchantillon de 600 personnes rellement interroges est compos de : 157 personnes de 18-24 ans, 143 de 25-49 ans, 170 de 50-65 ans et 130 de plus de 65 ans. ________________________________________________________________________ 2 ___ UE ESC 101 Exercices Dirigs CNAM JPA VCG

Les diffrences avec les quotas viss dans chaque classe dge vous semblent-elles significatives. eff tho 150 150 150 150 600 eff theo-eff obs 7 -7 20 -20 0 (eff theo-eff obs) 49 49 400 400 898 (eff theo-eff obs)/eff tho 0,3 0,3 2,7 2,7 6,0

18-24 25-49 50-65 plus de 65 Total

eff obs 157 143 170 130 600

Ces 3 indicateurs derreurs sappellent des khi Pour chacun des khi calculs, il manque une valeur de rfrence partir de laquelle nous allons pouvoir conclure que la diffrence entre les effectifs attendus en thorie et ceux observs est grande ou bien est insignifiante. On saide pour cela dune table. On comprend, avec ces trois exemples, quil est ncessaire de prendre en compte le degr de difficult demande aux enquteurs. Le travail des deux premiers, est plus simple que celui du 3me enquteur. Les deux premiers doivent tre justes sur deux critres alors que le 3 doit tre juste sur 4 critres. Il est donc normal dtre plus indulgent avec le 3 enquteur. Certes le Khi calcul est gal 6, comme pour le deuxime enquteur, mais finalement, on pourrait considrer que cest moins grave. Le problme est de savoir partir de quelle valeur, le Khi va tre considr comme significatif, sachant quil y avait 4 quotas respecter. Pour pouvoir rpondre cette question, on utilise le nombre de degr de libert (not DDL) qui correspond au nombre de critres moins 1. DDL = nbre de critres-1 Pourquoi un nom aussi barbare et pourquoi ce moins 1 ? Revenons nos deux premiers enquteurs. Ils taient pays pour interroger 600 personnes. Par rapport aux objectifs qui leurs taient fixs, sils ont ramens plus de rponses de femmes, forcment, il y a moins de rponses dhommes (et inversement). Le 2me cart nest que la consquence du 1er cart. Il ny a pas deux critres indpendants, mais un. Do cette notion dindpendance, de libert, et do ce moins 1 . De mme, le 3me enquteur ne commet en ralit que 3 erreurs indpendantes, la 4me ntant que la consquence. Sil ramne plus de rponses de 18-24 ans, plus de 25-49 ans, plus de 50-65 ans, forcment il y aura moins de rponses des plus de 65 ans. ________________________________________________________________________ 3 ___ UE ESC 101 Exercices Dirigs CNAM JPA VCG

Donc pour apprcier la valeur dun Khi, il faut prendre en compte le degr de libert. Do une table de Khi. N.B. Le tableau suivant donne les seuils de Chi-deux pour les 10 premiers degrs de libert(DDL). DDL 1 2 3 4 5 6 7 8 9 10 0,05 3,84 5,99 7,82 9,49 11,07 12,59 14,07 15,51 16,92 18,31 On saperoit que pour un niveau de signification donn, plus le nombre de degr augmente, plus la valeur de rfrence ( partir de laquelle on peut considrer que lcart entre les effectifs thoriques et observ est grand) augmente. Cela revient dire que lon sautorise tre plus indulgent plus le nombre de critres augmente. Mthode de lecture de la table si le Khi calcul est infrieur 3,84, avec un DDL=1, on conclut que la diffrence entre les effectifs thoriques et les effectifs observs nest pas significative. En revanche, si le Khi calcul est suprieur 3,84, on conclut que la diffrence entre les effectifs thoriques et les effectifs observs est significative avec un risque derreur dans cette conclusion de 5%. Revenons aux exemples portant sur les enquteurs : - pour lenquteur n1, dans la rgion A, le Khi est gal 2,67, et le DDL = 1 (2-1). Si lon travaille avec un risque de 5%, que peut-on en conclure ? a) quelle est la valeur de rfrence pour le khi ? _____________ b) notre khi calcul est-il ? * infrieur * suprieur * gal

c) la diffrence entre les effectifs observs et effectifs thoriques est-elle ? * significative * non significative * cela dpend

Ainsi, alors que pour lenquteur n2, le Khi calcul, avec un degr de libert gal 1 (2-1), tait suprieur la valeur critique (3,84), pour lenquteur n3, le Khi calcul, avec un degr de libert gal 3 (4-1), est infrieur la valeur critique (7,82). Ainsi, pour lenquteur n2, les effectifs observs avaient t jugs significativement diffrents des effectifs thoriques avec un risque derreur dans la conclusion de 5%, alors que pour lenquteur n3, les effectifs observs ne seront pas jugs significativement diffrents des effectifs thoriques.

________________________________________________________________________ 4 ___ UE ESC 101 Exercices Dirigs CNAM JPA VCG

EXERCICE 3 : La socit SFA (Socit Franaise d'Affranchissement) a install des machines affranchir le courrier dans 100 000 entreprises de tailles trs varies. Le traitement statistique de son fichier-clients fournit le tableau suivant de rpartition de la clientle en 3 classes, selon l'effectif de l'entreprise. Nombre de salaris Nombre de l'entreprise d'entreprises clientes < 50 50 - 499 > 500 Total 90 000 8 500 1 500 100 000

Largement leader sur son march, SFA recherche, en priorit, fidliser ses clients, pour maintenir l'essentiel de son chiffre d'affaires (qui consiste, sur les clients existants, en une location annuelle des machines affranchir). Pour mesurer la satisfaction de ses clients, SFA vous demande de concevoir une enqute auprs d'un chantillon de 2 000 clients. Vous devez, en particulier, dcider de la mthode d'chantillonnage. a) Une premire mthode consiste extraire alatoirement 2 000 entreprises du fichierclients de SFA. Calculez la marge d'erreur1, dans chacune des 3 classes de nombre de salaris. On suppose (hypothse la plus probable) que, dans chacune des trois classes considres (C1,C2,C3), on obtient la mme proportion dentreprises que sur lensemble de lchantillon ( 2000 / 100 000 = 2 % ). 2% de 90 000 = 18000 2% de 8500 = 170 2% de 1500=30 Le nombre le plus vraisemblable dentreprises de lchantillon, dans chaque classe est donn par la colonne (A) du tableau suivant. Lapplication de la formule donne en cours fournit une estimation de la marge derreur dans la colonne (B). Nb de salaris Ensemble des clients Echantillon(A) Marge derreur(B) < 50 (C1) 90 000 1 800 2.4 %

50-499 (C2)

8 500

170

7.7 %

> ou = 500 (C3) Total


1

1 500 100 000

30 2 000

18.3 % 2.2 %

La marge derreur est calcule par la formule du cours donnant lintervalle de confiance, (associ une probabilit de 0.95) correspondant au pourcentage de rponse une question donne. Ce pourcentage sera estim 50%, ce qui correspond lintervalle de confiance maximal, pour une taille dchantillon donne.

________________________________________________________________________ 5 ___ UE ESC 101 Exercices Dirigs CNAM JPA VCG

Exemple de calcul dtaille Pour n1= 1800 0,5*0,5/n1 = 1,38*10-4 racine (1,38*10-4) = 0,011178 e=2*racine (0,5*0,5/n1 ) =2,35% b) Sachant que plus de la moiti du chiffre d'affaires de SFA est ralis sur des entreprises de plus de 500 salaris, vous souhaitez analyser plus finement la satisfaction de ces entreprises (en assurant une marge derreur (cf. note 1) dau plus 6%, dans chacune des 3 classes). Proposez un autre mode d'chantillonnage possible en conservant une taille dchantillon de 2 000 entreprises. Pour obtenir une marge derreur de 6 %, lapplication de la mme formule donne .06 = 2 rac ( ( .05 x .05 ) / n ) o n est leffectif minimal n* dune classe donne. On en dduit n* = 278 arrondi 300. On choisit n3 = 300, pour C3, en remarquant que cela reprsente une proportion relativement importante dentreprises acceptant de rpondre lenqute ( 300 / 1 500 = 1 / 5 ). On choisit n2 = 700 pour C2 et n1 = 1 000 pour C3, ce qui permet de conserver, lors danalyses de sous ensemble de C2 ou C3 (deffectif suprieur 200 notamment ), une marge derreur acceptable ( de 7% pour un sous ensemble deffectif 200 ). Ce dcoupage a un caractre arbitraire et des considrations thoriques -non tudies en cours- permettraient daffiner les choix faits. Le raisonnement pragmatique propos se rapproche nanmoins des pratiques courantes de cabinets de conseil et suffit amplement dans le cadre de ce cours. c) Avec la mthode que vous proposez en b), le pourcentage de clients satisfaits dans chacune des 3 classes est estim (par nombre de salaris croissant) respectivement 30%, 25% et 20%. Quelle est lestimation du pourcentage de clients satisfaits sur lensemble de la clientle ? = 30 % x 90 000/100 000 + 25 % x 8 500/100 000 + 20 % x 1 500/100 000 = 29.4 % d) Pourrait-on, selon vous, rduire en taille de lchantillon interroge sans perdre trop de prcision ? On peut, par exemple, ninterroger que 1 000 entreprises (500 en C1, 300 en C2 et 200 en C3, par exemple), ce qui assure une marge derreur globale de 3.2 % (2*racine (0,5*0,5/1000)), au lieu de 2.2 %, et une marge derreur sur chaque classe < 7 %, (7% = (2*racine (0,5*0,5/200) pour la classe C3), au lieu de 6 %. Paralllement, le cot du recueil est divis par 2 ; on garde donc une prcision acceptable pour un budget nettement rduit

________________________________________________________________________ 6 ___ UE ESC 101 Exercices Dirigs CNAM JPA VCG

EXERCICE 4 : Dans une rgion de 2 500 000 personnes de 18 ans et plus, un recensement rcent permet dtablir les tableaux suivants rpartissant ce nombre total dhabitants : selon leur sexe (variable V1) HOMME 1 200 000 48% FEMME 1 300 000 52%

et selon la catgorie socioprofessionnelle de la personne de rfrence du foyer (variable V2) CATGORIE 1 700 000 68% CATGORIE + 800 000 32%

Dans cette mme rgion, on dsire raliser un sondage, sur 100 personnes de 18 ans et plus, en utilisant V1 et V2 comme quotas croiss . Nous supposons que les 100 enqutes sont administres par 4 enquteurs. Sachant que V1 et V2 sont deux variables indpendantes2, dterminez des consignes de quotas possibles pour chaque enquteur (en respectant un quilibre de consignes de quotas donnes aux enquteurs). TOTAL(T) 100 TOTAL (T) 68 CATEGORIE (C-) 32 CATEGORIE (C+) Chaque enquteur doit interroger 25 personnes avec des quotas croiss qui peuvent tre : a) quilibrs pour chaque enquteur (ce qui rduit les biais de recueil) : H F C- 8 9 C+ 4 4 Enquteur 1 H F 8 9 4 4 Enquteur 2 H F 8 9 4 4 Enquteur 3 H F 9 8 3 5 Enquteur 4 15 17 33, soient 68% de 48 35 HOMME(H) 48 FEMME(F) 52

Ce qui implique que lon observe les mmes pourcentages de catgories et + sur la population totale, dune part, sur les hommes et sur les femmes, dautre part.

________________________________________________________________________ 7 ___ UE ESC 101 Exercices Dirigs CNAM JPA VCG

b) rpartis avec des cibles privilgies pour chaque enquteur ( ce qui peut augmenter les biais de recueil) : H F H F H F H F C- 25 0 C- 0 25 C- 8 0 C- 0 10 C+ 0 0 C+ 0 0 C+ 0 17 C+ 15 0 Enquteur 1 Enquteur 2 Enquteur 3 Enquteur 4 c) dtermins avec des consignes intermdiaires entre celles de a) et celles de b)
EXERCICE 5 : (Examen, 2,5 points) Un grand quotidien conomique souhaite mesurer lopinion de ses lecteurs sur le format et le contenu du journal. Un consultant lui propose dinterroger deux cents acheteurs du quotidien la sortie de kiosques parisiens. a) Citer deux biais importants dune telle mthode denqute. (1 point)

Biais 1 : Echantillon uniquement parisien Biais 2 : Non prise en compte - des abonns - des lecteurs non acheteurs - des acheteurs dans dautres lieux que les kiosques
b) Proposez des modes dchantillonnage et dadministration denqute plus complets (1,5 points) NB. Il nest pas demand de prciser le contenu de questionnaires.

Si lectorat important : interview dun chantillon alatoire de cadres et dirigeants avec filtre sur la lecture du quotidien Si lectorat faible : complter la mthode 1 en interrogeant galement - un chantillon dabonns (particuliers + lecteurs en entreprise) - des acheteurs la sortie dautres poins de vente Paris et en rgions Dans tous les cas : redresser les rsultats sur la base dtudes de lectorat (tude IPSOS, par exemple)

________________________________________________________________________ 8 ___ UE ESC 101 Exercices Dirigs CNAM JPA VCG

Вам также может понравиться