Вы находитесь на странице: 1из 6

UNIVERSITE IBN ZOHR

ECOLE NATIONALE DE COMMERCE ET DE GESTION


D¶AGADIRc
c c
c
c
c

 cc  c
c c
÷  
      c
c

Réalisé par : A l¶attention de :


c
 cc c 

c  c
Y   
Y 



  
c c
Page |’

T T

Dans le cadre du cours d¶Analyse des données, nous sommes amenés à préparer un travail
d¶analyse en exploitant les fonctionnalités du logiciel Sphinx.
En ce qui concerne ce travail d¶analyse, nous ferons appelle à quatre variables, deux variables
quantitatives, et deux autres qualitatives. Nous analyserons chaque variable individuellement
à travers des tris à plats, puis nous nous pencherons sur la relation qui existe entre les
variables de même nature.
Les données auxquelles nous ferons appel seront extraites d¶études déjà faites et traitées au
   
niveau du logiciel Sphinx. E u  
          

 c BLE TTT E
 c  ly  u i i  il u ii
 
!c "
# $           

Ô   Les observations gravitent autour de la


Ô  
c c 
 moyenne 1132 ¼ elles s¶approchent ou
 

cc ccc cc  s¶éloignent de celle-ci de 812.74, ou


bien, en moyenne, les automobilistes
cccc  !"
dépensent 1132 ¼ mensuellement sur

cc 
   #!" leurs voitures plus ou moins 812.74 ¼.
ccccc   !"
ccccc  !" La plupart des automobilistes, 74,
ccc     !" dépensent mensuellement entre 800 à
1599 ¼. Il s¶agit de la classe modale des
ccccc  !"
données regroupées.




!c "  #
       $   $
  

Pour cette variable, les observations  
gravitent autour de 1670.51 Km et Ô    c  c 

s¶approchent ou s¶éloignent de celle-ci  

cc  
ccc cc 
avec un écart moyen de 1008.27, ou
cc ccc $cc 
bien, en moyenne, les automobilistes ccccc   !"
parcourent mensuellement avec leurs ccccc

  !#"
voitures 1670.51 Km plus ou moins 
ccc   !"
812.74 Km. ccccc    !"
ccc 
  !"
La plupart des automobilistes ccccc  !"
mensuellement une distance comprise


entre 1000 et 1999 Km. ette part
représente 46.3% de l¶effectif.
3   c|cÑ
c

b.c Anal se bi-variée des variables q antitatives

 c ttc  tic c llc c  c c  l c i lt c c c  i lc
 tit tic
ic c c iic  c lc   titic c l c l tic ic itc
tcll icc
c
c 3   % %  
c
ct l ci cc c  ticiiillcl ticc ccc
 i lc cl  tillc
itcc  ticc  tic tc ctc c
icc tc cc c icccitèc

c icilltcc ccitcc citcclcitccc


 cc

c


c
  !" # $"
À ÀÑ 5
2 4 À
Ñ À5 2
4 5 4
5 5 6
6 5 À
7 À À2
8 Ñ 2
9 5 2
À À5 À5
ÀÀ 8 À
À2 2 À5 

ÀÑ 5 Ñ  Ô  
À4 À5 2
« « «
À75 6 5 c
c

c
c


c   & 

##%&'%#

c
ct l cttclc  titici tcc
†: !" ˆ : #""$%
´: #!! Ë´ : "#!
c
 èclc ccitccc ccc
¦c cc i lc itcttclcc clc  ccc
¦c  cl tccc ittc tcctcc itc!"c&c#!!c
¦c ctcictict licc
cccccccccccccccccccccccccccccccccccccccc cccccccccc c
Page |-

Ty l gi Une tr s forte condensation des observations, ces derni res gravitent
autour du centre de gravité
Ty l gi ’ oyennement importante, s¶éloignent modérément du centre de gravité
Ty l gi  Tr s éloignées, et représentent la part la moins importantes des
observations


 ()* 

š ´ Le coefficient de corrélation est de 0.85. Nous en déduisons une tr s forte linéarité


positive ou directe (70% < 0.85) entre Kilométrage et Dépense, c'est-à-dire que les deux
variables varient linéairement dans le même sens, avec des écarts positifs (ou négatifs) par
rapport à leurs moyennes.
Le mod le ajusté par la méthode des  est le suivant 
Ô $  !'(
    !)'
Intéressons nous maintenant à l¶appréciation des variations des deux variables. En d¶autres
termes, on cherchera à savoir quel incident aura la variation explicative Kilométrage sur la
variation expliquée Dépense. Pour ce faire, on proc de par calculer la dérivée de la droite.
ö
= 0.69
ö
Donc nous en déduisons qu¶une variation de Kilométrage de 1 entraine une variation de
Dépense de 0.69. En d¶autres termes si le kilométrage parcouru mensuellement par
l¶automobiliste varie de 1000 Km, les dépenses quant à elles varieront de 690 ¼.
La Variation Kilométrage explique 72.25% de la variation de Dépenses. Le mod le est tr s
explicatif.

 c BLE LTT E
L¶objectif à ce niveau, est d¶analyser la relation statistique (dépendance ou indépendance)
entre les deux variables qualitatives observées. Pour ce faire, nous allons croiser ces derni res
à l¶aide d¶un tableau de contingence, comme illustré ci-dessous 
! ## (
÷ "  + ! ,$%%& -&%%& "'"
() * &++&
 ./ 0/ 12
(& ,$- $.
3  .0 1/ 455
() +/, . /
*  67 55 15
() ,$-+$%%) $-
 ./ .0 4/5
() &- & 0& .$ &
 * * 48 / 41
() 1 $
*$- /7 /. 2.
(& ,$ 0 &- .& &-
9 :   .1 .5 488
( &+1 ),&
: 47 04 64
( &+ 2/
:  )*& 14 25 4..
(
"'" /28 /17 1.8
3   c|c5
c
[  

   
[
  

   
[   
  
   
   
 
  
c
iti ticc#ccitationscclclcitècc ccitctclcc

3c t c l c tic c li ic tc lc c  i lc ilc
tc ttc  c c c
t l cc
cc

CRITERES/SEXE Homme Femme TOTAL


 citc '(c (c $(c
c
t c %(c #'(c $(c
 citc !(c '"(c #"(c
 c tic '(c %(c $(c
 ctcctc (c $%(c #(c
 clltic %(c %"(c "#(c
ctc)ttic "(c "(c #(c
) c $(c (c !(c
)ttic #!(c ""(c "(c
TOTAL 49.7% 5 .Ñ% À %
c

3cc lcct l cf22 = #'(c&c f2. € f.2 = "(c&c fij  fi. € f.jcclc
cclcc i lctc tc

tc ticl cl ticc ctclcc i lctc tcl c iccl llc


cci clc3ctclc3 cc iccitt ticlc ticcl c
 ctcc i lc

3 4 3
* %35 +  *3
c
CRITERES/SEXE Homme Femme TOTAL c t tc iic c t c lc 3c
 citc (c %(c $$(c cc
c
t c %!%(c ''(c $$(c
*c l c  i lc ,c c c l c
 i lc6-6.7,8
 citc !!(c '""(c $$(c
 c tic $(c %#!(c $$(c
 ctcctc "#(c (c $$(c  citcl ctcctctc ttic
 clltic %'$(c %$(c $$(c  c lc c ic c lc
 c
ctc)ttic $(c %#$(c $$(c ttitcl citctcl  c
) c !!(c '(c $$(c
)ttic %(c %"'(c $$(c
 citctcl  ctcc c
TOTAL 49.7% 5 .Ñ% À % lc  c c  tc c l c itc tc
c

l ctcctctcc clc

 c
c



Page |‰

#       

÷TEE / E E   TTL A partir du TP découle que la variable


9
La vitesse 15.3% 4.9% 10.1%  dépend de la variable 
Le confort 14.8% 19.2% 17.0%
La sécurité 6.2% 13.5% 9.8% La vitesse et la tenue de route attire les
La consommation 15.3% 14.7% 15.0% hommes. La sécurité et l¶espace les
La tenue de route 3.1% 0.8% 1.9% repoussent.
La pollution 8.2% 9.6% 8.9% Les femmes sont attirées par la sécurité
Le coût d'entretien 16.3% 15.5% 15.9% et l¶espace et repoussées par les
L'espace 2.1% 4.3% 3.2% modalités vitesse et tenue de route
L'esthétique 18.8% 17.6% 18.2%
TTL   

Pour tester si la dépendance est significative ou ne l¶est pas, on calcule le chi2, ce test est la
résultante d¶une comparaison entre les fréquences des citations effectives et les fréquences
théoriques. Sphinx donne le résultat suivant La dépendance est tr s significative. chi2 =
52.96, ddl = 8, 1-p = >99.99%.

L¶AF ne peut être faite sur sphinx, du fait que nous n¶avons que deux modalités pour la
9
variable  !

Вам также может понравиться