Академический Документы
Профессиональный Документы
Культура Документы
cc c
cc
÷
c
c
c c
Y
Y
c c
Page |
T T
Dans le cadre du cours d¶Analyse des données, nous sommes amenés à préparer un travail
d¶analyse en exploitant les fonctionnalités du logiciel Sphinx.
En ce qui concerne ce travail d¶analyse, nous ferons appelle à quatre variables, deux variables
quantitatives, et deux autres qualitatives. Nous analyserons chaque variable individuellement
à travers des tris à plats, puis nous nous pencherons sur la relation qui existe entre les
variables de même nature.
Les données auxquelles nous ferons appel seront extraites d¶études déjà faites et traitées au
niveau du logiciel Sphinx. E u
c
BLE TTT
E
c ly u ii il u ii
!c "
# $
!c " #
$ $
Pour cette variable, les observations
gravitent autour de 1670.51 Km et Ô c c
s¶approchent ou s¶éloignent de celle-ci
cc
ccc
cc
avec un écart moyen de 1008.27, ou
cc
ccc$cc
bien, en moyenne, les automobilistes ccccc
!"
parcourent mensuellement avec leurs ccccc
!#"
voitures 1670.51 Km plus ou moins
ccc !"
812.74 Km. ccccc !"
ccc
!"
La plupart des automobilistes ccccc
!"
mensuellement une distance comprise
entre 1000 et 1999 Km.
ette part
représente 46.3% de l¶effectif.
3 c|cÑ
c
c ttc tic c llc c c c l c i lt c c c i lc
tit tic
ic c c iic c lc titic c l c l tic ic itc
tcllicc
c
c 3 % %
c
ct l cicc c ticiiillcl ticc ccc
i lc cl tillc
itcc ticc tictc ctc c
icc
tccc c
icccitèc
c
c
!" # $"
À ÀÑ 5
2 4 À
Ñ À5 2
4 5 4
5 5 6
6 5 À
7 À À2
8 Ñ 2
9 5 2
À À5 À5
ÀÀ 8 À
À2 2 À5
ÀÑ 5 Ñ
Ô
À4 À5 2
« « «
À75 6 5 c
c
c
c
c &
##%&'%#
c
ct l cttclc titici tcc
: !" Ë : #""$%
´: #!! Ë´ : "#!
c
èclc ccitccc ccc
¦c cc i lc itcttclcc clc
ccc
¦c cl tccc ittc tcctcc itc!"c&c#!!c
¦c ctcictict licc
cccccccccccccccccccccccccccccccccccccccc cccccccccc c
Page |-
Ty l gi Une tr s forte condensation des observations, ces derni res gravitent
autour du centre de gravité
Ty l gi oyennement importante, s¶éloignent modérément du centre de gravité
Ty l gi Tr s éloignées, et représentent la part la moins importantes des
observations
()*
c
BLE LTT
E
L¶objectif à ce niveau, est d¶analyser la relation statistique (dépendance ou indépendance)
entre les deux variables qualitatives observées. Pour ce faire, nous allons croiser ces derni res
à l¶aide d¶un tableau de contingence, comme illustré ci-dessous
! ## (
÷ " + ! ,$%%& -&%%& "'"
() * &++&
./ 0/ 12
(& ,$- $.
3 .0 1/ 455
() +/, . /
* 67 55 15
() ,$-+$%%) $-
./ .0 4/5
() &- & 0& .$ &
* * 48 / 41
() 1 $
*$- /7 /. 2.
(& ,$ 0 &- .& &-
9 : .1 .5 488
( &+1 ),&
: 47 04 64
( &+ 2/
: )*& 14 25 4..
(
"'" /28 /17 1.8
3 c|c5
c
[
[
[
c
iti ticc#ccitationscclclcitècc ccitctclcc
3c t
c l c tic c li ic tc lc c i lc ilc
tc ttc c c c
t l cc
cc
3cc
lcct l cf22 = #'(c&c f2. f.2 = "(c&c fij fi. f.jcclc
cclcc i lctc tc
l ctcctctcc clc
c
c
Page |
Pour tester si la dépendance est significative ou ne l¶est pas, on calcule le chi2, ce test est la
résultante d¶une comparaison entre les fréquences des citations effectives et les fréquences
théoriques. Sphinx donne le résultat suivant La dépendance est tr s significative. chi2 =
52.96, ddl = 8, 1-p = >99.99%.
L¶AF
ne peut être faite sur sphinx, du fait que nous n¶avons que deux modalités pour la
9
variable !