Вы находитесь на странице: 1из 151

jean-Claude Liquet 1

Analyse des donnes


jean-Claude Liquet 2
4 sances
1- Les donnes: nature, traitement quanti-quali.
Analyse univari et bivari.
2- Lanalyse de variance, lanalyse factorielle
ACP AFC AFCM
3-Les mthodes explicatives : rgression linaire
et multilinaire, lanalyse structurelle des variables
latentes.
4-Analyse discriminante. Analyse conjointe et
analyse multidimensionnelle des similarits

jean-Claude Liquet 3
Bibliographie : analyse de donnes en marketing.
Propose par J .C. Liquet :

Audigier 1995 les tudes marketing Dunod fiches express.
Bouroche et Saporta 1992 lanalyse des donnes P.U.F. Que sais je n=1854.
Cibois 1995 lanalyse factorielle Que Sais Je 2095.
Baleo JN et al 2003 Myhodologie exprimentale Tech et Doc
Bon , Gregory 1995 les techniques marketing Vuibert.
Croutsche Jean-Jacques 1997 Pratique de lAnalyse des donnes Editions Eska
Dickes P et al 1994 la psychomtrie Puf.
Foucart Thierry 1997 lanalyse de donnes presses universitaires de Rennes
Escoffier et Pags 1988 analyses factorielles simples et multiples : objectifs, mthodes et interprtation Dunod.
Escoffier et Pags 1997 Initiation aux traitements statistiques, mthodes, mthodologie Presse Universitaire de Rennes.
Evrad et Lemaire 1976 information et dcision en marketing Dalloz.
Fenelon 1992 quest ce que lanalyse des donnes , Lefonen.
Gianelloni, Vernette 1994 tude de march Vuibert.
Giard 7
ime
ed 1995 statistique applique la gestion Economica.
Green,Tull 1974 recherche et dcisions en marketing , Presses Universitaires de Grenoble.
Hooley et Hussey 1994 quantitative methods in marketing The Dryden Press.
Lagarde Jean de 1995(redition) initiation lanalyse de donnes Dunod
Ladwein 1996 les tudes marketing Economica.
Lambin 1993 la recherche en marketing Ediscience.
Liquet J C, Flambard S, Jean S 2003 Cas danalyse des donnes en marketing Tech et Doc
Moscarola. 1990 enqutes et analyse des donnes Vuibert.
Perrien Cherron 1984 recherches en marketing , mthodes de dcision Gatan Morin.
Pras, Evrad, Roux 1994 market Vuibert
S.P.S.S. manuels dutilisation.


jean-Claude Liquet 4
Biblio suite
Roussel P et al 2002 Mthodes dquation structurelles: recherche et applications en gestion Economica
Saporta 1990 probabilits, analyse des donnes et statistique ditions Technip.
Thitart Alain et al. 1999 Mthodes de recherche en management Dunod.
Vedrine J.P . 1991 Le traitement des donnes ditions dorganisation.
Vandercammen, Gauthy-Sinchal 1999 Recherche Marketing, outil fondamental du marketing De
Boeck Universit
Volle M. 1989 analyse des donnes Economica.
Wonnacott. 1972, 4
ime
ed 1994. statistique Economica
La collection Sage et Amos user guide

jean-Claude Liquet 5
Origine des donnes
Donnes primaires
Observation
Exprimentation
Enqute
Donnes secondaires
Insee
Organisme public
Observatoire spcialis (Xerfi etc.)

jean-Claude Liquet 6
Nature des donnes
Les donnes nominales
Genre homme femme que lon peut coder 0 et 1
Les donnes ordinales
Relation dordre antisymtrie et transitivit
Les donnes quantitatives de ratio
Y=aX
Les donnes quantitatives dintervalle
Y=aX +b (la temprature et les chelles de lickert ou
diffrentiel smantique)

jean-Claude Liquet 7
les chelles de Lickert ou diffrentiel
smantique
Diffrentiel smantique
Pour vous le produit est
Amer___1 __2 __3 __4 __5__ 6__ 7__ Doux
Echelle de lickert
Le produit que je viens de goter est amer
Pas du tout Pas daccord ni daccord daccord Tout fait
daccord ni pas daccord daccord
/___1____/______2______/______3________/_____4_____/____5_/



jean-Claude Liquet 8
L'organisation matricielle des
donnes

Individu Varible1 /
Le poids en
kg
Variable 2 /
La taille en
m
Variable 3
Le sexe
Variable 3 /
Le rang au
100 M
papillon
masculin
universitaire
Pierre 75 1,80 Masculin 1
Marie 60 1,65 Fminin
Jasmina 56 1,60 Fminin
Jacques 80 1,90 Masculin 2
Paul 72 1,70 Masculin 3
Denis 60 1,60 Masculin 7
Anne 50 1,60 Fminin
Jean 74 1,75 Masculin 5
Josu 90 2 Masculin 4
Idriss 85 1,83 Masculin 6
Etienne 85 1,70 Masculin 8


jean-Claude Liquet 9
L'analyse univarie ou tri plat
Variables quantitatives
n x x
n
i

=
1
lments d nombre le est n
iable la de quelconque lment un est x
moyenne la est x o
i
'
var
jean-Claude Liquet 10
Distribution


Variable tudie
Courbe de Gauss
F
r
e
q
u
e
n
c
e
moyenne
A
M
F
R
E
Q
U
E
N
C
E
Valeurs de la variable tudie

=
n
i
M x dispersion
1
) (
n
M x
Variance
n
i

=
1
2
) (


=
n
M x
type cart
i
2
) (
o
jean-Claude Liquet 11
Proprits de la loi normale

Variable tudie
Courbe de Gauss
F
r
e
q
u
e
n
c
e
o
68 % de la
population
entre - o et +o
95 % de la population
entre - 2 o et +2o

jean-Claude Liquet 12
Les autres indicateurs de
tendance centrale


La mdiane : C'est la valeur de la variable
qui divise la population en deux sous
populations d'effectif gal.
Le mode : C'est la valeur de la variable qui a
la frquence la plus importante.

jean-Claude Liquet 13
Variables qualitatives

Pour les variables ordinales ou nominales le tri plat est essentiellement
constitu par le calcul des frquences des modalits.
En ce qui concerne les variables ordinales, des indicateurs de dispersion
constitus par les fractiles peuvent tre utiles.
Exemple : Echantillon utilis lors d'une tude

Quelle est votre profession ?
Frquence Pour cent
Agriculteur 14 4,38
Cadre suprieur, Profession librale 69 21,56
Profession intermdiaire 67 20,94
Employ 70 21,88
Ouvrier 30 9,38
Retrait 18 5,63
Inactif 30 9,38
Etudiant 22 6,88
Total 320 100

jean-Claude Liquet 14
Retour sur
l'chantillonnage

B
Mb et ob
Population mre
appele A qui prsente
une moyenne m pour
une variable V et un
cart type o
C Mc et oc
D Md et od

E Me et oe

1 - ne
e
1 - nd
d
1 - nc
c
1 - nb
b
N
o o o o o
= = = =
N
V
96 , 1 = A
N
V
56 , 2 = A
N
p p ) 1 (
96 , 1

= A

Pour o=0,05

Pour o=0,01
jean-Claude Liquet 15
Incertitude sur chantillonnage

Population 1/N Incertitude
100 0,01 0,1
400 0,0025 0,05
500 0,002 0,044
1000 0,001 0,031
40000 0,000025 0,005

jean-Claude Liquet 16
L'analyse bivarie descriptive
ou tri crois

Deux variables quantitatives
Y) de ype X)(cart t de e (cart typ
Y et X bles deux varia de Covariance
R =
1 - n
) (
1 - n
) (
1 n
) )( (
R
i
2
1 i
i
2
1 i
i
2 i 1 i




=
m y m x
m y m x



=
i
2
1 i
i
2
1 i
i
2 i 1 i
) ( ) (
) )( (
R
m y m x
m y m x
jean-Claude Liquet 17
Reprsentation graphique

R=-1 R=0 R=1
Anticorrlation Indpendance Corrlation parfaite


jean-Claude Liquet 18
Deux variables qualitatives
Le but de l'analyse est de dterminer si deux variables
qualitatives sont indpendantes ou dpendantes. Autrement
dit, il sagit de dterminer lexistence ou non dun lien.
D'o les hypothses suivantes.
Ho : Les deux variables sont indpendantes
H1 : Les deux variables sont dpendantes.
Le test consiste rejeter l'hypothse Ho
Le test le plus frquemment utilis est le test de Chi2.

jean-Claude Liquet 19
En colonne variable
V1

En ligne la variable
V2

m1

m2

m3

L1

A

B

C

L2

D

E

F

l3

G

H

I

Tableau de contingence
jean-Claude Liquet 20
En colonne variable
V1

En ligne la variable
V2

m1

m2

m3

L1

A'

B'

C'

L2

D'

E'

F'

l3

G'

H'

I'

Tableau des effectifs thoriques
jean-Claude Liquet 21
En colonne variable
V1

En ligne la variable
V2

m1

m2

m3

L1

A-A'

B-B'

C-C'

L2

D-D'

E-E'

F-F'

l3

G-G'

H-H'

I-I'

Diffrence entre thorie et observation
jean-Claude Liquet 22
En colonne variable
V1

En ligne la variable
V2

m1

m2

m3

L1

(A-A')x(A-A')

(B-B')x(B-B')

(C-C')x(C-C')'

L2

(D-D')x(D-D')

(E-E')x(E-E')

(F-F')x(F-F')

l3

(G-G')x(G-G')

(H-H')x(H-H')

(I-I')x(I-I')

Carr des valeurs
jean-Claude Liquet 23
En colonne variable
V1

En ligne la variable
V2

m1

m2

m3

L1

(A-A')x(A-A')/A'

(B-B')x(B-B')/B'

(C-C')x(CxC')/C'

L2

(D-D')x(D-D')/D'

(E-E')x(E-E')/E'

(F-F')x(F-F')F'

l3

(G-G')x(G-G')/G'

(H-H')x(H-H')/H'

(I-I')x(I-I')/I'

thorique effectif
) thorique effectif - observ (effectif
j i,
2
2

= X
Carrs relatifs
jean-Claude Liquet 24
En colonne variable
V1

En ligne la variable
V2

m1

m2

m3

Somme des
lignes

L1

A

B

C

A+B+C

L2

D

E

F

D+E+F

l3

G

H

I

G+H+I

Somme des
colonnes

A+D+G

B+E+H

C+F+I

N



A' = (la probabilit d'appartenir la premire ligne x par la probabilit d'appartenir la premire colonne)X N

N
N
G D A
N
C B A
A'
+ +

+ +
=
jean-Claude Liquet 25
Ce calcul est ritr autant de fois qu'il y a de cellules.
Si les deux variables sont indpendantes, le rsultat apporte
peu de sens pour l'tude. Par contre si un lien existe, il faut
expliquer le sens sous-jacent. C'est l'cart entre leffectif
thorique et leffectif observ qui sera dterminant, les plus
grands carts permettront de dterminer les carts de
l'exprimentation un contexte d au hasard.

jean-Claude Liquet 26
La comparaison de
moyennes


m1 m2
m1 m2
ou
H0 : m1 est gal m2
H1 : m1 est diffrent de m2

jean-Claude Liquet 27

Ce qui revient calculer une valeur z qui sera compare la valeur du z de la loi normale centre rduite au risque o.

1 n
2) de e (cart typ
1 n
1) de e (cart typ
m2 - m1
2
2
1
2

= z
Dans le cas de deux proportions le calcul se fait de faon semblable

)
n
1
n
1
)( 1 (
p2 - p1
2 1
+
=
p p
z
2 1
2 2 1 1
n n
p n p n
p
+
+
=
Pour rpondre au test il faut comparer ce z la valeur limite de la table, autrement dit de vrifier au risque de 5% si z est suprieur 1,96, car
l'hypothse de dpart est la normalit des distributions
jean-Claude Liquet 28
Lanalyse de variance
On cherche comparer deux (ou plusieurs) exprimentations, c'est dire
mettre en relation une srie de rsultats avec une autre srie de rsultats.
Ce qui peut se traduire par l'expression " on recherche la relation entre
une variable quantitative(les rsultats) et une variable qualitative ( la
premire ou la deuxime mesure)".
Par exemple la couleur de l'emballage d'un paquet de lessive est-il un
lment qui a de l'influence sur la quantit de vente ? Les quantits de
vente constituent une variable quantitative, la couleur est qualitative
mme si elle est code 1 ou 2 .
Comparer deux populations revient comparer les moyennes d'une variable
commune
jean-Claude Liquet 29
analyse un facteur.

tableau d'exprimentation.
modalit du traitement.
Observation
n
1 2 j k
1
Y
j 1


2 ...
...
Y
ij
I
Y
ij


...
N
Y
nj



Y
ij
n m
j
= .


Y N M
ij
= .


jean-Claude Liquet 30
Le modle


Y
ij j ij
= + + o c
est la moyenne de l'ensemble des rsultats
o
j est le coefficient du au traitement particulier, ainsi un traitement particulier s'crit
o +
j
c
ij
correspond un facteur rsiduel.
M est la grande moyenne, elle s'crit :
=
i j
ij
n.k
Y
M
C'est dire la somme de toutes les valeurs
du tableau divise par le nombre de cases.
jean-Claude Liquet 31
Premire grandeur
caractristique
Pour chacune des colonnes, c'est dire pour chacune des modalits on peut calculer la moyenne
du traitement.

=
i
ij
j
n
Y
m

jean-Claude Liquet 32
Deuxime grandeur
caractristique
Chaque rsultat contenu dans chacune des cases du tableau est une mesure, l'ensemble de
l'information de toutes ces mesures peut tre mis sous la forme de la dispersion de ces mesures
autour de la moyenne des mesures, la dispersion est mesure ici comme la somme des distances
carres la moyenne, note SC

=
i j
2
ij
M) (Y SCT

La dispersion des facteurs autour de la grande moyenne constitue la dispersion factorielle.

=
j
2
j
M) (m n. SCF

Cette dispersion est aussi appele dispersion entre colonnes ou entre modalits ou beetwen.
jean-Claude Liquet 33
Troisime grandeur
caractristique
Une troisime grandeur peut tre dfinie c'est la somme des dispersion autour de chacune des
modalits appele aussi dispersion rsiduelle ou dispersion intra ou dispersion within;

+ =
i j
2
j ij
) m (Y SCR

Ce qui revient calculer lensemble des dispersions de chaque modalit autour de sa propre
moyenne et ensuite d'additionner toutes ces dispersions, on a bien la dispersion des rsidus autour
des moyennes de modalit.
jean-Claude Liquet 34

L'quation d'analyse de
variance.

SCT=SCF+SCR
. La dispersion est commode pour le raisonnement mais ce
qui a une signification pour comparer des mesures c'est la
variance, c'est dire la dispersion ramene
l'unidimensionnalit.

Le nombre de degrs de libert doit tre dtermin pour faire
la liaison entre la dispersion et la variance.

jean-Claude Liquet 35
Retour lunidimensionnalit
La dispersion factorielle ou dispersion inter a t calcule partir d'une relation entre les
diffrents facteurs, cette relation fait baisser d'une unit la dimension du ddl, c'est ainsi que pour
k facteurs le degr de libert est k-1.
La dispersion rsiduelle ou dispersion intra est une dispersion de toutes les mesures n.k autour
des moyennes au nombre de k : le nombre de degr de libert est donc n.k-k ou N-k.
D'o les variances :
VF=SCF/(k-1)
VR=SCR/(N-k)
jean-Claude Liquet 36
Le test de Fischer.

On recherche si l'hypothse nulle d'galit des moyennes est vraie. Elle le sera si les donnes de
chaque colonne sont extraites d'une mme loi de probabilit. Dans ce cas la variance factorielle
est approximativement gales la variance rsiduelle et donc on peut mettre la proposition
suivante :
L'hypothse H0 sera retenu si le rapport F=VF/.VR est infrieur la valeur de F au degr
de libert prs, qui est la limite de la signification.
Plus ce rapport est lev 'au dessus du F limite) plus on s'loigne de l'hypothse nulle.
jean-Claude Liquet 37
Tableau rcapitulatif
D'o le tableau de l'analyse d'e variance :
d.d.l. Somme des
carrs
carrs
moyens
F
Variance
factorielle
k-1 SCF VF=SCF/K-
1

variance
rsiduelle
N-k SCR VR=SCR/N
-k
F=VF/VR
total N-1 SCT
F suit une loi de Fischer-Snedecor dans la mesure de trois conditions
Les traitements sont additifs
les observations sont indpendantes
Les rsidus ont une distribution normale
Le F calcul partir de la table prcdente doit tre compar au Fo lu sur la table de Fisher-
Snedecor dans la colonne k-1 et la ligne N-k pour le seuil de risque accept o.
jean-Claude Liquet 38
Analyse deux facteurs croiss.
Il est possible d'tendre le raisonnement prcdent plusieurs facteurs contrls, dans le cas
prcdent on recherchait l'effet de la couleur d'un paquet de lessive par exemple sur les ventes,
maintenant on rajoute un facteur , la couleur. Il y a deux variables qualitatives.(par exemple A et
B)
On veut arriver l'laboration d'un modle.

ij 1 1 j ij 1
Y + + + =

Cette quantit est la vente de chacun des paquets de lessive ayant une couleur et une forme, c'est
dire deux caractristiques A et B.
o
j
reprsente le rsultat de la vente d'un paquet ayant la couleur j et
|
1
l'effet de la modalit 1
du facteur B
jean-Claude Liquet 39
Gnralisation

Le tableau se prsente sous la forme suivante :
Modalits du facteur A
Modalit
du facteur B
1 2 j
k
A


1
Y
j 1


2 ...
...
i Y
I 1

Y
ij

Y
Im

...
K
B


Y
nj



Y K m
ij ij j
=



Y N M
ij
=

.

L'quation de dispersion s'crit :
SCT=SCF(A)+SCF(B)+SCR
jean-Claude Liquet 40
Tableau ANOVA
D'o la table ANOVA:

d.d.l. somme des
carrs
carrs moyens F
Variance
factorielle A

d k
A A
= 1

SCF(A)

1 k
SCFA
VF(A)
A

=
VF(A)/VF(R)
Variance
factorielle B

d k
B B
= 1

SCF(B)

1 k
SCFB
VF(B)
B

=
VF(B)/VF(R)
variance
rsiduelle
dT-
d d
A B


SCR
B A T
d d d
SCR
VR

=


total dT=N-1 SCT
F est test sparment par comparaison au F de fisher-Snedecor lu sur la table avec les degrs de
libert correspondant et la significativit recherche.
jean-Claude Liquet 41
l'interdpendance.

Ainsi l'analyse de variance permet de traiter en mme temps plusieurs facteurs, cependant nous
avons fait l'approximation de l'indpendance de ces facteurs.
Une hypohse forte est que le modle est additif
Y
ijk j k ijk
= + + + o | o

Cependant s'il y interaction on peut amliorer le modle par un terme de confusion:
Y
ijk j k jk ijk
= + + + + o | o| o ( )

Il suffit de considrer ce terme comme l'introduction d'un nouveau facteur et le considrer ainsi.
Extension n facteurs.
Par extension on peut reprendre l'ensemble des raisonnements prcdents qui s'appliquent n
facteurs avec autant de facteurs de confusion le modle gnral s'crit :
Y
ijkl j k l jk jl ki jkl ijkl
= + + + + + + + + o | o| o | o| c ( ) ( ) ( ) ( )

jean-Claude Liquet 42
Un exemple Lge de mariage
des hommes et des femmes
Moyennes

Tableau de bord
Age lors de votre (premier) mariage
24,16 492 4,87
21,84 710 4,93
22,79 1202 5,03
Sexe du rpondant
Homme
Femme
Total
Moyenne N Ecart-type

Oneway
ANOVA
La vie est-elle excitante ou ennuyeuse ?
,383 1 ,383 1,029 ,311
370,652 995 ,373
371,035 996
Inter-groupes
Intra-groupes
Total
Somme
des carrs ddl
Moyenne
des carrs F Signif ication

jean-Claude Liquet 43
Le salaire des hommes et des
femmes
Moyennes

Tableau de bord
Revenu du rpondant
14,14 482 5,23
11,55 512 5,69
12,80 994 5,62
Sexe du rpondant
Homme
Femme
Total
Moyenne N Ecart-type

Oneway
ANOVA
Revenu du rpondant
1670,855 1 1670,855 55,798 ,000
29705,282 992 29,945
31376,137 993
Inter-groupes
Intra-groupes
Total
Somme
des carrs ddl
Moyenne
des carrs F Signif ication

jean-Claude Liquet 44
lanalyse factorielle ACP
Analyse en composantes principales



Cette analyse est la base de toutes les analyses multifactorielles. Elle consiste regrouper des
variables quantitatives en combinaisons linaires appeles composantes ou facteurs.
Du point de vue de sa rsolution mathmatique, la position du problme est simple. elle consiste
partir de n variables quantitatives quelconques constituant un repre n dimensions (la matrice
des donnes) passer un repre orthonorm n dimension. Ces nouvelles dimensions sont les
facteurs. La rsolution de ce problme consiste diagonaliser la matrice des variances
covariances, les composantes principales sont constitues des facteurs dont les valeurs propres
sont les plus importantes.
jean-Claude Liquet 45
Rduire la dimensionnalit
- un bilan des liaisons entre variables (on peut ainsi dterminer celles qui sont lies
positivement entre elles ou celles qui s'opposent, dterminer des groupes de variables corrles
entre elles, trouver une typologie des variables, etc.), donc diminuer la dimensionnalit des
donnes en colonnes.

C'est cette tude des variables qui permettra de rsumer l'ensemble des variables un petit
nombre de variables synthtiques appeles composantes principales (une composante principale
reprsentant un groupe de variables lies entre elles).
jean-Claude Liquet 46
La rvolution copernicienne
Le soleil tourne-t-il autour de la terre ou est
ce le contraire?
Quid du rfrentiel?

jean-Claude Liquet 47
La matrice de variance
covariance
|
|
|
|
|
.
|

\
|
1 R R R
R 1 R R
R R 1 R
R R R 1
43 42 41
34 32 31
24 23 21
14 13 12
jean-Claude Liquet 48
Une matrice carre symtrique
est diagonalisable
|
|
|
|
|
.
|

\
|
4
3
2
1
0 0 0
0 0 0
O 0 0
0 0 0

jean-Claude Liquet 49
Les rsultats
Il est possible de conserver tous les axes, cependant cela devient trs vite sans objet. A partir du
moment o un axe contient moins d'information que n'importe quelle autre variable de dpart, il
n'a plus beaucoup de sens. C'est pourquoi l'habitude est de ne conserver que les axes dont les
valeurs propres sont suprieures 1. D'autres rgles de conservation des axes existent comme par
exemple le critre du coude (la perte d'information entre deux axes conscutifs est dans un
rapport nettement infrieur aux gains prcdents). Dans la pratique plusieurs essais sont faits qui
permettent de mieux dcrire le contexte, il ne faut pas oublier ce niveau que l'ACP est une
mthode descriptive, par consquent le but est de dcrire le mieux possible un contexte.
Il est noter que le nouveau repre constitu est une hyper sphre trigonomtrique. La projection
des variables sur les axes sont des cosinus qui permettent de calculer les contributions de chaque
variable au facteur considr.
jean-Claude Liquet 50
Une application lanalyse
sensorielle
Le but de ltude est de rechercherles
descripteurs permettant dlaborer un profil
sensoriel de 4 spoupes aux lgumes verts
Existe-t-il des diffrences significatives entre
les soupes?
Peut on valider un profil sensoriel issu de
cette analyse
jean-Claude Liquet 51
Mode opratoire
Reconnaissance des saveurs fondamentales
Dgustation par 24 personnes entranes de 4
soupes : Royco minute soupe aux sept
lgumes, Auchan velout de lgumes vert,
Knorr mouline aux lgumes verts Maggi
panier de lgumes moulins lgumes verts
persills

jean-Claude Liquet 52
Les descripteurs
Aspects : 8 descripteurs
Odeur : 11 descripteurs
Flaveur : 11descripteurs
Texture : 3 descripteurs
On recherche rduire le nombre de
descripteurs afin de ne retenir que les
plus pertinents

jean-Claude Liquet 53
Organisation des donnes
jean-Claude Liquet 54
Analyse des donnes
Analyse de chaque descripteur (univarie)
permettant de vrifier les normalits.
Analyse ACP afin de dterminer des
regroupements
jean-Claude Liquet 55
Calcul des valeurs propres
Variance explique totale
4,512 17,355 17,355 4,512 17,355 17,355 4,174 16,053 16,053
3,516 13,522 30,876 3,516 13,522 30,876 2,391 9,195 25,248
2,062 7,930 38,806 2,062 7,930 38,806 2,171 8,351 33,599
1,859 7,149 45,955 1,859 7,149 45,955 1,804 6,938 40,537
1,700 6,537 52,492 1,700 6,537 52,492 1,802 6,933 47,470
1,502 5,778 58,270 1,502 5,778 58,270 1,717 6,604 54,074
1,389 5,342 63,612 1,389 5,342 63,612 1,574 6,056 60,129
1,286 4,948 68,560 1,286 4,948 68,560 1,504 5,785 65,915
1,134 4,362 72,922 1,134 4,362 72,922 1,493 5,740 71,655
1,005 3,866 76,788 1,005 3,866 76,788 1,335 5,133 76,788
,851 3,274 80,062
,779 2,996 83,058
,646 2,485 85,543
,494 1,900 87,444
,448 1,725 89,169
,425 1,635 90,804
,387 1,490 92,293
,332 1,276 93,570
,321 1,233 94,803
,292 1,123 95,926
,259 ,997 96,923
,222 ,854 97,776
,198 ,762 98,538
,150 ,577 99,115
,140 ,539 99,654
8,995E-02 ,346 100,000
Composante
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Total
% de la
variance == % cumuls Total
% de la
variance == % cumuls Total
% de la
variance == % cumuls
Valeurs propres initiales Sommes des carrs charges Somme des carrs pour la r otation
Mthode d'extr action : Analyse des pr incipaux composants.

jean-Claude Liquet 56
Regroupement des variables en
facteur
Matrice des composantes
a
,888
,834
,826
,822
-,758
-,599 ,366
,742
,621 ,459 -,324
,599 ,325 ,368 -,342
-,592 ,367 -,323
-,521 ,321 -,324
-,515 ,402
,482 ,309 ,362
,634 ,427
,496 -,426 -,348
-,439 -,409
,623 -,335
,380 -,304 ,500 ,317
-,454 ,487 ,438
,466
,392 ,480 ,341 ,377
,377 ,665 ,327
-,437 ,454 -,302
-,314 ,303 -,642 ,363
,398 ,350 ,590
-,415 ,370 ,427
coul homog-htero
T granuleuse abs-prs
asp homog- hterog
Prs de morceaux
T onctueuse
coul jaune
f l de poireaux
od de poireaux
od de pomme de terre
int d'od chimique
f l sucre
prs de coul vert f luo
sale
T visqueuse liq- visq
f laveur acide
f l de carotte
amre
int d'od herbace
int d'od armate
f l astingente
f l de pomme de terre
int d'odeur
od de petits pois
asp mat-brillant
int de f laveur
int de coul vert cl f on
1 2 3 4 5 6 7 8 9 10
Composante
Mthode d'extraction : Analyse en composantes principales.
10 composantes extraites. a.

jean-Claude Liquet 57
Interprtation
limination des descripteurs non pertinents
Nommer les facteurs
Scorer les facteurs

jean-Claude Liquet 58
AFC AFCM

L'analyse factorielle des correspondances (AFC) est une application spcifique de l'analyse en
composantes principales (ACP) au cas des tableaux de contingence.
Un tableau de contingence est un tableau d'effectifs croisant les modalits de
deux
variables
qualitatives
dfinies sur n individus. Il permet donc de mesurer le lien entre deux variables
qualitatives, voir le tri crois de deux variables qualitatives et lindication du lien par le Chi2.
Lorsqu'un tableau de contingence est de grande dimension, il est difficile d'en retirer les
informations essentielles. L'utilisation de l'AFC prsente donc un double intrt :
- faciliter l'tude des liens ventuels existant entre les modalits des deux variables ;
- offrir des possibilits de reprsentation graphique relativement simple interprter.
jean-Claude Liquet 59
Un exemple pdagogique
Un tudiant observateur regarde les jeunes filles qui entrent dans notre institut un matin
ordinaire. Son observation sur deux variables le type de vtement et la couleur du vtement sont
consigns dans un tableau de contingence (de contexte).
Pantalon Jupe Robe
Bleu 45 11 7
Noir 55 20 15
vert 5 7 6
Rouge 11 8 14

Lanalyse habituelle dun tel tableau est la recherche du lien qui peut exister entre le
type de vtement et la couleur de celui-ci. Le lien est mesur par le chi2. Un chi2 significatif
indique une liaison non due au hasard. Dans ce cas il est possible de rechercher une
reprsentation graphique. La reprsentation graphique obtenue par lapplication de lAFC a la
m^me signifacation que lanalyse du Chi2. Cependant pour des tableaux de contingence
important, lAFC permet une interprtation facilite.
jean-Claude Liquet 60
Reprsentation graphique
jean-Claude Liquet 61
Analyse factorielle des
correspondances multiples.
LAFCM est une technique qui permet de visualiser plus de deux variables qualitatives.
Elle se dduit de lAFC la condition de transformer le tableau de contingence en tableau
disjonctif complet. Elle permet de visualiser plus de deux variables croises. Son intrt est
essentiellement la constitution dun mapping qui rsume une tude de croisements multiples.
Un exemple tudi est l tude de la lecture des magazines par les femmes.
Les variables explicatives taient
- Les tranches dge
- Les PCS
- Les magazines eux mmes
- Le niveau scolaire
jean-Claude Liquet 62
Le mapping obtenu
4 3 2 1 0 -1 -2
3
2
1
0
-1
-2
-3
-4
plus de 60 ans
41 60 ans
26 40 ans
retraites
femmes au foyer
ouvrires no
ouvrires qu
employes
Pro inter
cadres et pr
artisans, co
agricultrice
autres revue
mag conomiq
mag sant/en
revues loisi
mag scientifique
mag culturel
mag dco/mai
mag fminins
mag TV
mag fin de s
hebdo d'info
aucun diplme
2/3mes cycl
DEUG/DUT/BTS
Bac/BP/BT
CAP-BEP
BEPC
certificat d
pqn
pqr
jean-Claude Liquet 63
Les mthodes explicatives
La rgression linaire
La rgression simple

jean-Claude Liquet 64
Recherche dune quation
Il sagit de trouver la droite moyenne de la forme y=ax+b. Les mathmatiques lmentaires
nous ont appris tracer des droites connaissant les paramtres a et b. Ici, cest la position
inverse, les couples (x,y) sont dtermins, il sagit de dterminer les paramtres a et b.
Deux inconnues dterminer appellent deux quations indpendantes crire.
La premire est relative au centre de gravit des points.

b a
_
y
_
+ = x

La deuxime est un calcul doptimisation sous contrainte de linarit.
jean-Claude Liquet 65
Quelques rappels
Il sagit de trouver la droite moyenne de la forme y=ax+b. Les mathmatiques lmentaires
nous ont appris tracer des droites connaissant les paramtres a et b. Ici, cest la position
inverse, les couples (x,y) sont dtermins, il sagit de dterminer les paramtres a et b.
Deux inconnues dterminer appellent deux quations indpendantes crire.
La premire est relative au centre de gravit des points.

b a
_
y
_
+ = x

La deuxime est un calcul doptimisation sous contrainte de linarit.
jean-Claude Liquet 66
Dtermination des paramtres
Comme il est dusage pour une distribution de points, et donc une sommation, cest les
distances quadratiques qui sont les plus pertinentes, do lexpression :

=
n
i i
Y y E
1
2 2
) (
La minimisation de cette expression consiste en une drive partielle par rapport aux deux
paramtres et lgalisation 0.
Les deux expressions permettent la rsolution du systme dquations et par, consquent, les
expressions de a et de b.

La rsolution complte permet de dterminer a
varx
cov(xy)
a =

et b se dduit de la premire expression
b a
_
y
_
+ = x

_ _
varx
cov(xy)
- x y b =
jean-Claude Liquet 67
Rsolution graphique
jean-Claude Liquet 68
Validation
Deux prcautions
- Les rsidus doivent avoir une distribution normale
- La pente de la droite doit tre significativement diffrente de 0, une droite parallle
laxe des x indique une corrlation nulle.

La distribution normale des rsidus permet de vrifier que ces rsidus sont bien du au hasard,
quil ny a pas dautres lments qui interviennent dans lobservation. Le test KS est possible.
Cest une condition ncessaire, elle nest pas suffisante.
Par ailleurs vrifier que la pente nest pas nulle (que a nest pas nul) revient comparer a o.

Le test appropri est le test de Student n degr de libert.
Il suffit donc de calculer le t de Student et de vrifier quil est suprieur 1,96 pour un risque
alpha de 0,05.

jean-Claude Liquet 69
Rgression multiple

La rgression multiple est utilise lorsquil y a plusieurs variables explicatives.
Dans le cas de deux variables explicatives, le nuage de points est reprsent dans un espace
3 dimensions, la rgression consiste rechercher un plan de rgression de la mme manire
que prcdemment.
Une hypothse forte est cependant introduite. Le raisonnement tant fait dans un espace
orthogonal, les variables explicatives doivent tre indpendantes. Chacun des coefficients de
rgression doit faire lobjet dun test de Student selon les mmes modalits que pour le cas de
la rgression simple.
Lexpression gnrale scrit de la manire suivante :

c + + + + = ......
3 3 2 2 1 1
X a X a X a Y

Les i
a
sont les coefficients qui doivent tre non nuls qui font donc lobjet dun test t.
Les i
X
sont les variables explicatives. Celles qui sont affectes dun coefficient non nul
interviennent dans lobservation et rciproquement.
c
est lincertitude ou le rsidu.
jean-Claude Liquet 70
L'analyse structurelle
Lanalyse structurelle a pour objet lanalyse de modles. Se basant sur les liens linaires entre les
variables mesurant des concepts, il sagit de tester un modle par rapport un autre.
Il importe de faire une analyse des variances et covariances, ainsi que des rgressions
linaires. Des indices dajustement permettent de tester lexprimentation par rapport au
modle thorique.
Cette technique fait partie des mthodes dites de deuxime gnration, elle a le mrite de
combiner des mthodes statistiques habituelles en une combinatoire maintenant admise. Les
techniques sous jacentes sont dune part lanalyse factorielle et dautre part les quations
simultanes (systme dquations linaires).
Les logiciels les plus couramment utilises sont EQS, LISREL, PLS et AMOS
jean-Claude Liquet 71
Les variables latentes.
engagement
Q1 e1
Q2 e2
Q3 e3
Q4 e4
Quatre quations sont gnres :
Q1=a1(engagement) +e1
Q2=a2(engagement) +e2
Q3=a3(engagement) +e3
Q4=a4(engagement) +e4
Les ei sont les incertitudes de mesure.
jean-Claude Liquet 72
Les structures


engagement
Q4 e4
1
1
Q3 e3
1
Q2 e2
1
Q1 e1 1
1
fidelite
Q5 e5
1
1
Q6 e6
1
Q7 e7
1
Q8 e8
1
Q9 e9
1

e10
1
Cest la dtermination de qui est lobjet du problme. Lquation dterminante est la
suivante :
Fidlit= * engagement+e10
Les deux variables latentes tant dtermines par le mme type dquation que dans le
paragraphe prcdent.
A ce stade cest un ensemble dquations de rgression linaire qui va lever les
indterminations et permettre de calculer les coefficients de rgression. Les tests de pertinence
sont les mmes que dans les systmes linaires.
Cependant les moments statistiques que sont les variances covariances vont permettre de
tester la pertinence de la structure.
Le principe consiste comparer la matrice de variance covariance O des variables observes
avec la matrice thorique T.
La comparaison est naturellement le chi2, nous verrons par la suite les limites de cette
distance entre deux matrices.

jean-Claude Liquet 73

Comme pour un tableau de contingence la question de loptimisation thorique est dlicate.
Ici loptimisation est fonde sur une fonction de maximum de vraisemblance.
X est la matrice des variables observe. (p variables sur n observations)
L la matrice des variables latentes
I la matrice des incertitudes de mesure
C la matrice des contributions.
Le modle peut scrire
X=CL+I
Lanalyse de structure de variance covariance scrira :
T=CC+E
T est la matrice thorique que lon calcule partir de
C calcul prcdemment comme matrice des contributions, C tant sa transpose
la matrice de variance covariance des variables latentes
E est la matrice des rsidus.
jean-Claude Liquet 74

Le fit ou ajustement global sera jug par le chi2 ou mieux le chi2 relatif=chi2/ddl la
probabilit du chi2 est dautant meilleure quelle est proche de 1. On admet un chi2 relatif
infrieur 2 comme refltant un bon ajustement.
Du fait de la trs forte sensibilit du chi2 la taille de lchantillon, dautres indices
dajustement sont employs, less plus courants sont :
- Le GFI et lAGFI qui varient de 0 1 indiquent la part de variances et covariances des
variables observes pris en compta par le modle. LAGFI est ajust au nombre de degr de
libert.
- Le RMR Root Mean Square Residual est la mesure de la variance rsiduelle La limite
suprieure couramment admise est 0,08.
- Le RMSEA a lui aussi une limite suprieure de 0,08.

Les limites nont de sens que dans labsolu, en fait il est beaucoup plus intressant de
comparer les modles et de retenir celui qui a les meilleurs indices dajustement, et de
continuer rechercher des modles qui infirment le premier et ainsi de suite.

jean-Claude Liquet 75
Un exemple agro-alimentaire



Figure 1 :

Modle structurel complet et principaux rsultats





























OSL
Tendance la
recherche de
varit en
alimentaire
Apprciation
sensorielle
OSL1

OSL2

OSL3

OSL4

OSL5

OSL6

OSL7

VSK1

VSK2

VSK3

VSK4

VSK5

VSK6

VSK7

VSK8

0.57

0.32

0.20

0.45

Golden Royal Gala Red Chief Jonagold



jean-Claude Liquet 76
Recherche de varit et perceptions
sensorielles



jean-Claude Liquet 77
Plan de l expos
La spcificit de comportements alimentaires
La recherche de varit
Les prfrences
Problmatique
Mesure
Rsultats, limites et perspectives.

jean-Claude Liquet 78
Les comportements alimentaires
Importance, risque ,plaisir
Pilgrim 1957
Les dterminants gnraux
Shepherd 1985
Les dterminants du got
Sirieix 1999
Rle de la recherche de varit
jean-Claude Liquet 79
La recherche de Varit
Comme facteur de stimulation (Van Trijp
1992)
Rduction de monotonie
Un optimum (le niveau optimum de
stimulation OSL) Berlyne 1960, Driver et
Streufert 1964
jean-Claude Liquet 80
Les prfrences sensorielles
Les dterminants des prfrences de couleur :
l ge, le sexe,la personnalit, la culture ( Divard et
Urier 2001)
On peut s attendre des dterminants du mme
ordre en ce qui concerne le got
Le dterminisme socio-culturel selon Bourdieu
(1979), des socio styles selon le CCA : La golden
pour le conservateur la Granny pour l aventurier

jean-Claude Liquet 81
La problmatique
Un lien existe entre la tendance la
recherche de varit en alimentaire et les
prfrences gustatives.
Plus un individu prsente une forte tendance
la recherche de varit plus son
apprciation sensorielle est leve
jean-Claude Liquet 82
Modle simplifi
OSL
Tendance
la recherche
de varit
Apprciation
sensorielle
jean-Claude Liquet 83
Mesure de l OSL
Le choix sest port sur CSI version courte
en 7 items de Giannelloni (1997)
Les autres chelles disposition
Steenkamp et Baumgartner (1992) ont
compar SSS, AST-II, CSI, NES, ils
proposent CSI
jean-Claude Liquet 84
Mesure de la tendance la
recherche de Varit
Choix de VARSEEK de Van
Trijp et Steenkamp, 1992 ; cette
chelle est en anglais, elle est ici
traduite et teste.
jean-Claude Liquet 85
Mesure de l apprciation
sensorielle
laboration dun index de prfrence sur un
produit de consommation courante : la
pomme. La Granny Smith, la Golden, la
Royal Gala, la Red Chief et la Jonagold
jean-Claude Liquet 86
chantillon et mise en uvre
empirique
79 rpondants en laboratoire d analyse
sensorielle (contrle des variables externes),
les rpondants sont des volontaires de
l univers de l Institut Agroalimentaire de
Lille
39 rpondants gotent avant de remplir le
questionnaire, 40 aprs.
jean-Claude Liquet 87
Contrle de l chelle
unidimensionnelle OSL
Item Communauts Loading % Var.
o
OSL 1
OSL 2
OSL 3
OSL 4
OSL 5
OSL 6
OSL 7
0,496 (0,56)
0,553 (0,69)
0,511 (0,58)
0,554 (0,63)
0,604 (0,61)
0,517 (0,41)
0,492 (0,55)
0,704 (0,75)
0,743 (0,83)
0,715 (0,76)
0,744 (0,79)
0,776 (0,78)
0,719 (0,64)
0,702 (0,74)
53,2 (57,6) 0, 852 (0,876)
Tableau 1 : Analyse en composantes principales exploratoire de lOSL (les valeurs entre parenthses
rappellent les rsultats de Giannelloni, 1997)
jean-Claude Liquet 88
Traduction et validation de
l chelle VARSSEK





Tableau 2 : Analyse en composantes principales exploratoire de la tendance la recherche de varit (les
valeurs entre parenthses rappellent les rsultats de Van Trijp et Steenkamp, 1992)

Item Communa
uts
Loading % Var. o
VSK1
VSK2
VSK3
VSK4
VSK5
VSK6
VSK7
VSK8
0,626
0,331
0,715
0,647
0,617
0,701
0,498
0,590
0,791
0,575
0,846
0,805
0,785
0,837
0,706
0,768
59,0
(0,58)
0,896
(0,90)
jean-Claude Liquet 89
Le modle structurel
OSL1 VSK1
OSL2 VSK2
OSL3 0,32 VSK3
0,57
OSL4 OSL Tendance la
VSK4
recherche de varit
OSL5 en alimentaire
VSK5
OSL6 VSK6
0,45
OSL7 0,20 VSK7
SENSOR VSK8
Golden Royal Gala Red Chief Jonagold
Figure 1 : Modle structurel complet et principaux rsultats
jean-Claude Liquet 90
Indices d ajustement

_
2
= 133,58 (ddl : 100 ; p : 0,014) ;

_
2
/ddl = 1,33 ;
CFI = 0,93 ;
TLI = 0,92.
jean-Claude Liquet 91
Limites perspectives et
implications
Une chelle est traduite et teste
Les relations cherches sont montres
Reste valider les variables pertinentes de
recherche de varit.
Si il y a recherche de varit cela implique que dans
le temps les gots voluent
L laboration des gammes doit se faire en fonction
de cette nouvelle donne
jean-Claude Liquet 92
Analyse discriminante
Cette mthode est connue aussi sous le nom de scoring. Elle est trs employe par les
organisations qui veulent prdire le comportement des clients.
Lors d'un prt le banquier se pose invitablement la question "est ce que mon client va bien
rembourser ou non ?. En fait il souhaite pouvoir prdire la case de bon payeur ou mauvais
payeur. Pour ce faire il va comparer ce qu'il sait de ses autres clients avec ce qu'il sait de son
emprunteur. En d'autre terme il va chercher une fonction explicative qui affecte les clients
une case ou l'autre et ensuite il applique cette fonction son nouvel emprunteur. Ne nous y
trompons pas, le questionnaire que le banquier fait remplir est tout simplement les rponses de
l'unit statistique aux variables explicatives.

jean-Claude Liquet 93


L'analyse discriminante peut tre considre comme la recherche de groupes sous jacents. Il
s'agit de rechercher des axes qui dcrivent ces deux groupes alors que les variables qui ont
servi la mesure ne les "discriminent pas"
Le graphique suivant permet de visualiser cet tat des choses.
Il y a bien deux nuages de points mais leurs projections sur x et y ne permettent pas de les
distinguer.
De fait la solution consiste trouver un axe sur lequel on va projeter et qui distingue bien
deux groupes.
jean-Claude Liquet 94
Faire une analyse discriminante revient ainsi trouver l'axe qui permet d'obtenir que les deux
moyennes soient significativement distinctes
La nouvelle variable est une combinaison linaire des prcdentes.
Ici l'analyse se fait sur deux dimensions de dpart et un axe discriminant. Dans la pratique on
peut avoir un espace de plus de deux dimensions, le nombre d'axes discriminants est ainsi
augment.
En fait cela ressemble beaucoup l'analyse de variance, la premire des conditions est le
calcul de la quantit.:
Le deux groupes tant reprsents par les deux ellipses, ce rapport se compare la distribution de
F, ainsi il apparat qu'il faut maximiser le numrateur et minimiser le dnominateur.
On remarquera que la dmarche s'apparente fortement une analyse en composantes
principales. En particulier en la recherche de combinaisons linaires.
groupe intra Variance
groupe inter Variance

jean-Claude Liquet 95
Validation de lanalyse
discriminante
Les indicateurs statistiques de validation sont
Le V de Bartlett
Le test de Rao
Le de wilks est utilis plus simplement si le nombre de classe est 2 ou 3. Cest le rapport de
la variation intra-groupe la variation totale.
jean-Claude Liquet 96
Analyse conjointe

jean-Claude Liquet 97
Compromis et Modle de Choix
Mieux vaut tre riche et en bonne sant que pauvre et malade
jean-Claude Liquet 98
Ralit
Physique
Jugements
(Perception)
valuation des
attributs
valuation
Globale
Probabilit
d achat
jean-Claude Liquet 99
X
X
X
X
X
X
X Droite de
rgression
X
X
Rang 1 Rang
2
Rang 3 Rang
4
U1
U2
U3
U4
Autre courbe possible
Choix du modle
jean-Claude Liquet 100
Le modle compensatoire
additif
m
m
m
m l
l
l
l k
k
k
k j j
j
j
P
i
D C B A U U

=
=
=
=
=
=
=
=
+ + + + =
3
1
2
1
4
1
3
1
0
e e e e
est lutilit du produit p pour lindividu i
e=0 si l'individu n'a pas retenu la modalit j
e=1 si l'individu a retenu la modalit j.

p
i
U
jean-Claude Liquet 101
Le choix de la rgression
Monanova
Prefmap
Linmap
Algorithme de Johnson
Rgression multiple
Logit
Probit
jean-Claude Liquet 102
Processus d analyse
jean-Claude Liquet 103
Analyse du champs
d exprience et choix
d un modle
Identification des attributs
pertinents et des
modalits
Dfinition des paniers
d attributs ( plan
factoriel)
Recueil des Prfrences
Calculs des utilits et des
importances des attributs
Segment sur les
avantages recherchs

Simuler les parts de
marchs

Optimiser
sous contraintes
de cots de production
jean-Claude Liquet 104
Un exemple
Le choix du pain par les enfants
jean-Claude Liquet 105
Les caractristiques du pain
ATTRIBUT MODALITES
INGREDIENTS - type 5S : pain blanc
- pain complet
- aux germes
MODE DE FABRICATION - artisanal
- moderne : ptrissage intensifi
TEMPS DE CUISSON - court : crote claire
- longue : crote fonce
FORME -petit pain : 80 grammes
- pain : 500 grammes.
-baguette : 250 grammes
jean-Claude Liquet 106
Le plan d exprience
Rduction du nombre de concepts.
Le nombre de concepts est
3X2X2X3=36 ; une rduction permet
la prsentation de 9 .
Procdure orthoplan.
ORTHOPLAN
/FACTORS=ingredie 'ingredient' ( 1 'pain blanc' 2 'pain complet' 3
'aux'+
' germes') fabricat 'mode fabrication' ( 1 'artisanal' 2 'ptrissage'+
' intensifi') temps 'temps de cuisson' ( 1 'court' 2 'long') forme
'forme' (
1 'petit pain' 2 'pain' 3 'baguette')
/OUTFILE='C:\Program Files\SPSS\ORTHO.SAV' .
jean-Claude Liquet 107
Pain 1 : petit pain, ptri la machine, aux germes et peu cuit.
Pain 2 : petit pain, ptrissage artisanal, mie blanche, cuit
longuement.
Pain 3 : pain boulot, ptrissage artisanal, aux germes, cuit
longuement..
Pain 4 : pain boulot, ptrissage artisanal, complet, peu cuit.
Pain 5 : pain boulot, ptri la machine, mie blanche, peu cuit.
Pain 6 : baguette, ptrissage artisanal, aux germes, peu cuit.
Pain 7 : baguette, ptrissage artisanal, mie blanche, peu cuit.
Pain 8 : petit pain, ptrissage artisanal, complet, peu cuit.
Pain 9 : baguette, ptri la machine, complet, cuit longuement.
Les diffrentes combinaisons
jean-Claude Liquet 108
La procdure

Data list free /ID PREF1 TO PREF9.
BEGIN DATA
01 04 01 08 06 09 03 07 05 02
02 05 07 02 04 03 01 09 08 06
03 07 05 03 04 09 06 01 08 02
04 07 02 05 03 04 01 08 06 09
05 07 02 05 08 01 09 03 04 06
06 02 07 05 09 03 04 06 01 08
07 07 05 02 01 08 03 09 04 06
08 05 02 07 01 09 08 04 06 03
09 01 03 05 09 07 08 04 06 02
10 02 06 03 01 04 09 08 07 05
.. .


48 02 07 01 05 09 08 06 03 04
49 02 01 06 08 05 09 07 03 04
END DATA.
CONJOINT PLAN='a:\orthopain.sav'
/DATA=*
/SEQUENCE=PREF1 TO PREF9
/SUBJECT=ID
/FACTORS=ingredie (DISCRETE) mode
(Discrete) temps (discrete)forme (discrete)
/PRINT=ALL
/plot all
/utilite="exercice.sav".

jean-Claude Liquet 109
Les rsultats - 1
SUBJECT NAME: 1,00
Importance Utility(s.e.) Factor

+---------+ INGREDIE ingredient
I61,22 I -3,0000( ,7328) ----I pain blanc
+---------+ 2,0000( ,7328) I--- pain complet
I 1,0000( ,7328) I- aux germes
I
I MODE mode de fabrication
,00 I ,0000( ,5496) I artisanal
I ,0000( ,5496) I moderne
I
+----+ TEMPS temps de cuisson
30,61I I 1,2500( ,5496) I-- court
+----+ -1,2500( ,5496) --I long
I
++ FORME forme
8,16 II ,3333( ,7328) I petit pain
++ ,0000( ,7328) I pain
I -,3333( ,7328) I baguette
I
4,5833( ,5794) CONSTANT

Pearson's R = ,959 Significance = ,0000
Kendall's tau = ,833 Significance = ,0009

jean-Claude Liquet 110

SUBFILE SUMMARY
Averaged
Importance Utility Factor
+---------+ INGREDIE ingredient
I38,40 I 1,1875 I---- pain blanc
+---------+ -,9306 ---I pain complet
I -,2569 -I aux germes
I
+--+ MODE mode de fabrication
13,42 I I -,0990 I artisanal
+--+ ,0990 I moderne
I
+---+ TEMPS temps de cuisson
14,28 I I -,2188 -I court
+---+ ,2188 I- long
I
+--------+ FORME forme
I33,90 I ,6806 I-- petit pain
+--------+ -,0833 I pain
I -,5972 --I baguette
I
5,1059 CONSTANT

Pearson's R = ,971 Significance = ,0000
Kendall's tau = ,833 Significance = ,0009







Les rsultats - 2
jean-Claude Liquet 111
Les rsultats - 3
ingredient
aux germes pain complet pain blanc
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
mode de fabrication
moderne artisanal
,2
,1
0,0
-,1
-,2
jean-Claude Liquet 112
Les rsultats - 4
temps de cuisson
long court
,3
,2
,1
-,0
-,1
-,2
-,3
forme
baguette pain petit pain
,8
,6
,4
,2
0,0
-,2
-,4
-,6
-,8
jean-Claude Liquet 113
Les rsultats - 5
forme
temps de cuisson
mode de fabrication
ingredient
I
m
p
o
r
t
a
n
c
e

m
o
y
e
n
n
e
40
30
20
10
0
jean-Claude Liquet 114
Un exemple
Les strotypes des vendeurs
jean-Claude Liquet 115
Les rsultats - 1


Habits 55,22% Dcontracts -0,3226
Stricts 0,6237
De travail -0,3011

Sexe 20,39% Homme 0,4919
Femme -0,4919

Age 24,28% 20 35 ans 0,0968
35 45 ans 0,0108
Plus de 45 ans -0,0860

Attributs Importance Modalits Utilits
Tau de Kendall = 0,556 Risque alpha = 0,0185

jean-Claude Liquet 116
Les rsultats - 2
Tableau : fiche de l'entreprise Dupont
Attributs Importance Modalits Utilits
Habits 28,57% Dcontracts 1,3333
Stricts -0,3333
De travail -1
Sexe 42,86% Homme 1,7500
Femme -1,7500
Age 8,57% 20 35 ans 03333
35 45 ans 1
Plus de 45 ans -1,3333

jean-Claude Liquet 117
Calcul des utilits
Lentreprise Dupont vient de sadjoindre comme
collaborateur Madame Germain qui a 28 ans,
elle est habituellement habille dun tailleur noir.
On peut calculer lutilit totale pour chacune des entreprises
de ce ngociateur.

Utotal= utilit ( habit strict ) + utilit (sexe fminin )
+ utilit (ge entre 25 et 35 ans).

jean-Claude Liquet 118
Rpartition des scores
la jeune femme stricte
4,0 3,0 2,0 1,0 0,0 -1,0 -2,0 -3,0 -4,0
R

p
a
r
t
i
t
i
o
n

d
u

s
c
o
r
e

d
'
a
c
c
u
e
i
l
8
6
4
2
0
Moyenne 0,22 et Ecart Type 2,39
jean-Claude Liquet 119
Rpartition des scores
Le jeune homme strict
5,0 4,0 3,0 2,0 1,0 0,0 -1,0 -2,0 -3,0 -4,0
R

p
a
r
t
i
t
i
o
n

d
u

s
c
o
r
e

d
'
a
c
c
u
e
i
l
8
6
4
2
0
Moyenne 1,2 et Ecart-type 2,36
jean-Claude Liquet 120
Segmentation par
avantages recherchs

typologies et cartes
perceptuelles.

jean-Claude Liquet 121
familles
1
2
3
4
Typologie par avantages recherchs,deuxime srie
l'avantage principal
type d'ensei
vie de l'iup
dbouch
,8 ,7 ,6 ,5 ,4 ,3 ,2 ,1 0,0
Typologie par avantages recherchs
jean-Claude Liquet 122
Carte perceptuelle : les avantages recherchs par les
tudiants dans une formation universitaire
professionnalise
quilibre
dbouchd'a
responsabili
public
projet perso
ouverture
alternance
equi-uni-pro
2,0 1,5 1,0 ,5 0,0 -,5 -1,0
,4
,2
0,0
-,2
-,4
-,6
-,8
-1,0
II
III
I
jean-Claude Liquet 123
Autre exemple : la presse
-1,5
-1
-0,5
0
0,5
1
1,5
-1,2 -1 -0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 1
l es chos
i mage de soi ri sque
di stri buti on
ne l i t ri en
l e pl ai si r
proxi mi t de pense
anal yse
pqr l e monde
l efi garo
besoi n sans ri sque
l e monde
contenu
l ' humani t
rationnalit
passion
pas impliqu
"les accros"
Li b
jean-Claude Liquet 124
Le prix acceptable
prix les deux aut r es
niveaux *2 ou *3
abonnement
por t age
achat en magasin
Le prix et la mise disposition.
Segment par avantages recherchs
cont enu
proximit polit ique
analyse rat ionnalit
dist ribut ion
u
t
i
l
i
t
e

p
r
i
x

e
t

d
i
s
t
r
i
b
u
t
i
o
n
3
2
1
0
-1
-2
-3
jean-Claude Liquet 125
jean-Claude Liquet 126
jean-Claude Liquet 127
L ANALYSE DE SURVIE
jean-Claude Liquet 128
Les modles de survie:


- stratgie de fidlisation


- outils de CRM
jean-Claude Liquet 129
A partir des fichiers clients valuer les pratiques commerciales.


Par lanalyse des dures de vie de vos lecteurs
Comment ?
jean-Claude Liquet 130
Optimiser les actions de fidlisation
avec les Modles de Survie:
Dcrire
Expliquer
jean-Claude Liquet 131
La fidlit un journal dpend:
de son contenu
de la qualit de la livraison
de la pression commerciale sur la diffusion de leur
parution

Mais les prcautions nempchent pas les rsiliations
jean-Claude Liquet 132
une des solutions ?
Anticiper la rsiliation, intervenir en amont
de la prise de dcision de rsiliation.
jean-Claude Liquet 133
Un exemple d tude a t publi dans Dcisions Marketing
Le mode de recrutement
La priodicit du paiement
Le mode de livraison
Le prix de l abonnement
Les variables retenues dans le cadre du quotidien:

jean-Claude Liquet 134
La mesure de la dure de vie des abonns:
L analyse de survie se dcompose en deux phases
complmentaires:
L analyse de survie descriptive
L analyse de survie explicative
jean-Claude Liquet 135
Les analyses de survie descriptives :
Renseignent sur la valeur actualise client :
Life Time Value
Examen de la population suivant la mthode des
dmographes
jean-Claude Liquet 136
Les analyses de survie explicatives:
la probabilit de survie du client
une gestion pertinente des rsiliations
d abonnements
jean-Claude Liquet 137
Modlisation de l analyse de survie:
Temps
jean-Claude Liquet 138

- recherche d une fonction qui rende compte de la forme de la courbe


- prvoit les chances qu un lecteur fidle possdant un certain profil le
soit encore au bout d un certain temps.
Modlisation des dures de survie :
jean-Claude Liquet 139
Un exemple d application:
L application des analyses de survie ncessite:
une variable de dure
un indicateur de censure
jean-Claude Liquet 140
L tude descriptive
La mdiane de survie est de 34 mois.
jean-Claude Liquet 141
Ou encore:
40% des abonns ne renouvellent pas leur
abonnement au bout d un an.
La demi vie est de 28 mois
jean-Claude Liquet 142
Seuls 82% des abonns poursuivent leur abonnement l issue
de un an
jean-Claude Liquet 143
Pour cette population ayant opts pour le prlvement
automatique, la fonction de risque est trace:
Les zones de risques sont ainsi lisibles
jean-Claude Liquet 144
La valeur actualise du client:
Les clients les plus fidles n ont pas toujours la valeur la
plus leve
Dure
(mois)
-._
P(survie pour les Prel.
AVtom.(PA)
Valeur abonn PA
cumule 1, 2 et 3 ans
P(survie 1 an, 2 ans) pour
les abonns annuels
Valeur par
anne
Valeur
cumule
Diffrence PA et
abonnement annuel
1 0,9872
2 0,9681
3 0,9423
4 0,9127
5 0,8856
6 0,8856
7 0,8348
8 0,8139
9 0,7918
10 0,7738
11 0,7525
12 0,7362 964,4 F 0,5485 1248 F 1248 F +283,6 F
24 0,5935 1779,5 F 0,3952 0,5485 x
1248=685
1933 F +153,5 F
36 0,4849 2451 F 0,3952 x
1248=493
2426 F , -25 F
jean-Claude Liquet 145
Modlisation des dures de survie individuelles:
diffrentes variables explicatives :
- la tranche d ge de l abonn (plus et moins 50 ans)
- le mode d abonnement
- le mode de distribution
- le mode de paiement
Le modle de Cox
jean-Claude Liquet 146
La probabilit de survie de chaque lecteur est estim suivant son
profil et pour un horizon de temps fix.
On dtermine ainsi:
Qui doit faire l objet d actions ?
Quand agir ?
jean-Claude Liquet 147
jean-Claude Liquet 148
jean-Claude Liquet 149
Les conclusions induites :
Les abonns servis par portage sont plus fidles
Le prlvement automatique est un facteur de fidlit
L abonnement volontaire est plus durable
Les plus gs sont les plus fidles
jean-Claude Liquet 150
ge
mode de
distribution
type de
paiement
mode de
recrutement 4 8 12
a
b
c
d
e
f
individu
caractristiques
action 4
action 5
action 6
probabilit de survie
actions marketing
action 1
action 2
action 3
action 1
action 2
action 3
action 4
action 5
action 6
agir sur le produit lui-mme
envoi de courrier
cadeau de rabonnement
supprimer le possibilit de rsiliation mensuel
agir sur la force de vente
vrifier la logistique/tendre le portage
Le fichier et son devenir
jean-Claude Liquet 151
Les perspectives possibles
L analyse de survie est bien adapte la presse pour mettre
en place des programmes de fidlisation.
Les donnes comportementales des lecteurs abonns ou
ports peuvent tre enrichies galement par d autres
mthodes de scoring.

Вам также может понравиться