Qualitatif Chapitre2

MASTER ECONOMETRIE ET
STATISTIQUE APPLIQUEE (ESA)

Universit dOrlans
Economtrie des Variables Qualitatives

Chapitre 2
Modles Multinomiaux
Modles Logit Multinomiaux Ordonnes et non Ordonns
Christophe Hurlin
Polycopi de Cours
Master Economtrie et Statistique Applique (ESA)
Universit dOrlans
Facult de Droit, dEconomie et de Gestion
Bureau A 224
Rue de Blois BP 6739
45067 Orlans Cedex 2
www.univ-orleans.fr/deg/masters/ESA/
January 21, 2003

Contents
1 Modles Multinomiaux Ordonns . . . . . . . . . . . . . . . . . . . .
1.1 Exemples de Modles Multinomiaux Ordonns . . . . . . . . .
1.1.1 Dosage dinsecticide : Gurland, Lee et Dahm (1960) . .
1.1.2 Acquisition dun bien immobilier : David et Legg (1975)
1.2 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Modles Multinomiaux Squentiels . . . . . . . . . . . . . . . . . . .
2.1 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3 Modles Multinomiaux Non Ordonns . . . . . . . . . . . . . . . . .
3.1 Des modles de choix probabilistes . . . . . . . . . . . . . . . .
3.2 Logit multinomial indpendant . . . . . . . . . . . . . . . . . .
3.2.1 Spcification du Logit Multinomial . . . . . . . . . . . .
3.2.2 Estimation des paramtres du logit multinomial . . . .
3.2.3 Exemples de modles logit multinomial . . . . . . . . .
3.3 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Logit Conditionnel . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Spcification du logit conditionnel . . . . . . . . . . . .
3.4.2 Estimations des paramtres du logit conditionnel . . . .
3.4.3 Exemples de modles logit conditionnel . . . . . . . . .
3.4.4 Applications . . . . . . . . . . . . . . . . . . . . . . . .
3.5 Logit Universel . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 Lhypothse dindpendance des alternatives non pertinentes . . . . .
4.1 Test de lhypothse IIA . . . . . . . . . . . . . . . . . . . . . .
4.2 Modle Alternatifs . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Probit multinomial . . . . . . . . . . . . . . . . . . . . .
4.2.2 Logit Hierarchis . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
5
6
7
8
12
13
14
14
17
18
21
24
25
25
26
27
28
29
29
30
30
30
30
30
Economtrie des Variables Qualitatives. Cours C. Hurlin
Introduction
Nous allons prsent envisager le cas des modle multinomiaux, ou plus prcisment des
modles variable explique qualitative multinomiale (ou polytomique). Ce sont des modles
dans lesquels la variable explique peut prendre plus de deux modalits1 . Nous allons voir quil
existe trois catgories de modles multinomiaux :
1. Modles multinomiaux ordonns
2. Modles multinomiaux squentiels
3. Modles multinomiaux non ordonns
Dans la pratique, les modles non ordonns sont les plus frquents, cest pourquoi nous
leur accorderons une attention toute particulire. Dans cette catgorie, on trouve notamment
le modle logit multinomial et le modle logit conditionnel de McFadden qui sont
les modles les plus utiliss et qui constituent une extension du logit binaire tudi dans le
chapitre prcdent. Nous verrons toutefois, que si ces modles sont simples utiliser, ils posent
toutefois un problme de cohrence en raison dun proprit peu raliste dindpendance des
tats non pertinents. Cest pourquoi, des modles alternatifs ont t dvelopps comme le
modle logit hierarchis ou le modle probit multinomial. Ces derniers requirent toutefois
des techniques destimation relativement complexes.
Commenons par dcrire le cadre gnral de ces modles multinomiaux.
Definition 0.1. On considre un modle multinomial dans le lequel la variable dpendante qualitative observe pour le ie`me individu i = 1, .., N , note yi , peut prendre
mi + 1 modalits indices j = 0, 1, 2, .., mi , supposes mutuellement exclusives pour
chaque individu i :
mi +1
P rob (yi = j) = 1
j=0
i = 1, .., N
(0.1)
La probabilit associe chaque rponse est dfinie par :

P rob (yi = j) = Fij (x, ) i = 1.., N j = 0, 1, .., mi
(0.2)
Partant de cette dfinition, on peut faire quatre remarques.

1. On remarque tout dabord que le nombre de modalits mi prises par la variable dpendante
yi peut dpendre de lindividu : on peut avoir mz = mk .
2. La fonction de rpartition Fij (x, ) correspond la probabilit que lindividu i choisisse
la modalit j en fonction des variables explicatives x et du vecteur de paramtres . Cette
fonction peut ainsi direr suivant les individus (indice i) mais aussi suivant les modalits
(indice j).
1 Voir
lintroduction du premier chapitre pour la dfinition gnrale des modles variable qualitative.
3. Dans un modle multinomial, la probabilit associe la mi +1e`me modalit (gnralement

lvnement cod en 0) na pas besoin dtre spcifie puisquelle peut tre calcule partir
des mi probabilit comme suit :
mi
P rob (yi = 0) = 1
Si lon dfinit
N
i=1
j=1
Fij (x, ) i = 1.., N
(mi + 1) variables binaires yij telles que :
yij =
1
0
si yi = j
sinon
i = 1.., N j = 0, 1, .., mi
(0.3)
alors on peut crire la vraisemblance associ lchantillon y = (y10 , ...., y1m1 , ..., yN 0 , ...., yN mN )
comme le produit des probabilits associes aux direntes modalits, et ceci pour tous les
individus :
N
mi
yij
Fij (x, )
L (y, ) =
(0.4)
i=1 j=0
Les rsultats gnraux concernant les estimateurs du MV et les proprits asymptotiques

des estimateurs tudies dans le chapitre 1 concernant les modles binaires restent valables ici.
Il ny a donc pas de dicult technique concernant lestimation des paramtres de ces modles. Mais les modles polytomiques peuvent avoir des formes mathmatiques trs direntes
suivant les hypothses retenues. Cest pourquoi la recherche dune forme adapte au problme
conomique pos constitue dans la plupart des cas, la plus grande dicult bien avant les mthodes destimation et dinfrence. Si ces modles posent des problmes, ce sont avant tout des
problmes de choix de modlisation. Pour mieux comprendre ces dicults, nous allons
prsent distinguer les modles multinomiaux ordonns, les modles multinomiaux squentiels
et les modles multinomiaux non ordonns.
1. Modles Multinomiaux Ordonns

Avant de dfinir prcisment ce que sont les modles multinomiaux ordonns, commenons par
dfinir leur champ dapplication. Les modles ordonns sont utiliss lorsque les valeurs
prises par la variable multinomiale correspondent des intervalles dans lesquels
va se trouver une seule variable latente inobservable continue. Ainsi, un modle
polytomique univari ordonn est un modle dans lequel on a une variable, plusieurs modalits,
et un ordre naturel sur ces modalits. On suppose que les modalits sont identiques pour tous
les individus :
mi = m i = 1.., N
Definition 1.1.
forme :
Un modle polytomique univari ordonn peut scrire sous la
si yi < c1
0
1
si c1 yi < c2
i = 1.., N
(1.1)
yi =
...
...
m si yi > cm
avec cj+1 cj et o la variable latente yi est dfini par

yi = xi + i
(1.2)
avec xi = x1i ..xK

, i = 1, .., N , = ( 1 ... K ) RK , i i.i.d. 0, 2 et o i / suit une
i
loi de fonction de rpartition F (.) .
Naturellement, si la fonction F (.) correspond la loi logistique, F (.) = (.) , le modle
est un modle logit multinomial ordonn, tandis que si la fonction F (.) correspond la loi
normale centre rduite, F (.) = (.) , le modle est un modle probit multinomial ordonn.
Du point de vue pratique, naturellement un tel dcoupage en classe sur yi na de sens que si le
nombre de classes est relativement faible.
Naturellement, partir de la dfinition prcdente on peut dduire la loi de la variable
qualitative observe yi qui nous servira par la suite construire la fonction de vraisemblance.
En eet, on a :
c1
xi
P rob (yi = 0) = P rob (yi < c1 ) = F
P rob (yi = 1) = P rob (c1 yi < c2 ) = F
c2
xi
xi
c1
...
P rob (yi = m) = P rob (yi > cm ) = 1 F
cm xi
De faon gnrale, on obtient le rsultat suivant :

Proposition 1.2. Dans un modle polytomique univari ordonn satisfaisant la dfinition 1.1, la probabilit associe lvnement yi = j, j = 0, 1, .., m est dfinie par
:
cj
cj+1
xi
xi
F
i = 1.., N
P rob (yi = j) = F
avec par convention c0 = et cm+1 = .
Il ne reste plus alors qu construire la vraisemblance associe lchantillon y comme suit :

N
mi
yij
L (y, , c1 , .., cm , ) =
P rob (yi = j)
i=1 j=0
N
mi
cj+1 xi
F
i=1 j=0
xi
cj
yij
(1.3)
o la variable dichotomique yij est dfinie par :

yij =
1
0
si yi = j
sinon
i = 1.., N j = 0, 1, .., m
Gnralement seuls les paramtres = / et cj = cj / sont identifiables. La vraisemblance

scrit alors en fonction de ces paramtres comme suit :
N
mi
L y, , c1 , .., cm =
i=1 j=0
F cj+1 xi F cj xi
yij
(1.4)
On vrifie en outre que le vecteur xi ne peut contenir de constante pour les mmes raison
didentification qui avaient t voques dans le cas du modle dichotomique en ce qui concerne
la normalisation du seuil . On ne peut identifier la fois le paramtre associ la constante
et les seuils cj .
Il ny a alors aucune dicult technique maximiser la fonction de log-vraisemblance en
, c1 , ..et cm pour obtenir les estimateurs du maximum de vraisemblance dont les proprits sont
identiques celles tudies dans le modle dichotomique univari, si ce nest que lon estime en
outre les paramtres de seuil cj :
=arg max log L y, , c1 , .., cm
{ }
(1.5)
cj =arg max log L y, , c1 , .., cm
(1.6)
{cj }
avec
log L y, , c1 , .., cm =
i=1 j=0
yij log F cj+1 xi F cj xi
(1.7)
o F (.) est une fonction de rpartition donne.

Nous allons prsent tudier plusieurs exemples de modles qualitatifs multinomiaux ordonnes afin de mieux apprhender le type de problmes conomiques auxquels cette modlisation
sadapte. Ces exemples sont repris de Amemiya (1981).
1.1. Exemples de Modles Multinomiaux Ordonns

Considrons plusieurs exemples de modles multinomiaux ordonns.
1.1.1. Dosage dinsecticide : Gurland, Lee et Dahm (1960)

Le premier exemple relve de la bio-conomtrie, domaine privilgi des premires applications
des modles qualitatifs.. Il sagit de ltude de Gurland, Lee et Dahm (1960) parue dans
Biometrics qui constitue une extension en multinomial de lexemple de linsecticide tudi dans
le modle dichotomique. On considre un dosage dinsecticide xi vaporis sur le ie`me individu et
lon note yi la tolrance de cet individu au produit. Naturellement, on suppose que la tolrance
est inobservable et continue. On suppose pour simplifier que la tolrance yi est distribu selon
une loi N , 2 de paramtre inconnus. On suppose en outre que la variable observe yi qui
traduit ltat de linsecte peut prendre prsent trois valeurs, m = 3 et i = 1.., N :
0 si lindividu i est vivant

1 si lindividu i est moribond
yi =
2 si lindividu i est mort
On suppose que lindividu meurt si et seulement si le dosage de linsecticide dpasse la

tolrance xi > yi , et quil reste vivant si au contraire sa tolrance dpasse dun montant
le dosage dinsecticide, cest dire si et seulement si yi > xi + , o est un paramtre
inconnu. Entre les deux, linsecte est mal en point. Un tel problme correspond bien la
structure dun modle polytomique ordonn, puisque les valeurs prises par la variable
multinomiale (yi = 0, 1, 2) correspondent des intervalles dans lesquels va se trouver
une seule variable latente inobservable continue, savoir la tolrance yi . En eet,
un tel problme peut se modliser sous la forme :
0 si yi > xi +
1 si xi < yi xi +
(1.8)
yi =
2 si yi xi
Les probabilits associes au trois modalits sont donc gales :
P rob (yi = 0) = P rob (yi > xi + ) = 1
xi +
P rob (yi = 1) = P rob (xi < yi xi + ) =
xi +
P rob (yi = 2) = P rob (yi < xi ) =
xi
xi
xi
o (x) dsigne la fonction de rpartition de la loi normale centre rduite. Naturellement,

puisque la somme de ces trois probabilit est gale lunit, seules deux probabilits seront
eectivement estimes. Considrons seulement P rob (yi = 0) et P rob (yi = 2) , cest dire les
probabilits de rester vivant et de dcs. Lestimation de la probabilit P rob (yi = 2) , sous la
forme P rob (yi = 2) = ( 0 + 1 x) , fournit un estimateur 0 du coecient associ la constante et un estimateur 1 du coecient associ xi . On peut alors identifier les paramtres
structurels et en rsolvant le systme trivial 0 = 1/ et 1 = / et proposer deux estimateurs = 1/ 0 et = 1 0 . De la mme faon, lestimation de la probabilit P rob (yi = 0) ,
sous la forme P rob (yi = 0) = (0 + 1 x) , fournit un estimateur 0 du coecient associ la
constante et un estimateur 1 du coecient associ xi . On peut alors identifier le paramtre
structurel manquant savoir le seuil . En eet, on sait que 0 = ( ) /, connaissant une
valeur de et de on peut en dduire un estimateur pour , tel que = 0 . Naturellement, lestimateur du paramtre 1 = 1/ est obtenu sous la contrainte 1 = 0 . Donc
dans ce modle, lestimation des probabilits P rob (yi = 0) et P rob (yi = 2) permet didentifier
les trois paramtres structurels , et . Notre bio-conomtre connat alors la distribution de
la tolrance yi des insectes et le seuil dinsecticide.
1.1.2. Acquisition dun bien immobilier : David et Legg (1975)

Ltude de David et Legg (1975) parue dans le Journal of Business and Economic Statistics,
est une tentative de modlisation du prix des biens immobiliers en fonction dun certain nombre de caractristiques comme la taille du bien immobilier, lge de lacqureur, le revenu de
lacqureur, le nombre dannes dtudes de lacqureur etc.. Les donnes de David et Legg
sont prsentes de la faon suivante. On observe si lacquisition dun bien immobilier a eu
lieu, les biens tant regroups en trois catgories suivant leur prix. Etant donn la nature des
donnes utilises, le prix de chaque bien est inobservable et seul son appartenance lune des
trois catgories est observe :
0 si le prix du bien i acquis est infrieur $28,999

1 si le prix du bien i acquis est compris entre $29,000 et $54,999
(1.9)
yi =
2 si le prix du bien i acquis est suprieur $55,000
David et Legg (1975) proposent de modliser la variable polytomique yi = 0, 1, 2 selon

lappartenance dune variable inobservable yi trois classes distinctes :
0 si yi < c1
1 si c1 yi < c2 i = 1.., N
yi =
(1.10)
2 si yi > c2
o la variable latente yi est distribue selon une loi normale N xi , 2 , o le vecteur xi

comporte lensemble des caractristiques du bien cites prcdemment.. On suppose que le
vecteur xi ne comporte pas de constante. Le problme consiste donc estimer les paramtres
structurels c1 , c2 , et les K paramtres du vecteur . On a donc K + 3 paramtres structurels
estimer. Les probabilits associes aux trois modalits sont dfinies de la faon suivante :
P rob (yi = 0) = P rob (yi < c1 ) =
P rob (yi = 1) = P rob (c1 yi < c2 ) =
c1
xi
c2
xi
c1
xi
c2
c2
xi
= + xi
Ds lors, la log-vraisemblance de lchantillon est dfinie par la fonction :

P rob (yi = 2) = P rob (yi > c2 ) = 1
N
log L (y, , c1 , c2 , ) =
yi0 log
i=1
+yi2 log
c1
xi
+ yi1 log
c2
xi
c1
xi
c2
+ xi
Ce qui peut scrire sous une forme log-linaire dans les paramtres :
N
log L y, , c1 , c2
=
i=1
yi0 log c1 xi
+yi2 log c2 + xi
+ yi1 log c2 xi c1 xi
(1.11)
avec x = x/. La procdure du maximum de vraisemblance fournit alors une estimation pour
les K + 2 paramtres , c1 et c2 . Ds lors, on ne peut pas dans ce cas identifier la variance
du fait de la normalisation impose par le choix de la distribution normale. Par consquent
lestimation de ce modle ne permet pas didentifier les paramtres de seuil c1 et c2 et les
paramtres , mais seulement les transformes , c1 et c2 . Ceci na pas dimportance ds lors
que lon sintresse uniquement aux eets marginaux des variables xi sur la probabilit dacheter
des biens immobiliers appartenant aux trois catgories. On peut par exemple calculer limpact
de la taille du logement sur la probabilit dacheter un logement dont le prix est infrieur
$28,999 et comparer celle-ci avec limpact de la taille du logement sur la probabilit dacheter
un logement dont le prix est suprieur $55,000. En eet, on peut calculer 3 N K drives
suivantes :
P rob (yi = j)
i = 1.., N, j = 0, 1, 2 k = 1.., K
[k]
xi
Dans cette tude, tout comme dans les modles multinomiaux en gnral, il y a finalement
plusieurs faons dinterprter la variable latente yi .
Remarque Dans un modle multinomial, il ny a gnralement aucune ncessit de
donner un nom et dexpliquer rellement ce quest la variable latente yi . Peu
importe ce quelle reprsente, il sut juste de supposer que cest une variable
continue qui aecte la variable polytomique observe yi . Le fait de nommer
yi permet simplement de faciliter la justification conomique du choix des
variables explicatives xi .
Dans le cas prsent de ltude David et Legg (1975), on peut dire que la variable latente yi
correspond au prix du bien immobilier. Dans ce cas, si cette variable est par ailleurs observable,
il aurait t prfrable au lieu destimer les probabilits, destimer directement la relation entre
le prix du bien et les caractristiques xi observes. Mais rien ne nous contraint dans le fait
dassimiler yi au prix des biens : cette variable inobservable yi peut reprsenter nimporte
quelle grandeur conomique susceptible daecter lachat de biens des trois catgories de prix et
qui elle mme dpend des variables xi (taille du logement, revenu et ge de lacqureur etc..).
Ce peut tre par exemple, la disponibilit payer le bien immobilier.
1.2. Application
On considre une application tire dune tude de J. Gunther de la Federal Reserve Bank de
Dallas, intitule Between a Rock and a Hard Place : The CRA-Safety and Soundness Pinch.
Le fichier de donnes disponible sur le sitye web (??) est intitul Gunther.xls. Cette tude porte
sur le Community Reinvestment Act (CRA), loi promulgu aux Etats Unis en 1977 et visant
encourager les institutions de dpts (banques et autres institutions financires) rpondre
aux besoins en crdit des communauts dans lesquelles elles oprent2 . Toutes les banques sont
ainsi values par des instances de contrle qui sont les suivantes : Oce of the Comptroller
of the Currency (OCC), Board of Governors of the Federal Reserve System (FRB), Oce of
Thrift Supervision (OTS), and Federal Deposit Insurance Corporation (FDIC). En eet, la loi
recquiert que les agences de contrle mentionnes, valuent rgulirement les performance des
institutions au regard des objectifs du CRA.
2 Pour
un
historique
et
une
http://www.ec.gov/cra/history.htm.
prsentation
plus
global
du
CRA,
consulter
le
site
La performance des institutions en ce qui concerne le fait de favoriser les besoins en crdit
de la communaut est valu dans le contexte des informations disponibles sur cette institution
(capacits, contraintes diverses, stratgie..), des informations sur la communaut (dmographie,
donnes conomiques, prts, investissements..) et des informations sur ses concurrents et sur
ltat du march. Une notation (ou rating) est alors attribu selon quatre modalit : yi = 1 pour
performance remarquable, yi = 2 pour performance satisfaisante,; yi = 3 pour performance
amliorer, yi = 4 pour performance dplorable.
Ltude de Gunther porte sur 350 observations de ces rating et propose de modliser ces
ratings en fonction de plusieurs variables explicatives intitules respectivement loa, prl, equ,
roa, sec, ass, metro et growth. La variable loa dsigne le ratio prts sur actif total de la
banque, la variable prl dsigne le ratio actifs douteux sur actif total, la variable equ dsigne le
ratio capitaux propres sur actif, la variable roa dsigne le ratio dividende sur actifs, la variable
sec dsigne le ratio investissements de valeurs sur actifs, la variable ass le logarithme de lactif
de la banque, la variable metro prend une valeur 1 si la banque son sige dans une MSA ()
et 0 sinon, et enfin la variable growth dsigne le taux de croissance du Pib de ltat dans lequel
la banque opre. Dans le tableau ci dessous sont reproduit les valeurs ces direntes variables
pour les 10 premiers individus de lchantillon.
Figure 1.1:
Nous allons prsent modliser le rating sous la forme dun probit ordonn. En eet, dans ce
cas prcis, les valeurs prises par la variable multinomiale peuvent correspondre des intervalles
dans lesquels va se trouver une variable latente inobservable. On a ici un ordre naturel sur
les modalits allant de la satisfaction la plus complte au regard des objectifs du CRA la
performance dplorable. Pour modliser ce probit ordonn sous Eviews, on choisit Estimate
Equation dans le menu Quick, et lon retient la mthode ORDERED - Ordered Choice avec
une Error Distribution de type Normal. On indique ensuite la variable polytomique ainsi que
les variables explicatives, la constante ne pouvant tre introduite pour une raison de colinarit.
Les coecients des variables roa et sec sont alors non significativement dirents de zro. On
retire donc ces variables et les rsultats obtenus pour le probit ordonns sont alors les suivants
:
On observe cette fois que toutes les variables sont significatives de mme que les trois seuils
10
Figure 1.2: Estimation dun Probit Ordonn
c1 , c2 et c3 tels que :
2
yi =
3
si
si
si
si
yi < c1
c1 yi < c2
c2 yi < c3
yi > c3
i = 1.., N
yi = xi + i
(1.12)
On obtient ainsi des ralisations c1 = 3.645, c2 = 2.725 et c3 = 1.61. On peut alors

calculer pour chaque banque la probabilit dobtenir un rating trs satisfaisant (yi = 1) de la
faon suivante :
P rob (yi = 1) = P rob (yi < c1 ) = c1 xi
o c1 = c1 / , = / . On peut donc estimer cette probabilit de la faon suivante :
^
P
rob (yi = 1) = c1 xi
(1.13)
o c1 est un estimateur convergent de c1 et o est un estimateur convergent de . Ainsi dans

le cas de notre modle pour lindividu 1, on montre que la ralisation de lestimation de la
variable latente est :
x1
= 0.068 5.24 6.138 0.0559 11.273 0.250
1.7245 0.3982 + 0.7685 0 + 10.748 0.0120
= 3.359
11
Ds lors, on a :
^
P
rob (y1 = 1) = c1 x1
(3.645 + 3.359)
(0. 286)
0.387
De la mme faon, on peut calculer pour cette banque la probabilit que yi = 2 :
P^
rob (y1 = 2) = c2 x1 c1 x1
(2.725 + 3.359) (0. 286)
(0. 634) 0.387
0.736 0.387
0. 349
Ainsi pour tous les individus on peut calculer les probabilits associes aux quatre modalits.
On obtient les rsultats suivants pour les dix premiers individus :
Figure 1.3: Probabilits Estimes du Probit Ordonn
12
2. Modles Multinomiaux Squentiels

Avant de dfinir prcisment ce que sont les modles multinomiaux squentiels, commenons
par dfinir leur champ dapplication. Les modles squentiels sont utiliss pour rendre compte de choix eectus ou dvnements selon une squence bien prcise, le
plus souvent dans le temps, et dont les ralisations successives conditionnent naturellement lensemble des modalits futures. Ces modles possdent la particularit de
construire la squence des vnements comme le produit des probabilits lmentaires associes
la ralisation dun seul venement chaque tape.
Definition 2.1. Soit T le nombre dtapes et yi = 1, .., N une variable polytomique
dont les modalits sont 1, 2, .., T. On crit alors la probabilit de sarrter ltape
t comme une fonction Ft (xi ) , t = 1, 2, .., T :
j1
P rob (yi = j) =
s=1
[1 Fs (xi )] Fj (xi )
(2.1)
Lexemple typique est celui de la russite aux examens, qui est bien entendu conditionne
par la russite aux examens antrieurs dans le cursus. Considrons lexemple de la russite au
master. On cherche modliser la probabilit quun tudiant obtienne son Master en fonction
de caractristiques individuelles, comme le revenu moyen des parents, la moyenne des notes
au baccalaurat, la srie du baccalaurat etc.. On note yi = 1 si le ie`me tudiant a obtenu le
baccalaurat mais pas la licence, yi = 2 si ltudiant a obtenu la licence mais pas le master et
yi = 3 si ltudiant a obtenu le master. Naturellement, la probabilit associe lobtention du
master scrit :
2
P rob (yi = 3) =
s=1
[1 Fs (xi )] F3 (xi )
= [1 F1 (xi )] [1 F2 (xi )] F3 (xi )

De la mme faon, la probabilit associe lobtention de la licence scrit :
1
P rob (yi = 2) =
s=1
[1 Fs (xi )] F2 (xi ) = [1 F1 (xi )] F2 (xi )
La probabilit que les individus nobtiennent pas leur baccalaurat, cest dire que yi = 1,
est calcule en utilisant tout lchantillon constitu des deux sous groupes : les tudiants ayant
obtenu le baccalaurat et ceux qui ont chou (yi = 0 non modlise). On utilise ensuite le sous
chantillon des tudiants ayant obtenu le baccalaurat pour dterminer les caractristiques de
la probabilit dobtenir la licence yi = 2. Et enfin, on utilise le sous chantillon des tudiants
ayant obtenu la licence pour dterminer les caractristiques de la probabilit dobtenir le master
yi = 3.
13
2.1. Application
**************************
***** Application Eviews ****
**************************
cf. Ordered Models
- Chandek, Meghan Stroshine (1999). Race, expectations and evaluations of police performance: An empirical assessment. Policing 22(4):675
- http://faculty.smu.edu/tfomby/eco6352/data/
14
3. Modles Multinomiaux Non Ordonns

Nous allons prsent envisager la classe des modles multinomiaux les plus frquents en
conomie : les modles multinomiaux non ordonns. Il existe deux grandes classes de
modles multinomiaux non ordonns suivant que ces modles satisfont ou ne satisfont pas une
hypothse particulire qui est lhypothse dIndpendence des Alternatives Non Pertinentes (IAN P ou IIA en anglais pour Independance of Irrelevant Alternative). Cette hypothse traduit le fait que le rapport de deux probabilits associs deux venements particuliers est indpendant des autres vnements. Ainsi, la premire grande classe de modle est
constitu par les modles logit multinomiaux non ordonns qui comprend notamment :
1. Les modles logit multinomiaux indpendants ou modles logit multinomiaux.
2. Les modles logit multinomiaux conditionnels ou modles logit conditionnels.
3. Les modles logit multinomiaux universels ou modles logit universels.
Tous ces modles satisfont lhypothse IIA, or nous verrons quune telle hypothse pose des
problmes de cohrence dans certaines modlisations conomiques. Cest pourquoi des modles
alternatifs ont t dvelopps de sorte ne pas satisfaire cette hypothse contestable : cette
seconde classe de modles comprend notamment le modle logit hierarchis, le modle probit
multinomial.
Toutefois, dans la pratique les modles multinomiaux les plus frquemment utiliss restent
les modles logit satisfaisant lhypothse IIA. Cest pourquoi dans cette section, nous nous
limiterons ltude de cette classe de modles multinomiaux non ordonns. Nous
tudierons les modles alternatifs dans la prochaine section. Mais avant de prsenter la classe
des logit multinomiaux non ordonns, nous allons introduire ces modles en dcrivant leur
utilisation essentielle, savoir celle de rendre compte de choix probabilistes. Les
modles multinomiaux non ordonns sont en eet avant tout des modles permettant de dcrire
des choix individuels en prsence dutilit stochastique.
3.1. Des modles de choix probabilistes
Supposons quun individu ait a eectuer un choix rationnel entre m + 1 modalits procurant
m + 1 niveaux de satisfaction dirents pour lindividu. On postule que les choix rationnels
peuvent tre reprsents par une fonction dutilit. Rappelons quune fonction dutilit U ()
est dfinie une transforme croissante prs : si la fonction h (.) est une fonction croissante
et continue, h (U ()) est une autre fonction dutilit associe au mme prordre que celui de
U (). On considre le cas o le niveau dutilit est stochastique et dcrit par une fonction
U (.) dpendant dun terme alatoire. Ce choix peut se justifier par ne mauvaise perception
de la qualit des direntes modalits ou en raison dune grande dicult valuer de faon
certaine les niveaux dutilit. On pose que pour chaque modalit j = 0, 1, .., m, lutilit de
lindividu sexprime sous la forme suivante :
Uj = U (xj , j ) = v (xj ) + j
j = 0, 1, .., m
(3.1)
15
o v (.) est une fonction continue dterministe et o j est une variable alatoire i.i.d. dont la loi
est dcrite par la fonction de densit f (.) et la fonction de rpartition F (.) . On suppose que
les perturbations j , j = 0, 1, .., m sont indpendantes. Ainsi lutilit alatoire associe
la j e`me modalit dpend des caractristiques propres cette modalit
On dfinit une variable polytomique y qui prend m + 1 modalits suivant les choix de
lindividu :
y = j si lindividu choisit la j e`me modalit j = 0, 1, .., m
Ds lors, la probabilit que notre individu choisisse la modalit j correspond la probabilit
que cette modalit lui confre un niveau dutilit suprieure toutes les autres modalits qui
sorent lui. En eet, la probabilit que lindividu choisisse la modalit j est dfinie par :
P rob (y = j) = P rob {U (xj , j ) > U (x0 , 0 ) , U (xj , j ) > U (x1 , 1 ) ,
....., U (xj , j ) > U (xk , k ) , ....., U (xj , j ) > U (xm , m )}
(3.2)
Prenons par exemple la probabilit que lagent choisisse la modalit 0 :

P rob (y = 0) = P rob {U (x0 , 0 ) > U (x1 , 1 ) , U (x0 , 0 ) > U (x2 , 2 ) ,
....., U (x0 , 0 ) > U (xk , k ) , ....., U (x0 , 0 ) > U (xm , m )}
ce qui peut se rcrire sous la forme suivante :

P rob (y = 0) = P rob [U (x0 , 0 ) > U (xk , k ) , k = 1, .., m]
= P rob [v (x0 ) + 0 > v (xk ) + k , k = 1, .., m]
= P rob [k < v (x0 ) v (xk ) + 0 , k = 1, .., m]

Pour calculer cette probabilit partir des fonctions de densit f (.) , rappelons la dfinition
de la densit jointe.
Definition 3.1. La densit jointe de deux v.a.r. continues X et Y , note fX,Y (x, y)
0, satisfait les proprits suivantes :
b
(a, b, c, d) R4 P (a X b, c Y d) =
fX,Y (x, y) dy dx
a
(3.3)
fX,Y (x, y) dy dx = 1
(3.4)
La fonction de distribution cumulative jointe, note FX,Y (x, y) est alors dfinie par,
(a, b) R2 :
FX,Y (a, b) = P (X a, Y b) =
fX,Y (x, y) dy dx
(3.5)
On sait en outre que si les variables X et Y sont dites indpendantes si et seulement

si fX,Y (x, y) = fX (x) fY (y) . Lindpendance implique par consquent que FX,Y (x, y) =
FX (x) FY (y) . Ainsi, si lon suppose que les perturbations j sont indpendantes et distribues
16
selon une loi de distribution f (.) , et si lon note vj = v (xj ) , la probabilit P rob (y = 0) peut
scrire sous la forme :
m
P rob (y = 0) =
P rob [k < v0 vk + 0 ] f (0 ) d0
k=1
v0 v1 +0
v0 vm +0
..
v0 v2 +0
f (1 ) d1
f (m ) dm
f (2 ) d2 ..
f (0 ) d0
En dautres termes, si lon note F (.) la fonction de rpartition associe la loi des perturbations j , on a:
k=1
P rob (y = 0) =
F [v (x0 ) v (xk ) + 0 ] f (0 ) d0
De faon gnrale, quelque soit la modalit j = 0, 1, .., m on montre ainsi que :
P rob (y = j) =
k=0
k=j
F [v (xj ) v (xk ) + j ] f (j ) dj
(3.6)
Supposons prsent que la loi des perturbations soit une loi de Gompertz3 :
F (z) = exp [ exp (z)]
(3.7)
f (z) = exp [z exp (z)]
(3.8)
Alors, il est possible de donner une expression analytique la probabilit que lagent choisisse
la modalit 0.
P rob (y = 0) =
k=1
exp [ exp (v0 + vk 0 )] exp [0 exp (0 )] d0

m
exp
k=1
exp (v0 + vk 0 ) exp [0 exp (0 )] d0
******************************
*** FINIR DEMONSTRATION ***
******************************
Finalement, on montre que :
P rob (y = 0) =
exp [v (x0 )]
m
exp [v (xk )]
1+
k=0
k=1
exp [v (xk ) v (x0 )]
avec par convention v (x0 ) = 0. De faon gnrale, la probabilit que lindividu choisisse la
modalit j est dfinie par :
exp [v (xj )]
(3.9)
P rob (y = j) = m
exp [v (xk )]
k=0
3 Dite
aussi loi des valeurs extrmes.
17
Or, si lon se restreint une classe des fonctions v (.) anes, avec v (xj ) = j xj ,
cette formulation de la probabilit associe la j e`me modalit est prcisment la
modlisation de la probabilit que lon retiendra dans les modles logit multinomiaux non ordonns.
Considrons prsent le cas o lon dispose dun ensemble de N individus indics i = 1, .., N
ayant les mmes prfrences que lindividu de rfrence de lexemple prcdent. De la mme
faon sous les hypothse dindpendance des perturbations j et sous une hypothse particulire
sur la distribution des ces perturbations, on montre que la probabilit que lindividu i choisisse
la modalit j, j = 0, .., m, est dfinie par :
P rob (yi = j) =
exp [v (xi,j )]
exp [v (xi,k )]
m
k=0
(3.10)
o xi,j dsigne la valeur du vecteur de variable explicative pour lindividu i conditionnant le

choix de la j e`me modalit.
Suivant la forme de la fonction v (xi,j ) plusieurs modles peuvent tre envisags.
1. Le modle logit multinomial indpendant (ou logit multinomial) est obtenu
lorsque la fonction v (.) est une fonction linaire dont les paramtres j diffrent selon les modalits et pour laquelle les variables explicatives varient
uniquement en fonction des individus :
v (xi,j ) = xi j
(3.11)
2. Le modle logit multinomial conditionnel (ou logit conditionnel) est obtenu

lorsque la fonction v (.) est linaire, les paramtres sont indpendants des
modalits et que les variables explicatives dirent selon les modalits et les
individus :
(3.12)
v (xi,j ) = xi,j
3. Le modle logit multinomial universel (ou logit universel) est obtenu pour
toute fonction v (.) continue dpendant de paramtres j conditionnels aux
modalits et de lensemble des variables explicatives du modle :
v (xi,j ) = v j , xij
(3.13)
3.2. Logit multinomial indpendant

Comme nous lavons dit prcdemment, le modle logit multinomial indpendant4 (ou logit
multinomial) est obtenu lorsque la fonction v (.) est linaire, les paramtres j dirent selon les
modalits et que les variables explicatives varient uniquement en fonction des individus, cest
dire lorsque v (xi,j ) = xi j . Ds lors, on peut dfinir la forme gnrale de la probabilit que
lindividu i choisisse la modalit j de la faon suivante :
4 Il convient de faire attention ici sur la terminologie employe. Amemiya (1981) qualifie le modle logit conditionnel de modle indpendant puisque construit sur lindpendance des perturbations. Donc pour Amemiya,
le modle indpendant ici tudi nest quun cas particulier sans nom du logit universel..
18
Definition 3.2. Dans un modle logit multinomial, la probabilit que lindividu i

choisisse la modalit j, j = 0, .., m, est dfinie par :
P rob (yi = j) =
exp xi j
exp xi j
exp (xi k )
(3.14)
1+
k=0
exp (xi k )
k=1
o le vecteur 0 est normalis zro : 0 = 0.

Sous lhypothse de normalisation 0 = 0, la probabilit associe la modalit de rfrence
0 est dfinie par :
P rob (yi = 0) =
exp (xi k )
1+
k=0
(3.15)
exp (xi k )
k=1
Exemple : Considrons prsent un exemple de modle logit multinomial. On cherche

modliser la probabilit de dfaillance dabonns en fonction de leur revenu, not ri , et dune
constante. Supposons que la variable observable yi puisse prendre trois modalits : dfaillance
totale (modalit 0), dfaillance partielle (modalit 1) et remboursement intgral de la crance
(modalit 2). Lhypothse selon laquelle les paramtres j dirent selon les modalits revient
en fait poser que :
[1]
P rob (yi = 1) =
[2]
exp 1 + 1 ri
[1]
[2]
[1]
[2]
[1]
[2]
1 + exp 1 + 1 ri + exp 2 + 2 ri
[1]
P rob (yi = 2) =
[2]
exp 2 + 2 ri
[1]
[2]
1 + exp 1 + 1 ri + exp 2 + 2 ri
[2]
o 1 dsigne le coecient associ au revenu (2e`me variable explicative) dans la modlisation

[2]
de la probabilit de la dfaillance partielle (1e`re modalit), tandis que 2 dsigne le coecient
associ au revenu (2e`me variable explicative) dans la modlisation de la probabilit de labsence
de dfaillance (2e`me modalit). On suppose ici que le revenu naecte pas de faon identique
la probabilit de dfaillance partielle et la probabilit dabsence de dfaillance. Par contre le
revenu du couple ne dire suivant que ce dernier rembourse totalement ou de faon partielle
son prt. Essayons prsent de recenser les implications de la spcification dun modle logit
multinomial indpendant.
3.2.1. Spcification du Logit Multinomial

On considre un modle multinomial pour lequel la probabilit que lindividu i choisisse la
modalit j = 0, .., m scrit sous la forme :
P rob (yi = j) =
exp xi j
m
exp (xi k )
k=0
o les vecteurs de paramtres j RK peuvent direr selon les modalits j. La premire

remarque sur cette spcification concerne la normalisation 0 = 0. En eet, supposons que
19
cette normalisation ne soit pas impose a priori. On obtient alors une expression quivalente
la probabilit (3.14) en divisant les deux membres de la probabilit par exp ( 0 xi ) :
P rob (yi = j) =
exp xi j / exp (xi 0 )
exp xi j 0
exp (xi k ) / exp (xi 0 )

k=0
k=0
exp [xi ( k 0 )]
En posant j = j 0 , j, et donc 0 = 0, on obtient alors une expression de la probabilit

P rob (yi = j) similaire celle de la dfinition, sans imposer la normalisation 0 = 0.
P rob (yi = j) =
exp xi j
m
exp xi j
exp (xi k )
1+
k=0
(3.16)
exp (xi k )
k=1
m
j xi
/ [1 + k=1 exp (xi k )] revient en fait

Ainsi crire la probabilit sous la forme exp
normaliser les paramtres du modle qui correspondent en fait aux dirences entre les
paramtres originaux et le vecteur de paramtres de la modalit de rfrence, ici en loccurrence 0 . Ainsi, les paramtres sinterprtent comme des carts au rfrentiel
(cest dire aux paramtres de la modalit 0). On peut exprimer cette proprit de la
faon suivante.
Proposition 3.3. Dans un modle logit multinomial m+1 modalits, la probabilit
associe la j e`me modalit dpend des carts k j avec k = j et k = 0, 1, ..m :
exp xi j
P rob (yi = j) =
exp (xi k )
k=0
1+
k=0
k=j
(3.17)
exp xi k j
Les m probabilit indpendantes dpendent alors de (m + 1) m/2 dirences de

paramtres k j . Les paramtres ne sont pas identifiables moins dimposer
une contrainte de normalisation : par exemple 0 = 0.
Exemple : considrons un modle avec 3 modalits (m = 2), j = 0, 1, 2. On a alors :
P rob (yi = 0) =
1
1 + exp [xi ( 1 0 )] + exp [xi ( 2 0 )]
1
1 + exp [xi ( 0 1 )] + exp [xi ( 2 1 )]
1
P rob (yi = 2) =
1 + exp [xi ( 0 2 )] + exp [xi ( 1 2 )]
P rob (yi = 1) =
Par construction 2j=0 pj = 1. On dispose ainsi de deux probabilits indpendantes pour

dterminer trois dirences de paramtres ( 1 0 ) , ( 2 0 ) et ( 2 1 ) . Naturellement, ces
dirences de paramtres ne sont identifiables que si lon impose une contrainte de normalisation
du type 0 = 0. Ds lors, on a deux probabilits indpendantes qui nous permettent didentifier
deux paramtres 1 et 2 . Ces paramtres sinterprtent comme des carts au vecteur 0 .
Corollary 3.4. Dans un modle logit mutinomial m + 1 modalits :
Les paramtres associs la modalit de rfrence, gnralement 0, sont normaliss zro : seuls les paramtres associes m modalits peuvent tre
estims.
20
Les paramtres du modle sinterprtent comme des carts au rfrentiel (cest

dire aux paramtres 0 de la modalit 0)
La log vraisemblance scrit uniquement en fonction des vecteurs 1 , ..., m
La seconde proprit centrale dans lanalyse des modles logit multinomiaux concerne les
ratio de probabilits pj /pk o j et k sont deux modalits distinctes. En eet, on montre la
proprit suivante :
Proposition 3.5. Dans le cas dun modle logit multinomial, le rapport des probabilits associs deux modalits j et k distinctes, j = 0, .., m et k = 0, .., m, scrit
sous la forme :
exp xi j
P rob (yi = j)
pj
=
=
= exp xi j k
pk
P rob (yi = k)
exp (xi k )
(3.18)
Ce rapport de probabilits est indpendant des alternatives autres que j et k.

Ainsi, on illustre une hypothse trs particulire de ces modles logit multinomiaux indpendants : savoir lhypothse dIndpendence des Alternatives Non Pertinentes (IAN P
ou IIA en anglais pour Independance of Irrelevant Alternative). Cette hypothse traduit le fait
que le rapport de deux probabilits associs deux venements particuliers est indpendant
des autres vnements. La question que se pose est alors de savoir si une telle hypothse est
satisfaite en pratique.
Pour montrer quel point cette hypothse peut savrer inadquate, reprenons lexemple du
choix de transport propos par Mac Fadden et connu sous le nom de bus bleu, bus rouge. On
considre quun individu pour se rendre son travail le choix entre deux modes de transports.
yi =
0
1
si lindividu prend le mtro

si lindividu prend un bus bleu
On note pb = p0 la probabilit que lindividu prenne le bus bleu et pm = p1 la probabilit

que lindividu prenne le mtro dans cette configuration de choix. Supposons maintenant que
lon ore lindividu la possibilit soit de prendre un bus bleu, soit de prendre un bus rouge.
0 si lindividu prend le mtro

1 si lindividu prend un bus bleu
yi =
2 si lindividu prend un bus rouge

La probabilit que lagent prenne le bus scrit donc sous la forme :
pb = P rob (yi = 1) + P rob (yi = 2)
(3.19)
La probabilit que lagent prenne le mtro demeure pm = p0 et reste un niveau inchang par
rapport au cas prcdent tant donn les nouvelles alternatives proposes. Si lon admet que
la couleur du bus a vraisemblablement peu de chance daecter le choix du mode de transport,
on doit avoir que les probabilits de slection p1 et p2 doivent tre gales :
P rob (yi = 1) = P rob (yi = 2)
(3.20)
21
Maintenant, si lhypothse IIA est satisfaite le rapport entre la probabilit de prendre le

mtro et la probabilit de prendre le bus devrait tre la mme dans les deux modles : en eet,
ce ratio doit tre indpendant des alternatives. Or, ici ce ratio vaut p0 /p1 dans la premire
modlisation et vaut :
p0
1 p0
pm
=
=
pb
p1 + p2
2 p1
Ce ratio dire de celui que lon avait obtenu en labsence de lalternative bus rouge : lhypothse IIA nest donc pas satisfaite.
En conclusion, lhypothse IIA nest que rarement satisfaite, ce qui pose le problme de
la cohrence dune modlisation de type logit multinomial pour rendre compte de choix probabilistes. Nous reviendrons dans la prochaine section sur cette hypothse IIA et les modles
alternatifs qui en rendement compte. Toutefois, le modle logit multinomial indpendant est
trs souvent utilis compte tenu de la simplicit de sa mise en oeuvre pratique. Cest ce que
nous allons voir prsent en ce qui concerne lestimation des paramtres de ce type de modles..
3.2.2. Estimation des paramtres du logit multinomial

Tout comme dans le cas du modle logit dichotomique, lestimation des paramtres des modles
logit multinomiaux peut se faire de direntes faons :
1. Mthodes du maximum de vraisemblance
2. Mthodes de moments : GMM, moments simuls etc..
3. Mthodes non paramtriques et semi-paramtriques
Nous ntudierons ici que la mthode du maximum de vraisemblance information complte.
Comme nous lavons vu prcdemment la vraisemblance associe un modle logit multinomial indpendant m+1 modalits scrit en fonction de m vecteur de paramtres j , j = 1, .., m
du fait de la normalisation 0 = 0. Ainsi lestimation des paramtres du modle logit multinomial seectue alors en maximisant la log-vraisemblance par rapport aux vecteurs de paramtres
( 1 , 2 , ..., m ) :
N
log L (y, 1 , 2 , ..., m ) =
yi,j log [P rob (yi = j)]

i=1 j=0
avec yi,j = 1 si yi = j et 0 sinon, et o les probabilits P rob (yi = j) sont dfinies par :
P rob (yi = j) =
exp xi j
exp xi j
=
exp (xi k )
1+ m
k=1 exp (xi k )
m
k=0
P rob (yi = 0) =
avec 0 par convention.
1+
1
exp (xi k )
m
k=1
22
Proposition 3.6. La log vraisemblance associe un modle logit multinomial

m + 1 modalits j = 0, 1, .., m scrit :
m
log L (y, 1 , 2 , ..., m ) =

i=1 j=1
yi,j xi j
log 1 +
i=1
exp (xi k )
(3.21)
k=1
avec 0 = 0 par convention.

En eet, on sait que la log-vraisemblance est dfinie par la relation suivante :
N
log L (y, 1 , 2 , ..., m ) =
yi,j log (pi,j )

i=1 j=0
N
yi,j log
=
i=1 j=0
m
k=1
Si lon pose Hi = log [1 +
exp xi j
1+ m
k=1 exp (xi k )
exp (xi k )] , cette expression devient :
log L (y, 1 , 2 , ..., m ) =
i=1 j=0
yi,j xi j
i=1
Sachant que par convention 0 = 0 on a donc :

N
j=0
yi,j
yi,j xi j =
i=1 j=0
Hi
yi,j xi j
i=1 j=1
Etant donne la dfinition de la variable yi,j qui prend la valeur 1 si yi = j et 0 sinon, on a

immdiatement que :
m
yi,j = yi,0 + yi,1 + .. + yi,m1 + yi,m = 1

j=0
En eet, on sait que la variable yi ne peut prendre quune seule et mme valeur parmi les m + 1
modalits, ds lors m
j=0 yi,j = 1. Ainsi, on obtient que :
i=1
Puisque en eet
Hi
N
i=1
j=0
yi,j =
Hi =
i=1
log 1 +
i=1
exp (xi k )
k=1
yi,0 = 1. On en dduit alors finalement que :

N
log L (y, 1 , 2 , ..., m ) =

i=1 j=1
yi,j xi j
log 1 +
i=1
exp (xi k )
k=1
On retrouve alors lexpression (3.21) de la log-vraisemblance. Notons au passage que la fonction de log-vraisemblance dun modle logit multinomial indpendant est globalement concave5 et que par consquent on peut utiliser dirents algorithmes doptimisation
numrique propres ce type de problme (Newton Raphson par exemple) et que les rsultats
ne sont pas sensibles au choix des conditions initiales de ces algorithmes.
5 La
dmonstration de ce rsultat est laisse au lecteur titre dexercice.
23
Definition 3.7. Le gradient associ la log-vraisemblance dun modle logit multinomial est dfini z = 1, .., m :
log L (y, 1 , 2 , ..., m )
=
z
i=1
(yi,z pi,z ) xi
(3.22)
avec pi,z = P rob (yi = z) .

En eet, on a :
log L (y, 1 , 2 , ..., m )
z
N m

yi,j xi j
z i=1 j=1
z
N
=
i=1
yi,z xi
i=1
log 1 +
i=1
exp (xi k )
k=1
exp (xi z )
xi
m
k=1 exp (xi k )
1+
Connaissant la dfinition de pi,z = P rob (yi = z) , on a donc :

log L (y, 1 , 2 , ..., m )
=
z
i=1
yi,z xi
pi,z xi =
i=1
i=1
(yi,z pi,z ) xi
On retrouve naturellement la mme expression que dans le cas du modle logit bivari. De
la mme faon, la matrice hessienne est dfinie par :
N
2 log L (y, 1 , 2 , ..., m )

=
pi,j (Ij,k pi,k ) xi xi
j k
i=1
(3.23)
o la fonction indicatrice Ij,k est telle que Ij,k = 1 si k = j et 0 sinon.

Enfin, on peut naturellement tudier les eets marginaux dans un modle logit
multinomial indpendant de la faon suivante.
[k]
Definition 3.8. Les eets marginaux dune variation de la variable exogne xi ,

k = 1, .., K sur la probabilit que lindividu i choisisse la j e`me modalit, j = 0, 1, .., m,
sont dfinis par :
m
pi,j
[k]
=
p
pi,z [k]
(3.24)
i,j
z
j
[k]
xi
z=0
[k]
[k]
o j est la ke`me composante de j associ la variable explicative xi et o pi,j =

P rob (yi = j) dsigne la probabilit que lindividu i choisisse la j e`me modalit :
pi,j =
exp xi j
z=0
exp (xi z )
Pour dmontrer ce rsultat, on pose H (xi ) =

pi,j
[k]
xi
=
=
=
[k]
xi
exp xi j
2
exp (xi z ) En eet, on sait que
[k]
xi
H (xi ) exp xi j
H (xi )
[k]
xi
m
1
H (xi )
m
z=0
exp xi j
H
1
H (xi )
(3.25)
[k]
j exp xi j H (xi ) exp xi j
[k]
z exp (xi z )
z=0
24
En simplifiant cette expression, on fait apparatre les probabilits pi,j = exp xi j /H, et
on trouve :
pi,j
[k]
xi
exp xi j
H (xi )
[k]
j
exp xi j
[k]
z
z=0
exp (xi z )
H
m
[k]
= j pi,j pi,j
[k]
z pi,z
z=0
On retrouve ainsi lexpression (3.24) des eets marginaux. Il convient de remarquer que,
[k]
pour chaque individu, pour une variable explicative quelconque xi , on doit calculer m + 1
eets marginaux associs aux probabilits pi,j pour j = 0, 1, .., m.
Dans le cas dun modle dichotomique deux modalits (m = 1), on retrouve videmment
la formule propose dans le premier chapitre. En eet, nous avions vu que pour un modle logit
univari :
exi
pi
=
(3.26)
2 k
[k]
(1 + exi )
xi
Selon la formule (3.24), dans un modle 2 modalits on doit avoir
pi,1
[k]
xi
[k]
[k]
[k]
= pi,1 1 pi,0 0 pi,1 1
avec pi,1 = P rob (yi = 1) et pi,0 = P rob (yi = 0) = 1 pi,1 et pi,1 = exi / 1 + exi . Par
[k]
[k]
[k]
[k]
normalisation, on pose 0 = 0, k, ds lors, il vient pi,1 /xi = pi,1 1 p2i,1 1 ou encore :
pi,1
[k]
xi
[k]
= 1
exi
1 + exi
exi
1 + exi
2
[k]
= 1
exi
2
(1 + exi )
On retrouve naturellement la formule propose dans le cadre du premier chapitre pour le modle
logit dichotomique.
3.2.3. Exemples de modles logit multinomial

Le exemple de modle logit multinomial est tir de Perlo et Watcher (1979). Aux EtatsUnis en 1977-1978 est mis en place un programme de subventions destin lutter contre le
chmage endmique li la crise conomique du dbut des annes 70. Ce programme vise
proposer des rductions de taxes aux entreprises qui embauchent de nouveaux salaris et
plus particulirement des salaris non qualifis. Perlo et Watcher (1979) proposent dvaluer
lutilit de ce programme en rgressant la variation en pourcentage de lemploi dans la ie`me
firme, note yi , sur direntes variables explicatives incluant notamment une variable dummy
indiquant si lentreprise participe au programme. Etant donns que les premiers rsultats de
ces rgressions ntaient pas satisfaisant, les auteurs ont alors regroupes les entreprises en cinq
classes : celles pour lesquels yi tait compris dans les intervalles S0 = ], 1] , S1 = ]1, 2] ,
S2 = ]2, 30] , S3 = ]30, 45] et S4 = [45, +[ . Ils ont alors estim un modle non ordonn de
type logit multinomial en essayant de modliser la probabilit
pi,j = P rob (yi Sj )
(3.27)
25
en utilisant les mmes variables explicatives que dans leurs premires estimations. Dans leur
modle les variables xi,j sont indpendantes des modalits (xi,j = xi ) et les coecients j
varient avec les modalits. On a vu que gnralement lorsque la variable latente yi
est continue, distribue selon une loi normale et observable, il est prfrable de
rgresser directement yi sur un ensemble de variables explicatives plutt que de
vouloir modliser les probabilits que yi tombe dans certains intervalles. Pourtant,
si yi est distribue selon une loi inconnue et non normale qui dpend de xi dune faon plus
complique quun simple problme de localisation dans un intervalle, la procdure de Perlo et
Watcher peut donner de meilleurs rsultats que les M CO de yi sur xi .
****************************************
*** Chercher dautres applications sur EconLit **
****************************************
3.3. Application
********************************************
*** Application Eviews ou Limdep programmer ***
********************************************
3.4. Logit Conditionnel

Comme nous lavons vu, le modle logit multinomial indpendant permet denvisager une modlisation o les paramtres dirent selon les modalits, mais o les variables explicatives sont
les mmes quelles que soient les modalits. Ces dernires ne varient quavec les individus. Si
lon reprend la notation de lutilit stochastique utilise prcdemment, on a un modle o la
probabilit que lindividu i choisisse la modalit j scrit sous la forme :
P rob (yi = j) =
exp [v (xi,j )]
(3.28)
exp [v (xi,k )]
k=0
o la fonction v (.) est linaire, les paramtres j dirent selon les modalits et que les variables
explicatives varient uniquement en fonction des individus :
v (xi,j ) = xi j
(3.29)
Une alternative ce modle logit multinomial consiste supposer quau contraire les
paramtres sont indpendants des modalits et que ce sont les variables explicatives qui dirent selon les modalits et les individus :
v (xi,j ) = xi,j
(3.30)
On obtient alors, un modle logit multinomial conditionnel (ou logit conditionnel) introduit par McFadden (1973). La dfinition dun modle logit conditionnel est ainsi
la suivante :
Definition 3.9. Dans un modle logit conditionnel, la probabilit que lindividu i
choisisse la modalit j, j = 0, .., m, est dfinie par :
P rob (yi = j) =
exp (xi,j )
m
exp (xi,k )
k=0
exp xi,j
1+
k=1
exp xi,k
(3.31)
26
o par convention xi,j = xi,j xi,0 .

Nous allons prsent tudier quels sont les avantages et limites de cette spcification avant
de proposer direntes applications.
3.4.1. Spcification du logit conditionnel

Commenons par tudier le rapport de probabilits dans un modle logit conditionnel. On
constate immdiatement que ce modle vrifie lhypothse IIA tout comme le modle logit
multinomial.
Proposition 3.10. Dans le cas dun modle logit conditionnel, le rapport des probabilits associs deux modalits j et k distinctes, j = 0, .., m et k = 0, .., m, scrit
sous la forme :
P rob (yi = j)
exp (xi,j )
pj
=
=
= exp [(xi,j xi,k ) ]
pk
P rob (yi = k)
exp (xi,k )
(3.32)
Ce rapport de probabilits est indpendant des alternatives autres que j et k.

Ainsi, le modle logit conditionnel de McFadden vrifie lhypothse dIndpendence des
Alternatives Non Pertinentes (IAN P ou IIA en anglais pour Independance of Irrelevant
Alternative). Donc lavantage de ce modle ne se situe pas dans ses proprits vis vis de
lhypothse dIIA.
Lavantage de ce modle se situe davantage dans la possibilit qui est oerte de prdire la
probabilit dune nouvelle modalit (virtuelle) en fonction de variables explicatives simules.
Proposition 3.11. Le modle logit conditionnel permet destimer la probabilit associe une modalit virtuelle de la faon suivante :
exp xi,m+1
Pm+1 =
1+
k=1
(3.33)
exp xi,k + exp xi,m+1
o dsigne un estimateur convergent de obtenu sur la base des modalits

j = 0, .., m existantes et o xi,m+1 est une estimation des caractristiques exognes
associes la m + 1e`me modalit virtuelle.
Cest lexemple typique du modle hypothtique de choix de transport cit dans Amemiya
(1981) et Alban (2000). Prenons lexemple dune collectivit territoriale envisageant la mise
en place dun nouveau mode de transport public, le tramway, en plus des modes de transports
collectifs existant (le bus pour simplifier). Pour valuer la probabilit que les administrs
choisissent le tramway, on conduit tout dabord une enqute sur les choix des modes de transport
existant : le but est de calculer la probabilit que lindividu choisisse le bus (modalit 1), la
voiture (modalit 2), ou le vlo (modalit 3). On a ici m + 1 = 4 modalits, la modalit
de rfrence (code 0) tant les autres modes de transports (marche pieds, roller, auto-stop
etc..). Les variables explicatives sont exprimes en dirences par rapport leur valeur prises
dans la modalit 0. Il sagit par exemple du temps de transport moyen du domicile au lieu de
[1]
[2]
travail pour le mode j, not ti,j = xi,j et le cot au kilomtre de ce mode, not ci,j = xi,j ,
27
pour lindividu i. Le modle donne alors la probabilit quun individu caractris par des temps
relatifs (ti,1 , ti,2 , ti3 ) et des cots (ci,1 , ci,2 , ci3 ) choisisse le mode de transport j = 1, 2, 3. La
probabilit que lindividu i choisisse le bus est par exemple gale :
exp ( 0 + 1 ti,1 + 2 ci,1 )
P rob (yi = 1) =
1+
exp xi,1
exp ( 0 + 1 ti,j + 2 ci,j )
1+
k=1
avec = ( 0 1 2 ) et
xi,j
k=1
exp xi,k
= (1 ti,j ci,j ) .
Comme le mode de transport mtro (modalit 4) nexiste pas encore, les variables de temps
de trajet ti,4 et de cot ci,4 ne sont pas disponibles. Mais elles peuvent tre simules partir
dune valuation du temps de trajet du mtro et du cot au kilomtre de ce mode de transport
dans dautres villes. Soient ti,4 et ci,4 les valuations correspondantes. Si lon dispose en outre
dun estimateur convergent du vecteur de paramtres , on peut alors calculer la probabilit
quun individu i prenne le mtro lorsque celui-ci sera eectivement mis en place :
exp 0 + 1 ti,4 + 2 ci,4
P^
rob (yi = 4) =
1+
exp 0 + 1 ti,j + 2 ci,j + exp 0 + 1 ti,4 + 2 ci,4

k=1
Cela donne la probabilit que lindividu i choisisse le mtro plutt que les autres modes de
transport.
3.4.2. Estimations des paramtres du logit conditionnel

Tout comme dans le cas du modle logit multinomial, plusieurs mthodes peuvent tre utilises pour estimer les paramtres dun modle logit conditionnel : mthodes du maximum
de vraisemblance, mthodes de moments, mthodes non paramtriques et semi-paramtriques.
Nous ntudierons ici que la mthode du maximum de vraisemblance information complte.
La vraisemblance associe un modle logit conditionnel m+1 modalits scrit en fonction
dun vecteur RK de K paramtres.
N
yi,j log [P rob (yi = j)]
log L (y, ) =
i=1 j=0
avec yi,j = 1 si yi = j et 0 sinon, et o les probabilits P rob (yi = j) sont dfinies par :
exp (xi,j )
P rob (yi = j) =
exp xi,j
exp (xi,k )
1+
k=0
k=1
exp xi,k
avec par convention xi,j = xi,j xi,0 .

Proposition 3.12. La log vraisemblance associe un modle logit conditionnel
scrit alors :
N
log L (y, ) =
i=1 j=0
N
yi,j xi,j
=
i=1 j=1
log
i=1
yi,j xi,j
exp (xi,j )
k=0
m
exp xi,j
log 1 +
i=1
k=1
(3.34)
28
avec xi,j = xi,j xi,0 par convention.

En eet, on sait que la log-vraisemblance est dfinie par la relation suivante :
N
log L (y, ) =
yi,j log (pi,j )

i=1 j=0
N
exp xi,j
yi,j log
1+
i=1 j=0
m
k=1
exp xi,j
On en dduit la relation suivante :

N
yi,j xi,j
log L (y, ) =
i=1 j=0
N
=
i=1 j=1
i=1
N
yi,j xi,j
j=0
exp xi,j
k=1
exp xi,j
log 1 +
i=1
yi,j log 1 +
k=1
puisque par construction m

j=0 yi,j = 1 et que xi,0 = 0. On retrouve alors lexpression (3.34)
de la log-vraisemblance. De la mme faon que pour un modle logit multinomial, la fonction
de log-vraisemblance dun modle logit conditionnel est globalement concave.
3.4.3. Exemples de modles logit conditionnel

Un premier exemple de modle logit conditionnel est donn dans ltude de 1976 de McFadden
(prix Nobel 2000). Dans cette tude, pralablement ralise en 1968, McFadden utilise un logit
conditionnel pour analyser la slection des projets autoroutiers faite par la division californienne
des autoroutes (California Division of Highways) pour les districts de San Fransisco et de Los
Angles durant les annes 1958-1966. Lchantillon porte sur N = 65 projets. Le ie`me projet
peut tre choisi parmi mi routes possibles et la probabilit de slection est donne par :
P rob (yi = j) =
exp (xi,j )
mi
exp (xi,k )
j = 0, 1, .., mi
(3.35)
k=0
o xi,j est un ensemble de caractristiques attribues la route j dans le projet i (dure

de trajet, nombre de kilomtre, dicult de construction etc..). Naturellement pour chaque
projet, le nombre de routes possibles dire : do la prsence dun terme mi pour le nombre de
modalits. Naturellement, lensemble des caractristiques xi,j dire avec la nature du projet
mais aussi selon les routes envisages pour ce projet.
McFadden considre deux ensembles de variables explicatives xi,j : un premier ensemble ne
comportant que des variables de cots et de bnfices, le second ensemble regroupe les variables
du premier ainsi que des variables qui expriment les sentiments de la population sur le projet et
le degr selon lequel la population sera aecte par le projet. A chaque ensemble de variables
explicatives, McFadden associe un modle logit conditionnel dirent et le choix du modle est
fait selon le critre de la log-vraisemblance et le critre du nombre de prdictions fausses. Ce que
montre ainsi McFadden cest que pour chaque projet le classement entre les direntes routes
(selon la probabilit de slection pi,j ) dire selon le modle utilis. Suivi que lon ne considre
29
que des variables de cots - bnfices ou des variables lies aux souhaits de la population, les
probabilits aects pour un mme projet aux direntes routes varient.
3.4.4. Applications
********************************************
*** Application Eviews ou Limdep programmer ***
********************************************
3.5. Logit Universel

La dernire catgorie des modles logit multinomiaux est celle du logit universel, qui comme
son nom lindique englobe le logit multinomial indpendant et le logit multinomial conditionnel
de McFadden. Si lon reprend la notation de lutilit stochastique utilise prcdemment, on a
un modle o la probabilit que lindividu i choisisse la modalit j scrit sous la forme :
P rob (yi = j) =
exp [v (xi,j )]
m
(3.36)
exp [v (xi,k )]
k=0
o la fonction v (.) est linaire, les paramtres j dirent selon les modalits et que les variables
explicatives varient uniquement en fonction des individus :
Definition 3.13. Le modle logit multinomial universel (ou logit universel) est obtenu
pour toute fonction v (.) continue dpendant de paramtres j conditionnels aux
modalits et de lensemble des variables explicatives du modle :
v (xi,j ) = v j , xij
(3.37)
La probabilit que lindividu i choisisse la modalit j, j = 0, .., m, est alors dfinie

par :
exp v j , xij
(3.38)
P rob (yi = j) = m
exp v j , xij
k=0
On peut montrer que si les fonctions v j , xij dpendent de lensemble des caractristiques, le modle logit universel ne satisfait pas lhypothse dindpendance des alternatives
non pertinentes (IIA). Lorsque v (.) est linaire dans les paramtres j , on retrouve alors le
modle logit indpendant.
4. Lhypothse dindpendance des alternatives non pertinentes

Tests + modles alternatifs.
4.1. Test de lhypothse IIA
4.2. Modle Alternatifs

4.2.1. Probit multinomial
4.2.2. Logit Hierarchis
cf amemiya
30
31
Bibliographie
Amemiya T. (1981), Qualitative Response Models : A Survey, Journal of Economic Litterature, 19(4), 481-536
Alban T. (2000), Economtrie des Variables Qualitatives, Dunod.
David J.M. et Legg W.E. (1975), An application of Multivariate Probit Analysis to the Demand
for Housing, Journal of Business and Economic Statistics, August 1975, 295-300
Gourieroux C. (1989), Economtrie des Variables Qualitatives, Economica.
Gurland J., Lee I.et Dahm P. (1960), Polytchotomous Quantal Response in Biological Assay,
Biometrics, Sept. 1960, 382-388.
Greene W.H. (1997), Econometric Analysis, Londres, Prentice Hall.
Judge G.G., Miller D.J. et Mittelhammer R.C. (2000), Econometric Foundations, Cambridge
University Press.
Maddala. G.S. (1983), Limited-dependent and Qualitative Variables in Econometrics, Econometric Society Monographs, 3, Cambrige University Press.
McFadden D. (1976), The Revealed Prefrences of a Government Bureaucracy: Empirical Evidence, Bell Journal of Economic Mangament, Spring 1976, 55-72
Spector L.C. et MazzeoMcFadden M. (1980), Probit Analysis and Economic Education, Journal of Economic Education, 11(2), 37-44
Tobin J. (1958), Estimation of Relationships for Limited Dependent Variables, Econometrica,
26, 24-36.

Qualitatif Chapitre2

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Qualitatif Chapitre2

Загружено:

Авторское право:

Доступные форматы

MASTER ECONOMETRIE ET

STATISTIQUE APPLIQUEE (ESA)

Economtrie des Variables Qualitatives

January 21, 2003

Economtrie des Variables Qualitatives. Cours C. Hurlin

La probabilit associe chaque rponse est dfinie par :

Partant de cette dfinition, on peut faire quatre remarques.

Economtrie des Variables Qualitatives. Cours C. Hurlin

3. Dans un modle multinomial, la probabilit associe la mi +1e`me modalit (gnralement

Fij (x, ) i = 1.., N

(mi + 1) variables binaires yij telles que :

Les rsultats gnraux concernant les estimateurs du MV et les proprits asymptotiques

Economtrie des Variables Qualitatives. Cours C. Hurlin

1. Modles Multinomiaux Ordonns

Un modle polytomique univari ordonn peut scrire sous la

avec cj+1 cj et o la variable latente yi est dfini par

avec xi = x1i ..xK

P rob (yi = 1) = P rob (c1 yi < c2 ) = F

De faon gnrale, on obtient le rsultat suivant :

avec par convention c0 = et cm+1 = .

Economtrie des Variables Qualitatives. Cours C. Hurlin

Il ne reste plus alors qu construire la vraisemblance associe lchantillon y comme suit :

o la variable dichotomique yij est dfinie par :

Gnralement seuls les paramtres = / et cj = cj / sont identifiables. La vraisemblance

cj =arg max log L y, , c1 , .., cm

yij log F cj+1 xi F cj xi

o F (.) est une fonction de rpartition donne.

1.1. Exemples de Modles Multinomiaux Ordonns

Economtrie des Variables Qualitatives. Cours C. Hurlin

1.1.1. Dosage dinsecticide : Gurland, Lee et Dahm (1960)

0 si lindividu i est vivant

2 si lindividu i est mort

On suppose que lindividu meurt si et seulement si le dosage de linsecticide dpasse la

P rob (yi = 1) = P rob (xi < yi xi + ) =

P rob (yi = 2) = P rob (yi < xi ) =

o (x) dsigne la fonction de rpartition de la loi normale centre rduite. Naturellement,

Economtrie des Variables Qualitatives. Cours C. Hurlin

1.1.2. Acquisition dun bien immobilier : David et Legg (1975)

0 si le prix du bien i acquis est infrieur $28,999

2 si le prix du bien i acquis est suprieur $55,000

David et Legg (1975) proposent de modliser la variable polytomique yi = 0, 1, 2 selon

o la variable latente yi est distribue selon une loi normale N xi , 2 , o le vecteur xi

Ds lors, la log-vraisemblance de lchantillon est dfinie par la fonction :

Economtrie des Variables Qualitatives. Cours C. Hurlin

Economtrie des Variables Qualitatives. Cours C. Hurlin

Economtrie des Variables Qualitatives. Cours C. Hurlin

Figure 1.2: Estimation dun Probit Ordonn

On obtient ainsi des ralisations c1 = 3.645, c2 = 2.725 et c3 = 1.61. On peut alors

o c1 est un estimateur convergent de c1 et o est un estimateur convergent de . Ainsi dans

= 0.068 5.24 6.138 0.0559 11.273 0.250

1.7245 0.3982 + 0.7685 0 + 10.748 0.0120

Economtrie des Variables Qualitatives. Cours C. Hurlin

Economtrie des Variables Qualitatives. Cours C. Hurlin

2. Modles Multinomiaux Squentiels

= [1 F1 (xi )] [1 F2 (xi )] F3 (xi )

[1 Fs (xi )] F2 (xi ) = [1 F1 (xi )] F2 (xi )

Economtrie des Variables Qualitatives. Cours C. Hurlin

Economtrie des Variables Qualitatives. Cours C. Hurlin

3. Modles Multinomiaux Non Ordonns

Economtrie des Variables Qualitatives. Cours C. Hurlin

....., U (xj , j ) > U (xk , k ) , ....., U (xj , j ) > U (xm , m )}

Prenons par exemple la probabilit que lagent choisisse la modalit 0 :

....., U (x0 , 0 ) > U (xk , k ) , ....., U (x0 , 0 ) > U (xm , m )}