Академический Документы
Профессиональный Документы
Культура Документы
Christophe Hurlin
Polycopi de Cours
Master Economtrie et Statistique Applique (ESA)
Universit dOrlans
Facult de Droit, dEconomie et de Gestion
Bureau A 224
Rue de Blois BP 6739
45067 Orlans Cedex 2
www.univ-orleans.fr/deg/masters/ESA/
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
5
6
7
8
12
13
14
14
17
18
21
24
25
25
26
27
28
29
29
30
30
30
30
30
Introduction
Nous allons prsent envisager le cas des modle multinomiaux, ou plus prcisment des
modles variable explique qualitative multinomiale (ou polytomique). Ce sont des modles
dans lesquels la variable explique peut prendre plus de deux modalits1 . Nous allons voir quil
existe trois catgories de modles multinomiaux :
1. Modles multinomiaux ordonns
2. Modles multinomiaux squentiels
3. Modles multinomiaux non ordonns
Dans la pratique, les modles non ordonns sont les plus frquents, cest pourquoi nous
leur accorderons une attention toute particulire. Dans cette catgorie, on trouve notamment
le modle logit multinomial et le modle logit conditionnel de McFadden qui sont
les modles les plus utiliss et qui constituent une extension du logit binaire tudi dans le
chapitre prcdent. Nous verrons toutefois, que si ces modles sont simples utiliser, ils posent
toutefois un problme de cohrence en raison dun proprit peu raliste dindpendance des
tats non pertinents. Cest pourquoi, des modles alternatifs ont t dvelopps comme le
modle logit hierarchis ou le modle probit multinomial. Ces derniers requirent toutefois
des techniques destimation relativement complexes.
Commenons par dcrire le cadre gnral de ces modles multinomiaux.
Definition 0.1. On considre un modle multinomial dans le lequel la variable dpendante qualitative observe pour le ie`me individu i = 1, .., N , note yi , peut prendre
mi + 1 modalits indices j = 0, 1, 2, .., mi , supposes mutuellement exclusives pour
chaque individu i :
mi +1
P rob (yi = j) = 1
j=0
i = 1, .., N
(0.1)
(0.2)
lintroduction du premier chapitre pour la dfinition gnrale des modles variable qualitative.
P rob (yi = 0) = 1
Si lon dfinit
N
i=1
j=1
yij =
1
0
si yi = j
sinon
i = 1.., N j = 0, 1, .., mi
(0.3)
alors on peut crire la vraisemblance associ lchantillon y = (y10 , ...., y1m1 , ..., yN 0 , ...., yN mN )
comme le produit des probabilits associes aux direntes modalits, et ceci pour tous les
individus :
N
mi
yij
Fij (x, )
L (y, ) =
(0.4)
i=1 j=0
si yi < c1
0
1
si c1 yi < c2
i = 1.., N
(1.1)
yi =
...
...
m si yi > cm
(1.2)
c2
xi
xi
c1
...
P rob (yi = m) = P rob (yi > cm ) = 1 F
cm xi
P rob (yi = j) = F
mi
yij
L (y, , c1 , .., cm , ) =
P rob (yi = j)
i=1 j=0
N
mi
cj+1 xi
F
i=1 j=0
xi
cj
yij
(1.3)
1
0
si yi = j
sinon
i = 1.., N j = 0, 1, .., m
mi
L y, , c1 , .., cm =
i=1 j=0
F cj+1 xi F cj xi
yij
(1.4)
On vrifie en outre que le vecteur xi ne peut contenir de constante pour les mmes raison
didentification qui avaient t voques dans le cas du modle dichotomique en ce qui concerne
la normalisation du seuil . On ne peut identifier la fois le paramtre associ la constante
et les seuils cj .
Il ny a alors aucune dicult technique maximiser la fonction de log-vraisemblance en
, c1 , ..et cm pour obtenir les estimateurs du maximum de vraisemblance dont les proprits sont
identiques celles tudies dans le modle dichotomique univari, si ce nest que lon estime en
outre les paramtres de seuil cj :
=arg max log L y, , c1 , .., cm
{ }
(1.5)
(1.6)
{cj }
avec
log L y, , c1 , .., cm =
i=1 j=0
(1.7)
0 si yi > xi +
1 si xi < yi xi +
(1.8)
yi =
2 si yi xi
Les probabilits associes au trois modalits sont donc gales :
P rob (yi = 0) = P rob (yi > xi + ) = 1
xi +
xi +
xi
xi
xi
dans ce modle, lestimation des probabilits P rob (yi = 0) et P rob (yi = 2) permet didentifier
les trois paramtres structurels , et . Notre bio-conomtre connat alors la distribution de
la tolrance yi des insectes et le seuil dinsecticide.
0 si yi < c1
1 si c1 yi < c2 i = 1.., N
yi =
(1.10)
2 si yi > c2
c1
xi
c2
xi
c1
xi
c2
c2
xi
= + xi
log L (y, , c1 , c2 , ) =
yi0 log
i=1
+yi2 log
c1
xi
+ yi1 log
c2
xi
c1
xi
c2
+ xi
Ce qui peut scrire sous une forme log-linaire dans les paramtres :
N
log L y, , c1 , c2
=
i=1
yi0 log c1 xi
+yi2 log c2 + xi
+ yi1 log c2 xi c1 xi
(1.11)
avec x = x/. La procdure du maximum de vraisemblance fournit alors une estimation pour
les K + 2 paramtres , c1 et c2 . Ds lors, on ne peut pas dans ce cas identifier la variance
du fait de la normalisation impose par le choix de la distribution normale. Par consquent
lestimation de ce modle ne permet pas didentifier les paramtres de seuil c1 et c2 et les
paramtres , mais seulement les transformes , c1 et c2 . Ceci na pas dimportance ds lors
que lon sintresse uniquement aux eets marginaux des variables xi sur la probabilit dacheter
des biens immobiliers appartenant aux trois catgories. On peut par exemple calculer limpact
de la taille du logement sur la probabilit dacheter un logement dont le prix est infrieur
$28,999 et comparer celle-ci avec limpact de la taille du logement sur la probabilit dacheter
un logement dont le prix est suprieur $55,000. En eet, on peut calculer 3 N K drives
suivantes :
P rob (yi = j)
i = 1.., N, j = 0, 1, 2 k = 1.., K
[k]
xi
Dans cette tude, tout comme dans les modles multinomiaux en gnral, il y a finalement
plusieurs faons dinterprter la variable latente yi .
Remarque Dans un modle multinomial, il ny a gnralement aucune ncessit de
donner un nom et dexpliquer rellement ce quest la variable latente yi . Peu
importe ce quelle reprsente, il sut juste de supposer que cest une variable
continue qui aecte la variable polytomique observe yi . Le fait de nommer
yi permet simplement de faciliter la justification conomique du choix des
variables explicatives xi .
Dans le cas prsent de ltude David et Legg (1975), on peut dire que la variable latente yi
correspond au prix du bien immobilier. Dans ce cas, si cette variable est par ailleurs observable,
il aurait t prfrable au lieu destimer les probabilits, destimer directement la relation entre
le prix du bien et les caractristiques xi observes. Mais rien ne nous contraint dans le fait
dassimiler yi au prix des biens : cette variable inobservable yi peut reprsenter nimporte
quelle grandeur conomique susceptible daecter lachat de biens des trois catgories de prix et
qui elle mme dpend des variables xi (taille du logement, revenu et ge de lacqureur etc..).
Ce peut tre par exemple, la disponibilit payer le bien immobilier.
1.2. Application
On considre une application tire dune tude de J. Gunther de la Federal Reserve Bank de
Dallas, intitule Between a Rock and a Hard Place : The CRA-Safety and Soundness Pinch.
Le fichier de donnes disponible sur le sitye web (??) est intitul Gunther.xls. Cette tude porte
sur le Community Reinvestment Act (CRA), loi promulgu aux Etats Unis en 1977 et visant
encourager les institutions de dpts (banques et autres institutions financires) rpondre
aux besoins en crdit des communauts dans lesquelles elles oprent2 . Toutes les banques sont
ainsi values par des instances de contrle qui sont les suivantes : Oce of the Comptroller
of the Currency (OCC), Board of Governors of the Federal Reserve System (FRB), Oce of
Thrift Supervision (OTS), and Federal Deposit Insurance Corporation (FDIC). En eet, la loi
recquiert que les agences de contrle mentionnes, valuent rgulirement les performance des
institutions au regard des objectifs du CRA.
2 Pour
un
historique
et
une
http://www.ec.gov/cra/history.htm.
prsentation
plus
global
du
CRA,
consulter
le
site
La performance des institutions en ce qui concerne le fait de favoriser les besoins en crdit
de la communaut est valu dans le contexte des informations disponibles sur cette institution
(capacits, contraintes diverses, stratgie..), des informations sur la communaut (dmographie,
donnes conomiques, prts, investissements..) et des informations sur ses concurrents et sur
ltat du march. Une notation (ou rating) est alors attribu selon quatre modalit : yi = 1 pour
performance remarquable, yi = 2 pour performance satisfaisante,; yi = 3 pour performance
amliorer, yi = 4 pour performance dplorable.
Ltude de Gunther porte sur 350 observations de ces rating et propose de modliser ces
ratings en fonction de plusieurs variables explicatives intitules respectivement loa, prl, equ,
roa, sec, ass, metro et growth. La variable loa dsigne le ratio prts sur actif total de la
banque, la variable prl dsigne le ratio actifs douteux sur actif total, la variable equ dsigne le
ratio capitaux propres sur actif, la variable roa dsigne le ratio dividende sur actifs, la variable
sec dsigne le ratio investissements de valeurs sur actifs, la variable ass le logarithme de lactif
de la banque, la variable metro prend une valeur 1 si la banque son sige dans une MSA ()
et 0 sinon, et enfin la variable growth dsigne le taux de croissance du Pib de ltat dans lequel
la banque opre. Dans le tableau ci dessous sont reproduit les valeurs ces direntes variables
pour les 10 premiers individus de lchantillon.
Figure 1.1:
Nous allons prsent modliser le rating sous la forme dun probit ordonn. En eet, dans ce
cas prcis, les valeurs prises par la variable multinomiale peuvent correspondre des intervalles
dans lesquels va se trouver une variable latente inobservable. On a ici un ordre naturel sur
les modalits allant de la satisfaction la plus complte au regard des objectifs du CRA la
performance dplorable. Pour modliser ce probit ordonn sous Eviews, on choisit Estimate
Equation dans le menu Quick, et lon retient la mthode ORDERED - Ordered Choice avec
une Error Distribution de type Normal. On indique ensuite la variable polytomique ainsi que
les variables explicatives, la constante ne pouvant tre introduite pour une raison de colinarit.
Les coecients des variables roa et sec sont alors non significativement dirents de zro. On
retire donc ces variables et les rsultats obtenus pour le probit ordonns sont alors les suivants
:
On observe cette fois que toutes les variables sont significatives de mme que les trois seuils
10
c1 , c2 et c3 tels que :
2
yi =
3
si
si
si
si
yi < c1
c1 yi < c2
c2 yi < c3
yi > c3
i = 1.., N
yi = xi + i
(1.12)
(1.13)
= 3.359
11
Ds lors, on a :
^
P
rob (y1 = 1) = c1 x1
(3.645 + 3.359)
(0. 286)
0.387
De la mme faon, on peut calculer pour cette banque la probabilit que yi = 2 :
P^
rob (y1 = 2) = c2 x1 c1 x1
(2.725 + 3.359) (0. 286)
(0. 634) 0.387
0.736 0.387
0. 349
Ainsi pour tous les individus on peut calculer les probabilits associes aux quatre modalits.
On obtient les rsultats suivants pour les dix premiers individus :
Figure 1.3: Probabilits Estimes du Probit Ordonn
12
P rob (yi = j) =
s=1
[1 Fs (xi )] Fj (xi )
(2.1)
Lexemple typique est celui de la russite aux examens, qui est bien entendu conditionne
par la russite aux examens antrieurs dans le cursus. Considrons lexemple de la russite au
master. On cherche modliser la probabilit quun tudiant obtienne son Master en fonction
de caractristiques individuelles, comme le revenu moyen des parents, la moyenne des notes
au baccalaurat, la srie du baccalaurat etc.. On note yi = 1 si le ie`me tudiant a obtenu le
baccalaurat mais pas la licence, yi = 2 si ltudiant a obtenu la licence mais pas le master et
yi = 3 si ltudiant a obtenu le master. Naturellement, la probabilit associe lobtention du
master scrit :
2
P rob (yi = 3) =
s=1
[1 Fs (xi )] F3 (xi )
P rob (yi = 2) =
s=1
La probabilit que les individus nobtiennent pas leur baccalaurat, cest dire que yi = 1,
est calcule en utilisant tout lchantillon constitu des deux sous groupes : les tudiants ayant
obtenu le baccalaurat et ceux qui ont chou (yi = 0 non modlise). On utilise ensuite le sous
chantillon des tudiants ayant obtenu le baccalaurat pour dterminer les caractristiques de
la probabilit dobtenir la licence yi = 2. Et enfin, on utilise le sous chantillon des tudiants
ayant obtenu la licence pour dterminer les caractristiques de la probabilit dobtenir le master
yi = 3.
13
2.1. Application
**************************
***** Application Eviews ****
**************************
cf. Ordered Models
- Chandek, Meghan Stroshine (1999). Race, expectations and evaluations of police performance: An empirical assessment. Policing 22(4):675
- http://faculty.smu.edu/tfomby/eco6352/data/
14
j = 0, 1, .., m
(3.1)
15
o v (.) est une fonction continue dterministe et o j est une variable alatoire i.i.d. dont la loi
est dcrite par la fonction de densit f (.) et la fonction de rpartition F (.) . On suppose que
les perturbations j , j = 0, 1, .., m sont indpendantes. Ainsi lutilit alatoire associe
la j e`me modalit dpend des caractristiques propres cette modalit
On dfinit une variable polytomique y qui prend m + 1 modalits suivant les choix de
lindividu :
y = j si lindividu choisit la j e`me modalit j = 0, 1, .., m
Ds lors, la probabilit que notre individu choisisse la modalit j correspond la probabilit
que cette modalit lui confre un niveau dutilit suprieure toutes les autres modalits qui
sorent lui. En eet, la probabilit que lindividu choisisse la modalit j est dfinie par :
P rob (y = j) = P rob {U (xj , j ) > U (x0 , 0 ) , U (xj , j ) > U (x1 , 1 ) ,
(3.2)
(a, b, c, d) R4 P (a X b, c Y d) =
fX,Y (x, y) dy dx
a
(3.3)
fX,Y (x, y) dy dx = 1
(3.4)
La fonction de distribution cumulative jointe, note FX,Y (x, y) est alors dfinie par,
(a, b) R2 :
FX,Y (a, b) = P (X a, Y b) =
fX,Y (x, y) dy dx
(3.5)
16
selon une loi de distribution f (.) , et si lon note vj = v (xj ) , la probabilit P rob (y = 0) peut
scrire sous la forme :
m
P rob (y = 0) =
P rob [k < v0 vk + 0 ] f (0 ) d0
k=1
v0 v1 +0
v0 vm +0
..
v0 v2 +0
f (1 ) d1
f (m ) dm
f (2 ) d2 ..
f (0 ) d0
En dautres termes, si lon note F (.) la fonction de rpartition associe la loi des perturbations j , on a:
k=1
P rob (y = 0) =
F [v (x0 ) v (xk ) + 0 ] f (0 ) d0
P rob (y = j) =
k=0
k=j
F [v (xj ) v (xk ) + j ] f (j ) dj
(3.6)
Supposons prsent que la loi des perturbations soit une loi de Gompertz3 :
F (z) = exp [ exp (z)]
(3.7)
(3.8)
Alors, il est possible de donner une expression analytique la probabilit que lagent choisisse
la modalit 0.
P rob (y = 0) =
k=1
exp
k=1
******************************
*** FINIR DEMONSTRATION ***
******************************
Finalement, on montre que :
P rob (y = 0) =
exp [v (x0 )]
m
exp [v (xk )]
1+
k=0
k=1
avec par convention v (x0 ) = 0. De faon gnrale, la probabilit que lindividu choisisse la
modalit j est dfinie par :
exp [v (xj )]
(3.9)
P rob (y = j) = m
exp [v (xk )]
k=0
3 Dite
17
Or, si lon se restreint une classe des fonctions v (.) anes, avec v (xj ) = j xj ,
cette formulation de la probabilit associe la j e`me modalit est prcisment la
modlisation de la probabilit que lon retiendra dans les modles logit multinomiaux non ordonns.
Considrons prsent le cas o lon dispose dun ensemble de N individus indics i = 1, .., N
ayant les mmes prfrences que lindividu de rfrence de lexemple prcdent. De la mme
faon sous les hypothse dindpendance des perturbations j et sous une hypothse particulire
sur la distribution des ces perturbations, on montre que la probabilit que lindividu i choisisse
la modalit j, j = 0, .., m, est dfinie par :
P rob (yi = j) =
exp [v (xi,j )]
exp [v (xi,k )]
m
k=0
(3.10)
(3.11)
(3.13)
18
exp xi j
exp xi j
exp (xi k )
(3.14)
1+
k=0
exp (xi k )
k=1
exp (xi k )
1+
k=0
(3.15)
exp (xi k )
k=1
P rob (yi = 1) =
[2]
exp 1 + 1 ri
[1]
[2]
[1]
[2]
[1]
[2]
1 + exp 1 + 1 ri + exp 2 + 2 ri
[1]
P rob (yi = 2) =
[2]
exp 2 + 2 ri
[1]
[2]
1 + exp 1 + 1 ri + exp 2 + 2 ri
[2]
exp xi j
m
exp (xi k )
k=0
19
cette normalisation ne soit pas impose a priori. On obtient alors une expression quivalente
la probabilit (3.14) en divisant les deux membres de la probabilit par exp ( 0 xi ) :
P rob (yi = j) =
exp xi j 0
k=0
exp [xi ( k 0 )]
exp xi j
m
exp xi j
exp (xi k )
1+
k=0
(3.16)
exp (xi k )
k=1
m
j xi
P rob (yi = j) =
exp (xi k )
k=0
1+
k=0
k=j
(3.17)
exp xi k j
1
1 + exp [xi ( 1 0 )] + exp [xi ( 2 0 )]
1
1 + exp [xi ( 0 1 )] + exp [xi ( 2 1 )]
1
P rob (yi = 2) =
1 + exp [xi ( 0 2 )] + exp [xi ( 1 2 )]
P rob (yi = 1) =
20
La seconde proprit centrale dans lanalyse des modles logit multinomiaux concerne les
ratio de probabilits pj /pk o j et k sont deux modalits distinctes. En eet, on montre la
proprit suivante :
Proposition 3.5. Dans le cas dun modle logit multinomial, le rapport des probabilits associs deux modalits j et k distinctes, j = 0, .., m et k = 0, .., m, scrit
sous la forme :
exp xi j
P rob (yi = j)
pj
=
=
= exp xi j k
pk
P rob (yi = k)
exp (xi k )
(3.18)
0
1
(3.19)
La probabilit que lagent prenne le mtro demeure pm = p0 et reste un niveau inchang par
rapport au cas prcdent tant donn les nouvelles alternatives proposes. Si lon admet que
la couleur du bus a vraisemblablement peu de chance daecter le choix du mode de transport,
on doit avoir que les probabilits de slection p1 et p2 doivent tre gales :
P rob (yi = 1) = P rob (yi = 2)
(3.20)
21
avec yi,j = 1 si yi = j et 0 sinon, et o les probabilits P rob (yi = j) sont dfinies par :
P rob (yi = j) =
exp xi j
exp xi j
=
exp (xi k )
1+ m
k=1 exp (xi k )
m
k=0
P rob (yi = 0) =
avec 0 par convention.
1+
1
exp (xi k )
m
k=1
22
yi,j xi j
log 1 +
i=1
exp (xi k )
(3.21)
k=1
yi,j log
=
i=1 j=0
m
k=1
exp xi j
1+ m
k=1 exp (xi k )
i=1 j=0
yi,j xi j
i=1
j=0
yi,j
yi,j xi j =
i=1 j=0
Hi
yi,j xi j
i=1 j=1
En eet, on sait que la variable yi ne peut prendre quune seule et mme valeur parmi les m + 1
modalits, ds lors m
j=0 yi,j = 1. Ainsi, on obtient que :
i=1
Puisque en eet
Hi
N
i=1
j=0
yi,j =
Hi =
i=1
log 1 +
i=1
exp (xi k )
k=1
yi,j xi j
log 1 +
i=1
exp (xi k )
k=1
On retrouve alors lexpression (3.21) de la log-vraisemblance. Notons au passage que la fonction de log-vraisemblance dun modle logit multinomial indpendant est globalement concave5 et que par consquent on peut utiliser dirents algorithmes doptimisation
numrique propres ce type de problme (Newton Raphson par exemple) et que les rsultats
ne sont pas sensibles au choix des conditions initiales de ces algorithmes.
5 La
23
Definition 3.7. Le gradient associ la log-vraisemblance dun modle logit multinomial est dfini z = 1, .., m :
log L (y, 1 , 2 , ..., m )
=
z
i=1
(yi,z pi,z ) xi
(3.22)
N m
yi,j xi j
z i=1 j=1
z
N
=
i=1
yi,z xi
i=1
log 1 +
i=1
exp (xi k )
k=1
exp (xi z )
xi
m
k=1 exp (xi k )
1+
i=1
yi,z xi
pi,z xi =
i=1
i=1
(yi,z pi,z ) xi
On retrouve naturellement la mme expression que dans le cas du modle logit bivari. De
la mme faon, la matrice hessienne est dfinie par :
N
(3.23)
pi,z [k]
(3.24)
i,j
z
j
[k]
xi
z=0
[k]
[k]
exp xi j
z=0
exp (xi z )
=
=
=
[k]
xi
exp xi j
2
[k]
xi
H (xi ) exp xi j
H (xi )
[k]
xi
m
1
H (xi )
m
z=0
exp xi j
H
1
H (xi )
(3.25)
[k]
[k]
z exp (xi z )
z=0
24
En simplifiant cette expression, on fait apparatre les probabilits pi,j = exp xi j /H, et
on trouve :
pi,j
[k]
xi
exp xi j
H (xi )
[k]
j
exp xi j
[k]
z
z=0
exp (xi z )
H
m
[k]
= j pi,j pi,j
[k]
z pi,z
z=0
On retrouve ainsi lexpression (3.24) des eets marginaux. Il convient de remarquer que,
[k]
pour chaque individu, pour une variable explicative quelconque xi , on doit calculer m + 1
eets marginaux associs aux probabilits pi,j pour j = 0, 1, .., m.
Dans le cas dun modle dichotomique deux modalits (m = 1), on retrouve videmment
la formule propose dans le premier chapitre. En eet, nous avions vu que pour un modle logit
univari :
exi
pi
=
(3.26)
2 k
[k]
(1 + exi )
xi
Selon la formule (3.24), dans un modle 2 modalits on doit avoir
pi,1
[k]
xi
[k]
[k]
[k]
avec pi,1 = P rob (yi = 1) et pi,0 = P rob (yi = 0) = 1 pi,1 et pi,1 = exi / 1 + exi . Par
[k]
[k]
[k]
[k]
normalisation, on pose 0 = 0, k, ds lors, il vient pi,1 /xi = pi,1 1 p2i,1 1 ou encore :
pi,1
[k]
xi
[k]
= 1
exi
1 + exi
exi
1 + exi
2
[k]
= 1
exi
2
(1 + exi )
On retrouve naturellement la formule propose dans le cadre du premier chapitre pour le modle
logit dichotomique.
(3.27)
25
en utilisant les mmes variables explicatives que dans leurs premires estimations. Dans leur
modle les variables xi,j sont indpendantes des modalits (xi,j = xi ) et les coecients j
varient avec les modalits. On a vu que gnralement lorsque la variable latente yi
est continue, distribue selon une loi normale et observable, il est prfrable de
rgresser directement yi sur un ensemble de variables explicatives plutt que de
vouloir modliser les probabilits que yi tombe dans certains intervalles. Pourtant,
si yi est distribue selon une loi inconnue et non normale qui dpend de xi dune faon plus
complique quun simple problme de localisation dans un intervalle, la procdure de Perlo et
Watcher peut donner de meilleurs rsultats que les M CO de yi sur xi .
****************************************
*** Chercher dautres applications sur EconLit **
****************************************
3.3. Application
********************************************
*** Application Eviews ou Limdep programmer ***
********************************************
exp [v (xi,j )]
(3.28)
exp [v (xi,k )]
k=0
o la fonction v (.) est linaire, les paramtres j dirent selon les modalits et que les variables
explicatives varient uniquement en fonction des individus :
v (xi,j ) = xi j
(3.29)
Une alternative ce modle logit multinomial consiste supposer quau contraire les
paramtres sont indpendants des modalits et que ce sont les variables explicatives qui dirent selon les modalits et les individus :
v (xi,j ) = xi,j
(3.30)
On obtient alors, un modle logit multinomial conditionnel (ou logit conditionnel) introduit par McFadden (1973). La dfinition dun modle logit conditionnel est ainsi
la suivante :
Definition 3.9. Dans un modle logit conditionnel, la probabilit que lindividu i
choisisse la modalit j, j = 0, .., m, est dfinie par :
P rob (yi = j) =
exp (xi,j )
m
exp (xi,k )
k=0
exp xi,j
1+
k=1
exp xi,k
(3.31)
26
(3.32)
Pm+1 =
1+
k=1
(3.33)
27
pour lindividu i. Le modle donne alors la probabilit quun individu caractris par des temps
relatifs (ti,1 , ti,2 , ti3 ) et des cots (ci,1 , ci,2 , ci3 ) choisisse le mode de transport j = 1, 2, 3. La
probabilit que lindividu i choisisse le bus est par exemple gale :
exp ( 0 + 1 ti,1 + 2 ci,1 )
P rob (yi = 1) =
1+
exp xi,1
1+
k=1
avec = ( 0 1 2 ) et
xi,j
k=1
exp xi,k
= (1 ti,j ci,j ) .
Comme le mode de transport mtro (modalit 4) nexiste pas encore, les variables de temps
de trajet ti,4 et de cot ci,4 ne sont pas disponibles. Mais elles peuvent tre simules partir
dune valuation du temps de trajet du mtro et du cot au kilomtre de ce mode de transport
dans dautres villes. Soient ti,4 et ci,4 les valuations correspondantes. Si lon dispose en outre
dun estimateur convergent du vecteur de paramtres , on peut alors calculer la probabilit
quun individu i prenne le mtro lorsque celui-ci sera eectivement mis en place :
exp 0 + 1 ti,4 + 2 ci,4
P^
rob (yi = 4) =
1+
Cela donne la probabilit que lindividu i choisisse le mtro plutt que les autres modes de
transport.
log L (y, ) =
i=1 j=0
avec yi,j = 1 si yi = j et 0 sinon, et o les probabilits P rob (yi = j) sont dfinies par :
exp (xi,j )
P rob (yi = j) =
exp xi,j
exp (xi,k )
1+
k=0
k=1
exp xi,k
log L (y, ) =
i=1 j=0
N
yi,j xi,j
=
i=1 j=1
log
i=1
yi,j xi,j
exp (xi,j )
k=0
m
exp xi,j
log 1 +
i=1
k=1
(3.34)
28
log L (y, ) =
exp xi,j
yi,j log
1+
i=1 j=0
m
k=1
exp xi,j
yi,j xi,j
log L (y, ) =
i=1 j=0
N
=
i=1 j=1
i=1
N
yi,j xi,j
j=0
exp xi,j
k=1
exp xi,j
log 1 +
i=1
yi,j log 1 +
k=1
exp (xi,j )
mi
exp (xi,k )
j = 0, 1, .., mi
(3.35)
k=0
29
que des variables de cots - bnfices ou des variables lies aux souhaits de la population, les
probabilits aects pour un mme projet aux direntes routes varient.
3.4.4. Applications
********************************************
*** Application Eviews ou Limdep programmer ***
********************************************
exp [v (xi,j )]
m
(3.36)
exp [v (xi,k )]
k=0
o la fonction v (.) est linaire, les paramtres j dirent selon les modalits et que les variables
explicatives varient uniquement en fonction des individus :
Definition 3.13. Le modle logit multinomial universel (ou logit universel) est obtenu
pour toute fonction v (.) continue dpendant de paramtres j conditionnels aux
modalits et de lensemble des variables explicatives du modle :
v (xi,j ) = v j , xij
(3.37)
On peut montrer que si les fonctions v j , xij dpendent de lensemble des caractristiques, le modle logit universel ne satisfait pas lhypothse dindpendance des alternatives
non pertinentes (IIA). Lorsque v (.) est linaire dans les paramtres j , on retrouve alors le
modle logit indpendant.
30
31
Bibliographie
Amemiya T. (1981), Qualitative Response Models : A Survey, Journal of Economic Litterature, 19(4), 481-536
Alban T. (2000), Economtrie des Variables Qualitatives, Dunod.
David J.M. et Legg W.E. (1975), An application of Multivariate Probit Analysis to the Demand
for Housing, Journal of Business and Economic Statistics, August 1975, 295-300
Gourieroux C. (1989), Economtrie des Variables Qualitatives, Economica.
Gurland J., Lee I.et Dahm P. (1960), Polytchotomous Quantal Response in Biological Assay,
Biometrics, Sept. 1960, 382-388.
Greene W.H. (1997), Econometric Analysis, Londres, Prentice Hall.
Judge G.G., Miller D.J. et Mittelhammer R.C. (2000), Econometric Foundations, Cambridge
University Press.
Maddala. G.S. (1983), Limited-dependent and Qualitative Variables in Econometrics, Econometric Society Monographs, 3, Cambrige University Press.
McFadden D. (1976), The Revealed Prefrences of a Government Bureaucracy: Empirical Evidence, Bell Journal of Economic Mangament, Spring 1976, 55-72
Spector L.C. et MazzeoMcFadden M. (1980), Probit Analysis and Economic Education, Journal of Economic Education, 11(2), 37-44
Tobin J. (1958), Estimation of Relationships for Limited Dependent Variables, Econometrica,
26, 24-36.