Proba2-Version 1 PDF

Notes du cours de Probabilits 2 - Licence MMIA Version 1 (dcembre 2008) Christian Lonard
Dpartement de mathmatiques et informatique, Universit Paris Ouest. Nanterre. E-mail address: leonard@u-paris10.fr
Rsum. Cette version des notes du cours de Proba 2 nest pas dnitive. En particulier, il manque des chapitres sur lindpendance de plus de deux variables, les convergences et les principaux thormes limites. Si vous trouvez des erreurs ou si vous souhaitez me soumettre des critiques ou des suggestions damlioriation, nhsitez pas men faire part.
Table des matires

Chapitre 1. Fondements 1.1. vnements 1.2. Probabilit Chapitre 2. Variables alatoires 2.1. Fonction de rpartition 2.2. Variables alatoires discrtes 2.3. Variables alatoires continues 2.4. Quelques lments de rexion Chapitre 3. Loi et esprance dune variable alatoire 3.1. Variables discrtes 3.2. Variables continues 3.3. Une notation commune 3.4. Fonction indicatrice densemble 3.5. Variance et cart-type 3.6. Moments 3.7. Fonctions dune variable alatoire 3.8. Egalit en loi 3.9. Dnition abstraite de la loi dune variable alatoire Chapitre 4. Variables alatoires usuelles 4.1. Exemples de variables alatoires discrtes 4.2. Exemples de variables alatoires continues Chapitre 5. Fonctions gnratrices et caractristiques 5.1. Le cas des variables entires 5.2. Fonctions caractristiques Chapitre 6. Couples alatoires 6.1. Lois jointe et marginales 6.2. Fonction de rpartition 6.3. Indpendance 6.4. Couples discrets 6.5. Couples continus 6.6. Fonctions caractristiques 6.7. Ingalit de Cauchy-Schwarz Chapitre 7. Fonctions dun couple alatoire 7.1. Quelques exercices corrigs 7.2. Somme de deux variables alatoires indpendantes
v
1 1 3 7 8 11 12 15 17 17 21 23 24 24 25 26 27 29 31 31 33 41 41 43 47 47 47 49 51 54 58 59 61 61 62
vi
TABLE DES MATIRES
Chapitre 8. Conditionnement 8.1. Probabilit conditionnelle 8.2. Conditionnement dans le cas discret 8.3. Conditionnement dans le cas continu Chapitre 9. Indpendance Chapitre 10.1. 10.2. 10.3. 10. Construction dune variable alatoire relle gnrale Construction dune variable alatoire continue uniforme Construction dune variable alatoire relle gnrale Principe de la simulation dune variable alatoire Convergence des variables alatoires Ingalits de convexit
65 65 66 67 71 73 73 75 77 81 83 85 89 93 97
Chapitre 11. Chapitre 12.
Annexe A. Dnombrabilit Annexe B. Esprance mathmatique sans thorie de lintgration Annexe C. Elments de thorie de lintgration Annexe D. Convexit
CHAPITRE 1
Fondements
1.1. vnements Nous commenons par prsenter les fondements axiomatiques de la thorie des probabilits. Dfinition 1.1. Lensemble des ralisations possibles dune exprience est appel univers de lexprience. Il est gnralement not . Exemple 1.2. On tire une fois pile ou face. Il est naturel de considrer = {p, f } o p et f sont les ralisations de lexprience qui correspondent aux tirages respectifs de pile et de face. Voici quelques vnements : (a) la ralisation est face (b) la ralisation est face ou pile (c) la ralisation est face et pile simultanment (d) la ralisation nest pas face Ces vnements peuvent tre dcrits respectivement par les parties A de suivantes : (b) A = {f } {p} = {f, p} = (d) A = {f }c = {p} (c) A = {f } {p} = (a) A = {f }
o Ac dsigne le complmentaire de la partie A dans . Exemple 1.3. On lance un d une fois. Il est naturel de considrer = {1, 2, 3, 4, 5, 6} dont les lments correspondent aux direntes facettes du d. Voici quelques vnements : (a) la ralisation est 1 (b) la ralisation est un nombre pair (c) la ralisation est un nombre pair infrieur 3 (d) la ralisation nest pas un nombre pair Ces vnements peuvent tre dcrits respectivement par les parties A de suivantes : (b) A = {2, 4, 6} (a) A = {1}
(d) A = {2, 4, 6}c = {1, 3, 5}
(c) A = {2, 4, 6} {1, 2, 3} = {2}

1
1. FONDEMENTS
Si A et B sont des vnements qui correpondent respectivement aux ralisations eectives a et b, on peut avoir besoin de considrer les vnements composs : a b non a a et b a mais pas b a ou b a ou bien b o A \ B = A B c est la dirence A moins B, cest--dire lensemble des lments qui se trouvent dans A mais pas dans B; AB = (A B) \ (A B) est la dirence symtrique de A et B, cest--dire lensemble des lments qui se trouvent soit dans A, soit dans B, mais pas simultanment dans A et B. B A\B A B Ac AB A\B AB AB
AB
B\A
La rgion colore est AB = (A \ B) (B \ A). Remarquons la dirence entre ou bien qui est exclusif et ou qui ne lest pas et correspond la runion A B. Si A B = , on dit que les vnements sont incompatibles, est lvnement impossible et est lvnement certain. Lensemble de tous les vnements est not A, il est inclus dans lensemble de toutes les parties de note 2 . Cette notation est justie par lexercice suivant. Exercice 1.4. En considrant lensemble des applications {oui, non} de dans {oui, non}, montrer que lorsque le cardinal de est n, celui de 2 est 2n .
Lorsque nest pas un ensemble dnombrable (voir la Dnition A.1), pour des raisons subtiles (qui ne sont pas aisment comprhensibles au niveau de ce cours) on ne pourra pas en gnral prendre A = 2 ; ce sujet on peut jeter un coup dil la Remarque 2.24. Compte tenu de ce qui prcde, A doit au moins satisfaire : (1) A, B A = A B A et A B A
1.2. PROBABILIT
(2) A A = Ac A Exemple 1.5. On rpte notre lancer de pile ou face jusqu ce quon obtienne pile. Lunivers est alors = {1 , 2 , . . .} avec 1 = p, 2 = f p, 3 = f f p, . . . La ralisation i est : "on observe pile pour la premire fois au i-me lancer". Lensemble correspondant lvnement : "linstant de premire sortie de pile est pair" est A = {2 }{4 }{6 }. . . , cest une runion innie dnombrable. Cette remarque justie la dnition suivante. Dfinition 1.6. Un ensemble A de parties de est appele une tribu (ou une -algbre) si (2) A A = A A (3) A (1) A1 , A2 , A =
c i=1
(3) A.
Ai := { ; i 1, Ai } A
Les lments de A (ce sont des parties de ) sont appels des vnements. Exemple 1.7 (Exemples de tribus). (a) A = {, } (cest la plus petite tribu) (c) Si A , A = {, A, Ac , }.
(b) A = 2 (cest la plus grande tribu)
une exprience, on associe le couple (, A) o A est une tribu de . Dire que A est un vnement, cest dire : A A. Remarque 1.8. Lorsque est un ensemble dnombrable (en particulier ni), on prend toujours pour tribu A = 2 : lensemble de toutes les parties de . 1.2. Probabilit Si on note P(A) la probabilit doccurence dun vnement A A, on attend que : 0% = 0 P(A) 1 = 100% (par convention) P() = 1 (condition de normalisation) pour tous A, B A, si A B = alors P(A B) = P(A) + P(B) (additivit) Comme nous lavons dj remarqu, il peut tre utile de considrer des vnements constitus par une runion dnombrable dvnements disjoints A1 , A2 , . . . On note dans de cas leur runion i=1 Ai = i=1 Ai pour mettre lemphase sur leur disjonction qui signie : i, j, i = j Ai Aj = . Do la dnition suivante.
Dfinition 1.9. Une mesure de probabilit P sur (, A) est une fonction P : A [0, 1] qui satisfait : (1) P() = 1 (2) si A1 , A2 , . . . est une suite dvnements disjoints, alors : P
i=1
Ai =
i=1
P(Ai ).
Le triplet (, A, P) est appel un espace de probabilit.
1. FONDEMENTS
Il vient immdiatement de cette dnition, en choisissant A1 = A2 = = , que 0 2P() P() et par consquent P() = 0; en choisissant A1 = A, A2 = B et A3 = A4 = = , que pour tous A, B A disjoints, P(A B) = P(A) + P(B). Il en va de mme pour toute runion dun nombre ni dvnements disjoints :
n n
P
i=1
Ai =
i=1
P(Ai ).
Exemples 1.10. (a) Pile ou face correspond = {f, p}, avec A = {, {f }, {p}, } et P() = 0, P({f }) = P({p}) = 1/2, P() = 1.
(b) Un lancer de d ventuellement pip peut se modliser comme suit : = {1, 2, . . . , 6}, A = 2 et P({i}) = pi 0, 1 i 6 avec p1 + p6 = 1. Pour tout A , nous obtenons P(A) = iA pi . (c) Si le d est honnte, p1 = = p6 = 1/6 et P(A) = card(A)/6 o card(A) dsigne le cardinal de A.
Voici quelques consquences immdiates de la dnition de P. Lemme 1.11. Pour tous A, B A, nous avons (1) P(Ac ) = 1 P(A) (2) A B = P(B) = P(A) + P(B \ A) P(A)
(3) P(A B) = P(A) + P(B) P(A B) Dmonstration. Laisse en exercice.
Dfinition 1.12 (Masse de Dirac). Soit a . On dnit la fonction densembles a : A {0, 1} par a (A) = 1 0 si a A , sinon AA
On appelle a la masse de Dirac au point a. Exercice 1.13. (b) Si on prend trois lments distincts a, b et c de , alors P = est aussi une mesure de probabilit. (c) Montrer que P({a, b}) = 5/7 et calculer P({a, c}).
4 2 La mesure de probabilit P = 1 a + 7 b + 7 c de lexercice prcdent modlise 7 lexprience qui attribue les chances doccurence 1/7, 4/7 et 2/7 aux ralisations lmentaires a, b et c.
(a) Vrier que a est une mesure de probabilit sur A.
1 7
a +
4 7
b +
2 7
Exemple 1.14. On se donne une urne contenant 3 boules rouges appeles 1 , 2 et 3 , 2 bleues appeles 4 , 5 et 1 verte : 6 . On tire au hasard une boule et on note sa couleur. On peut prendre = {1 , . . . , 6 } avec P(n ) = 1/6, n = 1, . . . , 6 puisque notre
1.2. PROBABILIT
intuition nous suggre lquiprobabilit. Bien sr, on choisit A = 2 et on obtient pour tout A , P(A) = card(A)/6. On constate que P= 1 . 6 n n=1
6
Notons les vnements R = {1 , 2 , 3 }, B = {4 , 5 }, V = {6 } correspondant au 6 tirage dune boule rouge, bleue ou verte. On voit que P(B) = 1/6 n=1 n (B) = 6 1/6 n=1 n ({4 , 5 }) = (0 + 0 + 0 + 1 + 1 + 0)/6 = 1/3. Si on nest concern que par la couleur de la boule, on peut prendre lunivers = {r, b, v} munit de la mesure de probabilit P = P(R)r + P(B)b + P(V )v = 1 1 1 2 r + 3 b + 6 v . Lorsque est lensemble dnombrable = {n ; n 1}, toute mesure de probabilit sur A = 2 est de la forme P=
n1
(1.15)
p n n
o (pn )n1 est tel que pn 0, n et n1 pn = 1. Linterprtation de cette formule est : P({n }) = pn , n 1. Le premier rsultat concernant une quantit inniment dnombrable doprations sur les vnements est le suivant. Lemme 1.16. (1) Soient A1 , A2 , . . . une suite croissante (pour la relation dinclusion) de A : A1 A2 et A = n=1 An = { ; i 1, Ai } sa limite. Alors P(A) = lim P(An ).
n
(2) Soient B1 , B2 , . . . une suite dcroissante (pour la relation dinclusion) de A : B1 B2 et B = n=1 Bn = { ; i 1, Ai } sa limite. Alors P(B) = lim P(Bn ).
n
Dmonstration. Puisque (An )n1 est une suite croissante, A2 A1 A2 \ A1 A3 A=

i1
Ai
A = A1 (A2 \A1 )(A3 \A2 ) est la runion disjointe dune famille dvnements. Par consquent, P(A) = P(A1 ) +
i=1
P(Ai+1 \ Ai )
n1
= P(A1 ) + lim =
n
i=1
[P(Ai+1 ) P(Ai )]
lim P(An )
1. FONDEMENTS
Pour le rsultat concernant la famille dcroissante, passer aux complmentaires en utilisant la relation (A B)c = Ac B c .
Exemple 1.17. On joue indniment pile ou face jusqu ce quon obtienne pour la premire fois pile. Le premier instant dobtention de pile est un entier qui peut tre arbitrairement grand. On doit donc prendre un univers de cardinal inni. Un bon choix est = {p, f }{1,2,...} : lensemble des suites = 1 2 . . . n . . . constitues des lettres p et f avec linterprtation que n = p signie quon a obtenu pile au n-ime lancer. Notons que nous choisissons un univers dirent de celui de lExemple 1.5, pour modliser la mme exprience. Lvnement qui correspond lobtention pour la premire fois de pile au nime lancer est Pn = { ; 1 = = n1 = f, n = p}. Cest un ensemble inni qui a le mme cardinal que puisque seul le dbut des suites est spci (Exercice : le prouver). Il est naturel de demander lors de notre modlisation de cette exprience que P(Pn ) = 2n puisquil y a 2n mots de longueur n constitus des lettre p et f et que chacun de ces mots qui code la ralisation de n lancers de pile ou face doit avoir la mme probabilit (situation dquiprobabilit). Soit Bn = { ; 1 = = n = f } = in+1 Pi lvnement "il ny a pas eu pile pendant les n premiers lancers". Ladditivit des probabilits dvnements disjoints scrit P(Bn ) = i=n+1 P(Pi ) cest--dire 2n = i=n+1 2i . On vient de retrouver une formule bien connue. La suite (Bn )n1 est dcroissante avec n1 Bn = P = {} o = f f f f . . . est la suite constitue de f uniquement : lvnement "pile napparait jamais". Le lemme prcdent nous assure de P(P ) = limn 2n = 0. Cest--dire que P() = 0. En dautres termes, avec cette modlisation de lexprience, on conclut que lvnement complmentaire "pile nit par apparatre" est de probabilit 1 0 = 1; il est certain. Un paradoxe. Compte tenu de la symtrie de notre modlisation, tous les sont quiprobables : , P() = P() = 0. Or la somme" des probabilits de tous les vnements lmentaires doit tre gale 1 : P() = 1. Ce qui nous mne 0 = 1. Une somme de zros gale un ! Cette somme ne peut donc pas tre la somme dune srie car nN 0 = 0. Cest la raison pour laquelle on a mis entre guillemets. On lve le paradoxe en se rappelant que est un ensemble non-dnombrable (voir le Lemme A.7-2), cest--dire quil ne peut pas tre mis en injection dans N, il est beaucoup plus gros. De ce fait est une opration indnie ; en particulier elle nest pas une srie.
CHAPITRE 2
Variables alatoires
Pour dnir une variable alatoire, seul (, A) sut. On laisse P de ct pour le moment. On se donne (, A). Essentiellement, une variable alatoire est une fonction numrique sur lunivers souvent note X : R. Exemple 2.1. On joue deux fois de suite pile ou face. Notre univers est = {pp, pf, f p, f f } (lordre des lancers est pris en compte). Le nombre dapparitions de pile est la variable alatoire suivante 2 si = pp 1 si {pf, f p} X() = 0 si = f f
Exemple 2.2. On jette une che par terre et on note langle de sa direction avec le nord magntique. Une telle exprience peut tre dcrite laide de = [0, 2[. Quant la tribu A, contentons-nous de dire quelle contient entre autres toutes les runions dnombrables dintervalles mais pas toutes les parties de , voir la Remarque 2.24 plus bas. Lapplication X() = , est la variable alatoire qui correspond langle de la che. Si lon considre le cosinus de cet angle : Y = cos X, on obtient nouveau une variable alatoire sur (, A). Nous reviendrons sur la question du choix de P lExemple 2.7. Il est trs pratique dintroduire la notation suivante En particulier, nous noterons { ; X() x} = {X x}. Dfinition 2.3. Une application X : R est une variable alatoire relle si pour tout x R, lensemble {X x} appartient A. Lorsque est dnombrable on prend A = 2 et bien sr toute fonction numrique X sur est une variable alatoire. Mais lorsque nest pas dnombrable, comme cest le cas dans lExemple 2.2, pour des raisons techniques dlicates dune dicult dpassant le niveau de ce cours, on ne peut pas considrer toutes les fonctions numriques X sur mais seulement celles qui sont spcies dans la dnition prcdente. On peut se reporter la Remarque 2.24 pour plus de dtails. Remarques 2.4. (1) Notons que X est une fonction. Elle nest donc ni variable, ni alatoire ! Le vocable variable alatoire date du dbut de la thorie des probabilits
7
[0, 2[
{ ; X() C} := {X C}, C R.
2. VARIABLES ALATOIRES
(Fermat et Pascal au seizime sicle), bien avant que les mathmatiques soient formalises. Il faut donc prendre lexpression variablalatoire sans lui accorder une porte smantique nhsitez pas ouvrir votre dictionnaire. (2) Les premires formalisations rigoureuses de la thorie des probabilits datent du dbut du vingtime sicle. Nous pratiquons celle de Kolmogorov, mathmaticien, physicien, gnial et sovitique. 2.1. Fonction de rpartition Ds lors que lon rintroduit la mesure de probabilit P, le comportement alatoire de X peut tre quanti. Lobjet fondamental de cette description est la fonction de rpartition. Dfinition 2.5. On se donne (, A, P) et une variable alatoire X sur (, A). La fonction de rpartition de X est dnie par FX (x) = P(X x), x R. Notons que pour pouvoir crire P(X x), il faut que X soit une variable alatoire au sens de la Dnition 2.3. Exemple 2.6. On reprend la variable alatoire X de lExemple 2.1. Notre espace probabilis est (, A, P) avec = {pp, pf, f p, f f }, A = 2 et P(pp) = P(pf ) = P(f p) = P(f f ) = 1/4. Nous avons bien sr, P(X = 0) = P(X = 2) = 1/4 et P(X = 1) = 1/2. La fonction de rpartition de X est si x ] , 0[ 0 1/4 si x [0, 1[ FX (x) = 3/4 si x [1, 2[ 1 si x [2, +[ et son graphe est y 1
p2 = 1/4
3/4
p1 = 1/2
1/4
p0 = 1/4
|
|
2 1 Reprsentation graphique de y = FX (x)
On constate que FX ne crot que pour les valeurs eectivement frquentes par X : 0, 1 et 2. La hauteur de chacune des marches est respectivement p0 = P(X = 0), p1 = P(X = 1) et p2 = P(X = 2).
2.1. FONCTION DE RPARTITION
Exemple 2.7 (suite de lExemple 2.2). Compte tenu de la symtrie de lexprience, il semble raisonnable den modliser le hasard laide de la mesure de probabilit qui satisfait P(]a, b[) = (b a)/(2), 0 a < b < 2. Soient X() = et Y () = cos . Les fonctions de rpartition de X et Y sont si x 0 0 x/(2) si 0 x < 2 FX (x) = 1 si x 2 et si y < 1 0 1 (arccos y)/ si 1 y < 1 FY (y) = 1 si y 1 En eet, pour 0 x < 2 FX (x) = P(X x) = P({ ; 0 x}) = P([0, x]) = x/(2) z 1
x 1 0 Reprsentation graphique de z = FX (x) et pour 1 y < 1
2( arccos y) 1 0 y 1
arccos y
FY (y) = P(Y y) = P({ ; cos y}) = P(X [( arccos y), arccos y]) = 2( arccos y)/(2) = 1 (arccos y)/ z 1
y 1 0 Reprsentation graphique de z = FY (y) 1 Les fonctions de rpartition jouissent dun certain nombre de proprits.
10
Proposition 2.8. Une fonction de rpartition F possdent les proprits suivantes : (1) limx F (x) = 0 et limx F (x) = 1, (2) F est croissante (3) pour tous a < b, P(a < X b) = F (b) F (a) (4) F est continue droite Dmonstration. Preuve de (1). Soit Bn = {X n}. Alors B1 , B2 , . . . est une suite dcroissante dvnements de limite vide. Par consquent, grce au Lemme 1.16, limn P(Bn ) = P() = 0. Pour lautre limite, considrer An = {X n}.
Preuve de (2) et (3). Soient a < b et A(a) = {X a}, A(a, b) = {a < X b}. Alors, A(b) = A(a) A(a, b) est une union disjointe, de sorte que P(A(b)) = P(A(a)) + P(A(a, b)) do il vient que F (b) = F (a) + P(a < X b) F (a) qui est (3) et prouve (2).
Preuve de (4). Avec la notation prcdente, pour tout a R, A(a, a + h) dcrot vers le vide lorsque h > 0 dcrot vers zro. Par consquent, grce (3), limh0 F (a+ h) F (a) = limn F (a + 1/n) F (a) = limn P(X ]a, a + 1/n]) = P(X limn ]a, a+1/n]) = P(X ) = 0, o lgalit () est une consquence du Lemme 1.16 et lexistence de la limite limh0 F (a + h) est garantit par le croissance de F dmontre au point (2). Le rsultat suivant montre que la fonction de rpartition permet dvaluer la probabilit P(X I) pour nimporte quel intervalle I. Proposition 2.9. Soient a b +. Alors, (1) P(X ]a, b]) = FX (b) FX (a); (2) P(X [a, b]) = FX (b) FX (a ); (3) P(X ]a, b[) = FX (b ) FX (a);
()
o FX (c ) := limxc FX (x) est la limite gauche de FX en c et par convention FX () := limx = 0 et FX (+) := limx+ FX (x) = 1, daprs la Proposition 2.8-(1). On notera que la limite gauche FX (c ) existe puisque FX est une fonction croissante de sorte que limxc FX (x) = supx<c FX (x). Dmonstration. Preuve de (1). Dans ce cas, b < . Lorsque a = , cest vident et lorsque a est ni, ce rsultat a t obtenu la Proposition 2.8. Preuve de (2). Dans ce cas, a et b sont nis. Puisque, [a, b] = n1 ]a 1/n, b] on a {X [a, b]} = n1 {X ]a 1/n, b]} et on obtient laide de (1) et du Lemme 1.16, P(X [a, b]) = limn P(X ]a 1/n, b]) = limn FX (b) FX (a 1/n) = FX (b) FX (a ).
(4) P(X [a, b[) = FX (b ) FX (a )
Preuve de (3). Prenons a = . Si b = , le rsultat est vident et si b < , P(X ] , b[) = P(X n1 ] , b 1/n]) = limn P(X ] , b 1/n]) =
2.2. VARIABLES ALATOIRES DISCRTES
11
limn FX (b1/n) = FX (b ). Lorsque a est ni, P(X ]a, b[) = P(X ], b[) P(X ] , a]) = FX (b ) FX (a). Preuve de (4). Dans ce cas a est ni et en tenant compte de (3), P(X [a, b[) = limn P(X ]a 1/n, b[) = limn FX (b ) FX (a 1/n) = FX (b ) FX (a ). 2.2. Variables alatoires discrtes Commenons par rappeler la dnition dune variable alatoire discrte. Dfinition 2.10. La variable alatoire X est dite discrte si elle prend ses valeurs dans une partie dnombrable {xn ; n N } de R o N est un ensemble dindices. Rappelons que certains des rsultats les plus simples au sujet de la dnombrabilit sont prsents en Annexe A. Remarques 2.11. (1) Bien sr, on peut sans restriction supposer que les xn sont tous distincts. (2) Puisque N est dnombrable, on peut choisir N = {1, . . . , K} si X prend K = card(X()) < valeurs ou bien N = {1, 2, . . .} si X prend une innit de valeurs. Exemples 2.12. (1) La variable alatoire de lExemple 2.1 est discrte. (2) On note X le premier instant dobtention de pile dans lExemple 1.17. Cest une variable alatoire valeurs dans {1, 2, . . .} {} o X = signie que pile napparat jamais. On a vu que P(X = ) = 0 de sorte que X est eectivement valeurs dans R et quon peut considrer sa fonction de rpartition. On a dj vu que pour tout n 1, P(X = n) = P(Bn ) = 2n . La reprsentation graphique de FX est y 1 1/2+1/4=3/4 1/2
1/8 1/4
| |
1/2
| | |
3 1 2 Reprsentation graphique de y = FX (x)
Comme nous allons le voir, telles fonctions de rpartition sont typiques des variables discrtes.
12
Le comportement dune variable discrte X est dcrit par la donne de (xn , pn )nN o les xn sont supposs distincts et pn := P(X = xn ) 0. Du fait que 1 = P(X R), nous obtenons la condition de normalisation (2.13)
nN
pn = 1.
On peut toujours choisir pour N une partie de Z constitue de nombres conscutifs de sorte que les valeurs de X soient ranges par ordre croissant : < xn1 < xn < xn+1 < . laide de la Proposition 2.8-(3), on voit que P(X = xn ) = P(xn1 < X xn ) = FX (xn ) FX (xn1 ), soit (2.14) avec les conventions x(inf(N )1) = et FX () = 0. De plus, pour tous xn1 x y < xn , nous avons 0 FX (y) FX (x) = P(x < X y) P(xn1 < X < xn ) = 0. Par consquent FX (x) = FX (y), ce qui signie que FX est constante sur les intervalles semi-ouverts [xn1 , xn [. La forme gnrale de FX est donc y 1 pn = FX (xn ) FX (xn1 ), nN
pn+1
pn pn1
| |
xn1
xn
xn+1
Reprsentation graphique de y = FX (x) Une telle fonction de rpartition est dite atomique : cest- dire quelle est constante entre ses discontinuits qui sont des sauts positifs. 2.3. Variables alatoires continues La situation prcdente est radicalement dirente de celle des variables alatoires continues. Dfinitions 2.15. (1) Une fonction numrique est dite continue par morceaux si tous ses points de discontinuit sont isols. Ceci signie que pour tout point de discontinuit il existe un intervalle ouvert qui le contient et ne contient pas dautre point de discontinuit. (2) La variable alatoire X est dite continue si sa fonction de rpartition peut scrire sous la forme
x
(2.16)
FX (x) =
fX (u) du,
xR
pour une certaine fonction fX : R [0, [ continue par morceaux et intgrable.
2.3. VARIABLES ALATOIRES CONTINUES
13
(3) Dans ce cas, la fonction fX est appele fonction de densit de la variable alatoire X. Exemple 2.17 (suite de lExemple 2.7). On constate que X et Y sont continues puisque
x y
FX (x) = avec les fonctions de densit fX (x) = 1/(2) 0
fX (u) du,
FY (y) =
fY (u) du
si x [0, 2] , sinon z
fY (y) =
1/( 0
1 y 2 ) si y [1, 1] sinon
1/(2)
Reprsentation graphique de z = fX (x)
y 1 0 1 Reprsentation graphique de z = fY (y) Par souci de lisibilit, ces deux reprsentations ne sont pas la mme chelle. Notons lexplosion en 0 de la densit de Y. Remarques 2.18. (1) Il est clair que la fonction de rpartition FX dune variable continue est continue. En fait, elle est un peu plus rgulire : des fonctions FX qui admettent une reprsentation (2.16) sont dites absolument continues.
(2) Si fX est elle-mme continue, FX est drivable (de classe C 1 ) et FX = fX .
(3) Remarquons que FX nest pas drivable aux points de discontinuit de fX . (4) Notons quil existe des fonctions de rpartition qui ne sont ni atomiques, ni absolument continues. Cest le cas de lExemple 2.22 plus bas et de lescalier du diable que nous gravirons un peu plus tard, voir lExemple 6.1. Les variables alatoires qui leurs sont associes ne sont donc ni discrtes, ni continues. Si X est une variable alatoire continue, FX est une fonction continue et toutes les expressions des membres de droite des galits de la Proposition 2.9 sont gales. On en dduit immdiatement le
14
Corollaire 2.19. Si X est une variable alatoire continue de densit fX , pour tous a b nous avons P(X ]a, b]) = P(X [a, b]) = P(X ]a, b[)
b
= P(X [a, b[) =
fX (x) dx.
a
Lorsque X est continue, on notera parfois P(X (a, b)) chacune des quantits gales P(X ]a, b]) = P(X [a, b]) = P(X ]a, b[) = P(X [a, b[). y y = fX (x)
b aire=
b a
x fX (x) dx = P(X (a, b))
En se souvenant de la dnition de lintgrale de Riemann comme limite de sommes de Darboux, on obtient en tout point x de continuit de la densit fX que lorsque x+h h 0 tend vers zro, P(X (x, x + h)) = x fX (t) dt = fX (x)h + (h)h o limh0 (h) = 0. De faon informelle, on traduit ceci par (2.20) y P(X (x, x + h)) fX (x)h.
h0
aire h(h)/2 (h) h y = fX (x)
fX (xo )
xo
xo + h
aire= fX (xo )h P(X (xo , xo + h)) On constate donc que la variable alatoire X a plus de chance de prendre des valeurs dans les rgions o fX est grande. En particulier, X ne prend pas de valeur dans lensemble {fX = 0} := {x R; fX (x) = 0}. Bien videmment, puisque 1 = P() = P(X R), nous avons toujours la condition de normalisation (2.21)
R
fX (x) dx = 1.
qui est lanalogue de (2.13).
2.4. QUELQUES LMENTS DE RFLEXION
15
2.4. Quelques lments de rexion Nous concluons ce chapitre en donnant un exemple de variable alatoire qui nest ni continue, ni discrte ; ainsi quune remarque au sujet de la tribu A lorsque X prend un nombre non-dnombrable de valeurs. Exemple 2.22 (Une variable alatoire ni continue, ni discrte). On tire une boule dune urne qui contient 1 boule rouge et 2 boules vertes. Si la boule obtenue est verte, alors on lance notre che par terre et on mesure son angle. Lunivers de lexprience est = {r} {(v, x); 0 x < 2}. Soit X : R donne par X prend ses valeurs dans {2, 9} [0, 2[ et sa fonction de rpartition admet la reprsentation graphique suivante. y 1 X(r) = 2, 9, X((v, x)) = x.
1/3
|
-2,9
0 Reprsentation graphique de y = FX (x)
Exemple 2.23 (Lescalier du diable). Remarque 2.24. Clairement, si X prend un nombre non-dnombrable de valeurs, il est ncessaire que ne soit pas dnombrable. Cest le cas pour les variables continues. En revenant la Remarque 1.8, on peut se demander pourquoi dans cette situation on ne pourrait pas prendre la tribu 2 de toutes les parties. Cest lvidence une tribu et on peut donc considrer une probabilit P construite sur elle. Le problme que lon rencontre est le suivant. On peut montrer quil nexiste pas de mesures de probabilits sur 2 autres que celles de la forme (1.15) : n1 pn n car 2 est un ensemble trop gros.
CHAPITRE 3
Loi et esprance dune variable alatoire

Nous commenons par prsenter les notions de loi et desprance dans la situation la plus simple qui est celle des variables discrtes. Puis, nous tendons par analogie ces notions au cas des variables continues. Finalement, nous montrons quil existe un cadre mathmatique gnral qui permet de comprendre et dnir ces notions pour toutes les variables alatoires. 3.1. Variables discrtes Soit X une variable alatoire qui prend les valeurs {xn ; n N } o les xn sont distincts et N est un ensemble dindices inclus dans lensemble {1, 2, . . .} des entiers positifs non nuls, voir les Remarques 2.11. On dcrit le comportement alatoire de X par la donne de (xn , pn )nN avec pn := P(X = xn ), n N. Cette donne est moins informative a priori que celle de (X, P) qui dcrit le phnomne par , mais elle est susante pour obtenir toutes les quantits moyennes que nous dsirons. Dfinition 3.1. La loi de la variable alatoire discrte X est (3.2) PX =
nN
pn xn
Une loi de cette forme est dite atomique. Ses atomes sont les xn tels que pn > 0. On rappelle que x est la masse de Dirac au point x, cest--dire que pour toute 1 si x B , voir la Dnition 1.12. La loi PX est une partie B R, x (B) = 0 sinon mesure de probabilit sur R. Exemples 3.3. (1) La variable alatoire X de lExemple 2.12-(1) a pour loi PX = 1 0 + 1 1 + 4 2 1 4 2 . (2) La loi de celle de lExemple 2.12-(2) est PX = Soit B une partie de R, nous constatons que (3.4) puisque P(X B) = PX (B), PX (B) =
nN n1
2n n .
BR pn
nN : xn B
pn xn (B) =
=
nN : xn B
P(X = xn ) = P(X B).
On voit clairement laide de (2.14) que la donne de (xn , pn )nN est quivalente celle de la fonction de rpartition FX , de mme quelle est quivalente
17
18
3. LOI ET ESPRANCE DUNE VARIABLE ALATOIRE
celle de la loi PX . En rsum, le comportement alatoire de X est dcrit de manire quivalente par la donne de (xn , pn )nN ou la fonction de rpartition FX ou la loi PX . La valeur moyenne de X pondre par les probabilits de ralisation des vnements est appele son esprance mathmatique. Dfinition 3.5. Soit X une variable discrte de loi PX = mathmatique de X est EX :=
nN nN
pn xn . Lesprance
pn xn .
Pour que cette quantit soit dnie correctement, il est ncessaire de supposer que E|X| :=
nN
pn |xn | <
cest--dire que
nN
pn xn est une srie absolument convergente.
Exemples 3.6.
1 1 (1) La variable X de lExemple 3.3-(1) a pour loi PX = 4 0 + 1 1 + 4 2 . Son 2 1 1 1 esprance est EX = 4 0 + 2 1 + 4 2 = 1. n1
(2) La variable X de lExemple 3.3-(2) a pour loi PX = esprance est EX = n1 2n n. Remarques 3.7.
2n n . Son
(1) Lorsque X est une variable alatoire positive, son esprance EX = nN pn xn est une srie termes positifs. Elle est donc toujours dnie condition de lui donner la valeur + lorsquelle est divergente. En particulier, pour toute variable alatoire, on a E|X| = nN pn |xn | et lon peut crire E|X| sans prcaution en tant que nombre dans [0, +] = [0, +[{+}. De plus, E|X| < signie que la srie nN pn xn est absolument convergente et donc que EX est bien dni. (2) On dnit la loi dune variable alatoire discrte X valeurs dans un ensemble quelconque X exactement comme lorsque X R, par la donne de (xn , pn )nN o les xn sont dans X . La loi de X est donne par la Dnition 3.1 : PX = nN pn xn . Cest une mesure de probabilit sur X muni de la tribu 2X de ses parties.
(3) En revanche, pour considrer EX, il faut pouvoir additionner les x et les multiplier par des poids 0 p 1. La notion desprance de X na donc de sens que si X est un espace vectoriel. Lesprance de X est donne par la Dnition 3.5 : EX = nN pn xn X sous rserve que cette srie soit absolument convergente, cest--dire que la srie termes positifs E X = nN pn xn < soit convergente, o est une norme sur lespace vectoriel X . Un cas trs important est celui de X = Rd muni de le norme euclidienne ou de nimporte quelle autre norme quivalente.
Considrons la variable alatoire Y = (X), image de X par la fonction numrique : R R. Sa loi est PY = mM qm ym o {ym ; m M } = {(xn ); n N }
3.1. VARIABLES DISCRTES
19
les ym tant tous distincts et qm := = =

xX(): (x)=ym
P(Y = ym ) P((X) = ym ) P(X = x) pn

nN (m)
(3.8)
o N (m) = {n N : (xn ) = ym } est lensemble des indices des xn dont limage par est ym . Notons que (N (m))mM constitue une partition de N. Cest--dire que les parties N (m) sont disjointes : m = m N (m) N (m ) = (puisque les ym sont tous distincts), et (3.9) N=
mM
N (m).
nN
Thorme 3.10. On suppose que (3.11) E[(X)] =
pn |(xn )| < . Alors,
pn (xn ).
nN
Dmonstration. En notant Y = (X) comme prcdemment, nous avons E[(X)] =

(a)
EY qm y m
mM
(b)
= =
pn y m
mM nN (m)
(c) mM nN (m) (d)
pn (xn ) pn (xn )
nN
o (a) est la dnition de lesprance, (b) provient de (3.8), (c) est une consquence de ym = (xn ), n N (m) et (d) vient de (3.9). Bien videmment, il faut sassurer que toutes ces sries sont absolument convergentes. Or, en reprenant le prcdent calcul en remplaant Y par |Y | et donc par ||, on voit que cest le cas sous notre hypothse : nN pn |(xn )| < . Thorme 3.12. La loi de (X) est P(X) =
nN
pn (xn ) .
Dmonstration. On reprend en la transposant la preuve du Thorme 3.10. Ce qui donne : P(X) = PY =

mM
qm ym =
mM nN (m)
pn y m pn (xn )
nN
=
mM nN (m)
pn (xn ) =
qui est le rsultat dsir.
20
1 1 Reprenons lExemple 3.3-(1), cest--dire PX = 4 0 + 1 1 + 4 2 et considrons 2 1 1 1 1 2 (x) = (x 1) . On obtient alors P(X) = 4 (0) + 2 (1) + 4 (2) = 1 1 + 2 0 + 4 1 1 1 4 1 = 2 0 + 2 1 . En prenant N = {1, 2, 3}, x1 = 0, x2 = 1 et x3 = 2, ainsi que M = {1, 2} avec y1 = 0 = (1) et y2 = 1 = (0) = (2), nous obtenons N (1) = {2} et N (2) = {1, 3}. La formule (3.8) scrit q1 = nN (1) pn = p2 et q2 = nN (2) pn = p1 + p3 , ce qui donne P((X) = 0) = 1/2 et P((X) = 1) = 1/4 + 1/4 = 1/2.
Lemme 3.13 (Positivit de lesprance). (1) Soit X une variable positive : X 0, cest--dire X() 0, . Alors, 0 EX .
(2) Soient et deux fonctions positives telles que 0 . Alors, 0 E[(X)] E[(X)] .
Preuve de (2). Pour tout n N, 0 pn (xn ) pn (xn ). Donc les sries termes positifs correspondantes sont ordonnes de faon similaire : 0 E[(X)] = nN pn (xn ) E[(X)] . nN pn (xn ) Thorme 3.14 (Linarit de lesprance). Soient , : R R deux fonctions numriques telles que E|(X)| < et E|(X)| < . Pour tous rels a, b, nous avons E[a(X) + b(X)] = aE[(X)] + bE[(X)] o toutes les esprances sont bien dnies. Dmonstration. Puisque |a(X) + b(X)| |a||(X)| + |b||(X)|, grce au Lemme 3.13-(2), nous avons E|a(X) + b(X)| |a| E|(X)| + |b| E|(X)| < de sorte que toutes les esprances sont bien dnies. Grce au Thorme 3.10, E[a(X) + b(X)] =
nN
Dmonstration. Preuve de (1). Nous avons xn 0 et pn 0 pour tout n N. Donc EX = nN pn xn 0.
pn [a(xn ) + b(xn )] pn (xn ) + b

nN nN
= a
pn (xn )
= aE[(X)] + bE[(X)] ce qui achve la preuve. Thorme 3.15 (Croissance de lesprance). Soient et deux fonctions numriques telles que E|(X)| < , E|(X)| < et . Alors, E[(X)] E[(X)]. Dmonstration. (X) (X) 0, donc par linarit et positivit de lesprance E[(X)] E[(X)] = E[(X) (X)] 0. Remarque 3.16. En reprenant la Remarque 3.7-(2), on peut tendre les Thormes 3.14 et 3.15 au cas des variables alatoires discrtes valeurs dans un ensemble X quelconque, en prenant des fonctions , : X R, puisque (X) et (X) sont des variables alatoires relles.
3.2. VARIABLES CONTINUES
21
3.2. Variables continues Nous allons procder par analogie avec les variables discrtes. Nous gardons les notations introduites la Dnition 2.15, en particulier la densit fX de la loi de la variable alatoire continue X est suppose continue par morceaux. Dfinition 3.17. (1) On note CX lensemble des fonctions de : R R qui sont continues par morceaux et telles que lintgrale gnralise R |(x)|fX (x) dx soit convergente, cest--dire R |(x)|fX (x) dx < . (2) Soit CX . Lesprance mathmatique de la variable alatoire (X) est dnie par (3.18) E(X) :=
R
(x)fX (x) dx.
Une justication rigoureuse de cette dnition est obtenue au Thorme B.10 o lon montre quelle est lextension naturelle de la Dnition 3.5 de lesprance dune variable discrte. En tenant compte de (2.20), lorsquon se souvient de la construction de lintgrale de Riemann comme limite de sommes de Darboux, on voit que cette dnition est analogue au rsultat obtenu en (3.11) pour les variables discrtes. Du fait que fX et sont continues par morceaux, il en est de mme pour leur produit fX qui, par consquent, est localement intgrable au sens de Riemann. Remarques 3.19. (1) Si 0 est une fonction continue par morceaux et positive, on peut dnir lesprance (3.18) en posant E(X) = + lorsque lintgrale gnralise positive R (x)fX (x) dx est divergente. En particulier, pour toute fonction continue par morceaux, on note E|(X)| = R |(x)|fX (x) dx [0, ]. (2) Lhypothse dintgrabilit E|(X)| = R |(x)|fX (x) dx < exprime que lintgrale gnralise R (x)fX (x) dx est absolument convergente. Exemple 3.20. Si X est langle de la che de lExemple 2.17 : fX (x) = 2 x 1[0,2[ (x)/(2) de sorte que E(X) = 0 2 dx = . Remarque 3.21. On peut se demander ce que signie la valeur moyenne de langle EX = . En eet, si lon avait choisi de coder langle dans [, [, on aurait obtenu EX = 0 pour la mme exprience. En revanche, les coordonnes cartsiennes (cos X, sin X) sur le cercle trigonomtrique sont indpendantes du choix de lorigine des angles.
22
(cos X, sin X)
angle = X (0, 0) (1, 0)
On dnit E(cos X, sin X) = (E[cos X], E[sin X]) et on obtient la direction moyenne 2 1 E(cos X, sin X) = (0, 0) puisque E[cos X] = 2 0 cos x dx = 0 et E[sin X] = 2 1 2 0 sin x dx = 0. Ce qui signie bien quaucune direction nest privilgie. Thorme 3.22 (Linarit de lesprance). Lensemble CX est un sous-espace vectoriel de lespace des fonctions numriques. Pour tous , CX et tous rels a, b, nous avons E[a(X) + b(X)] = aE[(X)] + bE[(X)]. Dmonstration. Soient et deux fonctions continues par morceaux. Lensemble des points de discontinuit de + est inclus dans la runion des ensembles de points de discontinuit de et et une runion nie de points isols reste un ensemble de points isols. Donc + est continue par morceaux. Il en est de mme pour a pour tout a R. Dautre part, R |a(x)|fX (x) dx = |a| R |(x)|fX (x) dx < . Ce qui prouve que CX est un espace vectoriel. La linarit de lintgrale nous assure de E[a(X) + b(X)] =
R
[a(x) + b(x)]fX (x) dx (x)fX (x) dx + b

R R
= a
(x)fX (x) dx
= aE[(X)] + bE[(X)], qui est le rsultat annonc. Thorme 3.23 (Croissance de lesprance). (1) Soient , 0 deux fonctions positives continues par morceaux telles que 0 . Alors la Remarque 3.19-(1) nous assure du sens des quantits E[(X)] et E[(X)] et nous avons 0 E[(X)] E[(X)] .
(2) Soient , CX telles que , alors E[(X)] E[(X)].
Dmonstration. Ces rsultats sont des consquences immmdiates des proprits de croissance des intgrales gnralises. Par analogie avec la relation (3.4), nous introduisons la
3.3. UNE NOTATION COMMUNE
23
Dfinition 3.24. La loi de X est la mesure de probabilit sur R PX (dx) := fX (x) dx qui est dnie par
b
PX (B) := P(X B) = pour tout intervalle B = (a, b) R.
fX (x) dx
a
notation
fX (x) dx
B
3.3. Une notation commune Nous venons de voir que les rsultats de croissance (Thormes 3.15 et 3.23) et de linarit (Thormes 3.14 et 3.22) sexpriment de faon analogue pour les variables alatoires discrtes et continues. Cest lindice quil existe une thorie gnrale qui englobe ces deux situations. Il sagit de la thorie de lintgration de Lebesgue que nous naborderons pas dans ce cours. En revanche, nous allons introduire des notations issues de cette thorie qui permettront de traiter simultanment ces deux types de variables alatoires. les principaux rsultats de cette thorie sont collects lAnnexe C. On note (x) PX (dx) =
R R
dPX = E(X)
(1) la quantit dPX =

R nN nN
(xn )pn pn xn ou bien
lorsque X est discrte de loi PX = (2) la quantit dPX =

R R
(x)fX (x) dx
lorsque X est continue de loi PX (dx) = fX (x) dx. Nous avons montr aux Thormes 3.15, 3.23, 3.14 et 3.22 que, pour et dans une bonne classe de fonctions, les proprits suivantes sont satisfaites. Linarit. Pour tous a, b R, E[a(X) + b(X)] = aE(X) + bE(X) ou avec notre nouvelle notation : [a + b] dPX = a
R R
(3.25)
dPX + b
R
dPX
(3.26)
Croissance. Si , alors
ou avec notre nouvelle notation :

R
E(X) E(X) dPX dPX .

R
Normalisation. On note 1 la fonction constante gale 1. (3.27) E(1) =

R
dPX = PX (R) = P() = 1.
24
3.4. Fonction indicatrice densemble On introduit maintenant une fonction trs pratique en calcul des probabilits. Dfinition 3.28 (Fonction indicatrice). Soit V un ensemble quelconque et W V une partie de V. La fonction indicatrice de W est 1W (v) := Remarques 3.29. (1) Notons que 1W (v) = v (W ). (2) Pour tout B R, 1{XB} () = 1B (X()) = Proposition 3.30. (2) Pour tout rel c, E(c1 ) = c. (1) Pour B R, E[1{XB} ] = E[1B (X)] = P(X B) = PX (B). 1 0 si X() B . sinon 1 0 si v W , sinon v V.
On notera souvent la variable alatoire gale la constante c : c1 = c; donc E(c) = c. Une telle variable alatoire est dite dterministe. Dmonstration. Preuve de (1). Commenons par le cas o X est discrte. Grce au Thorme 3.10, E[1{XB} ] = E[1B (X)] = = nN pn 1B (xn ) = nN ; xn B pn = P(X B) = PX (B). Lorsque X est continue, E[1{XB} ] = E[1B (X)] = R 1B (x)fX (x) dx = B fX (x) dx = PX (B). Preuve de (2). Avec (3.27) : E(c) = cE(1) = c1. 3.5. Variance et cart-type Pour mesurer la moyenne des uctuations de X autour de sa moyenne := EX, on peut prendre la moyenne de lcart la moyenne : X . Cest--dire E(X ). Mais on voit que E(X ) = EX E = = 0. En moyenne, les carts par dfaut compensent exactement les carts par excs. Une ide naturelle est donc de considrer la moyenne de lcart absolu la moyenne : E|X |. Mais personne naime beaucoup travailler avec les valeurs absolues qui demandent des dcoupages fastidieux. Cest la raison pour laquelle on prfre considrer la moyenne du carr de lcart la moyenne : E[(X )2 ]. Si on change dchelle de mesure, par exemple si X est une longueur exprime en mtres et X la mme longueur exprime en millimtres, on a X = 1000X do E[(X E(X ))2 ] = E[(1000X 1000E(X))2 ] = 10002 E[(X EX)2 ]. Ces quantits dirent du facteur 10002 et sexpriment comme des longueurs au carr. Il est donc pertinent de considrer la quantit E[(X )2 ] qui conserve les bonnes units et les facteurs dchelle. Dfinition 3.31. On suppose que E|X| < de sorte que EX est bien dni. La variance de X est Son cart-type est Var(X) := E[(X EX)2 ] [0, +] (X) := Var(X) [0, +].
3.6. MOMENTS
25
On remarque quen tant quesprance de la variable positive (X )2 , Var(X) est un nombre positif. Il est pratique lors de certains calculs dutiliser les formules suivantes. Proposition 3.32. Soit X tel que E|X| < . Nous avons (2) Var(aX) = a2 Var(X) et (aX) = |a|(X), pour tout rel a = 0, avec la convention a2 = |a| = Bien sr, si a = 0, Var(0) = (0) = 0. (3) Var(X + c) = Var(X) pour tout rel c. (4) Var(c) = 0 pour tout rel c. Dmonstration. Preuve de (1). Grce la linarit de lesprance (3.25) et la Proposition 3.30-(2), en posant = EX, Var(X) = E[(X )2 ] = E[X 2 2X + 2 ] = E(X 2 ) 2EX + E(2 ) = E(X 2 ) 22 + 2 = E(X 2 ) 2 . (1) Var(X) = E(X 2 ) (EX)2 .
Preuve de (3). Var(X + c) = E[{(X + c) E(X + c)}2 ] = E[{X + c (EX + c)}2 ] = E[{X EX}2 ] = Var(X). Preuve de (4). Var(c) = Var(c c) = Var(0) = 0. 3.6. Moments Commenons par la dnition des moments dune variable alatoire. Dfinition 3.33. Soit X une variable alatoire relle. Si X 0 est une variable alatoire positive, pour tout rel p > 0, on appelle moment dordre p de X la quantit E[X p ] [0, ]. Dans le cas gnral o X est une variable alatoire relle, pour tout entier p 1 tel que E[|X|p ] < , on appelle moment dordre p de la variable alatoire relle X la quantit E(X p ). On rappelle que les puissances non-entires ne sont dnies que pour les nombres positifs par xp := exp(p ln(x)), x > 0, p R et 0p = 0 si p > 0. Proposition 3.34 (Comparaison des moments). On se donne deux rels 0 < p q. Soit X 0 une variable alatoire positive : E[X q ] < E[X p ] < . Pour toute variable alatoire relle X : E[|X|q ] < E[|X|p ] < . Dmonstration. Soit X 0. On utilise les fonctions indicatrices 1W , voir la Dnition 3.28, en remarquant que 1 = 1W + 1W c : E[X p ] =
(a)
Preuve de (2). A nouveau, par la linarit de lesprance, Var(aX) = E[(aX a)2 ] = E[a2 (X )2 ] = a2 E[(X )2 ] = a2 Var(X).
E[(1{X<1} + 1{X1} )X p ] E[1{X<1} X p ] + E[1{X1} X p ] 1 + E[1{X1} X q ] 1 + E[X q ] < .
(b) (c)
26
Lgalit (a) est une application de la linarit de lesprance. Lingalit (b) vient de 1{0x<1} xp 1 et xp xq lorsque x 1 et 0 < p q. On obtient lingalit (c) en remarquant que 1{x1} xq xq lorsque x 0. On a invoqu (3.26) pour des fonctions positives pour ces deux ingalits. La dernire assertion de la proposition sen dduit immdiatement. Corollaire 3.35. Si E(X 2 ) < , alors E|X| < . De plus, Var(X) < si et seulement si E(X 2 ) < . Dmonstration. La premire assertion est un cas particulier de la Proposition 3.34 et la seconde sen dduit laide de la Proposition 3.32-(1). 3.7. Fonctions dune variable alatoire Si est une fonction numrique susamment rgulire et X est une variable alatoire, alors Y = (X) est aussi une variable alatoire. Pour tout intervalle B R, notons 1 (B) := {x R; (x) B}.
Exercice 3.36. Montrer que si est continue par morceaux, 1 (B) est une runion dnombrable dintervalles.
Grce lexercice prcdent et lidentit (3.45) plus bas, on peut considrer PX (1 (B)) et crire PY (B) = P(Y B) = P((X) B) = PX (1 (B))
= P(X 1 (B))
ce qui spcie la loi de Y. Par exemple, lorsque est une application strictement monotone son application rciproque 1 est bien dnie et en prenant B =] , y] nous obtenons lorsque est strictement croissante FY (y) = P(X 1 (y)) = FX (1 (y)) et lorsque est strictement dcroissante FY (y) = P(X 1 (y)) = = P((X) y) = P((X) y)
Donnons quelques exemples dapplication de cette mthode. (a) Soit X une variable continue de densit fX continue par morceaux. On cherche la loi de Y = aX + b avec a et b rels. Remarquons avant tout que lorsque a = 0, Y vaut b quoiquil arrive, sa loi est donc PY = b . On note en passant que ceci nous donne un exemple de (X) discrte alors que X est continue. Prenons maintenant a = 0 et calculons la fonction de rpartition de Y = aX +b. Si a > 0, FY (y) = P(aX + b y) = P(X (y b)/a) = FX ((y b)/a). Ce qui donne fY (y) = FY (y) = fX ((y b)/a)/a.
1 FX ((1 (y)) )
3.8. EGALIT EN LOI
27
(b) Soit X une variable alatoire quelconque, la fonction de rpartition FY de Y = X 2 sexprime en fonction de FX de la manire suivante. Pour tout y 0, FY (y) = P(X 2 y) = P( y X y) = FX ( y) FX (( y) )
Si a < 0, FY (y) = P(aX +b y) = P(X (yb)/a) = 1FX ((yb)/a). Ce qui donne fY (y) = FY (y) = fX ((y b)/a)/a. Finalement, nous obtenons dans les deux cas fX ((y b)/a) , yR (3.37) fY (y) = |a|
alors que pour tout y < 0, FY (y) = 0. En particulier, si X admet une densit fX continue par morceaux, FX est drivable partout sauf en un nombre ni de points et FX = fX . Par consquent Y admet la densit (dnie partout sauf en un nombre ni de points) fX ( y) + fX ( y) . (3.38) fY (y) = FY (y) = 1(y>0) 2 y Exemple 3.39. Si X est langle de la che de lExemple 2.17 et Y = X 2 , fX (x) = 1[0,2[ (x)/(2) et avec (3.38) : fY (y) = 1[0,42 [ /(4 y) de sorte que E(X 2 ) = E(Y ) = x2 4 dx = 2 2 3 0 4 2 y 4 dy = 2 4 3 0
2
On constate bien videmment que E(Y ) = E(X 2 ). (c) Les choses sont plus simples si lon considre Z = X 3 . En eet, pour tout z R, nous avons La simplicit de ce calcul vient du fait que z 3 est injective, alors que la noninjectivit de z 2 crait quelques dicults dans lexemple prcdent. Si X admet une fonction de densit continue par morceaux, Z = X 3 admet la fonction de densit fX (z 1/3 ) . fZ (z) = 3z 2/3 Notons que cette fonction nest pas dnie en z = 0, mais a nest pas un problme puisque des fonctions de densit gales sauf sur un ensemble de longueur nulle (Lebesgue-presque partout) correspondent la mme loi, voir la Proposition 3.42 plus bas. 3.8. Egalit en loi Cette notion est spcique la thorie des probabilits. Dfinition 3.40 (Egalit en loi). Deux variables alatoires X1 et X2 construites respectivement sur (1 , P1 ) et (2 , P2 ) sont gales en loi si et seulement si elles ont L la mme loi : PX1 = PX2 . On note dans ce cas : X1 = X2 . FZ (z) = P(X 3 z) = P(X z 1/3 ) = FX (z 1/3 ).
28
Cela ne signie pas que (1) X1 = X2 ni mme que (2) P(X1 = X2 ) = 1, mme lorsque (1 , P1 ) = (2 , P2 ). Bien sr, (1) implique (2) qui implique lgalit en loi. Lgalit en loi est la notion la plus faible permettant didentier deux phnomnes alatoires. Exemples 3.41. (1) On joue deux fois de suite pile ou face de sorte que 1 = {pp, pf, f p, f f } et P1 = 1 (pp + pf + f p + f f ). On considre X1 dni par : X1 (pp) = 4 X1 (pf ) = 3 et X1 (f p) = X1 (f f ) = 5. On lance un d de sorte que 2 = {a, b, c, d, e, f } avec P2 = 1 (a + b + 6 c +d +e +f ). On considre 2 dni par X2 (a) = X2 (b) = X2 (c) = 3 X et X2 (d) = X2 (e) = X2 (f ) = 5. L 1 On voit que PX1 = PX2 = 2 (3 + 5 ), cest--dire X1 = X2 .
1 1 (2) Soit X la variable de lExemple 2.6 dont la loi est 4 0 + 1 1 + 4 2 . Montrer 2
(3) Soit X une variable alatoire continue dont la densit est une fonction L paire ; fX (x) = fX (x), x. Alors nous avons X = X. En eet, pour tout rel y nous avons FX (y) = =
(a) y y
que X = 2 X.
P(X y)
+
fX (x) dx fX (z) dz
y
(b)
fX (z) dz FX (y)
o lgalit (a) sobtient avec le changement de variable z = x et (b) est une consquence de la parit de fX . Nous avons dj remarqu que les donnes de FX et PX sont quivalentes. On en dduit le rsultat suivant. Proposition 3.42. Deux variables alatoires X1 et X2 construites respectivement sur (1 , P1 ) et (2 , P2 ) sont gales en loi si et seulement si elles ont la mme fonction de rpartition : FX1 = FX2 . Si elles sont discrtes, cela signie quil existe une suite (ventuellement nie) (xn )nN de rels distincts telle que nN P1 (X1 = xn ) = 1 et P1 (X1 = xn ) = P2 (X2 = xn ), n N Si elles sont continues, cela signie que leurs densits ont le mme ensemble de points de discontinuit (Cf. les Dnitions 2.15 et 3.17) et quelles sont gales
3.9. DFINITION ABSTRAITE DE LA LOI DUNE VARIABLE ALATOIRE
29
partout sauf ventuellement sur cet ensemble de "longueur nulle". On dit alors quelles sont gales Lebesgue-presque partout et on note fX1 = fX2 , Lebesgue-p.p.
3.9. Dnition abstraite de la loi dune variable alatoire Spcier compltement le comportement dune variable alatoire X devrait permettre en principe dvaluer les quantits P(X B) pour toute partie B de R. Mais cela nest possible que si lensemble {X B} est un vnement, cest--dire un lment de la tribu A. Lorsque X est une variable discrte, on peut prendre dnombrable et A = 2 de sorte que pour tout B R, {X B} est un vnement. Lorsque X est une variable alatoire continue, comme nous lavons dj voqu la Remarque 2.24, les choses se compliquent du point de vue mathmatique : on ne peut pas prendre nimporte quelle partie B. Les "bonnes" parties B de R sont celles de la tribu de Borel. Dfinition 3.43. La tribu de Borel de R est la plus petite tribu contenant lensemble I de tous les intervalles de R. On la notera B. Exercice 3.44. Montrer que si (A , ) est une collection quelconque de tribus sur le mme ensemble , alors lensemble A constitu des parties de qui se trouvent dans toutes les tribus A lorsque parcourt lensemble dindices , est aussi une tribu. La plus petite tribu contenant lensemble I de tous les intervalles de R est par dnition lintersection de toutes les tribus contenant I. Cette intersection existe puisque 2R est une tribu qui contient I, de plus en tant quintersection de tribus, cest une tribu daprs lexercice prcdent. Ceci justie la dnition de la tribu de Borel B. On peut montrer, mais a nest pas simple, quil existe des parties de R qui ne sont pas dans B. On retiendra que la tribu de Borel contient toutes les runions dnombrables dintervalles. Avec B = n1 In o les In sont des intervalles disjoints, nous avons (3.45) P(X B) =
n1
P(X In ).
(Notons que si B est la runion nie de N intervalles, on peut toujours prendre In = pour n > N ). Or cette quantit est entirement dtermine par la fonction de rpartition FX de X comme le montre la Proposition 2.9. Dfinition 3.46. La loi de la variable alatoire (quelconque) X est la mesure de probabilit PX sur (R, B) dnie par PX (B) = P(X B), B B. La connaissance de PX sur tous les intervalles de la forme ]a, b] permet de retrouver FX (x) = P(X ] , x]) = limn PX (] n, x]), x R. Rciproquement, si on se donne FX , grce la Proposition 2.9, PX est connue sur tous les intervalles et par suite, grce (3.45), sur toutes les runions dnombrables
30
dintervalles. On peut montrer, mais cest assez dlicat et dpasse le niveau de ce cours, quen fait FX spcie PX compltement sur B. En rsum, FX et PX encodent la mme information sur le comportement alatoire de X. De plus, PX nest autre que limage sur (R, B) de la mesure de probabilit P sur (, A) par lapplication X : PX = X#P. La notion de mesure image est prsente lAnnexe C.
CHAPITRE 4
Variables alatoires usuelles

Nous prsentons ici les lois des variables alatoires les plus usites. Certaines, comme la loi normale, sont extrmement importantes tant sur le plan thorique que pratique (utilisation trs frquente en statistique).
4.1. Exemples de variables alatoires discrtes Nous prsentons dans cette section les lois de Bernoulli, binomiales, de Poisson et gomtriques. Loi de Bernoulli. Il sagit dune des lois les plus simples. La variable alatoire X suit la loi de Bernoulli B(p) de paramtre 0 p 1 si sa loi est PX = q0 + p1 . Ceci signie que X peut prendre les valeurs 0 et 1 avec les probabilits respectives q = 1 p et p. On obtient immdiatement que EX = q0 + p1 = p et que puisque X 2 = X sous cette loi, E(X 2 ) = p. Par consquent, VarX = p p2 = pq. Une variante immdiate de cette loi est PY = qa + pb avec a, b rels. On a immdiatement EY = qa + pb et du fait que Y = a + (b a)X avec X B(p), VarY = (b a)2 VarX = (b a)2 pq, grce la Proposition 3.32. Loi binomiale. La variable alatoire X suit la loi binomiale B(n, p) de paramtres n 1 et 0 p 1 si sa loi est
n
PX =
k=0
n k nk p q k k
o comme prcdemment on pose q = 1 p. Ceci signie que X peut prendre les n k nk p q pour 0 k n. On constate valeurs 0, 1, . . . , n avec P(X = k) = k quavec n = 1, on retrouve B(1, p) = B(p). Exercice 4.1. (a) Vrier que PX est une mesure de probabilit. (b) Montrer que EX = np et VarX = npq.
31
32
4. VARIABLES ALATOIRES USUELLES
Solution. Nous donnons seulement la solution de EX = np. Nous avons

n
EX
=
k=0
k
n
n! pk q nk k!(n k)! (n 1)! pk1 q nk (k 1)!(n k)! n 1 l n1l pq l
=
(a)
np
k=0 n
np
l=0
(b)
np(p + q)n1 np
o lon a eectu le changement de variable l = k 1 en (a) (on notera que n k = n 1 l) et utilis la formule du binme de Newton en (b). Une indication pour calculer VarX : commencer par calculer E[X(X 1)] en procdant dans le mme esprit que ce que nous venons de faire. Loi gomtrique. La variable alatoire X suit la loi gomtrique G(p) de paramtre 0 < p 1 si sa loi est PX =
q k1 pk
k=1
o comme prcdemment on pose q = 1 p. Ceci signie que X peut prendre les valeurs 1, 2, . . . avec P(X = k) = q k1 p pour k 1. Exercice 4.2. (a) Vrier que PX est une mesure de probabilit. (b) Montrer que EX = 1/p. Solution. On pose (q) = k=0 q k , 0 q < 1. On sait que n (q) = limn k=0 q k = limn (1 q n+1 )/(1 q) = 1/(1 q). De ce fait, PX (N) = p k=1 q k1 = p k=0 q k = p/(1 q) = 1, ce qui montre (a). Grce au Thorme C.3 de drivation sous le signe somme, en drivant terme d terme la srie k=0 q k on obtient k=1 kq k1 = (q) et puisque (q) = dq (1/(1 q)) = 1/(1 q)2 , on voit que EX = k=1 kq k1 p = p/(1 q)2 = 1/p. Loi de Poisson. La variable alatoire X suit la loi de Poisson P() de paramtre > 0 si sa loi est k PX = e k . k!
k=0
Ceci signie que X peut prendre les valeurs 0, 1, 2, . . . avec P(X = k) = e k /k! pour k 0 avec la conventions habituelles 0 = 1 et 0! = 1 de sorte que P(X = 0) = e . Exercice 4.3. (a) Vrier que PX est une mesure de probabilit. (b) Montrer que EX = VarX = .
4.2. EXEMPLES DE VARIABLES ALATOIRES CONTINUES
33
Solution. Commenons par rappeler que pour tout rel x (4.4) ex =

l0
xl l
k0
On en dduit immdiatement que PX (N) = e Montrons que EX = . Nous avons EX =

k0
k /k! = e e = 1. k k!
ke
k = k!
ke
k1
= e
k1
(k 1)! l = e e = l!
k1
= e
l0
o lon a eectu le changement de variable l = k 1 et utilis la formule (4.4). Calculons de faon similaire E[X(X 1)] =
k0
k(k 1)e
k = k!
k2
k(k 1)e
k k!
= 2 e
k2
(k 2)! l = 2 e e = 2 l!
k2
= 2 e
l0
On en dduit que VarX = E[X(X 1)] + EX (EX)2 = 2 + 2 = . Exercice 4.5. En vous inpirant de la solution prcdente, montrer que pour tout entier k 1, E[X(X 1) (X k + 1)] = k . 4.2. Exemples de variables alatoires continues Nous prsentons dans cette section les lois uniformes, exponentielles, normales, Gamma et de Cauchy. Loi uniforme. Nous avons dj rencontr la variable U de loi uniforme sur [0, 1]. Ses fonctions de rpartition et de densit sont 0 si u 0 u si 0 u 1 FU (u) = et fU (u) = 1(0u1) , u R. 1 si u 1 z z 1 1
z = FU (u)
z = fU (u)
34
Une variable alatoire X suit une loi uniforme sur [a, b] si elle a la mme loi (cest-dire la mme fonction de rpartition) que a + (b a)U. Ses fonctions de rpartition et de densit (voir (3.37)) sont si x a 0 1(axb) (x a)/(b a) si a x b , x R. F (x) = et f (x) = ba 1 si x b z z 1 1/(b a)
| | | |
a z = F (x)
z = f (x)
On note Ua,b la loi uniforme sur [a, b].
Exercice 4.6. Vrier que E(X) = (a + b)/2 et que Var(X) = (b a)2 /12.
Loi exponentielle. Une variable alatoire X suit la loi exponentielle de paramtre , note E(), si ses fonction de rpartition et fonction de densit sont F (x) = z 1 0 1 ex si x 0 si x 0 et f (x) = 1(x0) ex , z
|
x R.
0 z = F (x)
0 z = f (x)
Exercice 4.7. Vrier que E(X) = 1/ et que Var(X) = 1/2 . Cette variable alatoire sert souvent modliser des temps dattente. Elle intervient de faon fondamentale dans la construction des processus de Markov temps continu que lon rencontre lors de la modlisation de systme de les dattente (rseaux informatiques, guichets, etc. . .). Loi normale. Cest probablement la loi continue la plus importante. On lappelle aussi loi de Gauss ou loi gaussienne. On dit quune variable alatoire Z suit une loi normale centre rduite si sa fonction de densit est 1 z2 fZ (z) = exp , zR 2 2 Cette loi est note N (0, 1).
35
v 1/ 2
|
Toutefois, on peut vrier que limy+ (y) = R fZ (z) dz = 1. Pour cela posons I = R fZ (z) dz. Nous avons par un simple jeu dcriture sur les variables dintgration I2 =
R
z 1 0 1 2 Reprsentation graphique de v = fZ (z) Il nexiste pas dexpression analytique de la fonction de rpartition de Z. On la note traditionnellement y z2 1 exp (4.8) (y) = P(Z y) = dz. 2 2 2
fZ (x) dx
R
fZ (y) dy =
R2
2
fZ (x)fZ (y) dxdy 1 2

0
=
(a)
1 2 1 2
0 0
ex
R2 2 0
/2 y 2 /2
dxdy =
e(x
R2 2
+y 2 )/2 0
dxdy
2
er
/2
rdrd =
1 2
er
/2
rdr
(b)
= =
eu du
o nous avons eectu en (a) : le changement de variables en coordonnes polaires : x = r cos , y = r sin avec r 0 et 0 < 2 de sorte que r2 = x2 + y 2 et dxdy est remplac par rdrd; en (b) : le changement de variable u = r2 /2. Puisque I > 0 et I 2 = 1, nous venons de montrer que (4.9) 1 2 ez
R
2
/2
dz =
R
fZ (z) dz = 1.
Exercice 4.10. Vrier que E(Z) = 0 et que Var(Z) = 1.
36
Solution. Lintgrale EZ = R zfZ (z) dz est nulle car la fonction z zfZ (z) 2 est impaire et intgrable. Donc EZ = 0 et VarZ = EZ 2 = 1 R z 2 ez /2 dz. On 2 eectue une intgration par parties uv = [uv] u v avec u (z) = zez /2 et 2 2 v(z) = z. Nous avons u(z) = ez /2 et v (z) = 1, de sorte que R z 2 ez /2 dz = 2 2 [zez /2 ]+ + R ez /2 dz = 0 + 2 R fZ (z) dz. On en dduit avec (4.9) que 2 EZ = 1.
L
2
Exercice 4.11. Montrer que Z = Z. fZ (x) dx = FZ (y) o nous avons utilis fZ (z) dz = fZ (x) dx = successivement la parit de fZ : fZ (z) = fZ (z) et le changement de variable x = z. Par consquent Z et Z ont la mme fonction de rpartition. Dfinition 4.12. De manire gnrale, une variable alatoire X est dite centre si E(X) = 0 et rduite si Var(X) = 1. Une variable alatoire X suit une loi normale de paramtres et 2 ( R, > 0) note N (, 2 ), si elle peut scrire sous la forme (4.13) X = + Z
y
Solution. Pour tout rel y, FZ (y) = P(Z y) = P(Z y) =

y y
fZ (z) dz =
o Z suit une loi N (0, 1). Cette loi est note N (, 2 ). Exercice 4.14. Vrier que E(X) = et que Var(X) = 2 . La fonction de rpartition de X est F (x) = P(X x) = P( + Z x) = P(Z (x )/) = ((x )/),
de sorte quavec f (x) = F (x), nous obtenons lexpression de la fonction de densit de X suivante : (4.15) f (x) = 1 2 2 exp (x )2 2 2 , x R.
La gure suivante donne la reprsentation graphique des densits de probabilit 2 2 des lois N (, 1 ) et N (, 2 ) avec 0 < 1 < 2 . On constate que ces densits sont symtriques par rapport la moyenne et que les aires situes entre les courbes et 2 laxe des x sont les mmes pour les deux densits. De plus, la densit de N (, 1 ) 2 est plus concentre autour de la moyenne que celle de N (, 2 ).
37
2 N (, 1 )
Lexercice suivant permet de donner une approximation de la fonction de rpartition dnie en (4.8) bien quon nen connaisse pas dexpression analytique exacte. Exercice 4.16. Pour tout y > 0, nous avons (a) P(Z y) = 1 (y) (b) P(|Z| y)
2ey /2 . y 2
2
1 2
2 N (, 2 )
+ 1 + 2
ey /2 y 2
et
Solution. En remarquant que z/y 1 pour tout z y, nous avons P(Z y) = =

y y
2 1 ez /2 dz 2 1 z z2 /2 1 e dz = 2 y y 2 2
zez
/2
dz
2 ey /2 1 [ez /2 ] = y y 2 y 2
ce qui prouve (a). On en dduit (b) en remarquant que P(|Z| y) = P(Z y) + P(Z y) = P(Z y) + P(Z y) = 2P(Z y) puisque Z a la mme loi que Z, voir lExercice 4.11. Notons que les majorations de lexercice prcdent sont trs mauvaises pour y proche de 0, puisquelles sont en 1/y au voisinage zro. En revanche ces estimes samliorent beaucoup pour des grandes valeurs de y. On trouve P(|Z| 3) 0, 0533 ainsi que P(|Z| 4) 0, 0021, P(|Z| 5) 3105 et P(|Z| 6) 2107 . En pratique, cest--dire plus de 997 fois sur 1000, Z prend ses valeurs entre -4 et 4.
38
Loi gamma. On dit quune variable alatoire X suit une loi gamma de paramtres , t > 0, note (, t), si sa fonction de densit est 1 t t1 x x e , x R. f (x) = 1(x0) (t) La constante de normalisation est la fonction gamma (t) =
0
xt1 ex dx.
Si t = 1, on retrouve la loi exponentielle de paramtre . Dans le cas o = 1/2 et t = d/2 pour un entier d, on dit que X suit la loi du khi-deux d degrs de libert, note 2 (d).
2 (3)
2 (4)
Densits de lois de 2 Observer la pente lorigine de ces trois densits.
2 (d); d 5
Loi de Cauchy. On dit quune variable alatoire X suit une loi de Cauchy si sa fonction de densit est donne par 1 (4.17) f (x) = , x R. (1 + x2 )
0 Densit de la loi de Cauchy
Exercice 4.18. Montrer que E(|X|) = +. Calculer E(1(aXa) X) et E(1(aX2a) X). Peut-on donner un sens E(X) ? Loi bta. On dit quune variable alatoire X suit une loi bta de paramtres a, b > 0, note (a, b), si sa fonction de densit est 1 f (x) = 1(0x1) xa1 (1 x)b1 , x R. B(a, b) La constante de normalisation est
1
B(a, b) =
0
xa1 (1 x)b1 dx.
39
Si a = b = 1 on retrouve la loi uniforme sur [0, 1]. Exercice 4.19. Vrier que B(a, b) = (a)(b)/(a + b).
CHAPITRE 5
Fonctions gnratrices et caractristiques

Nous allons prsenter des mthodes ecaces pour calculer les moments de certaines lois, ainsi que les lois de sommes de variables indpendantes. Nous commenons par tudier les variables alatoires valeurs entires, puis les variables gnrales. Rappelons que le moment dordre k de la variable alatoire X est E(X k ), voir la Dnition 3.33. Les principaux rsultats abstraits concernant les moments sont prsents en Chapitre 12. Dans ce qui suit on notera f (k) la drive dordre k de la fonction f. 5.1. Le cas des variables entires On dit quune variable alatoire X est entire si elle prend ses valeurs dans lensemble N des nombres entiers. sa loi est donc de la forme PX = n0 pn n . Cest le cas des variables binomiales, gomtriques et de Poisson. Dfinition 5.1. Soit X une variable entire. Sa fonction gnratrice est dnie pour tous 0 t 1 par GX (t) = E(tX ). On remarque que puisque 0 t 1 et X est entier, nous avons 0 tX 1 de sorte que 0 E(tX ) 1 est bien dni. En notant pn = P(X = n), n N, nous obtenons bien sr (5.2) GX (t) =
n0
pn t n = p0 +
n1
pn t n ,
0t1
avec GX (1) = E(1) = 1 et GX (0) = p0 . Cette dernire galit est une convention puisque GX (0) = p0 00 : nous avons choisi de prendre 00 = 1. Cette convention est justie du fait quelle garantit la continuit de GX (t) en t = 0. En eet, grce au Thorme C.2, puisque 0 tX 1 est born, limt0 GX (t) = p0 + limt0 n=1 pn tn = p0 + n=1 0 = p0 . Proposition 5.3. Pour tout entier k 1 tel que E(X k ) < , nous avons o GX (1) est la drive gauche dordre k de GX en 1. On remarque que puisque X ne prend que des valeurs entires, X(X1) (X k + 1) = 0 si X {0, . . . , k 1} de sorte que X(X 1) (X k + 1) 0. On appelle E[X(X 1) (X k + 1)] le k-ime moment factoriel de X. Dmonstration. Du fait que E(X k ) < , nous avons aussi grce la Proposition 3.34 : E(X l ) < pour tous 1 l k. Ce qui implique clairement que E[X(X 1) (X l + 1)] < pour tous 1 l k.
41 (k) (k)
E[X(X 1) (X k + 1)] = GX (1)
42
5. FONCTIONS GNRATRICES ET CARACTRISTIQUES
Commenons par le cas k = 1 sous lhypothse EX < . On peut donc appliquer le thorme de drivation sous le signe somme nonc au Thorme C.3 pour obtenir G (1) = n1 pn ntn1 |t=1 = n1 pn n puisque EX = n1 pn n < . X En recommenant, on montre de mme que G (1) = n2 pn n(n 1)tn2 |t=1 = X n2 pn n(n 1) sous lhypothse n2 pn n(n 1) = E[X(X 1)] < . En drivant k fois, nous obtenons GX (1) =
nk (k)
pn n(n 1) (n k + 1) = E[X(X 1) (X l + 1)]
sous lhypothse E[X(X 1) (X l + 1)] < . Exemples 5.4. (a) La loi de Bernoulli B(p) de paramtre 0 p 1 est PX = q0 +p1 o q = 1p. Par consquent, pour tout 0 t 1, GX (t) = qt0 + pt1 = q + pt. On a bien sr, GX (0) = q, GX (1) = q + p = 1 et EX = G (1) = p. X (b) La loi binomiale B(n, p) de paramtres n 1 et 0 p 1 est n k nk p q k k n n de sorte que GX (t) = k=0 pk q nk tk = k=0 (pt)k q nk = (q +pt)n en utilisant la formule du binme de Newton. Avec n = 1, on retrouve la formule prcdente pour B(p). On obtient EX = G (1) = np(q + pt)n1 t=1 = np(q + p) = np ainsi que X E[X(X 1)] = G (1) = n(n 1)p2 (q + pt)n2 t=1 = n(n 1)p2 . On en dduit X que Var(X) = E[X(X 1)] + EX (EX)2 = n(n 1)p2 + np (np)2 = npq.
n k=0
(d) La loi gomtrique G(p) est n1 q n1 pn . Par consquent GX (t) = n1 q n1 ptn = pt n1 (qt)n1 = pt n0 (qt)n = pt/(1qt). On obtient donc EX = G (1) = X [p(1 qt) + pqt]/(1 qt)2 |t=1 = 1/p. Comme le montre le rsultat suivant, la fonction gnratrice permet de retrouver la loi de X.
n (c) La loi de Poisson P() de paramtre > 0 est /n! n de sorte n0 e que GX (t) = e n0 n /n! tn = e n0 (t)n /n! = e et = e(t1) . On a EX = G (1) = e(t1) |t=1 = , ainsi que E[X(X 1)] = G (1) = X X 2 e(t1) |t=1 = 2 . On en dduit que Var(X) = E[X(X 1)] + EX (EX)2 = 2 + 2 = .
o GX (0) est la drive n-ime droite de GX en 0.
Proposition 5.5. Soit X une variable alatoire entire de fonction gnratrice GX . Nous avons (n) pn = GX (0)/n!, n 0
(n)
GX (0) = pn n! + 0.
Dmonstration. La preuve est analogue celle de la Proposition 5.3. En (n) drivant n fois terme terme la srie (5.2), on obtient GX (t) = k=n pk k(k 1) (k n + 1)tkn = pn n! + k=n+1 pk k(k 1) (k n + 1)tkn et en t = 0 :
(n)
De ce fait GX caractrise la loi de la variable entire X. (n) Un dveloppement illimit formel en t = 0 de GX donne GX (t) = n0 GX (0)/n! tn (un tel dveloppement sappelle un dveloppement en srie entire). La proposition
5.2. FONCTIONS CARACTRISTIQUES
43
prcdente exprime que lon peut identier terme terme cette srie formelle avec la srie (5.2) : GX (t) = n0 pn tn . 5.2. Fonctions caractristiques On considre maintenant une variable X gnrale. On cherche une fonction analogue GX qui permette de calculer aisment laide de drivations successives les moments de X. La gnralisation naturelle de la fonction X tX lorsque X peut prendre des valeurs non-entires sobtient en posant t = es ce qui nous donne X esX . De sorte que la gnralisation de GX (t) = EtX est LX (s) = EesX . Dfinitions 5.6. (1) La transforme de Laplace de la loi de X est dnie par s R LX (s) = EesX [0, ] (2) La transforme de Fourier de la loi de X est dnie par o i est le nombre imaginaire tel que i2 = 1. On appelle aussi X la fonction caractristique de la loi de X. Remarques 5.7. (1) Puisque esX 0, son esprance LX (s) = EesX est toujours dnie dans [0, ] (en incluant la valeur +). s R X (s) = EeisX C
(2) De mme, eisX = cos(sX) + i sin(sX) est une variable borne et son esprance X (s) = EeisX = E[cos(sX)] + iE[sin(sX)] est un nombre complexe bien dni puisque ses parties relle et imaginaire sont intgrables puisque bornes. (3) En particulier, la fonction caractristique X (s) est dnie pour tout rel s alors quon peut avoir LX (s) = + pour tout s non nul comme par exemple lorsque X suit une loi de Cauchy, voir (4.17). (4) Lorsque X est une variable entire, nous avons LX (s) = GX (es ) et X (s) = GX (eis ), s R.
Thorme 5.8.
(1) On suppose quil existe so > 0 tel que Eeso |X| < . Alors, pour tout k 1, E|X|k < et (k) E(X k ) = LX (0). (2) Sous les mmes hypothses quen (1), nous avons (ln LX ) (0) = EX et (ln LX ) (0) = VarX.
(k)
(3) Si E|X|k < alors X est k fois direntiable et EX k = (i)k X (0). La premire assertion du thorme montre que lhypothse Eeso |X| < faite en (1) et (2) est bien plus restrictive que celle faite en (3). Ceci justie lusage de la fonction caractristique plutt que celui de la transforme de Laplace dans certaines situations. Notons que les calculs sont essentiellement les mmes avec LX et X du fait que formellement X (s) = LX (is).
44
5. FONCTIONS GNRATRICES ET CARACTRISTIQUES
Dmonstration. Cest une application directe du Thorme C.3 de drivation sous le signe somme. Preuve de (1). Pour tout k, il existe c > 0 tel que |x|k c + eso |x| , x R. Par consquent, E|X|k c + Eeso |X| < . La drive k-ime de s esX est X k esX . Or nous avons |X k esX | = |X|k esX c + eso |X| ds que |s| s1 avec 0 < s1 < so pour une certaine constante c. Sous notre hypothse, nous avons E|X k esX | c + Eeso |X| < pour tout s tel que |s| s1 , ce qui permet dappliquer le Thorme C.3 de drivation en s = 0 (avec (k) Y = c + eso |X| ). Ceci nous donne LX (0) = E(X k e0.X ) = EX k qui est le rsultat annonc. Preuve de (2). Nous avons (ln LX ) = L /LX et (ln LX ) = L /LX L2 /L2 . X X X X En particulier en 0, nous obtenons grce (1), (ln LX ) (0) = L (0)/LX (0) = X EX puisque LX (0) = 1 et (ln LX ) (0) = L (0)/LX (0) L2 (0)/L2 (0) = EX 2 X X X (EX)2 = VarX. Preuve de (3). Elle est analogue celle de la seconde partie de (1). La drive k-ime de s eisX est ik X k eisX . Or nous avons |ik X k eisX | = |X|k pour tout s et nous faisons lhypothse que E|X|k < . laide du Thorme C.3 de drivation en (k) s = 0 nous obtenons X (0) = E(ik X k e0.X ) = ik EX k qui est le rsultat annonc. Remarque 5.9. Le dveloppement formel en srie entire de LX : LX (s) = (k) (k) k k0 LX (0)s /k!, peut nous permettre didentier rapidement les drives LX (0) lorsquon en connat lexpression LX (s) = k0 ak sk . Nous avons alors LX (0) = k!ak , k 0. Un raisonnement analogue fonctionne lorsquon ne connat quun dveloppement K limit en 0 lordre K : LX (s) = k=0 ak sk +sk (s), pour identier les K premires drives en 0 de LX . Exemples 5.10. (a) Loi de Poisson P(). En reprenant lExemple 5.4-(c), avec la Remarque 5.7-(4) nous obtenons LX (s) = exp((es 1)) donc ln LX (s) = (es 1) de sorte que (ln LX ) (s) = (ln LX ) (s) = es . Avec le Thorme 5.8-(2) on retrouve EX = VarX = . (b) Loi gomtrique G(p). En reprenant lExemple 5.4-(d), avec la Remarque 5.7-(4) nous obtenons LX (s) = pes /(1 qes ) donc ln LX (s) = ln p + s ln(1 qes ) de s s 2 2s sorte que (ln LX ) (s) = 1+qes /(1 qes ) et (ln LX ) (s) = qe (1qe )+q e . Avec (1qes )2 le Thorme 5.8-(2) on retrouve EX = 1/p et on obtient VarX = (qp+q 2 )/p2 = (1 p)/p2 . (c) Loi exponentielle E(). Puisque fX (x) = 1{x0} ex, nous avons LX (s) = 0 esx ex dx = 0 e(s)x dx. Cette intgrale est convergente si et seulement si s < et dans ce cas LX (s) = /( s). Nous sommes bien dans les conditions dapplication du Thorme 5.8-(1). Lorsque |s|/ < 1, nous avons k k! LX (s) = 1/(1 s/) = k0 (s/)k = k0 s k . En tenant compte de la k! Remarque 5.9, nous obtenons LX (0) = k!/k , donc EX k = k!/k .
(k) (k)
Compte tenu de limportance des variables alatoires normales nous isolons le calcul de leurs transformes de Laplace et fonctions caractristiques.
5.2. FONCTIONS CARACTRISTIQUES
45
Proposition 5.11. (1) Soit Z une variable alatoire normale standard : Z N (0, 1). Nous avons 2 2 pour tout rel s, LZ (s) = es /2 et Z (s) = es /2 . (2) Soit X une variable alatoire normale de loi N (, 2 ). Nous avons pour 2 2 2 2 tout rel s, LX (s) = es+ s /2 et X (s) = eis s /2 . Dmonstration. Preuve de (1). Nous ne donnons que la preuve concernant LZ en admettant que le lien formel X (s) = LX (is) est rigoureux dans ce cas. Cette identit ncessite la notion de prolongement analytique (prolongement de R C) qui nest pas du niveau de ce cours. Pour tout rel s, 2 1 esz ez /2 dz LZ (s) = 2 R 2 1 eszz /2 dz = 2 R 1 1 (z2 2sz+s2 ) s2 /2 e 2 = e dz 2 R 2 2 1 1 e 2 (zs) dz = es /2 2 R = es
2
/2
1 2
o la dernire galit provient de R 1 e 2 (zs) dz = 1, la condition de normali2 sation de la densit N (s, 1), voir (4.15). 2 En admettant Z (s) = LZ (is), on voit que Z (s) = es /2 . Preuve de (2). Grce (4.13) nous avons X = + Z de sorte que LX (s) = Ees(+Z) = es LZ (s) et X (s) = Eeis(+Z) = eis Z (s).
CHAPITRE 6
Couples alatoires
Beaucoup dnoncs probabilistes intressants sexpriment laide dune paire de variables alatoires X, Y. Nous allons tudier le problme de leur variation conjointe sur le mme domaine . Dans tout ce qui va suivre, les variables alatoires sont dnies sur le mme espace probabilis (, A, P). 6.1. Lois jointe et marginales La loi du couple (X, Y ) est la mesure de probabilit PX,Y sur R2 qui est spcie par pour tous intervalles A et B. On appelle lois marginales du couple (X, Y ) les lois PX et PY de X et de Y. Nous avons pour tous intervalles A et B, PX (A) = PX,Y (A R) PY (B) = PX,Y (R B) Pour distinguer la loi PX,Y des lois marginales, on lappelle parfois la loi jointe de (X, Y ). Exemple 6.1. Soit un couple alatoire (X, Y ) qui prend les valeurs (1, 3), (1, 4) et (2, 4) avec les probabilits respectives 1/4, 1/8 et 5/8. y (3/4) (1/4)
(1/8) (5/8)
PX,Y (A B) = P(X A et Y B)
4 3
(1/4)
1 2 (3/8) (5/8)
5 3 5 1 Sa loi est PX,Y = 4 (1,3) + 1 (1,4) + 8 (2,4) . Ses lois marginales sont PX = 8 1 + 8 2 8 1 3 et PY = 4 3 + 4 4 .
6.2. Fonction de rpartition Nous introduisons une notion de fonction de rpartition dun couple de variables alatoires analogue celle des variables relles. Dfinitions 6.2. Une application (X, Y ) : R2 est un couple alatoire si pour tout x, y R, lensemble { ; X() x et Y () y} appartient A.
47
48
6. COUPLES ALATOIRES
La fonction de rpartition jointe de (X, Y ) est la fonction FX,Y : R2 [0, 1] donne par FX,Y (x, y) = P(X x, Y y). On montre aisment que pour tous a b, c d R P(a < X b, c < Y d) = FX,Y (b, d) FX,Y (a, d) FX,Y (b, c) + FX,Y (a, c). y a b x
d + c +
En dautres termes, nous pouvons valuer la probabilit que le point alatoire (X, Y ) "tombe" dans la rgion rectangulaire ]a, b]]c, d] du plan R2 . En travaillant de faon analogue la Proposition 2.9, on rcupre les probabilits de tomber dans des rgions rectangulaires quelconques, puis leurs runions dnombrables, etc. . . De l en aiguille, il est possible de montrer, grce aux proprits des mesures de probabilit, lassertion suivante : Proposition 6.3. FX,Y spcie de manire unique P((X, Y ) C) pour toutes les parties ouvertes C de R2 . En dautres termes, FX,Y spcie entirement le loi jointe PX,Y . Les fonctions de rpartition marginales de X et de Y sont FX (x) = P(X x) = lim P(X x et Y n)
n
= FX,Y (x, ) := lim FX,Y (x, y),

y
FY (y) = P(Y y) = lim P(X n et Y y)

n
= FX,Y (, y) = lim FX,Y (x, y),

x
On constate que, mme sur lExemple 6.1 qui est trs simple, la fonction de rpartition FX,Y est pnible expliciter. En eet, elle ncessite de dcouper le plan en 5 zones rectangulaires. Nous nemploierons donc que trs peu souvent les fonctions de rpartition dans les calculs explicites.
6.3. INDPENDANCE
49
6.3. Indpendance Deux variables alatoires discrtes X et Y sont dites indpendantes si pour tous x, y R, P(X = x et Y = y) = P(X = x)P(Y = y). Il est clair que cette dnition de lindpendance ne peut pas tre conserve si lune au moins des variables (par exemple X) est continue, puisque dans ce cas P(X = x) = 0, pour tout x R. Nous adopterons la dnition gnrale suivante. Dfinition 6.4. Les variables alatoires X et Y sont dites indpendantes si P(X x et Y y) = P(X x)P(Y y), x, y R.
On vrie que pour des variables alatoires discrtes, cette dnition de lindpendance est quivalente celle rappele plus haut. Une formulation quivalente est : X et Y sont indpendantes si et seulement si FX,Y (x, y) = FX (x)FY (y), x, y R.
Proposition 6.5. Soient X et Y deux variables alatoires indpendantes. Alors pour toute runion dnombrable dintervalles A et B, nous avons P(X A et Y B) = P(X A)P(Y B) et pour toutes fonctions numriques continues par morceaux et , les variables alatoires (X) et (Y ) sont indpendantes. Notons que lorsque X et Y sont des variables discrtes dont toutes les valeurs sont isoles, toutes les fonctions et sont continues (en restriction X() et Y ()). Ide de la preuve. Nous navons pas les outils susants pour donner une preuve complte (donc une preuve) de ce rsultat. Notons toutefois quil est possible de montrer, de faon similaire la preuve de la Proposition 6.3, que X et Y sont indpendantes si et seulement si pour toutes runions dnombrables de parties ouvertes A et B de R, P(X A et Y B) = P(X A)P(Y B). Maintenant, nous pouvons crire pour toute paire douverts A, B : P (X) A et (Y ) B = P X 1 (A) et Y 1 (B) = P X 1 (A) P Y 1 (B) = P((X) A)P((Y ) B) o lavant-dernire galit est une consquence de lindpendance de X et Y et du fait que et sont continues par morceaux, les ensembles 1 (A) et 1 (B) sont des runions dnombrables douverts. Cette notion mathmatique de lindpendance est cohrente avec la notion intuitive que nous en avons. Pour tayer cette armation, donnons-en une illustration simple. Nous avons deux urnes contenant des boules de couleur numrotes. La premire urne contient 5 boules numrotes : 1,2,3,4 et 5. Les boules 1,2,3 sont jaunes et les boules 4,5 sont rouges. La deuxime urne contient 3 boules numrotes : a,b,c. Les boules a,b sont vertes et la boule c est bleue.
50
On note X et Y les numros alatoires des boules tires au hasard dans la premire et la seconde urne. On suppose que ces tirages sont uniformes sur {1, 2, 3, 4, 5} et {a, b, c}. De mme, on note U et V les couleurs alatoires des boules tires au hasard dans la premire et la seconde urne : U = (X) et V = (Y ) avec (1) = (2) = (3) = jaune, (4) = (5) = rouge, (a) = (b) = vert et (c) = bleu. On a donc P(X = jaune) = 3/5, P(X = rouge) = 2/5 ainsi que P(Y = vert) = 2/3, P(Y = bleu) = 1/3. Si de plus ces tirages sont indpendants (au sens habituel du terme), on navantage aucun couple de boules au dtriment dautres : la loi de (X, Y ) est uniforme sur {1, 2, 3, 4, 5} {a, b, c}. On constate qualors X et Y sont des variables alatoires indpendantes au sens mathmatique. En eet, pour tous A {1, 2, 3, 4, 5} et B {a, b, c}, P((X, Y ) AB) = card(AB) card({1, 2, 3, 4, 5} {a, b, c}) card(A)card(B) = card({1, 2, 3, 4, 5}) card({a, b, c}) card(A) card(B) = 5 3 = P(X A)P(Y B)
En particulier, en prenant A = 1 (jaune) = {1, 2, 3} et B = 1 (vert) = {a, b} on obtient P(U = jaune, V = vert) = P((X, Y ) {1, 2, 3}{a, b}) = P(X {1, 2, 3})P(Y {a, b}) = P(U = jaune)P(V = vert) et de mme pour les autres couleurs. Ce qui prouve lindpendance mathmatique de U et V. Mais il est clair que si les tirages dans les deux urnes sont indpendants (au sens habituel) il en est de mme pour les couleurs des boules tires. Exercice 6.6. Soient X et Y deux variables alatoires indpendantes de fonctions de rpartition FX et FY . Dterminer les lois de U = max(X, Y ) et V = min(X, Y ). Solution. Du fait que pour tout t R, max(x, y) t (x t et y t), FU (t) = P({X t} {Y t}) = P(X t)P(Y t) = FX (t)FY (t) o lon a fait usage de lindpendance dans lavant-dernire galit. De mme, pour tout t R, min(x, y) > t (x > t) et (y > t), donc 1 FV (t) = P(min(X, Y ) > t) = P({X > t} {Y > t}) = P(X > t)P(Y > t) = [1 FX (t)][1 FY (t)] = P(max(X, Y ) t)
6.4. COUPLES DISCRETS
51
do ce qui dtermine la loi de V. FV (t) = 1 [1 FX (t)][1 FY (t)], t R.
Exemple 6.7. On se donne deux variables alatoires X et Y indpendantes de lois exponentielles E() et E(). Calculons laide de lexercice prcdent les lois de U = max(X, Y ) et V = min(X, Y ). Nous avons pour tout t 0, FX (t) = FY (t) = 0 et pour tout t 0, FX (t) = 1et , FY (t) = 1 et . Par consquent pour tout t > 0, fU (t) et 1 FV (t) = = et et = e(+)t [1 FX (t)][1 FY (t)]
= FU (t) = fX (t)FY (t) + FX (t)fY (t)
= et (1 et ) + et (1 et )
Pour tout t 0, FU (t) = FV (t) = 0. On constate que V = min(X, Y ) admet la loi exponentielle E( + ). 6.4. Couples discrets Soit un couple de variables alatoires (X, Y ) prenant ses valeurs dans lensemble produit X Y avec X = {x1 , . . . , xL } et Y = {y1 , . . . , yK }. Pour tout indice n = (l, k) N := {1, . . . , L}{1, . . . , K}, on note zn = (xl , yk ). Cet ensemble tant ni, le couple Z = (X, Y ) est une variable alatoire discrte valeurs dans X Y. Elle est donc de la forme PX,Y = PZ = nN pn zn = 1lL,1kK pl,k (xl ,yk ) avec pl,k = P((X, Y ) = (xl , yk )) = P(X = xl et Y = yk ). Pour plus de clart, on note pl,k = pX,Y (xl , yk ) et on peut regrouper lensemble de ces probabilits lmentaires en un tableau matriciel : y1 y2 yK Y x1 pX,Y (x1 , y1 ) pX,Y (x1 , y2 ) pX,Y (x1 , yK ) pX (x1 ) x2 pX,Y (x2 , y1 ) pX,Y (x2 , y2 ) pX,Y (x2 , yK ) pX (x2 ) . . . . . . . . . . . . . . . xL pX,Y (xL , y1 ) pX,Y (xL , y2 ) pX,Y (xL , yK ) pX (xL ) X pY (y1 ) pY (y2 ) pY (yK ) 1 dont lintrieur dcrit la loi jointe de (X, Y ). Les lois marginales sont donnes par PX = 1lL pX (xl )xl et PY = 1kK pY (yk )yk avec pX (xl ) pY (yk ) =
1kK
pX,Y (xl , yk ), pX,Y (xl , yk ),

1lL
1lL 1kK
puisque pX (xl ) = P(X = xl ) = P(X = xl et Y Y) = P((X, Y ) {xl } Y) = 1kK P(X = xl et Y = yk ) et de mme pour pY (yk ). Par consquent la dernire ligne du tableau est constitue des sommes par colonnes et la dernire colonne des sommes par lignes : les marges du tableau spcient les lois marginales PX et PY .
52
De faon plus gnrale, soient X et Y deux variables alatoires valeurs dans des ensembles dnombrables X et Y. Alors le couple (X, Y ) est valeurs dans lensemble dnombrable X Y (voir la Proposition A.4) et sa loi jointe est de la forme pX,Y (x, y)(x,y) . PX,Y =
xX ,yY
et on montre comme prcdemment la Proposition 6.8. Les lois marginales sont PX = pY (y)y avec pX (x) =
yY xX
pX (x)x et PY =
yY
pX,Y (x, y), pX,Y (x, y),

xX
xX y Y.
pY (y) =
Exemple 6.9. Considrons les deux lois jointes spcies par les tableaux suivants : 1 -1 0,1 2 0,45 X 0,55 3 Y 0,2 0,3 0,25 0,7 0,45 1 -1 2 X 1 3 0,2 0,1 0,35 0,35 0,55 0,45 Y 0,3 0,7 1
On constate que ces deux lois jointes sont distinctes bien quelles possdent les mmes lois marginales. Par consquent la loi jointe PX,Y nest pas spcie par la donne des deux lois marginales PX et PY . Il y a plus dinformation dans lintrieur du tableau que sur les marges. Proposition 6.10. Soit (X, Y ) de loi PX,Y = xX ,yY pX,Y (x, y)(x,y) . Les variables X et Y sont indpendantes si et seulement sil existe deux fonctions q : X [0, 1] et r : Y [0, 1] telles que pour tous x X et y Y nous avons pX,Y (x, y) = q(x)r(y). Dans ce cas, nous avons aussi pX,Y (x, y) = pX (x)pY (y), x X , y Y.
Dmonstration. Cest une consquence directe de la Proposition 6.5 en prenant A = {x} et B = {y} avec x X et y Y. Notons aussi que lorsque pX,Y (x, y) = q(x)r(y), pX (x) = aq(x) pour tout x avec a = yY pY (y) = yY r(y). De mme pour tout y, pY (y) = br(y) avec 1 = b yY r(y) = ab. Finalement, r(x)q(y) = pX (x)pY (y)/(ab) = pX (x)pY (y). Exemple 6.11. Considrons la loi jointe spcie par le tableau -1 2 X 1 3 0,165 0,135 0,385 0,315 0,55 0,45 Y 0,3 0,7 1
On constate quil possde la structure produit pX,Y (x, y) = pX (x)pY (y), x, y. Les variables X et Y sont donc indpendantes. On note que les lois marginales PX et PY sont les mmes que celles de lExemple 6.9.
6.4. COUPLES DISCRETS
53
Puisque le couple discret (X, Y ) est une variable discrte valeurs dans lensemble dnombrable X Y (voir la Proposition A.4) lesprance de (X, Y ) est donne par le Thorme 3.10 qui dans ce cas prcis scrit (6.12) E(X, Y ) =
xX ,yY
(x, y)pX,Y (x, y)
et qui est correctement dnie ds lors que E|(X, Y )| = xX ,yY |(x, y)|pX,Y (x, y) < . On obtient immdiatement la Proposition 6.13 (Linarit et croissance). (1) En particulier, avec (x, y) = ax + by, nous obtenons la linarit de lesprance E(aX + bY ) = aEX + bEY, a, b R pour toute variables alatoires X et Y telles que E|X| < et E|Y | < . Plus gnralement pour toutes fonctions et telles que E|(X, Y )| < et E|(X, Y )| < et tous rels a, b, nous avons E[a(X, Y ) + b(X, Y )] = aE(X, Y ) + bE(X, Y ). (2) Si les fonctions , : X Y R sont telles que , alors E(X, Y ) E(X, Y ). Dfinition 6.14. Nous dnissons la covariance de (X, Y ) par cest--dire Cov(X, Y ) := E[(X EX)(Y EY )] Cov(X, Y ) =
xX ,yY
(x EX)(y EY )pX,Y (x, y).
On dit que X et Y sont dcorelles si Cov(X, Y ) = 0. Noter que, tout comme lesprance, la covariance nest pas toujours dnie. Il faut pour cela que xX ,yY |(x EX)(y EY )|pX,Y (x, y) < . On montrera au Corollaire 6.36 quune condition susante est que E(X 2 ) < et E(Y 2 ) < . Un simple calcul nous mne Proposition 6.15. Soient X et Y deux variables alatoires discrtes indpendantes. (1) Pour toutes fonctions sur X et sur Y telles que E|(X)| < et E|(Y )| < , nous avons E[(X)(Y )] = E[(X)]E[(Y )]. (2) Si E|X| < et E|Y | < alors Cov(X, Y ) = 0. E[(X)(Y )] =
xX ,yY
Cov(X, Y ) = E(XY ) E(X)E(Y ).
Dmonstration. Preuve de (1). Avec la Proposition 6.10 nous avons (x)(y)pX (x)pY (y) (x)pX (x)
xX yY
(y)pY (y)
= E[(X)]E[(Y )]
54
qui est le rsultat annonc. Preuve de (2). Grce (1), nous avons E(XY ) = E(X)E(Y ) cest--dire Cov(X, Y ) = 0. Lexercice suivant montre que la rciproque de lassertion (2) de cette proposition est fausse. Exercice 6.16. (a) On considre le couple alatoire (X, Y ) dont la loi est uniforme sur les quatre points du plan (1, 0), (0, 1), (1, 0) et (0, 1). Montrer que Cov(X, Y ) = 0 mais que X et Y ne sont pas indpendantes. (b) On considre le couple alatoire (X, Y ) dont la loi est uniforme sur les huits points du plan daxes eik/4 , 0 k 7.
y 1
/4
x 1
Montrer que Cov(X, Y ) = 0 mais que X et Y ne sont pas indpendantes. Solution. Nous ne donnons que la solution de (a). Nous avons PX = PY = 1 + 1 0 + 4 1 de sorte que EX = EY = 0. De plus XY = 0, donc EXY = 0 2 et Cov(X, Y ) = 0. Dautre part X et Y ne sont pas des variables indpendantes 1 puisque P(X = 1)P(Y = 0) = 4 1 = 1/8 = 1/4 = P((X, Y ) = (1, 0)). 2
1 4 1
6.5. Couples continus Par analogie avec les variables alatoires continues, nous introduisons la notion suivante. Dfinition 6.17. Un couple alatoire (X, Y ) de fonction de rpartition jointe FX,Y est dit continu, sil existe une fonction intgrable fX,Y : R2 [0, [ telle que
x y
FX,Y (x, y) =

fX,Y (s, t) dsdt,
x, y R.
Dans ce cas, la fonction fX,Y est appele fonction de densit jointe du couple alatoire (X, Y ). On dduit de cette dnition que si FX,Y est continment drivable alors (6.18) fX,Y (x, y) = 2 FX,Y (x, y). xy
Proposition 6.19. Les lois marginales PX et PY admettent les densits fX (x) =

R
fX,Y (x, y) dy, fX,Y (x, y) dx,

R
xR yR
fY (y) =
6.5. COUPLES CONTINUS
55
Dmonstration. Nous avons vu que les fonctions de rpartition marginales de X et de Y sont FX (x) = FX,Y (x, ) et FY (y) = FX,Y (, y). En dautres termes, x FX (x) = R fX,Y (s, y) dy ds do il vient que fX (x) = R fX,Y (x, y) dy. De la mme manire, nous obtenons que la fonction de densit marginale de Y est fY (y) = R fX,Y (x, y) dx. Dfinition 6.20. Par analogie avec (6.12) et la dnition (3.18) qui est justie par le Thorme B.10, nous dnissons (sans plus de justication cette fois-ci) lesprance de la variable alatoire (X, Y ) par E(X, Y ) :=
R2
(x, y)fX,Y (x, y) dxdy

R2
pour toute fonction : R2 R telle que ||fX,Y soit intgrable et . On dduit immdiatement de cette dnition la Proposition 6.21 (Linarit et croissance).
|(x, y)|fX,Y (x, y) dxdy <
(1) En particulier, avec (x, y) = ax + by, nous obtenons la linarit de lesprance E(aX + bY ) = aEX + bEY, a, b R pour toute variables alatoires X et Y telles que E|X| < et E|Y | < . Plus gnralement pour toutes fonctions et telles que E|(X, Y )| < et E|(X, Y )| < , nous avons E[(X, Y ) + (X, Y )] = E(X, Y ) + E(X, Y ). (2) Si les fonctions , : R2 R sont telles que , alors E(X, Y ) E(X, Y ). Comme pour les couples discrets nous dnissons la covariance de (X, Y ) par Cov(X, Y ) := =
R2
E[(X EX)(Y EY )] (x EX)(y EY )fX,Y (x, y) dxdy.
Noter que, tout comme lesprance, la covariance nest pas toujours dnie. Nous verrons au Corollaire 6.36 quil sut pour cela E(X 2 ), E(Y 2 ) < . Comme le montre la proposition suivante, la fonction de densit jointe dun couple alatoire continu de variables indpendantes a une forme produit. Proposition 6.22. (1) Soit (X, Y ) un couple alatoire continu de fonction de densit jointe fX,Y . Sil existe des fonctions g et h telles que alors X et Y sont des variables alatoires indpendantes. De plus, la fonction de densit jointe scrit alors : fX,Y (x, y) = fX (x)fY (y). (2) Soient X et Y des variables alatoires indpendantes qui admettent des fonctions de densit fX et fY continues par morceaux. Alors la fonction de densit jointe de (X, Y ) est fX,Y (x, y) = fX (x)fY (y), x, y R. fX,Y (x, y) = g(x)h(y), x, y R,
56
Dmonstration. Preuve de (1). La premire partie de la proposition est presque immdiate. La forme fX,Y (x, y) = fX (x)fY (y) sobtient par un raisonnement analogue celui de la preuve de la Proposition 6.10. Preuve de (2). Du fait des hypothses, FX et FY sont des fonctions drivables partout sauf en un nombre ni de points. De ce fait, la fonction de rpartition jointe FX,Y (x, y) = FX (x)FY (y) est partout drivable, sauf sur la runion dun nombre ni de droites (dont laire est nulle et que lon peut exclure des intgrales doubles). En dehors de cet ensemble, on peut appliquer (6.18) qui nous donne fX,Y (x, y) = FX (x)FY (y) = fX (x)fY (y). Ce qui achve la preuve. Le rsultat suivant est une consquence immdiate de la proposition prcdente. Corollaire 6.23. Soit (X, Y ) un couple alatoire continu de variables indpendantes. (1) Si E|X|, E|Y | < , alors Cov(X, Y ) = 0. (2) Si E|(X)|, E|(Y )| < , alors E[(X)(Y )] = E(X)E(Y ). Dmonstration. Immdiate. Attention : Il existe des couples alatoires continus (X, Y ) de covariance nulle dont les composantes X et Y ne sont pas indpendantes. Exercice 6.24. Montrer, sans calculs explicites, que cest le cas pour le tirage alatoire uniforme dun point (X, Y ) du disque unit. Au fait, quelle peut bien tre la fonction de densit jointe de ce couple alatoire ? Exemple 6.25 (Laiguille de Buon). Les lignes dquations y = n (n Z), sont traces sur un plan et une aiguille de longueur unit est jete sur ce plan. Quelle est la probabilit quelle intersecte lune des lignes ? On suppose que laiguille na pas de prfrence de position ni de direction. Cherchons la solution de ce problme. Soient (X, Y ) les coordonnes du centre de laiguille et langle, modulo , de laiguille avec laxe des x. On note Z = Y Y (Y est la partie entire de Y ) la distance du centre de laiguille la ligne immdiatement en-dessous de lui. Nos hypothses se traduisent par (a) Z est distribu uniformment sur [0, 1] : fZ = 1[0,1] . (b) est distribu uniformment sur [0, ] : f =
1 1[0,] .
(c) Z et sont indpendantes : fZ, (z, ) = fZ (z)f (). Par consquent, (Z, ) a pour fonction de densit jointe f (z, ) = 1 1(0z1,0) .
A laide dun dessin, on constate quil y a intersection si et seulement si Z I avec I= (z, ) [0, 1] [0, ]; z 1 1 sin ou 1 z sin . 2 2
6.5. COUPLES CONTINUS
57
z 1 1 (sin )/2
1/2 0
(sin )/2
Le lieu des centres possibles de laiguille impliquant une intersection est en rouge. Par consquent, P(intersection) =
I
f (z, ) dzd 1
0 0
1 2
sin
= =
dz +
1 1 sin 2
dz
2/.
Buon a eectivement mis en place cette exprience pour obtenir une valeur approche de . Exemple 6.26 (Loi normale bivarie). Soit f : R2 R la fonction dnie par f (x, y) = 1 2 1 2 exp 1 (x2 2xy + y 2 ) 2(1 2 )
o 1 < < 1. On vrie que f est bien une fonction de densit jointe, cest--dire : f (x, y) 0 et R2 f (x, y) dxdy = 1. Exercice 6.27. (a) Vrier que
R2
f (x, y) dxdy = 1.
(b) Montrer que les lois marginales de X et de Y sont des lois normales centres rduites. (c) Montrer que Cov(X, Y ) =
R2
xyf (x, y) dxdy = .
La fonction de densit jointe dune loi normale bivarie gnrale est plus complique. On dit que (X, Y ) suit une loi normale bivarie de moyennes 1 et 2 , de 2 2 variances 1 et 2 et de corrlation avec 1 < < 1, si sa fonction de densit jointe est donne par (6.28) f (x, y) = 1 21 2
2
o 1 , 2 > 0 et Q est la forme quadratique : Q(x, y) = 1 1 2 x 1 1 2
1 exp Q(x, y) 2 1 2 x 1 1 y 2 2 + y 2 2
2
58
Exercice 6.29. Montrer que (b) Cov(X, Y ) = 1 2 .

2 2 (a) X N (1 , 1 ) et Y N (2 , 2 ),
A laide de la Dnition 6.35 plus bas du coecient de corrlation Cor(X, Y ), lnonc de (b) est Cor(X, Y ) = . Proposition 6.30. Soit (X, Y ) un couple alatoire normal. Si Cov(X, Y ) = 0 alors X et Y sont des variables alatoires indpendantes. Ce rsultat est remarquable car en gnral la dcorrlation (covariance nulle) nimplique pas lindpendance, voir lExercice 6.16. Cest une proprit spcique des couples alatoires normaux. Dmonstration. Compte tenu de lexercice prcdent, nous avons = 0. En injectant = 0 dans la formule (6.28), on obtient f (x, y) = fX (x)fY (y) (avec 2 2 X N (1 , 1 ) et Y N (2 , 2 )) et on conclut avec la Proposition 6.22. Exercice 6.31. Soit (X, Y ) un couple alatoire de fonction de densit jointe 1 x f (x, y) = 1{x,y>0} exp y y y Trouver la loi marginale de Y. Solution. Pour tout y 0, fY (y) = fY (y) =
R R
x, y R.
f (x, y) dx = 0 et pour tout y > 0, dx = ey
f (x, y) dx =
0
1 x exp y y y
1 puisque lon reconnat que x 1{x>0} y exp x y loi (exponentielle). Par consquent Y E(1).
est la fonction de densit dune
6.6. Fonctions caractristiques On les dnit de faon analogue aux transformes de Laplace et de Fourier des variables relles, voir la Dnition 5.6. Dfinitions 6.32. (1) La transforme de Laplace de la loi de (X, Y ) est dnie par (s, t) R2 LX,Y (s, t) = EesX+tY [0, ] (2) La fonction caractristique de la loi de (X, Y ) est dnie par o i est le nombre imaginaire tel que i2 = 1. (s, t) R2 X,Y (s, t) = Eei(sX+tY ) C
On peut montrer, mais cette preuve est au del du niveau de ce cours, que la fonction caractristique caractrise la loi PX,Y . Cest--dire que si nous connaissons X,Y , on peut calculer PX,Y et quil ny a quune seule loi PX,Y qui admet X,Y comme fonction caractristique. Un rsultat analogue est valide pour la transforme de Laplace sous lhypothse que LX,Y est nie sur un voisinage ouvert de (0, 0). Proposition 6.33. Soient (X, Y ) un couple discret ou continu.
6.7. INGALIT DE CAUCHY-SCHWARZ
59
(1) Les variables X et Y sont indpendantes si et seulement si la fonction caractristique de (X, Y ) satisfait XY (s, t) = X (s)Y (t), s, t R. (2) Si les transformes de Laplace LX et LY sont nies au voisinage de zro, alors X et Y sont indpendantes si et seulement si LXY (s, t) = LX (s)LY (t), Dmonstration. Preuve de (1). Soient X et Y indpendantes. laide de la Proposition 6.15 et du Corollaire 6.23, on obtient XY (s, t) = Eei(sX+tY ) = E[eisX eitY ] = EeisX EeitY = X (s)Y (t). Montrons la rciproque. On se donne (X, Y ) tel que XY (s, t) = X (s)Y (t) pour L tous s, t. Soit (U, V ) un couple de variables indpendantes telles que U = X et L V = Y. Ceci implique bien sr que U = X et V = Y . Daprs ce que nous venons de montrer, nous avons U,V (s, t) = U (s)V (t) = X (s)Y (t). Donc, U,V = X,Y . Mais puisque les fonctions caractristiques caractrisent les lois (rsultat admis), L ceci implique (X, Y ) = (U, V ). Do le rsultat annonc. Preuve de (2). Analogue celle de (1). 6.7. Ingalit de Cauchy-Schwarz Cette ingalit permet de contrler en esprance les uctuations jointes de (X, Y ) laide des variances individuelles de X et Y, voir le Corollaire 6.36 plus bas. Thorme 6.34 (Ingalit de Cauchy-Schwarz). Pour tout couple alatoire discret ou continu (X, Y ) nous avons E(XY )
2
s, t R.
avec galit si et seulement sil existe a, b R dont lun au moins est non nul tels que P(aX = bY ) = 1. Il est entendu que dans lnonc de ce thorme que E|XY | < de sorte que les intgrales qui interviennent sont bien dnies, ventuellement valeurs innie. Dmonstration. On peut supposer sans perte de gnralit que E(X 2 ), E(Y 2 ) < . Pour tous a, b R, lesprance de la variable positive (aX BY )2 est positive. Donc E (aX bY )2 = a2 E(X 2 ) 2abE(XY ) + b2 E(Y 2 ) 0
E(X 2 )E(Y 2 )
Si P(X = 0) = 1, lassertion est vidente. Si P(X = 0) < 1, alors E(X 2 ) > 0 et lingalit ci-dessus peut tre vue comme une inquation du second degr en a, b x. Ceci implique que le discriminant rduit : b2 [E(XY )]2 E(X 2 )E(Y 2 ) est strictement ngatif (si a2 E(X 2 ) 2abE(XY ) + b2 E(Y 2 ) = E (aX bY )2 = 0).
2abE(XY ) + b2 E(Y 2 ) > 0 pour tout a) ou nul (sil existe un a tel que a2 E(X 2 ) En choisissant b = 0, on obtient [E(XY )]2 < E(X 2 )E(Y 2 ) dans le premier cas et [E(XY )]2 = E(X 2 )E(Y 2 ) lorsque E (aX bY )2 = 0, cest--dire lorsque
P(aX bY = 0) = 1.
60
Dfinition 6.35. Le coecient de corrlation de (X, Y ) est dni par Cor(X, Y ) = Cov(X, Y ) Var(X)Var(Y ) .
Pour que cette dnition soit valide, il est ncessaire que E(X 2 ) < et E(Y 2 ) < et que VarX, VarY > 0. Une consquence simple de lingalit de Cauchy-Schwarz est le Corollaire 6.36. (1) Pour que Cov(X, Y ) soit dni, il sut que E(X 2 ), E(Y 2 ) < . (2) Soit (X, Y ) tel que 0 < Var(X), Var(Y ) < . Alors 1 Cor(X, Y ) 1.
Dmonstration. Preuve de (1). Cest une consquence immdiate du Thorme 6.34 et du Corollaire 3.35. Preuve de (2). On applique le Thorme 6.34 avec X EX et Y EY la place de X et Y.
CHAPITRE 7
Fonctions dun couple alatoire

7.1. Quelques exercices corrigs Exercice 7.1. Soient X et Y deux variables alatoires indpendantes de lois normales N (0, 1). Calculer la fonction de densit de W = X 2 + Y 2 . Solution. Pour tout w 0, P(W w) =
(a) 0 (b) w/2 {x2 +y 2 w} w 2
1 1 exp (x2 + y 2 ) 2 2
dxdy
1 exp(r2 /2)r drd 2
eu du
0
avec le changement de variable en coordonnes polaires en (a) et en posant u = r2 /2 u/2 en (b). On constate que W admet la fonction de densit f (u) = 1(u0) e 2 . Cest-dire que W suit une loi exponentielle de paramtre 1/2. Attention. Ce nest pas parce que X est une variable alatoire continue quil en est de mme pour Y = (X). Par exemple, considrer (x) = 3, x R. Exercice 7.2. On se donne un couple alatoire (X1 , X2 ) de fonction de densit jointe fX1 ,X2 et on considre le couple alatoire (Y1 , Y2 ) tel que X1 X2 = aY1 = cY1 + bY2 + dY2
Solution. Pour cela, valuons pour tout ensemble B R2 (susamment rgulier) la probabilit P((Y1 , Y2 ) B). Soit A limage de B par T (y1 , y2 ) = (ay1 + by2 , cy1 + dy2 ) qui est une bijection du fait de lhypothse ad bc = 0. P((Y1 , Y2 ) B) = P((X1 , X2 ) A) =
A
avec ad bc = 0. Cherchons la loi de (Y1 , Y2 ).
fX1 ,X2 (x1 , x2 ) dx1 dx2 fX1 ,X2 (ay1 + by2 , cy1 + dy2 )|ad bc| dy1 dy2
=
B
o |ad bc| est la valeur absolue du jacobien de la transformation T. On en dduit que (Y1 , Y2 ) est un couple alatoire continu de fonction de densit jointe : ce qui achve lexercice. fY1 ,Y2 (y1 , y2 ) = |ad bc|fX1 ,X2 (ay1 + by2 , cy1 + dy2 )
61
62
7. FONCTIONS DUN COUPLE ALATOIRE
En fait, le procd est gnral pour toute transformation bijective T. Exercice 7.3. Soient (X, Y ) deux variables alatoires indpendantes exponentielles de paramtre . Trouver la fonction de densit jointe de U = X + Y, V = X/Y
et montrer que ce sont des variables alatoires indpendantes. Solution. On considre la transformation S donne par S(x, y) = (x + y, x/y), x, y > 0. Elle est bijective et son inverse S 1 donne par (x, y) = S 1 (u, v) = a pour jacobien J(u, v) =
x u x v y u y v
uv u , 1+v 1+v
, u, v > 0
u . (1 + v)2
Par consquent, avec la formule de changement de variables dxdy = |J(u, v)|dudv, nous obtenons pour tout B R2 (susamment rgulier), P((U, V ) B) = P(S 1 (U, V ) S 1 (B)) = P((X, Y ) S 1 (B)) =
S 1 (B)
1(x>0,y>0) 2 exp((x + y)) dxdy u dudv (1 + v)2
=
B
1(u>0,v>0) 2 exp(u)
Par consquent, (U, V ) admet la densit fU,V (u, v) = 1(u>0,v>0) 2 exp(u) = u (1 + v)2 1 (1 + v)2
[2 1(u>0) u exp(u)] 1(v>0)
o la forme produit de la densit nous indique lindpendance de U et V. 7.2. Somme de deux variables alatoires indpendantes Soient X et Y deux variables alatoires continues indpendantes de fonctions de densit fX et fY . Dterminons la loi de S = X + Y. Pour cela nous eectuons s = x+y x = t le changement de variables qui nous donne t = x y = st
7.2. SOMME DE DEUX VARIABLES ALATOIRES INDPENDANTES
63
dsdt = dxdy et FS (u) = P(X + Y u) =

R2
1(x+yu) fX (x)fY (y) dxdy 1(su) fX (t)fY (s t)

R
=
R2 u
fX (t)fY (s t) dt ds
cette dernire galit est de au thorme de Fubini. Par consquent, S est une variable alatoire continue de fonction de densit fX+Y (s) =
R
fX (x)fY (s x) dx.
Dfinition 7.4. Soient f et g deux fonctions numriques, f g(s) =

R
f (x)g(s x) dx, s R
est la convolue de f et g (si cette intgrale est bien dnie). Lopration est le produit de convolution. On constate facilement que f g = g f. On vient de montrer le rsultat suivant. Proposition 7.5. Soient X et Y deux variables alatoires continues indpendantes de fonctions de densit fX et fY . Alors la somme X + Y est une variable alatoire continue de fonction de densit fX+Y = fX fY Exercice 7.6. Soient X et Y deux variables alatoires indpendantes de lois respectives N (0, 2 ) et N (0, 2 ). Montrer que X + Y suit une loi N (0, 2 + 2 ). Solution. Pour tout s R, fX+Y (s) = fX fY (s) 2 2 2 2 1 1 ex /(2 ) e(sx) /(2 ) dx = 2 2 2 2 R 1 1 2 2 = exp [x / + (s x)2 / 2 ] dx 2 R 2
2 + 2 2 2 (x
Or, x2 / 2 + (s x)2 / 2 = fX+Y (s) = = puisque 1

+ 2 2 2
2 2
1 2 + 2 1 s2 2 1 exp exp 2 (x 2 s)2 2 2 2 2 2 + 2 + 2 R 1 s2 exp 2( 2 + 2 ) 2( 2 + 2 ) 1 2 + 2 2 (x 2 s)2 2 2 2 + 2

2 2 2
2 2 2 + 2 s)
s2 2 + 2 .
Par consquent, dx
exp
dx = 1
en tant que fonction de densit de la loi N ( 2 2 s, + 2 ). 2 +
64
7. FONCTIONS DUN COUPLE ALATOIRE
On en dduit le rsultat suivant. Proposition 7.7. Soient X1 et X2 des variables alatoires indpendantes de 2 2 2 lois respectives N (1 , 1 ) et N (2 , 2 ), alors X1 + X2 suit une loi N (1 + 2 , 1 + 2 2 ). Dmonstration. La loi de (X1 , X2 ) est gale celle de (1 + 1 Z1 , 2 + 2 Z2 ) o (Z1 , Z2 ) est un couple alatoire normal standard. Ce que nous crivons rapidement L (X1 , X2 ) = (1 + 1 Z1 , 2 + 2 Z2 ). Par consquent, X1 + X2 = (1 + 2 ) + 1 Z1 + 2 Z2 . Mais, nous venons de montrer L 2 2 que 1 Z1 + 2 Z2 = 1 + 2 Z avec Z N (0, 1). Ce qui achve la preuve.
L
Thorme 7.8. Soient X et Y deux variables alatoires (discrtes ou continues) indpendantes de fonctions caractristiques X , Y et de transformes de Laplace LX et LY . (1) La fonction caractristique de X + Y est X+Y (t) = X (t)Y (t), t R. (2) Si LX et LY sont nies au voisinage de zro, la transforme de Laplace de X + Y est LX+Y (t) = LX (t)LY (t), Dmonstration. Daprs la Proposition 6.33, X+Y (t) = X,Y (t, t) = X (t)Y (t) et LX+Y (t) = LX,Y (t, t) = LX (t)LY (t). Exercice 7.9 (Suite de lExercice 7.6). On reprend lExercice 7.6 laide du Thorme 7.8. Solution. Grce la Proposition 5.11, X (t) = e t /2 et Y (t) = e t /2 . 2 2 2 2 2 2 2 Le Thorme 7.8 nous donne X+Y (t) = e t /2 e t /2 = e( + )t /2 qui est la fonction caractristique de N (0, 2 + 2 ).
2 2 2 2
t R.
CHAPITRE 8
Conditionnement
8.1. Probabilit conditionnelle Soit V A tel que P(V ) > 0. La probabilit de U conditionnelle V est dnie par la formule de Bayes P(U |V ) := P(U V ) , P(V ) U A.
Puisque P(V |V ) = 1, lunivers de P(|V ) est restreint V .
U V
Proposition 8.1. La fonction densemble U P(U |V ) est une mesure de probabilit sur la tribu A ainsi que sur la tribu AV := {U V ; U A}, trace de A sur V. De plus, AV A. Dmonstration. En eet, P(|V ) = P(V |V ) = 1 et si (Un )n1 est une suite de U telle que n1 Un = , nous avons n1 (Un V ) = V et daprs la Dnition 1.9 dune mesure de probabilit, P( n1 Un |V ) = P( n1 (Un V ))/P(V ) = n1 P(Un |V ); ce qui prouve que P(|V ) est une mesure n1 P(Un V )/P(V ) = de probabilit. Puisque P(|V ) est une mesure de probabilit, on peut dnir la loi de (X, Y ) sous P(|V ) par PX,Y |V (C) := P((X, Y ) C|V ) pour C dans la tribu de Borel de R2 , ainsi quune esprance par rapport P(|V ) E((X, Y )|V ) :=
R
(x, y) PX,Y |V (dxdy).
On voit aisment que (a) lorsque (X, Y ) est un couple alatoire discret de loi PX,Y =
xX ,yY 65
pX,Y (x, y)(x,y)
66
8. CONDITIONNEMENT
on a PX,Y |V =
xX ,yY
1{(x,y)X(V )Y (V )} pX,Y (x, y) (x,y) P(V ) (x, y) pX,Y (x, y) ; P(V )
E((X, Y )|V ) =
xX(V ),yY (V )
(b) lorsque (X, Y ) est un couple alatoire continu de loi PX,Y (dxdy) = fX,Y (x, y) dxdy on a PX,Y |V (dxdy) = E((X, Y )|V ) = 1{xX(V ),yY (V )} fX,Y (x, y) dxdy P(V ) fX,Y (x, y) (x, y) dxdy. P(V ) X(V )Y (V )
On note PX|V (dx) et PY |V (dy) les lois marginales de PX,Y |V (dxdy). 8.2. Conditionnement dans le cas discret Soit (X, Y ) un couple alatoire discret de loi PX,Y = xX ,yY pX,Y (x, y)(x,y) . En prenant V = {Y = y} avec y Y tel que pY (y) > 0, on obtient X(V ) Y (V ) = X {y} et pX,Y (x, y) (x,y) PX,Y |Y =y = pY (y)
xX
de sorte que PX|Y =y (8.2) (8.3) pX|Y =y (x) =

xX
pX|Y =y (x) x
avec
pX,Y (x, y) = P(X = x|Y = y) et pY (y) (x)pX|Y =y (x).

xX
E((X)|Y = y) =
De faon analogue, on montre que pour tout x X tel que pX (x) > 0, PY |X=x (8.4) (8.5) =
yY
pY |X=x (y) y
avec
pY |X=x (y) = E((Y )|X = x) =
pX,Y (x, y) = P(Y = y|X = x) et pX (x)

yY
(y)pY |X=x (y).
On remarque quil sut que E|(X)| < et E|(Y )| < pour que ces sommes soient absolument convergentes. Exemple 8.6. On reprend la loi jointe de lExemple 6.9 : 1 3 -1 0,1 0,2 2 0,45 0,25 X 0,55 0,45 Y 0,3 0,7 1
8.3. CONDITIONNEMENT DANS LE CAS CONTINU
67
0,45 0,1 On voit que PX|Y =1 = 0,55 1 + 0,55 2 = 0, 1818 1 + 0, 8182 2 et que PY |X=2 = 0,45 0,25 0,7 1 + 0,7 3 = 0, 6429 1 + 0, 3571 3 . On a aussi E(X 2 |Y = 1) = 0, 1818(1)2 + 0, 818222 = 3, 4546 et E(Y |X = 2) = 0, 64291 + 0, 35713 = 1, 7142.
Dfinition 8.7. Pour toutes fonctions et telles que E|(X)| < et E|(Y )| < , on dnit les variables alatoires E((X)|Y ) =
yY
1{Y =y} E((X)|Y = y) 1{X=x} E((Y )|X = x)
E((Y )|X)
=
xX
et on les appelle esprance de (X) sachant Y et esprance de (Y ) sachant X. On note que E((X)|Y ) = (Y ) est la fonction de Y qui vaut E((X)|Y = y) lorsque Y = y et E((Y )|X) = (X) est la fonction de X qui vaut E((Y )|X = x) lorsque X = x. Proposition 8.8. Pour toutes fonctions et telles que E|(X)| < et E|(Y )| < , nous avons E[E((X)|Y )] = E(X) E[E((X)|Y )] =
yY
et
E[E((Y )|X)] = E(Y ).
Dmonstration. Nous avons pY (y)E((X)|Y = y) pY (y)

yY xX
= =
yY
(x)pX|Y =y (x) (x)

xX
pY (y)
pX,Y (x, y) pY (y)
=
yY xX (a)
(x)pX,Y (x, y) (x)pX,Y (x, y)

xX yY
=
xX (b)
(x)
yY
pX,Y (x, y)
(x)pX (x)
xX
E(X)
Nous avons pu commuter les sommes en (a) car la srie est absolument convergente. En (b), nous avons fait usage de la Proposition 6.8. La seconde galit se prouve de faon analogue. 8.3. Conditionnement dans le cas continu Soit (X, Y ) un couple alatoire continu de loi PX,Y (dxdy) = fX,Y (x, y) dxdy. On ne peut plus considrer aussi simplement que dans le cas discret le conditionnement par Y = y car pour tout y nous avons P(Y = y) = 0 du fait que Y est
68
8. CONDITIONNEMENT
une variable continue. Nous allons donc introduire des notions analogues aux quantits discrtes sans les justier dans un premier temps. Nous en donnerons une justication un peu plus bas. Pour tout y rel tel que fY (y) > 0, on dnit les lois, densits et esprance conditionnelles PX|Y =y (dx) (8.9) (8.10) fX|Y =y (x) = := fX|Y =y (x) dx fX,Y (x, y) fY (y)
R
avec
et
E((X)|Y = y) :=
(x)fX|Y =y (x) dx.
De faon analogue, on dnit pour tout x rel tel que fX (x) > 0, PY |X=x (dy) (8.11) (8.12) fY |X=x (y) = := fY |X=x (y) dy fX,Y (x, y) fX (x)
R
avec
et
E((Y )|X = x) :=
(y)fY |X=x (y) dy.
On remarque quil sut que E|(X)| < et E|(Y )| < pour que ces intgrales soient absolument convergentes. Exemple 8.13. Le couple (X, Y ) suit la loi uniforme sur le domaine T = {(x, y) R2 ; 0 x y 1}, cest--dire que sa loi est PX,Y (dxdy) = fX,Y (x, y) dxdy [x x2 /2]1 = 1/2 : laire du triangle T vaut 1/2. 0 1 x T 0 x 1 Calculons la densit marginale fX . Pour tout x, fX (x) = 2 R 1((x,y)T ) dy. Donc, pour x [0, 1], (x, y) T, y R et fX (x) = 0. Alors que pour tout 0 x 1, 1 (x, y) T x y 1 et fX (x) = 2 x dy = 2(1 x). On a donc fX (x) = 1 1{0x1} 2(1 x), x R. Par consquent, si 0 x < 1, fY |X=x (y) = {xy1} , 2(1x) y R. La loi de Y sachant X = x est donc la loi uniforme sur [x, 1]. On en dduit que pour 0 x < 1, E(Y |X = x) = (1 + x)/2. Dfinition 8.14. Pour toutes fonctions et telles que E|(X)| < et E|(Y )| < , on dnit les variables alatoires E((Y )|X) E((X)|Y ) = (Y ) o (y) = E((X)|Y = y), y R = (X) o (x) = E((Y )|X = x), x R 1x avec fX,Y (x, y) = 2 1T (x, y) puisque
T
dxdy =
1 0
1 x
dy dx =
1 (1 0
x) dx =
et on les appelle esprance de (X) sachant Y et esprance de (Y ) sachant X.
8.3. CONDITIONNEMENT DANS LE CAS CONTINU
69
Proposition 8.15. Pour toutes fonctions et telles que E|(X)| < et E|(Y )| < , nous avons E[E((X)|Y )] = E(X) et E[E((Y )|X)] = E(Y ). Dmonstration. Nous avons E[E((X)|Y )] =
y
fY (y)E((X)|Y = y) dy fY (y)
y x
= =
y
(x)fX|Y =y (x) dx dy (x)

x
fY (y)
fX,Y (x, y) dx dy fY (y)
=
R2
(x)fX,Y (x, y) dxdy (x)

x y
= =
x
pX,Y (x, y) dy dx
(x)fX (x) dx
= E(X) Nous avons pu commuter les intgrales laide de leur convergence absolue. La seconde galit se prouve de faon analogue. Lensemble des dnitions introduites en (8.9), (8.10), (8.11) et (8.12) est justi par lobtention de la Proposition 8.15 dont lnonc est analogue celui de la Proposition 8.8. Exemple 8.16 (Suite de lExemple 8.13). En appliquant la Proposition 8.15, on 1 1 obtient EY = E[E(Y |X)] = R (1+x)/2fX (x) dx = 0 1+x 2(1x) dx 0 (1x2 ) dx = 2 [x x3 /3]1 = 2/3. 0 Dautre part, par symtrie on voit que fY (y) = fX (1 y) = 2y1{0y1} de sorte 1 quon retrouve EY = R yfY (y) dy = 0 2y 2 dy = [2y 3 /3]1 = 2/3. 0
CHAPITRE 9
Indpendance
71
CHAPITRE 10
Construction dune variable alatoire relle gnrale

Donnons-nous une fonction F candidate tre une fonction de rpartition. Nous allons dcrire un espace probabilis (, A, P) et construire explicitement une variable alatoire dont la fonction de rpartition est eectivement F. Nous commenons par le cas particulier dune rpartition uniforme sur [0, 1].
10.1. Construction dune variable alatoire continue uniforme Soit X une variable alatoire uniforme sur lensemble des chires : {0, 1, . . . , 9}. Construisons une suite (Xn )n1 de copies indpendantes de X. Pour cela, on prend pour lensemble des suites = (1 , 2 , . . . ) valeurs dans {0, 1, . . . , 9} et on dnit Xn () = n , , n 1
qui reprsente le rsultat du n-ime tirage. On prend pour A la plus petite tribu qui contient toutes les parties de de la forme
n i=1
{Xi Ai },
n 1, Ai {0, . . . , 9}, 1 i n
et on choisit une mesure de probabilit P qui satisfait

n
P
i=1
{Xi Ai }
card(Ai ) , n 1, A1 , . . . , An {0, . . . , 9}. 10 i=1
Cette situation est celle de lquiprobabilit des vnements lmentaires, puisquil n y a i=1 card(Ai ) nombres parmi les 10n nombres entiers de [0, 10n 1] dont le i-me chire est dans Ai pour tout 1 i n. On admet quune telle mesure de probabilit sur (, A) existe et est unique. Pour tout n 1, on dnit la variable alatoire Un () = =
i=1
0, 1 . . . n
n
(dveloppement dcimal)
i 10i
Il est clair que Un peut prendre 10n valeurs dans [0, 1[. Calculons sa fonction de rpartition. Bien sr, FUn (u) = 0, si u < 0 et FUn (u) = 1 si u 1. Soit maintenant
73
74
10. CONSTRUCTION DUNE VARIABLE ALATOIRE RELLE GNRALE
0 u < 1. En notant u = 0, x1 x2 . . . son dveloppement dcimal, FUn (u) = P(Un u) = P { ; 0, 1 . . . n 0, x1 . . . xn xn+1 . . .} = P {X1 x1 1} [{X1 = x1 } {X2 x2 1}] [{X1 = x1 } {Xn1 = xn1 } {Xn xn 1}] [{X1 = x1 } {Xn = xn }] = = 10
1
x1 + 10
0, x1 x2 . . . xn + 10n . 1
x2 + + 10n xn + 10n
10n FU
FUn 0 1
(10.1)
0 u Par consquent, lim FUn (u) = G(u) := n 1

n
U () = lim Un () = 0, 1 2 . . . ,
u si u 0 si 0 u 1 , u R. Posons si u 1 .
La loi de U, spcie par sa fonction de rpartition FU , est appele loi uniforme sur [0, 1]. Sa fonction de densit est donne par fU (u) = 1 si u [0, 1] , 0 sinon u R.
Puisque sup |Un () U ()| 10n , pour tout > 0 et tout entier n susamment grand pour que 10n , nous avons : {Un u } {U u} {Un u + }. Do il vient que FUn (u ) FU (u) FUn (u + ). Ce qui en faisant tendre n vers linni nous donne G(u ) FU (u) G(u + ), puis en faisant tendre vers zro, nous donne FU = G. Soit 0 si u 0 u si 0 u 1 , u R. FU (u) = 1 si u 1
On vient de construire U laide dune innit dnombrable de tirages indpendants uniformes dans {0, . . . , 9}. Remarque 10.2. Lors de la preuve de la Proposition A.8, on montre que le procd de construction (10.1) atteint tous les rels de [0, 1] une seule fois lexception de certains qui sont atteints deux fois : les lments de D, lensembles des nombres dans [0, 1] qui admettent un dveloppement dcimal ni. Or, il est aussi prouv que D est dnombrable de sorte que P(U D) = xD P(U = x) = xD 0 = 0 o lavant-dernire galit vient de P(U = x) = 0 pour tout x et la dernire a du sens car D tant dnombrable, xD est une srie numrique.
10.2. CONSTRUCTION DUNE VARIABLE ALATOIRE RELLE GNRALE
75
10.2. Construction dune variable alatoire relle gnrale La variable alatoire U va nous permettre de construire toutes les autres variables alatoires sur (, A, P). Le procd de construction est le suivant. Thorme 10.3. Soit une fonction F : R [0, 1], croissante et continue gauche telle que limx F (x) = 0 et limx F (x) = 1. On dnit son inverse sur ]0, 1[ par F 1 (u) := inf{x R; F (x) u}, u ]0, 1[.
On considre U U(0, 1) une variable alatoire sur (, A, P) de loi uniforme sur ]0, 1[. Alors (10.4) X = F 1 (U )
est une variable alatoire sur (, A, P) de fonction de rpartition F.
1 F 0 1 F 1
Preuve du Thorme 10.3. Rappelons que pour tout 0 u 1, FU (u) = P(U u) = P(U < u) = u. Si x est un point de continuit de F, alors F 1 (u) x u F (x), de sorte que FX (x) = FU (F (x)) = F (x) = P(X x) = P(F 1 (U ) x) = P(U F (x))
On note F (x+ ) et F (x ) les limites droite et gauche de F en x (ces limites existent puisque F est suppose croissante). Si x est un point de discontinuit de F, alors F (x ) < F (x) = F (x+ ), F 1 (u) < x u < F (x ) et F 1 (u) = x F (x ) u F (x). Donc, FX (x) = P(F 1 (U ) < x) + P(F 1 (U ) = x) = P(U < F (x )) + P(F (x ) U F (x)) = F (x ) + [F (x) F (x )] = F (x). Ce qui achve la preuve de FX = F et donc de la proposition.
76
Remarquons que nous avons dj montr la Proposition 2.8 que toute fonction de rpartition jouit des proprits imposes F dans le Thorme 10.3. Nous en dduisons le rsultat suivant. Corollaire 10.5. Une fonction F est la fonction de rpartition dune variable alatoire si et seulement si F : R [0, 1] est croissante, continue gauche et satisfait limx F (x) = 0 et limx F (x) = 1. Exemples 10.6. (a) Loi de Bernoulli B(p). Nous avons F (x) = q1[0,1[ (x) + p1[1,[ (x) avec p + q = 1, dont linverse est F 1 (u) = 1]q,1] (u), 0 u 1. 0 si U [0, q] Par consquent X = suit la loi B(p). On remarque que la 1 si U ]q, 1] longueur de [0, q] est q = P(X = 0) et que celle de ]q, 1] est 1q = p = P(X = 1). (b) Loi exponentielle E(). Nous avons F (x) = 1{x0} (1 ex ) de sorte que F 1 (u) = ln(1 u)/, u [0, 1[. On voit donc que X = ln(1 U )/ suit L la loi E(). Or U = 1 U, donc X = ln(U )/ E().
Attention, dans (10.4) F 1 nest pas linverse traditionnel de F mais seulement son inverse gnralis. En particulier il nest pas vrai en gnral que F (X) = U, cest--dire que F (X) soit une variable alatoire uniforme sur (0, 1). Exercice 10.7. (a) Soit X B(2, 1/2) la variable alatoire de lExemple 2.1, montrer que F (X) nest pas uniforme sur (0, 1). Calculer sa loi.
(b) Soit X une variable alatoire continue de fonction de rpartiton F, montrer que F (X) est uniforme sur (0, 1). Solution. Solution de (a). Puisque card(X()) = card({0, 1, 2}) = 3 et card(U ()) = card([0, 1]) = , card(F (X())) 3 donc F (X) ne peut pas avoir la mme loi que U. 1 1 Plus prcisment, PX = 1 F (0) + 1 F (1) + 1 F (2) = 4 1/4 + 2 3/4 + 1 1 . 4 2 4 4 Solution de (b). Au dbut de la preuve du Thorme 10.3, nous avons vu que si x est un point de continuit de F, alors pour tout 0 u 1, F 1 (u) x u F (x). Or, sous notre hypothse, F est continue partout, donc pour tout 0 u 1, P(F (X) u) =
(a)
P(X F 1 (u)) P(X > F 1 (u)) 1 F (F 1 (u)) 1u
(b)
= =
(c)
o lgalit (a) est vraie car X est une variable continue, (b) vient de la dnition de la fonction de rpartition F et (c) se vrie comme suit. Pour tout 0 u 1, F (F 1 (u)) = F (inf{x; F (x) u}) = limx F (x) := F ( ) o est lunique nombre tel que F ( ) u F (). Or F est suppose continue, donc F ( ) = F (), ce qui implique que F ( ) = u et F (F 1 (u)) = u. On en dduit que P(F (X) u) = 1 limvu (1 v) = 1 (1 u) = u pour tout 0 u 1, ce qui montre que F (X) suit une loi uniforme sur (0, 1).
10.3. PRINCIPE DE LA SIMULATION DUNE VARIABLE ALATOIRE
77
10.3. Principe de la simulation dune variable alatoire Il existe des algorithmes qui gnrent des suites de tirages pseudo-alatoires indpendants de loi U(0, 1) uniforme sur [0, 1]. La plupart des calculettes permettent dexcuter un tel programme, souvent baptis rand1. En gnral leur conception repose sur des proprits arithmtiques de certaines suites rcurrentes. Ces algorithmes sont dterministes : si vous utilisez le mme algorithme avec la mme condition initiale, il vous donnera toujours la mme suite de nombres. De plus, ces suites sont priodiques, mais avec une priode extrmement grande. Cest la raison pour laquelle les tirages sont appels pseudo-alatoires plutt qualatoires. Nous appellerons U le rsultat dun tirage de loi U(0, 1). Simulation dune loi discrte. La mthode est simple. La loi discrte que nous souhaitons simuler est xX px x . On suppose sans perte de gnralit que px > 0 pout tout x X . Puisque X est dnombrable, on peut numroter ses lments : xn , n N avec N {1, 2, . . .} et on note pn = pxn . Puis on partitionne lintervalle ]0, 1] de sorte que ]0, 1] =
nN nN
]un1 , un ] pn = 1 pn
p1
p2
| |
0 u1
||
u2
| |
un1 un
| |
1
avec u0 = 0 et un = 1in pi , n N. La probabilit que la variable U de loi uniforme sur (0, 1) tombe dans n-ime bote Bn =]un1 , un ] est La variable (10.8) P(U Bn ) = P(un1 < U un ) = un un1 = pn , X=
nN
n N.
xn 1{U Bn }
nN
qui vaut xn si et seulement si U Bn , n N a pour loi
pn xn .
Exercice 10.9. Montrer que la variable X dnie par (10.8) satisfait lgalit (10.4) : X = F 1 (U ), du Thorme 10.3. Simulation dun couple alatoire normal standard. On appelle couple alatoire normal standard un couple (X, Y ) de variables alatoires indpendantes normales standard X, Y N (0, 1). Lapplication directe du Thorme 10.3 est compromise par le fait quil nexiste pas dexpression analytique simple de la fonction de partition de N (0, 1). A fortiori, nous navons pas dexpression simple de sa fonction rciproque. Nous allons toutefois contourner ce problme en rsolvant lexercice suivant.
1En anglais, au hasard se dit at random qui vient de lancienne expression franaise "aller randon" qui signie avancer de faon dsordonne et que lon retrouve dans randonne.
78
Exercice 10.10. Soit (X, Y ) un couple normal standard. On dnit (R, ) comme tant les coordonnes polaires de (X, Y ), cest--dire X Y avec R 0 et 0 < 2. (X, Y ) = R cos = R sin
0 R
Montrer que R et sont des variables indpendantes telles que R2 E(1/2) et U(0, 2).
1 Solution. La densit de la loi de (X, Y ) est fX,Y (x, y) = 2 e(x +y )/2 et notons g(r, ) celle de (R, ), si elle existe. Soit T la transformation inverse de (r, ) (x, y) = (r cos , r sin ) de sorte que (R, ) = T (X, Y ). On se donne une fonction borne rgulire quelconque sur [0, [[0, 2[. Nous avons
2 2
E(R, )
= E(T (X, Y )) = = =
R2
1 (x2 +y2 )/2 e dxdy 2 R2 2 1 (r, ) er /2 rdrd 2 [0,[[0,2[ (T (x, y)) (r, )g(r, ) drd
2
1 avec g(r, ) = g ()gR (r) o g () = 2 1[0,2[ () et gR (r) = 1[0,[ (r)rer /2 , en eectuant un changement de variables en coordonnes polaires lavant-dernire galit. Puisque g a la forme produit, R et sont indpendantes de densit gR et g . Les variables R2 et sont donc aussi indpendantes. Clairement, U(0, 2) 2 t t et pour tout t 0, P(R2 t) = P(R t) = 0 er /2 rdr = 0 es/2 ds/2 en faisant le changement de variable s = r2 . On voit donc que la densit de la loi de S = R2 est 1[0,[ (s) 1 es/2 , cest--dire R2 E(1/2). 2
Il sut maintenant de simuler (R, ) laide dun couple (U, V ) de variables indpendantes distribues uniformment sur [0, 1] dont la ralisation est donne par deux valeurs conscutives du programme rand. On prend alors 2 ln U R = = 2V o lon a utilis lExemple 10.6-b dans le calcul de R. Finalement, nous venons de montrer que le couple (X, Y ) donn par X = 2 ln U cos(2V ) 2 ln U sin(2V ) Y =
10.3. PRINCIPE DE LA SIMULATION DUNE VARIABLE ALATOIRE
79
est un couple normal standard.
CHAPITRE 11
Convergence des variables alatoires
81
CHAPITRE 12
Ingalits de convexit
On sintresse ici un lien entre les probabilits et les fonctions convexes. Les notions de base concernant la convexit sont rappeles lAnnexe D. Soient x, y Rd et 0 t 1. La mesure de probabilit sur Rd : (1 t)x + ty x avec la probabilit (1 t) est la loi de Zt = , voir les Remarques 3.7-(2&3) y avec la probabilit t au sujet des variables discrtes valeurs dans un espace vectoriel. On a E(Zt ) = (1 t)x + ty, de sorte que la dnition (D.3) de la convexit de la fonction sur la partie convexe C de Rd se rcrit pour tout 0 t 1. Cette ingalit est en fait un cas particulier du rsultat gnral nonc plus bas en (12.4). Lemme 12.1 (Variable discrte). Soit X une variable alatoire discrte valeurs dans une partie convexe C de Rd telle que E X < . Si de plus lune des proprits suivantes est satisfaite C est un ouvert C est un ferm X prend un nombre ni de valeurs alors, EX C. Dmonstration. Si X prend un nombre ni de valeurs, EX = nN pn xn est une combinaison linaire nie et on montre par rcurrence laide de la dnition (D.2) que nN pn xn C. Par exemple avec N = {1, 2, 3}, p1 x1 + p2 x2 + p3 x3 = p1 x1 + (p2 + p3 ) p3 p2 x2 + x3 p2 + p3 p2 + p3
C C
(EZt ) E(Zt ),
et ainsi de suite pour un nombre ni de valeurs. Lorsque N = {1, 2, . . .} est inm m ni, nous avons en posant m = n=1 pn xn + n=1 pn , EX = n1 pn xn = m m m pn pn pn pn xn = m n=1 m xn + n>m pn xn . Or, n=1 m xn C puisque n=1 m = n>m 1, limm m = 1 et limm n>m pn xn = 0. Donc, EX appartient la fermeture de C dans Rd . Si C est ferm, nous venons de montrer que EX C. Si C est ouvert, il est gal son intrieur. Donc x1 est dans lintrieur de C. On en dduit que EX = p1 x1 + n>1 pn xn est dans lintrieur de C; donc dans C. Exercice 12.2. Justier les dernires lignes de la preuve prcdente.
83
84
12. INGALITS DE CONVEXIT
Proposition 12.3 (Ingalit de Jensen). Soient : C R une fonction convexe direntiable sur la partie ouverte convexe C de Rd et X une variable alatoire valeurs dans C telle que E|(X)| < et E X < . Alors, (12.4) Dmonstration. Du fait des hypothses E|(X)| < et E X < les esprances que nous considrons sont bien dnies. Nous avons avec la Proposition D.5 : (x) (a) + (a), x a pour tous x, a C. Puisque C est un ensemble convexe, le Lemme 12.1 nous dit que EX appartient aussi C. En prenant a = EX dans lingalit prcedente, nous obtenons (X) (EX) + (EX), X EX . En prenant les esprances, la linarit et la croissance de lesprance nous assurent de E(X) (EX) + (EX), E(X EX) = (EX) puisque E(X EX) = 0. Ce qui achve la dmonstration. Remarques 12.5. (1) Le Lemme 12.1 reste vrai pour toute partie convexe C de Rd . La preuve de cette extension ncessite une tude des proprits lmentaires des ensembles convexes de Rd que nous ne ferons pas ici. (2) Lingalit de Jensen reste vraie lorsque la fonction convexe nest pas direntiable et C nest pas un ouvert. Il sut pour cela de tenir compte de la remarque (1) prcdente et de remplacer (x) (a) + (a), x a par (x) (a) + , x a o = (a) + , u a , avec Rd , est lquation en (u, ) Rd R dun hyperplan "tangent" au graphe de en a. Cest--dire un hyperplan passant par (a, (a)) et tel que le graphe de soit entirement dans le demi-espace "suprieur" dlimit par cet hyperplan. En dimension 1 avec (x) = x2 , on retrouve E(X 2 ) (EX)2 , cest--dire Var(X) 0. Avec (x) = eax , on obtient ln EeaX aEX, a R. En appliquant lingalit de Jensen la fonction convexe (x) = x p , x Rd avec p 1 (voir lExercice D.7), on obtient EX p E[ X p ], p 1. Avec p = 1, nous avons EX E X et en regroupant ces rsultats : Corollaire 12.6. Soient 0 < p q et X une variable alatoire sur Rd telle que E[ X q ] < . Alors, E[ X
p 1/p
(EX) E(X).
EX E X E[ X
p 1/p
p 1.
Dmonstration. La fonction (y) = y q/p , y 0 est convexe puisque q/p 1. Avec Y = X p , nous avons X q = (Y ) et avec lingalit de Jensen : E[ X p ]q/p = (EY ) E(Y ) = E[ X pq/p ] = E[ X q ] qui est le rsultat annonc. En particulier, avec 1 = p q nous retrouvons E X E[ X
q 1/q
E[ X
q 1/q
ANNEXE A
Dnombrabilit
Un ensemble est dnombrable si on peut le dnombrer, cest--dire coller un numro distinct sur chacun de ses lments. Lensemble de tous les numros possibles tant lensemble N des entiers naturels, nous arrivons la dnition abstraite suivante. Dfinition A.1. Un ensemble E est dit dnombrable sil existe une injection de E dans N. Remarques A.2. (1) Appelons : E N une telle injection. Alors son application rciproque 1 : (E) E est une bijection, cest lapplication qui tout numro pris dans (E) N associe un lment unique de E. (2) Bien sr, tout ensemble ni est dnombrable et N est dnombrable. (3) De mme, tout sous-ensemble dun ensemble dnombrable est dnombrable et par contraposition, tout ensemble contenant une partie nondnombrable est non-dnombrable. (4) Si deux ensembles sont en bijection, ils sont soit dnombrables tous les deux, soit non-dnombrables tous les deux. Exercice A.3. Montrer que Z est dnombrable. Solution. On numrote les entiers relatifs dans lordre suivant : 0, 1, 1, 2, 2, 3, . . . , n, n, . . . Il sagit de lapplication f : Z N := {1, 2, . . .} dnie par f (n) = 2n et f (n) = 2n + 1 pour tout n 1 et f (0) = 1. Elle est bijective de Z sur N . Proposition A.4. Le produit cartsien dun nombre ni densembles dnombrables est dnombrable. Dmonstration. Par rcurrence, il sut de montrer ce rsultat pour le produit de deux ensembles dnombrables. Compte tenu de la dnition de la dnombrabilit, il sut pour cela de montrer que N2 est dnombrable. Le procd de numrotation de N2 suivant
85
86
A. DNOMBRABILIT
2 1 0 1 2 3 N
permet de voir que N2 est en bijection avec N. Lexercice et la proposition prcdents nous permettent de voir que pour tout d 1, Zd est dnombrable. On en dduit que lensemble des nombres rationnels Q est aussi dnombrable. En eet, tout x Q on associe le couple dentiers (p, q) Z N tels que x = p/q soit une fraction irrductible. Cette application est clairement une injection de Q dans Z N Z2 qui est dnombrable. Proposition A.5. Une runion dnombrable densembles dnombrables est dnombrable. Dmonstration. Soient (Ei )iI une collection dnombrable (lensemble I des indices est dnombrable) densembles dnombrables. On peut sans perte de gnralit prendre I N. Dautre part chacun des Ei est en injection dans N : on peut dcrire Ei = {xi ; j J(i)} avec J(i) N. Par consquent iI Ei = {xi ; (i, j) : i j j I, j J(i)}. Lapplication qui tout x de iI Ei associe un couple (i, j) tel que xi = x est une injection de iI Ei dans {(i, j) : i I, j J(i)} N2 . Puisque, j daprs la Proposition A.4, N2 est dnombrable, il en est de mme pour iI Ei . Nous allons voir la Proposition A.8 plus bas quaucun intervalle rel dintrieur non-vide nest dnombrable. Pour cela nous aurons besoin du rsultat prliminaire suivant. Lemme A.6. Soit X un ensemble non vide et 2X lensemble de toutes les parties de X . Il nexiste pas dinjection de 2X dans X . Dmonstration. On fait une preuve par labsurde. Supposons quil existe une injection de 2X dans X . Alors, il existe une partie Y de X et une application P : Y 2X qui est bijective. Lapplication P permet de nommer les parties de X laide des lments du sous-ensemble Y de X . Considrons la partie A = {y Y; y P (y)} 1 ainsi que llment z = P (A) Y. Soit z A = P (z), mais ceci est impossible par dnition de A; Soit z A = P (z) et par dnition de A : z P (z), ce qui est contradictoire. Les deux cas sont exclus, par consquent notre hypothse de dpart est impossible : il nexiste donc aucune injection de 2X dans X . Cette preuve est due Bertrand Russel, philosophe, humaniste et grand mathmaticien britannique du XX-ime sicle. Elle est base sur le paradoxe suivant,
A. DNOMBRABILIT
87
nonc par lui : "Le barbier rase tous les hommes de son village qui ne se rasent pas eux-mmes". Lemme A.7. Soit A un ensemble ni contenant au moins deux lments. (1) Lensemble des suites nies composes dlments de A est dnombrable. (2) Lensemble AN des suites innies composes dlments de A est nondnombrable. On peut voir A comme un alphabet : un ensemble de lettres et toute suite nie comme un mot de taille nie compos avec cet alphabet. Les suites innies sont des mots de taille innie. ce sont toutes les applications de N dans A. Dmonstration. Preuve de (1). En notant Sn lensemble des suites de longueur n et Sf lensemble des suites nies, on a Sf = n1 Sn qui est dnombrable daprs la Proposition A.5, puisque runion dnombrable densembles nis : card(Sn ) = card(A)n < .
Preuve de (2). Du fait que card(A) 2, il sut de montrer que lensemble {0, 1}N des suites innies composes de 0 et de 1 nest pas dnombrable. En eet, en choisissant deux lments distincts a0 et a1 de A, on voit immdiatement que lapplication qui la suite (n )nN dans {0, 1}N associe la suite (an )nN dans {a0 , a1 }N est une bijection de {0, 1}N sur {a0 , a1 }N . Cest donc une injection de {0, 1}N dans AN . Or {0, 1}N est en bijection avec lensemble 2N des parties de N : la suite (n )nN on associe la partie {n N; n = 1}. Mais on a vu au Lemme A.6 que 2N nest pas dnombrable, donc {0, 1}N ne lest pas non plus. Nous somme maintenant en mesure de prouver la Proposition A.8. Tout intervalle dintrieur non-vide (i.e. de la forme (a, b) avec a < b +) est non-dnombrable. En particulier, R nest pas dnombrable.
Dmonstration. Il sut de montrer que le segment [0, 1] nest pas dnombrable. Car alors la bijection x [0, 1] + ( )x [, ] nous assure quil en est de mme pour [, ]. Tout intervalle dintrieur non-vide (a, b) contient un tel segment [, ] (il sut pour cela que a < < < b) et est de ce fait nondnombrable. Montrons que [0, 1] nest pas dnombrable. Tout x [0, 1] admet un dveloppement dcimal x = 0, x1 x2 x3 inni (avec ventuellement xn = 0 pour tout n partir dun certain rang) o lon adopte la convention que si le dveloppement se termine par une succession innie de 9, cest--dire si x = a1 ak 9999 avec 0 ak 8, on remplace ce dveloppement dcimal par 0, a1 ak1 (ak +1)0000 1/10 En eet 0, 9999 = 9 n1 (1/10)n = 9 11/10 = 1 = 1, 0000 On note D(x) = (x1 , x2 , . . . ) {0, . . . , 9}N la suite correspondant ce dveloppement dcimal unique. Notons G lensemble des suites nies (a1 , . . . , ak ) dlments de {0, 1, . . . , 9} dont le dernier terme ak est dirent de 9. Lensemble des x concerns par la modication prcdente du dveloppement dcimal est lensemble des x de la forme x = a1 ak 9999 . Il est clairement en bijection avec G. Par consquent, D : [0, 1] {0, . . . , 9}N \ G est une bijection. Or, daprs la Proposition A.7, {0, . . . , 9}N est
88
A. DNOMBRABILIT
non-dnombrable et G est dnombrable (en tant que sous-ensemble des suites nies) donc {0, . . . , 9}N \ G est non-dnombrable et il en est de mme pour [0, 1].
ANNEXE B
Esprance mathmatique sans thorie de lintgration

La notion desprance mathmatique a t introduite sans ambigut dans le cadre des variables alatoires discrtes, voir (6.12). Rappelons que pour tout couple alatoire discret (X, Y ) prenant ses valeurs dans R2 et telles que xX |x|pX (x) < et yY |y|pY (y) < , lesprance mathmatique de aX + bY est dnie par E(aX + bY ) =
xX ,yY
(ax + by)pX,Y (x, y).
Elle possde les proprits suivantes : (B.1) (B.1) (B.1) E(aX + bY ) = aEX + bEY, a, b R si X 0, EX 0 E(1) = 1 (positivit) (normalisation). (linarit)
Notre but est de construire une extension de loprateur : X E(X), une classe de variables alatoires X valeurs relles plus gnrale que celle des variables discrtes. Nous allons montrer que lorsquon impose cette extension de satisfaire les proprits (B.1), elle est unique sur la classe considre. Soit X E(X) une extension de lesprance qui possde les proprits (B.1). Cet oprateur est croissant au sens o : (B.2) X Y = E(X) E(Y ). |E(X)| E(|X|).
En eet, avec (B.1) et (B.1) : E(Y ) E(X) = E(Y X) 0. On en dduit que (B.3) Pour dcrire la classe sur laquelle lextension de lesprance est calcule, nous introduisons lensemble fonctionnel suivant. Dfinition B.4. La classe est lensemble des fonctions de ]0, 1[ dans R qui sont bornes et dont lensemble des points de discontinuit est dnombrable et admet un nombre ni de points daccumulation. Thorme B.5. Soit X E(X) un oprateur qui prolonge lesprance mathmatique des variables alatoires discrtes des variables alatoires plus gnrales et qui possde les proprits (B.1). Soit U une variable alatoire de loi uniforme sur [0, 1]. Alors, pour toute fonction dans ,
1
E (U ) =
0 89
(u) du.
90
B. ESPRANCE MATHMATIQUE SANS THORIE DE LINTGRATION
Dmonstration. On se replace dans le cadre de la suite des tirages indpendants uniformes sur {0, . . . , 9} tudi au Chapitre 10. On considre maintenant les approximations discrtes de U dnies pour tout n 0 par Un () = 0, 1 . . . n . Cette variable alatoire est discrte : elle prend chacune des 10n valeurs un,k = 10n k, (0 k 10n 1) avec la probabilit 10n . Soit une fonction numrique quelconque sur ]0, 1[. Son esprance mathmatique est E((Un )) =
0k10n 1
10n (un,k ).
Cette somme est lintgrale de Riemann dune fonction en escalier qui approxime . On en dduit que si est intgrable au sens de Riemann,
1
(B.6)
lim E((Un )) =
0
(u) du.
On suppose pour le moment que :]0, 1[ R est continue et borne. Puisquelle admet un prolongement continu sur le compact [0, 1]; elle est absolument continue, cest--dire que w () := sup{|(u) (v)|; u, v tels que |u v| < } tend vers zro lorsque dcrot vers zro. Dautre part, puisque supn0 |U Un | 10n , |E[(U )] E[(Un )]| = |E[(U ) (Un )]| E[w (sup |U Un |)]
n0
avec (B.1) avec (B.3) avec (B.2) avec (B.2) avec (B.1) et (B.1)
E[|(U ) (Un )|] E[w (10n )] = w (10

n
Do il vient que (B.7) E[(U )] = lim E[(Un )].

n
En rapprochant cette identit de (B.6), nous obtenons le rsultat dsir lorsque est continue :
1
E (U ) =
0
(u) du.
Il reste tendre cette identit au cas gnral : . Soit . Son ensemble de points de discontinuit est tel que pour tout > 0, il existe une runion nie dintervalles qui le recouvre, que nous noterons A et dont la longueur totale |A | est infrieure . Il est clair que la restriction de au complmentaire de A admet un prolongement continu sur [0, 1] (on peut procder une srie dinterpolations linaires entre les bornes de A ). Notons cette approximation continue de . Puisque est borne, cest--dire : := sup0u1 |(u)| < , on peut choisir de mme borne que et nous obtenons |(u) (u)| 21(uA ) , u ]0, 1[.
91
Par consquent, E[(U )] E[ (U )] = = E[1(U A ) ((U ) (U ))] + E[1(U A ) ((U ) (U ))] E[1(U A ) ((U ) (U ))]
o lon a fait usage darguments similaires ceux invoqus lors de la preuve de (B.7), ainsi que de E[1(U A ) ] = P(U A ) (1(U A ) est une variable discrte dont on connat lesprance) et de P(U A ) = |A | (puisque P(a U b) = b a). Des arguments analogues nous mnent
1 0 1
2P(U A ) = 2|A | 2
(u) du
(u) du 2,
1
de sorte que pour tout ,

1
E[(U )]
(u) du
0
E[ (U )] 4,
(u) du + 4
0 1 0
puisque, tant continue, nous avons montr plus haut que E[ (U )] = La preuve sachve en faisant tendre vers zro.
(u) du.
Nous allons donner plus bas une dnition de lesprance mathmatique pour une classe de variables alatoires continues assez gnrale. Compte tenu du Thorme 10.3, toute variable alatoire X admet le mme comportement alatoire (la 1 mme loi) que FX (U ). Par consquent, tant une fonction numrique, il est 1 loisible dcrire E((X)) = E( FX (U )). Le Thorme B.8 plus bas est une consquence immdiate du Thorme B.5. Nous sommes en mesure dnoncer le thorme suivant. Thorme B.8. Soit X E(X) un prolongement de lesprance des variables alatoires discrtes une classe plus gnrale de variables alatoires qui satisfait les proprits (B.1). Soit X une variable alatoire de fonction de rpartition FX et 1 une fonction numrique. Si FX est dans la classe , alors
1
E((X)) = Cest en particulier le cas lorsque continue par morceaux.

1 FX 0 1 FX
1 FX (u) du.
est dans la classe et est borne et
1 Remarque B.9 (Au sujet des points de discontinuit de FX .). La fonction 1 est croissante et continue gauche. Nous notons FX (u) lintervalle semi1 1 ouvert [FX (u), FX (u+ )[. Il est non vide si et seulement si u est un point de discon1 1 tinuit de FX . Dans ce cas nous disons que FX (u) est un intervalle dabsence de 1 X. Cette terminologie est justie par la constatation que lorsque au := FX (u) < 1 + FX (u ) := bu , la fonction FX est plate sur lintervalle [au , bu [, plus prcisment : [au , bu [ {x R; FX (x) = u} [au , bu ]. Ceci implique que P(X [au , bu [) = 0, et que pour tout > 0, P(X ]au , bu [) > 0 et P(X ]au , bu + [) > 0.
92
La formule assez gnrale du Thorme B.8 nest pas trs parlante. Nous allons llucider les variables alatoires continues. Pour une variable alatoire continue, un intervalle dabsence correspond un intervalle maximal (composante connexe) de 1 lensemble des points dannulation de fX . Pour que FX soit dans la classe , il sut que X admette un nombre ni dintervalles dabsence. On en dduit que si 1 lensemble {x R; fX (x) = 0} est une runion nie dintervalles, la fonction FX est dans la classe . Supposons maintenant que X admette une fonction de densit fX continue par 1 morceaux. Dans ce cas, FX est partout continue donc x = FX (u) u = FX (x); de plus, sauf en un nombre ni de points, nous avons FX (x) = fX (x). La formule de changement de variable dans lintgrale, nous permet en po1 sant x = FX (u) "dinjecter" du = FX (x)dx = fX (x)dx. Ce qui nous donne 1 1 E((X)) = 0 FX (u) du = (x)fX (x) dx. Lensemble de ces considrations nous amnent au rsultat suivant. Thorme B.10. Soit X E(X) un prolongement de lesprance des variables alatoires discrtes une classe plus gnrale de variables alatoires qui satisfait les proprits (B.1). Soit X une variable alatoire continue dont la densit fX est continue par morceaux et telle que {x R; fX (x) = 0} est une runion nie dintervalles. Soit une fonction numrique borne et continue par morceaux, alors E (X) =
R
(x)fX (x) dx.
ANNEXE C
Elments de thorie de lintgration

lAnnexe B nous avons travaill pour mettre sur pied, avec les moyens du bord (les notions de srie numrique et dintgrale de Riemann), une notion desprance cohrente. Malheureusement, les lacunes laisses par cette notion desprance vont nous entraver plusieurs occasions. Nous reprenons donc la notion desprance en introduisant (sans preuves) les rsultats fondamentaux de la thorie de lintgrale de Lebesgue. Notations. Nous avons dj rencontr les esprances des variables alatoires discrtes xpX (x) E(X) =
xX
et des variables alatoires continues E(X) =

R
xfX (x) dx.
Dans les deux cas, la fonction de rpartition FX permet le calcul : E(X) = E(X) =
R
xFX (x) o FX (x) = FX (x) FX (x ) xdFX (x) o dFX (x) = fX (x) dx
Ceci nous suggre la notation unie E(X) =

R
x dFX (x).
Ainsi, lexpression de la Proposition B.10 et son analogue discret deviennent E((X)) = (x) dFX (x).
Intgration abstraite. Lesprance de X est dtermine par la fonction de rpartition FX et puisque FX est elle-mme spcie par la donne de X et de (, A, P) on sattend ce quune notion gnrale desprance de X puisse tre dnie partir des donnes (, A, P) et X : R. La variable alatoire X : R est dite simple si elle prend un nombre ni de valeurs. Les variables simples scrivent donc
n
X=
i=1
xi 1Ai
o A1 , . . . , An est une partition de . On dnit lintgrale de X, note E(X), par

n
E(X) =
i=1 93
xi P(Ai ).
94
C. ELMENTS DE THORIE DE LINTGRATION
Toute variable alatoire positive X : [0, [ est limite croissante dune suite (Xn )n1 de variables alatoires simples. Cest--dire : Xn () X() pour tout . On dnit alors lintgrale de X par E(X) = lim E(Xn ) [0, ].
n
Cette quantit, qui est ventuellement innie, existe en tant que limite dune suite croissante et est non-ambige : on peut montrer quelle ne dpend pas de la suite croissante approximante (Xn )n1 . Pour toute variable alatoire X, notons pour tout , X + () = max(X(), 0) et X () = max(X(), 0) de sorte X = X + X avec X + , X 0. Si E(X + ) et E(X ) ne sont pas innis simultanment, on dnit Cest en particulier le cas lorsque En thorie de la mesure on note E(X) =
E(X) = E(X + ) E(X ) [, +]. E(|X|) = E(X + + X ) < . X() P(d) =
X dP.
Lopration E est donc un oprateur qui agit sur lensemble des variables alatoires X telles que E(|X|) < . On montre que pour de telles variables alatoires X, Y et pour tous a, b R, E(aX + bY ) = aE(X) + bE(Y ) cest--dire que lensemble des variables alatoires X telles que E(|X|) < est un espace vectoriel et que E est une forme linaire qui agit sur cet espace vectoriel. Les proprits de continuit de lesprance mathmatique sont les suivantes. Thorme C.1 (Thormes de continuit de E.). Soit (Xn )n1 une suite de variables alatoires qui converge simplement vers X : limn Xn () = X(), pour tout , alors
(1) (convergence monotone) si (Xn )n1 est une suite positive et croissante, alors lim E(Xn ) = E(X) [0, ];
n
(2) (convergence domine) si |Xn ()| Y (), pour tout et E(Y ) < , alors lim E(Xn ) = E(X) R;
n
(3) (convergence borne) sil existe c R tel que |Xn ()| c, pour tout , alors lim E(Xn ) = E(X) R.
n
La convergence borne est bien sr un cas particulier de convergence domine. Des consquences directes du thorme de convergence domine sont les deux rsultats suivants.
C. ELMENTS DE THORIE DE LINTGRATION
95
Thorme C.2 (Continuit par rapport au paramtre). Soit X(t, ) une fonction sur R telle que pour tout t R, X(t, ) soit P-intgrable et pour tout , t X(t, ) R soit continue en to . Si de plus, il existe > 0 et une variable alatoire Y 0 telle que E(Y ) < et supt[to ,to +] |X(t, )| Y (), pour tout , alors est continue en to . t E(X(t, )) R
Thorme C.3 (Drivation sous le signe somme). Soient T un ensemble ouvert de R et X(t, ) une fonction sur T telle que pour tout t T, X(t, ) soit Pd intgrable et pour tout , t T X(t, ) R soit drivable. On note dt X(t, ) cette drive. Si de plus, il existe > 0 et une variable alatoire Y 0 telle que E(Y ) < d et supt[to ,to +] | dt X(t, )| Y (), pour tout , alors est drivable en to et sa drive est donne par d G (to ) = E( X(t, )|t=to ). dt Mesure image. G : t T E(X(t, )) R
Intgrale de Lebesgue-Stieltjes. Elle peut apparatre comme le cas particulier de lintgrale abstraite (de Lebesgue) avec = R. Plus precisment, soit X une variable alatoire de fonction de rpartition F. On fabrique partir de F une mesure de probabilit F sur la tribu de Borel de R comme suit. (a) dnir F (]a, b]) = F (b) F (a), (b) tendre le domaine de dnition de F la plus petite tribu de R contenant tous les intervalles : la tribu de Borel B. Ainsi, (R, B, F ) est un espace de probabilit et dF est appele lintgrale de Lebesgue-Stieltjes de par rapport F . On la note habituellement dF ou (x) dF (x). Si X est une variable alatoire discrte ou continue, on reconnat alors E((X)) = (x) dF (x).
On prend cette galit comme la dnition gnrale de lesprance de la variable alatoire (X) (que X soit discrte, continue ou autre). Une notation bien pratique, avec A B : E(1{XA} (X)) =
1{XA} (X) dP =
(X) dP =
{XA} A
(x) dF (x).
On remarque en passant que
E(1{XA} ) = P(X A) = F (A).
ANNEXE D
Convexit
On se place dans lespace vectoriel Rd . Dfinitions D.1 (Ensemble et fonction convexes). Pour tous x, y Rd , on note [x, y] le segment qui relie x et y, cest--dire [x, y] = {(1 t)x + ty; 0 t 1}. (1) On dit quune partie C de Rd est convexe si (D.2) x, y Rd , x, y C [x, y] C. x, y C, 0 t 1, ((1 t)x + ty) (1 t)(x) + t(y).
(D.3)
(2) On dit que la fonction : C R est convexe sur lensemble convexe C si
Dans la gure suivante, C est une partie convexe du plan alors que A ne lest pas puisque [a, b] A bien que a, b A : C y x b convexe non convexe A a
Exercice D.4. Montrer que les parties convexes de R sont les intervalles. La proprit (D.3) signie que toutes les cordes liant deux points du graphe de la fonction convexe sont situes au-dessus du graphe. Cest ce quillustre la gure suivante. corde (y) (1 t)(x) + t(y) graphe de (x) x (1 t)x + ty Dans la gure suivante, le graphe de gauche est celui dune fonction convexe puisque toutes ses cordes sont situes au-dessus, alors que celui de droite est celui dune fonction non-convexe.
97
98
D. CONVEXIT
convexe
non convexe Deux graphes fonctionnels
Proposition D.5. Soit : C R une fonction drivable sur une partie ouverte et convexe C de Rd . Les assertions suivantes sont quivalentes. (a) est convexe sur C.
o (x) = ( x1 (x), . . . , xd (x)) est le gradient de en x et u, v est le produit scalaire de u et v dans Rd . Dans le cas particulier o Rd = R, si de plus est une fonction sur un intervalle ouvert I R, deux fois continment direntiable (de classe C 2 ), alors les assertions (a) et (b) sont aussi quivalentes
(b) Pour tous x, y C, (y) (x) + (x), y x
(c) Pour tout x I, (x) 0. La partie C est suppose ouverte pour pouvoir dnir sans encombre la drive de . La proprit (b) signie que le graphe de se situe au-dessus de tous ses hyperplans tangents. graphe de
Preuve de (b) (a). Par labsurde. Supposons que (b) soit satisfait et que (a) ne le soit pas. Nous allons montrer une contradiction. Puisque (a) nest pas satisfait, il existe 0 < t < 1 tel que (D.6) Lhyperplan tangent au graphe de en xt := (1 t)x + ty a pour quation avec les coordonnes (u, ) Rd R : = (xt ) + , u xt o = (xt ) Rd . Puisque (b) est suppos vrai, nous avons en x : (X) (xt ) + , x xt = (xt ) , t(y x) (x) (xt ) > (1 t)(x) + t(y).
Dmonstration. Preuve de (a) (b). (a) exprime que pour tous x, y C et tout 0 t 1, (x + t(y x)) (x) + t[(y) (x)]]. Do en prenant t > 0, [(x + t(y x)) (x)]/t (y) (x), et en le faisant tendre vers 0 : (x), y x (y) (x), cest--dire (b).
D. CONVEXIT
99
et en y : (Y) En faisant (1t)(X)+t(Y), nous obtenons (xt ) (1t)(x)+t(y) qui contredit (D.6). Preuve de (b) (c). Prenons y x = th avec t > 0 de sorte que (b) nous donne (x + th) (x) (x)th 0. Dautre part, puisque est C 2 , il existe 0 1 tel que (x + th) (x) (x)th = (x + th)t2 /2. On en dduit que (x + th) 0 et en faisant tendre t vers 0, nous obtenons grce la continuit de que (x) 0. (xt ) + , y xt = (xt ) + , (1 t)(y x) (y)
Preuve de (c) (b). Puisque 0, est croissante et pour tous x y, y y (y) = (x) + x (z) dz (x) + x (x) dz = (x) + (x)(y x). Lorsque y x x y x, (y) = (x) + x (z) dz = (x) y (z) dz (x) + y (x) dz = (x) + (x)(y x). Ce qui prouve (b) et achve la preuve de la proposition. Dans la gure suivante, le graphe de gauche est celui dune fonction convexe puisque toutes ses tangentes sont situes au-dessous, alors que celui de droite est celui dune fonction non-convexe.
convexe
non convexe Deux graphes fonctionnels
Exercice D.7. Montrer que les fonctions suivants sont convexes. (b) (x) = |x|p , x R, avec p 1. (d) (x) = eax , x R, avec a R. (e) (x) = x ln x x + 1, x > 0. (f) (x) = ln x, x > 0. (a) (x) = ax + b, x R, avec a, b R. (c) (x) = xp , x [0, [, avec 0 p < 1.
(h) (x) = ( x ), x Rd o est une norme sur Rd et est une fonction convexe croissante sur [0, [. En particulier, (x) = x p , x Rd , avec p 1.
(g) (x) = x , x Rd une norme sur Rd . Par exemple, x = (x2 + + x2 )1/2 ou x = |x1 | + + |xd | ou x = 1 d max1id |xi |.

Proba2-Version 1 PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Proba2-Version 1 PDF

Загружено:

Авторское право:

Доступные форматы

Notes du cours de Probabilits 2 - Licence MMIA Version 1 (dcembre 2008) Christian Lonard

Table des matires

TABLE DES MATIRES

Chapitre 11. Chapitre 12.

(d) A = {2, 4, 6}c = {1, 3, 5}

(c) A = {2, 4, 6} {1, 2, 3} = {2}

(b) A = 2 (cest la plus grande tribu)

Le triplet (, A, P) est appel un espace de probabilit.

(3) P(A B) = P(A) + P(B) P(A B) Dmonstration. Laisse en exercice.

(a) Vrier que a est une mesure de probabilit sur A.

Dmonstration. Puisque (An )n1 est une suite croissante, A2 A1 A2 \ A1 A3 A=

2 1 Reprsentation graphique de y = FX (x)

2.1. FONCTION DE RPARTITION

x 1 0 Reprsentation graphique de z = FX (x) et pour 1 y < 1

(4) P(X [a, b[) = FX (b ) FX (a )

2.2. VARIABLES ALATOIRES DISCRTES

3 1 2 Reprsentation graphique de y = FX (x)

pour une certaine fonction fX : R [0, [ continue par morceaux et intgrable.

2.3. VARIABLES ALATOIRES CONTINUES

FX (x) = avec les fonctions de densit fX (x) = 1/(2) 0

Reprsentation graphique de z = fX (x)

= P(X [a, b[) =

x fX (x) dx = P(X (a, b))

aire h(h)/2 (h) h y = fX (x)

qui est lanalogue de (2.13).

2.4. QUELQUES LMENTS DE RFLEXION

0 Reprsentation graphique de y = FX (x)

Loi et esprance dune variable alatoire

P(X = xn ) = P(X B).

3. LOI ET ESPRANCE DUNE VARIABLE ALATOIRE

pn xn est une srie absolument convergente.

3.1. VARIABLES DISCRTES

les ym tant tous distincts et qm := = =

P(Y = ym ) P((X) = ym ) P(X = x) pn

Thorme 3.10. On suppose que (3.11) E[(X)] =

pn |(xn )| < . Alors,

Dmonstration. En notant Y = (X) comme prcdemment, nous avons E[(X)] =

(c) mM nN (m) (d)

Dmonstration. On reprend en la transposant la preuve du Thorme 3.10. Ce qui donne : P(X) = PY =

qui est le rsultat dsir.

3. LOI ET ESPRANCE DUNE VARIABLE ALATOIRE

Dmonstration. Preuve de (1). Nous avons xn 0 et pn 0 pour tout n N. Donc EX = nN pn xn 0.

pn [a(xn ) + b(xn )] pn (xn ) + b

3.2. VARIABLES CONTINUES

(x)fX (x) dx.

3. LOI ET ESPRANCE DUNE VARIABLE ALATOIRE

angle = X (0, 0) (1, 0)

[a(x) + b(x)]fX (x) dx (x)fX (x) dx + b

(2) Soient , CX telles que , alors E[(X)] E[(X)].

3.3. UNE NOTATION COMMUNE

PX (B) := P(X B) = pour tout intervalle B = (a, b) R.

(1) la quantit dPX =

(xn )pn pn xn ou bien

lorsque X est discrte de loi PX = (2) la quantit dPX =

ou avec notre nouvelle notation :

E(X) E(X) dPX dPX .

Normalisation. On note 1 la fonction constante gale 1. (3.27) E(1) =

dPX = PX (R) = P() = 1.

3. LOI ET ESPRANCE DUNE VARIABLE ALATOIRE

E[(1{X<1} + 1{X1} )X p ] E[1{X<1} X p ] + E[1{X1} X p ] 1 + E[1{X1} X q ] 1 + E[X q ] < .

3. LOI ET ESPRANCE DUNE VARIABLE ALATOIRE

3.8. EGALIT EN LOI

3. LOI ET ESPRANCE DUNE VARIABLE ALATOIRE