Вы находитесь на странице: 1из 81

Elment du Module:

1 - Statistique
CHERIF Walid - Statistique Anne universitaire: 2013/2014
Enseign par:
CHERIF Walid
ENSAJ
Ch. 01: Introduction la Statistique
1. Rappels et Gnralits:
CHERIF Walid - Statistique
La Statistique: mthode scientifique
Les statistiques: produit de la statistique
Population et Individu: lunit {vivant sous le mme toit: mnage; liens de
mariage/sang: famille}
Echantillon: Maroc: a 6 000 000 mnages
7200 : est un chantillon
<exhaustif> : on peut mesurer lerreur dchantillon
Caractre: - qualitatif : * nominal: sexe.
* ordinal: degr de satisfaction (peu, assez)
- quantitatif : * continu: ge
* discret: taille du mnage
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Ex: Rpartition des mnages marocains selon les classes de dpense (en dh) entre 1999 et 2010
Classes de dpense Nombre de mnages
] 0 ; 1500 ] 500
] 1500 ; 5000 ] 250
] 5000 ; 15000 ] 650
] 15000 ; 30000 ] 100
] 30000 ; 100000] 10
( * )
* : donne approximative (refus de dclaration)
Lgende : pour prciser plus dinformations
Tableau 01: rpartition des mnages marocains
suivant les classes de dpenses
Titre
Source 01: Enqute nationale sur la consommation. Direction de la statistique (2011)
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Classes de dpense Nombre de mnages
] 0 ; 1500 ] 500
] 1500 ; 5000 ] 250
] 5000 ; 15000 ] 650
] 15000 ; 30000 ] 100
] 30000 ; 100000] 10
Effectif absolu
1510
Total
Frquence relative
33,11 %
16,55 %
43,04 %
6,62 %
0,66 %
500
1510
250
1510
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Classes de dpense Frquences absolues Frquences relatives Frquences cumules F . Cumules inverse
] 0 ; 1500 ] 500 33,11 % 33,11 % 100 %
] 1500 ; 5000 ] 250 16,55 % 49,66 % 66,99 %
] 5000 ; 15000 ] 650 43,04 % 92,7 % 51,33 %
] 15000 ; 30000 ] 100 6,62 % 99,33 % 7,3 %
] 30000 ; 100000] 10 0,66 % 100 % 0,66 %
1510
Total
=

=
=1

= 100%
1
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Modalit Frquences absolues Frquence corrige
1 400 400
2 500 250
3 360 120
4 40 10
5 100 20
Frquence corrige :

Ch. 01: Statistique un seul caractre


2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Reprsentation graphique
a. Caractre qualitatif : Diagramme en tuyau dorgues / diagramme circulaire
Degr de satisfaction des clients
satisfait
moyen
peu
non
0
10
20
30
40
Hommes Femmes
Nombre d'accidents
Nombre
d'accidents
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Reprsentation graphique
b. Caractre quantitatif discret : Diagramme en bton
0
2
4
6
1999 2003 2007 2011
Tailles des mnages
Tailles des
mnages
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Reprsentation graphique
c. Caractre quantitatif continu: Histogramme
0
100
200
300
400
500
600
Dpenses des mnages
Dpenses des
mnages
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Reprsentation graphique
Polygone de frquence:
Relie les points (

)
0
1
2
3
4
5
0 2 4 6 8 10 12
Evolution des
changes
c
i
: centres des classes
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
Yule :
Les caractristiques de tendance centrale doivent vrifier les conditions de Yule :
- Proches des observations (
1
,
2

)
- Etre bien dfinies
- Tenir compte de toutes les observations (
1
,
2

)
- Etre simples calculer
- Avoir une signification
- Se prter au calcul algbrique
- Etre peu sensible aux fluctuations dchantillonnage.
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
Observations individuelles :
1
,
2

Observations groupes :
1

1
,
2

2

]
1
,
2
] , ]
1
,
2
] ]
1
,
2
]
Dfinition:
Valeur du caractre qui spare la population en 2 parties: 50% se situent au-
dessous de la mdiane et 50% se situent au dessus
Exemple:
Les notes de 5 tudiants: 15, 12, 03, 11, 02
On classe les notes,
La mdiane est la valeur du milieu: 11
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
Pour N impair : = +1
2
Pour N pair : On aura 2 valeurs: =
2
et = +2
2
Par convention, on prend: =
2

ou
Cas des observations groupes:
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :

= (

= (

= (

)
Cas dun caractre quantitatif discret
(

=
50 %

tel que:
(

) < 50% (

)
(

)
On prend:
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :

10 1 5 % 5 %
20 2 10 % 15 %
28 3 14 % 29 %
52 4 26 % 55 %
70 5 35 % 90 %
20 6 10 % 100 %
Cas dun caractre quantitatif discret
= 4

On a: 3 = 29 %
4 = 55 %
3 < 50 % 4
Donc :
200
Ch. 01: Statistique un seul caractre
47
53
45
50
55
24 ? 29
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
Cas dun caractre quantitatif continu

= ,

]
tel que:

= 50%

On a:

i.e:
(

)(

)
(

)(

)
=

a.n:
53 50
53 47
=
29

2924
c/c:
a
A
b
B
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
1) La mdiane rend minimale la somme des carts absolus des observations % nombre u :
=
=1

u|
Ceci explique que la mdiane est la valeur la moins loigne des observations.
(conditions de Yule)
2) La mdiane est invariable par transformation linaire :
Si:

ont pour mdiane .


Alors:

telles que :

= .

+
ont pour mdiane: = . +
3) Pour deux fonctions :croissante, et dcroissante,
on a: = pour = .
Proprits de la mdiane :
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
2. Le mode :
Dfinition:
Valeur du caractre pour laquelle les frquences relatives sont les plus
leves
Exemple:
Le nom Mohammed pour les prnoms
arabes musulmans
4 Taille modale
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
2. Le mode :
Cas dune distribution continue
Classe modale
Dterminer le mode : m
m
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
2. Le mode :
Cas dune distribution continue
Remarque
Plusieurs populations => Plusieurs modes
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.1 - Moyenne arithmtique

1
,
2

: des observations individuelles

=

=1

Proprits :
1)
=1


) = 0
2) Thorme de Koenig:
=1

) =

=1


) +


2
3) B =
=1

) atteint son minimum pour : =


Ch. 01: Statistique un seul caractre


Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
Proprits :
1)
=1


) = 0
2) Thorme de Koenig:
=1

) =
=1


) +


2
3) B =
=1

) atteint son minimum pour : =


4) Si:

+ Alors:

=

+
5) Soit une sous population de taille
1
, et de moyenne
1
, et une autre sous
population de taille
2
, et de moyenne
2
, alors:

=

1

1
+
2

1
+
2
6) Gnralisation:

=

=1

=1

3.1 - Moyenne arithmtique


Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
- Cas dun caractre quantitatif discret:
3.1 - Moyenne arithmtique
- Observation individuelles:
=

=1

- Observation groupes:

=

=1

=1

- Cas dun caractre quantitatif continu:

=

=1

=1

: centre de classe =

1
+

2
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.2 - Moyenne gomtrique
Gnralisation:

=
1
+
= .
1
=

1
:

=
1
. (1 +)

=
1
. (1 +)

1
=
2
. (1 + )

=
1
. 1 + =
2
. (1 +) =
1
. (1 + )
1



Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.2 - Moyenne gomtrique
Application:
Vous avez investi en bourse le Mercredi : 05/02/14 un montant de 1000 dh.
Le jeudi : 06/02/14 a connu une croissance de 1 %.
Le vendredi : 07/02/14 a connu une baisse de 1 %.
Pouvez-vous retirer votre argent le vendredi?
Ch. 01: Statistique un seul caractre
=

=1

Caractristiques de tendance centrale de position ou de location


CHERIF Walid - Statistique
3. La moyenne:
3.2 - Moyenne gomtrique
Gnralisation:

=
1
. 1 +
1
=
2
. 1 +
2
. 1 +
1
=

1

2

3

4

=
0
.
=1

1 +

1 + (1 +

=
0
. (1 + )

1 + =

=1

1 +

Ch. 01: Statistique un seul caractre


Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.3 - Moyenne harmonique
Application:
Sur lautoroute El Jadida Casablanca, la vitesse de la voiture varie d 1 Km un autre.
Calculer le temps moyen du trajet.

1
2
3
90
1
V2 90
3
=
1

=

=1

=1

/:
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.4 - Moyenne quadratique
Application: Donnez le ct moyen des carrs
=

=1

Gnralisation:
(

=

=1

=


=1

Soit :
Ch. 01: Statistique un seul caractre
Notons

les cts des carrs:


Les superficies des carrs sont donc:

La superficie moyenne des carrs est:



=1

Do, le ct moyen est:


Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.5 Comparaison des moyennes
Comparez les 4 moyennes : (n=2)
-


=

1
+
2
2
- =
1
.
2
- =
2
1

1
+
1

2
- =

1
+
2

2
Ch. 01: Statistique un seul caractre
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
1. Dispersion:
Htrognit

1
,
2

: caractre quantitatif
:

Exemple: N=3

1
,
2
,
3

12
=
2

1

13
=
3

1

23
=
3

2

=

12
+
13
+
23
3

=
(
2

1
) + (
3

1
) +(
3

2
)
3
=
2(
3

1
)
3
=
2(

)
3
=
2
3
:
Ch. 01: Statistique un seul caractre
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
1. Fractiles:
Htrognit

1
,
2

: caractre quantitatif
:

3
fractile
25 %
50 %
75 %
Ch. 01: Statistique un seul caractre
Fractile dordre 50 % = Mdiane
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
1. Fractiles:
Ch. 01: Statistique un seul caractre
Exemple :

10 %
25 %
30 %

] 10 %
]

] 20 %
]

(10 %)

(90 %)
(1) ()

Caractristiques de dispersion et de forme


CHERIF Walid - Statistique
2. Ecart absolu:

1
,
2

: caractre quantitatif

=
1

=1


Ch. 01: Statistique un seul caractre

=
1

=1

Caractristiques de dispersion et de forme


CHERIF Walid - Statistique
2. Ecart type:

1
,
2

: caractre quantitatif

=
1

=1



)
Ch. 01: Statistique un seul caractre

= V(X): Variance de X

: est appel coefficient de variation


Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
2. Ecart type:
Ch. 01: Statistique un seul caractre
Proprit:
Si: a pour cart type

Alors: ( +) a pour cart type

- Dmontrez la proprit.
- Dmontrez que:


Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
1. Mdiale: la distribution de 250 employs selon leur salaire
Salaire
(en 1000 dh)
Centres de classes

Effectifs

cumuls
croissants
[8 - 8,4[ 8,2 10 82 82
[8,4 - 8,8[ 8,6 30 258 340
[8,8 - 9,0[ 8,9 60 534 874
[9,0 - 9,2[ 9,1 72 655,2 1 529,2
[9,2 - 9,6[ 9,4 40 376 1 905,2
[9,6 - 10,2[ 9,9 24 237,6 2 142,8
[10,2 - 10,9[ 10,55 14 147,7 2 290,5
Total 250 2 290,5
On appelle mdiale le salaire Ml correspondant la moiti de la masse des salaires
distribus
/2 = 1145,25
- Pour moins de 9000 dh, la somme des salaires est : 874 000 dh
- Pour moins de 9200 F CFA, la somme des salaires est : 1 529 200 dh
Comme pour la mdiane, on dduit le salaire mdial: 9083 dh
La mdiane partage la masse des effectifs en deux fractions de mme poids.
La mdiale partage la masse des

en deux fractions de mme poids.


Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
2. Indice de GINI :
Lindice de Gini est une mesure statistique de la dispersion d'une distribution dans une
population donne, variant de 0 1:
0 signifie l'galit parfaite et 1 signifie l'ingalit totale.
Il est trs utilis pour mesurer l'ingalit des revenus dans un pays. Sil dpasse 0.67, le pays
passe un tat critique.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0
%
5
%
1
0
%
1
5
%
2
0
%
2
5
%
3
0
%
3
5
%
4
0
%
4
5
%
5
0
%
5
5
%
6
0
%
6
5
%
7
0
%
7
5
%
8
0
%
8
5
%
9
0
%
9
5
%
1
0
0
%
Part cumule de la population
Part
cumule
du
revenu
Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
2. Indice de GINI :
Analytiquement, pour n tranches, le coefficient de Gini s'obtient par la formule de Brown:
= 1
=0
1

+1

.
+1

: part cumule de la population.

: part cumule du revenu.


Pour n personnes ayant des revenus

indics par ordre croissant (


+1
):
=
2
=1


=1


+1

Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
2. Indice de GINI :
Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
1. Frquences:
=

=
=1

Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
2. Mode, mdiane et mdiale:
- Mdiane: Valeur du caractre qui spare la population en 2 parties:
50% se situent au-dessous et 50% se situent au dessus.
- Mode: Valeur du caractre pour laquelle les frquences relatives
sont les plus leves.
- Mdiale: Valeur du caractre qui spare lensemble des valeurs observes
en 2 parties: 50% se situent au-dessous et 50% au dessus.
Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
3. Moyennes :
Moyenne Formule Utilisation Exemple

=

=1

Observations indpendantes - Moyenne des salaires


- Moyenne des tailles

=1

Observations dpendantes
Variation en (1+

)
- Taux bancaires
- Bourse
- Gomtrie

=1

Ecriture en
1

- Moyenne des vitesses


- Moyenne des concentrations

=

=1

Ecriture en

- Moyenne des surfaces carrs


Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
3. Ecarts :

=
1

=1

=
1

=1

=
1

=1

Fin du chapitre 1
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
Ch. 02: Statistique deux caractres
CHERIF Walid - Statistique
Comparaison
Dfinition
Une srie statistique deux caractres est une srie dont les valeurs

et
les valeurs

peuvent tre observes simultanment. Elles sont donnes par


des couples (; ).
Leur reprsentation dans un repre orthogonal forment les points de
coordonnes (

). On lappelle nuage de points.


Statistique un seul caractre Statistique deux caractres
Taille 1,80 1,75 1,95 2,05 1,70
Athltes 30 20 12 3 15
Salaire [5000,
8000[
[8000,
11000[
[11000,
14000[
Employs 30 20 12
Taille dun chantillon de 80 athltes
Tranches de salaires des employs
dune socit
Taille 1,80 1,75 1,95 2,05 1,70
Poids 75 74 90 93 85
Taille et poids dun chantillon dathltes
Ch. 02: Statistique deux caractres
CHERIF Walid - Statistique
Exemple 1 :
Tailles et Poids des 10 athltes
Poids

80 90 93 75 86 97 124 88 90 75
Taille

1,82 1,88 1,97 1,65 1,92 1,99 2,01 1,88 1,93 1,75
Donner le nuage de points associ cette srie statistique
1,6
1,65
1,7
1,75
1,8
1,85
1,9
1,95
2
2,05
2,1
70 90 110
Ch. 02: Statistique deux caractres
CHERIF Walid - Statistique
Exemple 2 : La moyenne des tudiants suivant le nombre dheures de
prparation des examens
Nombre dheures

2 10 30 15 13 28 22
Moyenne

6 14 15 16 10 18 14
Donner le nuage de points associ cette srie statistique
0
2
4
6
8
10
12
14
16
18
20
0 10 20 30 40
Ch. 02: Statistique 2 variables :
Exemple 3 :
La part consacre au logement dans le budget dun foyer ( en 1000 dh).
CHERIF Walid - Statistique
Revenu

8,6 10,5 9,5 8,1 9,7 6,5 7,1


D. Logement

4,4 5,2 4,3 3,2 3,3 2,8 3,5


Donner le nuage de points associ cette srie statistique
0
1
2
3
4
5
6
6 7 8 9 10 11
Logement
Ch. 02: Statistique 2 variables :
2.1 - Point moyen
CHERIF Walid - Statistique
0
1
2
3
4
5
6
6 7 8 9 10 11
Le point moyen dun nuage de points est le point G de coordonnes ( ; ) o :
=
1

=0

=
1

=0

Ch. 02: Statistique 2 variables :


2.2 - Ajustement par la mthode des moindres carrs
Effectuer un ajustement de en dun nuage de points par la mthode des
moindres carrs consiste trouver la fonction f du modle retenu qui minimise la
somme des carrs des carts entre les valeurs

observes et les valeurs f(

)
donnes par le modle.
La fonction f doit donc minimiser lexpression:
=1

f(

))
CHERIF Walid - Statistique
Interprtation graphique:
Cela revient minimiser la somme des carrs
des distances verticales entre la courbe et
les points du nuage :
(
1

1
) + (
2

2
) + + (

)
Ch. 02: Statistique 2 variables :
2.2 - Ajustement par la mthode des moindres carrs
CHERIF Walid - Statistique
Remarque :
1. Pour une valeur
0
donne du caractre , la fonction f permet de prvoir le rsultat
correspondant de la variable .
On supposera que
0
f(
0
).
2. Si
0
appartient est compris entre
1
et

:
on parle dinterpolation.
3. Si
0
est en dehors de lintervalle
dobservation du caractre x:
on parle dextrapolation
Ch. 02: Statistique 2 variables :
2.2 - Ajustement par la mthode des moindres carrs
CHERIF Walid - Statistique
Ajustement affine par la mthode des moindres carrs:
On appelle covariance de et de le nombre :
cov , =
1

=1

)(

)
La variance du caractre est:
V =
1

=1


Elle est utilise pour le calcul de lcart type :
() = ()
V = cov ,
Ch. 02: Statistique 2 variables :
Thorme :
CHERIF Walid - Statistique
Lors dun ajustement affine par la mthode des moindres carrs:
La droite (D) servant lajustement de en :
- a comme coefficient directeur:
=
(, )
()
- passe par le point moyen du nuage: G( , ).
1. Ces deux donnes permettent de dterminer une quation de cette droite.
2. Cette droite est appele droite de rgression de y en x.
Ch. 02: Statistique 2 variables :
Exemple :
On prend lexemple des parts du logement, mais en remplaant la
variable par = 1978 (prendre le rang des annes)
CHERIF Walid - Statistique
Anne 1978 1984 1992 1994 2000 2004 2009
Rang des annes

0 6 14 16 22 26 31
Part en %

4,4 5,2 4,3 3,2 3,3 2,8 3,5


On a dj vu que: = 16,42 et = 3, 81.
Pour calculer la variance et la covariance:
La liste 1 (
1
) contient les

La liste 2 (
2
) contient les

La liste 3 (
3
) contient

, cest--dire :
3
=
1
16,42
La liste 4 (
4
) contient (

), cest--dire :
4
=
3
.
La liste 5 (
5
) contient

, cest--dire:
5
=
2
3, 81
La liste 6 (
6
) contient (

) (

), cest--dire
6
=
3

5
On a alors:
=
(, )
()
(, )=
(
6
)
7
()=
(
4
)
7
La droite de rgression: =
(,)
()
+ b. Elle passe par G (on obtient b).
Ch. 02: Statistique 2 variables :
Droite d'ajustement affine : Mthode de Mayer
CHERIF Walid - Statistique
Dans le cas d'un nuage de points de forme allonge, et afin de faciliter l'tude de la
srie, il est possible de remplacer ce nuage par une droite appele droite d'ajustement
affine.
Pour tracer cette droite, on utilise la mthode de Mayer.
Exemple :
Le tableau suivant donne le chiffre d'affaire ralis au cours des 6 derniers mois par un
site de vente en fonction du nombre de commandes reues:
Nombre de
commandes

6 400 8 350 9 125 9 600 10 050 12 000


Chiffre daffaire
mensuel

250 000 320 000 335 000 350 000 370 000 400 000
Ch. 02: Statistique 2 variables :
Droite d'ajustement affine : Mthode de Mayer
CHERIF Walid - Statistique
Reprsentation du nuage de points :
200000
250000
300000
350000
400000
450000
5000 7000 9000 11000 13000
Ch. 02: Statistique 2 variables :
Droite d'ajustement affine : Mthode de Mayer
CHERIF Walid - Statistique
Calcul des coordonnes des points moyens
1
et
2
:
On partage le nuage de points en deux groupes de mme importance suivant les valeurs
croissantes de

, et on calcule les coordonnes des points moyens


1
et
2
de chaque
groupe de points:

1
=
6400+8350+9125
3

1
(
1
,
1
)

1
=
250000+320000+335000
3

2
=
9600+10050+12000
3

2
(
2
,
2
)

2
=
350000+370000+400000
3
On trace la droite d'ajustement qui passe par les deux points
1
et
2
Equation de la droite d'ajustement affine :
= + o:
=

2

1
=
1
.
1
=
2
.
2
Ch. 02: Statistique 2 variables :
Exercice 01:
CHERIF Walid - Statistique
Depuis 1900, les chercheurs ont relev des tats de contamination du virus RG2 chez
certaines races doiseaux.
Leur recherche les a men lier la cause du virus au climat des rgions concernes.
Le tableau suivant regroupe le nombre doiseaux atteints par ce virus:
Climat

81 84 89 93 97 99
Nombre d

oiseaux

2 500 3 200 4 500 3 300 1 900 4 900


Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Question 01 :
Existe-t-il une relation entre les investissements publicitaires dune
entreprise et lvolution de son chiffre daffaires ?
Question 02:
Existe-t-il une relation entre la place dun tudiant dans la classe et sa note
finale?
Ltude de la corrlation entre deux sries permet didentifier la
dpendance ou lindpendance qui existe entre deux sries. Ce degr de
dpendance peut tre vrifi en calculant le coefficient de corrlation ou
vrifi par les droites dajustement.
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Interprtation:
-1 r 1
Lorsque la corrlation est forte (r ):
les droites de rgression sont trs proches et le nuage peut tre
approxim par une droite.
Lorsque la corrlation est faible, le nuage de points ne peut pas tre
ajust par une droite, mais il se peut quune autre courbe permette un
bon ajustement.
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple:
Existe une corrlation entre la taille et le poids des athltes dun club
descalade.
Les donnes individuelles sont indiques dans le tableau suivant:
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Droite dajustement (ou de rgression des moindres carrs):
Nous avons vu quil tait possible de calculer la droite dajustement dune
srie de donnes. De la mme faon il est possible de calculer la droite
dajustement dune srie 2 variables.
Cette dernire na de sens que sil existe une corrlation entre les deux
sries de donnes.
Rappel:
Droite de la forme y = a.x + b de telle sorte que la somme des carts positifs
la droite soit gale la somme des carts ngatifs
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
La droite trace se prsente ainsi, la corrlation de 0,949 est forte et les
points sont resserrs autour de la courbe de tendance.
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple 1:
Dans lexemple suivant nous recherchons la corrlation entre lge dinvestisseurs
et les plus-values ralises.
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple 1:
Dans lexemple suivant nous recherchons la corrlation entre lge dinvestisseurs
et les plus-values ralises.
La droite trace correspond une
corrlation faible, et les points
sont disperss autour de la droite.
Un coefficient de corrlation de +1 correspond une courbe de tendance ascendante et une
corrlation ngative une courbe descendante.
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple 2:
Nous tudions la corrlation entre le prix de vente dun article et le chiffre
daffaires ralis. Un article vendu gnre 50 dh de CA et 5 articles gnrent 250
dh de CA.
La corrlation est totale le coefficient de +1
=> La courbe est ascendante
Ch. 02: Statistique 2 variables :
Corrlation
CHERIF Walid - Statistique
Exemple 3:
Nous tudions la corrlation entre le nombre darticles achet et son prix dachat.
Plus la quantit achete est importante et plus le prix dachat unitaire est faible.
La corrlation est total le coefficient de -1
=> La courbe est descendante :
CHERIF Walid - Statistique
- Suite -
La socit Pol-Arctique est spcialise
dans la commercialisation de vtements
de sport.
On vous communique ci-dessous le CA
des 6 dernires annes et les dpenses de
publicit
1. Existe-t-il une corrlation entre les
dpenses de publicit et le CA ?
2. Calculer le CA Prvisionnel de 2010
Exercice 02
Ch. 02 - TD
Ch. 02: Statistique 2 variables :
Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Le tableau suivant donne la rpartition dun chantillon de mnages
ruraux selon la dpense annuelle totale X en milliers de dirhams et la
dpense annuelle en lectricit Y en centaines de dirhams.
Pour mesurer lintensit de la corrlation entre deux caractres quantitatifs, on
tudie les variations des moyennes conditionnelles

ou

X \ Y 0-3 3-4 4-5 5-7,5 7,5-10 Total


0-5 6,3 1,1 0,4 0,4 0,4 8,6
5-7,5 3,6 1,5 0,8 1,7 0,2 7,6
7,5-10 2,5 1,1 1,7 1,3 0,4 7,0
10-14 4,4 5,0 2,8 4,2 1,5 17,9
14-18 0,4 2,9 3,8 6,3 2,2 15,6
18-24 0,6 1,5 2,8 7,0 2,3 14,2
24-30 1,3 0,5 3,2 14,0 9,6 28,9
Total 19,1 13,9 15,5 34,9 16,6 100,00
Ch. 02: Statistique 2 variables :
Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Complter le tableau de calcul:

Moyennes conditionnelles suivant Y

Moyennes conditionnelles suivant X

1
=
2,5 6,3 + 6,25 3,6 + 8,75 2,5 +12 4,4 + 16 0,4 +21 0,6 +27 1,3
6,3 +3,6 + 2,5 +4,4 + 0,4 +0,6 +1,3
X \ Y 0-3
0-5 6,3
5-7,5 3,6
7,5-10 2,5
10-14 4,4
14-18 0,4
18-24 0,6
24-30 1,3
Total 19,1
Ch. 02: Statistique 2 variables :
Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Dans le tableau de calcul: on a remplac chaque classe par son centre et
on a calcul les moyennes conditionnelles :

2,5 6,25 8,75 12,00 16,00 21,00 27,00


2,4535 3,4135 3,8393 4,25 5,5288 5,8187 6,5969


Moyennes conditionnelles suivant Y

1,5 3,5 4,5 6,25 8,75


8,745 12,946 16,805 20,034 21,812


Moyennes conditionnelles suivant X
Analyse 1: La dpense moyenne en lectricit

croit avec le centre

La dpense moyenne en lectricit

croit avec le centre

Ch. 02: Statistique 2 variables :


Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Courbe de rgression Y en X Courbe de rgression X en Y

Ch. 02: Statistique 2 variables :


Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Quoiquil ny a pas de relation directe entre la dpense annuelle en
lectricit et la dpense annuelle totale dun mnage, on peut affirmer
que quand la dpense totale augmente, la dpense en lectricit
augmente, mais seulement en moyenne .
Dfinition:
On appelle:
courbe de rgression Y en X, la ligne brise qui joint les points M
i
(x
i
, y
i
).
courbe de rgression X en Y, la ligne brise qui joint les points M
j
(y
j
, x
i
).
Ces deux courbes nous renseignent graphiquement sur le sens et le degr
de la corrlation entre X et Y.
Ch. 02: Statistique 2 variables :
1. Distributions marginales
CHERIF Walid - Statistique
On note

le nombre dindividus prsentant les modalits

et

.
(
=1

=1

= )
Tableau statistique dune tude simultane de deux caractres
Modalits du
caractre X
Modalits du caractre Y Distribution
marginale de X

11

1

1

1 .

.
Distribution de Y
. 1

.

.

. .
=
Ch. 02: Statistique 2 variables :
1. Distributions marginales
CHERIF Walid - Statistique
On appelle frquence du couple (ou frquence totale) des modalits

et

la
proportion dindividus qui prsentent simultanment les modalits

et

Distributions marginales :
Les effectifs
.
dfinissent la distribution marginale de X.
La frquence marginale de la modalit

est :

.
=

.

De mme pour Y, on dfinit les frquences marginales


.
=

.

Ch. 02: Statistique 2 variables :


2. Distributions conditionnelles
CHERIF Walid - Statistique
La j
me
colonne du tableau statistique dcrit la sous population des individus
possdant la modalit

suivant le caractre X. La frquence conditionnelle


de la modalit

sachant

(ou lie

) est:

.
( f i sachant j)
De mme, la distribution conditionnelle sachant

est :

.
Remarque:

=
.
.

=
.
.

Ch. 02: Statistique 2 variables :


3. Indpendance et dpendance
CHERIF Walid - Statistique
Le caractre X est indpendant du caractre Y si les distributions
conditionnelles (|

) sont identiques entre elles :

ne dpend pas de et
sont alors identiques la distribution de X.
Les colonnes du tableau statistique sont proportionnelles entre elles.
Exemple: - caractres indpendants -
Modalits du
caractre X
Modalits du caractre Y

1

2

3

4

3
3 5 2 4
6 10 4 8
12 20 8 16
Ch. 02: Statistique 2 variables :
3. Indpendance et dpendance
CHERIF Walid - Statistique
Le Chi-deux : - mesure de lintensit de la dpendance entre X et Y -
Le Chi-deux permet de comparer le tableau des effectifs relevs ce
quil aurait du tre si les caractres avaient t indpendants.
=
=1

=1



.
.
.

.
.
.

= N (
=1

=1

.
.
.
1)
Proprits :
- Les caractres X et Y sont indpendants ssi X=0.
- X 0 est dautant plus grand que la liaison entre X et Y est forte.
Ch. 02: Statistique 2 variables :
Application
Indpendance:
CHERIF Walid - Statistique
P1. X et Y sont indpendants si les distributions conditionnelles
selon le caractre Y, pour X fix sont identiques.
X/Y B1 B2 B3 B4 Total
A1 5 15 20 10 50
A2 8 24 32 16 80
A3 7 21 28 14 70
Total 20 60 80 40 200
(n11)
(n21)
(n.1) (n.2)
1. Considrons les individus qui prsentent la modalit B3, parmi ceux qui
prsentent les modalits A1, A2 et A3:
100 x 20/50 = 40% pour A1
100 x 32/80 = 40% pour A2
100 x 28/70 = 40% pour A3

3/1

=
3/2

=
3/3

= 40 %

3/1

3/2

P2. X et Y sont indpendants si et seulement si les frquencesconditionnelles

sont le produit des frquences marginales


.
et
.

Вам также может понравиться