Академический Документы
Профессиональный Документы
Культура Документы
1 - Statistique
CHERIF Walid - Statistique Anne universitaire: 2013/2014
Enseign par:
CHERIF Walid
ENSAJ
Ch. 01: Introduction la Statistique
1. Rappels et Gnralits:
CHERIF Walid - Statistique
La Statistique: mthode scientifique
Les statistiques: produit de la statistique
Population et Individu: lunit {vivant sous le mme toit: mnage; liens de
mariage/sang: famille}
Echantillon: Maroc: a 6 000 000 mnages
7200 : est un chantillon
<exhaustif> : on peut mesurer lerreur dchantillon
Caractre: - qualitatif : * nominal: sexe.
* ordinal: degr de satisfaction (peu, assez)
- quantitatif : * continu: ge
* discret: taille du mnage
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Ex: Rpartition des mnages marocains selon les classes de dpense (en dh) entre 1999 et 2010
Classes de dpense Nombre de mnages
] 0 ; 1500 ] 500
] 1500 ; 5000 ] 250
] 5000 ; 15000 ] 650
] 15000 ; 30000 ] 100
] 30000 ; 100000] 10
( * )
* : donne approximative (refus de dclaration)
Lgende : pour prciser plus dinformations
Tableau 01: rpartition des mnages marocains
suivant les classes de dpenses
Titre
Source 01: Enqute nationale sur la consommation. Direction de la statistique (2011)
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Classes de dpense Nombre de mnages
] 0 ; 1500 ] 500
] 1500 ; 5000 ] 250
] 5000 ; 15000 ] 650
] 15000 ; 30000 ] 100
] 30000 ; 100000] 10
Effectif absolu
1510
Total
Frquence relative
33,11 %
16,55 %
43,04 %
6,62 %
0,66 %
500
1510
250
1510
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Classes de dpense Frquences absolues Frquences relatives Frquences cumules F . Cumules inverse
] 0 ; 1500 ] 500 33,11 % 33,11 % 100 %
] 1500 ; 5000 ] 250 16,55 % 49,66 % 66,99 %
] 5000 ; 15000 ] 650 43,04 % 92,7 % 51,33 %
] 15000 ; 30000 ] 100 6,62 % 99,33 % 7,3 %
] 30000 ; 100000] 10 0,66 % 100 % 0,66 %
1510
Total
=
=
=1
= 100%
1
Ch. 01: Statistique un seul caractre
2. Tableaux statistiques et reprsentations graphiques:
CHERIF Walid - Statistique
Tableau statistique
Modalit Frquences absolues Frquence corrige
1 400 400
2 500 250
3 360 120
4 40 10
5 100 20
Frquence corrige :
)
0
1
2
3
4
5
0 2 4 6 8 10 12
Evolution des
changes
c
i
: centres des classes
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
Yule :
Les caractristiques de tendance centrale doivent vrifier les conditions de Yule :
- Proches des observations (
1
,
2
)
- Etre bien dfinies
- Tenir compte de toutes les observations (
1
,
2
)
- Etre simples calculer
- Avoir une signification
- Se prter au calcul algbrique
- Etre peu sensible aux fluctuations dchantillonnage.
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
Observations individuelles :
1
,
2
Observations groupes :
1
1
,
2
2
]
1
,
2
] , ]
1
,
2
] ]
1
,
2
]
Dfinition:
Valeur du caractre qui spare la population en 2 parties: 50% se situent au-
dessous de la mdiane et 50% se situent au dessus
Exemple:
Les notes de 5 tudiants: 15, 12, 03, 11, 02
On classe les notes,
La mdiane est la valeur du milieu: 11
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
Pour N impair : = +1
2
Pour N pair : On aura 2 valeurs: =
2
et = +2
2
Par convention, on prend: =
2
ou
Cas des observations groupes:
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
= (
= (
= (
)
Cas dun caractre quantitatif discret
(
=
50 %
tel que:
(
) < 50% (
)
(
)
On prend:
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
10 1 5 % 5 %
20 2 10 % 15 %
28 3 14 % 29 %
52 4 26 % 55 %
70 5 35 % 90 %
20 6 10 % 100 %
Cas dun caractre quantitatif discret
= 4
On a: 3 = 29 %
4 = 55 %
3 < 50 % 4
Donc :
200
Ch. 01: Statistique un seul caractre
47
53
45
50
55
24 ? 29
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
Cas dun caractre quantitatif continu
= ,
]
tel que:
= 50%
On a:
i.e:
(
)(
)
(
)(
)
=
a.n:
53 50
53 47
=
29
2924
c/c:
a
A
b
B
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
1. La mdiane :
1) La mdiane rend minimale la somme des carts absolus des observations % nombre u :
=
=1
u|
Ceci explique que la mdiane est la valeur la moins loigne des observations.
(conditions de Yule)
2) La mdiane est invariable par transformation linaire :
Si:
telles que :
= .
+
ont pour mdiane: = . +
3) Pour deux fonctions :croissante, et dcroissante,
on a: = pour = .
Proprits de la mdiane :
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
2. Le mode :
Dfinition:
Valeur du caractre pour laquelle les frquences relatives sont les plus
leves
Exemple:
Le nom Mohammed pour les prnoms
arabes musulmans
4 Taille modale
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
2. Le mode :
Cas dune distribution continue
Classe modale
Dterminer le mode : m
m
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
2. Le mode :
Cas dune distribution continue
Remarque
Plusieurs populations => Plusieurs modes
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.1 - Moyenne arithmtique
1
,
2
=
=1
Proprits :
1)
=1
) = 0
2) Thorme de Koenig:
=1
) =
=1
) +
2
3) B =
=1
) = 0
2) Thorme de Koenig:
=1
) =
=1
) +
2
3) B =
=1
4) Si:
+ Alors:
=
+
5) Soit une sous population de taille
1
, et de moyenne
1
, et une autre sous
population de taille
2
, et de moyenne
2
, alors:
=
1
1
+
2
1
+
2
6) Gnralisation:
=
=1
=1
- Observation groupes:
=
=1
=1
=
=1
=1
: centre de classe =
1
+
2
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.2 - Moyenne gomtrique
Gnralisation:
=
1
+
= .
1
=
1
:
=
1
. (1 +)
=
1
. (1 +)
1
=
2
. (1 + )
=
1
. 1 + =
2
. (1 +) =
1
. (1 + )
1
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.2 - Moyenne gomtrique
Application:
Vous avez investi en bourse le Mercredi : 05/02/14 un montant de 1000 dh.
Le jeudi : 06/02/14 a connu une croissance de 1 %.
Le vendredi : 07/02/14 a connu une baisse de 1 %.
Pouvez-vous retirer votre argent le vendredi?
Ch. 01: Statistique un seul caractre
=
=1
=
1
. 1 +
1
=
2
. 1 +
2
. 1 +
1
=
1
2
3
4
=
0
.
=1
1 +
1 + (1 +
=
0
. (1 + )
1 + =
=1
1 +
1
2
3
90
1
V2 90
3
=
1
=
=1
=1
/:
Ch. 01: Statistique un seul caractre
Caractristiques de tendance centrale de position ou de location
CHERIF Walid - Statistique
3. La moyenne:
3.4 - Moyenne quadratique
Application: Donnez le ct moyen des carrs
=
=1
Gnralisation:
(
=
=1
=
=1
Soit :
Ch. 01: Statistique un seul caractre
Notons
=
1
+
2
2
- =
1
.
2
- =
2
1
1
+
1
2
- =
1
+
2
2
Ch. 01: Statistique un seul caractre
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
1. Dispersion:
Htrognit
1
,
2
: caractre quantitatif
:
Exemple: N=3
1
,
2
,
3
12
=
2
1
13
=
3
1
23
=
3
2
=
12
+
13
+
23
3
=
(
2
1
) + (
3
1
) +(
3
2
)
3
=
2(
3
1
)
3
=
2(
)
3
=
2
3
:
Ch. 01: Statistique un seul caractre
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
1. Fractiles:
Htrognit
1
,
2
: caractre quantitatif
:
3
fractile
25 %
50 %
75 %
Ch. 01: Statistique un seul caractre
Fractile dordre 50 % = Mdiane
Caractristiques de dispersion et de forme
CHERIF Walid - Statistique
1. Fractiles:
Ch. 01: Statistique un seul caractre
Exemple :
10 %
25 %
30 %
] 10 %
]
] 20 %
]
(10 %)
(90 %)
(1) ()
1
,
2
: caractre quantitatif
=
1
=1
Ch. 01: Statistique un seul caractre
=
1
=1
1
,
2
: caractre quantitatif
=
1
=1
)
Ch. 01: Statistique un seul caractre
= V(X): Variance de X
- Dmontrez la proprit.
- Dmontrez que:
Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
1. Mdiale: la distribution de 250 employs selon leur salaire
Salaire
(en 1000 dh)
Centres de classes
Effectifs
cumuls
croissants
[8 - 8,4[ 8,2 10 82 82
[8,4 - 8,8[ 8,6 30 258 340
[8,8 - 9,0[ 8,9 60 534 874
[9,0 - 9,2[ 9,1 72 655,2 1 529,2
[9,2 - 9,6[ 9,4 40 376 1 905,2
[9,6 - 10,2[ 9,9 24 237,6 2 142,8
[10,2 - 10,9[ 10,55 14 147,7 2 290,5
Total 250 2 290,5
On appelle mdiale le salaire Ml correspondant la moiti de la masse des salaires
distribus
/2 = 1145,25
- Pour moins de 9000 dh, la somme des salaires est : 874 000 dh
- Pour moins de 9200 F CFA, la somme des salaires est : 1 529 200 dh
Comme pour la mdiane, on dduit le salaire mdial: 9083 dh
La mdiane partage la masse des effectifs en deux fractions de mme poids.
La mdiale partage la masse des
+1
.
+1
+1
):
=
2
=1
=1
+1
Complment
CHERIF Walid - Statistique
Mdiale et indice de Gini
Ch. 01: Statistique un seul caractre
2. Indice de GINI :
Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
1. Frquences:
=
=
=1
Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
2. Mode, mdiane et mdiale:
- Mdiane: Valeur du caractre qui spare la population en 2 parties:
50% se situent au-dessous et 50% se situent au dessus.
- Mode: Valeur du caractre pour laquelle les frquences relatives
sont les plus leves.
- Mdiale: Valeur du caractre qui spare lensemble des valeurs observes
en 2 parties: 50% se situent au-dessous et 50% au dessus.
Rsum
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
3. Moyennes :
Moyenne Formule Utilisation Exemple
=
=1
=1
Observations dpendantes
Variation en (1+
)
- Taux bancaires
- Bourse
- Gomtrie
=1
Ecriture en
1
=
=1
Ecriture en
=
1
=1
=
1
=1
=
1
=1
Fin du chapitre 1
CHERIF Walid - Statistique
Ch. 01: Statistique un seul caractre
Ch. 02: Statistique deux caractres
CHERIF Walid - Statistique
Comparaison
Dfinition
Une srie statistique deux caractres est une srie dont les valeurs
et
les valeurs
80 90 93 75 86 97 124 88 90 75
Taille
1,82 1,88 1,97 1,65 1,92 1,99 2,01 1,88 1,93 1,75
Donner le nuage de points associ cette srie statistique
1,6
1,65
1,7
1,75
1,8
1,85
1,9
1,95
2
2,05
2,1
70 90 110
Ch. 02: Statistique deux caractres
CHERIF Walid - Statistique
Exemple 2 : La moyenne des tudiants suivant le nombre dheures de
prparation des examens
Nombre dheures
2 10 30 15 13 28 22
Moyenne
6 14 15 16 10 18 14
Donner le nuage de points associ cette srie statistique
0
2
4
6
8
10
12
14
16
18
20
0 10 20 30 40
Ch. 02: Statistique 2 variables :
Exemple 3 :
La part consacre au logement dans le budget dun foyer ( en 1000 dh).
CHERIF Walid - Statistique
Revenu
=0
=
1
=0
)
donnes par le modle.
La fonction f doit donc minimiser lexpression:
=1
f(
))
CHERIF Walid - Statistique
Interprtation graphique:
Cela revient minimiser la somme des carrs
des distances verticales entre la courbe et
les points du nuage :
(
1
1
) + (
2
2
) + + (
)
Ch. 02: Statistique 2 variables :
2.2 - Ajustement par la mthode des moindres carrs
CHERIF Walid - Statistique
Remarque :
1. Pour une valeur
0
donne du caractre , la fonction f permet de prvoir le rsultat
correspondant de la variable .
On supposera que
0
f(
0
).
2. Si
0
appartient est compris entre
1
et
:
on parle dinterpolation.
3. Si
0
est en dehors de lintervalle
dobservation du caractre x:
on parle dextrapolation
Ch. 02: Statistique 2 variables :
2.2 - Ajustement par la mthode des moindres carrs
CHERIF Walid - Statistique
Ajustement affine par la mthode des moindres carrs:
On appelle covariance de et de le nombre :
cov , =
1
=1
)(
)
La variance du caractre est:
V =
1
=1
Elle est utilise pour le calcul de lcart type :
() = ()
V = cov ,
Ch. 02: Statistique 2 variables :
Thorme :
CHERIF Walid - Statistique
Lors dun ajustement affine par la mthode des moindres carrs:
La droite (D) servant lajustement de en :
- a comme coefficient directeur:
=
(, )
()
- passe par le point moyen du nuage: G( , ).
1. Ces deux donnes permettent de dterminer une quation de cette droite.
2. Cette droite est appele droite de rgression de y en x.
Ch. 02: Statistique 2 variables :
Exemple :
On prend lexemple des parts du logement, mais en remplaant la
variable par = 1978 (prendre le rang des annes)
CHERIF Walid - Statistique
Anne 1978 1984 1992 1994 2000 2004 2009
Rang des annes
0 6 14 16 22 26 31
Part en %
La liste 2 (
2
) contient les
La liste 3 (
3
) contient
, cest--dire :
3
=
1
16,42
La liste 4 (
4
) contient (
), cest--dire :
4
=
3
.
La liste 5 (
5
) contient
, cest--dire:
5
=
2
3, 81
La liste 6 (
6
) contient (
) (
), cest--dire
6
=
3
5
On a alors:
=
(, )
()
(, )=
(
6
)
7
()=
(
4
)
7
La droite de rgression: =
(,)
()
+ b. Elle passe par G (on obtient b).
Ch. 02: Statistique 2 variables :
Droite d'ajustement affine : Mthode de Mayer
CHERIF Walid - Statistique
Dans le cas d'un nuage de points de forme allonge, et afin de faciliter l'tude de la
srie, il est possible de remplacer ce nuage par une droite appele droite d'ajustement
affine.
Pour tracer cette droite, on utilise la mthode de Mayer.
Exemple :
Le tableau suivant donne le chiffre d'affaire ralis au cours des 6 derniers mois par un
site de vente en fonction du nombre de commandes reues:
Nombre de
commandes
250 000 320 000 335 000 350 000 370 000 400 000
Ch. 02: Statistique 2 variables :
Droite d'ajustement affine : Mthode de Mayer
CHERIF Walid - Statistique
Reprsentation du nuage de points :
200000
250000
300000
350000
400000
450000
5000 7000 9000 11000 13000
Ch. 02: Statistique 2 variables :
Droite d'ajustement affine : Mthode de Mayer
CHERIF Walid - Statistique
Calcul des coordonnes des points moyens
1
et
2
:
On partage le nuage de points en deux groupes de mme importance suivant les valeurs
croissantes de
1
=
6400+8350+9125
3
1
(
1
,
1
)
1
=
250000+320000+335000
3
2
=
9600+10050+12000
3
2
(
2
,
2
)
2
=
350000+370000+400000
3
On trace la droite d'ajustement qui passe par les deux points
1
et
2
Equation de la droite d'ajustement affine :
= + o:
=
2
1
=
1
.
1
=
2
.
2
Ch. 02: Statistique 2 variables :
Exercice 01:
CHERIF Walid - Statistique
Depuis 1900, les chercheurs ont relev des tats de contamination du virus RG2 chez
certaines races doiseaux.
Leur recherche les a men lier la cause du virus au climat des rgions concernes.
Le tableau suivant regroupe le nombre doiseaux atteints par ce virus:
Climat
81 84 89 93 97 99
Nombre d
oiseaux
ou
1
=
2,5 6,3 + 6,25 3,6 + 8,75 2,5 +12 4,4 + 16 0,4 +21 0,6 +27 1,3
6,3 +3,6 + 2,5 +4,4 + 0,4 +0,6 +1,3
X \ Y 0-3
0-5 6,3
5-7,5 3,6
7,5-10 2,5
10-14 4,4
14-18 0,4
18-24 0,6
24-30 1,3
Total 19,1
Ch. 02: Statistique 2 variables :
Apprciation graphique de la corrlation
Les courbes de rgression
CHERIF Walid - Statistique
Dans le tableau de calcul: on a remplac chaque classe par son centre et
on a calcul les moyennes conditionnelles :
et
.
(
=1
=1
= )
Tableau statistique dune tude simultane de deux caractres
Modalits du
caractre X
Modalits du caractre Y Distribution
marginale de X
11
1
1
1 .
.
Distribution de Y
. 1
.
.
. .
=
Ch. 02: Statistique 2 variables :
1. Distributions marginales
CHERIF Walid - Statistique
On appelle frquence du couple (ou frquence totale) des modalits
et
la
proportion dindividus qui prsentent simultanment les modalits
et
Distributions marginales :
Les effectifs
.
dfinissent la distribution marginale de X.
La frquence marginale de la modalit
est :
.
=
.
sachant
(ou lie
) est:
.
( f i sachant j)
De mme, la distribution conditionnelle sachant
est :
.
Remarque:
=
.
.
=
.
.
ne dpend pas de et
sont alors identiques la distribution de X.
Les colonnes du tableau statistique sont proportionnelles entre elles.
Exemple: - caractres indpendants -
Modalits du
caractre X
Modalits du caractre Y
1
2
3
4
3
3 5 2 4
6 10 4 8
12 20 8 16
Ch. 02: Statistique 2 variables :
3. Indpendance et dpendance
CHERIF Walid - Statistique
Le Chi-deux : - mesure de lintensit de la dpendance entre X et Y -
Le Chi-deux permet de comparer le tableau des effectifs relevs ce
quil aurait du tre si les caractres avaient t indpendants.
=
=1
=1
.
.
.
.
.
.
= N (
=1
=1
.
.
.
1)
Proprits :
- Les caractres X et Y sont indpendants ssi X=0.
- X 0 est dautant plus grand que la liaison entre X et Y est forte.
Ch. 02: Statistique 2 variables :
Application
Indpendance:
CHERIF Walid - Statistique
P1. X et Y sont indpendants si les distributions conditionnelles
selon le caractre Y, pour X fix sont identiques.
X/Y B1 B2 B3 B4 Total
A1 5 15 20 10 50
A2 8 24 32 16 80
A3 7 21 28 14 70
Total 20 60 80 40 200
(n11)
(n21)
(n.1) (n.2)
1. Considrons les individus qui prsentent la modalit B3, parmi ceux qui
prsentent les modalits A1, A2 et A3:
100 x 20/50 = 40% pour A1
100 x 32/80 = 40% pour A2
100 x 28/70 = 40% pour A3
3/1
=
3/2
=
3/3
= 40 %
3/1
3/2