Академический Документы
Профессиональный Документы
Культура Документы
DESCRIPTIVES
INTRODUCTION
INTRODUCTION Vocabulaire statistique L oprateur somme
VOCABULAIRE STATISTIQUE
Population statistique :
Une population statistique est l'ensemble sur lequel on effectue des observations.
VARIABLES QUANTITATIVES
Variable quantitative :
Une variable statistique est quantitative si ses valeurs sont des nombres exprimant
une quantit, sur lesquels les oprations arithmtiques (somme, etc...) ont un sens.
VARIABLES QUALITATIVES
Variable qualitative :
Une variable statistique est qualitative si ses valeurs, ou modalits, s'expriment de
faon littrale ou par un codage sur lequel les oprations arithmtiques telles que
moyenne, somme, ... , n'ont pas de sens.
DEFINITION: q
p et q tant 2 entiers relatifs x
i p
i x p x p 1 ...... xq
q q q
REMARQUE 2: n
a b a
i p
i i p bp a p 1 bp 1 ..... aq bq
PROPRIETE3: k a b k a k b
i i i i
q q
a p a p 1 ..... aq bp bp 1 ..... bq ai bi
i i i
i p i p
n
PROPRIETE 4 : k nk
i 1
n
k k k ..... k nk
i 1 q
k q p 1 k
n
PROPRIETE 5:
i p
TABLEAUX ET
GRAPHIQUES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue
80
60
60
40 40
40
20
Noir
54% 0
Bleu Noir Noisette Vert
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue
45
40
40
35 32
30
25
25 23
20
15
10
10
0
A B C D E
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue
Diagramme en btons
140
120
100
80
60
40
20
0
0 1 2 3 4 5 6
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue
La proportion de clients possdant un nombre de pro. fin. suprieur ou gal 1 est de 71,39%
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue
0 300
0 0 103 103 360
103 257 250
1 1 115 218 257
218 142 200
2 2 95 313 142
313 47 150
35 348 47
3 3 348 12 100
10 358 12
4 4 358 2 50
2 360 2 0
5 5 360 0
-2 -1 0 1 2 3 4 5 6
On appelle courbe cumulative croissante le trac de la fonction N (ou F pour les frquences)
qui tout rel x associe N( x ) = nombre d'observations infrieur ou gal x.
On appelle courbe cumulative dcroissante le trac de la fonction N' (ou F pour les frquences)
qui a tout rel x associe N'( x ) = nombre d'observations suprieur strictement x.
Les courbes cumulatives N(x) et N(x) sont symtriques par rapport n/2 : N(x) + N(x) = n
Les courbes cumulatives F(x) et F(x) sont symtriques par rapport 0,5 : F(x) + F(x) = 1
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue
Remarque 1: Le choix des classes et arbitraire, mais elles doivent tre contiges
et recouvrir lensemble des valeurs.
Remarque 2: Il est prfrable de prendre des classes damplitudes gales.
900 effectif
Classes Effectifs 800
[0 3[ 830 700
[3 5[ 615 600
[5 10[ 510 500
[10 20 [ 92 400
0
3
30
50
350
Effectif rectifi
Classes Effectifs Amplitude Effectifs
300
ni ai rectifis
ni /ai 250
[0 3[ 830 3 276,7 HISTOGRAMME
200
[3 5[ 615 2 307,5
[5 10[ 510 5 102,0 150
30
50
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue
0
3
30
50
La surface = ai (ni/ai) est de 830 units
50 1 0 0,1
-10
0
0 10 20 30 40 50 60
On appelle courbe cumulative croissante le trac de la fonction F (N pour les effectifs) qui tout rel x
associe F( x ) = nombre d'observations infrieur ou gal x.
On appelle courbe cumulative dcroissante le trac de la fonction F (N pour les effectifs) qui a tout rel
Remarque: Pour une variable continue, il est indiffrent de dire infrieur ou gal ou
x associe F( x ) = nombre d'observations suprieur strictement x.
strictement infrieur . Il en est de mme pour suprieur ou gal ou strictement
suprieur .
Les courbes cumulatives F(x) et F(x) sont symtriques par rapport 0,5 : F(x) + F(x) = 1
Il ny a aucune chance quune observation tombe sur une borne. Cest limprcision de
linstrument de mesure et un mauvais choix des bornes qui pourrait conduire ce rsultat.
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue
5 0,680 0,6
0,5
[ 5 - 10 [ 0,920 0,4
10 0,920 0,3
30 0,993
[30 - 50 [ 1
50 1
17 10
17 - 10
p - 0,92 D'o p 0,92 0,963 0,920 95%
20 10
20 - 10 0,963-0,920
TABLEAUX ET GRAPHIQUES
RESUME
VARIABLE QUALITATIVE VARIABLE QUANTITATIVE
Nominale Ordinale Discrte Continue
Modalits dans
l ordre
Diagramme circulaire Courbes cumulatives des effectifs ou des frquences
PARAMETRES
STATISTIQUES
PARAMETRES STATISTIQUES
Un paramtre statistique permet de rsumer par une seule quantit numrique une
information contenue dans une distribution dobservations.
0 0 0
0 N individu 0 N individu 0 N individu
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
80
140
70
120
60
100
50
80
40
60
30
40 20
20 10
0 0
0 1 2 3 4 5 6 900 1400 1900 2400 2900 3500 4000 4500 ou
plus...
La mdiane M est la valeur du milieu de la srie dobservations, c..d. telle qu'il y ait
autant d'observations "au-dessous" que "au-dessus".
3 4 4 5 6 8 8 9 10 3 4 4 5 6 8 8 9
1 1
0,5 0,5
0 0
-2 -1 0 1 2 3 4 5 6 -2 -1 0 1 2 3 4 5 6
Intervalle mdian
M M = milieu = 1,5
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
5 0,680 0,6
0,5 0,5
[ 5 - 10 [ 0,920 0,4
10 0,920 0,3
0,2
[10 - 20 [ 0,963
0,1
20 0,963 0
30 0,993 M
[30 - 50 [ 1
50 1
0,5 0,391
M-3
0,5-0,391
D'o M 3 5 3 3,22
0,680 0,391
5-3 0,680-0,391
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
1 n
Srie brute x1, x2, , xn x = xi
n i=1
1 k k
x = n i x i fi x i
n i=1 i=1
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyenne x 2
Population P = P1 P2
Effectif n = n 1+ n2
Moyenne x?
k
nixi
x= 1 1 2 2
nx +n x
Moyenne globale = moyenne des moyennes
n i=1 n
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
z=ax+b
y=ax
Moyenne gomtrique
G = n x1n1 x n2 2 .....x nk k
Moyenne harmonique
n
H= k n
x
i=1
i
99 centiles C1, C2, , C99 qui divisent les observations en 100 parties gales
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
0,9 0,9
1 0,8
0,75 0,7
0,75 0,6
0,5 0,5
0,5 0,4
0,3
0,2
0,2 0,1
0
0
-2 -1 0 1 2 3 4 5 6 -10 0 MQ3D
10 20 30 40 50 60
9
D2 M Q3
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
y=ax
100 % - A % A%
x
100 % - A %
A%
A%
Intervalle interquartile : IQ = Q3 - Q1
1 n 1 k k
V = xi - x V = n i x i - x fi x i - x
2 2 2
1 k
V = n i x i2 x 2 = Moyenne des carrs - Carr de la moyenne
n i=1
Ecart-type : = V
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyenne x 2
Variance V1 Variance V2
Population P = P1 P2
Effectif n = n 1+ n2
Moyenne x
Variance V ?
1 k 1 k
V = n i Vi + n i x i -x
2
n i=1 n i=1
Variance globale = Moyenne des variances + Variance des moyennes
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion
z=ax+b
y=ax
PROPRIETES IMPORTANTES
DE LA MOYENNE ET DE LA VARIANCE
xi y i = a xi + b
xi
z i = xi + y i
yi
z= x+ y V(z) V(x)+ V(y)
ETUDE DE 2
VARIABLES
QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES
95
90
Poids
Nom Taille xi (cm) Poids yi (kg)
85
Pierre 175 73
80
Arantxa 168 56
.. .. .. 75
Martin 185 87 70
65
60
55
Taille
50
150 160 170 180 190 200
1 n
Covariance : Cov x,y = x i -x yi -y
n i=1
Proprits :
cov(x,y)
Corrlation linaire: =
(x) (y)
Proprits :
1 1
= 1 si a > 0
y=ax+b
= -1 si a < 0
1 Il existe une relation fonctionnelle entre x et y
0 x et y sont indpendantes
0 1 Il existe une dpendance linaire dautant plus forte que |r| est grand
90
y = Poids
85
80
75
70
65
60
55
x = Taille
50
150 160 170 180 190 200
Si une telle fonction existe, on dit que f est un modle du phnomne tudi.
90
y = Poids
85
80
75
70
65
60
55
x = Taille
50
150 160 170 180 190 200
au mieux
n n
Minimiser S = e 2
i
Minimiser S' =
i=1
e'i2
i=1
95 95
90
y = Poids 90
y = Poids
85 85
80 80
e'i
75 ei 75
70 70
65 65
60 60
55 55
x = Taille x = Taille
50 50
150 160 170 180 190 200 150 160 170 180 190 200
90
y = Poids
85
f(x) = y = ax+b
Droite de rgression y80i
75
linaire de y en x
y = f(x) = ax + b axi+b70 ei = |yi-axi-b|
65
60
55
x = Taille
50
150 160 170 180 190 200
xi
n n
yi -ax i -b
2 2
La droite de rgression linaire de y en x, note Dy/x , minimise S = e =
i
i=1 i=1
n
x -x y -y
i i
Cov x,y
a= i=1
= b = y - ax
n
x i -x
2 V(x)
i=1
Dy/x passe par le point moyen x , y
ETUDE DE 2 VARIABLES QUANTITATIVES
90
y = Poids
85
f(x) = y = ax+b
Droite de rgression y80i
75
linaire de y en x
y = f(x) = ax + b axi+b70 ei = |yi-axi-b|
65
60
55
x = Taille
50
150 160 170 180 190 200
xi
y = a x + b dfinit un modle affine
70
x = f(y) = ay + b 65
60
55
x = Taille
50
xi ayi+b
150 160 170 180 190 200
n n
x i -a'yi -b'
2 2
La droite de rgression linaire de x en y, note Dx/y , minimise S' = e' =
i
i=1 i=1
n
x -x y -y
i i
Cov x,y
a' = i=1
n
= b' = x - a' y
y -y
2 V(y)
i=1
i
Dx/y passe par le point moyen x , y
ETUDE DE 2 VARIABLES QUANTITATIVES
x, y x, y
x, y
r = a a = 0 0 r = a a < 1 r = a a = 1
Le degr de dpendance linaire
Indpendance linaire se mesure la proximit des Liaison fonctionnelle linaire
droites de rgression
ETUDE DE 2 VARIABLES QUANTITATIVES
25,0
xi yi
2,8 0,8 20,0
4,3 1,2 droite de rgression linaire
2,7 1,5 15,0 de y en x
4,2 1,9
4,1 2,3 10,0
. .
4,0 3,1 5,0
0,0
0 10 20 30 40 50 60
2
Analyse des rsidus
1
0
Les rsidus devraient se rpartir
-1
0 10 20 30 40 50 60 au hasard autour de laxe des
-2
abscisses:
-3 le modle affine ne convient pas
ETUDE DE 2 VARIABLES QUANTITATIVES
20,0
Modle exponentiel
y = ex exponentielle de base e
15,0
10,0
y = ax exponentielle de base a
Y=AX + B avec Y = ln y
X=x
A = ln a
Lajustement affine de Y en fonction de X donne A et B, B = ln b
d o a = e A , b = e B , et le modle y = b a x
ETUDE DE 2 VARIABLES QUANTITATIVES
20,00
Srie initiale (xi,yi)
15,00 Srie prvue par le modle x i ,y i
10,00
5,00
0,00
0 10 20 30 40 50 60
1,50
1,00
0,50
-0,50
900
800
700
600
500 Droite de rgression linaire de y en x
400
300
200
100
0
0 20 40 60
150
100
50
0
0 10 20 30 40 50 60
Analyse des rsidus
-50
Le modle affine ne
-100
convient pas
-150
ETUDE DE 2 VARIABLES QUANTITATIVES
80
60
40
20
-40
Le modle puissance est mieux
-60
adapt que le modle affine
-80
ETUDE DE 2 VARIABLES QUANTITATIVES
y -y y -y y -y
2 2 2
On montre que i i i i
SCM SCR
SCT = SCM + SCR 1
SCT SCT
Somme des carrs des Somme des carrs des Somme des
= +
carts la moyenne carts du modle carrs des rsidus
Lajustement est dautant meilleur que SCR est proche de 0, c..d. que SCR/SCT est
proche de 0 ou SCM/SCT est proche de 1.
SCM
R = Coefficient de dtermination = r = (coef. de corrlation)
SCT
0 R 1
LES INDICES
LES INDICES
INDICES ELEMENTAIRES
Un indice est le rapport dune variable mesure deux instants diffrents.
Un indice est reprsentatif dune volution
y1
r1 0 = 1 i1 0 1 r=i-1 i=1+r
y0
y0, y1, .., yn les valeurs prises par une variable aux dates t0, t1, .., tn
ir1,, ir2,, .., i les indices lmentaires sur chacune des priodes
1 2 .., rnn les taux de croissance sur chacune des priodes
yn i(1n ) yn-1
yrnn-1 in i(1 ryn )n-2 (1......
n-1 rn-1 )inyn-2.....
(1 i2
rni)1.....
y0 (1 r2 ) (1 r1) y0
lindice
irG le lmentaire
taux de croissanceglobal
entre tentre
0 et tnt0 et tn
yynn i(1
Gy
rG0) y0
ir lindice
le taux de moyen
croissance moyen
yn i(1yr) yi2n-1yn-2
n-1 2...yin-2
(1 r)
n
y...
0 (1 r) y0
n
(1+ rG )=
iG =
(1+ ni n(1
i n r) rni)2.....
..... i1 (1 r2 ) (1 r1 )
iG =n i n (1i1nr11
(1+rG )= (1+r) )ni1 2n2 r2)inkn2 k ..... (1 rk ) nk
(1.....
i n i1n1 i n2 2 ..... i nk k
Moyenne gomtrique des indices lmentaires
LES INDICES
INDICES USUELS
P1
Indice lmentaire des prix i P 1 0 =
P0
Q1
Indice lmentaire des quantits i Q 1 0 =
(ou des volumes) Q0
V1 P1Q1
Indice lmentaire de valeur i V 1 0 = i P 1 0 i Q 1 0
(ou de dpense) V0 P0Q0
LES INDICES
INDICES SYNTHETIQUES
V
j=1
j,n P
j=1
j,n Q j,n
Remarque :
j=1
j,n 1
LES INDICES
IP
n
L P 1 0 = j,0 j 10
Comment
1 seul indice sur sen
4 doit tre souvenir ?
modifi
j=1 n
n P Q j,10
P
j,1
Q j,0 Dpense de la date courante
j,1 j=1
n
100
P
j=1
n
Dpense de la date de rfrence Q j,0
P
j,0
j,0 Q j,0 j=1
j=1
IQ
n
L Q 1 0 = j,0 j 10
Comment
1 seul indice sur sen
4 doit tre souvenir ?
modifi
j=1 n
n P Q j,1
P
j,10
Q j,1 Dpense de la date courante
j,0 j=1
n
100
P
j=1
n
Dpense de la date de rfrence Q j,0
P
j,0
j,0 Q j,0 j=1
j=1
Pj,0Q j,1
Dpense de la date de rfrence
P
j=1
j,0 Q j,01
j=1
LES DONNEES
Date Y
T1 2001 10 Y = prix dun bien en fonction du temps
T2 2001 9
T3 2001 10 2001 2002 2003 2004 2005
er
T4 2001 11 1 trimestre 10 11 11 12 12
T1 2002 11 2e trimestre 9 10 11 11 12
T2 2002 10 3e trimestre 10 11 13 12 15
T3 2002 11 4e trimestre 11 12 13 14 16
T4 2002 12
T1 2003 11
T2 2003 11
17
Y
16
T3 2003 13 15
T4 2003 13 14
13
T1 2004 12 12
T2 2004 11 Y = srie initiale 11
T3 2004 12 10
9
T4 2004 14 8
temps
T1 2005 12 0 5 10 15 20
T2 2005 12
T3 2005 15
T4 2005 16
SERIES CHRONOLOGIQUES
LES COMPOSANTES
17
16
15
14
Y = srie initiale 13
12
11
10
9
8
0 5 10 15 20
MODELES DE DECOMPOSITION
Y=T+ S +A Y=T. S .A
SERIES CHRONOLOGIQUES
Il sagit de faire un lissage du nuage des points par une fonction connue.
Lorsque le nuage est linaire on utilise la droite de rgression de y en fonction du temps
T = tendance
Avantages:
Expression analytique
Inconvnients:
Un nuage ne se prsente pas toujours sous une forme analytique simple
Le calcul de la tendance peut tre affect par des valeurs extrmes ou par
les valeurs de dbut et de fin de srie.
SERIES CHRONOLOGIQUES
t Y t mm(2)
1 y1 -
Moyennes mobiles (y1/2+y2+y3/2)/2
2 y2 2
dordre pair. 3 y3 3 (y2/2+y3+y4/2)/2
On utilise une observation 4 y4 Moy.
Mobiles
dordre 2
supplmentaire .. ..
n yn -
SERIES CHRONOLOGIQUES
S'j = Moyenne des rapports de la saison j S'j = Moyenne des diffrences de la saison j
Coefficients saisonniers S j
DETERMINATION DE LA COMPOSANTE
ALEATOIRE
Y A=Y-T-S
A=
T.S
DESAISONNALISATION
Y
YCVS = YCVS = Y S
S
SERIES CHRONOLOGIQUES
PREVISION
Lissage obtenu par