Вы находитесь на странице: 1из 83

STATISTIQUES

DESCRIPTIVES
INTRODUCTION
INTRODUCTION Vocabulaire statistique L oprateur somme

VOCABULAIRE STATISTIQUE

Population statistique :
Une population statistique est l'ensemble sur lequel on effectue des observations.

Individu (ou units statistiques) :


Les individus sont les lments de la population statistique tudie.

Caractre statistique ou variable statistique :


C'est ce qui est observ ou mesur sur les individus d'une population statistique.
INTRODUCTION Vocabulaire statistique L oprateur somme

VARIABLES QUANTITATIVES

Variable quantitative :
Une variable statistique est quantitative si ses valeurs sont des nombres exprimant
une quantit, sur lesquels les oprations arithmtiques (somme, etc...) ont un sens.

Variable quantitative discrte: Variable quantitative continue:


Une variable quantitative est discrte si elle Une variable quantitative est continue si ses
ne peut prendre que des valeurs isoles, valeurs peuvent tre n'importe lesquelles
gnralement entires. d'un intervalle rel.
INTRODUCTION Vocabulaire statistique L oprateur somme

VARIABLES QUALITATIVES

Variable qualitative :
Une variable statistique est qualitative si ses valeurs, ou modalits, s'expriment de
faon littrale ou par un codage sur lequel les oprations arithmtiques telles que
moyenne, somme, ... , n'ont pas de sens.

Variable qualitative nominale : Variable qualitative ordinale :


C'est une variable qualitative dont les C'est une variable qualitative dont les
modalits ne sont pas ordonnes. modalits sont naturellement ordonnes
INTRODUCTION Vocabulaire statistique L oprateur somme

(1) UN OUTIL : L OPERATEUR SOMME S

DEFINITION: q
p et q tant 2 entiers relatifs x
i p
i x p x p 1 ...... xq

q q q

REMARQUE 1: i est une variable muette x x x


i p
i
j p
j
h p
h

REMARQUE 2: n

Quand il ny a pas dambigut sur le domaine x x x


i 1
i
i
i i

de variation de i, celui-ci peut tre omis


INTRODUCTION Vocabulaire statistique L oprateur somme

(2) UN OUTIL : L OPERATEUR SOMME S


PROPRIETE 1: ka
i
i k ai
i
q q

ka i ka p ka p 1 ...... kaq k a p a p 1 ...... aq k ai


i p i p
PROPRIETE 2: ai bi ai bi
i i i
q

a b a
i p
i i p bp a p 1 bp 1 ..... aq bq
PROPRIETE3: k a b k a k b
i i i i
q q
a p a p 1 ..... aq bp bp 1 ..... bq ai bi
i i i

i p i p
n
PROPRIETE 4 : k nk
i 1
n

k k k ..... k nk
i 1 q

k q p 1 k
n
PROPRIETE 5:
i p
TABLEAUX ET
GRAPHIQUES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(1) VARIABLES QUALITATIVES NOMINALES

Noms Couleur des yeux Modalits Effectifs Frquences %


M. Alberro Vert Bleu 60 0,200 20,0
M. Hondarrague Noir Noir 160 0,533 53,3
Mme Claverotte Noir Noisette 40 0,133 13,3
Melle Lopez Noisette Vert 40 0,133 13,3
M. Paulien Bleu Total : 300 1 100
M. Guillou Noir
M. Lahitette Noisette Modalits Effectifs Frquences %
Mme Vigouroux Noir modalit 1 n1 f1= n1/n f1100
Melle Maleig Bleu
M. Duclos Vert modalit i ni fi= ni/n f i 100
M. Carricaburu Bleu
Mme Vidal Noir modalit k nk fk= nk/n f k 100
. . Total : n i = n fi =1 100
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(2) VARIABLES QUALITATIVES NOMINALES


Modalits Effectifs Frquences %
Bleu 60 0.200 20,0
Noir 160 0,533 53,3
Noisette 40 0,133 13,3
Vert 40 0,133 13,3
Total : 300 1 100

Diagramme circulaire ou camembert Diagramme en barres


Vert 180
Bleu 160
13% 160
20%
140
Noisette 120
13%
100

80
60
60
40 40
40
20
Noir
54% 0
Bleu Noir Noisette Vert
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

VARIABLES QUALITATIVES ORDINALES


130 personnes ont t interroges sur leur addiction au chocolat
Modalits Effectifs = Nombre de personnes
Les Pas du tout (A) 10
modalits Un peu (B) 25
sont Beaucoup (C) 40
prsentes Passionnment (D) 32
dans lordre A la folie (E) 23

45
40
40

35 32

30
25
25 23

20

15
10
10

0
A B C D E
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(1) VARIABLES QUANTITATIVES DISCRETES


EFFECTIFS ET FREQUENCES
Clients Nombre de produits Nombre de Nombre de clients
financiers produits financiers
Bredat 2 0 103
Gauguet 3
1 115
Leremboure 0
Coustere 0 2 95
Lalisou 1 3 35
Aussagne 0 4 10
Vittorello 1 5 2
Diaz 0
Etcheverry 2 Valeurs de Effectifs Frquences %
Bernadet 4 la variable
Miramon 1 x1 n1 f1= n1/n f1100
Jaime 3
Dartus 2 xi ni fi= ni/n f i 100
Domege 0
Train 0
Piquemal 1
xk nk fk= nk/n f k 100
Laffargue 2 Total : n i = n fi =1 100
.
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(2) VARIABLES QUANTITATIVES DISCRETES


REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

Nbre de produits financiers Effectif Frquence


xi ni fi
0 103 0,286
1 115 0,319
2 95 0,264
3 35 0,097
4 10 0,028
5 2 0,006

Diagramme en btons
140

120

100

80

60

40

20

0
0 1 2 3 4 5 6
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(3) VARIABLES QUANTITATIVES DISCRETES


EFFECTIFS ET FREQUENCES CUMULES
Nbre Nombre de Effectifs cumuls Effectifs cumuls
produits Clients croissants dcroissants
financiers
0 103 103 360
Effectifs cumuls croissants: 1 115 218 257
Nombre d'individus pour lesquels la 2 95 313 142
variable est infrieure ou gale xi.
3 35 348 47
4 10 358 12
Rsultat de l'addition, de proche en 5 2 360 2
proche, des effectifs d'une distribution Total : 360
observe en commenant par le 1er.

Valeurs de la Effectif Effectifs cumuls Effectifs cumuls


variable croissants dcroissants
Effectifs cumuls dcroissants: xi ni Ni Ni
Nombre d'individus pour lesquels la x1 n1 N1= n1 N1= nk+ .+ n1= n
variable est suprieure ou gale xi. x2 n2 N2= n1+ n2 N2= nk+ .+ n2
Rsultat de l'addition, de proche en x3 n3 N3= n1+ n2+ n3 N3= nk+ .+ n3
proche, des effectifs d'une distribution . .
xk-1 nk-1 Nk-1= n1+ .+ nk-1 Nk-1= nk+ nk-1
observe en commenant par le dernier.
xk nk Nk= n1+ .+ nk= n Nk= nk
Total : n
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(4) VARIABLES QUANTITATIVES DISCRETES


EFFECTIFS ET FREQUENCES CUMULES
Nombre de Nombre de Effectifs Effectifs Frquences Frquences Frquences
produits clients cumuls cumuls cumules cumules
financiers croissants dcroissants croissantes dcroissantes
xi ni Ni Ni fi Fi Fi
0 103 103 360 0,2861 0,2861 1
1 115 218 257 0,3194 0,6055 0,7139
2 95 313 142 0,2639 0,8694 0,3945
3 35 348 47 0,0972 0,9666 0,1306
4 10 358 12 0,0278 0,9944 0,0334
5 2 360 2 0,0056 1 0,0056
Total : 360 1

Il y a 313 clients possdant un nombre de produits financiers infrieur ou gal 2

Il y a 47 clients possdant un nombre de pro. fin. suprieur ou gal 3


La proportion de clients possdant un nombre de pro. fin. infrieur ou gal 4 est de 99,44%

La proportion de clients possdant un nombre de pro. fin. suprieur ou gal 1 est de 71,39%
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(5) VARIABLES QUANTITATIVES DISCRETES


COURBES CUMULATIVES
400
x xi ni Ni N(x) Ni N (x)
360
350

0 300
0 0 103 103 360
103 257 250
1 1 115 218 257
218 142 200
2 2 95 313 142
313 47 150
35 348 47
3 3 348 12 100
10 358 12
4 4 358 2 50
2 360 2 0
5 5 360 0
-2 -1 0 1 2 3 4 5 6

On appelle courbe cumulative croissante le trac de la fonction N (ou F pour les frquences)
qui tout rel x associe N( x ) = nombre d'observations infrieur ou gal x.
On appelle courbe cumulative dcroissante le trac de la fonction N' (ou F pour les frquences)
qui a tout rel x associe N'( x ) = nombre d'observations suprieur strictement x.
Les courbes cumulatives N(x) et N(x) sont symtriques par rapport n/2 : N(x) + N(x) = n
Les courbes cumulatives F(x) et F(x) sont symtriques par rapport 0,5 : F(x) + F(x) = 1
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(1) VARIABLES QUANTITATIVES CONTINUES


Variable observe: augmentation moyenne mensuelle du salaire, en , des employs
dune multinationale au cours de lanne 2005. Augmentation Effectif
18 38 10 35 0 4 ()
4 11 27 2 41 16
2 25 43 22 26 11 0 257
34 34 1 28 5 5 1 318
21 0 2 30 1 8 2 255
9 37 22 39 11 0 3 307
36 16 6 42 42 1
8 33 31 33 4 4 4 308
9 19 15 2 21 0 5 159
12 18 . . . . 6 140
7 84
Remarque1 : la variable augmentation moyenne mensuelle peut
8 72
tre considre comme continue. En arrondissant leuro, on la 9 55
discrtise. 10 22
Une augmentation de 10 est en fait une augmentation comprise 11 13
entre 9,5 et 10,5 . 12 9
13 7
Remarque2 : Une variable continue ne prend pas des valeurs 14 8
isoles, mais des valeurs appartenant des intervalles. C'est 15 21
pourquoi, au lieu de dfinir des effectifs par valeurs, on dfinira des 16 6
17 2
effectifs par intervalles, appels classes. .. .
Total 2125
Remarque3 : Une variable discrte comportant trop de valeurs est
aussi traite comme une variable continue.
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(2) VARIABLES QUANTITATIVES CONTINUES


Augmentation () Effectifs
[0 3[ 830 Classes Effectifs
[3 5[ 615 [e1 e2[ n1
[5 10[ 510 [e2 e3[ n2
. .
[10 20[ 92
[ek ek+1[ nk
[20 30[ 63
[30 50[ 15

Remarque 1: Le choix des classes et arbitraire, mais elles doivent tre contiges
et recouvrir lensemble des valeurs.
Remarque 2: Il est prfrable de prendre des classes damplitudes gales.

Remarque 3: Il ne faut prendre ni trop ni trop peu de classes.

Remarque 4: Le choix et le nombre de classes influent sur les reprsentations


graphiques.
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(3) VARIABLES QUANTITATIVES CONTINUES


REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

900 effectif
Classes Effectifs 800
[0 3[ 830 700
[3 5[ 615 600
[5 10[ 510 500
[10 20 [ 92 400

[20 30[ 63 300

[30 50[ 15 200


100
0

0
3

30

50
350
Effectif rectifi
Classes Effectifs Amplitude Effectifs
300
ni ai rectifis
ni /ai 250
[0 3[ 830 3 276,7 HISTOGRAMME
200
[3 5[ 615 2 307,5
[5 10[ 510 5 102,0 150

[10 20 [ 92 10 9,2 100


[20 30[ 63 10 6,3
50
[30 50[ 15 20 0,75
0
0
3

30

50
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(4) VARIABLES QUANTITATIVES CONTINUES


REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

Classes Effectifs Amplitude Effectifs 350


Effectif rectifi
ni ai rectifis 300
ni /ai
250
[0 3[ 830 3 276,7
[3 5[ 615 2 307,5 200
HISTOGRAMME
[5 10[ 510 5 102,0 150
[10 20[ 92 10 9,2
[20 30[ 63 10 6,3 100

[30 50[ 15 20 0,75 50

0
3

30

50
La surface = ai (ni/ai) est de 830 units

La surface = ai (ni/ai) est de 615 units


Dans un histogramme, ce sont les surfaces des rectangles (ce que lil voit), qui sont
proportionnelles aux effectifs, et non les hauteurs de ces rectangles

Remarque: Le trac de lhistogramme des frquences est identique. Il suffit de porter


en ordonnes la frquence rectifie di = fi/ai, appele densit.
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(5) VARIABLES QUANTITATIVES CONTINUES


EFFECTIFS ET FREQUENCES CUMULES
Classes Effectifs Effectifs Effectifs Frquences Frquences
cumuls cumuls cumules cumules
croissants dcroissants croissantes dcroissantes
[ei ei+1[ ni Ni Ni Fi Fi
Variable observe: [0 3[ 830 830 2125 0,391 1,000
augmentation moyenne [3-5[ 615 1445 1295 0,680 0,609
mensuelle du salaire, en [ 5 - 10 [ 510 1955 680 0,920 0,320
[10 - 20 [ 92 2047 170 0,963 0,080
, des employs dune [20 - 30 [ 63 2110 78 0,993 0,037
multinationale au cours [30 50[ 15 2125 15 1,000 0,007
Total : 2125
de lanne 2005.

Il y a 1445 employs dont laugmentation est strictement infrieure 5


Il y a 170 employs dont laugmentation est suprieure ou gale 10

Combien y-a-t-il demploys dont laugmentation est infrieure 17 ?


TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(6) VARIABLES QUANTITATIVES CONTINUES


COURBES CUMULATIVES
x
[ei ei+1[ Fi F
F(x) Fi F(x)
?
?0i 1 lintrieur
0 A 1
[0-3[ 0,391 1,000
? 1,000 ? 0,9
3 0,391 0,609
de chaque
[3-5[ 0,680 0,609
? 0,609 0,8
Fi
5 0,680 classe, on fait
0,320 0,7
[ 5 - 10 [ 0,920 0,320 0,320
0,920 lhypothse
0,080
0,6 Fi
10 [10 - 20 [ 0,963 0,080 0,080 0,5
que la
20 0,963 0,037 0,4
[20 - 30 [ 0,993 0,037 0,037 rpartition est 0,3
30 0,993 0,007
uniforme
[30 - 50 [ 1,000 0,007 0,007 0,2

50 1 0 0,1

-10
0
0 10 20 30 40 50 60

On appelle courbe cumulative croissante le trac de la fonction F (N pour les effectifs) qui tout rel x
associe F( x ) = nombre d'observations infrieur ou gal x.

On appelle courbe cumulative dcroissante le trac de la fonction F (N pour les effectifs) qui a tout rel
Remarque: Pour une variable continue, il est indiffrent de dire infrieur ou gal ou
x associe F( x ) = nombre d'observations suprieur strictement x.
strictement infrieur . Il en est de mme pour suprieur ou gal ou strictement
suprieur .
Les courbes cumulatives F(x) et F(x) sont symtriques par rapport 0,5 : F(x) + F(x) = 1
Il ny a aucune chance quune observation tombe sur une borne. Cest limprcision de
linstrument de mesure et un mauvais choix des bornes qui pourrait conduire ce rsultat.
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrte Quantitative continue

(7) VARIABLES QUANTITATIVES CONTINUES


COURBES CUMULATIVES
Quelle est la proportion p demploys dont laugmentation est infrieure 17 ?
[ei ei+1[ Fi F(x)
x
0 0
1
[0-3[ 0,391 0,950,9
3 0,391 0,8
[3-5[ 0,680 0,7

5 0,680 0,6
0,5
[ 5 - 10 [ 0,920 0,4
10 0,920 0,3

17 [10 - 20 [ 0,963 p 0,2


0,1
20 0,963 0

[20 - 30 [ 0,993 -10 0 10


17
20 30 40 50 60

30 0,993
[30 - 50 [ 1
50 1
17 10
17 - 10

p - 0,92 D'o p 0,92 0,963 0,920 95%
20 10
20 - 10 0,963-0,920
TABLEAUX ET GRAPHIQUES

RESUME
VARIABLE QUALITATIVE VARIABLE QUANTITATIVE
Nominale Ordinale Discrte Continue

Effectifs ou Frquences Effectifs ou Frquences


Diagramme en barres Diagramme en barres Diagramme en btons Histogramme

Modalits dans
l ordre
Diagramme circulaire Courbes cumulatives des effectifs ou des frquences
PARAMETRES
STATISTIQUES
PARAMETRES STATISTIQUES

Les reprsentations graphiques ont permis une premire synthse visuelle de la


distribution des observations

Un paramtre statistique permet de rsumer par une seule quantit numrique une
information contenue dans une distribution dobservations.

! Les paramtres statistiques ne concernent que les variables quantitatives

Variable Variable Variable


3000 3000 3000

2500 2500 2500

2000 2000 100 % - A % 2000


Dispersion
1500
Tendance centrale 1500 1500
Position
1000 1000
A% 1000

500 500 500

0 0 0
0 N individu 0 N individu 0 N individu
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(1) PARAMETRES DE TENDANCE CENTRALE


LE MODE
Une distribution est unimodale si elle prsente un maximum marqu, et pas d'autres
maxima relatifs.
La lecture seffectue sur le diagramme en btons ou l'histogramme.
100
140 90
80
120
70
100
60
80 50
60 40
30
40
20
20
10
0 0
0 1 2 3 4 5 6
900 1400 1900 2400 2900 3500 ou plus...

Mode Mode Classe modale

Le mode correspond l'abscisse du maximum, c..d. la valeur la plus frquente


PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(2) PARAMETRES DE TENDANCE CENTRALE


LE MODE
Si la distribution prsente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou
plurimodale.
La population est compose de plusieurs sous-populations ayant des caractristiques de
tendance centrale diffrentes.
90

80
140
70
120
60
100
50
80
40
60
30
40 20
20 10

0 0
0 1 2 3 4 5 6 900 1400 1900 2400 2900 3500 4000 4500 ou
plus...

Mode 1 Mode 2 Mode 1 Mode 2


PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(3) PARAMETRES DE TENDANCE CENTRALE


LA MEDIANE

Les valeurs observes doivent tre ranges par ordre croissant.

La mdiane M est la valeur du milieu de la srie dobservations, c..d. telle qu'il y ait
autant d'observations "au-dessous" que "au-dessus".

Nombre impair dobservations Nombre pair dobservations

3 4 4 5 6 8 8 9 10 3 4 4 5 6 8 8 9

4 valeurs 4 valeurs 4 valeurs 4 valeurs


M Intervalle mdian
M = milieu = 5,5
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(4) PARAMETRES DE TENDANCE CENTRALE


LA MEDIANE partir dune distribution discrte
F(x) F(x)
xi ni Fi xi ni Fi
0 103 0,286 0 0
0 103 0,286
1 115 0,606
0,286 0,286
0,5 Intervalle mdian 1 77 0,500
M 0,606 0,500 0,5
2 95 0,869 M = milieu = 1,5 2 95 0,764
3 35 0,967 0,869 0,764
3 35 0,861
0,967 0,861
4 10 0,994 4 10 0,889
0,994 0,889
5 2 1 5 40 1
1 1

1 1

0,5 0,5

0 0
-2 -1 0 1 2 3 4 5 6 -2 -1 0 1 2 3 4 5 6
Intervalle mdian
M M = milieu = 1,5
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(5) PARAMETRES DE TENDANCE CENTRALE


LA MEDIANE partir dune distribution continue
[ei ei+1[ Fi F(x)
x
0 0
1
[0-3[ 0,391
0,9
3 0,391 0,8
M [ 3 - 5 [ 0,680 0,5 0,7

5 0,680 0,6

0,5 0,5
[ 5 - 10 [ 0,920 0,4
10 0,920 0,3
0,2
[10 - 20 [ 0,963
0,1
20 0,963 0

[20 - 30 [ 0,993 -10 0 3,2210 20 30 40 50 60

30 0,993 M
[30 - 50 [ 1
50 1
0,5 0,391
M-3

0,5-0,391
D'o M 3 5 3 3,22
0,680 0,391
5-3 0,680-0,391
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(6) PARAMETRES DE TENDANCE CENTRALE


LA MOYENNE ARITHMETIQUE

La moyenne arithmtique est note x

1 n
Srie brute x1, x2, , xn x = xi
n i=1

Valeurs de Effectifs Frquences 1 k


Srie groupe la variable x = nixi
x1 n1 f1= n1/n n i=1

k
nixi k
xi ni fi= ni/n
= fi x i
i=1 n i=1
xk nk fk= nk/n
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(7) PARAMETRES DE TENDANCE CENTRALE


LA MOYENNE ARITHMETIQUE

Classes Effectifs Frquences Centres de classe


Srie classe [e1 e2[ n1 f1 x1= ( e1 + e2)/2
[e2 e3[ n2 f2 x2= ( e2 + e3)/2
. . . .
[ek ek+1[ nk fk xk= ( ek + ek+1)/2

1 k k
x = n i x i fi x i
n i=1 i=1
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(8) PARAMETRES DE TENDANCE CENTRALE


LA MOYENNE ARITHMETIQUE
Comment faire la moyenne de plusieurs populations ?

Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyenne x 2

Population P = P1 P2
Effectif n = n 1+ n2
Moyenne x?

k
nixi
x= 1 1 2 2
nx +n x
Moyenne globale = moyenne des moyennes
n i=1 n
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(9) PARAMETRES DE TENDANCE CENTRALE


PROPRIETES GENERALES

z=ax+b

y=ax

P (x) = moyenne, mdiane, mode P (y) = a P (x) P (z) = a P (x) + b


PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(10) PARAMETRES DE TENDANCE CENTRALE


MOYENNES GEOMETRIQUE ET HARMONIQUE

Moyenne gomtrique

G = n x1n1 x n2 2 .....x nk k

Utilise dans le cas de phnomnes multiplicatifs (taux de croissance moyen)

Moyenne harmonique

n
H= k n

x
i=1
i

Utilise dans le cas o lon combine 2 variables sous forme de rapport


(pices/heure, km/litre,)
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(1) PARAMETRES DE POSITION


LES FRACTILES OU QUANTILES
On appelle fractiles ou quantiles d'ordre k les (k-1) valeurs qui divisent les observations
en k parties d'effectifs gaux.

1 mdiane M qui divise les observations en 2 parties gales

3 quartiles Q1, Q2, Q3 qui divisent les observations en 4 parties gales

9 dciles D1, D2, , D9 qui divisent les observations en 10 parties gales

99 centiles C1, C2, , C99 qui divisent les observations en 100 parties gales
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(2) PARAMETRES DE POSITION


LES FRACTILES OU QUANTILES
Quartiles, dciles, centiles sobtiennent de la mme faon que la mdiane.

Variable discrte Variable continue

0,9 0,9
1 0,8
0,75 0,7
0,75 0,6
0,5 0,5
0,5 0,4
0,3
0,2
0,2 0,1
0
0
-2 -1 0 1 2 3 4 5 6 -10 0 MQ3D
10 20 30 40 50 60
9
D2 M Q3
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(3) PARAMETRES DE POSITION


PROPRIETES GENERALES
z=ax+b
100 % - A %

y=ax
100 % - A % A%

x
100 % - A %

A%
A%

Q (x) = quantile Q (y) = a Q (x) Q (z) = a Q (x) + b


PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(1) PARAMETRES DE DISPERSION

Etendue : R = xmax - xmin

Intervalle interquartile : IQ = Q3 - Q1

Variance : Srie brute : Srie groupe ou classe :

1 n 1 k k
V = xi - x V = n i x i - x fi x i - x
2 2 2

n i=1 n i=1 i=1

1 k
V = n i x i2 x 2 = Moyenne des carrs - Carr de la moyenne
n i=1

Ecart-type : = V
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(2) PARAMETRES DE DISPERSION


Comment faire la variance de plusieurs populations ?

Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyenne x 2
Variance V1 Variance V2

Population P = P1 P2
Effectif n = n 1+ n2
Moyenne x
Variance V ?

1 k 1 k
V = n i Vi + n i x i -x
2

n i=1 n i=1
Variance globale = Moyenne des variances + Variance des moyennes
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion

(3) PARAMETRES DE DISPERSION


PROPRIETES GENERALES

z=ax+b

y=ax

P (x) = tendue, cart-type, P (y) = a P (x) P (z) = a P (x)


intervalle interquartile
PARAMETRES STATISTIQUES

PROPRIETES IMPORTANTES
DE LA MOYENNE ET DE LA VARIANCE

Comment se comportent la moyenne et la variance


lorsquon fait subir un changement de variable aux observations?

xi y i = a xi + b

y=ax+b V(y) = a 2 V(x) (y) = a (x)

Comment se comportent la moyenne et la variance


de la somme de deux sries dobservations?

xi
z i = xi + y i
yi
z= x+ y V(z) V(x)+ V(y)
ETUDE DE 2
VARIABLES
QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES

(1) MESURE DE LA LIAISON ENTRE 2


VARIABLES QUANTITATIVES

95

90
Poids
Nom Taille xi (cm) Poids yi (kg)
85
Pierre 175 73
80
Arantxa 168 56
.. .. .. 75

Martin 185 87 70

65

60

55
Taille
50
150 160 170 180 190 200

La connaissance de la taille x apporte une certaine information sur le poids y

Il existe une relation de dpendance entre x et y


ETUDE DE 2 VARIABLES QUANTITATIVES

(2) MESURE DE LA LIAISON ENTRE 2


VARIABLES QUANTITATIVES

La connaissance de x napporte La connaissance de x permet de


aucune certaine information sur y connatre exactement la valeur de y

x et y sont indpendantes Il existe une relation fonctionnelle


entre x et y
ETUDE DE 2 VARIABLES QUANTITATIVES

(3) MESURE DE LA LIAISON ENTRE 2


VARIABLES QUANTITATIVES

1 n
Covariance : Cov x,y = x i -x yi -y
n i=1

Proprits :

Cov x,y 0 x et y varient dans le mme sens

Cov x,y 0 x et y varient en sens contraire

Cov x,y Cov y,x

Cov x,x V(x)

Cov a x + b y , z a Cov x,z b Cov y,z


ETUDE DE 2 VARIABLES QUANTITATIVES

(4) MESURE DE LA LIAISON ENTRE 2


VARIABLES QUANTITATIVES

cov(x,y)
Corrlation linaire: =
(x) (y)

Proprits :

1 1
= 1 si a > 0
y=ax+b
= -1 si a < 0
1 Il existe une relation fonctionnelle entre x et y
0 x et y sont indpendantes
0 1 Il existe une dpendance linaire dautant plus forte que |r| est grand

! Ne pas confondre causalit et corrlation


ETUDE DE 2 VARIABLES QUANTITATIVES

(1) AJUSTEMENT LINEAIRE


95

90
y = Poids
85

80

75

70

65

60

55
x = Taille
50
150 160 170 180 190 200

Est-il possible de trouver une fonction numrique f telle que y = f (x) ?

Si une telle fonction existe, on dit que f est un modle du phnomne tudi.

x est la variable explicative.


y est la variable explique.
ETUDE DE 2 VARIABLES QUANTITATIVES

(2) AJUSTEMENT LINEAIRE


95

90
y = Poids
85

80

75

70

65

60

55
x = Taille
50
150 160 170 180 190 200

On dsire trouver la droite qui passe au mieux lintrieur du nuage de points


ETUDE DE 2 VARIABLES QUANTITATIVES

(3) AJUSTEMENT LINEAIRE

au mieux

n n
Minimiser S = e 2
i
Minimiser S' =
i=1
e'i2
i=1

95 95

90
y = Poids 90
y = Poids
85 85

80 80
e'i
75 ei 75

70 70

65 65

60 60

55 55
x = Taille x = Taille
50 50
150 160 170 180 190 200 150 160 170 180 190 200

Droite de rgression de y en x Droite de rgression de x en y


ETUDE DE 2 VARIABLES QUANTITATIVES

(4) AJUSTEMENT LINEAIRE


REGRESSION LINEAIRE DE Y EN X
95

90
y = Poids
85

f(x) = y = ax+b
Droite de rgression y80i
75
linaire de y en x
y = f(x) = ax + b axi+b70 ei = |yi-axi-b|
65

60

55
x = Taille
50
150 160 170 180 190 200
xi
n n

yi -ax i -b
2 2
La droite de rgression linaire de y en x, note Dy/x , minimise S = e =
i
i=1 i=1
n

x -x y -y
i i
Cov x,y
a= i=1
= b = y - ax
n

x i -x
2 V(x)
i=1
Dy/x passe par le point moyen x , y
ETUDE DE 2 VARIABLES QUANTITATIVES

(5) AJUSTEMENT LINEAIRE


REGRESSION LINEAIRE DE Y EN X
95

90
y = Poids
85

f(x) = y = ax+b
Droite de rgression y80i
75
linaire de y en x
y = f(x) = ax + b axi+b70 ei = |yi-axi-b|
65

60

55
x = Taille
50
150 160 170 180 190 200
xi
y = a x + b dfinit un modle affine

yi = a xi + b = valeur de yi prvue par le modle

ri = yi - y i = rsidu de la ime observation

ei = ri = yi - a x i - b = erreur due au modle


ETUDE DE 2 VARIABLES QUANTITATIVES

(6) AJUSTEMENT LINEAIRE


REGRESSION LINEAIRE DE X EN Y
95 ei = |xi-ayi-b|
90
y = Poids
85

Droite de rgression f(y) = x = ay+b


y80i
linaire de x en y 75

70
x = f(y) = ay + b 65

60

55
x = Taille
50

xi ayi+b
150 160 170 180 190 200

n n

x i -a'yi -b'
2 2
La droite de rgression linaire de x en y, note Dx/y , minimise S' = e' =
i
i=1 i=1
n

x -x y -y
i i
Cov x,y
a' = i=1
n
= b' = x - a' y
y -y
2 V(y)
i=1
i
Dx/y passe par le point moyen x , y
ETUDE DE 2 VARIABLES QUANTITATIVES

LIENS ENTRE CORRELATION


ET DROITES DE REGRESSION
Cov x,y
Dy/x : y = ax + b a= b = y - ax
(x) (y)
V(x) r = a a =a = a'
(y) (x)
Cov x,y
Dx/y : x = ay + b a' = b' = x - a' y
1 b' V(y)
y= x
a' a'

x, y x, y
x, y

r = a a = 0 0 r = a a < 1 r = a a = 1
Le degr de dpendance linaire
Indpendance linaire se mesure la proximit des Liaison fonctionnelle linaire
droites de rgression
ETUDE DE 2 VARIABLES QUANTITATIVES

(1) AJUSTEMENT A UNE FONCTION EXPONENTIELLE

25,0
xi yi
2,8 0,8 20,0
4,3 1,2 droite de rgression linaire
2,7 1,5 15,0 de y en x
4,2 1,9
4,1 2,3 10,0

. .
4,0 3,1 5,0

0,0
0 10 20 30 40 50 60

2
Analyse des rsidus
1

0
Les rsidus devraient se rpartir
-1
0 10 20 30 40 50 60 au hasard autour de laxe des
-2
abscisses:
-3 le modle affine ne convient pas
ETUDE DE 2 VARIABLES QUANTITATIVES

(2) AJUSTEMENT A UNE FONCTION EXPONENTIELLE


25,0

20,0
Modle exponentiel
y = ex exponentielle de base e
15,0

10,0
y = ax exponentielle de base a

5,0 y = b a x Forme exponentielle gnrale


0,0
0 10 20 30 40 50 60
Changement de variable
ln y = ln b + x ln a

Y=AX + B avec Y = ln y
X=x
A = ln a
Lajustement affine de Y en fonction de X donne A et B, B = ln b
d o a = e A , b = e B , et le modle y = b a x
ETUDE DE 2 VARIABLES QUANTITATIVES

(3) AJUSTEMENT A UNE FONCTION EXPONENTIELLE


25,00

20,00
Srie initiale (xi,yi)
15,00 Srie prvue par le modle x i ,y i
10,00

5,00

0,00
0 10 20 30 40 50 60

1,50

1,00

0,50

Analyse des rsidus 0,00


0 10 20 30 40 50 60

-0,50

-1,00 Le modle exponentiel est mieux


-1,50 adapt que le modle affine
ETUDE DE 2 VARIABLES QUANTITATIVES

(1) AJUSTEMENT A UNE FONCTION PUISSANCE

900
800
700
600
500 Droite de rgression linaire de y en x
400
300
200
100
0
0 20 40 60

150

100

50

0
0 10 20 30 40 50 60
Analyse des rsidus
-50
Le modle affine ne
-100
convient pas
-150
ETUDE DE 2 VARIABLES QUANTITATIVES

(2) AJUSTEMENT A UNE FONCTION PUISSANCE


900
800
Modle puissance y = b xa
700
600
500 Changement de variable
400
300 ln y = ln b + a ln x
200
100 Y=AX + B
0
avec Y = ln y
0 20 40 60 X = ln x
A=a
B = ln b

Lajustement affine de Y en fonction de X donne A et B,


d o a = A , b = e B , et le modle y = b x a
ETUDE DE 2 VARIABLES QUANTITATIVES

(3) AJUSTEMENT A UNE FONCTION PUISSANCE


900
800
700 Srie initiale (xi,yi)
600
500 Srie prvue par le modle x i ,y i
400
300
200
100
0
0 20 40 60

80

60

40

20

Analyse des rsidus 0


0 10 20 30 40 50 60
-20

-40
Le modle puissance est mieux
-60
adapt que le modle affine
-80
ETUDE DE 2 VARIABLES QUANTITATIVES

QUALITE DUN AJUSTEMENT

y -y y -y y -y
2 2 2
On montre que i i i i

SCM SCR
SCT = SCM + SCR 1
SCT SCT
Somme des carrs des Somme des carrs des Somme des
= +
carts la moyenne carts du modle carrs des rsidus

Lajustement est dautant meilleur que SCR est proche de 0, c..d. que SCR/SCT est
proche de 0 ou SCM/SCT est proche de 1.

SCM
R = Coefficient de dtermination = r = (coef. de corrlation)
SCT

= proportion de la variation totale due l'ajustement

0 R 1
LES INDICES
LES INDICES

INDICES ELEMENTAIRES
Un indice est le rapport dune variable mesure deux instants diffrents.
Un indice est reprsentatif dune volution

y1 = valeur de la variable y la date t1


y0 = valeur de la variable y la date t0

y1 Indice lmentaire de la variable y la date t1 par rapport


i1 0 =
y0 la date de rfrence t0

Indice lmentaire de la variable y la date t1 par rapport


I1 0 = i1 0 100
la date de rfrence t0, base 100.

Proprits in/n = 1 Identit


i 2/1 i1/2 = 1 Rversibilit
i3/1 i3/2 i 2/1 Circularit
LES INDICES

INDICES ET TAUX DE VARIATION


y1 y 0 Taux de variation ou taux de croissance de la variable y
r1 0 =
y0 entre la date t0 et la date t1

y1
r1 0 = 1 i1 0 1 r=i-1 i=1+r
y0

y1 = (1+ r1 0 )y0 y1 = i1 0 y0 i = 1 + r = coefficient multiplicateur

r=0 i=1 Pas dvolution

r>0 i>1 Croissance

-100% = -1 < r < 0 0i < 1 Dcroissance


LES INDICES

INDICES ET TAUX DE VARIATION MOYENS

y0, y1, .., yn les valeurs prises par une variable aux dates t0, t1, .., tn
ir1,, ir2,, .., i les indices lmentaires sur chacune des priodes
1 2 .., rnn les taux de croissance sur chacune des priodes
yn i(1n ) yn-1
yrnn-1 in i(1 ryn )n-2 (1......
n-1 rn-1 )inyn-2.....
(1 i2
rni)1.....
y0 (1 r2 ) (1 r1) y0

lindice
irG le lmentaire
taux de croissanceglobal
entre tentre
0 et tnt0 et tn
yynn i(1
Gy
rG0) y0
ir lindice
le taux de moyen
croissance moyen
yn i(1yr) yi2n-1yn-2
n-1 2...yin-2
(1 r)
n
y...
0 (1 r) y0
n

(1+ rG )=
iG =
(1+ ni n(1
i n r) rni)2.....
..... i1 (1 r2 ) (1 r1 )

ri1 , ir22,, ..,


.., irkk indices
indices lmentaires
lmentaires sur
sur des
des priodes de nn11,, nn22,, ..,
priodes de .., nnkk units
units (jour,
(jour, mois,
mois, anne)
anne)

iG =n i n (1i1nr11
(1+rG )= (1+r) )ni1 2n2 r2)inkn2 k ..... (1 rk ) nk
(1.....
i n i1n1 i n2 2 ..... i nk k
Moyenne gomtrique des indices lmentaires
LES INDICES

INDICES USUELS

P1
Indice lmentaire des prix i P 1 0 =
P0

Q1
Indice lmentaire des quantits i Q 1 0 =
(ou des volumes) Q0

V1 P1Q1
Indice lmentaire de valeur i V 1 0 = i P 1 0 i Q 1 0
(ou de dpense) V0 P0Q0
LES INDICES

INDICES SYNTHETIQUES

Un indice synthtique mesure lvolution simultane de plusieurs produits

Un indice synthtique est une moyenne pondre des indices lmentaires


des diffrents produits

Coefficient de pondration (ou budgtaire) du produit j la date tn

Vj,n Pj,n Q j,n


j,n n
n

V
j=1
j,n P
j=1
j,n Q j,n

Remarque :
j=1
j,n 1
LES INDICES

(1) INDICES SYNTHETIQUES DE LASPEYRES

Indice de Laspeyres des prix

L P 1 0 = Moyenne arithmtique des indices lmentaires des prix, base 100,


pondrs par des coefficients de pondration relatifs la date de rfrence t0

IP
n
L P 1 0 = j,0 j 10
Comment
1 seul indice sur sen
4 doit tre souvenir ?
modifi
j=1 n
n P Q j,10
P
j,1
Q j,0 Dpense de la date courante
j,1 j=1
n
100
P
j=1
n
Dpense de la date de rfrence Q j,0
P
j,0
j,0 Q j,0 j=1
j=1

Dpense de la date courante avec les quantits de rfrence


100
Dpense de la date de rfrence
LES INDICES

(2) INDICES SYNTHETIQUES DE LASPEYRES

Indice de Laspeyres des quantits

L Q 1 0 = Moyenne arithmtique des indices lmentaires des quantits, base 100,


pondrs par des coefficients de pondration relatifs la date de rfrence t0

IQ
n
L Q 1 0 = j,0 j 10
Comment
1 seul indice sur sen
4 doit tre souvenir ?
modifi
j=1 n
n P Q j,1
P
j,10
Q j,1 Dpense de la date courante
j,0 j=1
n
100
P
j=1
n
Dpense de la date de rfrence Q j,0
P
j,0
j,0 Q j,0 j=1
j=1

Dpense de la date courante avec les prix de rfrence


100
Dpense de la date de rfrence
LES INDICES

(1) INDICES SYNTHETIQUES DE PAASCHE

Indice de Paasche des prix

P P 1 0 = Moyenne harmonique des indices lmentaires des prix, base 100,


pondrs par des coefficients de pondration relatifs la date courante t1
1
P P 1 0 = n j,1
I
j=1
Pj
10
Comment
1 seul indice sur sen
4 doit tre souvenir ?
modifi
n
n

Pj,1Q j,1 Dpense de la date courante


P j,1 Q j,1
j=1
j=1
100 n
n

Pj,0Q j,1
Dpense de la date de rfrence
P
j=1
j,0 Q j,01
j=1

Dpense de la date courante


100
Dpense de la date de rfrence avec les quantits courantes
LES INDICES

(2) INDICES SYNTHETIQUES DE PAASCHE

Indice de Paasche des quantits

P Q 1 0 = Moyenne harmonique des indices lmentaires des quantits, base 100,


pondrs par des coefficients de pondration relatifs la date courante t1
1
P Q 1 0 = n j,1
I

Comment
1 seul indice sur sen
4 doit tre souvenir ?
modifi
j=1 Qj
10 n
n P Q j,1
P
j,1
Q j,1 Dpense de la date courante
j,1 j=1
n
100
P 1 Q
j=1
n
Dpense de la date de rfrence
P
j,0 j,0
Q j,0
j,1
j=1
j=1

Dpense de la date courante


100
Dpense de la date de rfrence avec les prix courants
SERIES
CHRONOLOGIQUES
SERIES CHRONOLOGIQUES

LES DONNEES
Date Y
T1 2001 10 Y = prix dun bien en fonction du temps
T2 2001 9
T3 2001 10 2001 2002 2003 2004 2005
er
T4 2001 11 1 trimestre 10 11 11 12 12
T1 2002 11 2e trimestre 9 10 11 11 12
T2 2002 10 3e trimestre 10 11 13 12 15
T3 2002 11 4e trimestre 11 12 13 14 16
T4 2002 12
T1 2003 11
T2 2003 11
17
Y
16
T3 2003 13 15
T4 2003 13 14
13
T1 2004 12 12
T2 2004 11 Y = srie initiale 11
T3 2004 12 10
9
T4 2004 14 8
temps
T1 2005 12 0 5 10 15 20
T2 2005 12
T3 2005 15
T4 2005 16
SERIES CHRONOLOGIQUES

LES COMPOSANTES
17
16
15
14
Y = srie initiale 13
12
11
10
9
8
0 5 10 15 20

Tendance ou Trend Composante Saisonnire Composante Alatoire


T S A
17 1,5
2
16 1,4
15 1,3
14 1,2 1,5
13 1,1
1 1
12
0,9
11 0,8
10 0,7 0,5
9 0,6
8 0,5 0
0 5 10 15 20 0 5 10 15 20 0 5 10 15 20
SERIES CHRONOLOGIQUES

MODELES DE DECOMPOSITION

Modle additif Modle multiplicatif

Y=T+ S +A Y=T. S .A
SERIES CHRONOLOGIQUES

(1) DETERMINATION DE LA TENDANCE


REGRESSION LINEAIRE

Il sagit de faire un lissage du nuage des points par une fonction connue.
Lorsque le nuage est linaire on utilise la droite de rgression de y en fonction du temps

T = tendance

Avantages:
Expression analytique

Inconvnients:
Un nuage ne se prsente pas toujours sous une forme analytique simple
Le calcul de la tendance peut tre affect par des valeurs extrmes ou par
les valeurs de dbut et de fin de srie.
SERIES CHRONOLOGIQUES

(2) DETERMINATION DE LA TENDANCE


MOYENNES MOBILES
t Y t mm(3)
1 y1 -
2 y2 2 (y1+y2+y3)/3
Moyennes mobiles 3 y3 3 (y2+y3+y4)/3
dordre impair 4 y4 Moy.
Mobiles
.. .. dordre
3
n yn -

t Y t mm(2)
1 y1 -
Moyennes mobiles (y1/2+y2+y3/2)/2
2 y2 2
dordre pair. 3 y3 3 (y2/2+y3+y4/2)/2
On utilise une observation 4 y4 Moy.
Mobiles
dordre 2
supplmentaire .. ..
n yn -
SERIES CHRONOLOGIQUES

(3) DETERMINATION DE LA TENDANCE


MOYENNES MOBILES

Choix de lordre des moyennes mobiles : gal au nombre de saisons

Avantages du lissage par moyennes mobiles :

Permet de se faire une ide de la tendance lorsque le nuage ne prsente pas


une tendance algbrique claire
Inconvnients:
La tendance est estime sur une partie de la priode tudie et non sur la totalit

Ne donne pas une expression analytique de la tendance en fonction du temps

Approximation pas trs bonne lorsquil y a de fortes courbures


Sensible aux valeurs extrmes
SERIES CHRONOLOGIQUES

DETERMINATION DES COMPOSANTES


SAISONNIERES
Modle multiplicatif Y = T.S.A Modle additif Y = T+S+A

Rapports Y/T = S.A Diffrences Y-T = S+A

Coefficients saisonniers bruts S'


j

S'j = Moyenne des rapports de la saison j S'j = Moyenne des diffrences de la saison j

Coefficients saisonniers S j

S j = S'j S' S j = S'j - S'

Rque: cette transformation permet de respecter le principe de conservation des aires


S 1 S0
SERIES CHRONOLOGIQUES

DETERMINATION DE LA COMPOSANTE
ALEATOIRE

Modle multiplicatif Y = T.S.A Modle additif Y = T+S+A

Y A=Y-T-S
A=
T.S

La composante alatoire, ou rsidu, permet danalyser la qualit du modle de


dcomposition
SERIES CHRONOLOGIQUES

DESAISONNALISATION

YCVS = srie dsaisonnalise ou Corrige des Variations Saisonnires, exprime


ce quaurait t lvolution du phnomne sans effet saisonnier.

Modle multiplicatif Y = T.S.A Modle additif Y = T+S+A

Y
YCVS = YCVS = Y S
S
SERIES CHRONOLOGIQUES

PREVISION
Lissage obtenu par

- Rgression linaire de Y sur le temps t T = droite de rgression DY/t

- Moyennes mobiles (Moyennes mobiles = T provisoire)


Rgression linaire de YCVS sur le temps t T = droite de rgression DYCVS t

Prvision la date future t, correspondant la saison j:

Modle multiplicatif Y = T.S.A Modle additif Y = T+S+A

Y(t)= T(t) Sj Y(t) = T(t) + Sj