Вы находитесь на странице: 1из 59

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Statistique Descriptive
N. Jgou

L2 Gographie

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Statistiques en GEO

L2 :
Statistique descriptive : 6-CM + 12-TD
R - prise en main : 6-CM + 12-TD

M1 : Rgression - Tests - ACP : 6-CM + 18-TD


M2 : Analyse de donnes : 12-TD

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Bibliographie1

Statistique descriptive, cours et exercices corrigs. Hamon, A. &


Jgou, N., PUR, 2008
Statistique gnrale pour utilisateurs. Pags, J. PUR, 2nd ed., 2010
Statistique avec R. Cornillon et al., 3me ed. PUR, 2012

pour la L2

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Descriptive vs Infrence
Infrence : tendre les proprits de lchantillon la population
POPULATION

INFERENCE : probas

ECHANTILLON
Mesures Description

Cadre du cours : description, sur la population ou sur un chantillon

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Plan du cours
I Statistique une variable
1. Vocabulaire
2. Graphes
3. Indicateurs
II Croisement de variables
1. Deux qualitatives
2. Qualitative Quantitative
3. Deux quantitatives

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Population - Variable(s)
Population = Ensemble dindividus
Variable = Alatoire (la mesure varie dun individu lautre)
ENSEMBLE

i
xi : i eme observation de X

Graphes + Resumes

Lien entre X et Y

On note n ralisations de X : {x1 , . . . , xn }.

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Nature dune variable


Variables
Quantitatives

Discrtes

Nombre denfants
Nombre de jours de cong

Continues

Age
Temprature
Poids

Qualitatives

Nominales

Sexe
Etat matrimonial
Couleur des yeux

Ordinales

Mention au bac
Niveau dtudes
Seuil de gravit dune maladie

La nature de X oriente le type de reprsentation


La nature de X et Y oriente ltude du lien : carts
lindpendance, corrlation,...

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Exemple
PAYS
Allemagne
Autriche
Belgique
Danemark
Espagne
Finlande
France
Grce
Irlande
Islande
Italie
Luxembourg
Norvge
Pays-Bas
Portugal
Royaume-Uni
Sude
Suisse

SUPERFICIE
(milliers de km2)

POPULATION
(millions dhab.)

357
83,8
30,5
43,1
505
337
552
132
70,3
103
301
3,0
324
33,9
92,1
244
450
41,3

80
7,6
9,9
5,1
39,2
4,9
56,5
10
3,5
0,3
58
0,4
4,2
14,9
10,6
57
8,5
6,7

APPARTENANCE
LA C.E.E.
O
N
O
O
O
N
O
O
O
N
O
O
N
O
O
O
N
N

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Frquences

La frquence dobservation de xi est le rapport entre le nombre de


fois o xi est observe et le nombre total dobservations :
fi =

ni
n

Ainsi
fi [0, 1]
fi peut sexprimer en pourcentage

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Frquences
Variable qualitative :
Etat
matrimonial
Clibataires
Maris
Veufs
Divorcs

Frquences
fi
0,452
0,469
0,051
0,028

Variable discrte :
Nombre denfants
de 0 16 ans par famille
0
1
2
3
4
5
TOTAL

Nombre de familles
(en milliers)
7130
3201
2498
919
241
130
14119

Frquences
fi
0,505
0,227
0,178
0,065
0,017
0,009
1

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Frquences

Variable continue :
On regroupe les observations dans des intervalles
SUPERFICIE (km2)
[0; 100.000[
[100.000; 200.000[
[200.000; 300.000[
[300.000; 400.000[
[400.000; 500.000[
Plus de 500.000
TOTAL

Effectif
8
2
1
4
1
2

Frquence fi
0,44
0,11
0,06
0,22
0,06
0,11

18

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Reprsentations de la distribution dune variable

Reprsentations qui diffrent selon la nature de la variable


qualitative : diagramme en barres
quantitative discrte : diagramme en btons
quantitative continue : histogramme

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Variable qualitative : diagramme en barres


Etat
matrimonial
Clibataires
Maris
Veufs
Divorcs

Frquences
fi
0,452
0,469
0,051
0,028

Frequence

0.5
0.4
0.3
0.2
0.1
Maries

Celibataires

Veufs

Divorces

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Variable discrte : diagramme en btons


Nombre denfants
de 0 16 ans par famille
0
1
2
3
4
5
TOTAL

Nombre de familles
(en milliers)
7130
3201
2498
919
241
130
14119

Frquences
fi
0,505
0,227
0,178
0,065
0,017
0,009
1

Frequences

0.5
0.4
0.3
0.2
0.1

Nombre denfants par famille

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Variable continue : histogramme


Exemple introductif :
Classe
dge
[25, 30[
[30, 55[
Total

Effectifs
ni
25
25
50

Frquences
fi
0,5
0,5
1

Figure en trompe lil :


Frequences

0,50

0,00
25

30

55

Age

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Variable continue : histogramme


Exemple introductif :
Classe
dge
[25, 30[
[30, 55[
Total

Effectifs
ni
25
25
50

Frquences
fi
0,5
0,5
1

Densits
ni /(ei +1 ei )
5
1

Histogramme : effectifs aires

Densite

25

30

55

Age

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Tendance centrale - Dispersion

Evident : rserv aux variables quantitatives


Tendance centrale :

moyenne, mdiane (quartiles), mode


Dispersion :

variance, cart-type, carts inter-quartiles

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Tendance centrale

Comment dfinir le centre ?


Milieu (moiti avant, moiti aprs) : Mdiane
Centre de gravit : Moyenne
Observation la plus frquente : Mode

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

La mdiane

Dfinition : La mdiane est une valeur possible de la variable telle


quau moins la moiti des observations lui sont suprieures ou gales
et au moins la moiti des observations lui sont infrieures ou gales

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Exemple
Pays
Luxembourg
Belgique
Pays-Bas
Suisse
Danemark
Irlande
Autriche
Portugal
Islande
Grce
Royaume-Uni
Italie
Norvge
Finlande
Allemagne
Sude
Espagne
France

Superficie
(milliers de km2 )
3,00
30,5
33,9
41,3
43,1
70,3
83,8
92,1
103
132
244
301
324
337
357
450
505
552

Mdiane =

103 + 132
= 117.5
2

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Variable discrte

Nombre denfants
de 0 16 ans par famille
0
1
2
3
4
5

Frquences
0,505
0,227
0,178
0,065
0,017
0,009

M=0

Frq. cumules
0,505
0,732
0,91
0,975
0,992
1

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Variable continue agrge


Lorsque lon ne dispose que dintervalles qui contiennent les valeurs
on utilise la dfinition suivante :
Soit la fonction cumulative

[0, 1]
x 7 F (x) = proportion dobservations x

La mdiane M est la solution de


F (M) = 0.5

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Rpartition de lge des hommes


De
De
De
De
De
De
De

15
20
30
40
50
60
70

Age
moins
moins
moins
moins
moins
moins
moins

de
de
de
de
de
de
de

20
30
40
50
60
70
95

ans
ans
ans
ans
ans
ans
ans

Frquences (%)
5,8
24,8
20,5
14,8
14,2
10,7
9,2

Frq. cumules (%)


5,8
30,6
51,1
65,9
80,1
90,8
100

F (x) = 0.5 pour x [39, 40[


Plus prcisment F (x) = 0.5 pour
x = 30 +
donc M = 39.5

50 30.6
(40 30) 39.5
51.1 30.6

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

La moyenne
Soit x1 , . . . , xn les observations de X . La moyenne est
n

x =

1X
xi
n
i=1

Exemple : x1 = 0, x2 = x3 = x4 = 4

G
A

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

La moyenne
Nombre denfants par famille :
Nombre denfants
de 0 16 ans par famille
0
1
2
3
4
5
TOTAL

x =

Nombre de familles
(en milliers)
7130
3201
2498
919
241
130
14119

Frquences
fi
0,505
0,227
0,178
0,065
0,017
0,009
1

7130 0 + . . . + 130 5
0.9
14119

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Age des hommes :


De
De
De
De
De
De
De

x =

15
20
30
40
50
60
70

Age
moins
moins
moins
moins
moins
moins
moins

de
de
de
de
de
de
de

20
30
40
50
60
70
95

ans
ans
ans
ans
ans
ans
ans

Frquences (%)
5,8
24,8
20,5
14,8
14,2
10,7
9,2

17.5 5.8 + . . . + 82.5 9.2


43.4
100

Est-ce raisonnable ?

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Le Mode

Dfinition Le mode est la valeur la plus souvent observe


Unicit ?
Variable continue : intervalle modal = intervalle de plus forte

densit

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Mesures de dispersion

Dfinitions
Etendue

cart entre les observations extrmes

Variance

=
=

dispersion autour de la moyenne


Moyenne de carrs des carts la moyenne

Quartiles

Dcoupage en 4 de la srie comme pour la mdiane

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Variance, cart-type
Variance = Moyenne des carrs des carts la moyenne
n

V =

1X
(xi x)2
n
i=1

ou
Variance = Moyenne de carrs - carr de la moyenne
n

V =

1X 2
xi (
x )2
n
i=1

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Variance, cart-type

Lcart-type (penser cart-typique la moyenne) est la racine


carre de la variance :

= V
Lcart-type a la mme unit que la variable

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Variance - Exemples
Pays
Luxembourg
Belgique
Pays-Bas
Suisse
Danemark
Irlande
Autriche
Portugal
Islande

Superficie
(milliers de km2 )
3,00
30,5
33,9
41,3
43,1
70,3
83,8
92,1
103

Pays
Grce
Royaume-Uni
Italie
Norvge
Finlande
Allemagne
Sude
Espagne
France

Superficie
(milliers de km2 )
132
244
301
324
337
357
450
505
552

La moyenne est x = 205.7 donc


V =

(3 205.7)2 + . . . + (522 205.7)2


30600
18

et

V 175

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Variance - Exemples
Nombre denfants
de 0 16 ans par famille
0
1
2
3
4
5
TOTAL

Nombre de familles
(en milliers)
7130
3201
2498
919
241
130
14119

La moyenne est x = 0.9 donc


V =

(0 0.9)2 7130 + . . . + (5 0.9)2 130


1.2
14119

et
1.1

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Ecart inter-quartiles

Selon le mme principe que lon dfinit la mdiane, on dfinit le 1er


quartile Q1 et le 3me quartile Q3 :
Q1 (resp. Q3 ) : valeur possible de la variable telle que au

moins 25% (resp. 75%) des observations lui sont infrieures ou


gales et au moins 75% (resp. 25%) lui sont suprieures ou
gales
Q2 = M
Lcart inter-quartiles est Q3 Q1

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Quartiles - Exemples
Pays
Luxembourg
Belgique
Pays-Bas
Suisse
Danemark
Irlande
Autriche
Portugal
Islande
Grce
Royaume-Uni
Italie
Norvge
Finlande
Allemagne
Sude
Espagne
France

Superficie
(milliers de km2 )
3,00
30,5
33,9
41,3
43,1
70,3
83,8
92,1
103
132
244
301
324
337
357
450
505
552

Q1 = 43, 1

Q3 = 337

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Quartiles - Variable discrte

Nombre denfants
de 0 16 ans par famille
0
1
2
3
4
5

Q1 = 0

Frquences
0,505
0,227
0,178
0,065
0,017
0,009

M=0

Frq. cumules
0,505
0,732
0,91
0,975
0,992
1

Q3 = 2

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Variable continue agrge


Comme pour la mdiane, on revient la fonction cumulative :

[0, 1]
x 7 F (x) = proportion dobservations x

Q1 tel que F (Q1 ) = 0.25


M = Q2 tel que F (M) = 0.5
Q3 tel que F (Q3 ) = 0.75

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Rpartition de lge des hommes


De
De
De
De
De
De
De

15
20
30
40
50
60
70

Age
moins
moins
moins
moins
moins
moins
moins

de
de
de
de
de
de
de

20
30
40
50
60
70
95

ans
ans
ans
ans
ans
ans
ans

Frquences (%)
5,8
24,8
20,5
14,8
14,2
10,7
9,2

Frq. cumules (%)


5,8
30,6
51,1
65,9
80,1
90,8
100

F (x) = 0.25 pour


x = 20 +

25 5.8
(30 20) 27.7
30.6 5.8

donc
Q1 = 27.7
F (x) = 0.75 pour
x = 50 +

75 65.9
(60 50) 27.7
80.1 65.9

donc
Q1 = 56.4

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

A partir de la courbe des frquences cumules


La courbe des frquences cumules est la courbe de la fonction
cumulative F
Exemple : rpartition de lge des hommes

FREQUENCE

100%

50%

10%
Q1

15

20

30

Q3

Q2

40

50

60

AGE

70

80

90

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Exemple
On interroge n = 10 personnes
X : sexe
Y : frquence de lecture dun quotidien ( trois modalits : 0

pour ne lit jamais le journal ; 1 pour de temps en temps ; 2


pour tous les jours)
Individu
1
2
3
4
5
6
7
8
9
10

Variable 1
X
H
H
F
H
F
F
F
H
F
F

Variable 2
Y
1
1
0
2
0
1
0
0
2
1

Question :
Indpendance des
variables ?

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Tableau de contingence

On regroupe les observations par croisements de modalits :

X
Total

F
H

0
3
1
4

Y
1
2
2
4

Total
2
1
1
2

6
4
10

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Tableau de contingence : notations


y1

y2

y3

ys

Total

x1
x2
x3

xr

n11
n21
n31

nr 1

n12
n22
n32

nr 2

n13
n23
n33

nr 3

n1s
n2s
n3s

nrs

n1
n2
n3

nr

Total

n1

n2

n3

ns

i : indice de ligne ; j : indice de colonne


nij : nombre dindividus dans la ime modalit de X et la jme modalit de Y
(effectif conjoint)

ni : nombre dindividus dans la ime modalit de X (effectif marginal de la


ime modalit de X )
ni =

s
X

nij

j=1

nj est le nombre dindividus dans la jme modalit de Y (effectif marginal de


la jme modalit de Y )
nj =

r
X
i =1

nij

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Distributions conditionnelles
Conditionnement par les modalits de Y : distributions
conditionnelles de X

X
Total

F
H

Y
0
= 3/4 = 0, 75
= 1/4 = 0, 25
1

Total
1
0,5
0,5
1

fi|j = fX =i|Y =j =

nij
nj

2
0,5
0,5
1

0,6
0,4
1

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Distributions conditionnelles
Conditionnement par les modalits de X : distributions
conditionnelles de Y

X
Total

F
H

0
0,50
0,25
0,4

Y
1
0,33
0,5
0,4

fj|i = fY =j|X =i =

Total
2
0,17
0,25
0,2
nij
ni

1
1
1

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Qualitative Quantitative

Deux qualitatives

Deux quantitatives

Distributions attendues sous lindpendance


Indpendance : les distributions conditionnelles correspondent aux
distributions marginales cest--dire
fi|j = fi soit

nij
nj

ni
n

fj/i = fj soit

nij
ni

nj
n

ou

Ainsi lindpendance quivaut


nij? =

ni nj
n

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Tableau thorique sous lindpendance

En utilisant nij? =

ni nj
,
n

X
Total

F
H

il vient

0
2,4
1,6
4

Y
1
2,4
1,6
4

Total
2
1,2
0,8
2

6
4
10

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Ecart lindpendance : 2
Tableau thorique : nij?

Tableau rel : nij

X
Total

F
H

0
3
1

Y
1
2
2

2
1
1

Total
6
4

10

F
H

X
Total

Ecart entre les tableaux :


2

r X
s
X
(nij nij? )2
i=1 j=1

nij?

0
2,4
1,6

Y
1
2,4
1,6

2
1,2
0,8

Total
6
4

10

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Contributions au 2
Brutes :

F
H

Total

0
0,15
0,225

Y
1
0,07
0,1

2
0,03
0,05

Total
0,25
0,375

0,375

0,17

0,08

0,625

En pourcentages :

X
Total

F
H

0
0,24
0,36

Y
1
0,112
0,16

2
0,048
0,08

Total
0,4
0,6

0,6

0,272

0,128

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Exemple : les ufs de coucou


Espce 1
19.65
20.05
20.65
20.85
21.65
21.65
21.65
21.85
21.85
21.85
22.05
22.05
22.05
22.05
22.05
22.05
22.05
22.05
22.05
22.05
22.25
22.25

22.25
22.25
22.25
22.25
22.25
22.25
22.45
22.45
22.45
22.65
22.65
22.85
22.85
23.05
23.25
23.25
23.45
23.65
23.85
24.25
24.25

Espce 2
21.05
21.85
22.05
22.45
22.65
23.25
23.25
23.25
23.45
23.45
23.65
23.85
24.05
24.05
24.05

Espce 3
20.85
21.65
22.05
22.85
23.05
23.05
23.05
23.05
23.45
23.85
23.85
23.85
24.05
25.05

Espce 4
21.05
21.85
22.05
22.05
22.05
22.25
22.45
22.45
22.65
23.05
23.05
23.05
23.05
23.05
23.25
23.85

Espce 5
21.05
21.85
21.85
21.85
22.05
22.45
22.65
23.05
23.05
23.25
23.45
24.05
24.05
24.05
24.85

Espce 6
19.85
20.05
20.25
20.85
20.85
20.85
21.05
21.05
21.05
21.25
21.45
22.05
22.05
22.05
22.25

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Questions
La taille des ufs diffre-t-elle selon lespce hte ?
Espce
i

Effectifs
ni

Moyennes
yi

Mdianes
Mi

Ecart-type
i

1
2
3
4
5
6

45
15
14
16
15
15

22,3
23,09
23,12
22,575
22,9
21,13

22,25
23,25
23,05
22,55
23,05
21,05

0,91
0,87
1,03
0,66
1,03
0,72

Total

120

22,46

22,35

1,07

Y : taille des ufs ; X : espce hte


La variabilit de Y est-elle explique par X ?

Deux quantitatives

Vocabulaire

Graphes

Indicateurs

Qualitative Quantitative

Deux qualitatives

20

21

22

23

24

25

Boxplots

TAILLE DES OEUFS

Introduction

ESPECE

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Dcomposition de la variance
La variance totale 2 scrit
r

i=1

i=1

1X
1X
=
ni (
yi y )2 +
ni i2
n
n
2

Vintra = n1

Pr

mesure la variabilit au sein de chaque

Pr

(
yi y )2 est la variabilit explique par X

2
i=1 ni i

groupe
Vinter = n1

i=1 ni

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Rapport de corrlation

Le rapport de corrlation mesure la part de variabilit explique par


la variable qualitative :
1 Pr
yi y )2
Vinter
i=1 ni (
2
n
=
=
2
2
Dans lexemple : Lespce hte explique 31% de la variabilit des
ufs de coucous :
2 = 0.31

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Exemple
identifiant
de la mesure
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

X
Temprature
(Celsius)
13,4
15,0
7,9
13,1
14,1
16,7
26,8
18,4
27,2
20,6
21,0
17,4
26,9
25,5
19,4
20,8
29,5
21,7
19,7
19,0
20,7
18,0
17,4
16,3
13,6
15,8

Y
Teneur en O3
(g/ml)
63,6
89,6
79,0
81,2
88,0
68,4
139,0
78,2
113,8
41,8
65,0
73,0
126,2
127,8
61,6
63,6
134,2
67,2
87,8
96,8
89,6
66,4
60,0
90,8
104,2
70,0

La temprature explique-t-elle la
pollution de lair ?

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

40

60

80

100

120

140

Nuage de points

10

15

20

25

30

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Modle linaire

Modelisation : On cherche f :

R R telle que Y f (X )

Linaire : on suppose lexistence de rels a et b et dune

variable alatoire tels que


Y = aX + b +
Les paramtres a et b du modle sont inconnus : on utilise les

donnes pour les estimer

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Estimateur des moindres carrs


La droite la plus proche des points (au sens de la mesure
quadratique) sobtient en minimisant
S(a, b) =

n
X

(yi axi b)2

i=1

La solution est
a =

cov(X , Y )
X2

ou

b = y ax
n

cov(X , Y ) =

1X
(xi x)(yi y )
n
i=1

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Droite des moindres carrs

100

120

140

Dans lexemple : a = 2.8 et b = 32.8

40

60

80

10

15

20

25

30

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Ajustement

100

120

140

Points ajusts : (xi ; yi = axi + b)

40

60

80

10

15

20

25

30

Deux quantitatives

Introduction

Vocabulaire

Graphes

Indicateurs

Deux qualitatives

Qualitative Quantitative

Deux quantitatives

Mesure de la qualit dajustement : le R 2


Rapport de la variance des valeurs ajustes la variance des
observations de Y :
1 Pn
(
yi y )2
var(Y )
2
n
R =
= 1 Pi=1
n
var(Y )
)2
i=1 (yi y
n
Dans lexemple : le modle explique 31% de la variabilit de Y
R 2 = 0.31