Вы находитесь на странице: 1из 21

INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

MODULE A2C-1
ACQUISITION DE CONNAISSANCES À PARTIR
DE DONNÉES : MÉTHODES NUMÉRIQUES

I NTRODUCTION AUX STATISTIQUES

N ICOLAS B ONNEL
I NSA de Rennes
nicolas.bonnel@insa-rennes.fr 4 INFO
Année 2006 / 2007

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 1 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Plan

1 Introduction à la statistique

2 Statistique descriptive

3 Méthodes factorielles

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 2 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Statistiques

Ensemble de méthodes permettant d’analyser des ensembles


d’observations (ou de données)

Méthodes relevant des mathématiques


Utilisation intensive de l’outil informatique

« Deux » classes de méthodes en statistique :


1 Statistique descriptive ou exploratoire
2 Statistique inférentielle

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 3 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Statistique exploratoire

Objectifs : présenter, résumer et structurer les données

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 4 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Statistique exploratoire
Tableaux de données

Tableau rectangulaire : individus × variables


lignes (i = 1, . . . , n) : représentent les n individus ou
observations
colonnes (j = 1, . . . , p) : représentent les p variables ou
mesures numériques : variables quantitatives

Tableau rectangulaire : tableau de contingence


ou tableau croisé de 2 variables qualitatives
lignes (i = 1, . . . , n) : représentent les n modalités d’une
variable qualitative
colonnes (j = 1, . . . , p) : représentent les p modalités
d’une variable qualitative

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 5 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Statistique exploratoire

Représentation géométrique d’un tableau X(n, p)

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 6 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Statistique exploratoire

1 Définir une distance entre points d’un même nuage :


distance entre individus, distance entre variables

2 Évaluer les proximités géométriques entre points-lignes et


entre points-colonnes

≡ associations soit entre les individus


statistiques soit entre les variables

→ tableau de distances associé à chaque nuage

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 7 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Statistique exploratoire

Description des tableaux de distance

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 8 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Statistique inférentielle
Statistique exploratoire
→ mise en évidence des propriétés de la population étudiée
→ suggérer des hypothèses

Objectif de la statistique inférentielle


Étendre à la population globale des phénomènes observés
→ valider ou infirmer des hypothèses a priori après une
phase exploratoire
construction d’estimateur, d’intervalle de confiance
test d’hypothèses
modélisation et prévision statistique

⇒ les deux démarches sont complémentaires

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 9 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Plan

1 Introduction à la statistique

2 Statistique descriptive

3 Méthodes factorielles

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 10 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Notations

une variable numérique X

elle est observée sur n individus


→ une série statistique : x1 , x2 , . . . , xn

Résumés numériques
(dans les transparents suivants)

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 11 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Tendance centrale

n
1X
X̄ = xi
n
i=1

X̄ centre de gravité des n points {xi }ni=1 affectés du même


poids n1

n
X
X̄ solution de min (x − xi )2
x
i=1

sensibilité aux valeurs aberrantes

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 12 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Tendance centrale
X
Si xi a un poids pi ≥ 0 (avec pi = 1) alors le centre de gravité G
i
n
X n
X
des {xi }ni=1 , X̄ = pi xi , est solution de min pi (x − xi )2
x
i=1 i=1

Espérance d’une variable aléatoire dans {xi }ni=1


n
X
E[X ] = P{X = xi } xi
i=1
| {z }
pi

Opération de centrage d’une variable

X → X − X̄
{xi }ni=1 → {xi − X̄ }ni=1

détecter les plus grands écarts xi − X̄


≡ les points les plus éloignés de X̄
≡ détecter les individus qui diffèrent le plus du « comportement
moyen » par rapport à X

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 13 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Mesure de dispersion
n
X n
X
2 2
Variance(X ) = S (X ) = min pi (x − xi ) = pi (X̄ − xi )2
x
i=1 i=1

Analogie avec la variance d’une v.a.

σ 2 (X ) = E[(X − E[X ])2 ]


Xn
S2 (X ) = pi (X̄ − xi )2
i=1

Indicateur insensible au changement d’origine

ex : S2 (X ) = S2 (X − X̄ )

q
Écart-type : S(X ) = S2 (X ) (même unité que X )

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 14 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Mesure de liaison entre deux variables

X → série x1 , . . . , xn
Y → série y1 , . . . , yn

Construction du nuage des points {(xi , yi )}ni=1

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 15 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Mesure de liaison entre deux variables


Indicateur de liaison linéaire

coefficient de corrélation linéaire


C(X ,Y ) E[(X −E[X ])(Y −E[Y ])]
Deux v.a. ρ(X , Y ) = σ(X )σ(Y ) = σ(X )σ(Y )
Xn
pi (xi − X̄ )(yi − Ȳ )
i=1
Deux séries statistiques R(X , Y ) = S(X )S(Y )

Propriétés
nombre sans unité
|R(X , Y )| ≤ 1
|R(X , Y )| = 1 ⇔ liaison linéaire exacte ∀i, axi + byi + c = 0
R(X , Y ) = 0 n’implique pas l’indépendance en général

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 16 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Mesure de liaison entre deux variables

R(X , Y ) ≈ 1 : pour beaucoup d’individus i on a,


  
xi − X̄ yi − Ȳ
>> 0
S(X ) S(Y )

pour ces individus on a



soit xi − X̄ >> 0 et yi − Ȳ >> 0

soit xi − X̄ << 0 et yi − Ȳ << 0


soit xi >> X̄ et yi >> Ȳ

soit xi << X̄ et yi << Ȳ

Même tendance dans les valeurs prises par X et Y

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 17 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Mesure de liaison entre deux variables

Même R(X , Y ), X̄ , Ȳ , S2 (X ), S2 (Y )

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 18 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Plan

1 Introduction à la statistique

2 Statistique descriptive

3 Méthodes factorielles

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 19 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Méthodes factorielles

Objectif : fournir des représentations synthétiques d’un grand


ensemble de données
Entrées : nuage de points et distance entre ces points
Sorties : en général, représentations graphiques planes

Méthodes factorielles
Techniques de réduction de l’espace de visualisation à
une représentation plane respectant au mieux les
proximités géométriques

Espaces factoriels
Sous-espaces de dimension 2 (ou 3) qui ajustent au mieux
le nuage N (I) ou le nuage N (J)

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 20 / 21
INTRODUCTION À LA STATISTIQUE STATISTIQUE DESCRIPTIVE MÉTHODES FACTORIELLES

Méthodes factorielles

1 Analyse en Composantes Principales (ACP)


tableau individus × variables
lignes ≡ individus, objets, observations, . . .
colonnes ≡ variables quantitatives i.e. à valeurs
numériques continues
proximité entre individus ≡ similitudes globales des
grandeurs observées sur les individus
proximité entre variables ≡ corrélation

2 Analyse Factorielle des Correspondances (AFC)


tableau ≡ table de contingence
évaluer la liaison globale entre les 2 variables
proximité entre lignes (colonnes) ≡ similitude statistique
des sous-populations présentant ces modalités
Remarque : rôle symétrique lignes / colonnes

N ICOLAS B ONNEL — nicolas.bonnel@insa-rennes.fr M ODULE A2C-1 : I NTRO S TATS — 4 INFO, 2006 / 2007 — 21 / 21

Вам также может понравиться