Академический Документы
Профессиональный Документы
Культура Документы
1
Position du problme
Analyser les donnes.
Do proviennent les donnes ? Sont-elles collectes pour une analyse particulire, ou
sagit-il de travailler sur des informations dj disponibles ?
Quelle analyse en faire ? Pour valider des hypothses ? Pour explorer sans
hypothse pralable ?
La dmarche traditionnelle en sciences humaines est gnralement la suivante :
Formulation dune hypothse.
Elaboration dindicateurs quantitatifs (indices synthtiques, statistiques, ) visant
valider ou invalider cette hypothse.
Elaboration dune dmarche pour collecter les donnes.
Synthse et conclusion.
techniques denqute.
La dmarche danalyse est cependant lie larchitecture des systmes
dinformation
Les donnes sont prsentes lintrieur des systmes dinformation sans collecte
spcifique.
Ex : les donnes comptables permettent dobtenir des informations sur la stratgie
commerciale dune entreprise, voire ses procds de production.
Cette profusion de donnes a inspir des mthodes originales, trs loignes de
lenqute utilise en sciences sociales.
Trois sous-systmes
Les organisations sont perues
comme des systmes, en
interaction avec leur
Aide la dcision
environnement (clients,
fournisseurs, tat, concurrents ) Systme de
pilotage
Systme
Environnement dinformation Environnement
Informatique de
gestion
Systme oprant
2
Des modifications profondes du SI
Pour dcider mieux Besoin dintgrer divers
systmes dinformation.
3
Schma dun SI dcisionnel
Fonctions du SI dcisionnel
Alimentation :
Extraction des donnes sources.
Transformation des donnes (mises au format,
calculs).
Stockage
Stocker les donnes pures, agrges,
historises, classes par thmes.
Datawarehouse = entrept de donnes.
Restitution
Tableaux de bord
Analyses
4
Analyses
Statistique :
Analyse de base, ralise sur un tableur ou un outil
plus puissant.
Analyse quantitative des donnes
Algorithmes complexes, possibles uniquement
grce linformatique.
Analyse plus subtile que les statistiques.
Permet de visualiser, de synthtiser de manire
claire et lgante de nombreux facteurs .
Data Mining
Propose des outils supplmentaires (rseaux
neuronaux, pattern recognition )
1.2 La statistique
5
1.2 - Statistique
Statistique , le mot a t invent en
Allemagne au XVIIIme sicle pour dsigner
lensemble des renseignements
principalement quantitatifs devant servir aux
administrations publiques.
Dbut : premiers recensements (Napolon).
Ide de synthse.
Paramtres permettant de dcrire, comparer
des populations.
1.2 statistique
6
1.2.1 statistique descriptive
7
1.2.1 statistique descriptive
ENSEMBLE
Nombreux outils graphiques : courbes,
140
nuages, histogrammes
120
100
80
60
40
Frquence
Sigma = 2,57
20
Moyenne = 10,9
0 N = 700,00
3,0 5,0 7,0 9,0 11,0 13,0 15,0 17,0 19,0
4,0 6,0 8,0 10,0 12,0 14,0 16,0 18,0
ENSEMBLE
8
1.2.2 statistique infrentielle
Deux techniques :
Lestimation. Permet destimer un paramtre
(une moyenne par exemple) sur lensemble
dune population partir de celui mesur sur
un chantillon, dans un certain intervalle de
confiance
Les tests. Permettent de vrifier si une
hypothse faite sur une population est
contredite par ltude dun chantillon pris au
hasard.
Mthodologie fondamentale en
sciences.
Permettent davoir des bases solides
pour vrifier une hypothse, de mettre
en place une dmarche scientifique.
Utilises dans tous les domaines,
mme les plus inattendus.
9
1.2.3 Utilisation des statistiques
1.3 LAQD
10
1.3 AQD
1.3 AQD
11
1.3 AQD
1.3 AQD
12
1 Des donnes lanalyse : quels outils
pour quels types danalyses ?
13
1.4 Le data mining
14
1.4 Le data mining
15
1.4 Le data mining
16
Bibliographie
3 manuels simples :
Les statistiques, une approche nouvelle Sanders-
Allard McGraw Hill
Initiation lanalyse des donnes J. de Lagarde
Dunod
Introduction au Data Mining M. Jambu - Eyrolles
Webographie
http://www.inrialpes.fr/sel/index.html un tutorial interactif sur les
statistiquess fait par lINRIA.
http://trochim.human.cornell.edu/tutorial/TUTORIAL.HTM un site
fait par des tudiants en sciences humaines.
http://www.micheloud.com/FXM/COR/intro.htm un bon cours
danalyse des donnes (franais)
http://cons-dev.univ-lyon1.fr/Enseignement/Stat/St.html tests non
paramtriques (franais)
http://193.48.37.48/~douillet/cours/stats/stats.html un cours de
statistiques (franais)
http://www.lsp.ups-tlse.fr/Besse/enseignement.html de bons
articles en franais sur le data mining (un peu difficile)
http://ocw.mit.edu/index.html site des cours en ligne du MIT
(anglais).
17