Академический Документы
Профессиональный Документы
Культура Документы
1- Statistiques descriptives.
Un ensemble d’éléments homogènes auxquels on s’intéresse. Par exemple, les étudiants d’une
classe, les contribuables de longue, les ménages lillois . . .,
Les éléments de la population sont appelés les individus ou unités statistiques.
3- Echantillon
Un individu donné de la population peut être étudié selon certaines propriétés. Ces propriétés
sont appelées caractères ou variables statistiques. Exemple : une étude sur les étudiants de
l'université d’Adrar peut porter sur les différentes variables : leur âge, leur sexe, leur nationalité,
leur moyenne de l'année, etc.
On distingue deux types de variables statistique.
4. a- Une variable qualitative est une variable qui ne prend pas de valeur numérique.
Exemple : sexe, nationalité. Chaque variable qualitative a plusieurs modalités.
Exemple
Pour la variable état matrimonial, les modalités sont célibataire, marié, veuf, divorcé.
On distingue deux types de variables qualitatives : les variables qualitatives ordinales et les
variables qualitatives nominales.
4. a.1- une variable qualitative ordinale, lorsque ses modalités peuvent être classées dans un
certain ordre naturel mais on ne peut pas dire à partir de cet ordre de "combien" (c’est par
exemple le cas de la variable Mention au Bac) ;
1
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
4. a.2- une variable qualitative nominale, lorsque ses modalités ne peuvent être classées de
façon naturelle (c’est par exemple le cas de la variable Couleur des Yeux ou la variable Sexe,
ou la variable état matrimonial).
4. b- Une variable quantitative est une variable qui est de la forme d'une variable numérique.
Exemple : âge, moyenne de l'année.
On distingue 2 types de variables quantitatives : les variables quantitatives discrètes et les
variables quantitatives continues
4. b.1- Une variable quantitative discrète peut prendre des valeurs dénombrables. Exemple :
le nombre d'enfants par ménage, le nombre des pièces de production..
4. b.2- variable quantitative continue peut prendre toutes les valeurs à l'intérieur d'un
intervalle. Exemple : la taille. L’Age, le poids. Les chiffres d’affaires des entreprises
L’amplitude d’une classe (a) est alors la différence entre la borne supérieure et la borne
inférieure de l’intervalle défini :
soit [a; b[ une classe d’une variable quantitative, on dit que b − a est l’amplitude de cette
𝒂+𝒃
classe, et Ci= la centre de classe dans le cas de variable discrète an appelle
𝟐
Variables
statistiques
Quantitative Qualitative
5- Effectif et le fréquence
5.1- L'effectif (ni ) d'une valeur donnée d'une variable est l'ensemble des individus présentant
cette valeur. L'effectif total (N) est la somme de tous les effectifs d'une variable.
2
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
5.2- La fréquence (fi ) d'une valeur donnée est le rapport de l'effectif correspondant à l'effectif
total. La fréquence totale (F) est toujours égale à 1.
Exemple : une étude sur l'état matrimonial des dix (10) salariés de la société X.
Population : dix(10) salariés de la société X.
Unité statistique (individu) : chaque salarié de la société X.
Variable (caractère) étudiée : état matrimoniale.
Modalités : célibataire, marié, veuf, divorcé.
Effectif : n1=2 célibataires ; n2=5 mariés ; n3=2 veufs : n4=1divorcé.
Effectif total : N = n1 + n2 + n3 + n4=10
Fréquence : fréquence de la modalité (fi) : célibataire = n1/N=0.2 ; marié = n2/N=0.5 : veuf =
n3/N=0.2 ; divorcé = n4/N=0.1 et la fréquence totale = F=1.
7- Représentations graphiques
Pour obtenir une meilleure compréhension de la répartition des valeurs d’une variable donnée
d’une série, plusieurs types de diagrammes existent. Le choix de quel type de diagramme
utiliser dépend directement du type de variable dont il s’agit.
7.1- Variables qualitatives
Diagramme en barre : dans ce diagramme, les modalités de la variable sont placées sur une
droite horizontale et les effectifs (ou les fréquences) sont placés sur un axe vertical. La
hauteur de la barre est proportionnelle à l’effectif (figure). Les barres ont une certaine
3
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
épaisseur pour qu’il n’y ait pas de confusion avec les diagrammes en bâtons réservés à des
variables quantitatives discrètes.
Figure 7.1.a
Diagramme circulaire ou camembert : L’effectif total est représenté par un disque. Chaque
modalité est représentée par un secteur circulaire dont la surface (pratiquement : l’angle au
centre) est proportionnelle à l’effectif correspondant (figure 4.2).
effectif de la modalité
L’angle de chaque modalité se calcule par : α= ∗ 360
effectif total
Figure 7.1.b
4
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
Figure7.2.a
Si les classes ont la même amplitude, on reporte en ordonnée l'effectif (ou fréquence)
des classes (voir figure 2.4 à gauche).
si les amplitudes sont différentes, on reporte en ordonnée la densité (di ) (effectif
𝑛𝑖
divisé par l'amplitude de la classe) Et nous devenons l’effectif rectifie 𝛼𝑖 = ×𝑎
𝑎𝑖
Figure7.2.b Figure7.2.c
5
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
Exemple :
La répartition suivante montre la répartition des 100 salariés par le salaire quotidien:
𝑛𝑖 𝑛𝑖
𝛼𝑖 = ×𝑎 Densité Amplitude Effectif 𝑛𝑖 Les classes
𝑎𝑖 𝑎𝑖
𝑎𝑖
5 1 5 5 ]25 − 20]
5,5 1,5 11 15 ]35 − 25]
01 4 5 01 ]40 − 35]
3,88 1,11 15 05 ]55 − 40]
5,5 1,5 20 81 ]75 − 55]
5 1 5 5 ]80 − 75]
/ / / 111 La somme
8.1- Moyenne
La moyenne arithmétique d'une série statistique est la somme des valeurs divisée par le Cas
des valeurs xi avec les effectifs n i
Cas des valeurs xi avec les effectifs n i
1
On désigne par x ni x i la moyenne arithmétique des valeurs observées. .
ni
On peut remarquer que x= f i x i
6
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
̅̅̅X=2.5∗2+7.5∗3+11∗7+13.5∗5+16∗3+18.5∗1 =
2+3+7+5+3+1
8.2- Médiane(Me)
C'est le nombre qui permet de couper la série statistique classées par ordre croissant (ou
décroissant) en deux sous-groupes égaux (contenant le même nombre des individus).
Graphiquement : la point d’intersection les deux courbes cumulé croissant et cumulé
décroisant représenter le médian.
Calcul de médiane pour un variable discrète
Si l’effectif total est impair N=2n+1, la médiane est parfaitement déterminée : la modalité
correspondant à la classe de n+1 (Me=x n+1 ).
Exemple : Soit la série statistiques suivante : 15, 7, 22, 4, 12, 30, 9, 18, 6. Pour déterminer la
médiane, il faut ordonner la série : 4, 6, 7, 9, 12, 15,18, 22, 30. Donc l’effectif totale N=2*4+1
La médiane est le Me= X4+1 =X5 = 12 car dans cette série, il y a 4 nombres inférieurs et 4
supérieures de 12.
Si l'effectif total est pair N=2n, on ne peut pas définir précisément la médiane : On définit un
xn + xn+1
intervalle médian. Xn et xn+1 alors Me= 2
Exemple : une série représentant les notes d'une classe : 15, 7, 20, 4, 12, 20, 9, 18, 6, 4 (série
ordonnée :
4, 4, 6, 7, 9, 12, 15, 18, 20, 20), l'interval médian est 9 et 12. Dans ce cas-là, le médian est
9+12
Me= =10.5
2
7
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
8.3- Mode
Pour une variable discrète, le mode est la modalité qui représente le plus grand effectif.
Exemple : sur le tableau, le mode est qualité de service 3
Pour une variable quantitative continue nous parlons de classe modale : c'est la classe dont
∆1
l'effectif est maximum. et 𝑀𝑜 = 𝑎 + [∆ ] × (𝑏 − 𝑎)
1+∆ 2
8
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
65
Mo 70
9- paramètres de dispersion
9.1- Etendue
L'étendue d'une série statistique quantitative est la différence entre la plus grande valeur de la
variable (discrète ou continue) et la plus petite valeur. Exemple, dans le tableau 1.1,.
𝐸 = 𝑀𝑎𝑥 (𝑋𝑖 ) − 𝑀𝑖𝑛(𝑋𝑖 ) = 85 − 50 = 35
9.2- Quartiles
On appelle premier quartile d'une série Q1 la plus petite valeur des termes de la série
pour laquelle au moins un quart (25%) des données sont inférieures ou égales.
On appelle troisième quartile d'une série la plus petite valeur Q3 des termes de la série
pour laquelle au moins trois quarts (75%) des données sont inférieures ou égales à Q3.
On appelle intervalle interquartile l'intervalle [Q1 ; Q3].
On appelle écart interquartile le nombre Q3-Q1.
Exemple : la série ordonnée par ordre croissant S a 12 termes :
S = [11; 12; 13; 15; 16; 16; 17; 17; 18; 19; 20; 22]
Un quart (25%) des données correspond à : 12 * 0.25 = 3. Donc Le premier quartile est alors,
par définition, la valeur du 3ème terme de la série c'est-à-dire Q1= 13.
Trois quarts (75%) des données correspondent à : 12 * 0.75 = 9. Donc Le troisième quartile
est alors, par définition, la valeur du 9ème terme de la série c'est-à-dire Q3= 18.
L'intervalle interquartile est [13 ; 18]. L'écart interquartile est 18-13 = 5.
9
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
Classe de premier quartile : c’est la première classe que l’effectif cumulé croissant supérieur ou
𝑁 𝑁
égal c’est-à-dire 𝑁𝑄↑ ≥ et Q1 donner par la formule suivant
4 1 4
𝑁
− 𝑁𝑄↑ 1−1
4
𝑄1 = 𝐿𝑖𝑚 𝑖𝑛𝑓𝑄1 + [ ] × 𝐴𝑄1
𝑛𝑄1
Classe de troisième quartile : c’est la première classe que l’effectif cumulé croissant supérieur
𝑁 𝑁
ou égal 3 c’est-à-dire 𝑁𝑄↑3 ≥ 3 et Q1 donner par la formule suivant
4 4
3𝑁
− 𝑁𝑄↑ 3 −1
4
𝑄3 = 𝐿𝑖𝑚 𝑖𝑛𝑓𝑄3 + [ ] × 𝐴𝑄3
𝑛𝑄3
Diagramme de Tukey
Ce type de diagramme est appelé diagramme de Tukey ou boîte à moustaches ou boîte à
pattes. Il représente le 1er et le 3ème quartile, le 1er et le 9ème décile, les valeurs extrêmes et
éventuellement la médiane d'une série
Xmax
Q3
Me
Q1
Xmin
9.3- Variance
La variance est un indicateur de la dispersion d'une série par rapport à sa moyenne. La
définition de la variance d'une série statistique est donnée par la formule :
9.4- Ecart-type
La définition de l'écart-type d'une série est donnée par la formule :
( x) V ( x)
Si l'écart-type est faible, cela signifie que les valeurs sont assez concentrées autour de la
moyenne et si l'écart-type est élevé, cela veut dire au contraire que les valeurs sont plus
dispersées autour de la moyenne.
10
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
mode < médiane < moyenne : la distribution est dissymétrique à gauche, c'est à dire
qu'il y a concentration pour les valeurs faibles et dispersion pour les valeurs fortes. C'est le cas
le plus fréquent.
- moyenne < médiane <mode : la distribution est dissymétrique à droite, c'est à dire
qu'il y a concentration pour les valeurs élevées et dispersion pour les valeurs faibles. Ce cas
est plus rare que le précédent.
11
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
Une série statistique à deux variables (ou une série double) représente une étude statistique sur
deux variables de la même population.
On considère deux variables statistiques numériques x et y observées sur une même
population de n individus.
On note x1 ; x2 ….x n les valeurs relevées pour la première variable et y1 ; y2 ..; yn les valeurs
relevées pour la deuxième variable. Les couples (x1 ; y1); (x2 ; y2) ..; (xn ; y n) forment une
Série statistique à deux variables.
Exemple : Le tableau montre deux séries mensuelles. La première indique le temps passé par
une personne sur Internet chaque mois (en heures) et la seconde série indique le total de la
somme dépensée sur différents sites marchands
Représentation graphique
Un graphique de dispersion ou nuage de points est un graphique qui met en relation les
valeurs de deux variables sur un repère de coordonnées cartésiennes
12
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
POINT MOYEN
On appelle point moyen de cette serie le point G de coordonnees ( x ; y ) ou x et y sont les
moyennes respectives des séries x1 ; x2 ;…. xn et y1 ; y2 ;….y n .
1 1
x xi et y yi
N N
La covariance
Pour mesurer la dispersion des points d'un nuage par rapport au point moyen, on utilise la
covariance.
La covariance est positive si X et Y ont tendance à varier dans le même sens, et négative si
elles ont tendance à varier en sens contraire.
3
Si r 1 X et Y sont bien corrélées, c'est-à-dire qu'elles sont liées entre elles par une
2
relation presque affine ; le nuage de points est presque aligné le long d'une droite (croissante
si r = +1, décroissante si r = -1).
1 3
Si r la corrélation entre X et Y est médiocre
2 2
1
0 r la corrélation entre X et Y mauvaise ou il n’y a aucun corrélation entre X et Y
2
13
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
La droite d'ajustement
Le coefficient de corrélation mesure la dépendance linéaire des variables. Si cette dépendance
est bonne, on peut exprimer la variable Y comme fonction linéaire de X. C'est à dire que les
valeurs yi peuvent être remplacées par des valeurs calculées qui sont fonctions des xi. Plus
précisément :
y1 = ax1+b, y2 = ax2+b……… . yn= axn+b Il reste donc à déterminer les valeurs des
paramètres a et b,
Graphiquement, cela signifie qu’on cherche une droite qui passe au plus près de tous les
points du nuage. Une telle relation permettrait notamment de faire des prévisions. Il existe de
nombreuses manières d’obtenir un ajustement affine satisfaisant.
Méthode de Mayer
Etape 1: On commence par « découper » la série statistique double en deux sous-séries
bien distinctes, c’est-à-dire que l’on découpe le nuage des points Mi (xi, yi) en deux sous-
nuages distincts et de même effectif (ou presque : si le nombre de points est pair, pas de souci.
S’il est impair, on peut mettre le point surnuméraire dans n’importe lequel des deux sous-
nuages)
Etape 2 : On calcule les coordonnées des deux points moyens G1 et G2 associés à ces
deux sous-groupes, et on place ces deux points sur le graphique.
Etape 3 : On trace la droite (G1 G2)?, appelée droite de Mayer du nuage des points
Mi (xi, yi), qui doit passer par le point moyen G du nuage de points Mi (xi, yi) .C’est cette
droite qui constitue un ajustement affine tout à fait acceptable pour la série double (xi, yi)
14
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
Exemple :
Exemple : Le tableau suivant donne le chiffre d'affaire réalisé au cours des 6 derniers mois par
un site de vente en ligne en fonction du nombre de commandes reçues.
On partage le nuage de points en deux groupes de même importance suivant les valeurs
croissantes de xi, et on calcule les coordonnées des points moyens G1 et G2 de chaque groupe
des points.
Alors les deux sous-groupes des point comme la suit.
On calcule les coordonnées des deux points moyens G1 et G2 associés à ces deux sous-
groupes,
Coordonnées de G1 x1 ; y1 ) avec x1 moyenne des valeurs xi du premier groupe et
y1 : moyenne des valeurs yi du premier groupe.
6400 8350 9125 250000 320000 335000
x1 = 7960 et y1 310650
3 3
Donc G1 (7960 ; 310650).
Coordonnées de G2 x 2 ; y 2 ) avec x 2 moyenne des valeurs xi du deuxième groupe et
y 2 : moyenne des valeurs yi du deuxième groupe.
L’équation de droite D1 elle admet de la forme y=a.x+b et dans ce cas passant par les points
y yG1 373330 310650
G1 et G2 avec a G 2 24 et
xG 2 xG1 10550 7960
b yG1 a * xG1 310650 24 * 7960 119700
La droite d'ajustement affine à donc pour équation y=24*x+119700
15
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
16
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
et
17
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :
18
Mr :Damba N