Академический Документы
Профессиональный Документы
Культура Документы
Définitions et notation
Quelques précautions à prendre
Quelques problèmes posés par les séries temporelles
Représentations graphiques
Myriam Maumy1
Sommaire
1 Exemples
2 Définitions et notation
5 Représentations graphiques
Exemples
1 Indice mensuel des prix à la consommation, base 100 en
juillet 1970,
2 Trafic voyageur de la SNCF en deuxième classe,
3 Accroissement relatif mensuel de l’indice des prix et de
son évolution à moyen terme, entre 1970 et 1978,
4 Population des États-Unis, 1790-1980,
5 Nombre de grèves aux États-Unis, 1951-1980,
6 Nombre mensuel de décès accidentels aux USA,
1973-1978,
7 Nombre mensuel de passagers des vols internationaux,
1949-1960.
Sommaire
1 Exemples
2 Définitions et notation
5 Représentations graphiques
Définition
Une série chronologique (ou encore série temporelle, ou
encore chronique) est une suite finie formée d’observations
numériques d’une grandeur (ici une
variable aléatoire) Xt ou
(1) (2)
d’un vecteur Xt = Xt , Xt , . . . effectuées à intervalles
réguliers au cours du temps.
Définitions
La variable mesurée peut être l’état d’une grandeur à l’instant
de mesure, nous parlons de niveau ou stock, ou le bilan d’une
activité au cours de la dernière période écoulée à cet instant et
nous disons qu’il s’agit d’un flux.
Exemples
1 En météorologie, la température est un niveau et la
pluviométrie est un flux. Les relevés se font à heure fixe.
2 En économie, l’indice des prix à la consommation est un
niveau et le taux d’inflation correspondant est un flux. Dans
ce cas, l’indice fait référence au mois bien qu’il résulte de
mesures pouvant être très étalées dans le temps.
3 En finance, un cours boursier est souvent considéré
comme évoluant continûment bien que nous utilisons sa
valeur en ouverture de séance durant cinq jours par
semaine pour déterminer les rentabilités journalières puis
hebdomadaires ou mensuels par sommation.
Définition
La composante fondamentale ou tendance (trend) traduit
l’évolution à moyen terme du phénomène. Nous parlons aussi
de mouvement conjoncturel ou mouvement extra-saisonnier. La
série chronologique correspondante, notée Ft , t = 1, . . . , T , est
une fonction à variation lente supposée déterministe dans cette
approche. Elle sera estimée sous forme paramétrique (linéaire,
polynômiale, logarithmique, exponentielle, etc) ou comme le
résultat d’une opération de lissage (le lissage sera traité dans
un des chapitres suivants).
Définition
Nous parlons de tendance linéaire lorsque la série peut se
décomposer en
Xt = a1 × t + a0 + Et , t = 1, 2, . . .
Xt = ap × t p + ap−1 × t p−1 + · · · + a0 + Et , t = 1, 2, . . .
Exemple
Le graphe représentant la population des États-Unis de 1790 à
1980, semble à première vue présenter une tendance
polynômiale ou exponentielle. Pour trancher entre les deux,
nous pouvons tracer le graphe du logarithme des données et
voir si il présente une tendance linéaire. Nous reviendrons par
la suite sur les représentations graphiques.
Définition
Nous parlons de tendance multiplicative lorsque la série peut
se décomposer en
Xt = Tt × Et , t = 1, 2, . . .
Définition
La composante saisonnière ou mouvement saisonnier
représente des effets périodiques de période connue p qui se
reproduisent de façon plus ou moins identique d’une période à
l’autre. La série chronologique correspondante, également
déterministe, est notée St , t = 1, . . . , T . Elle est généralement
supposée rigoureusement périodique : St+p = St et les valeurs
Sj = Sij , j = 1, . . . , p d’une période sont appelées coefficients
saisonniers. Le bilan de l’effet saisonnier sur une période doit
être nul car il est pris en compte dans la tendance.
Remarque
La composante saisonnière permet simplement de distinguer à
l’intérieur d’une même période une répartition stable dans le
temps d’effets positifs ou négatifs qui se compensent sur
l’ensemble de la période.
Définition
Nous parlons de composante périodique, ou de périodicité,
lorsque la série chronologique se décompose en
Xt = St + Et , t = 1, 2, . . .
Remarques
1 Lorsque la période p est de 6 mois ou un an, comme c’est
le cas dans beaucoup de phénomènes
socio-économiques, nous avons plutôt l’habitude de parler
de saisonnalité ou de composante saisonnière.
2 Comme précédemment, il arrive que nous ayons recours à
un modèle multiplicatif.
Remarque
Certains phénomènes économiques étudiés à très long terme
présentent une composante cyclique (cycles d’activité) dont la
période, de plusieurs années, est souvent mal définie. Cette
composante est prise en compte dans la tendance sur les
séries de taille moyenne et ne sera pas étudiée en tant que
telle.
Définition
La composante résiduelle ou variations accidentelles est la
partie non structurée du phénomène temporel étudié. Elle est
modélisée par une suite de variables aléatoires Et , t = 1, . . . , T
centrées, non corrélées et de même variance, nous parlons
alors dans ce cas de bruit blanc.
Remarque
Nous supposons généralement que la partie résiduelle a un
ordre de grandeur très inférieur à celui des parties explicatives
Ft et St . En fait il sera toujours possible de déceler la présence
d’une partie déterministe, même de faible importance, à
condition que la série observée soit suffisamment longue.
Notation
{Xt , t ∈ I} ou {Xt }t∈I ou encore {X (t), t ∈ I}, où I est un
intervalle de temps.
Quelques remarques
Nous comprenons facilement l’intérêt de connaître la tendance
de la série. La composante saisonnière sert également à
analyser le phénomène temporel étudié et participe à la volonté
de prévision (aspect que nous essayerons de développer tout
au long de ce cours !)
Cependant bien des séries économiques sont publiées en
données corrigées des variations saisonnières (notées séries
CVS). De telles séries, dites désaisonnalisées, sont obtenues
en éliminant la composante saisonnière de la série initiale. À
cette fin la composante saisonnière est estimée en général de
façon non paramétrique.
Remarques
1 En utilisant (1 + Et ) dans le cas multiplicatif, nous
conservons la même signification et les mêmes propriétés
à chacune des composantes Ft , St et Et dans les 3
schémas de composition. Il est nécessaire de supposer
que (1 + Et ) reste positif dans le modèle multiplicatif car la
composante résiduelle ne peut être responsable du signe
de la grandeur observée.
2 Dans les schémas multiplicatif et mixte, les oscillations
dues à l’effet saisonnier ont une amplitude proportionnelle
à la valeur de la tendance. Nous utilisons cet argument
pour faire le choix entre le schéma additif et les autres
schémas au vu de la représentation graphique de la série.
Remarques
3 La distinction entre le schéma multiplicatif et le schéma
mixte peut également s’apprécier graphiquement selon le
même principe. Elle peut aussi relever de considérations
sur l’origine des erreurs : une erreur structurelle (de
modélisation) a des chances d’être proportionnelle à la
grandeur étudiée alors qu’une erreur de mesure pourrait
ne pas en dépendre.
Exemple
Le trafic aérien aux Etats Unis entre 1949 et 1960 fournit un
exemple où le schéma multiplicatif s’impose. Nous avons déjà
remarqué que dans ce cas il fallait considérer le logarithme de
la variable qui est alors expliqué par un schéma additif.
Remarques
4 Par la suite nous ne considérerons plus que le cas additif.
Il peut être nécessaire d’appliquer plusieurs fois la
transformation logarithmique.
Sommaire
1 Exemples
2 Définitions et notation
5 Représentations graphiques
Sommaire
1 Exemples
2 Définitions et notation
5 Représentations graphiques
Définition
Prévoir les valeurs futures XT +h , h > 1, à partir des valeurs
données X1 , ..., XT , par « les valeurs attendues en moyenne »,
avec une incertidude à contrôler.
Notation
La valeur prédite ou encore la prévision sera notée X
bT +h ou
encore XT (h).
b
Remarque
En général, nous avons
bT +h 6= XT +h .
X
Remarque
Nous pouvons quantifier cette erreur en utilisant l’erreur
quadratique moyenne (EQM) :
2
E XT +h − XT +h
b .
Remarque
Plus h est grand, plus cette erreur est grande aussi.
Remarque
La prévision sert aussi :
1 à évaluer la qualité d’un modèle par application aux
valeurs Xt , t 6 T ,
2 à traiter les valeurs manquantes,
3 mesurer l’effet d’un phénomène accidentel comme par
exemple une grève,
4 etc.
Important
Aucune prévision n’est possible sans avoir une certaine
structure, par exemple celle des « corrélations », ou encore la
dépendance, dans les valeurs aléatoires Xt .
Un contre-exemple
« Random walk », ce qui signifie une marche aléatoire.
Une marche aléatoire est une somme de variables
« purement » aléatoires.
Exemples
Des ruptures peuvent être engendrées par
1 un changement de politique,
2 un changement de politique économique,
3 etc.
L’idée
Il faudra éliminer la tendance représentant l’évolution à moyen
terme du phénomène étudié.
Remarque
Pourquoi ? Parce que cette tendance agit comme une forte
corrélation entre les variables Xt qui n’exprime aucune liaison à
caractère explicatif.
Remarque
Nous verrons par la suite comment estimer et enlever cette
tendance pour voir si de telles liaisons existent afin de n’étudier
que les corrélations sans tendance qui sont les quantités qui
nous intéressent pour expliquer un phénomène observé.
L’idée
Nous corrigerons les éventuelles variations saisonnières qui
résultent d’un comportement cyclique dans la série observée.
Exemple
Considérons l’évolution du trafic des voyageurs qui utilisent les
trains de la SNCF. Dans cet exemple, nous observons une
relation directe entre la période de l’année (par exemple le
mois d’août), et la fréquentation des trains.
Remarque
Toute théorie d’analyse de séries chronologiques et de
prévision devra tenir compte de ce phénomène.
Remarque
Nous verrons comment éliminer cette saisonnalité afin de nous
intéresser uniquement aux composantes aléatoires de la série
chronologique.
Exemple
Si deux séries sont observées, nous pouvons nous demander
quelle influence elles exercent l’une sur l’autre.
En notant (Xt ) et (Yt ) deux séries chronologiques observées,
nous nous demandons, par exemple, s’il existe des relations du
type :
Yt = a1 × Xt−1 + a3 × Xt−3 .
Remarque
Dans ce dernier exemple, deux questions interviennent :
1 La question de la causalité.
Quelle variable (ici c’est Xt ) va expliquer l’autre (ici c’est
Yt ) ? Ce qui amène la deuxième question.
2 La question du décalage temporel.
Si une influence de (Xt ) sur (Yt ) existe, alors avec quel
délai et pendant combien de temps la variable explicative
(Xt ) influence-t-elle la variable expliquée (Yt ) ?
Sommaire
1 Exemples
2 Définitions et notation
5 Représentations graphiques
Représentation graphique
La représentation graphique des observations est une étape
indispensable avant d’entreprendre une analyse plus technique
de la chronique. Les points (t, yt ), t = 1, . . . , T sont représentés
dans un système d’axes orthogonaux (échelles arithmétiques).
Ils sont joints chronologiquement par des segments de droite
pour faciliter la visualisation. Cette représentation permet
d’apprécier l’évolution lente du phénomène (tendance), de
dégager les périodes de stabilité. Elle suggère parfois d’opérer
une transformation de la grandeur.
Exemple : C’est le cas pour le trafic aérien où, par exemple
une transformation logarithmique peut être envisagée.
La tendance
L’interprétation de la tendance est délicate, lorsqu’elle est
naturellement liée au phénomène observé.
Exemple : trafic aérien, indice des prix, etc.
Elle est reproductible dans un contexte similaire et sera
considérée comme déterministe. Par contre une tendance
apparente peut résulter du pur hasard comme dans l’exemple
de la marche aléatoire. Dans ce cas elle est de nature
stochastique et n’a pas d’interprétation autre que descriptive.
La composante saisonnière
La représentation de la chronique peut faire apparaître, en plus
de la tendance, un aspect périodique plus ou moins marqué de
période connue, 12 pour une chronique mensuelle, 4 pour une
chronique trimestrielle,...
Exemple : Il est très net dans le cas du trafic aérien.
Une première appréciation de son importance est obtenue
graphiquement en représentant, pour une chronique
mensuelle, les courbes annuelles (sur 14 mois). La
représentation polaire de la chronique a le même objectif, elle
est plus originale mais moins lisible.