Вы находитесь на странице: 1из 170

Université de Technologie de Belfort-Montbéliard

École Doctorale Sciences Pour l’Ingénieur et


Microtechniques

THÈSE
Présentée pour obtenir le grade de

Docteur de l’Université de Technologie de Belfort-


Montbéliard en Sciences pour l’Ingénieur
Spécialité : Automatique et Informatique

Présentée le 28-03-2014 par


HUIDE ZHOU

Concepts thermodynamiques et d’entropie pour la


modélisation et la régulation d’un réseau de transport

Président : Alain Oustaloup (Professeur, Université Bordeaux 1)


Rapporteurs : Dimitri Lefebvre (Professeur, IUT du Havre)
Najib Essounbouli (Professeur, IUT Troyes)
Examinateurs Mohamed Benrejeb (Professeur, ENIT Tunisie)
Abdellah EL Moudni (Professeur, UTBM Belfort)
Directeur Rachid Bouyekhf (Maître de conférences HDR, UTBM Belfort)
2
TABLE DES MATIÈRES

Liste des figures vii

Liste des tableaux ix

Introduction générale xiii

Chapitre 1 Généralités 1
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Description d’un réseau de carrefours . . . . . . . . . . . . . . . . . . . 2
1.2.1 Caractéristiques d’un carrefour à feux . . . . . . . . . . . . . . . 2
1.2.2 Caractéristiques des feux d’un carrefour . . . . . . . . . . . . . . 5
1.2.3 Caractéristiques du mouvement du trafic . . . . . . . . . . . . . . 8
1.2.4 Infrastructures de mesure . . . . . . . . . . . . . . . . . . . . . . 10
1.3 Régulation des feux de signalisation . . . . . . . . . . . . . . . . . . . . 11
1.3.1 Boucle de régulation d’un réseau de carrefours . . . . . . . . . . 11
1.3.2 Modes de régulation d’un réseau de carrefours . . . . . . . . . . 12
1.3.3 Stratégies de régulation d’un réseau de carrefours . . . . . . . . . 14
1.3.3.1 Stratégies fixes . . . . . . . . . . . . . . . . . . . . . . 15
1.3.3.2 Stratégies adaptatives . . . . . . . . . . . . . . . . . . 17
1.4 Conclusion et objectif de la thèse . . . . . . . . . . . . . . . . . . . . . . 21
ii TABLE DES MATIÈRES

Chapitre 2 Modélisation thermodynamique des réseaux de transport 23


2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2 Quelques notions sur les systèmes thermodynamiques . . . . . . . . . . . 25
2.2.1 Le système, la chaleur et la température . . . . . . . . . . . . . . 25
2.2.2 Premier principe de la thermodynamique . . . . . . . . . . . . . 27
2.2.3 Deuxième principe : notions d’entropie et disentropie . . . . . . 28
2.3 Sur la représentation mathématique des systèmes thermodynamiques . . . 29
2.3.1 Formulation de l’entropie . . . . . . . . . . . . . . . . . . . . . 32
2.3.2 Formulation de la disentropie . . . . . . . . . . . . . . . . . . . 33
2.4 Modélisation thermodynamique d’un réseau de carrefours . . . . . . . . . 34
2.4.1 Conservation des véhicules (premier principe) . . . . . . . . . . . 37
2.5 Entropie du transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.5.1 Justification de l’entropie du transport . . . . . . . . . . . . . . . 41
2.5.2 Equilibre thermique = Equilibre du taux d’occupation . . . . . . 46
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

Chapitre 3 Commande dissipative des réseaux de transport 53


3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.2 Rappels mathématiques et résultats préliminaires . . . . . . . . . . . . . 55
3.3 Définition des systèmes discrets dissipatifs . . . . . . . . . . . . . . . . . 59
3.3.1 Commande dissipative des systèmes discrets . . . . . . . . . . . 62
3.3.2 Avantages et inconvénients . . . . . . . . . . . . . . . . . . . . . 62
3.4 Spécialisation aux systèmes de transport . . . . . . . . . . . . . . . . . . 63
3.4.1 Commande dissipative des réseaux de transport . . . . . . . . . . 66
3.4.2 Cas d’un modèle non-linéaire . . . . . . . . . . . . . . . . . . . 67
3.4.3 Cas d’un modèle linéaire . . . . . . . . . . . . . . . . . . . . . . 80
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

Chapitre 4 Commande H∞ des réseaux de transport 91


4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.2 Rappels mathématiques et résultats préliminaires . . . . . . . . . . . . . 92
4.2.1 Sur l’optimisation sous contraintes inégalités . . . . . . . . . . . 92
4.2.2 Sur le problème H∞ . . . . . . . . . . . . . . . . . . . . . . . . 94
4.3 Commande H∞ des réseaux de transport . . . . . . . . . . . . . . . . . . 96
TABLE DES MATIÈRES iii

4.3.1 Position du problème de la commande . . . . . . . . . . . . . . . 98


4.3.2 Solution du problème de la commande . . . . . . . . . . . . . . . 101
4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

Chapitre 5 Applications 113


5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.2 Application à un réseau artériel . . . . . . . . . . . . . . . . . . . . . . . 114
5.2.1 Caractéristiques du réseau simulé . . . . . . . . . . . . . . . . . 114
5.2.2 Solutions des commandes . . . . . . . . . . . . . . . . . . . . . 117
5.2.3 Étude en simulation . . . . . . . . . . . . . . . . . . . . . . . . 118
5.2.3.1 Résultats de la commande dissipative . . . . . . . . . . 118
5.2.3.2 Résultats de la commande H∞ . . . . . . . . . . . . . 121
5.2.3.3 Comparaison avec la commande LQ . . . . . . . . . . 122
5.3 Application à un réseau en grille . . . . . . . . . . . . . . . . . . . . . . 126
5.3.1 Caractéristiques du réseau simulé . . . . . . . . . . . . . . . . . 126
5.3.2 Scénario 1 : Perturbations sinusoïdales . . . . . . . . . . . . . . 128
5.3.3 Scénario 2 : Perturbations à distribution de Gauss . . . . . . . . . 137
5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

Conclusion générale 143

Références 152
iv TABLE DES MATIÈRES
TABLE DES FIGURES

1.1 Intersection à quatre branches avec mouvement tourne-à-gauche à priorité


à droite (sans déplacements pédestres) . . . . . . . . . . . . . . . . . . . 3
1.2 Courants de flux dans un carrefour élémentaire . . . . . . . . . . . . . . 4
1.3 Ensemble des éléments d’un tronçon . . . . . . . . . . . . . . . . . . . . 5
1.4 Le premier feu de signalisation électrique à Cleveland . . . . . . . . . . . 6
1.5 Exemple de séquence de phases . . . . . . . . . . . . . . . . . . . . . . 8
1.6 Boucle de régulation d’une intersection isolée . . . . . . . . . . . . . . . 12
1.7 Bande passante maximale d’une artère [1] . . . . . . . . . . . . . . . . . 17
1.8 Simplification du modèle "stocker-et-transférer" . . . . . . . . . . . . . . 21

2.1 Système thermodynamique . . . . . . . . . . . . . . . . . . . . . . . . . 30


2.2 L’écoulement du trafic des deux intersections . . . . . . . . . . . . . . . 35
2.3 L’ordre thermodynamique . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.4 L’ordre du transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.5 Le diagramme fondamental . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.1 Intersection à deux phases . . . . . . . . . . . . . . . . . . . . . . . . . 67


3.2 Intersection à trois phases . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.1 Problème H∞ standard . . . . . . . . . . . . . . . . . . . . . . . . . . . 94


4.2 Problème H∞ du système de transport . . . . . . . . . . . . . . . . . . . 100
vi TABLE DES FIGURES

5.1 Réseau artériel incluant quatre intersections . . . . . . . . . . . . . . . . 114


5.2 Évolution des taux d’occupation en utilisant la commande dissipative
pour le réseau artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.3 Évolution de Sω et ∆ψ(x) en utilisant la commande dissipative pour le
réseau artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
5.4 Évolution de la commande u en utilisant la commande dissipative pour le
réseau artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
5.5 Évolution des taux d’occupation en utilisant la commande H∞ pour le
réseau artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
kzc k2
5.6 Évolution de kωk2
en utilisant la commande H∞ pour le réseau artériel . . 122
5.7 Évolution de la commande u en utilisant la commande H∞ pour le réseau
artériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.8 Évolution de l’entropie de transport pour le réseau artériel . . . . . . . . . 124
5.9 Évolution du retard total des véhicules par cycle pour le réseau artériel . . 125
5.10 Évolution du temps de calcul pour le réseau artériel . . . . . . . . . . . . 125
5.11 Réseau en grille incluant 12 intersections . . . . . . . . . . . . . . . . . 127
5.12 Évolution des taux d’occupation en utilisant la commande dissipative
pour le réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5.13 Évolution des taux d’occupation en utilisant la commande dissipative
pour le réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
5.14 Évolution de Sω et ∆ψ(x) en utilisant la commande dissipative pour le
réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
5.15 Évolution de la commande u en utilisant la commande dissipative pour le
réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
5.16 Évolution des occupations en utilisant la commande H∞ pour le réseau
en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.17 Évolution des taux d’occupation en utilisant la commande H∞ pour le
réseau en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
kzc k2
5.18 Évolution de kωk2
en utilisant la commande H∞ pour le réseau en grille . 134
5.19 Évolution de la commande u en utilisant la commande H∞ pour le réseau
en grille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.20 Évolution de l’entropie du transport pour le réseau en grille . . . . . . . . 135
5.21 Évolution du retard total de véhicules par cycle pour le réseau en grille . . 136
TABLE DES FIGURES vii

5.22 Évolution du temps de calcul pour le réseau en grille . . . . . . . . . . . 136


5.23 Perturbations aux heures de pointe . . . . . . . . . . . . . . . . . . . . . 137
5.24 Évolution des taux d’occupation en utilisant la commande dissipative
avec les perturbations aux heures de pointe . . . . . . . . . . . . . . . . . 138
5.25 Évolution des taux d’occupation en utilisant la commande H∞ avec les
perturbations aux heures de pointe . . . . . . . . . . . . . . . . . . . . . 139
5.26 Évolution des taux d’occupation en utilisant la commande LQ avec les
perturbations aux heures de pointe . . . . . . . . . . . . . . . . . . . . . 139
5.27 Évolution de l’entropie du transport avec les perturbations aux heures de
pointe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
5.28 Évolution du retard total des véhicules par cycle avec les perturbations
aux heures de pointe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
viii TABLE DES FIGURES
LISTE DES TABLEAUX

2.1 Correspondances des concepts de base . . . . . . . . . . . . . . . . . . . 36

5.1 Proportions des flux d’échange λi,j . . . . . . . . . . . . . . . . . . . . . 115


5.2 Performances pour le réseau artériel . . . . . . . . . . . . . . . . . . . . 126
5.3 Performances pour le réseau en grille (scénario 1) . . . . . . . . . . . . . 135
5.4 Performances face aux perturbations à distribution de Gauss . . . . . . . 140
x LISTE DES TABLEAUX
LISTE DES PUBLICATIONS

Journals
1. Huide Zhou, Rachid Bouyekhf, Abdellah El Moudni. Modeling and entropy based
control of urban transportation network. Control Engineering Practice, Volume 21,
Issue 10, pp. 1369-1376, 2013.
2. Huide Zhou, Rachid Bouyekhf, Abdellah El Moudni. Constrained H∞ control of ur-
ban transportation network. Journal of Advanced Transportation, Published online
in Wiley Online Library (wileyonlinelibrary.com). DOI : 10.1002/atr.1281, 2014.

Conférences
1. Huide Zhou, Rachid Bouyekhf, Abdellah EL Moudni. Modelling and H∞ Control
of Urban Transportation Network Control in Transportation Systems. 13th IFAC
Symposium on Control in Transportation Systems, Sofia, Bulgaria, Septembre 2012.
2. Huide Zhou, Rachid Bouyekhf, Abdellah EL Moudni. Modeling and Constrained
Control of Transportation Network. 10th IEEE International Conference on Net-
working, Sensing, and Control, Paris, France, April 2013.
3. Huide Zhou, Rachid Bouyekhf, Abdellah EL Moudni. An Approach of Model Pre-
dictive Control for Urban Transportation Network. 13th IFAC Symposium on Large
Scale Complex Systems, Shanghai, China, July 2013.
xii LISTE DES TABLEAUX

4. Huide Zhou, Rachid Bouyekhf, Abdellah EL Moudni. Concept of Transportation


Entropy and Its Application in Traffic Signal Control. 1st IFAC Workshop on Ad-
vances in Control and Automation Theory for Transportation Applications, Istan-
bul, Turkey, September 2013.
INTRODUCTION GÉNÉRALE

Les systèmes de transport sont des systèmes complexes en raison non seulement
du nombre élevé d’acteurs qui y participent, mais aussi à cause de leurs structures très
maillées sur lesquelles le trafic se déroule. Cette complexité a engendré un besoin gran-
dissant d’outils et de méthodes pour la modélisation, la régulation ainsi que l’évaluation
des performances de tels systèmes.
Les approches largement utilisées dans la modélisation des systèmes de transport sont
la théorie de files d’attente, l’approche de la mécanique des fluides, les automates cellu-
laires, les réseaux de Petri etc. Ces méthodes ont été mises au point au cours des dernières
décennies et ont été appliquées dans de nombreuses stratégies de contrôle de la signali-
sation routière. Cependant, bien que ces approches soient efficaces pour la modélisation
du trafic, elles sont souvent confrontées à la complexité du modèle obtenu. En effet, si le
réseau routier étudié est de grande taille, l’utilisation de ces méthodes devient rapidement
problématique et très coûteuse en terme de temps de calcul.
Ce travail se propose d’aborder le problème de la modélisation et la régulation du trafic
des réseaux de carrefours signalisés par une nouvelle approche, qui, à notre connaissance,
n’a pas encore été explorée. Nous nous intéressons tout particulièrement à la manière dont
les liens se tissent entre les systèmes de transport et les systèmes thermodynamiques. En
effet, en considérant les véhicules comme étant l’énergie fournie au réseau de transport,
nous pouvons considérer le réseau d’intersections comme un système thermodynamique
où il y a des échanges ou transferts de l’énergie (véhicules) entre les sous-systèmes (in-
tersections signalisées) qui transitent entre différents états : stable (non congestionné),
xiv Introduction

instable (congestionné) et en équilibre (fluide). Nous pouvons ainsi, comme dans le cas
thermodynamique, produire une régulation de la circulation à partir d’énergie sous forme
d’information.
L’étude basée sur des concepts thermodynamiques permet d’ouvrir une nouvelle pers-
pective sur la dynamique et la gestion de flux de véhicules. En effet, l’approche énergé-
tique permet d’une part de modéliser les interactions entre différentes intersections rou-
tières et d’autre part, d’analyser l’énergie interne (véhicules) du système qui est l’un des
facteurs qui détermine l’état du trafic. De plus, elle permet d’étudier le problème de la
gestion dynamique basée sur un modèle de trafic qui a fait ses preuves en thermodyna-
mique.
Cependant, les systèmes de transport sont des systèmes dynamiques sujets à des in-
certitudes et des limitations d’ordre physique ou dictées par des impératifs de sécurité.
Ces limitations se traduisent dans la majorité des cas par des contraintes sur les variables
d’état et/ou de commande. La prise en compte de ces incertitudes et de ces contraintes
dans la conception du plan de feux est donc nécessaire. Notre travail s’inscrit dans ce
cadre pour la régulation des réseaux de carrefours.
La régulation du trafic dans un réseau de carrefours à feux concerne en général deux
objectifs distincts : la fluidification ou la résorption de congestion. Dans le premier cas,
on évite de se retrouver dans une situation de trafic très dense en essayant d’ajuster les
durées de commutation des feux en fonction de la demande d’affluence au carrefour :
c’est une action a priori. Dans le second cas, on est confronté à un trafic saturé (état de
congestion). Dans ce cas, il faudra agir a posteriori.
Dans ce mémoire, nous nous intéressons essentiellement à un travail en amont (action
a priori) permettant d’éviter la congestion en forçant les files d’attente à ne pas dépasser
le niveau du trafic correspondant à l’optimum opérationnel des lignes.

Plan de la thèse
Ce mémoire est structuré en cinq chapitres.
Le premier chapitre présente tout d’abord les carrefours à feux ainsi que les différents
éléments les caractérisant. Les notions essentielles pour la régulation du trafic aux abords
des carrefours sont ensuite présentées. Une dernière partie est consacrée à la présentation,
non exhaustive, des méthodes développées pour la gestion et la régulation des carrefours.
xv

Enfin, nous terminons le chapitre par une conclusion et la formulation du problème de la


commande de ce travail.
Le deuxième chapitre est consacré à la modélisation des réseaux de transport signa-
lisés. Après avoir exposé une brève introduction aux systèmes thermodynamiques, nous
élucidons le lien étroit qui existe entre les systèmes de transport et la thermodynamique.
Nous montrons dans un premier temps, que certains concepts thermodynamiques tels que
la température, la capacité thermique, l’équilibre thermique, trouvent leurs similitudes
dans le cadre des systèmes de transport. Ensuite, nous présentons la notion d’entropie du
réseau de transport qui sert à mesurer le degré de désordre d’un système. Ce concept d’en-
tropie représente le visage thermodynamique de notre système et prend source et forme à
partir de l’énergie (véhicules) échangée ou transférée entre les sous-systèmes.
Le troisième chapitre est consacré à la solution de notre problème de la commande
par l’approche des systèmes dissipatifs avec contraintes sur l’état et la commande. Après
avoir exposé quelques définitions et résultats utiles donnés dans la littérature dont nous
aurons besoin dans la suite, nous donnons sous forme d’inégalités matricielles linéaires
(LMI) des conditions nécessaires et suffisantes pour qu’un réseau de transport soit dissi-
patif. Deux cas sont étudiés : celui, où le modèle du système est non-linéaire, est d’abord
analysé. Ensuite, nous nous intéressons au cas où le modèle de transport est linéaire.
Les inconvénients de l’approche de la commande dissipative dans le cas linéaire nous
ont amené à avoir recours à la commande H∞ dans le chapitre 4. Après avoir exposé
quelques résultats utiles, nous proposons des commandes par retour d’état basées sur le
concept d’invariance positive des ensembles et permettant d’atteindre notre objectif. Le
principe de cette approche implique que toutes les trajectoires issues d’un ensemble y
restent.
Le chapitre 5 se focalise sur la mise en place des stratégies de régulation proposées
sur deux types de réseaux de carrefours : artériel et en grille. Pour chaque type de ré-
seau, nous décrivons ses caractéristiques géométriques ainsi que les caractéristiques des
flux de véhicules. Une étude détaillée sur les performances des stratégies sera décrite en
comparaison avec la stratégie de commande linéaire quadratique (LQ).
Enfin, nous concluons ce mémoire en résumant les contributions de ce travail et en
présentant quelques perspectives de nos travaux.
xvi Introduction
CHAPITRE 1

GÉNÉRALITÉS SUR LES RÉSEAUX


DE CARREFOURS URBAINS

1.1 Introduction
Le transport a toujours été l’un des composants déterminants de la vie urbaine et de
son développement économique. A partir de la seconde moitié du siècle dernier, l’amé-
lioration du niveau de vie moyen et du taux d’équipement des ménages a permis au plus
grand nombre d’accéder au déplacement par véhicule particulier. Nous avons donc assisté
à une course entre la croissance du trafic routier et les progrès quantitatifs et qualitatifs de
la voirie. Cette quantité d’actions génère des problèmes au niveau de la fluidité du trafic,
d’où l’apparition de phénomènes de congestion.
La congestion se produit aujourd’hui de façon quasi-quotidienne dans les réseaux
routiers. Elle est source de perte de temps, augmentation de la consommation d’énergie,
nuisance et détérioration de l’environnement.
La solution aux problèmes de congestion routière ne passe pas toujours par la construc-
tion de nouvelles routes, comme cela se faisait dans un passé récent. Étant donné que
l’offre de terrains est épuisée et que le développement de l’infrastructure routière est coû-
teux, la tendance actuelle est plutôt à une meilleure utilisation des infrastructures exis-
tantes. En particulier, les feux de signalisation jouent un rôle important parmi les ap-
2 Chap 1. Généralités

proches qui permettent d’éviter la congestion. Avec le développement des infrastructures


de mesure et des nouvelles techniques numériques, la conception d’une meilleure com-
mande des feux de signalisation a fait l’objet de nombreuses recherches afin d’améliorer
la circulation au niveau du réseau à grande échelle.
Dans la suite de ce chapitre, nous décrivons d’une manière détaillée un réseau de car-
refours. Ceci passe par la définition des différents éléments le caractérisant. Une deuxième
partie est consacrée à la présentation, non exhaustive, des méthodes développées pour la
gestion et la régulation des carrefours.

1.2 Description d’un réseau de carrefours


En milieu urbain, l’infrastructure de transport se compose d’un ensemble d’éléments
structuraux interconnectés qui fournissent le réseau pour supporter la totalité de la struc-
ture du trafic. En particulier, les carrefours à feux sont des nœuds importants d’un réseau
routier permettant d’écouler ou de stocker des flux de véhicules selon la variation du tra-
fic. Ainsi, la description du réseau de transport urbain se concentre sur les caractéristiques
des carrefours et les composantes qui leurs sont liées.

1.2.1 Caractéristiques d’un carrefour à feux


D’après la définition donnée par le livre de référence en matière d’ingénierie du tra-
fic routier [2], un carrefour est situé à la rencontre de plusieurs routes déterminant des
couloirs d’entrée et de sortie. Plus précisément, un carrefour à feux constitue un terrain
sensible pour les conflits de trafic à partir des différentes routes. La mise en place d’un
système de feux à un carrefour réalise une séparation dans le temps du passage de dif-
férents flux de véhicules. Elle peut revêtir plusieurs schémas relatifs à la géométrie de
l’infrastructure et aux règles de franchissement.
Pour étudier une intersection routière, nous nous concentrons tout d’abord sur l’ana-
lyse d’une intersection routière à deux phases et à quatre branches que nous pouvons
qualifier comme étant un carrefour élémentaire (voir Figure 1.1). L’étude des autres types
d’intersection sera ramenée à ce type simple de carrefour. Ceci peut être réalisé, soit en
décomposant ceux qui sont complexes en plusieurs carrefours élémentaires, soit en ajou-
tant des tronçons fictifs pour les intersections à moins de quatre branches.
1.2 Description d’un réseau de carrefours 3

F IGURE 1.1 – Intersection à quatre branches avec mouvement tourne-à-gauche à priorité


à droite (sans déplacements pédestres)

Dans chaque intersection, nous pouvons identifier trois zones fonctionnelles :


– Zone de conflit : il s’agit de l’espace de croisement des routes. Autrement dit, c’est
la ressource critique partagée par tous les véhicules qui traversent l’intersection ;
– Zone de stockage : en amont de la zone de conflit, elle est l’entrée empruntée par
les véhicules ;
– Zone de sortie : en aval de la zone de conflit, elle permet le soulagement de cette
zone.
Pour bien comprendre le fonctionnement d’un carrefour, un certain nombre d’élé-
ments doivent être définis :
4 Chap 1. Généralités

Couloir et tronçon : Un couloir est caractérisé par sa longueur, son nombre de voies
ainsi que par les sens de circulation ; certaines de ces voies peuvent être affectées à un cou-
rant particulier appelées voies spéciales. Les courants de véhicules sont soit directs, soit
des courants de tourne-à-gauche ou tourne-à-droite (voir Figure 1.2). Une voie spéciale
pourrait être affectée à un courant tourne-à-gauche ou tourne-à-droite. Un tronçon d’un
carrefour représente chaque couloir d’entrée et de sortie. Ainsi, il peut contenir plusieurs
voies. Chaque voie écoule un mouvement de véhicules unidirectionnel et donc correspond
à une phase unique. Un tronçon est caractérisé par plusieurs paramètres, entre autres, sa
longueur qui représente la mesure en mètres de la distance séparant la ligne géométrique
où sont implantés les feux associés au tronçon (cette ligne est considérée comme la sortie
du tronçon) et la ligne géométrique en amont considérée comme l’entrée de ce tronçon
(voir Figure 1.3).

1 3
(1,2) Tourne-à-droite
(1,3) Tout droit
2 (1,4) Tourne-à-gauche

F IGURE 1.2 – Courants de flux dans un carrefour élémentaire

Concentration maximale et capacité de stockage d’une voie : La concentration ou


la densité donne le nombre de véhicules présents sur une section de longueur donnée.
La concentration maximale d’une voie est le nombre maximal de véhicules que l’on peut
stocker par mètre linéaire dans la voie. La capacité de stockage d’une voie représente le
nombre maximal de véhicules que l’on peut stocker sur toute sa longueur. En d’autres
termes, la capacité représente la concentration de la voie multipliée par sa longueur. Par
1.2 Description d’un réseau de carrefours 5

F IGURE 1.3 – Ensemble des éléments d’un tronçon

exemple, si la concentration maximale d’une voie est de 0.2 véh/m et, sachant que la
longueur de la voie est de 100m, alors la capacité de cette voie est de 100*0.2=20 véh.

Longueur des files d’attente : Cette variable correspond au nombre de véhicules arrê-
tés derrière la ligne d’arrêt à un feu de circulation. La longueur des files d’attente constitue
l’une des grandeurs majeures de l’évaluation d’une stratégie de régulation.

1.2.2 Caractéristiques des feux d’un carrefour


En raison de l’insécurité qui existe à l’approche des carrefours, notamment ceux des
grandes agglomérations, de nombreux carrefours sont équipés de feux tricolores (ou feux
de signalisation) qui permettent d’empêcher les conflits entre les flux à partir des diffé-
rentes directions.

Petit historique : Le premier feu de signalisation utilisé dans le domaine remonte au


sémaphore à commande manuelle implanté à Londres dès 1868 [3]. Le premier feu de
signalisation électrique aux Etats-Unis a été développé par James Hoge et installé à Cle-
veland, Ohio, en 1914 [4] (voir Figure 1.4).
Ceci a été suivi par l’introduction de feux inter-connectés en 1917 dans la ville de Salt
Lake, Utah [5]. A ce moment, la propriété et l’utilisation de l’automobile étaient en pleine
expansion et l’efficacité du contrôle des feux de signalisation a été reconnue. La circula-
tion automobile croissante dans les rues a conduit au développement et à l’implémentation
des signaux actionnés en 1928 [6].
Depuis, les technologies liées avec la commande des feux de signalisation ont connu
un développement rapide et les feux tricolores sont devenus un élément essentiel des sys-
6 Chap 1. Généralités

F IGURE 1.4 – Le premier feu de signalisation électrique à Cleveland

tèmes de contrôle et de gestion du trafic moderne. Du point de vue de l’application, les


feux de signalisation sont utilisés pour contrôler l’affectation du droit de passage des vé-
hicules ou des piétons aux endroits où des conflits potentiellement dangereux existent.
Un autre avantage des feux tricolores par rapport aux dispositifs passifs (panneaux, mar-
quages) est sa capacité à soutenir la commande adaptative du trafic.

États des feux : Un feu tricolore est un signal lumineux situé à la frontière de chaque
zone de stockage et de la zone de conflit. Il commande le passage libre (feu vert), toléré
(feu orange) ou interdit (feu rouge) du trafic des véhicules. Ces différentes couleurs sont
nommées les états de feux. Le changement de feu d’un état à l’autre est appelé commu-
tation. Pour la sécurité des usagers, le temps de passage par état doit au moins durer une
période minimale, fixée par les exploitants. Contrairement aux durées du feu vert ou du
feu rouge, la durée du feu orange est invariable. Notons que l’implantation des feux de
signalisation doit respecter la géométrie d’un carrefour.
Rappelons quelques concepts essentiels de la signalisation à feux :
1.2 Description d’un réseau de carrefours 7

– Cycle : Les indicateurs des feux - vert, orange, rouge - se succèdent à l’intérieur
d’un cycle, défini comme étant la durée constante séparant deux passages successifs
de l’ensemble des signaux par le même état.
– Phase : Le cycle est partagé en phases, temps pendant lequel un ou plusieurs cou-
rants sont admis dans le carrefour. Une phase est dite spéciale quand elle a pour
seul but de favoriser l’écoulement d’un mouvement tournant. Elle est dite saturée
lorsqu’un véhicule au moins de cette phase est contraint d’attendre plus d’un cycle
pour franchir le carrefour. Le carrefour est lui-même saturé quand au moins une des
ses phases est saturée.
– Vert effectif : On appelle temps de vert effectif, la somme du temps de vert réel et
du temps de l’orange (qui est souvent de 3 à 5 secondes selon la vitesse d’approche
dans le cas d’un carrefour urbain ordinaire).
– Vert utile : On définit le temps de vert utile, en retranchant du temps de vert effectif
le temps perdu (somme des temps perdus au début du vert, c’est-à-dire au démar-
rage, et du temps perdu en fin de phase). Les temps perdus par phase se situent en
moyenne autour de 8 secondes [7].
– Rouge utile : On appelle rouge utile la différence entre la durée du cycle est celle
du vert utile. Pour des raisons de sécurité, à la fin de chaque phase, l’ensemble des
feux du carrefour est maintenu au rouge pendant une certaine durée, appelée rouge
intégral. Dans le cas d’un carrefour simple à 4 branches par exemple, on adopte
une durée de rouge intégral de 2 secondes.

Le plan des feux d’un carrefour signalisé : Considérons l’intersection montrée dans
la Figure 1.1. On constate qu’il y a deux paires de courants en conflit, à savoir la paire de
courants provenant des rues R1 et R2 et la paire de courants provenant des rues R3 et R4 .
En supposant que les mouvements dominants soient les mouvements directs (aller tout
droit) et que les mouvements de tourne-à-gauche soient soumis à la priorité à droite, nous
pouvons découper le cycle en 2 phases, i.e. Phase I et Phase II.
Supposons que les durées des phases I et II soient identiques et que la séquence des
phases soit fixe. Les feux installés aux rues R1 et R2 sont d’abord verts, puis rouges pour
que les feux aux rues R3 et R4 deviennent à leur tour verts ; et ainsi de suite. Les deux
phases se succèdent, constituant un cycle. Le plan des feux pour cette intersection est
illustré dans la Figure 1.5. Pour des raisons de sécurité, l’ensemble des feux de l’intersec-
8 Chap 1. Généralités

tion est maintenu au rouge pendant une certaine durée à la fin de chaque phase, appelée
rouge intégral. Ainsi, l’équation qui décrit le plan des feux dans cet exemple est donnée
par :
Cycle = Vert effectifPhase I + Vert effectifPhase II + 2 × Rouge intégral (1.1)

Notons que le cycle et le rouge intégral sont fixes en général [8]. Par conséquent, la somme
des temps de vert effectifs d’un carrefour dans un cycle reste constante.

F IGURE 1.5 – Exemple de séquence de phases

La stratégie de régulation des feux dépend de l’état du trafic estimé grâce aux mesures
réalisées. Ainsi, la fluidité du trafic est généralement la mission du système de régulation
qui décide de la séquence des phases et de la durée de chaque phase.

1.2.3 Caractéristiques du mouvement du trafic


Un mouvement est défini par son origine et sa destination. Un courant de trafic est
l’ensemble des mouvements de véhicules qui proviennent de la même branche d’accès,
à savoir la même origine (voir Figure 1.2). Selon les similitudes avec la théorie de l’hy-
drodynamique, le courant routier peut être considéré comme un flux de trafic au niveau
d’un tronçon ou d’une route [9]. L’objectif des Théories de flux de trafic est de dé-
crire de façon mathématique précise les interactions entre les véhicules et l’infrastructure.
Les études scientifiques de flux de trafic sont nées dans les années 1930. En particulier,
Adams a appliqué la théorie des probabilités pour décrire le trafic routier [10] ; Bruce
D. Greenshields du Bureau du Trafic Routier de Yale a étudié des modèles de volume et
de la vitesse [11]. A partir des années 1950, des nouvelles études ont été élaborées dans
ce domaine sur la base des approches théoriques diverses, telles que le modèle de suivi
1.2 Description d’un réseau de carrefours 9

du véhicule [12, 13, 14], la théorie de l’onde cinétique (KWT : kinematic Wave Theory)
[15, 16, 17, 18] et la théorie des files d’attente (queuing theory) [19, 20], etc.
Dans cette section, on distingue trois grandeurs principales caractérisant les flux de
trafic dans le réseau de carrefours.

Débit des flux : Il correspond au nombre de véhicules observés en un point donné de


l’infrastructure pendant un intervalle de temps d’observation. En fonction de la méthode
de mesure utilisée, le débit peut être approximé soit en un point, soit sur un tronçon de la
route. Formellement, le débit moyen q(x, t1 , t2 ) au point d’abscisse x entre les instants t1
et t2 est défini par le rapport :

N (x, t1 , t2 )
q(x, t1 , t2 ) = (1.2)
t2 − t1
où N (x, t1 , t2 ) désigne le nombre de véhicules qui passent par le point x entre les instants
t1 et t2 . En particulier, deux débits importants sont considérés :
– Le débit d’entrée d’une voie est le débit de son flux d’entrée. Notons que les flux
d’entrée du milieu extérieur dépendent des activités humaines. Par conséquent, les
débits d’entrée sont évolutifs dans le temps et ils ne sont pas commandable par les
feux de signalisation. L’évolution des débits d’entrée exprime les incertitudes dans
la demande de trafic.
– Le débit de saturation d’une voie est le nombre maximum de véhicules pouvant
sortir de la voie et accéder à l’intersection en aval sans interruption par unité de
temps, le feu étant continuellement au vert. Pour chaque voie, il est exprimé en
unités de véhicules particuliers par heure de feu vert. On adopte souvent les va-
leurs de référence suivantes : s=1820 uvp/h/voie dans une agglomération impor-
tante, s=1650 uvp/h/voie dans une petite agglomération. Ces valeurs peuvent être
ajustées en fonction de divers facteurs liés à la géométrie de l’aménagement du
carrefour et à son environnement (taille de l’agglomération, visibilité,...). Puisque
ces facteurs ne changent pas en général, le débit de saturation est considéré fixe et
connu dans cette thèse.
Pour un carrefour à feux, nous partageons le débit en deux parties ; le débit d’entrée
et le débit de sortie. Notons que, contrairement aux arrivées, les départs sont dépendants
des durées de commutation de l’ensemble des feux d’un carrefour.
10 Chap 1. Généralités

Charge d’un carrefour : La charge Y d’une entrée est définie comme le rapport entre
le débit d’entrée mesuré q et le débit de saturation s. C’est donc le rapport de la demande
sur l’offre :
q
Y = (1.3)
s
Cette définition s’étend à l’ensemble du carrefour. La charge globale du carrefour est la
somme des charges de chacune des phases :
X
Y = yp (1.4)

La somme étant effectuée sur le nombre n de phases. yp représente la charge du courant


prépondérant de chaque phase définie par yp = M ax(yc ), où yc définit la charge des
courants admis simultanément dans le carrefour au cours de la phase. Chaque phase se
caractérise donc par une charge correspondant à celle de son entrée prédominante.

Remarque 1.1 Si le courant directionnel ayant la plus forte charge est commun à 2
phases, on prend la charge immédiatement inférieure. Toutefois, il convient de s’assu-
rer que la somme de la charge immédiatement inférieure et de la charge prédominante
de l’autre phase est supérieure à la charge du courant utilisant les 2 phases. Dans le cas
contraire, c’est cette dernière que l’on utilise. I

1.2.4 Infrastructures de mesure


Il existe de nombreux types de capteurs permettant les mesures directes ou indirectes
des variables de circulation. Les deux principaux types de capteurs que l’on peut rencon-
trer [21, 22] sont :
– Les capteurs enfouis dans la chaussée :
– Boucles électromagnétiques : c’est aujourd’hui le dispositif de mesure des pa-
ramètres du trafic le plus répandu dans le monde, tant en ville que sur les voies
rapides et les autoroutes urbaines. Il permet de mesurer les débits, le taux d’oc-
cupation, la vitesse et l’écart de temps inter-véhiculaire. Le capteur est constitué
d’une boucle inductive, noyée dans le revêtement de la chaussée. Le passage de
la masse métallique d’un véhicule au-dessus de la boucle provoque une variation
du champ électromagnétique. Cette variation se traduit par un créneau de tension
dont la longueur est liée à celle du véhicule et du capteur et au temps de passage.
– Les détecteurs latéraux :
1.3 Régulation des feux de signalisation 11

– Capteurs à ultrasons et à effet Doppler : ce capteur est constitué d’une an-


tenne fixée sur un portique, lequel est positionné dans l’axe de la voie de circula-
tion. Cette antenne émet constamment des ondes qui se propagent à une vitesse
connue. Lors du passage d’un véhicule, l’onde émise rencontre un obstacle et est
réfléchie. A partir de la différence entre les fréquences de l’onde émise et de celle
reçue, la vitesse du véhicule peut être estimée.
– Capteurs optiques (vidéo) : le principe de ces capteurs consiste à utiliser une
caméra vidéo et à traiter de manière automatique les images fournies par cette
caméra afin de déduire les paramètres du trafic [23, 24].

1.3 Régulation des feux de signalisation

1.3.1 Boucle de régulation d’un réseau de carrefours


Le système de feux de signalisation associé à un réseau de carrefours urbains est
généralement un système complexe qui ne se limite pas aux signalisations verticales et
horizontales visibles par les conducteurs. En effet, des instruments de mesure, des postes
de contrôle, des liaisons filaires ou GPRS, etc., sont souvent requis pour assurer le fonc-
tionnement de la régulation. Si nous limitons notre étude à une intersection isolée, nous
pouvons au moins identifier trois éléments qui composent le système de feux de signali-
sation (voir figure 1.6). L’intégration de ces trois éléments à une intersection constitue la
boucle de régulation du trafic à son niveau. Ces éléments sont :
– Les dispositifs de signalisation : Il s’agit de l’ensemble des signaux verticaux
et horizontaux transmis aux conducteurs pour assurer la sécurité de passage des
véhicules. Ils visent à éviter la rencontre de mouvements conflictuels. Par la suite,
nous limiterons notre étude aux feux tricolores ;
– Les infrastructures de mesure : Elles reflètent l’état du trafic à travers ses diffé-
rentes grandeurs. Ces grandeurs sont mesurées par des capteurs installés au niveau
de l’infrastructure ;
– Le régulateur : Il est le cerveau de la boucle de régulation. Il précise en temps réel
les stratégies de régulation, en fonction des données issues de l’infrastructure de
mesure, afin d’atteindre des objectifs bien précis, comme par exemple minimiser la
longueur des files d’attente, le temps d’attente des véhicules, etc.
12 Chap 1. Généralités

Boucles électromagnétiques, ...


Infrastructure
de mesure État du trafic

Régulateur

Plan de feux

Dispositifs de
signalisation Couleur des feux
Feux tricolores, Panneaux de
signalisation, ...

F IGURE 1.6 – Boucle de régulation d’une intersection isolée

1.3.2 Modes de régulation d’un réseau de carrefours


La régulation du réseau de carrefours par les feux de signalisation peut fonctionner
sous divers modes. Outre le contrôle manuel, on distingue généralement le contrôle au-
tomatique, le contrôle adaptatif et le contrôle coordonné. Ces modes ne sont pas toujours
distincts et peuvent se combiner à plusieurs titres, voir se substituer l’un à l’autre.

Mode manuel : dans ce cas, c’est un individu qui actionne le changement d’état du
carrefour. C’était le cas des premiers feux de circulation, mais aujourd’hui encore, les
feux peuvent fonctionner en mode manuel si la situation l’exige, ou également en mode
semi-manuel (ou semi-automatique).
1.3 Régulation des feux de signalisation 13

Mode automatique : ce mode n’exige aucune intervention extérieure ; les états succes-
sifs d’un cycle se déroulent séquentiellement suivant les plans de feux en place dans le
contrôleur. On parle aussi de fonctionnement en cycles fixes.

Mode adaptatif : contrairement au mode automatique, ce mode permet l’adaptation de


la durée des intervalles des feux verts, et par conséquent la modulation de l’ensemble
des phases d’un cycle en fonction des variations du trafic. Ainsi, un feu vert peut être
allongé pour écouler le flux d’une voie où s’écoule un trafic plus important que dans les
voies adjacentes. Un autre exemple d’adaptation est la priorité donnée aux véhicules de
transport public : leur arrivée dans un carrefour déclenche soit l’allongement de l’état du
feu vert, soit la réduction de l’intervalle du feu rouge sur la voie qu’ils empruntent.

Mode coordonné : ce mode signifie que plusieurs contrôleurs, donc plusieurs carre-
fours, sont soumis à une même stratégie de régulation. Il existe deux grandes applications
du mode coordonné. La première est la régulation d’axes de circulation. Elle consiste à
coordonner les phases des différents carrefours d’un même axe routier afin de rendre plus
confortable et plus fluide la progression des véhicules, c’est-à-dire, d’éliminer leurs arrêts
aux carrefours (du moins s’ils respectent une vitesse moyenne, définie par le gestionnaire
des feux). La seconde application de la coordination est la régulation des zones. Dans ce
cas, ce sont les feux de l’ensemble d’un périmètre géographique déterminé (un quartier
urbain par exemple) qui sont coordonnés entre eux, afin d’optimiser les déplacements des
usagers, c’est-à-dire, de minimiser le temps qu’ils passent dans cette zone.
Les deux derniers modes (adaptatif, coordonné) évoqués soulèvent chacun des com-
plexités techniques que ne posent pas les deux premiers. Ces modes exigent de disposer
de moyens de détection des variations du trafic, c’est-à-dire de recueillir des informations
caractérisant la circulation en temps réel. D’où la nécessité d’utiliser des capteurs auto-
matiques. Il en existe de différentes sortes : pneumatiques, hydrauliques, acoustiques, à
boucles électromagnétiques, à ultrasons, à infrarouges, radars, caméras, etc... Ces capteurs
sont placés à une certaine distance du carrefour concerné, reliés par câble ou par ondes
au contrôleur qui reçoit et interprète l’information codée par le détecteur (un élément
électronique qui transforme l’information issue du capteur en signal électrique).
Notons également que les modes adaptatifs et coordonnés, ainsi que leur combinaison,
se trouvent aujourd’hui gérés à distance à partir d’un poste de contrôle. Cette télé-gestion
14 Chap 1. Généralités

repose évidemment sur des transmissions d’informations entre les feux et le poste de
contrôle. Les modes manuel et automatique entrent dans le cadre des systèmes de com-
mande en boucle ouverte. Ce sont des systèmes qui s’appuient sur des bases de données
prédéfinies. Dans ces conditions, le système marche sans prendre en considération les
problèmes brusques : la forte congestion, les incidents, etc. L’utilisation de ces systèmes
est désormais impossible pour répondre à la demande actuelle. Donc il est nécessaire
d’adopter des approches qui nous permettent d’en savoir plus sur l’état en temps réel et
qui agissent directement pour fluidifier le trafic. D’où l’utilisation actuelle dans les re-
cherches récentes des systèmes en boucle fermée dont nous pouvons inclure les modes
adaptatifs et coordonnés.

1.3.3 Stratégies de régulation d’un réseau de carrefours


La régulation des feux de signalisation dans un réseau de carrefours concerne en gé-
néral deux objectifs distincts : la fluidification ou la résorption de la congestion. Dans le
premier cas, on évite de se retrouver dans une situation de trafic très dense en essayant
d’ajuster les durées de commutation des feux en fonction de la demande d’affluence aux
carrefours : c’est une action a priori. Dans le second cas, on est confronté à un trafic
saturé (état de congestion). Dans ce cas, il faudra agir a posteriori. Notons qu’une stra-
tégie de régulation au niveau d’un réseau est appelée stratégie globale. Elle permet la
régulation des feux de tous les carrefours. Dans le cas d’un carrefour congestionné sur le
réseau étendu englobant ainsi plusieurs carrefours, une stratégie locale ne saurait résorber
cette forte densité de trafic. En effet, pour répondre au phénomène d’accumulation de vé-
hicules, une stratégie globale permettant la régulation simultanée de plusieurs carrefours
interdépendants pourrait atténuer ce phénomène.
La littérature concernant la régulation du trafic dans un réseau de carrefours est abon-
dante. Bien qu’une quelconque classification soit toujours partiellement arbitraire, il nous
semble qu’une des classifications consiste à séparer les travaux existants en deux catégo-
ries principales.
Une première catégorie de travaux est communément désignée sous le nom de straté-
gie fixe ou pré-déterminée. Dans ce type de stratégie, tous les paramètres sont déterminés
et réglés à partir de données recueillies avant l’installation. Le principal inconvénient de
la stratégie fixe est qu’elle n’est pas capable de tenir compte de la demande du trafic en
1.3 Régulation des feux de signalisation 15

temps réel et nécessite une remise à jour régulière des plans de feux pour tenir compte de
l’évolution du trafic moyen.
Une deuxième catégorie de travaux est communément désignée sous le nom de stra-
tégie adaptative ou temps réel. Cette stratégie est plus coûteuse, parce qu’elle néces-
site l’installation, l’exploitation et la maintenance d’un système de contrôle en temps réel
(capteurs, communications, salle de contrôle centrale, contrôleurs locaux). Grâce au déve-
loppement des techniques liées, la stratégie adaptative, si bien conçue, est potentiellement
plus efficace.
Dans la suite de ce chapitre, certaines stratégies populaires des deux catégories sont
présentées.

1.3.3.1 Stratégies fixes

Dans ce mode de régulation, tous les paramètres sont déterminés et réglés à partir de
données recueillies avant l’installation. Le rôle principal des plans de feux fixes est de
mettre en marche cycliquement une série de phases pendant des durées données. Cette
série de phases doit permettre de mieux répondre à la demande moyenne de la capacité
estimée du carrefour. Pour calculer le plan de feux, il est nécessaire de définir la notion
de phasage. Cette notion est définie comme étant l’ensemble des phases utilisées pour la
commande de l’intersection. Une fois le phasage est déterminé, le calcul du plan des feux
consiste en la détermination des trois paramètres suivants :
– la durée du cycle ;
– la répartition des verts : la durée du vert attribuée à chaque feu au cours du cycle ;
– les décalages entre les débuts des cycles dans le cas de plusieurs carrefours à coor-
donner.
Les commutations des feux de signalisation sont constantes d’un cycle à un autre. Ainsi,
on retrouve à chaque cycle la même longueur et la même durée des phases. Nous trouvons
dans ce mode de régulation les systèmes à base de plans de feux fixes.
Il est à noter que les plans de feux fixes ne sont pas fixés pour toutes les périodes
d’une journée ou pour tous les jours. Un choix doit être effectué entre les différents plans
disponibles au poste de commande selon la situation du trafic. Un opérateur peut réa-
liser ce choix manuellement ; c’est généralement le cas lorsqu’il détecte un événement
exceptionnel nécessitant une gestion adaptée du réseau.
16 Chap 1. Généralités

Nous présentons dans ce qui suit les systèmes de type fixe les plus utilisés dans les
grandes villes mondiales :

Méthode de Webster : A partir d’analyses en simulation et de campagnes de mesures


sur le terrain, [25] a donné le temps perdu moyen des véhicules dans la voie i pendant
leur traversée du carrefour sous la forme suivante :

c(1 − gci )2 (yi gci )2 c 1/3 c 2+5 gi


Ri = + c − 0.65( 2 ) (yi ) (1.5)
c
2(1 − yi ) 2qi (1 − yi gi ) qi gi

où c est la durée du cycle, gi , yi et qi sont le temps vert, la charge et le débit d’arrivée de la


voie i respectivement. De cette expression, Webster déduit alors la durée du cycle comme
suit :
1.5Tp + 5
c= (1.6)
1−Y
où Tp est la somme des temps perdus entre les phases, Y est la charge globale du carrefour.
Cette formule reste la formule de référence jusqu’à aujourd’hui. Elle est communément
nommée durée de cycle optimale.

MAXBAND : En combinant la méthode de Webster et une formule proposée par Mor-


gan [26] et Little [27] pour maximiser la bande passante, Little dans [1] a publié une stra-
tégie nommée MAXBAND. Elle considère une artère à deux voies avec n intersections et
spécifie les décalages afin de maximiser le nombre de véhicules qui peuvent voyager avec
une vitesse donnée sans s’arrêter [28, 29, 30]. L’inconvénient majeur de MAXBAND est
que cette stratégie ne s’applique qu’aux situations sous-saturées.

TRANSYT : C’est l’un des logiciels les plus connus et utilisés qui permettent de pré-
parer les plans de feux fixes. Initialement développé par Transport Research Laboratory
[31], TRANSYT est un programme qui permet de fournir un plan optimal du point de vue
des durées des feux verts et de leurs décalages. Il sert souvent de stratégie de référence
pour évaluer la qualité de la commande des feux dans un réseau urbain. Durant la der-
nière décennie, TRANSYT a été substantiellement étendu et amélioré en de nombreuses
versions. En particulier, TRANSYT-7F développé et maintenu par l’University of Florida
est l’une des versions les plus importantes, qui s’appelle aussi la version des États-Unis
[32].
1.3 Régulation des feux de signalisation 17

F IGURE 1.7 – Bande passante maximale d’une artère [1]

TRANSYT utilise un modèle déterministe de trafic tenant compte du phénomène de


dispersion des pelotons de véhicules, et minimise un critère qui est fonction du temps
moyen perdu des véhicules et du nombre moyen d’arrêt (TRANSYT-7F utilise un algo-
rithme génétique) [33].

1.3.3.2 Stratégies adaptatives

Dans ce mode de régulation, la recherche actuelle s’est orientée vers la réalisation des
systèmes de régulation qui tiennent compte de l’évolution du trafic au cours du temps et
qui réagissent en temps réel. Selon [34], un système de contrôle en temps réel du trafic
doit répondre aux exigences suivantes :
– la stratégie doit répondre réellement à la demande actuelle et non pas à une demande
prédite ou historique.
– la stratégie ne doit pas être réduite à intervenir sur des périodes de contrôle fixées
arbitrairement.
Cette analyse est rendue possible grâce aux différents capteurs mis en place : des boucles
noyées dans la chaussée, radar etc. La mise en service d’une régulation aux feux d’un
réseau répond le plus souvent aux objectifs suivants : rendre crédible la signalisation
tricolore, assurer le confort de l’usager en minimisant son temps d’attente, diminuer le
nombre d’arrêts de véhicules et surtout minimiser la longueur des files d’attente.
18 Chap 1. Généralités

Du fait de la nécessité de coordination des différents carrefours, la commande en


temps réel d’un réseau d’intersections est un problème bien complexe. Les premiers sys-
tèmes de commande en boucle fermée d’un réseau sont apparus au début des années 60
et sont directement dérivés des méthodes fixes. Dans ces systèmes, une bibliothèque de
plans de feux est calculée hors ligne et appliquée ensuite, non plus sur la base de la période
de la journée, mais en fonction des débits et taux d’occupation mesurés par des capteurs.
Leur problème majeur est lié au vieillissement des plans. Ils doivent remettre à jour la
bibliothèque de manière à contenir des plans correspondants au mieux aux conditions
réelles.
Plus tard, on a vu ensuite apparaître une seconde génération de systèmes de commande
qui cherchent à recalculer, en ligne et à partir des informations collectées sur le réseau,
tous les paramètres des feux de signalisation. C’est dans cet esprit que plusieurs types de
systèmes ont été élaborés pour ce mode de régulation. Les plus connus sont :

SCATS : Sydney Coordinated Adaptative Traffic system : Ce système a été déve-


loppé dans les années 70s [35]. Il est mis en place dans plusieurs villes en Australie. En
1995, plus de 2500 carrefours de Sydney étaient commandés par SCATS. Le rôle essentiel
de ce système est la reconstitution en temps réel des plans de feux fixes disponibles dans
une base de données. Il comporte une architecture hiérarchisée en trois niveaux :
– Les contrôleurs de carrefours ont pour objectif de mettre en forme les signaux issus
des boucles électromagnétiques placées en ligne de feu pour les communiquer à
l’ordinateur régional dont ils dépendent.
– Les postes régionaux sont chargés de recalculer périodiquement, à partir des me-
sures transmises par les contrôleurs de carrefours, le plan de feux à appliquer.
– Le poste central de surveillance a pour but la visualisation en temps réel de l’état
du système ainsi que des éventuels problèmes détectés.
L’inconvénient majeur est que SCATS utilise des algorithmes de choix de stratégies
parmi une série de plans pré-calculés et non une procédure réelle d’optimisation de la
commande basée sur l’emploi d’un modèle de trafic.

SCOOT : Split Cycle and Offset Optimisation Technique : Ce système a été déve-
loppé en 1981 par le Traffic and Road Research Laboratory TRRL en Grande Bretagne.
1.3 Régulation des feux de signalisation 19

Ce système se base initialement sur un plan de feux fixes issu du système TRANSYT
avec un algorithme d’optimisation fourni pour l’application en ligne [36, 37, 38].
Le principe général de SCOOT est d’ajuster par petits incréments successifs les para-
mètres des plans de feux de manière à répondre au mieux à la situation de trafic actuelle.
Le réseau de carrefours commandé par SCOOT est subdivisé en plusieurs zones. Les
carrefours d’une même zone opèrent avec la même durée de cycle. Cette méthode ne né-
cessite qu’un capteur par voie pour mesurer le débit et l’occupation de la boucle. A partir
de l’enregistrement du profil de la demande, et grâce au modèle de TRANSYT, SCOOT
prédit l’évolution de la longueur de file d’attente. Un critère est alors créé pour l’optimi-
sation à partir de la somme des valeurs moyennes des files d’attente ainsi que le nombre
total d’arrêts de la région régulée.
L’optimisation de SCOOT considère trois types de réglages :
– Répartition des temps verts : Au niveau de chaque carrefour, cette méthode dé-
cide, peu avant le changement de phase, si la durée de ce changement doit être
maintenue, avancée ou reculée, afin de minimiser le degré de saturation des tron-
çons entrants.
– Décalages : Une fois par cycle et pour chaque carrefour, les décalages entre car-
refours sont légèrement modifiés pour améliorer la somme des performances des
carrefours adjacents.
– Durée de cycle : Périodiquement et pour certains cycles, SCOOT modifie la durée
du cycle de quelques secondes, afin que le degré de saturation du chaînon le plus
chargé se rapproche de 90%.
SCOOT conduit à une réduction de 12% du temps moyen perdu par rapport à une
méthode basée sur des changements de plans de feux fixes [39]. Cependant, à cause du
manque de coordination entre les différentes zones gérées par SCOOT, il s’avère souvent
difficile de partager un réseau en différentes zones. De plus, les performances de SCOOT
se détériorent en situations saturées.

OPAC : Optimization Policies for Adaptative Control : OPAC a été développé par
[40]. Il s’agit d’une stratégie de commande des feux en temps réel adaptée à la demande
en utilisant l’optimisation par la programmation dynamique (DP). OPAC utilise un niveau
de contrôle locale pour minimiser le délai total de chaque intersection et ensuite une
synchronisation pour le réseau global [41].
20 Chap 1. Généralités

Bien qu’OPAC fonctionne acycliquement dans le niveau local, il utilise des cycles
virtuels pour maintenir la synchronisation du réseau au niveau global. La longueur du
cycle virtuel varie selon les besoins d’une intersection ou d’une majorité des intersections.
Il faut noter qu’OPAC souffre d’une exigence informatique énorme. La mise en œuvre
en temps réel de la stratégie OPAC est toujours limitée aux intersections isolées en raison
de la complexité de calcul pour un réseau.

Régulation "stocker-et-transférer" : Le principe "stocker-et-transférer" ("store and


forward" en anglais) a été initialement proposé par Gazis et Potts [42, 43] en 1963. Ré-
cemment, ce principe est apparu séduisant car il permet de réguler un réseau d’inter-
sections à l’échelle d’une ville. L’idée principale est d’introduire une simplification du
modèle qui permet la description mathématique du processus de flux de trafic sans l’utili-
sation de variables discrètes. Cette dernière est d’une importance capitale, car elle ouvre
la voie à l’application des méthodes d’optimisation et de contrôle très efficaces (tels que
la programmation linéaire, la programmation quadratique, etc) avec une complexité po-
lynomiale, ce qui, à son tour, permet la régulation coordonnée du réseau à grande échelle
en temps réel, même dans les situations saturées.
Selon le fonctionnement réel des flux de trafic et des feux de signalisation, le flux
quittant une voie est positif seulement si cette voie a le feu vert, ce qui signifie que le
flux présente des interruptions dans un cycle. Le modèle "stocker-et-transférer" ignore
ces interruptions et considère le flux comme un processus continu (voir Figure 1.8). Ceci
revient théoriquement à supposer que :
g
η= s (1.7)
c
où s est le débit de saturation, g est le temps vert, c est le cycle, η est le débit moyen. Les
conséquences de la simplification sont [44] :
– la discrétisation temporelle ne peut pas être inférieure à la durée d’un cycle, ce qui
limite l’observation de phénomènes locaux ;
– les oscillations des files d’attente en fonction des changements de phases ne peuvent
pas être décrites dans ce modèle ;
– la régulation dans cette approche ne peut pas contrôler les décalages entre carrefours
adjacents.
Grâce à cette simplification, quelques stratégies ont été développées ces dernières
années [45, 46, 47, 48, 49, 50, 51, 52]. En particulier, TUC (Traffic-responsive Urban
1.4 Conclusion et objectif de la thèse 21

Débit

Flux réel

Flux moyen

F IGURE 1.8 – Simplification du modèle "stocker-et-transférer"

Control), initialement développé pour le projet TABASCO d’European Telematics Ap-


plications [8], a été appliqué en Angleterre, en Grèce et en Allemagne [53] donnant des
résultats satisfaisants quand le trafic est fluide.

1.4 Conclusion et objectif de la thèse


Compte tenu de la complexité de l’implémentation des systèmes de régulation du
trafic, il n’existe pas de méthode parfaite pour contrôler le flux dans une intersection
routière. L’adéquation d’une méthode est très liée aux conditions du trafic (fluide, dense
et saturé, etc...). Les recherches qui ont été menées sur la régulation du trafic ont permis
de développer plusieurs stratégies de régulation. Toutefois, la plupart d’entre elles sont
destinées, de manière exclusive, aux méthodes d’optimisation en ligne pour minimiser
un critère formulé à partir d’un comportement idéal souhaité. La minimisation du critère
permet de déterminer la commande à appliquer pour mieux réaliser les objectifs de la
commande. Cependant, et indépendamment d’une quelconque comparaison, ces travaux
souffrent de trois inconvénients majeurs suivants :
– La faisabilité en temps réel de la commande.
– La robustesse vis-à-vis des perturbations qui sont inhérentes aux systèmes de trans-
port.
– La non prise en compte des changements brusques des flux.
Ce constat milite donc pour une résolution des problèmes de régulation des carrefours,
faisant d’avantage appel à des méthodes nouvelles.
22 Chap 1. Généralités

Objectifs de la thèse : Dans le cadre de notre travail, nous adoptons une stratégie diffé-
rente pour résoudre le problème de la modélisation et la régulation du trafic urbain par les
feux de signalisation. De point de vue de la modélisation, nous introduisons un nouveau
regard sur les systèmes de transport en proposant un premier travail sur la manière dont
les liens se tissent entre ces systèmes et la thermodynamique. Le point de vue dominant
est la considération des véhicules comme étant l’énergie fournie ou/et échangée entre les
intersections signalisées. Contrairement aux approches existantes, le modèle développé
se base sur la notion d’énergie au lieu du débit.
De point de vue de la régulation, nous nous intéressons essentiellement à un travail
en amont permettant d’éviter la congestion en forçant les files d’attente à ne pas dépasser
le niveau de trafic correspondant à l’optimum opérationnel des lignes. Pour ce faire, deux
approches sont utilisées, la théorie des systèmes dissipatifs et la synthèse H∞ .
L’idée qui a guidé notre choix a été d’appliquer des techniques et des formulations qui
ont prouvé une efficacité certaine dans des applications industrielles. Elles mettent en jeu
des grandeurs et des caractéristiques concrètes qui s’interprètent clairement comme une
interconnexion entre le système et son environnement. En outre, elles se conforment le
plus aux objectifs fixés pour notre investigation, à savoir, l’obtention de commandes pour
la régulation du réseau des carrefours permettant :
– la faisabilité en temps réel ;
– une flexibilité dans son utilisation ;
– une prise en compte des perturbations instantanées affectant le système.
CHAPITRE 2

MODÉLISATION
THERMODYNAMIQUE DES
RÉSEAUX DE TRANSPORT

2.1 Introduction
La complexité sans cesse croissante des systèmes de grande dimension, tels que les
réseaux de transport, a engendré un besoin grandissant d’outils et de méthodes pour la
modélisation et l’évaluation des performances de tels systèmes. Cette situation a motivé
de nombreux chercheurs à développer différentes techniques pour la modélisation des
systèmes de transport en fonction de la complexité du problème.
Les approches largement utilisées dans la modélisation des systèmes de transport sont
la théorie de files d’attente, l’approche de la mécanique des fluides, les automates cellu-
laires, les réseaux de Petri etc. Ces méthodes ont été mises au point au cours des dernières
décennies et ont été appliquées dans de nombreuses stratégies de contrôle de la signali-
sation routière. Cependant, bien que ces approches soient efficaces pour la modélisation
du trafic, elles sont souvent confrontées à la complexité du modèle obtenu. En effet, si le
réseau routier étudié est de grande taille, l’utilisation de ces méthodes devient rapidement
problématique et très coûteuse en terme de temps de calcul.
24 Chap 2. Modélisation thermodynamique des réseaux de transport

Dans ce chapitre, nous proposons une nouvelle approche pour la modélisation d’un
réseau de transport signalisé, qui, à notre connaissance, n’a pas encore été explorée. Nous
nous intéressons tout particulièrement au lien existant entre les systèmes de transport et les
systèmes thermodynamiques. En effet, en considérant les véhicules comme étant l’énergie
fournie au réseau de transport, nous pouvons considérer le réseau d’intersections comme
étant un système thermodynamique où il y a des échanges ou transferts de l’énergie (vé-
hicules) entre les sous-systèmes (intersections signalisées) qui transitent entre différents
états : stable (non congestionné), instable (congestionné) et en équilibre (fluide). Nous
pouvons ainsi, comme dans le cas thermodynamique, produire une régulation de la circu-
lation à partir d’énergie sous forme d’information (travail).
L’étude basée sur des concepts thermodynamiques permet d’ouvrir une nouvelle pers-
pective sur la dynamique et la gestion de flux de véhicules. En effet, l’approche énergé-
tique permet d’une part de modéliser les interactions entre différentes intersections rou-
tières et d’autre part, d’analyser l’énergie interne (véhicules) du système qui est l’un des
facteurs qui détermine l’état du trafic. De plus, elle permet d’étudier le problème de la
gestion dynamique basée sur un modèle de trafic qui a fait ses preuves en thermodyna-
mique.
Ce chapitre est organisé de la manière suivante : la première partie présente une brève
introduction aux systèmes thermodynamiques. La deuxième partie porte sur le lien étroit
qui existe entre les systèmes de transport et les systèmes thermodynamiques. Nous mon-
trons dans un premier temps, que certains concepts thermodynamiques tels que la tem-
pérature, la capacité thermique, l’équilibre thermique, trouvent leurs similitudes dans le
cadre des systèmes de transport. Ensuite, nous présentons la notion d’entropie du réseau
de transport qui sert à mesurer le degré de désordre d’un système. Ce concept d’entro-
pie représente le visage thermodynamique de notre système et prend source et forme à
partir de l’énergie (véhicules) échangée ou transférée entre les sous-systèmes. Avec cette
fonction, nous pouvons définir le sens de l’évolution du trafic. En effet, plus l’entropie
est grande plus le système est désordonné. Elle peut donc être considérée non seulement
comme un très bon moyen d’évaluer les performances du réseau de transport mais aussi,
comme une source d’information pour remettre de l’ordre dans le système.
2.2 Quelques notions sur les systèmes thermodynamiques 25

2.2 Quelques notions sur les systèmes thermodynamiques


La thermodynamique est une branche de la physique qui étudie la science des échanges
d’énergie entre les systèmes, ou entre les systèmes et le milieu extérieur, lors de transfor-
mations de la matière. Ses applications sont nombreuses car l’énergie est un concept qui
s’applique dans tous les domaines. On l’utilise autant en physique qu’en chimie ou en
biologie, en s’appuyant notamment sur des outils mathématiques. Elle nous permet de
comprendre et de prévoir les variations d’énergie entre différents systèmes en interaction
grâce à des principes fondamentaux. Pour mieux utiliser les principes thermodynamiques
dans le contexte du transport, cette section est consacrée à l’introduction de quelques
notions thermodynamiques importantes.

2.2.1 Le système, la chaleur et la température


La résolution de tout problème thermodynamique commencera par la définition pré-
cise du système à étudier. Ceci nécessite de définir une frontière qui partage l’univers en
deux : le système d’une part, et le milieu extérieur (ou environnement) d’autre part. Par
conséquent, un système thermodynamique est défini comme un corps ou un ensemble
de corps délimité par une frontière matérielle ou fictive qui le sépare du milieu extérieur.
Les échanges d’énergie se font au travers cette frontière (surface délimitant le système).
Le système thermodynamique est la portion de l’univers qu’on choisit d’étudier, il peut
s’agir de n’importe quel objet, n’importe quel espace. Par exemple, imaginez une casse-
role sur le feu. Cette casserole, correspondant à notre système, reçoit de l’énergie de l’air
au-dessus de la bougie, donc sa température à l’intérieur augmente. Nous pouvons étudier
la variation de température de cette casserole, ainsi que la variation de pression, de quan-
tité de matière, de volume, d’entropie, etc., au cours du temps. Ces données mesurables
sont appelées "variables d’état", elles définissent l’état du système.
De plus, en thermodynamique nous pouvons également étudier l’interaction entre
deux systèmes ou plus. Par exemple, si deux enceintes sont accolées l’une à l’autre, de
différentes températures à un instant, et que le transfert de chaleur est possible, alors au
cours du temps, ces deux enceintes vont progressivement faire en sorte d’avoir la même
température.
On appelle transformation la succession temporelle d’états qu’un système parcourt
entre un état initial et un état final. Lors d’une transformation, l’état du système considéré
26 Chap 2. Modélisation thermodynamique des réseaux de transport

évolue car des échanges ont lieu, dans ce système s’il est composite et/ou entre ce système
et le milieu extérieur. L’énergie qui s’échange au cours de la transformation des systèmes
peut être sous deux formes :
1. l’énergie calorifique qui fait intervenir la chaleur ;
2. l’énergie mécanique qui prise au sens large, incluant toutes les autres formes d’éner-
gie connues, notamment le travail mécanique.
Dans ce chapitre, nous nous intéressons plus particulièrement à la chaleur. Générale-
ment, l’échange de chaleur est la conséquence d’une différence de température (des corps
chauds vers les corps froids). Les notions de chaleur et de température sont les plus fon-
damentales de la thermodynamique. En effet, on peut définir la thermodynamique comme
la science de tous les phénomènes qui dépendent de la température et de ses changements.

Chaleur et température
La définition précise de la température est difficile. Chacun a une connaissance in-
tuitive de la notion de température. Un corps est chaud ou froid, selon que sa température
est plus ou moins élevée. En effet, il existe plusieurs échelles de température : les de-
grés Celsius (°C), les degrés Fahrenheit (°F), etc. Si on prend le 0 °C, cette valeur ne fait
qu’indiquer le passage de l’eau de l’état liquide à l’état solide (c’est-à-dire que de l’eau
liquide va se transformer en glace). L’un des grands succès de la thermodynamique clas-
sique au dix neuvième siècle, est d’avoir donné une définition de la température absolue
d’un corps, qui a mené à la création de l’échelle kelvin. Celle-ci donne la température
minimale pour tous les corps : zéro kelvin, soit -273,15 °C. Il s’agit du zéro absolu, dont
le concept apparaît pour la première fois en 1702 avec le physicien français Guillaume
Amontons.
De l’autre côté, la chaleur est un transfert d’énergie qui ne découle pas du déplace-
ment du point d’application d’une force. Généralement, on considère que la chaleur est
également une énergie, ou précisément une forme d’énergie qu’on appelle alors "énergie
thermique". Un corps n’a pas une quantité de chaleur déterminée (contrairement à la tem-
pérature). Il perd ou gagne de la chaleur en fonction des corps avec lesquels il entre en
contact et en fonction du type d’expérience menée (on dira plutôt "transformation").
En général, si un système gagne de la chaleur du milieu extérieur, sa température aug-
mente, et la quantité de chaleur absorbée est proportionnelle à la variation de température,
2.2 Quelques notions sur les systèmes thermodynamiques 27

i.e.
∆T = E ∗ × Q

où ∆T est l’augmentation de température, Q est la quantité de chaleur que le système


gagne, et le coefficient E ∗ s’appelle la capacité thermique qui dépend de la nature du
système.

2.2.2 Premier principe de la thermodynamique


Les transformations réelles sont généralement complexes, mais elles doivent respecter
quelque principes. En particulier, le premier principe de la thermodynamique, qui a été
énoncé pour la première fois par le médecin et physicien allemand Robert Von Mayer en
1845, traduit la conservation de l’énergie. Ce principe postule qu’il existe une fonction
des variables d’état, appelée énergie totale, qui est toujours conservée : sa variation est
égale à l’énergie reçue par le système du milieu extérieur, sous forme de travail et de
chaleur.
Plus précisément, pour tout système thermodynamique, on peut définir une fonction
U , appelée énergie interne définie à une constante près. Lors d’une transformation quel-
conque, la variation de l’énergie d’un système peut s’exprimer selon la relation suivante :

∆U = W + Q

où W est la partie de l’énergie qui correspond au travail échangé avec le milieu extérieur
et Q est la quantité d’énergie transférée par chaleur. En clair, pour que l’énergie d’un
système varie, il faut qu’il y ait un échange d’énergie entre celui-ci et le milieu extérieur.
Si le système ne fournit aucun travail avec le milieu extérieur, le premier principe peut
s’écrire :
∆U = Q

Le premier principe de la thermodynamique est aussi une loi générale pour toutes
les théories physiques (mécanique, électromagnétisme, physique nucléaire,...) On ne lui
a jamais trouvé la moindre exception, bien qu’il y ait eu des doutes parfois, notamment à
propos des désintégrations radioactives.
28 Chap 2. Modélisation thermodynamique des réseaux de transport

2.2.3 Deuxième principe : notions d’entropie et disentropie


Le premier principe indique que l’énergie totale est toujours conservée, elle ne peut
pas être créée ou détruite. Pourtant, ce principe ne précise en rien la possibilité et la di-
rection de la transformation de l’énergie. Le premier principe de la thermodynamique est
insuffisant pour décrire les transformations réelles. Il est nécessaire de prendre en compte
le sens de l’évolution et les irréversibilités. Par exemple, dans la réalité, la transmission
de chaleur entre les corps se fait toujours du corps chaud vers le corps froid. La transfor-
mation inverse est impossible sans l’apport d’énergie.
Le deuxième principe de la thermodynamique (également connu sous le nom de la
deuxième loi de la thermodynamique ou principe de Carnot) établit l’irréversibilité des
phénomènes physiques, en particulier lors des échanges thermiques. C’est un principe
d’évolution qui fut annoncé pour la première fois par Sadi Carnot en 1824. Il a depuis fait
l’objet de nombreuses généralisations et formulations successives.
En particulier, en 1865, Rudolf Clausius introduisit l’entropie dans le cadre du deuxième
principe de la thermodynamique. Etymologiquement parlant, l’entropie est synonyme de
transformation (du grec "entropê" signifiant "cause d’évolution" ou "action de se retour-
ner"). L’entropie d’un système est une fonction d’état. Elle peut être interprétée comme
la mesure du degré de désordre d’un système au niveau microscopique. Le deuxième
principe déclare que toute transformation d’un système thermodynamique s’effectue avec
augmentation de l’entropie globale incluant l’entropie du système et du milieu extérieur.
On dit alors qu’il y a création d’entropie. Il est associé à l’impossibilité du passage du
désordre à l’ordre sans intervention extérieure.
Soit ψ l’entropie d’un système thermodynamique. Sa variation, lors d’une transforma-
tion quelconque, peut être décrite comme la somme d’un terme d’échange et d’un terme
de création :
dψ = ψéchange + ψcréation

où ψéchange correspond à l’entropie échangée par le système avec le milieu extérieur, et


ψcréation est l’entropie que le système lui-même crée lors de la transformation. Clausius
a montré que Z
dQ
ψéchange =
Ta
où dQ est la quantité de chaleur que le système gagne à un point de la frontière entre
le système et le milieu extérieur, et T a est la température absolue à ce point. D’un autre
2.3 Sur la représentation mathématique des systèmes thermodynamiques 29

côté, l’entropie de création, toujours positif ou nul, impose le sens de l’évolution de la


transformation
ψcréation ≥ 0

Donc, on a Z
dQ
dψ ≥ (2.1)
Ta
L’expression ainsi obtenue a été formulée par Clausius. On l’appelle encore inégalité de
Clausius. C’est une autre façon d’exprimer le second principe.
Une autre notion, directement liée à l’entropie, est son contraire la disentropie (en-
tropie négative ou force de cohésion qui s’oppose à la tendance naturelle à la désorga-
nisation des systèmes). La disentropie (non-entropie) trouve son origine dans les travaux
du physicien autrichien Erwin Schrödinger en 1944, est développée par les américains
Claude Shannon et Warren Weaver en 1948, puis par le français Léon Brillouin en 1956.
A l’inverse de l’entropie qui a une tendance naturelle à la désorganisation, la disentropie
peut-être assimilée comme une entropie à croissance négative ou une croissance disentro-
pique positive. La disentropie est considérée en physique des systèmes comme un facteur
d’organisation.
Ainsi, le deuxième principe de la thermodynamique peut aussi être représenté par une
inégalité faisant intervenir la disentropie
Z
dφ ≤ dQ × T a (2.2)

où φ est la disentropie du système. Cette expression s’appelle l’inégalité inverse Clausius.


Contrairement à l’énergie, l’entropie et la disentropie sont deux notions non conserva-
tives. Particulièrement dans un système isolé, l’énergie totale est toujours constante, mais
l’entropie tend à augmenter, tandis que la disentropie a tendance à diminuer. Ces deux
notions jouent un rôle très important pour évaluer les performances d’un système.

2.3 Sur la représentation mathématique des systèmes ther-


modynamiques
La représentation mathématique des systèmes thermodynamiques a été largement dé-
veloppée par de nombreuses approches. En 2005 Haddad a proposé une représentation
discrète basée sur les systèmes compartimentaux [54]. C’est ce modèle qu’on propose
30 Chap 2. Modélisation thermodynamique des réseaux de transport

d’exploiter par la suite afin d’introduire la démarche thermodynamique présentée dans ce


chapitre.
Les modèles compartimentaux permettent d’étudier l’évolution au cours du temps
de quantités de substance au travers de blocs homogènes nommés compartiments, et ils
représentent le comportement du système à l’étude au moyen d’équations relatives aux
propriétés de ces compartiments. Ainsi, les variables d’état peuvent par exemple repré-
senter les tailles des compartiments ou les paramètres et les taux de transfert de substance
entre ces compartiments (l’énergie dans le cas des les systèmes thermodynamiques). Dans
un modèle compartimental, il est essentiel de faire l’hypothèse d’homogénéité dans les
compartiments ; c’est à dire que la matière dans un compartiment ne présente pas de
différence, et que toute unité de matière qui entre dans un compartiment se mélange ins-
tantanément au contenu du compartiment.
Un système thermodynamique peux être graphiquement représenté par un ensemble
de n boîtes (sous-systèmes), chacune étant un compartiment du modèle, et un système
d’arcs orientés reliant les compartiments (voir Figure 2.1). Chaque compartiment du ré-
seau représente un dispositif de stockage qui contient une quantité variable d’une espèce
matérielle ou immatérielle déterminée (masse, énergie, information...).

F IGURE 2.1 – Système thermodynamique


2.3 Sur la représentation mathématique des systèmes thermodynamiques 31

Soient Ei l’énergie stockée dans le sous-système Ψi , i ∈ {1, · · · , n} et Ei∗ > 0 sa


capacité thermique. Alors la température du compartiment Ψi est donnée par :

Ti = Ei /Ei∗ , i ∈ {1, · · · , n} (2.3)

Dans les systèmes thermodynamiques, il y a des échanges ou transferts d’énergie entre


les sous-systèmes. Ils peuvent se faire soit par des transports physiques d’une localisation
à l’autre, soit par des réactions chimiques. Les échanges d’énergie entre les sous-systèmes
e e
sont symbolisées par σi,j , i 6= j (resp, σj,i ) qui représente le flux d’énergie entrant à
l’instant k dans le compartiment i (resp, j) depuis le compartiment j (resp, i). Par ailleurs,
des arcs d’entrée et de sortie supplémentaires représentent les interactions du réseau avec
son environnement : soit des flux d’entrée notés rie injectés de l’extérieur dans le sous-
système i, soit des flux de sortie dei soutirés du sous-système i vers l’extérieur.
Un système thermodynamique est généralement caractérisé par des équations ma-
thématiques qui décrivent l’évolution au cours du temps des variables d’état du modèle
que sont les énergie stockées dans chaque sous-système. L’écriture de ces équations re-
pose sur le principe de conservation de la masse. Appliqué au sous-système i à l’ins-
tant k, ce principe traduit le fait que pendant l’intervalle de temps [k, k + 1] la variation
∆Ei (k) = Ei (k + 1) − Ei (k) de la quantité d’énergie présente dans le sous-système i est
égale à la différence entre les sommes des flux entrants et sortants.
Plus précisément, si l’on considère le i-ème sous-système Ψi , l’équation régissant son
évolution au cours du temps s’écrit de la manière suivante :
n
X  
e e
∆Ei (k) = Ei (k+1)−Ei (k) = σi,j (k)−σj,i (k) +rie (k)−dei (k), k ∈ N (2.4)
j=1,j6=i

Notons tout de suite que dans cette équation, seuls sont explicités les termes correspondant
e
à des liens effectifs du système. En d’autres termes, les σi,j , rie et dei correspondant à des
liens inexistants n’apparaissent pas dans les équations.
Si l’on considère maintenant les n sous-systèmes, l’équation (2.4) peut s’écrire sous
la forme matricielle suivante :

E(k + 1) = E(k) + le (k) + re (k) − de (k) (2.5)

où E(k) = [E1 (k), · · · , En (k)]T est le vecteur d’état du système à l’instant k, re =


[r1e , · · · , rne ]T est le vecteur des flux d’entrée, de = [de1 , · · · , den ]T est le vecteur des flux de
32 Chap 2. Modélisation thermodynamique des réseaux de transport

sortie et le = [l1e , · · · , lne ]T représente tous les échanges d’énergie entre les sous-systèmes,
c’est à dire : n
X
lie = e
(σi,j e
− σj,i ), i ∈ {1, · · · , n} (2.6)
j=1,j6=i

2.3.1 Formulation de l’entropie


Pour formuler l’entropie, Haddad [54] a présenté la version discrète suivante de l’in-
égalité de Clausius pour le système (2.5)
n
X Qi (k)
ψ(E(k + 1)) ≥ ψ(E(k)) + a
, ∀k ∈N (2.7)
i=1
T i (k + 1)

où ψ(E) est l’entropie du système thermodynamique, Tia (k+1) est la température absolue
du i-ème sous-système à l’instant k + 1 et Qi (k) est l’énergie échangée par le i-ème sous-
système avec le milieu extérieur :

Qi (k) = rie (k) − dei (k), i ∈ {1, · · · , n}

En se basant sur cette inégalité, Haddad a formulé l’entropie du système comme suit :

ψ(E) , E ∗ T ln(τ  + Pe E) − T E ∗ ln τ (2.8)

où ln(x) = [ln(x1 ), · · · , ln(xn )]T , E ∗ = [E1∗ , · · · , En∗ ]T ,  = [1, 1 · · · , 1]T , τ est un


scalaire positif tel que Tia = τ + Ti , i ∈ {1, · · · , n}, Ti est la température du système
donnée par l’équation (2.3) et Pe est une matrice diagonale dont les éléments diagonaux
sont 1/Ei∗ .
Notons tout de suite que la formulation de l’entropie (2.8) est identique avec celle
de Boltzmann en physique statistique. En effet, on sait que si le i-ième sous-système
thermodynamique est sans transition de phases, son entropie à des température absolues
différentes (T1a , T2a ) est donnée par [55] :

T1a
ψi (E1 ) − ψi (E2 ) = Ei∗ ln , (2.9)
T2a
Ei
Or Tia = τ + Ti et Ti = Ei∗
, il vient aussitôt que :

E1
τ+ Ei∗
ψi (E1 ) − ψi (E2 ) = Ei∗ ln E2
, ∀i ∈ {1, · · · , n} (2.10)
τ+ Ei∗
2.3 Sur la représentation mathématique des systèmes thermodynamiques 33

Si maintenant T2 = 0 alors E2 = 0. Ainsi, l’équation (2.10) devient :


E1
τ+ Ei∗
ψi (E1 ) = ψi (0) + Ei∗ ln
τ
E1
= ψi (0) + Ei∗ ln(τ + ) − Ei∗ ln τ (2.11)
Ei∗
Par ailleurs, on sait que (théorème de Nernst) :

ψi (0) = lim ψi (Ei ) = 0 (2.12)


Ei →0

Par conséquent, l’équation (2.11) devient :


E1
ψi (E1 ) = Ei∗ ln(τ + ∗
) − Ei∗ ln τ (2.13)
Ei
Ainsi, l’entropie du système global est donc donnée par :
n
X Ei
ψ(E) = Ei∗ ln(τ + ) − Ei∗ ln τ (2.14)
i=1
Ei∗

ce qui est exactement la formulation de Haddad (2.8).

Remarque 2.1 Pour un système isolé, i.,e, Qi (k) = 0, ∀i ∈ {1, · · · , n}, l’inégalité (2.7)
montre que ψ(E(k + 1)) ≥ ψ(E(k)). Ceci montre que l’entropie définie par (2.8) est une
fonction croissante pour un système isolé. Ce qui traduit exactement le deuxième principe
de la thermodynamique (l’entropie d’un système isolé ne peut pas diminuer). Néanmoins,
la diminution d’entropie d’un système non isolé est possible si l’augmentation de l’entro-
pie du milieu extérieur fait plus que compenser la diminution d’entropie de ce système.
Le bilan entropique reste alors conforme à la deuxième loi de la thermodynamique et se
traduit par une augmentation globale de l’entropie, assimilée à une création d’entropie qui
est donc la caractéristique de toutes les transformations réelles. I

2.3.2 Formulation de la disentropie


La disentropie a la caractéristique précise d’entraîner un système en désordre vers
un niveau d’auto-organisation. Pour formuler cette fonction, Haddad a présenté dans un
premier temps l’inégalité inverse de Clausius suivante :
n
X
φ(E(k + 1)) − φ(E(k)) ≤ Qi (k)Ti (k + 1), ∀k ∈ N (2.15)
i=0
34 Chap 2. Modélisation thermodynamique des réseaux de transport

où φ(E) est la disentropie du système thermodynamique, Qi (k) est l’énergie échangée


par le i-ème sous-système avec le milieu extérieur, Ti (k + 1) est la température absolue
du i-ème sous-système à l’instant k + 1. Ainsi, en se basant sur cette inégalité, Haddad à
formulé la disentropie du système comme suit :
1
φ(E) , E T Pe E (2.16)
2
où Pe est une matrice diagonale dont les éléments diagonaux sont 1/Ei∗ .

Remarque 2.2 Pour un système isolé, i.,e, Qi (k) = 0, ∀i ∈ {1, · · · , n}, l’inégalité (2.15)
montre que φ(E(k + 1)) ≤ φ(E(k)). Ceci montre que la disentropie est une fonction
décroissante pour un système isolé. Par conséquent, l’entropie augmente si et seulement
si la disentropie diminue. Ceci montre la dualité entre l’entropie (mesure du désordre) et
la disentropie (mesure de l’ordre). I

Dans la section suivante, nous allons voir comment les liens se tissent entre les sys-
tèmes de transport et la thermodynamique. Pour cela, plusieurs paramètres et principes
thermodynamique vont trouvé leurs parallèles dans le cadre des systèmes de transport.

2.4 Modélisation thermodynamique d’un réseau de car-


refours
La mise en place d’un système de feux à un carrefour réalise une séparation dans le
temps de l’admission de différents courants de véhicules. Généralement, pour étudier un
réseau de carrefours routier, on se limite tout d’abord à l’analyse de deux intersections
routière (voir figure 2.2) . L’étude de plusieurs types d’intersections est similaire à ce type
simple de carrefours.
Généralement on associe à chaque carrefour des listes d’entrées et de sorties. Ces
listes sont décrites par des mouvements. Chaque mouvement est défini comme étant un
parcours des véhicules allant d’une entrée vers une sortie. Les courants de véhicules sont
soit directs, soit des courants de tourne-à-gauche ou tourne-à-droite.
Nous allons voir à présent comment les phénomènes observés en thermodynamique
s’apparentent avec ceux du trafic de ces deux intersections. En effet, chaque voie de circu-
lation (tronçon) peut contenir une certaine quantité de véhicules. Ces derniers se déplacent
2.4 Modélisation thermodynamique d’un réseau de carrefours 35

F IGURE 2.2 – L’écoulement du trafic des deux intersections

entre les voies ou quittent le tronçon vers l’extérieur. Ainsi, si nous effectuons une projec-
tion de la figure 2.2 sur la figure 2.1, nous pouvons considérer le tronçon i comme étant
un compartiment dont l’énergie stockée est représentée par le nombre des véhicules sur
le tronçon. Ainsi, les véhicules sont équivalents à l’énergie et les tronçons à des compar-
timents dans le contexte thermodynamique.
Ceci fait, nous allons voir dans la suite comment le concept de la température en ther-
modynamiques peut être introduit dans le contexte de transport. Pour ce faire, remarquons
d’abord que chaque tronçon a une longueur fixe. Il s’ensuit que chaque tronçon i admet
une certaine capacité x∗i à contenir les véhicules. Par conséquent, la capacité x∗i s’appa-
rente à la capacité thermique Ei∗ . Ainsi, si nous définissons le taux d’occupation d’une
voie comme la proportion entre le nombre des véhicules sur le tronçon et sa capacité,
c’est à dire :
xi
fi = , i ∈ {1, · · · , n} (2.17)
x∗i
nous pouvons considérer le taux d’occupation de la voie comme étant la température
Ti = Ei /Ei∗ dans le contexte thermodynamique. En résumé, le tableau 2.1 montre les
correspondances des concepts de base entre les systèmes de transport et les systèmes
thermodynamiques.
Ainsi, la prise en compte de l’ensemble des ces caractéristiques thermodynamiques
du réseau de carrefours justifie le modèle mathématique suivant du i-ième tronçon entre
l’instant k et k + 1 :

xi (k + 1) = xi (k) + li (k) + ri (k) − di (k) (2.18)


36 Chap 2. Modélisation thermodynamique des réseaux de transport

TABLE 2.1 – Correspondances des concepts de base


Thermodynamique Transport
Energie Véhicules
Sous-système Voie de circulation
Energie stockée dans les sous-systèmes Nombre de véhicules sur le tronçon
Capacité thermique Capacité de la voie
Température Taux d’occupation

– xi le nombre de véhicules dans chaque tronçon i.


– ri le nombre d’entrée de véhicules de l’extérieur dans le tronçon i.
– di le nombre de sortie de véhicules du tronçon i vers l’extérieur.
Xn
– li (k)= (σi,j (k) − σj,i (k)) les échanges de véhicules entre la voie i et les voies
j=1,j6=i
j.
X n
– σi,j , le flux de véhicules entrants dans la voie i depuis les voies j.
j=1,j6=i
X n
– σj,i , le flux de véhicules sortants de la voie i vers les voies j.
j=1,j6=i
Il est important de noter que, seuls sont explicités les termes correspondant à des liens
effectifs du système. En d’autres termes, les σi,j correspondant à des liens inexistants
n’apparaissent pas dans les équations. En outre, il est clair que σi,j = 0, dj = 0 si et
seulement si xj = 0. Cette contrainte implique que si le nombre de véhicules du sous-
système j est égale à zéro, alors ce sous-système ne peut pas fournir des véhicules à son
environnement.
Pour un réseau à plusieurs intersections et n tronçons nous avons alors l’équation
d’état du système global :

x(k + 1) = x(k) + l(k) + r(k) − d(k), ∀k ∈ N (2.19)

où x = [x1 , · · · , xn ]T , l = [l1 , · · · , ln ]T , r = [r1 , · · · , rn ]T , d = [d1 , · · · , dn ]T ,


Dans la suite du chapitre, nous allons voir que les réseaux de carrefours ainsi définis
respectent certains principes thermodynamiques.
2.4 Modélisation thermodynamique d’un réseau de carrefours 37

2.4.1 Conservation des véhicules (premier principe)


Une propriété fondamentale de l’énergie est qu’elle se conserve. En effet, la première
loi de la thermodynamique indique que l’énergie ne peut être ni créée ni détruite, elle
peut juste changer de forme ou être transférée [55]. Plus particulièrement, la variation de
l’énergie stockée dans un système thermodynamique est exactement égale à la quantité
d’énergie échangée avec son environnement.
Ce principe est également valable pour le système de transport. En effet, il est clair
que la variation de la quantité de véhicules au sein d’un réseau de transport est exactement
égale aux échanges de trafic avec le milieu extérieur. Ce principe est résumé dans le
théorème suivant.

Théorème 2.1 Soit  , [1, · · · , 1]T le vecteur dont toutes les composantes sont égales à
1. Définissons :
U , T x (2.20)

comme le nombre total des véhicules à l’intérieur du réseau de transport à l’instant k.


Soit :
Q , T (r − d) (2.21)

la quantité de véhicules échangés entre le réseau de transport et le milieu extérieur à


l’instant k. Nous avons alors : ∀k ∈ N

∆U (k) = U (k + 1) − U (k) = Q(k) (2.22)

Preuve: A partir du modèle (2.19), nous avons :

U (k + 1) = T x(k + 1) = T x(k) + T l(k) + T (r(k) − d(k))


= U (k) + T l(k) + Q(k)

Il vient alors :
∆U (k) − Q(k) = T l
38 Chap 2. Modélisation thermodynamique des réseaux de transport

D’autre part, remarquons que :


n
X n  X
X n n
X 
T
 l(k) = li (k) = σi,j (k) − σj,i (k)
i=1 i=1 j=1,j6=i j=1,j6=i
Xn n
X X n n
X
= σi,j (k) − σj,i (k)
i=1 j=1,j6=i i=1 j=1,j6=i
Xn X n Xn Xn
= σi,j (k) − σj,i (k)
i=1 j=1,j6=i j=1 i=1,i6=j

=0

si bien que ∆U (k) = Q(k), ce qui achève la preuve. 


Remarquons que si on définit l’entrée du système comme u(k) = r(k) et la sortie par
y(k) = d(k), il vient à partir de l’équation (2.22) que :
1 −1 
kX 
U (k1 ) = U (k0 ) + T u(k) − T y(k) , ∀k1 ∈ N, k1 > k0
k=k0

ce qui montre que le réseau de transport est conservatif par rapport à la fonction de sto-
ckage U , T x et la fonction d’approvisionnement Γ(u, y) = T u(k) − T y(k). Ceci
implique (voir [56]) que :

0 ≤ Ua (x0 ) = U (x0 ) = Ur (x0 ) < ∞ (2.23)


k−1 
X 
Ua (x0 ) = sup T u(j) − T y(j) (2.24)
u
j=k0
0 −1
kX 
T T
Ur (x0 ) = inf  u(k) −  y(k) ; k ≥ 1 − k0 (2.25)
u
−k

Ua (x0 ) est la quantité maximale de véhicules stockées qui peut être extraite du réseau de
transport à chaque instant k. Ur (x0 ) est la quantité minimale de véhicule qui peut être
délivrée au réseau pour le transférer à partir de l’état x(−k) = 0 à l’état x(k0 ) = x0 . Il
en résulte à partir de (2.23) que le réseau de transport est capable de délivrer à l’extérieur
tous les véhicules stockés en son sein et peut stocker tous les véhicules échangés entre ses
sous-systèmes.
2.5 Entropie du transport 39

Par ailleurs, si r(k) = 0 il vient à partir de l’équation (2.22) et (2.21) que :

∆U (k) = −T d ≤ 0

Ceci montre que l’état d’équilibre x = 0 est stable au sens de Lyapunov et U (k) (le
nombre total des véhicules à l’intérieur du réseau de transport) est une fonction de Lya-
punov pour le système.

2.5 Entropie du transport


Si le premier principe est un principe de conservation de l’énergie, le second principe
de la thermodynamique est un principe d’évolution qui introduit la notion d’irréversibilité
des phénomènes physiques et la notion d’entropie. Il dit que l’entropie d’un système isolé
augmente, ou reste constante. Il est associé à l’impossibilité du passage du désordre à
l’ordre sans intervention extérieure.
Le second principe a une origine statistique : à la différence du premier principe, les
lois microscopiques qui gouvernent la matière ne le contiennent qu’implicitement et de
manière statistique. En revanche, il est assez indépendant des caractéristiques mêmes de
ces lois, car il apparaît également si l’on suppose des lois simplistes à petite échelle.
Bien que les systèmes thermodynamiques et les réseaux de transport peuvent être si-
milaires comme nous venons de le voir, le second principe de la thermodynamique n’est
pas applicable dans le contexte du transport. En effet, une des conséquences directe du
deuxième principe de la thermodynamique est que lorsque deux corps dans l’espace mis
en contact sont à des températures différentes, il y a systématiquement transfert de cha-
leur toujours vers le corps froid. Dans le contexte du transport, ce phénomène n’est pas
observable car la propagation des véhicules dans un réseau est déterminée par la volonté
des conducteurs et aucune règle n’existe pour obliger les véhicules de se déplacer seule-
ment des voies les plus chargées vers celles les moins chargées. Par conséquent, nous ne
pouvons pas introduire le concept d’entropie dans le cadre du transport en fonction de
certains principes tel qu’il est défini dans le cadre de la thermodynamique. Néanmoins,
sur la base des similarités des concepts de base, tels que l’énergie et la température, nous
pouvons présenter l’entropie de transport comme une mesure du désordre du système.
Pour ce faire, comparons tout d’abord les notions de l’ordre et du désordre entre les
systèmes thermodynamiques et les réseaux de transport. En effet, dans le contexte ther-
40 Chap 2. Modélisation thermodynamique des réseaux de transport

modynamique, un ordre élevé signifie une plus grande capacité de réaliser un travail,
ce qui se traduit par une grande différence de températures entre les sous-systèmes. Par
exemple, dans un système thermodynamique composé de deux sous-systèmes comme le
montre la figure 2.3, si la plupart de l’énergie se concentre sur un seul sous-système pour
générer un gradient de température, l’énergie du sous-système le plus chaud aura le po-
tentiel de se déplacer vers celui le plus froid. Ainsi, la quantité d’énergie potentielle de
la transmission est également déterminée par la différence de température. Ce potentiel
correspond à la capacité du système d’effectuer un travail. Dans ce cas, le système est
dans une organisation élevé. D’autre part, si l’énergie est répartie uniformément dans ces
deux sous-systèmes de sorte qu’ils partagent la même température, il n’y aura pas de
mouvements d’énergie potentielle. Dans ce cas, le système est considéré comme étant
mal organisé.
Ainsi, l’entropie d’un système thermodynamique est maximale quand la température
est identique en tout point. De même, si on verse un liquide colorant dans un verre
d’eau, l’entropie du système coloré sera maximale quand, suite au mélange, la couleur
du contenu sera devenue uniforme.

Gradient de température Équilibre de température

F IGURE 2.3 – L’ordre thermodynamique

Pour les systèmes de transport il en va autrement. En effet, une grande différence


entre les taux d’occupation de deux voies de circulation correspond à un désordre élevé.
Par exemple, pour l’intersection de la figure 2.4, si la plupart des véhicules se concentrent
sur une seule voie, celle-ci sera encombrée et par conséquent susceptible de provoquer
une congestion. Dans ce cas, le système de transport est considéré mal organisé. D’autre
part, si les véhicules sont dispersés d’une manière uniforme, le problème de congestion
disparaît et le système sera mieux organisé. En outre, l’apport d’énergie au système ther-
modynamique apporte plus de capacité à faire un travail, ce qui augmente l’ordre du
système. Cependant, dans le contexte du transport, l’entrée des véhicules par le milieu
extérieur apporte plus de chances de générer des congestions, ce qui diminue l’ordre du
2.5 Entropie du transport 41

système. Pour un système thermodynamique isolé sans apport d’énergie, le désordre (en-
tropie) augmente jusqu’à ce que le système atteigne l’équilibre. Au contraire, si, à un
moment donné, le système de transport ne possède pas d’entrée de véhicules, le système
dissipe les véhicules existants, et par conséquent devient mieux organisé.

Congestionné Distribution uniforme

F IGURE 2.4 – L’ordre du transport

En résumé, les notions de l’ordre et du désordre dans les deux systèmes sont oppo-
sées. Ceci signifie que l’ordre thermodynamique (mesuré par la disentropie) correspond
au désordre dans le contexte du transport. En d’autres termes, l’entropie du transport
correspond à la disentropie thermodynamique. Ce qui nous permet d’écrire :
1
ψ(x) , xT P x, Entropie du transport (2.26)
2
φ(x) , x∗ T ln(τ  + P x) − T x∗ ln τ, Disentropie du transport (2.27)

2.5.1 Justification de l’entropie du transport


La formule de l’entropie du transport a été introduite principalement à partir des
considérations thermodynamiques, mais nous n’avons pas montré sa signification dans
le contexte du transport. Pour ce faire, la figure 2.5 montre le diagramme fondamental
liant le débit à la concentration. Ce diagramme est le plus couramment utilisé dans l’ana-
lyse du transport. Il est déduit à partir d’un modèle pionnier en modélisation du trafic
routier. Il s’agit du modèle développé simultanément par [Lighthill et Whitham, 1955]
ainsi que [Richards, 1956], s’appuyant sur une analogie avec la dynamique des fluides.
Plus communément appelé le modèle LWR.
On constate qu’il existe deux régimes différents :
42 Chap 2. Modélisation thermodynamique des réseaux de transport

Traffic Flow
Traffic Density

F IGURE 2.5 – Le diagramme fondamental

– Lorsque le nombre de véhicules (concentration) est suffisamment faible sur la sec-


tion considérée, ces véhicules n’interagissent pas et chacun peut circuler à la vi-
tesse désirée, appelée vitesse libre (prise généralement égale à la vitesse maximale
moyenne νm ) ;
– En augmentant le nombre de véhicules dans la voie, les interactions deviennent
plus importantes et se reflètent par une limitation du débit. Dans ce cas, les vitesses
pratiquées diminuent. La vitesse de flot est donc une fonction décroissante de la
concentration ;
– Dans le cas extrême où la voie est saturée et donc la concentration est maximale
ρm , la vitesse et le débit sont nuls ;
A noter que ces observations conduisent la plupart du temps à considérer un diagramme
fondamental décomposé en deux parties distinctes, à savoir le régime fluide et le régime
congestionné. En outre, nous pouvons remarquer que le désordre du réseau est intime-
ment relié au nombre de véhicules sur les voies (plus le nombre de véhicules sur les
voies est grand plus le système est désordonné) puisque la vitesse du flot est une fonction
décroissante de la concentration.
Ceci fait, nous allons voir à présent comment l’entropie (2.26) prend toute sa signifi-
cation dans le domaine du transport en la rattachant au nombre de véhicules sur les voies.
En effet, étant donnés deux états x(k1 ) et x(k2 ) du réseau avec k1 < k2 , la question fonda-
mentale est : que signifie mathématiquement qu’un état est plus désordonné que l’autre ?
Commençons par un cas intuitif, à savoir x(k2 ) ≤ x(k1 ) (c’est-à-dire, xi (k2 ) ≤
xi (k1 ), i = 1, · · · , n). Alors le nombre de véhicules de chaque voie diminu entre les
instants k1 et k2 . Ceci implique une diminution de la densité dans chaque voie et donc
une augmentation de la vitesse des véhicules, ce qui conduit à un ordre élevé du système.
2.5 Entropie du transport 43

Ainsi, dans ce cas nous avons ψ(x(k2 )) = xT (k2 )P x(k2 ) ≤ ψ(x(k1 )) = xT (k1 )P x(k1 )
car 0 ≤ x(k2 ) ≤ x(k1 ). Par conséquent, l’entropie peut être considérée comme une me-
sure de la tendance du système à perdre son désordre.
Dans le cas général, la réponse à la question peut être donnée par la théorie de la ma-
jorisation qui a été introduite par Hardy, Littlewood et Polya [57]. C’est une formalisation
de la notion de la diversité dans les composantes des vecteurs. Au cours des dernières
décennies, cette théorie a trouvé des applications dans plusieurs disciplines comme les
statistiques, la théorie des probabilités, l’économie, la génétique mathématiques, la mé-
canique quantique, l’algèbre linéaire et la géométrie. Pour plus de détails, les lecteurs
peuvent se référer à l’excellent livre sur le sujet de Marshall [58] .
En mathématiques, on désigne par majorisation un certain préordre sur les éléments
de l’espace vectoriel Rn . Pour un vecteur x = (x1 , · · · , xn )T ∈ Rn , on note x↓ =
(x[1] , · · · , x[n] )T le vecteur de Rn qui a les mêmes composantes, mais ordonnées en ordre
décroissant, c’est-à-dire,
x[1] ≥ x[2] ≥ · · · ≥ x[n]
Par exemple, pour x = (2, 5, 1, 9), on a x↓ = (9, 5, 2, 1).

Définition 2.1 Soient x et y deux vecteurs de Rn . On dit que x est faiblement majoré par
y et on note x ≺f m y si :
r
X r
X
x↓[i] ≤ ↓
y[i] , ∀r = 1, · · · , n (2.28)
1 1

c’est-à-dire,

x[1] ≤ y[1]
x[1] + x[2] ≤ y[1] + y[2]
..
.
X n Xn
x[i] ≤ y[i]
1 1
Pn Pn
Si de plus 1 x[i] = 1 y[i] , alors on dit que x est majoré par y et on note x ≺m y. I

Par exemple, nous avons la majorisation de la séquence suivante de vecteurs à n compo-


santes :
     
1 1 1 1 1 1
,..., ≺m ,..., , 0 ≺m · · · ≺ m , , 0, . . . , 0 ≺m (1, 0, . . . , 0)
n n n−1 n−1 2 2
44 Chap 2. Modélisation thermodynamique des réseaux de transport

Il est clair que si x ≤ y, alors x est faiblement majoré par y. Ainsi, la définition 2.1
inclut le cas mentionné plus haut. En plus, la majorisation ne dépend pas de l’ordre des
composantes des deux vecteurs, et ce n’est donc pas une relation d’ordre, malgré son nom
puisque x f m y et y f m x n’implique pas que x = y, mais seulement que x↓ = y ↓ .
Le concept de la majorisation fournit une procédure de calcul simple et évidente pour
la comparaison de deux vecteurs, mais il offre peu de lumière sur le sens de l’ordre. Une
approche plus pratique est donnée par les matrices dites doublement sous-stochastique et
les fonctions convexes.

Définition 2.2 Une matrice Λ ∈ Rn×n est dite doublement sous-stochastique si :


n
X n
X
Λij ≥ 0, Λij ≤ 1, Λij ≤ 1
j=1 i=1

Pn Pn
Si de plus j=1 Λij = i=1 Λij = 1, Λ est dite doublement stochastique. I

Par exemple, la matrice suivante est doublement sous-stochastique :


 
0 21 14
 
 3 1 0 
 4 4 
1 1 1
5 5 5

tandis que la matrice suivante est doublement stochastique :


 
1 4
0 5 5
 
 2 3 0 
 5 5 
3 1 1
5 5 5

Pour introduire ce que nous allons faire, rappelons tout d’abord la définition des fonc-
tions convexes.

Définition 2.3 Soit C ⊂ Rn un convexe et f : C → R une fonction. On dit que f est


convexe lorsque pour tous x et y ∈ C et tout t ∈ [0, 1], on a

f (1 − t)x + ty 6 (1 − t)f (x) + tf (y)

Dans le travail déjà cité [57], Hardy, Littlewood et Polya ont démontré le résultat
suivant qui donne une caractérisation de la notion de majorisation.
2.5 Entropie du transport 45

Lemme 2.1 Soient x ∈ Rn+ et y ∈ Rn+ deux vecteurs positifs. Alors les trois conditions
suivantes sont équivalentes :
1. x ≺f m y, (x est faiblement majoré par y)
2. il existe une matrice doublement sous-stochastique Λ telle que x = Λy
3. quelle que soit la fonction convexe croissante Θ définie dans R, on a
n
X n
X
Θ(xi ) ≤ Θ(yi )
i=1 i=1

Si de plus x ≺m y (x est majoré par y), alors Λ est une matrice doublement stochastique
et Θ une fonction convexe.

Il vient immédiatement à partir de ce lemme que l’ordre au sens de la majorisation est


maintenant clair. En effet, à partir du point 2 nous pouvons remarquer que chaque compo-
sant xi est une combinaison linéaire de y1 , · · · , yn . Ceci implique que le vecteur x est le
résultat d’une moyennisation du vecteur y à l’aide de poids dont la somme est inférieure
à l’unité. En d’autres termes, x est le résultat de la diminution des écarts entre les com-
posantes de y. Cela signifie que toutes les composantes xi sont beaucoup plus proches
que les yi . Par conséquent, les composantes de x sont plus uniformément distribuées que
celles de y.
Le point 3 identifie la classe des fonctions compatibles avec l’ordre au sens de la
majorisation. Cela signifie que si x est faiblement majoré par y, alors l’inégalité associée
à y sera plus grande que l’inégalité associée à x par une classe de fonctions d’évaluation
Θ. Il s’agit de la mesure du degré d’inégalité d’une distribution.
Ceci fait, nous allons montrer maintenant que le concept de la majorisation et l’entro-
pie ψ(x) sont intimement liés, en ce sens que les deux offrent des approches au problème
de la quantification de ce qu’un état du réseau est plus désordonné qu’un autre. En effet,
si nous supposons que pour k2 ≥ k1 l’état du réseau x(k2 ) est faiblement majoré par l’état
x(k1 ), l’inégalité (2.28) implique que l’état x(k2 ) représente un degré de concentration
de véhicules plus faible que celui de l’état x(k1 ) (moyennisation). En d’autres termes, la
distribution des véhicules de l’état x(k2 ) est plus uniforme dans le réseau que celle de
x(k1 ). Par conséquent, le système est plus organisé lorsque l’état x(k2 ) est atteint, ce qui
conduit à une faible possibilité d’apparition des congestions à l’instant k2 . Cela dit, soit
x2i
ψi (xi ) = x∗i
. Alors ψi (xi ) est une fonction convexe et croissante dans l’orthant positif. Il
46 Chap 2. Modélisation thermodynamique des réseaux de transport

vient à partir du point 3 du lemme que :


n
X n
X
ψi (xi (k2 )) ≤ ψi (xi (k1 ))
i=1 i=1

Or,
n n
X x2i
X
ψ(x) = xT P x = = ψi (xi )
x∗
i=1 i i=1

ce qui implique que ψ(x(k2 )) ≤ ψ(x(k1 )). Nous en déduisons qu’une faible entropie
correspondant à la distribution la plus uniforme des véhicules dans le réseau.
Inversement, si pour k2 ≥ k1 nous avons ψ(x(k2 )) ≤ ψ(x(k1 )), alors d’après le lemme
x(k2 ) est faiblement majoré par x(k1 ). Par conséquent, x(k2 ) représente une distribution
plus uniforme des véhicules dans le réseau que x(k1 ). Ainsi, aucune concentration parti-
culière de véhicules n’existe dans un tronçon du réseau à l’instant k2 et par suite, l’ordre
émanant de la distribution x(k2 ) est plus grand que celui de x(k1 ).
En conclusion, il devient maintenant clair que l’entropie de transport ψ(x) est une me-
sure appropriée du désordre du système. En effet, une faible entropie de transport (faible
désordre) correspond à une distribution plus uniforme des véhicules dans le réseau. Il
s’ensuit alors une faible concentration de la circulation, et par conséquent (diagramme
fondamental) une augmentation de la vitesse de circulation des véhicules puisque la vi-
tesse est inversement reliée à la concentration et donc une meilleure organisation du réseau
de transport. Ainsi, l’entropie ψ(x) peut donc être considérée non seulement comme un
très bon moyen d’évaluer les performances du réseau de transport mais aussi, une source
d’information pour remettre de l’ordre dans le système.

2.5.2 Equilibre thermique = Equilibre du taux d’occupation


Dans un système thermodynamique isolé, au début de l’expérience l’agitation des
molécules peut-être élevée, l’énergie est intense, mais sans apport extérieur, au bout d’un
certain temps tout finit par se calmer, il n’y a plus d’échanges d’énergie ou de chaleur
et les molécules reviennent au repos. Le système qui tout d’abord était en déséquilibre
finit par s’équilibrer ; la chaleur s’est dissipée, le désordre est total. Le système ne peut
plus entraîner aucun échange d’énergie et ne peut plus engendrer le moindre ordre. Ainsi,
l’entropie (réps, disentropie) d’un système thermodynamique isolé est maximale (réps,
minimale) quand le système est en équilibre thermique.
2.5 Entropie du transport 47

Puisque la température s’apparente au taux d’occupation des voies d’un réseau de car-
refours, ce concept d’équilibre thermique peut être facilement introduit dans le contexte
du transport pour désigner l’état lorsque les taux d’occupation de toutes les voies de cir-
culation sont les mêmes. Cet état est appelé l’équilibre du taux d’occupation dans ce
chapitre. Il est désigné par l’expression suivante :
x̄1 x̄n

= · · · = ∗ = f¯i = constante (2.29)
x1 xn

L’équilibre du taux d’occupation implique qu’aucune concentration particulière de vé-


hicules existe dans un tronçon du réseau, et par conséquent la possibilité d’apparition
d’une congestion est extrêmement faible. En d’autres termes, pour un certain vecteur x̄,
l’équilibre du taux d’occupation correspond à la meilleure organisation du système. Ainsi,
contrairement aux systèmes thermodynamiques (comme nous l’avons vu precédemment),
pour un réseau de transport isolé, l’entropie ψ qui exprime le désordre (résp, disentropie
φ qui exprime l’ordre) est minimale (réps, maximale) quand le système est en équilibre
du taux d’occupation. Cette observation est démontrée dans le théorème suivant.

Théorème 2.2 Supposons que le réseau de transport soit isolé. Soit alors N le nombre
total des véhicules dans le réseau. Soient ψ et φ l’entropie et la disentropie du système
réspectivement. Définissons l’ensemble D par D = {x ∈ R+ /T x = N }. Alors :

N
arg min ψ(x) = arg max φ(x) = x̄ = x∗
x∈D x∈D T x∗
et
N2
min ψ(x) = ψ(x̄) =
x∈D 2T x∗
 N 
max φ(x) = φ(x̄) =  x ln τ + T ∗ − T x∗ ln τ
T ∗
x∈D  x
Preuve: L’existence et l’unicité de la solution x̄ vient du fait que ψ(x) ainsi que −φ(x)
sont des fonctions convexes et D est un ensemble compact. Il s’agit maintenant de connaître
la valeur minimale de la fonction ψ(x) sur l’ensemble D, c’est-à-dire :
1
min ψ(x) = xT P x
2
sous la contrainte T x = N
48 Chap 2. Modélisation thermodynamique des réseaux de transport

Pour résoudre ce problème, nous allons appliquer les conditions de Kuhn et Tucker
(voir chapitre 4). En effet, soit le Lagrangien J :
1
J(x, λ) = xT P x − λ(T x − N })
2
Alors, si x̄ est la solution recherchée, il existe un scalaire λ̄ ∈ R tel que :
∂J
= x̄T P + λ̄T = 0, (2.30)
∂x
∂J
= T x̄ − N = 0 (2.31)
∂λ
Ainsi, à partire de (2.30) on a x̄ = −λ̄P −1 . On en déduit à partir de (2.31) λ̄ = N
T P −1 
,
∂2J
ce qui implique x̄ = N
T x∗
x∗ . Or, la matrice Hessienne de J est ∂x2
= P qui est définie
positive. Donc le point x̄ est un minimum de ψ(x).
De la même manière, pour connaître la valeur maximale de la fonction disentropie
φ(E) = ni=1 x∗i ln(τ + xx∗i ) − x∗i ln τ sur l’ensemble D, on définit le Lagrangien J :
P
i

n
X xi
J(x, λ) = x∗i ln(τ + ∗
) − x∗i ln τ − λ(T x − N })
i=1
xi

Alors, si x̄ est la solution recherchée, il existe un scalaire λ̄ ∈ R tel que :


∂J h 1 1 i
= + λ̄, · · · , + λ̄ = 0, (2.32)
∂x τ + xx̄∗1 τ + xx̄∗n
1 n

∂J
= T x̄ − N = 0 (2.33)
∂λ
Il vient à partir de (2.32) que :
1
λ̄ = − , ∀i = 1, · · · , n
τ + xx̄∗i
i

Si λ̄ = 0, alors la seule valeur possible de x̄ = +∞, ce qui viole le fait que T x = N pour
une valeur finie de N . Ainsi, λ̄ 6= 0 si bien que : x̄i = −(λ̄ + τ )x∗i , ∀i = 1, · · · , n, ce qui
implique x̄ = −(λ̄ + τ )x∗ . Ainsi, l’équation (2.33) donne :

N
λ̄ = − −τ
T x∗
2.5 Entropie du transport 49

d’où x̄ = N
 T x∗
x∗ . Or, la matrice Hessienne de J est :

1 .. 
−  2 0 . 0

x∗1 (τ + x∗1
 
 1

 
1
2
 0 −  2 0 ··· 
∂ J 
x∗2

(τ + x∗2

=
 
2 2
∂x

 .. ... 

 . ··· 0 

1
 
 0 ··· 0 −  2 
x∗1 (τ + x̄
x∗
n
n

qui est définie négative. Donc le point x̄ est un maximum de φ(x). Finalement, on en
déduit que
N
arg min ψ(x) = arg max φ(x) = x̄ = x∗
x∈D x∈D T x∗
et
N2
min ψ(x) = ψ(x̄) = T ∗ (2.34)
x∈D 2 x
 N 
max φ(x) = φ(x̄) = T x∗ ln τ + T ∗ − T x∗ ln τ (2.35)
x∈D  x

Il vient immédiatement à partir du théorème (2.2) que l’équilibre pour lequel le désordre
(résp, l’ordre) est minimal (réps, maximal) quand le système est en équilibre du taux d’oc-
cupation. En effet, il est clair que x̄ = TN ∗ x∗ implique x̄∗i = TN ∗ = f¯i = constante, ∀i =
 x xi  x
1, · · · , n. Ainsi, pour que le réseau du transport soit bien organisé, toute stratégie de
contrôle de signalisation doit avoir comme objectif essentiel la réalisation de l’équilibre
du taux d’occupation.
Par ailleurs, puisque T x = N , il vient à partir de (2.34)
n n−1 n
N2 1 X x2i 1 X X (x∗j xi − x∗i xj )2
ψ(x̄) = T ∗ = − T ∗
2 x 2 i=1 x∗i 2 x i=1 j=i+1 x∗i x∗j
n−1 n
1 T 1 X X (x∗j xi − x∗i xj )2
= x Px − T ∗
2 2 x i=1 j=i+1 x∗i x∗j
n−1 n
1 X X (x∗j xi − x∗i xj )2
= ψ(x) − T ∗
2 x i=1 j=i+1 x∗i x∗j

(2.36)
50 Chap 2. Modélisation thermodynamique des réseaux de transport

Ainsi, si x = x̄ alors x∗j x̄i −x∗i x̄j = 0. Nous en déduisons que l’entropie (le désordre) pour
un système isolé diminue jusqu’à ce que l’équilibre du taux d’occupation soit atteint. De
la même manière on montre que la disentropie (l’ordre) pour un système isolé augmente
jusqu’à ce que l’équilibre du taux d’occupation soit atteint.

2.6 Conclusion
La thermodynamique est une branche de la physique et de la chimie liée à l’étude du
comportement thermique des corps, à l’étude de l’énergie et de ses transformations (en
particulier de l’énergie interne). Bien que sa puissance dans différents domaines indus-
triels n’est plus à démontrer, aucun travail, à notre connaissance, n’a été élaboré pour son
utilisation dans la régulation du trafic.
Le but de ce chapitre était donc de proposer un premier travail sur la manière dont les
liens se tissent entre les systèmes de transport et la thermodynamique. Pour cela, plusieurs
paramètres et principes thermodynamiques ont trouvé leurs parallèles dans le cadre des
systèmes de transport tels que la température (taux d’occupation de la voie), la capacité
thermique (capacité de la voie), l’équilibre thermique (l’équilibre du taux d’occupation),
le premier principe de la thermodynamique (loi de conservation des véhicules) et les no-
tions d’entropie et disentropie. Le point de vue dominant est l’assimilation des véhicules
à l’énergie fournie ou/et échangée entre les intersections signalisées. Contrairement aux
approches existantes, le modèle développé se base sur la notion d’énergie au lieu du débit.
L’avantages majeur du choix énergétique est qu’il fait apparaître sur le modèle le
nombre de véhicules présents sur les segments de route comme variable d’état, ce qui per-
met de suivre les modifications de l’infrastructure routière dues à des situations nouvelles
sans avoir à reprendre les démarches de modélisation depuis le début. En outre, il permet
de décrire explicitement les phénomènes qui gouvernent le trafic tel que le phénomène de
congestion qui est facilement représenté par l’augmentation de l’entropie (désordre).
Cependant, bien que les systèmes thermodynamiques et les réseaux de transport puissent
être similaires, le second principe de la thermodynamique n’est pas applicable dans le
contexte du transport. La raison en est que la propagation des véhicules est déterminée
par la volonté des conducteurs et aucune règle n’existe pour obliger les véhicules de se
déplacer seulement des voies les plus chargées vers celles les moins chargées (comme le
principe de la propagation de la température). En outre, les notions de l’ordre et désordre
2.6 Conclusion 51

dans les deux systèmes sont opposées. Ceci signifie que l’ordre thermodynamique (me-
suré par la disentropie) correspond au désordre (mesuré par l’entropie) dans le contexte
du transport. Cette entropie du transport est liée à la densité de la circulation ce qui lui
confère une légitimité de son utilisation. En effet, non seulement elle peut être considérée
comme un moyen pour la compréhension des phénomènes du trafic, mais aussi comme
un outil d’évaluation pour avoir une idée rapide sur l’évolution du trafic surtout lorsqu’il
s’agit de traiter des réseaux de grande taille. Un autre avantage à souligner de l’utilisation
de l’entropie se situe au niveau de la commande du trafic. En effet, puisque l’entropie me-
sure le désordre dans le système, elle peut être considérée comme un outil de régulation
car sa diminution fournit un moyen de réduire le désordre et donc de rendre le système
mieux organisé. Ceci est l’un des objectifs du chapitre suivant.
52 Chap 2. Modélisation thermodynamique des réseaux de transport
CHAPITRE 3

COMMANDE DISSIPATIVE DES


RÉSEAUX DE TRANSPORT

3.1 Introduction
L’objectif principal de contrôle et de régulation des systèmes de transport est de main-
tenir un trafic plus fluide afin d’assurer une meilleure qualité de service. Les feux de
signalisation représentent dans cette optique, le moyen le plus important pour réguler les
réseaux de carrefours. Néanmoins, la conception d’une commande nécessite de dispo-
ser d’un modèle et d’un représentant (critère) afin de préciser les objectifs par rapport
auxquels la commande est définie.
Dans le chapitre précédent, nous avons vu que l’entropie du transport représente le
visage thermodynamique du système et prend source et forme à partir de l’énergie (véhi-
cules) échangée ou transférée entre les sous-systèmes. Avec cette fonction, nous pouvons
définir le sens de l’évolution du trafic. En effet, plus l’entropie est grande plus le sys-
tème est désordonné. Elle peut donc être considérée non seulement comme un très bon
représentant pour évaluer les performances du réseau de transport mais aussi, comme une
source d’information pour remettre de l’ordre dans le système.
Dans ce chapitre, nous nous intéressons essentiellement à l’apport que pourrait avoir
l’implication de la théorie des systèmes dissipatifs dans le cadre des systèmes de transport.
54 Chap 3. Commande dissipative des réseaux de transport

Les systèmes dissipatifs sont des systèmes qui ne peuvent pas stocker toute l’énergie
échangée avec l’environnement extérieur. Autrement dit, ils dissipent partiellement ou
totalement l’énergie absorbée. Cette théorie joue un rôle très important dans l’analyse des
propriétés et la commande des systèmes physiques et a donné lieu à plusieurs résultats
importants dans les domaines de la thermodynamique, de l’électronique, de la mécanique,
etc.
L’idée fondamentale de notre approche est de faire le lien entre la théorie des systèmes
dissipatifs et les systèmes des carrefours signalisés. En effet, comme nous l’avons vu au
chapitre 2, l’entropie peut être vue comme étant le désordre stocké dans le réseau. Les feux
de signalisation peuvent alors être considérés comme des vannes dissipant ce désordre.
Dans le cas des carrefours congestionnés par exemple, ce concept se traduit par le
fait que l’énergie stockée (véhicules en files d’attente) est beaucoup plus importante que
l’énergie dissipée (véhicules sortants). Ce constat nous amène donc à réfléchir sur des
commandes permettant de dissiper cette énergie (désordre) stockée. C’est précisément
là où se situe l’intérêt d’utiliser la théorie des systèmes dissipatifs. En effet, cette théorie
offre des outils qui permettent de moduler par rétroaction l’énergie physique de façon à ce
que cette énergie soit utilisable comme fonction de Lyapunov à des fins de commande et
de stabilisation. Ces développements ont conduit à ce qu’on appelle parfois dissipativity-
based control, ou commande dissipative. C’est une stratégie qui consiste à trouver un
contrôleur qui transforme un système non-dissipatif, comme dans le cas des carrefours
congestionnés, en un système dissipatif. De cette manière, le système sera mieux organisé.
Cependant, le fonctionnement des systèmes de transport imposent souvent des incer-
titudes et des contraintes de type inégalité sur les variables de commande et de l’état du
modèle considéré. De ce fait, synthétiser une loi de commande dissipative pour les sys-
tèmes de transport nécessite la prise en compte de ces contraintes.
Notre contribution dans ce chapitre consiste à fournir des solutions au problème de la
dissipativité avec contraintes sur l’état et la commande pour les systèmes de transport, qui
soient aussi simples que possible à mettre en œuvre en temps réel. L’approche utilisée vise
à appliquer les techniques des Inégalités Matricielles Linéaires (LMI). Leur succès vient
du développement des méthodes dites du point intérieur (interior point methods) qui per-
mettent d’apporter des solutions intéressantes par la manipulation des contraintes de fa-
çon systématique. La mise en évidence de l’approche LMI a ouvert des possibilités telles
qu’il est devenu possible d’aborder des problèmes d’analyse et/ou de commande jusque
3.2 Rappels mathématiques et résultats préliminaires 55

là non envisageables. En outre, de nombreux logiciels (solveurs) conviviaux existent dont


certains offrent une interface avec MATLAB.
Dans un premier temps, nous rappelons quelques définitions et résultats utiles don-
nés dans la littérature et nous donnons certains résultats préliminaires relatifs au concept
d’inclusion des polyèdres. Ensuite, nous présentons la théorie des systèmes dissipatifs
à travers une formulation très générale. Cette formulation permet néanmoins de présen-
ter les avantages et les inconvénients de la commande dissipative. Une fois l’intérêt de
cette commande justifié, nous précisons la définition du problème de commande qui nous
concerne. Cette définition est faite par spécialisation du problème de la commande dis-
sipative aux systèmes de transport. Une fois le problème bien défini, nous proposons
d’appliquer cette commande en vue d’une régulation des intersections du réseau tout en
prenant en compte les incertitudes du modèle et en respectant les contraintes sur les va-
riables de commande et de l’état. Deux cas sont étudiés : celui où le modèle du système
est non-linéaire est d’abord analysé. Ensuite, nous nous intéressons au cas où le modèle
de transport est linéaire.

3.2 Rappels mathématiques et résultats préliminaires


Nous définissons ici différentes notations concernant les vecteurs et les opérateurs po-
sitifs. Ces notations sont conformes à celles classiquement introduites dans la littérature.
Nous introduisons tout d’abord deux relations d’ordre partiel dans Rn : > et ≥. Considé-
rons deux vecteurs x et y de Rn ; alors :
– x > y ⇔ ∀i ∈ {1, · · · , n}, xi > yi
– x ≥ y ⇔ ∀i ∈ {1, · · · , n}, xi ≥ yi
Il est clair que : x > y ⇒ x ≥ y. Ces relations d’ordre partiel nous permettent de
définir les vecteurs positifs de Rn :
– x est non-négatif, i.e., x ≥ 0
– x est positif, i.e., x > 0
Définissons les orthants non-négatifs et positifs, que nous noterons respectivement Rn+ et
Rn+∗ :

Rn+ = {x ∈ Rn , x ≥ 0}
Rn+∗ = {x ∈ Rn , x > 0}
56 Chap 3. Commande dissipative des réseaux de transport

De la même façon, nous définissons les relations > et ≥ pour les matrices (m × n) :
– A > B ⇔ ∀(i, j), aij > bij
– A ≥ B ⇔ ∀(i, j), aij ≥ bij
Nous définissons donc les matrices :
– A est non-négative, i.e., A ≥ 0
– A est positif, i.e., A > 0
Clairement : A > 0 ⇒ A ≥ 0.
L’espace vectoriel Rn muni de la relation d’ordre partiel ≥ est un espace de Riesz
[59], c’est-à-dire pour tout couple (x, y) d’éléments de Rn ,
– sup(x, y) existe (le plus petit des majorants de {x, y}
– inf(x, y) existe (le plus grand des minorants de {x, y}
Définissons maintenant pour tout x ∈ Rn :

x+ = sup(x, 0); x− = sup(−x, 0) = (−x)+ = − inf(x, 0)

Il est clair que pour tout x ∈ Rn , x+ > 0 et x− > 0 et :

x = x+ − x− ; |x| = x+ + x− (3.1)

D’autre part, on a pour tout x, y ∈ Rn :


1
sup(x, y) = x + sup(y − x, 0) = x + (y − x)+ =

x + y + |x − y|
2
x + y = sup(x, y) + inf(x, y) (relation de Dedekind)

Lemme 3.1 Soit x ∈ Rn et soient u, v ∈ Rn+ tels que :

x=u−v

Alors nous avons :


x+ ≤ u, x− ≤ v

Autrement dit, la décomposition de x en x+ − x− est minimale.

Preuve: Nous avons :

x+ = (u − v)+ = sup(u − v, 0) = sup(u, v) − v

Donc, si u > v alors il vient :

x+ = u − v ≤ u, car u, v ≥ 0
3.2 Rappels mathématiques et résultats préliminaires 57

et si u ≤ v, alors :
x+ = v − v = 0 ≤ u

Pour montrer x− ≤ v, il suffit de remarquer que :

x− = (u − v)− = − inf(u − v, 0) = sup(v − u, 0) = sup(u, v) − u

et d’appliquer le raisonnement précédent. 


De la même manière, pour toute matrice A ∈ Rm×n on définit :

A+ = (A+
ij ); où A+
ij = sup(Aij , 0)

A− = (A−
ij ); où A−
ij = − inf(Aij , 0)

Il est clair que :

A+ ≥ 0; A− ≥ 0; A = A+ − A − ; |A| = A+ + A− (3.2)

En nous servant du lemme 3.1, nous pouvons aisément établir le lemme suivant :

Lemme 3.2 Soit x ∈ Rn et soit A ∈ Rm×n , alors :

(Ax)+ ≤ A+ x+ + A− x− ; (Ax)− ≤ A+ x− + A− x+ (3.3)

Preuve: Remarquons que :

Ax = (A+ − A− )(x+ − x− ) = (A+ x+ + A− x− ) − (A+ x− + A− x+ )

Posons :
u = A+ x + + A − x − , v = A+ x − + A− x +

Ainsi, l’application du Lemme 3.1 donne immédiatement le résultat. 

Sur l’inclusion des polyèdres


Soient Q ∈ Rq×n et P ∈ Rp×n deux matrices. Définissons les ensembles suivants :
n o
Q = x ∈ Rn \ Qx ≤ λ
n o
P = x ∈ Rn \ P x ≤ β
58 Chap 3. Commande dissipative des réseaux de transport

Théorème 3.1 (Hennet [60]) Une condition nécessaire et suffisante pour que Q ⊆ P est
qu’il existe une matrice K ∈ Rp×q telle que :

Kij ≥ 0; ∀i = 1 · · · p, j = 1···q
KQ = P
Kλ ≤ β

Le théorème 3.1 donne une condition nécessaire et suffisante du problème suivant : si x


est solution du système d’inégalités Qx ≤ λ alors x est aussi une solution du système
d’inégalités P x ≤ β

Sur les Inégalités Matricielles Linéaires (LMI)


Une inégalité matricielle linéaire (LMI) est une relation de type :
n
X
F (x) = F0 + x1 F1 + ... + xn Fn = F0 + xi F i  0 (3.4)
i=1

où x = (x1 , · · · , xn )T est un vecteur réel à n composantes et les matrices Fi ∈ Rn×n


sont symétriques. Fi sont des données, x est l’inconnue. Le signe d’inégalité  signifie
que la matrice symétrique F (x) doit être semi-définie positive. Il est possible de traiter
des inégalités strictes du type F (x)  0 qui signifie que la matrice F (x) est définie
positive. On consultera avec profit l’ouvrage de [61] qui constitue un très bon répertoire
de nombreux problèmes faisant appel aux LMIs.
Considérons à titre d’exemple le problème de la recherche d’une matrice réelle P =
P T d’ordre 2 définie positive. La matrice P dépend alors de trois paramètres xi , i = 1, 2, 3
et peut s’écrire :
! ! ! !
x1 x2 1 0 0 1 0 0
P = PT = = x1 +x2 +x3 0
x2 x3 0 0 1 0 0 1
| {z } | {z } | {z }
F1 F2 F3

Une propriété remarquable des LMIs est la possibilité de regrouper plusieurs LMIs
F 1 (x)  0, · · · , F q (x)  0 en une seule LMI bloc-diagonale :
 
F 1 (x)
F (x) = 
 .. 
0
 . 
q
F (x)
3.3 Définition des systèmes discrets dissipatifs 59

Cette propriété découle du fait que les valeurs propres d’une matrice diagonale par blocs
sont constituées par les valeurs propres des matrices de la diagonale.

Quelques outils pour les LMIs


Certaines inégalités non-linéaires peuvent être également transformées en LMIs à
l’aide du complément de Schur. En effet, soit
" #
R(x) S(x)
F (x) =
S T (x) Q(x)

où R(x) = RT (x), Q(x) = QT (x) inversible, et S(x) dépendent linéairement de x.

Définition 3.1 Le complément de Schur du bloc Q(x) de la matrice F (x) est la matrice :

R(x) − S(x)Q−1 (x)S T (x)

Le complément de Schur apparaît naturellement comme le résultat d’un échantillonnage


partiel de F (x) à l’aide du pivot de Gauss. Nous avons alors le résultat suivant :

Lemme 3.3 ([61]) On suppose que Q(x) est définie positive (respectivement semi-définie
positive).
– F (x)  0 si et seulement si R(x) − S(x)Q−1 (x)S T (x)  0.
– F (x)  0 si et seulement si R(x) − S(x)Q−1 (x)S T (x)  0.

Remarquons à partir de ce lemme que R(x)  0 est une condition nécessaire pour que
F (x)  0. Pour le montrer, il suffit de remarquer que :
" # 
R S y
(y T , z T ) T = y T Ry + 2y T Sz + z T Qz  0
S Q z

implique, en posant z = 0 , y T Ry  0.

3.3 Définition des systèmes discrets dissipatifs


Le concept d’énergie est d’une grande utilité dans l’analyse des systèmes physiques.
La plupart des systèmes physiques peuvent être étudiés à partir du gain et de la perte
d’énergie. Intuitivement, un système dissipatif dissipe de l’énergie et ne peut la produire.
60 Chap 3. Commande dissipative des réseaux de transport

Autrement dit, toute augmentation de l’énergie stockée est seulement due à l’environne-
ment extérieur. Cette remarque implique l’existence de deux types de fonctions d’éner-
gies : la fonction d’approvisionnement représentant l’énergie injectée au système et la
fonction de stockage représentant l’énergie stockée dans le système.
L’interaction entre la théorie des systèmes dissipatifs et les systèmes dynamiques ne
remonte pas assez loin dans le passé. La présentation de la chronologie des résultats per-
met de réaliser à quel point cette théorie est récente. En effet, dans [62], en étudiant les
phénomènes de dissipation dans les circuits électriques, Zames semble être le premier à
étudier les systèmes dissipatifs sans qu’ils aient été encore nommés. Plus tard, dans [63],
Willems, sous une écriture condensée, a repris ce travail en introduisant pour la première
fois les notions d’énergies d’approvisionnement et de stockage. L’objectif de l’étude était
de faire l’interconnexion entre les systèmes dissipatifs et la théorie de la commande. Une
première application de cette théorie a été mise en évidence par Popov [64] pour la syn-
thèse d’une loi de commande pour les systèmes Lury Postnikov. L’objectif de la com-
mande était la stabilisation absolue de ce type de système. Plus récemment, ce principe
a été largement exploité d’une manière implicite ou explicite pour de nouveaux dévelop-
pements en matière de stabilité et de stabilisation. On consultera avec profit l’ouvrage de
Brogliato [65] qui présente une excellente introduction sur ce sujet.
Dans la suite, les définitions et les notations utilisées sont présentées de la façon la
plus générale, dans le but de montrer le principe de la dissipation. Des spécialisations
sont apportées chaque fois que cela est opportun.
On s’intéresse aux systèmes discrets non linéaires affines par rapport à la commande
définis par l’équation suivante :
x(k + 1) = f (x(k)) + g(x(k))u(k),
(3.5)
y(k) = h(x(k), u(k)),
où x ∈ Rn et u, y ∈ Rm sont l’état, l’entrée et la sortie du système respectivement.
f : Rn → Rn , h : Rn → Rm et g : Rn → Rn×m sont supposées continues avec f (0) = 0.
Supposons donnée une fonction S(·) définie sur Rm × Rm , S est une fonction de u et
de y et S(0, 0) = 0. Cette fonction est appelée taux d’approvisionnement. Notons que
seules l’entrée et la sortie sont utilisées pour formuler la fonction d’approvisionnement.
Ceci est cohérent avec la logique physique de cette formulation. En effet, pour la plupart
des systèmes physiques, la fonction S(·) représente la quantité d’énergie fournie au sys-
tème. Par exemple, dans le cas des réseaux électriques, en appliquant un potentiel v aux
3.3 Définition des systèmes discrets dissipatifs 61

bornes on obtient un courant i. La quantité d’énergie fournie se traduit alors dans ce cas
par la puissance électrique donnée par P = vi.
Il va sans dire que cette énergie doit être définie par une limitation pratique, à savoir,
elle doit être finie. C’est pourquoi, dans la suite, nous supposons que pour tout u ∈ Rm
et pout tout x(0) ∈ Rn , la sortie y(k) du système (3.5) doit être telle que S(y(k), u(k))
vérifie :
k
X
S(y(i), u(i)) < ∞, ∀k ≥ 0.
i=0
En termes plus précis, la somme de la fonction S(y(k), u(k)) sur un intervalle de temps
borné doit être finie.
Définition 3.2 Le système (3.5) est dit dissipatif par rapport au taux d’approvisionne-
ment S(y, u), s’il existe une fonction non-négative V : Rn −→ R, avec V (0) = 0,
appelée fonction de stockage, telle que pour tout u ∈ Rm et pour tout k ∈ N :

V (x(k + 1)) − V (x(k)) ≤ S(y(k), u(k)). (3.6)

Si l’inégalité (3.6) est stricte, le système est dit strictement dissipatif. I


Notons tout de suite que l’inégalité (3.6) est satisfaite si et seulement si l’inégalité suivante
est satisfaite :
k
X
V (x(k + 1)) − V (x(0)) ≤ S(y(i), u(i)); ∀k, u, x(0). (3.7)
i=0

Cette équivalence peut être démontrée comme suit : (3.6)⇒ (3.7) est triviale. Inversement,
puisque (3.7) est satisfaite pout tout k, pour tout u ∈ Rm et pout tout état initial x(0) =
x ∈ Rn , posons x(0) = x = x(j), y(0) = y(j), u(0) = u(j) et k = j, on déduit à partir
de (3.7)
V (x(j + 1)) − V (x(j)) ≤ S(y(j), u(j)); ∀j, u(j).
ce qui est exactement (3.6).
L’inégalité (3.7) est appelée inégalité de dissipation. Elle signifie que la quantité
d’énergie stockée dans un intervalle de temps n’est jamais supérieure à l’énergie totale
fournie durant cette période. Autrement dit, un système dissipatif ne peut stocker plus
d’énergie que l’environnement extérieur lui fournit.
Remarque 3.1 Il est important de noter que, malgré qu’initialement, le concept de la
dissipation a été motivé par l’étude de l’énergie, les définitions et les résultats qui en
découlent restent valables même si aucune interprétation de l’énergie n’est donnée. I
62 Chap 3. Commande dissipative des réseaux de transport

3.3.1 Commande dissipative des systèmes discrets


La théorie des systèmes dissipatifs a connu un regain d’intérêt très important ces dix
dernières années. Cet aspect de la théorie des systèmes a été motivé essentiellement par
les applications dans le domaine de la commande des systèmes physiques, car ces outils
permettent de moduler par bouclage l’énergie physique de façon à ce que cette énergie
soit utilisable comme fonction de Lyapunov à des fins de commande et de stabilisation.
Ces développements ont conduit à ce qu’on appelle parfois dissipativity-based control,
ou commandes dissipatives.

Principe de la commande dissipative : La stratégie de la commande dissipative consiste


à trouver un contrôleur qui transforme un système non-dissipatif en un système dissipatif.
Ceci passe, tout d’abord, par le choix d’une fonction de stockage d’énergie désirée ayant
un minimum à l’équilibre souhaité et par l’injection de l’amortissement (commande) dans
le système. Dans ce cadre, la classe de systèmes qui peuvent être rendus dissipatifs est dite
feedback dissipative. Ainsi, le problème de la commande dissipative peut être formulé
comme suit :

Problème de la commande dissipative : Soient S(y, u) le taux d’approvisionnement et


V (x) une fonction de stockage. Alors, pour le système x(k + 1) = f (x(k) + g(x(k))u(k),
trouver, si c’est possible, un retour d’état u = α(x), tel que le système en boucle fermée :

x(k + 1) = f (x(k)) + g(x(k))α(x(k)), (3.8)

soit dissipatif. Autrement dit, le système transformé (3.8) vérifie l’inégalité de dissipation
suivante :

V f (x) + g(x)α(x, v) − V (x) ≤ S(α(x), y). (3.9)

3.3.2 Avantages et inconvénients


Plusieurs atouts majeurs de cette stratégie peuvent être soulignés. En effet :
1. Il est possible, comme nous allons le voir avec les systèmes de transport, de donner
aux énergies une interprétation cohérente avec la réalité physique du système. Cette
propriété peut être d’une grande importance dans des applications industrielles.
3.4 Spécialisation aux systèmes de transport 63

2. la stratégie de commande présente une faible sensibilité vis-à-vis de la structure du


modèle. En effet, les systèmes dissipatifs sont robustes vis-à-vis des incertitudes
paramétriques et des dynamiques non modélisées.
3. la stratégie de commande est une approche systématique pouvant fonctionner sans
connaissance préalable de la solution du système.
Cependant, si la commande dissipative est calculée à partir d’une information très
riche, à savoir la connaissance du modèle du système, la qualité de ce dernier dépend de
la connaissance parfaite des paramètres définissant la dynamique du système. Dans toute
application pratique, ces quantités ne sont connues qu’avec une part d’incertitude, et la
dégradation de performance découlant d’un choix impropre des valeurs des paramètres
peut être selon les cas très importante. Le développement de stratégies de contrôle ef-
ficaces nécessite alors la prise en compte de ces incertitudes inhérentes à tout système
physique, car celles-ci conduisent souvent à une grande instabilité.
En dépit de ce handicap sérieux, les avantages de cette approche, le succès industriel
qu’elle a rencontré ainsi que l’efficacité que peuvent apporter les techniques du calcul
numérique, sont des arguments suffisants pour justifier l’intérêt porté à cette approche.
Dans la suite, nous montrerons comment la commande dissipative est également im-
portante dans une optique de régulation d’un réseau de carrefours à feux.

3.4 Spécialisation aux systèmes de transport


La présentation de la formulation générale de la commande dissipative est donnée
dans la section précédente. Dans cette partie, nous précisons la définition du problème
qui nous concerne. Cette définition est faite par spécialisation de la commande dissipative
au problème de la régulation d’un réseau de carrefours à feux.
Pour introduire ce que nous allons faire dans la suite, rappelons d’abord le modèle de
transport établi dans le chapitre 2.

x(k + 1) = x(k) + l(k) + r(k) − d(k), ∀k ∈ N (3.10)

où x = [x1 , · · · , xn ]T , l = [l1 , · · · , ln ]T , r = [r1 , · · · , rn ]T , d = [d1 , · · · , dn ]T avec :


– xi le nombre de véhicules dans chaque tronçon i.
– ri le nombre d’entrées de véhicules de l’extérieur dans le tronçon i.
– di le nombre de sorties de véhicules du tronçon i vers l’extérieur.
64 Chap 3. Commande dissipative des réseaux de transport

n
X
– li (k)= (σi,j (k) − σj,i (k)) les échanges de véhicules entre le tronçon i et les
j=1,j6=i
tronçons j.
Xn
– σi,j , le flux de véhicules entrants dans le tronçon i depuis les tronçons j.
j=1,j6=i
X n
– σj,i , le flux de véhicules sortants du tronçon i vers les tronçons j.
j=1,j6=i
Rappelons que σi,j = 0, dj = 0 si et seulement si xj = 0. Cette contrainte implique que si
le nombre de véhicules du sous-système j est égal à zéro, alors ce sous-système ne peut
pas fournir des véhicules à son environnement.
L’utilisation de la commande dissipative pour les systèmes de transport n’est pas sys-
tématique. Elle nécessite donc un travail d’adaptation afin de pouvoir l’appliquer à notre
système. En effet, la théorie des systèmes dissipatifs nécessite de définir clairement les
deux points suivants :
– Les énergies d’approvisionnement et de stockage.
– Le domaine de commande admissible.
Les énergies d’approvisionnement et de stockage précisent les objectifs par rapport aux-
quels la commande est définie. Le domaine de commande admissible est le sous-ensemble
de l’espace de commande dans lequel une commande est à rechercher.

Energie de stockage : Dans le chapitre précédent, nous avons vu que l’entropie ψ(x) =
T
x P x est une mesure du désordre dans le réseau de transport. Ce désordre est provoqué
par l’accumulation des véhicules dans les voies. Ces dernières stockent une partie des
véhicules en files d’attente et en dissipent d’autres par les feux de signalisation. Ainsi,
l’entropie est un représentant idéal pour la fonction de stockage.

Energie d’approvisionnement : Le taux d’approvisionnement S reflète des facteurs


extérieurs au système. Dans le contexte du transport, toute augmentation du nombre de
véhicules dans le réseau provoque un désordre dans le système. Ce désordre dépend non
seulement des véhicules fournis par le milieu extérieur r(k), mais aussi de la répartition
des véhicules entre les sous-systèmes. En effet, une même quantité de véhicules apporte
plus de désordre aux voies les plus occupées qu’aux voies les moins fréquentées. Ainsi,
puisque les taux d’occupation représentent la manière dont les voies sont occupées, il est
naturel de considérer la fonction d’approvisionnement S en fonction de la quantité r(k) et
3.4 Spécialisation aux systèmes de transport 65

du vecteur d’occupation f (k). Cependant, puisque f (k + 1) correspond à la fin du cycle


k, il est clair que la quantité de désordre fournie par le milieu extérieur pendant le cycle k
est donnée par :
S(k) = f T (k + 1)r(k)

Puisque f = P x (voir équation (2.17)), nous avons alors :

S(k) = xT (k + 1)P r(k) (3.11)

D’où la définition suivante.

Définition 3.3 Le système de transport (3.10) est dissipatif par rapport au taux d’appro-
visionnement S(k) et la fonction de stockage ψ(x) si et seulement si :

ψ(x(k + 1)) − ψ(x(k)) ≤ S(k), ∀k ∈ N (3.12)

Ainsi, la dissipativité par rapport au taux d’approvisionnement S(k) implique que la quan-
tité du désordre stockée pendant un cycle n’est jamais supérieure au désordre fourni par
le milieu extérieur durant ce cycle. Autrement dit, un système de transport dissipatif a une
tendance à diminuer son désordre et par conséquent, devient mieux organisé.
Soulignons tout de suite que le système de transport (3.10) n’est pas dissipatif par
rapport au taux d’approvisionnement S(k). En effet, observons d’abord que la différence
totale de l’entropie ψ(x) le long de la trajectoire du système est donnée par :
1 1
∆ψ(x(k)) = xT (k + 1)P x(k + 1) − xT (k)P x(k)
2  2 
T
= x (k + 1)P x(k + 1) − x(k) − l(k)
1 T  
− x(k + 1) − x(k) P x(k + 1) − x(k) + xT (k + 1)P l(k)
2

Or, x(k + 1) − x(k) − l(k) = r(k) − d(k) et S(k) = xT (k + 1)P r(k), il vient :

T 1 T  
∆ψ(x(k)) = S(k) − x (k + 1)P d(k) − x(k + 1) − x(k) P x(k + 1) − x(k)
2
+ xT (k + 1)P l(k)
66 Chap 3. Commande dissipative des réseaux de transport

Comme la matrice P est définie positive et l’état x(k) ainsi que d(k) sont positifs, il
s’ensuit :
1 T  
− x(k + 1) − x(k) P x(k + 1) − x(k) ≤ 0; −xT (k + 1)P d(k) ≤ 0
2
On en déduit alors :
∆ψ(x(k)) ≤ S(k) + xT (k + 1)P l(k) (3.13)
Pour simplifier les équations, posons g(x(k)) = xT (k + 1)P l(k). Puisque :
n
X
li (k) = (σi,j (k) − σj,i (k))
j=1,j6=i

il vient :
n n n
X xi (k + 1)li (k) X X xi (k + 1)(σi,j (k) − σj,i (k))
g(x(k)) = =
i=1
x∗i i=1 j=1,j6=i
x∗i
n−1 X
n 
X xi (k + 1) xj (k + 1)  
= − σ i,j (k) − σ j,i (k)
i=1 j=i+1
x∗i x∗j
xi (k+1) xj (k+1)  
Si nous supposons que x∗i
− x∗j
σi,j (k) − σj,i (k) ≤ 0 pour tout i 6= j et
pour tout k ∈ N, alors ∆ψ(x(k)) ≤ S(k), ∀k ∈ N. Par conséquent, le système de
transport serait dissipatif. Malheureusement, cette hypothèse n’existe pas dans la réalité,
car elle implique que les voies les plus chargées fournissent plus de véhicules aux voies
les moins chargées ; ce qui n’est pas réaliste dans les systèmes de transport. Même la
situation où σi,j (k) = σj,i (k) pour tout k ∈ N (les voies i et j échangent la même quantité
de véhicules) n’est pas réaliste car les directions des véhicules sont déterminées par les
conducteurs. Ainsi, contrairement aux systèmes thermodynamiques, la dissipativité des
systèmes de transport n’est pas naturelle, d’où la nécessité de faire appel à la notion de
commande dissipative.

3.4.1 Commande dissipative des réseaux de transport


Dans cette partie, nous adoptons une démarche qui consiste à séparer l’étude de la
dissipativité des réseaux de transport dans le cas ou le modèle d’état est non-linéaire
et l’étude de la dissipativité dans le cas linéaire. Il s’agit de simplifier la présentation
tout en traitant l’ensemble des aspects du problème. Une fois que ces deux études sont
présentées séparément, le principe de la commande dissipative des réseaux de transport
devient évident.
3.4 Spécialisation aux systèmes de transport 67

3.4.2 Cas d’un modèle non-linéaire


Afin de pouvoir présenter le modèle d’état non-linéaire du système, un certain nombre
de remarques est nécessaire. En effet, considérons à titre d’exemple l’intersection à deux
phases de la figure 3.1. Soit gj , j = 1, · · · , 4, les temps des feux verts de chaque mouve-

F IGURE 3.1 – Intersection à deux phases

ment. Il est clair que :

g1 = g2 = ge1
g3 = g4 = ge2

où ge1 et ge2 sont les temps des feux verts effectifs de la phase 1 et la phase 2 respecti-
vement (voir chapitre 1). Or, on sait que les feux verts effectifs sont liés par l’équation
suivante :
ge1 + ge2 = c − lo

où lo est le rouge intégral pendant un cycle. Il s’ensuit que ge1 et ge2 ne sont pas indépen-
dants. Ainsi, si ge1 est choisi comme la variable de commande, les temps des feux verts
des quatre mouvements peuvent être représentés par la relation linéaire suivante :
       
g1 ge1 1 0
       
g2  ge1   1 
  =   =   ge1 +  0 
 
g  g  −1 c − l  (3.14)
 3   e2     o

g4 ge2 −1 c − lo

Ainsi, pour un carrefour à deux phases, il existe une seule variable de commande indé-
pendante.
68 Chap 3. Commande dissipative des réseaux de transport

F IGURE 3.2 – Intersection à trois phases

Considérons maintenant l’intersection à trois phases de la figure 3.2. Ce carrefour est


composé de six mouvements. Chaque mouvement est associé à un feux vert gj . Dans ce
cas, les feux verts effectifs correspondants aux trois phases ge1 , ge2 et ge3 sont liés aux
feux verts gj par la relation suivante :
   
g1 ge1
   
g  g + g 
 2   e1 e3 
   
g3   ge3 
 =  (3.15)
g  g + g 
 4   e2 e3 
   
g5   ge2 
   
g6 ge1 + ge2

Comme :
ge1 + ge2 + ge3 = c − lo
3.4 Spécialisation aux systèmes de transport 69

il existe alors deux variables indépendantes. Si nous choisissons ge1 et ge2 comme les
variables de commande, alors l’équation (3.15) devient :
     
g 1 0 0
 1    
g   0 −1 c − l 
 2   !   o
    
g3  −1 −1 ge1 c − lo 
 =  +   (3.16)
g  −1 0  g
c − lo 

 4   e2
     
g5   0 1   0 
     
g6 1 1 0
En résumé, notons g ∈ Rn le vecteur des feux verts du réseau de carrefours et soit u ∈
Rm le vecteur des feux verts effectifs du réseau dont les composantes sont indépendantes.
Alors g et u sont liés par la relation suivante :

g = Gu + ξ (3.17)

où G ∈ Rn×m et ξ ∈ Rn .
Regardons maintenant comment les échanges de flux σi,j entre les tronçons peuvent
être exprimés par la commande. En effet, comme les échanges des flux de trafic entre les
tronçons sont déterminés par les feux de signalisation, ils peuvent s’écrire sous la forme
(voir [44])
σi,j (k) = sj λi,j gj (k) (3.18)
où λi,j est la proportion du flux de sortie de la voie j vers la voie i, c’est-à-dire le pourcen-
tage des véhicules allant de la voie j vers la voie i par rapport au nombre total de véhicules
présents sur la voie j. gj (k) est le feu vert de la voie j et sj son débit de saturation. Ainsi,
à partir de l’équation (3.18) nous avons :
Xn n
X
li (k) = σi,j (k) − σj,i (k)
j=1,j6=i j=1,j6=i
X n n
X
= sj (x)gj (k)λi,j (x) − si (x)gi (k)λj,i (x)
j=1,j6=i j=1,j6=i
X n n
X
= sj (x)gj (k)λi,j (x) − si (x)gi (k) λj,i (x) (3.19)
j=1,j6=i j=1,j6=i

Définissons le vecteur Li par : Li = [Li,1 , · · · , Li,n ]T ∈ Rn où


(
−si nj=1,j6=i λj,i : pour i = j
P
Li,j =
sj λi,j : pour i 6= j
70 Chap 3. Commande dissipative des réseaux de transport

Alors, les équations (3.19) et (3.17) donnent :


n
X n
X
li (k) = Li,j gj (k) + Li,i gi (k) = Li,j gj (k) = LTi g(k)
j=1,j6=i j=1

= Li Gu(k) + Li ξ (3.20)

Par ailleurs, si di (x) est différentiable et puisque di (x) = 0 si et seulement si xi =


0, i = 1, · · · , n, alors di (x) peut s’écrire sous la forme di (x) = dˆi (x)xi avec 0 ≤ dˆi (x) ≤
1, car di (x) ≤ xi .
Cela fait, posons maintenant D(x) = diag dˆ1 (x), · · · , dˆn (x) , A(x) = I − D(x) et


L = [L1 , · · · , Ln ]T . Dans ce cas, l’équation (3.10) peut s’écrire sous la forme :

x(k + 1) = A(x)x(k) + Bu(k) + h(k) (3.21)

où B = LG ∈ Rn×m et h(k) = r(k) + GLξ ∈ Rn . Notons tout de suite que la matrice A


est non-négative car dˆi (x) ≤ 1 et 0 ≤ A(x) ≤ I.
Il va sans dire que le flux d’entrée représenté par le vecteur r(k) n’est pas connu en
général. Dans la pratique, la seule information disponible sur ce vecteur incertain réside
dans la connaissance des bornes des intervalles auxquels appartiennent ces composantes.
C’est pourquoi, dans la suite, nous supposons que l’incertitude h(k) est de type borné en
norme, c’est-à-dire les contraintes sur h(k) sont définies par :

R = {h ∈ Rn / khk2 ≤ hm , hm > 0} (3.22)

où, k k2 est la norme euclidienne.

Domaine de commande admissible : Comme pour toute stratégie de synthèse, il est


nécessaire de définir clairement le domaine de commande admissible. En effet, la com-
mande du système est à rechercher dans un ensemble défini par deux limitations pra-
tiques :
– La première est la nécessité de prendre en compte des contraintes sur l’état. En effet,
pour que le modèle de transport ait un sens physique, il faut que l’état appartienne
au domaine E = {x ∈ Rn /x ≥ 0}. Ainsi la commande est à rechercher parmi les
suites de commandes telles que x ∈ E pour tout k ∈ N. Soit x∗ = [x∗1 , · · · , x∗n ]T le
vecteur des capacités maximales de chaque tronçon. Puisque le nombre de véhicules
3.4 Spécialisation aux systèmes de transport 71

ne peut pas dépasser la capacité de chaque tronçon, les contraintes sur l’état sont
alors définies par :
X = {x ∈ Rn / 0 ≤ x ≤ x∗ } (3.23)

– La deuxième limitation est la nécessité de prendre en compte des contraintes sur la


commande. En effet, les feux verts effectifs doivent respecter les conditions aux li-
mites suivantes 0 ≤ gej ≤ c. Cependant, certaines conditions aux limites ne corres-
pondent pas à la réalité physique du système. En particulier, gej = 0 (resp, gej = c)
se traduit par l’absence du feu vert effectif pour le tronçon j (resp, l’absence des
feux verts effectifs pour les tronçons antagonistes). Par conséquent, il est important
de sélectionner deux bornes gmin et gmax sur la valeur de la commande telles que
gmin ≤ gej ≤ gmax . Ces bornes peuvent être fournies par les actionneurs et doivent
être convenablement choisies. En effet, une durée courte ou longue du feu vert ef-
fectif n’est pas acceptable sur le plan pratique. De ce fait, les feux verts effectifs
doivent respecter les conditions aux limites suivantes :

umin = gmin ≤ uj ≤ gmax = umax (3.24)

Les contraintes sur u(k) sont alors définies par :

U = {u ∈ Rm / umin ≤ u ≤ umax } (3.25)

Notons que ces deux contraintes traduisent une cohérence avec le fonctionnement réel
d’un carrefour. En effet, puisque le cycle de signalisation est borné, le temps du feu vert
effectif doit être borné. En outre, puisque l’état traduit dans notre cas le nombre de véhi-
cules présents dans un tronçon, nous comprenons aisément qu’il soit positif.
Sur ce, nous terminons notre aperçu général de la formulation du modèle non-linéaire
pour passer à la définition du problème de la commande et sa solution en terme de LMI.

Problème de la commande dissipative des systèmes de transport


le problème de la commande dissipative pour notre système peut être formulé comme
suit : trouver, si c’est possible, un retour d’état u = α(x), tel que le système (3.21)
transformé :
x(k + 1) = A(x)x(k) + Bα(x(k)) + h(k) (3.26)
72 Chap 3. Commande dissipative des réseaux de transport

soit dissipatif pour tout h ∈ R. En d’autres termes, d’après l’inégalité (3.13), trouver un
retour d’état u = α(x) tel que pour tout h ∈ R, l’inégalité suivante est satisfaite :

g(α(x)) = αT (x)B T P Bα(x) + αT (x)B T P (Ax + h) ≤ 0 (3.27)

Il est important de noter que l’existence des contraintes (3.25) implique que le retour
d’état u = α(x) n’est admissible que dans une région déterminée de l’espace d’état,
c’est-à-dire :
Ux = {x ∈ Rn / umin ≤ α(x) ≤ umax } (3.28)

Toutefois, tout état émanant de X peut parfaitement donner une trajectoire sortant
de l’ensemble Ux . De ce fait, il est nécessaire d’assurer l’inclusion X ⊆ Ux . De cette
manière, si x(k) ∈ X alors on est sûr que x(k) ∈ Ux . L’objectif de la commande est donc
le suivant :

Objectif :
1. trouver un retour d’état u = α(x) tel que pour tout h ∈ R, l’inégalité suivante est
satisfaite :

g(α(x)) = αT (x)B T P Bα(x) + αT (x)B T P (Ax + h) ≤ 0 (3.29)

2.
X ⊆ Ux (3.30)

Dans la suite, nous adoptons une démarche qui consiste à séparer l’étude de la dissi-
pativité du système et l’étude de l’inclusion X ⊆ Ux . Il s’agit de simplifier la présentation
tout en traitant l’ensemble des aspects du problème. Une fois que ces deux études sont
présentées séparément, leur intégration dans une formulation complète devient évidente.

Solution du problème :
Sur la dissipativité du système :

Pour simplifier les notation, posons M = B T P B, y = 12 B T P Ax et w = 12 B T P h. Il


vient à partir de (3.29) que :

g(u) = uT M u + 2uT y + 2uT w (3.31)


3.4 Spécialisation aux systèmes de transport 73

Or, on sait que uT w ≤ |uT w| ≤ kuk2 kwk2 . De plus, pour tout h ∈ R nous avons :
1 1 1
kwk2 = k B T P hk2 ≤ kB T P k2 khk2 ≤ kB T P k2 hm , wm
2 2 2
On en déduit que :
g(u) ≤ uT M u + 2uT y + 2kuk2 wm (3.32)

Or, on sait que kuk2 ≤ kuk1 , où kuk1 est la norme 1. Il vient kuk1 = T u, car u > 0.
Rappelons que  = (1, · · · , 1)T . Ainsi, l’inégalité (3.32) implique :

g(u) ≤ uT M u + 2uT (y + wm ) , gm (u) (3.33)

Donc, si gm (u) ≤ 0, alors g(u) ≤ 0 et le système serait dissipatif. Le problème main-


tenant est de trouver u telle que gm (u) ≤ 0. En effet, observons d’abord que, puisque
T l = T Bu = 0 pour tout u (voir chapitre 2), alors T B = 0. Ceci implique que les
lignes de B sont linéairement dépendantes si bien que M est singulière. Par conséquent,
la matrice M est symétrique semi-définie positive, et donc toutes ses valeurs propres
sont non-négatives. Ainsi, il existe une matrice orthogonale K (K T = K −1 ) telle que
M = KCK T , où C est une matrice diagonale sous la forme :

C = diag(ν1 ; · · · , νp , 0, · · · , 0)

avec νi > 0 sont les valeurs propres de M et p = rang(M ). Les colonnes de K sont les
vecteurs propres de M . Posons D = diag(ν1 ; · · · , νr ), D est donc inversible et M peut
s’écrire comme :
1
! ! 1
!
D2 0 Ip 0 D2 0
M =K KT
0 Im−p 0 0 0 Im−p

Définissons la matrice J par :


1
!
D2 0
J =K
0 Im−p

Alors J −1 est bien définie car la matrice K est orthogonale. Il vient alors :
!
Ip 0
M =J JT
0 0
74 Chap 3. Commande dissipative des réseaux de transport

Dans ce cas, la fonction gm (u) se transforme naturellement en :


!
Ip 0
gm (u) = uT J J T u + 2uT (y + wm )
0 0
Soient z = J T u et θ = J −1 (y + wm ), alors gm peut s’écrire sous la forme :
! !
Ip 0 0 0
gm (z) = z T z + 2z T θ = z T z + 2z T θ − z T z
0 0 0 Im−p
!
0 0
Or, −z T z ≤ 0, il vient :
0 Im−p

gm (z) ≤ z T z + 2z T θ = (z + θ)T (z + θ) − θT θ , f (θ)

Soit maintenant R une matrice telle que z = Rθ. Il s’ensuit que :


h i
f (θ) = (z + θ)T (z + θ) − θT θ = θT (R + I)T (R + I) − I θ (3.34)

Ainsi, f (θ) ≤ 0 pour tout θ si et seulement si (R + I)T (R + I) − I est semi-définie


négative, c’est-à-dire :
(R + I)T (R + I) − I  0
ou d’une manière équivalente :

I − (R + I)T (R + I)  0 (3.35)

L’application du lemme 3.3 de Schur avec R = Q = I, S = (R + I)T donne (voir rappels


mathématiques) : !
I (R + I)T
0 (3.36)
(R + I) I
Ainsi, le système (3.26) est dissipatif si la LMI (3.36) est faisable. D’où le théorème
suivant.

Théorème 3.2 Soit la matrice R solution de la LMI suivante :


!
I (R + I)T
0
(R + I) I
Alors, pour tout h ∈ R, le retour d’état :
1
u(x) = (J T )−1 RJ −1 ( B T P Ax + wm ) (3.37)
2
rend le système (3.26) dissipatif par rapport au taux d’approvisionnement S(k) = xT (k +
1)P r(k) et la fonction de stockage ψ(x) = 12 xT P x.
3.4 Spécialisation aux systèmes de transport 75

Remarquons que si la matrice R est symétrique (i.e., RT = R), alors d’après (3.34),
f (θ) ≤ 0 si et seulement si −2 ≤ λi ≤ 0, pour toute valeur propre λi de R. En effet,
puisque R est symétrique, elle est toujours diagonalisable. Ainsi, il existe une matrice
orthogonale F telle que R = F LF T , où L est une matrice diagonale dont les éléments
diagonaux sont les valeurs propres de R. Il vient alors :

(R + I)T (R + I) − I = R2 + 2R = F (L2 + 2L)F T

d’où f (θ) ≤ 0 si et seulement si (L2 + 2L) est semi-définie négative. Or L2 + 2L =


diag(λ21 + 2λ1 , · · · , λ2n + 2λm ), on en déduit que (L2 + 2L) est semi-définie négative si
et seulement si λ2i + 2λi ≤ 0, ∀i = 1, · · · , m. D’où l’on peut inférer −2 ≤ λi ≤ 0. Nous
avons alors le corollaire suivant.

Corollaire 3.1 Soit R une matrice symétrique telle que −2 ≤ λi ≤ 0, ∀i = 1, · · · , m, où


λi sont les valeurs propres de R. Alors, pour tout h ∈ R, le retour d’état :
1
u(x) = (J T )−1 RJ −1 ( B T P Ax + wm ) (3.38)
2
rend le système (3.26) dissipatif par rapport au taux d’approvisionnement S(k) = xT (k +
1)P r(k) et la fonction de stockage ψ(x) = 12 xT P x.

Remarque 3.2 Il vient immédiatement à partir de ce corollaire que pour un choix arbi-
traire de la matrice R telle que −2 ≤ λi ≤ 0, ∀i = 1, · · · , m, le retour d’état (3.38)
fournit la classe des commandes rendant le système dissipatif. Ainsi, le corollaire 3.1
donne une solution explicite mais pas unique au problème de la commande dissipative.
Cette liberté de choix de la matrice R confère à la commande dissipative dans le cadre
de la régulation des carrefours à feux une flexibilité permettant de l’adapter à plusieurs
situations possibles. Ceci est, à notre sens, un avantage certain, car elle nous offre un
ensemble de choix possibles pour améliorer les performances de la commande de notre
système. En outre, dans le cas particulier d’un système de transport sans flux d’entrée,
i.e., r ≡ 0, le taux d’approvisionnement devient S(k) = 0. Dans ce cas, si R est choisie
telle que −2 < λi < 0, ∀i = 1, · · · , m, alors (R + I)T (R + I) − I est définie négative.
Il vient ∆ψ(x(k)) < 0, x 6= 0, ∀k ∈ N, ce qui montre que l’état d’équilibre x = 0 est
asymptotiquement stable au sens de Lyapunov. I
76 Chap 3. Commande dissipative des réseaux de transport

Sur l’inclusion X ⊆ Ux

Pour introduire ce que nous allons faire, commençons par préciser un peu le cadre.
Soit XA l’ensemble défini par :

XA = {x ∈ Rn / 0 ≤ Ax ≤ x∗ } (3.39)

Proposition 3.1 Nous avons X ⊆ XA

Preuve: La preuve est immédiate si on remarque que 0 ≤ A ≤ I, ∀x ∈ X 


Il vient immédiatement à partir de cette proposition que si XA ⊆ Ux alors X ⊆ Ux . Cela
dit, observons d’abord que le retour d’état (3.38) peut s’écrire sous la forme :

u(x) = HA(x)x + π (3.40)

avec H = 21 (J T )−1 RJ −1 B T P et π = (J T )−1 RJ −1 wm . Ainsi, l’ensemble des contraintes


Ux peut s’écrire sous la forme :

Uπ = {x ∈ Rn / − π2 ≤ HA(x)x ≤ π1 } (3.41)

Avec, π2 = π − umin et π1 = umax − π. Donc, l’inclusion (3.30) peut alors se formuler


ainsi :

XA ⊆ Ux ⇐⇒ XA ⊆ Uπ

Posons maintenant Ax = y. Les ensembles XA et Uπ se transforment en :

Uy = {y ∈ Rn / − π2 ≤ Hy ≤ π1 }

Xy = {y ∈ Rn / 0 ≤ y ≤ x∗ }

Remarquons que puisque 0 ∈ Uy alors nécessairement nous avons π1 ≥ 0 et π2 ≥ 0. Cela


dit, la condition d’inclusion XA ⊆ Uπ peut alors se formuler ainsi :

y ∈ Xy ⇒ y ∈ U y (3.42)

I ∗
y ≤ x0 alors y est

En d’autres termes, si y est solution du système d’inégalités −I
H
y ≤ ππ12 . Ainsi, en vertu du théorème
 
aussi une solution du système d’inégalités −H
3.4 Spécialisation aux systèmes de transport 77

3.1 (voir rappels mathématiques), la condition (3.42) équivaut à l’existence d’une matrice
non-négative K ∈ R2m×2n
+ telle que :
   
I H
K = (3.43)
−I −H
 ∗  
x π1
K ≤ (3.44)
0 π2
Posons : !
K11 K12
K=
K21 K22
Il s’ensuit à partir de (3.43) et (3.44) que :

K11 − K12 = H (3.45)


K22 − K21 = H (3.46)
K11 x∗ ≤ π1 (3.47)
K21 x∗ ≤ π2 (3.48)

d’où l’on peut inférer :


H = K11 − K12 = K22 − K21 (3.49)

Les relations (3.47) et (3.48) peuvent se formuler ainsi :


!   
K11 O x∗ π1
≤ (3.50)
O K21 x∗ π2

Définissons les matrices H + et H − par :

H + = (Hij+ ); où Hij+ = sup(Dij , 0)


H − = (Hij− ); où Hij− = − inf(Dij , 0)

Il est clair que :


H + ≥ 0; H − ≥ 0; H = H+ − H− (3.51)

Nous avons alors le proposition suivante :

Proposition 3.2 Les inégalités suivantes sont satisfaites :

Hij+ ≤ min{(K11 )ij ; (K22 )ij }


Hij− ≤ min{(K12 )ij ; (K21 )ij }
78 Chap 3. Commande dissipative des réseaux de transport

Preuve: Puisque la décomposition de H en H + et H − est minimale (voir lemme 3.1)


alors l’équation (3.49) donne :

Hij+ ≤ (K11 )ij et Hij+ ≤ (K22 )ij


Hij− ≤ (K12 )ij et Hij− ≤ (K21 )ij

si bien que :

Hij+ ≤ min{(K11 )ij ; (K22 )ij }


Hij− ≤ min{(K12 )ij ; (K21 )ij }


Il résulte de cette proposition et l’inégalité (3.50) que :
!  !   
H+ O x∗ K11 O x∗ π1
≤ ≤ (3.52)
O H− x∗ O K21 x∗ π2

Par conséquent, les conditions (3.43) et (3.44) et l’équation (3.49) sont équivalentes à
l’existence de deux matrices non-négatives H1 ∈ Rm×n
+ et H2 ∈ Rm×n
+ :

H1 − H2 = H (3.53)
H1 x∗ ≤ π1 (3.54)
H2 x∗ ≤ π2 (3.55)

Finalement, en réunissant les conditions citées plus haut, nous avons la proposition
suivante.

Proposition 3.3 Supposons que π1 > 0 et π2 > 0. Alors Xy ⊆ Uy si et seulement s’il


existe deux matrices non-négatives H1 et H2 telles que :

H1 − H2 = H (3.56)
H1 x∗ ≤ π1 (3.57)
H2 x∗ ≤ π2 (3.58)

Preuve: Suffisance : Multiplions l’inégalité 0 ≤ y ≤ x∗ par H1 , il vient :

0 ≤ H1 y ≤ H1 x∗ (3.59)
3.4 Spécialisation aux systèmes de transport 79

De même, la multiplication de l’inégalité par −H2 donne :

−H2 x∗ ≤ −H2 y ≤ 0 (3.60)

L’addition maintenant de (3.59) et (3.60) implique :

−H2 x∗ ≤ (H1 − H2 )y ≤ H1 x∗ (3.61)

il vient à partir de (3.56), (3.57) et (3.58) :

−π2 ≤ Hy ≤ π1

d’où y ∈ Uy .
Nécessité : il suffit de prendre H1 = H + et H2 = H − et d’appliquer le raisonnement
plus haut. 
Finalement la solution de notre problème de commande est résumée dans le théorème
suivant :

Théorème 3.3 Supposons que π1 > 0 et π2 > 0. Alors, s’il existe une matrice R et deux
matrices non-négatives H1 et H2 telles que :
!
I (R + I)T
0
(R + I) I

H1 − H2 = H (3.62)
H1 x∗ ≤ π1 (3.63)
H2 x∗ ≤ π2 (3.64)

Alors, pour tout h ∈ R, le retour d’état :


1
u(x) = (J T )−1 RJ −1 ( B T P Ax + wm ) (3.65)
2
1. rend le système (3.26) dissipatif par rapport au taux d’approvisionnement S(k) =
xT (k + 1)P r(k) et la fonction de stockage ψ(x) = 12 xT P x.
2. respecte la contrainte X ⊆ Ux
80 Chap 3. Commande dissipative des réseaux de transport

Il va sans dire que la condition X ⊆ Ux nécessite l’hypothèse π1 > 0 et π2 > 0.


Si cette condition n’est pas vérifiée, nous pouvons envisager pour éviter la violation des
contraintes sur la commande u(x) ∈ U de prendre la fonction sat(x) suivante :

 ui,min :

 ui ≤ ui,min
sat(ui ) = ui : ui,min ≤ ui ≤ ui,max (3.66)

ui ≥ ui,max

 u
i,max :

Sur ce, nous terminons notre solution du problème de la dissipativité du modèle non-
linéaire pour passer au cas linéaire.

3.4.3 Cas d’un modèle linéaire


Pour modéliser un réseau de transport par une équation d’état linéaire, le flux de sor-
tie di ainsi que le flux d’entrée ri de chaque tronçon i peuvent s’écrire sous la forme
(voir[44]) :

di (k) = si gi (k)λi,i (3.67)


ri (k) = qi (k)c (3.68)

où c est le temps du cycle des feux et q(k) est le débit d’entrée du i-ième tronçon. C’est
le nombre de véhicules par unité de temps franchissant une ligne d’entrée d’un tronçon.
D’après l’équation (3.18) nous avons :
n
X n
X
li (k) = sj (x)gj (k)λi,j − si (x)gi (k) λj,i (3.69)
j=1,j6=i j=1,j6=i

Pn
Puisque j=1 λj,i = 1, il vient :
n
X
li (k) = sj (x)gj (k)λi,j − si (x)gi (k)(1 − λi,i ) (3.70)
j=1,j6=i

Définissons le vecteur Li par : Li = [Li,1 , · · · , Li,n ]T ∈ Rn où :


(
−si (1 − λi,i ) : pour i = j
Li,j =
sj λi,j : pour i 6= j
3.4 Spécialisation aux systèmes de transport 81

Alors, les équations (3.70) et (3.17) donnent :


n
X n
X
li (k) = Li,j gj (k) + Li,i gi (k) = Li,j gj (k) = LTi g(k)
j=1,j6=i j=1

= Li Gu(k) + Li ξ (3.71)

Dans ces conditions, l’équation d’état du réseau de transport (3.21) prend la forme linéaire
suivante :
x(k + 1) = x(k) + q(k)c + Bu(k) + h (3.72)
où q = [q1 , · · · , qn ]T est le vecteur de débits d’entrée, B = (L − D)G, h = (L − D)ξ et
D ∈ Rn×n est une matrice diagonale dont les éléments diagonaux sont si λi,i .
Comme il a été étudié par Diakaki [51], dans les carrefours à feux, il existe une situa-
tion où le nombre d’entrées est égal au nombre de sorties. Cette situation est appelée état
nominal ou état d’équilibre et est notée xN . La commande et le débit d’entrée corres-
pondants quant à eux sont notés uN et qN . Dans cette situation, nous avons :

qN c + BuN + h = 0. (3.73)

Généralement, un minimum de connaissances sur le processus à commander permet de


dire quels sont les états d’équilibre intéressants. Nous supposons donc que l’ensemble de
ces états d’équilibre est connu. Dans ces conditions, posons comme nouveau vecteur de
commande :
v(k) = u(k) − uN (3.74)
et comme nouveau vecteur de débit :

w(k) = (q(k) − qN )c (3.75)

L’équation d’état (3.72) se transforme naturellement en :

x(k + 1) = x(k) + Bv(k) + ω(k) (3.76)

Les contraintes sur l’état sont définies par :

X = {x ∈ Rn / 0 ≤ x ≤ x∗ } (3.77)

D’après (3.25), les contraintes sur u(k) se transportent sur v(k) en :

U = {v ∈ Rm / − v2 ≤ v ≤ v1 , v1 , v2 > 0} (3.78)

où v1 = umax − uN , and v2 = uN − umin .


82 Chap 3. Commande dissipative des réseaux de transport

Remarque 3.3 Soulignons que, comme dans le cas non-linéaire, le débit d’entrée q(k)
n’est pas connu en général. Ainsi, w(k) représente les incertitudes du modèle. Cependant,
contrairement au cas non-linéaire, nous supposons qu’aucune information sur ce vecteur
incertain n’est disponible. I

La commande du système dynamique (3.76) aura pour expression :

v(k) = Kx(k) (3.79)

où K ∈ Rm×n . Dans ce cas, le système(3.76) en boucle fermée est donné par :

x(k + 1) = x(k) + BKx(k) + ω(k) = Ax(k) + ω(k) (3.80)

où A = I + BK.
Soulignons que, comme dans le cas non-linéaire, l’existence des contraintes (3.78)
implique que le retour d’état u = Kx n’est admissible que dans une région déterminée de
l’espace d’état, c’est-à-dire :

Ux = {x ∈ Rn / − v2 ≤ Kx ≤ v1 ; v1 > 0; v2 > 0} (3.81)

Ce domaine représente l’ensemble des états admissibles pour la commande pour K choi-
sie telle que rang(K) = m. Il est polyédral dissymétrique contenant l’origine. De ce fait,
il est nécessaire d’assurer l’inclusion X ⊆ Ux . De cette manière, si x(k) ∈ X alors on est
sûr que x(k) ∈ Ux . l’objectif de la commande est donc le suivant :

Objectif : Trouver un contrôleur par retour d’état v = Kx tel que :

1. le système (3.76) soit dissipatif par rapport au taux d’approvisionnement S(k) =


xT (k + 1)P r(k) et la fonction de stockage ψ(x) = 12 xT P x,
2. X ⊆ Ux

Comme dans le cas non-linéaire, nous allons séparer l’étude de la dissipativité du


système et l’étude de l’inclusion X ⊆ Ux .

Sur la dissipativité du système

Pour expliquer comment on peut trouver un retour d’état rendant le système (3.76)
dissipatif sans connaissance préalable sur les bornes des incertitudes w, il nous faut com-
mencer à préciser le cadre. Commençons donc par donner le lemme suivant.
3.4 Spécialisation aux systèmes de transport 83

Lemme 3.4 Soit :


Sω (k) = x(k + 1)T P ω(k) (3.82)

Si le système (3.76) est dissipatif par rapport au taux d’approvisionnement Sω (k), alors
il est aussi dissipatif par rapport au taux d’approvisionnement S(k).

Preuve: Puisque le système (3.76) est dissipatif par rapport au taux d’approvisionnement
Sω (k), alors d’après la définition 3.3 :

ψ(x(k + 1)) − ψ(x(k)) ≤ Sω (k) (3.83)

Or, r(k) = q(k)c et ω(k) = (q(k) − qN )c, il vient alors ω(k) = r(k) − rN . Ainsi :

Sω (k) = x(k + 1)T P (r(k) − rN (k))


= x(k + 1)T P r(k) − x(k + 1)T P rN (k)

Puisque −x(k + 1)T P rN (k) < 0 car x(k + 1) ≥ 0 et rN (k) ≥ 0, il s’ensuit que :

Sω (k) ≤ x(k + 1)T P r(k) = S(k)

ce qui prouve le lemme. 


A partir de ce lemme, il devient maintenant clair que toute recherche d’un retour d’état
rendant le système (3.76) dissipatif va se baser sur le taux d’approvisionnement Sω (k) au
lieu de S(k).
Regardons à présent les conditions sur le gain K pour que le système bouclé (3.80)
soit dissipatif. En effet, observons d’abord que :
1
x(k + 1)T P x(k + 1) − x(k)T P x(k) −x(k + 1)T P ω(k)

4ψ(x) − Sω (k) =
2
1 T T
Ax + ω P Ax + ω −xT P x − Ax + ω P ω
 
=
2
1
= − xT (P − AT P A)x + ω T P ω

2
Ainsi, puisque ω T P ω ≥ 0 car P est définie positive, alors l’inégalité :

ψ(x(k + 1)) − ψ(x(k)) ≤ Sω (k)

est satisfaite si la matrice P − AT P A est semi-définie positive, c’est-à-dire,

P − AT P A  0
84 Chap 3. Commande dissipative des réseaux de transport

Or,

P − AT P A = P − (I + BK)T P (I + BK) = −K T B T P − P BK − K T B T P BK
= −K T B T P − P BK − K T B T P P −1 P BK

L’application du lemme 3.3 de Schur avec R = −K T B T P − P BK, Q = P , S =


(P BK)T donne la LMI suivante :
!
−K T B T P − P BK K T B T P
0 (3.84)
P BK P

D’où le théorème.

Théorème 3.4 Si le gain K est solution de la LMI suivante :


!
−K T B T P − P BK K T B T P
0 (3.85)
P BK P

alors, le retour d’état v = Kx rend le système (3.76) dissipatif par rapport au taux
d’approvisionnement S(k) = xT (k + 1)P r(k) et la fonction de stockage ψ(x) = 12 xT P x.

Notons tout de suite que la condition P − AT P A  0 peut aussi être déterminée par
une autre procédure. En effet, puisque A = I + BK, alors

P − (I + BK)T P (I + BK)  0 (3.86)

Or, on sait que la condition T  0 est équivalente à P −1 T P −1  0, car xT T x =


y T P −1 T P −1 y ≥ 0, où y = P x. Ainsi, (3.86) est équivalente à :

P −1 − P −1 (I + BK)T P (I + BK)P −1  0

Il s’ensuit que :

P −1 − (P −1 + BKP −1 )T P (P −1 + BKP −1 )  0

Posons Q = P −1 . Il vient alors :

Q − (Q + BKQ)T Q−1 (Q + BKQ)  0

Si nous appliquons maintenant le changement de variable Y = KQ, la dernière inégalité


devient :
Q − (Q + BY )T Q−1 (Q + BY )  0
3.4 Spécialisation aux systèmes de transport 85

L’application du lemme 3.3 de Schur avec R = Q, S = (Q + BY )T donne :


!
Q Q + Y T BT
 0, Q = P −1 , Y = KQ (3.87)
Q + BY Q

D’où le corollaire suivant.

Corollaire 3.2 Si la LMI suivante est faisable :


!
Q Q + Y T BT
 0, Q = P −1 , Y = KQ (3.88)
Q + BY Q

alors, le retour d’état v = Kx rend le système (3.76) dissipatif par rapport au taux
d’approvisionnement S(k) = xT (k + 1)P r(k) et la fonction de stockage ψ(x) = 21 xT P x.

Remarquons à partir de ce lemme que pour calculer le gain K, Il suffit donc de ré-
soudre la LMI ci-dessus en Y = KQ puis de calculer K = Y Q−1 .

Sur l’inclusion X ⊆ Ux

Regardons à présent les nouvelles conditions sur K pour que X ⊆ Ux . En effet, défi-
∗ T
nissons le vecteur v ∗ = [v1∗ , · · · , vm ] par :

vi∗ = min(v1,i , v2,i ), i ∈ {1, · · · , m}

Soit Ki la i-ème ligne de la matrice K. Nous avons alors pour tout i ∈ {1, · · · , m} :

|vi |2 = |Ki x|2 ≤ kKi k22 kxk22 ≤ kKi k22 max kxk22 = kKi k22 kx∗ k22 (3.89)
x∈X

Nous sommes maintenant prêts à énoncer le lemme suivant.

Lemme 3.5 Si la matrice K est choisie telle que :


2
kKi k22 kx∗ k22 ≤ vi∗ , ∀i ∈ {1, · · · , m} (3.90)

alors X ⊆ Ux .

Preuve: Soit x ∈ X et soit v = Kx. En vertu de (3.89), l’inégalité (3.90) implique pour
tout i ∈ {1, · · · , m} :
2
|vi |2 ≤ vi∗
86 Chap 3. Commande dissipative des réseaux de transport

ce qui donne −vi∗ ≤ vi ≤ vi∗ . Puisque vi∗ = min(v1,i , v2,i ), il vient aussitôt que :

vi ≤ v1,i

De plus, −vi∗ ≤ vi implique :

vi ≥ −min(v1,i , v2,i ) ≥ −v2,i

Ainsi, −v2,i ≤ vi ≤ v1,i , ou d’une manière équivalente −v2,i ≤ Ki x ≤ v1,i pour tout
i ∈ {1, · · · , m}, ce qui prouve que x ∈ Ux . 
Pour transformer la contrainte (3.90) en LMIs, observons qu’elle est équivalente à
2
vi∗
− Ki KiT ≥ 0, ∀i ∈ {1, · · · , m} (3.91)
kx∗ k22

Soit N ∈ Rm×m une matrice symétrique dont les éléments diagonaux vérifient Nii ≤
2
vi∗
kx∗ k22
. Il est clair que si l’inégalité suivante est satisfaite :

Nii − Ki KiT ≥ 0, ∀i ∈ {1, · · · , m} (3.92)

alors l’inégalité (3.91) est satisfaite. Ceci dit, remarquons que l’inégalité (3.92) est équi-
valente à :
diag[N − KK T ] ≥ 0 (3.93)

Or, il est bien connu que si une matrice est semi-définie positive, alors nécessairement
ses éléments diagonaux sont non-négatifs. Ainsi, si la matrice K est choisie telle que la
matrice N − KK T est semi-définie positive, alors l’inégalité (3.93) est satisfaite. L’ap-
plication maintenant du lemme 3.3 de Schur sur N − KK T  0 avec R = N , Q = I et
S = K T donne la LMI suivante :
!
N K
0 (3.94)
KT I

Pour résumer les résultats précédents, notons qu’une propriété remarquable des LMIs
est la possibilité de regrouper plusieurs LMIs en une seule LMI bloc-diagonale. Cette
propriété nous permet finalement d’énoncer la solution de notre problème de commande
en termes d’une seule LMI.
3.4 Spécialisation aux systèmes de transport 87

Théorème 3.5 Soit la matrice K solution de la LMI suivante :


 ! 
−K T B T P − P BK K T B T P
O
∗2
 
 P BK P   0, avec Nii ≤ vi

 ! (3.95)

 N K   kx∗ k22
O
KT I

Alors, le retour d’état v = Kx :


1. rend le système (3.76) dissipatif par rapport au taux d’approvisionnement S(k) =
xT (k + 1)P r(k) et la fonction de stockage ψ(x) = 21 xT P x
2. vérifie la contrainte X ⊆ Ux .

Soulignons un fait majeur qui résulte aussitôt de ce Lemme. En effet, pour un choix
2
vi∗
arbitraire de la matrice N telle que Nii ≤ kx∗ k22
, le retour d’état v = Kx fournit la
classe des commandes rendant le système dissipatif. Cette liberté de choix de la matrice N
confère à la commande dissipative dans le cadre de la régulation des carrefours à feux une
flexibilité permettant de l’adapter à plusieurs situations possibles. Ceci est, à notre sens,
un avantage certain, car elle nous offre une multitude de choix possibles pour améliorer
les performances de la commande de notre système.
Par ailleurs, remarquons que l’inclusion X ⊆ Ux peut aussi être déterminée par l’ap-
plication du théorème 3.1. En effet, cette inclusion implique que si x est solution du
I ∗
y ≤ x0 alors x est aussi une solution du système d’inégalités

système d’inégalités −I
K v1
 
−K
x ≤ v2
. Ainsi, en vertu de la proposition 3.3 la condition X ⊆ Ux est équivalente
à l’existence de deux matrices non-négatives K1 ∈ Rm×n
+ et K2 ∈ Rm×n
+ :

K1 − K2 = K (3.96)
K1 x∗ ≤ v1 (3.97)
K2 x∗ ≤ v2 (3.98)

Pour transformer les inégalités (3.97) et (3.97) en LMI, il suffit de remarquer que ces
inégalités peuvent s’écrire sous la forme :

v1 − K1 x∗ ≥ 0
v2 − K2 x∗ ≥ 0
88 Chap 3. Commande dissipative des réseaux de transport

ce qui est équivalent à :


!
diag(v1i − K1i x∗i ) 0
0 (3.99)
0 diag(v2i − K2i x∗i )
D’où le théorème

Théorème 3.6 Soient les matrices K, K1 et K2 sont solutions de la LMI suivante :


 ! 
−K T B T P − P BK K T B T P
 O 

 P BK P 
  0,
!
i i ∗

 diag(v 1 − K x
1 i ) 0 

O i i ∗
0 diag(v2 − K2 xi )
avec K = K1 − K2

Alors, le retour d’état v = Kx :


1. rend le système (3.76) dissipatif par rapport au taux d’approvisionnement S(k) =
xT (k + 1)P r(k) et la fonction de stockage ψ(x) = 21 xT P x
2. vérifie la contrainte X ⊆ Ux .

Remarque 3.4 Contrairement au cas non-linéaire, les conditions de la dissipativité du


système de transport dans le cas linéaire sont données sans qu’on dispose d’information
spécifique sur les incertitudes w. Ceci peut paraître surprenant, cependant il n’en est rien.
En effet, les conditions du théorème sont formulées pour exiger la dissipativité par rap-
port au taux d’approvisionnement Sw (k) au lieu de S(k). Dans ce cas, la quantité du
désordre stockée pendant un cycle n’est jamais supérieure au désordre fourni par les per-
turbations w(k) durant ce cycle. Autrement dit, si la condition (3.85) est satisfaite, alors
la commande fait que, toutes les trajectoires du système sont incluses dans l’ensemble des
contraintes X. La stabilité du système peut seulement être garantie si r(k) ≤ rN ∀k, car
dans ce cas Sw (k) ≤ 0 et l’entropie est une fonction de Lyapunov définie positive. Ce-
pendant, dans la réalité, cette hypothèse ne peut pas toujours être suivie et par conséquent
la stabilité peut être menacée.

3.5 Conclusion
Dans ce chapitre, une approche basée sur la commande dissipative a été adaptée avec
succès et appliquée aux réseaux de carrefours à feux. Dans un premier temps, le principe
3.5 Conclusion 89

de cette approche a été donné dans sa formulation la plus générale, puis un examen a été
fait afin de mettre en évidence ses avantages. Dans un deuxième temps, une spécialisation
du problème de la commande dissipative aux systèmes des carrefours à feux a été réalisée.
En considérant l’entropie comme étant le désordre stocké dans le système, nous avons
élaboré une loi de commande rendant le système dissipatif, c’est à dire permettant de
rendre le système mieux organisé. Cette étude est faite dans une formulation qui prend
en compte explicitement les contraintes aussi bien sur la commande que sur l’état. Deux
cas ont été étudiés : celui où le modèle du système est non-linéaire est d’abord analysé.
Ensuite, nous nous sommes intéressés au cas où le système peut être représenté par un
modèle linéaire. Dans les deux cas, la mise en évidence de l’outil LMI nous a permis
d’énoncer des conditions suffisantes pour la résolution de notre problème de commande
dissipative.
Dans le cas non-linéaire, nous avons trouvé une borne supérieure sur la norme des
incertitudes wm en deçà de laquelle la propriété de la dissipativité du système incertain
est conservée. Cependant, dans le cas linéaire, la commande n’impose aucune pénalité sur
les incertitudes. Par conséquent, l’effet des perturbations sur le comportement du système
bouclé est difficile à maitriser, et en particulier la stabilité n’est plus garantie.
Ce dernier point est un handicap qui est, à notre sens, sérieux. En effet, il enlève à
l’approche des systèmes dissipatifs l’un de ces principaux avantages, à savoir la possibilité
de réaliser un compromis entre un comportement souhaité et le coût de la commande
nécessaire pour l’obtenir. Il faut donc se tourner vers d’autres méthodes de synthèse pour
un traitement quantitatif plus rigoureux garantissant une loi de contrôle qui amortisse
le plus rapidement possible les perturbations susceptibles de déstabiliser les systèmes.
La commande H∞ se positionne parmi les approches permettant d’atteindre cet objectif.
C’est le sujet du chapitre suivant.
90 Chap 3. Commande dissipative des réseaux de transport
CHAPITRE 4

COMMANDE H∞ DES RÉSEAUX DE


TRANSPORT

4.1 Introduction
Ce chapitre utilise le concept d’invariance positive des ensembles pour la régulation a
priori des carrefours signalisés. La vérification de cette propriété permet de conclure sur la
possibilité de restreindre l’état d’un système à l’intérieur d’un ensemble donné, au moyen
d’une commande appropriée sans supposer aucune structure particulière des contraintes.
Comme il est souligné dans la conclusion du chapitre précédent sur l’inconvénient
de l’approche de la commande dissipative dans le cas linéaire, notre souci premier est
de déterminer une loi de commande permettant de maintenir un comportement désiré
face aux incertitudes et fluctuations qui affectent le système pendant son fonctionnement.
L’avantage de cette approche serait de donner aux systèmes de transport modélisés par
une équation d’état linéaire, une certaine capacité à résister ou s’adapter aux perturba-
tions extérieures. Pour ce faire, la commande H∞ est une bonne candidate pour réaliser
nos objectifs. En effet, il est bien connu que l’un des principaux avantages de la com-
mande H∞ est l’atténuation des effets des perturbations susceptibles de déstabiliser un
système. En outre, contrairement à l’approche de la commande dissipative, la commande
H∞ permet d’intégrer directement les contraintes sur l’état dans la synthèse du régulateur.
92 Chap 4. Commande H∞ des réseaux de transport

En effet, il suffit d’imposer à la fois en boucle fermée l’invariance du domaine X et son


inclusion dans le domaine des contraintes sur la commande Ux pour assurer le respect des
contraintes par les trajectoires du système.
Dans un premier temps, nous rappelons quelques définitions et résultats utiles dont
nous aurons besoin dans la suite de l’exposé. Ceci passe par la définition du problème H∞
et les conditions d’optimisation de Kuhn et Tucker. Ensuite, nous précisons la définition
du problème de commande qui nous concerne. Une fois que le problème est bien défini,
nous donnons sous forme de relations matricielles linéaires des conditions nécessaires et
suffisantes sur l’existence d’une commande robuste permettant à un domaine ellipsoïdal
d’être à la fois positivement invariant et inclus dans l’ensemble des contraintes sur l’état
et la commande.

4.2 Rappels mathématiques et résultats préliminaires

4.2.1 Sur l’optimisation sous contraintes inégalités


considérons le problème de maximisation suivant :

max f (x)
sous les contraintes hj (x) ≤ cj , j = 1, · · · , m

On définit le Lagrangien L par la fonction suivante :


m
X
L(x, λ) = f (x) − λj (hj (x) − cj )
j=1

où les variables λj sont les multiplicateurs de Lagrange associés a chaque contrainte j.


Notons qu’il est très facile de passer d’un problème de minimisation sous contraintes pre-
nant la forme d’inégalité à un problème de maximisation. En effet, il suffit de remarquer
que le problème de minimisation min f (x) : est équivalent au problème de maximisation
max −f (x).
Soit x̄ la solution du problème de maximisation de la fonction f (x). Deux situations
sont envisageables pour chaque contrainte j.
1. soit hj (x̄) = cj : dans ce cas, on dit que la contrainte j est saturée à l’optimum ;
2. soit hj (x̄) < cj : dans ce cas, on dit que la contrainte j est non saturée à l’optimum.
4.2 Rappels mathématiques et résultats préliminaires 93

Conditions de qualification des contraintes : Pour pouvoir utiliser le Lagrangien dans


la résolution d’un programme d’optimisation sous contraintes prenant la forme d’inéga-
lité, il suffit que l’une des conditions suivantes soit vérifiée :
a) Soit s ≤ m le nombre de contraintes saturées a l’optimum x̄. Si la matrice ja-
cobienne de ces s fonctions contraintes, de taille (s, n), est de rang s lorsqu’elle
est évaluée a l’optimum x̄, alors la condition de qualification des contraintes est
vérifiée.
b) Les fonctions contraintes hj , j = 1, · · · , s sont toutes linéaires.

Conditions du premier ordre (Kuhn et Tucker) : On suppose que les contraintes


de qualification sont vérifiées. Si le vecteur x̄ ∈ Rn est une solution du problème de
maximisation de la fonction f , alors il existe un unique vecteur λ̄ ≥ 0 tel que x̄ vérifie les
conditions suivantes :
∂L(x̄, λ̄)
=0
∂x
λ̄j (hj (x̄) − cj ) = 0 ⇔ λ̄j = 0, ou hj (x) − cj = 0, j = 1, · · · , m
∂L(x̄, λ̄)
≥ 0 ⇔ hj (x) ≤ cj , j = 1, · · · , m
∂λ
Notons que ces conditions n’excluent pas la possibilité que λ̄j = 0 et hj (x) − cj = 0
simultanément.

Conditions suffisantes du second ordre pour un optimum global : Supposons qu’il


existe un x̄ ∈ Rn qui vérifie les conditions du premier ordre.
1. Si f est concave et les hj sont convexes, x̄ est un maximum global.
2. Si f est convexe et les hj sont concaves, x̄ est un minimum global
En pratique, la résolution des conditions de Kuhn et Tucker est compliquée par le
fait qu’il faut envisager successivement toutes les configurations possibles : toutes les
contraintes sont saturées à l’équilibre, toutes sauf une, deux,..., aucune (tous les λ̄j sont
nuls à l’équilibre). Pour trouver la bonne solution, il faut procéder par élimination en mon-
trant que parmi l’ensemble de ces possibilités, certaines aboutissent à des contradictions.
94 Chap 4. Commande H∞ des réseaux de transport

4.2.2 Sur le problème H∞


L’avantage essentiel des techniques de commande robuste est de générer des lois de
commande qui satisfont à l’exigence de maintenir un comportement désiré du système
face aux aléas et fluctuations qui l’affectent pendant son fonctionnement. Cette exigence
est qualifiée de robustesse à l’incertitude. Plus précisément, étant donné une spécifica-
tion temporelle ou fréquentielle du comportement désiré et une estimation de l’ordre de
grandeur de l’incertitude, la théorie évalue la faisabilité, produit une loi de commande
adaptée et fournit une garantie sur le domaine de validité de cette loi de commande (ro-
bustesse). Cette démarche de synthèse est systématique et très générale. En particulier,
elle est directement applicable aux systèmes à plusieurs entrées/sorties comme dans le
cas des systèmes de transport.
Sous sa forme la plus simple, le problème H∞ est un problème de réjection de per-
turbation. Il consiste à minimiser l’effet d’une perturbation w sur le comportement du
système. Le signal w est supposé d’énergie finie et sa taille est mesurée en norme `2
(norme Euclidienne). Son effet sur le système est mesuré par la norme `2 d’un vecteur
du coût z (la sortie). Enfin, on peut agir sur le système par une commande u et on dis-
pose d’une observation y. Il s’agit donc de synthétiser une loi de commande u = Ky qui
minimise l’impact de w sur z. On mesurera cet impact par le rapport :

kzk2
kwk2

Ce problème standard est représenté schématiquement par la figure 4.1.

F IGURE 4.1 – Problème H∞ standard

La matrice de transfert G(η) décrit les interconnections entre w, u, z, y est donnée


par : ! 
   
z w G11 G12 w
=G =
y u G21 G22 u
4.2 Rappels mathématiques et résultats préliminaires 95

Lorsque ce système est rebouclé sur la commande u = K(z)y, le transfert boucle fermée
de w à z est donné par :

M = G11 + G12 K(I − G22 K)−1 G21


kzk2
Ainsi, le ratio kwk2
dans le pire des cas est donné par :
kzk2
sup = kM (η)k∞
w6=0 kwk2

La fonction sup(x) signifie qu’on s’intéresse à la plus importante perturbation parmi


toutes les perturbations envisageables. Dans le cas des systèmes discrets sans pôle sur
le cercle unité, on définit la norme H∞ de M (η) par la quantité :

kM (η)k∞ = sup σ̄ M (exp(jθ))
0≤θ≤π

où σ̄(M ) est la plus grande valeur singulière de la matrice M .


le problème décrit ci-dessus peut se reformuler mathématiquement comme suit : étant
donné une tolérance γ > 0, trouver un compensateur K qui assure kM (η)k∞ ≤ γ. De
cette manière nous assurerons pour toute perturbation w la relation suivante :
kzk2
≤ γ,
kwk2
La philosophie de cette commande est intuitive. En effet, kM (z)k∞ serait la perte
maximale possible que le système peut subir à cause des perturbations. Le fait d’intro-
duire la tolérance γ > 0, signifie que ce type de commande est conçu pour imposer des
restrictions de type mini-max au sens de la théorie de la décision (minimiser γ revient à
minimiser la perte maximale possible).
Considérons maintenant un système discret linéaire bouclé par u = Kx :

x(k + 1) = Ax(k) + D1 w(k) (4.1)


z(k) = Cx(k) + D2 w(k) (4.2)

Le calcul de kM (z)k∞ n’est pas toujours aisé. En effet, si on se restreint à un nombre


fini de pulsations, on n’obtient qu’une borne inférieure. Le lemme suivant donne une
caractérisation du problème H∞ en termes d’inégalité matricielle linéaire (LMI).

Lemme 4.1 [66] Soit M (η) = C(ηI −A)−1 B +D, la fonction de transfert entre la sortie
z et la perturbation w. Donnons nous une tolérance γ > 0. Alors, les deux propositions
suivantes sont équivalentes :
96 Chap 4. Commande H∞ des réseaux de transport

1. A est stable et kM (η)k∞ ≤ γ.


2. Il existe une matrice X = X T  0 telle que :
!T ! ! !
A B X 0 A B X 0
− 0
C D 0 γ −2 I C D 0 I

Sur ce, nous terminons notre aperçu général des rappels mathématiques pour passer
aux sections suivantes à la définition du problème de la commande de notre système et sa
solution.

4.3 Commande H∞ des réseaux de transport


Considérons maintenant le système de transport linéaire (3.76) établi dans le chapitre
3:
x(k + 1) = x(k) + Bv(k) + ω(k)

où x(k) est l’état du système à l’instant k, v(k) est la commande et ω(k) est le vecteur
des incertitudes (perturbations) affectant le système.
Pour pouvoir appliquer la commande H∞ comme cela est montré dans la figure 4.1, il
est nécessaire de définir la sortie du modèle. Cette dernière peut représenter toute grandeur
mesurable du système. Cependant, la synthèse H∞ exige que la sortie soit en fonction de
la commande v et les perturbations w. Dans notre cas, le taux d’occupation f (k) = P x(k)
est un bon candidat qui se prête à cette exigence. En effet, le système de contrôle dyna-
mique du trafic est un système qui dispose de capteurs lui donnant des informations sur
l’état du trafic, et notamment, le nombre de véhicules x(k) sur certaines rues ou inter-
sections du réseau routier. En outre, à la fin du cycle k, le taux d’occupation est donné
par :
z(k) = f (k + 1) = P x(k + 1) = P x(k) + P Bv(k) + P ω(k) (4.3)

Ainsi, le système de transport considéré est le suivant :

x(k + 1) = x(k) + Bv(k) + ω(k)


(4.4)
z(k) = P x(k) + P Bv(k) + P ω(k)

Les contraintes sur l’état et la commande sont définies par :

X = {x ∈ Rn / 0 ≤ x ≤ x∗ } (4.5)
4.3 Commande H∞ des réseaux de transport 97

U = {v ∈ Rm / − v2 ≤ v ≤ v1 , v1 , v2 > 0} (4.6)

Effectuons maintenant le changement de variable :

xc (k) , x(k) − xN

où xN est l’état nominal (voir chapitre 3). Dans ce cas, la sortie z se transforme en :

zc (k) , P xc (k + 1) = P x(k + 1) − P xN = z − zN

où zN = P xN . Ainsi, le système devient :


(
xc (k + 1) = xc (k) + Bv(k) + ω(k)
(4.7)
zc (k) = P xc (k) + P Bv(k) + P ω(k)

La commande du système dynamique (4.7) aura pour expression :

v(k) = Kxc (k) (4.8)

où K ∈ Rm×n . Dans ce cas, le système (4.7) en boucle fermée est donné par :

xc (k + 1) = Axc (k) + ω(k)


(4.9)
zc (k) = Cxc (k) + Dω(k)

avec A = I + BK, C = P + P BK et D = P . Ainsi, les contraintes sur x(k) se


transportent sur xc (k) en :

Xc = {xc ∈ Rn / − x2 ≤ xc ≤ x1 , x1 , x2 ≥ 0} (4.10)

avec x1 = x∗ − xN et x2 = xN .
Par ailleurs, observons que l’inégalité 0 ≤ x ≤ x∗ implique 0 ≤ P x ≤ P x∗ . Il
s’ensuit que 0 ≤ P x ≤ , où  = (1, · · · , 1)T , car P est diagonal dont les éléments
1
diagonaux sont x∗j
. Dans ce cas, les contraintes sur xc (k) se transportent sur zc (k) en :

Zc = {zc ∈ Rn / − z2 ≤ zc ≤ z1 , z1 , z2 ≥ 0} (4.11)

avec z1 =  − zN et z2 = zN . Il est clair que :

x(k) ∈ X ⇐⇒ xc (k) ∈ Xc ⇐⇒ zc (k) ∈ Zc (4.12)


98 Chap 4. Commande H∞ des réseaux de transport

Remarquons aussi que, comme dans le chapitre précédent, l’existence des contraintes
(4.6) implique que le retour d’état u = Kxc n’est admissible que dans une région déter-
minée de l’espace d’état, c’est-à-dire :

Ux = {x ∈ Rn / − v2 ≤ Kxc ≤ v1 ; v1 > 0; v2 > 0} (4.13)

Ce domaine représente l’ensemble des états admissibles pour la commande pour K choi-
sie telle que rang(K) = m. Il est polyédral dissymétrique contenant l’origine.
Soulignons tout de suite que les contraintes (4.11) et (4.13) sont de nature fonda-
mentalement différente. En effet, la contrainte (4.11) exprime une exigence du cahier des
charges du contrôleur, alors que la contrainte (4.13) est une contrainte technique imposée
par l’ingénieur pour garantir la faisabilité de son contrôleur. Ainsi, violer les contraintes
(4.11), c’est ne pas respecter l’objectif de la commande, alors que trouver un autre schéma
de commande dans lequel (4.11) n’est pas nécessaire, c’est réaliser les objectifs autre-
ment.

4.3.1 Position du problème de la commande


Problème 1 : Conformément à ce qui a été annoncé dans l’introduction, notre souci
premier est d’élaborer une loi de commande v = Kxc permettant d’éviter les congestions
au sein du réseau de transport. Ceci est possible si la loi de commande force le nombre de
véhicules à ne pas dépasser le niveau du trafic correspondant à l’optimum opérationnel des
lignes. Plus formellement, si x∗ est le vecteur des capacités des lignes du réseau, alors la
congestion peut se produire dans le système si le nombre de véhicules stockés dans chaque
ligne dépasse sa capacité. Une conséquence de ce type d’instabilité est l’accumulation
illimitée de véhicules dans le système. L’objectif de la commande est alors de trouver un
contrôleur par retour d’état vérifiant x(k) ≤ x∗ pour chaque cycle k, ce qui est équivalent
à zc (k) ∈ Zc , ∀k en vertu de (4.12). Ceci se traduit par l’invariance positive de l’ensemble
Zc . Rappelons que Zc est positivement invariant si et seulement si :

zc (0) ∈ Zc =⇒ zc (k) ∈ Zc , ∀k

Toutefois, la commande H∞ nécessite l’utilisation des normes euclidiennes. Ainsi,


toute tentative d’application de l’approche H∞ doit utiliser ces normes. Or, l’ensemble
Zc est un polyèdre dissymétrique contenant l’origine et donc l’étude de son invariance
4.3 Commande H∞ des réseaux de transport 99

positive par les normes euclidiennes n’est pas chose évidente. L’idée alors est de chercher
à garantir le respect des contraintes sur l’état et la commande par la restriction de l’état
en boucle fermée à un ensemble Z∗c positivement invariant ellipsoïdal centré à l’origine et
tel que Z∗c ⊆ Zc . De cette manière, si zc (0) ∈ Z∗c alors on est sûr que zc (k) ∈ Zc pour tout
k. C’est la raison pour laquelle nous montrons le lemme suivant qui représente un résultat
utile pour la suite (voir Remarque 4.2).

Proposition 4.1 Soit α un scalaire positif défini par :



α = min min(z1,i ), min(z2,i )
i i

Définissons l’ensemble Z∗c par :

Z∗c = {zc ∈ Rn /kzc k2 ≤ α} (4.14)

Alors nous avons :


Z∗c ⊆ Zc

Preuve: Si kzc k2 ≤ α, alors −α ≤ zc,i ≤ α, ∀i ∈ {1, · · · , n}, ce qui implique :

−[α, · · · , α]T ≤ zc (k) ≤ [α, · · · , α]T (4.15)



Puisque α = min min(z1,i ), min(z2,i ) , il vient aussitôt que :
i i

[α, · · · , α]T ≤ z1 et [α, · · · , α]T ≤ z2

Ainsi, (4.15) implique :


−z2 ≤ zc ≤ z1

Ce qui montre que zc ∈ Zc et complète la preuve. 

Problème 2 : Pour maintenir le comportement désiré du problème 1 face aux incerti-


tudes w(k) pendant son fonctionnement, la loi de commande doit être robuste dans le
sens où, elle doit permettre d’amortir le plus rapidement possible ces perturbations. Pour
ce faire, observons d’abord qu’à partir de (4.9), la fonction de transfert entre la sortie zc
et la perturbation w est donnée par :

G(η) = C(ηI − A)−1 + D (4.16)


100 Chap 4. Commande H∞ des réseaux de transport

Donnons nous une tolérance γ > 0. On sait maintenant que l’objectif de la commande
H∞ est de trouver un gain K tel que kG(η)k∞ ≤ γ. Ceci est équivalent à :

kzc (k)k2 ≤ γkω(k)k2 , ∀k ∈ N

Ainsi, si nous imposons aux incertitudes w(k) d’appartenir au domaine suivant :


α
Ω = {ω ∈ Rn /kω(k)k2 ≤ , ∀k ∈ N} (4.17)
γ

alors on est sûr que pour tout k, zc (k) ∈ Z∗c et par conséquent la commande H∞ permet
l’invariance positive de Z∗c . Ce problème est représenté schématiquement par la figure
4.2 :

F IGURE 4.2 – Problème H∞ du système de transport

Il est clair que pour atténuer l’effet des perturbations, il faut maximiser αγ car la valeur
α
max( ), fournit le plus grand domaine des incertitudes Ωopt garantissant l’invariance po-
γ
sitive de Z∗c . Ainsi, pour maximiser αγ , il suffit de minimiser γ car la valeur α est calculée
à partir des bornes de Zc et donc imposée par le système. L’objectif de la commande H∞
pour l’invariance positive de Z∗c est donc :

min γ
sous la contrainte kG(η)k∞ ≤ γ

Problème 3 : Comme dans le chapitre précédent, rappelons que tout état émanant de
Zc peut parfaitement donner une trajectoire sortant de l’ensemble Ux . De ce fait, il est
nécessaire d’assurer l’inclusion Zc ⊆ Ux ou d’une manière suffisante Z∗c ⊆ Ux . De cette
manière, si xc (k) ∈ Zc (xc (k) ∈ Z∗c ) alors on est sûr que xc (k) ∈ Ux .
En résumé, l’objectif final de la commande est donc le suivant :
4.3 Commande H∞ des réseaux de transport 101

Objectifs : Trouver un retour d’état u = Kx minimisant l’effet des perturbations w(k)


et permettant que :
1. kG(η)k∞ ≤ γ ou d’une manière équivalente Z∗c soit positivement invariant par
rapport à la solution du système,
2. Zc ⊆ Ux ou Z∗c ⊆ Ux .
Soulignons qu’une méthode simple de résolution de ce problème de régulation sous
contraintes consiste donc, par exemple à déterminer la matrice K en résolvant le pro-
gramme d’optimisation sous contraintes suivant :

Minimiser γ
sous les contraintes kG(η)k∞ ≤ γ
Zc ⊆ Ux ou Z∗c ⊆ Ux

Nous pouvons à présent en venir à l’examen de ces conditions.

4.3.2 Solution du problème de la commande


Afin de présenter rigoureusement l’ensemble des résultats, nous allons répartir les
objectifs sur deux présentations. La première est consacrée à l’étude de l’invariance po-
sitive de Z∗c par la commande H∞ . La deuxième traite l’étude des inclusions Zc ⊆ Ux et
Z∗c ⊆ Ux . Une fois ces deux présentations faites, leur intégration dans une formulation
globale devient parfaitement claire.

Sur l’invariance positive de Z∗c


Nous allons voir à présent comment trouver le gain K tel que kG(η)k∞ ≤ γ. En effet,
observons d’abord que kG(η)k∞ ≤ γ est équivalente à :
1 1
k C(ηI − A)−1 + Dk∞ ≤ 1
γ γ
Ainsi, en vertu du lemme 4.1, une condition nécessaire et suffisante pour la solution du
problème H∞ pour notre système est l’existence d’une matrice X = X T  0 telle que :
!T ! ! !
A I X 0 A I X 0
− 0
C D 0 γ −2 I C D 0 I
102 Chap 4. Commande H∞ des réseaux de transport

Par application du lemme Schur (voir chapitre 3), cette relation est équivalente à :
 
X ∗ ∗ ∗
 
0 I ∗ ∗ 
 A I X −1 ∗   0 (4.18)
 
 
C D 0 γ 2I

où ∗ représente le transposé des éléments sous la diagonale. Définissons maintenant la


matrice suivante :

 
γI 0 0 0

 0 √ 
γI 0 0 
M =
 
√1 I

 0 0 γ
0 
 
1
0 0 0 √ I
γ

Il est clair que M est inversible. Ainsi, (4.18) est équivalente à :


 
X ∗ ∗ ∗
 
T 0
 I ∗ ∗ 
M  0
M  −1
 A I X ∗ 

2
C D 0 γ I

Il s’ensuit que :  
Q ∗ ∗ ∗
 
 0 γI ∗ ∗ 
A I Q−1 ∗   0 (4.19)
 
 
C D 0 γI
où Q = γX. D’où le théorème suivant.

Théorème 4.1 Pour le système de transport (4.9), une condition nécessaire et suffisante
pour l’invariance positive de Z∗c est l’existence d’une matrice K et une matrice symétrique
Q = QT solution de la LMI suivante :
 
Q ∗ ∗ ∗
 
 0 γI ∗ ∗ 
0

−1
(4.20)
 I + BK
 I Q ∗ 

P + P BK P 0 γI
4.3 Commande H∞ des réseaux de transport 103

Soulignons tout de suite un point important qui va nous servir pour la suite. En ef-
fet, l’invariance positive de Z∗c peut aussi être établie par la dissipativité du système par
rapport au taux d’approvisionnement :
1
W (zc (k), ω(k)) = (γ 2 kω(k)k22 − kzc (k)k22 ) (4.21)
2
et la fonction de stockage :
1
V (xc (k)) = γxc (k)T Qxc (k), ∀k ∈ N (4.22)
2
En effet, par application du lemme de Shur, la relation (4.20) est équivalente à :
! !T ! !
Q 0 A I Q 0 A I
− 0
0 γI C D 0 γ −1 I C D
ou d’une manière équivalente ∀xc (k), ω(k) ∈ Rn :
!T " ! !T ! !# !
xc (k) Q 0 A I Q 0 A I xc (k)
− ≥0
ω(k) 0 γI C D 0 γ −1 I C D ω(k)
Puisque : ! ! !
A I xc (k) xc (k + 1)
=
C D ω(k) zc (k)
il vient :

xc (k)T Qxc (k) + γω(k)T ω(k) − xc (k + 1)T Qxc (k + 1) + γ −1 zc (k)T zc (k) ≥ 0

Il s’ensuit :
1 1 1
4V (xc ) = γxc (k + 1)T Qxc (k + 1) − γxc (k)T Qxc (k) ≤ (γ 2 kω(k)k22 − kzc (k)k22 )
2 2 2
(4.23)
ce qui montre que le système de transport est dissipatif par rapport au taux d’approvision-
nement (4.21) et la fonction de stockage (4.22). D’où le corollaire suivant.

Corollaire 4.1 Pour le système de transport (4.9), une condition nécessaire et suffisante
pour l’invariance positive de Z∗c est que le système soit dissipatif par rapport au taux
d’approvisionnement :
1
W (zc (k), ω(k)) = (γ 2 kω(k)k22 − kzc (k)k22 ) (4.24)
2
et la fonction de stockage :
1
V (xc (k)) = γxc (k)T Qxc (k), ∀k ∈ N (4.25)
2
104 Chap 4. Commande H∞ des réseaux de transport

Sur ce, nous terminons notre aperçu général du sujet pour passer à l’examen des condi-
tions supplémentaires que doit vérifier la matrice de gain K pour la condition d’inclusion
Zc ⊆ Ux ou Z∗c ⊆ Ux .

Sur l’inclusion Zc ⊆ Ux
Voyons à présent les nouvelles condition sur le gain K pour que Zc ⊆ Ux . L’inclusion
Z∗c ⊆ Ux sera étudiée à la fin de cette partie. En effet, remarquons d’abord que :

x(k) ∈ X ⇐⇒ xc (k) ∈ Xc ⇐⇒ z(k) ∈ Zc

Il s’ensuit que :
Zc ⊆ Ux ⇐⇒ Xc ⊆ Ux
Ainsi, pour des raisons de simplicité, nous allons travailler avec l’inclusion Xc ⊆ Ux . En
effet, observons que les ensembles Xc et Ux peuvent s’écrire sous la forme :
( " # " #)
I x1
X c = x c ∈ Rn / xc ≤ (4.26)
−I x2
( " # " #)
K v1
Ux = x c ∈ Rn / xc ≤ (4.27)
−K v2
En vertu du théorème 3.1 (voir chapitre 3), l’inclusion Xc ⊆ Ux équivaut à l’existence
d’une matrice non-négative T ∈ R2m×2n
+ telle que :
" # " #
I K
T = (4.28)
−I −K
" # " #
x1 v1
T ≤ (4.29)
x2 v2
Posons : " #
T11 T12
T=
T21 T22
Il vient à partir de (4.28) et(4.29) que :

T11 − T12 = T22 − T21 = K (4.30)


T11 x1 + T12 x2 ≤ v1 (4.31)
T21 x1 + T22 x2 ≤ v2 (4.32)
4.3 Commande H∞ des réseaux de transport 105

Nous avons alors le théorème suivant :

Théorème 4.2 L’inclusion Xc ⊆ Ux (et par conséquent Zc ⊆ Ux ) est équivalente à


l’existence de deux matrices non-négatives K1 et K2 telles que :

K1 − K2 = K (4.33)
K 1 x1 + K 2 x2 ≤ v 1 (4.34)
K 2 x1 + K 1 x2 ≤ v 2 (4.35)

Preuve: Suffisance : Multiplions l’inégalité −x2 ≤ xc ≤ x1 par K1 , il vient :

−K1 x2 ≤ K1 xc ≤ K1 x1 (4.36)

De même, la multiplication de l’inégalité par −K2 donne :

−K2 x1 ≤ K2 xc ≤ K2 x2 (4.37)

L’addition maintenant de (4.36) et (4.37) implique :

−K2 x1 − K1 x2 ≤ (K1 − K2 )xc ≤ K1 x1 + K2 x2 (4.38)

il vient à partir de (4.33), (4.34) et (4.35) :

−v2 ≤ Kx ≤ v1

d’où xc ∈ Ux .
Nécessité : Supposons que Xc ⊆ Ux . Soit :

K + = (Kij+ ); où Kij+ = sup(Kij , 0)


K − = (Kij− ); où Kij− = − inf(Kij , 0)

Il est clair que :


K + ≥ 0; K − ≥ 0; K = K+ − K− (4.39)

Or puisque la décomposition K = K + − K − est minimale (voir lemme 3.2 du chapitre


3), il vient :

K + ≤ T11 et K + ≤ T22
K − ≤ T12 et K + ≤ T21
106 Chap 4. Commande H∞ des réseaux de transport

On en déduit à partir de (4.31), (4.32) :

K + x1 + K − x2 ≤ T11 x1 + T12 x2 ≤ v1
K − x1 + K + x2 ≤ T21 x1 + T22 x2 ≤ v2

Ainsi, la nécessité est prouvée si on pose :

K1 = K +
K2 = K −

Sur l’inclusion Z∗c ⊆ Ux


Pour simplifier les notation, posons M = 1
α2
P 2. Ainsi, le domaine Z∗c peut s’écrire
comme :
Z∗c = {xc ∈ Rn /xTc M xc ≤ 1} (4.40)

C’est un ellipsoïde centré à l’origine.


Regardons à présent les nouvelles conditions sur le gain K pour que Z∗c ⊆ Ux . En
effet, rappelons d’abord qu’avec le retour d’état v = Kxc , l’ensemble Ux s’écrit :

Ux = {xc ∈ Rn / Kxc ≤ v1 et − Kxc ≤ v2 ; v1 > 0, v2 > 0} (4.41)

Soient V1 , V2 des matrices diagonales de termes diagonaux v1i et v2i respectivement. Nous
avons alors :
   
1 1
v11
0 ··· 0 v21
0 ··· 0

1 ..  
1 .. 
 0 v12
0 .   0 v22
0 . 
V−1 = , V−1 =
   
1 .. .. .. 2 .. .. .. 

 . . . 0 

 . . . 0 
1 1
0 ··· 0 v1m
0 ··· 0 v2m

Il s’ensuit que l’ensemble Ux peut s’écrire sous la forme suivante :


!
−1
V 1 K
U x = x c ∈ Rn / n
 
x c ≤  = x c ∈ R / Hx c ≤ 
−V−1 2 K

avec !
H 1 = V−1
1 K
H= ,  = (1, 1, · · · , 1)T
2
H = −V−1
2 K
4.3 Commande H∞ des réseaux de transport 107

ou d’une manière équivalente :

Ux = {xc ∈ Rn / Hi xc ≤ 1, i = 1, · · · , 2m}

où Hi est la iième ligne de la matrice H. Ceci fait, il est clair que la condition Z∗c ⊆ Ux est
équivalente à :

max∗ Hi xc ≤ 1 (4.42)
xc ∈Zc

Il s’agit maintenant de connaître la valeur maximale de la fonction linéaire Hi xc sur l’en-


semble Z∗c , c’est-à-dire :

max Hi xc
sous la contrainte xTc M xc ≤ 1

Pour résoudre ce problème, nous allons appliquer les conditions de Kuhn et Tucker
(voir section 4.2.1). En effet, soit le Lagrangien L :

L(xc , λ) = Hi xc − λ(xTc M xc − 1)

Alors, si x̄c est la solution recherchée, il existe un scalaire λ̄ ≥ 0 tel que :


∂L
= HiT − 2λ̄M x̄c = 0 (4.43)
∂xc
λ̄(x̄Tc M x̄c − 1) = 0 ⇔ λ̄ = 0, ou x̄Tc M x̄c − 1 = 0 (4.44)
∂L
≥ 0 ⇔ x̄Tc M x̄c ≤ 1 (4.45)
∂λ
Pour déterminer les solutions de ce système, il faut envisager successivement tous les cas
de figure possibles portant sur la saturation des contraintes et procéder par élimination.

Cas 1 : x̄Tc M x̄c = 1 (la contrainte est saturée à l’optimum). Dans ce cas, on a :

∂ x̄Tc M x̄c 
∀x̄c ∈ Rn

rang = rang 2M x̄c = 1,
∂xc
Ainsi, la contrainte de qualification est vérifiée. Il s’ensuit alors que dans ce cas nous
avons λ̄ > 0 car sinon on aurait Hi = 0 en vertu de (4.43), ce qui absurde car Hi 6= 0. Il
vient alors à partir de (4.43) :
1 −1 T
x̄c = M Hi
2λ̄
108 Chap 4. Commande H∞ des réseaux de transport

En multipliant (4.43) par xTc il vient :


1 1
λ̄ = (Hi M −1 HiT ) 2
2
En remplaçant λ̄ dans x̄c on obtient :
1
x̄c = (Hi M −1 HiT )− 2 M −1 HiT

qui est une solution possible du problème de maximisation de la fonction Hi x sur l’en-
semble Z∗c .

Cas 2 : x̄Tc M x̄c < 1 (la contrainte n’est pas saturée à l’optimum). Dans ce cas, on a
λ̄ = 0. Or, l’équation (4.43) donne HiT = 0, ce qui viole le fait que Hi 6= 0.
Finalement, on en déduit que les conditions de Kuhn et Tucker admettent une seule
solution :
1
x̄c = (Hi M −1 HiT )− 2 M −1 HiT

Or, Hi xc est concave et les contraintes sont convexes, donc x̄c est un maximum global.
Par conséquent, la valeur maximale de Hi xc sur l’ensemble Z∗c est donnée par :
1
max∗ Hi xc = (Hi M −1 HiT ) 2

xc ∈Zc

Ainsi, d’après (4.42), la condition Z∗c ⊆ Ux est équivalente à :


1
(Hi M −1 HiT ) 2 ≤ 1

qui est à son tour équivalente à :

Hi M −1 HiT ≤ 1

d’où :
1 − Hi M −1 HiT ≥ 0, i = 1, · · · , 2m

Puisque 1 − Hi M −1 HiT ∈ R, l’application du lemme 3.3 de Schur avec R = 1 et S = Hi


donne la LMI suivante :
!
1 Hi
 0, i = 1, · · · , 2m
HiT M
4.3 Commande H∞ des réseaux de transport 109

1
D’autre part, puisque Hi1 = v1i
Ki et Hi2 = − v1i Ki , avec Ki est la iième ligne de la matrice
2
K, la dernière LMI devient :
   
1
1 v1i
K i 1 − v1i Ki
   0,  2   0, i = 1, · · · , m
1
vi
K T
i M − v1i KiT M
1 2

En outre, puisque plusieurs LMI peuvent s’exprimer sous la forme d’une seule LMI
simple diag(LM Ij )  0, nous avons alors le résultat suivant.

Théorème 4.3 Pour que Z∗c ⊆ Ux , il est nécessaire et suffisant que la LMI suivante soit
faisable :
  
1
1 v1i
Ki

 1 KT 1 2
 O 
 v1i i α2
P 

    0, i = 1, · · · , m (4.46)
1 − v1i Ki 
 

2
 O  
− v1i KiT 1
α2
P 2
2

Formulation globale de la solution


Avec les théorèmes 4.1, 4.2 et 4.3, nous avons maintenant tous les éléments néces-
saires pour formuler la solution de notre problème de commande.

Théorème 4.4 Pour le système de transport (4.9), s’il existe un grain K, une matrice
définie positive Q et deux matrices non-négatives K1 , K2 solutions du problème d’opti-
misation suivant :

min γ (4.47)
sous les contraintes (4.20) et (4.33)-(4.35).

alors le retour d’état v = Kxc garantit les conditions suivantes :


1. Z∗c est positivement invariant où d’une manière équivalente kzc k2 /kωk2 ≤ γ ; pour
tout k ∈ N
2. v(k) ∈ Ux , pour tout k ∈ N.

Remarque 4.1 Anticipons sur ce qui va suivre pour noter que la solvabilité du problème
d’optimisation (4.47) est difficile car, la recherche à la fois de la matrice inconnue Q et
110 Chap 4. Commande H∞ des réseaux de transport

son inverse Q−1 introduit une non-linéarité dans la contrainte LMI (4.20). Cette condition
nécessite une recherche qui est à la fois difficile à accomplir et très coûteuse en temps de
calcul. C’est le problème de l’optimisation non-linéaire non-convexe. I

Pour contourner le problème posé par le théorème 4.4, remarquons que d’après le
corollaire 1, la matrice Q définit la fonction de stockage et par conséquent, nous pouvons
la remplacer par l’entropie du système, c’est-à-dire :
1
V (xc (k)) = ψ(xc (k)) = xc (k)T P xc (k)
2
ce qui donne Q = γ −1 P . Ainsi la LMI (4.20) devient :
 
γ −1 P ∗ ∗ ∗
 
 0 γI ∗ ∗ 
0
 (4.48)
 I + BK
 I γP −1 ∗  
P + P BK P 0 γI
ce qui équivaut à :  
P ∗ ∗ ∗
2
 
 0 γ I ∗ ∗ 
0
 (4.49)
 I + BK
 I P −1 ∗
P + P BK P 0 I
Si on pose β = γ 2 , (4.49) devient une LMI affine par rapport aux variables de décision.
Ce qui donne le corollaire suivant.

Corollaire 4.2 Pour le système de transport (4.9), s’il existe un grain K et deux matrices
non-négatives K1 , K2 solutions du problème d’optimisation suivant :

min β (4.50)
sous les contraintes
 
P ∗ ∗ ∗
 
 0 βI ∗ ∗ 
0
LM I :  −1
(4.51)
 I + BK
 I P ∗ 

P + P BK P 0 I
K1 − K2 = K (4.52)
K1 x1 + K2 x2 ≤ v1 (4.53)
K2 x1 + K1 x2 ≤ v2 (4.54)
4.3 Commande H∞ des réseaux de transport 111

alors le retour d’état v = Kxc garantit les conditions suivantes :



1. Z∗c est positivement invariant où d’une manière équivalente kzc k2 /kωk2 ≤ β;
pour tout k ∈ N
2. v(k) ∈ Ux , pour tout k ∈ N.

Remarque 4.2 Dans ce corollaire, l’existence de la LMI (4.51) affine par rapport aux
variables de décision pourrait être trompeuse. En effet, ceci suggérerait que le problème
lié au temps de calcul de la commande posé par le théorème 4.4 est résolu. Or, il n’en est
rien, car la complexité est simplement déplacée vers la recherche des matrices K1 , K2 , et
le temps de calcul est consommé dans la vérification des conditions (4.52), (4.53), (4.54).

Si nous voulons éviter la recherche des matrices K1 , K2 , nous pouvons utiliser les ré-
sultats du théorème 4.3, ce qui fournit la solution finale de notre problème de commande.

Théorème 4.5 Pour le système de transport (4.9), s’il existe un grain K solution du pro-
blème d’optimisation suivant :

min β
sous la contrainte
  
P ∗ ∗ ∗
  
 0 βI ∗ ∗ 
  O O 
 I + BK
 I P −1 ∗


 
 P + P BK P 0 I 
 
 
1
   0,
 1 i
v1
K i 
 O 
1 T 1 2
 O 
K i α2 P
 
v1i
 
  
− v1i Ki 
 
 1
 O O  2 
− v1i KiT α12 P 2
2

i = 1, · · · , m

alors le retour d’état v = Kxc garantit les conditions suivantes :



1. Z∗c est positivement invariant où d’une manière équivalente kzc k2 /kωk2 ≤ β;
pour tout k ∈ N
2. v(k) ∈ Ux , pour tout k ∈ N.
112 Chap 4. Commande H∞ des réseaux de transport

Ce théorème est très important dans le sens où il offre une condition pratique de mise
en oeuvre de la stratégie de commande. En effet, le problème d’optimisation LMI posé
dans ce théorème est convexe en K et par conséquent, il peut facilement être résolu avec
des outils sous Matlab [67, 68].

4.4 Conclusion
Dans ce chapitre, une approche basée sur la commande H∞ a été appliquée pour éviter
les congestions du trafic urbain par les feux de signalisation en forçant les files d’attente
à ne pas dépasser le niveau de trafic correspondant à l’optimum opérationnel des lignes.
Cette étude à été faite grâce à la construction d’un domaine ellipsoïdal Z∗c positivement
invariant, contenu dans le domaine des contraintes sur l’état et la commande. La mise
en évidence des techniques LMIs nous a permis d’énoncer des conditions nécessaires et
suffisantes pour la résolution de notre problème de commande. Ces résultats s’avèrent plus
généraux que ceux de l’approche de la commande dissipative et permettent d’introduire
les incertitudes dans la conception de la commande.
Deux principaux objectifs ont été atteints avec la commande proposée : d’une part, la
commande est robuste vis-à-vis des incertitudes et peut être calculée par une procédure
numérique tirant largement partie des caractéristiques de convexité des LMIs (Théorème
4.5). Ceci lui confère une légitimité indépendante de son efficacité par rapport à l’objectif
fixé par notre investigation, à savoir le calcul de la commande en temps réel. D’autre part,
afin de respecter les contraintes physiques inhérentes à la signalisation des carrefours, la
commande proposée respecte les conditions aux limites.
Dans le chapitre suivant, nous présentons deux exemples de réseaux de carrefours
pour illustrer les contributions de notre travail ainsi que pour mettre en évidence les per-
formances de nos stratégies de commande.
CHAPITRE 5

APPLICATIONS

5.1 Introduction
Dans les chapitres précédents, nous avons présenté deux types de commandes permet-
tant d’améliorer la fluidité du trafic. Afin d’illustrer en pratique les stratégies de contrôle
proposées, nous exposons dans ce chapitre quelques simulations relatives aux réseaux de
transport urbains. En particulier, nous proposons d’évaluer les commandes proposées en
simulation pour deux types de réseaux :
1. les réseaux artériels, et
2. les réseaux en grille.
Dans un premier temps, nous présentons les réseaux sur lesquels les tests seront réalisés.
Ceci passe par la description de leurs caractéristiques géométriques. Ensuite, nous exami-
nons les objectifs des deux commandes pour chaque type de réseau tels que la dissipati-
vité de l’entropie de transport, la réjection des perturbations, le respect des contraintes
sur l’état et la commande. Dans un second temps, afin de montrer les avantages des
commandes proposées, une comparaison est effectuée avec la stratégie linéaire quadra-
tique (LQ). Plus précisément, trois grandeurs importantes sont considérées : l’entropie de
transport, le retard total des véhicules par cycle et le temps de calcul des paramètres de
signalisation dans chaque cycle.
114 Chap 5. Applications

Soulignons enfin que toutes les simulations sont réalisées sur un ordinateur avec un
CPU Core i5, 2.47 GHZ×4, une mémoire 4G, et le système opérationnel Windows 7
(64bit).

5.2 Application à un réseau artériel


Un réseau artériel en milieu urbain est constitué d’une route principale de grande
capacité (route artérielle) et plusieurs rues locales (voir Figure 5.1). La fonction principale
d’un réseau artériel est d’acheminer le trafic depuis des routes collectrices jusqu’à, par
exemple les autoroutes ou entre les centres urbains avec un plus haut niveau de qualité
de service [69]. Le réseau artériel représente de ce fait un élément très important pour la
régulation du trafic urbain.

5.2.1 Caractéristiques du réseau simulé

F IGURE 5.1 – Réseau artériel incluant quatre intersections

La Figure 5.1 schématise la structure géométrique de ce réseau sous la forme d’un


graphe direct. La route artérielle supporte la majorité du trafic du réseau, et elle est sub-
divisée en quatre carrefours numérotés 11, 12, 13 et 14. Ainsi, ce réseau comporte seize
voies numérotées de 1 jusqu’à 16. Le nombre de véhicules xi dans chaque voie représente
l’état du système. Les sorties du réseau sont ignorées étant donné que les arcs de sortie ne
sont pas pris en compte dans les stratégies. Pour chaque voie considérée, nous supposons
5.2 Application à un réseau artériel 115

que les véhicules tournant à gauche et à droite partagent la même ligne que les autres
véhicules. Pour chaque intersection, la durée d’un cycle est subdivisée en deux phases, et
les temps des feux verts correspondants à la direction horizontale sont considérés comme
les variables de commande, notés

u = [g11 , g12 , g13 , g14 ]T

Durant les simulations, les paramètres de ce réseau (e.g., cycle, débits de saturation, λi,j ,
etc) sont supposés constants et connus. Ils sont donnés comme suit :
– tous les carrefours fonctionnent avec le même cycle de durée c = 100s ;
– le temps perdu est de 5s pour toutes les phases ;
– tous les temps des feux verts effectifs sont bornés entre 20s et 70s ;
– dans le cas d’une voie, le débit de saturation varie très légèrement autour de si =
0.5véh/s. Nous considérons donc cette valeur pour toutes les voies ;
– les proportions des flux des échanges λi,j entre voies sont données dans le Tableau
5.1. λi,j désigne le pourcentage des véhicules allant de la voie j vers la voie i par
rapport au nombre total de véhicules présents sur l’arc de la voie j.
– les capacités des voies sont données par x∗ = [80, 70, 50, 50, 70, 70, 50, 50, 70, 70,
50, 50, 70, 80, 50, 50]T véh.

TABLE 5.1 – Proportions des flux d’échange λi,j


Voie i λi,j
2 λ2,6 =0.7 λ2,7 =0.27 λ2,8 =0.3
5 λ5,1 =0.72 λ5,3 =0.25 λ5,4 =0.28
6 λ6,10 =0.71 λ6,11 =0.29 λ6,12 =0.25
9 λ9,5 =0.75 λ9,7 =0.26 λ9,8 =0.25
10 λ10,14 =0.72 λ10,15 =0.27 λ10,16 =0.25
13 λ13,9 =0.75 λ13,11 =0.25 λ13,12 =0.29

Ainsi, le modèle linéaire de ce système est donné par :

x(k + 1) = x(k) + Bu(k) + q(k)c + h


116 Chap 5. Applications

avec :    
−0.5 0 0 0 0
   
 −0.5 0.065 0 0  25.65
   
 −45 
   
 0.5 0 0 0 
   
 0.5 0 0 0   −45 
   
   
0.095 −0.5 0 0  23.85
   
 0 −0.5 0.085 0   24.3 
   
   
 0 0.5 0 0   −45 
   
   
 0 0.5 0 0   −45 
B=  h= 
 0
 0.12 −0.5 0 

22.95
 
   
 0
 0 −0.5 0.1 


 23.4 

 0 0 0.5 0   −45 
   
   
 0 0 0.5 0   −45 
   
   
 0
 0 0.105 −0.5
 24.3 
 
 0 0 0 −0.5  0 
   
   
 0 0 0 0.5   −45 
   
0 0 0 0.5 −45

État nominal : Supposons que les débits d’entrée correspondants à l’état nominal soient
donnés par :

qN = [0.3, 0.0045, 0.15, 0.15, 0.0045, 0.006, 0.15, 0.15, 0,

0.006, 0.15, 0.15, 0, 0.3, 0.15, 0.15]T véh/s


Dans ce cas, la commande nominale est donnée par :

uN = [60, 60, 60, 60]T s

Par conséquent, le modèle devient :

x(k + 1) = x(k) + Bv(k) + ω(k) (5.1)

où v(k) = u(k) − uN et ω(k) = (q(k) − qN )c.

Perturbations : Afin de montrer l’atténuation des effets des perturbations, nous suppo-
sons que le vecteur ω est donné par une fonction sinusoïdale comme suit :
2kπ
ω(k) = 10qN sin( )
15
5.2 Application à un réseau artériel 117

5.2.2 Solutions des commandes


Nous avons montré dans les chapitres précédents que l’existence de la commande
dissipative (résp, la commande H∞ ) est caractérisée par la faisabilité de certaines LMIs
(résp, le problème d’optimisation LMI). Ces problèmes peuvent être facilement résolus
en utilisant l’outil CVX [68] sous la plate forme de MATLAB.

Commande dissipative : Une solution au problème LMI du Théorème 3.6 est donnée
par :

K =(col 1-8)
 
0.0081 0.0089 −0.013 −0.013 0.0004 0.0017 −0.0029 −0.0029
 
0.0013 −0.0004 −0.0021 −0.0021 0.01 0.0099 −0.0144 −0.0144
 
 0.001 0.0008 −0.0017 −0.0017 0.002 0.0004 −0.0031 −0.0031
 
0.0009 0.0008 −0.0015 −0.0015 0.0016 0.0014 −0.0025 −0.0025
(col 9-16)
 
0.0014 0.0016 −0.0025 −0.0025 0.0008 0.0009 −0.0015 −0.0015
 
0.0004 0.002 −0.0031 −0.0031 0.0008 0.001 −0.0017 −0.0017
 
 0.01
 0.01 −0.0145 −0.0145 −0.0004 0.0013 −0.0021 −0.0021

0.0017 0.0004 −0.0029 −0.0029 0.0089 0.0081 −0.013 −0.013

Commande H∞ : De même, en résolvant le problème d’optimisation du Théorème 4.5,


nous obtenons :
min γ = 0.2534
118 Chap 5. Applications

et le gain K comme :

K =(col 1-8)
 
0.0604 0.068 −0.0966 −0.0966 −0.0071 0.0053 −0.0075 −0.0075
 
0.0044 −0.0071 −0.0071 −0.0071 0.0663 0.0663 −0.0941 −0.0941
 
0.0002 −0.0007 −0.0003 −0.0003 0.005 −0.007 −0.0071 −0.0071
 
0 −0.0001 −0 −0 0.0005 −0.0004 −0.0008 −0.0008
(col 9-16)
 
−0.0004 0.0005 −0.0008 −0.0008 −0.0001 0 −0 −0
 
 −0.007 0.005 −0.0071 −0.0071 −0.0007 0.0002 −0.0003 −0.0003
 
 0.0663
 0.0663 −0.0941 −0.0941 −0.0071 0.0044 −0.0071 −0.0071

0.0053 −0.0071 −0.0075 −0.0075 0.068 0.0604 −0.0966 −0.0966

5.2.3 Étude en simulation


L’objectif de cette section est la mise en œuvre des commandes proposées et l’analyse
de leurs comportements pour ce réseau artériel. Supposons que l’état initial soit donné
par : x(0) = [28, 35, 11, 12, 7, 7, 28, 30, 35, 16, 15, 14, 28, 34, 5, 6]T véh. Le système est
simulé pour 100 cycles dans la plate forme de MATLAB. Les résultats sont montrés dans
la suite.

5.2.3.1 Résultats de la commande dissipative

Pour illustrer les performances de la commande dissipative, la figure 5.2 montre les
variations des taux d’occupation fi des 16 voies pour 100 cycles. L’existence des per-
turbations sinusoïdales a pour cause les oscillations des fi , mais la tendance majeure est
la convergence vers un intervalle autour de 0.4 pour toutes les voies (notamment pour
les voies des carrefours 12 et 14). En d’autres termes, la commande dissipative rend la
distribution de véhicules plus uniforme. Cette observation est aussi liée à la dissipativité
illustrée par la figure 5.3 où l’on observe que la variation de l’entropie ∆ψ(x) est toujours
inférieure à la fonction d’approvisionnement Sω . Ainsi, la commande dissipative a pour
effet une meilleure organisation du système.
En outre, nous reportons également dans la Figure 5.4 l’évolution de la commande u
durant les 100 cycles. On peut observer que les temps verts effectifs oscillent aussi mais
5.2 Application à un réseau artériel 119

x
1 1 5
x x6
0.9 1 0.9
x2
x7
0.8 x3 0.8
x8
0.7 x4 0.7
Occupations

Occupations
0.6 0.6

0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
0 20 40 60 80 100 0 20 40 60 80 100
Cycle Cycle

(a) Intersection 11 (b) Intersection 12

1 1
x x
0.9 9 0.9 13
x10 x14
0.8 x 0.8 x
11 15
0.7 x12 0.7 x16
Occupations

Occupations

0.6 0.6

0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
0 20 40 60 80 100 0 20 40 60 80 100
Cycle Cycle

(c) Intersection 13 (d) Intersection 14

F IGURE 5.2 – Évolution des taux d’occupation en utilisant la commande dissipative pour
le réseau artériel

convergent vers leurs valeurs nominales uiN = 60s. De plus, ils respectent les conditions
aux limites 20s ≤ gi ≤ 70s.
120 Chap 5. Applications

10

10
0 5 10 15 20 25 30 35 40
Cycle

F IGURE 5.3 – Évolution de Sω et ∆ψ(x) en utilisant la commande dissipative pour le


réseau artériel

60.6

60.4

60.2
La commande u

60

59.8

59.6

59.4

59.2
0 10 20 30 40 50 60 70 80 90 100
Cycle

F IGURE 5.4 – Évolution de la commande u en utilisant la commande dissipative pour le


réseau artériel
5.2 Application à un réseau artériel 121

5.2.3.2 Résultats de la commande H∞

De la même manière, les taux d’occupation sont illustrés dans la figure 5.5. On re-
marque que les oscillations sont similaires aux résultats de la figure 5.2 à cause de l’exis-
tence des perturbations sinusoïdales. Cependant, contrairement à la commande dissipa-
tive, les taux d’occupation convergent rapidement vers un petit intervalle autour de 0.4.
Ceci est notamment le cas pour les voies du carrefour 12 où on peut observer que la
convergence est atteinte avant le 20ième cycle tandis que la convergence dans le cas de la
commande dissipative demande presque 100 cycles (voir Figures 5.2(b) et 5.5(b)).

1 1 x5
x
0.9 1 0.9 x6
x2
0.8 x 0.8 x7
3
0.7 x4 0.7 x8
Occupations

Occupations

0.6 0.6

0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
0 20 40 60 80 100 0 20 40 60 80 100
Cycle Cycle

(a) Intersection 11 (b) Intersection 12

1 1
x9 x13
0.9 0.9
x10 x14
0.8 x11 0.8 x15
0.7 x12 0.7 x16
Occupations

Occupations

0.6 0.6

0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
0 20 40 60 80 100 0 20 40 60 80 100
Cycle Cycle

(c) Intersection 13 (d) Intersection 14

F IGURE 5.5 – Évolution des taux d’occupation en utilisant la commande H∞ pour le


réseau artériel

De plus, en comparant les figures 5.2 et 5.5, on constate que les amplitudes des os-
cillations des taux d’occupation sont plus petites en utilisant la commande H∞ . Cette
observation confirme l’objectif de la commande H∞ à savoir, l’atténuation des pertur-
122 Chap 5. Applications

kzc k2
bations. Ce fait peut être aussi montré dans la figure 5.6 où la quantité kωk2
est réduite
rapidement dans les premiers 20 cycles puis reste limité dans un petit intervalle. La valeur
kzc k2
maximale de kωk2
durant la simulation est égale à 0.2156 ≤ min γ, ce qui en accord avec
l’objectif de la commande H∞ .

0.25

0.2

0.15

0.1

0.05

0
0 10 20 30 40 50 60 70 80 90 100
Cycle

kzc k2
F IGURE 5.6 – Évolution de kωk2
en utilisant la commande H∞ pour le réseau artériel

Par ailleurs, la figure 5.7 montre l’évolution de la commande. On peut immédiatement


observer que la commande u évolue entre 54s et 63s puis converge vers un intervalle
i
autour de la valeur nominale vN = 60s lors des premiers 20 cycles. Ceci implique que les
temps des feux verts respectent aussi dans ce cas les conditions aux limites 20s ≤ gi ≤
70s.
En résumé, on peut dire que la commande H∞ présente de bien meilleures perfor-
mances que la commande dissipative. Ceci se comprend assez facilement car la com-
mande H∞ limite les effets des perturbations en les intégrant dans la formulation de la
commande.

5.2.3.3 Comparaison avec la commande LQ

Les simulations précédentes montrent la portée des deux stratégies de la commande


pour la régulation du réseau de carrefours à feux. Il s’ensuit que toute discussion sur leurs
avantages ne peut se faire que par rapport aux autres méthodes de régulation des carrefours
à feux. Dans cette optique, nous avons choisi de comparer nos stratégies de commande
5.2 Application à un réseau artériel 123

63

62

61
La commande u
60

59

58

57

56

55

54
0 10 20 30 40 50 60 70 80 90 100
Cycle

F IGURE 5.7 – Évolution de la commande u en utilisant la commande H∞ pour le réseau


artériel

avec la commande LQ (Linéaire Quadratique) proposée par [8]. Cette méthode joue un
rôle très important dans la stratégie TUC qui a été déployée dans quelques villes et a
présenté de bons résultats [53].
La commande LQ utilise un modèle similaire au modèle linéaire (5.1). La différence
principale est que cette stratégie ne prend pas en compte les contraintes sur l’état et la
commande. C’est la raison pour laquelle la commande LQ sera utilisée sous les mêmes
conditions de notre système. En effet, les figures 5.8 jusqu’à 5.10 comparent les perfor-
mances de la commande LQ et nos stratégies de commandes. Nous avons relevé les faits
suivants :

Comparaisons des entropies : A partir de la figure 5.8, nous pouvons remarquer que
la commande H∞ et la commande dissipative sont meilleurs par rapport à la commande
LQ dans le sens où elles fournissent des faibles entropies pour tous les cycles. Cependant,
l’entropie de la commande H∞ reste un peu faible par rapport à celle de la commande dis-
sipative. En plus, on peut aussi observer que l’entropie de la commande LQ converge vers
un état correspondant à une grande entropie, ce qui se traduit par une faible performance.
124 Chap 5. Applications

130
LQ
dissipative
120
H−infini

110
Entropie de transport

100

90

80

70

60

50
0 10 20 30 40 50 60 70 80 90 100
Cycle

F IGURE 5.8 – Évolution de l’entropie de transport pour le réseau artériel

Comparaisons des retards des véhicules : Le retard des véhicules est un critère très
important pour mesurer la qualité de service d’un système de transport. La figure 5.9
illustre les courbes des retards des véhicules par cycle en utilisant ces trois commandes.
Là aussi, il est clair que la commande H∞ conduit au plus court retard pour tous les
cycles. Les performances de la commande dissipative sont un peu plus faibles lors des
premiers cycles, mais deviennent identiques avec celles de la commande H∞ dans la
seconde moitié de la simulation. Une fois encore, la commande LQ fait converger le
système vers un mauvais état.

Efficacité : Pour l’application en temps réel, l’efficacité des commandes doit être consi-
dérée. En effet, la figure 5.10 illustre les temps de calcul des commandes pour tous les
cycles. On constate que les commandes dissipative et H∞ ont un temps de calcul proche
de zéro pour tous les cycles. Celui de la commande LQ oscille entre 0, 008s et 0, 012s, ce
qui confère à nos stratégies de commande un avantage pour des applications temps réel.
5.2 Application à un réseau artériel 125

4
x 10
3.6
LQ
dissipative
3.4
H−infini

3.2
Retard total de vehicule par cycle

2.8

2.6

2.4

2.2

1.8
0 10 20 30 40 50 60 70 80 90 100
Cycle

F IGURE 5.9 – Évolution du retard total des véhicules par cycle pour le réseau artériel

−3
x 10
20
LQ
dissipative
H−infini
15
Temps de calcul par cycle

10

−5
0 10 20 30 40 50 60 70 80 90 100
Cycle

F IGURE 5.10 – Évolution du temps de calcul pour le réseau artériel


126 Chap 5. Applications

Finalement, les résultats de cette comparaison sont résumés dans le tableau 5.2.

TABLE 5.2 – Performances pour le réseau artériel


Commande Entropie de transport Retard de véhicules (véh*s)
Moyen Max Min Moyen Max Min
LQ 97 129 59 29614 35132 21638
Dissipative 71 93 55 24434 28621 20005
H∞ 69 86 54 24298 28378 19902

Ces résultats révèlent tout d’abord la puissance de la commande H∞ et indiquent que


les commandes proposées dans ce travail présentent de bien meilleures performances que
la commande LQ pour les réseaux artériels. Ceci est dû au fait que les gains des com-
mandes proposées sont calculés une fois pour tous les cycles tandis que la commande LQ
doit résoudre pour chaque cycle un problème d’optimisation quadratique. Ce dernier peut
s’avérer complexe, surtout quand il s’agit des systèmes de grandes dimensions comme
le cas des systèmes de transport. Une autre raison aussi est que la commande LQ n’est
pas appropriée pour ce type de réseaux. En effet, Kosmatopoulos dans [53] a montré que
la commande LQ conduit le plus souvent à des grands taux d’occupation pour le réseau
artériel de Munich.

5.3 Application à un réseau en grille


Bien que les réseaux artériels soient importants dans la régulation du trafic, la plupart
des réseaux de transport urbains se structurent sous la forme d’une grille. Afin d’analyser
plus en détail les commandes proposées, nous réalisons dans cette section des simulations
pour un réseau en grille (voir Figure 5.11). Ce système est bien plus complexe que le
réseau artériel et possède beaucoup de caractéristiques des réseaux réels. Sa nature est
utile pour mettre en lumière les performances des commandes proposées.

5.3.1 Caractéristiques du réseau simulé


La Figure 5.11 donne un aperçu du réseau sous la forme d’un graphe direct. Ce sys-
tème est composé de 12 intersections numérotées 12, 21, 22, 23, 24, 31, 32, 33, 34, 42,
43, et 54. Ainsi, il comporte 48 voies numérotées de 1 jusqu’à 48. Pour chaque voie, les
5.3 Application à un réseau en grille 127

F IGURE 5.11 – Réseau en grille incluant 12 intersections

véhicules tournant à gauche et à droite partagent la même ligne que les autres véhicules.
Les sorties du réseau sont ignorées étant donné que les arcs de sortie ne sont pas pris en
compte dans les stratégies.
Nous supposons que tous les carrefours sont à deux phases de même cycle de durée
c = 90s. Pour chaque phase, le temps perdu est égal à 5s, les temps des feux verts effectifs
sont bornés entre 30 et 60s. Comme dans le cas du réseau artériel, le débit de saturation
si = 0.5véh/s est considéré pour tous les arcs du réseau. Par contre, les flux des échanges
λi,j sont données par les pourcentages suivants direct= 0.6, tourne-à-gauche= 0.1 et
128 Chap 5. Applications

tourne-à-droite= 0.3. Pour des raisons de simplicité, nous supposons que toutes les voies
partagent la même capacité moyenne x∗i = 70véh.

État nominal : Pour les voies de connexion entre le réseau et l’extérieur, nous sup-
posons que leurs débits d’entrée nominaux sont tous égales à 0.22véh/s ; d’autre part,
les débits d’entrée nominaux des voies à l’intérieur du réseau sont donnés par 0.02véh/s.
Ainsi, toutes les phases de ces 12 carrefours partagent le même temps vert effectif nominal
uiN = 40s.

Perturbations : Pour mieux mettre en évidence les effets des commandes proposées
dans ce réseau, nous considérons deux scénarios. Le premier utilise des perturbations
sinusoïdales similaires au cas du réseau artériel. Dans le deuxième scénario, nous nous
intéressons aux performances des commandes dans la situation des heures de pointes en
utilisant les perturbations à distribution de Gauss.

5.3.2 Scénario 1 : Perturbations sinusoïdales


Comme dans le cas du réseau artériel, ce scénario suppose que les perturbations sont
données par :
2kπ
ω(k) = 10qN sin( )
15

Commande dissipative : Pour illustrer les performances de la commande dissipative


dans ce cas, les figures 5.12 et 5.13 montrent les variations des taux d’occupation fi des 48
voies pour 120 cycles. Les remarques du cas d’un réseau artériel demeurent inchangées.
Néanmoins, les taux d’occupation ont tendance cette fois-ci à converger vers un intervalle
autour de 0.5. Par ailleurs, la figure 5.14 montre que la variation de l’entropie ∆ψ(x) est
toujours inférieure à la fonction d’approvisionnement Sω . Ce qui permet de dire que le
système a une tendance à perdre son désordre. Cette situation est montrée aussi par la
convergence de la commande vers les valeurs nominales uiN = 40s.
5.3 Application à un réseau en grille 129

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations
0.6 0.6

0.5 0.5
x5
0.4 x1 0.4
x6
0.3 x2 0.3
x7
0.2 x3 0.2
x8
0.1 x4 0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(a) Intersection 12 (b) Intersection 21

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations

0.6 0.6

0.5 0.5
x9 x13
0.4 0.4
x10 x14
0.3 0.3
x11 x15
0.2 0.2
x12 x16
0.1 0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(c) Intersection 22 (d) Intersection 23

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations

0.6 0.6

0.5 0.5
x x21
17
0.4 0.4
x x22
18
0.3 0.3
x x23
19
0.2 0.2
x x24
20
0.1 0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(e) Intersection 24 (f) Intersection 31

F IGURE 5.12 – Évolution des taux d’occupation en utilisant la commande dissipative pour
le réseau en grille
130 Chap 5. Applications

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations
0.6 0.6

0.5 0.5
x25 x29
0.4 0.4
x26 x30
0.3 0.3
x27 x31
0.2 0.2
x28 x32
0.1 0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(a) Intersection 32 (b) Intersection 33

1 1

0.9

0.8 0.8

0.7
Occupations
Occupations

0.6 0.6

0.5
x33 x37
0.4 0.4
x34 x38
0.3
x35 x39
0.2 0.2
x36 x40
0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(c) Intersection 34 (d) Intersection 42

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations

0.6 0.6

0.5 0.5

0.4 x41 0.4 x


45

0.3 x42 0.3 x


46

0.2 x43 0.2 x


47

0.1 x44 0.1 x


48
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(e) Intersection 43 (f) Intersection 53

F IGURE 5.13 – Évolution des taux d’occupation en utilisant la commande dissipative pour
le réseau en grille
5.3 Application à un réseau en grille 131

15

10

10

15
0 5 10 15 20 25 30 35 40
Cycle

F IGURE 5.14 – Évolution de Sω et ∆ψ(x) en utilisant la commande dissipative pour le


réseau en grille

40.4

40.3

40.2
La commande u

40.1

40

39.9

39.8

39.7
0 20 40 60 80 100 120
Cycle

F IGURE 5.15 – Évolution de la commande u en utilisant la commande dissipative pour le


réseau en grille

Commande H∞ : De la même manière, les figures 5.16, 5.17, 5.18 et 5.19 illustrent
kzc k2
respectivement les variations des taux occupations des voies, l’évolution du rapport kωk2
et la variation de la commande. Nous remarquons sans difficulté que toutes les observa-
132 Chap 5. Applications

tions concernant la commande H∞ du cas du réseau artériel sont toujours valables. En


plus, les meilleurs résultats sont obtenus quand la commande H∞ est appliquée.

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations
0.6 0.6

0.5 0.5
x5
0.4 x1 0.4
x6
0.3 x2 0.3
x7
0.2 x3 0.2
x8
0.1 x4 0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(a) Intersection 12 (b) Intersection 21

1 1

0.9

0.8 0.8

0.7
Occupations
Occupations

0.6 0.6

0.5
x9 x13
0.4 0.4
x10 x14
0.3
x11 x15
0.2 0.2
x12 x16
0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(c) Intersection 22 (d) Intersection 23

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations

0.6 0.6

0.5 0.5
x x21
17
0.4 0.4
x x22
18
0.3 0.3
x x23
19
0.2 0.2
x x24
20
0.1 0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(e) Intersection 24 (f) Intersection 31

F IGURE 5.16 – Évolution des occupations en utilisant la commande H∞ pour le réseau


en grille
5.3 Application à un réseau en grille 133

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations
0.6 0.6

0.5 0.5
x25 x29
0.4 0.4
x26 x30
0.3 0.3
x27 x31
0.2 0.2
x28 x32
0.1 0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(a) Intersection 32 (b) Intersection 33

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations

0.6 0.6

0.5 0.5
x33 x37
0.4 0.4
x34 x38
0.3 0.3
x35 x39
0.2 0.2
x36 x40
0.1 0.1

0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(c) Intersection 34 (d) Intersection 42

1 1

0.9 0.9

0.8 0.8

0.7 0.7
Occupations

Occupations

0.6 0.6

0.5 0.5

0.4 x 0.4 x45


41

0.3 x 0.3 x46


42

0.2 x 0.2 x47


43

0.1 x 0.1 x48


44
0 0
0 20 40 60 80 100 120 0 20 40 60 80 100 120
Cycle Cycle

(e) Intersection 43 (f) Intersection 53

F IGURE 5.17 – Évolution des taux d’occupation en utilisant la commande H∞ pour le


réseau en grille
134 Chap 5. Applications

0.25

0.2

0.15

0.1

0.05

0
0 20 40 60 80 100 120
Cycle

kzc k2
F IGURE 5.18 – Évolution de kωk2
en utilisant la commande H∞ pour le réseau en grille

48

46

44
La commande u

42

40

38

36

34
0 20 40 60 80 100 120
Cycle

F IGURE 5.19 – Évolution de la commande u en utilisant la commande H∞ pour le réseau


en grille
5.3 Application à un réseau en grille 135

Comparaison avec la commande LQ : La figure 5.20 compare les entropies pour les
trois stratégies. On peut observer que la commande H∞ est toujours puissante par rapport
aux deux autres. Cependant, cette fois-ci, la commande LQ donne de meilleurs résultats
que la commande dissipative.

480

460

440

420
Entropie de transport

400

380

360

340

320
LQ
300 dissipative
H−infini
280
0 5 10 15 20 25 30 35 40
Cycle

F IGURE 5.20 – Évolution de l’entropie du transport pour le réseau en grille

La figure 5.21 compare le retard total des véhicules par cycle. Là aussi, on peut remar-
quer que la commande H∞ donne de bons résultats par rapport aux autres. Toutefois, la
différence entre la commande LQ et la commande dissipative est très peu illustrée. Cepen-
dant, le tableau 5.3 montre que la commande LQ est un peu meilleure que la commande
dissipative.

TABLE 5.3 – Performances pour le réseau en grille (scénario 1)


Commande Entropie du transport Retard de véhicules (véh*s)
Moyen Max Min Moyen Max Min
LQ 382 474 305 91724 100835 82705
Dissipative 384 480 302 91881 100764 82638
H∞ 376 460 301 91635 100590 82866

Enfin, en ce qui concerne les temps de calcul des commandes par cycle, la figure 5.21
donne un avantage certain à nos stratégies de commandes par rapport à la commande LQ.
136 Chap 5. Applications

4
x 10
10.2

10

9.8

Retard total de vehicule par cycle


9.6

9.4

9.2

8.8

8.6
LQ
8.4 dissipative
H−infini
8.2
0 5 10 15 20 25 30 35 40
Cycle

F IGURE 5.21 – Évolution du retard total de véhicules par cycle pour le réseau en grille

−3
x 10
15
LQ
dissipative
H−infini

10
Temps de calcul par cycle

−5
0 20 40 60 80 100 120
Cycle

F IGURE 5.22 – Évolution du temps de calcul pour le réseau en grille

En résumé, ces résultats révèlent toujours que la commande H∞ est bien puissante
et s’adapte aux deux types de réseaux. Par contre, la commande dissipative donne de
mauvais résultats par rapport à la commande LQ. Cependant, pour les applications temps
réel, nos deux stratégies de commande demeurent les meilleures.
5.3 Application à un réseau en grille 137

5.3.3 Scénario 2 : Perturbations à distribution de Gauss


L’heure de pointe est la période de la journée pendant laquelle le trafic est le plus im-
portant. Les problèmes de transport tels que la congestion, se concentrent lors de cette pé-
riode. Par conséquent, tester le comportement des commandes proposées face à l’heure de
pointe représente un grand intérêt. Pour ce scénario, nous introduisons des perturbations
qui correspondent à une période de pointe pour chaque entrée du réseau et examinons les
performances des commandes dans ce cas.
En effet, la distribution de Gauss est utilisée ici afin d’imiter la demande lors des
heures de pointe. Figure 5.23 montre les flux d’entrée à partir de l’extérieur du réseau.
Observons que le réseau rencontre de grands flux entre les cycles 20 et 60. Les ampli-
tudes et les durées de ces impulsions varient suivant 9 entrées y1 , · · · , y9 . Ces dernières
correspondent aux 5 directions horizontales et 4 verticales. Les autres flux d’entrée sont
donnés par leurs valeurs nominales.

20
y1
18 y2
y3
16 y4
y5
Perturbations aux heures de pointe

14
y6
y7
12
y8
10 y9

0
0 10 20 30 40 50 60 70 80
Cycle

y1 pour les directions 11 → 12 et 13 → 12 y2 pour les directions 20 → 21 et 25 → 24


y3 pour les directions 30 → 31 et 35 → 34 y4 pour les directions 41 → 42 et 44 → 43
y5 pour les directions 52 → 53 et 54 → 53 y6 pour les directions 11 → 21 et 41 → 31
y7 pour les directions 02 → 12 et 52 → 42 y8 pour les directions 13 → 23 et 63 → 53
y9 pour les directions 14 → 24 et 44 → 34

F IGURE 5.23 – Perturbations aux heures de pointe


138 Chap 5. Applications

Afin d’examiner les capacités des commandes à gérer ces grandes demandes de trafic,
la simulation est effectuée pour 80 cycles (correspondant à deux heures). A partir des fi-
gures 5.24, 5.25 et 5.26, nous pouvons observer que ces grandes perturbations provoquent
de grandes augmentations des taux d’occupation pour les trois stratégies. Il y en a même
qui dépassent la capacité de la voie (état de congestion). Cependant, les amplitudes et
les durées de ces états sont différentes. En effet, le Tableau 5.4 nous donne, pour chaque
commande, l’amplitude de la première impulsion (réponse à la perturbation y1 ) et le cycle
de fin de l’évacuation (le cycle quand tous les taux d’occupation redeviennent inférieurs
à 0.3). Les résultats montrent que la commande H∞ dépasse largement les autres mé-
thodes avec la plus petite augmentation du taux d’occupation et la plus grande vitesse
d’évacuation.
Ce fait est aussi illustré par rapport aux entropies et le retard total des véhicules dans
les figures 5.27 et 5.28. Cependant, il faut souligner que la commande LQ présente de
meilleures performances par rapport à la commande dissipative.

0.9

0.8
0.75
0.7

0.6
Occupations

0.5 63

0.4

0.3

0.2

0.1

0
10 20 30 40 50 60 70
Cycle

F IGURE 5.24 – Évolution des taux d’occupation en utilisant la commande dissipative avec
les perturbations aux heures de pointe
5.3 Application à un réseau en grille 139

0.9

0.8

0.7

0.59
0.6
Occupations

0.5 58

0.4

0.3

0.2

0.1

0
10 20 30 40 50 60 70
Cycle

F IGURE 5.25 – Évolution des taux d’occupation en utilisant la commande H∞ avec les
perturbations aux heures de pointe

0.9

0.8
0.7
0.7

0.6
Occupations

0.5

0.4
60

0.3

0.2

0.1

0
10 20 30 40 50 60 70
Cycle

F IGURE 5.26 – Évolution des taux d’occupation en utilisant la commande LQ avec les
perturbations aux heures de pointe
140 Chap 5. Applications

TABLE 5.4 – Performances face aux perturbations à distribution de Gauss


Commande Amplitude de la première impulsion Cycle de fin de l’évacuation
LQ 0.7 60
Dissipative 0.75 63
H∞ 0.59 58

180
LQ
dissipative
160
H−infini

140
Entropie de transport

120

100

80

60

40

20
10 20 30 40 50 60 70
Cycle

F IGURE 5.27 – Évolution de l’entropie du transport avec les perturbations aux heures de
pointe

4
x 10
4
LQ
dissipative
H−infini
3.5
Retard total de vehicule par cycle

2.5

1.5

1
10 20 30 40 50 60 70
Cycle

F IGURE 5.28 – Évolution du retard total des véhicules par cycle avec les perturbations
aux heures de pointe
5.4 Conclusion 141

5.4 Conclusion
La difficulté de la mise en oeuvre d’une stratégie de régulation de trafic réside dans
le choix de la géométrie du réseau de test. Pour cela, nous avons choisi deux types de
réseaux à différentes échelles contenant 4 et 12 carrefours afin de tester nos commandes
sur différentes situations : artériel et en grille. Ces réseaux possèdent des caractéristiques
correspondantes aux flux et aux feux des réseaux réels, et donc peuvent servir comme des
systèmes de test.
Les résultats de simulation montrent que les commandes proposées réalisent leurs
objectifs pour chaque système et arrivent à bien réguler le trafic. De plus, confrontées à la
commande LQ, les stratégies proposées offrent de meilleures performances, notamment
la commande H∞ qui montre bien sa puissance dans la diminution de l’entropie et le
retard de véhicules pour les différents scénarii de test. Ces résultats nous encouragent à
privilégier à mettre en pratique la commande H∞ sur un réseau réel.
Enfin, nous terminons cette conclusion pour souligner une remarque importante concer-
nant l’entropie. En effet, lors des comparaisons de nos méthodes avec la command LQ,
les courbes des entropies et du retard des véhicules ont toujours les mêmes allures. Ceci
confirme la légitimité de l’entropie du transport que nous avons introduit dans ce travail
comme une mesure du désordre du système puisque le retard des véhicules est évidem-
ment relatif au niveau d’organisation du trafic.
142 Chap 5. Applications
CONCLUSION GÉNÉRALE

Dans ce travail, nous avons présenté notre contribution portant sur la modélisation
et le contrôle a priori de congestion des réseaux de carrefours signalisés. Ces systèmes
dynamiques sont sujets à des incertitudes et des contraintes d’ordre physique ou imposées
par des obligations de sécurité. Dans ce cadre, nous avons présenté deux contributions
permettant d’apporter des améliorations appréciables pour la fluidification du trafic dans
un réseau de transport tout en tenant compte à la fois des incertitudes et des contraintes
du système.
Du point de vue de la modélisation, nous avons introduit un nouveau regard sur les sys-
tèmes de transport en proposant un premier travail sur la manière dont les liens se tissent
entre ces systèmes et la thermodynamique. Pour cela, plusieurs paramètres et principes
thermodynamiques ont trouvé leurs parallèles dans le cadre des systèmes de transport
tels que la température (taux d’occupation de la voie), la capacité thermique (capacité de
la voie), l’équilibre thermique (l’équilibre du taux d’occupation), le premier principe de
la thermodynamique (loi de conservation des véhicules) et les notions d’entropie et di-
sentropie. Le point de vue prépondérant est la considération des véhicules comme étant
l’énergie fournie ou/et échangée entre les intersections signalisées. Contrairement aux ap-
proches existantes, le modèle développé se base sur la notion d’énergie au lieu du débit.
L’avantage majeur de la modélisation thermodynamique est l’introduction de la notion
d’entropie mesurant le désordre dans les réseaux du transport. Nous avons montré que
cette dernière est liée à la densité de la circulation, ce qui lui confère une légitimité de
son utilisation. En effet, non seulement elle peut être considérée comme un moyen pour
144 Conclusion générale

la compréhension des phénomènes du trafic, mais aussi comme un outil d’évaluation pour
avoir une idée rapide sur l’évolution du trafic surtout lorsqu’il s’agit de traiter des réseaux
de grande taille.
Un autre avantage de la modélisation est que le choix énergétique fait apparaître sur le
modèle le nombre de véhicules présents sur les segments de route comme variable d’état,
ce qui permet de suivre les modifications de l’infrastructure routière dues à des situations
nouvelles sans avoir à reprendre les démarches de modélisation depuis le début. En outre,
il permet de décrire explicitement les phénomènes qui gouvernent le trafic tels que le
phénomène de congestion qui est facilement représenté par l’augmentation de l’entropie
(désordre).
Du point de vue du contrôle, la contribution principale du travail est l’introduction
des concepts de la dissipativité et de la synthèse H∞ dans le domaine de la commande
du trafic. Ces approches nous ont permis de traiter le problème de la commande de deux
façons différentes.
La première fait appel à la commande dissipative. Nous avons exploité cet outil pour
arriver à des résultats théoriques dont la vérification permet de conclure sur la possibilité
de dissiper les véhicules au moyen d’une action de la commande adéquate. L’existence
d’une commande dissipative est caractérisée par la faisabilité de certaines inégalités ma-
tricielles linéaires dont les solutions s’avèrent relativement simples à mettre en œuvre
et non coûteuses du point de vue temps de calcul. Deux cas ont été étudiés : celui où
le modèle du système est non-linéaire est d’abord analysé. Ensuite, nous nous sommes
intéressés au cas où le système peut être représenté par un modèle linéaire.
Dans le cas non-linéaire, nous avons trouvé une borne supérieure sur la norme des
incertitudes en deçà de laquelle la propriété de la dissipativité du système incertain est
conservée. Par contre, le cas linéaire n’impose aucune pénalité sur les incertitudes. Par
conséquent, l’effet des perturbations sur le comportement du système bouclé est difficile
à maîtriser, et en particulier la stabilité n’est plus garantie.
Pour remédier aux inconvénients de l’approche de la commande dissipative dans le
cas linéaire, nous avons dû avoir recours à la commande H∞ pour la solution de notre
problème de commande. Nous avons tiré profit de cet outil pour développer des résultats
assurant l’invariance positive en boucle fermée d’un domaine ellipsoïdal contenu dans
l’ensemble des contraintes. Le test d’existence et le calcul d’une loi de commande par re-
tour d’état peut alors se faire de façon simple par la résolution d’un problème de program-
145

mation linéaire convexe. Cette méthode nous a permis en outre d’intégrer directement les
incertitudes sur la commande dans la synthèse du régulateur.
L’utilisateur dispose ainsi de deux approches à sa disposition selon ses besoins. Ce-
pendant, les résultats de simulation sur les deux types de réseaux du chapitre 5 ont permis
de mettre en lumière l’importance de la méthode H∞ puisqu’elle a réussi à satisfaire les
objectifs de départ à savoir :
– Eviter la congestion en forçant les files d’attente à ne pas dépasser le niveau du
trafic correspondant à l’optimum opérationnel des lignes.
– Le calcul de la commande en temps réel.
– La prise en compte des incertitudes dans la conception de la commande.
Finalement, l’ensemble de ces travaux contribue ainsi à préciser l’intérêt d’utiliser
les concepts de l’entropie et de l’invariance positive pour résoudre le problème de la
régulation du trafic au sein d’un réseau d’intersections signalisées.

Perspectives
Plusieurs perspectives et voies de recherche peuvent être discernées. En effet, il serait
intéressant de poursuivre ce travail sur les points suivants :
1. La perspective la plus directe consiste à valider nos stratégies de commande sur un
réseau de transport réel.

2. Le système de contrôle dynamique du trafic est un système qui dispose de cap-


teurs lui donnant des informations sur l’état du trafic, et notamment, le nombre de
véhicules sur certaines rues ou intersections du réseau routier. Ces capteurs sont
assujettis à leur tour à des perturbations diverses et par conséquent les informations
issues de ces outils de mesure sont souvent approximatives. Il est alors intéressant
de s’attaquer aux problèmes de la présence des incertitudes de structure qui peuvent
être confinées dans la matrice dynamique A ou la matrice de commande B.

3. Il est intéressant aussi de faire appel à l’outil d’optimisation avec contraintes afin
de prendre en compte les critères dédiés à la régulation du trafic comme le temps
de trajet, le temps d’attente des véhicules, etc.
146 Conclusion générale
BIBLIOGRAPHIE

[1] J. D. C. Little, M. D. Kelson, and N. H. Gartner, “MAXBAND : A Program for


Setting Signals on Arteries and Triangular Networks,” in Transportation Research
Record 795. Washington, DC : U.S. Dept. Transp., 1981.
[2] W. H. Kraft, W. S. HOMBURGER, and J. L. Pline, Traffic engineering handbook.
Institute of Transportation Engineers, 2009.
[3] F. V. Webster and B. M. Cobbe, Traffic signals, ser. Road research technical paper.
London : Great Britain Road Research Laboratory, 1966, no. 56.
[4] A. Benesch, “Regulating Street Traffic in Cleveland,” The American City, pp. 182–
184, 1915.
[5] B. Marsh, “Traffic control,” Annals of the American Academy of Political and Social
Science, vol. 133, pp. 90–113, 1927.
[6] M. Bell, “Future directions in traffic signal control,” Transportation Research Part
A : Policy and Practice, vol. 26A, pp. 303–313, 1992.
[7] R. Hall, Ed., Handbook of Transportation Science. Kluwer Academic Publishers,
1999.
[8] C. Diakaki, M. Papageorgiou, and K. Aboudolas, “A multivariable regulator ap-
proach to traffic-responsive network-wide signal control,” Control Engineering
Practice, vol. 10, no. 2, pp. 183–195, Feb. 2002.
[9] N. H. Gartner, C. J. Messer, and A. K. Rathi, Eds., Revised Monograph on Traffic
Flow Theory. Federal Highway Administration, USA, 2005.
148 BIBLIOGRAPHIE

[10] W. Adams, “Road Traffic Considered as a Random Series,” J. Inst. Civil Engineers,
vol. 4, pp. 121–130, 1936.
[11] B. D. Greenshields, “A Study in Highway Capacity,” Highway Research Board,
Proceedings, vol. 14, p. 458, 1935.
[12] L. Pipes, “An Operational Analysis of Traffic Dynamics,” Journal of Applied Phy-
sics, vol. 24, no. 3, pp. 274–281, 1953.
[13] P. Gipps, “A behavioural car-following model for computer simulation,” Transpor-
tation Research Part B : Methodological, vol. 15, no. 2, pp. 105–111, 1981.
[14] X. Zhao and Z. Gao, “A new car-following model : full velocity and acceleration
difference model,” The European Physical Journal B, vol. 47, no. 1, pp. 145–150,
Sep. 2005.
[15] M. Lighthill and G. Whitham, “On kinematic waves II : a theory of traffic flow on
long crowded roads,” in Proceedings of the Royal Society, London Series A, vol. 229,
1955, pp. 317–345.
[16] P. Richards, “Shockwaves on the highway,” Operations Research, vol. 4, no. 1, pp.
42–51, 1956.
[17] C. F. Daganzo, “The cell transmission model, part II : Network traffic,” Transporta-
tion Research Part B : Methodological, vol. 29, no. 2, pp. 79–93, Apr. 1995.
[18] H. Zhang and W. Jin, “Kinematic Wave Traffic Flow Model for Mixed Traffic,”
Transportation Research Record, vol. 1802, no. 1, pp. 197–204, Jan. 2002.
[19] J. Wardrop, “Some Theoretical Aspects of Road Traffic Research,” in Proceedings
of the Institution of Civil Engineers, Part II, vol. 1, no. 2, 1952, pp. 325–362.
[20] N. Vandaele, T. V. Woensel, and A. Verbruggen, “A queueing based traffic flow
model,” Transportation Research Part D : Transport and Environment, vol. 5, no. 2,
pp. 121–135, 2000.
[21] J. Kamata and T. Oda, “Detectors for road traffic,” Concise encyclopedia of traffic
and transportation systems, 1991.
[22] L. A. Klein, M. K. Mills, and D. R. P. Gibson, Traffic Detector Handbook. U.S.
Department of Transportation Federal Highway Administration, 2006.
[23] S. Avner, R. Glachet, M. Pintado, and F. Boillot, “L’image au service de la gestion
du trafic urbain,” TRANSPORT ENVIRONNEMENT CIRCULATION, vol. 160, pp.
9–13, 2000.
BIBLIOGRAPHIE 149

[24] C. Chaudy, J. Delaigle, and M. Macq, “Analyse du trafic routier par caméra intelli-
gente : MvTraffic,” UCL, Tech. Rep., 2004.
[25] F. Webster, Traffic signal settings, ser. Road research technical paper. London :
Great Britain Road Research Laboratory, 1958, no. 39.
[26] J. T. Morgan and J. D. C. Little, “Synchronizing Traffic Signals for Maximal Band-
width,” Operations Research, vol. 12, pp. 896–912, 1964.
[27] J. D. C. Little, “The Synchronization of Traffic Signals by Mixed-Integer Linear
Programming,” Operations Research, vol. 14, no. 4, pp. 568–594, Jul. 1966.
[28] N. A. Chaudhary, A. Pinnoi, and C. Messer, “Proposed enhancements to
MAXBAND-86 program,” Transportation Research Record, vol. 1324, 1991.
[29] N. H. Gartner, S. F. Assmann, L. F., and D. L. Hom, “A multiband approach to arte-
rial traffic signal optimization,” Transportation Research Part B : Methodological,
vol. 25, pp. 55–74, 1991.
[30] C. Stamatiadis and N. H. Gartner, “MULTIBAND-96 : a program for variable band-
width progression optimization of multiarterial traffic networks,” U.S. Dept. Transp.,
Washington, DC, Transp. Res. Record 1554, 1996.
[31] D. I. Robertson, “TANSYT method for area traffic control,” Traffic Engineering &
Control, vol. 10, pp. 276–281, 1969.
[32] D. Hale, Traffic Network Study Tool : TRANSYT-7F, United States Version. Mc-
Trans Center in the University of Florida, Gainesville, Jan. 2005.
[33] M. T. Li and A. C. Gan, “Signal timing optimazation for oversaturated networks
using TRANSYT-7F,” in 78th Annu. Meeting Transportation Research Board, 1999.
[34] M. Bielli, G. Ambrosino, and M. Boero, Artificial intelligence applications to traffic
engineering. VSP International Science Publishers, 1994.
[35] P. Lowrie, “The Sydney coordinated adaptive traffic system - principles, methodo-
logy, algorithms,” in International Conference on Road Traffic Signalling, London,
United Kingdom, 1982, pp. 67–70.
[36] P. Hunt, D. Robertson, R. Bretherton, and R. Winton, “SCOOT-a traffic responsive
method of coordinating signals,” Transport and Road Research Laboratory, Tech.
Rep. LR 1014 Monograph, 1981.
150 BIBLIOGRAPHIE

[37] R. D. Bretherton, P. Hunt, D. Robertson, and M. Royle, “The SCOOT on-line traffic
signal optimisation technique,” Traffic Engineering and Control, vol. 23, no. 4, pp.
190–192, 1982.
[38] D. Bretherton, “Current Developments in SCOOT : Version 3,” Transportation Re-
search Record : Journal of the Transportation Research Board, vol. 1554, pp. 48–52,
1996.
[39] R. Bretherton, “The use of SCOOT for traffic management,” in INTERNATIONAL
CONFERENCE ON ROAD TRAFFIC CONTROL, 1986, pp. 81–85.
[40] N. H. Gartner, “OPAC : A DEMAND-RESPONSIVE STRATEGY FOR TRAFFIC
SIGNAL CONTROL,” in Transportation Research Record 906. Washington, DC :
U.S. Dept. Transp., 1983.
[41] N. H. Gartner, F. J. Pooran, and C. M. Andrews, “Implementation of the OPAC
adaptive control strategy in a traffic signal network,” in Proceedings of the IEEE
4th International Conference on Intelligent Transportation Systems, Oakland, CA,
2001, pp. 195–200.
[42] D. Gazis and R. Potts, “The Oversaturated Intersection,” in Proceedings of the Se-
cond International Symposium on the Theory of Road Traffic Flow, 1963, pp. 221–
237.
[43] D. C. Gazis, Traffic Theory. Boston : MA : Kluwer, 2002.
[44] M. Papageorgiou, C. Diakaki, V. Dinopoulou, A. Kotsialos, and Y. Wang, “Review
of road traffic control strategies,” Proceedings of the IEEE, vol. 91, no. 12, pp. 2043–
2067, 2003.
[45] G. C. D’Ans and D. C. Gazis, “Optimal Control of Oversaturated Store-and-Forward
Transportation Networks,” Transportation Science, vol. 10, no. 1, pp. 1 –19, Feb.
1976.
[46] P. G. Michalopoulos and G. Stephanopoulos, “Oversaturated signal systems with
queue length constraints ii : System of intersections,” Transportation Research,
vol. 11, pp. 413–421, 1977.
[47] J. H. Lim, S. H. Hwang, I. H. Suh, and Z. Bien, “Hierarchical optimal control of
oversaturated urban networks,” Int. J. Control, vol. 33, p. 727¨C737, 1981.
[48] E. J. Davison and U. Ozguner, “Decentralized control of traffic networks,” IEEE
Transactions on Automatic Control, vol. 28, p. 677¨C688, 1983.
BIBLIOGRAPHIE 151

[49] A. K. Rathi, “A control scheme for high traffic density sectors,” Transportation Re-
search Part B : Methodological, vol. 22, pp. 81–101, 1988.
[50] K.-J. Kim and M. G. H. Bell, “Development of an integrated traffic control strategy
for both urban signalised and motorway networks,” in Proceedings of 1st Meeting
EUROWorking Group on Urban Traffic and Transportation, Landshut, Germany,
1992.
[51] C. Diakaki, “Integrated control of traffic flow in corridor networks,” Ph.D. Thesis,
Department of Production Engineering and Management, Technical University of
Crete, Chania, Greece, 1999.
[52] K. Aboudolas, M. Papageorgiou, and E. Kosmatopoulos, “Store-and-forward based
methods for the signal control problem in large-scale congested urban road net-
works,” Transportation Research Part C : Emerging Technologies, vol. 17, no. 2,
pp. 163–174, Apr. 2009.
[53] E. Kosmatopoulos, M. Papageorgiou, C. Bielefeldt, V. Dinopoulou, R. Morris,
J. Mueck, A. Richards, and F. Weichenmeier, “International comparative field eva-
luation of a traffic-responsive signal control strategy in three cities,” Transportation
Research Part A : Policy and Practice, vol. 40, no. 5, pp. 399–413, Jun. 2006.
[54] W. M. Haddad, Q. Hui, S. G. Nersesov, and V. Chellaboina, “Thermodynamic mo-
deling, energy equipartition, and nonconservation of entropy for discrete-time dy-
namical systems,” Advances in Difference Equations, vol. 2005, no. 3, pp. 275–318,
2005.
[55] Y. A. Cengel and M. Boles, Thermodynamics : An Engineering Approach, 4th ed.
McGraw-Hill Science/Engineering/Math, Nov. 2001.
[56] J. C. Willems, “Dissipative dynamical systems part I : General theory,” Archive for
Rational Mechanics and Analysis, vol. 45, no. 5, pp. 321–351, 1972.
[57] G. H. Hardy, J. E. Littlewood, and G. Pólya, Inequalities, 1st ed. London : Cam-
bridge University Press, 1934.
[58] A. W. Marshall, I. Olkin, and B. C. Arnold, Inequalities : Theory of Majorization
and Its Applications, 2nd ed., ser. Springer Series in Statistics. New York, USA :
Springer, 2011.
[59] F. Robert, Matrices nonnégatives et normes vectorielles, ser. Cours de DEA. Gre-
noble : Institut IMAG, 1973.
152 BIBLIOGRAPHIE

[60] J. C. Hennet, “Une extension du lemme de Farkas et son application au problème


de régulation linéaire sous contrainte,” Comptes rendus de l’Académie des sciences.
Série 1, Mathématique, vol. 308, no. 13, pp. 415–419, 1989.
[61] S. Boyd, L. E. Ghaoui, E. Feron, and V. Balakrishnan, Linear matrix inequalities in
system and control theory. SIAM, 1994.
[62] G. Zames, “On the input-output stability of time-varying nonlinear feedback systems
part one : Conditions derived using concepts of loop gain, conicity, and positivity,”
IEEE Transactions on Automatic Control, vol. 11, no. 2, pp. 228–238, 1966.
[63] J. C. Willems, “Dissipative dynamical systems Part II : Linear systems with quadra-
tic supply rates,” Archive for Rational Mechanics and Analysis, vol. 45, no. 5, pp.
352–393, 1972.
[64] V. M. Popov, Hyperstability of Control Systems. New York : Springer-Verlag, 1973.
[65] B. Brogliato, R. Lozano, B. Maschke, O. Egeland et al., Dissipative systems analysis
and control : theory and applications, 2nd ed. London : Springer Verlag, 2007.
[66] J. Doyle, A. Packard, and K. Zhou, “Review of LFTs, LMIs, and µ,” in Proceedings
of the 30th IEEE Conference on Decision and Control, 1991. IEEE, Dec. 1991, pp.
1227–1232 vol.2.
[67] S. Boyd and L. Vandenberghe, Convex Optimization. Cambridge University Press,
Mar. 2004.
[68] M. Grant and S. Boyd, “CVX : Matlab Software for Disciplined Convex Program-
ming, version 1.21,” Apr. 2011.
[69] S. Chen, “Real-time traffic signal control for over-saturated networks,” Ph.D. Thesis,
Texas Tech University, Nov. 2007.

Вам также может понравиться