Régulation Directe Adaptative - Chap04

Chapitre 4
Rgulation directe adaptative et prdictive sur

plusieurs pas de temps pour processus
plusieurs entres et plusieurs sorties
4.1. Introduction
Les rgulateurs flous sont reconnus comme une solution viable, face aux rgulateurs
classiques, pour la commande de processus complexes, non linaires ou imparfaitement
connus. La littrature propose dj plusieurs approches pour leur conception [LIV 98,
WAN 97]. Ce chapitre prsente un rgulateur flou adaptatif et prdictif sur plusieurs
units de temps, plusieurs entres et plusieurs sorties (MSDAFC : Multiple Step
Direct Adaptive Fuzzy Controller). Un tel rgulateur a t utilis lIRIDIA dans le
cadre du projet europen : Fuzzy Algorithm for the control of Multi-Input, Multi-Output
processes (FAMIMO) (ESPRIT LTR project 21911).
Nous dcrivons, dans ce chapitre, une technique de commande adaptative applicable

des systmes dont la structure est connue mais dont les paramtres sont inconnus.
Ces paramtres peuvent tre regroups dans un vecteur p. Si le systme est linaire et
que p est connu, il est possible de trouver immdiatemment le vecteur des paramtres
optimaux w du rgulateur. Si le systme est non linaire, ou si p est inconnu, le vecteur
w des paramtres du rgulateur doit tre ajust en ligne.
Il existe deux approches distinctes pour la commande adaptative : lapproche directe

et lapproche indirecte. Dans la commande adaptative indirecte, les paramtres du
Chapitre rdig par Frank Vanden Berghen et Hugues Bersini.
139
140 Commande floue 1
processus sont estims (p) chaque instant et les paramtres w du rgulateur sont
calculs sur base des p. Les p sont assimils aux vrais paramtres p du processus. Dans
ce chapitre, nous nous intressons la commande adaptative directe. Les paramtres du
rgulateur sont ajusts afin de minimiser une fonction de cot donne. Cet ajustement
des paramtres est ralis via un algorithme dapprentissage ; nous utilisons la descente
de gradient.
Le travail prsent ici est inspir de travaux raliss dans le cadre de la commande
neuronale adaptative [REN 95, REN 96]. Nous proposons une extension des rsultats
la commande floue et une gnralisation de la procdure.
Les systmes flous sont des approximateurs universels [CAS 95, YIN 94]. Cette
proprit est une des hypothses ncessaire lapplication de notre algorithme. Les
systmes flous peuvent donc tre utiliss en tant que rgulateur sous forme de bote
noire paramtrisable [REN 94, WAN 93].
Les techniques de rgulation floue ont toutes un point commun : laction de contrle
est obtenue par la combinaison de rgulateurs simples (gnralement linaires) dfi-
nis localement sur lespace dentre du rgulateur. Laction de contrle dfinie par
la consquence de la rgle sapplique dans la zone de lespace dentre limite par
lantcdent. Lorsque plusieurs rgles sont actives en mme temps, dans une certaine
partie de lespace, laction de contrle applique est obtenue par combinaison floue
des diverses rgles.
Le prsent chapitre a t inspir du travail ralis par les auteurs de [BER 00], de
[BER 96] et de [BAK 97].
4.2. Description du systme
La figure 4.1 montre la structure en boucle ferme du systme de contrle. Celui-ci

est compos :
dun processus rguler ;
dun prdicteur P de ce processus ;
dun rgulateur flou R.
A chaque appel du rgulateur, celui-ci adaptera les paramtres des systmes flous
Ri qui le composent (un systme flou par signal de contrle ui ). Il calculera ensuite
les signaux de contrle (qui sont simplement la sortie des systmes flous Ri ).
Nous voulons rguler un processus n entres et q sorties.

Rgulation directe adaptative et prdictive 141
Figure 4.1. Reprsentation schmatique du systme de rgulation
Le rgulateur R se prsente sous la forme dune fonction floue entre-sortie :

ui (t) = Ri [y(t), i (t); w(t)] 1 i n1 [4.1]
i (t) = [u(t 1), . . . , u(t (nrs )i ),
v(t 1), . . . , v(t (nrv )i ),
y(t), . . . , y(t (nre )i + 1)] [4.2]
avec :
u(t) n1 : sorties : actions de commande du rgulateur au temps t ;
v(t) n2 : entres : perturbations observables du systme ;
y(t) q : entres : la consigne voulue au temps t (idalement y(t) y(t)) ;
y(t) q : entres : la sortie du processus au temps t ;
w(t) : les paramtres du rgulateur cest--dire les centres (Cj ) et variances (Fj )
des ensembles flous et les paramtres Lj des consquences de chaque rgle floue (voir
paragraphe 4.3.3.) ;
Ri (. . .) : le systme flou permettant de calculer ui ;
nrs n1 , nre n1 , nrv n1 : ordres connus du systme.
Remarque. Associ y(t) nous trouvons nre (voir [4.2]). nre est un ordre associ
une entre du rgulateur.
Des dlais nrde , nrdv peuvent tre intgrs au rgulateur, mais ils prsentent peu
dintrt, cest pourquoi ils ne sont pas repris dans [4.2].
Nous utilisons un prdicteur P sous forme de systme flou qui se prsente comme
suit :
yi (t + 1) = Pi [i (t)], 1iq [4.3]
i (t) = [y(t), . . . , y(t (nps )i + 1),
u(t (npde )i + 1), . . . , u(t (npe )i (npde )i + 2),
v(t (npdv )i + 1), . . . , v(t (npd )i (npdv )i + 2)] [4.4]
avec :
u(t) n1 : entres : actions de commande du rgulateur au temps t ;
v(t) n2 : entres : perturbations observables du systme ;
y(t) q : sorties : prdiction pour le temps t ;
Pi (. . .) : le systme flou permettant de prdire yi ;
nps q , npe q , npv q : ordres connus du systme ;
npde q , npdv q : dlais connus du systme.
Remarque. Les lments des vecteurs npde et npdv doivent tre suprieurs 1 pour
avoir un rel sens physique.
Exemple. Nous voulons rguler un processus 3 entres (2 signaux de commande,
1 perturbation observable) et 2 sorties. Si nous incluons le seul signal non contrlable
v1 (t) dans les u(t), nous obtenons (u3 (t) := v1 (t)) (pas de npv et de npdv ) :

3
nps = : caractrise les signaux de sortie de P ;
1

2
npe = : caractrise les signaux dentre de P ;
1

2
npde = : caractrise le dlai sur les signaux dentre de P.
1
Ce qui donne :
y1 (t + 1) = P1 [y1 (t), y1 (t 1), y1 (t 2), y2 (t), y2 (t 1), y2 (t 2),
u1 (t 1), u1 (t 2), u2 (t 1), u2 (t 2), u3 (t 1), u3 (t 2)]
y2 (t + 1) = P2 [y1 (t), y2 (t), u1 (t), u2 (t), u3 (t)]
Soit un rgulateur 3 entres et 2 sorties. Si nous prenons nre = npe , nrs = nps
(voir ci-dessus) (et nrde = 0) nous avons :
u1 (t) = R1 [u1 (t 1), u1 (t 2), u2 (t 1), u2 (t 2), u3 (t 1), u3 (t 2))
y1 (t), y1 (t 1), y1 (t 2), y2 (t), y2 (t 1), y2 (t 2)]
u2 (t) = R2 [u1 (t 1), u2 (t 1), u3 (t 1), y1 (t), y2 (t)]
4.3. Algorithme dapprentissage : descente de gradient
4.3.1. Hypothses requises
Avant de procder aux calculs, nous devons faire les hypothses suivantes :
il existe une srie de signaux de contrle unique [ut , ut+1 , . . . , ut+Hc ] qui guident
y vers y au temps t + Hc . Hc est lhorizon de contrle. Le rgulateur doit avoir un
horizon de prdiction Hp Hc ;
le rgulateur flou est capable dapproximer cette loi de contrle, au degr de

prcision voulu, dans le domaine voulu (les systmes flous sont des approximateurs
universels) ;
ltat du processus peut tre reconstruit tout moment partir de ;
la fonction P est continuellement diffrentiable par rapport ses arguments. De

plus :
P R P R
= = = =0 t < k [4.5]
ut ut yt yt
la vitesse dadaptation des paramtres est suffisamment faible pour pouvoir spa-
rer la mesure de lerreur, dune part, et des effets de lajustement des paramtres dautre
part ;
le processus est asymptotiquement minimum de phase.
4.3.2. Algorithme
Nous pouvons maintenant dvelopper un algorithme de descente de gradient per-

mettant de trouver/optimiser les paramtres w du rgulateur.
La fonction de cot minimiser est :

k+Hp
1
Jk (w(k)) = (y(t) y(t))T Qk,t (y(t) y(t))
2
t=k+1
k+Hp 1
1
+ ( u(t))T Rk,t ( u(t)) [4.6]
2
t=k
avec :
u(t) = u(t) u(t 1) [4.7]
Les matrices Qk,t qq pondrent les erreurs (y(t) y(t)) de suivi de la

consigne. Les matrices Rk,t n1 n1 empchent des variations ( u(t)) trop brutales
de la consigne et stabilisent le systme. Gnralement, Qk,t = Iq (I = matrice unit)

et Rk,t = 0,01In1 .
Remarquons que la fonction de cot fait intervenir des valeurs pour y(t) et u(t) avec
t > k. Cest--dire, elle utilise des valeurs inconnues des variables. Nous devons prdire
lvolution de ces variables. Nous utiliserons P qui est un prdicteur du processus
rguler pour simuler la boucle ferme sur un horizon Hp . Cette simulation de la boucle
ferme est pour t = k jusqu k + Hp :
construire (t) ;
u(t) = R(y(t), (t); w(t)) ;
construire (t) en tenant compte des saturations sur u(t) ;
y(t + 1) = P((t)).
A chaque pas de temps k, le rgulateur rduit lerreur Jk grce une descente de

gradient dans lespace des paramtres :
Jk
w(k) = w(k 1) [4.8]
w
avec :
w(k) : la valeur linstant k du paramtre en cours doptimisation. Ce para-
mtre est choisi parmi lensemble des paramtres des systmes flous Ri qui composent
le rgulateur ;
1 : la vitesse dapprentissage.
Nous avons :

k+Hp
y(t)
w(k) = w(k 1) (y(t) y(t))T Qk,t
w
t=k+1

k+Hp 1
( u(t))
+ ( u(t))T Rk,t [4.9]
w
t=k
u(t) R(y(t), (t); w)

=
w w

R1 (y(t), i (t); w) Rn1 (y(t), i (t); w) T
=
w w
T
R1 (t) Rn1 (t)
= [4.10]
w w
Ri (t) ui (t)
= [4.11]
w w
Ri Ri i (t)
= +
w i (t) w
q (nre )i 1
Ri Ri yj (t k)
= +
w yj (t k) w
j =1 k=0
n1 (n
rs )i 1
Ri uj (t k 1)
+ [4.12]
uj (t k 1) w
j =1 k=0
y(t + 1) P((t))
=
w w

P1 ((t)) Pq ((t)) T
=
w w

P1 (t) Pq (t) T
= [4.13]
w w
Pi (t) yi (t + 1)
= [4.14]
w w
Pi (t)
=
(t) w
q (nps)
i 1 Pi yj (t k)
=
yj (t k) w
j =1 k=0
n1 (npe
)i 1
Pi uj (t k (npde )i + 1)
+
uj (t k (npde )i + 1) w
j =1 k=0
[4.15]
Les deux quations importantes sont [4.12] et [4.15]. A lintrieur de ces deux
quations est cache une rcurrence. En effet, elles font intervenir des termes en y/w
et en u/w qui doivent tre dvelopps suivant respectivement [4.11] et [4.14].
Remarquons, aussi, la notation employe pour crire les drives dans les qua-
tions [4.12] et [4.15]. Cette notation fait apparatre, clairement, la diffrence entre les
drives partielles () et les drives totales(). Lors dune drive partielle (), la
rcurrence sarrte. Pour une drive totale (), nous devons continuer le dveloppe-
ment, ce qui reprsente une lourde charge de calcul. Lessentiel du temps de calcul lors
de ladaptation est utilise pour trouver ces drives ().
Si nous voulons viter une charge de calcul trop importante, nous commenons par
calculer les y(t)/w et les u(t)/w partir de t = k car, ce moment, le calcul est
trs simple daprs lquation [4.5]. Ensuite, nous calculons les drives pour t > k
sur la base des drives prcdentes soigneusement gardes en mmoire. Il est hors de
question deffectuer les calculs selon un algorithme rcursif (cest--dire en partant de
t = k + Hp et ensuite en remontant vers t = k).
Nous venons de transformer un algorithme rcursif (lourde charge de calcul) en

un algorithme itratif (faible charge de calcul), au prix dune consommation mmoire
somme toute faible.
4.3.3. Drives dun systme flou
Les quations [4.12] et [4.15] font intervenir les drives partielles dun systme
flou par rapport un paramtre interne et par rapport une de ses entres (gradient).
Ce paragraphe dtaille le calcul de ces drives.
Soit un systme flou de Tagaki-Sugeno R une sortie (y ), n entres (u n )

et r rgles avec E j (j = 1, . . . , r), un ensemble flou de forme gaussienne, caractris
par son centre Cj n et par son talement Fj nn .
n
si (U est dans E j ) alors yj = i=1 Ui .Li,j + Ln+1,j ,
j = 1, . . . , r
a = ( (U )) = 1
,
j Ej e (U Cj )T Fj (U Cj )
[4.16]
r
j =1 aj yj
y = r [4.17]
j =1 aj
Si nous calculons analytiquement le gradient de R, nous obtenons :

r n
R 1 aj Lj,k 2.
(U ) = r (Fj )k,s (U Cj )s (yj R(U ))
uk j =1 aj j =1 s=1
[4.18]
La figure 4.2 est une reprsentation graphique dun systme flou une entre u et
une sortie y, compos de deux rgles floues. La fonction dappartenance de la premire
rgle est 1 (x) et sa sortie locale est y1 = a1 u + h1 . Nous pouvons voir sur la partie
gauche du schma 4.2 le rsultat obtenu en utilisant [4.18].
Figure 4.2. Deux dfinitions pour le calcul du gradient en u dun systme flou
La mthode correcte pour le calcul du gradient (vue sur la partie droite de la

figure 4.2) consiste calculer la combinaison floue des gradients locaux (de chaque
rgle). Ce qui donne :
r
R 1

(U ) = r aj .Lj,k [4.19]
uk a
j =1 j j =1
La drive dun systme flou par rapport un de ses paramtres ne pose pas de
problme. Nous obtenons les drives suivantes :

R ak Ul si (l n)
(U ) = r . [4.20]
Lk,l j =1 aj 1 si (l = n + 1)
n
R 2 ak
(U ) = r (Fk )l,s (U Ck )s (yk R(U )) [4.21]
(Ck )l j =1 aj s=1
R ak
(U ) = r (U Ck )l (U Ck )m (yk R(U )) [4.22]
(Fk )l,m j =1 aj
4.3.4. Remarque sur le prdicteur
Il est possible demployer comme prdicteur, non pas un systme flou, mais nim-
porte quelles fonctions dcrivant le processus. Pour pouvoir appliquer lalgorithme
dapprentissage, il est cependant ncessaire de pouvoir calculer le gradient de ce prdic-

teur. Des tests ont t raliss lIRIDIA sur la base de prdicteurs linaires AU = Y ,
de prdicteurs Lazy et de prdicteurs bass sur des Lookup-Tables.
Le rgulateur est fortement sensible la qualit du prdicteur. Cest un point faible

de notre technique.
4.4. Applications en simulation
Lapproche MSDAFC a t teste sur deux systmes diffrents : un toy problem et

un traitement des eaux uses. Ce dernier est utilis par tous les partenaires du projet
FAMIMO [YOU 96].
4.4.1. Toy problem
Le systme rguler est le suivant (systme non linaire, non-minimum de phase) :
yk+1 = yk + sin(3 uk1 ) 3uk [4.23]
Un rgulateur bas sur une prdiction dune unit de temps dans le futur ne pourra
contrler ce systme car celui-ci est non-minimum de phase. Il est donc ncessaire
dutiliser un algorithme qui peut prdire le comportement du systme sur plusieurs
occurences dans le futur.
Le processus est modlis grce un systme flou Takagi-Sugeno. Celui-ci a t

identifi en utilisant lalgorithme de Gustafson-Kessel [GUS 79] pour calculer la posi-
tion des centres et les consquences de chaque rgle floue. Lidentification a t ralise
sur une base de 5 000 points, obtenus en excitant le processus avec un signal pseudo-
alatoire sinusodal. Le rgulateur est, lui, constitu de 9 rgles floues. Les cons-
quences (Li,j ) ont t initialises 0. La vitesse dapprentissage est de = 0,0005.
Un horizon de prdiction de 5 pas en avant a t utilis pour le calcul de la mise
jour des paramtres des consquences des rgles floues du rgulateur. Le rsultat de la
simulation est prsent sur la figure 4.3.
Dans cet exemple, il est intressant de noter la forme typique de la rponse dun
systme non-minimum de phase. A chaque changement de consigne, le systme
part dans la direction oppose la consigne. Ce systme, impossible rguler en
utilisant une prdiction un pas, est facilement contrl en utilisant une prdiction sur
plusieurs pas.
4.4.2. Le problme du traitement des eaux uses
Un systme biologique constitu dun bioracteur continu, ciel ouvert, utilis pour
le traitement des eaux uses dans lindustrie du papier, est la cible de notre seconde
Figure 4.3. Performance du MSDAFC sur un systme non-minimum de

phase aprs 10 000 units de temps
tude exprimentale. Ce racteur contient une certaine masse de bio-organismes et

deux substrats : le xenobiotic polluant substrate et lenergetic substrate. Nous avons
notre disposition un modle simulink du racteur dvelopp par le LAAS, laboratoire
danalyse et darchitecture des systmes du CNRS [YOU 96]. Nous devons rguler la
concentration rsiduelle de xenobiotic polluant substrate et la prolifration des bio-
organismes (biomasse), pour empcher toutes nuisances bactriologiques.
La concentration du energetic substrate ne doit pas tre rgule car celui-ci est
facilement dgradable. Le processus est caractris par sa haute non-linarit, sa dyna-
mique changeante et des problmes de couplage entre les variables. De plus, nous ne
disposons pas de capteur pour connatre la masse du xenobiotic polluant substrate.
Celle-ci est donc obtenue grce un observateur asymptotique. Le volume deau dans
le racteur est maintenu constant. Il est possible de rguler la concentration en substrats
en jouant sur les deux dbits deau entrant dans le racteur. La premire arrive deau
provient dun rservoir deau pure et la seconde provient dun rservoir deau pollue
(voir figure 4.4).
Soit :
c(t) [g/l] : (entre ; rguler) concentration de la biomasse. Les micro-organismes
dgradent les deux substrats prsents dans le racteur ;
s(t) [g/l] : ( rguler) concentration du xenobiotic polluant substrate ;
e(t) [g/l] : (entre) concentration du energetic substrate ;
Figure 4.4. Reprsentation schmatique du bioracteur pour le traitement des

eaux uses
u1 (t) [l/s] : (sortie) dbit deau propre entrant dans le racteur ;

u2 (t) [l/s] : (sortie) dbit entrant deau pollue. Cette eau pollue contient une
certaine concentration maximale de substrats : samax [g/l] et eamax [g/l] ;
sm et em : le taux de croissance spcifique maximum des deux substrats ;
Yc/s et Yc/e : coefficients lis correspondant la conversion des substrats en
biomasse ;
Ks et Ke : constantes de Michaelis-Menten correspondant laffinit de la popu-
lation microbienne pour chaque substrat ;
as et ae : constantes inhibitoires : ae est linfluence inhibitoire du energetic sub-
strate sur la dgradation du xenobiotic polluant substrate (et vice versa pour as ).
Les quations du systme sont :

s(t) e(t)

c(t) = sm + em

Ks + s(t) + ae e(t) Ke + e(t) + as s(t)

c(t) u1 (t)c(t) u2 (t)c(t)

usm s(t)

s(t) = c(t) u1 (t)s(t) + samax s(t) u2 (t)

Yc/s Ks + s(t) + ae e(t)

u e(t)

e(t) = em c(t) u (t)e(t) + emax e(t) u (t)
1 a 2
Yc/e Ke + e(t) + as s(t)
[4.24]
Le processus est modlis grce un systme flou de Takagi-Sugeno. Celui-ci a

t identifi en utilisant lalgorithme de Gustafson-Kessel [GUS 79] pour calculer la
position des centres et les consquences de chaque rgle floue. Lidentification a t
ralise sur une base de 5 000 points obtenus en excitant le processus avec un signal
pseudo-alatoire sinusodal. Le prdicteur pour la biomasse est constitu de quatre
rgles floues. Le prdicteur pour la concentration en xenobiotic substrate est constitu

de deux rgles floues. Le rgulateur est, lui, constitu de deux systmes flous (un
systme pour chaque sortie) chacun constitu dune rgle floue. Les consquences
(Li,j ) des rgles du rgulateur ont t initialises 0.
Ladaptation a t ralise en utilisant trois horizons de prdiction diffrents : 1, 3 et

10. Les rsultats avec un horizon de 1 sont trop mdiocres et ne seront pas prsents. Sur
les figures 4.5 et 4.6, on peut voir le rsultat de la simulation pour les autres horizons.
La vitesse dapprentissage est fonction de lhorizon de prdiction. Elle vaut = 0,05
pour un horizon de 3 et = 0,005 pour un horizon de 10. Seuls les paramtres des
consquences des rgles floues du rgulateur sont mis jour. Les capteurs lintrieur
du racteur sont perturbs par un bruit damplitude compris entre 2 % et +2 % de la
valeur de sortie. Des variations des constantes cintiques biologiques ont t appliques
pour pouvoir tenir compte de la nature imprcise de la dynamique du systme.
Figure 4.5. Performance du MSDAFC avec un horizon de prdiction de 3 sur

le bioracteur aprs 6 400 units de temps
Nous pouvons constater sur les figures 4.5 et 4.6 quaprs un temps dapprentissage
suffisament long (6 400 units de temps), les deux systmes donnent de bons rsultats
et cela malgr des conditions fort bruites. La principale diffrence entre les deux
algorithmes tient dans le temps ncessaire pour apprendre la loi de contrle optimale.
La mthode base sur un horizon de prdiction de 10 apprend plus vite que celle
base sur un horizon de 3 car, chaque unit de temps, elle regarde plus loin et peut
donc retirer plus dinformations du systme. Malheureusement, elle exige plus de
puissance de calcul ( chaque unit de temps, il faut plus de temps pour mettre jour
les paramtres du rgulateur que lorsque lhorizon est de 3). Cela implique que, bien
que lapprentissage soit plus rapide, la simulation pourra prendre plus de temps que sa
concurrente.
Figure 4.6. Performance du MSDAFC avec un horizon de prdiction de 10 sur

le bioracteur aprs 6 400 units de temps
Nous avons aussi utilis un algorithme dapprentisssage de type Levenberg-

Marquardt . Le temps dapprentissage du rgulateur (le temps mis pour arriver un
contrle du processus satisfaisant) avec lalgorithme de Levenberg-Marquardt est plus
court que pour un algorithme bas sur une simple descente de gradient. Une fois lap-
prentissage termin, Levenberg-Marquardt ne donne pas des rsultats de contrle
significativement meilleurs que la descente de gradient .
4.5. Conclusion
Les algorithmes adaptatifs prsents ici sont trs proches des algorithmes prsents
dans les rgulateurs neuronaux. Ces algorithmes adaptatifs peuvent fonctionner partir
de paramtres initiaux alatoires ; mais, si le rgulateur de dpart est dj correctement
initialis, ladaptation est plus rapide et donne de meilleurs rsultats. Il est facile, dans
le cas de systmes flous, de retirer de linformation dun expert et de lintgrer dans un
rgulateur. En effet, la structure dun systme flou est facilement comprhensible pour
un humain. Linitialisation partielle dun rgulateur est donc possible. Cette facilit ne
se retrouve pas, par exemple, dans les rseaux de neurones. Cest pourquoi les systmes
flous sont dexcellents candidats pour raliser des rgulateurs dits botes noires .
Grce sa facult dapprentissage constant, le MSDAFC est capable de rsorber

rapidement des perturbations accidentelles qui modifieraient le comportement du pro-
cessus rgler.
Il reste certains problmes rsoudre, notamment la grande sensibilit du processus

dapprentissage face la qualit du prdicteur du processus. Nous pensons quil est
possible de perfectionner lalgorithme de manire le rendre plus robuste.
4.6. Bibliographie
[BAK 97] Bakuska R., Fuzzy Modeling and Identification, PhD thesis, TU Delft, Delft, Pays-
Bas, 1997.
[BER 96] Bersini H., Adaptive fuzzy control for the state feedback optimal control , Pro-
ceedings of the XI I I th IFAC World Congress, San Francisco, juillet 1996.
[BER 00] Bertolissi E., Duchateau A., Bersini H., Berghen F.V., Direct Fuzzy Control
for MIMO Processes , Proceedings FUZZ-IEEE 2000, San Antonio, Texas, 7-10 mai 2000.
[CAS 95] Castro J., Fuzzy logic controllers are universal approximtors , IEEE Trans. on
Systems, Man and Cybernetics, vol. 25, p. 629-635, 1995.
[GUS 79] Gustafson D.E., Kessel W.C., Fuzzy clustering with a fuzzy covariance matrix ,
Proc. IEEE CDC, San Diego, Etats-Unis, p. 761776, 1979.
[LIV 98] Livchitz M., Avershitz A., Soudak U., Kandel A., Development of an automated
fuzzy-logic-based expert system for unmanned landing , Fuzzy Sets and Systems, vol. 2,
p. 145-159, 1998.
[REN 94] Renders J.M., Saerens M., Bersini H., On the stability of direct adaptive fuzzy
controllers ; Rapport IRIDIA/ULB, Bruxelles, 1994.
[REN 95] Renders J.M., Saerens M., Bersini H., dans Hunt K.J., Irvin G.R., Warwick K.,
(Eds.), Adaptive neurocontrol of a certain class of MIMO discrete-time processes based
on stability theory , Neural Network Engineering in Dynamic Control Systems, Springer
Verlag, p. 43-60, 1995.
[REN 96] Renders J.M., Saerens M., Bersini H., Neurocontrol based on the backpropaga-
tion algorithm , dans M.M. Gupta, N.K. Sinha (dir.) Intelligent Control Systems, p. 292-326,
IEEE Press, 1996.
[WAN 93] Wang L.-X., Stable adaptive fuzzy control of nonlinear systems , IEEE Trans.
on Fuzzy Systems, vol. 1, p. 146-155, 1993.
[WAN 97] Wang L.-X., Combining mathematical model & heuristics into controllers, an
adaptive fuzzy control approach , Fuzzy Sets and Systems, vol. 89, p. 151-156, 1997.
[YIN 94] Ying H., Sufficient conditions on general fuzzy systems as function approximators ,
Automatica, vol. 30, p. 521-525, 1994.
[YOU 96] Youssef C.B., Filtrage, estimation et commande adaptive dun procd de traitement
des eaux usues, PhD thesis, Institut national polytechnique, Toulouse, 1996.

Régulation Directe Adaptative - Chap04

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Régulation Directe Adaptative - Chap04

Загружено:

Авторское право:

Доступные форматы

Chapitre 4

Rgulation directe adaptative et prdictive sur

Nous dcrivons, dans ce chapitre, une technique de commande adaptative applicable

Il existe deux approches distinctes pour la commande adaptative : lapproche directe

Chapitre rdig par Frank Vanden Berghen et Hugues Bersini.

4.2. Description du systme

La figure 4.1 montre la structure en boucle ferme du systme de contrle. Celui-ci

Nous voulons rguler un processus n entres et q sorties.

Figure 4.1. Reprsentation schmatique du systme de rgulation

Le rgulateur R se prsente sous la forme dune fonction floue entre-sortie :

4.3. Algorithme dapprentissage : descente de gradient

4.3.1. Hypothses requises

le rgulateur flou est capable dapproximer cette loi de contrle, au degr de

ltat du processus peut tre reconstruit tout moment partir de ;

la fonction P est continuellement diffrentiable par rapport ses arguments. De

le processus est asymptotiquement minimum de phase.

Nous pouvons maintenant dvelopper un algorithme de descente de gradient per-

La fonction de cot minimiser est :

u(t) = u(t) u(t 1) [4.7]

Les matrices Qk,t qq pondrent les erreurs (y(t) y(t)) de suivi de la

de la consigne et stabilisent le systme. Gnralement, Qk,t = Iq (I = matrice unit)

A chaque pas de temps k, le rgulateur rduit lerreur Jk grce une descente de

u(t) R(y(t), (t); w)

Nous venons de transformer un algorithme rcursif (lourde charge de calcul) en

4.3.3. Drives dun systme flou

Soit un systme flou de Tagaki-Sugeno R une sortie (y ), n entres (u n )

Si nous calculons analytiquement le gradient de R, nous obtenons :

La mthode correcte pour le calcul du gradient (vue sur la partie droite de la

4.3.4. Remarque sur le prdicteur

dapprentissage, il est cependant ncessaire de pouvoir calculer le gradient de ce prdic-

Le rgulateur est fortement sensible la qualit du prdicteur. Cest un point faible

4.4. Applications en simulation

Lapproche MSDAFC a t teste sur deux systmes diffrents : un toy problem et

4.4.1. Toy problem

Le systme rguler est le suivant (systme non linaire, non-minimum de phase) :

yk+1 = yk + sin(3 uk1 ) 3uk [4.23]

Le processus est modlis grce un systme flou Takagi-Sugeno. Celui-ci a t

4.4.2. Le problme du traitement des eaux uses

Figure 4.3. Performance du MSDAFC sur un systme non-minimum de

tude exprimentale. Ce racteur contient une certaine masse de bio-organismes et

Figure 4.4. Reprsentation schmatique du bioracteur pour le traitement des

u1 (t) [l/s] : (sortie) dbit deau propre entrant dans le racteur ;

Les quations du systme sont :

Le processus est modlis grce un systme flou de Takagi-Sugeno. Celui-ci a

rgles floues. Le prdicteur pour la concentration en xenobiotic substrate est constitu

Ladaptation a t ralise en utilisant trois horizons de prdiction diffrents : 1, 3 et

Figure 4.5. Performance du MSDAFC avec un horizon de prdiction de 3 sur

Figure 4.6. Performance du MSDAFC avec un horizon de prdiction de 10 sur

Nous avons aussi utilis un algorithme dapprentisssage de type Levenberg-

Grce sa facult dapprentissage constant, le MSDAFC est capable de rsorber

Il reste certains problmes rsoudre, notamment la grande sensibilit du processus

Вам также может понравиться