Supervision Neuro-Floue A Apprentissage Genetique D'un Pid Robuste

SCIENCES & Technologie B N23, juin (2005), pp. 95-106.
SUPERVISION NEURO-FLOUE A APPRENTISSAGE GENETIQUE DUN PID ROBUSTE

Reu le 29/04/2004 - Accept le 10/05/2005
Rsum Dans cet article on prsente de nouveaux outils pour la supervision et loptimisation intelligente des systmes hautement non linaires base de la logique floue. Les paramtres dominants caractrisant la base des connaissances floues (facteurs dchelle des variables dentre/sortie, fonctions dappartenance et rgles dinfrence) sont optimiss par lemploi des algorithmes gntiques (AG). Le conventionnel PID dans sa forme amliore, o les coefficients de diffrentes actions KP, KI et KD sont non linairement variables. Un systme dinfrence floue structure neuronale apprentissage gntique joue le rle de superviseur qui permet de donner des fonctions optimales ces coefficients. La structure du rseau superviseur est spcifie par une combinaison entre le raisonnement flou mixte de Takagi-Sugeno et de Mamdani. Le codage optimal mixte, binaire-entier, est utilis pour la construction des chromosomes dfinissant lensemble des paramtres ncessaires pour la conception du superviseur dsir. Ce nouveau superviseur se distingue lui mme par un gain de dnormalisation (facteur dchelle de sortie) qui varie linairement avec les entres floues. Sous certaines conditions, il devient similaire un PID conventionnel coefficients non-linairement variables. Les rsultats de simulation sur la commande temps optimal dun modle de rfrence prdtermin pour le systme de pendule invers montrent bien l'efficacit et la robustesse de la mthode utilise. Mots cls: PID flou, algorithme gntique, rseau de neurones. Abstract This article presents the application of a new generation of fuzzy logic supervisor (FLS) to the highly nonlinear systems. The dominant parameters characterizing the base of fuzzy knowledge: scaling factors of the Input/Output (I/O) variables, membership functions and the rule consequences are optimized by using the Genetic Algorithms (GA). The conventional PID in its improved form, where the coefficients of different actions KP, KI and KD are nonlinear variables. A fuzzy inference system with multilayer neural network structure with genetic training plays the role of supervisor who allows giving optimal functions to these coefficients. The fuzzy structure is specified by a combination of the mixed Takagi-Sugenos and Mamdanis fuzzy Reasoning TSM-FR. The mixed integer-binary optimal coding is utilized to construct the chromosomes, which define the same of necessary prevailing parameters for the conception of the desired supervisor. This new fuzzy supervisor stands out by a non standard gain (output scaling factor) which varies linearly with the fuzzy inputs. It becomes similar to the conventional PID controller with non-linearly variable coefficients. Computer simulation indicates that the designed fuzzy supervisor is satisfactory in PID control of a nonlinear system Inverted Pendulum. Keywords: Fuzzy PID, genetic algorithms, neural networks
A. SOUKKOU * A. KHELLAF ** S. LEULMI *** * Dpartement d'Electronique Universit de Jijel Algrie. ** Institut d'Electronique, Universit Ferhat Abbas-Stif Algrie. *** Institut d'Electrotechnique, Universit de Skikda Algrie.
. -- ) / ( . PID . Takagi- . Mamdani Sugeno . . PID : a commande des procds industriels complexes, se heurtes de plusieurs difficults: i) Prsence de non linarits, ii) Les incertitudes et, iii) La complexit au niveau de la modlisation et dlaboration des lois de commande convenables. Ce qui exige de nouvelles mthodes de contrle plus sophistiqu ayant de grandes capacits dapprentissage et de prise de dcision dans des milieux incertains et perturbs. Malgr sa popularit dans lindustrie et sa facilit d'implantation, l'inconvnient du contrleur PID (Proportional-Integral-Derivative) est le choix des coefficients de diffrentes actions KP, KI et KD. Yougho Lee [1] prsente un bref historique sur les diffrentes mthodes de calcule des coefficients (gains) KP, KI et KD. Il a aussi propos une nouvelle mthode de calcul base sur le dveloppement en srie de Mc Laurin. En consquence, beaucoup de techniques du rglage des paramtres bases sur diffrentes approches :
Universit Mentouri Constantine, Algrie, 2005. 0
A. SOUKKOU, A. KHELLAF, S. LEULMI
Procds empiriques, tel que mthodes Ziegler-Nichols [2]. Mthodes analytiques, par exemple, le lieu gomtrique des racines. Des mthodes doptimisation, tel que Cian-Cone ou mthodes Lopez [3]. Ces techniques permettent dobtenir les coefficients (gains) de diffrentes actions en se basant sur la minimisation dun critre de performances dsires (IAE, ITAE). Les proprits d'approximation et de traitement parallle des systmes base de la logique floue [4] peuvent fournir des solutions plus efficaces aux problmes de contrle des systmes complexes. Lavantage dun tel systme flou est que seules les connaissances du comportement de procd commander sont suffisantes pour la synthse de la loi de commande. En termes plus spcifiques, la logique floue vise modliser les modes imprcis du raisonnement qui jouent un rle trs important dans la capacit humaine de prendre des dcisions rationnelles dans un environnement incertain et imprcis. Linconvnient majeur de lapproche traditionnelle pour la conception des systmes flous rside au niveau de lobtention des connaissances auprs dun expert humain. Pour palier ce problme, la recherche sest oriente vers llaboration des techniques optimales et systmatiques pour la conception de ces systmes. Deux approches de conceptions les plus rencontres dans la littrature: Approche connexionniste. Approche directe. Lapproche connexionniste consiste combiner la thorie des rseaux de neurones avec celle de la logique floue afin de concevoir ce quon appelle un rseau neuronal flou (FNN: Fuzzy Neural Network). Deux manires pour construire un FNN [5]: 1. Soit en construisant un systme dinfrence floue (SIF) sous forme dun rseau de neurones multicouches dans lequel les poids du rseau correspondent aux paramtres du systme flou (approche structurelle). 2. Soit en construisant un rseau neuronal qui peut incorporer le processus de raisonnement approximatif (approche fonctionnelle). La rtropropagation est lalgorithme le plus utilis pour lapprentissage et lajustement des poids synaptiques du rseau caractrisant la base de connaissances floues. Linconvnient majeur de cette mthode est le temps de calcul et le problme de convergence. Dans lapproche directe le problme de conception et rsolu par lapplication des mthodes doptimisation pour lajustement des paramtres du SIF, i, e, sa base de connaissances. Les algorithmes gntiques (AG), algorithmes itratifs inspirs des lois d'volution des espces et de la gntique naturelle, dvelopps par J. Holland au dbut des annes 70 [6], sont devenus des concurrents trs puissants dans le domaine de l'optimisation des paramtres ncessaires la conception des systmes flous optimaux. Ainsi l'objectif est de combiner ces deux mthodes afin d'exploiter les richesses de chacune pour obtenir des systmes aussi simples et efficaces que possibles.
Lobjectif de ce travail est de dvelopper un contrleur PID dans une forme amliore, o les coefficients de diffrentes actions KP, KI et KD sont non linairement variables. Un superviseur flou structure neuronale apprentissage gntique permet de donner des fonctions optimales ces coefficients. Ce manuscrit est divis en deux parties principales : Une description de principe de fonctionnement des outils de conception : les SIF et les AG. Description de la mthodologie de conception de superviseur flou suivie par les rsultats de simulation. LES ALGORITHMES GENETIQUES Les AG commencent avec une population de cratures artificielles (chanes de caractres) analogues aux chromosomes en nature qui voluent par application de plusieurs oprateurs (modlisant le test de la survie naturelle) vers la solution optimale ou du moins vers une solution proche de celle-ci. Une solution (un chromosome) rsout ce problme, si elle satisfait une fonction de performances donne au pralable. L'ensemble des solutions est appel espace des solutions. L'objectif de la procdure de recherche est de localiser une solution optimale. Une description abstraite de l'AG de base peut se traduire par la figure 1. En se basant sur le principe de fonctionnement des AG, on peut identifier quelques diffrences avec les mthodes classiques d'optimisation. Ces diffrences sont [7]: Les AG possdent une reprsentation code et cherchent une reprsentation dans l'espace des solutions et non pas directement dans le domaine original. Les AG utilisent une population de solutions la place d'une seule solution. Les AG utilisent des rgles de transition probabilistes et non dterministes (pseudo- alatoires) comme outils pour guider l'exploration travers les rgions de l'espace de recherche. Les AG n'utilisent que les valeurs de la fonction optimiser, pas sa drive ou une autre connaissance auxiliaire.
Mcanismes d'un AG standard A partir d'une population initiale de chromosomes (chanes de caractres) cre alatoirement, l'AG gnre de nouveaux chromosomes pour construire une nouvelle gnration, en effectuant les oprations gntiques: Slection et reproduction. La slection Cette opration permet aux chromosomes codant de bonnes structures de se reproduire le plus souvent que ceux qu'ils ne le sont pas [7]. La plus utilise est celle de la slection proportionnelle (slection par roue de fortune biaise).
96
Supervision Neuro-Floue a Apprentissage Gntique dun PID Robuste
Evaluation des individus de la population
critre darrt ? Non
Oui
Meilleure individu
Nouvelle gnration
Recombinaison
Gnration dune population initiale.
Slection
Solution optimale
Croisement
Mutation
Configuration paramtrique de lAG Figure 1. Le processus dexcution de l'AG.
La reproduction Cette opration permet la construction d'une nouvelle gnration, en appliquant les oprateurs gntiques savoir le croisement et la mutation. Croisement Loprateur de croisement consiste changer des gnes entre deux individus (parents) pour obtenir des descendants qui prennent les caractristiques de leurs parents. Le site de croisement est choisi alatoirement. La figure 2 schmatise clairement les diffrents types de croisements. Les oprateurs gntiques savoir la slection, la mutation et le croisement sont gnralement suffisants pour accomplir la tche d'optimisation. L'AG dans ce cas sera considr comme une boite noir d'optimisation de fonctions ne ncessitant aucune connaissance sur le domaine. Cependant, l'amlioration de l'AG standard et ventuellement la connaissance du domaine peuvent tre introduites et exploites pour amliorer les performances de l'AG.
Site de mutation
Parents
Avant mutation
---
Aprs mutation
----
Descendants
Codage binaire Figure 3. Mutation.
Croisement en un point.
Croisement en deux points. Figure 2. Croisement.
Croisement multipoints.
Notion du codage La premire tape dans le fonctionnement de l'algorithme gntique est le codage de l'ensemble des paramtres optimiser en une chane de caractres de longueur finie. Pour une fonction (modle d'un systme) multivariable f(k1, k2,...., kn), le codage se droule de la faon suivante: Coder chaque variable ki (i = 1,..., n) selon le choix de sa longueur. Construire les chanes en concatnant les diffrents codes, cest dire juxtaposer ces derniers lun aprs lautre.
Mutation Loprateur de mutation consiste altrer un ou plusieurs gnes choisis alatoirement dans un chromosome. Cette altration va prendre des formes diffrentes selon le type de gnes : Une simple inversion pour un codage boolen (figure 3). Un tirage alatoire dans un ensemble discret de valeurs de gnes (codage entier). Lajout dun bruit gaussien pour un codage rel.
97
Exemple: chaine=(code 1)(code 2) L (code n).
(1)
Plusieurs types du codage sont utiliss [7]: Codage binaire, entier, rel et Codage Gray. Notion du dcodage Lopration du dcodage est l'inverse du codage. Chaque chane doit tre dcode pour pouvoir calculer la valeur de la fonction d'aptitude qui lui est associe. Parmi les types du dcodage possibles, le dcodage binaire est le plus utilis:
k =U MIN +decimal(101 ...1012 )U MAX lU MIN . 2 1
Lengin dinfrence permet de dfinir la stratgie de contrle en utilisant les implications floues qui lient les diffrentes variables de chaque rgle. Parmi le mcanismes dinfrence les plus utiliss: MAX-MIN, MAX-PROD et SOM-PROD. Lopration de dfuzzification consiste convertir le rsultat de combinaisons des rgles en une forme numrique bien adapte au milieu du processus grer. Plusieurs mthodes de dfuzzification sont proposes dans la littrature [8]. La plus utilise est celle du centre de gravit.
Base de connaissances floue
(2)
Avec UMAX, UMIN sont les bornes suprieure et infrieure du domaine de variation de la variable k, respectivement. decimal(1011012) sa valeur dcimale convertie du binaire et l est la longueur de la chane correspondante au code de la variable k. Le choix de la longueur dpend essentiellement de la prcision voulue sur la variable k qui est donne par: =U MAXlU MIN (3) 2 1 Quand le domaine de variation des chanes est inconnu, ainsi que dans le cas o la longueur de la chane dpasse 32 bits (selon la norme IEEE), il est conseill d'utiliser le dcodage rel, comme suit:
x=(sgn ) 2exp (mant )
Entres
Fuzzification
Dfuzzification
Engin dinfrence floue
( )
(4)
Figure 4. Structure de base dun SIF.
O (sgn) est le signe, (exp): l'exposant (sur 08 bits, aprs un dcodage de 08 bits en base 10, le rsultat est retranch 127, ce qui donne l'exposant) et (Mant): est la mantisse (sur 23 bits). SYSTEME DINFERENCE FLOUE La structure de base dun SIF est schmatise par la figure 4. Un SIF peut tre dcrit par un ensemble de rgles linguistiques de la forme : SI (condition(s)) ALORS (action(s)). Ces rgles permettent de convertir la stratgie de contrle dun expert humain en une stratgie de contrle automatique bien adapte au monde rel. Un SIF est compos de quatre blocs : Une base de connaissances. Une interface de fuzzification en entre. Lengin dinfrence ou la logique de prise de dcision. Une interface de dfuzzification en sortie. La base de connaissances floue, constitue le noyau du SIF. Elle contient les dfinitions des fonctions dappartenance des variables dEntres/Sorties (gaussienne, trapzodale, etc.) ainsi que les rgles dinfrence. La fuzzification permet dassurer la conversion des grandeurs physiques dentres du SIF en variables linguistiques qui peuvent tre traites par les infrences.
Le problme de conception dun SIF revient la dtermination de sa structure et aux choix de ces paramtres (phase dacquisition). La conception dun SIF ncessite le choix des paramtres suivants: Dfinition des variables dEntres/Sorties (E/S) du systme. Choix de la partition floue, cest dire, association dun ensemble de termes linguistiques caractriss par des fonctions dappartenance dfinies sur des univers de discours appropris pour chaque variable dE/S. La forme des fonctions dappartenance de lespace dE/S (gaussienne, trapzodale, ...etc.). Les facteurs dchelle (normalisation / dnormalisation) La base des rgles. Le choix de la mthode dinfrence et de la stratgie de dfuzzification. Les systmes flous ont connus un succs considrable dans la commande et lidentification des procds industriels complexes, du fait de leurs caractres approximatif et qualitatif inspirs de la pens humaine. Cependant, leurs performances sont lies deux facteurs importants: 1. La disponibilit de lexpertise (le savoir-faire). 2. La validit des techniques dacquisition de connaissances et la justesse des donnes acquises.
98
Sortie
Linconvnient majeur de lapproche traditionnelle pour la conception des SIF rside au niveau de lobtention des connaissances auprs dun expert humain. Pour palier ce problme, la recherche sest oriente vers llaboration des techniques optimales et systmatiques pour la conception de ces systmes. CONCEPTION DE SUPERVISEUR FLOU Les modles les plus rencontrs dans la littrature des SIF, sont: Les modles de Mamdani. Les modles de Sugeno. La diffrence, entre ces deux raisonnements, rside dans la forme d'valuation des consquences des rgles floues. Dans la mthode de Mamdani [9-10], chaque rgle est reprsente par une conjonction (MIN) et l'agrgation des rgles par une disjonction (MAX). Dans ce modle, les consquences sont indpendantes des entres du SIF. Le lien entre les conditions et les actions est ralis, uniquement, par des oprateurs. Takagi-Sugeno et Kang [10] ont propos un modle pour dvelopper une approche systmatique pour gnrer les rgles floues partir de lensemble de donnes dE/S. Une rgle de ce type a la forme suivante: Ri: SI (x1 est A1i) ET ... ET (xm est Ami) ALORS Yi =Fi (x1, x2, ... , xm) (4)
mthodes permettant de rduire le nombre de paramtres des consquences qui alourdissent lapproche de Sugeno. Hao Ying [15] a propos une mthode analytique de traitement de ce type de SIF. Les polynmes de sorties sont proportionnels lun de lautre. En introduisant certaines modifications au niveau des formes des rgles, on obtient:
Ri : SI (x1 est Ai1) ET ... ET (x m est Aim ) ALORS (8) S i = Ri F (x1 ,..., x m )
Avec,
F(x1,..., x m )=a0+ a1x1+ ... + a m x m
(9)
En utilisant la mthode de dfuzzification des moyennes pondres, on obtient la sortie numrique S pour un ensemble de variables d'entres x1, x2,... et xm:
S=
i =1 M
i F i
i =1
1 = i =M .F (x1 ,..., x m ) i i =1
i Ri
(10)
Les Ri sont les centres de gravit des ensembles flous de sortie associs chaque rgle. Les floues de base sont construites de telle sorte que i 0 .
i =1 M
Lexpression (10) devient:

S = G (x, ).F (x )
(11)
Les Ami caractrisent les sous ensembles flous des entres et les xi reprsentent les variables dentres. Gnralement Fi(-) possde une forme polynomiale de x1, x2, ... et xm.
Fi(x1,..., xm )=a0i +a1i x1+ ... +a mi xm
avec,
G (x, ) = i =1 M i
i =1
i Ri
(12)
(5)
Cette forme est appele le modle de Sugeno d'ordre un. Dans certains cas, Fi(-) doit tre constante (Sugeno d'ordre zro). La dtermination des coefficients des consquences doit tre faite par lemploi des mthodes didentification paramtriques [12]. Les mthodes de dfuzzification adaptes cette forme de rgles sont bases sur lapproche : Dfuzzifier Sans Combiner (DSC). La plus utilise est celle des moyennes pondres "weighted-average defuzzification", donne par:
i Fi(x1,..., x m ) y = i =1 M i
M i =1
La relation a0+a1x1+ ... +amxm prsente une association d'un ensemble de contrleurs linaires, y compris le PID (Proportional-Derivative-Integral) comme cas particulier (avec a0 = 0). Les trois entres utilises par le PID dans sa forme discrte l'instant d'chantillonnage n sont donnes par: x1(n )= y r (n ) y(n ) x3(n )= x 2(n ) x 2(n1) ;
x 2(n )= x1(n ) x1(n1)
(6)
O M est le nombre des rgles et i est le degr d'activation de la ime rgle calcul soit par la conjonction MIN ou le produit arithmtique:
i = i ( x j )
j =1 m
O yr(n) et y(n) sont le signal de rfrence et l'tat actuel du systme commander l'instant d'chantillonnage n, respectivement. Selon les donnes du problme traiter, la variable de sortie peut tre l'action directe ou sa variation. Il est parfois judicieux de formuler les rgles d'infrence de sorte que le signal de sortie intervient comme incrment du signal daction entre les instants n et n-1:
S(n )=S(n1)+ S(n ) S min S(n ) S max
(13)
Or
Avec bien sr vitement des rgions de saturation: (14)
(7) i = MIN ( i ( x1) , , .... , i ( x m)) La simplicit et le temps d'excution rduit prsentent deux avantages de lapproche de Sugeno. Plusieurs chercheurs [13-14] ont essay de dvelopper de nouvelles
Dans le reste de travail, on note S(n) et S(n), l'action directe et sa variation l'instant d'chantillonnage n, respectivement.
99
La forme de sortie du SIF sera donne par:

S (n ) = G (x, )F (x ) = G (x, )(K OP x1 (n ) + K OD x 2 (n )) = (G()K OP ) x1(n)+(G()K OD ) x2(n)
paramtres du systme (base de connaissances floues) sont injects sur un rseau de neurones multicouches. Le rseau utilis possde 06 couches : Une couche de normalisation des grandeurs dentres. Une couche d'entre ralise le transfert direct des signaux d'entres. Une couche de fuzzification ralise la conversion des donnes numriques en une forme symbolique bien adapte au raisonnement approximatif. La fonction d'activation associe chaque neurone de cette couche est la fonction triangulaire (figure 5). La sortie de chacun est caractrise par lexpression (21).
(x xi 1) (xi xi 1), x [xi 1 , xi ], i = 1,2,..., n Tri = (xi 1 x ) (xi +1 xi ), x [xi , xi +1], i = 1,2,..., n 1 (21) 1, x < x1 orx > x n Les poids entre la couche d'entre et celle de fuzzification reprsentent les largeurs des sous ensembles flous associs chaque variable linguistique.
(15)
La loi de commande par PD dans sa forme discrte est donne par: S PD(n )= K P x1(n )+ K D x 2(n ) (16) O K P et K D sont les gains (coefficients) de proportionnalit et de drivation, respectivement. Ceci rend le SIF quivalent un PD avec des gains K P et K D variables et non linaires, puisque la sortie d'un SIF est gnralement non linaire par rapport ces entres.
K P G( )K OP ; K D G()K OD
Dans le cas de la variation de laction, la sortie du SIF sera donc:

S(n)=G()(a1x1(n)+a 2 x 2(n)+a3 x3(n))
(17)
Par analogie avec un PI et un PID dans la forme discrte, la variation de sortie est: S PI (n )= K P x 2(n)+ K I x1(n) (18)
S PID(n )= K P x 2(n)+ K I x1(n)+ K D x3(n)
(19)
La relation (17) peut s'crire comme suit:

S(n )=(a1G()) x1(n)+(a 2G()) x 2(n)+(a3G()) x3(n) (20) Cette dernire est similaire celle de l'expression (19),
Une couche d'infrence o chaque neurone calcule le degr d'activation de chaque rgle (utilisant un oprateur de produit arithmtique). La sortie d'un neurone de la couche d'infrence est donne par:
Oi =(i(x1) i(x 2))
(22)
seulement les gains constants K P , K I et K D sont remplacs par des facteurs non linaires: (a2.G(-)), (a1.G(-)) et (a3.G(-)), respectivement. Gnralement, la commande des systmes complexes mal dfinis par un PID prsente une tche dlicate. La solution du problme revient choisir ou dvelopper une mthode efficace pour la dtermination des gains de diffrentes actions, ou la combinaison du PID avec d'autres mthodes plus sophistiques bien adaptes la complexit et la nature des procds industriels. Le superviseur ainsi dvelopp reprsente une faon de cette hybridation, dont le but est de profiter d'une part de la prcision du modle mathmatique du PID, d'autre part, de la souplesse des lments manipuls par la logique floue.
STRUCTURE DU RESEAU SUPERVISEUR
Les poids entre la couche d'infrence et celle de fuzzification sont fixs 1. Une couche de dfuzzification permettant de gnrer la sortie numrique. La mthode utilise est celle des moyennes pondres. Les poids entre cette couche et celle d'infrence reprsentent les consquences des rgles, qui sont les centres des rpartitions floues (singleton) de sortie de chaque rgle. Une couche de dnormalisation permet de d'amplifier ou dattnuer le signal daction. Les paramtres ou poids du rseau de neurones, ainsi que les coefficients KOP, KOI, KOD associs au gain de dnormalisation et les facteurs dchelle en entre KX1 et KX2 sont optimiss par l'AG.
STRUCTURE DE LA COMMANDE
La structure d'un rseau de neurones adapte la forme des rgles de lexpression (8) est schmatise par la figure 5. Elle prsente un SIF deux entres x1, x2, une sortie S, trois sous ensembles flous pour chacune et neuf rgles. Il s'agit donc d'un contrleur du type 333 selon Hamaifar [16] et Jim Woo Kim [17-18]. Si F(x) de lexpression (9) est constante, F(x)=a0, le superviseur exploite efficacement le raisonnement approximatif de Sugeno d'ordre zro. Dans le cas o F(x) dpend des entres du SIF (Sugeno d'ordre un modifi), celle-ci n'est qu'une hybridation FLOU-PID o les
La structure de commande de la figure 7 contient quatre blocs: Un bloc d'optimisation simul par l'AG. Un bloc de supervision reprsentant le SIF. Le systme de commande (PID). Le systme commander (procd). Lorganigramme de la figure 8 exprime clairement l'interaction entre ces blocs.
100
NB
KX1-1
x1
ZE PB
x1 x2
SS
NB
KX2-1
ZE PB Couche de fuzzification Couche dinfrence

Figure 5. Structure du rseau superviseur.
x2
Normalisation
Couche de dfuzzification
Couche dentre
Poids synaptiques du rseau superviseur.
x1
xi xi+
xn
Figure 6. Fonctions dappartenance triangulaires.
Donnes provenant du procd.

Rseau superviseur. (SIF)
Couche doptimisation
AG
Procd
AG
Mesure de Performances Base de connaissances
Contrleur PID.
SIF
Couche de supervision Couche daction
Non
Fin du temps de simulation ?

Oui Evaluation du critre de performances.
yref
Contrleur PID
y Procd
Figure 7. Structure de contrle et dapprentissage.
Figure 8. Interaction entre les diffrents blocs de la structure de commande.
101
Remarques: La mise en chelle (Normalisation / dnormalisation) des grandeurs dE/S permet dadapter le traitement des signaux dE/S. Par convention, la plage de variation des variables dE/S est comprise entre 1 et +1. Ces facteurs dchelles sont adapts, soit empiriquement, soit par lemploi des mthodes de contrle adaptatif. Les variables d'E/S du SIF sont utilises avec normalisation, c'est dire, utilisant le domaine de discours normalis [-1, +1]. Les fonctions d'appartenance utilises sont de type triangulaires symtriques quidistantes avec un chevauchement de 25%.
MECANISME DE L'AG
La slection par roue de fortune pour la reproduction, loprateur de croisement en deux points et la mutation sont les tapes essentielles de lAG utilis dans ce travail. Si la mutation, a lieu dans la partie code en binaire, l'oprateur de mutation a le mme principe que celui de la mutation standard. Si la mutation a lieu dans la partie des entiers, au lieu de changer un 1 en 0 ou un 0 en 1, on change l'allle (l'entier) par une valeur alatoire de 1 N diffrente de sa valeur courante. N reprsente le nombre des sous ensembles flous de sortie. La figure 10 schmatise clairement le processus de mutation. Enfin, pour mettre une limitation la divergence gntique, une des stratgies d'litisme a t introduite. Cette dernire, base sur la technique de slection l'tat permanent "steady-state selection" permet de construire une nouvelle gnration plus performante que la prcdente. De plus, et pour acclrer le processus de convergence, les probabilits de croisement (Pc) et de mutation (Pm) sont dynamiques et voluent dune gnration lautre [20] (Ngen : le numro de gnration). La figure 11 indique clairement le processus de lvolution des oprateurs gntiques, croisement et mutation.
Ngen Pc =exp Maxgen 0.8 0.05*Ngen P m=exp Maxgen
CODAGE DES PARAMETRES
La diffrence entre les AG utiliss dans la littrature rside niveau du codage (binaire, entier ou rel) et les oprateurs gntiques adapts chaque mode du codage [19]. Le codage mixte binaire-entier multiparamtr et concatn o plusieurs paramtres sont cods et juxtaposs lun aprs lautre, pour construire le chromosome de lAG, est utilis dans cette conception. Les paramtres optimiser sont: Les largeurs des sous ensembles flous associs aux espaces d'E/S qui sont codes en binaire. Les rgles ou centres des sous ensembles flous de sortie sont codes en entier. Chaque centre (singleton) est cod par un numro allant de 1 jusqu'au nombre maximal N des sous-ensembles flous de l'espace de sortie. Les coefficients KX1, KX2, KOP et KOD sont les facteurs dchelle des variables dE/S cods en binaire. Chaque chromosome peut reprsenter une solution du problme, c'est dire, une base de connaissances floues optimale. Sa structure est reprsente par la figure 9. LZE X1, LZEX2 et LZES sont les codes des largeurs des univers de discours ou des sous ensembles flous (ZE) des entres x1, x2 et de la sortie S, respectivement. Les Ri sont les codes des conclusions caractrisant les centres des sous ensembles flous de sortie, KX1, KX2, KOP et KOD sont les codes des coefficients des facteurs dchelle des variables dE/S.
METHODE D'OPTIMISATION Les grandeurs ajustables sont les largeurs des sousensembles flous, les rgles et les facteurs dchelle des variables dE/S. On commence par l'optimisation de LZE, c'est dire, dterminer les bornes de variations suprieure (UB) et infrieure (LB) de ZE. Aprs lopration de dcodage, on aura: L ZE = LB + decimal 01101.......012 UBl LB (23) 2 1 O l reprsente la longueur ou la taille du code de ZE. Les largeurs des autres sous-ensembles flous sont obtenues par un dcalage avec un chevauchement de 25%. De mme pour les autres paramtres cods en binaire.
(24) (25)
Le critre d'arrt de l'AG est fix par un nombre bien dtermin de gnrations (Maxgen).
La validit de la mthodologie de supervision propose, est teste, sur le systme du pendule invers considr comme un systme, non linaire, mono-entre/multi-sorties (SIMO).
SIMULATION
La figure 12 montre le diagramme schmatique du systme de pendule invers, ainsi que sa structure. Les dynamiques du systme sont caractrises par:
2 & x1= x2 U m p l x2 sin(x1) g sin(x1)+cos(x1) mc +mP & x2 = 4 m p cos2(x1) l 3 mc +m p
(26)
O, l: demi longueur du segment, g: acclration gravitationnelle, mc: masse du chariot, mp: masse du segment, x1 = langle du segment par rapport laxe vertical et x2 = & la vitesse angulaire du segment. Les valeurs numriques utilises dans la simulation sont: l = 0.5m, mc = 1kg, mp= 0.1kg, g = 9.8m/s2. L'objectif du contrle est de gnrer une squence d'actions F (en Newton) pour stabiliser le pendule dans sa position d'quilibre (verticale) correspondante un angle et
102
une vitesse angulaire nulles. Le vhicule se dplace librement droite ou gauche avec l'hypothse que les frottements sont ngligeables. Ce systme est simul par la mthode de Runge-Kutta avec une priode dchantillonnage gale 10 ms. Le but de lAG est de gnrer une base de connaissances optimale du superviseur flou en minimisant une fonction cot donne. Dans cette application la fonction objective responsable de classement des chromosomes dans la population est:
400 F it =1+ 103 (k ) +10 4 F(k ) k =1
(27)
Le superviseur ainsi dvelopp pour cette application se caractrise par: Deux SIF deux bases de connaissances diffrentes, une pour le gain de laction de proportionnalit KPPD et lautre pour laction de drivation KDPD, comme montre la figure 13. Chaque SIF est caractris par : 05 sous ensembles flous pour langle, 05 sous ensembles flous pour la vitesse angulaire, 05 sous ensembles flous pour la commande (force). Ce qui donne au total 252 rgles. Chaque chane de la population contiendra 120 gnes (10 bits pour chacune des largeurs des univers de discours, 252 entiers pour les rgles et 10 bits pour chaque coefficient des gains).
LZEX1
x1 x2
NB
ZE NB 1
PB
LZEX2
NB ZE PB
Rgle2 : SI (x1 est ZE) ET (x2 est NB) ALORS (U = R2 F(x1, x2). R2 NB
KX1-1
KX2-1
LZEX1
LZEX2
LZES
R1
R2
...
RN-1
RN
KOP
KOD
Largeurs des univers de Facteurs discours dchelle en entre
Partie conclusions des rgles
Paramtres des consquences
Figure 9. Structure de chromosome.
Avant mutation
---
Aprs mutation
---
Codage binaire
Codage entier
Figure 10. Mutation.
103
1 0.9 0.8 0.7 Pc
Les conditions initiales utilises dans cette simulation sont: i =200 et &i =00 /sec , avec la contrainte: U 125[N] . La figure 14 indique l'volution de la fonction objective de gnration en gnration.
0 .4 5
Probability rate
0.6
0.4
0.5
0 .3 5
0.4 0.3 Pm 0.2 0 20 40 60 80 100 120 Generation 140 160 180 200
Best objective
0.3 0 .2 5 0.2 0 .1 5 0.1
Figure 11. Evolution des probabilits Pm et Pc.
0 .0 5
20
40
60
80
100 120 G e n e ra t io n
140
160
180
200
Figure 14. Evolution de la fonction objective.
Les paramtres de lAG sont prsents dans le tableau 1.

Tableau 1. Paramtres de lAG.
Paramtre La taille de la population. Les largeurs LZEX1, LZEX2 et LZEU Les paramtres KX1 et KX2 Les paramtres KOP et KOD Le nombre maximal de gnration.
Valeur 40 [-0.5, 0.5] [10, 80] [1, 150] 200
Le tableau 2 reprsente les bases de rgles gnres aprs 200 gnrations. La figure 15 montre, bien, la convergence de la trajectoire vers ltat dquilibre (0, 0/s) partir du ltat initial (20, 0/ s).
Tableau 2. Tables des rgles.
Base de rgles
SIF 1 : SIF 2 : 2525251344135523412112345 5343124233323234211242513
2l,mp
mc
La robustesse du contrleur est justifie par sa capacit de bien ragir lorsqu'on s'carte des conditions normales d'utilisation. Pour cela, ce dernier a t test pour plusieurs conditions initiales, comme le montre la figure 16. Les conditions initiales testes sont les suivantes :
x Figure 12. Structure de pendule invers
(+10,0 s )(+20,0 s )(+30,0 s )(+40,0 s )
(+ 50, 0 s )(+ 60, 0 s )(+ 70, 0 s )(+ 80, 0 s )

CONCLUSION
x1 x2 x1 x2 SIF relatif KPPD x1 x2 x1 x2 SIF relatif KDPD KDPD=H2(x1, x2 ) KPPD=H1(x1, x2 )
Figure 13. Structure de superviseur.
Dans ce travail, le contrleur PD supervision floue propos a prouv son efficacit. Sa robustesse est justifie par sa capacit de ragir dans un sens positif (ralisation du but vis par la commande) vis vis au changement des conditions de fonctionnement. La mise en uvre de rgulateur PID souffre de problmes de rglage des gains de diffrentes actions afin dobtenir de bonne performances. Lexploitation dune supervision base sur la logique floue optimisation gntique en vue de ladaptation des paramtres de synthse dun rgulateur de type PID permet doffrir une alternative fort intressante dont lobjectif est de satisfaire les critres de performances dsires. La combinaison des techniques conventionnelles de lautomatique avec les techniques dites intelligentes permet de tirer profit, dune part des performances offertes par les algorithmes conventionnelles, et dautre part de la
104
souplesse des lments manipuls par les techniques modernes qui se traduit par leurs progressivits dans la prise de dcisions. On remarque que le contrleur arrive toujours raliser l'objectif.
Angle(deg)
80 70 60 50 40 30 20
20 15 10 5 System state 0 -5 -10 -15 -20 -25 -30 0 0.5 1 1.5 2 Time(sec) 2.5 3 3.5 4 Angular velocity(deg/sec) Angle(deg)
10 0 -10
0.5
1.5
2 Tim e(s ec )
2.5
3.5
(a)
-5
Angular velocity(deg/sec)
(a)
140 120 100 80
-10
-15
-20
-25
-30
Force(N)
60
-35
40 20 0 -20 -40
0
0.5
1.5
2 Tim e(s ec )
2.5
3.5
(b)
0.5
1.5
2 Time(sec)
2.5
3.5
4
-5
(b)
0
Angular velocity(deg/sec) -10 -15
-5
-20
Angular velocity(deg/sec)
-10
-25
-30
-15
-35 -10 0 10 20 30 40 A ngle(deg) 50 60 70 80
-20
(c)
-25
Figure 16. Rponses aux diffrentes conditions initiales. (a) Angles. (b) Vitesses angulaires. (c) plan de phase.
0 5 Angle(deg) 10 15 20
-30 -5
REFERENCES
[1] Yongho Lee and Sunwon Park, "PID controllers tunning for desired closed-loop responses for SI/SO systems", Aiche journal, Vol. 44, No. 4, January 1998, 106-115. [2] Astrm, K.J. and T. Hgglund, PID Controllers: Theory, Design, and Tuning, Instrument Society of America, 1995.
(c)
Figure 15. Raction du pendule : (a) Etat du systme. (b) Commande gnre. (c) Plan de phase.
105

[3] Marlin, T. E, Process Control. Designing Processes and Control Systems for Dynamic Performance, Mc Graw-Hill, 1995. [4] L. A. Zadeh, "Fuzzy sets", Information and Control , Vol. 8, 1965, pp. 338-353. [5] Jhy-Shing Roger Jang and Chuen-Tsai Sun, "Neuro fuzzy modeling and control", Proceedings of the IEEE, Vol. 83, No. 3, March 1995, pp. 378-406. [6] David E. Goldberg, Algorithmes gntiques: exploration, optimisation et apprentissage automatique, AddisonWesley, 1994. [7] J. Holland, Adaptation in natural and artificial systems, University of Michigan Press, 1975. [8] Yigang Shi and P.C. Sen, "A New Defuzzification Method for Fuzzy Control of Power Converters, IEEE porceeding on Fuzzy Systems, 2000. [9] Mamdani, E. H., Application of fuzzy algorithms for simple dynamic plant, Proc. IEE, D-121, 1974, pp. 1558-1588. [10] Mamdani, E. H., and Assilian, An experiment in linguistic synthesis with a fuzzy logic controller, International Journal of Man- Machine Studies, Vol. 7, 1975, pp. 1-13. [11] M. Sugeno and G. T. Kang, "Structure identification of fuzzy model", Fuzzy sets and systems, Vol. 28, 1988, pp.15-33. [12] Jhy-Shing Roger Jang and Chuen-Tsai Sun, "Neuro fuzzy modeling and control", Proceedings of the IEEE, Vol. 83, No. 3, March 1995, pp. 378-406. [13] X. W. Yan, Z. D. Deng and Z. Q. Sun, Genetic TakagiSugeno-fuzzy reinforcement learning, Proceeding of the 2001 IEEE, International Symposium On Intelligent Control, September 5-7, 2001, Mexico city, Mexico, pp. 67-72. [14] Chia-Feng Juang and Yuan-Chang Liou, A TSK-type recurrent fuzzy network for dynamic systems processing via supervised and reinforcement learning, 2001 IEEE International Fuzzy Systems Conference, pp. 240-243. [15] Hao Ying, "Constructing nonlinear variable gain controllers via the Takagi-Sugeno fuzzy control", IEEE transactions on fuzzy systems, Vol. 6, No. 2, May 1998, pp. 226-234. [16] A. Homaifar and Ed Mc Cormick, "Simultaneous design of membership functions and rules sets for fuzzy controllers using genetic algorithms", IEEE Transactions On Fuzzy Systems, Vol. 3, No. 2, May 1995, pp. 161-176. [17] Jinwoo Kim, Yoonkeon Moon, and Bernard P. Zeigler, "Designing fuzzy net controllers using genetic algorithms", IEEE control systems, June 1995, pp. 66-72. [18] Jinwoo Kim, and Bernard P. Zeigler, "Designing fuzzy logic controllers using a multiresolutional search paradigm", IEEE Transaction On Fuzzy Systems, Vol. 4, No. 3, August 1996, pp. 213-226. [19] Sanjay Kumar Sharma and George W. Irwin, Fuzzy Coding of Genetic Algorithms, IEEE Transactions on Evolutionary Computation, Vol. 7, No. 4, August 2003, pp 344-355. [20] Teo Lian Seng et al., Tuning of a neuro-fuzzy controller by genetic algorithm, IEEE Transactions On Systems,Man, and Sybernetics-Part B: Cybernetics, Vol. 29, No. 2, April 1999, pp. 226-236.
106

Supervision Neuro-Floue A Apprentissage Genetique D'un Pid Robuste

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Supervision Neuro-Floue A Apprentissage Genetique D'un Pid Robuste

Загружено:

Авторское право:

Доступные форматы

SCIENCES & Technologie B N23, juin (2005), pp. 95-106.

SUPERVISION NEURO-FLOUE A APPRENTISSAGE GENETIQUE DUN PID ROBUSTE

Universit Mentouri Constantine, Algrie, 2005. 0

A. SOUKKOU, A. KHELLAF, S. LEULMI

Supervision Neuro-Floue a Apprentissage Gntique dun PID Robuste

Evaluation des individus de la population

critre darrt ? Non

Gnration dune population initiale.

Configuration paramtrique de lAG Figure 1. Le processus dexcution de l'AG.

Codage binaire Figure 3. Mutation.

Croisement en deux points. Figure 2. Croisement.

A. SOUKKOU, A. KHELLAF, S. LEULMI

Exemple: chaine=(code 1)(code 2) L (code n).

Engin dinfrence floue

Figure 4. Structure de base dun SIF.

Supervision Neuro-Floue a Apprentissage Gntique dun PID Robuste

F(x1,..., x m )=a0+ a1x1+ ... + a m x m

Lexpression (10) devient:

Avec bien sr vitement des rgions de saturation: (14)

A. SOUKKOU, A. KHELLAF, S. LEULMI

La forme de sortie du SIF sera donne par:

Dans le cas de la variation de laction, la sortie du SIF sera donc:

La relation (17) peut s'crire comme suit:

Supervision Neuro-Floue a Apprentissage Gntique dun PID Robuste

ZE PB Couche de fuzzification Couche dinfrence

Poids synaptiques du rseau superviseur.

Figure 6. Fonctions dappartenance triangulaires.

Donnes provenant du procd.

Couche de supervision Couche daction

Fin du temps de simulation ?

Figure 7. Structure de contrle et dapprentissage.

Figure 8. Interaction entre les diffrents blocs de la structure de commande.

A. SOUKKOU, A. KHELLAF, S. LEULMI

CODAGE DES PARAMETRES

Supervision Neuro-Floue a Apprentissage Gntique dun PID Robuste

Largeurs des univers de Facteurs discours dchelle en entre

Partie conclusions des rgles

Paramtres des consquences

Figure 9. Structure de chromosome.

Figure 10. Mutation.

A. SOUKKOU, A. KHELLAF, S. LEULMI

1 0.9 0.8 0.7 Pc

0.3 0 .2 5 0.2 0 .1 5 0.1

Figure 11. Evolution des probabilits Pm et Pc.

Figure 14. Evolution de la fonction objective.

Les paramtres de lAG sont prsents dans le tableau 1.

Valeur 40 [-0.5, 0.5] [10, 80] [1, 150] 200

x Figure 12. Structure de pendule invers

(+10,0 s )(+20,0 s )(+30,0 s )(+40,0 s )

(+ 50, 0 s )(+ 60, 0 s )(+ 70, 0 s )(+ 80, 0 s )

x1 x2 x1 x2 SIF relatif KPPD x1 x2 x1 x2 SIF relatif KDPD KDPD=H2(x1, x2 ) KPPD=H1(x1, x2 )

Figure 13. Structure de superviseur.

Supervision Neuro-Floue a Apprentissage Gntique dun PID Robuste

A. SOUKKOU, A. KHELLAF, S. LEULMI

Вам также может понравиться