Вы находитесь на странице: 1из 11

Hiba KHELIL et Abdelkader BENYETTOU

Application du système immunitaire artificiel ordinaire et


améliore pour la reconnaissance des caractères artificiels

Hiba KHELIL, Abdelkader BENYETTOU

Laboratoire SIgnal IMage PArole SIMPA – Université des sciences et de la


technologie d’Oran
BP 1505 El M’Naouer 31000 Oran ALGERIE
hibakhelil@yahoo.fr aek.benyettou@univ-usto.dz

Résumé
L’écriture est un moyen de communication depuis la nuit des temps, la poste a toujours fait le
liens des échange de lettres classique, la lecture des adresses est une tâche assez ennuyeuse
pour un agent qui travail à la porte durant toute la journée, pour cela un classificateur
automatique peut faire le travail des milliers d’agents et dans un temps très réduit, il s’agit dans
ce cas d’une lecture artificiel des adresses et une classification régionale. Dans cet article on va
définir qu’est ce qu’un système immunitaire biologique, sa simulation artificielle projetant la
lumière sur les algorithmes d’apprentissages artificiels et les calcules bio inspiré, présentant par
la suite les résultats obtenus pour la reconnaissance des caractères artificiels. La deuxième
partie est une présentation du système immunitaire artificiel amélioré appliqué sur la
reconnaissance sur la reconnaissance des caractères artificiels, montrant la différence du
nombre de cellules B générées et le taux de reconnaissance des deux méthodes.

Abstract
The handwriting is one of the communication tools, where the post office use frequently the
handwriting signal to distribute letters to there owners by reading the address home; this task is
very boring if we have a lot of thousand of letters by day, so we think to automate this task
using artificial recognition methods in order to reducing time using the artificial reading of
address to classify it by region; the artificial immune recognition systems is able to do this task.
In this article we define the natural immune system, its artificial simulation giving the training
algorithm and we present in the last some classification results using the artificial immune
system for characters recognition. The second part is a presentation of the amelioration of the
artificial immune recognition system applied also for characters recognition, showing the
difference on the remarkable memory cells number and recognition rate between two methods.

144
Application du système immunitaire artificiel ordinaire et améliore pour la reconnaissance
des caractères artificiels

Mots Clés
Système immunitaire naturel, Système immunitaire artificiel, Antigène, Anticorps, Cellules B
mémoire, Reconnaissance des caractères artificiels.

Keywords
Natural immune system, Artificial immune system, Antigen, Antibody, B memory cells,
Artificial characters recognition.

1 Introduction
La reconnaissance des formes est un domaine très vaste dans l’intelligence artificiel, dont on
peut trouver la reconnaissance des visages, les empreintes, la parole, l’écriture et autres
domaines qui ne sont pas moins important de ce qu’on a citer ; pour cela il existe plusieurs
méthodes et approches d’applications comme les réseaux de neurones, les algorithmes
évolutionnaires, les algorithmes génétiques et autres qui sont en cours d’exploitation. Le
système immunitaire artificiel est une approche utilisée dans différents domaines d’application
tel que la reconnaissance des formes (Andrew et all, 2003) (Batouche, 2003) (Deneche et all,
2005) (Deneche, 2006) (Goodman et all., 2002), la détection des intrusions dans les réseaux
d’Internet (Kim et Bently, 2001), la robotique (Jun et all, 1999), apprentissage machine
(Timmis, 2000) et autres applications diverses dans des domaines différents. Les fonctions du
système immunitaire artificiel sont inspirées du système immunitaire naturelles, les cellules
responsables de la réponse ainsi que la réponse immunitaire sont simulées pour donner une
approche artificielle adaptée selon le domaine d’application et le but d’utilisation de cette
dernière.

Le présent travail est une application de l’approche immunitaire artificiel dans le cadre de la
reconnaissance des formes et la forme choisie est le signal d’écriture plus précisément les
caractères artificiels. L’AIRS (Artificial Immune Recognition System) est une méthode inspiré
du système immunitaire biologique orienté reconnaissance des formes proposé par A. Watkins
en 2001 (Watkins, 2001) dans sa thèse de magister à l’université de Mississipi, l’amélioration
été en 2004 par le trio A. Watkins, J. Timmis et L. Boggess (Watkins et all, 2004) en
optimisant le nombre de cellules B générées. Cette méthode est caractérisée par l’apprentissage
distribué prouvé par A. Watkins dans son PHD à l’université de Kent en 2005 (Watkins,
2005). Dans ce papier ont commencera par une représentation du système immunitaire naturel
et les types de réponse immunitaire, la deuxième partie est une représentation d’une simulation
artificielle des systèmes immunitaires donnant les phases d’apprentissages. Comme prototype
d’apprentissage nous présentons un aperçu sur la base de donnée du signal d’écriture, suivie
des résultats de la mise en œuvre. Finalement l’approche d’amélioration est donnée avec les
résultats obtenus par sa mise en œuvre, montrant la différence entre les deux méthodes par une
discussion et des commentaires.

145
Hiba KHELIL et Abdelkader BENYETTOU

2 Le système immunitaire naturel


Le système immunitaire biologique constitue une arme contre des intrus dans un corps donné,
pour ce but il existe plusieurs cellules qui contribuent pour éliminer cet intrus nommé antigène,
ces cellules participent pour ce qu’ont appelle une ‘réponse immunitaire biologique’. On
distingue deux types principaux d’immunité naturelle, une innée et l’autre acquise, expliqué
dans les points qui suit :

2.1 L’immunité innée


Est une immunité élémentaire qui est adapté seulement à un certain nombre très réduit
d’antigènes, on trouve ce type d’immunité chez les nouveaux nés pas encore vacciné. Une
immunité non adaptative pour longtemps peut conduire à des infections et à la mort car le
corps n’est pas encore bien armé contre les antigènes de l’environnement (Emilie, 2006).

2.2 L’immunité acquise


Est une immunité a mémoire (réponse secondaire), qui se développe lors de l’apparition du
même antigène dans le même système immunitaire pour la deuxième fois ou plus, et qui
engendre le développement et la génération des cellules B mémoire pour ce type d’antigène
déjà rencontré (mémorisé) dans le système. Cette réponse est plus rapide que celle innée
(Emilie, 2006). Une réponse immunitaire engendre une augmentation de la température du
corps, ce qui explique que les cellules B développé sont en train de lutter contre les antigènes
introduit dans l’organe humain. La réponse immunitaire primaire est plus lente seulement mais
elle garde les informations du passage des antigènes dans le système, le phénomène de
mémorisation sera intéressant de l’utiliser pour la reconnaissance artificiel des formes, de ce
principe le système immunitaire artificiel est développé dans ce sens, ce qui fera le but de ce
papier.

3 Le système immunitaire artificiel


Le système immunitaire naturel est assez compliqué pour qu’une simulation artificielle soit
d’une façon complète, mais par contre dans (Watkins, 2001) l’auteur a réussi de simuler les
fonctions les plus pertinentes dans un système immunitaire biologique pour que l’artificiel
hérite le maximum des fonctionnalité naturels dans le domaine de la reconnaissance des formes.
Les acteurs principaux entrant dans un système immunitaire artificiel sont les antigènes, les
anticorps et les cellules B mémoire, dans la session qui suit nous présenteront l’algorithme
d’apprentissage qui mettra en œuvre les acteurs notés.

4 L’algorithme d’apprentissage du système immunitaire


artificiel
Le présent algorithme est inspiré de thèse de A. Watkins (Watkins, 2001) (Watkins et Timmis,
2002) (Watkins et Boggess, 2002a) (Watkins et Boggess, 2002b) qui représente un système

146
Application du système immunitaire artificiel ordinaire et améliore pour la reconnaissance
des caractères artificiels

immunitaire artificiel destinée pour la reconnaissance des formes nommée AIRS. Tout d’abor
l’antigène représente l’ensemble d’apprentissage dont il aura besoin pour le déroulement du
programme, et le résultat d’apprentissage est l’ensemble d’anticorps (cellules B mémoire) qui
seront utilisé pour la phase de test (les nouveaux antigènes introduits dans le système).
L’apprentissage du système immunitaire artificiel se déroule en quartes étapes chaque sortie est
une introduction de l’étape suivante et le résultats finale comme nous avons noté c’est
l’ensemble des anticorps générés. Les étapes seront détaillées dans les points qui suivent:

4.1 Etape d’initialisation


Dans cette partie nous allons télécharger les données d’apprentissage (antigènes), ces données
seront normalisé et tout vecteur caractéristique aura des valeurs de l’intervalle [0, 1]. Un seuil
d’affinité est calculé à partir cet ensemble d’antigène, qui représente l’affinité moyenne entre
tout les antigène deux à deux. Le seuil d’affinité est calculé selon la formule (1) :
n n
affinité (agi , ag j )
i =1 j =i +1
seuil _ d 'affinité =
n(n − 1)
2 (1)

ag i et ag j
Avec : deux antigènes et affinité (a, b) retourne la distance euclidienne
normalisée entre a et b.

La dernière étape d’initialisation consiste à initialiser l’ensemble des cellules mémoires


(anticorps) et la population des ARB1 (Artificial Recognition Ball), à partir de l’ensemble des
antigènes par tirage aléatoire des exemples.

4.2 Etape d’identification des cellules B et génération des ARBs


Une fois que l’initialisation est achevée, cette étape aura lieu pour chaque nouvel antigène
introduit. Une cellule mémoire est sélectionnée de l’ensemble entier de cellules B est
nommé mcmatch , cette dernière est tiré de tel sorte qu’elle ressemble le plus a l’antigène en
cours de traitement (la plus grande valeur de stimulation) selon la formule (2)

mcmatch = arg max mc∈MCag .c stimulation(ag , mc)


(2)

Une fois que la cellule mcmatch est sélectionnée, elle sera utilisée pour générer les nouveaux
ARBs (clonage), cet ensemble sera additionné a l’ensemble total des ARBs généré par

1
Le ARBs est un magasin de cellules B réduit, dont chaque ARB contient des informations sur la cellule B
(anticorps, ressource, classe).

2
La ressemblance est calculée par la formule de stimulation : stimulation( ag , mc) = 1 − affinité ( ag , mc )

147
Hiba KHELIL et Abdelkader BENYETTOU

l’ensemble des antigènes préalablement traité. Le nombre de clone de la cellule mcmatch , il est
limité selon la formule (3):

nombre _ de _ clones = hyper _ clonal _ rate * clonal _ rate * stimulation(mcmatch , ag en _ cours )


(3)

Notant que pour chaque ARB généré par mcmatch est muté selon l’algorithme de mutation décrit
dans (Watkins, 2001). Le clonage participe à survie de la cellule mcmatch et la mutation est un
opérateur d’exploration de l’espace de recherche.

4.3 Compétition des ressources et développement des cellules mémoire


candidates
Cette partie se base sur les résultats de la précédente, elle complète les informations des ARBs
généré en calculant les ressources selon (4) pour chaque anticorps avec l’antigène en cours de
traitement, ces ressources sont mis à jour durant l’apprentissage, et chaque ARB n’ayant pas
de ressources sera supprimé de l’ensemble des ARBs (Watkins, 2001).

ressources = stimulation(ag , anticorps ) * clonal _ rate (4)

Les points 4.2 et 4.3 seront exécutés pour un antigène donné jusqu’à ce que la condition
si ≥ Seuil _ d 'affinité soit vérifiée, avec

| ABi |
ab j .stim
j =1
si = , abj ∈ ABi (5)
| ABi |

A la fin de ces deux étapes un ensemble d’ARBs est obtenu pour s’introduire a l’étape finale de
l’apprentissage

4.4 Introduction des cellules mémoire


Cette étape consiste a choisir à partir des ARBs la cellule candidate qui convient le plus à
l’antigène en terme de similarité tenant en compte la cellule mcmatch déjà sélectionné, la cellule
candidate sera additionné à l’ensemble des cellules mémoire seulement si retourne une
stimulation plus élevé que la cellule mcmatch avec l’antigène en cours de traitement sinon la
cellule mcmatch sera retiré de cellules mémoire seulement si sa stimulation entre la cellule
candidate avec mcmatch ne dépasse pas le seuil (Watkins, 2001).

Dans cette partie nous avons représenté l’algorithme d’apprentissage d’un système immunitaire
artificiel destinée pour la reconnaissance des formes, dans la partie qui suit nous allons
représenter la forme choisi pour l’application de cet algorithme.

148
Application du système immunitaire artificiel ordinaire et améliore pour la reconnaissance
des caractères artificiels

5 Les caractères artificiels


La base de donnée est un ensemble de caractères différents dont chacun est représentée dans
différents fichiers et chaque fichier représente les coordonné cartésienne de ce caractère. Voici
d’un exemple d’un caractère qui est délimité par un ensemble de point dans le plan cartésien.

Figure 1 : Un caractère artificiel

Pour pouvoir lancer l’apprentissage nous avons choisi un corpus d’apprentissage de trois
caractères (A, C et D) dont chacun contient 100 exemples et pour pouvoir tester 500 exemple
pour chaque caractère la figure 2 montre la distribution des exemples.

Train Test

A 100 500

C 100 500

D 100 500

Figure 1 : Nombre d’exemples du corpus d’apprentissage et de test

6 Mise en œuvre
Pour la mise en œuvre de notre application nous avons pris le corpus d’apprentissage de trois
caractères donné dans la figure 2, dont il représente les antigènes, et le but est d’atteindre en
sortie un ensemble d’anticorps qui seront utilisé pour la phase de test.

Selon la figure 2 on remarque bien que l’ensemble d’apprentissage est plus petit que l’ensemble
de test, cette particularité caractérise ce type système dans la reconnaissance des formes, cela
est tiré du principe naturel de vaccination, qui est l’introduction de petite quantité d’antigène.
L’apprentissage nécessite de poser certains paramètres d’apprentissage, ces paramètres seront
représentés dans la figure 3 suivante :

149
Hiba KHELIL et Abdelkader BENYETTOU

Paramètres Signification Plage de valeurs Valeurs

hyper_clonal_rate Taux maximal de Entier 25


clonage

clonal_rate Taux moyen de Entier 15


clonage

mutate_rate Probabilité de Réel ∈[0, 1] 0.0001


mutation

Figure 3 : paramètres d’apprentissage

6.1 Résultats et discussions


Le logiciel d’apprentissage est écrit a l’aide du compilateur C++ sous l’environnement Linux
Mandriva, déroulé dans une machine Pentium 4 doté d’un processeur d’une fréquence de 2.4
GHz et d’une RAM de 512 Mo. Prenant en compte des paramètres indiqué dans la figure 3,
l’apprentissage est déroulé au bous de 50 itérations pour tout l’ensemble d’apprentissage. Les
résultats c’est la génération des cellules B indiqué dans la figure 4 et l’évolution de ces cellules
par itération est montrée dans la figure 5.

Cellules B généré au bout du


50éme itérations

A 446

C 121

D 330

Figure 4 : Cellules B générées après l’apprentissage

500

400 Cellules
mémoires A
300 Cellules
200 méoir e C
Cellules
100 mémoire D
0
1 6 11 16 21 2 31 3 41 4 51

I t é r a t i ons

Figure 5 : Evolution des cellules B

150
Application du système immunitaire artificiel ordinaire et améliore pour la reconnaissance
des caractères artificiels

6.2 Classification
Dans cette phase de test nous allons utiliser le résultats d’apprentissage (Cellules B) pour
pouvoir classifier les nouveaux antigènes, le principe est de pouvoir affecter un antigène a une
classe tel sorte qu’il se rapproche le plus aux anticorps de cette classe en terme de distance ; la
méthode KMeans offre ce principe, tel qu’ont calcule pour chaque classe de cellules B un
centroîde qui sera utilisé pour calculé l’affinité avec l’antigène a classer et la classe qui donne la
plus faible affinité sera la classe cible de cet antigène.

6.3 Résultats de classification


Basant sur le principe de classification expliqué auparavant, les résultats de classification
obtenue été satisfaisante, la figure 6 est une récapitulation des résultats de cette expérience.

Cellules Tes %Tes Apprentissage %Apprentissage


B t t

A 446 500 100 100 100

C 121 500 66.73 100 67

D 330 500 100 100 100

88.91 89

Figure 6 : Résultats de classification

Dans la partie suivante nous allons appliquer l’amélioration portée par A. Watkins, J. Timmis
et L. Boggess (Watkins et all, 2004) sur l’algorithme d’apprentissage des systèmes immunitaire
artificiels.

7 Le système immunitaire amélioré


Cet algorithme ne divers pas trop par rapport de l’originale, seulement au niveau de la
mutation et la compétition des ressources. Car dans la mutation les auteurs introduit la notion
de stimulation entre l’anticorps et l’antigène en cour de traitement, et de même pour la
compétition des ressources qui prend en compte seulement des anticorps de même classe que
l’antigène (Watkins et all, 2004) (Watkins et Timmis, 2002). L' apprentissage est déroulé dans
les mêmes condition logiciel et matériel de celle de l’expérience précédente, ainsi que pour les
paramètres de d’apprentissage dans la figure 3. Les cellules B générées sont montrées dans la
figure 7 ainsi que l’évolution des cellules B dans la figure 8.

151
Hiba KHELIL et Abdelkader BENYETTOU

Cellules B généré au bout du


50éme itérations

A 356

C 62

D 77

Figure 7 : Cellules B générées après l’apprentissage

400
350
300
250 Cell ules mémoi r e A
200 Cell ules mémoi r e C
150 Cell ules mémoi r e D
100
50
0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49

I t é r a t i ons

Figure 8 : Evolution des cellules B

Cellules Test %Test Apprentissage %Apprentissage


B

A 355 500 100 100 100

C 61 500 67.13 100 100

D 76 500 100 100 100

89.04 100

Figure 9 : Résultats de classification

Voici donc les résultats de classification des caractères artificiels obtenu par l’apprentissage du
système immunitaire amélioré, on remarque bien que nous avons obtenu une amélioration de
0,134% sur la reconnaissance des caractères de test et de 11% sur l’ensemble d’apprentissage
avec une réduction importante du nombre de cellules B généré dans la phase d’apprentissage
du système immunitaire artificiel, et delà on peut extraire l’efficacité du système immunitaire
amélioré sur le taux de reconnaissance augmenté et surtout sur le nombre de cellules réduit qui
implique des ressources logiciels minime et aussi temps d’exécution réduit.

8 Conclusion
Finalement, on peut dire que l’AIRS est un outils puissant dans la reconnaissance des formes,
ce que l’écriture a confirmé dans le cadre de classification. Nous avons vu aussi que le système
immunitaire amélioré a portait un point important sur le temps d’exécution et sur le nombre de
cellules B généré ainsi sur le taux de reconnaissance.

152
Application du système immunitaire artificiel ordinaire et améliore pour la reconnaissance
des caractères artificiels

L’intégration des AIRS avec d’autres méthodes d’optimisation pourra peut être porter de
meilleurs résultats en faisant le choix sur les meilleurs paramètres de d’apprentissage, prenant
l’exemple des algorithmes génétiques, ce qui fera l’objectif du prochain travail.

Références
Deneche A. (2006). Approches bios inspirées pour la reconnaissance de formes, Thèse de
Magister de l’université Mentouri, Constantine, Algérie.

Deneche A., Meshoul S., Batouche M. (2005). Une approche hybride pour la reconnaissance
de formes en utilisant un Système Immunitaire Artificiel, Procéding des Journées
d'informatique graphique, Algérie

Emilie P. (2006). Organisation du system immunitaire Felin. Thèse doctorat vétérinaire, Ecole
nationale de Lyon. Lyon

Goodman D., Boggess L., Watkins A. (2002). Artificial immune system classification of
multiple class problems. Journal Intelligent Engineering Systems Through Artificial Neural.

Jun J. H., Lee D. W., Sim K. B., (1999), Realization of cooperative and Swarm Behavior in
Distributed Autonomous Robotic Systems Using Artificial Immune System. Procéding IEEE,
conférence Man and Cybernetics.

Kim J., Bently P. (2001), Towards an artificial immune system for network intrusion detection
: an investigation of clonal selection with a negative selection operator, Procéding de la
conférence Congress on Evolutionary Computation.

Timmis J., (2000), Artificial Immune Systems: A novel data analysis technique inspired by the
immune network theory, PhD, Département d’informatique, université de Wales UK

Secker A., Freitas A., Timmis J. (2003). AISEC : an Artificial Immune System for E-mail
Classification. Journal IEEE Evolutionary Computation ECE’2003 pp 131-138.

Watkins A. (2001). AIRS : A resource limited artificial immune classifier. Thèse de


l’université de Mississipi du département d’informatique. Mississipi.

Watkins A., (2005), Exploiting immunological metaphors in the development of serial,


parallel, and distributed learning algorithms, PhD de l’université de Kent.

Watkins A., Boggess L. (2002a). A New Classifier Based on Resources Limited Artificial
Immune Systems. Procéding congress de Evolutionary Computation, IEEE World Congress
on Computational Intelligence held en Honolulu, pp 1546-1551. IEEE. USA.

Watkins A., Boggess L. (2002b). A Resource Limited Artificial Immune System. Journal IEEE
World Congress on Computational Intelligence help in Honolulu, USA pp 926-931.

Watkins A., Timmis J. (2002). Artificial Immune Recognition System (AIRS): Revisions and
Refinements. 1ére Conférence internationnal du Système immunitaire artificiel ICARIS’2002,
pp 173-181, Université de Kent à Canterbury.

153
Hiba KHELIL et Abdelkader BENYETTOU

Watkins A., Timmis J., Boggess L. (2004). Artificial immune recognition system (AIRS) : an
immune inspired supervised learning algorithm. Journal de l’acédemie Kluwer Genetic
Programming and Evolvable Machines. pp 291-317.

154

Вам также может понравиться