Академический Документы
Профессиональный Документы
Культура Документы
Dpartement de llectronique
Mmoire de Master
No. Rf. : 521/2151
Prsident
M. Ziet Lahcene
Directeur du Mmoire
M. Belaala Hichem
Examinateur
Ddicaces
Ce mmoire est ddi ma famille: ma mre, mon pre, dont la fiert est ma raison de vivre; mon
frre Mohammed et ma sur Bouthana. Rien de tout ceci ne serait possible sans leurs sacrifices et
leurs encouragements.
ii
Remerciements
Jexprime mes remerciements et ma gratitude mon directeur de mmoire, Monsieur Ziet Lahcene
matre de confrences classe A lUniversit de Stif, pour laide et le soutien et les conseils quil
ma apports tout au long de ce travail.
Nos vifs remerciements vont aussi Monsieur Khellaf Abdelhafid professeur lUniversit de
Stif, pour avoir fait lhonneur de prsider le jury de ce mmoire et lintrt quil a apport ce
travail.
Nous tenons remercier Monsieur Belaala Hichem, matre de confrences classe B lUniversit
de Stif, pour avoir bien voulu faire partie du jury de ce mmoire.
iii
SOMMAIRE
Sommaire
INTRODUCTION GENERALE ...........................................................................VIII
Chapitre 01............................................................................................................................. 1
ETAT DE LART SUR LA BINARISATION ........................................................... 1
1.1. Introduction ......................................................................................................................................................... 1
1.2. Binarisation .......................................................................................................................................................... 1
1.2.1. Dfinition .................................................................................................................................................................. 1
1.2.2. Les mthodes de binarisation .......................................................................................................................... 1
1.2.3. Quelques mthodes de binarisation globale .............................................................................................. 2
1.2.4. Quelques mthodes de binarisation locale ................................................................................................. 6
Chapitre 02............................................................................................................................. 9
IMPLEMENTATION DES TECHNIQUES DE CALCUL DU SEUIL DE
BINARISATION ..................................................................................................... 9
2.1. Introduction ......................................................................................................................................................... 9
2.2. Seuillage global bas sur l'histogramme ................................................................................................... 9
2.2.1. Informations statiques de l'histogramme ................................................................................................... 9
2.2.2. Implmentation dune mthode simple de calcul du seuil.................................................................11
2.2.3. Implmentation de la technique ISODATA ...............................................................................................12
2.2.4. Implmentation du calcul du seuil par la mthode OTSU ..................................................................13
2.2.5. Implmentation de calcul du seuil par lentropie maximale .............................................................14
2.4. Rsultats des testes sur quelques images de vieux documents (base de donnes DIBCO) 17
2.4.1. Rsultats de la 1re image : ...............................................................................................................................18
2.4.2. Rsultats de la 2me image :..............................................................................................................................18
iv
SOMMAIRE
Chapitre 03.......................................................................................................................... 20
BINARISATION PAR LE LISSAGE ET LA DETECTION DE
CONTOURS .........................................................................................................20
3.1. Introduction .......................................................................................................................................................20
3.2. Lissage par l'algorithme de Golay-savitsky ...........................................................................................20
3.2.1. Dfinition du lissage ...........................................................................................................................................21
3.2.2. Lissage polynomial (Filtre de Savitsky-Golay) ........................................................................................21
3.2.3. Mthode des moindres carrs ........................................................................................................................21
3.2.4. Calcul des coefficients dun filtre unidimensionnel de Savitsky-Golay .........................................22
3.2.5. Estimation du fond .............................................................................................................................................23
3.2.6. Algorithme .............................................................................................................................................................23
Chapitre 04.......................................................................................................................... 31
OUTILS DE MESURE DES PERFORMANCES, TECHNIQUES
DEVALUATION ET TESTS ................................................................................31
4.1. Outils de mesure...............................................................................................................................................31
4.2. Rsultats ..............................................................................................................................................................32
4.3. Discussion ...........................................................................................................................................................36
4.4. Conclusion ..........................................................................................................................................................37
SOMMAIRE
vi
INTRODUCTION GENERALE
Symboles
: La moyenne
: Lcart type
:Application
: Incrmentation
: Dcrmentation
: Et
Ou
vii
INTRODUCTION GENERALE
INTRODUCTION GENERALE
Introduction (contexte et motivation)
Au sein de dveloppements forts de la science, on ne peut pas nier le rle de limage numrique, le
traitement dimages est considr comme une tape de base et indispensable dans toutes ces
applications et a suscit de nombreuses recherches.
La binarisation des images est gnralement effectue comme un prtraitement des diffrentes
applications lies lanalyse des images de documents, comme la reconnaissance optique de
caractres (OCR) et la recherche dimages de documents. La binarisation sert convertir une image
de document en niveaux de gris ou couleurs en une image de document binaire, dont linformation
davant-plan (textes, graphes, etc.) est en noir et larrire-plan en blanc.
Dans lanalyse dimages des documents anciens, la binarisation est toujours une des premires
tapes utilise avant ltape de traitement. Elle a donc une grande influence sur les performance des
tapes qui suivent et sur le rsultat final. Cest une technique importante dans les applications de
traitement dimages.
La binarisation est un problme classique mais trs considr. Cest vident quil nexiste pas
toujours une solution idale pour tous les cas de dgradations. Plusieurs solutions ont t proposes
pour rsoudre ce problme du plus gnral au plus particulier. Cependant, chaque mthode a ses
avantages et ses inconvnients.
Problme
Les images des documents anciens prsentent un aspect fortement dgrad, avec un fond non
uniforme, des pages dchires, froisss et/ou des tches dencre effaant partiellement lencre, plus
encore certains documents prsentent un impacte de reflet de la page du verso.
Les problmes de dgradation sur le plan visuel
On appelle un document ancien dgrad tous les documents qui contiennent des effets indsirables
cumuls nuisant la lisibilit, au traitement ou la conservation des images. Les dgradations ont
plusieurs origines et laccumulation des dfauts rend difficile leurs sparations. Les dgradations
ont des effets plus destructeurs sur les images de documents que sur toutes autres images dites
naturelles.
Le papier est un moyen de stockage fragile et phmre. Il est constitu par lessentiel de matriaux
viii
INTRODUCTION GENERALE
naturels ou organiques qui sont chimiquement peu stables, les ractions chimiques, qui peuvent
avoir lieu, peuvent provoquer des modifications irrversibles dans la structure des matriaux. Les
processus chimiques ont des chances de sintensifier avec laccroissement de la temprature,
lhumidit, la luminosit et la pollution atmosphrique. Toutes ces ractions chimiques peuvent se
traduire, dune part, par le jaunissement du papier, et de lautre, par une dcoloration de lencre et
des pigments. Les papiers minces de faible grammage sont sujets au phnomne de transvision
(lorsque limpression du verso est visible sur le recto). La transvision sexprime partir de la
mesure en termes de transparence et de pntration de lencre.
Une destruction complte du papier peut avoir lieu pour des ractions photochimiques au contact de
loxygne. Lutilisation des matriaux tels que la colle ou les feuilles de protection en contact direct
avec le support papier aide propager des substances nuisibles qui peuvent ainsi provoquer des
dommages.
Il y a aussi les dgradations biologiques des documents anciens qui sont causes par des organismes
vivants qui reprsentent les parasites de la civilisation. Les dommages dorigine biologique
diffrent des prcdents quant la leurs effets. Ils peuvent tre causs par diffrents agents: Les
micro-organismes (bactries, moisissures), Les insectes et Les rongeurs.
Lhomme peut contribuer la dgradation progressive du patrimoine documentaire. Outre les
dsastres invitables comme les accidents ou les guerres, certaines dgradations qui sont imputables
aux manques dans les rgles lmentaires de conservation, peuvent tre vites. Par manque de
moyens financiers, les bibliothcaires ne peuvent pas toujours investir dans des systmes de
climatisation pour rduire lhumidit. Certaines nont ni la scurit efficace contre les incendies ni
les alarmes appropries.
Toute manipulation physique, par les conservateurs eux-mmes, dtriore les documents fragiles.
Citons titre dexemple, le cas dun livre qui tombe par maladresse dun chariot en cours de
transport, un mauvais rangement des microfilms provoquant des rayures. En outre, les
bibliothcaires nhsitent pas apposer systmatiquement des tampons toutes les pages et mme
sur les parties crites les rendant ainsi illisibles.
Les problmes de dgradations sur le plan traitement
Dans notre dmarche, nous nous intressons ltape de traitement dimage et en particulier
lopration de binarisation. Le choix du seuil de binarisation est donc crucial. Des algorithmes de
binarisation seuils adaptatifs, conduisent des rsultats intressants, mais la qualit des images
binaires produites dpend du document orignal. Un document original dgrad aboutit gnralement
une image binaire de mauvaise qualit.
ix
INTRODUCTION GENERALE
La binarisation choue systmatiquement sur des documents faiblement contrasts, ou lorsque les
couleurs des encres et du papier ne sont pas uniformes. Les dgradations du support, comme
lapparition du verso par transparence sur le recto et la prsence de taches dhumidit, sont
conserves dans limage binaire. En outre, le bruit du capteur tant plus lev sur les zones de fortes
variations dintensit, la binarisation fait systmatiquement apparatre des irrgularits alatoires sur
les contours des caractres. Elle modifie la topologie des formes en fonction de la rsolution
limitant ainsi les possibilits de segmentation des caractres et des mots. Les images en couleur ou
en niveaux de gris sont beaucoup plus lisibles et plus facilement interprtables par une machine que
les images binaires, les niveaux de gris ou la couleur apportent une information supplmentaire qui
compense le manque de rsolution.
Objectif
Lobjectif global de ce travail est de trouver une mthode gnrale de binarisation permettant
damliorer la qualit de limage traite par cette opration et par consquent rduire le temps des
traitements qui suivent. En recherchant des solutions pour limage de documents anciens, nous
allons proposer une mthode automatique de binarisation simple et plus efficace qui spare, au
maximum possible, le fond de larrire-plan de limage de document.
Les objectifs spcifiques sont :
1-Etudier plusieurs algorithme de binarisation dans le but dvaluer leurs performances et dcrire
les avantages et les inconvnients de ces mthodes.
2-Dfinir un nouveau problme de binarisation et proposer une ou plusieurs solutions possibles.
3-chercher une mthode simple mais efficace pour limage de documents anciens afin de sparer
clairement le fond et lobjet. Autrement dit, il sagit de trouver une mthode de binarisation qui peut
dterminer automatiquement et efficacement le seuil pour chaque point de limage.
Structure du rapport
Ce rapport se compose de quatre parties. Je commence tout dabord par ltat de lart et quelques
dfinitions. La deuxime partie est consacre une prsentation gnrale des techniques de
binarisation dimages, tout en prsentant des brves descriptions de quelques mthodes. Une
analyse des rsultats par des mesures dvaluations est aborde avant de terminer ce rapport par des
conclusions.
CHAPITRE 01
ETAT DE LART
Chapitre 01
Nous dfinissons les pixels de lobjet, ceux ayant le niveau de gris infrieur s, et les pixels
de fond, ceux ayant le niveau de gris suprieur s.
(1.1)
1.2.2. Les mthodes de binarisation
Les mthodes de binarisation ont t classes selon les informations quelles exploitent, en six
catgories :
p. 1
CHAPITRE 01
mthodes spatiales,
mthodes locales.
ETAT DE LART
Selon plusieurs travaux de recherche [2] [3], les techniques de binarisation par seuillage dimages
en niveaux de gris peuvent tre classes en deux catgories :
-
Seuillage global : consistant partitionner limage en deux classes grce un seuil optimal
qui sera calcul partir dune mesure globale sur toute limage. Lhistogramme est une
mesure utilise le plus souvent dans les mthodes de seuillage. Dans ce cas, le seuil attendu
est celui qui distingue le plus possible les deux classes : fond et objet.
Seuillage local : o un seuil est calcul localement pour chaque pixel, se basant sur
linformation se trouvant dans son voisinage dfinie pralablement.
Un troisime groupe de mthodes hybrides [4] est ajout, ces mthodes combinent des
informations globales et locales pour attribuer les pixels lune des deux classes.
p. 2
CHAPITRE 01
ETAT DE LART
dans la figure (1.1). En effet, la plupart des images prsentent des histogrammes bruits caractriss
par des modes non discernables.
Figure 1.1. Allures idales dun histogramme. (a): unimodal, (b): bimodal et (c) multimodal
Soient
la variance interclasse et
(1.7)
et
dsignent respectivement les niveau de gris moyen des classes C1, C2 et de limage tels
que :
(1.8)
p. 3
CHAPITRE 01
ETAT DE LART
(1.9)
(1.10)
P1 et P2 reprsentent respectivement les probabilits priori des classes C1 et C2 tels que :
(1.11)
(1.12)
(1.13)
Cette mthode consiste maximiser la variance inter classe
grande possible).
plus
(1.15)
p. 4
CHAPITRE 01
ETAT DE LART
(1.17)
Aprs quelques simplifications mathmatiques lexpression de lerreur minimiser devient :
(1.18)
(1.20)
Les entropies de Shannon associes aux deux distributions sont :
(1.21)
(1.22)
Le seuil optimal
est alors dfini comme tant le niveau de gris qui maximise les deux entropies,
cest--dire que :
(1.23)
p. 5
CHAPITRE 01
ETAT DE LART
(b)
(c)
(d)
Figure 1.2. Illustration du seuillage adaptatif. (a) Image originale avec un fond non uniforme, (b)
Image binarise avec un seuil global, (c) Image originale dcoupe en sous images, (d) Image
segmente avec un seuillage adaptatif.
.
.
p. 6
CHAPITRE 01
ETAT DE LART
: Est un paramtre utilis pour dterminer le nombre des pixels des contours considrs comme
des pixels dobjet et il prend des valeurs ngatives. (k est fix 0.2 par les auteurs).
: Lcart type des valeurs de la fentre centre en
Cette mthode donne de bons rsultats car le seuil dpond du pixel et de linformation extraite
partir de son voisinage, mais nest pas efficace quant le fond nest pas uniforme, ce problme a
pouss Sauvola une mthode amliore.
p. 7
CHAPITRE 01
ETAT DE LART
(1.28)
Alors le voisinage consiste en une seule classe: fond ou bien texte.
1.3. Conclusion
Nous avons abord le problme de binarisation des anciens documents dgrads. Plusieurs
mthodes ont t proposes dans la littrature pour la binarisation des images de documents, mais
aucune dentre elles ne se dmarque des autres, surtout pour les images des anciens documents
possdants diffrents caractristiques de dgradation. Nous avons prsent un petit tat de lart sur
les mthodes de binarisation dimages de documents, les plus frquemment cites dans la littrature.
p. 8
CHAPITRE 02
IMPLEMENTATION
Chapitre 02
en niveau de gris de
pixels et
p. 9
CHAPITRE 02
IMPLEMENTATION
La valeur moyenne de tous les pixels dans l'image est dfinie par:
(2.2)
La variance sera:
(2.3)
La valeur moyenne et la variance peut tre simultanment calcule dans une seule itration par:
(2.4)
(2.5)
Avec:
(2.6)
(2.7)
(2.8)
(2.9)
Donc :
(2.10)
Pour chaque seuil q, les valeurs moyennes correspondant chaque partition C0 ou C1, peuvent tre
calcules partir de l'histogramme par:
p. 10
CHAPITRE 02
IMPLEMENTATION
(2.11)
(2.12)
(2.14)
(2.15)
(2.16)
p. 11
CHAPITRE 02
IMPLEMENTATION
p. 12
CHAPITRE 02
IMPLEMENTATION
et la variance
:
(2.20)
Puisque
puisque :
(2.21)
(2.22)
(2.23)
(2.24)
L'algorithme 2.3.reprsente une implmentation de calcul du seuil par la mthode Otsu, il suppose
une image en niveaux de gris avec un total de N pixels et niveaux d'intensit K.
Il est not que cet algorithme utilise une procdure qui permet de construire un tableau de
moyennes.
1: Seuil OTSU(h)
Entre: h : [0, K1] N, histogramme.
Sortie: la valeur du seuil optimal ou 1 si aucun seuil n'est trouv.
2: K Taille(h)
--nombre des niveaux d'intensit
3: (0, 1, N) construction table moyenne (h, K) --appel la procdure construction
table
4: 2bmax 0
5: qmax1
6: n0 0
7: pour q 0 K2
--vrification de toutes les valeurs possibles du
seuil
8: n0 n0+ h(q)
p. 13
CHAPITRE 02
9: n1 N n0
10: si (n0> 0) (n1>0) alors
11: 2b (1/N2) n0.n1. [0 (q)- 1(q)] 2
12: si 2b> 2bmax alors
13 : 2bmax 2b
14:
qmax q
15: retourne qmax
16: construction table moyenne (h, K)
17: n0 0, s0 0
18: pour q 0 K1
19: n0 n0 + h(q)
20: s0 s0 +q. h(q)
IMPLEMENTATION
-- maximisation de la variance
21:
22: N n0
23: n1 0 , s1 0
24:
25: pour q k-2 0
26: n0 n1 + h(q+1)
27: s1 s1 + (q+1). h(q+1)
28:
29: retourne
2.2.5. Implmentation de calcul du seuil par lentropie maximale
L'entropie de l'image a t utilise dans plusieurs mthodes comme critre de slection du seuil.
Dans lexemple suivant, nous allons prsenter la technique la plus rcente celle de Kapur.
Pour un seuil donn q (0<q<k-1), les distributions de la probabilit estime pour produire deux
classe C0 et C1 sont:
(2.25)
Avec :
(2.26)
p. 14
CHAPITRE 02
IMPLEMENTATION
(2.27)
p. 15
CHAPITRE 02
IMPLEMENTATION
p. 16
CHAPITRE 02
IMPLEMENTATION
(2.31)
Algorithme 2.6. Calcul des seuils locaux par la mthode de Niblack
1: Seuil Niblack(I, r, , d, bg )
Entre: I, Image de taille M N; r, rayon de la rgion; , paramtre de contrle de
la variance.
d, offset; bg, type du fond.
Sortie: une matrice qui dtermine le seuil pour chaque pixel.
2: (M, N) Taille(I)
4: Pour chaque pixel (u, v) M N
R construction des rgions (u, v, r)
5: (, 2) rcupration de la procdure calcule de la moyenne
et de la variance (I, u, v, r)
6: 2 calcule de lcart type
7:
8: retourne Q
9: calcule de moy et var (I, u, v, r)
Sortie calcule de la moyenne et de la variance au voisinage
10: R Construire des rgions (u, v, r)
11: N 0, A 0, B 0
12: pour chaque (i, j) R
13: N N +1
14: A A + I(i, j)
15: B B + I2(i, j)
16:
17:
18: retourne (, )
2.4. Rsultats des testes sur quelques images de vieux documents (base de
donnes DIBCO)
Dans cette partie du chapitre, nous allons prsenter quelques rsultats en appliquant les algorithmes
implments en Matlab.
Le choix c'est port sur plusieurs images de la base de donnes DIBCO avec ses versions 2009,
2010 et 2011.
Nous nous contentons de prsenter les tests sur deux types d'images:
-
p. 17
CHAPITRE 02
IMPLEMENTATION
ISODATA
Image originale
OTSU
BERNSEN
KITTLER
Figure 2.1.Rsultats de la binarisation en utilisant les mthodes classiques sur une image dgrade
par une luminosit uniforme
2.4.2. Rsultats de la 2me image :
Image originale
ISODATA
p. 18
CHAPITRE 02
IMPLEMENTATION
OTSU
BERNSEN
KITTLER
Figure 2.2. Rsultats de la binarisation en utilisant les mthodes classiques sur une image dgrade
par les taches
2.5. Conclusion
Daprs les rsultats de tests, les mthodes globales qui consiste chercher le seuil globale a partir
gnralement de lhistogramme, sont simples, rapides et ont un bon impact sur le fond (nettoient
bien le fond), mais trop sensibles la variation des intensits du fond et de lobjet, elles sont donc
non adaptes aux images fortement bruites : en fonction des conditions de saisie, stockage et
dutilisation, il sera impossible dobtenir une image de bonne qualit, donc le bruit va introduire une
certaine irrgularit dans la forme de lhistogramme surtout dans sa partie minimum local.
La mthode dOtsu par exemple cherche maximiser la variance intra-classe du texte et du
fond. Contrairement kittler, ils ne se basent pas sur l'histogramme mais sur une simple
statistique de l'image, daprs les rsultats obtenus pose des problmes les documents mal clairs.
Cependant, les mthodes locales, bases sur lestimation de la valeur du seuil en faisant la moyenne
de la plus haute et la plus basse valeur de la fentre, sont plus efficaces, plus complexes et
ncessitent des capacits de calcul plus importantes en fonction du choix de la taille de la fentre et
le centrage pour certaines techniques.
p. 19
CHAPITRE 03
Chapitre 03
p. 20
CHAPITRE 03
, la nouvelle
: reprsente le poids
n : le nombre de signaux
Donc le signal rsultant
et les signaux
p. 21
CHAPITRE 03
-m -m+1
de degr p pour
(3.2)
: reprsentent les coefficients du filtre et ils sont constants pour tout les points de lensemble
choisi.
Donc pour calculer ces coefficients on doit rsoudre lquation :
(3.3)
Ou :
La matrice X est gale :
(3.4)
p. 22
CHAPITRE 03
(3.8)
Se calcule indpendamment des donnes, du coup le calcule des coefficients du filtre de SavitskyGolay se fait par le produit scalaire dune ligne de la matrice C avec le vecteur colonne D.
Nous concluons que le calcule des coefficients du filtre de Savitsky-Golay se fait par lapplication
dun filtre linaire C sur lensemble des donnes D.
3.2.5. Estimation du fond
Dans cette tape, nous faisons lestimation du fond du document en utilisant un lissage polynomiale
qui a t utilis dans diffrentes application. Par exemple : Krzysztof et al [13] utilise le lissage
polynomial en 2 dimensions pour estimer le fond des empreintes digitales. Seeger [14] et al utilise
un lissage polynomial sur les rgions de texte.
Dans notre mthode, nous limplmentons dune manire diffrente. Nous commenons tout
dabord par calculer un seuil global pour faire une pr dtection du fond, puis nous choisissons la
taille dune fentre dans laquelle nous allons faire un lissage polynomial unidimensionnel
(largement plus rapide que le lissage 2 dimensions) et pour finir nous augmentons la taille de la
fentre aprs chaque lissage complet du fond du document jusqu' ce quelle soit gale aux
dimensions de limage pour ainsi pouvoir suivre les variations dans limage avec prcision.
3.2.6. Algorithme
p. 23
CHAPITRE 03
et la rapidit du filtre de lissage nous faisons une rduction de la dynamique des pixels de la faon
suivante :
(3.10)
c. valuer lerreur entre les valeurs estimes et les valeurs originales et si elle est suprieure un
seuil prdfinie on enlve le pixel avec lerreur maximale du vecteur D.
d. Augmenter le degr du polynme et on applique le filtre au reste des points.
e. Rpter les tapes c et d jusqu ce que lerreur maximale soit infrieure au seuil.
p. 24
CHAPITRE 03
efficace.
Par contre pour le cas des images dgrades, la non homognit de la luminosit et les taches
causent des erreurs dans la dtection. Par exemple, on ne peut pas dtecter quelques contours dans
les zones sombres ou bien la dtection de faux contours cause des changements brusques dans le
fond causs par le bruit. La dtection des contours est une technique qui est beaucoup utilis dans la
binarisation comme dans le cas de la mthode de Su [15].
Dans la mthode dveloppe nous faisons la dtection en utilisant le gradient.
3.3.1. Ajustement du contraste
Le texte ou lobjet du document peut tre extrait grce aux variations locales dtectes, ceci devient
plus facile aprs un ajustement des variations globales du contraste de limage causes par les
dgradations.
Pour faire cet ajustement, nous utilisons le fond estim lors de la partie prcdente comme suit :
(3.11)
Ou :
C : cest une constante pour contrler la luminosit de limage, dans notre systme on la remplace
par la mdiane de limage quon est entrain dtudier.
BG : reprsente le fond estim de limage.
Ainsi les variations du contraste dans limage causes par les dgradations seront ajustes grce au
coefficient
, de faon ce que ce coefficient sera grand dans les zones sombres et faible dans
p. 25
CHAPITRE 03
(3.12)
(3.13)
Puis pour pouvoir dtecter les zones ou il ya plus de changement sur lintensit des pixels on fait la
somme des deux on aura :
(3.14)
Ainsi les zones ou la valeur du gradient V est grand (zones blanches) seront considres comme des
contours de texte conformment la figure suivante :
Lhistogramme de limage gnre par la somme des gradients vertical et horizontale est reprsent
si dessous :
p. 26
CHAPITRE 03
rduite que celle des pixels qui font partie des contours, nous pouvons donc extraire ces contours
grce une mthode classique de seuillage dhistogramme comme celle dcrite dans la mthode
dOtsu.
La figure suivante reprsente le rsultat du seuillage :
son intensit soit inferieur ou gale la moyenne des intensits des pixels qui lentoure.
p. 27
CHAPITRE 03
le parcourt ligne par ligne de limage des contours puis le calcul de la distance entre les
bords de chaque contour.
Nombre de pixels
Figure 3.5. Histogramme qui reprsente la frquence dapparition des distances entre les bords de
contour pour notre image
Daprs lhistogramme ci-dessus on remarque que la distance qui apparait le plus frquemment
cest 2 donc la taille de notre fentre ainsi que
valeur.
Aprs quelques tests, nous remarquons que les rsultats de la binarisation changent peu lorsque la
taille de le fentre change entre 2 et 4 fois la largeur des contours, donc on choisit une fentre de
taille 8 et
p. 28
CHAPITRE 03
p. 29
CHAPITRE 03
3.6. Conclusion
Lalgorithme propos permet destimer le fond dun document dgrad, en faisant un lissage
polynomial itratif et progressif. Cette dmarche nous permet de suivre les variations de limage
avec prcision, diminuant ainsi le bruit et les dgradations. Lutilisation dun fond estim amliore
considrablement lopration de dtection des contours. Lextraction du texte devient alors plus
efficace et prcise. Ltape de poste-traitement corrige quelques erreurs pargnes par les tapes
prcdentes.
p. 30
CHAPITRE 4
TESTS ET EVALUATION
Chapitre 04
OUTILS DE MESURE DES PERFORMANCES,
TECHNIQUES DEVALUATION ET TESTS
4.1. Outils de mesure
Pour valider une mthode dans le domaine de la binarisation, plusieurs techniques, ''outils de
mesure'' sont utilises par les chercheurs, ces techniques sont dcrites dans plusieurs documents de
la littrature. La plus part des chercheurs utilisent '' Recall- and Precision-Based Metrics'' pour
comparer leurs travaux.
Dans ce projet, nous avons utilis en plus de la FM (F-Measure) : dduction directe du Recall et
Precision, le PSNR (Pick Signal-to-Noise Ration), NRM (Negative Rate Metric), et la MPM
(Misclassification Penalty Metric).
Ces tests ont t oprs sur les images de la base de donnes DIBCO-2009 dont le choix est pris
pour des raisons comparatives.
-La FM mesure est la capacit de lalgorithme rcuprer les pixels de lobjet, elle est dfinit
comme suit :
(4.1)
Ou :
RC (Recall): le rapport entre le nombre des pixels rcuprs de lobjet sur le nombre total des pixels
de lobjet sur limage rfrence.
PR (Precision):le rapport entre le nombre des pixels rcuprs de lobjet sur le nombre total des
pixels rcuprs.
-Le PSNR (Pick Signal-to-Noise Ratio) mesure la ressemblance entre limage rfrence et limage
binarise, il est dfinie par :
(4.2)
p. 31
CHAPITRE 4
TESTS ET EVALUATION
Ou :
MSE (Mean Square Error): lerreur quadratique moyenne.
C : reprsente une constante, elle est prise gale 255 dans le cas des images niveau de gris.
-La NRM (Negative Rate Metric) mesure le taux de dcalage des pixels entre limage rfrence et
limage binarise. Elle est dfinit par :
(4.3)
Ou :
FN (False Negatives): les pixels de lobjet qui se trouvent limage de rfrence et pas limage
binaris.
FP (False Positives):les pixels qui font pas parties de lobjet dans limage de rfrence mais ils sont
dtects comme des pixels de lobjet dans limage binarise.
TN (True Negatives):les pixels qui font pas partie de lobjet dans limage de rfrence et celle
binaries.
TP (True Positives): les pixels qui font partie de lobjet dans limage de rfrence et celle binarise.
-La MPM (Misclassification Penalty Metric) mesure la capacit de lalgorithme dtecter les
contours de lobjet, plus sa valeur est petite plus lalgorithme est performant, elle est dfinit par :
(4.4)
Ou :
: La distance entre un FN et le contour.
: La distance entre un FP et le contour.
D : Cest un facteur de normalisation.
4.2. Rsultats
Le Tableau 4.1. Donne les rsultats obtenus des mesures de performances avec les mthodes
dotsu, Niblack, Sauvola, Gatos, Su et la mthode utilise sur la base de donnes DIBCO 2009
p. 32
CHAPITRE 4
TESTS ET EVALUATION
Mthodes
) MPM (
Otsu
78.72
15.34
5.77
13.3
Niblack
55.82
9.89
16.40
61.6
Sauvola
85.41
16.39
6.94
3.2
Gatos
85.25
16.50
10
0.7
Su
91.06
18.50
7
0.3
Mthode utilise 91.24
18.66
4.31
0.5
Tableau 4.1. Tableau rcupratif des mesures de performances
D'aprs ces rsultats, nous remarquons que la mthode dveloppe donne les meilleures
performances (FM et PSNR largement suprieurs, NRM et MPM ngligeables).
Nous affirmons donc, que cette approche est prcise et prserve surtout trs bien les contours.
Les figures suivantes donnent quatre exemples d'images sur lesquelles sont appliques les mthodes
cites dans le tableau 4.1 :
(a)
(b)
(c)
(d)
(e)
(f)
(g)
Figure 4.1. Les rsultats de la binarisation dun document dgrad par saignement (bleedingthrough) (a) en utilisant la mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la
mthode que nous avons dvelopp (g)
(a)
p. 33
CHAPITRE 4
TESTS ET EVALUATION
(b)
(c)
(d)
(e)
(f)
(g)
Figure 4.2. Les rsultats de la binarisation dun document dgrad par les taches (a) en utilisant la
mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que nous avons
dvelopp (g)
(a)
(b)
(c)
(d)
(e)
p. 34
CHAPITRE 4
TESTS ET EVALUATION
(f)
(g)
Figure 4.3. Les rsultats de la binarisation dun document dgrad par la variation du contraste (a)
en utilisant la mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que
nous avons dvelopp (g)
(a)
(b)
(f)
(g)
(c)
(d)
(e)
Figure 4.4. Les rsultats de la binarisation dun document dgrad par une luminosit uniforme (a)
en utilisant la mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que
nous avons dvelopp (g)
p. 35
CHAPITRE 4
TESTS ET EVALUATION
4.3. Discussion
Dans le chapitre 3, nous avons mentionn que la mthode utilise fait appel beaucoup de
paramtre surtout dans la partie du lissage de fond, d'aprs les tests exprimentaux, nous avons
constat que les performances du lissage changent lgrement lorsque le degr initial du polynme
est pris entre 3 et 6 donc automatiquement le choix de la taille de la fentre doit tre suprieur
, avec un seuil destimation infrieur 20 puisque gnralement lintensit entre le fond et le
texte est largement suprieur cette valeur.
Dans la partie de lextraction du texte, nous faisons appel aussi des paramtres comme la taille
de la fentre de dtection et le nombre minimum de pixels de bord de contours dans cette fentre.
Pour notre cas nous avons utilis une fentre de taille double la largeur des contours et un nombre
de pixels gale cette largeur pour estimer d'une manire efficace les pixels sans ngliger ceux qui
se trouvent lintrieur des contours.
La constatation essentielle que nous tirons est que les bonnes performances de cette mthode sont
dues plusieurs facteurs:
-
En premier, la mthode utilise un fond estim pour attnuer le bruit et pour surtout ajuster le
contraste uniforme dans limage qui est caus par les dgradations, cette estimation du fond
amliore la dtection des contours, et surtout son utilit dans le post-traitement pour
supprimer les lments qui ne font pas partie du texte. Comparativement la technique
dOtsu qui ncessite un histogramme bimodal et ainsi ne peut pas binariser correctement les
documents dgrad cause du bruit dans le fond comme montr dans les figures. 4.2, 4.3.
En mme temps les techniques de binarisation locales comme celle de Niblack et Sauvola
peuvent dans la plupart des cas introduire un bruit ou une mauvaise dtection des caractres
cause dun contraste bas dans les zones du texte comme indiqu sur les figures. 4.1, 4.2,
4.3, 4.4.
En second, lextraction du texte se fait grce aux contours : donc les rgions sans contours
ne seront pas traites ce qui entraine une fausse dtection des pixels du fond, cas de la
mthode dOtsu, figures.4.2, 4.3, 4.4.
La limite de cette mthode rside dans son incapacit faire la diffrence dans le cas ou un bloc de
p. 36
CHAPITRE 4
TESTS ET EVALUATION
pixels ayant une intensit suprieur ou gale celle du texte et nappartenant pas au texte.
Cette technique et conu pour la binarisation des documents scanns, donc si le traitement se fait
sur une image pris par un autre outil de capture et que celle si est courb ce qui va provoquer une
dtection fausse des contours et ainsi la dgradation des performances de la binarisation.
4.4. Conclusion
Cette mthode de binarisation utilise lestimation du fond et la dtection des contours.
Nous commenons par un filtrage itratif et progressif pour une estimation plus efficace, puis nous
faisons appel une opration de dtection de contours du texte grce une image estim et ajust
au niveau du contraste, ce qui permet une dtection correcte des variations.
Avec limage estime par filtrage contours dtectes, lextraction du texte est par la suite ralise.
A la fin des oprations de post-traitement sont appliques pour corriger quelques erreurs dues la
binarisation. Nos testes et rsultats ont montrs que cette mthode est plus performante que les
mthodes bases sur l'analyse de l'histogramme.
p. 37
p. 38
REFERENCES BIBLIOGRAPHIQUES
Rfrences Bibliographiques
[1]
Lu S, Su B, Tan C. Document image binarization using background estimation and stroke edges.
International Journal on Document Analysis and Recognition (IJDAR), October. 2010, pp. 13.
[2]
[3]
[4]
N. Otsu, A threshold selection method from gray-level histogram, IEEE Transactions on System
Man Cybernetics, Vol. SMC-9, No. 1, pp. 62-66, 1979.
[5]
Kittler, J., Illingworth, J. and Fglein, J., Threshold Selection Based on a Simple image Statistic,
Computer Vision, Graphics and Image Processing, pp. 30, 125147, 1985.
[6]
J.N. Kapur, P.K. Sahoo, A.K.C. Wong, A New method for gray-level picture threshold using the
entropy of the histogram, Computer Vision, Graphics, and Image Processing, 29, pp. 273-285, 1985.
[7]
F.R.D. Velasco, Thresholding using the ISODATA clustering algorithm, IEEE Transaction on
system, Man and Cybernitics, 10, pp. 771-774, 1980.
[8]
W.Niblack, An Introduction to Digital Image Processing. Prentice Hall, Englewood Cliffs, (1986).
[9]
[10] C. Wolf, J. M. Jolion, and F. Chassaing. Extraction de texte dans des vidos : le cas de la
binarisation , In 13me Congrs Francophone de Reconnaissance des Formes et Intelligence
Artificielle, pp. 145-152, 2002.
[11] Bernsen J., Dynamic thresholding of grey-level images, Proceedings 8th International Conference
on Pattern Recognition, Paris, pp. 1251-1255, 1986.
[12] B. Gatos, K. Ntirogiannis, and I. Pratikakis, ICDAR 2009 document image binarization contest
(DIBCO 2009), in Proc. 10th ICDAR, pp. 13751382, Jul. 2009.
[13] Krzysztof, M.P.M.,Axel, M.,Dynamic threshold using polynomial surface regression with application
to the binarization of fingerprints.Proceedings of the SPIE, vol. 5779.
[14] Seeger,M., Dance, C., Binarising camera images for ocr. Proceedings of International Conference on
Document Analysis and Recognition, pp. 5458 (2001).
[15] Su, B., Lu, S., Tan, C.L.: Binarization of historical handwritten document images using local
maximum and minimum filter. International Workshop on Document Analysis Systems,
pp. 159165. June 2010.
[16] Burger W, Burge M. Principles Of Digital Image Processing, London, Springer, 2013, pp. 329.
[17] Chaki N., Shaikh S., Saeed K., Exploring Image Binarization Techniques, India, Springer, 2014,
pp. 560.
p. 39
.
.
.
. .
.
. :
Rsum :
La binarisation est une tape importante dans tout processus de traitement et danalyse
dimages. Plusieurs techniques de binarisation ont t proposes dans la littrature, dont chacune est
approprie un type particulier dimages, par exemple dans le cas de la binarisation danciens
manuscrits. Ces derniers sont connus pour leur mauvaise qualit due aux diffrentes dtriorations
subies au cours du cycle de vie du document et les dispositions jusque-l employes pour leur
sauvegarde. Ce rapport prsente un dbut dune tude comparative entre quelques techniques de
binarisation. Dans cette premire phase nous avons tudi, implment et test plusieurs algorithmes
sur des images danciens manuscrites. Lobjectif tant moyen terme de faire une tude
comparative et pouvoir slectionner par la suite le meilleur algorithme de binarisation.
Mots Cls : seuillage,
Abstract:
Binarization is an important step in image processing. Several binarization techniques have been
proposed in the literature, each of which is appropriate to a particular type of images, for example
the case of the binarization old manuscripts. They are known for their poor quality due to different
damage sustained during the document life cycle and provisions previously employed to safeguard
them. This report presents a beginning of a comparative study of some technics of binarization. In
this first phase we studied, implemented and tested several algorithms on old handwritten images.
The objective is to make a comparative study and subsequently be able to select the best
binarization algorithm.
Key Words: thresholding,