Вы находитесь на странице: 1из 50

MINISTERE DE LENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE

UNIVERSITE FERHAT ABBAS -SETIF


Facult de Technologie

Dpartement de llectronique

Mmoire de Master
No. Rf. : 521/2151

Prsent au Dpartement de llectronique


Domaine : Sciences et Technologie
Filire
: Electronique
Spcialit : Rseaux et Systmes de
Tlcommunication
Ralis par :
M. BENMAHIDDINE SOFIENE
Thme

Implmentation des techniques de binarisation dimage.


Application aux vieux documents
Soutenu le 16/06/2015 devant la commission dexamen compose de :
M. Khellaf Abdelhafid

Professeur lUniversit de Stif

Prsident

M. Ziet Lahcene

M.C.A lUniversit de Stif

Directeur du Mmoire

M. Belaala Hichem

M.C.B lUniversit de Stif

Examinateur

Ddicaces
Ce mmoire est ddi ma famille: ma mre, mon pre, dont la fiert est ma raison de vivre; mon
frre Mohammed et ma sur Bouthana. Rien de tout ceci ne serait possible sans leurs sacrifices et
leurs encouragements.

ii

Remerciements
Jexprime mes remerciements et ma gratitude mon directeur de mmoire, Monsieur Ziet Lahcene
matre de confrences classe A lUniversit de Stif, pour laide et le soutien et les conseils quil
ma apports tout au long de ce travail.
Nos vifs remerciements vont aussi Monsieur Khellaf Abdelhafid professeur lUniversit de
Stif, pour avoir fait lhonneur de prsider le jury de ce mmoire et lintrt quil a apport ce
travail.
Nous tenons remercier Monsieur Belaala Hichem, matre de confrences classe B lUniversit
de Stif, pour avoir bien voulu faire partie du jury de ce mmoire.

iii

SOMMAIRE

Sommaire
INTRODUCTION GENERALE ...........................................................................VIII
Chapitre 01............................................................................................................................. 1
ETAT DE LART SUR LA BINARISATION ........................................................... 1
1.1. Introduction ......................................................................................................................................................... 1
1.2. Binarisation .......................................................................................................................................................... 1
1.2.1. Dfinition .................................................................................................................................................................. 1
1.2.2. Les mthodes de binarisation .......................................................................................................................... 1
1.2.3. Quelques mthodes de binarisation globale .............................................................................................. 2
1.2.4. Quelques mthodes de binarisation locale ................................................................................................. 6

1.3. Conclusion ............................................................................................................................................................ 8

Chapitre 02............................................................................................................................. 9
IMPLEMENTATION DES TECHNIQUES DE CALCUL DU SEUIL DE
BINARISATION ..................................................................................................... 9
2.1. Introduction ......................................................................................................................................................... 9
2.2. Seuillage global bas sur l'histogramme ................................................................................................... 9
2.2.1. Informations statiques de l'histogramme ................................................................................................... 9
2.2.2. Implmentation dune mthode simple de calcul du seuil.................................................................11
2.2.3. Implmentation de la technique ISODATA ...............................................................................................12
2.2.4. Implmentation du calcul du seuil par la mthode OTSU ..................................................................13
2.2.5. Implmentation de calcul du seuil par lentropie maximale .............................................................14

2.3. Seuillage local adaptif .....................................................................................................................................16


2.3.1. Mthode de Bernsen ..........................................................................................................................................16
2.3.2. Mthode de Niblack ............................................................................................................................................16

2.4. Rsultats des testes sur quelques images de vieux documents (base de donnes DIBCO) 17
2.4.1. Rsultats de la 1re image : ...............................................................................................................................18
2.4.2. Rsultats de la 2me image :..............................................................................................................................18

2.5. Conclusion ..........................................................................................................................................................19

iv

SOMMAIRE

Chapitre 03.......................................................................................................................... 20
BINARISATION PAR LE LISSAGE ET LA DETECTION DE
CONTOURS .........................................................................................................20
3.1. Introduction .......................................................................................................................................................20
3.2. Lissage par l'algorithme de Golay-savitsky ...........................................................................................20
3.2.1. Dfinition du lissage ...........................................................................................................................................21
3.2.2. Lissage polynomial (Filtre de Savitsky-Golay) ........................................................................................21
3.2.3. Mthode des moindres carrs ........................................................................................................................21
3.2.4. Calcul des coefficients dun filtre unidimensionnel de Savitsky-Golay .........................................22
3.2.5. Estimation du fond .............................................................................................................................................23
3.2.6. Algorithme .............................................................................................................................................................23

3.3. Traitement du texte par dtection de contours en utilisant le gradient ....................................24


3.3.1. Ajustement du contraste ..................................................................................................................................25
3.3.2. Calcul du gradient ...............................................................................................................................................25
3.3.3. Extraction des contours ....................................................................................................................................26

3.4. Extraction du texte ..........................................................................................................................................27


3.5. Post-traitement .................................................................................................................................................29
3.6. Conclusion ..........................................................................................................................................................30

Chapitre 04.......................................................................................................................... 31
OUTILS DE MESURE DES PERFORMANCES, TECHNIQUES
DEVALUATION ET TESTS ................................................................................31
4.1. Outils de mesure...............................................................................................................................................31
4.2. Rsultats ..............................................................................................................................................................32
4.3. Discussion ...........................................................................................................................................................36
4.4. Conclusion ..........................................................................................................................................................37

CONCLUSIONS GENERALES ET PERSPECTIVES ...........................................38

SOMMAIRE

Liste des figures


Figure 1.1. Allures idales dun histogramme. (a): unimodal, (b): bimodal et (c) multimodal ......................... 3
Figure1.2. Illustration du seuillage adaptatif. (a) Image originale avec un fond non uniforme, (b) .................. 6
Figure 2.1. Rsultats de la binarisation en utilisant les mthodes classiques sur une image dgrade par une
luminosit uniforme ................................................................................................................................. 18
Figure 2.2. Rsultats de la binarisation en utilisant les mthodes classiques sur une image dgrade par les
taches ....................................................................................................................................................... 19
Figure 3.1. Limage estime .......................................................................................................................... 25
Figure 3.4. Histogramme de limage V ............................................................................................................ 26
Figure 3.3. Limage gradient V ........................................................................................................................ 26
Figure 3.5. Image binarise des contours (Rsultat aprs Otsu) ...................................................................... 27
Figure 3.6. Histogramme qui reprsente la frquence dapparition des distances entre les bords de contour
pour notre image ...................................................................................................................................... 28
Figure 3.9. Reprsentation des dformations sur les blocs de pixels : ............................................................. 29
Figure 3.7. Le rsultat de la binarisation .......................................................................................................... 29
Figure 3.10. Limage finale obtenue aprs le post-traitement .......................................................................... 29
Figure 4.1. Les rsultats de la binarisation dun document dgrad par saignement (bleeding-through) (a) en
utilisant la mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que nous
avons dvelopp (g) ................................................................................................................................. 33
Figure 4.2. Les rsultats de la binarisation dun document dgrad par les taches (a) en utilisant la mthode
dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que nous avons dvelopp (g) .... 34
Figure 4.3. Les rsultats de la binarisation dun document dgrad par la variation du contraste (a) en
utilisant la mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que nous
avons dvelopp (g) ................................................................................................................................. 35
Figure 4.4. Les rsultats de la binarisation dun document dgrad par une luminosit uniforme (a) en
utilisant la mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que nous
avons dvelopp (g) ................................................................................................................................. 35

vi

INTRODUCTION GENERALE

Listes des Acronymes et Symboles


Acronymes
OCR : Optical Character Recognition
ISODATA : Iterative Self-Organizing Data Analysis Technique Algorithm
FM : F-Measure
PSNR : Pick Signal-to-Noise Ration
NRM : Negative Rate Metric
FN : False Positives
FP : False Negatives
TN : True Positives
TP : True Negatives
MPM : Misclassification Penalty Metric

Symboles
: La moyenne
: Lcart type
:Application
: Incrmentation
: Dcrmentation
: Et
Ou

vii

INTRODUCTION GENERALE

INTRODUCTION GENERALE
Introduction (contexte et motivation)
Au sein de dveloppements forts de la science, on ne peut pas nier le rle de limage numrique, le
traitement dimages est considr comme une tape de base et indispensable dans toutes ces
applications et a suscit de nombreuses recherches.
La binarisation des images est gnralement effectue comme un prtraitement des diffrentes
applications lies lanalyse des images de documents, comme la reconnaissance optique de
caractres (OCR) et la recherche dimages de documents. La binarisation sert convertir une image
de document en niveaux de gris ou couleurs en une image de document binaire, dont linformation
davant-plan (textes, graphes, etc.) est en noir et larrire-plan en blanc.
Dans lanalyse dimages des documents anciens, la binarisation est toujours une des premires
tapes utilise avant ltape de traitement. Elle a donc une grande influence sur les performance des
tapes qui suivent et sur le rsultat final. Cest une technique importante dans les applications de
traitement dimages.
La binarisation est un problme classique mais trs considr. Cest vident quil nexiste pas
toujours une solution idale pour tous les cas de dgradations. Plusieurs solutions ont t proposes
pour rsoudre ce problme du plus gnral au plus particulier. Cependant, chaque mthode a ses
avantages et ses inconvnients.
Problme
Les images des documents anciens prsentent un aspect fortement dgrad, avec un fond non
uniforme, des pages dchires, froisss et/ou des tches dencre effaant partiellement lencre, plus
encore certains documents prsentent un impacte de reflet de la page du verso.
Les problmes de dgradation sur le plan visuel
On appelle un document ancien dgrad tous les documents qui contiennent des effets indsirables
cumuls nuisant la lisibilit, au traitement ou la conservation des images. Les dgradations ont
plusieurs origines et laccumulation des dfauts rend difficile leurs sparations. Les dgradations
ont des effets plus destructeurs sur les images de documents que sur toutes autres images dites
naturelles.
Le papier est un moyen de stockage fragile et phmre. Il est constitu par lessentiel de matriaux
viii

INTRODUCTION GENERALE

naturels ou organiques qui sont chimiquement peu stables, les ractions chimiques, qui peuvent
avoir lieu, peuvent provoquer des modifications irrversibles dans la structure des matriaux. Les
processus chimiques ont des chances de sintensifier avec laccroissement de la temprature,
lhumidit, la luminosit et la pollution atmosphrique. Toutes ces ractions chimiques peuvent se
traduire, dune part, par le jaunissement du papier, et de lautre, par une dcoloration de lencre et
des pigments. Les papiers minces de faible grammage sont sujets au phnomne de transvision
(lorsque limpression du verso est visible sur le recto). La transvision sexprime partir de la
mesure en termes de transparence et de pntration de lencre.
Une destruction complte du papier peut avoir lieu pour des ractions photochimiques au contact de
loxygne. Lutilisation des matriaux tels que la colle ou les feuilles de protection en contact direct
avec le support papier aide propager des substances nuisibles qui peuvent ainsi provoquer des
dommages.
Il y a aussi les dgradations biologiques des documents anciens qui sont causes par des organismes
vivants qui reprsentent les parasites de la civilisation. Les dommages dorigine biologique
diffrent des prcdents quant la leurs effets. Ils peuvent tre causs par diffrents agents: Les
micro-organismes (bactries, moisissures), Les insectes et Les rongeurs.
Lhomme peut contribuer la dgradation progressive du patrimoine documentaire. Outre les
dsastres invitables comme les accidents ou les guerres, certaines dgradations qui sont imputables
aux manques dans les rgles lmentaires de conservation, peuvent tre vites. Par manque de
moyens financiers, les bibliothcaires ne peuvent pas toujours investir dans des systmes de
climatisation pour rduire lhumidit. Certaines nont ni la scurit efficace contre les incendies ni
les alarmes appropries.
Toute manipulation physique, par les conservateurs eux-mmes, dtriore les documents fragiles.
Citons titre dexemple, le cas dun livre qui tombe par maladresse dun chariot en cours de
transport, un mauvais rangement des microfilms provoquant des rayures. En outre, les
bibliothcaires nhsitent pas apposer systmatiquement des tampons toutes les pages et mme
sur les parties crites les rendant ainsi illisibles.
Les problmes de dgradations sur le plan traitement
Dans notre dmarche, nous nous intressons ltape de traitement dimage et en particulier
lopration de binarisation. Le choix du seuil de binarisation est donc crucial. Des algorithmes de
binarisation seuils adaptatifs, conduisent des rsultats intressants, mais la qualit des images
binaires produites dpend du document orignal. Un document original dgrad aboutit gnralement
une image binaire de mauvaise qualit.
ix

INTRODUCTION GENERALE

La binarisation choue systmatiquement sur des documents faiblement contrasts, ou lorsque les
couleurs des encres et du papier ne sont pas uniformes. Les dgradations du support, comme
lapparition du verso par transparence sur le recto et la prsence de taches dhumidit, sont
conserves dans limage binaire. En outre, le bruit du capteur tant plus lev sur les zones de fortes
variations dintensit, la binarisation fait systmatiquement apparatre des irrgularits alatoires sur
les contours des caractres. Elle modifie la topologie des formes en fonction de la rsolution
limitant ainsi les possibilits de segmentation des caractres et des mots. Les images en couleur ou
en niveaux de gris sont beaucoup plus lisibles et plus facilement interprtables par une machine que
les images binaires, les niveaux de gris ou la couleur apportent une information supplmentaire qui
compense le manque de rsolution.
Objectif
Lobjectif global de ce travail est de trouver une mthode gnrale de binarisation permettant
damliorer la qualit de limage traite par cette opration et par consquent rduire le temps des
traitements qui suivent. En recherchant des solutions pour limage de documents anciens, nous
allons proposer une mthode automatique de binarisation simple et plus efficace qui spare, au
maximum possible, le fond de larrire-plan de limage de document.
Les objectifs spcifiques sont :
1-Etudier plusieurs algorithme de binarisation dans le but dvaluer leurs performances et dcrire
les avantages et les inconvnients de ces mthodes.
2-Dfinir un nouveau problme de binarisation et proposer une ou plusieurs solutions possibles.
3-chercher une mthode simple mais efficace pour limage de documents anciens afin de sparer
clairement le fond et lobjet. Autrement dit, il sagit de trouver une mthode de binarisation qui peut
dterminer automatiquement et efficacement le seuil pour chaque point de limage.
Structure du rapport
Ce rapport se compose de quatre parties. Je commence tout dabord par ltat de lart et quelques
dfinitions. La deuxime partie est consacre une prsentation gnrale des techniques de
binarisation dimages, tout en prsentant des brves descriptions de quelques mthodes. Une
analyse des rsultats par des mesures dvaluations est aborde avant de terminer ce rapport par des
conclusions.

CHAPITRE 01

ETAT DE LART

Chapitre 01

ETAT DE LART SUR LA BINARISATION


1.1. Introduction
Notre problmatique de seuillage s'inscrit dans le contexte gnral du traitement de
documents anciens.
Dans cette partie du rapport, nous prsenterons les diffrents types de binarisation cits dans la
littrature. Nous nous intressons dans cette tude la binarisation des documents en niveaux de
gris, puisque la plupart des documents en couleurs, peuvent tre convertis fidlement en niveaux de
gris.
1.2. Binarisation
1.2.1. Dfinition
La binarisation est une opration de prtraitement dimages qui sert convertir une image en
couleur ou niveau de gris en une image binaire, o lavant plan est en couleur noir et larrire plan
en blanc (ou linverse). La binarisation peut se faire par plusieurs techniques, telles que le seuillage,
classification, etc. Elle reprsente donc un outil trs utilis dans la segmentation dimages pour
extraire des objets de leurs fonds en fonction dun certain seuil.
Techniquement parlant, soit une image I de taille (M (hauteur) x N (largeur)), I(x, y) la valeur
reprsentant le niveau de gris du pixel au point de coordonnes (x, y).
tant donn un seuil s :
-

Nous dfinissons les pixels de lobjet, ceux ayant le niveau de gris infrieur s, et les pixels
de fond, ceux ayant le niveau de gris suprieur s.

Donc, limage binarise g est dtermine comme suit :

(1.1)
1.2.2. Les mthodes de binarisation
Les mthodes de binarisation ont t classes selon les informations quelles exploitent, en six
catgories :

p. 1

CHAPITRE 01

mthodes bases sur la forme de lhistogramme de limage,

mthodes bases sur le regroupement,

mthodes bases sur lentropie,

mthodes bases sur les attributs dobjet,

mthodes spatiales,

mthodes locales.

ETAT DE LART

Selon plusieurs travaux de recherche [2] [3], les techniques de binarisation par seuillage dimages
en niveaux de gris peuvent tre classes en deux catgories :
-

Seuillage global : consistant partitionner limage en deux classes grce un seuil optimal
qui sera calcul partir dune mesure globale sur toute limage. Lhistogramme est une
mesure utilise le plus souvent dans les mthodes de seuillage. Dans ce cas, le seuil attendu
est celui qui distingue le plus possible les deux classes : fond et objet.

Seuillage local : o un seuil est calcul localement pour chaque pixel, se basant sur
linformation se trouvant dans son voisinage dfinie pralablement.

Un troisime groupe de mthodes hybrides [4] est ajout, ces mthodes combinent des
informations globales et locales pour attribuer les pixels lune des deux classes.

1.2.3. Quelques mthodes de binarisation globale


Les mthodes de seuillage globale reposent sur lexploitation de lhistogramme de toute limage.
Lhistogramme est une courbe monodimensionnelle qui caractrise la distribution des niveaux de
gris, il est dcrit par une fonction mono-variable discrte hiou piqui reprsente
respectivement la frquence ou la probabilit dapparition du niveau de gris i, tel que :
(1.2)
h(i) tant le nombre de pixels ayant le niveau de gris i et N le nombre total de pixels dans limage.
A partir de lallure de lhistogramme, on peut dduire le nombre de classes ainsi que la position
relative des seuils. Lhistogramme est uni-modal, sil est form dun seul pic reprsentant les pixels
de lobjet ou ceux du fond. Il est bimodal sil est caractris par deux modes spars par une valle,
il indique lexistence dun objet sur un fond.
Lhistogramme multimodal comporte plus de deux modes spars par des valles, il indique la
prsence de plusieurs classes dans limage (chaque mode correspond une classe). Les seuils
doivent tre localiss dans les valles.
En pratique, il est rare de trouver un histogramme qui prsente des modes bien distincts comme

p. 2

CHAPITRE 01

ETAT DE LART

dans la figure (1.1). En effet, la plupart des images prsentent des histogrammes bruits caractriss
par des modes non discernables.

Figure 1.1. Allures idales dun histogramme. (a): unimodal, (b): bimodal et (c) multimodal

1.2.3.1. Mthode Otsu


La mthode Otsu [4] est considre comme la mthode de rfrence dans le domaine du seuillage
dhistogrammes. Dans cette mthode, lopration de seuillage est vue comme une sparation (ou
partitionnement) des pixels dune image en deux classes C1 (fond), C2 (objet) partir dun seuil t.
La classe fond regroupe tous les pixels ayant un niveau de gris infrieur au seuil t alors que la
classe objet contient tous les pixels de niveau de gris suprieur t. Ces deux classes peuvent tre
dsignes en fonction du seuil t comme suit :
(1.3)
la variance dune classe,

Soient

la variance interclasse et

variance totale telles que :


(1.4)
(1.5)
(1.6)

(1.7)
et

dsignent respectivement les niveau de gris moyen des classes C1, C2 et de limage tels

que :
(1.8)

p. 3

CHAPITRE 01

ETAT DE LART

(1.9)

(1.10)
P1 et P2 reprsentent respectivement les probabilits priori des classes C1 et C2 tels que :
(1.11)

(1.12)
(1.13)
Cette mthode consiste maximiser la variance inter classe
grande possible).

(La distance entre

plus

1.2.3.2. Mthode de kittler


La mthode de Kittler [5] Consiste diviser les nivaux de gris en 2 classes C1 et C2 et attribuer
lintensit une classe en utilisant la loi de la dcision de BAYES :
On attribut le pixel x la classe :
(1.14)
On considre que la distribution des probabilits P (x|Cj) est une distribution gaussienne donc notre
critre devient :

(1.15)

Donc notre mthode consiste minimiser ce critre derreur.


En appliquant le logarithme et en enlevant les termes inutiles pour la classification on trouve :
(1.16)
Et donc lerreur pour toute limage est :

p. 4

CHAPITRE 01

ETAT DE LART

(1.17)
Aprs quelques simplifications mathmatiques lexpression de lerreur minimiser devient :
(1.18)

1.2.3.3. Mthode KAPUR


La mthode de Kapur [6] est base sur le principe de maximisation de lentropie de Shannon. Elle
suppose que les classes objet et fond possdent deux densits de probabilit indpendantes.
(1.19)
Ou

(1.20)
Les entropies de Shannon associes aux deux distributions sont :
(1.21)

(1.22)
Le seuil optimal

est alors dfini comme tant le niveau de gris qui maximise les deux entropies,

cest--dire que :
(1.23)

1.2.3.4. Mthode ISODATA


Le seuillage par ISODATA [7] consiste trouver un seuil en sparant l'histogramme en deux
classes itrativement avec la connaissance a priori des valeurs associes chaque classe. Cette
mthode commence par la division de lintervalle en valeurs non-nulles de lhistogramme en deux
parties quidistantes, calcule ensuite les moyennes arithmtiques m1 et m2 de chaque classe. Rpte
le calcul du seuil T jusqu la convergence vers la valeur la plus proche de (m1+m2)/2, et mettant
jour chaque fois les deux moyennes m1et m2.

p. 5

CHAPITRE 01

ETAT DE LART

Cette mthode prsente linconvnient de la non-convergence (boucle infinie).


1.2.4. Quelques mthodes de binarisation locale
Il existe des images pour lesquelles il est difficile deffectuer une bonne binarisation au moyen dun
seul seuil, si celui-ci est le mme pour chaque point de limage. Ceci peut tre d une non
uniformit de lclairage de limage ou au fait que les diffrents objets qui composent limage ont
des dynamiques de luminances diffrentes. Pour cela, les mthodes de binarisation locales sont
mieux adaptes.
A linverse des mthodes globales qui ne considrent que la valeur du pixel, les mthodes locales
prennent en considration la valeur des pixels voisins pour le calcul des seuils. Deux stratgies sont
souvent employes. La premire consiste diviser, en premier lieu, limage en fentres non
chevauchantes. Dans un deuxime temps, un seuil est dtermin dans chaque fentre selon la nature
de lhistogramme local. Un seuil gal zro est affect la fentre possdant un histogramme unimodal tandis quune procdure de seuillage est appliqu pour dterminer un seul seuil dans le cas
dun histogramme bimodal ou multimodal. La figure (1.2) suivante illustre le principe du seuillage
local :
(a)

(b)

(c)

(d)

Figure 1.2. Illustration du seuillage adaptatif. (a) Image originale avec un fond non uniforme, (b)
Image binarise avec un seuil global, (c) Image originale dcoupe en sous images, (d) Image
segmente avec un seuillage adaptatif.

1.2.4.1. Mthode Niblack


La mthode de Niblack [8] dtermine un seuil en fonction de la moyenne et de lcart-type dune
fentre centre sur le pixel de cordonnes (x,y) :
(1.24)
: La valeur de seuillage pour le pixel situ en
: La moyenne des valeurs de la fentre centre en

.
.

p. 6

CHAPITRE 01

ETAT DE LART

: Est un paramtre utilis pour dterminer le nombre des pixels des contours considrs comme
des pixels dobjet et il prend des valeurs ngatives. (k est fix 0.2 par les auteurs).
: Lcart type des valeurs de la fentre centre en
Cette mthode donne de bons rsultats car le seuil dpond du pixel et de linformation extraite
partir de son voisinage, mais nest pas efficace quant le fond nest pas uniforme, ce problme a
pouss Sauvola une mthode amliore.

1.2.4.2. Mthode de Sauvola


Lalgorithme de Sauvola [9] est une modification de celui de Niblack, pour donner plus de
performance dans les documents avec un fond qui contient une texture claire ou bien trop de
variation et illumination ingale.
Dans la modification de Sauvola, la binarisation est donne par :
(1.25)
Ou R est la port dynamique de lcart-type, et le paramtre k prend des valeurs positives dans
lintervalle [0.2-0.5]. Dans ses tests, Sauvola utilise R=128 et k=0.5.
Linconvnient de cette mthode se prsente lorsque limage a un faible contraste.

1.2.4.3. Mthode de Wolf


Pour sadresser aux problmes de lalgorithme de Sauvola (faible contraste, cart de niveaux de gris
etc.), Wolf et al [10] proposent de normaliser le contraste et la moyenne des niveaux de gris de
limage, et calculer le seuil par :
(1.26)
Tel que k est fix 0.5, M est le niveau de gris minimum de limage et R vaut lcart-type
maximum des niveaux de gris obtenu sur toutes les fentres.

1.2.4.4. Mthode de Bernsen


La mthode de Bernsen [11] est une technique locale adaptative dont le seuil est calcul pour
chaque pixel de limage. Ainsi pour chaque pixel de coordonns (x, y), le seuil est donn par :
(1.27)
Tel que Zbas et Zhaut sont le niveau de gris le plus bas et le plus haut respectivement, dans une fentre
carr r r centr sur le pixel (x, y).
Cependant si le contraste C est infrieur un certain seuil, avec :

p. 7

CHAPITRE 01

ETAT DE LART

(1.28)
Alors le voisinage consiste en une seule classe: fond ou bien texte.
1.3. Conclusion
Nous avons abord le problme de binarisation des anciens documents dgrads. Plusieurs
mthodes ont t proposes dans la littrature pour la binarisation des images de documents, mais
aucune dentre elles ne se dmarque des autres, surtout pour les images des anciens documents
possdants diffrents caractristiques de dgradation. Nous avons prsent un petit tat de lart sur
les mthodes de binarisation dimages de documents, les plus frquemment cites dans la littrature.

p. 8

CHAPITRE 02

IMPLEMENTATION

Chapitre 02

IMPLEMENTATION DES TECHNIQUES DE CALCUL


DU SEUIL DE BINARISATION
2.1. Introduction
Le Seuillage automatique est un domaine trs ancien, mais toujours trs actif dans la recherche. De
nombreuses techniques ont t dveloppes pour cette tche, allant de solutions simples des
algorithmes complexes avec des fondations thoriques solides, tel que document dans plusieurs
revues et tudes d'valuation dans la littrature.
La binarisation d'images est galement considre comme une technique de segmentation par
seuillage, elle est donc souvent classe sous ce terme. Dans ce chapitre nous allons donner
quelques implmentations des mthodes de base, les plus utilises pour le calcul du seuil, la
majorit de ces mthodes utilise la notion de distribution de probabilit et dhistogramme.
Pour cela, nous commenons par des mthodes de seuillage globales puis continuons avec des
mthodes locales adaptatives.
2.2. Seuillage global bas sur l'histogramme
Comme nous l'avons indiqu dans le chapitre prcdent, tant donn une image I en niveaux de
gris, la tache est de trouver une seule valeur de seuil "optimale" pour binariser cette image.
L'application d'un seuil particulier q est quivalent classer chaque pixel comme tant soit une
partie de l'arrire-plan (background) ou au premier plan (foreground). Ainsi, l'ensemble de tous les
pixels de l'image est divise en deux ensembles disjoints C0 et C1 tel que:
(2.1)
Avant de donner le principe de ces algorithmes, passons en revue quelques faits lmentaires au
sujet des informations qui peuvent tre drives de l'histogramme de l'image.
2.2.1. Informations statiques de l'histogramme
Dans tout ce qui suit,

dnote l'histogramme d'une image

en niveau de gris de

pixels et

les valeurs possibles d'intensit.

p. 9

CHAPITRE 02

IMPLEMENTATION

La valeur moyenne de tous les pixels dans l'image est dfinie par:

(2.2)

La variance sera:

(2.3)

La valeur moyenne et la variance peut tre simultanment calcule dans une seule itration par:
(2.4)

(2.5)
Avec:

(2.6)

(2.7)

Si on fait un seuillage un niveau , le nombre de pixel assign chaque classe C0 et C1


(background et foreground) est:

(2.8)

(2.9)

Donc :
(2.10)
Pour chaque seuil q, les valeurs moyennes correspondant chaque partition C0 ou C1, peuvent tre
calcules partir de l'histogramme par:

p. 10

CHAPITRE 02

IMPLEMENTATION

(2.11)

(2.12)

Nous pouvons dduire partir de ces deux quation que:


(2.13)
De la mme manire, pour chaque seuil q, les variances peuvent tre calcules par:

(2.14)

(2.15)

(2.16)

2.2.2. Implmentation dune mthode simple de calcul du seuil


La valeur du seuil ne doit pas tre choisit alatoirement, mais seulement partir du contenue de
limage.
Dans le cas le plus simple, nous pourrons utiliser la moyenne de tous les pixels de l'image comme
valeur du seuil :
(2.17)
Ou la valeur de la mdiane :
(2.18)
Ou alternativement la diffrence (average) entre la valeur max et min :
(2.19)
Ces quantits peuvent tre directement obtenues partir de l'histogramme.

p. 11

CHAPITRE 02

IMPLEMENTATION

L'algorithme 2.1. Reprsente une implmentation de calcul simple du seuil (thresholding).


La valeur de seuil optimal q [0, K-2] est retourn, (ou -1 si aucun seuil valide n'a t trouv).
1:Seuil simple (h,b)
Entre: h: [0, K1] N, histogramme.
b, pourcentage estim des pixels du fond (0 <b<1).
Sortie: la valeur du seuil optimal ou 1 si aucun seuil n'est trouv.
2: K Taille(h)
-- nombre des niveaux d'intensit
3: N
-- nombre des pixels de l'image
4: j 0
5: c h(0)
6: tant que (j<K) (c<N. b) --calcule du seuil
7: j j +1
8: c c + h(j)
9: si c<N alors
-- foreground non-vide
10: q j
11: sinon
-- foreground vide, tous les pixels sont background
12: q 1
13: retourne q.
2.2.3. Implmentation de la technique ISODATA
Cet algorithme commence tout dabord par une estimation initiale du seuil, (en prenant la moyenne
ou la mdiane de limage entire). Cette valeur divise les pixels en 2 parties : une qui contient les
pixels du fond (background) et lautre qui contient les pixels de lobjet (foreground). Aprs on
calcule la moyenne de chaque partie et on remplace lancien seuil par la moyenne de ses 2 valeurs.
Puis on recalcule les moyennes des 2 nouvelles parties jusqu' la convergence du seuil.
Algorithme 2.2. Slection du seuil par la mthode itrative de Ridler et Kalvard
1 : Seuil ISODATA(h)
Entre: h : [0, K1] N, histogramme.
Sortie : la valeur du seuil optimal ou 1 si aucun seuil nest trouv.
2 : K taille(h) --nombre des niveaux dintensit
3 : q moyenne (h, 0, K1)
-- initialisation du seuil la valeur moyenne
4: rpter
5: n0 Compteur (h, 0, q)
-- population background
6: n1 Compteur (h, q+1, K1)
-- population foreground
7 : si (n0=0) (n1=0) alors
8:
(retourner -1)
--background ou foreground vide
9 : 0 Moyenne (h, 0, q)
-- moyenne du background
10 : 1 Moyenne (h, q+1, K1)
-- moyenne du foreground
11 : q q
-- mmorisation de lancien seuil
12 : q [0 + 1]/2
13 : jusqua q = q
14: retourne q
Compteur (h, a, b) : =
Moyenne (h, a, b) : =

p. 12

CHAPITRE 02

IMPLEMENTATION

2.2.4. Implmentation du calcul du seuil par la mthode OTSU


Le procd d'Otsu suppose que l'image originale contient des pixels classs en deux, dont les
distributions d'intensit sont inconnues. L'objectif est de trouver un seuil q tels que les distributions
de l'arrire-plan rsultant et du premier plan sont spars au maximum, ce qui signifie que :
a- leurs variances sont au minimum.
b- leurs moyennes sont cartes au maximum.
La variance totale de limage est gale la somme de la variance intra-classe
interclasse

et la variance

:
(2.20)

Puisque

est constante donc on choisie soit de maximiser la variance interclasse ou de minimiser

la variance intra-classe. Dans notre cas on choisie de maximiser

puisque :
(2.21)

Et ses termes peuvent tres calculs facilement partir de lhistogramme de limage :

(2.22)

(2.23)

(2.24)
L'algorithme 2.3.reprsente une implmentation de calcul du seuil par la mthode Otsu, il suppose
une image en niveaux de gris avec un total de N pixels et niveaux d'intensit K.
Il est not que cet algorithme utilise une procdure qui permet de construire un tableau de
moyennes.
1: Seuil OTSU(h)
Entre: h : [0, K1] N, histogramme.
Sortie: la valeur du seuil optimal ou 1 si aucun seuil n'est trouv.
2: K Taille(h)
--nombre des niveaux d'intensit
3: (0, 1, N) construction table moyenne (h, K) --appel la procdure construction
table
4: 2bmax 0
5: qmax1
6: n0 0
7: pour q 0 K2
--vrification de toutes les valeurs possibles du
seuil
8: n0 n0+ h(q)

p. 13

CHAPITRE 02

9: n1 N n0
10: si (n0> 0) (n1>0) alors
11: 2b (1/N2) n0.n1. [0 (q)- 1(q)] 2
12: si 2b> 2bmax alors
13 : 2bmax 2b
14:
qmax q
15: retourne qmax
16: construction table moyenne (h, K)
17: n0 0, s0 0
18: pour q 0 K1
19: n0 n0 + h(q)
20: s0 s0 +q. h(q)

IMPLEMENTATION

-- maximisation de la variance

21:
22: N n0
23: n1 0 , s1 0
24:
25: pour q k-2 0
26: n0 n1 + h(q+1)
27: s1 s1 + (q+1). h(q+1)
28:
29: retourne
2.2.5. Implmentation de calcul du seuil par lentropie maximale
L'entropie de l'image a t utilise dans plusieurs mthodes comme critre de slection du seuil.
Dans lexemple suivant, nous allons prsenter la technique la plus rcente celle de Kapur.
Pour un seuil donn q (0<q<k-1), les distributions de la probabilit estime pour produire deux
classe C0 et C1 sont:

(2.25)

Avec :

(2.26)

p. 14

CHAPITRE 02

IMPLEMENTATION

: sont les probabilits cumulatives pour les pixels background et foreground


respectivement.
Les entropies pour chaque partition sont dfinies comme :

(2.27)

Algorithme 2.4. Calcul du seuil par la mthode de KAPUR


1:Seuil Kapur(h)
Entre: h : [0, K1] N, histogramme
Sortie: la valeur du seuil optimal ou 1 si aucun seuil n'est trouv.
2:K Taille(h) -- nombre des niveaux dintensit
3:p Normaliser(h) normalisation de lhistogramme
4: (S0, S1) Construction tableau (p, K) appel de la procdure construction table
5: P0 0
6: q max1
7: H max
-- entropie maximale
8: pour q 0 K2
-- vrifier toutes les valeurs du seuil
9: P0 P0+ p(q)
10: P1 1 P0
11:
12:
13
14: si H01 > Hmax alors
15: Hmax H01
16: qmax q
17: retourne qmax
18:Creation d'un tableau(S1,S0)
19: s0 0
20: pour i 0 K1
21: si p(i) > 0 alors
22: s0 s0+ p(i) log p(i)
23: S0 (i) s0
24: s1 0
25: pour i 0 K1
26: S1(i) s1
27: si p(i) > 0 alors
28: s1 s1+ p(i) log (p(i))
29: retourne (S0, S1)

p. 15

CHAPITRE 02

IMPLEMENTATION

2.3. Seuillage local adaptif


Dans beaucoup de situation, un seuil fixe ne peut tre appropri pour classifier les pixels de toute
limage, surtout lorsque limage prsente des zones avec des backgrounds non uniformment
claires. La solution est de recourir chercher des seuils locaux adaptatifs. Pour cela nous
trouvons dans la littrature plusieurs mthodes parmi lesquelles nous citions :
2.3.1. Mthode de Bernsen
Cette mthode spcifie un seuil de binarisation dynamique pour chaque position (u,v), en se basant
sur les valeurs des intensits maximales et minimales trouves dans un voisinage R (u,v).
Si :
(2.28)
(2.29)
Sont le minimum et le maximum respectivement sur un voisinage de rgion R centre sur le point
(u,v), le seuil est calcul par :
(2.30)
Algorithme 2.5. Calcul des seuils locaux par la mthode de Bernsen
1: Seuil Bernsen (I, r, c, bg)
Entre: I, Image de taille M N; r, rayon de la rgion; cmin, contraste minimum;bg, type du fond
(sombre ou clair)
Sortie: une matrice qui dtermine le seuil pour chaque pixel.
2: (M, N) Taille (I)
3:
4: Pour chaque pixel (u, v) M N
5: R construction des rgions (u, v, r)
6:
7:
8: c I max-Imin
9:
10: retourne Q
2.3.2. Mthode de Niblack
Dans cette approche, le seuil Q (u,v) es vari travers l'image en fonction de la moyenne R(u,v) et
lcart type R de la forme:

p. 16

CHAPITRE 02

IMPLEMENTATION

(2.31)
Algorithme 2.6. Calcul des seuils locaux par la mthode de Niblack
1: Seuil Niblack(I, r, , d, bg )
Entre: I, Image de taille M N; r, rayon de la rgion; , paramtre de contrle de
la variance.
d, offset; bg, type du fond.
Sortie: une matrice qui dtermine le seuil pour chaque pixel.
2: (M, N) Taille(I)
4: Pour chaque pixel (u, v) M N
R construction des rgions (u, v, r)
5: (, 2) rcupration de la procdure calcule de la moyenne
et de la variance (I, u, v, r)
6: 2 calcule de lcart type
7:
8: retourne Q
9: calcule de moy et var (I, u, v, r)
Sortie calcule de la moyenne et de la variance au voisinage
10: R Construire des rgions (u, v, r)
11: N 0, A 0, B 0
12: pour chaque (i, j) R
13: N N +1
14: A A + I(i, j)
15: B B + I2(i, j)
16:
17:
18: retourne (, )
2.4. Rsultats des testes sur quelques images de vieux documents (base de
donnes DIBCO)
Dans cette partie du chapitre, nous allons prsenter quelques rsultats en appliquant les algorithmes
implments en Matlab.
Le choix c'est port sur plusieurs images de la base de donnes DIBCO avec ses versions 2009,
2010 et 2011.
Nous nous contentons de prsenter les tests sur deux types d'images:
-

Une image contenant une dgradation due un clairage non uniforme

Une autre image prsentant des taches dues un vieillissement.

p. 17

CHAPITRE 02

IMPLEMENTATION

2.4.1. Rsultats de la 1re image :

ISODATA

Image originale

OTSU

BERNSEN

KITTLER
Figure 2.1.Rsultats de la binarisation en utilisant les mthodes classiques sur une image dgrade
par une luminosit uniforme
2.4.2. Rsultats de la 2me image :

Image originale

ISODATA

p. 18

CHAPITRE 02

IMPLEMENTATION

OTSU

BERNSEN

KITTLER
Figure 2.2. Rsultats de la binarisation en utilisant les mthodes classiques sur une image dgrade
par les taches
2.5. Conclusion
Daprs les rsultats de tests, les mthodes globales qui consiste chercher le seuil globale a partir
gnralement de lhistogramme, sont simples, rapides et ont un bon impact sur le fond (nettoient
bien le fond), mais trop sensibles la variation des intensits du fond et de lobjet, elles sont donc
non adaptes aux images fortement bruites : en fonction des conditions de saisie, stockage et
dutilisation, il sera impossible dobtenir une image de bonne qualit, donc le bruit va introduire une
certaine irrgularit dans la forme de lhistogramme surtout dans sa partie minimum local.
La mthode dOtsu par exemple cherche maximiser la variance intra-classe du texte et du
fond. Contrairement kittler, ils ne se basent pas sur l'histogramme mais sur une simple
statistique de l'image, daprs les rsultats obtenus pose des problmes les documents mal clairs.
Cependant, les mthodes locales, bases sur lestimation de la valeur du seuil en faisant la moyenne
de la plus haute et la plus basse valeur de la fentre, sont plus efficaces, plus complexes et
ncessitent des capacits de calcul plus importantes en fonction du choix de la taille de la fentre et
le centrage pour certaines techniques.

p. 19

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

Chapitre 03

BINARISATION PAR LE LISSAGE ET LA


DETECTION DE CONTOURS
3.1. Introduction
Comme nous l'avons dj prsent dans les chapitres prcdents, la binarisation des images
numriques est utilise souvent dans le traitement et lanalyse des images, nous la trouvons dans
plusieurs applications comme dans le cas des OCR (Optical Character Recognition). Ou Elle
convertit une image niveau de gris en une image binaire pour faciliter les oprations suivante.
Ainsi, une binarisation rapide est prcise est devenue important.
Nous avons aussi prsent quelques mthodes classiques, la plus part d'entre elles taient bases sur
l'analyse de l'histogramme. Cette fois, nous allons donner une approche trs diffrente qui consiste
faire une estimation du fond, une technique utilise dans la mthode de binarisation par Gatos [12].
En effet, il s'agit d'une mthode utilisant des notions bases sur des approximations se servant des
interpolations polynomiales. Dans cette mthode nous allons montrer l'efficacit d'un tel traitement
et prsenter une contribution se manifestant par lamlioration du temps de calcul par une technique
limitant la taille des fentres d'analyse.
Cette mthode se droule en deux grandes tapes:
-Une tape de lissage du background par les procdures dinterpolation.
-Une tape de dtection du forground par la mthode du gradient
3.2. Lissage par l'algorithme de Golay-savitsky
Dans cette partie du traitement, nous allons proposer lutilisation de lalgorithme de Savitsky-Golay
pour faire une estimation du fond du document. Cette procdure utilise une technique de lissage
polynomial progressive et itrative.
Pour bien comprendre les procdures utilises, nous devons claircir quelques points.

p. 20

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

3.2.1. Dfinition du lissage


En mathmatiques, le lissage est une technique qui consiste rduire les irrgularits et les
singularits dune courbe (cas se manifestant dans les dgradations des vieux documents).
Cette technique est utilise en traitement du signal pour attnuer ce qui peut tre considr comme
une perturbation ou un bruit de mesure.
Le lissage est un processus dans lequel les signaux sont pondrs par des coefficients calculs
partir de leur voisinage.
Par exemple aprs avoir appliquer un lissage sur une srie de n signaux
srie

, la nouvelle

peut tre reprsent comme suit :


(3.1)

: reprsente le poids
n : le nombre de signaux
Donc le signal rsultant

aprs le lissage est gale la somme du signal original

et les signaux

pondrs son voisinage.


3.2.2. Lissage polynomial (Filtre de Savitsky-Golay)
Le filtre de Savitsky-Golay est un filtre numrique qui peut tre appliqu sur un ensemble de
donnes numriques dans le but de lisser les donnes pour augmenter le rapport signal sur bruit sans
distorsion du signal.
Ce filtre utilise la convolution en construisant un polynme de degr inferieur reprsentant une
courbe qui passe sur un ensemble de donnes numriques.
Quand les donnes sont quidistantes, la solution lquation des moindres carrs est un vecteur
contenant les coefficients de convolution ou une matrice si les donnes ne sont pas
unidimensionnelles.
Lapplication de ses coefficients sur lensemble des donnes nous donne un signal estim partir du
centre de cet ensemble.
3.2.3. Mthode des moindres carrs
La mthode des moindres carrs permet de comparer des donnes exprimentales, gnralement,
entaches derreurs de mesure, un modle mathmatique cens dcrire ces donnes. Elle permet
alors de minimiser limpact des erreurs exprimentales en ajoutant de linformation dans le
processus de mesure, on parle alors dajustement par la mthode des moindre carr.

p. 21

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

3.2.4. Calcul des coefficients dun filtre unidimensionnel de Savitsky-Golay


Pour un ensemble de 2m+1 de points de donnes

positionns symtriquement par rapport au

centre comme suit :

-m -m+1

Tableau 3.1. Tableau de correspondance position et intensit


Dans notre cas

reprsente lintensit des pixels.

Pour faire un lissage de cet ensemble nous devons construire un polynme


lequel :

de degr p pour

(3.2)
: reprsentent les coefficients du filtre et ils sont constants pour tout les points de lensemble
choisi.
Donc pour calculer ces coefficients on doit rsoudre lquation :
(3.3)
Ou :
La matrice X est gale :

(3.4)

Le vecteur des coefficients a :


(3.5)
Le vecteur des donnes D :
(3.6)
Lquation reprsente le polynme pour chaque point de donne. Donc on utilise les moindres
carres pour rsoudre cette quation et on trouve :
(3.7)
On remarque que C avec :

p. 22

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

(3.8)

Se calcule indpendamment des donnes, du coup le calcule des coefficients du filtre de SavitskyGolay se fait par le produit scalaire dune ligne de la matrice C avec le vecteur colonne D.
Nous concluons que le calcule des coefficients du filtre de Savitsky-Golay se fait par lapplication
dun filtre linaire C sur lensemble des donnes D.
3.2.5. Estimation du fond
Dans cette tape, nous faisons lestimation du fond du document en utilisant un lissage polynomiale
qui a t utilis dans diffrentes application. Par exemple : Krzysztof et al [13] utilise le lissage
polynomial en 2 dimensions pour estimer le fond des empreintes digitales. Seeger [14] et al utilise
un lissage polynomial sur les rgions de texte.
Dans notre mthode, nous limplmentons dune manire diffrente. Nous commenons tout
dabord par calculer un seuil global pour faire une pr dtection du fond, puis nous choisissons la
taille dune fentre dans laquelle nous allons faire un lissage polynomial unidimensionnel
(largement plus rapide que le lissage 2 dimensions) et pour finir nous augmentons la taille de la
fentre aprs chaque lissage complet du fond du document jusqu' ce quelle soit gale aux
dimensions de limage pour ainsi pouvoir suivre les variations dans limage avec prcision.
3.2.6. Algorithme

3.2.6.1. Calcul du seuil global et rduction de la dynamique des pixels:


On peut le calculer par des algorithmes de seuillage globales comme celui dOtsu ou de Kapur mais
dans notre cas on choisie la moyenne comme seuil pour la simplicit et la rapidit de calcul.
Le seuil T sera gale :
(3.9)
L : nombre de lignes
C : nombre de colonnes
N : nombre des pixels dans limage
I : intensit des pixels
Ainsi, nous considrons tous les pixels dintensit inferieur T comme des pixels appartenant au
texte, le reste des pixels sera considr comme appartenant au fond.
Puisque, pour linstant, nous naurons pas besoin des pixels de texte et pour augmenter lefficacit

p. 23

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

et la rapidit du filtre de lissage nous faisons une rduction de la dynamique des pixels de la faon
suivante :
(3.10)

g : image aprs rduction de la dynamique


T : Seuil global
f : image originale

3.2.6.2. Application dun lissage itrative dans une fentre


a. Choisir une taille initiale pour une fentre unidimensionnelle qui contient un vecteur de pixels
D. La fentre doit tre horizontale de faon ce quon fait un lissage ligne par ligne.
b. Appliquer le lissage polynomial en choisissant un degr initial

c. valuer lerreur entre les valeurs estimes et les valeurs originales et si elle est suprieure un
seuil prdfinie on enlve le pixel avec lerreur maximale du vecteur D.
d. Augmenter le degr du polynme et on applique le filtre au reste des points.
e. Rpter les tapes c et d jusqu ce que lerreur maximale soit infrieure au seuil.

3.2.6.3. Lissage global et agrandissement de la taille de la fentre


a. Glisser la fentre le long de la ligne et faire un lissage ligne par ligne jusqu' la fin.
b. Agrandir la taille de la fentre et refaire le mme travaille de ltape B (Application dun
lissage itrative dans une fentre), jusqu' ce que la taille de la fentre soit gale la longueur de la
ligne.
c. Le coefficient dagrandissement de la taille de la fentre dpend du degr des dgradations
subit par limage, plus limage est dgrade plus le coefficient est petit.

3.2.6.4. Lissage vertical


Apres le lissage horizontal il restera toujours quelques lignes mal lisses, donc on refait le mme
travail de ltape 2 et 3 en faisant un lissage colonne par colonne pour ainsi corriger les erreurs
destimation introduites par le lissage horizontal.
3.3. Traitement du texte par dtection de contours en utilisant le gradient
La dtection de contours permet de reprer le changement brutale de lintensit lumineuse, on peut
avec ces changement faire un seuillage plus appropri et extraire le texte dune manire plus

p. 24

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

efficace.
Par contre pour le cas des images dgrades, la non homognit de la luminosit et les taches
causent des erreurs dans la dtection. Par exemple, on ne peut pas dtecter quelques contours dans
les zones sombres ou bien la dtection de faux contours cause des changements brusques dans le
fond causs par le bruit. La dtection des contours est une technique qui est beaucoup utilis dans la
binarisation comme dans le cas de la mthode de Su [15].
Dans la mthode dveloppe nous faisons la dtection en utilisant le gradient.
3.3.1. Ajustement du contraste
Le texte ou lobjet du document peut tre extrait grce aux variations locales dtectes, ceci devient
plus facile aprs un ajustement des variations globales du contraste de limage causes par les
dgradations.
Pour faire cet ajustement, nous utilisons le fond estim lors de la partie prcdente comme suit :
(3.11)
Ou :
C : cest une constante pour contrler la luminosit de limage, dans notre systme on la remplace
par la mdiane de limage quon est entrain dtudier.
BG : reprsente le fond estim de limage.
Ainsi les variations du contraste dans limage causes par les dgradations seront ajustes grce au
coefficient

, de faon ce que ce coefficient sera grand dans les zones sombres et faible dans

les zones claires du BG. Comme dans la figure (3.1) :

Figure 3.1. Limage estime


3.3.2. Calcul du gradient
Une fois le contraste de limage ajust, les contours du texte peuvent tre dtects plus facilement
avec moins derreurs, nous utiliserons dans ce cas, le calcul du gradient sur chaque pixel dans les
deux directions horizontale selon les quations 3.12 et 3.13:

p. 25

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

(3.12)
(3.13)
Puis pour pouvoir dtecter les zones ou il ya plus de changement sur lintensit des pixels on fait la
somme des deux on aura :
(3.14)
Ainsi les zones ou la valeur du gradient V est grand (zones blanches) seront considres comme des
contours de texte conformment la figure suivante :

Figure 3.2. Limage gradient V


3.3.3. Extraction des contours

Le nombre des pixels

Lhistogramme de limage gnre par la somme des gradients vertical et horizontale est reprsent
si dessous :

Lintensit des pixels

Figure 3.3. Histogramme de limage V


Daprs les schmas de lhistogramme uni-modal si dessus : nous remarquons que les pixels qui ne
font pas partie des contours (pixels noirs) sont plus nombreux et ont une dynamique beaucoup plus

p. 26

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

rduite que celle des pixels qui font partie des contours, nous pouvons donc extraire ces contours
grce une mthode classique de seuillage dhistogramme comme celle dcrite dans la mthode
dOtsu.
La figure suivante reprsente le rsultat du seuillage :

Figure 3.4. Image binarise des contours (Rsultat aprs Otsu)


3.4. Extraction du texte
Lextraction du texte se fait par une estimation locale des pixels. Les critres utiliss pour classifier
un pixel comme appartenant au texte est :
-

la condition dtre entour par un ensemble de pixels appartenant un contour

son intensit soit inferieur ou gale la moyenne des intensits des pixels qui lentoure.

Donc mathmatiquement parlant le choix se fait comme suit :


(3.15)
Ou :
: Le nombre de pixels de contours dtects dans la fentre.
: Un seuil qui dfinie le nombre minimum de pixels de contours dans une fentre pour
considrer le pixel comme un pixel appartenant au texte.
: La moyenne des intensits des pixels de contours dans une fentre, qui peut tre calcule
comme suit :
(3.16)
E : Image binarise des contours.
Daprs ce qui a t expliqu prcdemment, les performances de la binarisation en utilisant les
contours de texte dpendent essentiellement de deux paramtres : la taille de la fentre utilise et le

p. 27

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

nombre minimum de pixels de contours dans la fentre.


Nous avons remarqu que les deux paramtres sont lis la largeur du contour de texte. En
particulier la taille de la fentre, celle-ci ne doit pas tre inferieur cette largeur autrement dit, les
pixels lintrieur des contours seront mal estims.
Donc le calcul de la largeur des contours est indispensable pour le choix de la taille correspondante.
Pour arriver faire cela, nous utilisons la mthode suivante :

le parcourt ligne par ligne de limage des contours puis le calcul de la distance entre les
bords de chaque contour.

Reprsentation des distances obtenues sous la forme dun histogramme.

Choix de la largeur de contour gale la distance la plus prsente

Nombre de pixels

Pour notre cas lhistogramme est reprsent comme suit :

Distance entre les bords de contour

Figure 3.5. Histogramme qui reprsente la frquence dapparition des distances entre les bords de
contour pour notre image
Daprs lhistogramme ci-dessus on remarque que la distance qui apparait le plus frquemment
cest 2 donc la taille de notre fentre ainsi que

doivent tre suprieurs ou gales cette

valeur.
Aprs quelques tests, nous remarquons que les rsultats de la binarisation changent peu lorsque la
taille de le fentre change entre 2 et 4 fois la largeur des contours, donc on choisit une fentre de
taille 8 et

, on aura le rsultat suivant :

p. 28

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

Figure 3.6. Le rsultat de la binarisation


3.5. Post-traitement
Lopration de la binarisation introduit toujours quelques erreurs, ces erreurs seront corriges par
des oprations de poste-traitement.
Dans notre cas, on nos utilisons 3 oprations :
1) La premire consiste supprimer les composants qui ont une taille infrieure 3 pixels
puisque gnralement les composants du texte sont plus grands.
2) La deuxime consiste supprimer les composants plus grands et qui ne font pas partie du
texte, et on peut les dtecter grce leur intensit qui va tre plus claire que lintensit du
texte.
3) La troisime consiste supprimer les trous les concavits et les convexits provoques par la
binarisation dans les blocs de pixels comme montr ci-dessous :

Figure 3.7. Reprsentation des dformations sur les blocs de pixels :


a- Concavit ; b-Convexit ; c-Trou
Aprs lapplication de ces 3 oprations on aura le rsultat suivant :

Figure 3.8. Limage finale obtenue aprs le post-traitement

p. 29

CHAPITRE 03

LISSAGE ET DETECTION DES CONTOURS

3.6. Conclusion
Lalgorithme propos permet destimer le fond dun document dgrad, en faisant un lissage
polynomial itratif et progressif. Cette dmarche nous permet de suivre les variations de limage
avec prcision, diminuant ainsi le bruit et les dgradations. Lutilisation dun fond estim amliore
considrablement lopration de dtection des contours. Lextraction du texte devient alors plus
efficace et prcise. Ltape de poste-traitement corrige quelques erreurs pargnes par les tapes
prcdentes.

p. 30

CHAPITRE 4

TESTS ET EVALUATION

Chapitre 04
OUTILS DE MESURE DES PERFORMANCES,
TECHNIQUES DEVALUATION ET TESTS
4.1. Outils de mesure
Pour valider une mthode dans le domaine de la binarisation, plusieurs techniques, ''outils de
mesure'' sont utilises par les chercheurs, ces techniques sont dcrites dans plusieurs documents de
la littrature. La plus part des chercheurs utilisent '' Recall- and Precision-Based Metrics'' pour
comparer leurs travaux.
Dans ce projet, nous avons utilis en plus de la FM (F-Measure) : dduction directe du Recall et
Precision, le PSNR (Pick Signal-to-Noise Ration), NRM (Negative Rate Metric), et la MPM
(Misclassification Penalty Metric).
Ces tests ont t oprs sur les images de la base de donnes DIBCO-2009 dont le choix est pris
pour des raisons comparatives.
-La FM mesure est la capacit de lalgorithme rcuprer les pixels de lobjet, elle est dfinit
comme suit :

(4.1)
Ou :
RC (Recall): le rapport entre le nombre des pixels rcuprs de lobjet sur le nombre total des pixels
de lobjet sur limage rfrence.
PR (Precision):le rapport entre le nombre des pixels rcuprs de lobjet sur le nombre total des
pixels rcuprs.
-Le PSNR (Pick Signal-to-Noise Ratio) mesure la ressemblance entre limage rfrence et limage
binarise, il est dfinie par :

(4.2)

p. 31

CHAPITRE 4

TESTS ET EVALUATION

Ou :
MSE (Mean Square Error): lerreur quadratique moyenne.
C : reprsente une constante, elle est prise gale 255 dans le cas des images niveau de gris.
-La NRM (Negative Rate Metric) mesure le taux de dcalage des pixels entre limage rfrence et
limage binarise. Elle est dfinit par :

(4.3)

Ou :
FN (False Negatives): les pixels de lobjet qui se trouvent limage de rfrence et pas limage
binaris.
FP (False Positives):les pixels qui font pas parties de lobjet dans limage de rfrence mais ils sont
dtects comme des pixels de lobjet dans limage binarise.
TN (True Negatives):les pixels qui font pas partie de lobjet dans limage de rfrence et celle
binaries.
TP (True Positives): les pixels qui font partie de lobjet dans limage de rfrence et celle binarise.
-La MPM (Misclassification Penalty Metric) mesure la capacit de lalgorithme dtecter les
contours de lobjet, plus sa valeur est petite plus lalgorithme est performant, elle est dfinit par :

(4.4)
Ou :
: La distance entre un FN et le contour.
: La distance entre un FP et le contour.
D : Cest un facteur de normalisation.
4.2. Rsultats
Le Tableau 4.1. Donne les rsultats obtenus des mesures de performances avec les mthodes
dotsu, Niblack, Sauvola, Gatos, Su et la mthode utilise sur la base de donnes DIBCO 2009

p. 32

CHAPITRE 4

TESTS ET EVALUATION

Mthodes

FM(%) PSNR NRM (

) MPM (

Otsu
78.72
15.34
5.77
13.3
Niblack
55.82
9.89
16.40
61.6
Sauvola
85.41
16.39
6.94
3.2
Gatos
85.25
16.50
10
0.7
Su
91.06
18.50
7
0.3
Mthode utilise 91.24
18.66
4.31
0.5
Tableau 4.1. Tableau rcupratif des mesures de performances
D'aprs ces rsultats, nous remarquons que la mthode dveloppe donne les meilleures
performances (FM et PSNR largement suprieurs, NRM et MPM ngligeables).
Nous affirmons donc, que cette approche est prcise et prserve surtout trs bien les contours.
Les figures suivantes donnent quatre exemples d'images sur lesquelles sont appliques les mthodes
cites dans le tableau 4.1 :
(a)

(b)

(c)

(d)

(e)

(f)

(g)

Figure 4.1. Les rsultats de la binarisation dun document dgrad par saignement (bleedingthrough) (a) en utilisant la mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la
mthode que nous avons dvelopp (g)

(a)

p. 33

CHAPITRE 4

TESTS ET EVALUATION

(b)

(c)

(d)

(e)

(f)

(g)

Figure 4.2. Les rsultats de la binarisation dun document dgrad par les taches (a) en utilisant la
mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que nous avons
dvelopp (g)
(a)

(b)

(c)

(d)

(e)

p. 34

CHAPITRE 4

TESTS ET EVALUATION

(f)

(g)

Figure 4.3. Les rsultats de la binarisation dun document dgrad par la variation du contraste (a)
en utilisant la mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que
nous avons dvelopp (g)

(a)

(b)

(f)

(g)

(c)

(d)

(e)

Figure 4.4. Les rsultats de la binarisation dun document dgrad par une luminosit uniforme (a)
en utilisant la mthode dOtsu (b), Niblack (c), Sauvola (d), Gatos (e), Su (f), et la mthode que
nous avons dvelopp (g)

p. 35

CHAPITRE 4

TESTS ET EVALUATION

4.3. Discussion
Dans le chapitre 3, nous avons mentionn que la mthode utilise fait appel beaucoup de
paramtre surtout dans la partie du lissage de fond, d'aprs les tests exprimentaux, nous avons
constat que les performances du lissage changent lgrement lorsque le degr initial du polynme
est pris entre 3 et 6 donc automatiquement le choix de la taille de la fentre doit tre suprieur
, avec un seuil destimation infrieur 20 puisque gnralement lintensit entre le fond et le
texte est largement suprieur cette valeur.
Dans la partie de lextraction du texte, nous faisons appel aussi des paramtres comme la taille
de la fentre de dtection et le nombre minimum de pixels de bord de contours dans cette fentre.
Pour notre cas nous avons utilis une fentre de taille double la largeur des contours et un nombre
de pixels gale cette largeur pour estimer d'une manire efficace les pixels sans ngliger ceux qui
se trouvent lintrieur des contours.
La constatation essentielle que nous tirons est que les bonnes performances de cette mthode sont
dues plusieurs facteurs:
-

En premier, la mthode utilise un fond estim pour attnuer le bruit et pour surtout ajuster le
contraste uniforme dans limage qui est caus par les dgradations, cette estimation du fond
amliore la dtection des contours, et surtout son utilit dans le post-traitement pour
supprimer les lments qui ne font pas partie du texte. Comparativement la technique
dOtsu qui ncessite un histogramme bimodal et ainsi ne peut pas binariser correctement les
documents dgrad cause du bruit dans le fond comme montr dans les figures. 4.2, 4.3.
En mme temps les techniques de binarisation locales comme celle de Niblack et Sauvola
peuvent dans la plupart des cas introduire un bruit ou une mauvaise dtection des caractres
cause dun contraste bas dans les zones du texte comme indiqu sur les figures. 4.1, 4.2,
4.3, 4.4.

En second, lextraction du texte se fait grce aux contours : donc les rgions sans contours
ne seront pas traites ce qui entraine une fausse dtection des pixels du fond, cas de la
mthode dOtsu, figures.4.2, 4.3, 4.4.

finalement, le grand impacte sur les oprations de post-traitement, puisque grce


lestimation du fond, les pixels nappartenant pas au texte ont pu tre enlevs. A signaler
aussi, que la correction des dformations sur les blocs de pixels a amlior largement les
performances de la binarisation. Et cest surtout grce au poste traitement que les
performances de la mthode dveloppe ont pu dpasser celles de Gatos [12] et Su [13].

La limite de cette mthode rside dans son incapacit faire la diffrence dans le cas ou un bloc de
p. 36

CHAPITRE 4

TESTS ET EVALUATION

pixels ayant une intensit suprieur ou gale celle du texte et nappartenant pas au texte.
Cette technique et conu pour la binarisation des documents scanns, donc si le traitement se fait
sur une image pris par un autre outil de capture et que celle si est courb ce qui va provoquer une
dtection fausse des contours et ainsi la dgradation des performances de la binarisation.
4.4. Conclusion
Cette mthode de binarisation utilise lestimation du fond et la dtection des contours.
Nous commenons par un filtrage itratif et progressif pour une estimation plus efficace, puis nous
faisons appel une opration de dtection de contours du texte grce une image estim et ajust
au niveau du contraste, ce qui permet une dtection correcte des variations.
Avec limage estime par filtrage contours dtectes, lextraction du texte est par la suite ralise.
A la fin des oprations de post-traitement sont appliques pour corriger quelques erreurs dues la
binarisation. Nos testes et rsultats ont montrs que cette mthode est plus performante que les
mthodes bases sur l'analyse de l'histogramme.

p. 37

CONCLUSIONS GENERALES ET PERSPECTIVES

CONCLUSIONS GENERALES ET PERSPECTIVES


Le travail que nous avons men durant ce projet se divise en deux grandes parties:
Une partie consistait, en premier lieu, tudier les techniques de base utilises pour le calcul du
seuil de binaristion. A ce stade, nous avons dcouvert que d'une faon gnrale, ces mthodes
utilisent quelques dtails prs, presque la mme philosophie, consistant faire l'analyse de la
forme de l'histogramme.
Une fois la tche d'implmentation d'un ensemble d'approches termine, nous concluons que malgr
que ces mthodes ont t classifies en plusieurs catgories (globales, locales et mme adaptatives),
nul ne peut confirmer celles qui donnent des performances meilleurs sures. D'ailleurs, c'est pour
cette raison que les tests se font gnralement sur des bases de donnes ou leurs composantes sont
choisies judicieusement et la performance est juge par une moyenne.
Cette non assurance de l'efficacit de la mthode est essentiellement due surtout la diversit des
facteurs et paramtres causant la dgradation (tache d'ancre, vieillissement papier, illumination
..ect).Donc la performance d'une mthode n'est jamais mesure en se basant sur un type bien
dfini, mais sur un ensemble bien tri.
La deuxime partie de ce travail consistait implmenter une mthode ne faisant pas appel dans sa
stratgie la notion d'histogramme sauf bien sre dans la partie du calcul de la largeur des contours.
Cette mthode exploite les caractristiques d'approximation polynomiales, particulirement, celles
de Savitsky-Golay pour faire un lissage du fond, et la mthode du gradient pour l'extraction du
texte.
L'implmentation de cette mthode, nous a cre normment de problme (non singularit des
matrices lorsque le degr du polynme est choisie important). Comme solution ce problme, nous
avons propos une mthode que nous considrons comme contribution au succs de
l'implmentation, cette contribution se manifeste par la rduction de la dynamique des pixels et
l'introduction d'une fentre glissante pour le traitement de tous les pixels ce qui vite largement la
dgnrescence.
A la fin nous jugeons que la mthode dveloppe donne des rsultats de niveau concurrentiel, et
nous pensons que le changement de la procdure de lissage par une estimation dans le domaine
frquentiel amliore encore plus les performances de la binarisation et la rapidit de lalgorithme.

p. 38

REFERENCES BIBLIOGRAPHIQUES

Rfrences Bibliographiques
[1]

Lu S, Su B, Tan C. Document image binarization using background estimation and stroke edges.
International Journal on Document Analysis and Recognition (IJDAR), October. 2010, pp. 13.

[2]

N. Arica, F. T. Yarman-Vural, An overview of character recognition focused on off-line


handwriting, IEEE transactions on systems, man and cybernetics, vol. part C Applications and
reviews, 2001,
pp. 216-233.

[3]

K. Khurshid, I. Siddiqi, C. Faure, N. Vincent, Comparison of Niblack inspired Binarization methods


for ancient documents, 16th International conference on Document Recognition and Retrieval, USA,
2009.

[4]

N. Otsu, A threshold selection method from gray-level histogram, IEEE Transactions on System
Man Cybernetics, Vol. SMC-9, No. 1, pp. 62-66, 1979.

[5]

Kittler, J., Illingworth, J. and Fglein, J., Threshold Selection Based on a Simple image Statistic,
Computer Vision, Graphics and Image Processing, pp. 30, 125147, 1985.

[6]

J.N. Kapur, P.K. Sahoo, A.K.C. Wong, A New method for gray-level picture threshold using the
entropy of the histogram, Computer Vision, Graphics, and Image Processing, 29, pp. 273-285, 1985.

[7]

F.R.D. Velasco, Thresholding using the ISODATA clustering algorithm, IEEE Transaction on
system, Man and Cybernitics, 10, pp. 771-774, 1980.

[8]

W.Niblack, An Introduction to Digital Image Processing. Prentice Hall, Englewood Cliffs, (1986).

[9]

J.Sauvola, T,Seppanen, S.Haapakoski, M.Pietikainen,Adaptive Document Binarization, 4th Int.


Conf. On Document Analysis and Recognition, Ulm, Germany, pp.147-152 (1997).

[10] C. Wolf, J. M. Jolion, and F. Chassaing. Extraction de texte dans des vidos : le cas de la
binarisation , In 13me Congrs Francophone de Reconnaissance des Formes et Intelligence
Artificielle, pp. 145-152, 2002.
[11] Bernsen J., Dynamic thresholding of grey-level images, Proceedings 8th International Conference
on Pattern Recognition, Paris, pp. 1251-1255, 1986.
[12] B. Gatos, K. Ntirogiannis, and I. Pratikakis, ICDAR 2009 document image binarization contest
(DIBCO 2009), in Proc. 10th ICDAR, pp. 13751382, Jul. 2009.
[13] Krzysztof, M.P.M.,Axel, M.,Dynamic threshold using polynomial surface regression with application
to the binarization of fingerprints.Proceedings of the SPIE, vol. 5779.
[14] Seeger,M., Dance, C., Binarising camera images for ocr. Proceedings of International Conference on
Document Analysis and Recognition, pp. 5458 (2001).
[15] Su, B., Lu, S., Tan, C.L.: Binarization of historical handwritten document images using local
maximum and minimum filter. International Workshop on Document Analysis Systems,
pp. 159165. June 2010.
[16] Burger W, Burge M. Principles Of Digital Image Processing, London, Springer, 2013, pp. 329.
[17] Chaki N., Shaikh S., Saeed K., Exploring Image Binarization Techniques, India, Springer, 2014,
pp. 560.

p. 39

.
.
.
. .
.
. :
Rsum :
La binarisation est une tape importante dans tout processus de traitement et danalyse
dimages. Plusieurs techniques de binarisation ont t proposes dans la littrature, dont chacune est
approprie un type particulier dimages, par exemple dans le cas de la binarisation danciens
manuscrits. Ces derniers sont connus pour leur mauvaise qualit due aux diffrentes dtriorations
subies au cours du cycle de vie du document et les dispositions jusque-l employes pour leur
sauvegarde. Ce rapport prsente un dbut dune tude comparative entre quelques techniques de
binarisation. Dans cette premire phase nous avons tudi, implment et test plusieurs algorithmes
sur des images danciens manuscrites. Lobjectif tant moyen terme de faire une tude
comparative et pouvoir slectionner par la suite le meilleur algorithme de binarisation.
Mots Cls : seuillage,

binarisation, anciens documents.

Abstract:
Binarization is an important step in image processing. Several binarization techniques have been
proposed in the literature, each of which is appropriate to a particular type of images, for example
the case of the binarization old manuscripts. They are known for their poor quality due to different
damage sustained during the document life cycle and provisions previously employed to safeguard
them. This report presents a beginning of a comparative study of some technics of binarization. In
this first phase we studied, implemented and tested several algorithms on old handwritten images.
The objective is to make a comparative study and subsequently be able to select the best
binarization algorithm.
Key Words: thresholding,

binarisation, old manuscripts.

Вам также может понравиться