Вы находитесь на странице: 1из 12

&DStWXOR 

7pFQLFDV GH XPEUDOL]DFLyQ DXWRPiWLFD >$XWRPDWLF WKUHVKROGLQJ PHWKRGV@

. /10'24357698:4;<;=?>92@/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/A A/CBED<3F698<6-G%HJI7G=?;<6-G8KL:1MNH5 OQP1=SRCOT;=?>92UOV:<3F6MWIX3=?;OY/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/[Z


2.1 Media aritmtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.2 Mximos [ \ ]"^_ `"aJbc'de\(fgaJdfh^ikjhlkm n ] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.3 Seleccin iterativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.4 El mtodo de Otsu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.5 Mtodos basados en la entropa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.6 Conjuntos difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.7 Error mnimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Z/1oU=pHP1=?6%qh5 OQrJs Ot/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/4/u. A

   
 

  "!#

$%!'&#(
*)+-,

.0/%123'465%789-9-:<;2

En Visin Artificial se emplea una gran variedad de mtodos de segmentacin de imgenes. El objetivo de la umbralizacin es la conversin de una imagen con varios niveles de gris en una imagen monocroma (en blanco y negro) que contenga la informacin esencial relativa al nmero, posicin, tamao y forma de los objetos recogidos en la imagen. La forma ms comn de pasar de una imagen en niveles de gris a una imagen monocroma es seleccionar un umbral. Todos los pixels cuyos niveles de gris estn por debajo se clasificarn como si fuesen pixels negros (0) y los que estn por encima, blancos (1). Las tcnicas utilizadas para seleccionar este umbral suelen ser de tipo estadstico y pueden aplicarse a otro tipo de problemas (como subdividir un conjunto dado de valores numricos en dos intervalos). Todas las tcnicas aqu descritas utilizan el histograma para seleccionar el valor del umbral.

= > @BA#CDE"FHGJI @BKLCMKLE"KLCNKLEOLDM>HDQPMK"@-RFHEKLE ? S AK?EKA6TFU>UF(VDRICXWDRDNFU>UA#EYT(RDR"K'>-O'Z#G%W"Z#RYT(DG[FUKLC\TZ PMK>UZ#EPMFHEYTFHC\TZ#EG[] TZ#PMZ#EPMKA#G_^RDM>UF(VDMO'FU`#CQDMA6TZ#GJI\TFUOLD

   
 

  "!#

$%!'&#(
*)+-,

.0/%1325476%86%9;:<9 =?>@6%9;8ACBDE:F5GH?=JI%G>@=?KLEGB476%DE<%47=?>@G M5NPOQSR'T-UWV;VX7UY[Z]\7Y[UW^'V


Una forma simple de seleccionar el umbral, aunque no muy buena, es calcular la media _ aritmtica de los datos disponibles: `ba

= ()

Esta seleccin del umbral equivale a fijar el porcentaje de muestras por debajo del umbral en un 50% aproximadamente. Aunque pueda parecer excesivamente arbitrario, en determinadas aplicaciones puede resultar til. Por ejemplo, en Visin Artificial, este mtodo es prctico cuando se conoce la proporcin de pxeles que deben corresponder a un objeto contenido en una imagen (en general se fijar un determinado percentil como umbral).

cedgfhikjWl(mikn'lWo#p;qkrjsit"lsdvu wxrypkrytqkrr(zryd%{"jW| }5~ lWjWl(mipqk|;jsi;dryqklsi;qkr'jklst ~ |w@hidvi

   
 

  "!#

$%!'&#(
*)+-,

.0/ .21435687:9;<=?>@92ACB'DE-;F=HGCIJB';GC9K8LC68MCNO
El uso del histograma es frecuente a la hora de seleccionar el umbral. Cuando ste es evidente, su valor corresponde al punto ms bajo entre dos picos del histograma. Si el histograma tiene nicamente dos mximos locales, este mtodo es bastante bueno. En primer lugar se localiza el mximo PRQ SUT del histograma (el primer pico). A continuacin hemos de encontrar el segundo pico. No obstante, el segundo valor mayor del histograma no nos vale (puede que sea adyacente al mximo). Para encontrar un valor adecuado para el segundo pico podemos tener en cuenta la distancia al primero (le damos preferencia a picos que no se encuentren cerca del mximo):
2 max{( V W X ) Z Y ( W )}

El umbral que estbamos buscando ser el valor correspondiente al mnimo del histograma que encontremos entre los picos S y [ .

Two peaks thresholding

   
 

  "!#

$%!'&#(
*)+-,

.0/ 132-46574'8'8'97:;<9=>4'?6@=>9(AB@<CDE97F-574'?6GIH JKLM


Este mtodo de seleccin del umbral consiste en estimar inicialmente el valor del umbral y despus ir afinando la estimacin realizada en sucesivas pasadas sobre los datos. Inicialmente, el umbral es simplemente la media aritmtica de todos los valores disponibles. A continuacin se calcula la media NPO de todos los valores por debajo de este umbral y la media NQ de los valores que quedan por encima. La nueva estimacin del umbral ser igual a la media de NPO y NQ : R>NPOSNQ T6UWV . El proceso se repite hasta que el umbral estimado no vare. Empleando el histograma, la estimacin k-sima del umbral ser:

` = acb

2 ()
acb

Y[Z\Y Z\Y

() +

d e
>

]^Z_]
1

( )
Z_]

e 1

d e
>

( )

donde f0g es la estimacin inicial del umbral y h es el histograma de los datos. Cuando lleguemos a una iteracin en la cual f#ijf#ilkm habremos encontrado el umbral que buscbamos.

npo'q7o'r'r's7t#uvsxwozy{Bws7|z{

   
 

  "!#

$%!'&#(
*)+-,

-/.0213547698;:<=:><=?@>8;ABDCFE GHIJ
Este mtodo supone que los datos correspondientes a una clase siguen una distribucin normal. Realizando un anlisis de varianzas, se puede encontrar un umbral ptimo en cierto sentido minimizando la razn K2

L2
donde M N es la varianza total de los datos y OPN es la varianza entre clases (la varianza de las medias de cada clase respecto a la media global). La varianza global M N y la media total QSR de todos los datos son fciles de calcular a partir de los datos de entrada. La varianza entre clases se puede calcular como T UVWQSTXQSUZY N , donde T es la probabilidad de que un dato quede por debajo del umbral t y U es [ \ T . As mismo: ^ _ bdceb 0 = ] 1 = ` = a ( ) 0 1 0 `

fhgWikj lm#nompnoqsrsl(tu

   
 

  "!#

$%!'&#(
*)+%,

.0/132547698:;8<=;><>:;8<?'@BAC>D?'@E69F78G;HC>
En Teora de la Informacin, dados I posibles smbolos JK que ocurren con probabilidad LNM JK O , la entropa asociada a la fuente de informacin (en bits por smbolo) es:

= ( T ) log 2 ( T )
T

QSR

QSR

La entropa asociada a los datos cuyos valores quedan por debajo del umbral t es:

Y =

Z\[

VSW

( Z ) log 2 ( Z )

VXW

Igualmente, la asociada a los datos que quedan por encima es:

` =

ab
>

^S_

( a ) log2 ( a )

^S_

El mtodo de Pun (1981) consiste en encontrar el umbral t que maximiza la suma cDdefcDg . Esto es equivalente a maximizar la funcin h Mji O definida como sigue: o o log r log(1 r ) kml n r n r l l ( )= + 1 pmq pmq n s log(max{ t | }) n s log(max{ t | > }) donde

u y

w = { =

xw

v z

v x log x z | log |

}  =

~ \

El mtodo de Kapur (1985) es una variacin del mtodo de Pun en la cual se definen independientemente las distribuciones de probabilidad para cada clase. Se trata de minimizar la suma cDd Mji OefcDg Mji O , donde

( )=

log 2

( ) =

1
>

log 2

   
 

  "!#

$%!'&#(
*)+-,

Finalmente, el mtodo de Johannsen (1982) propone seleccionar el umbral de tal forma que se minimice la interdependencia entre las clases. Se persigue la minimizacin de ./1032 4657.89032 4 :

; > ( ) = log

?@

<

? + C

?@

1
<

< < ? = ( @ )+ = @ ? ? <

B E ( ) = log

F G H

F +

FG

1
C

C C G ( ) + F D D FH F >G

donde I*0(JK4 es la funcin de entropa I*0(JK4MLNOJPRQST0(JK4 .

Q#VWYX 2Q#Z[Q#VZ[\"]"^#_`0 a#bRPdceV^f"\9gbRQ#g4 hicjf"^#gk0 a#bRPdclbd_62\9gWY\9Z[bdc4nmeo#Q#pc__V\9_`0 a#bRPdclbd_qa#\9gbRQ#g4

   
 

  "!#

$%!'&#(
*)+-,

-/.021435#68795,:;3<=9>?@79<3<
En teora de conjuntos clsica, un elemento pertenece o no pertenece a un conjunto. En teora de conjuntos difusos, un elemento A pertenece a un conjunto S con un grado de pertenencia BC . Al seleccionar un umbral D , la media de los datos correspondientes a cada clase es EGF y EGH . La funcin de pertenencia a cada clase viene definida por:

1 J | 0 | 1+ J J I J max min O ( )= 1 J 1 + | 1 | J J max min

K/LMJ

N >N

K/LMJ

Una forma de seleccionar el valor del umbral se basa en la entropa de un conjunto difuso, que se calcula usando la funcin de Shannon:

Q Q Q Q Q R ( ) = log (1 ) log(1 )

El umbral adecuado ser aquel que minimice la entropa de los datos:

SUT

( )=

V1

X YZX [ ( \ ( )) ( )

Otro mtodo, ideado por Yager (1979), consiste en minimizar la funcin:

^
2

( )=
d

| a ( ) a b
d

( )|2

donde

c ( ) = 1 c ( )

   
 

  "!#

$%!'&#(
*)+,)

/10'230'4'4'536#79810'2;:#<>=?@12;:BA53235(C@781D92E@F0G7HA(?DIKJ(@9810:#7F4'D#7ML:#7HAD>815 N#:#OD

P <>=?@1235(C@14'536#7F:BA53235(C@781D92E@%N#:#714'536#7QI?DI":0GORA(@QI"D#?TS#@ UV0G?

   
 

  "!#

$%!'&#(
*)+-, .

.0/132546467458:9<;-=<8:7
El histograma de los datos puede considerarse como una combinacin de dos distribuciones de probabilidad (las dos clases >?A@CBDFE G y HIE(D?KJLG ). Estas distribuciones suelen considerarse distribuciones normales, por lo que el histograma es una aproximacin de Q Q ( 1 ) 2 ( 2 )2 2 2 1 1 MON P P 2 1 2 2

( )=

1 2

2 2

RTS

H<@ UWV

REl X error mnimo se alcanza cuando seleccionamos como umbral el valor para el cual H<@ U . Tomando logaritmos en ambos lados de la ecuacin podemos obtener Y Z Y Z 2 2

( 1 ) + log 1 2 log 12

( 2 ) + log 2 2 log 2 2

R Los valores de [ , y son desconocidos y su estimacin es difcil. Kittler e Illingworth (1986) propusieron la minimizacin de la siguiente funcin para obtener el valor del umbral:

1 + 2( 1 ( ) log 1 ( ) +
\^] ] \

2( 1 ( ) log
\^] _a`
1( ) =

\^] bdc

1( ) +

2 ( ) log

( ) log 2 ( ) )
] ] \
2 ( ))

en la cual

e5f

()
g

(h ) =
u

() l5m ikj
>

1 ( ) =

s5t

oqpko

() ()
{
2

2 ( ) =
2 2 ( )=

yz
>

vqwdv

() ()
( )( 2 ( ) )

2 2

12 ( ) =

|k}~} 

( )( 1 ( ))
1

( )

5
>

()

<('<#C"CK WW 0<<('A #(CA#

   
 

  "!#

$%!'&#(
*)+-, ,

/10%2436576368%91:<;=>6; ?*@(AB@C"D#EFG@IH@KJL#MNOBPIQRNTSUH@(AB@IJ@VWQ'Q X FGL<YZ<[\I]_^B@KHL#M`[(aLPbEcdQ [Q']']'\IZ#MEWe<\bf\IZ#MdQ"gM`[Q'PI\ hiQ_MB]'\b^Gj kl] JTa^m"npod\IPIPbErq ssKt


En este libro, clsico en Robtica, se describen algunos algoritmos utilizados en Visin Artificial. Entre ellos se encuentra un algoritmo tpico de umbralizacin automtica que, suponiendo distribuciones normales de probabilidad, minimiza el error medio. El algoritmo descrito en este libro es similar (aunque no exactamente igual) al expuesto en la seccin 1.7.

u^vwQ_fFG@x^ayQ_a X{z P hiL#a\|[(}v~f #L#agv~^ hiQ"xaL]'Q_ff\bM h^MHL#v%"D<[Q_awe<\bf\IL#MGj A zw u#L#}M\IPIQSABL#MfErq ss%


Un libro bastante bueno que recoge muchas de las tcnicas utilizadas en Visin Artificial. Su tercer captulo est dedicado a algoritmos de segmentacin de imgenes (algunos de los cuales se han adaptado aqu para seleccionar un umbral que permita dividir los valores de un atributo numrico en dos intervalos).

   
 

  "!#

$%!'&#(
*)+-,'.

Вам также может понравиться