Академический Документы
Профессиональный Документы
Культура Документы
"!#
$%!'&#(
*)+-,
.0/%123'465%789-9-:<;2
En Visin Artificial se emplea una gran variedad de mtodos de segmentacin de imgenes. El objetivo de la umbralizacin es la conversin de una imagen con varios niveles de gris en una imagen monocroma (en blanco y negro) que contenga la informacin esencial relativa al nmero, posicin, tamao y forma de los objetos recogidos en la imagen. La forma ms comn de pasar de una imagen en niveles de gris a una imagen monocroma es seleccionar un umbral. Todos los pixels cuyos niveles de gris estn por debajo se clasificarn como si fuesen pixels negros (0) y los que estn por encima, blancos (1). Las tcnicas utilizadas para seleccionar este umbral suelen ser de tipo estadstico y pueden aplicarse a otro tipo de problemas (como subdividir un conjunto dado de valores numricos en dos intervalos). Todas las tcnicas aqu descritas utilizan el histograma para seleccionar el valor del umbral.
"!#
$%!'&#(
*)+-,
= ()
Esta seleccin del umbral equivale a fijar el porcentaje de muestras por debajo del umbral en un 50% aproximadamente. Aunque pueda parecer excesivamente arbitrario, en determinadas aplicaciones puede resultar til. Por ejemplo, en Visin Artificial, este mtodo es prctico cuando se conoce la proporcin de pxeles que deben corresponder a un objeto contenido en una imagen (en general se fijar un determinado percentil como umbral).
"!#
$%!'&#(
*)+-,
.0/ .21435687:9;<=?>@92ACB'DE-;F=HGCIJB';GC9K8LC68MCNO
El uso del histograma es frecuente a la hora de seleccionar el umbral. Cuando ste es evidente, su valor corresponde al punto ms bajo entre dos picos del histograma. Si el histograma tiene nicamente dos mximos locales, este mtodo es bastante bueno. En primer lugar se localiza el mximo PRQ SUT del histograma (el primer pico). A continuacin hemos de encontrar el segundo pico. No obstante, el segundo valor mayor del histograma no nos vale (puede que sea adyacente al mximo). Para encontrar un valor adecuado para el segundo pico podemos tener en cuenta la distancia al primero (le damos preferencia a picos que no se encuentren cerca del mximo):
2 max{( V W X ) Z Y ( W )}
El umbral que estbamos buscando ser el valor correspondiente al mnimo del histograma que encontremos entre los picos S y [ .
"!#
$%!'&#(
*)+-,
` = acb
2 ()
acb
Y[Z\Y Z\Y
() +
d e
>
]^Z_]
1
( )
Z_]
e 1
d e
>
( )
donde f0g es la estimacin inicial del umbral y h es el histograma de los datos. Cuando lleguemos a una iteracin en la cual f#ijf#ilkm habremos encontrado el umbral que buscbamos.
npo'q7o'r'r's7t#uvsxwozy{Bws7|z{
"!#
$%!'&#(
*)+-,
-/.0213547698;:<=:><=?@>8;ABDCFEGHIJ
Este mtodo supone que los datos correspondientes a una clase siguen una distribucin normal. Realizando un anlisis de varianzas, se puede encontrar un umbral ptimo en cierto sentido minimizando la razn K2
L2
donde M N es la varianza total de los datos y OPN es la varianza entre clases (la varianza de las medias de cada clase respecto a la media global). La varianza global M N y la media total QSR de todos los datos son fciles de calcular a partir de los datos de entrada. La varianza entre clases se puede calcular como T UVWQSTXQSUZYN , donde T es la probabilidad de que un dato quede por debajo del umbral t y U es [\ T . As mismo: ^ _ bdceb 0 = ] 1 = ` = a ( ) 0 1 0 `
fhgWikjlm#nompnoqsrsl(tu
"!#
$%!'&#(
*)+%,
.0/132547698:;8<=;><>:;8<?'@BAC>D?'@E69F78G;HC>
En Teora de la Informacin, dados I posibles smbolos JK que ocurren con probabilidad LNM JK O , la entropa asociada a la fuente de informacin (en bits por smbolo) es:
= ( T ) log 2 ( T )
T
QSR
QSR
La entropa asociada a los datos cuyos valores quedan por debajo del umbral t es:
Y =
Z\[
VSW
( Z ) log 2 ( Z )
VXW
` =
ab
>
^S_
( a ) log2 ( a )
^S_
El mtodo de Pun (1981) consiste en encontrar el umbral t que maximiza la suma cDdefcDg . Esto es equivalente a maximizar la funcin h Mji O definida como sigue: o o log r log(1 r ) kml n r n r l l ( )= + 1 pmq pmq n s log(max{ t | }) n s log(max{ t | > }) donde
u y
w = { =
xw
v z
v x log x z | log |
} =
~ \
El mtodo de Kapur (1985) es una variacin del mtodo de Pun en la cual se definen independientemente las distribuciones de probabilidad para cada clase. Se trata de minimizar la suma cDd Mji OefcDg Mji O , donde
( )=
log 2
( ) =
1
>
log 2
"!#
$%!'&#(
*)+-,
Finalmente, el mtodo de Johannsen (1982) propone seleccionar el umbral de tal forma que se minimice la interdependencia entre las clases. Se persigue la minimizacin de ./1032 4657.89032 4 :
; > ( ) = log
?@
<
? + C
?@
1
<
B E ( ) = log
F G H
F +
FG
1
C
C C G ( ) + F D D FH F >G
"!#
$%!'&#(
*)+-,
-/.021435#68795,:;3<=9>?@79<3<
En teora de conjuntos clsica, un elemento pertenece o no pertenece a un conjunto. En teora de conjuntos difusos, un elemento A pertenece a un conjunto S con un grado de pertenencia BC . Al seleccionar un umbral D , la media de los datos correspondientes a cada clase es EGF y EGH . La funcin de pertenencia a cada clase viene definida por:
K/LMJ
N >N
K/LMJ
Una forma de seleccionar el valor del umbral se basa en la entropa de un conjunto difuso, que se calcula usando la funcin de Shannon:
Q Q Q Q Q R ( ) = log (1 ) log(1 )
SUT
( )=
V1
X YZX [ ( \ ( )) ( )
^
2
( )=
d
| a ( ) a b
d
( )|2
donde
c ( ) = 1 c ( )
"!#
$%!'&#(
*)+,)
/10'230'4'4'536#79810'2;:#<>=?@12;:BA53235(C@781D92E@F0G7HA(?DIKJ(@9810:#7F4'D#7ML:#7HAD>815 N#:#OD
P <>=?@1235(C@14'536#7F:BA53235(C@781D92E@%N#:#714'536#7QI?DI":0GORA(@QI"D#?TS#@UV0G?
"!#
$%!'&#(
*)+-,.
.0/132546467458:9<;-=<8:7
El histograma de los datos puede considerarse como una combinacin de dos distribuciones de probabilidad (las dos clases >?A@CBDFE G y HIE(D?KJLG ). Estas distribuciones suelen considerarse distribuciones normales, por lo que el histograma es una aproximacin de Q Q ( 1 ) 2 ( 2 )2 2 2 1 1 MON P P 2 1 2 2
( )=
1 2
2 2
RTS
H<@ UWV
REl X error mnimo se alcanza cuando seleccionamos como umbral el valor para el cual H<@ U . Tomando logaritmos en ambos lados de la ecuacin podemos obtener Y Z Y Z 2 2
( 1 ) + log 1 2 log 12
( 2 ) + log 2 2 log 2 2
R Los valores de [ , y son desconocidos y su estimacin es difcil. Kittler e Illingworth (1986) propusieron la minimizacin de la siguiente funcin para obtener el valor del umbral:
1 + 2( 1 ( ) log 1 ( ) +
\^] ] \
2( 1 ( ) log
\^] _a`
1( ) =
\^] bdc
1( ) +
2 ( ) log
( ) log 2 ( ) )
] ] \
2 ( ))
en la cual
e5f
()
g
(h ) =
u
() l5m ikj
>
1 ( ) =
s5t
oqpko
() ()
{
2
2 ( ) =
2 2 ( )=
yz
>
vqwdv
() ()
( )( 2 ( ) )
2 2
12 ( ) =
|k}~}
( )( 1 ( ))
1
( )
5
>
()
"!#
$%!'&#(
*)+-,,
"!#
$%!'&#(
*)+-,'.