Reconhecimento e Recuperação de Imagens Utilizando Redes Neurais Artificiais Do Tipo MLP

Reconhecimento e Recuperao de Imagens
Utilizando Redes Neurais Artificiais do Tipo MLP

Tlio Clber Bender1, Fernando Santos Osrio1
1
Programa Interdisciplinar de Ps-Graduao em Computao Aplicada Universidade

do Vale do Rio dos Sinos (UNISINOS)
Avenida Unisinos, 950 So Leopoldo RS Brasil
tulio@euler.unisinos.br, osorio@exatas.unisinos.br
Abstract. This paper presents an approach to the task of classification and

retrieval of bitmap images using artificial neural networks and color as
primary attribute. We also discuss about the impact of separations surfaces
drawn by the classifier during training and retrieval and we present a new
way to handle this situation.
Resumo. Este artigo apresenta uma abordagem para reconhecimento e
recuperao de imagens estticas do tipo bitmap baseado em atributos de cor
utilizando redes neurais artificiais do tipo Multilayer Perceptron. Tambm
discutido como as superfcies de separao do classificador determinadas
pelos pesos dos neurnios influenciam na preciso do reconhecimento e
apresentamos novos mecanismos de como abordar este problema.
1. Introduo
Atualmente com o aumento considervel de bases de dados de imagem e vdeo devido
s inovaes tecnolgicas tornou-se necessrio manter algum tipo de mecanismo de
indexao para posterior recuperao de dados. Executar esta indexao manualmente
uma tarefa sensvel a interpretaes subjetivas, laboriosa e sujeita a erros [ANTANI
02, SEBE 01, BRUNELLI 00, RUI 97, SMITH 96]. Mtodos automticos de indexao
e recuperao baseados em algum tipo de caracterstica (cor, forma, textura ou regio de
uma imagem) so interessantes neste contexto porque reduzem a interveno humana. A
idia de recuperao de imagens por exemplos uma extenso da idia de recuperao
de pginas web que contenham no texto as palavras-chave especificadas na pesquisa
(por exemplo, Google, Altavista e outros). No caso de imagens, busca-se recuperar em
uma base de dados de imagens aquelas que contenham o elemento grfico procurado
como, por exemplo, uma determinada cor, textura, forma ou a combinao destes
elementos.
Definimos imagem-exemplo como sendo um exemplo que contm o elemento
grfico procurado durante uma recuperao e que pode ser uma imagem completa,
regio de uma imagem, cor, forma ou textura. As regies de uma imagem que no so o
alvo da recuperao so denominadas de imagem-de-fundo. As caractersticas extradas
de uma imagem so atributos derivados da cor, textura e ou da forma e que denotam
alguma propriedade da imagem que pode ser utilizada para comparao entre imagens.
A comparao de caractersticas uma funo que retorna o grau de diferena entre as

caractersticas extradas das imagens.
As tcnicas de recuperao de imagens vem sendo desenvolvidas desde 1970
principalmente pelas reas de gerenciamento de banco de dados (indexao textual) e
viso computacional [RUI 97]. No mtodo baseado em indexao textual existe um
DBMS que gerencia a informao semntica anexada por uma pessoa a imagem. J nos
Content Based Image Retrieval (CBIR) [ANTANI 02] procura-se extrair
automaticamente das imagens caractersticas que as identifiquem. A partir destas
caractersticas da imagem-exemplo procura-se por caractersticas similares nas imagens
disponveis em uma base de pesquisa. As melhores similaridades so apresentadas como
resultado da pesquisa. Um exemplo de um sistema CBIR o IKONA [IKONA 02], que
est disponvel na Internet para demonstraes.
2. Abordagem Usual Para Recuperao de Imagens

A abordagem utilizada nos sistemas CBIR pode ser divida em dois subsistemas: gerao
da base de dados de imagens de pesquisa e o subsistema de pesquisa nesta base. No
subsistema de gerao da base de dados so aplicados os mtodos de extrao de
caractersticas nas imagens e seu resultado armazenado nesta base. O subsistema de
pesquisa aplica os mesmos mtodos de extrao de caractersticas na imagem-exemplo e
depois executa uma comparao entre as caractersticas extradas da imagem-exemplo e
das armazenadas na base de dados. A comparao das caractersticas est baseada numa
funo que retorna a diferena ou distncia entre as caractersticas extradas da imagemexemplo com as caractersticas de cada imagem da base de procura, portanto
executando uma comparao um-a-um. As imagens com as menores diferenas so
ento retornadas ao usurio da pesquisa como sendo as melhores candidatas. A escolha
dos mtodos de extrao e comparao utilizados, que melhor se adaptem a uma
determinada base de dados, normalmente uma responsabilidade de quem projeta e
prepara a base de imagens a ser pesquisada.
3. Aplicao da Inteligncia Artificial

Neste trabalho aplicamos tcnicas de Inteligncia Artificial (IA) para executar o
reconhecimento e recuperao de imagens bitmap a partir de caractersticas extradas
automaticamente das imagens. A aplicao faz uso de tcnicas de Machine Learning da
IA com aprendizado supervisionado, onde se optou pelo uso de Redes Neurais
Artificiais (RNA) do tipo Multilayer Perceptron (MLP) com algoritmo de aprendizado
construtivo e incremental do tipo Cascade-Correlation [FAHLMAN 91].
A escolha desta tcnica interessante pela capacidade das RNAs em obter uma
generalizao de um padro aprendido a partir de uma base de exemplos. Atravs
do
uso de RNAs se pretende obter uma generalizao do(s) modelo(s) de imagem
procurado e para isto foi desenvolvido o programa ImageMatching (IMatch) que
implementa esta abordagem. Este programa se baseia principalmente no atributo da cor
para executar a tarefa de reconhecimento, pois a identificao baseada nas cores
apresenta propriedades interessantes como a independncia da posio do padro
procurado na imagem, relativa independncia entre a escala do padro e o fundo da
imagem e da orientao do padro na imagem.
Podemos citar como aplicao do programa IMatch seu emprego nas reas de
viso computacional e robtica, levantamento automtico da ocorrncia de logomarcas e
localizao de objetos em uma cena. A seguir iremos descrever como este programa
opera e a metodologia empregada.
3.1. Mtodo de reconhecimento utilizando redes neurais artificiais
O programa IMatch realiza a extrao de caractersticas das imagens utilizando a cor
como atributo bsico (a verso atual do sistema no considera a forma dos objetos
presentes em uma cena). Sistemas unicamente baseados na cor iro recuperar imagens
com uma composio similar de cor, independentemente do contexto das imagens serem
diferentes. Apesar desta limitao, trabalhar com as cores possui algumas vantagens em
relao extrao de caractersticas baseadas em textura ou forma. A cor uma das
caractersticas mais utilizadas nos sistemas CBIR porque relativamente independente
quanto ao tamanho da regio de interesse em relao imagem-de-fundo, rotao,
escala, e ocluso parcial da imagem-exemplo, sendo computacionalmente menos cara
do que os outros mtodos [ANTANI 02, CIOCCA 01, RUI 97]. Alm disto, esta
abordagem permite que seja definida uma composio de cores (conjunto simultneo de
cores), o que permite caracterizar adequadamente muitos objetos e cenas.
A abordagem utilizando RNAs requer que exista uma fase de treinamento da
rede. Isto implica que a arquitetura do IMatch tambm possua um subsistema de gerao
da base de aprendizado de imagens e um subsistema de pesquisa (reconhecimento de
imagens) na base. A Figura 1 apresenta o modelo esquemtico do IMatch. No
subsistema de gerao da base de imagens prepara-se uma base que ser utilizada para
treinar a RNA. Esta base deve conter imagens de treinamento de duas categorias que
denominaremos de: Classe e No-Classe. As imagens da categoria classe so imagensexemplo representantes do que se pretende que a RNA aprenda a reconhecer na procura
(por exemplo, logotipos, latas de Coca-Cola, placas, sinalizaes, etc). A categoria NoClasse contm imagens-exemplo que no so relacionadas com a categoria Classe
(tipicamente imagens-de-fundo) e servem para que a RNA aprenda a delimitar o espao
de procura para imagens da categoria Classe. Estas imagens de treinamento so
extradas de regies retangulares de imagens que contenham a Classe/No-Classe.
Devemos definir o tamanho desta regio de acordo com o tipo de imagens de
treinamento disponvel. Quanto maior for esta regio em relao ao objeto a ser
reconhecido, menor ser a preciso de localizao da Classe procurada porque ir
ocorrer uma maior contribuio do fundo da imagem. Se a regio escolhida for muito
pequena em relao ao objeto perde-se em generalizao dos atributos que compem a
Classe. No nosso caso escolhemos uma regio de 64 x 64 pixels, para os experimentos
que sero descritos a seguir.
A partir desta base de imagens de treinamento ento realizada uma extrao de
caractersticas principalmente referentes cor utilizando o sistema de cor RGB ou HSV
(Figura 1, Subsistema de Treinamento). Para cada imagem da base de treinamento
aplica-se o mtodo de reduo de cor Median Cut [GOMES 94] que resulta numa paleta
de N cores e, ento se calcula o histograma de cores desta paleta. O resultado da
extrao de caractersticas um vetor de caractersticas de tamanho igual a N * 4, onde
N a quantizao de cores aplicada, sendo que para cada trs conjuntos de componentes
(RGB ou HSV) possumos uma freqncia de ocorrncia da cor (histograma). Este vetor
normalizado uniformemente para o intervalo [0, 1] e atribui-se um rtulo conforme a

categoria da imagem de treino (1 0 para Classe e 0 1 para No Classe). Os vetores
contendo as componentes da paleta de cores, histograma e a classe correspondente so
fornecidos RNA. O treinamento da RNA feito externamente ao IMatch utilizado o
programa NeuSim [OSRIO 99] que simula o aprendizado de uma RNA MLP usando o
algoritmo Cascade-Correlation. A generalizao obtida pela RNA pode ser entendida
como o reconhecimento da assinatura que caracteriza a coleo de imagens de
treinamento. Esta assinatura aprendida a partir de uma coleo inicial de imagens
ento reconhecida pela RNA usando as caractersticas extradas da imagem-exemplo.
Deste modo no estamos mais executando uma comparao um-a-um, mas sim uma
comparao com o modelo generalizado de N imagens, o que um diferencial em
relao s tcnicas atuais para recuperao de imagens.
Figura 1. Modelo esquemtico dos subsistemas utilizados no IMatch.
No subsistema de reconhecimento, o usurio informa ao programa uma imagemexemplo e o programa ir percorrer esta imagem procurando a classe aprendida no
treinamento. Neste reconhecimento, uma janela deslizante, que possui as mesmas
dimenses da janela utilizada para o treinamento, varre a imagem-exemplo com uma
sobreposio ajustvel usando um deslocamento configurvel pelo usurio (usualmente
32 x 32 pixels). Esta sobreposio contribui para que um padro tenha maior chance de
ser reconhecido atacando, em certo grau, o problema da escala. Para cada janela de
varredura aplicado o mesmo pr-processamento para extrao de caractersticas que
foi utilizado para o treinamento compondo o vetor de entrada que ser passado para o
SimNeu [OSRIO 99]. O SimNeu um simulador de RNAs que usa uma rede
previamente treinada e realiza a ativao da rede a fim de classificar os padres que lhe
so apresentados. A sada da RNA indicar se aquela regio da imagem-exemplo
similar ao padro que est sendo procurado (no caso, sada igual a 1 0). O programa
permite ainda que se especifique um critrio de limiar (threshold criteria) para ser
aplicado a sada de ativao da rede.
O mtodo de janela deslizante com sobreposio permite uma identificao mais
precisa de qual regio da imagem-exemplo possui o padro procurado, o que um
diferencial em relao a outros sistemas CBIR que somente retornam uma coleo de
imagens que atendem ao critrio de pesquisa, sem destacar quais regies da imagem
foram responsveis pela similaridade.
4. Problema das Superfcies Fechadas de Classificao

Na tarefa de reconhecimento e recuperao de imagens interessante que o mtodo
empregado recupere imagens com a menor diferena possvel entre as caractersticas
escolhidas da imagem-exemplo com as caractersticas das imagens da base de imagens
procurando evitar ao mximo falsos reconhecimentos. No contexto da classificao de
imagens utilizando RNAs isto significa evitar os falso-positivos.
Figura 2. Superfcies de Separao: A) Aberta; B) Fechada; C) Aberta com

Limiar de Padres; D) Fechada com Limiar de Padres.
Gori e Scarselli [GORI 98] apresentam um estudo sobre a utilizao de RNAs do

tipo MLP para a tarefa de classificao de padres baseada na compreenso geomtrica
das superfcies de separao obtida pelo ajuste dos pesos dos neurnios da rede. Os
autores apresentam uma anlise de que, ao contrrio dos bons resultados que vrios
trabalhos relatam, RNAs do tipo MLP utilizando critrio de limiar, no so adequados
para serem utilizadas como classificadores quando os padres apresentados RNA no
enquadram-se perfeitamente nas classes pr-definidas, portanto realizando uma rejeio
confivel do padro. Para ocorrer uma rejeio confivel de um padro necessrio que
as superfcies de classificao sejam fechadas. Ainda segundo Gori, em redes MLP com
uma estrutura piramidal, nas quais a quantidade de neurnios da camada oculta menor
que quantidade de neurnios de entrada, nunca iro ocorrer superfcies fechadas de
classificao. Caso a quantidade de neurnios da camada oculta seja maior que a
quantidade de neurnios de entrada, no h garantia de ocorrer superfcies fechadas de
classificao, e determinar esta condio um problema da classe NP-Hard [GORI 98].
Os autores do artigo sugerem que os casos de sucesso no uso de RNAs do tipo MLP
para a tarefa de classificao se deve ao pr-processamento aplicado aos dados e a
natureza destes dados.
Para exemplificar a proposta de Gori e Scarselli, treinou-se uma RNA do tipo
MLP com a topologia de duas entradas, cinco neurnios na camada oculta e um
neurnio de sada utilizando o algoritmo de aprendizado back-propagation. Foram
utilizadas duas classes para os padres de aprendizado que foram denominadas de
Nuvem0 e Nuvem1. Os padres foram gerados aleatoriamente com uma disperso maior
para os padres do rtulo Nuvem0. O objetivo verificar se aumentado quantidade de
padres Nuvem0 em torno dos padres Nuvem1 consegue-se que a RNA determine
superfcies de separao fechadas em torno dos padres Nuvem1. Na Figura 2A tem-se
um exemplo de uma superfcie aberta de separao. As retas plotadas, y0(x) a y4(x),
representam as superfcies de separao determinadas pelos pesos dos neurnios da
camada oculta e neste caso as suas interseces no determinam um polgono em torno
de todos os padres Nuvem1. A Figura 2C apresenta sobreposto aos padres de
treinamento e s retas, os padres de entrada para os quais a RNA treinada teve a sua
sada ativada (padres da classe Nuvem1), utilizando valor de limiar de 0.8 e 0.2.
Podemos verificar neste exemplo que a RNA classifica os padres de entrada
pertencentes regio da classe Nuvem0 como sendo pertencentes da classe Nuvem1,
portanto sem executar uma rejeio confivel dos padres da classe Nuvem0. As
Figuras 2B e 2D demonstram como o aumento de padres Nuvem0 permitiu que a RNA
ajustasse seus pesos de maneira mais adequada e determinasse uma superfcie fechada
de separao em torno dos padres Nuvem1. As retas determinam um polgono bem
prximo aos padres Nuvem1. Na Figura 2D podemos observar que se utilizando um
limiar de valor 0.8 a RNA ir executar uma rejeio confivel dos padres Nuvem0 e ir
classificar corretamente padres da classe Nuvem1.
A anlise destes resultados nos levou a considerar que embora o trabalho de Gori
indique que no h garantia de haver superfcies de classificao fechadas, elas so
possveis de se obter se conseguirmos fornecer padres de treinamento que cerquem a
regio daqueles padres que queremos que a RNA classifique como pertencentes
classe procurada na imagem. Fornecer estes padres no contexto de recuperao de
imagens factvel e isto nos levou a duas abordagens para tentar obter as superfcies de
classificao fechadas que iremos abordar nas prximas sees.
4.1. A influncia das superfcies de classificao na recuperao de imagens
O reconhecimento e recuperao imagens produz um vetor de entrada com uma
variabilidade muito grande nos padres que o compe. O nmero de combinaes de
cores e propores em que elas ocorrem numa imagem extremamente grande. Esta
variabilidade principalmente problemtica nas regies da imagem que no contm o
padro procurado (imagem de fundo). Isto implica que os padres apresentados a RNA
durante uma procura possuam grande probabilidade de se encontrarem fora do domnio
dos padres de treino. Como vimos na seo anterior, quando ocorre esta situao,
RNAs do tipo MLP que no possurem regies fechadas de classificao no podero
executar uma rejeio confivel, ocasionando assim um falso reconhecimento. Durante
nossos experimentos com o IMatch foi verificada esta situao. Os resultados obtidos
apresentaram mais falso-positivos do padro Classe do que o no reconhecimento do
padro Classe
4.2. Abordagem para Fechar as Superfcies de Classificao
Nossa primeira abordagem (Regies de Imagens) para se obter uma superfcie de
classificao fechada, ou quase fechada, foi utilizar regies de algumas imagens
classificadas erroneamente como pertencentes categoria Classe, incluindo-as como
exemplos de No-Classe na base de treinamento e executando um novo treino da RNA.
O sistema Ikona emprega uma abordagem similar de refinamento. Aps a determinao
dos mtodos de extrao e comparao de caractersticas, executam-se simulaes de
recuperao na base preparada. O usurio pode ento executar um refinamento
especificando nas imagens recuperadas, imagens como sendo exemplos positivos ou
negativos que o sistema ir utilizar para melhor refinar as pesquisas futuras. O ponto
negativo desta abordagem obter uma RNA especializada para determinada base de
imagem. Modificaes no contedo da base de imagens tornariam necessria uma nova
simulao de recuperao e talvez um novo refinamento.
A segunda abordagem (Nuvem de No-Classe) para fechar as superfcies de
classificao visou reduzir a especializao resultante de se utilizar regies de imagens
da base de pesquisa disponvel e aumentar a automatizao do processo. Para isto
procuramos gerar automaticamente exemplos de No-Classe que preenchessem o
espao de cores (conforme foi visto na Figura2D, a incluso de exemplos de Nuvem0
permitiu que a RNA ajustasse os pesos para determinar uma superfcie fechada de
classificao) para serem utilizadas no treinamento da RNA junto com exemplos de
No-Classe provenientes de regies de imagens. O mtodo utilizado foi gerar novos
padres aleatoriamente utilizando uma distribuio uniforme para as n triplas de cores e
n histogramas. Podemos citar como desvantagem o fato desta abordagem ser do tipo
fora-bruta.
5. Resultados
Experimentos foram realizados utilizando uma RNA treinada para reconhecer latas de
Coca-Cola. A base de treinamento foi confeccionada a partir de regies de 64 x 64
pixels de imagens fotogrficas obtidas com cmera fotogrfica digital em condies no
controladas de iluminao. Foram utilizadas 1000 regies de imagens de latas de CocaCola de diferentes tipos, ngulos e aproximao como exemplos do padro Classe, e
1000 regies de imagens diversas (sem conter latas de Coca-Cola na sua composio)
como exemplos do padro No-Classe. A Figura 3 apresenta algumas das imagens
utilizadas como exemplo para os padres. A Figura 4 mostra o conjunto de imagensexemplo utilizadas na comparao das abordagens para o fechamento das superfcies de
classificao. As figuras 4A a 4D foram escolhidas para demonstrar a robustez do
mtodo quanto rotao, variao de iluminao e escala do objeto procurado na cena.
E as figuras 4E e 4F so cenas com uma grande variao de objetos e composio de
cores. O sistema de cor utilizado foi o RGB com uma reduo para 5 cores. O passo de
varredura utilizado foi 32 x 32 pixels e um limiar de 0,96.
Figura 3. Exemplo de imagens de treinamento dos padres Classe (latas de

Coca-Cola na primeira linha) e No-Classe (segunda linha).
Figura 4. Imagens utilizadas na comparao das abordagens para fechamento

das superfcies de classificao.
A Tabela 1 apresenta a contagem de regies de 64 x 64 pixels que foram classificadas

como sendo pertencente categoria Classe utilizando como mtodo para fechamento de
superfcies de classificao a abordagem Regies de Imagens. A tabela mostra a
quantidade de erros (E) e acertos (A) para seis refinamentos (E1,A1 a E6,A6). Para as
imagens 4A a 4D nos seis refinamentos o mtodo no apresentou contribuies, mas
tambm no causou falsos reconhecimentos.
A Figura 5 mostra um exemplo do reconhecimento para a imagem-exemplo F utilizando
a abordagem Regies de Imagens. A imagem da esquerda o reconhecimento sem
nenhum refinamento, executado apenas com o treinamento original da RNA, e a figura
da direita aps seis refinamentos, cada um deles incluindo algumas regies que no
foram classificadas corretamente como exemplos de No-Classe. Observa-se que ainda
existem regies classificadas erroneamente, mas com uma reduo significativa.A
Tabela 2 apresenta a contagem de regies de 64 x 64 pixels que foram classificadas
como sendo pertencente categoria Classe utilizando como mtodo para fechamento de
superfcies de classificao a abordagem Nuvem de No-Classe. A cada refinamento

foram adicionados cem exemplos de No-Classe na base de treinamento. A tabela
mostra a quantidade de erros (E) e acertos (A) para seis refinamentos (E1,A1 a E6,A6).
Verifica-se que este mtodo menos eficiente na reduo dos falso-positivos quando
comparamos com a abordagem anterior.
Figura 5. Exemplo de reconhecimento da imagem-exemplo F no primeiro e no

ltimo refinamento para a abordagem Regies de Imagens.
Tabela 1. Contagem de erros (E) e acertos (A) de regies reconhecidas como
Classe durante seis refinamentos utilizando a abordagem Regies de
Imagens.
Imagem
E1
A1
E2
A2
E3
A3
E4
A4
E5
A5
E6
A6
11
10
10
10
11
10
11
14
35
38
39
17
17
Tabela 2. Contagem de erros (E) e acertos (A) de regies reconhecidas como

Classe durante seis refinamentos utilizando a abordagem Nuvem de NoClasse.
Imagem
E1
A1
E2
A2
E3
A3
E4
A4
E5
A5
E6
A6
10
10
11
14
11
18
35
25
39
32
31
28
6. Concluses e Perspectivas
Com esta abordagem baseada em tcnicas de Inteligncia Artificial e aprendizado
(Machine Learning) pretende-se melhorar a preciso da recuperao de imagens. O uso
de um conjunto de imagens, no lugar de uma nica imagem, nos permite focar melhor
o processo de busca e recuperao de imagens em bases de dados. Apresentamos um
embasamento terico e uma verificao prtica da necessidade de se considerar como

uma RNA do tipo MLP ir executar uma classificao de padres (e sua rejeio)
baseado nas superfcies de separao. Tambm apresentamos duas abordagens para
melhorar o ajuste das superfcies de separao no problema de recuperao e
classificao de imagens baseados em atributos de cor atravs da incluso de padres de
treinamento do tipo No-Classe.
Baseado nos resultados obtidos verifica-se que para uma base de dados
conhecida a melhor abordagem em termos de preciso a Regies de Imagens e que
ainda necessrio melhorar a abordagem de Nuvem de No-Classe no sentido de
determinar uma melhor estimativa de quantos exemplos devero ser gerados e como
distribu-los visando diminuir a quantidade de refinamentos e evitar que estes exemplos
invadam a regio dos padres Classe.
Referncias
ANTANI, S. et alii. (2002) A survey on the use of pattern recognition methods for
abstraction, indexing and retrieval of images and video., Pattern Recognition,
Amsterd, Pases Baixos, Elsevier Science B.V., n. 35, p. 945-965.
BRUNELLI, R.; MICH, O. (2000) Image Retrieval by Examples., IEEE
TRANSACTIONS ON MULTIMEIA, IEEE, v.20, n.3, p. 164-171.
CIOCCA, G. et alii. (2001) On Pre-Filtering with Retinex in Color Image Retrieval,
Internet Imagin II, Proceedings of SPIE. V.4311, p. 140-147.
GOMES, J.; VELHO, L.. Computao Grfica: Imagem. (1994) IMPA/SBM, Rio de
Janeiro, Brasil, p. 424.
IKONA IRNIA / IMEDIA Project Research Team. (2002) http://wwwrocq.inria.fr/imedia/ikona (visitado em 10/10/2002).
OSRIO, F. S.; AMY, B.. (1999) INSS: A hybrid system for constructive machine
leaning., Neurocomputing. Amterd, Pases Baixos, Elsevier Science B.V., v. 28, p.
191-205.
FAHLMAN, S. E.; LEBIERE, C. (1991) The Cascade-Correlation Learning
Algorithm, Advances in Neural Information Processing Systems 3, D. S. Touretzky
(ed.), Morgan Kaufmann, Los Altos CA, p. 190-196.
GORI, M.; SCARSELLI, F. (1998) Are Multilayer Perceptrons Adequate for Pattern
Recognition and Verification ?, IEEE Transactions on Pattern Analysis and Machine
Intelligence, v.20, n.11, Nov. 1998.
Rui, Y. et alii. (1997) Image Retrieval: Past, Present, and Future., International
Symposium on Multimedia Information Processing, Taipei.
SEBE, N.; LEW, M. S. (2001) Color-Based Retrieval., Pattern Recognition Letters,
Amsterd, Pases Baixos, Elsevier Science B.V., n. 22, p. 223-230.
SMITH, J. R.; CHANG, S. (1996) Tools and Techniques for Color Image Retrieval.,
IS&T/SPIE In Symposium on Electronic Imaging: Science and Technology - Storage
& Retrieval for Image and Video Databases IV, San Jose, CA. v. 2670.

Reconhecimento e Recuperação de Imagens Utilizando Redes Neurais Artificiais Do Tipo MLP

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Reconhecimento e Recuperação de Imagens Utilizando Redes Neurais Artificiais Do Tipo MLP

Загружено:

Авторское право:

Доступные форматы

Reconhecimento e Recuperao de Imagens

Utilizando Redes Neurais Artificiais do Tipo MLP

Programa Interdisciplinar de Ps-Graduao em Computao Aplicada Universidade

Abstract. This paper presents an approach to the task of classification and

A comparao de caractersticas uma funo que retorna o grau de diferena entre as

2. Abordagem Usual Para Recuperao de Imagens

3. Aplicao da Inteligncia Artificial

normalizado uniformemente para o intervalo [0, 1] e atribui-se um rtulo conforme a

Figura 1. Modelo esquemtico dos subsistemas utilizados no IMatch.

4. Problema das Superfcies Fechadas de Classificao

Figura 2. Superfcies de Separao: A) Aberta; B) Fechada; C) Aberta com

Gori e Scarselli [GORI 98] apresentam um estudo sobre a utilizao de RNAs do

Figura 3. Exemplo de imagens de treinamento dos padres Classe (latas de

Figura 4. Imagens utilizadas na comparao das abordagens para fechamento

A Tabela 1 apresenta a contagem de regies de 64 x 64 pixels que foram classificadas

superfcies de classificao a abordagem Nuvem de No-Classe. A cada refinamento

Figura 5. Exemplo de reconhecimento da imagem-exemplo F no primeiro e no

Tabela 2. Contagem de erros (E) e acertos (A) de regies reconhecidas como

embasamento terico e uma verificao prtica da necessidade de se considerar como

Вам также может понравиться