Вы находитесь на странице: 1из 7

See

discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/239611582

ANÁLISE DA VARIAÇÃO DE TEXTURA EM


IMAGENS MAMOGRÁFICAS PARA
CLASSIFICAÇÃO DE MASSAS SUSPEITAS

Article

CITATIONS READS

0 40

4 authors, including:

P. B. Ribeiro Roseli A. F. Romero


16 PUBLICATIONS 30 CITATIONS University of São Paulo
150 PUBLICATIONS 824 CITATIONS
SEE PROFILE

SEE PROFILE

All content following this page was uploaded by Roseli A. F. Romero on 18 September 2014.

The user has requested enhancement of the downloaded file.


ANÁLISE DA VARIAÇÃO DE TEXTURA EM IMAGENS
MAMOGRÁFICAS PARA CLASSIFICAÇÃO DE MASSAS SUSPEITAS

P. B. Ribeiro1, H. Schiabel1, A.C. Patrocinio2 e R. A. F. Romero3


1
USP/Departamento de Engenharia Elétrica, São Carlos, Brasil
2
UNIFESP/Departamento de Diagnóstico de Imagem, São Paulo, Brasil
3
USP/Departamento de Ciências Matemáticas e Computação, São Carlos, Brasil
bellin@sel.eesc.usp.br

Abstract analisados de acordo com o tamanho, contorno, limites e


densidade, Figura 1[1].
In this paper, a method for the classification of
mammary mass is proposed aiming to help the specialists
as a second opinion. For this, initially the texture, very
important for analyze of the mass, intensity and
geometric descriptors have been extracted from Regions
of Interest. Next, some methods of selection of attributes Figura 1: Formato típico dos Nódulos mamários.
have been considered. They are Self-Organizing Map
(SOM), Gaussian funcitons. Finally, the selected Segundo Kopans [1] a margem entre uma lesão e o
attributes have been used for training of neural tecido circunvizinho, Figura 2, é um dos fatores mais
networks: Multi-Layer Perceptron (MLP) for classifying importantes na determinação da benignidade ou
2 and 5 different kinds of breast masse. malignidade de uma massa. As bordas da massa, segundo
a American College of Radiology, podem ser divididas
em cinco contornos: circunscrita, obscurecida,
1. Introdução
microlobulada, mal definida e espiculada.
O câncer de mama é o que mais mata mulheres.
Como suas causas ainda não são bem conhecidas, a
prevenção, através dos exames de rastreamento das
mamas, como mamografia, ultra-sonografia, exame
clínico e o auto-exame, é a única maneira de reduzir a
mortalidade de mulheres com câncer de mama, pois a
detecção precoce aumenta as chances de cura
substancialmente [1,2]. Figura 2: Tipos de formato da borda da massa

A mamografia é considerada o exame de maior Nas últimas duas décadas diversos trabalhos
sensibilidade para o rastreamento do câncer de mama utilizando técnicas de Processamento de Imagens,
devido a sua sensibilidade. Porém, a interpretação de Reconhecimento de Padrões, Visão Computacional e
lesões numa mamografia uma tarefa complexa para os Inteligência Artificial vêm sendo desenvolvidos, como
especialistas, de cuja experiência depende um diagnóstico parte de esquemas Computer Aided Diagnosis (CAD), os
preciso [3]. quais podem funcionar como uma segunda opinião aos
radiologistas quanto à localização e à natureza destas
Distorções na interpretação e classificação de lesões estruturas [6,7].
suspeitas por especialistas implicam um número maior de
biópsias desnecessárias [4]. Ou seja, entre 65% a 85% Este trabalho tem como objetivo mostrar dois
das biópsias de mama são realizadas em lesões benignas experimentos que utilizam técnicas de processamento de
[5]. imagens aplicadas a imagens mamograficas, utilizando
os descritores de Haralick para analisar as variações de
As principais lesões identificadas na mamografia textura, ou seja, a textura contida em uma imagem de um
são: as microcalcificações, um dos primeiros indícios de nódulo espiculado é visualmente diferente de uma
formação de tumores com grau elevado de suspeita de imagem com contorno circular ou circunscrito. Com base
malignidade, e os nódulos, que são responsáveis por nessas informações, nosso estudo focou a utilização de
grande parte dos casos de câncer de mama e devem ser atributos de textura sem e com associação com outros
descritores a fim de classificar imagens de nódulos nódulos, segundo a padronização BI-RADS [1],
mamários em imagens com ou sem nódulos e em cinco conforme Tabela 1. Das 135 RIs, foram selecionadas
categorias de contorno de nódulos. 110 para o treinamento da rede MLP e esse conjunto
é formado por 22 imagens correspondentes a cada
2. Metodologia uma das cinco classes estudadas: circunscrita (classe
O presente trabalho trata da classificação de imagens 1), obscurecida (classe 2), microlobulada (classe 3),
mamográficas e foi desenvolvido em várias etapas. mal definida (classe 4) e espiculada (classe 5).
Foram utilizadas diversas técnicas de extração de Exemplos dessas classes podem ser visualizados
atributos, tais como: descritores de textura de Haralick através da Figura 5.
[9], descritores de intensidade [10] e geométricos [11]. Tabela 1: Levantamento de imagens laudadas por
Como classificador, utilizou-se a Rede Neural Multi- contorno.
Layer Perceptron (MLP). Também foram aplicadas Contornos Qtd. Nomes dos contornos
Redes Neurais Self-Organizing Map (SOM) e Gaussianas descritos nos laudos
para selecionar os atributos mais significativos. Circunscrito 31 Bem Definido
2.1. Base de Imagens Obscurecido 25 Parcialmente Definido
Microlobular 29 Bocelado
As mamografias utilizadas nos experimentos foram Mal Definido 22 Mal Definido
obtidas através do banco de imagens mamográficas do Espicular 28 Espiculado
LAPIMO (Laboratório de Análise e Processamento de
Total 135 Imagens
Imagens Médicas e Odontológicas), disponíveis também
em http://lapimo.sel.eesc.usp.br/bancoweb. As imagens
mamográficas foram digitalizadas em um scanner a laser
Lumiscan 50, com 12 bits de resolução de contraste e
com uma resolução espacial de 0,15 mm por pixel.
Para a realização deste trabalho, foram utilizados dois
conjuntos de regiões de interesse (RIs):
1º. Conjunto de RIs: 120 RIs de tamanhos variados, a) Circunscrita b) Obscurecida
selecionadas de acordo com laudos médicos
fornecidos junto com as mamografias, sendo 60
contendo nódulos e 60 normais. As Figuras 3 e 4
mostram exemplos das imagens com nódulos e sem
nódulos respectivamente.

c) Microlobulada d) Mal Definida

Figura 3: Exemplo de RIs com nódulos.

e) Espiculada
Figura 5: Exemplo de RIs utilizadas para os testes,
representando cada uma das 5 classes de contorno.
2.1. Atributos de Textura
Figura 4:- Exemplo de RIs de mama normais. O atributo de textura pode ser representado de forma
estatística utilizando-se da matriz co-ocorrência de níveis
2º. Conjunto de RIs: 135 RIs de tamanhos variados de cinza Spatial Grey-Level Dependence (SGLD) que
foram identificadas por um especialista. Todas as calcula a ocorrência combinada de direção e distância
imagens selecionadas foram laudadas com base nas entre pares de pixel com valores de tonalidade
caracterizações dos cinco tipos de contornos de semelhantes, separados por uma distância "d", na
orientação "θ". Em outras palavras, p(i,j) indica a O objetivo da RNA é calcular o erro para a camada de
freqüência de ocorrência de um par de níveis de cinza i e saída e propagá-lo no sentido saída-entrada, ajustando os
j, medido a partir de uma distância "d" e de um ângulo pesos de todas as camadas através da retropropagação do
que pode ser de 0º, 45º,90º e 135º graus [9], Figura 6. erro [8]. O treinamento possui duas fases: a forward,
utilizada para definir a saída da rede para um dado
(0,0) (0,1) (0,2) (0,3)
padrão de entrada, e a backward, que utiliza a saída
(1,0) (1,1) (1,2) (1,3) desejada e a saída fornecida pela rede para atualizar os
( 2,0) ( 2,1) (2,2) ( 2,3) pesos de suas conexões [8]. A rede MLP só será
(3,0) (3,1) (3,2) (3,3) considerada treinada quando o erro entre as saídas
obtidas e as saídas desejadas estiver reduzido a um valor
a) b) aceitável, ou seja, um valor baixo que irá depender da
aplicação para a qual a rede está sendo treinada.
0 1 0 1 0 1 1 1
1 0 2 0 1 0 0 1 Para facilitar os testes que foram realizados com as
regiões de interesse e melhorar a visualização dos dados,
0 2 2 0 1 0 0 2
foi desenvolvida uma interface gráfica para o treinamento
1 0 0 2 1 1 3 0 da Rede Neural MLP, Figura 8, facilitando a visualização
c) d) dos resultados das classes que estão sendo estudadas.

Figura 6: Cálculo de matrizes de co-ocorrência. a)


Imagem de 3x3 pixel com 4 valores de níveis de cinza
(0,1,2,3); b) Montagem da matriz de co-ocorrência, onde,
(i,j) indica o número de pixel da imagem com i números
de cinza e valor j para a direção e distância.; c) Matriz de
co-ocorrência com direção igual a 0; d) Matriz de co-
ocorrência com direção igual a 90.
Com base nos cálculos realizados sobre os valores
da SGLD, formou-se um conjunto de 14 medidas sendo
elas: Energia ou Uniformidade, Contraste, Correlação,
Variância, Momento da diferença inversa, Média da
Soma, Variância da Soma, Entropia da Soma, Entropia,
Variância da Diferença, Entropia da Diferença, Medida
de Informação de correlação 1, Medida de Informação de Figura 8: Rede MLP implementada para treinamento,
correlação 2 e Máximo Coeficiente de Correlação [9]. validação e teste.

2.2. Rede Neural Artificial 2.2.1. Treinamento


Para a classificação, foi utilizada a Rede Neural - Experimento 1: Classificação de RIs em Imagens
Artificial (RNA) Multi-Layer Perceptron (MLP), Figura com nódulo ou sem nódulos (normais)
7, com tipo de aprendizagem supervisionado.
Seis atributos de textura foram selecionados, servindo
de entrada para a rede MLP. Dentre todos os testes
realizados, a melhor topologia encontrada utiliza uma
camada intermediária com 32 neurônios e 1 neurônio na
camada de saída, taxa de aprendizagem η = 0,5. Os
resultados obtidos pelo algoritmo de classificação foram
validados pela ferramenta estatística cross validation [8].
- Experimento 2: Classificação de nódulos mamários
por Contorno
Os treinamentos foram validados pela técnica leave-
one-out [8]. Estes atributos foram utilizados como
entrada para as Redes Neurais MLP com diversas
Figura 7: Multi-Layer Perceptron (MLP). topologias, porém apenas as melhores, para cada
combinação de classes, foram selecionadas, Tabela 2.
Tabela 2: Topologias utilizadas pela Rede Neural MLP - Rede do tipo Self-Organizing Map (SOM): como
utilizando como entrada 20 atributos selecionados. essa RNA tem a propriedade de se auto-organizar e de
extrair as características comuns dos padrões de entradas,
ou seja, agrupar os padrões com características
semelhantes, ela foi utilizada para verificar os atributos
que melhor realizavam a separação das classes [8].
3. Resultados
Dois experimentos são apresentados: o primeiro tem
2.3. Seleção de Atributos como objetivo mostrar o potencial dos atributos de
Dois métodos foram utilizados nos testes para a Haralick [9] na análise da variação da textura das
seleção dos melhores atributos: imagens digitais e o segundo verifica como os descritores
de textura se comportam dependendo da complexidade da
- Distribuições Gaussianas: neste método, quanto classificação – sozinhos e em conjunto com outros tipos
menor a sobreposição das curvas, melhor o atributo de descritores como intensidade [10] e geométricos [11];
poderá representar cada padrão, conforme pode ser
visualizado na Figura 9, onde a base da curva cinza, que 3.1. Experimento 1: Classificação de RIs em Imagens
representa os nódulos normais, não sobrepõe a curva com nódulo ou sem nódulos (normais)
preta que indica a existência de nódulo. Quanto maior Um classificador Multi-Layer Percetron (MLP), foi
essa sobreposição, pior será a representação, conforme utilizado para classificar 120 regiões de interesse (RIs)
visualizado na Figura 10, onde as bases das curvas se (1º. Conjunto de RIs) em imagens com nódulos e
sobrepõem. normais.
Neste experimento todos os atributos de textura de
Haralick foram extraídos das RIs e através da utilização
de Gaussianas foram selecionados 6 atributos para o
treinamento. Os resultados da MLP, após vários
treinamentos apresentaram taxa de acerto igual a
91,50% de acerto na fase de validação e desvio padrão de
4,41, conforme Tabela 3.
Tabela 3: Resultados da MLP, tendo como entrada 6
atributos de textura selecionados pelas Gaussianas.
% de acertos por classe %
Ciclos Com Nódulo Sem Nódulo Acertos
798 100,00 83,33 91,67
836 93,33 96,67 95,00
942 83,33 100,00 91,67
959 93,33 76,67 85,00
814 86,67 100,00 93,33
Figura 9: Sem a sobreposição das curvas. 1008 90,00 80,00 85,00
777 100,00 73,33 86,67
836 93,33 96,67 95,00
883 90,00 100,00 95,00
795 100,00 93,33 96,67
Média 91,50
Desvio Padrão 4,41

3.2. Experimento 2: Classificação de nódulos


mamários por Contorno
Com base nas 110 RIs (2º. Conjunto de RIs), foram
extraídos atributos de textura, intensidade e geométricos,
Figura 10: Com sobreposição completa num total de 49 características, sendo eles:
- Todos os Descritores de textura [9]. - Descritores Geométricos: Momentos de Hu1,
Momentos de Hu4, Momento20, Compacidade,
- Descritores de Intensidade: Média de intensidade do
Irregularidade, Perímetro da lesão, Área da lesão, Área
histograma, Valor de intensidade do maior valor do
(pontos brancos) e Raio de Giração.
histograma, Menor intensidade do histograma, Maior
intensidade do histograma, Porcentagem do maior valor Estes atributos foram utilizados como entrada para as
de intensidade do histograma em relação à escala de Redes Neurais MLP com diversas topologias. Apenas os
4096 níveis, Porcentagem Maior, Ponto Médio, Ponto melhores resultados, Tabela 4, com valores altos de Az e
Mínimo, Porcentagem Total, Diferença da média para o baixo Falso Negativo (FN) foram selecionados.
menor valor de intensidade, Diferença da média para o
Tabela 4: Treinamento realizado com 20 atributos
maior valor de intensidade, Variação de intensidade
selecionados pela Rede Neural SOM e Gaussianas
global, Índice de variação de intensidade local (DI -
Densidade Integrada - que integra as diferenças das
variações locais de intensidades e a variação média,
dando uma medida que quantifica contraste entre as
partes mais claras da imagem e o restante), Quantidade
de pixels com intensidades maiores que a intensidade do
pico do histograma, Porcentagem da área da RI com
intensidade maior que a intensidade do pico do
histograma e Quantidade de níveis de cinza da RI [10]. 4. Conclusão
- Descritores Geométricos: Momentos, Momentos O uso de descritores de textura para esquemas CAD
Invariantes (MI) de Hu, perímetro, área, compacidade e vem sendo muito estudado atualmente. Embora fique
irregularidade [11]. difícil o entendimento da utilização de textura para a
As seleções foram realizadas tendo como base as classificação de contorno, por exemplo, os descritores de
cinco classes de nódulos por contorno. Foi utilizada a textura fornecem medidas, como suavidade, rugosidade e
Rede Neural SOM em conjunto com Gaussianas para a regularidade, as quais, isoladamente, não produzem bons
seleção das melhores características. Para isso foram resultados para a classificação de contorno; mas, junto
geradas 49 Gaussianas e 49 SOMs, referente aos 49 com outras técnicas, podem contribuir no que diz respeito
atributos extraídos. Com base nos resultados da Rede a informações sobre a variação de intensidade ou
SOM e da validação positiva através de distribuições alterações sutis entre o objeto e o fundo da imagem.
gaussianas, foram verificadas novas possíveis A tarefa de classificação ocorre em várias áreas da
combinações de classes [12]. atividade humana e as pesquisas na área têm sido
A Rede Neural SOM possui a seguinte topologia: na bastante direcionadas à construção de procedimentos
fase de ordenação: 1000 iterações, com uma taxa de automáticos de classificação para esquemas CAD. Além
aprendizado η = 0,1 e raio de vizinhança r = 5; e na fase dos estudos envolvendo a classificação, outras técnicas
de convergência também foram utilizadas 1000 iterações, vêm sendo estudadas para melhorar a separação de
porém, com uma taxa de aprendizado η = 0,01 e raio de classes, reconhecimento de padrões e tomada de decisões.
vizinhança r = 1 em um mapa de 100 por 100 neurônios. Em ambos os experimentos foi possível identificar um
Após as comparações, foram selecionados 20 bom desempenho da Rede Neural Artificial MLP. No
atributos, sendo eles: primeiro experimento como estávamos lidando com
imagens que possuíam nódulos ou não, foi mais fácil
- Atributos de textura: Contraste, Entropia da obter bons resultados, 91,50% de acerto, apenas com a
Diferença, Entropia da Soma, Momentos da Diferença utilização da textura da imagem, isso porque, mesmo as
Inversa, Média da Soma e Variância; RIs possuindo estruturas densas referentes a estrutura
- Atributos de Intensidade: quantidade de níveis de física da mama as variações de textura entre uma RI com
cinza da RI, índice de variação de intensidade local (DI - nódulo é muito maior do que uma RI sem nódulo.
Densidade Integrada), diferença da média para o menor No 2º. Experimento reuniu-se a utilização de atributos
valor de intensidade, diferença da média para o maior de textura, junto com outras técnicas, como descritores de
valor de intensidade e variação de intensidade global da intensidade e geométricos para diferenciar padrões de
RI (que consiste na média da variação de intensidade de contorno com diferentes combinações de classes e com
todos os pixels da região); isso foi possível obter bons resultados sendo o mais
importante referente às cinco classes com Az igual a 0,80 [8]S. HAYKIN, Neural Networks: A Comprehensive
e baixo FN. Foundation. Macmillan Publishing Co:/ IEEE Press,
1994.
Uma dado importante a ser salientado é que para o 1º.
Experimento, antes da seleção dos melhores atributos de [9]R. M. HARALICK, K. SHANMUGAM, I.
textura, o classificador estava registrando 86,67% de DINSTEIN, “Testural Features for Image
acerto; mas, após a seleção das melhores características, Classification“. IEEE Transactions on Systems Man,
aumentou seu nível de precisão em 5,57%. Já no 2º. and Cybernetics, Vol-SMC 3, n.6, 1973.
Experimento a seleção dos melhores atributos apresentou
[10] X. H. WANG, et. al., “Computer-Assisted Diagnosis
bons resultados (valores acima de 80%) em todos os
of Breast Cancer Using a Data-Driven Bayesian
testes realizados. Mostrando, assim, que uma pré-seleção
Belief Network”. International Journal of Medical
melhora os resultados do classificador em todos os
Informatics, v. 54, pp 116-126, 1999.
modelos verificados.
[11] M. K. HU, “Visual Pattern Recognition by
Outro dado importante é que a análise realizada pelo
Moments Invariant“. IRE Trans. Inf. heory, v.8, pp.
especialista continua sendo bastante subjetiva e a
179-187, 1962.
identificação de uma lesão como suspeita ou não e sua
detecção dependem muito da experiência do médico. [12] P. B. RIBEIRO, H. SCHIABEL, A. C.
Essa é mais uma motivação para o uso de ferramentas PATROCINIO, A. F. R. ROMERO. “A Influência da
automáticas para o auxílio ao diagnóstico, que tentam Seleção de Melhores Atributos na Classificação de
fornecer uma análise baseada em dados mais objetivos Contornos de Nódulos de Mama Através de RNA”.
através de valores extraídos da própria imagem. In: XX CBEB – Congresso Brasileiro de Engenharia
Biomédica, São Pedro. 2006.
5. Referências
[1]D. B. Kopans, Imagem da Mama. Rio de Janeiro,
MEDSI, pag. 852, 2000.
[2]G. W. Mitchell Jr., L. W. Basset, Mastologia Prática.
Revinter, 1988.
[3]J. E. BALL, T.W. BUTLER, L. M. BRUCE, “Towards
Automated Segmentation and Classification of
Masses in Digital Mammograms”. Proceedings of the
26th Annual International Conference of the IEEE
EMBS, San Francisco, CA, USA, pp. 1814-1817,
2004.
[4]B. ZHENG, et al, “Detection and Classification
Performance Levels of Mammographic Masses Under
Different Computer-Aided Detection Cueing
Environments”. Academic Radiology, v. 11, ed. 4, pp.
398-406, 2004.
[5]J. E. MEYER, et al., “Biopsy of occult breast lesions:
analysis of 1261 abnormalities”. JAMA, v. 263, pp.
2341-2343, 1990.
[6]M. MAVROFORAKIS, et al., “Significance analysis
of qualitative a mmographic features, using linear
classifiers, neural networks and support vector
machines”. European Journal of Radiology, v. 54, ed.
1, pp. 80-89, 2005.
[7] K. DOI, et al., “Recent Progress in Development of
Computer-Aided Diagnosis (CAD) Schemes In
Radiology”. Medical Image Technology, v. 13, n. 6,
pp. 822-835, 1995.

View publication stats

Вам также может понравиться