Академический Документы
Профессиональный Документы
Культура Документы
• Ao Image, que, literalmente, se ferrou sozinho pra me proteger, sem o qual este
trabalho não teria sido concluído, pelo menos não por mim.
• À Technical Ship Engenharia, na pessoa do meu pai, pelo apoio financeiro para
a impressão deste trabalho.
(PADI). Cada caso envolve uma escala diferente (milimétrica, micrométrica e nanométrica) e
apresenta complexidade em um diferente aspecto de PADI. Deste modo, juntos, estes três casos
oferecem um panorama abrangente das técnicas de PADI, assim como de sua aplicação na
caracterização de materiais.
crítica. Um procedimento, que, à primeira vista, parece fácil, demanda uma complexa rotina
diferentes, de mesmas espécies de bambu, apresentaram grande semelhança nas classes dos
caracterização por forma e sua maior dificuldade reside na escolha dos atributos descritores da
forma das partículas de grafita, sendo realizado um extenso estudo para isto. Como resultado,
uma abordagem diferente. Não há etapa de segmentação e as medidas são feitas diretamente
sobre as imagens originais do material. A caracterização é feita a partir da textura das imagens
quantidade de camadas de carbono dispersas na matriz de resina, o que justifica variações das
characterization through the use of Digital Image Processing and Analysis (DIPA). Each case
involves a different scale (millimeters, microns and nanometers) and presents complexity in a
different aspect of the DIPA sequence. Thus, together, the three case studies cover a broad range
The first case (Analysis of the Mesostructure of Bamboos) has the segmentation as
critical step. Although simple at first sight, the procedure requires a complex recursive procedure
to cluster sclerenchyma regions to reconstruct the vascular bundles. However, once the
plants belonging to the same species showed great similarity in the prevailing classes of vascular
In the second case study (Automatic Classification of Graphite in Cast Iron), the DIPA
sequence is substantially simpler. Nevertheless, this is a shape characterization problem and its
greatest difficulty resides in the choice of appropriate shape parameters to describe the graphite
particles. This required an extensive study. As a result, classification rates close to 100% were
achieved.
different approach. There is no segmentation step and the measurements are made directly on the
original images. The characterization is based on image texture (Haralick parameters). The
results confirm the hypothesis that during the manufacture of the composite material, graphite
nano-particles are eroded leading to a substantial amount of carbon layers dispersed in the resin
matrix. This is compatible with variations in the dieletric properties of the material reported in
the literature.
SUMÁRIO
1 INTRODUÇÃO .......................................................................................... 1
III
3 ANÁLISE DA MESOESTRUTURA DE BAMBUS ............................... 86
3.1 Introdução ..................................................................................................................... 86
3.2 Métodos Experimentais ................................................................................................. 90
3.2.1 Treinamento e Validação..................................................................................... 90
3.2.2 Classificação ....................................................................................................... 91
3.2.2.1 Segmentação do bambu .......................................................................... 92
3.2.2.2 Escamação do bambu ............................................................................. 96
3.2.2.3 Segmentação dos conjuntos vasculares ................................................... 98
3.2.2.4 Segmentação das regiões de esclerênquima .......................................... 101
3.2.2.5 Extração dos atributos .......................................................................... 103
3.2.2.6 Classificação ........................................................................................ 105
3.3 Resultados e Discussões .............................................................................................. 105
6 CONCLUSÕES....................................................................................... 138
IV
LISTA DE ILUSTRAÇÕES
Figura 1. Seqüência padrão de PADI...................................................................................... 5
Figura 2. Um exemplo de problema de PADI: (a) imagem original; (b) imagem das partículas
de grafita (regiões); (c) área de cada partícula; e (d) distribuição das áreas. ........... 7
Figura 3. Imagem digital. ....................................................................................................... 8
Figura 4. Resolução e profundidade. .................................................................................... 10
Figura 5. Brilho e contraste. ................................................................................................. 14
Figura 6. Operação de negativo: (a) função de mapeamento; (b) imagem original; (c) imagem
negativo; (d) histograma da imagem original; e (e) histograma do negativo......... 18
Figura 7. Exemplo de operação de Normalização para expansão do contraste....................... 20
Figura 8. Funções de mapeamento logarítmica (a) e exponencial (b). ................................... 24
Figura 9. Exemplo de função de mapeamento linear por partes. ........................................... 25
Figura 10. Equalização do histograma: (a) imagem original com seu histograma; e (b) imagem
com seu histograma equalizado. .......................................................................... 27
Figura 11. Operações entre imagens. .................................................................................... 30
Figura 12. Operações locais. ................................................................................................ 31
Figura 13. Filtros passa-baixa 3x3: (a) média; (b) gaussiana. ................................................ 33
Figura 14. Correção de iluminação irregular: (a) imagem original; (b) fundo calculado; e (c)
imagem com iluminação corrigida....................................................................... 35
Figura 15. Filtros passa-alta 3x3: (a) passa-alta básico; (b) alto reforço. ............................... 35
Figura 16. Operadores cruzados de gradiente de Roberts...................................................... 37
Figura 17. Filtro laplaciano 3x3............................................................................................ 38
Figura 18. Operações geométricas........................................................................................ 39
Figura 19. Exemplo de segmentação: (a) imagem em 256 tons de cinza; (b) imagem binária.
........................................................................................................................... 40
Figura 20. Exemplo de limiarização bi-modal: (a) imagem original; (b) tom de corte; (c)
imagem binária. .................................................................................................. 41
Figura 21. Exemplo de limiarização tetra-modal: (a) imagem em 256 tons de cinza; (b) tons
de corte; (c) imagem quaternária. ........................................................................ 42
Figura 22. Comparação entre métodos limiarização automática: (a) imagem em 256 tons de
cinza; (b) corte no ponto de mínimo; (c) corte pelo método de Otsu; (d) imagem
segmentada pelo método dos mínimos; e (e) imagem segmentada pelo método de
Otsu. ................................................................................................................... 44
Figura 23. Comparação entre a segmentação de Otsu e a limiarização adaptativa: (a) imagem
em 256 tons de cinza; (b) imagem da segmentação de Otsu; e (c) imagem da
limiarização adaptativa........................................................................................ 45
Figura 24. Exemplo de segmentação conjunta por limiarização e Marr-Hildreth: (a) imagem
em tons de cinza; (b) imagem da limiarização; (c) imagem da segmentação de
Marr-Hildreth; e (d) interseção entre as imagens (b) e (c). ................................... 46
Figura 25. Operações lógicas básicas (NOT, AND e OR)..................................................... 48
Figura 26. Operação lógica XOR. ........................................................................................ 49
Figura 27. Erosão e dilatação. .............................................................................................. 50
Figura 28. Elementos estruturantes 3x3: (a) conectividade 4; (b) conectividade 8................. 51
Figura 29. Extração de bordas. ............................................................................................. 51
Figura 30. Preenchimento de buracos (hole filling)............................................................... 52
Figura 31. Eliminação de objetos que tocam na borda da imagem (border object killing). .... 52
Figura 32. Extração de objetos marcados (object marking)................................................... 53
V
Figura 33. Eliminação de objetos por área (scrapping). ........................................................ 53
Figura 34. Comparação entre as operações de propagação com elemento estruturante
(conectividade 4) e EDM..................................................................................... 54
Figura 35. Mapa de Distâncias Euclidianas (EDM). ............................................................. 55
Figura 36. Erosão e dilatação a partir do EDM: (a) imagem binária inicial; (b) complemento
da imagem binária inicial; (c) EDM (com look-up table); (d) EDM do
complemento (com look-up table); (e) erosão (10 passos); e (f) dilatação (10
passos). ............................................................................................................... 56
Figura 37. Abertura e fechamento: (a) imagem binária inicial; (b) abertura (10 passos); e (c)
fechamento (10 passos). ...................................................................................... 57
Figura 38. Erosão derradeira e transformada do eixo medial: (a) imagem binária inicial; (b)
erosão derradeira; e (c) transformada do eixo medial. .......................................... 58
Figura 39. Dilatação derradeira e dilatação derradeira com barreiras: (a) imagem binária
inicial; (b) dilatação derradeira; e (c) dilatação derradeira com barreiras.............. 58
Figura 40. Método dos divisores de águas (watersheds): (a) imagem binária inicial; e (b)
imagem binária com objetos separados................................................................ 59
Figura 41. Conectividade. .................................................................................................... 61
Figura 42. Exemplo de possível erro de contagem de objetos devido à conectividade........... 62
Figura 43. (a) interceptos e (b) interseções. .......................................................................... 63
Figura 44. Vetor d................................................................................................................ 67
Figura 45. Objeto exemplo para ilustrar as medidas de tamanho........................................... 70
Figura 46. Medidas de área: (a) área; (b) área preenchida; e (c) área convexa. ...................... 70
Figura 47. Medidas de perímetro: (a) perímetro; (b) perímetro preenchido; e (c) perímetro
convexo. ............................................................................................................. 71
Figura 48. Ferets: (a) feret mínimo; (b) feret máximo; e (c) feret ortogonal ao máximo........ 72
Figura 49. Width. ................................................................................................................. 72
Figura 50. Comparação de fatores adimensionais de forma. ................................................. 77
Figura 51. Assinatura seqüencial de contorno....................................................................... 79
Figura 52. Medidas de posição............................................................................................. 79
Figura 53. Classificação supervisionada. .............................................................................. 82
Figura 54. Classificação não-supervisionada. ....................................................................... 82
Figura 55. Características anatômicas do bambu usadas para sua classificação..................... 87
Figura 56. Seção reta de um colmo de bambu a olho nu (a) e numa lupa (b)......................... 88
Figura 57. Detalhes da estrutura dos bambus. ....................................................................... 88
Figura 58. Classes de conjuntos vasculares........................................................................... 89
Figura 59. Conjunto de treinamento. .................................................................................... 90
Figura 60. Fluxograma da rotina de classificação de conjuntos vasculares............................ 92
Figura 61. Imagem capturada em 256 tons de cinza.............................................................. 93
Figura 62. “Expansão” da imagem do bambu. ...................................................................... 94
Figura 63. Segmentação grosseira do bambu. ....................................................................... 94
Figura 64. Imagem binária das bordas. ................................................................................. 95
Figura 65. “Limpeza” da imagem binária das bordas............................................................ 95
Figura 66. União das bordas................................................................................................. 96
Figura 67. Imagem binária do bambu. .................................................................................. 96
Figura 68. Escamação do bambu. ......................................................................................... 98
Figura 69. Um ciclo de segmentação de conjuntos vasculares. ........................................... 100
Figura 70. Resultados dos ciclos de segmentação de conjuntos vasculares.......................... 100
VI
Figura 71. Eliminação dos conjuntos vasculares que tocam as bordas da imagem ou que
possuem área fora do desvio padrão. ................................................................. 101
Figura 72. Segmentação das regiões de esclerênquima (primeira parte). ............................. 102
Figura 73. Segmentação das regiões de esclerênquima (segunda parte). ............................. 103
Figura 74. Preparação de imagens fáceis de serem medidas................................................ 104
Figura 75. “Limpeza” para a classificação.......................................................................... 105
Figura 76. Classificação das amostras de bambu da espécie Áurea. .................................... 106
Figura 77. Classificação das amostras de bambu da espécie Gigante. ................................. 107
Figura 78. Classificação das amostras de bambu da espécie Matake. .................................. 108
Figura 79. Classificação das amostras de bambu da espécie Moso...................................... 109
Figura 80. Imagens de referência das seis classes de partículas de grafita (ISO-945). ......... 112
Figura 81. Fluxograma da rotina de classificação de ferro fundido. .................................... 114
Figura 82. Ângulo interno médio: (a) imagem binária; (b) imagem pintada com um tom de
cinza k2; (c) imagem borrada pelo filtro passa-baixa média com kernel de tamanho
k x k; (d) imagem final resultante (com look-up table); e (e) look-up table......... 116
Figura 83. Grande correlação tamanho-forma..................................................................... 120
Figura 84. Diferença entre taxas de acerto globais médias (%) com e sem o atributo. ......... 122
Figura 85. Taxa de acerto global máxima sem o atributo. ................................................... 122
Figura 86. Influência da resolução com conjuntos de atributos com AIM............................ 124
Figura 87. Influência da resolução com conjuntos de atributos sem AIM. ........................... 125
Figura 88. Representação pictórica das taxas de acerto....................................................... 126
Figura 89. Classificação das três amostras de ferro fundido................................................ 127
Figura 90. Imagens de HRTEM de: (a) resina pura; (b) compósito em região sem nano-
partículas de grafite; e (c) compósito onde aparecem nano-partículas de grafite. 132
Figura 91. Imagens dos mosaicos. ...................................................................................... 133
Figura 92. Aplicação das imagens dos mosaicos sobre uma imagem do compósito............. 133
Figura 93. Influência do tamanho dos quadrados nos parâmetros de Haralick (Uniformidade,
Contraste e Entropia) para resina pura (a) e compósito (b)................................. 134
Figura 94. Histogramas da uniformidade (a), contraste (b) e entropia (c) para resina pura e
compósito entre nano-partículas de grafite (quadrados de 100x100 pixels). ....... 135
Figura 95. Pequenas regiões organizadas na matriz, provavelmente carbono. ..................... 136
VII
LISTA DE TABELAS
Tabela 1. Operadores diferenciais parciais............................................................................ 37
Tabela 2. Parâmetros de Haralick ......................................................................................... 69
Tabela 3. Fatores Adimensionais de Forma .......................................................................... 76
Tabela 4. Taxas de acerto globais de auto-validação........................................................... 121
Tabela 5. Validação ........................................................................................................... 123
Tabela 6. Taxas de acerto do conjunto de atributos escolhido na auto-validação................. 125
Tabela 7. Influência do classificador .................................................................................. 126
VIII
1 Introdução
O Processamento e Análise Digital de Imagens (PADI) é uma ferramenta
dos pixels de imagens digitais, modificando-as, para facilitar sua visualização e/ou para
pois permite fazer medidas impossíveis de serem realizadas manualmente e confere maior
procedimentos de classificação.
computador forneça o resultado. Para isto, as rotinas de PADI seguem uma seqüência
quantitativos interpretados.
modo, pode-se dizer que se trata da caracterização de três materiais compósitos, a partir da
nanométrica. Além disto, cada caso apresenta complexidade em uma etapa diferente da
1
seqüência padrão. Deste modo, juntos, estes três casos oferecem um panorama abrangente
sua etapa crítica. Os objetos a serem medidos e classificados, os conjuntos vasculares, são
objetos complexos formados, cada um, por um conjunto de objetos separados, as regiões de
fácil, demanda uma complexa rotina recursiva a fim de se garantir a robustez. Contudo,
são óbvios.
segmentação é fácil. O fato das amostras de ferro fundido não serem atacadas propicia uma
boa distinção entre as partículas de grafita (preto) e a matriz (cinza claro), facilitando sua
segmentação por limiarização. Deste modo, uma rápida segmentação automática de Otsu é
suficiente.
caracterização por forma e sua maior dificuldade reside justamente aí. Assim, a etapa
crítica é a escolha do conjunto de atributos, pois este precisa ser robusto para agrupar a
grande variabilidade de formas apresentada dentro cada classe de grafita e sensível bastante
2
O terceiro caso (Análise Nano-estrutural de um Compósito Resina-Grafite)
apresenta uma abordagem diferente, sua rotina de PADI é simples, porém peculiar. Por não
medidas são feitas sobre objetos arbitrários desenhados, no caso, quadrados de igual
tamanho, que são aplicados como máscaras sobre as imagens do material. O material é
caracterizado, a partir das regiões marcadas por cada um dos quadrados, através de
Imagens”) pretende-se tornar o embrião de uma futura apostila de PADI, e, neste sentido,
tenta ser abrangente, abordando inclusive, mesmo que de maneira mais sucinta, técnicas
não diretamente relacionadas aos casos aqui estudados. Os três capítulos seguintes tratam,
cada um, de um dos casos de caracterização. Por fim, no sexto capítulo, apresenta-se uma
conclusão geral.
3
2 Processamento e Análise Digital de Imagens
O Processamento Digital de Imagens (PDI) é uma técnica que se utiliza de
operações matemáticas para alterar os valores dos pixels de uma imagem digital,
modificando-a, para:
(ii) preparar a imagem para ser analisada pelo próprio computador (Análise
Digital de Imagens).
quantitativos de imagens digitais. Através de ADI pode-se realizar medições mais rápidas,
executar manualmente.
globalmente a ambas as técnicas, PDI e ADI. Isto é, de certo modo, justificável, já que
determinada por uma etapa de análise. Neste trabalho, utiliza-se o termo Processamento e
4
A fim de estruturar o estudo dessas rotinas, os procedimentos de PADI são
discriminados em etapas, de acordo com seu objetivo imediato, formando uma seqüência
Formação da imagem
Digitalização da imagem
Pixels Pré-Processamento
Segmentação Qualitativo
Regiões Pós-Processamento
Extração de Atributos
Dados Quantitativo
Reconhecimento de padrões e
Classificação
Aquisição, PDI e ADI. O bloco Aquisição tem, como entrada, uma amostra adequadamente
original, saída do bloco Aquisição, e fornece uma imagem processada. O bloco ADI
Ao lado do fluxograma, apresentam-se setas que indicam o nível dos dados sobre
5
os pixels da imagem, gerando-se uma imagem com objetos, representados por regiões de
PADI. Uma imagem de ferro fundido (Figura 2-a), gerada por microscopia óptica, é
segmentada e processada, obtendo-se uma imagem formada por objetos (Figura 2-b), que
representam as partículas de grafita. Então, são feitas medições nestas partículas, obtendo-
se dados quantitativos (Figura 2-c), que são então analisados (Figura 2-d).
6
(a) (b)
No. de partículas: 89
Figura 2. Um exemplo de problema de PADI: (a) imagem original; (b) imagem das
partículas de grafita (regiões); (c) área de cada partícula; e (d) distribuição das áreas.
ser pulada e, na etapa de reconhecimento de padrões e classificação, uma análise pode fazer
o fluxograma retroceder a qualquer outra etapa, até mesmo à etapa de formação da imagem,
arquivo digital de imagem, chega-se aos dados quantitativos, não havendo interferência
7
2.1 Aquisição da imagem
informações diversas, e uma matriz de números, onde cada um deles identifica a cor ou
pixel
245,230,185 216,182,138
231,216,184 214,186,151
imagem gera uma imagem da amostra, que então é capturada por um instrumento de
captura de imagem. A imagem pode ser capturada diretamente de forma digital (arquivo de
MET, etc.). Da mesma forma, os instrumentos de captura de imagem associados a eles são
diversos. Os mais comuns ainda são instrumentos analógicos, como câmeras fotográficas e
8
Atualmente, as câmeras de vídeo vem sendo substituídas por câmeras digitais, que
apresentam resolução bem superior. No entanto, quando se trata de alta resolução, estas
ainda não conseguem superar as câmeras fotográficas, pois apesar de atingirem resolução
apresentam resolução de 640 x 480 pixels, já, com câmeras fotográficas e recentemente
com digitais, pode-se atingir resoluções de alguns milhares de pixels. Por exemplo, a
câmera digital Zeiss Axiocam HR tem resolução de 3900 x 3090 pixels (Carl Zeiss, 2001).
Imagem, faz-se necessária uma breve introdução de alguns conceitos sobre a imagem
digital.
consiste no número máximo de níveis de intensidade que esta imagem pode apresentar. A
entre as imagens da direita e da esquerda, as da direita têm maior resolução (512 x 512
pixels) do que as da esquerda (128 x 128 pixels). Da mesma forma, a profundidade varia
9
entra as imagens de cima e as de baixo, as imagens de baixo apresentam maior
sendo muito comum em microscopia óptica. Assim, este trabalho trata somente de casos
sendo passíveis de utilização em imagens com outros níveis de profundidade, como, por
imagens de 14 bits, ou seja, com 214 tons de cinza, são utilizadas em imagens de figuras de
10
óptica e são usadas quando as cores são necessárias para se distinguir as feições de
interesse.
adição de 3 cores primárias com 256 níveis de intensidade (8 bits) para cada uma. Assim,
uma imagem colorida deste tipo constitui-se numa composição de três imagens com 8 bits
cada, que podem ser tratadas separadamente, com as técnicas de PADI descritas neste
percebidas. Uma imagem formada predominantemente por pixels com tons de cinza baixos,
próximos a 0 (preto), é percebida como uma imagem escura, ou seja, com baixo brilho. Já
uma imagem que contém predominantemente pixels com tons de cinza próximos a 255
(branco) é considerada uma imagem clara, com alto brilho. Da mesma forma, uma imagem
que apresenta pixels com uma pequena variação de tons de cinza é percebida como uma
Como uma imagem digital é uma representação matemática de uma imagem real,
mostrado a seguir.
O brilho de uma imagem digital pode ser definido como a média dos tons de cinza
de todos os pixels da imagem. Dada uma imagem f(x,y) de dimensão X x Y, seu brilho é
definido como:
1 Y −1 X −1
B= ∑∑ f ( x, y ) .
n y =0 x =0
(1)
suas dimensões X e Y.
11
O contraste de uma imagem digital pode ser definido como o desvio padrão dos
tons de cinza de todos os pixels da imagem (Weeks, Jr., 1996). Dada uma imagem f(x,y) de
1 Y −1 X −1
C= ∑∑ [ f ( x, y) − B ]2 (2)
n y =0 x=0
onde B é o brilho da imagem f(x,y), calculado de acordo com a Equação (1); e n é o número
total de pixels ( n = X ⋅ Y ).
2.2.3 Histograma
função distribuição dos tons de cinza de seus pixels. Dada uma imagem f(x,y) de dimensão
nr
p( r ) = (3)
n
onde r representa os tons de cinza, e pode variar de 0 a 255; nr é o número de pixels com o
O histograma é um gráfico que tem como eixo horizontal a escala de tons de cinza
imagem. De fato, o histograma fornece uma descrição global da aparência da imagem, mas
255
B = ∑ r ⋅ p (r ) ; (4)
r =0
255
C= ∑ [r − B]
r =0
2
⋅ p( r ) . (5)
12
A Figura 5 mostra três imagens ao lado de seus respectivos histogramas. Trata-se
obviamente da mesma imagem, uma imagem de uma areia, obtida em microscópio óptico,
apresentada aqui com diferentes níveis de brilho e contraste para fins de comparação.
contraste e diferentes níveis de brilho. Como pode ser visto nestas Figuras, ambos os
histogramas têm a mesma forma e largura, mas o da Figura 5-b está deslocado para a direita
em relação ao da Figura 5-a, ou seja, apresenta maior média, o que implica o maior brilho
Já as imagens da Figura 5-b e Figura 5-c têm o mesmo nível de brilho e diferentes
mesma média, porém o histograma da Figura 5-c é mais estreito, denotando o menor
13
(a)
B= 80
C = 31,1
(b)
B = 130
C = 31,1
(c)
B = 130
C = 13,8
Embora o histograma forneça uma descrição global da imagem que nada diz sobre
seu conteúdo, sua forma constitui-se em informação crucial para o processamento digital da
2.3 Pré-processamento
14
Tão variados, quanto os métodos de aquisição de imagem digital e os defeitos
muitos podem ser os tipos de detalhes que se deseje realçar. Assim, existem diversos
bordas.
dos pixels da imagem. Já os procedimentos no domínio das freqüências são feitos através
obtenção de sua transformada inversa (Gonzalez & Woods, 1992). Por não necessitarem do
domínio do espaço real são, geralmente, menos custosos computacionalmente, tendo assim
a preferência.
através de operações matemáticas que operam diretamente sobre pixels das imagens. Tais
15
(iv) operações geométricas.
Operações pontuais são operações onde para cada tom de cinza na imagem de
g ( x, y ) = M [ f ( x, y )] (6)
onde f(x,y) é a imagem de entrada, g(x,y) é a imagem de saída, (x,y) são as coordenadas dos
cinza s na imagem de saída g(x,y) para cada tom de cinza r na imagem de entrada f(x,y).
Cada pixel com tom de cinza r na imagem de entrada f(x,y) recebe o tom de cinza s
na imagem de saída g(x,y), de modo que as operações pontuais podem ser expressas, de
s = M (r ) (7)
Uma função de mapeamento linear modifica o brilho e o contraste de uma imagem, não
alterando muito a forma de seu histograma. Uma manipulação de brilho deste tipo provoca
16
do histograma da imagem, modificando prioritariamente alguma região do histograma ou
reta:
s = a⋅r +l (8)
o brilho da imagem, um valor positivo faz o brilho aumentar, um valor negativo o reduz. O
coeficiente angular com valor maior do que 1, resulta num aumento tanto do brilho quanto
do contraste, do contrário, caso seu valor seja menor do que 1, ambos, brilho e contraste,
diminuem.
negativo, que mapeia os tons de cinza claros na imagem de entrada como escuros na
de entrada. Para isto, esta função tem, como coeficientes angular e linear, respectivamente,
s = 255 − r . (9)
que, ao agir sobre uma imagem de ferro fundido (Figura 6-b), obtida por microscopia
óptica, gera uma imagem negativo (Figura 6-c) da original. Na Figura 6-d e na Figura 6-e,
17
(a)
(b) (c)
(d) (e)
Figura 6. Operação de negativo: (a) função de mapeamento; (b) imagem original; (c)
imagem negativo; (d) histograma da imagem original; e (e) histograma do negativo.
Normalização, também chamada Autoscaling (Weeks, Jr., 1996). Esta operação pontual é
composta por uma função que mapeia a faixa de tons de cinza da imagem de entrada para
uma faixa desejada na imagem de saída. Assim, nesta operação, os coeficientes angular e
linear da função de mapeamento não são escolhidos diretamente, mas calculados a partir
dessas duas faixas de tons de cinza. Desta forma, a função de mapeamento de uma
18
g max − g min (10)
s= (r − f min ) + g min
f max − f min
onde fmin e fmax são, respectivamente, o tom de cinza mínimo e máximo na imagem de
entrada f(x,y); gmin e gmax designam a faixa de tons de cinza desejada para a imagem de
saída g(x,y), sendo portanto, respectivamente, seu tom de cinza mínimo e máximo.
Como pode ser visto na Equação (10), o coeficiente angular a de uma função de
Caso o fator de escala, calculado pela Equação (11) para uma determinada operação de
Normalização em uma determinada imagem, seja menor do que 1, trata-se de uma operação
contraste. Uma imagem de uma areia (Figura 7-a), obtida em microscópio óptico, contendo
tons de cinza compreendidos entre 55 e 225 conforme seu histograma, é mapeada para uma
imagem (Figura 7-c) com tons de cinza em toda escala de 0 a 255, como pode ser visto em
Figura 7-b.
19
(a)
(b)
(c)
brilho e o contraste da imagem, enquanto que o coeficiente linear afeta somente seu brilho.
angular e linear:
C ′ = C ′(a) ; (12)
20
B′ = B′(a, l ) ; (13)
onde C' é o contraste da imagem de saída; B' é o brilho da imagem de saída; e a e l são,
diferentes, a Equação (8) é rescrita de acordo com a seguinte expressão (Weeks, Jr., 1996):
s = a ⋅ ( r − B ) + (b + B ) (14)
C ′ = C ′(a) ; (15)
B′ = B′(b) . (16)
Estas equações que definem funções de mapeamento são válidas somente para s no
domínio de r, ou seja, [0; 255]. Quando a função de mapeamento calcula s fora deste
domínio, s precisa ser ajustado. Existem diferentes modos de se fazer este ajuste e, ao se
utilizar este tipo de função, deve-se ter o cuidado de observar de que modo o ajuste está
implementado. O modo de ajuste mais comum consiste em saturar a imagem de saída nos
tons de cinza extremos da escala, igualando s a 0, caso ele seja calculado menor do que 0, e
s ≤0⇒ s =0 ; (17)
ajuste para conter s no domínio [0; 255], isto nem sempre acontece. Caso a função de
mapeamento calcule algum s fora deste domínio, o ajuste fará com que as propriedades de
brilho e contraste não possam ser tratadas de maneira independente uma da outra.
21
Para se manipular brilho e contraste separadamente, deve-se garantir que s seja
sempre calculado dentro do domínio [0; 255], para isso, acresce-se algumas condições à
s = a ⋅ (r − B) + (b + B) ; (19)
um analisador de imagem que opere também com imagens de maior profundidade. Deste
com função de mapeamento linear, onde apenas a última teria o compromisso de fornecer
De qualquer forma, deve-se sempre lembrar que a escala de tons de cinza nas
imagens de 8 bits é composta por valores inteiros no domínio [0; 255]. Assim, caso o
coeficiente angular da função de mapeamento não seja um número inteiro, alguns valores s
irão sofrer arredondamento. Deste modo, quando se manipula o contraste, pode ocorrer
um valor determinado, sem se importar com seu contraste. A princípio, esta seria uma
Equação (19), onde o coeficiente angular a seria unitário e a variável b seria calculada
como a diferença entre o valor de brilho B' desejado para a imagem de saída e o brilho B da
s = a ⋅ (r − B) + (b + B) ; (22)
a =1 ; (23)
22
b = B' − B . (24)
Entretanto, para que não haja saturação, a variável b tem que estar dentro de um
certo domínio, definido pela Equação (20), não sendo possível igualar o brilho de uma
imagem a um valor determinado, caso a variável b, calculada para isso, esteja fora deste
domínio. Então, pode-se pensar nesta operação como se fosse feita em duas etapas.
Primeiro, faz-se uma redução do contraste suficiente para estender o domínio da variável b
para que seu valor calculado pela Equação (24) seja válido. Aí, modifica-se o brilho até o
valor desejado através de uma operação simples de manipulação de brilho, como mostrado
na Equação (22). Substituindo-se b, de acordo com a Equação (24), esta operação como um
s = a ⋅ (r − B) + B ' ; (25)
B' (27)
( f min + B'− B) < 0 ⇒ a = ;
B − f min
função de mapeamento desta operação pode apresentar valores não inteiros. Assim, como
explicado anteriormente, isto pode gerar uma pequena distorção no brilho da imagem de
saída, não se atingindo o valor desejado. Na prática, isto é resolvido dando-se uma
utilizada quando se deseja processar várias imagens com uma mesma rotina ou quando se
23
2.3.1.2 Mapeamento não-linear
prioritariamente alguma região específica na escala de tons de cinza. Existem diversos tipos
aumenta o contraste das regiões escuras da imagem e reduz o contraste das regiões claras,
provoca o efeito inverso, reduz o brilho da imagem como um todo, aumenta o contraste das
regiões claras e reduz o contraste das regiões escuras. Isto pode ser percebido observando-
se a Figura 8.
(a) (b)
255 255
0 0
0 255 0 255
Pode-se definir, para imagens de 256 tons de cinza, uma função de mapeamento
r (30)
s = ME (r ) = e 45 , 98
−1
24
onde r e s representam respectivamente os tons de cinza na imagem de entrada e na
mapeamento exponencial. O fator de 45,98 foi calculado para que não haja saturação e para
Neste caso, as funções foram definidas na base e, mas obviamente, desde que não
haja saturação e que toda a escala de tons de cinza seja abrangida, qualquer base pode ser
mapeamento lineares por partes. Tais funções são não-lineares como um todo, mas são
formadas por partes que são funções lineares. A Figura 9 mostra um exemplo de função de
255
0
0 255
variados. No limite, tratando-se de uma escala discreta de tons de cinza, pode-se especificar
um tom de cinza para mapear cada tom de cinza na escala, fazendo-se uma verdadeira
25
2.3.1.3 Operações sobre o histograma
obter para a imagem de saída. Existem basicamente duas operações deste tipo, a
uniformemente distribuído, com a forma de uma linha horizontal, de modo que o número
saída.
Por gerar imagens com histogramas uniformes ou com uma forma determinada,
várias imagens com a mesma rotina ou quando se quer comparar diversas imagens. A
distribuição acumulada calcula, para cada tom de cinza r na imagem de entrada, um tom de
26
r r
ni
s = M (r ) = ∑ = ∑ p(i ) (31)
i =0 n i =0
histograma.
(a)
(b)
Figura 10. Equalização do histograma: (a) imagem original com seu histograma; e (b)
imagem com seu histograma equalizado.
não produziu uma imagem com histograma uniforme. De fato, isto é o que geralmente
acontece. Devido à escala de tons de cinza nas imagens de 8 bits ser discreta, composta por
fazendo com que o histograma da imagem resultante não seja uniforme. Todavia, o
27
histograma da imagem resultante da equalização tende a apresentar melhor distribuição do
equalização de histograma. Pois, enquanto esta última só é capaz de gerar imagens cujo
previamente.
imagem de entrada:
r
s = M (r ) = ∫ pr (i)di (32)
0
imagem de entrada;
especificado:
t
u = N (t ) = ∫ pt (i)di (33)
0
28
t = N −1 (u ) ; (34)
( u = s ), assim:
t = N −1 [M (r )] . (35)
histograma. O problema deste método para escalas contínuas de tons de cinza reside em se
Na prática, trabalhando-se com imagens com uma escala discreta de tons de cinza,
faz-se estes cálculos para cada valor da escala. Assim, a especificação de histograma
(i) o cálculo dos valores dos tons de cinza s a partir da equalização do histograma
da imagem de entrada;
(ii) o cálculo dos valores dos tons de cinza u a partir da equalização do histograma
especificado;
(iii) a busca do valor de tom de cinza u que mais se aproxima de cada valor de tom
de cinza s;
escala de tons de cinza ser discreta, como discutido anteriormente para a operação de
equalização de histograma.
29
2.3.2 Operações entre imagens
entrada, são as chamadas operações pontuais entre imagens ou, simplesmente, operações
entre imagens. Um operador matemático varre as imagens de entrada, sendo aplicado pixel
a pixel, relacionando os pixels correspondentes em cada uma das imagens de entrada, como
comparativo (máximo e mínimo), de modo que, as operações deles derivadas também são
caso de imagens binárias, imagens que contém somente dois tons, preto (0) e branco (1),
ainda existem as operações lógicas, que serão abordadas detalhadamente mais adiante, na
g ( x, y ) = T [ f 1 ( x, y ), f 2 ( x, y ),..., f n ( x, y )] (36)
onde f1(x,y), f2(x,y), ..., fn(x,y) são as n imagens de entrada; g(x,y) é a imagem de saída e T é
30
Nas operações aritméticas ainda possível operar com um escalar, um parâmetro
multiplicativo (fator de ganho) ou aditivo (off-set), que é aplicado pixel a pixel na imagem
aritméticas, pois, ao se fazer uma operação deste tipo, é comum se obter, para a imagem de
saída, pixels com valores de tons de cinza fora da escala (0 a 255), ou seja, valores
negativos ou maiores de que 255. Para resolver isso, os analisadores de imagem geralmente
(ii) saturar nos tons de cinza limites da escala (clipping), ou seja, qualquer valor
espaciais, são operações onde o tom de cinza de um determinado pixel na imagem de saída
é função não apenas de seu tom de cinza na imagem de entrada, mas também dos tons de
cinza de seus pixels vizinhos nesta imagem, como ilustrado na Figura 12.
31
Este tipo de operação é geralmente realizada através do cálculo de uma média
ponderada dos pixels da vizinhança. Cada vizinho tem um peso associado, definido pelos
elementos de uma matriz denominada kernel, que, através de seu tamanho, também define
m m
g ( x, y ) = ∑ ∑ f ( x + i, y + j ) ⋅ k ( i, j ) ;
i =− m j =− m
(38)
0 ≤ x ± m ≤ X −1 ; (39)
0 ≤ y ± m ≤ Y −1 ; (40)
K −1
m= ; (41)
2
K = (2 ⋅ a + 1) | a ∈ℵ* ; (42)
Pelas Equações (39) e (40), nota-se que o kernel não pode operar sobre os pixels
das extremidades da imagem, suas m primeiras e últimas linhas e colunas. Apesar disto não
ser geralmente um grande problema, já que as informações relevantes costumam estar mais
centradas na imagem, deve-se ter cuidado em alguns casos, pois os analisadores de imagem
tratam isto de formas diferentes. Existem quatro opções principais de tratamento desta
questão:
32
(ii) replicar os pixels das extremidades para fora da imagem de entrada, gerando
então é aplicado o filtro kernel de acordo com a opção (i), gerando-se uma
kernel adequado, diversos procedimentos podem ser implementados, tais como redução de
utilizados para que não seja calculado nenhum valor de tom de cinza maior do que 255,
para a imagem de saída. Estes fatores de escala são geralmente calculados como o inverso
1 1 1 1 2 1
1 1
× 1 1 1 × 2 4 2
9 16
1 1 1 1 2 1
Os filtros passa-baixa são definidos por kernels com elementos positivos. O filtro
média é assim chamado pois atribui ao pixel filtrado, na imagem de saída, a média dos
33
valores de tom de cinza dos pixels da vizinhança, na imagem de entrada. O filtro gaussiana
é um filtro média ponderada, seu kernel é circularmente simétrico e seus elementos variam
de acordo com uma função gaussiana. Devido ao maior peso no centro de seu kernel, ele
Um outro filtro utilizado para a redução de ruído é o filtro mediana, que é um tipo
vizinhança são ordenados em ordem crescente de tom de cinza e o valor mediano, que está
geralmente fornece um resultado melhor do que os filtros passa-baixa, pois borra menos a
redução de ruído tipo “spike”, ruído localizado com intensidade muito diferente da
baixa de kernel bem largo, de tamanho maior do que os possíveis objetos na imagem.
34
(a) (b) (c)
Figura 14. Correção de iluminação irregular: (a) imagem original; (b) fundo calculado; e (c)
imagem com iluminação corrigida.
detalhes, que visa realçar detalhes finos da imagem. Neste caso, os filtros usados são os
freqüência espacial, como as bordas. A Figura 15 mostra o kernel 3x3 do filtro passa-alta
–1 –1 –1 –1 –1 –1
1 1
× –1 8 –1 × –1 9·a - 1 –1
8 9·a - 1
–1 –1 –1 –1 –1 –1
Figura 15. Filtros passa-alta 3x3: (a) passa-alta básico; (b) alto reforço.
Os filtros passa-alta são definidos por kernels com elementos positivos próximo ao
centro e elementos negativos na periferia, de modo que, num kernel passa-alta 3x3, o
35
O filtro passa-alta básico, devido à soma nula dos elementos de seu kernel, retorna
valores próximos ou iguais a 0 quando passa por uma região de baixa freqüência espacial
na imagem de entrada, gerando, assim, uma imagem de saída com bordas aguçadas sobre
um fundo escuro.
O filtro alto reforço (“high boost”) realça as bordas, mas preserva mais a imagem,
pois o parâmetro a, quando maior que 1, aumenta o peso no centro do kernel, deixando
resultante do alto reforço é uma adição da imagem resultante do passa-alta básico com uma
fração da imagem de entrada, definida pela imagem de entrada multiplicada pelo fator de
ganho (a -1).
circundados por pixels mais escuros ou vice-versa, tipicamente ruído, não sendo sempre
cada pixel, apontando para a direção de maior derivada espacial, e seu módulo equivale a
esta derivada máxima. Assim, a detecção de bordas é geralmente feita através de filtros que
2 2
∂f ∂f ∂f ∂f
∇f = + ≈ + . (43)
∂x ∂y ∂x ∂y
A Equação (43) indica que uma aproximação do módulo do gradiente pode ser
calculada pela soma dos módulos das derivadas parciais em x e y. Deste modo, a imagem
módulo do gradiente de f(x,y) é obtida através da soma dos valores absolutos resultantes da
36
aplicação, em f(x,y), de filtros que operem estas derivadas parciais. Existem diversas
mais conhecidos.
∂ ∂
Operador
∂x ∂y
1 0 –1 –1 –1 –1
1 1
Prewitt × 1 0 –1 × 0 0 0
3 3
1 0 –1 1 1 1
1 0 –1 –1 –2 –1
1 1
Sobel × 2 0 –2 × 0 0 0
4 4
1 0 –1 1 2 1
1 0 –1 –1 – 2 –1
1 1
Frei-Chen × 2 0 – 2 × 0 0 0
2+ 2 2+ 2
1 0 –1 1 2 1
1 0 0 1
0 –1 –1 0
formada, pixel a pixel, pela máxima derivada local na imagem de entrada. Regiões
37
homogêneas na imagem de entrada, com pequena ou nenhuma variação de tom de cinza,
serão tão mais brilhantes, quanto mais abruptas e acentuadas forem as diferenças de
Além dos filtros espaciais já citados, existem muitos outros e ainda podem ser
0 –1 0
1
× –1 4 –1
4
0 –1 0
O filtro laplaciano, como o nome sugere, simula a segunda derivada. Ele é bastante
empregado para detecção de bordas (Gonzalez & Woods, 1992). Geralmente é utilizado
é alterada. Consistem em uma transformação espacial, que, caso leve à criação de pixels
inexistentes na imagem original, é seguida por uma interpolação das intensidades dos
38
Figura 18. Operações geométricas.
que consiste numa transformação espacial linear de mudança de escala, definida como:
x′ = S ⋅ x ; (44)
y′ = S ⋅ y ; (45)
baixa resolução, pois o aumento artificial da resolução pode melhorar a representação dos
contornos dos objetos, permitindo uma caracterização mais adequada de sua forma (Livens,
1997).
2.4 Segmentação
visão humana. A segmentação divide a imagem em regiões e distingue essas regiões como
objetos independentes uns dos outros e do fundo. No caso mais simples de diferenciar
objetos de um fundo, a segmentação tem como produto uma imagem binária, onde os
considerados objetos, ou vice-versa. No entanto, a partir deste ponto, fica instituído que,
neste trabalho, a notação é: os pixels pretos (0) são o fundo e as regiões de pixels brancos
39
A Figura 19 mostra um exemplo bem simples de segmentação. Uma imagem de
ferro fundido (Figura 19-a), em 256 tons de cinza, obtida por microscopia óptica, é
segmentada, gerando-se uma imagem binária (Figura 19-b), onde as partículas de grafita
(a) (b)
Figura 19. Exemplo de segmentação: (a) imagem em 256 tons de cinza; (b) imagem
binária.
através dela que se reconhece e se identifica os objetos de interesse, sobre os quais será
feita a análise.
2.4.1 Limiarização
limiarização usa o tom de cinza dos pixels para distingui-los, considerando como objetos,
as regiões de pixels contíguos com tom de cinza dentro de uma faixa tonal delimitada a
limiarização bi-modal é determinada por um único tom de corte que separa duas faixas
40
tonais, de modo a gerar uma imagem binária, tornando brancos os pixels com tom de cinza
minério (Figura 20-a), gerada em MEV, é segmentada por limiarização bi-modal com o
tom de corte mostrado na Figura 20-b, gerando uma imagem binária (Figura 20-c), onde
(b)
(a) (c)
Figura 20. Exemplo de limiarização bi-modal: (a) imagem original; (b) tom de corte; (c)
imagem binária.
não sendo suficiente simplesmente diferenciar objetos de um fundo. Neste caso, a técnica
da limiarização também é aplicável, pois ela não está restrita a apenas duas fases, podendo
ser utilizada para distinguir quantas fases se queira. É a chamada limiarização multi-modal,
onde para se distinguir n fases, especifica-se (n-1) tons de corte. Cada um destes (n-1) tons
de corte determina o início de uma faixa tonal, caracterizando portanto uma fase, e uma
fase adicional, geralmente o fundo, é definida pelos tons de cinza abaixo do primeiro tom
limiarização multi-modal para distinguir quatro fases. De fato, este exemplo utiliza a
mesma imagem do exemplo de limiarização bi-modal (Figura 20), havendo neste caso, uma
41
sofisticação do problema. A imagem do minério (Figura 21-a) passa por limiarização tetra-
modal, a partir dos três tons de corte mostrados na Figura 21-b, gerando uma imagem
quaternária (Figura 21-c), ou seja, uma imagem com quatro tons. Nesta imagem quaternária
(b)
(a) (c)
Figura 21. Exemplo de limiarização tetra-modal: (a) imagem em 256 tons de cinza; (b) tons
de corte; (c) imagem quaternária.
de onde pode-se mais facilmente escolher os tons de cinza que determinam as fronteiras
Na prática, determinar o exato tom de cinza de uma fronteira não é uma tarefa
simples, a escolha manual não é acurada e nem reprodutível, e, assim, busca-se sempre um
não satisfatórios, principalmente quando os vales entre as classes são largos e planos ou
42
Um outro método automático de limiarização é o método da minimização da
variância intraclasse, conhecido como segmentação de Otsu (Otsu, 1979). Para a realização
automática citados. Mostra-se a segmentação de uma mesma imagem pelo método dos
mínimos e pelo método de Otsu, apresentando seu histograma com os respectivos tons de
corte marcados.
43
(a)
(b) (c)
(d) (e)
Figura 22. Comparação entre métodos limiarização automática: (a) imagem em 256 tons de
cinza; (b) corte no ponto de mínimo; (c) corte pelo método de Otsu; (d) imagem
segmentada pelo método dos mínimos; e (e) imagem segmentada pelo método de Otsu.
O método de Otsu pode ser estendido para mais modos do histograma, mas em
geral os analisadores de imagem não contemplam esta opção. Apesar de ser facilmente
44
obtendo-se um tom de corte para cada uma. Em seguida, interpola-se estes tons de corte a
Ela mostra uma imagem, com problema de iluminação irregular, segmentada por ambas as
técnicas.
detecta as bordas dos objetos, a partir das quais, constrói seus contornos, considerando
computacionalmente mais custosa que a limiarização, devendo, assim, ser usada somente
45
A assim denominada segmentação de Marr-Hildreth é implementada através da
aplicação de dois filtros espaciais. Primeiro borra-se a imagem em tons de cinza com um
filtro gaussiana, para então se aplicar, nesta imagem borrada, um filtro laplaciano. A partir
Figura 24. Exemplo de segmentação conjunta por limiarização e Marr-Hildreth: (a) imagem
em tons de cinza; (b) imagem da limiarização; (c) imagem da segmentação de Marr-
Hildreth; e (d) interseção entre as imagens (b) e (c).
2.5 Pós-processamento
objetos para formar objetos mais complexos. Tais procedimentos são geralmente
46
2.5.1 Operações Lógicas
As operações lógicas são operações pontuais entre imagens binárias, realizadas por
operadores lógicos que varrem as imagens de entrada, operando pixel a pixel, gerando uma
imagem de saída onde cada pixel é preservado ou invertido. As três operações lógicas
básicas são o complemento (NOT), a interseção (AND) e a união (OR), a partir das quais
qualquer outra operação lógica pode ser definida. A Figura 25 mostra, a partir de duas
imagens de entrada (A e B), as três operações lógicas básicas com suas respectivas tabelas-
verdade.
pixels da imagem de entrada, gerando uma imagem de saída que é o seu negativo. A
operação de interseção (AND), também chamada “e”, faz a interseção das duas imagens de
entrada, produzindo uma imagem de saída onde são brancos somente os pixels que são
“ou”, realiza a união das duas imagens de entrada, produzindo uma imagem de saída onde
são brancos somente os pixels que são brancos em pelo menos uma das imagens de entrada.
47
A B
NOT A A AND B A OR B
A NOT A A B A AND B A B A OR B
0 1 0 0 0 0 0 0
1 0 0 1 0 0 1 1
1 0 0 1 0 1
1 1 1 1 1 1
utilizada, é o “ou exclusivo” (XOR). A operação de “ou exclusivo” (XOR) gera uma
imagem de saída onde são brancos somente os pixels que são brancos em somente uma das
48
A B
A XOR B
A B A XOR B
0 0 0
0 1 1
1 0 1
1 1 0
Assim como as operações lógicas são derivadas de apenas três operações lógicas
básicas (NOT, AND e OR), as operações morfológicas também têm sua base, sendo
dilatação.
erosão e a dilatação são operações orientadas pela vizinhança. A vizinhança, neste caso, é
definida por uma pequena imagem binária, denominada elemento estruturante, que varre a
cada pixel preto na imagem de entrada, se houver pelo menos um vizinho branco, o pixel é
49
invertido na imagem de saída. Assim, os objetos crescem em área, podendo até se unir, e o
fundo e os buracos nos objetos diminuem, sendo até mesmo eliminados. Na erosão, para
cada pixel branco na imagem de entrada, se houver pelo menos um vizinho branco, o pixel
A E
Erosão Dilatação
A? E A? E
(Figura 28-a). Ele define a vizinhança como 3x3, sendo considerados vizinhos do pixel
define a vizinhança como 3x3, mas que considera todos os 8 pixels adjacentes como
vizinhos do pixel central. Contudo, podem ser definidos elementos estruturantes das mais
50
função do problema. Nos exemplos que se seguem, como na Figura 27, é utilizado o
elemento de conectividade 4.
(a) (b)
A partir das operações lógicas básicas (NOT, AND e OR) e das operações
objetos que tocam na borda da imagem (border object killing) e a extração de objetos
Dada uma imagem (A) e um elemento estruturante (E), uma imagem contendo
somente as bordas dos objetos de A pode ser obtida por uma operação morfológica de
A b(A)
X0 = b(Ib) (48)
51
k ∈ℵ* (50)
onde Ib é uma imagem com todos os pixels brancos, de mesma dimensão que A.
A fh(A)
que tocam na borda da imagem (border object killing) é mostrada na Figura 31 e definida
como:
A kbo(A)
Figura 31. Eliminação de objetos que tocam na borda da imagem (border object killing).
extração de objetos marcados (object marking). De fato, ela pode ser considerada como
uma operação de interseção de mais alto nível, uma interseção de objetos, como
exemplificado na Figura 32. A partir de duas imagens de entrada (A e B), ela fornece uma
imagem de saída que contém somente os objetos de A que tenham algum pixel branco em
52
X0 = B (53)
k ∈ℵ* (55)
A B om(A,B)
Uma outra operação, não propriamente derivada das operações já citadas, mas que
área (scrapping), que consiste em eliminar, na imagem, os objetos que tenham área, ou
seja, número de pixels, dentro de uma determinada faixa de valores. A Figura 33 mostra a
A scrapping(A,20,100)
Todas essas operações morfológicas descritas acima, são definidas a partir das
são geralmente feitas de outro modo, pois a repetida aplicação de operações com elemento
53
Distance Map - EDM) (Danielsson, 1980), descrito mais adiante. Apesar de
estruturante (conectividade 4) e baseadas no EDM. Ela mostra uma imagem binária com
desta imagem com elemento estruturante (Figura 34-b) e através do EDM (Figura 34-c).
passo, num único sentido (erosão ou dilatação) e somente para pixels adjacentes, a
dependendo da aproximação utilizada no EDM. Desta forma, estas operações são feitas
54
A partir de uma imagem binária de entrada, o cálculo do EDM gera uma imagem
de saída em tons de cinza, mantendo os pixels do fundo como 0 e atribuindo, a cada pixel
dos objetos, o valor, aproximado ou truncado, da distância euclidiana deste pixel ao pixel
A EDM(A)
0 1 1 1 0 0 0 0 0 0
1 1 2 1 1 1 1 1 0 0
1 1 1 1 1 2 2 1 1 1
0 1 1 0 1 2 3 2 2 1
0 1 1 0 1 2 3 2 1 1
0 1 1 0 1 2 3 2 1 0
0 1 1 1 1 2 3 2 1 0
0 0 1 1 2 3 3 2 1 0
0 0 0 1 2 2 2 2 1 0
0 0 1 1 1 1 1 1 1 0
imagem binária em questão e fazendo-se sua limiarização, com uma faixa tonal de (k + 1) a
255, obtém-se uma erosão de k passos. Já a dilatação é feita como uma erosão do fundo,
envolvendo assim uma etapa a mais. Através do complemento (NOT) da imagem binária,
gera-se a imagem binária do fundo, então calcula-se sua imagem de EDM e faz-se a
limiarização desta, com uma faixa tonal de 0 a k, obtendo-se uma dilatação de k passos.
55
(a) (c) (e)
Figura 36. Erosão e dilatação a partir do EDM: (a) imagem binária inicial; (b) complemento
da imagem binária inicial; (c) EDM (com look-up table); (d) EDM do complemento (com
look-up table); (e) erosão (10 passos); e (f) dilatação (10 passos).
reduzindo a área dos objetos, assim, elas são geralmente aplicadas de forma combinada,
como operações de abertura ou fechamento. Por outro lado, existem situações onde se
deseja realmente alterar a imagem, visando ressaltar certas características dos objetos ou da
com barreiras.
abertura de k passos é feita através de uma erosão de k passos seguida por uma dilatação
56
também de k passos. Como resultado, de acordo com o número de passos, pequenos objetos
seguida por uma erosão de k passos. Como resultado do fechamento, de acordo com o
número de passos, pequenos buracos são preenchidos e objetos próximos são unidos.
Figura 37. Abertura e fechamento: (a) imagem binária inicial; (b) abertura (10 passos); e (c)
fechamento (10 passos).
passo, de cada objeto na imagem, até que um próximo passo o eliminaria. Já a operação de
condicionada a não remover pixels que dividam os objetos. A Figura 38 mostra as imagens
57
(a) (b) (c)
Figura 38. Erosão derradeira e transformada do eixo medial: (a) imagem binária inicial; (b)
erosão derradeira; e (c) transformada do eixo medial.
dilatação e esqueleto skiz, consiste na dilatação dos objetos na imagem, com a condição de
que eles não se unam. Uma variante desta operação é a dilatação derradeira com barreiras
(Gomes & Almeida, 2001), onde os objetos se dilatam até o limiar de encontrarem uma
barreira (outro objeto), quando então, cessam a dilatação em todas as direções, não se
unindo. Assim, por não unirem os objetos que dilatam, estas operações são muito utilizadas
Figura 39. Dilatação derradeira e dilatação derradeira com barreiras: (a) imagem binária
inicial; (b) dilatação derradeira; e (c) dilatação derradeira com barreiras.
58
2.5.3 Separação de objetos que se tocam
segmentação. Tal problema precisa ser resolvido antes da etapa de extração de atributos,
pois, caso contrário, os objetos não poderão ser corretamente identificados, contados e
medidos. Assim, a separação de objetos que se tocam é um dos mais importantes tópicos da
etapa de pós-processamento.
agregando pixels a elas, sem permitir que estes agrupamentos se unam. A limiarização
imagem (o pixel mais brilhante) até que a faixa vá deste valor até 1. O resultado deste
processo é uma imagem binária onde linhas de 1 pixel de espessura (os divisores de águas)
dividem os objetos considerados como a união de vários, como mostrado na Figura 40.
(a) (b)
Figura 40. Método dos divisores de águas (watersheds): (a) imagem binária inicial; e (b)
imagem binária com objetos separados.
águas são definidos como linhas formadas por pixels com valores de tons de cinza mínimos
locais. Deste modo, o método dos divisores de águas é muito sensível a ruídos locais na
59
imagem do EDM, como os gerados por irregularidades nos contornos dos objetos na
imagem binária. Assim, antes das sucessivas limiarizações, a imagem do EDM geralmente
sofre uma filtragem passa-baixa para atenuar os ruídos locais. Com esta filtragem, geram-se
O método dos divisores de águas deve ser usado com cautela, pois é comum, para
uma mesma imagem, gerar separações espúrias e manter objetos unidos. O problema em
imagem. Nela são realizadas medidas sobre a imagem segmentada e/ou sobre a imagem em
(ii) Área;
(iv) Intensidade; e
(v) Textura.
(i) Tamanho;
60
(ii) Forma;
(iii) Posição;
(iv) Intensidade; e
(v) Textura.
em análise de imagem. Apesar de ser uma tarefa simples, esta pode não ser uma medida
muito fácil de ser feita manualmente, especialmente se o número de objetos for grande. No
entanto, digitalmente, é uma das medidas mais fáceis de ser realizada. A partir da imagem
segmentada, as regiões de pixels contíguos com a mesma tonalidade, que correspondem aos
(branco).
Conectividade 8 Conectividade 4
61
A Figura 42 apresenta uma pequena imagem, de 10x10 pixels, onde a definição da
2.6.1.2 Área
A área ocupada por objetos é uma medida fácil e rápida para o computador, ela é
obtida pela simples contagem dos pixels brancos na imagem binária. Dela, derivam-se
outras medidas importantes, também facilmente obtidas, como a fração de área do campo
ocupada por objetos e a área média dos objetos. A fração de área é calculada pela razão
entre o número de pixels brancos e o número total de pixels, na imagem binária. E a área
média dos objetos é calculada pela razão entre a área e o número de objetos.
a diferença entre estas medidas é clara. Desenhada uma linha de teste sobre uma imagem
imagem (Figura 43-a). Já as interseções são os pixels comuns entre a linha e os contornos
dos objetos (Figura 43-b), ou seja, são os pixels extremos de cada intercepto.
62
(a) (b)
2.6.1.4 Intensidade
de seus pixels. Assim, diferentemente das anteriores, estas medidas são feitas sobre
estatísticos simples descritivos de sua aparência, tais como brilho e contraste, que são as
255
B = ∑ r ⋅ p (r ) ; (57)
r =0
255
C= ∑ [r − B]
r =0
2
⋅ p( r ) . (58)
63
255
µ n (r ) = ∑ [r − B] ⋅ p(r ) .
n
(59)
r =0
medida de seu achatamento ou planaridade. Já os momentos de ordem mais alta não são
2.6.1.5 Textura
como a orientação preferencial dos cristalitos num material poli-cristalino. Já, em PADI,
textura é um conceito mais abrangente, sem definição formal, que visa representar as
variações locais de intensidade dos pixels em uma imagem. Pensando a intensidade dos
pixels como uma terceira dimensão da imagem, a textura pode ser entendida como uma
Por não haver uma definição formal, existem diversas técnicas de caracterização
da textura em uma imagem, cada qual mais adequada à detecção de um determinado tipo de
questão.
são geralmente utilizadas na análise de imagens que apresentam uma segunda fase dispersa,
64
ao seu grau de ordenamento, aleatoriedade e agrupamentos. Em (Shehata, 2000) são
(ii) Distribuição das Distâncias ao Vizinho Mais Próximo: uma técnica baseada na
histograma da imagem, são os mais simples e por isso devem ser sempre os primeiros a
serem testados. Devido a sua simplicidade, tais parâmetros podem ser classificados como
Intensidade”).
65
Os parâmetros estatísticos de segunda ordem, derivados da matriz de co-
parâmetros deste tipo, cada qual quantificando uma característica de textura, como
(textels) que são ordenadas segundo regras sintáticas, formando padrões. Tais técnicas
possam ser mais facilmente detectadas. As técnicas espectrais, baseadas nas propriedades
periodicidade espacial dos padrões. Mais recentemente, outras transformadas vem sendo
parâmetros de Haralick. Assim, a partir deste ponto, dedica-se maior atenção a estes.
direção vertical, e quantizada com Ng tons de cinza, ela pode ser representada como uma
valores de tom de cinza dos pixels na posição correspondente. Assim, a sua matriz de co-
ocorrência é uma matriz quadrada, de dimensão Ng × Ng, cujo elemento da linha i e coluna
66
de cinza i e j, separados por uma certa distância numa dada direção e sentido, que são
determinados por um vetor d. O vetor d é definido por suas componentes dx e dy, como
dy
dx
d = (dx, dy )
como:
(k , l ), (m, n) ∈ N y × N x ; (61)
(m, n) = (k + dy , l + dx ) ; (62)
Pd (i, j )
pd (i, j ) = ; (63)
R
onde R representa o número total de pares de pixels (i,j) e pode ser calculado pela seguinte
expressão:
R = ( N x − | dx |) ⋅ ( N y − | dy |) . (64)
separados por uma certa distância numa dada direção, independendo do sentido. Assim, tais
67
matrizes de co-ocorrência são simétricas e designadas por dois vetores opostos, d e –d.
(m, n) = (k ± dy , l ± dx ) ; (65)
R = 2 ⋅ ( N x − | dx |) ⋅ ( N y − | dy |) . (66)
Além disso, originalmente, consideram apenas o posicionamento relativo entre cada pixel e
seus vizinhos mais próximos, os pixels adjacentes, havendo, portanto, somente quatro
valores possíveis (0°, 45°, 90° e 135°) para o ângulo α, que designa a direção do vetor d, e
três valores possíveis (-1,0 e 1) para suas componentes dx e dy, de modo que:
α = 0° ⇒ d = (1,0) ; (67)
Haralick.
68
Tabela 2. Parâmetros de Haralick
Parâmetro Definição
Ng N g
Ng Ng
2) Contraste f 2 = ∑∑ (i − j ) 2 ⋅ p (i, j )
i =1 j =1
N g Ng
3) Correlação
∑∑ i ⋅ j ⋅ p(i, j) − µ
i =1 j =1
x ⋅µy
f3 =
σ x ⋅σ y
Ng Ng
4) Variância f 4 = ∑∑ (i − µ ) 2 ⋅ p (i, j )
i =1 j =1
Ng Ng
1
5) Momento Inverso da Diferença f5 = ∑∑ ⋅ p( i , j )
i =1 j =1 1 + (i − j ) 2
2⋅N g
6) Média da Soma f6 = ∑k ⋅ p
k =2
x+ y (k )
2⋅N g
7) Variância da Soma f7 = ∑ (k − f )
k =2
6
2
⋅ p x + y (k )
2⋅N g
N g Ng
N g −1
f9 − HXY1
12) Medida de Correlação (1) f12 =
max{HX , HY }
Ng
p (i, k ) ⋅ p ( j , k )
Q = −∑
k =1 p x (i) ⋅ p y ( k )
µx, µy e σx, σy são as médias e os desvios padrões de px e py
69
2.6.2 Medidas de Região
2.6.2.1 Tamanho
objetos, como sua área e perímetro. A seguir, são apresentadas as principais medidas de
são ilustradas.
A área é uma medida fácil e rápida para o computador, ela é obtida pela simples
contagem dos pixels do objeto na imagem segmentada (Figura 46-a). Uma variante da área
é a área preenchida (filled area), que, da mesma forma, é obtida simplesmente contando-se
os pixels, só que, neste caso, incluindo-se a área dos “buracos” do objeto (Figura 46-b).
Uma outra medida é a área convexa (taut string area), que consiste na área obtida
após tornar o objeto convexo. Tal medida é equivalente à área definida por um elástico
Figura 46. Medidas de área: (a) área; (b) área preenchida; e (c) área convexa.
perímetro de um objeto pode ser obtida diretamente de seu contorno. “Andando-se” sobre o
70
contorno do objeto e contando-se os passos horizontais, verticais e diagonais dados de cada
P = N + Nd , (71)
dos “buracos” do objeto também são considerados. E há, ainda, os perímetros preenchido
Figura 47. Medidas de perímetro: (a) perímetro; (b) perímetro preenchido; e (c) perímetro
convexo.
diferentes direções, e, assim, caracterizam suas dimensões externas. Os principais ferets são
o feret mínimo (Figura 48-a), também denominado breadth, e o feret máximo (Figura 48-
b). Como será visto mais adiante, a razão entre eles constitui-se numa boa medida de
alongamento. No entanto, como estes ferets nem sempre são ortogonais entre si, há ainda
um outro importante, o feret ortogonal ao máximo (Figura 48-c). Os ângulos destes ferets
também são medidas comumente utilizadas, o ângulo do feret máximo constitui-se numa
71
(a) (b) (c)
Figura 48. Ferets: (a) feret mínimo; (b) feret máximo; e (c) feret ortogonal ao máximo.
simplesmente width, é uma medida da “largura” do objeto. Como mostrado na Figura 49,
2.6.2.2 Forma
devem ser independentes do tamanho, posição e rotação dos objetos na imagem. Existem
72
Os fatores adimensionais de forma são parâmetros adimensionais derivados das
medidas geométricas básicas (área, perímetro, calibres, etc.). Eles variam geralmente entre
0 e 1, sendo 1 para formas padrões, como formas geométricas regulares, e 0 para formas
irregulares. Tanto as formas padrões, quanto o modelos teóricos que as definem, podem ser
Tendo o círculo, definido a partir da área (A) e do perímetro (P), como modelo de
4 ⋅π ⋅ A
FFC = . (72)
P2
É facilmente notável que FFC vale 1 para objetos circulares e apresenta valor menor para
objetos com outras formas, pois qualquer outra forma possui maior perímetro para a mesma
área. Por ser fortemente dependente do perímetro, o FFC é uma medida da suavidade do
contorno.
que é um fator de forma circular calculado a partir da área e do feret máximo (Fmax), como
mostrado a seguir:
4⋅ A
FFCc = . (73)
π ⋅ Fmax 2
Do mesmo modo, FFCc vale 1 para objetos circulares e menos do que 1 para objetos com
outras formas, pois qualquer outra forma, tendo o mesmo feret máximo, possui menor área.
Muitos outros fatores de forma circular ainda podem ser definidos, visando dosar
Paciornik, 2001), é definido o fator de forma circular modificado (FFCm) e, em (Grum &
como:
73
4⋅ A
FFCm = ; (74)
P ⋅ Fmax
16 ⋅ A
FFCg = . (75)
π ⋅ P ⋅ Fmax 3
são utilizados alguns fatores adimensionais de forma mais genéricos, que não visam
comparar sua forma a um modelo específico. Assim, é definida a razão de aspectos (RA),
que é calculada como a razão entre os ferets mínimo (Fmin) e máximo (Fmax), como
mostrado a seguir:
Fmin
RA = . (76)
Fmax
infinito.
ramificações pode ser definido como uma razão de aspectos modificada (RAm), onde o
feret mínimo (Fmin) é substituído pelo diâmetro do maior círculo inscrito, width (W), de
modo que:
W
RAm = . (77)
Fmax
forma, aqui chamado fator de ramificação (FR), definido como a razão entre width (W) e o
W
FR = . (78)
Fmin
74
Também é comum descrever um objeto como côncavo ou convexo. Para isso,
existem dois fatores adimensionais de forma, a convexidade (Conv) e a solidez (Sol), que
são definidos, respectivamente, como a razão entre o perímetro convexo (Pc) e o perímetro
(P) e como a razão entre a área (A) e a área convexa (Ac), de modo que:
Pc
Conv = ; (79)
P
A
Sol = . (80)
Ac
75
Tabela 3. Fatores Adimensionais de Forma
4⋅ A
Circularidade FFCc = alongamento
π ⋅ Fmax 2
4⋅ A alongamento e
Fator de Forma Circular Modificado FFCm =
P ⋅ Fmax suavidade do contorno
16 ⋅ A alongamento e
Fator de Forma Circular de Grum FFCg =
π ⋅ P ⋅ Fmax 3 suavidade do contorno
Fmin
Razão de Aspectos RA = alongamento
Fmax
W alongamento e
Razão de Aspectos Modificada RAm =
Fmax ramificação
W ramificação e
Fator de Ramificação FR =
Fmin encurvamento
Pc concavidade e
Convexidade Conv =
P suavidade do contorno
A concavidade e
Solidez Sol =
Ac ramificações finas e longas
forma. Nota-se que os objetos à esquerda (A, C e E) são facetados, enquanto que os à
direita (B, D e F) possuem contornos mais suaves. Assim, o fator de forma circular
apresenta valores próximos a 0,32 para A, C e E, e valores maiores, próximos a 0,47, para
B, D e F. Além disso, o alongamento dos objetos diminui de cima para baixo, de modo que
A e B; C e D; e E e F.
76
A B
A B C D E F
E F
forma, são funções calculadas a partir da posição e raio (distância ao centro de gravidade
sua natureza, são geralmente mais sensíveis a irregularidades do contorno (Gomes &
Paciornik, 2001).
A partir das posições dos pixels do contorno, define-se a curvatura (Ci), que é um
pixel como:
onde xi e yi são as coordenadas do i-ésimo pixel do contorno. Assim, define-se uma medida
1 N 2
EC = ⋅ ∑ Ci , (82)
P i =1
77
A partir dos raios dos pixels do contorno, são definidas outras medidas de
contorno, como o raio médio ( R ), a variância dos raios (VR) e a dispersão dos raios em
1 N
R= ⋅ ∑ Ri ; (83)
N i =1
⋅ ∑ (Ri − R ) ;
1 N
VR = (84)
N i =1
VR
DR = ; (85)
R2
seguinte:
Ri = (xi − xG )2 + ( yi − yG )2 , (86)
VR 1
MCg = ⋅ . (87)
( Fmax − R ) FFCm
2
Medidas de contorno mais complexas podem ser definidas a partir de uma técnica
representando-o como uma função, para então analisá-la. A assinatura mais comum é a
assinatura angular de contorno, que é definida como o raio de cada pixel do contorno em
função de seu ângulo. No entanto, caso os objetos tenham reentrâncias, esta função não será
unívoca. Então, deve ser utilizada uma assinatura seqüencial, onde a abscissa é formada
pela posição seqüencial dos pixels ao longo do contorno e a ordenada marca o raio ou o
de contorno de um objeto exemplo, uma partícula de grafita num ferro fundido cinzento.
78
35,0 D
B
30,0
25,0
20,0
Raio
15,0
10,0 A A
5,0
C
0,0
0 20 40 60 80 100 120 140
Pixel
contorno. No entanto, devido a sua natureza, tal função é discreta e periódica, onde o
expandindo-se esta função em série de Fourier, obtendo-se seus coeficientes, a partir dos
2.6.2.3 Posição
como as coordenadas dos pixels mais em cima, mais em baixo, mais a esquerda e mais a
79
considerados medidas de textura em imagens segmentadas e são geralmente utilizados para
caracterizar a dispersão dos objetos na imagem. Na seção 2.6.1.5, são listadas algumas
2.6.2.4 Intensidade
partir dos tons de cinza de seus pixels, assim, para a realização destas medidas são
Tais medidas são parâmetros estatísticos simples, como os tons de cinza mínimo e
máximo, o tom de cinza médio (brilho) e o desvio padrão dos tons de cinza (contraste). De
fato, são as mesmas medidas de intensidade utilizadas como medidas de campo (seção
2.6.1.4), só que, neste caso, são calculadas separadamente para cada região da imagem
correspondente a um objeto.
2.6.2.5 Textura
regiões são as mesmas medidas utilizadas como medidas de campo (seção 2.6.1.5).
material.
caracterizam, na imagem em tons de cinza, a textura das regiões delimitadas numa imagem
80
2.7 Reconhecimento de Padrões e Classificação
padrão de PADI. Nela é feito o tratamento dos dados quantitativos obtidos na etapa de
podem ser usadas para classificar os objetos em uma imagem. A partir dos atributos dos
representado por um vetor, formado por seus atributos, que assume a forma de um ponto
neste espaço. Então, a classificação dos objetos é feita através da análise do posicionamento
classificação supervisionada (Figura 53), as classes são definidas por padrões conhecidos,
de modo que um objeto é atribuído a uma classe de acordo com sua proximidade aos
características.
81
15
objeto desconhecido,
provavelmente classe verde
10
Atributo 2
5
0
0 5 10 15
Atributo 1
15 15
10 10
Atributo 2
Atributo 2
5 è 5
0 0
0 5 10 15 0 5 10 15
Atributo 1 Atributo 1
características; e
82
2.7.1.1 Conjunto de treinamento
conhecidos rotulados (previamente classificados). Ele deve ser grande o suficiente para ter
uma boa estatística, minimizando o efeito de ruídos, e deve apresentar grande variabilidade
características precisa ser robusto para agrupar as diferenças dentro de cada classe e
classificação.
classes, sendo geralmente utilizados vários atributos. Por outro lado, a adição de mais
manter-se uma boa estatística, o aumento do conjunto de treinamento, o que nem sempre é
possível (Raudys & Jain, 1991). Além disso, um grande conjunto de características pode
atributos disponíveis.
principais (PCA), que constrói atributos a partir da combinação linear de outros que
83
A seleção dos atributos, para formar o conjunto de características ótimo, pode ser
feita através da busca exaustiva do conjunto que atinja a melhor taxa de acerto para a
factível o teste de todos os conjuntos possíveis, sendo, então, buscado um conjunto sub-
ótimo. Neste sentido, a busca do melhor conjunto a partir daqueles atributos que sozinhos
apresentam as melhores taxas de acerto nem sempre dá bons resultados. Métodos de busca
de conjuntos sub-ótimos fogem do escopo deste trabalho. Diversas referências podem ser
2.7.1.3 Classificador
Mahalanobis.
Devido à sua natureza radial, este classificador só apresenta bons resultados quando os
clusters, que representam as classes, são convexos. Tal problema é minimizado com a
clusters.
84
Os classificadores paramétricos discriminam as classes através da estimativa de
conhecidos. A partir de então, o sistema está pronto para a classificação, propriamente dita,
de objetos desconhecidos.
decisão que dividem o espaço de características em sub-espaços, que representam, cada um,
uma classe.
85
3 Análise da Mesoestrutura de Bambus
3.1 Introdução
América Latina, sendo largamente utilizadas principalmente pelas suas populações rurais.
Muitas são as aplicações dos bambus, dentre as quais destacam-se seu uso como material
ao aço em estruturas de concreto armado, os bambus apresentam menores custo e peso para
uma mesma capacidade de carga. Uma outra linha de pesquisa estuda a introdução de fibras
utilização mais científica dos bambus, como na indústria da construção civil, depende
base em algumas características anatômicas macroscópicas (pontas dos colmos, bainhas dos
86
(b) bainhas dos colmos
(d) conjuntos vasculares
(a) ponta dos
colmos
(c) folhas
subjetivo e lento, que não é adequado para o uso em grande escala na indústria e que nem
nota-se que este é constituído de duas fases, de modo que os bambus podem ser
considerados como um material compósito, formado por longas e alinhadas fibras imersas
microscópio óptico (Figura 56-b), percebe-se que o que a princípio é visto como uma fibra
é na verdade um conjunto vascular composto por vasos e fibras. A Figura 57 mostra duas
imagens obtidas em MEV, extraídas de Liese (Liese, 1987), onde vê-se em detalhe estas
estruturas.
87
(a)
(b)
Figura 56. Seção reta de um colmo de bambu a olho nu (a) e numa lupa (b).
parênquima
vasos
esclerênquima
mecânica. Os vasos têm como função o transporte de nutrientes da raiz às demais partes da
planta e, como os bambus possuem estrutura bastante esbelta, estes são reforçados por um
88
resistência do bambu. Já a matriz do compósito bambu é formada por um tecido
Segundo Taihui & Wenwei (Taihui & Wenwei, 1987), os conjuntos vasculares
podem ser divididos em sete tipos, de acordo com o modo como as regiões de
esclerênquima se arranjam em torno dos vasos. Na Figura 58, pode-se ver desenhos
produzidos por Taihui & Wenwei, que mostram estes sete tipos de conjunto vascular.
1. Não-diferenciado
2. Semi-diferenciado
3. Double-broken
4. Broken
5. Slender waist
6. Open
7. Semi-open
espécies, ocorrendo nas regiões da espessura próximas à superfície externa do colmo dos
demais cinco tipos como classes de conjuntos vasculares. Extraindo-se alguns conjuntos
vasculares dos desenhos de Taihui & Wenwei (Figura 58), foram produzidas cinco imagens
89
Classe I – Double-broken
Classe II – Broken
Classe IV – Open
Classe V – Semi-open
conjunto vascular e a razão entre área da maior região de esclerênquima e a área convexa
O primeiro atributo é óbvio, pois das cinco classes de conjunto vascular, apenas
duas têm o mesmo número de regiões de esclerênquima, open e slender-waist, que possuem
quatro. Além disso, este é um atributo discreto e que só pode assumir quatro valores (2, 4, 5
90
O segundo atributo tem por objetivo justamente a separação das classes open e
duas características que são diferentes nestas classes. Os conjuntos vasculares da classe
slender-waist são mais “densos”, apresentam mais área de esclerênquima por área de
Em seguida, notou-se que a soma destes dois atributos formaria um atributo capaz
foi composto pelas cinco imagens da Figura 59. E a validação foi feita com o próprio
3.2.2 Classificação
totalizando oito amostras, duas por espécie. As amostras foram preparadas por lixamento
(lixas no 400, 600 e 1000) e polimento (alumina, 6mm). Então, observou-se as amostras em
uma lupa com 6x de magnificação e suas imagens (1 campo por amostra) foram captadas
por uma câmera de vídeo, ligada a um computador PC através de uma placa digitalizadora
91
objetos formados, não por uma única região branca cada, mas por conjuntos de regiões
brancas separadas. Assim, a seqüência padrão de PADI não é a forma mais simples de
representação desta rotina. Então, seu fluxograma foi organizado em etapas conforme
Segmentação do bambu
Escamação do bambu
Segmentação dos
conjuntos vasculares
Segmentação das
regiões de esclerênquima
Classificação
Para isso, buscou-se algo existente em todo o bambu e que não há no fundo. Como pode ser
visto na Figura 61, o que basicamente o diferencia o bambu do fundo é a alta freqüência
espacial no bambu, formada pelas bordas entre a matriz e o fundo e entre a matriz e as
92
regiões de esclerênquima. Assim, decidiu-se pela segmentação das bordas, seguida de
3 mm
bordas, “expande-se” a imagem em tons de cinza (Figura 62). É criada uma imagem
completamente preta (todos os pixels iguais a zero) de tamanho maior que a imagem
original. Então, a imagem original, em si, é colocada em seu centro. O problema é que isto
gera alta freqüência espacial no fundo, entre o fundo original e o novo fundo, que é
aproximada do fundo original e mede-se seu tom de cinza médio. Aí, a fim de minimizar a
freqüência espacial entre o fundo original e o novo, pinta-se o novo fundo da imagem
“expandida” com o tom de cinza médio do fundo original, como mostrado na Figura 62.
93
è
grosseira do bambu. A partir da imagem em 256 tons de cinza do bambu (Figura 63-a),
procede-se a uma segmentação de Otsu (Figura 63-b) seguida por operações morfológicas
(dilatação, hole filling e erosão). Desta forma, gera-se uma imagem binária (Figura 63-c)
cujo negativo é uma aproximação do fundo, boa o suficiente para se medir seu tom de cinza
médio.
seguido pelo filtro Sobel e segmenta-se a imagem obtida através de uma segmentação
94
Figura 64. Imagem binária das bordas.
Mesmo com uso do passa-baixa, esta imagem binária ainda contém muitos
adaptativa da imagem “expandida” original, gerando-se uma imagem binária (Figura 65-a).
Sobre esta, são feitas operações morfológicas (fechamento, hole filling e scrapping) para
fechar seus “buracos”, obtendo-se uma outra imagem binária (Figura 65-b), já bem próxima
da imagem binária do bambu, mas que apresenta erros nas bordas entre o bambu o fundo.
Esta imagem serve então como marcador numa operação de extração de objetos marcados
(object marking) com a imagem binária das bordas (Figura 64), de modo a gerar uma
95
Então, a partir desta imagem binária “mais limpa” das bordas (Figura 65-c), faz-se
uma dilatação lateral radical (Figura 66-a) e preenche-se os “buracos” restantes através de
operações de fechamento e hole filling (Figura 66-b). Daí, procede-se a uma erosão lateral,
obtendo-se a imagem binária da Figura 66-c. Aí, corta-se esta imagem para que ela fique do
através de sua espessura. Então, após classificar cada conjunto vascular, determina-se a ou
96
as classes de conjunto vascular típicas de cada camada, caracterizando-se assim a variação
Foi arbitrado que dividir o colmo do bambu em oito camadas seria o suficiente. As
seis camadas mais internas, as de cima nas imagens, seriam usadas para caracterizar a
variação dos conjuntos vasculares através da espessura do colmo do bambu. As duas mais
externas, as de baixo nas imagens, foram ignoradas, pois geralmente contém de modo
por linhas verticais igualmente espaçadas (10 pixels). Desta imagem, elimina-se as linhas
que não tocam o bambu e adiciona-se as linhas verticais que passam pelas extremidades
laterais do bambu. Aí, pinta-se cada linha da grade com o tom de cinza correspondente à
ordem em que ela aparece da esquerda para a direita (Figura 68-a), o que é necessário para
manter um registro do ordenamento das linhas, pois adiante estas são ligadas em ordem.
Para facilitar sua visualização, à Figura 68-a foi aplicada uma look-up table.
Então, aplica-se a imagem binária do bambu, como uma máscara, sobre a imagem
da grade pintada, gerando-se a imagem (Figura 68-b) onde se mede a posição (x, y mínimo
e y máximo) e a ordem (tom de cinza) de cada linha. A partir desses dados, liga-se pontos
intermediários (a 1/8, 2/8, 3/8, 4/8, 5/8 e 6/8) das linhas verticais, formando as curvas de
corte, com as quais obtém-se a imagem do bambu separado em camadas (Figura 68-c).
97
(a) (b) (c)
como dito anteriormente, os conjuntos vasculares são objetos complexos, formados, cada
representam uma medida do espaçamento entre as regiões, de modo que vales mais
abruptos indicam uma maior proximidade entre duas regiões e vales mais suaves denotam
um maior afastamento.
espécies de bambu, mas também dentro de uma mesma amostra, fazendo-se necessário o
emprego de um procedimento de segmentação que seja robusto para abarcar toda esta
variabilidade.
98
segmentação recursiva a partir da segmentação “Valleys” do KS400 (Carl Zeiss Vision,
ou muito grandes (com área fora do desvio padrão), pois são provavelmente
imagem binária que, depois de passar por uma operação de dilatação, une regiões de
esclerênquima e vales (Figura 69-a). Algumas destas uniões formam anéis, cujos interiores
constituem “sementes” a partir das quais obtém-se os conjuntos vasculares. Assim, faz-se o
negativo desta imagem e elimina-se os objetos que tocam sua borda (border object killing),
gerando-se a imagem da Figura 69-c. Esta imagem serve então como marcador numa
operação de extração de objetos marcados (object marking) com a imagem das “sementes”,
99
de modo a eliminar as “sementes” que não tocam em regiões de esclerênquima, que
obviamente não são “sementes” de conjuntos vasculares. Aí, faz-se uma dilatação das
marcador a imagem das “sementes”. A imagem assim obtida passa por algumas operações
morfológicas (fechamento, hole filling e border object killing), gerando-se a imagem dos
No caso da amostra que se vem acompanhando, bastaram três ciclos (Figura 70-a,
100
Atingido o ponto ótimo da recursão (Figura 70-c), elimina-se os conjuntos
vasculares que tocam as bordas da imagem, com a operação border object killing,
objetos muito pequenos ou muito grandes (com área fora do desvio padrão), que
(a) (b)
Figura 71. Eliminação dos conjuntos vasculares que tocam as bordas da imagem ou que
possuem área fora do desvio padrão.
da imagem em tons de cinza do bambu. Aí, faz-se a interseção desta imagem (Figura 72-a)
com a imagem dos conjuntos vasculares (Figura 72-b), obtendo-se a imagem da Figura 72-
c. O problema é que esta imagem geralmente contém muitos erros, como pequenos objetos
facilmente eliminados com uma operação de scrapping, entretanto a separação das regiões
101
(a) (b) (c)
método dos divisores de águas (watersheds), entretanto, neste caso, ele não é aplicável.
contornos causada pela baixa resolução, o watersheds acaba por dividir regiões que não
gera muitos erros, pois, devido ao tamanho reduzido de várias das regiões, ele tende a
eliminá-las.
Então, foi utilizada uma variante mais controlável do watersheds. Tal técnica,
como descrita na seção 2.5.3 (“Separação de objetos que se tocam”), consiste na realização
seguida de três operações (erosão, dilatação derradeira e interseção). Faz-se uma erosão de
assim obtida com a imagem inicial dos objetos, gerando-se uma imagem onde alguns
esclerênquima são geralmente mais convexas que objetos formados pela união de duas ou
esclerênquima, todos os objetos com convexidade acima de 0,75 e solidez acima de 0,60,
102
retirando-os da imagem antes de se proceder à separação e retornando-os em seguida. De
maneira similar, objetos pequenos (com área entre 5 e 25 pixels) devem ser retirados da
e a imagem obtida pela segmentação de Otsu (Figura 72-c), faz-se um scrapping para
eliminar objetos muito pequenos, com área menor ou igual a 5 pixels. Então, retira-se, da
imagem assim obtida, os objetos pequenos (com área entre 5 e 25 pixels) e os objetos mais
convexos (com convexidade acima de 0,75 e solidez acima de 0,60). Isto gera três imagens,
uma somente com os objetos pequenos (Figura 73-a), uma só com os mais convexos
(Figura 73-b) e uma outra onde eles foram excluídos (Figura 73-c). Nesta última, procede-
apenas um passo na erosão. Aí, por fim, a imagem resultante é somada à imagem dos
formados, cada um, não por uma única região branca, mas por um conjunto de regiões
103
brancas separadas, as regiões de esclerênquima. Assim, para se proceder à extração dos
atributos, faz-se necessária ainda uma etapa de processamento, através da qual são
Separa-se cada conjunto vascular em uma imagem diferente (Figura 74-a) e faz-se
a interseção de cada uma destas com a imagem das regiões de esclerênquima, obtendo-se
imagens com as regiões de esclerênquima de cada conjunto vascular (Figura 74-b). A partir
coordenadas do primeiro pixel de cada região, varrida a imagem da esquerda para a direita,
de cima para baixo. Aí, para medir a área convexa das regiões como um todo, une-se as
regiões a partir do primeiro pixel de cada uma (Figura 74-c) e mede-se a área convexa deste
Então, a partir destas medidas, calcula-se o atributo único (AU) usado para a
vascular com a imagem de cada camada, medindo-se as áreas de cada um em cada uma.
Então, atribui-se cada conjunto vascular à camada do bambu na qual ele tem maior área.
104
3.2.2.6 Classificação
conjuntos vasculares cujo número de regiões de esclerênquima difere dos valores possíveis
(2, 4, 5 e 6) e, também, os conjuntos vasculares não pertencentes a uma das seis camadas
mais internas, as de cima nas imagens. Visualmente, a Figura 75 mostra esta “limpeza”.
(a) (b)
Então, feita a “limpeza”, classifica-se cada conjunto vascular segmentado das oito
amostras em estudo.
amostras de bambu.
105
3 mm 3 mm
Camada DB B SW O SO Camada DB B SW O SO
1 0 0 0 100 0 1 0 0 0 100 0
2 0 0 0 100 0 2 0 0 0 100 0
3 0 0 0 100 0 3 0 9 9 82 0
4 0 6 19 63 13 4 0 0 25 63 13
5 0 0 0 0 100 5 0 0 0 14 86
6 0 0 0 0 100 6 0 0 0 0 100
106
3 mm 3 mm
Camada DB B SW O SO Camada DB B SW O SO
1 50 25 0 25 0 1 0 50 25 25 0
2 0 67 33 0 0 2 57 29 0 0 14
3 67 11 0 0 22 3 56 11 22 0 11
4 67 33 0 0 0 4 63 13 13 0 13
5 47 47 7 0 0 5 45 36 0 0 18
6 27 60 13 0 0 6 38 50 13 0 0
107
3 mm 3 mm
Camada DB B SW O SO Camada DB B SW O SO
1 0 0 0 100 0 1 0 0 0 100 0
2 0 0 0 100 0 2 0 7 0 93 0
3 0 0 8 92 0 3 0 0 0 100 0
4 0 0 37 53 11 4 0 0 36 36 29
5 0 0 0 0 100 5 0 0 6 0 94
6 0 0 0 0 100 6 0 0 0 0 100
108
3 mm 3 mm
Camada DB B SW O SO Camada DB B SW O SO
1 0 20 0 80 0 1 0 0 0 100 0
2 0 5 0 95 0 2 0 0 0 100 0
3 0 0 0 100 0 3 0 5 0 89 5
4 0 4 0 83 13 4 0 0 19 56 25
5 0 0 0 6 94 5 0 0 0 0 100
6 0 0 0 0 100 6 0 0 0 0 100
treinamento representam uma limitação ao processo, pois são imagens sintéticas com
validação do classificador forneceu taxas de acerto iguais a 100% para todas as classes e os
amostras de uma mesma espécie apresentam grande semelhança nas classes dos conjuntos
109
discordâncias, principalmente nas amostras da espécie Gigante, o que é provavelmente
desta espécie e de outras, que contenham poucos conjuntos vasculares por camada,
demanda mais campos por seção reta do colmo, de modo a melhorar a estatística envolvida.
110
4 Classificação Automática de Grafita em Ferros
Fundidos
4.1 Introdução
O ferro fundido pode ser definido como uma liga Fe-C com teor de carbono
com formas nodulares melhoram estas propriedades, enquanto que partículas mais
tensão (Van Vlack, 1970). Assim, o ferro fundido é classificado segundo as formas de suas
partículas de grafita.
estas classes.
111
Classe I – Lamelar Classe II – Crab ou Spiky Classe III – Vermicular
Figura 80. Imagens de referência das seis classes de partículas de grafita (ISO-945).
observação de seções planas, pois as lamelas são interligadas, formando colônias que só
características do ferro fundido cinzento, assim denominado, devido à coloração escura que
fato, o ferro fundido nodular é geralmente caracterizado pela presença de pelo menos 80%
de partículas de grafita das classes V e VI, aliada à ausência de partículas das classes I e II
112
(Fargues & Stucky, 1994). Devido à sua alta ductilidade, dada pelas partículas de grafita de
forma nodular, o ferro fundido nodular também é chamado ferro fundido dúctil.
A classe III é chamada vermicular pois suas partículas de grafita têm aparência
similar a vermes. A classe III é característica do ferro fundido vermicular, que é assim
denominado, quando apresenta pelo menos 80% de partículas desta classe, acompanhadas
de partículas das classes V e VI (Carmo & Costa, 1996). A classe III representa partículas
de grafita que têm uma forma intermediária entre as classes I (lamelar) e VI (nodular
regular) e que também podem formar colônias como as formadas por partículas da classe I.
A classe II, denominada crab ou spiky por causa de sua forma com ramificações
que não corresponde a nenhum tipo específico de ferro fundido. As partículas de grafita
nodulizantes em excesso (Hecht, 1995). Partículas de grafita desta classe também ocorrem
procedimento subjetivo e lento, não sendo apropriado para o uso em grande escala na
indústria.
partículas de grafita, em ferros fundidos, de acordo com a norma ISO-945. Trata-se de uma
113
rotina de classificação supervisionada onde as imagens de referência da norma ISO-945 são
ferro fundido. A Figura 81 mostra o fluxograma desta rotina, destacando por cores as
Aquisição
Treinamento Segmentação
Classificação
% de cada classe
114
1. A: área;
5. FFCc: circularidade;
uma imagem binária, seja do conjunto de treinamento, seja de uma amostra de ferro
imagem binária (Figura 82-a) com um tom de cinza k2 (Figura 82-b), então aplica-se, na
imagem obtida, um filtro passa-baixa média com kernel de tamanho k x k (Figura 82-c). Aí,
a partir da imagem binária, gera-se uma imagem das bordas das partículas e aplica-se esta,
como uma máscara, à imagem gerada pelo filtro média. A imagem resultante (Figura 82-d)
destas poucas operações é uma imagem das bordas das partículas, onde cada pixel tem um
115
Então, basta medir o tom de cinza médio dos objetos nesta imagem para se ter o AIM. Neste
(d) (e)
Figura 82. Ângulo interno médio: (a) imagem binária; (b) imagem pintada com um tom de
cinza k2; (c) imagem borrada pelo filtro passa-baixa média com kernel de tamanho k x k;
(d) imagem final resultante (com look-up table); e (e) look-up table.
em 16383 diferentes conjuntos de atributos. Para cada conjunto, extraiu-se os atributos das
validação. Assim, todos os conjuntos foram testados num processo de busca exaustiva do
conjunto ótimo.
resolução.
116
A capacidade de generalização do sistema foi testada fazendo-se uma verdadeira
classe nas imagens de referência formou um novo conjunto de treinamento e a outra metade
e à grande variabilidade de forma dentro de cada classe, a escolha das metades influencia
selecionou-se as partículas ímpares, pares, duas sim/duas não, duas não/duas sim, a metade
treinamento, gerou-se oito conjuntos das imagens de referência, com resoluções diferentes,
abaixo e acima da resolução das imagens inicialmente utilizadas (512x512 pixels). Assim,
destas novas imagens, obtendo-se um gráfico da taxa de acerto global conseguida, por cada
4.2.2 Classificação
117
observadas no microscópio óptico (100x de magnificação), como no método tradicional, de
amostra, capturando-se suas imagens através de uma câmera de vídeo ligada a uma placa
obtidas, 10 de cada amostra, foram então processadas e analisadas no software KS400 (Carl
padrão de PADI:
matriz;
da imagem (pós-processamento);
• classificação.
desenvolvido para classificar ferro fundido é bem simples. O treinamento resume-se à etapa
corriqueiras.
O fato das amostras de ferro fundido não serem atacadas propicia uma boa
118
segmentação por limiarização, de modo que uma rápida segmentação automática de Otsu é
suficiente.
processamento, scrapping para eliminar partículas muito pequenas e border object killing
para eliminar partículas que tocam as bordas da imagem. As partículas muito pequenas são
fato a principal questão. O conjunto de atributos precisa ser robusto para agrupar a grande
variabilidade de formas apresentada em cada classe e sensível bastante para distingüir estas
pelo menos uma medida de tamanho, a fim de que, em pelo menos uma dimensão do
notar que todas as partículas têm “largura” (width) semelhante, mas o “comprimento”, que
neste caso pode ser grosseiramente estimado como a metade do perímetro, varia bastante.
Deste modo, verificam-se valores bem distintos para alguns parâmetros de forma.
119
Figura 83. Grande correlação tamanho-forma.
O outro fator que corrobora a necessidade de pelo menos uma medida de tamanho
objeto, mais fiel à realidade é sua forma, de modo que a degradação é inversamente
proporcional ao tamanho. Ou seja, esta é uma questão de amostragem, quanto mais pixels
validação com cada conjunto de atributos, ser menor do que 1 s (em um Pentium III 500
processamento.
validação.
obtida com conjuntos de atributos que não contenham os atributos de cada coluna. Esta taxa
120
diz qual o máximo desempenho conseguido sem a adição de determinado atributo no
As linhas “Méd. sem” e “Méd. com” trazem as taxas de acerto globais médias
obtidas sem e com a presença dos atributos nos conjuntos. A linha “Dif. Méd.” mostra a
diferença entre as taxas médias “com” e “sem”. Esta diferença dá uma idéia do ganho do
máxima e mínima obtidas com a presença dos atributos nos conjuntos. E a linha “Só”
presença ou não de medidas de tamanho. Referindo-se a esta coluna, “sem” significa sem
nenhuma medida de tamanho, “com” significa com pelo menos uma e “só” representa as
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Atributo A Cx PA Tam.* FFC FFCc FFCm FFCg RA RAm FR Conv Sol MCg AIM
Máx. sem 97,65 98,82 98,82 97,65 99,41 99,41 98,82 98,82 99,41 98,82 98,82 97,65 98,82 99,41 96,47
Méd. sem 90,93 91,80 91,77 90,40 91,40 91,57 91,45 91,83 91,71 91,30 91,84 91,26 91,73 91,40 89,61
Méd. com 92,94 92,07 92,10 92,16 92,48 92,30 92,43 92,05 92,16 92,57 92,03 92,61 92,14 92,47 94,26
Dif. Méd. 2,02 0,27 0,33 1,75 1,08 0,72 0,98 0,22 0,45 1,28 0,19 1,35 0,41 1,06 4,65
Máx. com 99,41 99,41 99,41 99,41 98,82 98,82 99,41 99,41 98,82 99,41 99,41 99,41 99,41 98,82 99,41
Mín. com 34,71 29,41 29,41 29,41 50,00 70,59 62,94 70,00 62,35 71,76 39,41 36,47 54,71 67,65 52,35
Só 34,71 36,47 37,06 52,35 51,18 70,59 62,94 70,00 62,35 71,76 39,41 36,47 54,71 71,18 52,35
*Tam.: medidas de tamanho (“sem” é sem nenhuma, “com” significa com pelo menos uma e “só” representa as 3 juntas.
de medidas de tamanho no conjunto de atributos. Sem pelo menos uma medida de tamanho,
no caso a área (A), a taxa de acerto global da auto-validação não vai além de 97,65%. Além
disso, a área (A) apresenta uma diferença entre as taxas médias (2,02%) bem superior à dos
121
De fato, o ângulo interno médio (AIM) é o atributo decisivo. Ele apresenta o maior
valor para a diferença entre as médias (4,65%) e sem ele a taxa de acerto global da auto-
validação não passa de 96,47%. Sua contribuição ao conjunto de atributos fica ainda mais
5,00
Diferença entre as taxas médias (%)
AIM
4,00
com e sem o atributo
3,00
2,00 A
RAm Conv
1,00 FFC FFCm MCg
RA
Cx PA FFCc FFCg Sol
FR
0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Atributo
Figura 84. Diferença entre taxas de acerto globais médias (%) com e sem o atributo.
100,00
Taxa de acerto global máxima sem o
98,00
A Conv
97,00
AIM
96,00
95,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Atributo
“metades” e, em seguida, para o teste de influência da resolução. Deste modo, a partir deste
122
programação do KS400 (Carl Zeiss Vision, 1998), o cálculo deste atributo é lento e torna-
atingiram uma taxa de acerto global na auto-validação maior do que 97%, e procedeu-se à
acerto global na validação (Tabela 5). Nota-se, observando esta tabela, que as taxas de
acerto são menores do que aquelas obtidas na auto-validação. Contudo, isto já era esperado,
das classes.
Tabela 5. Validação
Conjunto de atributos Auto-validação (%) Validação (%)
A, FFCm, RA, Conv, RAm, AIM 97,06 92,16
A, FFCm, RA, Conv, AIM 98,24 91,94
A, FFCm, Conv, Sol, AIM 97,06 90,55
A, FFC, FFCm, RA, Conv, RAm, AIM 97,65 90,33
A, FFC, FFCm, Conv, FR, RAm, AIM 98,24 90,33
A, PA, FFCm, RA, Conv, RAm, AIM 97,06 89,98
A, FFCm, FFCg, Conv, FR, RAm, AIM 98,24 89,96
A, FFCm, FFCg, RA, Conv, AIM 98,24 89,94
A, FFC, FFCc, RA, Conv, RAm, AIM 97,65 89,93
A, FFCg,Conv, Sol, RAm, AIM 98,24 89,80
86) mostram que, com todos estes 10 conjuntos, a resolução exerce forte influência, sendo
coincidentes e são paralelas à curva do atributo AIM sozinho. Assim, apesar do atributo
AIM ser o mais contributivo para a qualidade do sistema, verifica-se que ele é muito
123
dependente da resolução, e, deste modo, acaba por “contaminar” o conjunto de atributos,
100,00
90,00
80,00
20,00
10,00
0,00
128 171 256 341 512 768 1024 1536 2048
conjuntos de atributos que não contém o AIM (Figura 87), nota-se que realmente é o AIM
124
100,00
90,00
80,00
70,00
A,Cx, PA, FFCc, Conv, Sol, FR, RAm
Taxa de acerto global (%)
20,00
10,00
0,00
128 171 256 341 512 768 1024 1536 2048
Assim, abriu-se mão dos conjuntos de atributos contendo AIM. Então, escolheu-se,
dentre estes 10 conjuntos sem o AIM, o conjunto {A, PA, FFC, FFCc, RA, RAm}, que
taxa global na auto-validação (94,7%). A Tabela 6 e sua representação pictórica (Figura 88)
125
Classe I – Lamelar Classe II – Crab ou Spiky Classe III – Vermicular
classificador de Bayes, pois fez-se a busca exaustiva da auto-validação duas vezes, com
Bayes e com Distância Euclidiana, e Bayes apresentou melhores taxas de acerto (Tabela 7).
óptico, uma imagem com as partículas pintadas segundo a classificação e uma tabela com
126
Amostra 1 - Cinzento Amostra 2 - Maleável Amostra 3 - Nodular
30 µm 30 µm 30 µm
ferro fundido cinzento, teve como classe predominante, a classe I, 42,94% das partículas de
grafita foram assim classificadas. A amostra 2, um ferro fundido maleável, apresentou mais
(57,19%). A amostra 3, um ferro fundido nodular, teve quase 95% das partículas
representassem uma grave limitação ao processo por serem imagens sintéticas e possuírem
grande variabilidade de formas dentro de uma mesma classe, representando bem cada
127
classe. Deste modo, as imagens de referência utilizadas constituem um bom conjunto de
auto-validação. Assim, para o futuro, pensa-se estudar mais profundamente o atributo AIM,
128
5 Análise nano-estrutural de um compósito resina-
grafite
5.1 Introdução
A mistura íntima de duas ou mais fases com diferentes propriedades mecânicas dá origem a
que a variação nas propriedades é bem maior, pois algumas propriedades físicas, como a
de grafite dispersas, apresenta esta grande variação nas suas propriedades dielétricas. A
resina tem uma alta resistividade elétrica e o grafite é condutor. Assim, a mistura dos dois,
anti-radar).
modelado como uma mistura binária dos componentes puros. Entretanto, as propriedades
129
O material compósito em questão é obtido através da dispersão, com um
de grafite têm a tendência de se aglomerar em clusters de 160 nm com uma grande força de
forças de cisalhamento intensas o bastante para suplantar a força de coesão entre as nano-
uma cebola, onde as camadas são formadas pelo empilhamento de planos (~100) de átomos
de carbono com distância inter-planar de 0,37 nm. Contudo, a união destes planos é
mantida somente por forças de Wander Waals, não sendo, portanto, muito forte. Assim, há
coesão entre as nano-partículas de grafite, sejam grandes o suficiente para arrancar planos
propriedades elétricas do material, como por exemplo a condutividade elétrica, que seria
bem aumentada.
hipótese.
as fases, pois a freqüência espacial dos planos de carbono é escondida pela matriz
microscopia de alta resolução, como a filtragem no espaço de Fourier, não podem ser
130
empregadas. Do mesmo modo, por não haver definição clara de tons de cinza ou contornos
localmente o contraste nas imagens, pois os tons de cinza devem variar menos nos planos.
Da mesma forma, tal presença propiciaria algum ordenamento local, proporcionando uma
metodologia aqui proposta utiliza a análise de textura através dos chamados parâmetros de
simples. Além disto, alguns deles são correlatados, de modo que seu uso simultâneo não
contraste e entropia), que são aparentemente descorrelatados e cujo significado físico indica
2,64% em peso de grafite. Ele foi observado em um MET no modo de alta resolução
de 2048x2048 pixels com uma resolução final de 0,03 nm/pixel. Assim, foram geradas
imagens de resina pura (Figura 90-a), imagens de compósito em regiões sem nano-
grafite (Figura 90-c). Toda esta etapa de aquisição das imagens foi realizada no Centre de
Matériaux Pierre Marie Fourt da Ecole Nationale Supérieure des Mines de Paris, pela
equipe do Dr. Alain Thorel, com quem este trabalho foi feito em colaboração.
131
(a) (b)
10 nm 10 nm
10 nm
(c)
Figura 90. Imagens de HRTEM de: (a) resina pura; (b) compósito em região sem nano-
partículas de grafite; e (c) compósito onde aparecem nano-partículas de grafite.
KS400 (Carl Zeiss Vision, 1998). A rotina de processamento e análise das imagens é
simples, porém peculiar. Não há etapa de segmentação e as medidas são feitas sobre
132
igualar seu brilho. A partir daí, constróem-se duas imagens binárias, complementares entre
si, de mesmas dimensões das imagens do material, formadas por mosaicos de quadrados de
igual tamanho (Figura 91). Tais imagens são aplicadas, como máscaras, às imagens
Figura 92. Aplicação das imagens dos mosaicos sobre uma imagem do compósito.
mosaicos são tidos como objetos independentes. Então, mede-se, em cada quadrado, os três
parâmetro em quatro direções (0°, 45°, 90° e 135°). Em todas as análises, os parâmetros de
Haralick foram calculados a partir da matriz de co-ocorrência com a distância entre pixels
Haralick. Para isto, foram separadas as 9 imagens de resina pura e 9 imagens de compósito
133
em regiões sem nano-partículas de grafite. Variou-se o tamanho dos quadrados, em
pode ser claramente vista na Figura 93. Tanto para a resina pura como para o compósito, o
assintóticos para ambos, uniformidade e entropia, são atingidos entre 64x64 e 128x128
pixels.
8 8
7 Contraste x4 7
Valor do parâmetro
Valor do parâmetro
6 6 Contraste x4
Entropia
5 5
Entropia
4 4
3 3
Uniformidade x 40
2 Uniformidade x 40 2
1 1
0 0
4 16 64 256 1024 4 16 64 256 1024
Tamanho do quadrado (pixels) Tamanho do quadrado (pixels)
(a) (b)
pixels. Este tamanho está na região assintótica dos gráficos e fornece um total de 400
134
(20x20) quadrados por imagem, permitindo a exclusão de alguns pixels nas bordas das
entropia) mostraram proporcionar uma boa discriminação entre resina pura e compósito. A
Figura 94 mostra os histogramas destes três parâmetros obtidos a partir das 9 imagens de
(a) (b)
60% 16%
Resina pura Resina pura
14%
50% Compósito Compósito
12%
População (%)
População (%)
40%
10%
30% 8%
6%
20%
4%
10%
2%
0% 0%
0,00 0,04 0,08 0,12 0,16 0,20 0,0 0,4 0,8 1,2 1,6 2,0 2,4
Uniformidade Contraste
30%
Resina pura
25% Compósito
População (%)
20%
15%
10%
5%
0%
2,8 3,8 4,8 5,8
Entropia
(c)
Figura 94. Histogramas da uniformidade (a), contraste (b) e entropia (c) para resina pura e
compósito entre nano-partículas de grafite (quadrados de 100x100 pixels).
135
entropia, nota-se que a resina pura apresenta histogramas mais estreitos, denotando portanto
(picos a 0,09 e 0,15). Por outro lado, parte da população apresenta valores de uniformidade
muito similares aos da resina pura (pico a 0,04). Isto pode indicar a separação entre regiões
compósito. Todavia, o compósito apresenta maior população com valores menores. Como
mencionado anteriormente, isto pode ser explicado pela presença de pequenas camadas de
carbono, que criariam regiões com tons de cinza aproximadamente constantes. A Figura 95
Assim, tudo leva a crer que o processo de fabricação do compósito realmente está
136
dispersa na matriz de resina. Análises preliminares de EELS são consistentes com esta
137
6 Conclusões
A grosso modo, pode-se dizer que os três casos aqui estudados consistem na
ensinar a máquina a reproduzir uma tarefa que é, mesmo com limitações, facilmente
realizada por um ser humano treinado. Já, no terceiro caso, o compósito resina-grafite, a
idéia é usar a máquina para ver algo quase impossível para nós. Assim, nos dois primeiros,
caso traz à tona a questão do reconhecimento de objetos em uma imagem, de como separá-
los uns dos outros e do resto da imagem, reconhecendo-os como entidades individuais. O
terceiro caso engloba, de uma maneira peculiar, ambas as questões. Trata-se de reconhecer
Por fim, diferem do ponto de vista das técnicas de PADI empregadas. Ao longo
destes três casos, varreu-se todo capítulo de revisão, utilizando-se quase a totalidade das
Por tudo isso, juntos, estes três casos oferecem um panorama abrangente de PADI,
138
Referências Bibliográficas
Carl Zeiss Vision KS400. 1998.
1969.
p. 267-275, 1994.
Safety,2001.
139
HARALICK, R. M., SHANMUGAM, K. & DINSTEIN, I. Textural Features for Image
n. 6, p. 610-621, 1973.
KUDO, M. & SKLANSKY, J. Comparison of algorithms that select features for pattern
1987.
rio.br/cursos/ipdi/), 2001.
RAUDYS, S. J. & JAIN A. K. Small Sample Size Effects in Statistical Pattern Recognition:
RUSS, J. C. & RUSS, J. C. Uses of the Euclidean Distance Map for the Measurement of
375, 1989.
RUSS, J. C. The Image Processing Handbook. 2nd. ed. CRC Press, 1995.
140
SHEHATA, M. T. Characterization of Particle Dispersion. In: ASM. Practical Guide to
VAN VLACK, L. H. Princípios de ciência dos materiais. Ed. Edgard Blucher, 1970.
141