Estudo de Sistemas de Visão Artificial

Estudo de Sistemas de Visão Artificial

(Parte 4 de 5)

v.B(esp)-1 3 1

5° Ao final do processo repetitivo do 3° e 4° acima descritos obtØm-se o vetor resultante da convoluçªo de A por B,Cv(AB)= {1,5,8,9,4,1,-1}, mostrado abaixo: v.A 0 1 2 3 2 1 0 Cv(AB) 1 5 8 9 4 1 -1

Como dito anteriormente, este processo pode ser expandido do caso unidirecional para o caso bidirecional, utilizando-se de uma matriz imagem e uma mÆscara de convoluçªo matricial quadrÆtica para realizaçªo dos cÆlculos, como mostra o exemplo abaixo: Seja a matriz A, uma suposta matriz imagem em tons de cinza dada por:

Amn = 4 2 7 2 1 9 0 6 9 7 9 8 0 4 2 4

Seja a matriz B utilizada como mÆscara dada a seguir:

Bij = 1 1 -1 0 -1 -2

Lembrando que a mÆscara deve ser espelhada para iniciar-se o processo de convoluçªo, a

Figura 9 mostra o cÆlculo a ser realizado para o primeiro elemento da convoluçªo Cv(AB) das matrizes.

Figura 9 Resultado da primeira operaçªo de convoluçªo de A por B. A matriz resultante no final do processo de convoluçªo de A por B Ø dada por:

20 10 2 26 23 6 9 4 18 1 -8 2 7 3 3 -1 14 2 5 -1 9 -2 8 -1

Cv(AB) = 29 21 9 -9 10 12 -9 -9 21 1 16 -1 -3 -4 2 5 15 -9 -3 7 -6 1 17 9 21 9 1 6 -2 -1 23 2 9 -5 -25 -10 -12 -15 -1 -12

Finalmente, com o uso de diferentes mÆscaras no processo de convoluçªo, podem-se obter alteraçıes interessantes da imagem original a fim de realçar detalhes da mesma como linhas, bordas ou outros pontos isolados como apresentado no próximo item.

Em uma anÆlise de imagens, o primeiro passo a se realizar Ø a separaçªo ou a segmentaçªo dos objetos dentro da imagem. Com o uso de algoritmos de segmentaçªo como, por exemplo, os de detecçªo de borda, pode-se achar as diferenças entre dois ou mais objetos. A segmentaçªo baseia-se em dois conceitos bÆsicos, a descontinuidade e a similaridade (SEARA, 1998).

Segundo a autora nªo existe um modelo formal para a segmentaçªo, o processo Ø empírico e deverÆ ser ajustado a diferentes tipos de imagem e suas modificaçıes. Assim, as tØcnicas de segmentaçªo tornam-se relativamente complexas porque tentam traduzir para o computador um processo extremamente sofisticado e cognitivo realizado pela visªo humana. O conceito de descontinuidade pode apresentar-se basicamente de trŒs formas, a descontinuidade de um ponto isolado, de uma linha, ou da borda de um objeto.

Na detecçªo de pontos isolados, uma das mais simples tØcnica de detecçªo, busca-se uma mudança drÆstica do valor de cinza de um pixel em relaçªo aos seus vizinhos. Na detecçªo de linhas, um processo pouco mais complicado que o anterior, Ø necessÆrio achar os pixels que sªo semelhantes, testando-os para verificar se estes fazem parte de uma mesma linha.

A detecçªo de bordas Ø uma das tØcnicas utilizadas pela visªo humana no reconhecimento de objetos, que consiste no processo de localizaçªo e realce dos pixels da borda de determinado objeto, aumentado o contraste entre a borda deste e o fundo, atravØs da verificaçªo da variaçªo dos valores de luminosidade da imagem (PRATT, 1991, apud MARQUES FILHO & VIEIRA NETO, 1999).

Os próximos parÆgrafos detalham algumas tØcnicas de interesse a este trabalho utilizadas no processo de detecçªo de borda, tais como, reconhecimento por gradiente, operador laplaciano e a interessante aplicaçªo de mÆscaras de convoluçªo.

O reconhecimento de um a borda pelo gradiente ∇f de uma imagem f (x,y) na localizaçªo (x, y) Ø determinado pelo vetor gradiente ( 3 ):

onde Gx e Gy sªo as mÆscaras que podem variar de acordo com o tipo de detecçªo (OLIVEIRA, 2003).

Na detecçªo da borda pelo gradiente, a magnitude e a direçªo do vetor ∇f sªo de grande importância, fornecendo informaçıes da taxa de aumento da f (x,y) na direçªo de ∇f ( 4 ) e a direçªo do mesmo ( 5 ). As respectivas equaçıes de magnitude e direçªo estªo representadas a seguir:

( 3 )

Segundo Neves e Pelaes (2001) uma das prÆticas utilizadas Ø a aproximaçªo do gradiente por um valor absoluto determinado por:

o que facilita sua implementaçªo. O operador laplaciano utilizado na detecçªo de borda para uma imagem 2-D dada por f (x,y) Ø a derivada de segunda ordem definida como:

Embora o laplaciano seja capaz de realçar ou detectar bordas em qualquer direçªo, seu uso

Ø restrito devido a sua grande suscetibilidade a ruídos, que sªo pequenos distœrbios randômicos de níveis de cinza, estatisticamente independente dos dados da imagem e normalmente ocasionados quando esta Ø transmitida eletronicamente de um lugar para outro (SEARA, 1998).

Tanto o gradiente quanto o mØtodo do laplaciano costumam ser aproximados com a aplicaçªo de mÆscaras de convoluçªo geralmente de 3“ ordem (3 x 3), detalhadas na sessªo anterior. As mÆscaras de Roberts, Sobel, Prewitt e Frei-chen, bem como as específicas mÆscaras de laplaciano, sªo as mais utilizadas para as aplicaçıes descritas anteriormente, e estªo apresentadas na Tabela 3.

( 5 ) ( 6 )

( 7 )

( 4 )

Tabela 3 - Tipos de mÆscaras utilizadas na aproximaçªo do gradiente e laplaciano

Para se ter uma idØia dos resultados obtidos com aplicaçªo de algumas destas mÆscaras, as

Figuras 9-b e 9-c, apresentam respectivamente o uso das mÆscaras de Prewitt (vertical OR horizontal) e Sobel (vertical OR horizontal), aplicadas a uma imagem original (Figura 9-a).

Figura 9-a (Imagem Original);Figura 9-b (Prewitt); Figura 9-c (Sobel);

24 Figura 9 Detecçªo de bordas por mÆscaras de convoluçªo.

4.3.5. Ampliação e redução geométrica de imagens

O processo de ampliaçªo e reduçªo de imagens consiste basicamente no aumento ou diminuiçªo das dimensıes lineares desta apenas para fins de visualizaçªo. Um mØtodo simples de se ampliar uma imagem Ø a duplicaçªo dos valores de cada pixel p de (x,y) nas direçıes de x ou de y, ou ainda em ambas. Diferentes fatores de ampliaçªo ou reduçªo utilizados numa mesma imagem nas direçıes de x e y que respectivamente podem ocasionar alteraçıes no aspecto da proporcionalidade desta (MARQUES FILHO & VIEIRA NETO, 1999).

A ampliaçªo de uma imagem utilizando um fator 2 em ambas as direçıes, consiste na copia de cada pixel da imagem original, quatro vezes na imagem a ser gerada (Figura 1).

Figura 10 Ampliaçªo de 2 X aplicada a um pixel p(x,y);

Para aplicar-se a reduçªo basta utilizar o processo inverso, ou seja, agrupar quatro pixels da imagem original, de preferŒncia com mesma conectividade, a um œnico pixel da imagem a ser gerada. A proporcionalidade para a cópia de pixels em uma ampliaçªo ou zoom pode ser descrita atravØs da fórmula de (F)†, onde a F Ø o fator de zoom a se obter. Exemplificando: se se deseja obter um zoom de uma imagem da ordem de 4 x, entªo a cópia de pixels vizinhos a ser gerada Ø em nœmero da ordem de (4)† = 16 pixels. A ampliaçªo e reduçªo da imagem por fatores nªo inteiros, ou seja, fracionÆrios Ø perfeitamente possível, porØm muito mais complexa e requer o uso de algoritmos e tØcnicas de interpolaçªo nªo condizentes com as justificativas deste trabalho.

4.3.6. Histograma e Técnicas de filtragem de imagem

O histograma de uma imagem em tons de cinza consiste basicamente na obtençªo do percentual de pixels de uma imagem que se apresenta em um determinado valor de nível de cinza. Segundo GonzÆles e Woods (1992) para cada elemento encontrado no conjunto dos valores específicos de níveis de cinza vale a seguinte regra: P r ( rk ) = nk / n

k Ø0,1...... L-1, sendo L a quantidade de níveis de cinza da imagem;

onde : 0 ≤ rk ≤ 1; n Ø o total de pixels da imagem digitalizada; P r ( rk ) Ø a probabilidade do K-Øsimo nível de cinza; nk Ø o numero de cinza cujo nível de cinza corresponde a k.

assim, pela concentraçªo de pixels em determinada faixa do grÆfico discreto obtido dos valores de probabilidade para os níveis de cinza da imagem (Figura 11a 11d ), Ø possível determinar se uma imagem apresenta-se de forma predominantemente clara, escura, muito ou pouco contrastante. Por exemplo, se a maior concentraçªo estÆ nos valores mais baixos de cinza, a imagem Ø predominantemente escura e se a concentraçªo estÆ nos valores mais altos, a imagem Ø predominantemente clara.

( 6 )

P r o b a bi l i da d e

12 3 4 56 7 8 Faixas de Níveis de Cinza

Histograma de Imagem

Figura 11a Histograma de imagem predominantemente escura;

P r o b a b il id a d e

12 3 4 56 7 8 Faixas de Níveis de Cinza

Histograma de Imagem

Figura 11b Histograma de imagem predominantemente clara;

P r o b a bi l i da d e

12 3 4 56 7 8 Faixas de Níveis de Cinza

(Parte 4 de 5)

Comentários