Estudo de Sistemas de Visão Artificial

Estudo de Sistemas de Visão Artificial

(Parte 3 de 5)

Sensível ao nível e padrªo de iluminaçªo, bem como à distancia em relaçªo ao objeto e suas características físicas. Pode trabalhar com centenas de tons de cinza ao mesmo tempo conforme o tipo de projeto.

Tempo de Resposta Elevado, da ordem de 0,1s. Depende de aspectos de hardware e software, podendo ser tªo baixo quanto 0,001 s

Percepçªo Percebe variaçıes de brilho em escala logarítmica. A interpretaçªo subjetiva de brilho depende da Ærea ao redor do objeto.

se no sistema de cor utilizado

Pode perceber brilho em escala linear e logarítmica, baseando-

2-D e 3-D Pode executar tarefas 3-D com mœltiplos comprimentos de onda (dentro do espectro de luz visível ) com facilidade.

Executa tarefas 2-D com relativa facilidade, mas pode ser lento e limitado no espaço 3-D.

4.3. O Sistema de Visão Artificial e suas estruturas

Baseada na proposta de Marques Filho e Vieira Neto (1999) a Figura 5 apresenta o esquema bÆsico para funcionamento de um Sistema de Visªo Artificial (SVA) na soluçªo de problemas específicos.

Figura 5 Esquema bÆsico para um Sistema de Visªo Artificial.

Aquisição e Digitalização de Imagem

Filtragem e Pré - processamento

Segmentação de Imagem por Cor ou Forma

Extração e Armazenamento das Características de

Comparação.

Reconhecimento e Interpretação de Valores

A melhoria do sistema baseia-se no conhecimento adquirido e aplicação dos métodos conhecidos.

4.3.1. Aquisição e digitalização de imagens

Dois elementos bÆsicos sªo necessÆrios para aquisiçªo de uma imagem e sua digitalizaçªo

(GONZLES & WOODS, 1992). O primeiro diz respeito ao dispositivo físico sensível a uma faixa do espectro eletromagnØtico luminoso como, por exemplo, raio X, ultravioleta, infravermelho ou a luz visível, capaz de converter os valores captados em sinais elØtricos proporcionais. O segundo se trata dos conhecidos digitalizadores ou ADC (Analogical Digital Conversor – Conversor Analógico Digital), que sªo dispositivos capazes de converter sinais analógicos de entrada como os gerados pelos sensores luminosos acima descritos, em sinais digitais reconhecidos pelo sistema computacional.

No processo de aquisiçªo de imagem, os sensores do tipo CCD sªo os mais utilizados atualmente. Um CCD Ø composto de uma matriz de cØlulas semicondutoras foto sensíveis que geram um sinal analógico que posteriormente Ø tratado por dispositivos eletrônicos, convertendo este em um sinal conhecido de vídeo.

De acordo com esses autores, uma câmera monocromÆtica consiste basicamente em um conjunto de lentes para a focalizaçªo da imagem em um CCD. JÆ uma câmera colorida requer o uso de prismas e filtros de cor capazes de decompor a imagem nos componentes R, G e B que serªo focalizados cada um em CCD s distintos. Os sinais elØtricos entªo sªo posteriormente combinados conforme cada padrªo de cor utilizado, como por exemplo, o NTSC (National Television Standards Commitee - ComitŒ Nacional de Padrıes de Televisªo) e o Pal (Phase Alternating Line – Linha de Fases Alternadas) ou as variaçıes baseadas nestes.

Para digitalizaçªo de imagens monocromÆticas Ø necessÆrio primeiramente levar em consideraçªo que existe a perda de uma dimensªo da imagem 3D do objeto para sua representaçªo eletrônica analógica 2D e, alØm disso, deve-se compreender a representaçªo matemÆtica da imagem para esses valores analógicos como sendo uma funçªo f (x,y) da intensidade luminosa, onde a f (x,y) representa o produto da iluminância i (x,y) (luz incidente sobre o objeto) e a refletância (r) do ponto específico (x, y) do objeto representado.

Matematicamente: f (x,y) = i ( x,y ) * r ( x,y )

onde : 0 < i (x,y) < ∞e

0 < r (x,y) < 1

( 1 )

Assim, para GonzÆles e Woods (1992) os níveis de cinza (Nc ) podem ser representados analógica e proporcionalmente à intensidade de luz de uma imagem monocromÆtica em cada ponto (x,y) pela f (x,y), determinando um intervalo de variaçıes para Nc :Nc min< Nc (x,y) < Nc Max. Agora, para digitalizaçªo dos sinais analógicos obtidos, deve-se realizar a conversªo em valores discretos do intervalo de Nc para identificaçªo espacial e de amplitude. Basicamente, esses valores passam a ser representados na forma matricial K (m x n) onde os valores de identificaçªo espacial determinam a quantidade de pixels (elementos k mn) da matriz e a identificaçªo de amplitude determina o valor discreto da faixa de 0 a 2n -1 que cada pixel ou

elemento k mn assumirÆ, conforme mostra a matriz na equaçªo 2
f (0,0) f (0,1)f (0, n-1)
K (m x n) = f (1,0) f (1,1)f (1, n-1)
f (m,0) f (m,1)f (m-1,n-1)

Onde os valores m e n estªo distribuídos na imagem como mostra a Figura 6 .

Figura 6 Eixos para identificaçªo matricial de valores discretos dos níveis de cinza.

( 2 )

Observando-se a formaçªo da matriz imagem em relaçªo à qualidade da mesma, fica fÆcil perceber que quanto maior a quantidade de elementos (pixels) e maior a faixa de níveis de cinza utilizado, maior serÆ a qualidade final da imagem digitalizada. PorØm, Ø preciso levar em consideraçªo qual a finalidade de uso para tal digitalizaçªo e o espaço de memória ocupado por essa imagem. Para se ter uma idØia da qualidade de uma imagem digital em relaçªo à quantidade de pixels e níveis de cinza utilizados, em uma imagem de televisªo P & B tem-se uma matriz de 512 x 512 pixels, com 128 níveis de cinza. Em geral, para o olho humano, 64 níveis de cinza sªo considerados suficientes para uma boa interpretaçªo da imagem (MARQUES FILHO & VIEIRA NETO,1999).

Tendo-se o entendimento do processo de digitalizaçªo de uma imagem monocromÆtica descrito acima, pode-se expandir tal processo para os diferentes níveis discretos dos intervalos de R, G e B independentes entre si, de forma anÆloga à feita no processo de aquisiçªo da imagem monocromÆtica para a colorida pelos sensores CCD, descrita nesta sessªo.

4.3.2. Propriedades de uma imagem.

Para iniciaçªo no processo de processamento de imagem Ø requerido o conhecimento de algumas propriedades relacionais entre os pixels da imagem discreta digitalizada, descritas por Marques Filho e Vieira Neto (1999) tais como: vizinhança, conectividade, adjacŒncia, caminho e os tipos de mediçıes de distância.

A vizinhança de um pixel pode ser dividida em vizinhança vertical / horizontal e vizinhança diagonal. A vizinhança vertical / horizontal, trata dos quatro vizinhos do pixel (x,y) em questªo que sªo ( x+1, y ), ( x-1, y ), ( x , y+1 ) e ( x , y-1 ). A vizinhança diagonal trata dos pontos ( x-1, y -1 ), ( x-1, y + 1 ), ( x+1 , y-1 ) e ( x+1 , y+1 ) em relaçªo ao pixel (x, y).

De acordo com esses autores, a vizinhança total do pixel (x,y) passa entªo a ser a uniªo entre a vizinhança vertical / horizontal e a vizinhança diagonal ( Vt = Vv/h U Vd ). A Figura 7 ilustra os tipos de vizinhança para um pixel p de (x,y).

Figura 7 – Vizinhanças de um pixel de uma imagem digitalizada

A conectividade permite estabelecer os limites de objetos e componentes de uma regiªo em uma imagem. Para determinar a conectividade entre os pixels, Ø necessÆrio estabelecer um critØrio de comparaçªo e similaridade entre os níveis de cinza dos pixels vizinhos. A conectividade pode se dar entre dois ou mais pixels pela comparaçªo desses níveis adotados como critØrio entre as vizinhanças vertical /horizontal, diagonal ou a uniªo delas.

A adjacŒncia de um pixel p a outro q existe se estes forem conectados, portanto pode-se assim determinar se um subconjunto N de pixels da imagem Ø adjacente a outro subconjunto M de pixels dessa mesma imagem.

O caminho de pixel p de coordenadas (x,y) atØ atingir um pixel q de coordenadas (k,l) Ø constituído por uma seqüŒncia de pixels i (xi,yi) distintos e adjacentes entre si, onde: (xi, yi) Ø adjacente a (xi-1,yi-1) | 1 ≤ i ≤ n , n determina o comprimento do caminho. Os tipos de mediçıes mais comumente utilizados sªo: a distância euclidiana entre os

pontos p (x,y) e q (k,l) dada por: D(p,q) =( x – k ) † + ( y – l ) † ; a distância tipo D4

dada por: D4 (p,q) = | x k | + | y l | e a D8 dada por: D8 = max (| x k |,| y l |). Pode-se tambØm utilizar algumas operaçıes aritmØticas como adiçªo, multiplicaçªo, subtraçªo e divisªo pixel a pixel obtendo os resultados demonstrados na Tabela 2, ou ainda operaçıes lógicas (Not, And , Or , Xand , Xor), representadas na Figura 8, tanto em imagens binÆrias como em imagens de diferentes tons de cinza desde que se observe a normalizaçªo dos diferentes intervalos utilizados.

Tabela 2- Resultados das aplicaçıes aritmØticas de imagens em tons de cinza.

Operação Resultados Obtidos.

Adiçªo Normalizaçªo de brilho da imagem a uma faixa prØ- definida. Auxilio na remoçªo de ruídos.

Subtraçªo Permite a detecçªo de diferenças entre duas imagens adquiridas de forma consecutivas em uma cena.

Multiplicaçªo Possibilita a calibraçªo do brilho da imagem.

Divisªo Normalizaçªo do brilho for um fator K escolhido.

Figura 8 Aplicaçªo lógica aplicada a imagens binÆrias.

Uma das operaçıes muito œteis no processamento de imagem Ø a chamada convoluçªo com mÆscara. O termo convoluçªo Ø determinado por um processo finito de operaçıes matemÆticas feitas pixel a pixel na matriz imagem, obtendo-se um valor resultante para cada um dependendo diretamente do tipo de mÆscara (matriz quadrada com valores prØ-determinados) aplicada. Para compreender melhor as operaçıes realizadas com a convoluçªo, observe inicialmente o exemplo proposto por Marques Filho e Vieira Neto (1999), em um vetor unidirecional e em seguida sua aplicaçªo feita em uma matriz imagem elaborada para este exemplo:

v.B(esp) -1 3 1
Cv(AB)

Dado um vetor A = { 0,1,2,3,2,1,0 } como sendo um vetor imagem , e uma mÆscara a aplicar por convoluçªo, B = {1,3,-1}, obtØm-se o resultado Cv(AB) realizando as seguintes operaçıes: 1° - O vetor B deve ser espelhado, ficando B(esp) = {-1,3,1}; 2° - Alinha-se o centro do vetor B ao elemento inicial de A como abaixo; v.A 0 1 2 3 2 1 0

centralizada. Matematicamente: (0*-1) + (3*0) + (1*1) = 1
v.B(esp) -1 3 1
Cv(AB) 1

3°- Multiplica-se cada elemento de B ao elemento logo abaixo de A, considerando a falta de elementos como valor 0 (zero), somando-se os resultados obtidos de todos os produtos e posicionando este logo abaixo do elemento correspondente de A ao qual a convoluçªo foi v.A 0 1 2 3 2 1 0

v.B(esp) -1 3 1

4° Repete-se o procedimento anterior, deslocando a mÆscara do vetor B(esp), centralizando este em cada elemento do vetor A atØ o seu final. Agora (-1* 0 ) + (3*1)+(1*2)=5; v.A 0 1 2 3 2 1 0 Cv(AB) 1 5

(Parte 3 de 5)

Comentários