Processamento de Imagens de Sensoriamento Remoto

Sensoriamento Remoto
e
Classificação de Imagens

Ronei Marcos de Moraes

Departamento de Estatística
CCEN - UFPB
Campus I - João Pessoa

1999

Conteúdo

    Sensoriamento Remoto
    A Imagem e o Espectro Eletromagnético
    Problemas na Deteção
    O Básico do Processamento Digital de Imagens (P.D.I.) em Sensoriamento Remoto
    Recursos do P.D.I.
    Restauração e Eliminação do Ruído
    Realce de Contraste
    Incorporação de Informações
    Tratamento de Imagens
    Classificação
    Método Não-supervisionado
    Método Supervisionado Clássico
    Método Supervisionado Contextual
    Métodos de Relaxação
    Pós-classificação
    Interpretação Visual da Imagem
    Testes e Controle

Sensoriamento Remoto

Pode-se entender por Sensoriamento Remoto, como formas de obtenção de dados sobre um objeto, terreno, espécime, etc, sem contato físico com o mesmo. Como exemplo bem simples de Sensoriamento Remoto, tem-se a fotografia.

Na tabela 1, pode-se observar algumas das várias áreas de aplicação do Sensoriamento Remoto.

Tabela 1. Alguma áreas de aplicação do Sensoriamento Remoto.

Nosso estudo encara o Sensoriamento Remoto efetuado por satélites. Existem vários tipos de satélites orbitando a Terra e alguns planetas do Sistema Solar. Cada tipo de satélite pode ter características distintas, dependendo ao que se destina. Alguns satélites meteorológicos, por exemplo, orbitam a Terra em órbitas chamadas geo-estacionárias, ou seja, todo o tempo, estão "vendo" a mesma Terra da mesma posição e parecem estar sempre "parados" sobre o mesmo ponto. Exemplos deste tipo de satélite podem ser observados na figura abaixo [1]:

Alguns satélites utilizam sistemas de radar para coletar seus dados. São denominados SAR (Radar de Abertura Sintética). Exemplos de satélites desse tipo são o Seasat (EUA), ERS-1 (Europa), JERS (Japão) e Radarsat (Canadá).

Os satélites de coleta de dados, em geral, não são geo-estacionários e cobrem todo o globo. Geralmente, demoram alguns dias para passar sobre o mesmo ponto da Terra e se utilizam de vários sensores embarcados. Por exemplo, o satélite SPOT (França) tem um ciclo de 26 dias e 3 sensores espectrais; o LANDSAT V (EUA) tem um ciclo de 16 dias e 6 sensores espectrais e um sensor termal. Esses satélites são denominados Multi-espectrais.

Figura. Satélite Landsat V.

A Imagem e o Espectro Eletromagnético

As imagens são registros de cenas focalizadas por sensores com resposta em freqüência perfeitamente definidas do espectro. No entanto, os sensores não conseguem captar todo o espectro e registram faixas de freqüência. Analogamente, o olho humano capta uma faixa muito estreita do espectro. Várias técnicas codificam as freqüências do espectro não-visível de modo a tornar possível a visualização de uma imagem.

Dois tipos de sensores podem ser utilizados na obtenção de uma imagem; são eles: ativos - transmitem pulsos de energia e medem a energia refletida desses pulsos pelos objetos (satélites com sensores SAR, por exemplo); passivos - medem radiações refletidas ou emitidas pelos objetos (satélites com sensores multi-espectrais). Este trabalho trata de imagens geradas por satélites de sensoriamento remoto do tipo comercial, ou seja, munidos de sensores do tipo passivo.

A caráter de ilustração da obtenção de uma imagem por sensores passivos, será mostrado a forma de coleta dos dados dos satélites LANDSAT MSS 1 e 2 [2]. O satélite desloca-se no sentido Norte-Sul, enquanto um espelho a bordo imageia a superfície terrestre de Oeste para Leste em 33 milissegundos. São tomadas 3300 amostras em intervalos regulares de 9,95 microssegundos, ao longo de uma varredura de 185,2 km (figura abaixo). Nesta varredura, são imageadas seis linhas de dados por banda espectral, a cada vez.

Figura. Obtenção da imagem pelo LANDSAT MMS.

O Campo de Visão Instantânea - VIC - cobre uma área de 79m x 79m [3]. Entre cada amostragem, os sensores movem-se 56m, o que resulta um elemento de imagem ou ''pixel'' correspondendo a uma área de 56m x 79m. A esta redução de área dá-se o nome de Recobrimento - figura abaixo. Apesar dos dados serem tomados de uma área maior, para evitar distorções, os dados são arranjados como se tivessem sido tomados de uma área menor

Figura. Obtenção de um ``pixel'' [3].

Problemas na Deteção

Existem vários problemas na detecção de um objeto pelos sensores. Por exemplo, se o objeto focado tiver um tamanho menor que o VIC, ele não será detectado, a menos que o seu valor de brilho - VB, ou índice de luminosidade - se sobreponha ao da sua circunvizinhaça. Se o objeto tiver um tamanho exatamente igual ao do VIC, também não será detectado, a menos que o VIC se sobreponha exatamente sobre ele e o seu VB seja maior que o da circunvizinhança.

Outra questão a ser considerada é o que se chama "confusão espectral". Um objeto qualquer tem uma curva espectral definida, porém esta curva se altera quando o objeto é imageado na presença de outro - figura abaixo.

Figura. "Confusão" espectral dentro da VIC do MSS Landsat,
sem se considerar os efeitos atmosféricos [3].

Os sensores do tipo passivo sentem muito o efeito atmosférico de duas formas: dispersão e absorção. Enquanto a dispersão acrescenta luminosidade, a absorção retira. A atmosfera dispersa o comprimento de onda verde [0,5mm;0,6mm] quatro vezes mais que o comprimento de onda infravermelho [0,7mm;1,1mm]. A absorção afeta principalmente a faixa infravermelha do espectro. É possível fazer correções para a dispersão, mas é muito difícil fazê-lo para a absorção. Um outro problema grave é a qualidade da luz refletida que depende da radiação incidente. A assinatura espectral muda muito se o dia tem nuvens ou não.

(a) Imagem tomada a 45 graus a cerca de 150 m sobre Recife - PE, próximo ao aeroporto.

(b) Imagem tomada a 45 graus, em alguma parte de Pernambuco a cerca de 3000m.

(d) Imagem tomada a 45 graus, nas proximidades de Santa Rita - PB a cerca de 500m.

Figura. Efeitos atmosféricos da dispersão em imagens aéreas,
adquiridas em 23/10/99 entre 13:30h e 14:00h.

Outra questão é que dois objetos distintos podem ter diferenças espectrais desprezíveis na zona multiespectral, ou seja, em várias bandas espectrais. A poluição pode distorcer a radiação dentro das chamadas ''janelas atmosféricas'' - intervalo do espectro que não é absorvido. Assim, é importante ressaltar que a escolha correta dos canais a serem observados pode contornar a maioria destes problemas. Em geral, se utiliza combinações dessas bandas espectrais em estudos de Sensoriamento Remoto. As combinações ideais dependem do tipo de aplicação.

Figura. Efeitos atmosféricos da absorção e dispersão
na aquisição da imagem [3].

O Básico do Processamento Digital de Imagens (P.D.I.) em Sensoriamento Remoto

Didaticamente, pode-se pensar na imagem como uma matriz de pequenos quadrados, onde cada elemento - pixel - contém um valor de sombreamento proporcional a refletibilidade da imagem na respectiva posição.

Figura. Codificação (C) da matriz (A) resulta em uma imagem (B) [13].

Sinteticamente, na geração da imagem, para cada valor atribui-se uma cor (quando o equipamento é colorido), ou níveis de cinza (quando o equipamento é preto e branco). Pode-se pensar no campo de P.D.I., segundo o fluxograma abaixo:

Figura. Fluxograma do P.D.I. em Sensoriamento Remoto [8].

De acordo com este fluxograma, será feita a seguir uma análise suscinta de cada um dos seus pontos, dando ao leitor além de uma visão global do processo, alguns detalhes do mesmo.

Recursos do P.D.I.

Existem recursos para modificar ou restaurar uma imagem dentro da idéia de correção de deficiências. Esses recursos são de grande valia ao usuário. A seguir será dado uma breve introdução a estes recursos; o que objetiva cada um deles e a necessidade da sua utilização.

Restauração e Eliminação do Ruído

A restauração da imagem ou eliminação do ''ruído'', pode ser necessária para as imagens obtidas próximas ao limite de resolução dos seus sensores, como em Astronomia, Microscopia Eletrônica, Sensoriamento Remoto Militar, etc. Nestes casos, onde a resolução é bem alta, ou sob condições adversas, como movimento rápido relativo objeto-sensor; ou turbulência, pode-se notar na imagem distorções, borramentos e outros tipos de imperfeiçõees. A restauração, como o próprio nome já diz, consiste no uso de um conjunto de complexas técnicas obtidas a partir de modelos estatísticos, matemáticos ou físicos, que constituem funções de transferência para os pontos-problema, ou até toda a imagem, num caso mais complexo.

Comumente, em casos onde a imagem captada está contaminada por ruído aleatório, são utilizados processos de filtragem na imagem. Isso faz com que o ''ruído'' presente na imagem seja removido. A implementação destes filtros pode ser feita por ''software'' [4] - que também tece várias comparações entre diversos filtros - ou por ''hardware'' [5] - que mostra em detalhes a implementação de um filtro por gradiente de Roberts.

Realce de Contraste

Basicamente, a necessidade de se realçar contrastes em uma imagem deve-se ao fato da visão humana poder distinguir um número finito de níveis de sombreamento, que é muito inferior ao que uma tela de computador pode oferecer. Assim, esta limitação pode causar muita confusão à vista humana quando os níveis de sombreamento são muito próximos. As metodologias aplicadas permitem modificar as tonalidades de sombreamento - no caso de imagens em preto e branco - para que sejam melhor identificadas. Pode-se destacar os filtros lineares, não lineares e técnicas de equalização de histograma [6]. Um recurso que por vezes é utilizado, dependendo do equipamento disponível, é o da falsa cor. Este recurso bem simples, permite colorir a imagem com tonalidades diferentes, independentes das suas cores reais - daí o seu nome - de acordo com o nível de sombreamento determinado. Isso aumenta em muito a capacidade de discernimento da vista humana, já que para níveis de cinza é da ordem de centenas e para cores, a capacidade de distinção chega a alguns milhares.

Figura. Imagem tomada a 45 graus, nas proximidades de Santa Rita - PB a

cerca de 500m: original (acima) e realçada por equalização (abaixo).

Incorporação de Informações

O uso de informações adicionais sobre a topografia do terreno, apontou a necessidade da criação dos chamados Modelos Digitais de Terreno - M.D.T. - que consiste em alocar em determinados pixels, informações sobre a topografia do terreno naquele ponto. Essa ferramenta, em conjunto com outras informações sobre a localidade em questão (informações espaciais ou não), dão origem aos Sistemas de Informação Geográfica [7] e o conjunto de técnicas utilizadas em seu tratamento é denominado Geoprocessamento [8]. Em geral, utiliza-se "softwares" específicos que combinam um banco de dados com o tratamento e processamento de imagens e mapas. Um bom exemplo é o sistema Spring [18] do INPE. que pode ser obtido gratuitamente pela Intenet.

Figura. Mapa Cadastral da Paraíba em sistema Spring [18].

Figura. Composição RGB falsa-cor da região de Brasília - DF, utilizando o Spring .

Figura. Modelo Numérico de Terreno utilizando o Spring da região de Brasília - DF.

Suas principais aplicações são: construções de imagens em perspectiva ou 3D, estudos de luminosidade, avaliações de projetos ambientais e urbanos e até mesmo estudo e previsão de catástrofes.

Tratamento de Imagens

Geralmente, não se possui o equipamento adequado para trabalhar com a imagem da forma que se deseja, visto que são necessários grandes esforços computacionais para um estudo deste tipo. Quando esta situação ocorre, se faz necessário uma ''compressão'' dos dados. Sendo X 1 x n , o vetor de atributos (espaço de todas as medidas possíveis feitas pelos sensores do satélite), comprimir esses dados, significa reduzir a dimensão n deste vetor a níveis aceitáveis pelo usuário e pelo equipamento. Deve-se realçar, no entanto, a necessidade de procurar sempre a maior sofisticação de técnicas e equipamento o quanto possível. Com a facilidade de acesso a diferentes tipos de tecnologias de ''software'' e ''hardware'' e com a diminuição dos seus custos, estes tipos de técnicas para selecionar atributos poderão vir a se tornarem desnecessárias no decorrer dos próximos anos. Porém, como ainda são necessárias em muitos casos, far-se-á aqui uma breve descrição destes tipos de técnicas.

Os dois conjuntos de técnicas mais empregadas utilizam métodos estatísticos. O primeiro conjunto é constituído de transformações nos espacos dos atributos e o segundo utilizam medidas de distância.

No primeiro caso, o objetivo é reduzir a dimensão preservando ao máximo a representação de padrões e/ou a discriminação entre as classes caracterizadas pelos atributos. São utilizados os critérios do Erro Médio Quadrático (Componentes Principais) ou Entropia.

Resumidamente, a técnica de Componentes Principais [9] considera a distribuição multivariada global da mistura de classes. Obtém-se a matriz de covariâncias Sn x n do vetor de atributos. A matriz de transformação T p x n será tal que as linhas da matriz T são auto-vetores correspondentes aos maiores auto-valores de S. Assim, as componentes do vetor Y=TX , são não-correlacionadas e Y terá dimensão p<n. A escolha do valor numérico de p é dada ao usuário que geralmente dispõe de uma avaliação sobre a representação do vetor Y para vários valores de p. Uma boa discussão sobre transformações em imagens por Componentes Principais e sua aplicação também em rotação de imagens por intermédio dos seus auto-vetores, pode ser visto em Gonzalez and Wintz [19].

O critério da Entropia [7], procura reduzir a dimensão preservando o máximo de informação possível.

H(X) = -E[log (fk (X))]

Por exemplo, se X tiver distribuição Normal, ou Gaussiana, com matriz de covariância S, então:

onde det (S) é o determinante da matriz de covariâncias, p é o número pi, e e é o número de Neper.

Aplicando Componentes Principais :

onde p é a dimensão do vetor Y e li são os auto-valores da matriz T.

No segundo caso, ou seja, medidas de distância, visa-se a redução da dimensão procurando minimizar a probabilidade de erro. Na realidade, os critérios fornecem limites inferiores e superiores para esta probabilidade. São muito utilizados os critérios da Divergência e a Distância J-M.

A Divergência [9] toma as classes Wi e Wj, com suas respectivas probabilidades condicionais : f(X | Wi) e f(X | Wj). Seu princípio consiste em tomar a razão de verossimilhança Lij (X) como:

Lij (X) = f(X | Wi) / f(X | Wj)

L'ij (X) = loge [Lij (X)]

Figura. Definição da razão de verossimilhança no ponto.

A Divergência é definida por :

Dij = E [L'ij (X) | Wi) + E [L'ij (X) | Wj)

onde :

Um procedimento usual para computar a Divergência entre M classes, M>2, é computar a divergência média entre todos os pares de classes e, selecionar o subconjunto de N atributos, para o qual a divergência média definida por :

é máxima.

No entanto há problemas, pois essa forma não é ótima. Um único termo da somatória pode elevar muito o resultado final. Uma recomendação seria analisar cada divergência entre as classes i e j, num processo de seleção.

Para evitar os problemas da Divergência, pode-se utilizar a Distância Jeffries-Matusita [2]. Ela é uma medida da diferença média entre funções densidades de duas classes, e é definida formalmente por:

Estas e outros tipos de técnicas estatísticas estão presentes na codificação de imagens com o objetivo de armazenamento otimizado ou transmissão através de canais de comunicação [10].

Classificação

Não se entrará aqui nos méritos das formas atualmente utilizadas para classificação de imagens orbitais, mas dos fundamentos destes processos. Lembrando o fluxograma da figura 1.6, vê-se as diversas formas de classificação. Todos estes processos tem por base a Teoria Estatística de Decisão, idealizada por Fisher [9] e [12] - ver figura abaixo - na década de 30.

Figura. Princípio discriminante de Fisher [13].

O modelo sugerido de discriminação entre duas classes, poderia também alocar novos objetos aos grupos. Observa-se, no entanto, que mesmo para um caso muito simples, alguns pontos serão classificados de maneira errônea. Na realidade, para toda e qualquer classificação, sempre haverá o risco de se classificar um objeto em uma classe a qual, na verdade, ele não pertence.

Os métodos de classificação dividem-se em dois grupos principais: os não-supervisionados e os supervisionados. Este último, por sua vez, também se subdivide em dois: Métodos Clássicos e Métodos Contextuais. Os não-supervisionados dividem as classes automaticamente e em sua maioria baseiam-se no Princípio de Fisher. Alguns métodos podem ser baseados também em funções discriminantes matemáticas, como por exemplo a Teoria dos Grafos e relações nebulosas [14]; abordagens estatísticas assintóticas [15], ou ainda modelos de pertinência nebulosa [16]. Os supervisionados são mais precisos por levarem em consideração informações fornecidas pelo usuário, a verdade terrestre ou mapa de referência. Baseiam-se, além de funções discriminantes, na teoria de Bayes e requerem alguns conhecimentos prévios das classes [2, 11, 13, 17].

Método Não-supervisionado

São métodos nos quais o próprio algoritmo procura "descobrir" classes na imagem por agrupamento ou aglomeração, ou seja, procurando agrupar "pixels" semelhantes entre si, ou separando grupos de "pixels" diferentes. O usuário só informa ao algoritmo o número de classes desejado ou um critério para que o agrupamento seja considerado "estável". O resultado desse tipo de método é uma imagem com classes sem rótulos, ou seja, não se conhece a previamente a identificação das classes resultantes. O próprio usuário deve ao final do processo rotular essas classes da melhor maneira possível.

Um método não-supervisionado bastante didático é o método do Agrupamento Hierárquico [1]. Ele não necessita de um número pré-definido de classes. O algoritmo inicia assumindo que cada "pixel" é um agrupamento. Numa segunda fase, distâncias são calculadas entre os "pixels", procurando os vizinhos mais próximos unindo-os em um novo agrupamento. O método termina quando todos os "pixels" estão agrupados em um único grande agrupamento. Os resultados são mostrados em geral em um dendograma - ver figura - e o usuário pode ao final decidir com quantas classes a imagem deve ficar.

Esse método, por poder proporcionar resultados intermediários, é interessante do ponto de vista da análise dos agrupamentos. Porém, trabalha com matrizes de distâncias que são constantemente recalculadas e o método exige muita memória do computador e em geral, são lentos. Outra desvantagem é a possibilidade de decisão errônea em situações onde vários agrupamentos são igualmente possíveis - ver figura.

Problemas deste tipo podem ser contornados com informações extras advinda do usuário. Os métodos supervisionados iteragem com o usuário visando diminuir o número de operações envolvido e também fornecer um número mais confiável de classes previamente rotuladas.

Método Supervisionado Clássico

Nos métodos clássicos, cada ''pixel'' é classificado tomando-se em consideração as informações contidas no ''pixel''. Já nos contextuais, leva-se em conta também as informações dos ''pixels'' da vizinhança, para a classificação.

Apenas a título de ilustração, será mostrado aqui um método de cada. Será dado maior atenção aos métodos supervisionados, por serem próximos à área de interesse deste trabalho. Como exemplo do método supervisionado clássico, será mostrado o Método do Custo Mínimo de Classificação Errônea (ECM) [11]. Apesar de não ser um recurso ótimo em termos computacionais, é bastante didático. Sendo o vetor de atributos X composto por variáveis aleatórias xi, com densidades fi(X), i=1,2,...,N que serão atribuidas às populações pi (partição do espaço dos atributos), com probabilidades a priori P(pj), j=1,2,...,M; M<N e associadas às densidades f(X|pj). O custo de se classificar um objeto é dado por C(pk|pj), com probabilidade P(pk|pj).

Assim, o risco médio de se decidir pela população pi, é dada por :

Portanto, o procedimento ótimo de decisão a ser tomado, é o que minimize o risco médio, ou seja :

Se acaso os custos dos erros de classificação errônea sejam todos iguais, a minimização da equação acima equivale a maximizar a probabilidade a posteriori P(pk|X). Por Bayes:

Como o denominador é independente, têm-se a regra de decisão de alocar o ''pixel'' xj na população pk se :

Têm-se ainda que o cálculo da probabilidade de classificação correta é dada por:

onde Ri é a região atribuída à população pi.

Método Supervisionado Contextual

Os métodos contextuais, fundamentalmente, introduzem um fator de correção denominado fator de correção contextual [17]. Resumidamente, temos K classes possíveis para classificação, com probabilidades a priori p1, p2, ..., pk com densidade da classe k dada por fk (x).
Reserva-se também a possibilidade de se classificar um "pixel" de forma duvidosa (D). Assim, o espaço das decisões será:

W= { 1, 2,..., K, D }

Para facilitar a compreensão, assume-se que a perda incorrida por todos os erros de classificação seja um, e que a perda por se estar em dúvida seja . Nos sistemas, geralmente, essa função-perda é implementada com valores fixos, ou "default" para cada classe. Esses valores também podem ser alterados, privilegiando certa(s) classe(s) de acordo com a conveniência do usuário, fazendo diferenças mais realistas na classificação.

Num método como este, pode-se fazer com que a classificação de cada "pixel" dependa até de todos os outros "pixels" da imagem. Didaticamente, consideram-se apenas um "pixel" e sua vizinhança. Para o "píxel" i, temos a sua vizinhança denotada por Vi, e o seu vetor característico por Di. Se Vi consiste em n "pixels" em adição ao "pixel" central, o vetor característico será denotado por

Di= {xi,xi1, ..., xin}

onde as variáveis aleatórias x também podem vir a ser vetores aleatórios X, quando no caso de imagens multiespectrais.

A regra de classificação Bayesiana pode ser :

             D, se Pi (k|Di) < 1- e, para todo k=1,...,K
ci =
               m, se Pi (k|Di) = max    Pi (k|Di) >= 1 - e
                                        k <= K

onde Pi (k|Di) é a probabilidade de ci. seja igual a k dado Di, ou seja a probabilidade a posteriori da classe k, dado os vetores característicos em Vi. Assim, sem entrar em muitos detalhes, tem-se a expressão:

Pi (k|Di) = pk fk (xi) Rk (xi,xi1, ..., xin) / Pi (Di) (1.a)

onde :

Rk (xi1, ..., xin) = h(xi1, ..., xin | xi, k, k1, ..., kn) g( k1, ..., kn | k) (1.b)

e onde a função h descreve a densidade de probabilidade conjunta dos vetores característicos Di, dado que os "pixels" em Vi. pertencem à classe k ("píxel" central), k1, k2, ..., kn. O segundo fator, função g, é a probabilidade desta configuração em particular de classes, dado que o "píxel" central pertence à classe k. A somatória é o total das possíveis configurações.

A expressão (1 - a e b) pode parecer de difícil resolução à primeira vista, principalmente pelo grande número de termos envolvidos, mas não o é na prática. O denominador, como no método clássico é independente de K, o que facilita, bastando maximizar o numerador. Nos métodos clássicos maximiza-se pk fk (xi), podendo-se dizer que Rk é aquele fator de correção contextual mencionado anteriormente. O exemplo abaixo ilustra o mecanismo

# Exemplo 1.1.: Seja Vi = "pixel" i + 4 "píxels-vizinhança".

A função g é:

A função h é:

sendo que xi. Pertence a classe k, conforme anteriormente. #

Até aqui foram apresentados apenas a nível introdutório os sistemas de classificação. Mais detalhes sobre o método contextual pode ser visto em [13]. Para mais detalhes de diversos métodos de classificação estatística, pode-se citar Baridó [19] que em sua dissertação de mestrado tece comentários sobre vários métodos - paramétrícos e não-paramétricos - e os compara a partir de simulações. O próprio método contextual tem a sua versão não-paramétrica que pode ser visto em Baridó [19] e James [20] que também fornece além do algorítmo, um programa simples em linguagem BASIC para o caso de um vizinho (1-NN). Também em James [20], pode-se ver no capítulo 10 uma explanação introdutória sobre o reconhecimento de padrões e classificação auxiliado por inteligência artificial.

Métodos de Relaxação

Os métodos de relaxação que são utilizados como dispositivos de classificação contextual são baseados em uma filosofia diferente da apresentada na seção anterior. Inicialmente, estimam-se os "graus de pertinência" de um "pixel" a cada uma das K classes possíveis. Normalmente, utiliza-se para o "pixel" i, as K probabilidades a posteriori P(k | xi), k = l,...,K. Neste ponto, observa-se os vizinhos deste "pixel" para checar se os "graus de pertinência" destes estão em razoável correspondência com aqueles do"pixel" i. Esta avaliação é baseada em alguns conhecimentos a priori dos padrões nos quais as classes ocorrem. Classifica-se assim o "pixel" i numa classe concordante com os seus vizinhos, a partir das informações das probabilidades a posteriori - "graus de pertinência" - e probabilidades a priori obtidas de informações da própria imagem [17].

O procedimento pode ser ilustrado a partir do seguinte exemplo:

# Exemplo 1.2.: Dentre todas as classes disponíveis para um dado "pixel" i, a que obteve maior "grau de pertinêncía" foi a classe "Campo de Feijão". No entanto, os "pixels" da sua vizinhança obtiveram maior grau para a classe "Bosque de Eucaliptos" e as informações a priori fornecidas dão conta que um campo de feijão em meio a um bosque de eucaliptos é de probabilidade muito pequena. Num caso como este, deseja-se ajustar as estimativas iniciais para o "pixel" i e sua vizinhança. Inicia-se assim um procedimento iterativo visando ajustar as probabilidades a posteriori para o "pixel" i e seus vizinhos. Faz-se necessário observar que as probabilidades a posteriori são obtidas a partir de um procedimento não-contextua1. #

Este procedimento iterativo pode ser formulado de muitas maneiras diferentes, existindo portanto, vários tipos de métodos de relaxação [17, 21 e 22].

Estimativa de Parâmetros - Treinamento do Classificador

Os métodos de classificação supervisionados necessitam de estimativas para os parâmetros das funções discriminantes. Apesar de ser possível em alguns casos, determinar tais funções com base em considerações teóricas, com o conhecimento prévio a respeito da imagem, ou eventualmente pela intuição, o mais comum é o uso de informações retiradas de áreas de treinamento na própria imagem, fotografias aéreas, mapas, ou investigação direta no campo. Esses conhecimentos, denominados verdades terrestres, são na realidade, "pixels" sobre os quais se conhece suas verdadeiras classes - daí o nome. Com base nisto, o classificador é "treinado" a reconhecer "pixels" de estrutura semelhante. A estimativa da densidade de probabilidade para o vetor de atributos, fk (x), k = 1,...,K e os parâmetros das classes, como probabilidades a priori, probabilidades condicionais, etc, requerem diferentes tipos de conhecimento da verdade terrestre. Por exemplo, para estimar as densidades fk (x), necessita-se de áreas razoavelmente homogêneas de treinamento para cada classe. No entanto, para as probabilidades à priori p(k), as estimativas não podem advir de tais áreas de treinamento, necessitando de uma sistemática diferente, como por exemplo, uma inspeção visual da cena ou pontos amostrados aleatoriamente. No caso de classificadores contextuais, as funções discriminantes necessitam da verdade terrestre dos pontos e de um número determinado de vizinhos, de acordo com o modelo, exigindo uma forma de amostragem especifica para estes pontos.
A tabela 2, adaptada de Saebo et alii [17], mostra alguns métodos de classificação, a densidade multivariada comumente utilizada, os parâmetros de cada modelo a serem estimados e possíveis caminhos para fazê-los:

Tabela 2. Alguns métodos de classificação e metodologia de treinamento.

Uma explanação detalhada sobre os métodos pode ser encontrada em [17, 22, 23], sobre o método contextual de Owen & Switzer em [24] e sobre o Método da Máxima Verossimilhança, podem ser encontrado detalhes em [2].

Pós-classificação

A pós-classificação é uma forma de reduzir erros de classificação na imagem. Seu conceito básico é que pontos isolados de uma classe A dentro de uma área homogênea de uma classe B devem ser classificados como classe B e não como classe A.

Normalmente, usa-se um processo de filtragem para eliminar esses pontos isolados. Uma abordagem é utilizar o filtro da moda, reclassificando o "pixel" segundo os seus vizinhos dentro de uma janela, por exemplo 3 x 3. A pós-classificação pode ser utilizada sequencialmente até que as alterações na imagem classificada se estabilize. Porém, deve-se tomar cuidados para que o processo não afete outras áreas, nas quais os resultados já são aceitáveis.

Interpretação Visual da Imagem

Neste tópico, será dado uma breve introdução às metodologias de análise para quem não dispõe de nenhum dos recursos citados anteriormente. Trata-se da Interpretação Visual da Imagem (I.V.I.) [25]. A imagem é então adquirida já classificada, porém sem um fim específico. Normalmente, quando se utiliza um processo de classificação, a tendência é a procura de uma melhor qualidade na área especifica de interesse. Este pode ser o grande ponto desfavorável a interpretação visual. Este tipo de material é fornecido pelo Instituto de Pesquisas Espaciais - INPE - como sendo uma grande foto em papel, podendo ser esta colorida ou preto e branco, de determinada época de interesse, mono ou multiespectral, etc; ou seja, há várias opções de modo que o usuário deve procurar a que melhor se adeque à sua necessidade. Tendo a imagem em mãos, o passo seguinte é o de reconhecer o que existe na imagem e extrair dela o que se interessa.

A interpretação visual requer do usuário conhecimentos prévios de razoável monta. Por exemplo, há a necessidade do conhecimento prévio da época adequada para a obtenção da imagem, tipo de produto (colorido, ou P/B, já que nem sempre o colorido é que traz mais informações), as bandas a serem escolhidas (cada banda reflete uma determinada faixa do espectro). Para trabalhos com monitoramento ambiental, por exemplo, pode-se encontrar boas indicações em Tucker [26], as escalas (que devem ser ao máximo compatíveis com mapas, cartogramas, etc; disponíveis sobre a região), entre outros. Dependendo do tipo de interesse, a IVI requer mais conhecimentos da área "in loco", o que nem sempre é possível, ou associações com fotos aéreas, entre outros.

Os fotointerpretadores podem ser classificados em três grupos: primeiro, os que possuem conhecimento de campo; segundo, os que não possuem este conhecimento e, por fim, os que não possuem este conhecimento, mas que possuem fontes de informações adicionais. Os primeiros conseguem interpretar de forma mais fácil que os demais. Os do terceiro grupo podem ter dificuldades em cruzar as informações de que dispõem com a imagem. Já os do segundo grupo, dificilmente conseguirão fazê-lo sem o uso de chaves de interpretação - conhecimentos utilizados que são estruturados como se fossem formulações para se resolver um problema. É de grande valia que o uso das chaves de interpretação, quando necessárias (na maioria das vezes), seja feita de forma invariante, ou seja, não possa mudar de um fotointerpretador para outro. Para isso, cria-se legendas que vão funcionar como critérios de separação das diversas classes. Além de fixar a interpretação, as legendas auxiliam uma leitura mais rápida.

Feita a interpretação, parte-se para extrair da imagem as informações que se procura desde o início. Supondo um exemplo agrícola de estimativa de áreas plantadas, pode-se agir de duas formas. Na primeira, usa-se uma malha de pontos proporcionais à escala para se estimar a área, como um método grosseiro de integração. Logicamente que os resultados serão induzidos a muitos erros, às vezes até podem comprometer todo um trabalho. Uma solução seria trabalhar com uma malha de pontos bastante densa, o que ainda assim proporciona um risco de proporções razoáveis se o terreno em questão tiver um relevo acidentado. Uma segunda forma, já bem mais sofisticada, requer um computador em associação a uma mesa digitalizadora. A mesa transfere contornos da região ao computador e em associação a um mapa da região, incorpora também informações sobre o relevo. A seguir, um simples processo de integração numérica fornece a estimativa da área com erros bastante aceitáveis. Esta forma, porém é bastante onerosa, mas permite que se leve em consideração a tridimensionalidade. Com a tecnologia atual - a utilização de "scanners" pode transformar o trabalho ainda mais preciso, pois evita o contato manual - a transferência da imagem é feita por um processo digital de leitura da imagem. A grande desvantagem destes dois últimos processos é a necessidade de ?software" específico, nem sempre disponível com facilidade para este tipo de aplicação.

Em algumas aplicações da área agrícola, quando possível em termos de escala, pode-se utilizar dados amostrais do espaçamento médio no plantio na área de interesse para a estimativa da área plantada [27]. No entanto, a distância do pesquisador pode impossibilitar este procedimento. Geralmente, para se obter uma escala que permita tal visualização, deve-se recorrer ao uso de aeronaves, o que pode tornar inviável economicamente um projeto desta natureza. Porém, conseguindo-se agrupar recursos desta magnitude, os resultados deverão ser bastante confiáveis, podendo-se precisar de forma estatística o erro envolvido na operação.

Testes e Controle

Qualquer que seja o tipo de classificação, seja visual ou assistida por computador com qualquer algoritmo que se possa utilizar, sempre irão aparecer dúvidas com respeito à classificação obtida. Para sanar este problema, o procedimento usual é visitar o local. No entanto, este tipo de procedimento nem sempre é possível ou, em certos casos, nem mesmo viável. Uma forma de solução para o caso é a conjugação de imagens, tanto no aspecto espectral - imagens multiespectrais - quanto no aspecto temporal - imagens obtidas em diferentes épocas do mesmo local. Por exemplo, no caso agrícola da seção anterior, fotos obtidas em diferentes épocas mostrarão taxas de cobertura de solo diferenciadas, permitindo a diferenciação de culturas.

Na maioria das vezes os erros cometidos na classificação são inversamente proporcionais aos recursos - humanos , financeiros e de equipamento - alocados para o cumprimento da tarefa. Por estes motivos, é sempre recomendável o máximo aproveitamento e utilização de recursos e a maior sofisticação possível. É claro, que isto depende da finalidade com que se faz um processamento de uma imagem, já que não vale a pena investir na melhoria da classificação de uma região que não a de interesse, e da proporção de erro aceitável para o cumprimento da análise.

Referências

[1] Richards, J. A.; Remote Sensing Digital Image Analysis - An Introduction. Berlin, Springer-Verlag, 1995.

[2] Swain, P.H. and Davis, S.M.; Remote Sensing - The Quantitative Approach. New York, McGraw Hill International Book Company, 1978.

[3] Garcia, G.J.; Sensoriamento Remoto: Princípios e Interpretação de Imagens - Editora Nobel, 1982.

[4] Barros, M.A.; Filtros Espaciais: Implementação, estudo comparativo e aplicação em Sensoriamento Remoto. Dissertação de Mestrado - Departamento de Engenharia Elétrica - UFPb - Campina Grande, 1990, 156 pg.

[5] Barros, L.A.; Um circuito integrado para detecção de bordas com o Operador de Roberts. Dissertação de Mestrado - Departamento de Engenharia Elétrica - UFPb - Campina Grande, 1990.

[6] Ciampi, M.G.; ''Nociones Generales de Processamiento Digital de Imagines''. Revista Selper, marco, 1986.

[7] Câmara, G.; Casanova, M. A.; Hemerly, A. S.; Magalhães, G. C. e Medeiros, C. M. B.; Anatomia de Sistemas de Informação Geográfica. X Escola de Computação, Campinas, 1996.

[8] Assad, E. D. e Sano, E. E.; Sistemas de Informação Geográfica - Aplicações na Agricultura. EMBRAPA, Brasília, 1998.

[9] Johnson, R.A. and Wichern, D.W.; Applied Multivariate Statistical Analysis. Prentice-Hall Inc., 1982.

[10] Gonzalez, R.F. and Wintz, P.; Digital Image Processing, Addison-Wesley Publishing Co., 1977.

[11] Mascarenhas, N.D.A. e Velasco, F.D.R.; Processamento Digital de Imagens - IV Escola Brasileiro-Argentina de Informática - Termas de Rio Hondo, Argentina, 1989.

[12] Fisher, R.A.; ''The use of multiple measurements in taxonomic problems''. Ann. Eugen. v.7, 1936, pg 178-188.

[13] Moraes, R. M.; Implementação de um sistema contextual de classificação de imagens orbitais compatível com o sistema SITIM. Dissertação de Mestrado, UFPb, 1992, 100 pg.

[14] Dunn, J.C.; ''A Graph Theoretic Analysis of Pattern Classification via Tamura's Fuzzy Relations''. IEEE Trans. Syst. Man. Cybern., vol SMC-4, 1974, pg 310-313

[15] Cooper, D.B. and Freeman,J.H.; ''On the Asymptotic Improvement in the Outcome of Supervised Learning Provided by Additional Nonsupervised Learning''. IEEE Transactions on Computers, vol.19, n.11, november, 1970.

[16] Kent, J.T. and Mardia, K.V.; ''Spatial Classification Using Fuzzy Membership Models''. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.10, n.5, September, 1988, pp 659-671.

[17] Säebo, H.V.; Braten, K.; Hjort, N.L.; Llewllyn, B. and Mohn, E.; Contextual Classification of Remotly Sensed Data : Statistical Methods and Development of a System - Report n.768 - Norwegian Computing Center - Oslo - 1985.

[18] Teles, M. M. F.; Estudos sobre Sistemas de Informação Geográfica. Relatório PIBIC, Universidade Federal da Paraíba, João Pessoa, agosto de 1999.

[19] Baridó, M.P.F.; Uma comparação entre diferentes métodos multivariados de classificação. Dissertação de Mestrado - Instituto de Matemática - UFRJ - Rio de Janeiro, 1989, 189 pág.

[20] James, M.; Classification Algorithms - John Wiley and Sons Inc., 1985.

[21] Fu, K.S. and Yu, T.S.; Statistical Pattern Classification using Contextual Information - Research Studies Press, 1980.

[22] Hjort, N. L. and Mohn, E.; A comparison of some contextual methods in remote sensing classification. In: Säebo, H.V.; Braten, K.; Hjort, N.L.; Llewllyn, B. and Mohn, E.; Contextual Classification of Remotly Sensed Data : Statistical Methods and Development of a System - Report n.768 - Norwegian Computing Center - Oslo - 1985.

[23] Hjort, N. L.; Estimating parameters in neighbourhood based classifiers for remotely sensed data, using unclassified vectors: In: Säebo, H.V.; Braten, K.; Hjort, N.L.; Llewllyn, B. and Mohn, E.; Contextual Classification of Remotly Sensed Data : Statistical Methods and Development of a System - Report n.768 - Norwegian Computing Center - Oslo - 1985.

[24] Owen, A. and Switzer, P.; A neighbourhood based classifier for Landsat data. Technical Report. Dep. of Statistics, Stanford University, 1982.

[25] Duarte, V.; ''Metodologia de Interpretação Visual de Dados Orbitais''. Publicação interna INPE (no prelo).

[26] Tucker, C.J.; ''A comparison of satellite sensor bands for vegetation monitoring''. Photogrammetric Engineering and Remote Sensing, vol.44, n.11, november, 1978.

[27] Rudorff, B.F.T.; Palme, U.W.; Duarte, V.; Krug, T.; Tardin, A.T.; Batista, G.T.; Medeiros, J.S. e Godoy Jr.,M.; Sensoriamento Remoto na Detecção de áreas plantadas e perdas na produção agrícola no município de Irecê - BA. Publicação interna - INPE - abril, 1986

Continuação (em Postscript):

Segunda Parte .

Terceira Parte .