Publicado por: sadeckgeo | fevereiro 28, 2010

Classificação

Classificação

Uma grande diversidade de projetos ambientais tem se desenvolvido com técnicas de sensoriamento remoto, muitas das vezes esses projetos cobrem uma área bastante extensa, necessitando de procedimentos mais automáticos para a interpretação da paisagem. É nesse contexto que o uso das técnicas de classificação de imagens de satélite vem crescendo e junto com elas muitas duvidas sobre os tipos de classificação também. É por isso que hoje falaremos um pouco sobre algumas formas e métodos de classificação.

Logo de início, é importante dividirmos em dois grupos. Classificação Não-Supervisionada e Classificação Supervisionada. Essa divisão nos leva a explicação dos diferentes processos.

Classificação Não-Supervisionada: genericamente nesse método, cada pixel da imagem é associado a uma classe sem que o usuário tenha conhecimento prévio do numero ou da identificação das diferentes classes presentes na área imageada. (FONSECA, 2008).

Classificação Supervisionada: na forma mais ampla, esse método pode ser explicado como o procedimento que necessita de conhecimento prévio da área para produção do treinamento do algoritmo, para que o mesmo possa reconhecer os diferentes intervalos do comprimento de onda e assim definir as fronteiras de classe.

Dentro desses dois métodos existem peculiaridades de agregação da informação espectral que podem ser pixel-a-pixel ou por regiões.

Pixel-a-pixel: a técnica de classificação por pixel utiliza a informação espectral de cada pixel isolado para encontrar regiões homogêneas, traçando assim uma probabilidade de um determinado pixel analisado pertencer ou não a uma determinada classe.

Regiões: nessa peculiaridade leva-se em consideração a variabilidade espacial e a textura natural. Ao invés de considerar as características espectrais de um determinado pixel no processo de decisão, um agrupamento de pixels é selecionado e usado como unidade de classificação. Estes classificadores procuram simular o comportamento de um fotointérprete, ao reconhecer áreas homogêneas nos dados orbitais, baseados nas propriedades espectrais e espaciais dessas áreas na imagem. A informação de borda é utilizada inicialmente para separar regiões; e as propriedades espaciais e espectrais agrupam áreas com mesma textura. (KURY & VIEIRA, 2001). Usualmente está técnica é empregada após o procedimento de segmentação.

Após esse entendimento, falaremos então mais específico de alguns métodos que são recorrentes na literatura e nos softwares de PDI. Você lembra quais são? ENVI, ERDAS, PCI, SPRING e outros.

Bem, vou listá-los para não esquecer nenhum. (Máxima Verossimilhança, Distância Euclidiana, Bhattacharya, Mahalanobis, Parallelepiped, Spectral Angle Mapper, K-Media, IsoData).

Começando pelo Máxima Verossimilhança ou como costuma ser chamado, MAXVER. Esse método pressupõe a ponderação das distâncias entre médias dos níveis digitais das classes, utilizando parâmetros estatísticos. Como esse é um método de classificação supervisionada pixel-a-pixel, é fundamental que se use amostras de treinamento para definir o diagrama de dispersão das classes e a probabilidade de pertencimento.

Para que nessa metodologia se tenha uma boa classificação é imprescindível o número de amostras seja um pouco elevado. Alguns trabalhos são desenvolvidos pegando-se 20 amostras de 5 x 5 pixels, o que dá um total de 500 pixels no total das amostras, é importante frisar que essas amostras não podem conter contaminações, ou seja, apresentarem muita informação pertencente a outras classes, sendo assim, é sempre bom dar uma olhada na estatística das amostras antes de partir para a classificação.

Outro método de classificação, também supervisionado pixel-a-pixel, é o por Distância Euclidiana, segundo a matemática, é a distância entre dois pontos provada pela aplicação repetida do teorema de Pitágoras. No sensoriamento remoto esse conceito se traduz da seguinte forma, é a distância medida para associar um pixel a uma determinada classe, pois nas amostras de treinamento foram determinados grupos de pixel que representam as classes. Para ficar mais claro, o que acontece é que o algoritmo de classificação compara a Distância Euclidiana do pixel à media de cada agrupamento e quanto menor for a distância maior será a probabilidade de pertencimento, esse procedimento é repetido até que toda a imagem seja classificada.

Seguindo com os métodos de classificação supervisionada, mas agora por regiões, o que implica dizer que é necessário o uso do segmentador, temos o método Bhattacharya. Nesse método o algoritmo é usado para medir a separabilidade estatística entre um par de classes espectrais, ou seja, mede a distância média entre as distribuições de probabilidades dessas classes para agrupar regiões. Aqui as amostras de treinamento serão os objetos gerados na segmentação através de similaridades e forma. Segundo (CORREIA et al 2007), o classificador Bhattacharya se aplica sobre o resultado do processo de segmentação, ou seja, classifica-se um conjunto de pixels, gerando áreas mais contínuas.

Ainda nessa mesma linha de classificações baseadas em segmentação, temos a classificação pela distância de Mahalanobis, que tem uma semelhança com a MAXVER, mas com o diferencial de assumir que todas as classes de covariância são iguais, tornando-se assim mais rápido. Segundo (SANTOS, 2006), a distância de Mahalanobis é calculada considerando o espalhamento dos dados, inclusive a orientação de amostras de uma determinada classe. Essa distância é calculada sempre entre um ponto e um conjunto de amostras, no caso objetos da segmentação, mas isso não implica que esse método seja empregado em outros tipos de classificação… Por exemplo, no software SPRING esse método é considerado para classificações não-supervisionadas, já no ENVI esse mesmo método é usado como classificação supervisionada, porém os dois concordam que é necessária a segmentação.

Para o método Parallelepiped, confesso que não tenho muito conhecimento nos procedimentos, mas vou tentar explicar o que entendo por tal, se alguém tiver mais conhecimento sobre esse método, use os comentários para contribuir. Bem, o método Parallelepiped consiste em determinara se um pixel está dentro de uma classe ou não, para isso, usa os limiares de cada amostra, esses limiares formam as dimensões de cada lado de um paralelepípedo em torno da média da classe, com isso, se um pixel cai dentro do paralelepípedo, é atribuído à classe. Mas se o pixel estiver dentro de mais de uma classe, ele é colocado dentro da sobreposição de classes e se não se enquadrar em nenhuma das classes, é atribuído à classe nula.

Saindo um pouco dos métodos tradicionais de classificação supervisionada, o método SAM – Spectral Angle Mapper traz, como já diz seu nome, um mapeamento de classes pela variação do ângulo de separação espectral, esse processo pode ser visualizado em um espaço n-dimensional, que é criado a partir do número de bandas da imagem, tendo como característica um nuvem de pontos. Geralmente nas extremidades dessa nuvem em ângulos diferentes temos a divisão das classes, pois esse método é insensível à iluminação, ou seja, o algoritmo SAM utiliza apenas a direção do vetor e não o comprimento do vetor. Segundo o grupo de estudos em sensoriamento remoto da universidade do Texas, este método é geralmente usado como um primeiro corte para a determinação da mineralogia e funciona bem em áreas de regiões homogêneas. Levando isso em consideração e sabendo que a maioria dos alvos na superfície terrestre não são homogêneos, esse método se torna melhor aplicado quando é feito um estudo prévio com modelo linear de mistura espectral – MLME e extração dos pixels puros – PPI.

Nesse artigo deixamos de lado dois métodos de classificação supervisionada que são o SVM (Support Vector Machine) e a Arvore de Decisão, por entender que esses podem ser enquadrados em um procedimento mais avançado de classificação que leva em consideração aprendizagem e decisão. Sendo assim, passamos agora aos métodos de classificação não-supervisonada.

Um dos métodos mais usados no sensoriamento remoto para esse tipo de classificação é o IsoData, esse algoritmo identifica padrões típicos nos níveis de cinza, esses padrões são classificados efetuando-se visitas de reconhecimento a alguns poucos exemplos escolhidos para determinar sua interpretação. Em razão da técnica usada nesse processo, os padrões são geralmente referidos como “clusters”. Neste tipo de classificação, as classes são determinadas pela análise de agrupamentos (cluster analysis). Para tanto é necessário que o usuário determine o número de classes, a quantidade de interações, ou seja, de recalculo para os novos valores médios. O usuário ainda pode deixar o algoritmo mais preciso configurando o desvio padrão, o erro de distância mínima e outros parâmetros. Esse algoritmo e muito sensíveis a esses parâmetros, podendo gerar classificações muito diferentes quando são feitas vários testes para um mesmo conjunto de dados.

O procedimento de classificação usado pelo método K-Media é basicamente o mesmo do IsoData, pois este ultimo é uma derivação do primeiro e se tornaria redundante explicá-lo novamente.

Por fim, gostaria de agradecer a paciência de todos, por lerem um artigo tão extenso, mas gostaria também de deixar claro, que muito mais existe sobre esses métodos expostos aqui e muitos outros métodos também. Em uma próxima oportunidade tentarei abordar os procedimentos que levam em consideração aprendizagem e decisão. Para aqueles que quiserem dar contribuições a esse artigo fiquem a vontade para comentar.


CORREIA, V. R. de M. et al. (2007) Uma aplicação do sensoriamento remoto para a investigação de endemias urbanas. Cad. Saúde Pública,  Rio de Janeiro,  v. 23,  n. 5. Acessado em 07 jan 2010.

FONSECA, E. L. da. (2008) Métodos para classificação de imagens digitais multiespectrais: classificadores supervisionados e não supervisionados (Notas de Aula). UFRGS – IG – DGEO. Acessado em 19 fev 2010.

KÖRTING, T. S. (2006) Classificação de Imagens por Regiões. São José dos Campos. Acessado em 23 fev 2010.

KURY, E. B. & VIEIRA, C. A. O. (2001) Classificação automática de imagens de alta resolução. In UFVGEO Acessado em 08 jan 2010.

PEREIRA, M. F. M. & RIBEIRO, G. P. (2008) Mapeamento digital de zona urbana em Teresópolis (rj), adjacente ao parque nacional da serra dos órgãos  (parnaso), a partir de imagens ikonos II. II SBCG e TG,Recife. Acessado em 23 fev 2010.

RICHARDS, J.A. (1999) Remote Sensing Digital Image Analysis. Springer-Verlag, Berlin.

SANTOS, R. (2006). Princípios e aplicações de mineração de dados. Technical report, INPE.

SPRING: Integrating remote sensingand GIS by object-oriented data modeling. Camara G, Souza RCM, Freitas UM, Garrido J. Computers & Graphics, 20: (3) 395-403, May-Jun 1996. Acessado em 19 fev 2010.

TOU, J. T. & R. C. GONZALEZ, (1974). Pattern Recognition Principles, Addison-Wesley Publishing Company, Reading, Massachusetts.

http://www.csr.utexas.edu/projects/rs/hrs/analysis.html Acessado em 20 fev 2010

http://www.csr.utexas.edu/ Acessado em  13 out 2009


Links Relacionados:

Classificação Orientada a Objeto

Classificação Supervisionada – ArcGIS 9.3

Classificação não-supervisionada ArcGIS 9.2

Classificação Supervisionada – TerraView

Reclassify – ArcGIS9.3

Density Slice ENVI4.5


Respostas

  1. Muito bom este artigo, parabéns Sadeck!!!

    Curtido por 1 pessoa

  2. ola amigo, esta de parabens pelo site conteudo muito bom, sou novo nessa area, pretendo ainda me formar em geografia. abraços

    Curtido por 1 pessoa

  3. Oi Sadeck,
    Tem que publicar este artigo para a gente poder citar. 🙂
    Muito bom!
    Abs

    Curtido por 1 pessoa

  4. Nossa muito bom!!!

    Curtido por 1 pessoa


Deixe um comentário

Categorias