Publicado por: sadeckgeo | junho 16, 2015

Graduated colors – Método de Sturges

Cart_tema

Tenho visto por ai algumas coisas que me deixam um pouco angustiado, as pessoas continuam só apertando botão, não pode pessoal! Vamos tentar entender o que estamos fazendo… Nesse poste quero me ater em algumas questões relacionadas à cartografia temática, que algumas pessoas dizem ser muito baseada no bom senso, sim, pode ser, mas algumas vezes podemos acrescentar um pouco de matemática e organizar as coisas, como é o caso da criação de legenda por quantidade, onde se representa o dado numérico em escalas de cor (symbolizing quantity / graduated colors).

No ArcGIS, ao lado da função está escrito “natural breaks (Jenks)”. Quantos de nós já fomos em busca de saber sobre isso? Então, esse método aplica um cluster sobre seus dados para determinar a melhor classificação e uma sequência de procedimentos deve ser tomada para uma representação cartográfica elegante do ponto de vista matemático, pois o ArcGIS, por padrão, coloca 5 classes e você pode ajustar para o seu dado. O próprio help do software informa que você pode reajustar os intervalos de classe para que fiquem regulados aos seus dados (Alternatively, you can start with one of the standard classifications and make adjustments as needed.).

Em uma outra oportunidade falaremos mais profundamente sobre o Jenks por que ele tem seu valor, principalmente quando se fala em otimização!

ScreenShot125

Ok! Agora, como fazer isso? Vamos começar com um método bem mais simples que o de Jenks. Em 1926 um estatístico chamado Herbert A. Sturges publicou no Journal of the American Statistical Association um artigo intitulado The Choice of a Class Interval onde demonstra um método para estipular o melhor número de classes para uma determinada amostra. (Artigo Aqui).

A formula é simples, veja:

C = 1 + 3,322 * (log N)

Onde C é o numero de classes e N é o número de amostras.

Imagine um dado com 293 amostras, logo o número de classes seria 9.194, que arredondando seriam 9 classes. Agora é preciso definir a amplitude do intervalo (Ai) dessas 9 classes e para isso outra formula bem simples pode ser empregada.

Ai = Ls – Li / C

Onde, Ls e Li são os limites superior e inferior da amostra respectivamente.

Se considerarmos o nosso conjunto de dados Ls = 4.869; Li = 0.873 Logo, o Ai será igual a 0.444, esse valor deve ser usado em Ls ou Li no intuito de gerar os intervalos, ou seja, Classe 1 (c1) será igual a [0.873 _ 1.317]; (c2) ]1.317 _ 1.761] e assim por diante até a classe 9 (c9).

Os meus professores de estatística intervalaram o mínimo de classes em 5 e o máximo em 20 para não ser generalista e nem minimalista no intuito de retirar a subjetividade tão temida na ciência.

Lembro aqui, que isso é uma das formas de tratar os dados e que muitas outras podem ser empregadas dependendo do objetivo e do conjunto de dados que se tem. Essa postagem é muito mais para instigar a busca desses métodos, que para ensinar uma boa forma de apresentar seus dados. 

Contribuições são muito bem vindas!

Referências

“natural breaks classification – GIS Dictionary – Esri Support.” 2011. 15 Jun. 2015 <http://support.esri.com/knowledgebase/GISDictionary/term/natural%20breaks%20classification>

Sturges, HA. “The Choice of a Class Interval.” 1926. <http://www.aliquote.org/cours/2012_biomed/biblio/Sturges1926.pdf>

“Probabilidade – conceitos e leis: Sturges.” 2014. 16 Jun. 2015 <http://www2.fm.usp.br/dim/probabilidade/sturges.php>


Respostas

  1. Excelente contribuição! Chamo a atenção para a possibilidade, ou dever, de pressionar o botão classify (ao lado do número de classes), ali o usuário poderá ver o comportamento das frequências relacionadas ao fenômeno que está representado.
    Os métodos de classificação podem realçar uma determinada visão de um fenômeno, evidenciar os padrões de agrupamento dos dados ou esconder a forma como os dados (que representam um fenômeno) se comportam.

    Curtido por 1 pessoa

  2. Realmente é um tema ainda negligenciado, mas de grande importancia, Parabens pelo artigo. abs

    Curtido por 1 pessoa

  3. Dica de leitura do amigo Reurysson Morais pelo Facebook.

    Iniciação à análise geoespacial
    Teoria, técnicas e exemplos para geoprocessamento

    Ferreira, Marcos César

    http://www.editoraunesp.com.br/catalogo/9788539305377,iniciacao-a-analise-geoespacial

    Curtir

  4. isso mesmo Sadeck. Nas aulas de quantificação em geografia vi esse método e ele é bastante útil 😀

    Curtido por 1 pessoa

    • Que legal Jocilene,

      Geralmente nos cursos de geografia, ou melhor, nos que eu conheço e posso dizer que não são muitos, não vejo os professores fazendo referência à esses métodos. Então, se no seu curso o professor está… duas coisas no geral, o professor é bom e o curso está realmente formando bons profissionais.

      Parabéns! E gostaríamos de ouvir suas experiências. Fique a vontade para compartilhar conosco.

      Um grande agraço.

      Curtir

  5. Gostaria de obter mais informações quanto aos métodos de classificação de dados

    Curtido por 1 pessoa

  6. […] de classificação dos valores para podermos tomar a melhor decisão. Há poucos artigos, como o do Luis Sadeck e do Sandro, explorando essa importante decisão. Pretendemos neste artigo, mostrar o como a […]

    Curtido por 1 pessoa

  7. […] de classificação dos valores para podermos tomar a melhor decisão. Há poucos artigos, como o do Luis Sadeck e do Sandro, explorando essa importante decisão. Pretendemos neste artigo, mostrar o como a […]

    Curtir

  8. Muito bom o artigo, Sadeck ! Parabéns, como sempre !

    Publiquei o artigo na minha página do Facebook – Cartografia Temática, com os devidos créditos, obviamente.
    https://www.facebook.com/CartografiaTematica/

    Curtido por 1 pessoa


Deixe um comentário

Categorias