Tenho visto por ai algumas coisas que me deixam um pouco angustiado, as pessoas continuam só apertando botão, não pode pessoal! Vamos tentar entender o que estamos fazendo… Nesse poste quero me ater em algumas questões relacionadas à cartografia temática, que algumas pessoas dizem ser muito baseada no bom senso, sim, pode ser, mas algumas vezes podemos acrescentar um pouco de matemática e organizar as coisas, como é o caso da criação de legenda por quantidade, onde se representa o dado numérico em escalas de cor (symbolizing quantity / graduated colors).
No ArcGIS, ao lado da função está escrito “natural breaks (Jenks)”. Quantos de nós já fomos em busca de saber sobre isso? Então, esse método aplica um cluster sobre seus dados para determinar a melhor classificação e uma sequência de procedimentos deve ser tomada para uma representação cartográfica elegante do ponto de vista matemático, pois o ArcGIS, por padrão, coloca 5 classes e você pode ajustar para o seu dado. O próprio help do software informa que você pode reajustar os intervalos de classe para que fiquem regulados aos seus dados (Alternatively, you can start with one of the standard classifications and make adjustments as needed.).
Em uma outra oportunidade falaremos mais profundamente sobre o Jenks por que ele tem seu valor, principalmente quando se fala em otimização!
Ok! Agora, como fazer isso? Vamos começar com um método bem mais simples que o de Jenks. Em 1926 um estatístico chamado Herbert A. Sturges publicou no Journal of the American Statistical Association um artigo intitulado The Choice of a Class Interval onde demonstra um método para estipular o melhor número de classes para uma determinada amostra. (Artigo Aqui).
A formula é simples, veja:
C = 1 + 3,322 * (log N)
Onde C é o numero de classes e N é o número de amostras.
Imagine um dado com 293 amostras, logo o número de classes seria 9.194, que arredondando seriam 9 classes. Agora é preciso definir a amplitude do intervalo (Ai) dessas 9 classes e para isso outra formula bem simples pode ser empregada.
Ai = Ls – Li / C
Onde, Ls e Li são os limites superior e inferior da amostra respectivamente.
Se considerarmos o nosso conjunto de dados Ls = 4.869; Li = 0.873 Logo, o Ai será igual a 0.444, esse valor deve ser usado em Ls ou Li no intuito de gerar os intervalos, ou seja, Classe 1 (c1) será igual a [0.873 _ 1.317]; (c2) ]1.317 _ 1.761] e assim por diante até a classe 9 (c9).
Os meus professores de estatística intervalaram o mínimo de classes em 5 e o máximo em 20 para não ser generalista e nem minimalista no intuito de retirar a subjetividade tão temida na ciência.
Lembro aqui, que isso é uma das formas de tratar os dados e que muitas outras podem ser empregadas dependendo do objetivo e do conjunto de dados que se tem. Essa postagem é muito mais para instigar a busca desses métodos, que para ensinar uma boa forma de apresentar seus dados.
Contribuições são muito bem vindas!
Referências
“natural breaks classification – GIS Dictionary – Esri Support.” 2011. 15 Jun. 2015 <http://support.esri.com/knowledgebase/GISDictionary/term/natural%20breaks%20classification>
Sturges, HA. “The Choice of a Class Interval.” 1926. <http://www.aliquote.org/cours/2012_biomed/biblio/Sturges1926.pdf>
“Probabilidade – conceitos e leis: Sturges.” 2014. 16 Jun. 2015 <http://www2.fm.usp.br/dim/probabilidade/sturges.php>
Excelente contribuição! Chamo a atenção para a possibilidade, ou dever, de pressionar o botão classify (ao lado do número de classes), ali o usuário poderá ver o comportamento das frequências relacionadas ao fenômeno que está representado.
Os métodos de classificação podem realçar uma determinada visão de um fenômeno, evidenciar os padrões de agrupamento dos dados ou esconder a forma como os dados (que representam um fenômeno) se comportam.
CurtirCurtido por 1 pessoa
By: Sandro Valeriano on junho 16, 2015
at 7:54 pm
Realmente é um tema ainda negligenciado, mas de grande importancia, Parabens pelo artigo. abs
CurtirCurtido por 1 pessoa
By: Felipe Sodré Barros on junho 17, 2015
at 2:39 pm
Dica de leitura do amigo Reurysson Morais pelo Facebook.
Iniciação à análise geoespacial
Teoria, técnicas e exemplos para geoprocessamento
Ferreira, Marcos César
http://www.editoraunesp.com.br/catalogo/9788539305377,iniciacao-a-analise-geoespacial
CurtirCurtir
By: sadeckgeo on junho 17, 2015
at 10:23 pm
isso mesmo Sadeck. Nas aulas de quantificação em geografia vi esse método e ele é bastante útil 😀
CurtirCurtido por 1 pessoa
By: Jocilene Dantas Barros on junho 21, 2015
at 8:49 am
Que legal Jocilene,
Geralmente nos cursos de geografia, ou melhor, nos que eu conheço e posso dizer que não são muitos, não vejo os professores fazendo referência à esses métodos. Então, se no seu curso o professor está… duas coisas no geral, o professor é bom e o curso está realmente formando bons profissionais.
Parabéns! E gostaríamos de ouvir suas experiências. Fique a vontade para compartilhar conosco.
Um grande agraço.
CurtirCurtir
By: sadeckgeo on junho 21, 2015
at 6:57 pm
Gostaria de obter mais informações quanto aos métodos de classificação de dados
CurtirCurtido por 1 pessoa
By: Dácio Cambraia on abril 2, 2016
at 8:13 pm
[…] de classificação dos valores para podermos tomar a melhor decisão. Há poucos artigos, como o do Luis Sadeck e do Sandro, explorando essa importante decisão. Pretendemos neste artigo, mostrar o como a […]
CurtirCurtido por 1 pessoa
By: Mapas Cloropléticos: Porque devo me preocupar? - UniversoGEO on julho 7, 2016
at 11:08 am
[…] de classificação dos valores para podermos tomar a melhor decisão. Há poucos artigos, como o do Luis Sadeck e do Sandro, explorando essa importante decisão. Pretendemos neste artigo, mostrar o como a […]
CurtirCurtir
By: Mapas Cloropléticos: Por que devo me preocupar? - UniversoGEO on julho 17, 2016
at 5:49 pm
Muito bom o artigo, Sadeck ! Parabéns, como sempre !
Publiquei o artigo na minha página do Facebook – Cartografia Temática, com os devidos créditos, obviamente.
https://www.facebook.com/CartografiaTematica/
CurtirCurtido por 1 pessoa
By: Edmilson Martinho Volpi on maio 21, 2017
at 3:16 pm