Inferir o significado de padrões de pontos com distâncias vizinho mais próximo

Video: Dica de Sociologia - Conceito de Trabalho - Oficina do Estudante cursinho vestibular e colégio

medição do ponto de padrão baseado em distância, como no algoritmo do vizinho mais próximo, é útil para descrever o efeitos de segunda ordem inerente dentro de um conjunto de dados - esses efeitos causados ​​por interações entre pontos de dados em um conjunto de dados. Na maioria das vezes, você provavelmente não sabe que seus pontos de dados estão influenciando uns aos outros, mas você pode testar para este tipo de influência usando distâncias vizinho mais próximo para fazer inferências de padrões de pontos.

Video: 1000 наиболее распространенных английских фраз для разговора (с субтитрами)

Para ilustrar a ideia de efeitos de segunda ordem dentro de um conjunto de dados, considere um conjunto de dados que descreve a propagação de Ebola em populações Serra Leoa. A densidade populacional é definitivamente um fator de risco para a propagação do Ebola dentro da comunidade, devido ao fato de que a doença é mais provável a se espalhar quando as pessoas infectadas estão em estreita proximidade com pessoas não-infectadas. A propagação do Ebola é um efeito que está diretamente causados ​​por interações entre os “pontos de dados” - os indivíduos em uma população Ebola-afetada.



Média algoritmo do vizinho mais próximo calcular um valor de índice descritiva que representa a distância média entre um ponto de dados e o seu vizinho mais próximo. Se o valor índice calculado é menor do que 1, então os dados são dito para mostrar padronização de cluster. Se o valor índice é maior do que 1, então os dados são dito para mostrar padronização dispersão.

Video: Sentidos da palavra direito | Prof. Ronaldo Bastos

Então, como você pode detectar interações entre pontos de dados? Você tem que olhar para os padrões dentro dos dados. padronização agrupado indica que há algum tipo de interação acontecendo entre os pontos de dados e que esta interação está causando um aumento nos valores médios de similaridade. A maneira mais fácil de entender esse conceito é pensar em dois ímãs de cargas opostas em estreita distância, próxima um do outro. Se você olhar para o valor do índice descritivo para os ímãs e ver que ele é menor do que 1, então você pode até mesmo assumir que os ímãs são da carga oposta - e atraindo assim um ao outro - apenas com base neste valor do índice sozinho.

Na modelação de dispersão, por outro lado, a interacção entre os pontos de dados provoca um decréscimo nos valores médios de similaridade. Voltando à analogia ímãs, desta vez os dois ímãs se repelem. Se você olhar para o valor do índice descritivo para os ímãs e ver que ele é maior do que 1, então você pode assumir que os ímãs são da mesma acusação - e repelindo assim um do outro.


Publicações relacionadas