Estimando clusters de dados com estimativa de densidade de kernel

Video: QGIS 2.4: Mapa de Densidade de Kernel

Uma forma de identificar grupos em seus dados é usar uma função de alisamento densidade. estimativa de densidade de Kernel (KDE) é apenas como uma suavização metodolo- ele funciona, colocando um núcleo - uma função de ponderação, que é útil para a quantificação da densidade - em cada ponto de dados no conjunto de dados e depois somando os grãos para gerar uma estimativa de densidade de grãos de toda a região.

Áreas de maior densidade de pontos irá resumir com maior densidade de kernel, enquanto as áreas de menor densidade ponto irá resumir com menor densidade de kernel.

Como os métodos do kernel de alisamento não se baseiam em técnicas de colocação e de agrupamento de centro de conglomerado para estimar aglomerados, eles não apresentam um risco de gerar agrupamentos erróneos, colocando os centros em áreas de densidade local mínimo.

Video: Lecture 18 - Epilogue



Onde k-médias algoritmos gerar definições de hard-alinhados entre pontos em diferentes clusters, KDE gera um lote de mudança de densidade gradual entre pontos de dados. Por esta razão, é uma ajuda útil quando eyeballing clusters. A figura a seguir mostra o que o Banco Mundial Renda e enredo Educação dispersão parece após uma KDE foi aplicada.

Video: Stata. Datos de panel 1/3 (panel data analysis with stata)

Você pode ver que os espaços em branco entre os clusters foram reduzidos. Olhando para a figura, é bastante óbvio que há pelo menos três grupos, e possivelmente mais, se você quiser permitir que pequenos grupos.


Publicações relacionadas