Como utilizar clusters de rebanho de aves em análise preditiva

Imagine o comportamento reunindo aves como modelo para dados de análise preditiva da sua empresa. Cada item de dados corresponde a um único pássaro na flock- uma aplicação visual apropriado pode mostrar o rebanho na ação em um espaço visual imaginário.

Seu conjunto de dados corresponde ao rebanho. O comportamento flocking naturais corresponde a padrões de dados que poderiam passar por descobrir. O objectivo consiste em detectar enxames (clusters de dados) entre as aves flocagem (elementos de dados).

Reunindo-se o comportamento tem sido utilizado em aplicações da vida real, como operações de resgate robótica baseada e animação por computador. Por exemplo, o produtor do filme Batman Returns comportamento flocking matemático gerado para simular enxames de morcegos e rebanhos pinguim.

O uso da reunindo comportamento como uma técnica de análise preditiva - análise de dados de uma empresa como rebanhos de elementos de dados semelhantes - é baseado na dinâmica por trás reunindo comportamento como aparece na natureza.

Reunindo comportamento das aves, peixes, moscas, abelhas e formigas é uma auto-organização sistema- os indivíduos tendem a se mover de acordo com tanto seu ambiente e indivíduos vizinhos.

Em um bando de pássaros, cada ave aplica três regras principais, enquanto reunindo:

  • Separação mantém um pássaro além de seus companheiros de rebanho mais próximos.

  • Alinhamento permite que um pássaro para mover ao longo da mesma posição média como a de seus companheiros de rebanho.

  • Coesão mantém o pássaro dentro do rebanho local.

Cada pássaro em um rebanho se move de acordo com estas regras. Um pássaro mates rebanho são aves encontradas dentro de uma certa distância da ave, e uma certa distância um do outro. Para evitar a colisão entre as aves, uma distância mínima deve ser kept- também pode ser definido matematicamente. Essas são as regras que orquestram flocagem comportamento- usá-los para analisar os dados é um próximo passo natural.

Considere um conjunto de dados de usuários de redes sociais on-line. agrupamento de dados pode identificar comunidades sociais que compartilham os mesmos interesses. Identificar comunidades sociais em uma rede social é uma ferramenta valiosa que pode transformar a maneira como as organizações pensar, agir, operar e gerir as suas estratégias de marketing.

Como você obter um conjunto de dados de usuários de redes sociais? Bem, alguns dos dados e ferramentas já estão disponíveis: principais redes sociais e sites de microblog como o Facebook eo Twitter fornecem uma interface de programação de aplicativos (API) que lhe permite desenvolver programas que podem obter dados públicos postados pelos usuários.

Essas APIs oferecidas pelo Twitter são referidos como Twitter Transmissão APIs. Eles vêm em três tipos principais: público, usuário e riachos do site:

fluxos públicos permitir que um usuário para coletar tweets públicos sobre um tópico ou usuário específico ou apoiar um propósito analytics.

  • fluxos de usuários permitir que um usuário para coletar tweets que são acessíveis por conta do usuário.



  • fluxos de site são para servidores de grande porte que se conectam ao Twitter em nome de muitos usuários.

    Video: Data Mining with STATISTICA - Session 1

  • Agora, suponha que você use esse programa para baixar os dados dos usuários e organizá-lo em um formato tabular como a matriz mostrada. Ele mostra uma matriz simples que registra as interações online de amigos on-line de Zach mais de duas semanas diferentes. Este conjunto de dados é composto por sete elementos e sete características. As características como mostradas na coluna da tabela é o número de interacções entre cada membro e os outros membros.

    Há muitas maneiras de aplicar o comportamento-reunindo pássaro para descobrir clusters em grandes conjuntos de dados. Uma das variações mais recentes é o Flock pelo Líder algoritmo de aprendizado de máquina clustering, inspirado pela descoberta de líderes de aves nas espécies de pombos. O algoritmo prevê elementos de dados que poderia levar um outro grupo de objetos de dados.

    Um líder é atribuído, em seguida, os iniciados líder e leva o comportamento flocagem. Ao longo do algoritmo, os líderes podem se tornar seguidores ou valores discrepantes. Em essência, este algoritmo funciona de uma forma que segue as regras da “sobrevivência do mais apto”.

    O Flock pelo algoritmo Líder foi introduzido pela primeira vez por Abdelghani Bellaachia e Anasse Bari em “Rebanho pelo Líder: A Clustering Algorithm Novel Machine Learning Biologicamente Inspirada”, publicado como um capítulo no processo dos 2012 Avanços na conferência Swarm Intelligence.

    A seguir mostra uma maneira possível para representar dados gerados por trocas sociais on-line mais de duas semanas. Isso mostra que Zach interagiu 56 vezes com Kellie e cinco vezes com Arthur.

    Rede de Membro socialInterações com JohnInterações com MikeInteracções com ZachInteracções com EmaInteracções com KellieInterações com NicoleInterações com Arthur
    John-1010124410
    Mike-5556575
    Zach-64144
    Emma-2888
    Kellie-55
    Nicole-4
    Arthur-
    Rede de Membro socialInterações com JohnInterações com MikeInteracções com ZachInteracções com EmaInteracções com KellieInterações com NicoleInterações com Arthur
    John-1012100108
    Mike-502005
    Zach-9013
    Emma-221
    Kellie-49
    Nicole-1
    Arthur-

    Aqui está um exemplo que descreve como aplicar o algoritmo de flocking pássaro para analisar os dados da rede social. Como descrito, cada membro é representado por um pássaro no espaço virtual. Notar que

    • As aves são inicialmente dispersos aleatoriamente no espaço virtual.

    • Cada ave tem uma velocidade e uma posição associada a ele.

    • A velocidade e a posição é calculado para cada ave, utilizando três vectores de: separação, lugares, e alinhamento.

    • Cada pássaro se move de acordo com os três vetores, e este movimento produz o comportamento flocking visto na natureza.

    Aqui dados de interação é analisada semanalmente para encontrar os usuários das redes sociais semelhantes. A cada semana, as aves podem ser visualizados em uma grade simples. As posições desses pássaros refletem as interações de indivíduos reais no mundo real.


    Publicações relacionadas