Como aplicar quaisquer grupos de colônias em análise preditiva

Um exemplo natural do grupo de auto-organização que você pode aplicar no comportamento análise preditiva é uma colônia de formigas caça para o alimento. As formigas coletivamente otimizar sua faixa para que ele sempre toma o caminho mais curto possível um alvo alimentos.

Mesmo se você tentar perturbar uma colônia de marcha das formigas e impedi-los de chegar ao alvo alimentos que voltar à pista rapidamente e (novamente) a encontrar o caminho mais curto possível do alvo comida, todos eles evitando os mesmos obstáculos, enquanto procura Comida. Esta uniformidade de comportamento é possível porque cada depósitos formiga um rastro de feromônios no terreno.

Considere um exército de formigas ociosos em seu ninho. Quando eles começam à procura de comida, eles não têm absolutamente nenhuma informação sobre onde encontrá-lo. Eles marcham aleatoriamente até que uma formiga encontra comida de agora a sorte formiga (chamemos-lhe Ant X) tem que comunicar a sua localização para o resto das formigas - e para fazer isso, ele deve encontrar o seu caminho de volta para o ninho.

Video: SCP-2003 Preferred Option | Object Class Thaumiel | temporal scp

Felizmente, Ant X estava produzindo seus próprios feromônios todo o tempo que estava à procura de comida de que pode seguir seu próprio rastro de feromônios de volta ao ninho. Em seu caminho de volta para o ninho, seguindo sua própria trilha de feromônio, Formiga X coloca mais feromônios na mesma trilha.

Como resultado, o cheiro no rastro de Ant X será o mais forte entre todas as trilhas das outras formigas. A trilha mais forte de feromônios vai atrair todas as outras formigas que ainda estão à procura de comida. Eles vão seguir o cheiro mais forte. À medida que mais formigas se juntar a trilha de Ant X, eles adicionar mais feromônios para it- o cheiro se torna mais forte. Em breve, todas as outras formigas têm um forte cheiro a seguir.

Se várias formigas descobriram a mesma fonte de alimento, as formigas que tiveram o caminho mais curto vai fazer mais viagens em comparação com formigas que seguem caminhos mais longos - mais feromônios serão produzidos, portanto, sobre o caminho mais curto. A relação entre o comportamento individual e colectiva é um exemplo natural esclarecedor.

Cada ponto representa um documento. Suponha que os pontos pretos são documentos sobre a análise preditiva e os pontos brancos são documentos sobre antropologia. Os pontos que representam os diferentes tipos de documentos são distribuídos aleatoriamente em grelha de cinco células.

“Formigas” são implantados aleatoriamente na grade para procurar documentos semelhantes. Cada célula com um valor em que representa um exemplo de um “feromona”. Utilizando a matriz documento, o valor “feromona” de cada célula é calculada a partir do documento correspondente.

Ok, como é que a inteligência coletiva de uma colônia de formigas produzir um modelo para Cluster eficazmente os dados? A resposta está em uma analogia simples: As formigas estão à procura de comida em seu ambiente, tanto quanto nós estamos à procura de aglomerados em um conjunto de dados - à procura de documentos semelhantes dentro de um grande conjunto de documentos.



Considere um conjunto de dados de documentos que deseja organizar por assunto. documentos semelhantes serão agrupados no mesmo cluster. Aqui é onde a colônia de formigas pode fornecer dicas sobre como agrupar documentos semelhantes.

Imagine uma grade bidimensional (2D), onde você pode representar documentos como pontos. A grade 2D é dividida em células. Cada célula tem um “feromônio” (valor) associado a ele. Resumidamente, o valor “feromônio” distingue cada documento em uma determinada célula.

Os pontos são inicialmente distribuídos aleatoriamente - e cada ponto na grade representa um documento único. O próximo passo é implantar outros pontos aleatoriamente na grade 2D, simulando busca da colônia de formigas para o alimento em seu ambiente. Esses pontos são inicialmente espalhados na mesma grelha 2D com os documentos.

Cada novo ponto adicionado à rede representa uma formiga. Esses “formigas”, muitas vezes referido no algoritmo ant-colônia como agentes, estão se movendo na grade 2D. Cada “formiga” vão quer pegar ou deixar os outros pontos (documentos), dependendo de onde os documentos melhor pertencem. Nesta analogia, o “alimento” assume a forma de documentos suficientemente semelhantes que podem ser agrupados.

Um “formiga” anda aleatoriamente na grid- se encontrar um documento, ele pode executar uma das duas ações: pegar ou largar. Cada célula tem uma “intensidade de feromônio” que indica como semelhante o documento é os outros documentos (pontos) que residem perto do documento em questão - a uma “formiga” está prestes a quer pegar ou largar.

Video: Марко Аннунциата: Добро пожаловать в эру промышленного Интернета

Note que a “formiga” em celular 3 vai pegar o documento em preto-pontilhada porque o valor branco “feromônio” é dominating- e ir para uma célula onde o valor é próximo (similar) para o que está no celular 4 (vários pontos pretos) . A busca continua repetindo até que os aglomerados se formam.

Com efeito, a “formiga” move documentos a partir de uma célula para outra para formar aglomerados através da realização de qualquer uma das duas únicas ações: pegar um documento ou deixar cair um documento.

Quando as “formigas” começou a se mover aleatoriamente na grade, encontrando um ponto (documento) resulta no “formiga” pegar um documento a partir de sua célula atual, movendo-se com ele, e deixá-la cair em uma célula em que ela tinha semelhança suficiente para em forma.

Como seria uma “formiga” determinar a melhor célula na qual a cair um documento? A resposta é que os valores nas células agem como “feromônios” - e cada célula na grade 2D contém um valor numérico que pode ser calculado de uma forma que representa um documento na célula.

Lembrar que cada documento é representada como um conjunto de números ou um vector de valores numéricos. A “intensidade do feromônio” (o valor numérico) aumenta quando mais documentos são descartados para dentro da célula - e esse valor diminui se os números que representam os documentos são movidos para fora da célula.


Publicações relacionadas