Mesclando e anexando dados

Quando seus dados estão em mais de um lugar, você precisa de maneiras de colocar tudo isso junto. Quando você participar de dois conjuntos de dados com diferentes variáveis, você está fusão dados. A fusão é uma operação comum. A fusão é frequentemente utilizado em extracção de dados, combinando os dados com ligações tais como

  • registros de clientes e dados da campanha de marketing

  • Antes e depois de resultados de testes

  • dados internos e fornecedor

Para mesclar conjuntos de dados, você deve ter uma variável que identifica casos de matching- isso é chamado de chave ou identificador variável. E você pode ter que identificar um dos conjuntos de dados como primário- tabela primária deve ter apenas um caso para qualquer valor da variável chave.

Algumas aplicações de mineração de dados tem mais de uma ferramenta para mesclar conjuntos de dados: A primeira figura mostra a ferramenta para fusões básicos, ea segunda figura mostra a ferramenta para a criação de critérios de mesclagem mais complexos.


Se suas fontes de dados contêm as mesmas variáveis ​​(mais ou menos- a partida não têm de ser idênticos), mas casos diferentes, se juntando a eles é chamado anexando ou concatenação. Como fusão, esta é uma operação comum. É usado sempre que você tem novos casos para algo que você já tenha sido rastreamento.

A parte complicada de encontrar a ferramenta certa é muitas vezes descobrir o que é chamado. Olhe nos menus (ou procure) para anexar, concatenar, ou mesclar linhas.


Publicações relacionadas