Bases de dados e data mining

Os dados coletados por grandes organizações no curso dos negócios todos os dias é normalmente armazenado em bancos de dados. Mas os administradores de banco de dados pode não estar disposto a permitir que os mineiros dos dados acesso direto a essas fontes de dados, e acesso directo pode não ser a melhor opção a partir do seu ponto de vista também. Acesso directo à operacionais (usado para operações de rotina) bancos de dados pode ser uma má idéia, porque

  • mineiros de dados usam uma grande quantidade de dados. Você poderia acidentalmente ocupar recursos e interferir com as operações de negócios comuns.

    Video: Exemplo de prática com Data Mining - 1

  • obrigações de negócios legais e outras importa. Você poderia involuntariamente violar uma lei de privacidade de dados ou outro requisito de gerenciamento de dados se o seu acesso a dados não for devidamente controlado.

  • bancos de dados operacionais não estão organizados para mineração de dados. Você poderia gastar muito tempo lutando para obter os dados que você precisa, e ainda não ter a certeza de acertar.

Quando você precisa de dados de um banco de dados operacional (e você tem a aprovação apropriado usar os dados), você deve discutir suas necessidades com o administrador responsável por esses dados. Você precisa explicar exatamente o que os dados que você precisa, o formato que você precisa para mineração de dados, e se você precisa os dados apenas uma vez ou em uma base contínua.

A melhor abordagem para os pedidos de uma só vez é muitas vezes para o administrador para extrair os dados para você e entregá-lo em um arquivo de texto ou outro formato aceitável.

acesso a dados em curso é outra questão. O administrador não pode querer fornecer extractos de dados mais e mais, e dando-lhe acesso directo aos sistemas de negócio é arriscado. Uma solução comum é o de criar um banco de dados analítico. Este é um banco de dados relacional comum que é separado do sistemas de negócios convencionais. Dados é rotineiramente (e automaticamente) transferidos de sistemas de negócios para o banco de dados analítico, e os mineiros de dados pode acessá-lo a qualquer momento.

Video: Fisl 16 - Melhorando o Processo Decisório com Mineração de Dados e Software Livre

Se você usar um banco de dados analítico, certifique-se de que ele está organizado adequadamente para apoiar a mineração de dados. Ajude o seu administrador de banco de dados por esboçar um diagrama como o mostrado para demonstrar como os dados devem ser organizados.



Se o administrador de banco de dados insiste que os dados não podem ser armazenados desta forma, pergunte se é possível criar uma Visão (A consulta armazenada que pode ser consultado como se fosse uma tabela de dados convencional) com a organização que você precisa.

Muitos produtos de mineração de dados são capazes de ler dados a partir de bancos de dados. Os passos necessários variar de acordo com o

  • Design do aplicativo de mineração de dados

  • Estrutura do banco de dados de fonte

  • Middleware, geralmente chamado de motorista (driver ODBC, JDBC driver), Um software especial que medeia entre o software de banco de dados e aplicações

Documentação para a sua aplicação de mineração de dados deve dizer-lhe se ele pode ler dados de um banco de dados, e em caso afirmativo, qual ferramenta ou função para usar, e como. O administrador que configura o banco de dados de análise pode fornecer detalhes sobre como acessar o banco de dados.

Se você já está confortável trabalhando com bancos de dados e outras aplicações, você vai encontrar nada de surpreendente sobre fazer as mesmas coisas com uma aplicação de mineração de dados. Se os bancos de dados são novidade para você, obter uma pessoa experiente de sua organização para orientá-lo através do processo com o seu próprio aplicativo de banco de dados e mineração de dados.


Publicações relacionadas