Mineração de dados

A característica distintiva sobre mineração de dados, em comparação com a consulta, relatórios, ou mesmo OLAP, é que você pode obter informações sem ter de fazer perguntas específicas.

mineração de dados serve dois papéis principais em sua missão de inteligência de negócios:

  • O “Diga-me o que pode acontecer” papel: O primeiro papel de mineração de dados é preditiva, em que você basicamente dizer: “Diga-me o que poderia acontecer.” Usando o conhecimento oculto trancado em seu data warehouse, probabilidades e a probabilidade de tendências e ocorrências futuras são desentocada e apresentado a você.

  • O “Diga-me algo interessante” papel: Além de possíveis eventos e ocorrências futuras, mineração de dados também tenta retirar informações interessantes que você provavelmente deve saber sobre, como uma relação particularmente incomum entre as vendas de dois produtos diferentes e como essa relação varia de acordo com a colocação em suas lojas de varejo.

    Embora muitos desses dados interessantes são susceptíveis de existir, o que perguntas que você gostaria de perguntar se você estivesse usando um consulta ou ferramenta OLAP, e como você interpretar os resultados? mineração de dados ajuda-lo nesta árdua tarefa de descobrir o que perguntas a fazer, fazendo muito do trabalho pesado para você.

mineração de dados em missões específicas de negócios

A mineração de dados é particularmente adequado para esses tipos específicos de missões empresariais:

  • fraude detectando

  • Determinar a eficácia do programa de marketing

  • A seleção de quem, a partir de uma grande base de clientes ou a população em geral, você deve direcionar como parte de um programa de marketing

    Video: Data Mining - Hitler pensa em usar Mineração de Dados

  • Gerenciando o ciclo de vida do cliente, incluindo a missão de retenção de clientes

  • Realizando avançada modelagem de processos de negócios e cenários hipotéticos

Pense sobre o que está por trás de cada uma das missões empresariais na lista anterior:

  • Uma grande quantidade de dados

  • Uma ainda maior número de combinações de vários elementos de dados

  • análise dos resultados conjunto intensivo, normalmente envolvendo complexos algoritmos e técnicas avançadas de estatística

Agora, pense no que você teria que fazer se você estivesse usando um relato ou uma ferramenta OLAP para realizar essas missões. Você acharia praticamente impossível executar completamente qualquer uma das missões anteriores se você tivesse que fazer uma pergunta e obter um resultado, fazer outra pergunta e obter outro resultado, e depois continuar a repetir esses passos.

mineração de dados e inteligência artificial



Se você já esteve no campo da tecnologia da informação (TI) durante pelo menos uma década, alguns dos termos anteriores pode soar vagamente familiar. Desbloquear conhecimento oculto? funcionalidade preditivo? Espere um minuto - que é a inteligência artificial!

Desde os primeiros dias da computação comercial, tem havido um enorme interesse no desenvolvimento de “máquinas pensantes” que podem processar grandes quantidades de dados e tomar decisões com base nessa análise.

Interesse em inteligência artificial (AI) atingiu o seu auge em meados dos anos 1980. Naquele tempo, os fornecedores de banco de dados trabalhou na produção de sistemas de gestão de base de conhecimento (KBMSs) - outros fornecedores saiu com conchas sistema de peritos, ou estruturas de desenvolvimento de aplicações baseadas em AI que usaram técnicas como forward-encadeamento e para trás-encadeamento para avisar os usuários sobre redes decisions- e neurais foram posicionados como o próximo grande desenvolvimento AI.

Interesse em AI diminuiu no início de 1990, quando as expectativas excedidas as capacidades disponíveis e outros delírios, como a migração de cliente / servidor e (é claro) data warehousing, tomou o centro do palco.

Agora, AI está de volta!

A técnica AI mais alto perfil usado em mineração de dados é redes neurais. redes neurais foram originalmente concebido como um modelo de processamento que imitam a maneira como o cérebro humano resolve problemas, usando neurônios e processamento altamente paralelo para fazer padrão de problemas.

Aplicação de algoritmos de redes neurais para as áreas de inteligência de negócios que alças de mineração de dados (mais uma vez, preditiva e “diga-me algo interessante” missões) parece ser um jogo natural.

Embora o / jogo de rede neural de mineração de dados é definitivamente vale a pena conferir em, você deve fazê-lo com cuidado. Você pode encontrar um monte de tecnologias interessantes e emocionantes que, nas mãos daqueles que não entendem os algoritmos, provavelmente vai falhar.

No entanto, com o conhecimento e educação adequada, você pode fazer um compromisso em grande escala para trazer este tipo de transformação em sua estrutura de inteligência de negócios como o emparelhamento-análise técnica para a análise de negócios focada no OLAP.

mineração de dados e estatísticas

A área mais maduro de mineração de dados é a aplicação de técnicas estatísticas avançadas contra os grandes volumes de dados em seu data warehouse. Diferentes ferramentas usam diferentes tipos de técnicas estatísticas, adaptados às áreas particulares que estão tentando resolver.

Sem uma base estatística, que você pode encontrar muito de mineração de dados confuso. Você precisa fazer um monte de trabalho para treinar os algoritmos e construir as regras para garantir resultados adequados com conjuntos de dados maiores. No entanto, supondo que você está confortável com este conceito, ou ter um colega que pode ajudar, aqui estão alguns dos algoritmos mais amplamente alavancada:

  • algoritmos de classificação: Prever uma ou mais variáveis ​​discretas, com base nos outros atributos do conjunto de dados. Usando algoritmos de classificação, a ferramenta de mineração de dados pode olhar para grandes quantidades de dados e, em seguida, informar que, por exemplo, “Os clientes que estão retidos por pelo menos duas gerações de compras de produtos tendem a ter as seguintes características: Eles têm uma renda de pelo menos US $ 75.000, e eles possuem suas próprias casas.”

  • algoritmos de regressão: Prever uma ou mais variáveis ​​contínuas, tais como lucros ou perdas, com base em outros atributos do conjunto de dados. algoritmos de regressão são conduzidos através de informação histórica apresentada para a ferramenta de mineração de dados “ao longo do tempo”, mais conhecido como séries temporais em formação.

  • algoritmos de segmentação: Divida os dados em grupos, ou clusters, de artigos que têm propriedades semelhantes.

  • algoritmos de associação: Encontrar correlações entre diferentes atributos em um conjunto de dados. A aplicação mais comum deste tipo de algoritmo cria regras de associação, que você pode usar em uma análise de cesta de mercado. Note-se que, por exemplo, se um cliente compra um pacote de software particular, ele ou ela tem uma chance de 65 por cento de compra de pelo menos dois produtos específicos add-on pacotes dentro de duas semanas.

  • algoritmos de análise de sequência: Resumir sequências frequentes ou em episódios de dados, tais como um fluxo de web-caminho.

Existem muitos mais métodos. A poeira do que o livro estatísticas de idade e começar a ler.


Publicações relacionadas