9 Leis de mineração de dados

Toda profissão tem os seus princípios orientadores, idéias que fornecem estrutura e orientação no trabalho diário. mineração de dados não é excepção. A seguir, estão nove idéias fundamentais para orientá-lo como você começar a trabalhar e se tornar um mineiro de dados. Estas são as 9 Leis de Data Mining como foram originalmente indicado pelo minerador de dados pioneiro, Thomas Khabaza.

1ª lei: Objetivos de negócio

Aqui está a primeira Lei de Mineração de Dados, ou “objetivos de negócio Lei”: Os objetivos de negócio são a origem de cada solução de mineração de dados.

Você explorar os dados para encontrar informações que o ajuda a executar o negócio melhor. Isso não deveria ser o mantra de todas as análises de dados de negócios? Claro que deve! No entanto, mineiros de dados novatos muitas vezes se concentrar em tecnologia e outros detalhes, que podem ser interessantes, mas não alinhados com as necessidades e objetivos dos decisores executivos.

Você tem que desenvolver o hábito de identificar as metas de negócios antes de fazer qualquer outra coisa, e incidindo sobre esses objetivos, a cada passo no processo de mineração de dados. É significativo que esta lei vem em primeiro lugar. Todos devem entender que a mineração de dados é um processo com um propósito.

2ª lei: Conhecimento do negócio

Aqui é a 2ª Lei de Mineração de Dados, ou “Lei Conhecimento do Negócio”: conhecimento do negócio é central para todas as etapas do processo de mineração de dados.

mineração de dados dá poder ao povo - Empresários - que usam seu conhecimento do negócio, experiência e insight, juntamente com métodos de mineração de dados, para encontrar significado em dados.

Você não tem de ser um estatístico fantasia para fazer a mineração de dados, mas você tem que saber algo sobre o significado dos dados e como o negócio funciona. Somente quando você entender os dados e o problema que você precisa para resolver os processos de mineração de dados pode ajudar você a descobrir informações úteis e colocá-lo para usar.

3ª lei: Preparação de dados

Aqui é a 3ª lei de Data Mining, ou “Lei Preparação de dados”: preparação de dados é mais do que a metade de cada processo de mineração de dados.

estatísticos tradicionais muitas vezes têm a oportunidade de coletar dados novos para abordar questões específicas de pesquisa. Eles podem usar processos rigorosos para planejar experimentos, questionários de pesquisa de pesquisa de design ou de outra forma coletar dados de alta qualidade que é bem orientados para objetivos específicos de pesquisa. No entanto, depois de tudo isso, eles ainda passam muito tempo a limpar e preparar dados para análise.

mineiros de dados, por outro lado, quase sempre tem que trabalhar com o que há dados disponíveis. Eles usam os registros existentes de negócios, dados públicos, ou os dados que podem comprar. As possibilidades são, todos esses dados foi recolhida por algum outro fim que não a mineração de dados, e sem qualquer plano rigoroso ou cuidadoso processo de coleta de dados. Então, mineiros de dados passam muito tempo na preparação de dados.

4º lei: Modelo de Direito

Aqui está o 4º Lei de Mineração de Dados, ou “NFL-DM”: O modelo certo para uma determinada aplicação só pode ser descoberto por experimento.

Esta lei também é conhecida pela abreviação NFL-DM, o que significa que não há almoço grátis para o mineiro de dados.

Em primeiro lugar, o que é um modelo? É uma equação que representa um padrão observado em dados. Pelo menos, ele representa o padrão de uma forma áspera. modelos matemáticos de coisas reais nunca são perfeitas! Este é um fato da vida, e é tão verdadeiro para os físicos nucleares, como é para os mineiros de dados.

Na mineração de dados, modelos são selecionados através de tentativa e erro. Você vai experimentar com diferentes tipos de modelo.

5ª lei: Padrão

Aqui está o 5º Lei da Data Mining: Há sempre padrões.



Como um mineiro de dados, você vai explorar os dados em busca de padrões úteis. Em outras palavras, você vai estar à procura de relações significativas entre as variáveis ​​nos dados. Compreender essas relações proporciona uma melhor compreensão do negócio, e melhores previsões do que vai acontecer no futuro. Mais importante ainda, a compreensão dos padrões nos dados permite influenciar o que vai acontecer no futuro.

Você sempre encontrar padrões. Os dados sempre tem algo para lhe dizer. Às vezes, ele confirma que o que você está fazendo é certo. Isso pode não parecer excitante, mas pelo menos ele lhe diz que você foi no caminho certo. Outros dias, os dados podem dizer-lhe que suas práticas de negócios atuais não funcionam. Isso é emocionante, e embora possa não ser agradável no curto prazo, sabendo a verdade é um passo importante para a melhoria.

6ª lei: Amplification

Aqui está o 6º Lei de Mineração de Dados, ou “Lei Insight”: mineração de dados amplifica a percepção no domínio do negócio.

métodos de mineração de dados que você possa entender o seu negócio melhor do que você poderia ter feito sem eles. métodos de mineração de dados ajudá-lo como uma lupa ou um microscópio, permitindo a descoberta de efeitos que seriam difíceis ou impossíveis de detectar por meio de relatórios comum.

mineração de dados não é instantânea.

Descoberta e aprendizagem através de mineração de dados é um processo interativo. Você vai fazer descobertas, descobrir um pouco de cada um deles, e usar o que você descobriu a agir. Os resultados de cada ação que tentam irá produzir mais dados, e que os dados permite que você entenda algo mais. É um ciclo de descoberta, eo ciclo continua, enquanto você continuar a explorar e experimentar.

7ª lei: Prediction

Aqui está o 7º Lei de Mineração de Dados, ou “Lei Prediction”: Previsão aumenta informações localmente pela generalização.

mineração de dados ajuda você a usar o que você sabe fazer melhores previsões (ou estimativas) de coisas que você não conhece. mineração de dados usa dados e métodos de modelagem para substituir suas expectativas informais com, estimativas consistentes e mais precisas orientadas a dados.

8ª lei: Valor

Aqui está a 8ª Lei de Mineração de Dados, ou “Lei Valor”: O valor dos resultados de extracção de dados não é determinada pela precisão ou estabilidade de modelos preditivos.

mineiros de dados não espalhafato sobre a teoria. Como um mineiro de dados, você pode nunca saber a teoria por trás das modelos estatísticos que você usa. Talvez isso é tão bem, porque em mineração de dados, você está indo para usar esses modelos de formas que não necessariamente se alinham com a teoria por trás deles.

Você vai olhar para os modelos que produzem previsões corretas (e você vai usar o teste, em vez de teoria estatística, a julgar isso). Mas você pode estar mais preocupado com outras questões, como se o modelo faz sentido para os negócios, ilumina-lo sobre fatores preditivos inesperados ou é prático para usar em seu local de trabalho.

9 Lei: Mudança

Aqui é a 9ª Lei de Mineração de Dados, ou “Lei de Mudança”: Todos os padrões estão sujeitos a alterações.

O mundo está sempre mudando. O modelo que lhe dá grandes previsões hoje pode ser amanhã inútil. Este é um fato da vida para todos os analistas de dados, e não apenas os mineiros de dados.


Publicações relacionadas