Fase 1 do modelo de processo crisp-dm: entendimento do negócio

o Cross-Industry processo padrão para Data Mining

(CRISP-DM) É a estrutura de processo dominante para mineração de dados. Na primeira fase de um projeto de mineração de dados, antes de se aproximar de dados ou ferramentas, você define o que você está fora de realizar e definir as razões para querer atingir esse objetivo.

A fase de entendimento do negócio inclui quatro tarefas (Actividades primárias, cada um dos quais pode envolver várias partes menores).

Tarefa: Identificar seus objetivos de negócio

A primeira coisa que você deve fazer em qualquer projeto é descobrir exatamente o que você está tentando realizar! Isso é menos óbvia do que parece. Muitos mineiros de dados têm investido tempo na análise de dados, apenas para descobrir que sua gestão não estava particularmente interessado na questão que está investigando. Você deve começar com uma compreensão clara do

  • Um problema que sua administração quer resolver

    Video: Data Mining Process and CRISP DM - Cognitir

  • Os objetivos de negócio

  • Restrições (limitações sobre o que você pode fazer, os tipos de soluções que podem ser usados, quando o trabalho deve ser concluído, e assim por diante)

  • De impacto (como o problema e as possíveis soluções encaixar com o negócio)

Entregas para esta tarefa incluem três itens (geralmente breves relatórios enfocando apenas os pontos principais):

Video: Meta S. Brown (Keynote): CRISP-DM; The dominant process for data mining

  • Fundo: Explicar a situação de negócio que conduz o projeto. Este item, como muitos que se seguem, ser de apenas alguns parágrafos.

  • objetivos de negócio: Definir o que sua organização pretende realizar com o projeto. Isso geralmente é um objetivo mais amplo do que você, como um mineiro de dados, pode realizar de forma independente. Por exemplo, o objetivo de negócio poderia ser a de aumentar as vendas de uma campanha publicitária de férias em 10 por cento ano a ano.

  • critérios de sucesso empresarial: Definir como os resultados serão medidos. Tentar obter critérios de sucesso quantitativos claramente definidos. Se você deve usar critérios subjetivos (dica: termos como ter uma visão ou obter uma alça sobre implica critérios subjetivos), pelo menos, obter um acordo sobre exatamente quem vai julgar ou não esses critérios foram cumpridos.

Tarefa: Avaliando sua situação

Isto é onde você entrar em mais detalhes sobre os problemas associados com os seus objetivos de negócio. Agora você vai aprofundar de averiguação, construindo uma explicação muito mais carnudas das questões delineadas na tarefa objetivos de negócio.

Entregas para esta tarefa incluem cinco relatórios detalhados:



Inventário dos recursos: Uma lista de todos os recursos disponíveis para o projeto. Estes podem incluir pessoas (mineiros não apenas dados, mas também aqueles com conhecimento especializado do problema de negócio, gerentes de dados, suporte técnico e outros), dados, hardware e software.

  • Requisitos, premissas e restrições: Requisitos incluirá um calendário para a conclusão, obrigações legais e de segurança e os requisitos para o trabalho acabado aceitável. Este é o ponto para verificar que você terá acesso a dados apropriados!

  • Riscos e contingências: Identificar as causas que poderiam atrasar a conclusão do projeto, e preparar um plano de contingência para cada um deles. Por exemplo, se uma interrupção de Internet em seu escritório poderia representar um problema, talvez o seu contingência poderia ser para trabalhar em outro cargo até a interrupção acabou.

    Video: ISM6136 - Chandley - Final Presentation

  • Terminologia: Criar uma lista de termos de negócios e termos de mineração de dados que são relevantes para o seu projeto e anotá-las em um glossário com definições (e talvez exemplos), de modo que todos os envolvidos no projeto pode ter um entendimento comum desses termos.

  • Custos e benefícios: Prepare uma análise custo-benefício para o projeto. Tente declarar todos os custos e benefícios em dólar (euro, libra, iene, e assim por diante) termos. Se os benefícios não excedem significativamente os custos, parar e reconsiderar esta análise e seu projeto.

  • Os tomadores de decisão muitas vezes se sentem recursos atribuindo mais confortáveis ​​para projetos que reduzam os custos do que aquelas que visam aumentar a receita, por isso sempre olhar para o potencial de redução de custos e oportunidades de poupança do Estado pela primeira vez em sua custos e benefícios relatório.

    Tarefa: Definir suas metas de mineração de dados

    Alcançar a meta negócio exige muitas vezes a ação de muitas pessoas, não apenas o mineiro de dados. Então, agora, você deve definir a sua pequena parte dentro do quadro maior. Se o objetivo do negócio é reduzir o atrito do cliente, por exemplo, suas metas de mineração de dados pode ser identificar as taxas de desgaste para diversos segmentos de clientes, e desenvolver modelos para prever quais clientes estão em maior risco.

    Entregas para esta tarefa incluem dois relatórios:

    • metas de mineração de dados: Definir resultados de mineração de dados, tais como modelos, relatórios, apresentações e bancos de dados processados.

    • critérios de sucesso de mineração de dados: Definir os critérios técnicos de mineração de dados necessários para suportar os critérios de sucesso empresarial. Tentar definir isso em termos quantitativos (tais como a precisão do modelo ou melhoria preditivo em relação a um método existente). Se os critérios devem ser qualitativa, identificar a pessoa que faz a avaliação.

    Video: José Supo - Metodología CRISP-DM y la Investigación Científica

    Tarefa: Produzir seu plano de projeto

    Agora você especificar cada passo que você, o mineiro de dados, pretende levar até que o projeto está concluído e os resultados são apresentados e analisados.

    Entregas para esta tarefa incluem dois relatórios:

    • Plano de projeto: Delinear o seu plano de acção passo-a-passo para o projeto. Expandir o contorno com um calendário para a conclusão de cada etapa, os recursos necessários, insumos (tais como dados ou uma reunião com um especialista no assunto), e saídas (como dados limpos, um modelo ou um relatório) para cada passo, e dependências (etapas que não pode começar até que essa etapa for concluída). Explicitamente indicar que certas etapas devem ser repetidos (por exemplo, modelação e avaliação geralmente exigem várias repetições de vai-e-vem).

    • A avaliação inicial de ferramentas e técnicas: Identificar as capacidades necessárias para cumprir seus objetivos de mineração de dados e avaliar as ferramentas e recursos que você tem. Se algo está faltando, você tem que lidar com essa preocupação muito no início do processo.


    Publicações relacionadas