A implantação de análises e dados barafustante para converter dados brutos em insights
Transformando seus dados brutos em insights é o primeiro passo na progressão a partir dos dados que você coletou a algo que realmente beneficia. cientistas de dados de empresas-centric usar análise de dados
Conteúdo
Identificar os tipos de analytics
Listados abaixo, em ordem crescente de complexidade, são os quatro tipos de análise de dados você provavelmente encontro:
analytics descritivas: Este tipo de análise responde à pergunta, “O que aconteceu?” Análise descritiva são baseadas em dados históricos e atuais. Um analista de negócios ou um bases cientista de dados de inteligência de negócios moderna centrada nos negócios na análise descritiva.
análise de diagnóstico: Você usa este tipo de análise para encontrar respostas para a pergunta: “Por que esse algo especial acontecer?” Ou “o que deu errado?” Análise de diagnóstico são úteis para deduzir e inferir o sucesso ou fracasso de sub-componentes de qualquer impulsionado dados iniciativa.
Análise preditiva: Embora este tipo de análise é baseada em dados históricos e atuais, a análise preditiva ir um passo mais longe do que análises descritivas. Análise preditiva envolvem a construção de modelos complexos e análise, a fim de prever um evento ou tendência futura. Em um contexto de negócios, essas análises seriam realizadas pelo cientista de dados centrada nos negócios.
analytics prescritivas: Este tipo de análise tem como objetivo otimizar os processos, estruturas e sistemas através de uma acção informou que é baseada em análise preditiva - essencialmente dizendo o que você deve fazer com base em uma estimativa informada do que vai acontecer. Ambos os analistas de negócios e cientistas de dados centrada nos negócios pode gerar análises prescritivas, mas seus métodos e fontes de dados diferentes.
Idealmente, uma empresa deve envolver-se em todos os quatro tipos de análise de dados, mas analytics prescritivas é o meio mais direto e eficaz por que para gerar valor a partir de percepções de dados.
Identificar os desafios comuns em análise
Analytics comumente representam pelo menos dois desafios na empresa. Primeiro, as organizações muitas vezes têm um tempo muito difícil encontrar novas contratações com conjuntos de habilidades específicas que incluem analytics. Em segundo lugar, os analistas ainda qualificados, muitas vezes têm dificuldade em comunicar idéias complexas de uma forma que é compreensível para os tomadores de decisão de gestão.
Para superar estes desafios, a organização deve criar e fomentar uma cultura que valoriza e aceita produtos de análise. O negócio deve trabalhar para educar todos os níveis da organização, de modo que a gestão tem um conceito básico de análise e o sucesso que pode ser alcançado por implementá-las.
Por outro lado, os cientistas de dados centrada nos negócios deve ter um conhecimento muito sólido trabalho sobre o negócio em geral e, em particular, uma sólida compreensão do negócio na mão. Um conhecimento de negócios forte é um dos três principais requisitos de qualquer cientista de dados centrada nos negócios - os outros dois sendo uma forte perspicácia de codificação e fortes habilidades de análise quantitativa por meio de matemática e modelagem estatística.
Wrangling dados brutos para insights
disputas de dados é outra parte importante do trabalho que é necessário para converter dados para insights. Para construir análise de dados brutos, você quase sempre precisa usar disputas de dados - os processos e procedimentos que você usa para limpar e converter dados de um formato e estrutura para outro, de modo que os dados são precisos e nas ferramentas de análise de formato e scripts exigem para o consumo.
A lista a seguir destaca algumas das práticas e questões mais relevantes para disputas de dados:
Extração de dados: O cientista de dados centrada nos negócios deve primeiro identificar o que os conjuntos de dados são relevantes para o problema na mão e, em seguida, extrair uma quantidade suficiente de dados que é necessário para resolver o problema. (Este processo de extracção é comumente referido como exploração de dados.)
munging dados: munging dados envolve a limpeza dos dados brutos extraídos através da extracção de dados, em seguida, convertê-lo em um formato que permite um consumo mais convenientes dos dados. (Mung começou a vida como um processo destrutivo, onde você iria converter algo reconhecível em algo que estava irreconhecível, assim, a frase Mash Até No Good, ou MUNG.)
governança de dados: padrões de governança de dados são padrões que são usados como uma medida de controle de qualidade para garantir que as fontes de dados manuais e automatizados em conformidade com os padrões de dados do modelo em questão. padrões de governança de dados deve ser aplicado de modo que os dados estão na granularidade certo quando ele é armazenado e fez pronto para uso.
granularidade é uma medida do nível de um conjunto de dados de detalhe. granularidade de dados é determinado pelo tamanho relativo dos sub-grupos em que os dados são divididos.
Arquitetura de dados: arquitetura de TI é fundamental. Se os seus dados é isolado em repositórios separados, fixos - aqueles infame silos de dados todo mundo reclama - então ele está disponível para apenas algumas pessoas dentro de uma linha particular de negócios. estruturas de dados em silos resultar em cenários onde a maioria dos dados de uma organização é simplesmente indisponível para uso pela organização em geral. (Escusado será dizer, estruturas de dados em silos são incrivelmente desperdício e ineficiência.)
Se o seu objetivo é obter o máximo de valor e uma visão de dados de negócios da sua organização, então você deve garantir que os dados são armazenados em um data warehouse central e não em silos separados.