Os deveres de um trabalho de codificação de análise de dados

Video: Talk #36 - Análise de dados e aumento da produtividade

analistas de dados filtrarem grandes volumes de dados, à procura de insights que ajudam a conduzir o produto ou negócio para a frente. Este papel de codificação se casa com programação e as estatísticas na busca de padrões nos dados. Exemplos populares de análise de dados em ação incluem os motores de recomendação usados ​​por Amazon para fazer sugestões de produtos para usuários com base em compras anteriores e pela Netflix para fazer sugestões de filmes baseados em filmes assistidos.

primeiro desafio do analista de dados é simplesmente importar, limpeza e processamento dos dados. Um site pode gerar milhões de entradas de dados de dados dos usuários por dia, exigindo o uso de técnicas complicadas, referido como aprendizado de máquina, para criar classificações e previsões a partir dos dados.

Por exemplo, metade de um bilhão de mensagens são enviadas por dia usando Twitter- alguns fundos de hedge analisar esses dados e classificar se uma pessoa falando de um estoque está expressando um sentimento positivo ou negativo. Esses sentimentos são depois agregadas para ver se uma empresa tem uma opinião pública positiva ou negativa antes das compras de fundos de hedge ou vender todo o estoque.

Video: CODIFICAÇÃO Atlas.ti - Software para Análise Qualitativa



Qualquer linguagem de programação pode ser usado para analisar os dados, mas as linguagens de programação mais populares usados ​​para a tarefa são R, Python, e SQL. código publicamente compartilhada nestas três línguas faz com que seja mais fácil para os indivíduos que entram no campo para construir sobre o trabalho de outra pessoa. Enquanto trituração dos dados é importante, os empregadores também olhar para os analistas de dados com habilidades no seguinte:

  • Visualização: Tão importante quanto encontrar percepção nos dados é comunicar essa visão. visualização de dados usa tabelas, gráficos, dashboards, infográficos e mapas, que podem ser interativo, para exibir dados e reduzir a complexidade de tal forma que uma ou duas conclusões parecem óbvias. Comuns ferramentas de visualização de dados incluem D3.js, uma biblioteca gráfica javascript, e ArcGIS para dados geográficos.

    Os dois Manhattan aborda mais distante da Starbucks.
    Os dois Manhattan aborda mais distante da Starbucks.
  • armazenamento e processamento distribuído: Processamento de grandes quantidades de dados em um computador pode ser demorada. Uma opção é a compra de um único computador mais rápido. Outra opção, chamada armazenamento e pr distribuídoocessamento, é a compra de várias máquinas e dividir o trabalho. Por exemplo, imagine que você deseja contar o número de pessoas que vivem em Manhattan. No armazenamento distribuído e abordagem de processamento, você pode tocar casas ímpares, alguém tocava casas de número par, e quando todo mundo termina você somar as contagens.

analistas de dados trabalhar com desenvolvedores de back-end para reunir os dados necessários para o seu trabalho. Depois que os analistas de dados tiraram conclusões a partir dos dados, e avançar com ideias sobre como melhorar o produto existente, eles se encontram com toda a equipe para ajudar a conceber protótipos para testar as ideias sobre os clientes existentes.


Publicações relacionadas