Vendo o que você precisa saber quando começar na ciência de dados

Tradicionalmente, big Data

é o termo para dados que tem incrível volume, velocidade e variedade. tecnologias de banco de dados tradicionais não são capazes de lidar com grandes dados - soluções de engenharia de dados mais inovadoras são necessárias. Para avaliar o seu projeto para saber se ela se qualifica como um projeto de dados grande, considerar os seguintes critérios:

  • Volume: Entre 1 terabytes / ano e 10 petabytes / ano

    Video: Introdução a Ciência de Dados: Comentários sobre o Livro

  • Velocidade: Entre 30 kilobytes / segundo e 30 gigabytes / segundo

  • Variedade: fontes combinadas de dados não estruturados, semi-estruturado, e estruturado

ciência de dados e engenharia de dados não são os mesmos

Os gerentes de contratação tendem a confundir os papéis do cientista de dados e engenheiro de dados. Embora seja possível encontrar alguém que faz um pouco de ambos, cada campo é incrivelmente complexa. É improvável que você vai encontrar alguém com habilidades robustos e experiência em ambas as áreas. Por esta razão, é importante ser capaz de identificar que tipo de especialista é mais apropriado para ajudar você a atingir seus objetivos específicos. As descrições abaixo devem ajudá-lo a fazer isso.



  • cientistas de dados: cientistas de dados usam codificação, métodos quantitativos (matemática, estatística e aprendizagem de máquina), e conhecimentos altamente especializados em sua área de estudo para derivar soluções para negócios complexos e problemas científicos.

  • engenheiros de dados: engenheiros de dados usar suas habilidades em ciência da computação e engenharia de software para projetar sistemas para e resolver problemas com, manusear e manipular grandes conjuntos de dados.

ciência de dados e inteligência de negócios também não são os mesmos

cientistas de dados de empresas-centric e analistas de negócios que fazem inteligência de negócios são como primos. Ambos os tipos de dados sobre o uso de especialista para alcançar os mesmos objetivos de negócio, mas as suas abordagens, tecnologias e funções são diferentes. As descrições abaixo esclarecer as diferenças entre os dois papéis.

  • inteligência de negócios (BI): As soluções de BI são geralmente construídos utilizando conjuntos de dados gerados internamente - de dentro de uma organização, em vez do que de fora, em outras palavras. ferramentas e tecnologias comuns incluem processamento analítico online, transformar o extrato e carga e armazenamento de dados. Apesar de BI às vezes envolve o futuro métodos como previsão, estes métodos são baseados em inferências matemáticas simples a partir de dados históricos ou atuais.

  • ciência dados de negócios centrada: soluções de ciências dados de negócios centrados são construídos utilizando conjuntos de dados que são tanto internos como externos para uma organização. ferramentas comuns, tecnologias e de habilidades incluem plataformas de análise baseados em nuvem, programação estatística e matemática, aprendizagem de máquina, análise de dados usando Python e R, e visualização de dados avançados. cientistas de dados de empresas-centric usar métodos matemáticos ou estatísticos avançados para analisar e gerar previsões de grandes quantidades de dados de negócios.


Publicações relacionadas