Vendo o que você precisa saber quando começar na ciência de dados
Tradicionalmente, big Data
Conteúdo
Volume: Entre 1 terabytes / ano e 10 petabytes / ano
Video: Introdução a Ciência de Dados: Comentários sobre o Livro
Velocidade: Entre 30 kilobytes / segundo e 30 gigabytes / segundo
Variedade: fontes combinadas de dados não estruturados, semi-estruturado, e estruturado
ciência de dados e engenharia de dados não são os mesmos
Os gerentes de contratação tendem a confundir os papéis do cientista de dados e engenheiro de dados. Embora seja possível encontrar alguém que faz um pouco de ambos, cada campo é incrivelmente complexa. É improvável que você vai encontrar alguém com habilidades robustos e experiência em ambas as áreas. Por esta razão, é importante ser capaz de identificar que tipo de especialista é mais apropriado para ajudar você a atingir seus objetivos específicos. As descrições abaixo devem ajudá-lo a fazer isso.
cientistas de dados: cientistas de dados usam codificação, métodos quantitativos (matemática, estatística e aprendizagem de máquina), e conhecimentos altamente especializados em sua área de estudo para derivar soluções para negócios complexos e problemas científicos.
engenheiros de dados: engenheiros de dados usar suas habilidades em ciência da computação e engenharia de software para projetar sistemas para e resolver problemas com, manusear e manipular grandes conjuntos de dados.
ciência de dados e inteligência de negócios também não são os mesmos
cientistas de dados de empresas-centric e analistas de negócios que fazem inteligência de negócios são como primos. Ambos os tipos de dados sobre o uso de especialista para alcançar os mesmos objetivos de negócio, mas as suas abordagens, tecnologias e funções são diferentes. As descrições abaixo esclarecer as diferenças entre os dois papéis.
inteligência de negócios (BI): As soluções de BI são geralmente construídos utilizando conjuntos de dados gerados internamente - de dentro de uma organização, em vez do que de fora, em outras palavras. ferramentas e tecnologias comuns incluem processamento analítico online, transformar o extrato e carga e armazenamento de dados. Apesar de BI às vezes envolve o futuro métodos como previsão, estes métodos são baseados em inferências matemáticas simples a partir de dados históricos ou atuais.
ciência dados de negócios centrada: soluções de ciências dados de negócios centrados são construídos utilizando conjuntos de dados que são tanto internos como externos para uma organização. ferramentas comuns, tecnologias e de habilidades incluem plataformas de análise baseados em nuvem, programação estatística e matemática, aprendizagem de máquina, análise de dados usando Python e R, e visualização de dados avançados. cientistas de dados de empresas-centric usar métodos matemáticos ou estatísticos avançados para analisar e gerar previsões de grandes quantidades de dados de negócios.