O que é a ciência de dados centrada nos negócios?
Dentro da empresa, a ciência de dados tem a mesma finalidade que a inteligência de negócios faz - para converter dados brutos em insights de negócios que os líderes empresariais e gestores podem usar para tomar decisões informadas por dados.
Conteúdo
Se você tem grandes conjuntos de fontes de dados estruturados e não estruturados, que pode ou não ser completa e você deseja converter essas fontes em informações valiosas para apoio à decisão em toda a empresa, chamada em um cientista de dados. ciência dados de negócio-centric é multi-disciplinar e incorpora os seguintes elementos:
Análise quantitativa: Pode ser na forma de modelagem matemática, análise estatística multivariada, previsão e / ou simulações.
O termo multivariada refere-se a mais do que uma variável. Uma análise estatística multivariada é uma análise estatística simultânea de mais do que uma variável de cada vez.
habilidades de programação: Você precisa das habilidades de programação necessárias para tanto analisar dados brutos e tornar esses dados acessíveis aos usuários de negócios.
Conhecimento do negócio: Você precisa de conhecimento do negócio e seu ambiente para que você possa entender melhor a relevância de suas descobertas.
ciência de dados é uma disciplina pioneiro. cientistas de dados muitas vezes empregam o método científico para a exploração de dados, as hipóteses de formação e testes de hipóteses (por meio de simulação e modelagem estatística). cientistas de dados de empresas centradas gerar informações valiosas de dados, muitas vezes, explorando padrões e anomalias nos dados de negócios. ciência dados em um contexto de negócios é comumente composta de
conjuntos de dados internos e externos: ciência de dados é flexível. Você pode criar dados corporativos mash-ups a partir de fontes internas e externas de dados estruturados e não estruturados com bastante facilidade. (UMA dados mash-up é uma combinação de duas ou mais fontes de dados que são então analisadas em conjunto, a fim de fornecer aos utilizadores uma vista mais completa da situação em causa.)
Ferramentas, tecnologias e conjuntos de habilidades: Exemplos aqui poderia envolver o uso de plataformas baseadas em nuvem, programação estatística e matemática, aprendizagem de máquina, de análise de dados usando Python e R, e visualização de dados avançados.
Como analistas de negócios, cientistas de dados de negócios centrada produzir produtos de apoio à decisão para os gerentes de negócios e líderes organizacionais para usar. Estes produtos incluem analytics dashboards e visualizações de dados, mas relatórios de dados geralmente não tabulares e mesas.
Dados úteis na ciência de dados centrada nos negócios
Você pode usar a ciência de dados para derivar insights de negócios a partir de conjuntos de tamanho padrão de dados de negócios estruturados (assim como BI) ou de conjuntos estruturados, semi-estruturados e não estruturados de dados grandes. soluções de ciência de dados não se limitam aos dados transacional que fica em um relacional database- você pode usar a ciência de dados para criar informações valiosas de todas as fontes de dados disponíveis. Estas fontes de dados incluem
dados de negócios transacional: Uma fonte de dados tentou-e-verdadeiro, os dados de negócios transacional é o tipo de dados estruturados usados na tradicional BI e inclui dados de gestão, dados de atendimento ao cliente, vendas e dados de marketing, dados operacionais e dados de desempenho do empregado.
Video: Seminário Ciência de Dados e Sociedade: conhecimento na interface universidade e mercado
dados sociais relacionados com a marca ou empresa: Um fenômeno mais recente, os dados abrangidos pelo presente rubrica inclui os dados não estruturados gerados através de e-mails, mensagens instantâneas e redes sociais como Twitter, Facebook, LinkedIn, Pinterest e Instagram.
Máquina de dados de operações de negócios: Máquinas gerar automaticamente estes dados não estruturados, como dados do SCADA, dados da máquina, ou dados do sensor.
A sigla SCADA refere-se a Supervisory Control e Data UMAQUISIÇÃO. sistemas SCADA são usados para controlar sistemas mecânicos remotamente e equipamentos que operam. Eles geram dados que são usados para monitorar as operações de máquinas e equipamentos.
Áudio, vídeo, imagem e arquivos PDF dados: Esses formatos bem estabelecidas são todas as fontes de dados não estruturados.
Tecnologias e de habilidades úteis na ciência de dados centrada nos negócios
Uma vez que os produtos da ciência de dados muitas vezes são gerados a partir de dados grandes, soluções de plataforma de dados baseado em nuvem são comuns no campo. Os dados que é usado na ciência de dados é muitas vezes derivada de soluções de dados grandes de engenharia de dados, como Hadoop, MapReduce e processamento paralelo.
cientistas de dados são inovadores, com visão de pensadores que muitas vezes deve pensar fora-the-box, a fim de exigir soluções para os problemas que resolvem. Muitos cientistas de dados tendem para soluções de código aberto, quando disponíveis. A partir de uma perspectiva de custo, esta abordagem beneficia as organizações que empregam esses cientistas.
cientistas de dados de empresas centradas pode usar técnicas de aprendizado de máquina para encontrar padrões em (e obter insights de) grandes conjuntos de dados que estão relacionados com uma linha de negócios ou o negócio em geral. Eles são qualificados em matemática, estatística e programação, e eles, por vezes, usar essas habilidades para gerar modelos preditivos.
Eles geralmente sabem como programar em Python ou R. A maioria deles sabe como usar SQL para consultar dados relevantes de bancos de dados estruturados. Eles são geralmente qualificados em comunicar idéias de dados para os usuários finais - na ciência de dados centrada nos negócios, os usuários finais são gerentes de negócios e líderes organizacionais. cientistas de dados deve ser hábil em usar meios verbais, orais e visuais para comunicar idéias de dados valiosos.
Embora os cientistas de dados de negócios centrada desempenhar um papel de apoio à decisão na empresa, eles são diferentes do analista de negócio em que eles geralmente têm fortes formações acadêmicas e profissionais em matemática, ciência, engenharia, ou todas as anteriores. Dito isto, os cientistas de dados centrada nos negócios também têm um forte conhecimento substantivo da gestão empresarial.