A sua empresa tem estruturas de dados existentes?

Sua organização tem chances esmagadoramente favoráveis ​​de ter pelo menos um espécie de armazém de dados

- um sistema de comunicação que fornece capacidades de informação e, às vezes, capacidades analíticas para um ou mais grupos de usuários.

Video: Estrutura de Dados - Aula 15 - Árvores - Conceitos básicos

O que é um arquivo de extração?

Seus usuários provavelmente usam o termo Extrair arquivo para descrever este tipo de ambiente, porque é povoada por extratos de dados de sistemas de produção, em vez de por usuários de ser forçado a executar suas consultas ou receber os seus relatórios a partir dos bancos de dados operacionais de produção ou arquivos. Ainda interessado em jogar as probabilidades? Aqui estão mais alguns exemplos de tipos de ambientes de dados que podem ser descritas como espécie de armazéns de dados:

  • Embora os dados extraídos são quase sempre alojados em um único arquivo ou banco de dados, um processo de mesclagem provavelmente combina extraíram os dados de mais de uma fonte da aplicação.

  • Apenas elementos, nem todos os elementos de todas as tabelas ou arquivos, a partir de cada fonte de dados geralmente são extraídos e copiados para o arquivo de extração selecionado.

    Video: Estrutura de Dados - Aula 2 - Criação de uma primeira estrutura

  • Algum tipo de processo de garantia de qualidade de dados é geralmente vai em cada passo do caminho, a partir do extrato inicial para carregar os dados no arquivo de extração.

  • Alguns usuários avançados provavelmente pode executar consultas ou criar programas estatísticos (em SAS ou SPSS, por exemplo) contra os dados, mas muitos usuários não são susceptíveis de tocar os dados diretamente. Em vez disso, eles provavelmente recebem regularmente relatórios gerados automaticamente ou em resposta a seus pedidos.

Claro que soa como um armazém de dados, não é? A realidade é que estas espécie de dados armazéns são normalmente servindo uma população muito pequena e não são feitas de uma maneira padrão para suportar as necessidades mais amplas da empresa. Você também pode chamá-los wanna-be data warehouses.

Aqui está a dicotomia da maioria das organizações o acesso aos dados:



  • A análise dos dados “não têm”: Organizações e indivíduos que têm poucos (e mais provável não) capacidades para fazer o tipo de análise que pode trazer-driven informações de tomada de decisão

  • A análise dos dados “ricos”: Organizações e indivíduos que podem não ter um armazém de dados instalado e funcionando, mas está fazendo algo com dados que eles estão recebendo a partir de algum lugar. Em muitos casos, ele está adequando suas necessidades de negócios muito bem.

Por que não são extrair arquivos considerados armazéns de dados?

Eles são, mais ou menos. Extrair arquivos, se nos anos 1970, 1980, 1990, ou ainda em uso hoje, existem pelas mesmas razões básicas que um data warehouse de pleno direito ou um data mart faz: para fornecer entrega de informação, apesar de uma série de barreiras, como difícil -para entender estruturas de dados, “não toque o sistema de produção” regras, ea falta de multi-arquivo ou referência cruzada multi-banco de dados.

Alguns proponentes de armazenamento de dados argumentam que a combinação e reconfigurando os dados simplesmente com a finalidade de geração de relatórios ou para realizar a análise estatística não é um armazém de dados, no sentido moderno do termo. Extrair arquivos não estão equipados com capacidades multidimensionais ou business-análise, como drill-down e giro de dados.

Se você separar o lado de data warehouse (o que é preciso para reunir, mover e reconfigurar os dados de uma ou mais fontes) do lado de business-intelligence (o que você faz com os dados depois de tê-lo disponível), a imagem torna-se muito mais clara.

Video: Estrutura de dados - Pilhas, Filas e Deck

Extrair arquivos, ou o que você quiser chamá-los, são uma parte muito importante da filosofia de quebra de barreira de um armazém de dados. Muitos dos que os usuários se referem como “extrair arquivos” são sistemas baseados em arquivos (em vez de construído sobre bases de dados), e eles provavelmente não são flexíveis o suficiente para suportar consultas ad hoc e análise dimensional. Em um sentido real, no entanto, esses ambientes servir o propósito de data warehousing para uso posterior.

Para muitos usuários, recursos de business-análise, como drill-down e giro de dados, têm pouco ou nenhum uso - pelo menos, não no contexto de suas definições de trabalho atuais. postos de trabalho dos usuários chamar para a funcionalidade que esses arquivos extrato pode entregar, bem como os relatórios estáticos e análise estatística realizada com esses dados.

A moral da história: Não vá para uma organização que utiliza eficazmente os dados através de arquivos extrair e expor sobre as maravilhas de armazenamento de dados. Em vez disso, ser cauteloso sobre propor qualquer solução de armazenamento de dados que pode ser visto como um passo para trás. Se você fizer esse tipo de proposição, você está em um passeio longo, acidentado.


Publicações relacionadas