utilitários para repositório de dados

Video: Introduction to the HP Business Data Warehouse Appliance

Conteúdo

Video: introduction to the hp business data warehouse appliance
Video: next generation data warehouse appliance webinar

Como com jeans boca de sino, bancos de dados assistida por hardware estão na trilha do retorno. Microsoft, Oracle e Netezza são toda a raiva em seminários de banco de dados em todo o mundo. Em meados da década de 1980 atrasados, fornecedores Britton Lee e Teradata (que eventualmente se fundiram) eram toda a raiva.

Eles forneceram máquinas dedicadas que otimizadas de processamento de banco de dados - as primeiras máquinas utilizadas pelos consumidores de dados pesados, incluindo muitas das empresas de bens embalados para o consumidor.

O objetivo dessas caixas era de dedicar todos os aspectos de um computador para a obtenção de dados para os usuários mais rápido. Esta máquina dedicada incluiu operações de banco de dados, memória, CPU e disco centrado no consulta. Eventualmente, esses produtos se moveu fora de moda, e os sistemas de gerenciamento de banco de dados foram migrados para uma arquitetura de gerência on-qualquer-box mais aberto.

Agora, eles estão de volta!

UMA appliance de data warehouse é um conjunto integrado de servidores, armazenamento, sistema operativo, SGBD, e software especificamente pré-instalados e pré-optimizados para armazenamento de dados. utilitários para repositório de dados fornecem soluções para o meio-de-grande volume de mercado de data warehouse, oferecendo um desempenho de baixo custo em volumes de dados no terabyte para petabytes gama (que é um monte de dados!).

Video: Next Generation Data Warehouse Appliance Webinar

A maioria dos fornecedores de aparelhos de data warehouse utilizar arquiteturas massivamente paralelo de processamento (MPP) para proporcionar um desempenho de alta consulta e escalabilidade da plataforma. arquitecturas MPP consistem de processadores independentes ou servidores que executam em paralelo.

A maioria das arquiteturas MPP implementar um arquitetura nada compartilhada, em que cada servidor é auto-suficiente e controla sua própria memória e disco. arquiteturas nada compartilhados têm um histórico comprovado em alta escalabilidade e pouco contenção.

A maioria dos utilitários para repositório de dados distribuir dados em unidades de armazenamento em disco dedicados conectados a cada servidor no aparelho. Essa distribuição permite que os aparelhos para resolver uma consulta relacional através da digitalização de dados em cada servidor em paralelo. A abordagem de dividir e conquistar oferece alto desempenho e escala linearmente quando você adicionar novos servidores à arquitetura.

E, a partir de uma perspectiva de preço, a maioria dos fornecedores nesta arena está tentando uma estratégia de plug-and-play. Por exemplo, Netezza normalmente vende um novo usuário seu produto como plug-compatível com Teradata para menos que o custo de manutenção Teradata. Este ponto de preço torna os produtos muito atraente, dando-lhes uma taxa de adoção crescente.