Bases de dados colunar em um ambiente de dados grande

bases de dados colunar pode ser muito útil em seu projeto de dados grande. Bancos de dados relacionais são linha orientada

, como os dados em cada linha de uma tabela é armazenada em conjunto. Numa colunar, ou base de dados orientado por colunas, os dados são armazenados através linhas. Embora isso possa parecer uma distinção trivial, é a característica subjacente mais importante de bancos de dados colunar.

É muito fácil adicionar colunas, e eles podem ser adicionados linha por linha, oferecendo grande flexibilidade, desempenho e escalabilidade. Quando você tem volume e variedade de dados, você pode querer usar um banco de dados colunar. É muito adaptable- você simplesmente continuar a adicionar colunas.

Uma das bases de dados colunar mais populares é HBase. É, também, é um projeto no Apache Software Foundation distribuído sob a v2.0 Apache Software License. HBase usa o sistema de arquivos Hadoop e motor de MapReduce para suas necessidades de armazenamento de dados núcleo.

O design do HBase é modelado em BigTable do Google. Portanto, implementações de HBase são altamente escaláveis, escasso, distribuídos, persistentes multidimensionais mapas ordenadas. O mapa é indexado por uma chave de linha, de coluna de chave, e um timestamp- cada valor no mapa é uma matriz não interpretado de bytes.

Quando a implementação de dados grande requer aleatório, acesso em tempo real dados de leitura / gravação, HBase é uma solução muito boa. Ele é frequentemente usado para armazenar resultados para processamento analítico mais tarde.

Video: Base de Dados para Planejamento Ambiental e Rural

Características importantes do HBase incluem o seguinte:

  • Consistência: Apesar de não ser uma implementação “ACID”, HBase oferece fortemente consistente lê e escreve e não se baseia em um modelo, eventualmente consistente. Isto significa que você pode usá-lo para os requisitos de alta velocidade, desde que você não precisa os “recursos extras” oferecidos pelo RDBMS como suporte a transações completo ou colunas digitados.



  • sharding: Porque os dados são distribuídos pelo sistema de arquivos de suporte, HBase oferece, divisão automática transparente e redistribuição de seu conteúdo.

  • Alta disponibilidade: Através da implementação de servidores região, HBase suporta LAN e WAN failover e recuperação. No centro, há um servidor principal responsável por monitorar os servidores região e todos os metadados para o cluster.

  • API Cliente: HBase oferece acesso programático através de uma API Java.

  • Suporte para operações de TI: Implementadores pode expor o desempenho e outras métricas através de um conjunto de páginas web embutidas.

Video: Banco de Dados - Aula 1 - Parte 1

implementações HBase são mais adequados para

  • De alto volume, recolha de dados e processamento de incremento

  • troca de informações em tempo real (por exemplo, mensagens)

  • mudam frequentemente servir conteúdo

    Video: Curso MySQL #16 - INNER JOIN com várias tabelas


Publicações relacionadas