Regionservers em hbase

Video: HBase for Java Developers - CRUD operations using HBase client API

RegionServers são os processos de software (geralmente chamados daemons) activa para armazenar e recuperar dados HBase (Hadoop Banco de Dados). Em ambientes de produção, cada RegionServer é implantado em seu próprio nó de computação dedicado. Quando você começar a usar HBase, você criar uma tabela e, em seguida, começar a armazenar e recuperar seus dados.

Video: IBM Big Data - HBase Fundamentals

No entanto, em algum momento - e talvez muito rapidamente em casos grandes uso de dados - a tabela cresce além de um limite configurável. Neste ponto, o sistema HBase divide automaticamente a tabela e distribui a carga para outro RegionServer.

Nesse processo, muitas vezes referida como auto-sharding, HBase dimensiona automaticamente quando você adicionar dados para o sistema - um benefício enorme em comparação com a maioria dos sistemas de gerenciamento de banco de dados, que exigem intervenção manual para dimensionar o sistema global para além de um único servidor. Com HBase, contanto que você tem no rack outro servidor de reposição que está configurado, a escala é automático!

Video: HBase Schema Design - Things you need to know



Por que definir um limite em tabelas e, em seguida, dividi-los? Afinal, HDFS é o mecanismo de armazenamento subjacente, de modo que todos os discos disponíveis no cluster HDFS estão disponíveis para o armazenamento de suas tabelas. (Sem contar o fator de replicação, é claro.) Se você tem um cluster inteiro à sua disposição, por que limitar-se a um RegionServer para gerenciar suas tabelas?

Simples. Você pode ter qualquer número de tabelas grandes ou pequenos e você vai querer HBase para alavancar todas as RegionServers disponíveis ao gerenciar seus dados. Você quer tirar o máximo proveito de desempenho computacional do cluster. Além disso, com muitos clientes acessando o sistema HBase, você vai querer usar muitos RegionServers para atender a demanda.

Video: How HBase Works

HBase aborda todas estas preocupações para você e dimensiona automaticamente em termos de capacidade de armazenamento e poder de computação.


Publicações relacionadas