Requisitos de hardware para hbase
HBase é uma tecnologia poderosa e flexível, mas que acompanha esta flexibilidade é o requisito para a configuração adequada e tuning. isto&tempo rsquo-s algumas orientações gerais para a configuração de aglomerados HBase. Seu &ldquo-quilometragem&rdquo- pode variar, dependendo dos requisitos específicos de computação para seus RegionServers (co-processadores personalizados, por exemplo) e outras aplicações que você pode escolher para co-localizar em seu cluster.
Conteúdo
RegionServers
A primeira tentação de resistir ao configurar suas RegionServers é desembolsar muito dinheiro para alguns sistemas corporativos de alto nível. dom&rsquo-t fazê-lo! HBase é normalmente implantado em servidores de commodities x86 plain vanilla.
Agora, não tome essa declaração como licença para implantar os servidores, mais barato de baixa qualidade. Sim, HBase é projetado para se recuperar de falhas de nós, mas a sua disponibilidade sofre durante os períodos de recuperação para qualidade de hardware e redundância Faz importam.
fontes de alimentação redundantes, bem como cartões de interface de rede redundantes são uma boa idéia para implantações de produção. Normalmente, as organizações escolher duas máquinas de soquete com quatro a seis núcleos cada.
A segunda tentação de resistir é configurar o servidor com o máximo de armazenamento e capacidade de memória. Uma configuração comum iria incluir de 6 a 12 terabytes (TB) de espaço de disco e de 48 a 96 gigabytes (GB) de RAM. controladores RAID para os discos são desnecessários porque HDFS fornece proteção de dados quando os discos falham.
HBase requer um cache de leitura e gravação que&rsquo-s alocados a partir do heap Java. Manter esta declaração em mente enquanto você lê sobre as variáveis de configuração HBase porque você&rsquo-ll ver que existe uma relação directa entre uma RegionServer&rsquo-s a capacidade do disco e um RegionServer&rsquo-s heap Java. Confira uma excelente discussão sobre dimensionamento de memória HBase RegionServer.
Video: Inmigración: ¿Cuáles documentos puedo utilizar para tramitar una visa de turista?
O artigo aponta que você pode estimar a proporção de espaço em disco cru para heap Java, seguindo esta fórmula:
RegionSize dividido por Memstoresize multiplicado por Fator de replicação HDFS multiplicado por HeapFractionForMemstores
Usando as variáveis de configuração HBase padrão fornece essa relação:
10GB / 128MB * 3 * 0.4 = Relação de espaço em disco 96MB: 1 MB Java heap space.
A linha anterior equivale a 3 TB de capacidade de disco bruto per RegionServer com 32GB de RAM alocada para o heap Java.
O que você acabar com, então, é de 1 terabyte de espaço utilizável por RegionServer uma vez que o fator de replicação HDFS padrão é 3. Este número ainda é impressionante em termos de armazenamento de banco de dados por nó, mas não tão impressionante dado que os servidores de commodities geralmente pode acomodar oito ou mais unidades com uma capacidade de 2 a 4 terabyte um pedaço.
O problema abrangente como esta escrito é o fato de que os atuais Java Virtual Machines (JVMs) luta para fornecer gerenciamento eficiente de memória (coleta de lixo, para ser preciso) com espaços heap grandes (espaços maiores do que 32 GB, por exemplo).
Sim, há lixo parâmetros coleção de ajuste você pode usar, e você deve verificar com o seu fornecedor JVM para garantir que você tenha as últimas opções, mas você ganhou&rsquo-t ser capaz de chegar muito longe de usá-los neste momento.
Video: Cómo se Hace una Hoja de Vida
O problema de gerenciamento de memória acabará por ser resolvido, mas por agora estar ciente de que você pode encontrar um problema se os seus requisitos de armazenamento HBase estão na faixa de centenas de terabytes para mais de um petabyte. Você pode facilmente aumentar para 20 GB para chegar 6TB cru e 2TB utilizável.
Você pode fazer outros ajustes (reduzindo o tamanho MemStore para cargas de trabalho pesadas ler, por exemplo), mas você ganhou&rsquo-t fazer encomendas de saltos de magnitude no espaço utilizável até que tenhamos um JVM que eficientemente lida com a coleta de lixo com montes maciças.
Você pode encontrar maneiras de contornar a questão recolha de lixo da JVM para RegionServers mas as soluções são novos e ainda não fazem parte da distribuição principal HBase como esta escrito.
servidores mestres
faz o MasterServer não consomem recursos do sistema, como os RegionServers fazer. No entanto, você deve fornecer para redundância de hardware, incluindo RAID para evitar a falha do sistema. Para a boa medida, também configurar um MasterServer backup para o cluster. Uma configuração comum é de 4 núcleos de CPU, entre 8GB e 16GB de RAM e 1 Gigabit Ethernet é uma configuração comum. Se você co-localizar MasterServers e nós Zookeeper, 16GB de RAM é aconselhável.
Zelador do zológico
Como o MasterServer, Zookeeper doesn&rsquo-t requerem uma configuração de hardware grande, mas Zookeeper não deve bloquear (ou ser obrigado a competir por) recursos do sistema. Zookeeper, que é o serviço de coordenação para um cluster HBase, senta-se no caminho de dados para os clientes. Se Zookeeper não pode fazer o seu trabalho, time-outs irá ocorrer - e os resultados podem ser catastróficos.
requisitos de hardware Zookeeper são as mesmas que para o MasterServer exceto que deve ser fornecido um disco dedicado para o processo. Para pequenos grupos pode co-localizar Zookeeper com o servidor mestre, mas lembre-se que Zookeeper precisa de recursos de sistema suficientes para executar quando estiver pronto.