Famílias de colunas no modelo de dados hbase

Nos dados HBase colunas do modelo são agrupados em famílias de colunas

, que deve ser definido na frente durante a criação da tabela. famílias de colunas são armazenados juntos no disco, e é por isso HBase é referido como um armazenamento de dados orientado a coluna.

Visão Lógica de Informação ao Cliente Fale em HBase
Row KeyColuna Família: {coluna Qualifier: Versão: Valor}
00001Nome do cliente: {&lsquo-FN&rsquo-:
1383859182496:&lsquo-John&rsquo-,
&lsquo-LN&rsquo-: 1383859182858:&lsquo-Smith&rsquo-,
&lsquo-MN&rsquo-: 1383859183001:&rsquo-Timothy&rsquo-,
&lsquo-MN&rsquo-: 1383859182915:&rsquo-T&rsquo-}
ContactInfo: {&lsquo-EA&rsquo-:
1383859183030:[email protected]&rsquo-,
&rsquo-SA&rsquo-: 1383859183073:&rsquo-1 Hadoop Lane, NY
11111&rsquo-}
00002Nome do cliente: {&lsquo-FN&rsquo-:
1383859183103:&lsquo-Jane&rsquo-,
&lsquo-LN&rsquo-: 1383859183163:&lsquo-Doe&rsquo-,
ContactInfo: {
&rsquo-SA&rsquo-: 1383859185577:&rsquo-7 HBase Ave, CA
22222&rsquo-}

A tabela mostra duas famílias de colunas: CustomerName e ContactInfo. Ao criar uma tabela em HBase, o desenvolvedor ou administrador é necessária para definir uma ou mais famílias de colunas usando caracteres imprimíveis.

Video: MapReduce e Sistemas de Arquivo Distribuídos - Aula 19 - Bancos de Dados 2016.2



Geralmente, famílias de colunas permanecem fixos durante toda a vida de uma tabela HBase mas novas famílias de colunas podem ser adicionadas usando comandos administrativos. A recomendação oficial para o número de famílias de colunas por tabela é três ou menos. (Veja o HBase documentação on-line.)

Além disso, você deve armazenar dados com padrões de acesso semelhantes na mesma família coluna - você não iria querer nome do meio de um cliente armazenado em uma família coluna separada do primeiro ou último nome porque você geralmente acessar todos os dados de nome, ao mesmo tempo.

Video: Introdução à Tabela Periódica - Resumo para o ENEM: Química | Descomplica

famílias de colunas estão reunidos no disco, portanto, agrupamento de dados com padrões de acesso semelhantes reduz o acesso total do disco e aumenta o desempenho.


Publicações relacionadas