Principais características hiveql

A comunidade vibrante e ativa Apache Hive continuamente adicionar

s a uma já extensa conjunto de recursos, o que torna a cobertura exaustiva ainda mais difícil. A lista a seguir resume algumas das principais características HiveQL para você:

Video: 5 личных качеств самых лучших игроков в покер в мире

  • Segurança: Apache Hive fornece um subsistema de segurança que pode ser bastante útil na prevenção da corrupção de dados acidental ou compromisso entre os membros confiáveis ​​de grupos de trabalho. No entanto, o Manual Hive Idioma afirma claramente que o subsistema Hive Segurança não é projetado para impedir que os usuários nefastas de comprometer um sistema Hive.

    segurança Hive pode ser estabelecida para usuários individuais, grupos e funções administrativas. Hive fornece privilégios que podem ser concedidos ou revogados para os usuários, grupos ou funções administrativas. The Hive 0,10 liberação melhorou a segurança em ambientes multi-usuário, fornecendo autorização ao metastore e futuros lançamentos Hive irá fornecer crescente integração com a estrutura de segurança Hadoop. Kerberos está emergindo como a tecnologia de escolha para a proteção de Apache Hadoop.

  • Locking Multi-User: Colmeia suporta acesso armazém multi-utilizador, quando configurada com Apache Zookeeper. Sem este apoio, um usuário pode ler uma tabela ao mesmo tempo outro usuário está excluindo que a tabela - o que é, obviamente, inaceitável.

    Video: Literatura - Aula 4: Arcadismo

    acesso multi-usuário é habilitado através de variáveis ​​de configuração no arquivo hive-site.xml. Uma vez configurado, colmeia adquire implicitamente através de bloqueios Zookeeper para certas operações de tabela. Os usuários também podem gerenciar explicitamente bloqueios no Hive CLI. Fechaduras e propriedades de configuração associados / variáveis ​​encontram-se descritos no Manual de colmeia Língua.



  • Compressão: A compressão de dados pode não só economizar espaço no HDFS, mas também melhorar o desempenho, reduzindo o tamanho global das operações de entrada / saída. Além disso, a compressão entre os mapeadores e redutores Hadoop pode melhorar o desempenho, por causa menos dados são passados ​​entre os nós do cluster.

    Video: Literatura - Aula 12: Pré-Modernismo

    Colmeia suporta compressão intermédia entre os mapeadores e redutores, bem como a compressão de saída tabela. Hive também compreende como ingerir dados comprimidos para o armazém. Arquivos compactados com gzip ou bzip2 pode ser lido por colmeia de CARREGAR DADOS comando.

  • Funções: HiveQL fornece um vasto conjunto de operadores embutidos, funções internas, embutido funções de agregação, e funções de geração de tabela embutidos. Vários exemplos deste uso capítulo embutido operadores, bem como funções internas de agregados (AVG, MIN, e CONTAGEM, por exemplo).

    Video: Forjado Unidireccional (Características Principales)

    Para listar todas as funções internas para qualquer liberação Hive particular, use o MOSTRAR FUNÇÕES comando HiveQL. Você também pode recuperar informações sobre uma função built-in usando os comandos HiveQL descrever a função function_name e DESCREVER função estendida function_name.

    usando o ESTENDIDA palavra-chave, por vezes, retorna exemplos de uso para a função built-in especificado. Além disso, Hive permite aos usuários criar suas próprias funções, chamadas de funções definidas pelo usuário, ou UDFs. Usando quadro UDF baseada em Java da Hive, você pode criar funções adicionais, incluindo agregados e funções geradoras de mesa. Este recurso é uma das razões que Hive pode funcionar como uma ferramenta de ETL.


Publicações relacionadas