Acesso sql e colmeia apache
Video: Bancos de Dados - Aula 13 - Linguagem de consulta – SQL Parte I
Conteúdo
Apache Hive é, indiscutivelmente, a interface de consulta de dados mais difundida na comunidade Hadoop. Originalmente, as metas de design para Hive não eram para compatibilidade SQL completa e de alta performance, mas foram para fornecer uma interface fácil, um pouco familiar para os desenvolvedores que precisam emitir consultas em lote contra Hadoop.
Video: PD - Criar View Básica no SQL Server 2012
Esta abordagem bastante fragmentada não funciona mais, assim que a demanda cresce para suporte SQL real e bom desempenho. Hortonworks respondeu a esta demanda, criando o projeto Stinger, onde ele investiu seus recursos de desenvolvimento na melhoria Hive para ser mais rápido, para dimensionar a um nível de petabyte, e para ser mais compatível com os padrões SQL. Este trabalho era para ser entregue em três fases.
Nas fases 1 e 2, você viu uma série de otimizações para como consultas foram processados, bem como suporte adicional para dados SQL tradicionais tipos, a adição do formato ORCFile um processamento mais eficiente e Storage- e integração com fio para um melhor desempenho.
Video: Configurando WampServer 2.5, e corrigindo erro de Acesso ao PhpMyAdmin
Na Fase 3, as evoluções verdadeiramente significativos ocorrem, que dissociar Hive de MapReduce. Especificamente, envolve a libertação de Apache Tez, que é um modelo de processamento alternativo para Hadoop, concebidos para cargas de trabalho interactivos.
Além do projeto Stinger, Hortonworks está liderando uma iniciativa ambiciosa para permitir Hive para apoiar a edição de dados no nível de linha com o cumprimento integral das propriedades ACID para sistemas de banco de dados: atomicidade, consistência, níveis de isolamento e durabilidade.