O sql access realmente significa
Uma série de empresas estão investindo pesadamente para conduzir projetos de código aberto e soluções proprietárias para acesso SQL aos dados do Hadoop. Quando você ouvir o termo Acesso SQL,
você deve saber que você está confiando em alguns pressupostos básicos:padrões de linguagem: O padrão mais importante, é claro, implica a linguagem em si. Existem muitas soluções “SQL-like”, embora eles geralmente não medir-se em certos aspectos fundamentais - maneiras que impediriam instruções SQL ainda típicos de trabalhar.
Video: O que é SQL
O American National Standards Institute (ANSI) estabeleceu SQL como um padrão técnico oficial, e da indústria de TI aceita o ANSI SQL-92 padrão como representando o ponto de referência para o cumprimento SQL básico. ANSI lançou uma série de versões progressivamente mais avançados ao longo dos anos como tecnologias de banco de dados têm evoluído.
Drivers: Outro componente chave em uma solução de acesso SQL é a motorista - a interface para aplicações para conectar e trocar dados com o armazenamento de dados. Sem um motorista, não há nenhuma interface SQL para quaisquer aplicações ou ferramentas de cliente para conectar-se para a apresentação de consultas SQL.
Video: SQL with Microsoft Access 2016 lesson 1 - Create table
Como tal, qualquer SQL na solução Hadoop tem que ter drivers JDBC e ODBC, no mínimo, porque eles são as tecnologias de interface de banco de dados mais comumente usados.
Acesso em tempo real: Até Hadoop 2, execução baseada em MapReduce era a única opção disponível para análise em relação aos dados armazenados no Hadoop. Para consultas relativamente simples envolvendo uma varredura completa de dados em uma tabela, o Hadoop foi muito rápido em comparação com um banco de dados relacional tradicional.
Tenha em mente que este é um caso de lote uso análise, onde velozes pode significar horas, dependendo da quantidade de dados está envolvido. Mas quando se tratava de consultas mais complexas, envolvendo subconjuntos de dados, Hadoop não se saiu bem. MapReduce é uma estrutura de processamento em lote, para atingir um alto desempenho para consultas em tempo real antes de Hadoop 2 foi arquitetonicamente impossível.
Um motivador cedo para FIO, a nova gestão de recursos e sistema de agendamento no bloco, foi esta necessidade de apoiar outras estruturas de processamento para permitir cargas de trabalho em tempo real, tais como consultas SQL interativas. De fato, uma solução SQL adequada não deve deixar as pessoas esperando por consultas razoáveis.
dados mutáveis: Uma pergunta comum em muitas discussões em torno de suporte SQL no Hadoop é “Podemos usar, e declarações, como nós seria capaz de fazer em um banco de dados relacional típico?” Por enquanto, a resposta é não, o que reflete a natureza do HDFS - ele é focado em arquivos grandes, imutáveis. Tecnologias como Hive oferecem acesso somente leitura para esses arquivos. Independentemente disso, o trabalho está em curso no projeto Hive Apache.