A importância de sql para hadoop
Há fortes razões que o SQL provou ser resiliente. A indústria de TI teve 40 anos de experiência com SQL, uma vez que foi inicialmente desenvolvido pela IBM na década de 1970. Com o aumento na adoção de bancos de dados relacionais na década de 1980, SQL desde então se tornou uma habilidade padrão para a maioria dos profissionais de TI.
Conteúdo
Video: SQL on Hadoop: The Secret
Você pode facilmente ver porque SQL tem sido tão bem sucedida: É relativamente fácil de aprender, e consultas SQL são bastante legível. Esta facilidade pode ser rastreada até um ponto de design de núcleo em SQL - o fato de que é um declarativo linguagem, ao contrário de um imperativo língua.
Para uma linguagem a ser meio declarativo que suas consultas lidam apenas com a natureza dos dados que está sendo solicitado - idealmente, não deve haver nada em sua consulta que determina como o processamento deve ser executado. Em outras palavras, tudo o que você indicar no SQL é o que informação que você quer de volta a partir do sistema - não como obtê-lo.
Video: Hadoop Vs SQL :: Just WHAT "Big Data" Is
Em contraste, com uma linguagem imperativa (C, por exemplo, ou Java, ou Python) o seu código consiste em instruções onde você define as ações que você precisa do sistema para executar.
Além das habilidades (facilmente alavancadas) de seus amigável-SQL profissionais de TI, que vale de aplicações de banco de dados décadas também foram construídos com interfaces SQL. Ao falar sobre como Hadoop pode complementar o data warehouse, é claro que as organizações irá armazenar dados estruturados em Hadoop. E, como resultado, eles vão executar alguns de sua lógica de aplicativo existente contra o Hadoop.
Video: Oracle Big Data SQL One Fast Query On All Your Data
Ninguém quer pagar por aplicações de ser reescrita, então uma interface SQL é altamente desejável.
Com o desenvolvimento de interfaces SQL aos dados Hadoop, uma tendência interessante é que a análise de negócios comerciais e ferramentas de gerenciamento de dados são quase todos entrando na onda Hadoop, incluindo inteligência de negócios reporting- Extract packages- estatística, Transformar e estruturas de carregamento (ETL) - e uma variedade de outras ferramentas. Na maioria dos casos, a interface para os dados Hadoop é Hive.