Camada 2 da pilha de dados grande: bancos de dados operacionais

Video: Banco de Dados na Web & XML - Aula 13 - Bancos de Dados 2016.2

No núcleo de qualquer ambiente de dados grande, e camada 2 da pilha de dados grande, são os motores de banco de dados contendo as coleções de elementos de dados relevantes para o seu negócio. Estes motores precisa ser rápido, escalável e rocha sólida. Eles não são todos iguais, e certos ambientes de big data se sairá melhor com um motor que outra, ou mais provavelmente com uma mistura de bancos de dados.

Por exemplo, embora seja possível usar sistemas de gerenciamento de banco de dados relacionais (RDBMSs) para todas as suas grandes implementações de dados, não é prático para fazê-lo por causa do desempenho, escala, ou mesmo custo. Um número de diferentes tecnologias de banco de dados estão disponíveis, e você deve tomar cuidado para escolher sabiamente.

Não existe um único escolha certa existe sobre linguagens de banco de dados. Embora SQL é a linguagem de consulta de banco de dados mais prevalente em uso hoje, outras linguagens podem fornecer uma maneira mais eficaz ou eficiente de resolver seus desafios de big data. É útil pensar dos motores e linguagens como ferramentas em uma “caixa de ferramentas do implementador.” Seu trabalho é escolher a ferramenta certa.

Por exemplo, se você usar um modelo relacional, provavelmente você vai usar SQL para consultá-lo. No entanto, você também pode usar linguagens alternativas como Python ou Java. É muito importante compreender que tipos de dados podem ser manipulados pelo banco de dados e se ele suporta verdadeiro comportamento transacional. designers de banco de dados descrever este comportamento com a sigla ÁCIDO. Ele significa



  • Atomicidade: Uma transação é “tudo ou nada” quando é atômica. Se qualquer parte da transação ou o sistema subjacente falhar, toda a transação falha.

  • Consistência: Apenas as operações com dados válidos serão realizadas no banco de dados. Se os dados forem corrompidos ou imprópria, a transação não será concluída e os dados não serão gravados no banco de dados.

  • Isolamento: Várias transações simultâneas não irá interferir uns com os outros. Todas as transações válidas será executado até concluído e na ordem em que foram submetidos para processamento.

  • Durabilidade: Depois que os dados da transação é gravada no banco de dados, ele permanece lá “para sempre”.

    Motorquery LanguageMapReduceTipos de dadostransaçõesExemplos
    relacionalSQL, Python, CNãodigitadoÁCIDOPostgreSQL, Oracle, DB / 2
    ColunarRubiHadoopPredefinidos e digitouSim, se estiver ativadoHBase
    GráficoAndar a pé, Pesquisa, CypherNãoUntypedÁCIDONeo4J
    DocumentocomandosjavascriptdigitadoNãoMongoDB, CouchDB
    Valor chaveLucene, ComandosjavascriptBLOB, semitypedNãoRiak, Redis

Video: PILHAS E FILAS - ESTRUTURA DE DADOS I

Depois de entender suas necessidades e entender o que os dados que você está reunindo, onde colocá-lo, eo que fazer com ele, você precisa organizá-lo para que ele possa ser consumida para análise, relatórios ou aplicações específicas.


Publicações relacionadas