RDBMSs em um ambiente de dados grande

Big data está se tornando um elemento importante na forma como as organizações estão utilizando dados de alto volume na velocidade certa para resolver problemas específicos de dados. Banco de Dados Relacional Systems Management são importantes para esse alto volume. não big data não viver em isolamento. Para ser eficaz, as empresas muitas vezes precisam de ser capaz de combinar os resultados de análise de dados grande com os dados que existe dentro da empresa.

Conteúdo

Noções básicas de big data: dados rdbms e persistentes
Noções básicas de big data: rdbms e tabelas
Postgresql, um banco de dados relacional de código aberto

noções básicas de big data: dados RDBMS e persistentes

Um dos serviços mais importantes prestados por bancos de dados operacionais (também chamado armazenamentos de dados) É a persistência. Persistência garante que os dados armazenados em um banco de dados não serão alterados sem permissões e que estará disponível, desde que ele é importante para o negócio. Que bom é um banco de dados se ele não pode ser confiável para proteger os dados que você colocar nele?

Tendo em conta este requisito mais importante, então você deve pensar sobre o tipo de dados que deseja persistir, como você pode acessar e atualizar-lo, e como você pode usá-lo para tomar decisões de negócios. Neste nível mais fundamental, a escolha de seus bancos de dados é fundamental para o seu sucesso global com a implementação de dados grande.

Mesmo que a tecnologia subjacente tem sido em torno de algum tempo, muitos destes sistemas estão em operação hoje, porque os negócios que eles suportam são altamente dependente dos dados. Para substituí-los seria como mudar os motores de um avião em um vôo transoceânico.

noções básicas de Big data: RDBMS e tabelas

Bancos de dados relacionais são construídos sobre uma ou mais relações e são representados por tabelas. Essas tabelas são definidos por suas colunas, e os dados são armazenados nas linhas. A chave primária é muitas vezes a primeira coluna na tabela. A consistência do banco de dados e muito do seu valor são alcançados por “normalizar” os dados. de dados normalizado foi convertido do formato nativo em um compartilhada, acordado formato.

Por exemplo, em um banco de dados que você pode ter “telefone” como XXX-XXX-XXXX enquanto em outro pode ser XXXXXXXXX. Para conseguir uma visão consistente das informações, o campo terá de ser normalizado para uma outra forma. existem cinco níveis de padrões para a normalização. A escolha da forma normal é muitas vezes relegado para o designer de banco de dados. A coleção de tabelas, chaves, elementos, e assim por diante é conhecido como o banco de dados esquema.

Ao longo dos anos, a linguagem de consulta estruturada (SQL) evoluiu na etapa de bloqueio com a tecnologia RDBMS e é o mecanismo mais utilizado para criar, consultar, manutenção e operação de bancos de dados relacionais.

Em empresas pequenas e grandes, a maioria de sua informação operacional importante é provavelmente armazenadas em RDBMSs. Muitas empresas têm RDBMSs diferente para diferentes áreas de seus negócios. dados transacionais pode ser armazenado no banco de dados de um fornecedor, enquanto as informações do cliente poderia ser armazenada em outro.

Não é provável que você irá usar RDBMSs para o núcleo da implementação, mas você vai precisar contar com os dados armazenados no RDBMSs para criar o mais alto nível de valor ao negócio com big data.

PostgreSQL, um banco de dados relacional de código aberto

Durante a sua implementação de dados grande, é provável que você se deparar PostgreSQL, um amplamente utilizado, banco de dados relacional de código aberto. Vários fatores contribuem para a popularidade do PostgreSQL. Como um RDBMS com suporte para o padrão SQL, que faz todas as coisas habituais num produto de banco de dados, além de sua longevidade e uso largo tornaram “batalha testado.” Ele também está disponível em praticamente todas as variedades de sistema operacional, a partir de PCs para mainframes.

Fornecendo o básico e fazê-lo de forma confiável são apenas parte da história. PostgreSQL também suporta muitas características encontradas apenas nas caras RDBMSs proprietária, incluindo o seguinte:

Capacidade de lidar diretamente “objetos” dentro do esquema relacional
chaves estrangeiras (referenciando chaves de uma tabela em outra)
Triggers (eventos usados para iniciar automaticamente um procedimento armazenado)
consultas complexas (subconsultas e junta-se em mesas separadas)
integridade transacional
controle de concorrência multiversão

O verdadeiro poder do PostgreSQL é a sua extensibilidade. Usuários e programadores de banco de dados pode adicionar novos recursos sem afetar a operação fundamental ou a confiabilidade do banco de dados. extensões possíveis incluem

Tipos de dados
operadores
Funções
métodos de indexação
linguagens procedurais

Este alto nível de personalização faz PostgreSQL desejável quando rígidas, produtos proprietários não vai fazer o trabalho. É extensível infinitamente.

Finalmente, a licença do PostgreSQL permite a modificação e distribuição, sob qualquer forma, de código aberto ou fechado. Quaisquer modificações podem ser mantidos privados ou compartilhados com a comunidade como desejar.