Definindo dados grandes por seus quatro vs

Video: Como passar seus apps e jogos para o cartão de memória

Quatro características (os quatro Vs) Definir grande de dados: o volume, velocidade, variedade, e de valor. Big data são dados que excede a capacidade de processamento dos sistemas de banco de dados convencionais porque ele é muito grande, ele se move muito rápido, ou ele não se encaixa nos requisitos estruturais de arquiteturas de banco de dados tradicionais. Se os volumes de dados classificar nos terabytes ou petabytes escalas, soluções de engenharia de dados deve ser projetado para atender requisitos para os de dados de destino e uso pretendido.

Quando você está falando de dados regular, é provável que você ouvir as palavras kilobyte ou gigabyte usado - 103 e 109 bytes, respectivamente. Em contraste, quando você está falando sobre big data, palavras como terabyte e petabyte são atirados ao redor - 1012 e 1015 bytes, respectivamente. UMA byte é uma unidade de dados de 8 bits.

Desde os quatro Vs dos dados grandes estão crescendo continuamente, tecnologias de dados novos e mais inovadores deve ser continuamente desenvolvido para gerenciar problemas de big data.

Sempre que você estiver em dúvida, use os critérios 4V para determinar se você tem uma grande-de dados ou problema-regular de dados em suas mãos.

Lidando com o volume de dados

Os limites inferiores de grandes volumes de dados variam entre alguns terabytes, até dezenas de petabytes, numa base anual. Os números de volume, através da qual um conjunto de dados de grande é definida não tem limite superior. Na verdade, os volumes da maioria dos conjuntos de dados grandes estão aumentando exponencialmente em uma base anual.

Video: 4 Simple Mistakes RUINING Your Poker Tournament Results

Manipulação de velocidade de dados



máquinas e sensores automatizado estão a gerar dados de alta velocidade sobre uma base contínua. Em termos de engenharia, velocidade de dados é o volume de dados por unidade de tempo. velocidades de dados grandes variar entre 30 kilobytes (KB) por segundo até mesmo 30 gigabytes (GB) por segundo. De alta velocidade, fluxos de dados em tempo real apresentar um obstáculo para a tomada de decisão em tempo hábil. As capacidades das tecnologias de manipulação de dados e de processamento de dados, muitas vezes limitam as velocidades de dados.

Video: Rihanna - Kiss It Better (Explicit)

Lidar com variedade dados

Big data torna tudo mais complicado pela adição de dados não estruturados e semi-estruturados com os conjuntos de dados estruturados. Isso é chamado Alto-variedade dados. fontes de dados de alta variedade pode ser derivada de fluxos de dados que são gerados a partir de redes sociais ou por máquinas automáticas.

Os dados estruturados é dados que pode ser armazenada, processada e manipulada num sistema de gestão de base de dados relacional tradicional. Estes dados podem ser gerados por seres humanos ou máquinas, e é derivada de todos os tipos de fontes, de click-córregos e formas baseadas na web para apontar de transações e sensores de venda.

dados não estruturados vem completamente desestruturado - é comumente gerado pelas atividades humanas e não se encaixa em um formato de banco de dados estruturado. Tais dados podem ser derivadas de blogs, e-mails e documentos do Word.

dados semi-estruturado são dados que não se encaixam em um sistema de banco de dados estruturado, mas não deixa de ser estruturado por tags que são úteis para a criação de uma forma de ordem e hierarquia nos dados. dados semi-estruturado é comumente encontrada em sistemas de banco de dados e arquivos. Ele pode ser armazenado como arquivos de log, arquivos XML ou arquivos de dados JSON.

valor de dados Criando

Em sua forma bruta, a maioria grande de dados é baixo valor - por outras palavras, a relação de quantidade de valor-de-dados é baixa em grandes dados brutos. Big data é composta por um grande número de pequenas transações que vêm em uma variedade de formatos. Estes componentes incrementais de dados grandes produzir o verdadeiro valor só depois de serem enrolados e analisados. engenheiros de dados tem o trabalho de rolar para cima e cientistas de dados têm a tarefa de analisá-lo.


Publicações relacionadas