Gerenciar de virtualização para big data

A virtualização separa os recursos e serviços do ambiente de entrega física subjacente, permitindo que você crie muitos sistemas virtuais dentro de um único sistema físico. Uma das principais razões que as empresas implementaram a virtualização é para melhorar o desempenho ea eficiência do processamento de um mix diversificado de cargas de trabalho

O hypervisor de dados grande

Em um mundo ideal, você não quer se preocupar com o sistema operacional subjacente e o hardware físico. UMA hypervisor é a tecnologia responsável por assegurar que o compartilhamento de recursos ocorre de forma ordenada e repetitiva.

Video: Pensando Grande

O hypervisor senta nos níveis mais baixos do ambiente de hardware e usa uma fina camada de código para habilitar o compartilhamento de recursos dinâmico. O hypervisor faz parecer que cada sistema operacional tem os recursos físicos todos a si mesmo.

No mundo dos grandes dados, pode ser necessário para suportar muitos diferentes ambientes operacionais. O hypervisor torna-se um mecanismo de entrega ideal para os componentes de tecnologia da pilha de dados grande. O hipervisor permite mostrar a mesma aplicação em lotes de sistemas sem ter que copiar fisicamente que a aplicação em cada sistema.

Video: Plataforma de Virtualização Microsoft Hyper-V: Benefícios da Virtualização

Como um benefício adicional, por causa da arquitetura hypervisor, ele pode carregar quaisquer sistemas operacionais diferentes, como se fossem apenas mais um aplicativo. Assim, o hypervisor é uma maneira muito prática de fazer as coisas virtualizados com rapidez e eficiência.

Os sistemas operacionais convidados são os sistemas operacionais rodando em máquinas virtuais. Com a tecnologia de virtualização, você pode configurar o hypervisor para dividir os recursos do computador físico. Os recursos podem ser divididos 50/50 ou 80/20 entre dois sistemas operacionais convidados, por exemplo.

A beleza deste arranjo é que o hypervisor faz todo o trabalho pesado. O sistema operacional convidado não se importa que ele está correndo em um partition- virtual que pensa que tem um computador só para ela.

Você encontra basicamente dois tipos de hypervisors:

  • Tipo 1 hypervisors executado diretamente na plataforma de hardware. Eles alcançar maior eficiência porque eles estão correndo diretamente na plataforma.



  • Tipo 2 hypervisors executado no sistema operacional hospedeiro. Elas são muitas vezes utilizadas quando existe uma necessidade para suportar uma ampla variedade de dispositivos de I / O.

Abstração e big data virtualização

Para os recursos de TI e serviços para ser virtualizado, eles são separados do ambiente de entrega física subjacente. O termo para este acto de separação é chamado abstração. A abstração é um conceito chave na big data. MapReduce e Hadoop são distribuídos ambientes de computação onde tudo é abstraída. O detalhe é captada de modo que o desenvolvedor ou analista não precisa se preocupar com o local onde os elementos de dados estão localizados.

Abstraction minimiza a complexidade de algo ocultando os detalhes e fornecendo apenas as informações relevantes. Por exemplo, se você estava indo para pegar alguém que você nunca conheceu antes, ele poderia dizer-lhe o local para encontrá-lo, e que ele vai usar. Ele não precisa dizer onde ele nasceu, quanto dinheiro ele tem no banco, sua data de nascimento, e assim por diante.

Essa é a idéia com a abstração - é sobre o fornecimento de uma especificação de alto nível, em vez de entrar em muitos detalhes sobre como algo funciona.

Implementar a virtualização para trabalhar com big data

A virtualização ajuda faz seu ambiente de TI inteligente o suficiente para lidar com análise de dados grande. Ao otimizar todos os elementos da sua infra-estrutura, incluindo hardware, software e armazenamento, você ganha a eficiência necessária para processar e gerenciar grandes volumes de dados estruturados e não estruturados. Com dados grandes, você precisa acessar, gerenciar e analisar dados estruturados e não estruturados em um ambiente distribuído.

Big data assume distribuição. Na prática, qualquer tipo de MapReduce irá funcionar melhor em um ambiente virtualizado. Você precisa a capacidade de mover cargas de trabalho em torno de com base em requisitos de energia e armazenamento de computação.

Virtualização irá permitir-lhe enfrentar os problemas maiores, que ainda não foram escopo. Você pode não saber com antecedência o quão rápido você precisará escalar.

Virtualização irá permitir-lhe suportar uma variedade de operacionais grandes armazenamentos de dados. Por exemplo, um banco de dados gráfico pode ser girado para cima como uma imagem.

O benefício mais direto de virtualização é garantir que os motores de MapReduce funcionam melhor. A virtualização vai resultar em melhor escala e desempenho para MapReduce. Cada um dos Mapa e reduzir as tarefas precisa ser executado de forma independente. Se o motor MapReduce é paralelizado e configurado para ser executado em um ambiente virtual, você pode reduzir a sobrecarga de gerenciamento e permitir expansões e contrações nas cargas de trabalho de tarefas.

si MapReduce é inerentemente paralelo e distribuído. Ao encapsular o mecanismo MapReduce em um recipiente virtual, você pode executar o que você precisa sempre que você precisar. Com a virtualização, você aumenta a sua utilização dos recursos já pagos por transformá-los em piscinas genéricas de recursos.


Publicações relacionadas