10 Recursos hadoop dignos de um marcador

Seguem-se dez recursos do Hadoop fantásticos que são dignos de criar um marcador no seu browser. Esses recursos ajudam a criar um plano de aprendizagem ao longo da vida para o Hadoop.

Sistema nervoso central: Apache.org

o Apache Software Foundation (ASF) é a comunidade central para projetos de software de código aberto. Não apenas qualquer projeto pode ser um projeto Apache - muitos processos baseados em consenso converter um pedaço de software de seus projetos iniciais e código beta (sua incubadora status) para software de pleno direito, geralmente disponíveis.

A ASF é não apenas onde projetos como o Hadoop são geridos - “viver e respirar” é onde Hoje, existem centenas de projetos Apache. Com isto em mente, você deve marcar a página Apache Hadoop como um de seus recursos de aprendizagem esteio. Este site é importante porque você pode acessar o código fonte lá.

Partilhar este

Twitter não é o lugar para aprender Hadoop per se - afinal, você não pode facilmente dominar a programação MapReduce em aulas que abrangem apenas 140 caracteres. Seja como for, um bom número de grandes gurus de dados estão no Twitter, e expressam opiniões e apontam para recursos que podem torná-lo uma forma mais inteligente de usuário Hadoop.

Uma série de listas de top-influenciador no Twitter tampa paisagem Hadoop e Big Data, e essa é a melhor maneira de encontrar essas personalidades Hadoop e adicioná-los à sua lista Twitter.

Universidade Hortonworks

Universidade Hortonworks oferece treinamento e certificações Hadoop. O site oferece cursos Hadoop construídos para administrador ou desenvolvedor profissionais com a opção de um programa de certificação rigoroso. Hortonworks emprega alguns dos mais profundos e os mais notáveis ​​especialistas Hadoop do mundo, então você tem a garantia de especialização de qualidade por trás do material didático.

Video: Learn the Bible in 24 Hours - Hour 8 - Small Groups

Universidade Cloudera

Universidade Cloudera é similar em seu modelo de negócios e charter para a Universidade Hortonworks, proporcionando uma série de pistas que vão da tradicional de texto para vídeo de aprendizagem. Cloudera é um dispositivo elétrico proeminente no mundo Hadoop. (Doug Cutting, o “pai” do Hadoop é o seu arquiteto-chefe.) O site oferece um extenso conjunto de cursos, e mais, que são baseados na distribuição Cloudera para Hadoop (CDH).

Video: Marcadores instantáneos

BigDataUniversity.com

BigDataUniversity.com (Caso não importa quando você digitar a URL no seu navegador) é um recurso fantástico para aprender sobre - você adivinhou - big data. Claro, big data não é apenas Hadoop, assim que você vai encontrar mais do que os recursos do Hadoop neste site. Esta universidade tem mais de 100.000 alunos matriculados e aprender sobre Hadoop e big data todos os dias.

Blog planeta Big Data Aggregator

É ótimo quando o nome de um site lhe diz exatamente o que ele faz - como o planeta Big Blog Dados Agregador: É um agregador de blogs sobre dados grande, Hadoop, e outros tópicos relacionados no planeta (bem, no Planeta Terra de qualquer maneira).



Ambos os grandes nomes e não-nomes aparecem no site, mas isso é útil: Embora não há, sem dúvida, compromisso com Hadoop por Cloudera, Hortonworks, IBM e outros, muitas vezes é refrescante e valioso para começar a exposição aos pensamentos e opiniões de raízes da grama, praticantes não-afiliadas por comunidades não vinculados a um fornecedor específico em seu roteiro de aprendizagem.

Fórum Apache Hadoop do Quora

o fórum Quora Apache Hadoop é a pedra angular para quem quer saber mais sobre o Hadoop, ou cerca de big data, em geral, para essa matéria.

Como em qualquer fórum, a gama de perguntas e respostas que você pode encontrar neste site é vertiginoso, mas todos eles levá-lo para o que você está procurando: o conhecimento. O site tem ligações com Hadoop e seus componentes individuais - por exemplo, tem fóruns específicos para MapReduce, HDFS, Porco, HBase, e muito mais.

O site também tem associado Hadoop Forums por exemplo, Cloudera e Hortonworks têm grupos de discussão específicos para suas distribuições - um testemunho de quão popular este fórum é.

O Hub IBM Big Data

o Hub IBM Big Data é um excelente lugar para aprender sobre Hadoop e seu ecossistema. Apesar de ser propriedade e operado pela IBM, o conteúdo deste site não está sempre ligada com produtos IBM.

A IBM Big Data Hub fornece qualquer visitante com conhecimento suficiente para saciar a sede de ninguém para big data. Você encontrará todos os tipos de blogs, vídeos, artigos de analistas, casos de uso, infográficos, apresentações e muito mais. É verdadeiramente um tesouro de grandes recursos de dados.

Conferências a não perder

Há muitas conferências Hadoop e conferências de dados ainda mais grandes - o Summit Hadoop e Strata Hadoop Mundial como as conferências por excelência a não perder. Normalmente, um fornecedor de distribuição de co-patrocinadores destas conferências. Por exemplo, Yahoo! e Hortonworks patrocinar a Summit Hadoop, e Cloudera é o co-patrocinador do Strata Hadoop Mundial.

Ambos Strata Hadoop Mundo e da Cúpula Hadoop são a lugares de reunião das mentes mais brilhantes do Hadoop Business- estas conferências atrair uma grande variedade de profissionais Hadoop-interessadas, incluindo os tomadores de decisão, arquitetos, desenvolvedores, analistas e mais.

Os papéis do Google que começou tudo

O que agora é conhecido como Hadoop tem sua gênese em uma série de artigos escritos por funcionários do Google que foram focadas no problema da indexação da Web.

Enquanto o projeto Apache Nutch (uma tecnologia de código aberto para o rastreamento da Web) foi transformando seu foco em escala para fora, a fim de índice de volumes maiores de dados web, o Google publicou um artigo, “O Sistema de Arquivos do Google”(Outubro de 2003), que influenciou muito Doug Cutting e sua co-fundador Nutch, Mike Cafarella. Pouco depois, o Google lançou o seu papel “MapReduce: simplificado Processamento de Dados em grandes aglomerados”(Dezembro de 2004).

Juntos, o conceito de um sistema de arquivos distribuídos e uma estrutura de processamento paralelo em larga escala foram tomadas pela Corte e Cafarella para desenvolver Apache Hadoop. Claro, cortando comercializado este trabalho, enquanto no Yahoo !, eo resto, como dizem, é história.


Publicações relacionadas