Como construir seu próprio laboratório de teste de dados grande

Aqui, você vai descobrir como construir um padrão para algumas das tecnologias de dados grandes específicos, lugares para aprender deles, e uma caixa de areia para a prática. (UMA caixa de areia

é um lugar para executar um teste.) Este é somente um padrão de amostra para aprender tecnologias de núcleo e onde usá-los.

Suponha que você queira fazer algumas análises de dados grandes sobre seus gastos pessoais durante os últimos três anos para ver se existem quaisquer indicadores preditivos ou insights interessantes que você pode aprender por esmagou-se gastos pessoais com os padrões do clima em sua cidade.

Talvez você queira ficar um pouco mais interessante e ver se há correlação com a atividade Facebook, mudanças de status, ou amigos postando fotos de viagem. Quem sabe? Esse é o ponto: Tente encontrar alguns padrões interessantes. Agora, você não sabe se existem padrões.

Para executar este projeto, você precisa criar um notebook projeto. Pode ser digital (usando Evernote, OneNote, ou bloco de notas), ou você pode simplesmente usar o bom papel antiquado. cadernos de projeto têm duas finalidades muito importantes:

  • Eles são pragmáticos. Notebooks são o lugar para você para documentar ideias, planos de aprendizagem, notas técnicas e resultados.

  • Eles são de revisão. Você vai encontrar enorme valor retrospectiva (mais sobre isso depois) em olhando para o seu progresso.

Tire um tempo para revista suas experiências - o que está funcionando, o que é frustrante, eo que você espera realizar enquanto você está aprendendo.

Passo 1: Defina suas metas

Passe algum tempo a escrever para baixo seus objetivos. Estudos mostram que as pessoas que articulam suas metas por escrito é muito mais provável para realizá-los. Seja específico. aqui estão alguns exemplos:

  • Se sentir confortável com Python básico.

  • Obter experiência prática com grandes dados usando dados de mídia social. Saiba como agarrar dados de Facebook com Python.

  • Aprenda uma ferramenta de visualização de combinar os gastos pessoais com dados do Facebook.

  • Concluir este projeto dentro de duas semanas, trabalhando durante a noite e nos fins de semana.

  • Gastar menos de US $ 100.

Passo 2: Faça um inventário habilidades

Passe algum tempo a definir quais as competências tecnologia que você precisa para realizar o projeto. Usando seus objetivos, você vai ser capaz de descobrir isso através de sua pesquisa sobre Python, lendo fóruns e apenas tentando. Se você não sabe o que você não sabe, está tudo bem. Você vai bater uma coli descobrir isso.

Para este projecto específico, você precisa saber

  • Python Basic.

  • habilidades de banco de dados, como MySQL e Excel como fonte de dados.

  • Tableau, um programa de software de business intelligence e analytics.

  • interfaces de Facebook aplicação de programação (APIs), que são os pontos de acesso que permitem que duas aplicações - o que você está construindo e Facebook - para se comunicar uns com os outros.

Passo 3: mind the gap

Determine o que você não conhecer e estimar o quanto de esforço será necessário para preencher essas lacunas. Faça algumas notas sobre onde você acha que deve ir para a ajuda. Você está apenas estimar o esforço de trabalho para aprender as coisas. Você já sabe neste momento que Python é uma lacuna para você. Faça o seu melhor para estimar o quanto de esforço que você acha que vai ser para aprendê-la.

Passo 4: Adquirir conhecimento

Iniciar a execução do plano de aprendizagem básica e ir fazer acontecer. Para este projeto, você vai começar recebendo habilidades básicas Python. Quando você está confortável com o Python, você vai começar a fazer chamadas de API para Facebook para entender como acessar as alterações de dados e status. Neste ponto, você pode sentir-se pronto para fazer algum trabalho mais interessante, como pegar mensagens de imagem de datas específicas que se correlacionam com compras grandes de cartão de crédito que você fez.

Passo 5: Olhe para trás

A etapa retrospectiva é extremamente crítico e talvez o passo mais importante em todo o processo. Simplificando, uma retrospectiva é o exercício de olhar para trás no esforço com a finalidade de melhorar o desempenho futuro. Você olhar não só para o que deu errado, mas também no que deu certo, porque você quer repetir esses sucessos novamente.

Comece a avaliar se o seu esforço foi bem sucedido para que você possa melhorar o seu desempenho.



Processo e resultado ambos têm três alavancas, cada um dos quais impactos sucesso. Os três alavancas de processo são

  • Ferramentas: Foram as ferramentas de aprendizagem eficaz para você?

  • Tempo: Será que quis realizar este projeto no tempo que você esperava?

  • Esforço: Era o seu nível de esforço para aprender maior ou menor do que o que você esperava? Esta não é uma medida de quão difícil que algo estava para aprender, mas se a dificuldade que as suas expectativas.

Aqui estão algumas perguntas que você pode pedir para iluminar este:

  • Você foi capaz de encontrar facilmente os recursos?

  • Onde esses recursos fácil para você compreender?

  • Você tem o tempo para aprender?

  • Será que quis atender às suas metas de tempo?

  • Será que você efetivamente usar tutoriais para aprender novas habilidades?

As três alavancas de resultado são

  • Conhecimento: Fazer agora que você possui o conhecimento que você se propôs a aprender?

  • Objetivos de aprendizado: Será que quis realizar seus objetivos de aprendizagem? Por exemplo, você conseguiu hands-on experiência com Python?

  • Valor: É o que você aprendeu relevantes para encontrar um emprego?

Sondagem perguntas para o resultado incluiria

  • Será que eu aprender as linguagens de programação e software que eu precisava (por exemplo, Python)?

  • Eu posso fazer isso novamente com um conjunto diferente de dados com menos esforço?

  • Se eu falei com meu chefe sobre este projeto, que ela deixe-me tentar algo no trabalho?

Olhe para cada um dos seis fatores de sucesso e determinar o quão bem sucedido você pensa que é. Fazer este tipo de atividade permite que você refletir sobre o seu processo e resultado com o propósito de aprender o que correu bem eo que pode ser melhorado.

Existem quatro estados possíveis:

  • Sucesso / Success: Tanto o processo eo resultado foram bem sucedidos.

  • Não houve sucesso: O processo foi considerada bem sucedida, mas o resultado foi um fracasso.

  • Fracasso / Sucesso: O processo foi considerado um fracasso, mas o resultado foi bem sucedida.

  • Falha / falha: Tanto o processo eo resultado foram fracassos.


Publicações relacionadas