Ferramentas de exploração de dados

Video: Estratificação de Dados [ QUALITV ]

Embora a visualização pode ajudar a esclarecer e comunicar o significado de seus dados, você precisa ter certeza de que os insights de dados que você está se comunicando estão corretas - que requer muito cuidado e atenção na fase de análise de dados. Aqui estão algumas ferramentas gratuitas que você pode usar para algumas tarefas avançadas de análise de dados.

Falando sobre Tableau Public

Tableau Public é uma aplicação desktop livre que pretende ser um pacote completo para a tomada de gráfico. Se o nome soa familiar, pode ser porque Tableau Public é apenas a versão gratuita do popular programa Tableau Desktop. Como parte da limitação freeware, a aplicação não permite salvar arquivos localmente para o computador. Todo o seu trabalho deve ser enviado para o servidor em nuvem da Tableau Public, a menos que você comprar o software.

Tableau Public cria três níveis de documento - a planilha, o painel de instrumentos, e a história. Na planilha, você pode criar gráficos individuais de dados que você importados do Access, Excel, ou um arquivo .csv texto-formato. Você pode então usar Tableau fazer facilmente coisas como escolher entre diferentes tipos de gráficos de dados ou colunas arrastar para diferentes eixos ou subgrupos.

Você tem que lidar com um pouco de uma curva de aprendizagem quando se trabalha com o fluxo da aplicação e sua nomenclatura - por exemplo, dimensões são dados categóricos e medidas são dados numéricos.

Tableau oferece diversos tipos de gráfico padrão - gráficos de barras, gráficos de dispersão, gráficos de linha, gráficos de bolhas, gráficos de Gantt, e até mesmo mapas geográficos. Tableau Public pode sequer olhar para o tipo de dados que você tem e sugerir tipos de gráficos que você pode usar para melhor representá-lo. Por exemplo, imagine que você tem duas dimensões e uma medida. Nesta situação, um gráfico de barras é uma escolha popular porque você tem duas categorias de dados e apenas uma medida numérica para essas duas categorias.

Mas se você tem duas dimensões e duas medidas, a dispersão pode ser uma boa opção, porque o gráfico de dados gráfico de dispersão permite que você visualize dois conjuntos de dados numéricos para duas categorias de dados.

Video: Ferramentas no lugar de brinquedos chamam a atenção para a exploração infantil

Você pode usar um painel Tableau combinar gráficos com anotações de texto ou com outros gráficos de dados. Você também pode usar o painel de controle para adicionar filtros interativos, como caixas ou controles deslizantes, de modo que os usuários podem interagir com seus dados para visualizar apenas algumas séries temporais ou categorias. Com uma história Tableau, você pode combinar vários painéis em uma espécie de apresentação de slides que mostra uma história linear revelado através de seus dados.

Você pode usar galeria de Tableau Public para compartilhar todas as planilhas, painéis e histórias que geram dentro do aplicativo. Você também pode incorporá-los em sites que ligam de volta para o servidor Tableau nuvem pública.

Video: Ferramentas da Qualidade - Estratificação de Dados

Recebendo até a velocidade em Gephi

Lembre-se de volta à escola, quando você foi ensinado como usar papel gráfico para fazer matemática e desenhe gráficos dos resultados? Bem, aparentemente, essa nomenclatura é incorreta. Essas coisas com um X-eixo e y-eixo são realmente chamados gráficos. Os gráficos são realmente topologias de rede.

Gephi é um pacote de software de código aberto que você pode usar para criar layouts gráficos e, em seguida, manipulá-los para obter os resultados mais claros e eficazes. Os tipos de visualização baseada em conexão você pode criar em Gephi são muito úteis em todos os tipos de rede analisa - da análise de dados de mídia social para uma análise das interações proteína ou transferência horizontal de genes entre bactérias.



Para ilustrar a análise de rede, imagine que você deseja analisar a interligação das pessoas nas suas redes sociais. Você pode usar Gephi para apresentar de forma rápida e facilmente os diferentes aspectos de interconexão entre seus amigos do Facebook.

Então, imagine que você é amigo de Alice. Você e Alice compartilhar 10 dos mesmos amigos no Facebook, mas Alice também tem um adicional de 200 amigos com os quais você não está conectado. Um dos amigos que você e share Alice é nomeado Bob. Você e Bob compartilhar 20 dos mesmos amigos no Facebook também, mas Bob tem apenas 5 amigos em comum com Alice. Com base amigos compartilhados, você pode facilmente supor que você e Bob são os mais semelhantes, mas você pode usar Gephi visualmente gráfico do amigo links entre si, Alice e Bob.

Para dar outro exemplo, imagine que você tem um gráfico que mostra quais personagens aparecem no mesmo capítulo como quais outros personagens imenso romance de Victor Hugo Os Miseráveis. (Na verdade, você não tem que imaginar ele- a figura a seguir mostra apenas como um gráfico, criado em aplicação Gephi.) As bolhas maiores indicam que esses personagens aparecem mais frequentemente, e os mais linhas ligado a uma bolha, mais ele ou ela co-ocorre com outras pessoas - a grande bolha no centro-esquerda, é claro, Jean Valjean.

Quando você usa Gephi, o aplicativo automaticamente as cores de seus dados em clusters diferentes. Olhando para as o conjunto de caracteres em azul (a cor um pouco mais escura-nesta imagem em preto-e-branco) são personagens superior esquerdo, que na sua maioria só aparecem uns com os outros (eles são os amigos de Fantine, como Félix Tholomyès - se você viu apenas o musical, eles não aparecem em que a produção). Esses personagens estão ligados ao resto dos personagens do livro através de um único personagem, Fantine. Se um grupo de personagens só aparecem juntos e nunca com quaisquer outros personagens, eles estariam em um cluster separado do seu próprio e não ligado ao resto do gráfico de qualquer forma.

Para dar um exemplo final, consulte a figura a seguir, que mostra um gráfico da rede elétrica dos Estados Unidos e os graus de interconexão entre milhares de instalações de geração de energia e de distribuição de energia. Este tipo de gráfico é referido geralmente como um Gráfico de bolas de pêlo, por razões óbvias. Você pode torná-lo menos denso e mais visualmente clara, mas fazer esses tipos de ajustes é tanto uma arte como é uma ciência. A melhor maneira de aprender é através da prática, julgamento e erro.

Video: FERRAMENTA CASE PARA MODELAGEM DE DADOS Com Narração

aprendizagem de máquina com o conjunto WEKA

aprendizado de máquina é a classe de inteligência artificial que é dedicada ao desenvolvimento e aplicação de algoritmos de dados, para que os algoritmos podem aprender e detectar padrões em grandes conjuntos de dados automaticamente. Waikato Ambiente para a análise do conhecimento (WEKA) É um conjunto popular de ferramentas que é útil para ferramentas de aprendizagem de máquina. Ele foi escrito em Java e desenvolvido na Universidade de Waikato, Nova Zelândia.

WEKA é um aplicativo independente que você pode usar para analisar os padrões em seus conjuntos de dados e, em seguida, visualizar esses padrões em todos os tipos de formas interessantes. Para usuários avançados, o verdadeiro valor do WEKA é derivado de seu conjunto de algoritmos de aprendizado de máquina que você pode usar para agrupar ou categorizar seus dados.

WEKA ainda permite executar diferentes algoritmos de aprendizagem de máquina em paralelo para ver qual deles executar de forma mais eficiente. WEKA pode ser executado através de um interface de utilizador gráfico (GUI) ou pela linha de comando. Graças a documentação Weka Wiki muito bem escrito, a curva de aprendizado para WEKA não é tão íngreme quanto você poderia esperar por um pedaço de software este poderoso.


Publicações relacionadas