10 Grátis ferramentas de ciência de dados e aplicações
Visualizações são uma parte extremamente importante do conjunto de ferramentas do cientista de dados para dados grandes. Com eles, você pode alavancar a capacidade do cérebro para absorver rapidamente a informação visual. visualizações de dados são um meio muito eficaz de comunicar percepções de dados.
Conteúdo
- Fazendo visualizações de dados baseados em web personalizado com pacotes r gratuitos
- Video: cientista de dados – dominando o big data com software livre
- Confira mais raspagem, coleta e manipulação de ferramentas
- Confira mais ferramentas de exploração de dados
- Video: ciência de dados: onde é aplicada?
- Video: o que É ciÊncia de dados em 5 minutos - explorar big data para prever o futuro
- Confira mais ferramentas de visualização baseados na web
- Video: entrevista sobre ciência de dados com ricardo cappra
Fazendo visualizações de dados baseados em web personalizado com pacotes R gratuitos
Estes pacotes e ferramentas são úteis para criar visualizações de dados muito legal, mas eles exigem que você código em linguagem de programação estatística R para ser capaz de usá-los.
Ficando brilhante por rstudio
Com o lançamento 2012 do pacote brilhante de rstudio, tanto a análise estatística e visualização de dados baseado na web pode ser realizada no mesmo quadro.
Se o seu objetivo é usar rapidamente algumas linhas de código para gerar instantaneamente uma aplicação de visualização de dados baseado na web, você pode usar o pacote brilhante de R fazer isso.
Traçando com rCharts
rCharts é um pacote de código aberto para R que leva seus dados e parâmetros como entrada, e depois converte rapidamente os a uma saída do bloco de código javascript. saídas de bloco de código de rCharts pode usar uma das muitas bibliotecas de visualização de dados javascript populares, incluindo NVD3, Highcharts, Richskaw, xCharts, Polychart, e Morris.
Video: Cientista de Dados – Dominando o Big Data com Software Livre
Para ver alguns exemplos de visualizações de dados criados usando rCharts, veja rCharts Gallery.
Mapeamento com rMaps
utilização rMaps, você pode criar chloropleths animados ou interativos, mapas de calor, ou mesmo mapas com anotações gotas de localização.
Se o seu objetivo é criar uma visualização de dados espaciais que tem sliders interativos que os usuários podem se mover para selecionar o intervalo de dados que eles querem ver, então rMaps oferece-lhe uma solução perfeita.
Confira mais raspagem, coleta e manipulação de ferramentas
Você pode usar web scraping para derivar conjuntos de dados muito interessantes e originais para as suas histórias baseadas em dados.
Raspagem de dados com Import.io
Import.io é uma aplicação desktop livre que, com apenas alguns cliques do mouse, você pode usar para copiar sem dor, pasta, limpo, e formatar qualquer parte de uma página web. Você ainda pode usar Import.io para rastrear e extrair dados de listas de várias páginas automaticamente.
Usando Import.io, você pode raspar dados de uma série simples ou complicado de páginas web:
Para raspar uma simples série de páginas web, aceder a eles através de links simples, na página 1, página 2, página 3,. . . Series.
Para desfazer uma complicada série de páginas da web, preencher um formulário ou escolher de uma lista drop-down, e enviar o seu pedido de raspagem para a ferramenta.
Recolher imagens com ImageQuilts
A tarefa ImageQuilts executa é enganosamente simples de descrever, mas muito complexo de implementar. ImageQuilts faz colagens de dezenas de imagens e peças-los todos juntos em um “quilt” que é composta de várias linhas de altura igual.
ImageQuilts ainda permite que você escolha a ordem das imagens ou para embaralhar eles. Você pode usar a ferramenta de arrastar e soltar qualquer imagem para qualquer lugar, remover uma imagem, zoom todas as imagens de uma vez, ou aproximar cada imagem individualmente.
Disputas de dados com DataWrangler
Os tipos de manipulações que você pode fazer com DataWrangler são semelhantes ao que você pode fazer em Excel usando Visual Basic. Um exemplo deste tipo de tarefa está usando DataWrangler ou Excel com Visual Basic para copiar, colar e informações de formato de listas na Internet.
DataWrangler é tão grande que sugere ações com base no seu conjunto de dados, e pode até mesmo repetir ações complexas através de conjuntos de dados inteiros.
Confira mais ferramentas de exploração de dados
A visualização é importante para esclarecer e comunicar o significado de seus dados, mas a análise de dados cuidado é ainda mais importante.
Falando sobre Tableau Public
Tableau Public é uma aplicação desktop livre que pretende ser um pacote completo para a tomada de gráfico. Tableau Public cria três níveis do documento:
Video: Ciência de dados: onde é aplicada?
planilha: A planilha é onde você pode criar gráficos individuais de dados que você importados do Access, Excel, ou um arquivo CSV text-format.
Painel de controle: Você pode usar um painel Tableau combinar gráficos com anotações de texto ou com outros gráficos de dados.
Video: O QUE É CIÊNCIA DE DADOS EM 5 MINUTOS - Explorar Big Data para prever o futuro
História: Com uma história Tableau, você pode combinar vários painéis em uma espécie de apresentação de slides que mostra uma história linear em seus dados.
Recebendo até a velocidade em Gephi
Gephi é um pacote de software de código aberto que você pode usar para criar layouts gráficos e, em seguida, manipulá-los para obter os resultados mais claros e eficazes. Os tipos de visualização baseada em conexão você pode criar em Gephi são muito úteis em todos os tipos análise de rede.
Este gráfico mostra que os caracteres apareçam no mesmo capítulo como outros caracteres que em imenso romance de Victor Hugo Os Miseráveis.
Aqui está um gráfico hairball da rede elétrica dos Estados Unidos, e os graus de interconexão entre milhares de instalações de geração e distribuição de energia.
aprendizagem de máquina com o conjunto WEKA
Waikato Ambiente para a análise do conhecimento (WEKA) É um aplicativo independente que você pode usar para analisar os padrões em seus conjuntos de dados e, em seguida, visualizar esses padrões em todos os tipos de formas interessantes. Para usuários avançados, o verdadeiro valor do WEKA é derivado de seu conjunto de algoritmos de aprendizado de máquina que você pode usar para agrupar ou categorizar seus dados.
Confira mais ferramentas de visualização baseados na web
Você pode usar uma variedade de aplicações web livre para gerar facilmente visualizações de dados originais e interessantes.
Video: Entrevista sobre Ciência de Dados com Ricardo Cappra
Ficando um pouco Weave na manga
Se o seu objetivo é criar visualizações que permitem que o seu público para ver e explorar a inter-relação entre os subconjuntos de seus dados, em seguida, Tecer é a ferramenta perfeita para este tipo de tarefa.
Aqui está uma visualização demo no próprio servidor do Weave. Descreve cada condado nos Estados Unidos, com muitas colunas de dados de que para escolher.
Verificando ofertas de visualização de dados de Knoema
Você pode usar Knoema de ferramentas de visualização de dados para criar visualizações que permitem o seu público para explorar facilmente os dados, drill down em áreas geográficas ou em diferentes indicadores, e automaticamente produzir cronogramas data-driven.
Aqui está um gráfico e uma tabela que foram gerados automaticamente com apenas dois cliques do mouse em Knoema.
Você pode usar Knoema para fazer seus próprios dashboards, também.
Você pode fazer dashboards a partir de seus próprios dados ou a partir de dados aberto no repositório de Knoema.