10 Recursos fenomenal para dados abertos

Dados abertos é parte de uma tendência maior para uma compreensão menos restritiva, mais aberto à ideia de propriedade intelectual, uma tendência que está ganhando enorme popularidade ao longo da última década. dados abertos

é os dados que foram disponibilizados ao público e é permitido para ser usado, reutilizado, construída sobre, e compartilhado com os outros. Dados abertos é parte do movimento aberto.

Além dados abertos, este apropriadamente chamado movimento aberto também inclui software open-source, hardware aberto, o trabalho criativo de conteúdo aberto, acesso aberto a publicações científicas, ea ciência aberta - todos comprometidos com a noção de que o conteúdo (incluindo dados brutos de experimentos) devem ser compartilhadas livremente.

A característica distintiva de licenças abertas é que eles têm copyleft, em vez de direitos de autor. Com copyleft, A única restrição é que a fonte do trabalho devem ser identificados, por vezes, com a ressalva de que trabalhos derivados não pode ser protegido por direitos autorais com uma licença mais restritiva do que o original. Se a segunda condição se encontra em vigor, comercializando com sucesso o trabalho em si torna-se difícil, embora as pessoas muitas vezes encontrar muitas outras, avenidas criativas indiretas de comercialização.

Esteja ciente de que, por vezes, trabalho que é rotulado como aberta pode não se encaixam na definição aceita. Você é responsável para verificar os direitos de licenciamento e restrições de dados aberto que você usa.

As pessoas muitas vezes confundem aberto licenças com licenças Creative Commons. Creative Commons é uma organização sem fins lucrativos que é dedicada a incentivar e divulgar trabalhos criativos, oferecendo um quadro jurídico através do qual as permissões de uso pode ser concedido e obtido, de modo que as partes de partilha estão a salvo de riscos legais quando desenvolvendo e utilizando trabalho e conhecimento que tem sido abertamente compartilhado. Algumas licenças Creative Commons são abertos, e alguns proíbem explicitamente obras e / ou comercialização de derivados.

Como parte das recentes iniciativas do governo mais aberto, os governos de todo o mundo começou a lançar dados do governo aberto. Os governos geralmente fornecem esses dados para que ele possa ser usado por analistas voluntários e hackers cívicos - programadores que trabalham em colaboração para construir soluções de código aberto que usam dados abertos para resolver problemas sociais - em um esforço para beneficiar a sociedade em geral. Em 2013, o G8 (França, Estados Unidos, Reino Unido, Rússia, Alemanha, Japão, Itália e Canadá) assinaram uma carta comprometendo-se a abrir os dados, priorizando as áreas de estatísticas nacionais, resultados eleitorais, os orçamentos governamentais, e mapas nacionais.

O movimento do governo aberta promove a transparência e responsabilidade do governo, nutre um eleitorado bem informado, e incentiva o engajamento público. Para colocá-lo em termos de computação, um governo aberto facilita uma relação de leitura / gravação entre um governo e seus cidadãos.

Vasculhando data.gov

o programa Data.gov foi iniciado pela administração Obama para fornecer acesso aberto a dados do governo nonclassified dos EUA. dados Data.gov está sendo produzido por todos os departamentos do Poder Executivo - A Casa Branca e todos os departamentos em nível de gabinete -, bem como conjuntos de dados de outros níveis de governo. Em meados de 2014, você poderia procurar por mais de 100.000 conjuntos de dados usando a busca Data.gov. O site é um recurso sem precedentes, se você está à procura de dados derivados do governo americano sobre os seguintes indicadores:

  • Econômico
  • De Meio Ambiente
  • indústria STEM
  • Qualidade de vida
  • Legal

Verificando para fora Canadá Open Data

Se você der uma olhada na Canadá Site do Open Data, forte compromisso da nação para os dados é esmagadoramente evidente. No site do Canadá Open Data, você pode encontrar mais de 200.000 conjuntos de dados. Entre as 25 ofertas mais populares no local do Canadá Dados Abertos são conjuntos de dados que abrangem os seguintes indicadores:

  • De Meio Ambiente
  • Cidadania
  • Qualidade de vida

Mergulho em data.gov.uk

O Reino Unido teve um início tardio no movimento um governo aberto. Data.gov.uk foi iniciado em 2010, e em meados de 2014, apenas cerca de 20.000 conjuntos de dados foram ainda disponível. Como Data.gov, data.gov.uk também é alimentado pelo catálogo de dados CKAN.

Embora data.gov.uk ainda está jogando catch-up, ele tem uma impressionante coleção de Ordnance Survey mapas idade suficiente - 50 anos ou mais - estar fora de copyright. Se você está procurando, mapas da pesquisa free-to-use de renome mundial, data.gov.uk é um lugar incrível para explorar. Além de seus mapas de levantamento estelares, data.gov.uk é uma fonte útil de dados sobre os seguintes indicadores:

  • De Meio Ambiente (Tema mais prolífico de data.gov.uk)
  • Gastos públicos
  • social
  • Saúde
  • Educação
  • Negócios e Economia

Checking Out EUA Census Bureau dados

o Census EUA é realizado a cada dez anos, e desde 2010, os dados foram disponibilizados gratuitamente. As estatísticas estão disponíveis para baixo ao nível do bloco de censo - que agrega pela contagem de 30 pessoas, em média. Os dados demográficos fornecidos pelos os EUA Census Bureau pode ser extremamente útil se você estiver fazendo marketing ou publicidade de pesquisa e necessidade de seu público-alvo de acordo com as seguintes classificações:

  • Era
  • renda média anual
  • tamanho do agregado familiar
  • Sexo ou raça
  • Nível de educação

Sabendo Dados NASA

Desde a sua criação em 1958, a NASA tornou público todos os seus dados de projeto nonclassified. Foi no jogo-de dados aberto tanto tempo que a NASA tem toneladas de dados! conjuntos de dados da NASA têm vindo a crescer ainda mais rápido com as recentes melhorias na via satélite e tecnologia de comunicação. Na verdade, a NASA agora gera 4 terabytes de novos dados, ciências da terra por dia - o que equivale a mais de um milhão de arquivos MP3. Muitos dos projetos da NASA ter acumulado dados para o intervalo petabyte.

Video: Minicurso - Estudos socioeconômicos utilizando dados abertos do censo IBGE e software livre

portal de dados abertos da NASA é chamada de dados. Este portal é uma fonte de todos os tipos de dados maravilhosas, incluindo dados sobre

  • Astronomia e espaço (é claro!)
  • Clima
  • Ciências da Vida
  • Geologia
  • Engenharia

Wrangling Dados do Banco Mundial

O Banco Mundial é uma instituição financeira internacional administrado pela Organização das Nações Unidas. Ele fornece empréstimos aos países em desenvolvimento para pagar o investimento de capital que vai levar (espera-se) para redução da pobreza e algum excedente para que as nações receptoras podem reembolsar os montantes de empréstimo ao longo do tempo. Porque os oficiais do Banco Mundial precisam para tomar decisões bem informadas sobre quais países seriam mais propensos a pagar os seus empréstimos, eles já se reuniram uma enorme quantidade de dados sobre os países membros. Eles fizeram esses dados disponíveis ao público na página Banco Mundial Open Data.

Video: Últimas - Brasil sobe quatro posições em ranking internacional de dados abertos



Se você está à procura de dados para reforçar seu argumento em uma peça-jornalismo de dados verdadeiramente interessante que é apoiada por estatísticas globais, o Banco Mundial deveria ser o seu go-to-fonte. Não importa o escopo do seu projeto, se você precisa de dados sobre o que está acontecendo nos países em desenvolvimento, o Banco Mundial é o lugar para ir. Você pode usar o site para baixar conjuntos de dados inteiros ou simplesmente ver as visualizações de dados online. Você também pode usar API Open Data do Banco Mundial para acessar o que você precisa.

Banco Mundial Open Data fornece dados sobre os seguintes indicadores (e muitos, muitos mais):

  • Agricultura e desenvolvimento rural
  • Economia e crescimento
  • Meio Ambiente
  • Ciência e Tecnologia
  • Setor financeiro
  • renda pobreza

Dados do Banco Mundial também inclui microdados - inquéritos por amostragem de domicílios e empresas em países em desenvolvimento. Você pode usar microdados para explorar variações em seus conjuntos de dados.

Conhecendo Knoema Dados

Knoema (pronuncia-se “no-mah”) pretende ser o maior repositório de dados públicos na web. A plataforma Knoema abriga um escalonamento mais de 500 bases de dados, além de sua 150 milhões séries temporais - 150 milhões de conjuntos de dados sobre valores de atributos ao longo do tempo, em outras palavras. Knoema inclui, mas não está limitado a, todas essas fontes de dados:

  • Dados do governo das nações industriais
  • dados públicos nacionais de países em desenvolvimento
  • dados das Nações Unidas
  • Dados da Organização Internacional
  • dados corporativos de empresas globais

Knoema é um excelente recurso se você está à procura de dados internacionais sobre a agricultura, as estatísticas de criminalidade, demografia, economia, educação, energia, meio ambiente, segurança alimentar, comércio exterior, saúde, uso da terra, a defesa nacional, a pobreza, a investigação e desenvolvimento, telecomunicações , turismo, transporte, ou água.

Além de ser uma fonte de dados incrível, Knoema é uma plataforma tasking multifacetada. Você pode usar a plataforma Knoema fazer dashboards que rastreiam automaticamente todos os seus conjuntos de dados favoritas. Você pode usar ferramentas de visualização de dados da plataforma para ver rapidamente e facilmente seus dados em um formato tabular ou mapa. Você pode usar o Atlas de Dados Knoema para perfurar para baixo entre as categorias e / ou regiões geográficas e rapidamente acessar os conjuntos de dados específicos que você precisa. Como indivíduo, você pode fazer upload de seus próprios dados e usar Knoema como um serviço gratuito de hospedagem. Acima e além de tudo isso, Knoema oferece ainda o Mercado Knoema - um lugar onde você pode ir para receber o pagamento apenas para fazer parte de projetos orientados a dados.

Embora uma grande quantidade de dados de Knoema é muito geral, você ainda pode encontrar alguns dados surpreendentemente específicos também. Se você está tendo um momento difícil localizar dados sobre um tópico específico, você pode ter sorte encontrar na plataforma Knoema. A figura ilustra o quão específico de dados Knoema pode ser.

-Ciência de dados-insetos
O índice de registros de insetos em busca de Knoema.

Fila com Quandl Dados

Quandl é um site baseado em Toronto que pretende ser um motor de busca para dados numéricos. Diferentemente da maioria dos motores de busca, no entanto, seu banco de dados não é gerado automaticamente por aranhas que vasculha a web. Em vez disso, concentra-se em dados vinculados que é atualizado via crowdsourcing - atualizado manualmente via curadores humanos, em outras palavras.

Video: Aula 9. Transparência Ativa e Dados Abertos

Porque a maioria de dados financeiros é em formato numérico, Quandl é uma excelente ferramenta para ficar up-to-date sobre as últimas informática de negócios. Como você pode ver, uma pesquisa por maçã retornos mais de 4.700 conjuntos de dados de 11 fontes diferentes com séries temporais no, trimestral ou nível diário, semanal, mensal anual. Muitos destes resultados estão relacionados com os dados agrícolas das Nações Unidas. Se você está à procura de dados em computadores Apple, você pode restringir o escopo de sua pesquisa, substituindo o maçã termo de pesquisa com o estoque abreviatura da empresa, AAPL.

data-ciência-maçã
O índice da Apple registra em busca Quandl.

O banco de dados Quandl inclui links para mais de 10 milhões conjuntos de dados (embora ele usa uma métrica generoso em declarar o que distingue um conjunto de dados de outra). ligações Quandl para 2,1 milhões de conjuntos de dados da ONU e muitas outras fontes, incluindo conjuntos de dados no Data Project Open Financial, os bancos centrais, organizações do setor imobiliário, e think tanks bem conhecidos.

Explorando Exversion Dados

Modelado após GitHub - a plataforma hospedada em nuvem através da qual os programadores podem colaborativa compartilhar e código de revisão - Exversion visa proporcionar a mesma funcionalidade de colaboração em torno de dados que GitHub fornece em torno do código. A plataforma Exversion oferece funcionalidade de controle de versão e serviços de hospedagem para o qual você pode enviar e compartilhar seus dados. Para ilustrar como Exversion funciona, imagine uma plataforma que lhe permitiria primeiro garfo (Ou cópia) um conjunto de dados e faça as alterações desejadas. Exversion estaria lá para acompanhar o que mudou a partir do conjunto original e todas as mudanças que você faz para ele. Exversion também permite que os usuários avaliem, revisar e comentar sobre conjuntos de dados.

Conjuntos de dados hospedados na plataforma Exversion são prestados por um usuário ou criado por uma aranha que rastreia e dados índices abertas para torná-lo pesquisável a partir de uma interface de programação de aplicação única (API). Como GitHub, com uma conta de usuário grátis, todos os dados que você enviar para Exversion é público. Se você está disposto a pagar por uma conta, você pode criar seus próprios, repositórios de dados privados. Além disso, com a conta paga, você tem a opção de compartilhar seus dados com usuários selecionados para projetos colaborativos.

Mapeamento OpenStreetMap Dados Espaciais

OpenStreetMap (OSM) é uma alternativa aberta, crowdsourced para produtos de mapeamento comerciais, como o Google Maps e ESRI ArcGIS Online. Em OSM, os usuários criar, enviar, ou digitalizar dados geográficos para o repositório central.

A plataforma OSM é bastante robusto. Governos e empresas privadas já começaram a contribuir para, e puxando a partir, os conjuntos de dados compartilhados. Mesmo empresas grandes como a Apple estão contando com os dados do OSM. OSM agora tem mais de 1 milhão de usuários registrados. Para ilustrar como uma pessoa pode criar dados em OSM, imagine que alguém liga os sistemas de GPS em seu telefone móvel para a aplicação OSM. Devido a esta autorização, OSM pode rastrear automaticamente as rotas de estradas, enquanto a pessoa viaja. Mais tarde, essa pessoa (ou outro usuário OSM) pode ir para a plataforma on-line OSM para verificar e rotular as rotas.

Os dados da OSM não é armazenada como mapas, mas como geométricas e texto representações - pontos, linhas, polígonos e mapa anotação - para que todos os dados do OSM pode ser rapidamente baixado do site e facilmente montado em uma representação cartográfica via um desktop aplicação.


Publicações relacionadas