Diferentes abordagens para a análise de dados grande
Em muitos casos, a análise de dados grande será representado para o usuário final por meio de relatórios e visualizações. Porque os dados brutos pode ser incomprehensively variada, você terá que contar com ferramentas e técnicas de análise para ajudar a apresentar os dados de forma significativa.
Conteúdo
Novas aplicações estão chegando disponível e vai cair amplamente em duas categorias: costume ou semi-custom.
aplicativos personalizados para análise de dados grande
Em geral, um aplicativo personalizado é criado para uma finalidade específica ou um conjunto relacionado de propósitos. Para análise dos dados grande, o propósito de desenvolvimento de aplicações customizadas é acelerar o tempo para decisão ou ação.
ambiente: R
O ambiente de “R” é baseado no “S” estatísticas e análise de linguagem desenvolvida na década de 1990 por Bell Laboratories. Ele é mantido pelo projeto GNU e está disponível sob a licença GNU.
Embora difícil de compreender plenamente, a sua profundidade e flexibilidade torná-lo uma opção atraente para desenvolvedores de aplicações analíticas e “usuários de poder”. Além disso, o projeto CRAN R mantém um conjunto mundial de servidores de protocolo e web transferência de arquivos com o mais up-to versões mais actualizadas do ambiente r. Um comercialmente suportado, versão da empresa de R também está disponível a partir de Revolution Analytics.
Mais especificamente, R é um conjunto integrado de ferramentas de software e tecnologias destinados a criar aplicativos personalizados usados para facilitar a manipulação de dados, cálculo, análise e apresentação visual. Entre outros recursos avançados, ele suporta
-Tratamento de dados e de manipulação de componentes eficazes.
Operadores de cálculos em arrays e outros tipos de dados ordenados.
Ferramentas específicas para uma ampla variedade de análises de dados.
Video: aula 1- R studio Análise de Dados
capacidades avançadas de visualização.
linguagem de programação S projetado por programadores, para programadores com muitas construções familiares, incluindo condicionais, loops, funções recursivas definidas pelo usuário, e uma ampla gama de instalações de entrada e saída.
R é bem adequado para uso único, aplicativos personalizados para análise de fontes de dados grandes.
Google API de Previsão
API de Previsão da Google é um exemplo de uma classe emergente de grandes ferramentas de aplicação de análise de dados. Ele está disponível no site do Google Developers e está bem documentado e fornecido com vários mecanismos de acesso usando diferentes linguagens de programação. Para ajudar você a começar, ele está disponível gratuitamente por seis meses.
A API de Previsão é bastante simples. Ele procura por padrões e combina-os a padrões prescritiva, prescritivos, ou outros já existentes. Durante a execução de sua correspondência padrão, ele também “aprende”. Quanto mais você usá-lo, o mais esperto ele fica.
Previsão é implementado como uma API RESTful com suporte de idioma para .NET, Java, PHP, javascript, Python, Ruby, e muitos outros. O Google também fornece scripts para acessar a API, bem como uma biblioteca cliente para R.
análise preditiva é uma das mais poderosas capacidades potenciais de dados grandes e API de Previsão da Google é uma ferramenta muito útil para a criação de aplicações personalizadas.
Video: Curso Introdução à Análise de Dados para Biólogos da Conservação
aplicações semi-personalizados para análise de dados grande
Na verdade, o que muitas pessoas percebem como aplicativos personalizados são realmente criadas usando componentes “embalado” ou de terceiros, como bibliotecas. Nem sempre é necessário para codificar completamente uma nova aplicação. Usando aplicativos ou componentes embalados requer que os desenvolvedores ou analistas para escrever código para “unidos” esses componentes em uma aplicação personalizada trabalhando. A seguir, são razões pelas quais esta é uma boa abordagem:
Velocidade de implantação: Porque você não tem que escrever cada parte do aplicativo, o tempo de desenvolvimento pode ser bastante reduzido.
Video: Estatística Descritiva no Excel usando suplemento Análise de Dados
Estabilidade: Usando bem construídos, confiáveis e componentes de terceiros pode ajudar a tornar o aplicativo personalizado mais resistente.
Melhor qualidade: componentes embalados são frequentemente sujeitos a padrões mais elevados de qualidade, porque eles são implantados em uma grande variedade de ambientes e domínios.
Mais flexibilidade: Se um componente melhor aparecer, pode ser trocado para o aplicativo, estendendo a vida, adaptabilidade e utilidade do aplicativo personalizado.
Outro tipo de aplicação semi-custom é aquele em que o código fonte está disponível e é modificado para um propósito particular. Esta pode ser uma abordagem eficiente porque há muito poucos exemplos de blocos de construção de aplicação disponível para incorporar em sua aplicação semi-custom:
TA-Lib: A biblioteca de análise técnica é amplamente utilizado por desenvolvedores de software que precisam para realizar a análise técnica dos dados do mercado financeiro. Ele está disponível como código aberto sob a licença BSD, que lhe permite ser integrada nas aplicações semi-personalizadas.
JUNG: O framework Java Universal Gráfico de Rede é uma biblioteca que fornece um quadro comum para análise e visualização de dados que pode ser representado por um gráfico ou rede. É útil para análise de redes sociais, as medidas de importância, e mineração de dados. Ele está disponível como código aberto sob a licença BSD.
GeoTools: Um conjunto de ferramentas geoespaciais de código aberto para manipulação de dados GIS em muitas formas, analisando atributos espaciais e não-espaciais ou dados GIS, e criar gráficos e redes de dados. Ele está disponível sob a licença GPL2, permitindo a integração em aplicações semi-personalizadas.