Técnicas utilizadas na codificação empregos para decodificar dados com r e python
Você pode ser solicitado para decodificar os dados em um trabalho de codificação. Inúmeras ferramentas podem ser usadas para analisar os dados. Além de Python, você pode ter ouvido de R, SAS, Stata e SPSS. O SPSS não tem todas as capacidades de outras ferramentas, mas os novatos podem usá-lo para realizar tarefas simples estatísticos facilmente.
Conteúdo
SAS e Stata, que são linguagens de programação, são poderosos para alguns tipos de tarefas, mas pode ser limitada para análise de dados mais avançado. Geralmente, R e Python são consideradas as línguas mais poderosas de usar para análise de dados moderna. Ambas as línguas têm fortes capacidades estatísticas, maior funcionalidade através de pacotes externos e bibliotecas, e uma crescente comunidade de usuários que fornecem suporte.
Usando R para a análise de dados
R é uma linguagem de programação desenvolvida no início de 1990. Criado para os estatísticos, a língua rapidamente se espalhou para outras áreas como finanças, biologia, epidemiologia e ciências sociais. R tem alguns atributos que contribuíram para sua popularidade:
Video: Python 3 Programming Tutorial - Regular Expressions / Regex with re
livre e open source: Baixar R e usá-lo sem nenhum custo. É difícil de bater livre, especialmente quando SAS, Stata e SPSS carga tanto para o pacote de software ou licenças anuais para usar o software. (A taxa muitas vezes inclui suporte técnico.) R também permite modificar livremente o software.
interoperável: Interface de R com outros pacotes estatísticos como SAS, Stata e SPSS.
Multi plataforma: Use R em uma variedade de sistemas operacionais, incluindo sistemas operacionais Windows, Mac e Unix.
Video: Python Programming Tutorial - 26 - Regular Expression in Python
visualizações: R vem com capacidades de visualização internas que tornam mais fácil para criar coloridos, profissionais gráficos olhando e gráficos.
funcionalidade expandida: Baixar pacotes disponíveis gratuitamente que adicionam funcionalidades e características, tais como limpeza de texto, visualização e mapeamento de geolocalização.
R usa uma linha de comando interface- você digitar seu código uma linha de cada vez. Você também pode armazenar o código em um arquivo de script e referenciá-lo quando necessário. R é feita mais amigável por um número de editores de código e interfaces gráficas de usuário, incluindo rstudio, e R comandante.
Usando Python para análise de dados
Python é uma linguagem de programação de uso geral que foi desenvolvido em 1989 e tornou-se popular para aplicação, desenvolvimento web, jogos e análise de dados. Grande parte da força de Python na análise de dados vem de bibliotecas de código externas que têm expandido a funcionalidade do Python, e a comunidade de usuários que continuar a apoiar e manter essas bibliotecas. Em comparação com R, Python é semelhante em muitos aspectos que o tornam popular entre os cientistas de dados, incluindo o seguinte:
Video: Python Advanced Tutorial 4 - Regular Expressions
livre e open source: Faça o download e usar Python para livre, e modificar livremente o programa.
interoperável: Use plug-ins para integrar Python com outros pacotes estatísticos, como SAS, Stata e SPSS. Note, no entanto, que essas integrações são experimentais em muitos casos.
Multi plataforma: Executar Python em uma variedade de sistemas operacionais como Windows, Macintosh e Unix.
visualizações: Python inclui suporte para gráficos e tabelas, mas não é tão desenvolvido como R. No entanto, esta funcionalidade está melhorando através do uso de APIs externas.
funcionalidade expandida: Expandir recurso do Python definida através da instalação de bibliotecas. Esta capacidade é a maior força do Python devido às bibliotecas Python sofisticados e bem desenvolvidos que estão disponíveis, tais como o seguinte:
NumPy: Executa o cálculo de álgebra linear, e é exigido por muitas outras bibliotecas
SciPy: baseia-se as bibliotecas Numpy e faz processamento de integração, otimização e de sinal e imagem
Pandas: lida com dados de séries temporais e trabalha com grande conjuntos- dados replica muito da funcionalidade do R
Scikit-learn: Usado para mineração de dados e análise de dados, incluindo regressões e mais complexa técnica de aprendizado de máquina
Se você está se perguntando se a aprender R ou Python em primeiro lugar, pensar em seu objetivo e qual projeto que você deseja concluir. Em seguida, fazer alguma pesquisa para encontrar o idioma preferido por seu empregador ou colegas de trabalho e a língua em que outros projetos semelhantes foram codificados. Além disso, verifique os fóruns on-line para discussões relevantes para a sua área de tópico ou objetivo.
Você pode ver um exemplo de Python e R usado para resolver o mesmo problema, com todos os passos de configuração para conclusão. No post no Lab Swarm, os autores criaram um gráfico dos top 25 filmes mais violentos, ordenados por número de mortes de tela por minuto, usando Python e R.