Usando o ecossistema python para a ciência de dados

Você precisa carregar bibliotecas, a fim de executar tarefas de ciência de dados em Python. Aqui está uma visão geral das bibliotecas que você pode usar para a ciência de dados. Estas bibliotecas podem desempenhar múltiplas funções para o cientista de dados.

Acessando ferramentas científicas usando SciPy

o pilha SciPy contém uma série de outras bibliotecas que você também pode fazer o download separadamente. Essas bibliotecas fornecem suporte para a matemática, ciência e engenharia. Quando você obter SciPy, você recebe um conjunto de bibliotecas projetados para trabalhar em conjunto para criar aplicações de vários tipos. Essas bibliotecas são

  • NumPy

    Video: Aulas Python - 147 - Bancos de Dados I: Introdução

  • SciPy

  • matplotlib

    Video: 04 - Python - Scripts e entrada de dados

  • IPython

  • SymPy

  • pandas

A biblioteca SciPy-se centra-se em rotinas numéricos, como rotinas para integração numérica e otimização. SciPy é uma biblioteca de uso geral que fornece funcionalidade para domínios vários problemas. Ele também fornece suporte para bibliotecas específicas de domínio, tais como scikit-learn, Scikit-imagem, e statsmodels.

Realizando computação científica fundamental usando NumPy

o biblioteca NumPy fornece os meios para a realização de manipulação de matriz n-dimensional, que é crítico para o trabalho ciência dados. Você não poderia facilmente acessar n-dimensional matrizes sem funções numpy que incluem o suporte para álgebra linear, transformada de Fourier, e a geração de números aleatórios.

Realizar análise de dados usando pandas



o biblioteca pandas fornece suporte para estruturas de dados e ferramentas de análise de dados. A biblioteca é otimizado para executar tarefas de ciência de dados especialmente rápido e eficiente. O princípio básico por trás pandas é fornecer análise de dados e suporte a modelagem para Python que é semelhante a outras línguas, como R.

A concretização da aprendizagem máquina usando scikit-learn

o Scikit-learn biblioteca é um de uma série de bibliotecas Scikit que construir sobre os recursos fornecidos pelo NumPy e SciPy para permitir que desenvolvedores de Python para executar tarefas específicas de domínio. Neste caso, a biblioteca centra-se na mineração de dados e análise de dados. Ele fornece acesso aos seguintes tipos de funcionalidade:

  • Classificação

  • Regressão

  • Clustering

  • redução de dimensionalidade

  • seleção de modelos

  • Pré-processando

O desenho dos dados utilizando matplotlib

o biblioteca matplotlib fornece-lhe com uma interface MATLAB-like para a criação de apresentações de dados da análise que você executa. A biblioteca está actualmente limitada a saída 2D, mas ainda fornece-lhe os meios para expressar graficamente os padrões de dados que você vê nos dados que você analisar. Sem esta biblioteca, você não pode criar uma saída que as pessoas fora da comunidade científica de dados poderia facilmente entender.

Analisar documentos HTML usando Beautiful Soup

o biblioteca Beautiful Soup download é realmente encontrado na website Python. Esta biblioteca fornece os meios para analisar dados de HTML ou XML de uma maneira que Python entende. Ele permite que você trabalhe com dados baseados em árvores.

Além de proporcionar um meio para trabalhar com dados baseados em árvore, bonito Soup tem um monte de trabalho fora de trabalhar com documentos HTML. Por exemplo, ele automaticamente converte a codificação (A maneira pela qual os caracteres são armazenadas em um documento) de documentos HTML de UTF-8 para Unicode. Um desenvolvedor Python normalmente precisa se preocupar com coisas como a codificação, mas com Beautiful Soup, você pode se concentrar em seu código em vez.


Publicações relacionadas