Agregar dados em qualquer nível com python

Você pode usar Python para agregar dados. Agregação é útil na ciência de dados. Agregação

é o processo de combinar ou agrupamento de dados em conjunto em um conjunto, saco, ou lista. Os dados podem ou não ser iguais. No entanto, na maioria dos casos, uma função de agregação combina várias linhas em conjunto estatisticamente usando algoritmos como média, contagem, máximo, mediana, mínimo, modo, ou soma. Há várias razões para agregar dados:

Video: Python Web Apps with Flask by Ezra Zigmond

  • Torná-lo mais fácil de analisar

  • Reduzir a capacidade de alguém para deduzir os dados de um indivíduo do conjunto de dados para a privacidade ou por outros motivos

  • Criar um elemento de dados combinados a partir de uma fonte de dados que corresponde a um elemento de dados combinado de outra fonte



O uso mais importante de agregação de dados é promover o anonimato, a fim de responder às preocupações legais ou outros. Às vezes até mesmo dados que devem ser anônimo acaba por fornecer a identificação de um indivíduo utilizando as técnicas de análise adequadas. Por exemplo, os pesquisadores descobriram que é possível identificar os indivíduos com base em apenas três compras com cartão de crédito. Aqui está um exemplo que mostra como executar tarefas de agregação:

Video: Curso de Python - Módulo Tkinter - Aula 4 - Gerenciador, widgets e eventos - eXcript

pandas importação como pddf = pd.DataFrame ({ `Map`: [0,0,0,1,1,2,2], `valores`: [1,2,3,5,4,2,5]} ) df [ `S`] = df.groupby ( `Mapa`) [ `Valores`]. transformar (np.sum) df [ `H`] = df.groupby ( `Mapa`) [ `Valores`]. transformar (np.mean) df [ `V`] = df.groupby ( `Mapa`) [ `Valores`]. transformar (np.var) df impressão

Neste caso, você tem duas características iniciais para esta Quadro de dados. Os valores em Mapa definir quais os elementos em valores pertencem juntos. Por exemplo, ao calcular uma soma de Mapa índice 0, você usa o valores 1, 2, e 3.

Para executar a agregação, você deve primeiro chamar groupby () para o grupo Mapa valores. Você, então, índice em valores e contar com transformar() para criar os dados agregados utilizando um dos vários algoritmos encontrados em NumPy, tal como np.sum. Aqui estão os resultados deste cálculo:

 Mapa Valores S M V0 0 1 6 2,0 1,01 0 2 6 2,0 1,02 0 3 6 2,0 1,03 1 5 9 4,5 0,54 1 4 9 4,5 0,55 2 2 7 3,5 4,56 2 5 7 3,5 4,5

Publicações relacionadas