Como converter dados para formato largo no r

Se você tem um dataset fundido

(Um conjunto de dados em formato longo), você está pronto para remodelá-lo com R. Para ilustrar que o processo de reformulação mantém todos os seus dados intactos, tentar reconstruir o original:

gt; dcast (mgoals, Venue + Game ~ variável, sum) Jogo Local Granny Geraldine Gertrude1 1º Bruges 12 5112 2ª Ghent 4 453 3 Ghent 5 264 4 Bruges 6 47

você pode ver como dcast () toma uma fórmula como seu segundo argumento? Mais sobre isso em um minuto, mas primeiro inspecionar seus resultados. Ele deve corresponder a estrutura de dados original.

Video: Como Recuperar Dados hd corrompido formatado ou Formato RAW

Em seguida, você pode querer fazer algo mais interessante - por exemplo, criar um resumo por local e jogador.

Você usa o dcast () função para lançar uma trama de dados fundido. Para ser claro, você usar isso para converter de um formato longo para um formato de largura, mas você também pode usar isso para agregar em formatos intermediários, semelhante à maneira como uma tabela dinâmica funciona.

Video: Como Converter Arquivos de Audio de Qualquer Formato para Qualquer Formato!

o dcast () função recebe três argumentos:

  • dados: Um quadro de dados fundido.

  • Fórmula: Uma fórmula que especifica como você deseja lançar os dados. Esta fórmula tem a forma x_variable ~ y_variable. Mas é simplificado-lo para fazer um ponto. Você pode usar múltiplos X-variáveis, múltiplos y-variáveis ​​e até mesmo z-variáveis.

  • fun.aggregate: Uma função de utilizar, se a fórmula de fundição resulta em agregação de dados (por exemplo, comprimento(), soma(), ou significar()).

Assim, para obter esse resumo de local contra jogador, você precisa usar dcast () com uma fórmula de fundição variável ~ Local. Note-se que a fórmula de vazamento refere-se a colunas no seu quadro de dados fundido:



gt; dcast (mgoals, variável ~ Local, soma) variável Bruges Ghent1 Granny 18 92 Geraldine 9 63 18 11 Gertrude

Se você deseja obter uma tabela com o local correndo as linhas e o jogador através das colunas, a sua fórmula de fundição deve ser Local ~ variável:

gt; dcast (mgoals, Local ~ variável, soma) Local Granny Geraldine Gertrude1 Bruges 18 9182 Ghent 9 611

É realmente possível ter fórmulas de fundição mais complicados. De acordo com a página de ajuda para dcast (), a fórmula fundição leva este formato:

x_variable + x_2 ~ y_variable + y_2 ~ z_variable ~ ...

Observe que você pode combinar diversas variáveis ​​em cada dimensão com o sinal de adição (+), E você separar cada dimensão com um til (~). Além disso, se você tiver dois ou mais tiles na fórmula (isto é, você incluir um z-variável), o resultado será uma matriz multidimensional.

Video: Como Converter Vídeos de Qualquer Formato para Qualquer Formato de Forma Fácil e Rápida!!!

Assim, para obter um resumo das metas, Local, jogador (variável), E jogos, você faça o seguinte:

gt; dcast (mgoals, Venue + variável ~ Jogo, sum) Venue variável 1º 2º 3º 4th1 Bruges Granny 12 0 0 62 Bruges Geraldine 5 0 0 43 Bruges Gertrude 11 0 0 74 Ghent Granny 0 4 5 05 Ghent Geraldine 0 4 2 06 Ghent Gertrude 0 5 0 6

Uma das razões que você deve compreender dados em formato longo é que ambos os pacotes gráficos gelosia e ggplot2 fazem uso extensivo de dados de formato longo. A vantagem é que você pode facilmente criar gráficos de seus dados que compara diferentes subgrupos.

gt; biblioteca (ggplot2) gt; ggplot (mgoals, AES (x = variável, y = valor, encher = Jogo)) + geom_bar ()

Publicações relacionadas