Como resumir um conjunto de dados em r

Se você precisar de uma rápida visão geral do conjunto de dados, você pode, é claro, sempre use o comando R str ()

e olhar para a estrutura. Mas isto diz-lhe algo que apenas sobre as classes de suas variáveis ​​e o número de observações. Além disso, a função cabeça() dá-lhe, na melhor das hipóteses, uma idéia da forma como os dados são armazenados no conjunto de dados.

Como chegar a saída

Para ter uma idéia melhor da distribuição das suas variáveis ​​no conjunto de dados, você pode usar o resumo() funcionar como este:

gt; resumo (carros) am gearMin mpg cil. : 10,40 min. : 4,000 auto: 13 3: 151 Qu.:15.43 1 Qu.:4.000 manual: 19 4: 12Median: 19,20 Mediana: 6,0005: 5Mean: 20,09 Média: 6.1883rd Qu.:22.80 3 Qu.:8.000Max. : 33.90 Max. : 8.000

o resumo() função funciona melhor se você usar apenas R interativamente na linha de comando para a digitalização de seu conjunto de dados rapidamente. Você não deve tentar usá-lo dentro de uma função personalizada que você escreveu-se.

Video: Interpretação de Gráficos e Tabelas - Aula 1

A saída do resumo() página mostra para cada variável de um conjunto de estatísticas descritivas, dependendo do tipo da variável:



  • As variáveis ​​numéricas: resumo() dá-lhe a gama, quartis, a mediana ea média.

  • variáveis ​​fator: resumo() dá-lhe uma tabela com freqüências.

  • Numéricos e fator de variáveis: resumo() dá-lhe o número de valores em falta, se houver algum.

  • variáveis ​​de caracteres: resumo() não lhe dá qualquer tipo de informação para além do comprimento e da classe (que é `personagem`).

Como corrigir um problema

Você viu os valores estranhos para a variável cil? Um rápido olhar para o resumo posso dizer-lhe que há algo suspeito acontecendo, como, por exemplo, o mínimo eo primeiro quartil têm exatamente o mesmo valor. Na verdade, a variável cil tem apenas três valores e seria melhor como um fator. Então, vamos colocar essa variável fora de sua miséria:

Video: Importar conjunto de dados do Excel usando R Commander L2 ex 3_p1

gt; carros $ cil lt; - as.factor (carros $ CYL)

Publicações relacionadas