Como resumir um conjunto de dados em r
Se você precisar de uma rápida visão geral do conjunto de dados, você pode, é claro, sempre use o comando R str ()
Conteúdo
Como chegar a saída
Para ter uma idéia melhor da distribuição das suas variáveis no conjunto de dados, você pode usar o resumo() funcionar como este:
gt; resumo (carros) am gearMin mpg cil. : 10,40 min. : 4,000 auto: 13 3: 151 Qu.:15.43 1 Qu.:4.000 manual: 19 4: 12Median: 19,20 Mediana: 6,0005: 5Mean: 20,09 Média: 6.1883rd Qu.:22.80 3 Qu.:8.000Max. : 33.90 Max. : 8.000
o resumo() função funciona melhor se você usar apenas R interativamente na linha de comando para a digitalização de seu conjunto de dados rapidamente. Você não deve tentar usá-lo dentro de uma função personalizada que você escreveu-se.
Video: Interpretação de Gráficos e Tabelas - Aula 1
A saída do resumo() página mostra para cada variável de um conjunto de estatísticas descritivas, dependendo do tipo da variável:
As variáveis numéricas: resumo() dá-lhe a gama, quartis, a mediana ea média.
variáveis fator: resumo() dá-lhe uma tabela com freqüências.
Numéricos e fator de variáveis: resumo() dá-lhe o número de valores em falta, se houver algum.
variáveis de caracteres: resumo() não lhe dá qualquer tipo de informação para além do comprimento e da classe (que é `personagem`).
Como corrigir um problema
Você viu os valores estranhos para a variável cil? Um rápido olhar para o resumo posso dizer-lhe que há algo suspeito acontecendo, como, por exemplo, o mínimo eo primeiro quartil têm exatamente o mesmo valor. Na verdade, a variável cil tem apenas três valores e seria melhor como um fator. Então, vamos colocar essa variável fora de sua miséria:
Video: Importar conjunto de dados do Excel usando R Commander L2 ex 3_p1
gt; carros $ cil lt; - as.factor (carros $ CYL)