Como contar valores de dados únicos em r

Para descobrir o que os dados podem ser tidos quando se trabalha em R, vamos dar uma olhada no conjunto de dados mtcars

. Este conjunto de dados built-in descreve o consumo de combustível e dez pontos diferentes do projeto de 32 carros da década de 1970. Ele contém, no total, 11 variáveis, mas todos eles são numéricos.

Video: GRINGS - Média e Mediana dados agrupados aula 5

Embora você possa trabalhar com o quadro de dados como está, algumas variáveis ​​podem ser convertidos em um fator, porque eles têm uma quantidade limitada de valores.

Se você não sabe quantos valores diferentes de uma variável tem, você pode obter essas informações em duas etapas simples:

Video: contar numeros repetidos no excel.avi

  1. Obter os valores exclusivos da variável usando único().

    Video: MS Excel - Macros - contar valores repetidos e eliminar linhas vazias em um intervalo

  2. Obter o comprimento do vector resultante usando comprimento().



usando o sapply () função, você pode fazer isso para todo o quadro de dados ao mesmo tempo. Você aplica uma função anônima combinando as duas etapas mencionadas em toda a estrutura de dados, como este:

gt; sapply (mtcars, função (x) comprimento (único (x))) mpg cil disp cv drat peso qsec vs carb25 engrenagem am 22 22 3 27 29 30 2 2 3 6

Assim, parece que as variáveis cil, vs, sou, engrenagem, e carboidrato podem beneficiar de uma conversão de fator.

Você tem 32 observações diferentes em que conjunto de dados, de modo que nenhuma das variáveis ​​tem apenas valores exclusivos.

Quando tratar uma variável como um fator depende um pouco sobre a situação, mas, como regra geral, evite mais de dez níveis diferentes em um fator e tentar ter pelo menos cinco valores por nível.


Publicações relacionadas