Como traçar histogramas com os seus dados em r

Para se ter uma idéia visual mais clara sobre como os dados são distribuídos dentro da faixa, você pode traçar um histograma usando R. Para fazer um histograma para os dados de quilometragem, você simplesmente usar o Hist () função, assim:

gt; hist (carros $ mpg, col = `cinza`)

Você vê que o Hist () função corta primeiro a gama dos dados num número de intervalos uniformes, e, em seguida, conta o número de observações em cada intervalo. A altura barras é proporcional a essas freqüências. No y-eixo, você encontra as contagens.

Com o argumento col, você dá as barras do histograma de um pouco de cor.

Como jogar com quebras

R escolhe o número de intervalos que considera mais útil para representar os dados, mas você pode discordar do que R faz e escolher as quebras de si mesmo. Para isso, use o rompe argumento do Hist () função.



Você pode especificar as quebras de duas maneiras diferentes:

  • Você pode dizer R o número de barras que você quer no histograma, dando um único número como argumento. Basta ter em mente que R ainda vai decidir se isso é realmente razoável, e tenta cortar a faixa usando números arredondados agradáveis.

  • Você pode dizer R exatamente onde colocar as quebras, dando um vetor com os pontos de quebra como um valor para a rompe argumento.

Então, se você não concordar com R e você quer ter barras que representam os intervalos de 5 a 15, 15 a 25 e 25 a 35, você pode fazer isso com o seguinte código:

gt; hist (carros $ mpg, quebras = c (5,15,25,35))

Você também pode dar o nome do algoritmo de R tem que usar para determinar o número de quebras como o valor para o rompe argumento. Você pode encontrar mais informações sobre esses algoritmos na página de ajuda ?hist. Tente experimentar com esses algoritmos um pouco para verificar qual funciona melhor.


Publicações relacionadas