Como de utilização de frequências ou densidades com os seus dados em r

Por dividir seus dados em intervalos de no R, você ainda perder algumas informações. Ainda assim, a forma mais completa de descrever seus dados é através da estimativa do função densidade de probabilidade

(PDF) ou densidade de sua variável.

Video: Exercício 16 - Histograma com densidade de frequências

Se este conceito é desconhecido para você, não se preocupe. Basta lembrar que a densidade é proporcional à chance de que qualquer valor em seus dados é aproximadamente igual a esse valor. De facto, para um histograma, a densidade é calculada a partir das contagens, de modo que a única diferença entre um histograma com frequências e um com densidades, é a escala do y-eixo. Para o resto, são exatamente o mesmo.

Como criar um gráfico de densidade

Você pode estimar a função densidade de uma variável utilizando o densidade() função. A saída desta função em si não lhe diz muito, mas você pode facilmente usá-lo em uma trama. Por exemplo, você pode obter a densidade da variável quilometragem mpg como isso:

gt; mpgdens lt; - densidade (carros $ mpg)

O objeto que você começa desta forma é uma lista que contém uma grande quantidade de informação que você realmente não precisa de se olhar. Mas essa lista faz traçando a densidade tão fácil como dizer “traçar a densidade”:

Video: Curso do RStudio: 3 - Medidas de tendência central, histogramas e curvas de densidade

gt; trama (mpgdens)

O enredo parece um pouco áspero nas bordas, mas o importante é ver como vem o seu dados para fora. O objeto densidade é representada como uma linha, com os valores reais de seus dados no X-eixo e a densidade na y-eixo.



o mpgdens lista de objetos contém - entre outras coisas - um elemento chamado X e um chamado y. Estes representam o X- e y-Coordenadas para traçar a densidade. Quando R calcula a densidade, o densidade() função divide os dados em uma série de pequenos intervalos e calcula a densidade para o ponto médio de cada intervalo. Esses pontos médios são os valores para X, e as densidades calculados são os valores y.

Video: Dados, Frequências e Gráficos

Como traçar densidades em um histograma

Lembre-se que o Hist () função retorna a contagem para cada intervalo. Agora, a chance de que um valor está dentro de um determinado intervalo é diretamente proporcional a contagem. Os mais valores que você tem dentro de um determinado intervalo, maior a chance de que qualquer valor que você escolheu está deitado nesse intervalo.

Assim, em vez de planejar as contagens no histograma, você poderia muito bem representar graficamente as densidades. R faz todos os cálculos para você - a única coisa que você precisa fazer é definir o frequencia argumento de Hist () para FALSO, como isso:

gt; hist (carros $ mpg, col = `cinzenta`, freq = FALSE)

Agora, o lote será exatamente o mesmo que antes- apenas os valores no y-eixo são diferentes. A escala na y-eixo é definida de tal forma que você pode adicionar a trama densidade sobre o histograma. Para isso, você usar o (linhas) funcionar com o objecto de densidade como o argumento.

Assim, você pode, por exemplo, gosta-se o histograma anterior um pouco mais longe, acrescentando a densidade estimada usando o seguinte código imediatamente após o comando anterior:

gt; linhas (mpgdens)

Você ver o resultado destes dois comandos no lado direito. Lembre-se disso (linhas) usa o X e y elementos do objecto densidade mpgdens para traçar a linha.


Publicações relacionadas