Como descrever a variação de dados em r

Um único número não lhe dizer muito sobre seus dados. Muitas vezes é tão importante saber a disseminação de seus dados. Você pode usar R para olhar para esta propagação através de um número de diferentes abordagens.

Primeiro, você pode calcular tanto o variação ou o desvio padrão para resumir a propagação em um único número. Para isso, você tem as funções convenientes var () para a variância e SD() para o desvio padrão. Por exemplo, você calcular o desvio padrão da variável mpg no quadro de dados carros como isso:

gt; sd (carros $ mpg) [1] 6,026948

Junto à média e variação, você também pode dar uma olhada nos quantis. UMA quantil, ou percentil, diz-lhe quanto de seus dados encontra-se abaixo de um determinado valor. O 50 por cento quantil, por exemplo, nada mais é que a mediana. Novamente, R tem algumas funções convenientes para ajudá-lo a olhar para os quantis.

Como calcular o intervalo de dados no R

Os quantis mais usados ​​são realmente os 0 por cento e 100 por cento quantiles. Você poderia facilmente chamar-lhes o mínimo eo máximo, porque é isso que eles são. Você pode obter tanto min () e max () as funções em conjunto, utilizando o alcance() função. Esta função convenientemente dá-lhe a gama dos dados. Assim, para saber, entre os quais dois valores todas as milhagens estão situados, basta fazer o seguinte:

Video: Matemática - Aula 4 - Função do Primeiro Grau - Parte 1

gt; range (carros $ mpg) [1] 10,4 33,9

Como calcular dados quartis em R



A gama ainda lhe dá apenas informações limitadas. Muitas vezes, os estatísticos relatam o primeiro eo terceiro quartil ao lado da gama ea mediana. Estes quartis são, respectivamente, os 25 por cento e 75 por cento quantis, que são os números para o qual um quarto e três quartos dos dados é menor. Você obter esses números usando o quantil () função, assim:

gt; quantil (carros $ mpg) 0% 25% 50% 75% 100% 10.400 15,425 19.200 22.800 33.900

Os quartis não são os mesmos que a dobradiça inferior e superior calculado no resumo de cinco números. Os dois últimos são, respectivamente, a mediana da metade inferior e superior de seus dados, e eles diferem ligeiramente dos primeiro e terceiro quartis. Para obter os cinco estatísticas numéricas, você usa o fivenum () função.

Como chegar na velocidade com a função quantil em R

o quantil () função pode dar-lhe qualquer quantil quiser. Para isso, você usar o probs argumento. Você dá o probs (Ou probabilidades) como um número fraccionário. Para os 20 por cento quantil, por exemplo, você usar 0.20 como um argumento para o valor. Este argumento também leva um vetor como um valor, para que possa, por exemplo, obter os 5 por cento e 95 por cento quantiles como este:

Video: Como Calcular a Medida de Dispersão Coeficiente de Variação CV da Estatística na Planilha Excel

gt; quantil (carros $ MPG, Probs = c (0,05, 0,95)) 5% 95% 11,995 31,300

O valor padrão para o probs argumento é um vector que representa o mínimo (0), o primeiro quartil (0,25), a mediana (0,5), o terceiro quartil (0,75), e o valor máximo (1).

Todas essas funções têm um argumento na.rm que lhe permite remover todos N / D valores antes de calcular o respectivo estatística. Se você não fizer isso, qualquer vector contendo N / D terá N / D como um resultado. Isso funciona de forma idêntica ao na.rm argumento do soma() função.


Publicações relacionadas