Como traçar quantiles para subgrupos em r
Muitas vezes, você quer dividir-se análise de dados para diferentes subgrupos em R, a fim de compará-los. Você precisa fazer isso se você quiser saber como o tamanho médio lábio compara entre gouramis beijando masculino e feminino (grande peixe pelo caminho!) Ou, no caso do nosso exemplo, você quer saber se o número de cilindros em um carro influencia a quilometragem.
Video: R Tutorial : Median Quartiles and IQR
Claro que você pode usar tapply () para calcular qualquer das descritivos para subgrupos definidos por uma variável fator. Mas em R encontrar mais algumas ferramentas para resumir descriptives para diferentes subgrupos.
Uma maneira de comparar rapidamente grupos é para a construção de uma caixa de bigodes-e-suiça a partir dos dados. Você poderia construir essa trama por meio do cálculo do intervalo, os quartis, e a mediana para cada grupo, mas felizmente você pode apenas dizer-R para fazer tudo isso para você. Por exemplo, se você quer saber como a quilometragem compara entre os carros com um número diferente de cilindros, você simplesmente usar o boxplot () função:
Video: Quantile Meaning
gt; boxplot (mpg ~ cyl, dados = carros)
Você fornece uma fórmula simples como o primeiro argumento para boxplot (). Esta fórmula lê como “caixas de enredo para a variável mpg para os grupos definidos pela variável cil.”
Video: Les quantiles
Este lote usa quantiles para lhe dar uma idéia de como os dados são espalhados dentro de cada subgrupo. A linha no meio de cada caixa representa a mediana, e as arestas da caixa representam o primeiro e o terceiro quartis. Os bigodes estender para ambos o mínimo e o máximo dos dados ou 1,5 vezes a distância entre o primeiro e o terceiro quartis, consoante o que for menor.
Para ser completamente correcto, as bordas da caixa representam as dobradiças inferior e superior do resumo de cinco números, calculadas utilizando o fivenum () função. Eles são iguais aos quartis somente se você tiver um número ímpar de observações em seus dados. Caso contrário, os resultados de fivenum () e quantil () podem diferir um pouco devido a diferenças nos detalhes do cálculo.
Você pode deixar os bigodes sempre alargar ao mínimo eo máximo, definindo o alcance argumento do boxplot () função para 0.