Como descrever o centro de dados contínuos em r
Video: Exercício 01 aula de Percentil
Você tem o conjunto de dados e você formatado-lo para atender às suas necessidades em R, então agora você está pronto para o trabalho real. Analisando seus dados sempre começa com descrevê-la. Desta forma, você pode detectar erros nos dados, e você pode decidir quais modelos são adequados para obter a informação que você precisa a partir dos dados que você tem.
Video: Distribuição normal - exemplo 1
Quais as estatísticas descritivas você usa depende da natureza dos dados, é claro.
Às vezes você está mais interessado no quadro geral de seus dados do que você está nos valores individuais. Você pode ser não está interessado na quilometragem de cada carro, mas na quilometragem média de todos os carros a partir desse conjunto de dados. Para isso, você calcular a média usando o significar() função, assim:
gt; significa (carros $ mpg) [1] 20,09062
Você também pode calcular o número médio de cilindros esses carros têm, mas isso não faz muito sentido. A média seria 6.1875 cilindros, e sem carros dirigir com um cilindro incompleta. Neste caso, o mediana - o valor mais central em seus dados - faz mais sentido. Você começa a mediana de usar a função mediana(), como isso:
gt; mediana (carros $ cyl) [1] 6
Existem inúmeras outras razões para calcular a mediana em vez da média, ou até mesmo os dois juntos. Ambas as estatísticas descrever uma propriedade diferente de seus dados, e até mesmo a combinação pode dizer uma coisa.