Como fazer um boxplot de um resumo dos cinco números

UMA boxplot

é um gráfico de um-dimensional de dados numéricos com base na síntese de cinco números. Este resumo inclui as seguintes estatísticas: o valor mínimo, o percentil 25 (conhecido como Q1), A mediana, o percentil 75 (Q3), E o valor máximo. Em essência, estes cinco estatística descritiva dividir o conjunto de dados em quatro partes, onde cada parte contém 25% dos dados.

Video: Box Plot passo a passo

Para fazer um boxplot, siga estes passos:

Encontre o resumo dos cinco números do seu conjunto de dados:

o mínimo é o menor valor no conjunto de dados, eo máximo é o maior valor no conjunto de dados. Utilize os seguintes passos para encontrar o percentil 25 (conhecido como Q1), O percentil 50 (mediana), e do percentil 75 (Q3).

  1. Encomendar todos os valores no conjunto de dados do menor ao maior.

  2. Multiplicar k por cento vezes o número total de valores dos dados, n.

    O resultado é conhecido como o índice.

  3. Se o índice obtido no Passo 2 não for um número inteiro, arredondar para o número inteiro mais próximo e ir para a Etapa 4a.

    Se o índice obtido no Passo 2 é um número inteiro, ir para o passo 4b.

  4. Escolha um dos seguintes.

    uma. Contar os valores em seu conjunto de dados da esquerda para a direita (do menor para o maior valor) até chegar ao número indicado pelo Passo 3. O valor correspondente no seu conjunto de dados é o kº percentil.

    b. Contar os valores em seu conjunto de dados da esquerda para a direita (menor para o maior) até chegar ao número indicado pelo Passo 2. O kº percentil é a média do que o valor correspondente no seu conjunto de dados e o valor que o segue diretamente.



  • Criar uma vertical (ou horizontal) o número da linha cujo escala inclui os valores na síntese de cinco números e utiliza unidades adequadas de igual distância uns dos outros.

  • Marcar a localização de cada valor no resumo de cinco números um pouco acima da linha de número (por um boxplot horizontal) ou apenas para a direita da linha de número (por um boxplot vertical).

  • Desenhar uma caixa em torno das marcas para o percentil 25 e o percentil 75.

  • Desenhar uma linha na caixa onde a mediana está localizado.

  • Determinar se ou não os outliers estão presentes.

    Para fazer essa determinação, calcular os limites do interquartil (IQR), que se encontra por subtracção Q3 - Q1- em seguida, multiplicar IQR por 1,5. Adicionar este valor ao valor do Q3 e subtrair este valor a partir de Q1. Isto dá-lhe um limite mais amplo em torno da mediana do que a caixa faz. Todos os pontos de dados que caem fora desse limite estão determinados a ser discrepantes.

  • Se não existem valores extremos (de acordo com os resultados do passo 6), desenhar linhas a partir das bordas superior e inferior da caixa de saída para os valores mínimos e máximos no conjunto de dados.

  • Se houver valores atípicos (de acordo com os resultados de Passo 6), indicar a sua localização no boxplot com sinais *.

    Em vez de desenhar uma linha a partir da borda da caixa de todo o caminho até o outlier mais extremo, parar a linha no último valor de dados que não é um caso isolado.

  • Muitos, se não a maioria dos pacotes de software indicam valores discrepantes em um conjunto usando um asterisco (*) ou estrela símbolo e usar o procedimento descrito no Passo 6 para identificar os outliers dados. No entanto, nem todos os pacotes usar estes símbolos e Procedimentos- verificar para ver o que o seu pacote faz antes de analisar seus dados com um boxplot.

    Boxplot de Melhores idades atriz (1928-2009- & lt; i & gt; n & lt; / i & gt; = 83 actrizes) “/ & gt;. & Lt; / p & gt; & lt; div classe =Boxplot de Melhores idades Atriz (1928-2009- n = 83 actrizes).

    Um boxplot horizontal para as idades dos Oscar Melhor Atriz vencedores de 1928-2009 é mostrado na figura acima. Você pode ver os números que separa as seções do boxplot corresponder às estatísticas resumo dos cinco números mostrados na figura a seguir.

    Estatística Descritiva para os melhores idades Atriz (1928-2009).
    Estatística Descritiva para os melhores idades Atriz (1928-2009).

    Boxplots pode ser vertical (para cima e para baixo) com os valores no eixo que vai de baixo (menor) para superior (mais alto) - ou eles podem ser horizontal, com os valores no eixo que vai da esquerda (mais baixo) para a direita (mais alto ).

    Os passos mostrados aqui demonstrar um modo de cálculo da média e quartis do resumo de cinco números e de construção da boxplot. Mas existem vários outros métodos aceitáveis. Não seja muito alarmado se a sua calculadora ou um amigo lhe dá um boxplot perto, mas diferente do que estes passos daria.

    Video: Cómo construir un diagrama de Caja (5 puntos) o BoxPlot con Excel


    Publicações relacionadas