Vá para fora a norma com as estatísticas não paramétricas

Todos os testes estatísticos são derivados com base em algumas suposições sobre seus dados, ea maioria dos testes de significância clássicos (como os testes t de Student, análise de variância e testes de regressão) assumem que os seus dados são distribuídos de acordo com alguma distribuição de frequência clássica ( mais geralmente a distribuição normal).

Video: Lemmy Kilmister Motorhead 2010 Documentary Greek/Portuguese/Spanish Subtitles

Porque as funções de distribuição clássicos são todos escritos como expressões matemáticas envolvendo parâmetros (como média e desvio padrão), eles são chamados paramétrico funções de distribuição, e testes que assumem os seus dados está em conformidade com uma função de distribuição paramétrica são chamados de testes paramétricos. Uma vez que a distribuição normal é a distribuição estatística mais comum, o termo parumateste métrica é mais frequentemente utilizado para significar um teste que assume dados distribuídos normalmente.

Mas às vezes os dados não é paramétrica. Por exemplo, você pode não querer assumir que os seus dados são normalmente distribuídos, pois pode ser muito visivelmente inclinada, como mostrado na parte uma da figura.

Video: DON'T PANIC — Hans Rosling showing the facts about population

Às vezes, você pode ser capaz de realizar algum tipo de transformação de seus dados para torná-lo mais distribuída normalmente. Por exemplo, muitas variáveis ​​que têm uma distribuição assimétrica pode ser convertido em números normalmente distribuída tendo em logaritmos, como mostrado na parte b. Se, por tentativa e erro, você pode encontrar algum tipo de transformação que normaliza seus dados, você pode executar os testes clássicos sobre os dados transformados.



Mas às vezes os seus dados estão teimosamente anormal, e você não pode usar os testes paramétricos. Felizmente, os estatísticos desenvolveram testes especiais que não assumem normalmente distribuído data- estes são (não surpreendentemente) chamou testes não paramétricos. A maioria dos testes paramétricos clássicos comuns têm contrapartidas não paramétricos.

Como você pode esperar, os testes não paramétricos mais conhecidos e utilizados são aqueles que correspondem aos testes clássicos mais conhecidos e utilizados.

As contrapartes não-paramétricos de testes clássicos
Teste Parametric clássicoequivalente não paramétrico
Um grupo ou emparelhado teste t de StudentAssinar test- Wilcoxon teste assinados-fileiras
Dois grupos teste t de StudentWilcoxon soma de fileiras teste-teste Mann-Whitney U
One-way ANOVAteste de Kruskal-Wallis
teste de correlação de Pearsonteste de Correlação Spearman

A maior parte dos testes não paramétricos envolvem primeiro a triagem seus valores de dados, menor para o maior, e gravar o posto de cada medição (o valor mais baixo tem uma classificação de 1, o próximo valor mais alto uma classificação de 2, e assim por diante). Todos os cálculos subseqüentes são feitas com estas fileiras em vez de com os valores de dados reais.

Embora os testes não paramétricos não assumem normalidade, eles fazem certas suposições sobre seus dados. Por exemplo, muitos testes não paramétricos supor que você não tem quaisquer valores amarrados em seu conjunto de dados (em outras palavras, não há dois temas têm exatamente os mesmos valores). A maioria dos testes paramétricos incorporar ajustes para a presença de laços, mas isso enfraquece o teste e faz com que o resultado não exata.

Mesmo em estatística descritiva, os parâmetros comuns têm contrapartes não-paramétricos. Apesar de médias e desvios-padrão pode ser calculado para qualquer conjunto de números, eles são mais úteis para resumir dados quando os números são normalmente distribuídos. Quando você não sabe como os números são distribuídos, medianas e quartis são muito mais úteis como medidas de tendência central e de dispersão.


Publicações relacionadas