Como analisar os dados em tabelas com r

Video: Estatística Descritiva - Gráficos e Tabelas para uma variável

Você pode usar o R ​​de prop.test () função para dados em matrizes e mesas. Para prop.test (), essas tabelas precisam ter duas colunas com o número de contagens para os dois resultados possíveis.

Video: TABELAS E GRÁFICOS - Vamos analisar as vendas de mochilas em uma determinada loja

Como testar contingência de tabelas

Alternativamente, você pode usar o chisq.test () função para analisar tabelas com um qui-quadrado (χ2) Teste de contingência. Para fazer isso na matriz com os dados de cinto de segurança, basta fazer o seguinte:

gt; chisq.test (seatbelt.table)

Isso retorna o seguinte resultado:

 O teste do qui-quadrado de Pearson com Yates correctiondata continuidade: survivorsX-quadrado = 24,3328, df = 1, p-value = 8.105e-07

Os valores para a estatística (X-quadrado), Os graus de liberdade, e o valor p são exatamente o mesmo que com o prop.test () função. Isso é de se esperar, porque - neste caso, pelo menos - ambos os testes são equivalentes.

Como testar tabelas com mais de duas colunas

ao contrário do prop.test () função, o chisq.test () função pode lidar com tabelas com mais de duas colunas e mesmo com mais de duas dimensões. Para ilustrar isso, vamos dar uma olhada na tabela HairEyeColor. Você pode ver a sua estrutura com o seguinte código:

gt; str (HairEyeColor) Tabela [1: 4, 1: 4, 1: 2] 10 3 32 53 11 50 10 30 10 25 ...- attr (*, "dimnames") = Lista de 3 .. $ cabelo: chr [1: 4] "Preto" "Castanho" "Vermelho" "loiro".. $ olhos: chr [1: 4] "Castanho" "Azul" "aveleira" "Verde".. $ Sexo: chr [1: 2] "Masculino" "Fêmea"


Assim, a tabela HairEyeColor tem três dimensões: uma para a cor do cabelo, um para a cor dos olhos, e um para o sexo. A tabela representa a distribuição dessas três características, entre 592 alunos.

Video: Tabela de dupla entrada - Em certo ano ao analisar os dados dos candidatos

Os nomes de dimensão de uma tabela são armazenados em um atributo chamado dimnames. Como você pode ver a partir da saída do str () função, esta é realmente uma lista com os nomes para as linhas / colunas em cada dimensão. Se essa lista é uma lista com o nome, os nomes são usados ​​para marcar as dimensões. Você pode usar o dimnames () função para extrair ou alterar os nomes de dimensão.

Para verificar se a cor do cabelo e cor dos olhos estão relacionados, você pode recolher a mesa durante as duas primeiras dimensões usando o margin.table () funcionar para resumir cabelo e cor dos olhos para ambos os sexos. Esta função soma os valores em algumas dimensões para dar-lhe um quadro-resumo com menos dimensões. Para isso, você tem que especificar quais as margens que você deseja manter.

Assim, para obter a tabela de cabelo e cor dos olhos, você usa o seguinte:

gt; HairEyeMargin lt; - margin.table (HairEyeColor, margem = c (1,2)) gt; HairEyeMarginEyeHair Castanho Azul Hazel GreenBlack 68 20 15 5Brown 119 84 54 26 17 14 29Red 14Blond 7 94 10 16

Agora você pode simplesmente verificar se o cabelo e cor dos olhos estão relacionados, testando-a nessa tabela:

gt; chisq.test testdata (HairEyeMargin) de Pearson Chi-quadrado: HairEyeMarginX-quadrado = 138,2898, df = 9, p-valor lt; 2.2e-16

Como esperado, a saída deste teste diz que algumas combinações de cabelo e cor dos olhos são mais comuns do que outros. Não uma grande surpresa, mas você pode usar essas técnicas em outras questões de pesquisa e mais interessantes.


Publicações relacionadas