Como olhar para as margens de dados e proporções em r
Na análise de dados categóricos, muitas técnicas R usar o totais marginais
Conteúdo
Video: Proporções
Como adicionar margens para a mesa
R permite estender uma tabela com os totais marginais das linhas e colunas em um simples comando. Para isso, você usar o addmargins () função, assim:
gt; addmargins (trial.table) Sumrisk saudável doente 349 43no_risk 11 32 41 86 43Sum45
Você também pode adicionar as margens para apenas uma dimensão, especificando o margem argumento para a addmargins () função. Por exemplo, para obter apenas as contagens marginais para o comportamento, faça o seguinte:
gt; addmargins (trial.table, margem = 2) doente saudável Sumrisk 349 43no_risk 11 32 43
o margem argumento leva um número ou um vetor de números, mas pode ser um pouco confuso. As margens são numerados da mesma forma que no Aplique() função. assim 1 significa linhas e 2 para colunas. Para adicionar a margem coluna, você precisa definir margem para 2, mas esta margem coluna contém os totais de linhas.
Como calcular proporções
Você pode converter uma tabela com contagens para uma tabela com proporções usando muito facilmente o prop.table () função. Isso também funciona para tabelas multiway. Se você quiser saber as proporções de observações em cada célula da tabela para o número total de casos, você simplesmente faça o seguinte:
gt; prop.table (trial.table) healthyrisk doente 0,3953488 0,1279070 0,3720930 0.1046512no_risk
Isto diz-lhe que, por exemplo, 10,4 por cento das pessoas no estudo eram saudáveis, mesmo quando eles mostraram comportamentos de risco.
Como calcular proporções mais colunas e linhas
Video: RAZÃO E PROPORÇÃO AULA 01_mpeg4
Mas e se você quiser saber qual fração de pessoas com comportamento de risco ficou doente? Então você não tem que calcular as proporções dividindo as contagens pelo número total de casos para todo o dataset- vez, você divide as contagens pelos totais marginais.
R permite fazer isso facilmente usando, novamente, o prop.table () função, mas desta vez especificando o margem argumento.
Dê uma olhada na tabela novamente. Você deseja calcular as proporções mais de cada linha, porque cada linha representa uma categoria de comportamento. Assim, para obter as proporções corretas, você especificar margem = 1 como isso:
gt; prop.table (trial.table, margem = 1) healthyrisk doente 0,7906977 0,2558140 0,7441860 0.2093023no_risk
Em cada linha, as proporções resumir a 1. Agora você pode ver que 79 por cento das pessoas que mostram comportamentos de risco ficou doente. Bem, não é uma grande notícia que o comportamento de risco pode causar doenças, e as proporções mostradas no último ponto de resultado nesse sentido.
No entanto, os cientistas acreditam que você só se você pode guardá-lo de uma forma mais objetiva. Esse é o ponto em que você deve considerar fazer alguns testes estatísticos.