Como olhar para as margens de dados e proporções em r

Na análise de dados categóricos, muitas técnicas R usar o totais marginais

da tabela nos cálculos. Os totais marginais são as contagens totais de casos sobre as categorias de interesse. Por exemplo, os totais marginais para o comportamento seria a soma sobre as linhas da tabela trial.table.

Video: Proporções

Como adicionar margens para a mesa

R permite estender uma tabela com os totais marginais das linhas e colunas em um simples comando. Para isso, você usar o addmargins () função, assim:

gt; addmargins (trial.table) Sumrisk saudável doente 349 43no_risk 11 32 41 86 43Sum45

Você também pode adicionar as margens para apenas uma dimensão, especificando o margem argumento para a addmargins () função. Por exemplo, para obter apenas as contagens marginais para o comportamento, faça o seguinte:

gt; addmargins (trial.table, margem = 2) doente saudável Sumrisk 349 43no_risk 11 32 43

o margem argumento leva um número ou um vetor de números, mas pode ser um pouco confuso. As margens são numerados da mesma forma que no Aplique() função. assim 1 significa linhas e 2 para colunas. Para adicionar a margem coluna, você precisa definir margem para 2, mas esta margem coluna contém os totais de linhas.

Como calcular proporções

Você pode converter uma tabela com contagens para uma tabela com proporções usando muito facilmente o prop.table () função. Isso também funciona para tabelas multiway. Se você quiser saber as proporções de observações em cada célula da tabela para o número total de casos, você simplesmente faça o seguinte:



gt; prop.table (trial.table) healthyrisk doente 0,3953488 0,1279070 0,3720930 0.1046512no_risk

Isto diz-lhe que, por exemplo, 10,4 por cento das pessoas no estudo eram saudáveis, mesmo quando eles mostraram comportamentos de risco.

Como calcular proporções mais colunas e linhas

Video: RAZÃO E PROPORÇÃO AULA 01_mpeg4

Mas e se você quiser saber qual fração de pessoas com comportamento de risco ficou doente? Então você não tem que calcular as proporções dividindo as contagens pelo número total de casos para todo o dataset- vez, você divide as contagens pelos totais marginais.

R permite fazer isso facilmente usando, novamente, o prop.table () função, mas desta vez especificando o margem argumento.

Dê uma olhada na tabela novamente. Você deseja calcular as proporções mais de cada linha, porque cada linha representa uma categoria de comportamento. Assim, para obter as proporções corretas, você especificar margem = 1 como isso:

gt; prop.table (trial.table, margem = 1) healthyrisk doente 0,7906977 0,2558140 0,7441860 0.2093023no_risk

Em cada linha, as proporções resumir a 1. Agora você pode ver que 79 por cento das pessoas que mostram comportamentos de risco ficou doente. Bem, não é uma grande notícia que o comportamento de risco pode causar doenças, e as proporções mostradas no último ponto de resultado nesse sentido.

No entanto, os cientistas acreditam que você só se você pode guardá-lo de uma forma mais objetiva. Esse é o ponto em que você deve considerar fazer alguns testes estatísticos.


Publicações relacionadas