Como calcular proporções de dados e encontrar o centro no r
Video: Aula de Proporção
Depois de ter a tabela de dados com as contagens, você pode usar R para calcular facilmente a proporção de cada contagem ao total simplesmente dividindo a mesa pelas contagens totais. Para calcular a proporção de caixas de velocidades manuais e automáticas no conjunto de dados carros, você pode usar o seguinte código:
gt; / Soma amtable (amtable) auto manual0.40625 0,59375
No entanto, R também fornece a prop.table () função para fazer o mesmo. Você pode obter o mesmo resultado exato como a linha de código anterior, fazendo o seguinte:
gt; prop.table (amtable)
Você pode se perguntar por que você iria usar uma função extra para algo que é tão fácil como dividindo pela soma. o prop.table () função também pode calcular proporções marginais.
Em estatística, o modo de uma variável categórica é o valor que ocorre com maior frequência. Não é exatamente o centro de seus dados, mas se não há nenhuma ordem em seus dados - se você olhar para uma variável nominal - você não pode realmente falar sobre um centro de qualquer um.
Embora não haja uma função específica para calcular o modo, você pode obtê-lo através da combinação de alguns truques:
Para obter as contagens para cada valor, o uso mesa().
Para encontrar a localização do número máximo de contagens, use max ().
Para encontrar o modo de sua variável, selecione o nome correspondente com a localização na Etapa 2 da mesa na Etapa 1.
Video: PENSI - Matematica - Razão e Proporção
Assim, para encontrar o modo para a variável sou no conjunto de dados carros, você pode usar o seguinte código:
gt; identidade lt; - == amtable max (amtable) gt; nomes (amtable) [id] [1] "manual"
a variável identidade contém um vetor lógico que tem o valor VERDADE para cada valor na tabela soutcapaz que é igual ao máximo na tabela. Você seleciona o nome dos valores em soutcapaz usando este vetor lógico como um índice.
Você também pode usar o which.max () função para encontrar a localização do máximo em um vetor. Esta função tem uma desvantagem importante, porém: Se você tiver vários máximos, which.max () irá retornar a posição de somente a primeira máxima. Se você estiver interessado em todos os máximos, você deve usar a construção no exemplo anterior.