Como utilizar a função de aplicar () para resumir as matrizes no r

Se você tiver dados na forma de uma matriz ou matriz e você quer resumir esses dados, R de Aplique() função é realmente útil. o Aplique() função atravessa uma matriz ou matriz por linha ou coluna e aplica-se uma função de síntese.

o Aplique() função recebe quatro argumentos:

  • X: Esta é a sua dados - um array (ou matriz).

  • MARGEM: Um vector numérico que indica a dimensão ao longo do qual a traverse- 1 significa linhas e 2 significa colunas.

  • DIVERSÃO: A função a aplicar (por exemplo, soma ou significar).

  • ... (pontos): Se seu DIVERSÃO função requer quaisquer argumentos adicionais, você pode adicioná-los aqui.

Para ilustrar isso, olhar para o conjunto de dados built-in Titânico. Esta é uma tabela de quatro dimensões com dados dos passageiros do navio Titânico, descrevendo a sua classe de cabine, sexo, idade, e se eles sobreviveram.



gt; str (titânico) Tabela [1: 4, 1: 2, 1: 2, 1: 2] 0 35 0 0 0 0 17 0 118 154 ...- attr (*, "dimnames") = Lista de 4 .. $ Classe: chr [1: 4] "1º" "2º" "3ª" "Equipe técnica".. $ Sexo: chr [1: 2] "Masculino" "Fêmea".. $ Idade: chr [1: 2] "Criança" "Adulto".. $ sobreviveram: chr [1: 2] "Não" "sim"

Para descobrir quantos passageiros estavam em cada uma das suas classes de cabine, você precisa para resumir Titânico ao longo de sua primeira dimensão, Classe:

gt; aplicar (Titanic, 1, sum) 1º 2º 3º Crew325 285 706 885

Da mesma forma, para calcular o número de passageiros nas diferentes faixas etárias, é preciso aplicar o soma() função através da terceira dimensão:

gt; aplicar (Titanic, 3, sum) Criança Adult109 2092

Você também pode aplicar uma função mais de duas dimensões ao mesmo tempo. Para fazer isso, você precisa combinar as dimensões desejadas com o c () função. Por exemplo, para obter um resumo de quantas pessoas em cada grupo de idade sobreviveu, você faça o seguinte:

gt; aplicar (titânico, c (3, 4), soma) SurvivedAgeNo YesChild 52 57Adult 1438 654

Publicações relacionadas