Como adicionar variáveis ​​para um quadro de dados em r

Video: Tabulação de dados no Excel com a função "cont.se"

Um quadro de dados pode ser estendido com novas variáveis ​​em R. Você pode, por exemplo, obter dados de outro jogador na equipe da avó. Ou você pode querer calcular uma nova variável das outras variáveis ​​no conjunto de dados, como a soma total de cestas feitas em cada jogo.

Video: Curso do RStudio: 2 - Seleção e transformação de dados e variáveis

Adição de uma única variável

Existem três principais maneiras de adicionar uma variável. Semelhante ao caso da adição de observações, você pode usar o cbind () ou função dos índices.

Você também pode usar o cifrão para adicionar uma variável extra. Imagine que Granny perguntou-lhe adicionar o número de cestas de sua amiga Gabrielle ao quadro de dados. Primeiro, você deve criar um vetor com os dados como este:

gt; baskets.of.Gabrielle lt; - c (11, 5, 6, 7, 3, 12, 4, 5, 9)

Para criar uma variável adicional chamado Gabrielle com esses dados, basta fazer o seguinte:

Video: Linguagem R: união de tabelas e tabelas pivôs

gt; baskets.df $ Gabrielle lt; - baskets.of.Gabrielle

Se você quiser verificar se isso funcionou, mas você não deseja exibir o quadro de dados completa, você poderia usar o cabeça() função. Esta função recebe dois argumentos: o objeto que você deseja exibir e o número de linhas que você quer ver. Para ver as primeiras quatro linhas do novo quadro de dados, baskets.df, use o seguinte código:



gt; cabeça (baskets.df, 4) Granny Geraldine Gabrielle1st 12 5112 4 4 53 5 2 64 4 6 7

Adicionando múltiplas variáveis ​​usando cbind

Você pode fingir o seu quadro de dados é uma matriz e usar o cbind () função para fazer isso. Ao contrário de quando você usa rbind () em quadros de dados, você não precisa nem se preocupar com os nomes de linha ou coluna. Vamos criar um novo quadro de dados com as metas para Gertrude e Guinevere. Para combinar os dois em um quadro de dados, tente:

gt; new.df lt; - data.frame (+ Gertrude = c (3, 5, 2, 1, NA, 3, 1, 1, 4), + Guinevere = c (6, 9, 7, 3, 3, 6, 2, 10, 6) +)

Embora os nomes de linha de quadros de dados new.df e baskets.df diferem, R irá ignorar isso e apenas usar os nomes de linha do primeiro quadro de dados na cbind () função, como você pode ver a partir da saída do código a seguir:

gt; cabeça (cbind (baskets.df, new.df), 4) Granny Geraldine Gabrielle Gertrude Guinevere1st 12 5113 62 4 4 55 93 5 2 62 74 6 71 4 3

Quando se utiliza uma estrutura de dados ou de uma matriz com os nomes das colunas, R usará aqueles como os nomes das variáveis. Se você usar cbind () para adicionar um vetor para um quadro de dados, R usará o nome do vetor como um nome de variável a menos que você especifique um você mesmo, como você fez com rbind ().

Se você vincular uma matriz sem nomes de coluna para o quadro de dados, R utiliza automaticamente os números de coluna como nomes. Isso fará com que um pouco de dificuldade, porém, porque os números simples são nomes de objetos inválidos e, portanto, mais difícil de usar como nomes de variáveis. Neste caso, é melhor usar os índices.

Sempre que você quiser usar um quadro de dados e não querem ter continuamente para digitar seu nome seguido por $, você pode usar as funções com() e dentro(). Com o dentro() função, você também pode facilmente adicionar variáveis ​​para um quadro de dados.


Publicações relacionadas