Como extrair variáveis, observações e os valores a partir de uma trama de dados em r

Em muitos casos, você pode extrair os valores de um quadro de dados em R fingindo que é uma matriz. Mas, embora os quadros de dados pode ser parecido com matrizes, eles definitivamente não são. Ao contrário de matrizes e matrizes, as estruturas de dados não são armazenados internamente como vectores, mas quanto listas de vetores.

Fingindo que é uma matriz

Se você quer extrair valores a partir de um quadro de dados, você pode simplesmente fingir que é uma matriz e começar a partir daí. Você pode usar números de índice, nomes ou vetores lógicos para a seleção, como você faria com matrizes. Por exemplo, você pode obter o número de cestos marcados por Geraldine no terceiro jogo como este:

Video: Leitura de dados CSV no R

gt; baskets.df [ “3”, “Geraldine”] [1] 2

Da mesma forma, você pode obter todas as cestas que Granny registados com o índice da coluna, como este:

gt; baskets.df [, 1] [1] 12 4 5 6 9 3

Ou, se você quer que isso seja um quadro de dados, você pode usar o argumento gota = FALSE exatamente como faz com matrizes:



gt; str (baskets.df [, 1, gota = FALSE]) ‘data.frame’: 6 obs. de uma variável: $ Granny: Nm 12 4 5 6 9 3

Note-se que, ao contrário de matrizes, os nomes de linha são descartados se você não especificar o gota = FALSE argumento.

Colocar o seu dólar, onde seus dados estão

Como um leitor atento, você já reparou que cada variável é precedida por um sinal de dólar ($) Na saída a partir de str (). R não é necessariamente lenocínio seus dados aqui - o sinal de dólar é simplesmente uma maneira específica para acessar variáveis. Para acessar a variável Avó, você pode usar o cifrão como este:

gt; baskets.df $ Granny [1] 12 4 5 6 9 3

Então você especificar o quadro de dados, seguido por um sinal de dólar e, em seguida, o nome da variável. Você não tem que cercar o nome da variável entre aspas (como seria quando você usa os índices). R retornará um vector com todos os valores contidos nessa variável. Observe novamente que os nomes de linha são jogados aqui.

Video: Usando Fórmulas Para Validar Dados

Com este método dólar-sinal, você pode acessar apenas uma variável de cada vez. Se você deseja acessar múltiplas variáveis ​​ao mesmo tempo usando seus nomes, você precisa usar os colchetes.


Publicações relacionadas