Como subconjunto quadros de dados em r

Agora que você já revisou as regras para a criação de subconjuntos, você pode experimentá-lo com alguns quadros de dados em R. Você só tem que lembrar que um quadro de dados é um objeto bidimensional e contém linhas, bem como colunas. Isso significa que você precisa especificar o subconjunto de linhas e colunas de forma independente. Para fazer isso, você combinar os operadores.

Para ilustrar subsetting de quadros de dados, ter um olhar para o conjunto de dados built-in íris, um quadro de dados de cinco colunas e 150 linhas com dados sobre flores da íris.

gt; str (íris) `data.frame`: 150 obs. de 5 variáveis: $ Sepal.Length: Num 4,9 4,7 4,6 5,1 5 5,4 4,6 5 4,4 4,9 ... $ Sepal.Width: Num 3 3.2 3.1 3.5 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: Num 1,4 1,4 1,5 1,4 1,7 1,3 1,4 1,5 1,4 1,5 ... $ Petal.Width: Num 0,2 0,2 ​​0,2 ​​0,2 ​​0,2 ​​0,4 0,3 0,2 0,2 ​​0,1 ... $ Espécie: Fator w / 3 níveis "setosa","versicolor", ..: 1 1 1 1 1 1 1 1 1 1 ...

Quando você subconjunto objetos com mais de uma dimensão, você especificar o argumento subconjunto para cada dimensão - você separar os argumentos subconjunto com vírgulas.

Por exemplo, para obter as cinco primeiras linhas da íris e todas as colunas, tente o seguinte:

gt; íris [1: 5,]

Para obter todas as linhas, mas apenas duas das colunas, tente o seguinte:

Video: Subconjuntos de dados em R

gt; íris [, c ("Sepal.Length", "Sepal.Width")]

Você precisa ter um cuidado especial quando subsetting em uma única coluna de um quadro de dados. Tente o seguinte:


iris [ `Sepal.Length`]

Video: Intervalos reais

Você verá que o resultado é um vetor, não um quadro de dados como seria de esperar.

Quando sua operação subconjunto retorna uma única coluna, o comportamento padrão é retornar uma versão simplificada. A maneira como isso funciona, é que R inspeciona os comprimentos dos elementos retornados. Se todos estes elementos têm o mesmo comprimento, então R simplifica o resultado a um vector, matriz ou matriz.

Video: Conjuntos: Introdução (Aula 1 de 4)

No exemplo, R simplifica o resultado de um vector. Para substituir esse comportamento, você precisa especificar o argumento gota = FALSE em sua operação subconjunto:

gt; íris [, `Sepal.Length`, gota = FALSE]

Alternativamente, você pode subdividir a estrutura de dados como uma lista. O código a seguir retorna um quadro de dados com apenas uma coluna, bem como:

gt; iris [ `Sepal.Length`]

Finalmente, para obter um subconjunto de apenas algumas colunas e algumas linhas:

Video: Matemática - Aula 1 - Conjuntos - Parte 2

gt; íris [1: 5, C ("Sepal.Length", "Sepal.Width")] Sepal.Length Sepal.Width1 3,52 4,9 3,03 5,1 4,7 3,24 4,6 3,15 5,0 3,6

Publicações relacionadas