Como olhar para a estrutura de um fator na r
R tem uma estrutura de dados especial para dados categóricos, chamados fatores.
Conteúdo
gt; str (state.region) Factor de w / 4 níveis "Nordeste","Sul", ..: 2 4 4 2 4 4 1 2 2 2 ...
R relata a estrutura do state.region como um factor de quatro níveis. Você pode ver que os dois primeiros níveis são "Nordeste" e "Sul", mas estes níveis são representados como números inteiros 1, 2, 3 e 4.
Fatores são uma forma conveniente para descrever dados categóricos. Internamente um fator é armazenado como um valor numérico associado a cada nível. Isto significa que você pode definir e investigar os níveis de um fator separadamente dos valores do fator.
Para olhar para os níveis de um fator, você usa o (níveis) função. Por exemplo, para extrair os níveis de factor de state.region, use o seguinte:
Video: Aula 02/38- Coesão Textual - Língua Portuguesa - Sidney Martins
gt; níveis (state.region) [1] "Nordeste" "Sul"[3] "North Central" "Oeste"
Porque os valores do fator estão ligados aos níveis, quando você alterar os níveis, você também alterar indiretamente os próprios valores. Para tornar isso claro, alterar os níveis de state.region para os valores “NE”, “S”, “NC”, e "W":
gt; níveis (state.region) lt; - c ("NE", "S", "NC", "W") Gt; cabeça (state.region) [1] WLevels S W W S W: N S NC W
Às vezes é útil saber o número de níveis de um fator. A função de conveniência NLEVELS () extrai o número de níveis a partir de um factor de:
Video: Estruturas cúbicas (CFC e CCC)
gt; NLEVELS (state.region) [1] 4
Porque os níveis de um fator são armazenados internamente por R como um vetor, você também pode extrair o número de níveis usando comprimento:
gt; comprimento (níveis (state.region)) [1] 4
Pela mesma razão, você pode indexar os níveis de um fator usando regras vector subsistentes padrão. Por exemplo, para extrair os segundo e terceiros níveis de factor, utilizar o seguinte:
gt; níveis (state.region) [2: 3] [1] "S" "NC"