Como usar dados em formato altura em parcelas de treliça em r
Quando você tem dados em formato alto em R, você pode facilmente usar gelosia
Conteúdo
Considere o conjunto de dados built-in longley, contendo dados sobre emprego, desemprego e outros indicadores populacionais:
gt; str (Longley) `data.frame`: 16 obs. de 7 variáveis: $ GNP.deflator: num 83 88,5 88,2 89,5 96,2 ... $ PNB: núm 234 259 258 285 329 ... $ Desempregados: NUM 236 232 368 335 210 ... $ Armed.Forces: NUM 159 146 162 165 310 ... $ População: num 108 109 110 111 112 ... $ Ano: int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 ... $ Employed: num 60,3 61,1 60,2 61,2 63,2 ...
Uma maneira de analisar facilmente as diferentes variáveis de um quadro de dados é a primeira a reformular o quadro de dados de grande formato para o formato de altura.
Video: Calculadora Científica Noções Básicas
Um quadro de dados de largura contém uma coluna para cada variável. Um quadro de dados de altura contenha a mesma informação, mas os dados são organizados de tal forma que uma coluna é reservada para identificar o nome da variável e uma segunda coluna contém os dados reais.
Uma maneira fácil de remodelar um quadro de dados de grande formato para o formato de altura é usar o fundição() na função reshape2 pacote. Lembrar: reshape2 não faz parte da base de R - é um pacote de add-on que está disponível no CRAN. Você pode instalá-lo com o install.packages ( “reshape2”) função.
Video: Дэн Филлипс: Креативные дома из вторичного материала
gt; biblioteca("reshape2") Gt; mlongley lt; - derreter (Longley, id.vars ="Ano") Gt; str (mlongley) `data.frame`: 96 obs. de 3 variáveis: $ Ano: int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 ... $ variável: Fator w / 6 níveis "GNP.deflator", ..: 1 1 1 1 1 1 1 1 1 1 ... $ value: num 83 88,5 88,2 89,5 96,2 ...
Agora você pode traçar o quadro de dados de altura mlongley e usar as novas colunas valor e variável na fórmula valor ~ Ano | variável.
Video: Кен Робинсон: Как избежать долины смерти в образовании
gt; xyplot (valor ~ Ano | variável, dados mlongley =, + layout = C (6, 1), + par.strip.text = lista (CEX = 0,7), + escalas = lista (CEX = 0.7) +)
Os argumentos adicionais par.strip.text e balança controlar o tamanho da fonte (razão de expansão de caracteres) da tira na parte superior do gráfico, bem como a escala.
Quando você cria lotes com vários grupos, certifique-se que a trama resultante é significativa. Por exemplo, a unidade de PNB (abreviação de Produto interno bruto) É provavelmente bilhões de dólares. Em contraste a unidade da população é provavelmente milhões de pessoas. (A documentação do longley conjunto de dados não é clara sobre este tema.)
Tenha muito cuidado quando você apresentar parcelas como este - você não quer ser acusado de criar chart junk (Enganosa gráficos).