Como para determinar uma estrutura de dados em r
A primeira decisão que você tem que fazer antes de analisar seus dados é como representar os dados dentro R. Se os dados tem apenas uma dimensão, então você já sabe que os vetores representam este tipo de dados muito bem. No entanto, se os seus dados tem mais de uma dimensão, você tem a opção de utilizar matrizes, listas ou quadros de dados. Assim, a pergunta é: quando você usa o que?
Conteúdo
As matrizes e matrizes de dimensões superiores são úteis quando todos os seus dados são de uma única classe - em outras palavras, todos os seus dados são numéricos ou todos os seus dados são personagens. Se você é um matemático ou um estatístico, você está familiarizado com matrizes e provavelmente usar esse tipo de objeto com muita freqüência.
Mas em muitas situações práticas, você terá dados que têm muitas classes diferentes - em outras palavras, você terá uma mistura de dados numéricos e de caracteres. Neste caso, você precisa usar tanto listas ou quadros de dados.
Se você imaginar seus dados como uma única planilha, um quadro de dados é provavelmente uma boa escolha. Recordar que uma trama de dados é simplesmente uma lista de vectores de nomeados com o mesmo comprimento, o que é conceptualmente muito semelhante a uma folha de cálculo com colunas e um cabeçalho da coluna para cada.
Se você estiver familiarizado com bancos de dados, você pode pensar em um quadro de dados como semelhante a uma única tabela em um banco de dados. Os quadros de dados são extremamente úteis e, em muitos casos, será a sua primeira escolha de objetos para armazenar seus dados.
Video: Estrutura de Dados I - Ordenação de Dados
Se os seus dados consiste de uma coleção de objetos, mas você não pode representar que como uma matriz ou um quadro de dados, em seguida, uma lista é a sua escolha ideal. Como as listas podem conter todos os tipos de outros objetos, incluindo outras listas ou quadros de dados, eles são tremendamente flexível. Consequentemente, R tem uma grande variedade de ferramentas para processar listas.
Você pode achar que um quadro de dados é uma escolha muito adequada para a maioria das tarefas de análise e processamento de dados. É uma maneira muito conveniente de representar os seus dados, e é semelhante a trabalhar com tabelas de banco de dados. Quando você ler dados de um valor separados por vírgulas (CSV) com a função read.csv () ou read.table (), R coloca os resultados numa frame de dados.
Video: Estrutura de Dados - Tabela Hash - Grupo 6
Objeto | Descrição | Comentários |
---|---|---|
vetor | O objecto de dados de base em I, que consiste em um ou mais valores de um único tipo (por exemplo, caracteres, o número ou o número inteiro). | Pense nisso como uma única coluna ou linha em uma planilha ou um coluna numa tabela da base de dados. |
matriz ou ordem | Um objecto multidimensional de um único tipo (conhecido como atômico). A matriz é uma matriz de duas dimensões. | Quando você tem que armazenar números em muitas dimensões, uso matrizes. |
Lista | As listas podem conter objetos de qualquer tipo. | As listas são muito úteis para armazenar coleções de dados que pertencem juntos. Como as listas podem conter listas, este tipo de objecto é muito útil. |
quadro de dados | Os quadros de dados são um tipo especial de lista nomeada onde toda a elementos têm o mesmo comprimento. | Os quadros de dados são semelhantes aos de uma única folha de cálculo ou a uma tabela em um banco de dados. |