Como carregar os dados em um modelo de análise preditiva de classificação r
O conjunto de dados analisamos para fazer uma previsão sobre o conjunto de dados de sementes, que pode ser encontrado no repositório UCI aprendizado de máquina. Este conjunto de dados tem 210 observações e 7 atributos além do rótulo. O rótulo é o resultado esperado e é usado para treinar e avaliar a precisão do modelo preditivo.
O resultado que você está tentando prever é o tipo de semente é (atributo 8), dado os valores dos sete atributos. Os três valores possíveis para o tipo de semente são rotulados 1, 2, e 3, e representam o Kama, Rosa, e variedades de trigo canadianas.
Os atributos na ordem da coluna são fornecidos:
área
perímetro
compacidade
Video: A-29 SPDA: NOVA NBR 5419 E SUAS CARACTERÍSTICAS RELEVANTES
comprimento do núcleo
largura do kernel
coeficiente de assimetria
comprimento de ranhura de kernel
classe de trigo
Para obter o conjunto de dados a partir do repositório UCI e carregá-lo na memória, digite o seguinte comando no console:
gt; sementes lt; -
read.csv ("https://archive.ics.uci.edu/ml/machine Learning-bases de dados / 00236 / seeds_dataset.txt", Cabeçalho = FALSO, setembro =", As.is = TRUE)
Você vê que o conjunto de dados foi carregado na memória como a variável quadro de dados sementes, olhando para o seu painel de espaço de trabalho (canto superior direito). Clique no sementes variável ao ver os valores dados no painel de fonte (parte superior esquerda). Esta é a aparência dos dados no painel de origem.
Você pode encontrar mais informações sobre os dados que você acabou de carregado usando o resumo() função.
gt; Resumo das sementes () V1 V2 V3Min. : 10,59 min. : 12,41 min. : 0.80811st Qu.:12.27 1º Qu.:13.45 1º Qu.:0.8569Median: 14,36 Median: 14,32 Median: 0.8734Mean: 14.85 Média: 14,56 Média: 0.87103rd Qu.:17.30 3ª Qu.:15.71 3ª Qu.:0.8878 Max. : 21.18 Max. : 17.25 Max. : 0,9183 ...