Como carregar os dados em um modelo de análise preditiva de classificação r

O conjunto de dados analisamos para fazer uma previsão sobre o conjunto de dados de sementes, que pode ser encontrado no repositório UCI aprendizado de máquina. Este conjunto de dados tem 210 observações e 7 atributos além do rótulo. O rótulo é o resultado esperado e é usado para treinar e avaliar a precisão do modelo preditivo.

O resultado que você está tentando prever é o tipo de semente é (atributo 8), dado os valores dos sete atributos. Os três valores possíveis para o tipo de semente são rotulados 1, 2, e 3, e representam o Kama, Rosa, e variedades de trigo canadianas.

Os atributos na ordem da coluna são fornecidos:

área
perímetro
compacidade
Video: A-29 SPDA: NOVA NBR 5419 E SUAS CARACTERÍSTICAS RELEVANTES
comprimento do núcleo
largura do kernel
coeficiente de assimetria
comprimento de ranhura de kernel
classe de trigo

Para obter o conjunto de dados a partir do repositório UCI e carregá-lo na memória, digite o seguinte comando no console:

gt; sementes lt; - 
read.csv ("https://archive.ics.uci.edu/ml/machine Learning-bases de dados / 00236 / seeds_dataset.txt", Cabeçalho = FALSO, setembro =", As.is = TRUE)

Você vê que o conjunto de dados foi carregado na memória como a variável quadro de dados sementes, olhando para o seu painel de espaço de trabalho (canto superior direito). Clique no sementes variável ao ver os valores dados no painel de fonte (parte superior esquerda). Esta é a aparência dos dados no painel de origem.

Você pode encontrar mais informações sobre os dados que você acabou de carregado usando o resumo() função.

gt; Resumo das sementes () V1 V2 V3Min. : 10,59 min. : 12,41 min. : 0.80811st Qu.:12.27 1º Qu.:13.45 1º Qu.:0.8569Median: 14,36 Median: 14,32 Median: 0.8734Mean: 14.85 Média: 14,56 Média: 0.87103rd Qu.:17.30 3ª Qu.:15.71 3ª Qu.:0.8878 Max. : 21.18 Max. : 17.25 Max. : 0,9183 ...

Video: A-29 SPDA: NOVA NBR 5419 E SUAS CARACTERÍSTICAS RELEVANTES