Como remover linhas com dados perdidos na r

Outra aplicação útil de subsetting quadros de dados é encontrar e remover linhas com dados ausentes. A função R para verificar se este é complete.cases ()

. Você pode tentar isto no conjunto de dados built-in qualidade do ar, um quadro de dados com uma boa quantidade de dados em falta:

gt; str (airquality) gt; complete.cases (airquality)

Os resultados de complete.cases () é um vetor lógico com o valor VERDADE para linhas que estão completos e FALSO para as linhas que têm algum N / D valores. Para remover as linhas com dados ausentes de qualidade do ar, tente o seguinte:

gt; X lt; - airquality [complete.cases (airquality),] gt; str (x)


Seu resultado deve ser um quadro de dados com 111 linhas, em vez das 153 linhas do original qualidade do ar quadro de dados.

Video: Como remover linha do word - Aprenda em 30 segundos

Como sempre com R, não é mais do que uma forma de alcançar seu objetivo. Neste caso, você pode fazer uso de na.omit () omitir todas as linhas que contêm NA valores:

gt; X lt; - na.omit (airquality)

Quando tiver certeza de que seus dados é limpo, você pode começar a analisá-lo adicionando campos calculados.

Video: Curso de Word Retirar ou eliminar quebra de parágrafo linha desnecessária depois importar texto pdf

Se você usar qualquer um desses métodos para o subconjunto de seus dados ou limpar valores em falta, lembre-se de armazenar o resultado em um novo objeto. R não alterar nada no quadro de dados original, a menos que você substituí-lo explicitamente. Isso é uma coisa boa, porque você não pode acidentalmente estragar seus dados.


Publicações relacionadas