Como procurar várias palavras em r

Ao trabalhar com texto em R, você pode precisar de encontrar palavras ou padrões dentro do texto. Imagine que você tem uma lista dos estados nos Estados Unidos, e você quer saber quais nomes de estado consistem em duas palavras.

Video: Como memorizar palavras em Ingles + Dica de app

Para encontrar substrings, você pode usar o grep () função, que recebe dois argumentos essenciais:

  • padronizar: O padrão que você deseja encontrar.

  • X: O vector personagem que você deseja pesquisar.

Então, como você encontra os nomes de todos os estados com mais de uma palavra? Isso é fácil quando você percebe que você pode enquadrar a questão por encontrar todos aqueles estados que contêm um espaço:



gt; state.name [grep (" ", State.name)] [1] "Nova Hampshire" "Nova Jersey"[3] "Novo México" "Nova york"[5] "Carolina do Norte" "Dakota do Norte"[7] "Rhode Island" "Carolina do Sul"[9] "Dakota do Sul" "West Virginia"

Os resultados incluem todos os estados que têm nomes de duas palavras, como Nova Jersey, Nova York, Carolina do Norte, Dakota do Sul e West Virginia.

Video: Aula 22/38 - Significação Contextual de Palavras e Expressões - Língua Portuguesa - Sidney Martins

Você pode ver a partir desta lista que não há nomes de estado que contêm Leste. Você pode confirmar isso fazendo uma outra descoberta:

gt; state.name [grep ("Leste", State.name)] caracteres (0)

Quando o resultado de uma operação de carácter é um vector vazio (isto é, não há nada na mesma), R representa como caracteres (0). Similarmente, um vazio, ou de comprimento zero, vetor numérico está representado com inteiro (0) ou numérico (0).

R faz a distinção entre NULO e um vector vazio. NULO geralmente significa que algo está indefinido. Esta é sutilmente diferente de algo que está vazio. Por exemplo, um vector personagem que acontece não ter elementos ainda é um vetor de caracteres, representado por caracteres (0).


Publicações relacionadas