Como procurar várias palavras em r
Ao trabalhar com texto em R, você pode precisar de encontrar palavras ou padrões dentro do texto. Imagine que você tem uma lista dos estados nos Estados Unidos, e você quer saber quais nomes de estado consistem em duas palavras.
Conteúdo
Video: Como memorizar palavras em Ingles + Dica de app
Para encontrar substrings, você pode usar o grep () função, que recebe dois argumentos essenciais:
padronizar: O padrão que você deseja encontrar.
X: O vector personagem que você deseja pesquisar.
Então, como você encontra os nomes de todos os estados com mais de uma palavra? Isso é fácil quando você percebe que você pode enquadrar a questão por encontrar todos aqueles estados que contêm um espaço:
gt; state.name [grep (" ", State.name)] [1] "Nova Hampshire" "Nova Jersey"[3] "Novo México" "Nova york"[5] "Carolina do Norte" "Dakota do Norte"[7] "Rhode Island" "Carolina do Sul"[9] "Dakota do Sul" "West Virginia"
Os resultados incluem todos os estados que têm nomes de duas palavras, como Nova Jersey, Nova York, Carolina do Norte, Dakota do Sul e West Virginia.
Video: Aula 22/38 - Significação Contextual de Palavras e Expressões - Língua Portuguesa - Sidney Martins
Você pode ver a partir desta lista que não há nomes de estado que contêm Leste. Você pode confirmar isso fazendo uma outra descoberta:
gt; state.name [grep ("Leste", State.name)] caracteres (0)
Quando o resultado de uma operação de carácter é um vector vazio (isto é, não há nada na mesma), R representa como caracteres (0). Similarmente, um vazio, ou de comprimento zero, vetor numérico está representado com inteiro (0) ou numérico (0).
R faz a distinção entre NULO e um vector vazio. NULO geralmente significa que algo está indefinido. Esta é sutilmente diferente de algo que está vazio. Por exemplo, um vector personagem que acontece não ter elementos ainda é um vetor de caracteres, representado por caracteres (0).