Como estender a funcionalidade de texto com stringr em r

Se você já trabalhou em tudo com as funções de manipulação de texto de R, você provavelmente quer saber por que todas essas funções têm nomes unmemorable e sintaxe aparentemente diversa. Se assim for, você não está sozinho.

Na verdade, Hadley Wickham escreveu um pacote disponível a partir de CRAN que simplifica e padroniza a trabalhar com texto em R. Este pacote é chamado stringr, e você pode instalá-lo usando o console R ou escolhendo Ferramentas → Instalar Pacotes no rstudio.

Embora você tenha que instalar um pacote apenas uma vez, você tem que carregá-lo no espaço de trabalho usando o biblioteca() funcionar cada vez que você iniciar uma nova sessão R e pretende usar as funções no pacote.

install.packages ("stringr") Biblioteca (stringr)

Aqui estão algumas das vantagens de usar stringr em vez das funções padrão de P:

  • Nomes de funções e argumentos são consistentes e mais descritivo. Por exemplo, todos stringr funções têm nomes começando com str_ (tal como str_detect () e str_replace ()).

  • stringr tem uma maneira mais consistente de lidar com casos com dados faltantes ou valores vazios.

  • stringr tem uma forma mais consistente de assegurar que os dados de entrada e saída são do mesmo tipo.

    Video: 13.1 Strings and Drawing Text - Processing Tutorial

o stringr equivalente para grep () é str_detect (), e o equivalente de gsub () é str_replace_all ().

Como ponto de partida para explorar stringr, você pode encontrar algumas dessas funções úteis:



  • str_detect (): Detecta a presença ou ausência de um padrão em uma string

    Video: C++ Tutorial 13 - String [arabic] - سترنج

  • str_extract (): Extrai a primeira parte de uma cadeia que corresponde a um padrão

  • str_length (): Retorna o comprimento de uma string (em caracteres)

  • str_locate (): Localiza a posição da primeira ocorrência de um padrão numa cadeia

  • str_match (): Extrai o primeiro grupo combinado de uma string

  • str_replace (): Substitui a primeira ocorrência de um padrão combinado em uma string

    Video: Important Character String functions in R Studio

  • str_split (): Divide uma string em um número variável de peças

  • str_sub (): Extrai substrings de um vetor de caracteres

  • str_trim (): Apara espaços em branco desde o início e final da string

  • str_wrap (): cordas Wraps em parágrafos bem formatados


Publicações relacionadas