10 Dicas sobre como trabalhar com pacotes em r

Uma das características muito atraentes de R é que ele contém uma grande coleção de terceiros pacotes

(colecções de funções em um formato bem definido). Para obter o máximo de R, você precisa entender onde encontrar pacotes adicionais, como fazer o download e instalá-los, e como usá-los.

Bisbilhotando os cantos e recantos do CRAN

o Comprehensive R Rede de Arquivo (CRAN) é uma rede de servidores web em todo o mundo onde você pode encontrar o código-fonte R, manuais R e documentação, e contribuíram pacotes.

CRAN não é um único website- é uma coleção de servidores web, cada um com uma cópia idêntica de todas as informações sobre CRAN. Assim, cada servidor web é chamado de espelho. A idéia é que você escolhe o espelho que está localizado mais próximo de onde você é, o que reduz o tráfego internacional ou de longa distância Internet. Você pode encontrar uma lista de espelhos CRAN Aqui.

Independentemente de qual interface R que você usa, você pode salvar permanentemente seu espelho CRAN preferido (e outros ajustes) em um arquivo especial chamado .RProfile, localizado no diretório home do usuário ou o diretório R inicialização. Por exemplo, para definir o espelho Imperial College, Reino Unido como seu espelho CRAN padrão, inclua esta linha no seu .RProfile:

Opções ( “repos” = c (CRAN = “https://cran.ma.imperial.ac.uk/”))

Encontrando pacotes interessantes

No início de 2015, havia mais de 6.000 pacotes em CRAN. Isso significa encontrar um pacote para sua tarefa na mão pode parecer difícil.

Felizmente, um punhado de especialistas voluntários foram recolhidos alguns dos pacotes mais utilizados em listas de curadoria. Estas listas são chamados As visualizações de tarefas CRAN. Você pode encontrar pontos de vista de tarefas para finanças empírica, genética estatística, aprendizado de máquina, aprendizagem estatística, e muitos outros temas fascinantes.

Cada pacote tem sua própria página web em CRAN. Na página web para um pacote, você encontra um resumo, informações sobre os pacotes que são usados, um link para o site do pacote (se tal site existe), e outras informações úteis.

Instalando pacotes

Para instalar um pacote de usar o install.packages () função. Este comando simples download do pacote a partir de um repositório especificado (por padrão, CRAN) e instala-lo em sua máquina:

 gt; install.packages ( “fortunas”)

Note-se que o argumento para install.packages () é uma cadeia de caracteres. Em outras palavras, lembre-se as aspas em torno do nome do pacote!

Em Rgui, bem como em rstudio, você encontra um comando de menu para fazer a mesma coisa:

  • Em Rgui, escolha Pacotes → Instalar pacote (s).

  • Em rstudio, escolha Ferramentas → Instalar pacotes. . . .

pacotes de carregamento

Para carregar um pacote, você usa o biblioteca() ou requerem () função. Estas funções são idênticas em seus efeitos, mas diferem no valor de retorno:

  • biblioteca(): Invisível retorna uma lista de pacotes que estão ligados, ou pára com um erro se o pacote não é em sua máquina.

  • requerem (): Devoluções VERDADE se o pacote foi anexado com sucesso e FALSO se não.

A documentação R sugere que biblioteca() é a forma preferida de pacotes de carga em scripts, enquanto requerem () é preferida dentro de funções e pacotes.

Então, depois de instalar o pacote fortunas carregá-lo como este:

gt; biblioteca ( “fortunas”)

Note que você não tem que citar o nome do pacote no argumento de biblioteca(), mas é uma boa prática para citar sempre o nome do pacote.

Embora seja possível descarregar um pacote dentro de uma sessão de R usando a separar () função, na prática, é geralmente muito mais fácil simplesmente reiniciar a sessão R.

Lendo o manual do pacote e vinheta

O manual do pacote é uma coleção de todas as funções e outra documentação do pacote. Você pode acessar o manual de duas maneiras. A primeira maneira é usar o Socorro argumento para o biblioteca() função:

Video: Curso Word #02 - 10 Dicas para Word 2016

gt; biblioteca (help = “fortunas”)

A segunda maneira é encontrar o manual no site do pacote. Se apontar a janela do seu navegador para o página CRAN para o pacote de fortunas, você verá uma link para o manual em direção ao fundo da página.

Qualquer que seja a abordagem que você escolher, o resultado é um documento PDF contendo o manual do pacote.

Alguns autores pacote também escrever um ou mais vinhetas, documentos que ilustram como usar o pacote. Uma vinheta tipicamente mostra alguns exemplos de como usar as funções e como começar. O importante é que uma vinheta ilustra como usar o pacote com o código R e saída, assim como este livro.



Para ler a vinheta para o fortunas pacote, tente o seguinte:

gt; vinheta ( “fortunas”)

atualização de pacotes

Para garantir que você tenha a versão mais recente de um pacote, use update.packages ():

gt; update.packages ()

Esta função se conecta a CRAN (por padrão) e verifica se há atualizações para todos os pacotes que você instalou no seu computador. Se houver, ele pergunta se você deseja atualizar cada pacote, em seguida, faz o download do código e instala a nova versão.

Se você adicionar update.packages (pergunte = FALSE), R atualiza todos os pacotes de out-of-date na atual localização da biblioteca, sem avisá-lo. Além disso, você pode dizer update.packages () olhar para um outro repositório de CRAN, alterando o repos argumento. Se o repos argumento aponta para um arquivo no seu computador (ou rede), R instala o pacote a partir deste arquivo.

Ambos Rgui e rstudio têm opções de menu que lhe permitem actualizar os pacotes:

  • Em Rgui, escolha Pacotes → pacote (s) Update.

  • Em rstudio, escolha Ferramentas → Verificar atualizações do pacote. . . .

Ambos os aplicativos permitem selecionar graficamente pacotes para atualizar.

Avançando com R-Forge

Apesar de não ser uma verdade universal, pacotes em CRAN tendem a ter um nível mínimo de maturidade.

Então, onde é que pacotes de viver que estão no ciclo de desenvolvimento? Muitas vezes, eles vivem em R-Forge. R-Forge oferece aos desenvolvedores uma plataforma para desenvolver e testar seus pacotes R. Por exemplo, oferece R-Forge

  • Um sistema de compilação e verificação nos sistemas operacionais Windows e Linux (Mac OSX não é suportado)

  • Controle de versão

  • sistemas de Bug-relatório

  • Cópia de segurança e administração

Video: 5 desafios REAIS de TRABALHAR EM CASA e 5 soluções

Para instalar um projeto de R-Forge, você também usar o install.packages () funcionar, mas você tem que especificar o repos argumento. Por exemplo, para instalar a versão de desenvolvimento do pacote Tabela de dados, tente o seguinte:

gt; install.packages ( “data.table”, reporte = “https://R-Forge.R-project.org”)

Embora R-Forge não tem uma compilação e verificação do sistema para Mac OSX especificamente, os usuários de Mac podem instalar e usar pacotes de R-Forge, instalando o pacote fonte. Você encontra mais informações no FAQ para Mac.

Recebendo pacotes de github

Nos últimos anos, muitos desenvolvedores começaram a usar github como um local de desenvolvimento de código. Embora github não oferece nenhuma das características específicas-R de CRAN ou R-Forge, às vezes o código é mais fácil de compartilhar usando github. Então você pode ocasionalmente obter instruções para instalar um pacote diretamente do github.

Nos sistemas operacionais Linux e Mac OSX, instalar pacotes do github é relativamente fácil. No entanto, no Windows, você também deve instalar primeiro RTools (um conjunto de compiladores e outras ferramentas para criar pacotes de fonte). Para instalar RTools em uma máquina Windows, siga atentamente as instruções.

Realização de instalações de BioConductor

BioConductor é um repositório de pacotes R e software, um conjunto de ferramentas que se especializa em análise de dados genômicos e afins.

BioConductor tem seus próprios conjuntos de regras para desenvolvedores. Por exemplo, para instalar um pacote de BioConductor você tem a fonte de um script de seu servidor:

gt; fonte ( “https://bioconductor.org/biocLite.R”)

Então você pode usar o biocLite () função para instalar pacotes a partir BioConductor. Se você não fornecer um argumento, basta instalar os pacotes básicos necessários do projeto BioConductor.

BioConductor utiliza extensivamente programação objeto-orientação com as classes S4.

Lendo o manual R

o “R Installation and Administration” Manual é um guia completo para a instalação e administração de R. Capítulo 6 deste manual contém todas as informações que você precisa sobre como trabalhar com pacotes.


Publicações relacionadas