パッケージのインストール

pacman

  • 使いたいパッケージを既にインストールしたかどうかを、我々は忘れがちである
    • 未インストールの場合、パッケージを読み込む→エラーになる→インストールする→再びパッケージを読み込む、と一手間かかる
    • だから、インストールされているか否かを自動で判別させ、それに応じて適切な処理を行わせたい
      • 未インストール →インストール&読み込み
      • インストール済み→読み込み
    • この処理を1つのコマンドで行ってくれるのが pacman パッケージ
      • pacman 自体は、install.packages(“pacman”) でインストールする

パッケージの一括読み込み

  • pacman::p_load(パッケージ名, …) でパッケージを読み込む
pacman::p_load(tidyverse, tidylog)
  • 読み込み時にパッケージがインストールされていなければ、自動でインストール
  • 複数のパッケージを一度に読み込むことができる
    • install.packages() でも複数パッケージの一括読み込みは可能だが、ベクトルで括る必要があり若干手間がかかる
  • 稀にインストールが失敗することがある
    • pacman でインストールが上手くいかない場合は、従来のinstall.packages(“パッケージ名”) でインストールを試みる

パッケージをなぜ読み込むのか?

  • 実は、原則として、パッケージを読み込まなくともコマンドは使用できる
    • (パッケージ名)::(関数名) のように記述すれば実行できる
    • しかし、毎回パッケージ名を表記するのが面倒なので、それを省略するためにパッケージを読み込ませているだけ
    • 複数のパッケージを読み込んだ際、同じ名前の関数が重複することがある(この現象は、衝突 (conflict) と呼ばれる)
      • この場合、後に読み込んだパッケージの関数が優先される

パッケージの一括インストール

  • インストールだけを行いたい場合は、pacman::p_install(“パッケージ名”, …) を実行してインストールできる
    • この場合も複数併記可

パッケージの一括更新

  • pacman::p_update() で インストール済みパッケージを全て更新できる

tidyverse のインストール

tidyverse

  • 分析できる状態になるようにデータを整理するためには、多大な 労力を要することが少なくない
    • この状況を改善するため、データの整頓 (data tidying) という概念が提唱された
  • 整頓されたデータ = tidy data
    • 操作しやすい・モデル化しやすい・視覚化しやすい
    • 構造が一定 (各変数が列, 各観測が行, 観測ユニットが表)
  • R で tidy data を扱えるようにしたのが tidyverse パッケージ群
  • データの操作結果をコンソールに出力できる tidylog パッケージも併用すると良い
  • 全データの何割が、実行した処理によって書き換えられたかを表示してくれる
    • 処理の誤りに気づきやすくなる

インストール

pacman::p_load(tidyverse, tidylog)
  • tidyverse はパッケージの集まりなので、インストールには多少時間がかかる
    • Linux 上で実行している場合は、インストール時にビルドが実行されるためかなり時間がかかる
      • 公式のパッケージマネージャのリポジトリを活用したい(まず、サイト右上の distribution から自分のディストリビューションを選択すること): https://packagemanager.rstudio.com/client/#/
      • なお、Global Options でリポジトリを設定しても反映されないため、インストール前に、上記サイトに記載のoptions 関数を実行されたい
  • tidyverse パッケージを読み込めば、メインのパッケージがまとめて読み込まれる
    • dplyr, tidyr, readr, ggplot2, purrr, tibble, stringr, forcats, lubridate
    • 上記以外のtidyverseパッケージ (readxl, rvest など) を 読み込む場合は、他パッケージと同様に、pacman::p_load() 内に表記する必要あり