パッケージのインストール
pacman
- 使いたいパッケージを既にインストールしたかどうかを、我々は忘れがちである
- 未インストールの場合、パッケージを読み込む→エラーになる→インストールする→再びパッケージを読み込む、と一手間かかる
- だから、インストールされているか否かを自動で判別させ、それに応じて適切な処理を行わせたい
- 未インストール →インストール&読み込み
- インストール済み→読み込み
- この処理を1つのコマンドで行ってくれるのが pacman パッケージ
- pacman 自体は、install.packages(“pacman”) でインストールする
パッケージの一括読み込み
- pacman::p_load(パッケージ名, …) でパッケージを読み込む
pacman::p_load(tidyverse, tidylog)- 読み込み時にパッケージがインストールされていなければ、自動でインストール
- 複数のパッケージを一度に読み込むことができる
- install.packages() でも複数パッケージの一括読み込みは可能だが、ベクトルで括る必要があり若干手間がかかる
- 稀にインストールが失敗することがある
- pacman でインストールが上手くいかない場合は、従来のinstall.packages(“パッケージ名”) でインストールを試みる
パッケージをなぜ読み込むのか?
- 実は、原則として、パッケージを読み込まなくともコマンドは使用できる
- (パッケージ名)::(関数名) のように記述すれば実行できる
- しかし、毎回パッケージ名を表記するのが面倒なので、それを省略するためにパッケージを読み込ませているだけ
- 複数のパッケージを読み込んだ際、同じ名前の関数が重複することがある(この現象は、衝突 (conflict) と呼ばれる)
- この場合、後に読み込んだパッケージの関数が優先される
パッケージの一括インストール
- インストールだけを行いたい場合は、pacman::p_install(“パッケージ名”, …) を実行してインストールできる
- この場合も複数併記可
パッケージの一括更新
- pacman::p_update() で インストール済みパッケージを全て更新できる
tidyverse のインストール
tidyverse
- 分析できる状態になるようにデータを整理するためには、多大な 労力を要することが少なくない
- この状況を改善するため、データの整頓 (data tidying) という概念が提唱された
- 整頓されたデータ = tidy data
- 操作しやすい・モデル化しやすい・視覚化しやすい
- 構造が一定 (各変数が列, 各観測が行, 観測ユニットが表)
- R で tidy data を扱えるようにしたのが tidyverse パッケージ群
- 公式 Web サイト: https://www.tidyverse.org/
- データの操作結果をコンソールに出力できる tidylog パッケージも併用すると良い
- 全データの何割が、実行した処理によって書き換えられたかを表示してくれる
- 処理の誤りに気づきやすくなる
インストール
pacman::p_load(tidyverse, tidylog)- tidyverse はパッケージの集まりなので、インストールには多少時間がかかる
- Linux 上で実行している場合は、インストール時にビルドが実行されるためかなり時間がかかる
- 公式のパッケージマネージャのリポジトリを活用したい(まず、サイト右上の distribution から自分のディストリビューションを選択すること): https://packagemanager.rstudio.com/client/#/
- なお、Global Options でリポジトリを設定しても反映されないため、インストール前に、上記サイトに記載のoptions 関数を実行されたい
- Linux 上で実行している場合は、インストール時にビルドが実行されるためかなり時間がかかる
- tidyverse パッケージを読み込めば、メインのパッケージがまとめて読み込まれる
- dplyr, tidyr, readr, ggplot2, purrr, tibble, stringr, forcats, lubridate
- 上記以外のtidyverseパッケージ (readxl, rvest など) を 読み込む場合は、他パッケージと同様に、pacman::p_load() 内に表記する必要あり