R や Python などのプログラミング言語を使うべき理由
- 無料で入手可能
- 分析の再現可能性を高める上で、分析にかかる費用を(コンピュータ自体の購入費を除いて)ゼロに抑えることは必須
- Excel, SPSS や Stata などの有名なソフトは有料のものが多い
- しかも、これらのソフトはクリック操作がメインである
- クリック操作での実行は、再現可能性を低める
- 手順が増えるほど、再現に失敗する確率が上がる
- ソフトのアップデートなどによって仕様が変わることで、以前の手順が実行できなくなることも多い
- 再現可能性の観点からは、Excel でデータフレームを作成・編集するのは全く推奨できない
- その手順、完璧に説明できる?おそらく(特にデータが大きいなら)無理
- 言語自体のソースコードが公開されている
RStudio や Visual Studio Code などのソフトウェアを使うべき理由
- 効率的なコーディング(=プログラムのコードの記述)を支援する機能が多く備わっている
- ショートカット、デバッグ(=バグの修正)など
- ゼロからコードを書いていくのは非効率
- 無料で入手可能
Quarto や Jupyter Notebook などのファイル形式を使うべき理由
- コードとメモを区別・混在できる
- コードの実行結果とメモを合わせてドキュメントとしてエクスポートできる
- 例えば Quarto では、コーディング、実行、結果の Word ファイルへの出力を一括で行うことができる