なぜR, RStudio, Quartoなのか?

R や Python などのプログラミング言語を使うべき理由

  • 無料で入手可能
    • 分析の再現可能性を高める上で、分析にかかる費用を(コンピュータ自体の購入費を除いて)ゼロに抑えることは必須
    • Excel, SPSS や Stata などの有名なソフトは有料のものが多い
      • しかも、これらのソフトはクリック操作がメインである
        • クリック操作での実行は、再現可能性を低める
          • 手順が増えるほど、再現に失敗する確率が上がる
          • ソフトのアップデートなどによって仕様が変わることで、以前の手順が実行できなくなることも多い
          • 再現可能性の観点からは、Excel でデータフレームを作成・編集するのは全く推奨できない
            • その手順、完璧に説明できる?おそらく(特にデータが大きいなら)無理
  • 言語自体のソースコードが公開されている

RStudio や Visual Studio Code などのソフトウェアを使うべき理由

  • 効率的なコーディング(=プログラムのコードの記述)を支援する機能が多く備わっている
    • ショートカット、デバッグ(=バグの修正)など
    • ゼロからコードを書いていくのは非効率
  • 無料で入手可能

Quarto や Jupyter Notebook などのファイル形式を使うべき理由

  • コードとメモを区別・混在できる
    • コードが見やすくなる
  • コードの実行結果とメモを合わせてドキュメントとしてエクスポートできる
    • 例えば Quarto では、コーディング、実行、結果の Word ファイルへの出力を一括で行うことができる