紹介

RN4E

『私たちのR: ベストプラクティスの探究 (R Not for Everyone: An Esoteric Guide)』はSONG Jaehyun矢内勇生 が共同で執筆するRプログラミングの「入門書」である。統計学の本ではない。また、本書はデータ分析の手法の解説書でもない。Rを用いたデータ分析については他の本を参照されたい。私たちが専門とする政治学におけるデータ分析については、以下の本を勧める。

本書が想定するのは、次のような希望をもつ読者である。

  • 分析に入るまでの段階、つまりデータの入手やクリーニング方法が知りたい
  • 分析結果を自分の思いどおりに可視化したい
  • 複数のモデルを効率的に分析したい
  • Rでシミュレーションがしたい
  • Rと友達になりたい

本書を読んでも統計学やデータ分析を理解することはできない。本書の目的は、統計学やデータ分析についての知識を持った方々と、Rを使ってもっと効率的にデータ分析をする方法を共有することである。また、統計学やデータ分析を勉強する際に、プログラミングについての副読本として読むことも想定している。

本書を読み終える頃には、Rなしでは生活できなくなっていることだろう。

本書の執筆環境については本書の巻末節を参照されたい。

進捗状況

章立ては未定。著者が書きたいものから書く予定(全部で30~35章くらいになる見込み)。

  • 第I部: Rの導入
    • 1章: R? (50%)
    • 2章: Rのインストール (0%)
    • 3章: IDEの導入 (0%)
    • 4章: 分析環境のカスタマイズ (0%)
    • 5章: Rパッケージ (50%)
  • 第II部: Rの基礎
    • 6章: 基本的な操作 (80%)
    • 7章: データの入出力 (70%)
    • 8章: データ型 (90%)
    • 9章: データ構造 (80%)
    • 10章: Rプログラミングの基礎 (75%)
    • 11章: 関数の自作 (50%)
  • 第III部: データハンドリング
    • 12章: データハンドリング [基礎編: 抽出] (95%)
    • 13章: データハンドリング [基礎編: 拡張] (95%)
    • 14章: データハンドリング [基礎編: factor型] (90%)
    • 15章: 整然データ構造 (85%)
    • 16章: 文字列の処理 (0%)
  • 第IV部: 可視化
    • 17章: 可視化[理論] (85%)
    • 18章: 可視化[基礎] (85%)
    • 19章: 可視化[応用] (85%)
    • 20章: 可視化[発展] (85%)
  • 第V部: 再現可能な研究
    • 21章: R Markdown [基礎] (85%)
    • 22章: R Markdown [応用] (0%)
    • 23章: 表の作成 (0%)
    • 24章: モデルの可視化 (0%)
    • 25章: 分析環境の管理 (0%)
  • 第VI部: 中級者向け
    • 26章: データハンドリング [応用編] (0%)
    • 27章: 反復処理 (70%)
    • 28章: オブジェクト指向プログラミング (70%)
    • 29章: モンテカルロシミュレーション (50%)
    • 30章: スクレイピング (0%)
    • 31章: API (0%)

著者紹介

事例研究をこよなく愛する著者 (Portland, OR. 2016年2月)

図 0.1: 事例研究をこよなく愛する著者 (Portland, OR. 2016年2月)

Song Jaehyun(宋 財泫 [ソン ジェヒョン]; 写真左)はR黒帯の大学教員。猫好き。 主な著書:真に驚くべき業績を残しているが、この余白はそれを書くには狭すぎる。 公開したRパッケージ: {BalanceR}, {PRcalc}, {SimpleConjoint} など

矢内勇生(やない ゆうき; 写真右)はR歴15年の大学教員。猫好き。主な著書:『Rによる計量政治学』(共著, オーム社, 2018年), 『政治経済学』(共著, 有斐閣, 2020年) 公開したRパッケージ:{rgamer}

データのダウンロード

本書のデータは全て筆者の GitHub リポジトリから入手可能である。データは以下の手順でダウンロードできる。

  1. 本書のGitHubリポジトリ にアクセスする。
  2. dataフォルダーを選択する。
  3. ダウンロードするファイル名を選択する。
  4. 「Raw」を右クリックし、「Save Linked Contents As…」を選択する。
  5. 保存するフォルダーを指定して、ダウンロードする。

本書における表記法

  • コードは以下のように背景に色が付けられている部分である。
print("Hello!")
  • コードの中で#で始まる内容はコメントであり、分析に影響を与えない。ただし、"'で囲まれた#はコメントではない。また、行の途中から#が入る場合、#以降は実行されない。
# Hello!を出力するコード
print("Hello!")

# "や'内の#はコメントではない
print("この#はコメントではありません")

print("Hello World!") # Hellow World!を出力
  • 出力結果は色付き背景かつ##で始まる箇所である。
## [1] "Hello!"
  • オブジェクト名は変数名関数名()のように文中の色付き背景で示された部分である。

  • パッケージ名は{}で囲む。tidyverseパッケージの場合、{tidyverse}と表記する1

著作権

クリエイティブ・コモンズ・ライセンス

本著作物は クリエイティブ・コモンズ 表示-非営利-改変禁止 4.0国際ライセンスの下に提供されています。


  1. ただし、パッケージ名を{}で囲むのは一般的な表記ではないことを断っておきたい。↩︎