1. 紹介

1.1 進捗状況

章立ては未定。著者が書きたいものから書く予定。

  • 全部で30~35章くらいになる見込み。
タイトル 進捗状況 (%) 備考
1 紹介 0
2 R? 75
3 Rのインストール 0 再執筆予定
4 IDEの導入 0 再執筆予定
5 分析環境のカスタマイズ 0
6 分析の手順 0
7 基本的な操作 80
8 データの入出力 60
9 データ型 80
10 データ構造 80
11 Rプログラミングの基礎 85
12 関数の自作 25
13 データハンドリング [基礎編: 抽出] 95
14 データハンドリング [基礎編: 拡張] 95
15 データハンドリング [基礎編: factor型] 90
16 整然データ構造 80
17 可視化[理論] 80
18 可視化[基礎] 80
19 可視化[応用] 20
20 可視化[発展] 0
21 データハンドリング [応用編] 0
22 文字列の処理 0
23 スクレイピング 0
24 R Markdown [基礎] 85
25 R Markdown [応用] 0
99 API 0
99 線形代数 5
99 最適化 5
99 モンテカルロシミュレーション 5
99 MCMC 0
99 オブジェクト指向プログラミング 0

1.2 本書の目的と対象

『私たちのR』はSONG Jaehyun矢内勇生 が共同で執筆するRプログラミングの「入門書」である。統計学の本ではない。

また、本書はデータ分析の手法の解説書でもない。Rを用いたデータ分析については他の本を参照されたい。私たちが専門とする政治学におけるデータ分析については、以下の本を勧める。

本書が想定するのは、次のような希望をもつ読者である。

  • 分析に入るまでの段階、つまりデータの入手やクリーニング方法が知りたい
  • 分析結果を自分の思いどおりに可視化したい
  • 複数のモデルを効率的に分析したい
  • Rでシミュレーションがしたい
  • Rと友達になりたい

本書を読んでも統計学やデータ分析を理解することはできない。本書の目的は、統計学やデータ分析についての知識を持った方々と、Rを使ってもっと効率的にデータ分析をする方法を共有することである。また、統計学やデータ分析を勉強する際に、プログラミングについての副読本として読むことも想定している。

本書を読み終える頃には、Rなしでは生活できなくなっていることだろう。

本書の執筆環境については第27 節を参照されたい。

1.3 著者紹介

事例研究をこよなく愛する著者 (Portland, OR. 2016年2月)

図 1.1: 事例研究をこよなく愛する著者 (Portland, OR. 2016年2月)

Song Jaehyun(宋 財泫 [ソン ジェヒョン]; 写真左)はR黒帯の大学教員。猫好き。 主な著書:多すぎて書けない。 公開したRパッケージ: BalanceR, PRcalc など

矢内勇生(やない ゆうき; 写真右)はR歴15年の大学教員。猫好き。主な著書:『Rによる計量政治学』(共著, オーム社, 2018年), 『政治経済学』(共著, 有斐閣, 2020年) 公開したRパッケージ:rgamer

1.4 データのダウンロード

本書のデータは全て筆者の GitHub レポジトリーから入手可能である。データは以下の手順でダウンロードできる。

  1. 本書のGitHubレポジトリー にアクセスする。
  2. dataフォルダーを選択する。
  3. ダウンロードするファイル名を選択する。
  4. 「Raw」を右クリックし、「Save Linked Contents As…」を選択する。
  5. 保存するフォルダーを指定して、ダウンロードする。

1.5 本書における表記法

  • コードは以下のように網掛けになっている箇所である。
print("Hello!")
  • コードの中で#で始まる内容はコメントであり、分析に影響を与えない。ただし、"'で囲まれた#はコメントではない。また、行の途中から#が入る場合、#以降は実行されない。
# Hello!を出力するコード
print("Hello!")

# "や'内の#はコメントではない
print("この#はコメントではありません")

print("Hello World!") # Hellow World!を出力
  • 出力結果は網掛け、かつ##で始まる箇所である。
## [1] "Hello!"
  • オブジェクト名は変数名関数名()のように文中の網掛け領域である。

  • パッケージ名は{}で囲む。tidyverseパッケージの場合、{tidyverse}と表記する。