相関係数

  • Pearson’s r : pwcorr
    • option : obs – ケース数, sig – 有意水準, star(0.05) – p < 0.05なら*を付ける
  • 偏相関係数:pcorr var1 var2 var3
    • ⇒var1とvar2/var3との偏相関係数を出力
  • Spearman’s ρ:spearman
  • Kendall’s τ:ktau

パネルデータ分析

  • tsset [group var] [time var]
  • xtregのoptionとしてfeを付けると固定効果モデル
  • areg varlist, absorb(group var)も上と同様に固定効果モデル。absorb内の変数で固定
  • xtregのoptionとしてreを付けると変量効果(Random Effect)モデル

固定効果モデルを使うか。変量効果モデルを使うか。

  • まずはfereで分析を行い、est store model1で結果を保存。
  • 次にもう一方の分析を行い、hausman model1で両モデルのHausman検定を行う。
  • カイ自乗の有意確率が10%か5%以下だと固定効果モデルが望ましい。

変量効果モデルとプーリングモデル。どっちを使うか。

  • xtreg, reで変量効果モデル分析を行う。
  • xttest0コマンドでプーリングモデルとの比較(Breusch and Pagan検定)
  • カイ自乗の有意確率が10%か5%以下だと変量効果モデルが望ましい。

固定効果モデルか、プーリングモデルか

  • xtreg, feもしくはareg varlist, absorb(group var)の結果の下にあるF検定結果を見る。
  • Fの有意確率が5%以下なら少なくとも一つ以上の固定の特性がある事を意味するため、固定効果モデルを使う。

誤差項の分散均一性の検定

  • Breusch-Pagan/Cook-weisberg test
    • コマンドはestat hettest
    • 帰無仮説は誤差項の等分散を仮定している。
  • white test
    • コマンドはestat imtest, white
    • 帰無仮説は誤差項の等分散
    • つまりp値が0.05以下だと分散不均一性。⇒ ロバスト標準誤差(, vce(robust))かGLS推定

クロス表分析

Pearson’s Chi-square

  • もっとも一般的な方法
  • コマンドはtabulate var1 var2, chi2

Fisher’s exact test

  • サンプル数が少ない時に用いる。多い場合にも有効
  • 一般的にセル内で5未満の期待度数がある時に使うらしい。
  • コマンドはtabulate var1 var2, exact
  • Pearson’s Chi-square検定と同時に使える
  • 期待値に表示オプションは, expected(もしくはexp)

グラフィック

  • Matrixでプロット
    • graph matrix (varlist)
  • 回帰分析後、残さと推定値のプロット:rvfplot
    • cf) 残差のプロットの見方 [Link]
  • 重回帰分析の後、他の変数を固定し、特定独立変数と従属変数の散布図および回帰線を表示する: avplot(avplotsを用いると全ての変数に対するプロットと回帰線が得られる)
  • 回帰係数のキャタピラープロットの作成
    • coefplotパッケージが非常に強力 [Link]

出力

  • 結果をExcelのセルに移す方法
    • Retainingan Excel cell’s format when using putexcel, The Stata Blog [Link]

条件付きロジット分析

  • 以下のものが分かりやすいかなと
  1. “The Conditional Logit Regression Model” – UITS Research Techonologies, Indiana University [Link]
  2. “Logistic Regression with Stata : Chapter 6 – Conditional Logistic Regression” – idre, UCLA [Link]
  3. Stataのマニュアルなら [Link]

簡単な行列演算

  • Mataという行列のための言語があるらしいが、そこはよく分からん。とにかく簡単な行列の演算ならすぐできる。
  • Stata工房 [Link] ※Stata13
  • まぁ、Rを使ったほうが一番ラクかも

Marginsplot

  • 複数のmarginsplotを一つの画面上に統合
  • graph combineだとoverlayではなく、並べるだけ
  • 一つの画面上に複数のmarginsplotを表示したければ、combomarginsplot[Link]というパッケージを利用
  • 一番良いのはSPost13のmgenコマンドで変数を作成してtwowayで作図するのかも