Category: Studynote

Logistic Regressionによる分類と可視化・評価

ロジスティック回帰分析について ロジスティック回帰分析は応答変数が0か1のように二値変数の場合に使う分析手法です。「投票に参加するか否か」などの場合にも使えますが、「AかBか」のような分類の場面でも使える手法です。ここでは説明変数が2つ(と)の場合を考えてみましょう。 最も単純なロジスティック回帰分析の場合、説明変数と応答変数の関係は以下のように表現できます。 $$\begin{eqnarray} Y_i & \sim &  \textrm{Bernoulli}(\theta_i) \nonumber \\ \theta_i & = &  \frac{\exp(y_i*)}{1 + \exp(y_i*)} \nonumber \\ y_i* & =  & \beta_0 + \beta_1 x1_i…

Slideshareへアップロードするスライドの日本語が消える場合

Slideshareにアップロードしたスライドで、日本語が消える場合がありますよね。 使用しているPCはMacbook Pro 2016 Lateモデルです。スライドはlatex (beamer)で作成しています。ちなみに主に使うテーマはmetropolisですが、テーマの問題ではないと思います。 ちなみに、別にbeamerで作成されたスライドだけの問題ではないようで、macOS全般の問題かと思います。 KeynoteのスライドをSlideShareにアップロードすると日本語が表示されない問題 これまでやってきた対処法としては スライドを全て画像 (pngなど)に変換し、アップロード とにかく面倒くさい。 画像化することで、画質が落ちる Speakerdeckにアップロード Speakerdeck自体はいいと思いますが、アップロードが出来ない/時間がかかる場合が多々あります。 今回、博士論文を提出する際に、規定上、PDF/Aフォーマットで提出しましたが、もし、PDF/Aフォーマットにしたら上手くいくのではないかと思い、やってみました。 PDF/Aファイルの変換方法は色々ありますが、ghostscriptで簡単にできます。ターミナルかiTermなどを起動し、以下のように打ち込みます。 sudo gs -dPDFA -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=output.pdf input.pdf output.pdfは変換後のファイル名、input.pdfは原本のファイル名です。 やってみたら上手くいけました。  …

モデルの比較&選択の基準: AICとBIC

以下の論文の要点のみを整理したものです。短い論文なので直接読んだ方がいいかも知れません。 Aho, Ken, DeWayne Derryberry, and Teri Peterson. 2014. “Model Selection for Ecologists: the Worldviews of AIC and BIC.” Ecology. 95 (3) pp. 631-636   AICとBIC、どっちを使うか? 両方使う。表の一列 (行)が増えるだけ…

dplyr入門

参考資料 dplyr of Datacamp <- 実はこんなもん読むよりこっちのホームページへアクセスして実習した方が100倍いいと思う。 Introduction to dplyr dplyrはR業界の神様、Hadley Wickhamが作成したRのパッケージである。 R内蔵の関数でもデータの管理はできるが、dplyrを使うと生産性は何倍も向上する。 dplyrの主な使い道は以下のとおり 関数名 機能 filter ある条件に合ったケースだけを抽出 arrange データをある基準に合わせて揃える select 指定した変数のみを抽出 mutate 計算した結果を新しい変数として定義 summarise データの要約 これらの機能を最大限発揮するために、いくつかの良き友達がいる 関数名 機能…

色々な非比例性指数

$$※ v_i: 得票率, s_i: 議席率$$ Rae’s Index (Rae 1967) $$I = \frac{1}{n}\sum_i^n|v_i – s_i|$$ Loosemore-Hanby’s Index (Loosemore and Hanby 1971) $$D = \frac{1}{2}\sum_i^n |v_i – s_i|$$ Least Square…