独立した項目


Bayesian Statistics

Rstan [入門]

  • Stan tutorial [Slideshare]
  • R stan 導入公開版 [Slideshare]
  • RStan使ってMCMCの計算をやってみた [(1) Link] [(2) Link]
  • Stanで統計モデリングを学ぶ [Link]

Rで形態素解析(韓国語)

[R単体] KoNLPを使う

  • CRANに登録されている韓国語形態素解析パッケージは多分はこれのみ [Link]
  • 普通使うには問題ないが、他の形態素解析と比べて性能がイマイチ
  • 形態素解析器はハンナヌム解析器
  • 使い方はわりと簡単で、名詞を抽出したいなら
    extractNoun(“여기에 문자열을 삽입”)

[R + Python]K oNLPyを使う

  • 実はこれはRのパッケージではなく、Pythonのパッケージ [Link]
  • 5種類くらいの解析器(KoNLPのハンナヌム解析器も含む)を同時に使えるという長所がある。特にTwitterが開発した韓国語形態素解析はStemmingができて非常に使える。
  • PythonのコードをRで呼び出すにはrPythonパッケージを使う
  • keitaiso.pyの中身が
    from konlpy.tag import Twitter
    tt = Twitter()
    def keitaiso(x):   
        result = tt.nouns(x)
        return result
    だとする。
  • 次にRで、
    library(rPython)
    python.load(“keitaiso.py”)
    python.call(“keitaiso”, “여기에 문자열을 삽입”)
    これでオッケー
  • 性能的にはKoNLPyがいいことは確かだとは思うが、速度に関してはまだ比較していない