宋ゼミを志望する皆様へ
何をするゼミか
本ゼミは社会現象のデータ分析(+美味しい飲食店情報の共有)を主な内容とします。ここでは一つの例を見ながら考えてみましょう(宋の専門は政治学であるため、政治の例を挙げます)。
2016年度の参院選から18歳投票権が導入されました。若者の政治参加が期待されている中、選挙後年齢別投票率が公開されました。以下のグラフは都道府県別に投票率を示したものです。
これまで日本では都市部の投票率が低く、非都市部の投票率が高いと言われていました。実際、これまで参政権を有していた20歳以上に限定してみると(青い棒)、長野、島根、山形当たりが最上位となります。一方、都市部の東京はやや高めでしたが、その他の大阪、愛知、千葉当たりの投票率は低い傾向を示しています。しかし、18歳の投票率はそうではありませんでした。最も高いトップ3は東京、神奈川、愛知といった都市部でした。若者ほど投票に参加しないのが長年の観察から得られた傾向ですが、これらの都道府県は18歳の投票率が20歳以上の投票率を凌駕しています。これはなぜでしょうか。
他にも様々な問いが考えられます。我々が街中で見る「投票に行きましょう」ポスター、これは本当に効果があるでしょうか。世論調査と実際の選挙結果がずれることはなぜでしょうか。みんな仲良くすれば良いのに、なぜ戦争が起こるでしょうか。
このように社会には「なぜ?」や「本当に?」といった謎(パズル)がいっぱいあります。本ゼミはこのような社会における謎を対象に、データを用いた実証分析を行います。近年、データの重要性が高まっており、データサイエンティストの需要が急増しています。データは社会の謎を解く一つの鍵でありながら、より良い社会を実現するための鍵でもあります。データを有効活用するためにはデータ分析そのものの発展も不可欠です。本ゼミでは2年間にわたって(1)問題を発見し、(2)問いを設定し、(3)問いに対する答えを導き出すためのスキルを身につけることを目標とします。
以下の内容は現時点での予定です。2023年度はゼミ2期目であり、ゼミの形や進め方が流動的です。皆さんと相談しながらゼミの進め方を調整していく予定です。
専門演習(3回生)
- 前期
- 文献輪読(リサーチデザインと因果推論に関する入門書)
- 分析ツール(R)の使い方の習得
- データ分析の基礎
- 後期
- データ分析の基礎
- グループ単位の共同研究と発表
卒業研究(4回生)
- 前期
- データ分析の発展的手法
- 既存研究の再現(replication/reproduction)
- 後期
- 卒論に向けた個人研究
事前履修が望ましい科目
全て履修する必要はなく、いくつか履修しているだけでベストです。全く履修していない場合でも、データ分析を勉強したいというやる気さえあれば、2年間で十分上達できます。
- 統計学
- 基礎数学(確率・統計)
- データリテラシー実習
- データ分析実習
- 調査データ分析
- 社会調査入門
- 社会調査方法論
配属後、履修が望ましい科目
強制ではありませんが、以下の2科目を強く推奨します。Rは本ゼミの共通言語でもあるため、相乗効果が期待されます。宋の他の担当科目である「政治学」、「ミクロ政治分析」、「マクロ政治分析」は政治学の授業であり、政治学に興味のある方は挑戦してみてください。
- ミクロ政治データ分析実習: Rの使い方
- マクロ政治データ分析実習: Rを用いたデータ分析
宋は何者か
私は政治行動論と政治学方法論を専門としています。政治行動論は政治における様々な主体(有権者、市民、政治家、官僚、マスコミ、若者、ネット民など)の行動や意識を観察したり、因果関係を分析する学問ですが、私の主な観察対象は有権者です。この観察や分析を支えるのが政治学方法論です。観察には観察済み(=既に公開されている)のデータを使うこともあれば、自分の問いを検証するために世論調査などを通じて観察する場合もあります。
要するに私の仕事は政治的現象をデータを用いて分析することです。政治学 \(\times\) データサイエンスについては以下の動画を参照してください。
私の研究活動に興味のある方はResearchページ、使用するツールに興味のある方はTutorialページを参照してください。とりわけ、ゼミの担当教員がどのような研究をする人かを知ることは重要であり、研究の履歴を見ることをおすすめします(本ゼミに限らず、全ゼミに共通します)。
趣味はグルメとゲームです。麺類(とりわけラーメン)が好きですが、最近は少し控えております。ゲームは最近、Final Fantasy XIV(Masamune@Mana)をプレイしております。
宋ゼミが求める人物像
1. 積極性
費やした時間と成果は比例します
ネットワーク分析で有名なバラバシ先生は、成功(success)のためには何度もチャレンジしていくことが重要であることを強調しています。大変面白い動画ですのでぜひご覧になってください(日本語字幕もあります)。
[I]f you keep trying, you could still succeed and succeed over and over.
皆さんがスキルの習得に費やした時間と、実際に得られたスキルは必ず正の関係を持ちます。人によっては100を達成するために1時間を要する人もいれば、5時間を要する人もいるでしょう。スピードに差はあるかも知れませんが、時間とレベルは必ず比例します。体育や芸術などとは違って、データ分析に才能というものは存在しないと、宋は考えております。ただし、年45時間のゼミだけでデータ分析、リサーチデザインなどのスキル全て身につけられるとは期待しないでください。これの数倍、数十倍の時間が必要です。したがって、ゼミ外時間の活用が非常に重要です。特に夏休み・冬休みはスキルアップのための絶好の時期であり、他人と差を付けたいのなら休み期間がチャンスです。ゼミ外時間、そして夏休み・冬休みにも積極的に学習・研究活動に取り組む方を歓迎します。
ゼミ生からの要望がありましたら、サブゼミとして分析ツール講習会の開催も検討します。また、2022年度は新型コロナで無理だと考えられますが、今後、方法論の合宿も行う可能性もあります。
たくさんの失敗を味わいましょう
パソコンを触っていくと、何度もエラーメッセージが遭遇したり、自分が欲しい結果が得られない時もあるでしょう。人によってはエラーメッセージなんかに遭遇しない人もいるかも知れません。しかし、現場において最も重宝されるのはたくさんの失敗を経験した人です。成功の経験しかない人は、失敗の時の対応が苦手です。失敗しを繰り返し、それを克服していく過程そのものに大きな意味があります。失敗を恐れない方を歓迎します。
分からないことを分からないまま放置しないように!
これは非常に重要です。分からないことを放置した時点で成長は止まります。小説や漫画、ゲームなどストーリーが存在するあらゆるものにおいて、後の内容は前の内容に基づいています。これはほとんどの教科書、学術書、論文だけでなく、学習の過程にも共通しています。学習において前の内容が分からないと後の内容は分かりません。分からないものを放置して進むと、必ず壁に遭遇し、そこで頓挫します。そしてもう一度最初に戻らざるを得なくなります。限られた時間においてこれは大きな損失です。
疑問点をその場で解決することは、今は面倒かも知れません。しかし、2年間のゼミを考えると、これは時間の節約になります。特に2年目は就活なので学習時間が限られてきます。分からないことがあれば他の入門書・教科書、インターネット検索、最終的には担当教員との相談で解決しましょう。
海外の論文を読みましょう
輪読の際、基本的には日本語の文献(本・論文)を読みますが、必要に応じて英語の文献も読む必要があります。多くの学生が「XXに関する先行研究は存在しない。だから本稿ではXXについて分析を行う」と書いたりしますが、これは高確率で誤りです。ほとんど研究の場合、先行研究が存在します。存在を知らないだけです。たまに、天才的な発想で誰も思いつかなかったテーマを見つけるケースも稀にありますが、本当に稀(SSR)です。また、本当に先行研究が存在しないとしてもそれは現実的に研究の遂行が困難なテーマか、学術的にあまり意味のないテーマである可能性が高いです。皆さんが何かのテーマを決めたらそれに関連する文献は必ずあると考えても良いでしょう。そして、それらのほとんどは英語で書かれています。英語の論文を一回も読んだことのない学生にとって、英語の論文は苦痛でしかないでしょう。しかし、英語の論文はかなり構成が論理的であるため、言語の側面を除けば逆に読みやすいです。また、最近は機械翻訳の精度も非常に高く、こちらも合わせて使うことも可能でしょう(ただし、機械翻訳を盲信してはいけません。たまにとんでもない結果を返したりします)。卒業研究に取り組むまでたくさんの論文を読むことになりますが、日本語の文献だけでなく、海外の文献にも挑戦する方を歓迎します。
サークル活動について
サークル活動と並行することは全く問題ございませんが、サークル活動の配慮は致しません。欠席に関しましては公欠扱いが可能でしたら公欠としますが、学習やグループワークにおける遅れは全て自己責任となります。欠席された分、一人で遅れを補う積極性が求められます。
2. コミュニケーション能力
多くの学問分野において共同作業、つまり「共著」が一般化しています。これまで「共著」といえば理系のイメージが強く、文系は「単著」文化だと認識されてきました。総合情報学部は文理融合学部です。共著も単著も体験して頂きます。文系においてもごく一部の分野を除き、共著文化が定着しつつあります。私が携わっている政治学も例外ではありません。共同作業においてコミュニケーション能力が必須です。これは「他人と楽しくしゃべる」ことを意味するわけではありません。ここでのコミュ力とは何かがあったら皆と相談する、途中経過を共有する、他人からのフィードバックに耳を傾けるといったものを指します。共同研究においてこれらは非常に大事です。
最終的には単著で卒業論文を執筆することになりますが、一人で執筆するとしてもコミュニケーション能力は重要です。研究のプロである研究者たちも一つの論文を出すまで何回も研究会・学会で報告したり、他研究者との相談を通じてフィードバックをもらいます。単著は独り善がりの研究になりやすい故、このようなコミュニケーションは非常に重要です。
宋にとって日本語は外国語ですし、文法も、アクセントもめちゃくちゃです。それでも人とコミュニケーションをとっています。上手に喋るに越したことはありませんが、大事なのは発信と意見の受け入れを恐れない態度です。
3. 探求力と知的好奇心
何かを継続していくには、そこから何かの意味を見出さなければなりません。以下の動画を御覧ください(日本語字幕もあります)。行動経済学者のアリエリー先生のTED公演動画です。
データ分析手法を身につける過程は退屈な作業の連続です。継続していくためには、目標が必要です。単に「データ分析に慣れたい/上達したい」という曖昧な目標だけでは、途中で諦めやすいです。そもそも「慣れ」や「上達」は主観的なものだからです。やはり「XXを明らかにしたい」といった具体的な問いがあって、その問いに答えるためのスキルとしてデータ分析を習得していく必要があります。むろん、美しいコードを作成したり、綺麗なグラフを作ることが目的の方には、これ自体が目的ですので、良いでしょう(宋がこのタイプの人間です)。あるいは、データ分析に関する資格(統計検定など)の取得のような目標も良いかも知れません。「XXを達成したら絶対うれしい!」といった具体的な目標を持つ方を歓迎します。
宋ゼミの到達点
宋ゼミでは(1)リサーチデザイン、(2)当該分野に関する知識、(3)分析ツール、(4)データ収集、(5)統計学と分析手法に関する知識を身に付けることを目的とします。これら5つのスキルについて背景知識があるに越したことはありませんが、必須ではありません。そもそもこれらのスキルを既に身につけているのであれば、わざわざ宋ゼミに来る必要はないでしょう。以下の内容は前提知識ではなく、これから2年間身につけていくスキル、つまり到達目標です。
1. リサーチデザイン
何か明らかにしたい問い(リサーチ・クエスチョン)が見つかったら、その問いに答えるためのプロセスを考える必要があり、これがリサーチデザインです。リサーチデザインがしっかりしていれば、研究として最低限の質は保障されます。一方、斬新なテーマ、または問いであってもリサーチデザインがしっかりしていなければ、研究として成り立ちません。自然科学もそうですが、社会科学も今日はリサーチデザインの雛形といったものが決まっております。論文の章立てとしては問題意識、理論・仮説、データ、分析手法およびモデル、分析結果、結論といった順となっており、実際に研究を進めていく際もこの順番に従うことになります。
社会科学では問いに対する暫定的な答えを用意し、この暫定的な答えの真偽を判定することになります。この暫定的な答えが仮説と呼ばれるものであり、これは印象論や想像でなく、これまでの先行研究や自明な公理の積み重ねで導出されるものです。そのためには問い関する先行研究を読む必要があります。
リサーチデザインは授業として教わることもできますが、個人の経験が重要です。様々な論文、本を読みながらリサーチデザインを習得して頂きます。優れたリサーチデザインの研究は参考の対象となりますし、そうでない研究でも反面教師として利用することができます。むしろ、リサーチデザインが優れていない研究が見つかればラッキーです。なぜなら、そのリサーチデザインを自分で改良することで一つの立派な研究になるからです。
本ゼミではリサーチデザインに関する教科書の輪読に加え、いくつかの論文/書籍を読みながらリサーチデザインの感覚を身につけます。これはグループワークおよび卒業論文においても最も重要な内容です。
2. 当該分野に関する知識(ドメイン知識)
社会現象を分析するためには、その現象に関する知識が必要です。たとえば、「若者の投票率はなぜ低いか」という問いに取り組むのであれば、政治学や政治心理学などの知識が必要です。関西大学総合情報学部には様々な分野に関する科目が開設されております。政治学だと、「政治学」、「政治過程論」、「公共政策論」、「パブリック・アドミニストレーション論」、「ミクロ政治分析」、「マクロ政治分析」などがあります。自分が関心のある分野の授業にも積極的に挑戦してみてください。むろん、これらの分野に関する教科書で独学するのも良いでしょう。総合情報学部は幅広し分野をカバーしますが、全てをカバーしているわけではありません。また政治学の話ですが、総合情報学部では政治理論、政治哲学、国際政治に関する講義は設けられておりません。しかし、これらの分野にも優れた教科書は多数公刊されていますし、一人でも十分学習できます。
3. 分析ツール
本ゼミでは共同作業における共通言語としてRを使います。これはRがベストな統計ソフト/言語だからではありません。むしろ、Rはプログラミング言語としてはあまり良くないという意見が多いですし、宋もそう思っています。しかし、共同作業において共通言語は必要です。皆が使う統計ソフトがバラバラだったら、共同作業は非常に難しいでしょう。
ならば、なぜRでしょうか。1つ目の理由は無料で誰でも使えるからです。世の中には大変便利な商用ソフトで溢れています。しかし、共同作業のメンバー全員がそのソフトを持っているとも限りませんし、これらのソフトウェアは安くても数万円、高ければ百万円以上となります。「自分は買える」は「他人も買える」ではありません。2つ目の理由は世の中に存在するほぼ全ての分析ができるからです。世の中には様々な統計手法がありますが、ほとんどの分析がRでできます。最近は新しい手法を発表したら、それを実装したRパッケージも一緒に公開するケースが多いです。3つ目の理由は学習資料が最も豊富だからです。本だけでなく、ウェブ記事やチュートリアルも非常に充実しており、独学にも向いています。Rの使い方に関しては3回生以上科目の「ミクロ政治データ分析実習」などがあります。
データサイエンス業界ではRとPythonが2大言語であり、最近はJuliaも注目されています。どれも無償で使えるため、こちらを使っても構いません。ただし、共同作業の場合、メンバー全員がその言語を使う必要があります。また、卒業論文のような個人研究の場合、SPSS、Stata、SASなどの有償ソフトウェアの使用を認めます。
分析ツールの学習は原則、独学となります。ゼミ生の要望がある場合、希望者を対象にサブゼミとして講習会を開くことはできます。また、Rを使用する授業として「ミクロ政治データ分析実習」と「マクロ政治データ分析実習」があります。ゼミ内では主にリサーチデザイン、文献講読、グループワークを中心に行う予定です。
4. データ収集
データ分析を掲げている以上、データは不可欠です。データを集める前に、私たちは分析の単位を決める必要があります。たとえば、「都市部の有権者は投票率が低い」という仮説があるとします。この場合、分析の単位は個人です。つまり、データの各行は一人一人の個人を表す必要があります。そして、世論調査を行い、回答者が暮らしている地域の規模、そして直近の選挙に投票したか否かを尋ね、データを集める必要があります。この場合、社会調査法の知識が必要となります。しかし、世論調査を行うには非常に大きなコストが必要であり、個人で行うことは困難です(できないという意味ではありません。数万円でできたりもします。)。場合によっては既に他の研究者、機関が行った世論調査データを使うこともあります。このように既に公表されているデータを用いた分析を「2次分析」と言います。ただし、注意すべき点は「集計データ」でなく、「個票データ」を使う必要があるということです。日本の場合、個人データの公開は非常に消極的であるため、注意が必要です。
世論調査ができず、公開されているデータもない場合は分析の単位を変えることが考えられます。仮説を「都市部はその他の地域より投票率が低い」に変えると、分析の単位は市区町村、または選挙区になります。このようなデータはネット上で手軽に入手することができます。各市区町村の選管ホームページなどを周りながらデータを集めたり、情報公開請求をするなどが必要ですが、金銭的なコストはほぼ発生しません。ただし、このように個々人のデータを集計したデータ、つまり集計したデータを使用すると生態学的誤謬が生じる可能性がある点には注意が必要です。
5. 統計学と分析手法
言うまでもありませんが、データ分析を行うためには統計学および分析手法に関する知識が必要です。近年のデータサイエンスのブームの影響もあってデータ分析に関する書籍が数百冊以上出版されており、優れたインターネット記事も多く公開されています。また、総合情報学部にはこれに関連する授業が充実しており、学習環境としては最適です。データ分析のためのソフトウェアを使えば、分析は数秒で終わります。たとえば、Rで回帰分析を行うコードは1行で済みます。チュートリアル本や記事が溢れているため、これらのスキルを身につけることは難しくありません。実際、社会科学におけるデータ分析のプロセスにおいて、分析そのものは全体の1〜2割程度に過ぎず、残りの8〜9割はリサーチデザイン、先行研究のレビュー、データ収集、データの前処理、データ/結果の可視化といった作業です。ただし、これが「データ分析は全体のプロセスにおいてあまり重要ではない」ことを意味しません。ほとんどはパソコンが瞬時にやってくれるという意味です。あくまでも費やす時間として短いだけです。
重要なのは「なぜこの分析を使うのか」、「この分析手法は自分の問いに答えるために適切な手法か」、「分析結果をどう解釈するか」、「分析結果は自分の問いに答えているのだろうか」など、パソコンがやってくれる作業以外のことですし、そのためには確率、線形代数、統計的仮説検定、可視化などの知識が必要です。これらの知識は授業、教科書、参考書、ネット記事などから身につける必要があり、非常に長い道のりです。たとえば、「若者と高齢者の間に投票率の差があるか」といった単純な問いに答えるための母平均の差の検定(t検定)を行うこと自体は1行で済みますが、その結果を正しく解釈するためにはt検定の仕組み、その仕組を理解するためには統計的仮説検定、統計的仮説検定を理解するためには中心極限定理と大数の(弱)法則、また、これらをりかいするためには確率の知識が必要です。これらの知識については近年、分析ツールの使い方を学びながら同時並行的に学習できるような資料もたくさん出ております。教科書の相性は人それぞれですので、ぜひ図書館や本屋などでいくつかの教科書に接してみてください。むろん、宋も積極的にサポートします。
宋ゼミの活動に関連する資料
以下のリストはほんの一部です。これから少しずつ追加しておきます。以下の資料をゼミ中に全て読むことはできませんが、何冊かピックアップして輪読する予定です。【】が付いている書籍は当該年度に使用した資料です。
リサーチデザイン
分析ツール (R) の使い方
様々な分析手法について
因果推論
(参考) 政治学の教科書
政治学分野の教科書/専門書はいつでも紹介できます。ご希望の方は宋に相談してください。
- 砂原庸介・稗田健志・多湖淳. 2020. 『政治学の第一歩〔新版〕』 有斐閣.
- 久米郁男・川出良枝・古城佳子・田中愛治・真渕勝. 2011. 『政治学 補訂版』有斐閣.
- 坂本治也・石橋章市朗 (編). 2020. 『ポリティカル・サイエンス入門』法律文化社.
- 伊藤光利. 2009. 『ポリティカル・サイエンス事始め (第3版)』有斐閣.
- 上神貴佳・三浦まり. 2018. 『日本政治の第一歩』有斐閣.
- 飯田健・松林哲也・大村華子. 2015. 『政治行動論ー有権者は政治を変えられるのか』有斐閣
- 山田真裕・飯田健. 2009. 『投票行動研究のフロンティア』おうふう.
- 建林正彦・曽我謙悟・待鳥聡史. 2008. 『比較政治制度論』有斐閣.
- 伊藤光利・真渕勝・田中愛治. 2000. 『政治過程論』有斐閣.
宋ゼミの「これまで」と「いま」
ゼミ生
- 井上達望(いのうえ・たつみ)さん
- 川東奈央(かわとう・なお)さん
- 岐部夢奈(きべ・ゆめな)さん
- 佐伯のの花(さえき・ののか)さん
- 末本健心(すえもと・けんしん)さん
- D・Sさん 【ゼミ代表】
- 中尾真広(なかお・まひろ)さん
- 永江倫佳(ながえ・りんか)さん
- 樋口遼子(ひぐち・りょうこ)さん
- 本田良太郎(ほんだ・りょうたろう)さん
- 孟揚帆(もう・ようほ)さん
- 山本薫(やまもと・かおる)さん
- 青谷佳奈(あおたに・かな)さん
- 大土康介(おおつち・こうすけ)さん
- 加藤涼太(かとう・りょうた)さん
- 蔡雨晨(さい・うしん)さん
- 齊藤伊吹(さいとう・いぶき)さん
- 島津柚羽(しまづ・ゆずは)さん
- 瀬崎暉梨(せざき・ひかり)さん
- 瀧惇人(たき・あつと)さん
- 谷口光央(たにぐち・みつお)さん
- 月原陸斗(つきはら・りくと)さん
- 橋本みなみ(はしもと・みなみ)さん
- 渡部敦子(わたなべ・あつこ)さん
ゼミ生の研究テーマ
2022年度
- テレビ視聴率低下の現状と原因
- ネコ派とイヌ派の間に性格の違いはあるか。
- 日本におけるiPhoneの圧倒的シェアの原因
- どのようにティッシュを配れば受け取ってもらえるか。
2023年度
Coming soon.
Coming soon.