複雑研全体ゼミ、プログラミング3の相談対応、個別ゼミ

Share on:

ここ1,2週間ぐらい「自宅に居ると喉の調子が悪くて鼻水がずるずる。大学で仕事してると少し回復」というのを繰り返しています。あれこれ試してみた感じでは「飲食の偏り」とか「空調付けっぱなし」の問題ではないことをここ1週間で確認。具体的には、普段あまり食べてなかった海産物や肉類、野菜果物類あれこれ食べてみたり、なるべく空調レス(扇風機のみ)で過ごしてみてたのだけど、体調には影響せず。言い換えると、案外空調無しでも過ごせるなとは思った。真昼&寝始めの2時間ぐらいは付けてたけど、それぐらいで何とか。

今は、試しに空調の「部屋掃除モード」とやらをお試し中。天気の良い日に空気入れ替えもしてるから関係無さそうなんだけど、今の所はプラシーボ効果か鼻水も止まってます。ハウスダスト? 掃除だけじゃなくてベッド周りの洗濯とかもやったんだけどな。

今日は朝から複雑研全体ゼミ、プログラミング3の相談対応、個別ゼミ、をしながら空き時間で事務作業したり相談準備したりで早朝からずっと走りっ放しな一日でした。


朝一の全体ゼミは、「統計的機械学習―生成モデルに基づくパターン認識」の3章関連演習、7章&8章。3章関連演習は主成分分析してみた、というお話。この辺りははじめよう多変量解析~主成分分析編~あたりを眺めてイメージしつつ、実際にやってみるのが良いんじゃないかと。

7章「最尤推定法におけるモデル選択」は、最尤推定法にもいくつか種類がある中でどれを選べば良いのかを判断するための基準についての話。どれだけ確率密度関数を近似できたかを表現する「KL情報量」だと、そのまま使うことができない(真の解が分からないと距離を測れない)上に、近似したとしても「複雑なモデルほど良いモデルと判定してしまう」のでそのままKL情報量を使うのはNG。そこでパラメータ数も含めたAIC基準を使いましょうというお話。東工大の資料が分かり易いというか教科書まんまかと。

8章「混合ガウスモデルの最尤推定」は、ガウスモデルを複数組み合わせて(足し合わせて)より複雑な表現を可能にしたモデルの話。複雑なだけあって解を行列演算して求めることが難しく、勾配法やEMアルゴリズムを使って局所的最適解を見つけようという流れ。これも東工大資料参照。


3時限目はプログラミング3関連の相談で、学科システムを学生らで運営している(=いろんな情報をゲットできる)ことを前提として、どういうことがやれそうかという話。具体的に収集しているデータは、誰が(who)、学科LANへの接続している時刻(when)と、どこから(where)接続しているかの情報。whoについては勿論個別に把握できる訳だけど、収集できてるデータからは「誰が同じ部屋に居るか」も分かるし、whenも「収集データのままだけじゃなく、1時間/1日/平日/週末/学期/年間」とか様々なスケールで見ることができるだろうし、whereについても具体的な部屋が分からなくても1〜3年次はかなりの頻度で各々の自習室だろうし、4年次以上は研究室情報追加するだけで分かるだろうし。いくつか例示しつつ、あれこれ粒度を変えて「今どうなってるか」だけじゃなくて「どう変化したか」を可視化することで見えてくるものもあるんじゃない?とか。ただし、グラフ化/可視化することが目的じゃなくて、何か目的があってそれを達成するために必要な可視化が何か、ということを考えよう。手段と目的を取り違えないように。


4時限目は平良くんの個別ゼミで、感情推定のために認知的評価が分かれば良いんじゃね?というストーリーをここ1,2ヶ月?ぐらい続けてて、その認知的評価ってどうやって取ろうかという話であれこれ。小説に限らず「コンテンツを楽しむ」という過程をどうモデル化するかというのが中核にあるのだけど、感想を書かせるみたいなやり方だと「実際に思ってたことを書けない側面を見落としがち」だったり。そこをインタビュー/アンケートとかで積極的に聴きだすアプローチだとバイアスかけ過ぎてしまうこともあるしで一長一短。それでも未知の物を作るのであれば「Demo or Die」とか「アジャイル」なやり方が向いてると思う訳で、「取りあえずやってみようよ」と。やりながら問題出て来たらその都度対応するのが基本だけど、その前に見通し立てたいよねという気持ちも分かるので、ストーリー例を示してみたり。ま、そういう話を根掘り葉掘り時間かけてやれるから個別ゼミの時間は必要だな。