全体ゼミ、個別ゼミ、#長田研勉強会
週末から昨日にかけての3連休は喉にくる風邪で体調回復に努めるために引き蘢ってました。しくしく。本当は引き蘢るの楽しいけど、半強制されると気持ち的にはちょっとね。で、今日から通常業務してた訳ですが、隣室の岡崎先生も大分喉の調子が悪い。何かそういうタイプの風邪(?)が流行ってるのかしら。体調第一に頑張りましょう。(体調悪い時に休むのは構わないから、そうじゃないときは取り戻すぐらい頑張ってくれ>休む人)
朝一は先週台風でお流れになった複雑研全体ゼミで、今回は「統計的機械学習―生成モデルに基づくパターン認識」の4章の演習、5章「最尤推定法の理論的性質」、6章「線形判別分析による手書き文字認識」。
4章の演習は正規分布に従って生成したサンプルを対象として最尤推定するというもので、サンプル数の変化に王子で推定結果がどう変わるかを眺めるというシンプルなタスク。教科書のコードはOctaveだと古過ぎる(教科書はOctave2.x, 現バージョンは3.x)らしく、そこで手こずったらしい。バージョン重要。
5章「最尤推定法の理論的性質」は、一致性(サンプル数が無限に多い時に最適な推定量が得られる)、漸近不偏性(サンプル数が無限に多い時にバイアスがゼロに確率収束)、漸近有効性(バリアンスの有効推定量の下界がクラメール・ラオの不等式で与えられる)、漸近正規性(サンプル数が十分に多いとき推定量が近似的に正規分布に従う)なお話。「これらを満たしてるとどう嬉しいのか」とか、現実の問題例を挙げて「必ずしもサンプル数が大量にあってからといって適切に推定できるとは限らない」とか、あれこれ。
6章「線形判別分析による手書き文字認識」は、具体的なデータセットを使って(最尤推定に基づいた)線形判別分析をしようというお話。分散共分散行列は全カテゴリで等しいと仮定している分、コードが易しくなってるっぽい。
午後の個別ゼミは源河くんで、もともとやりたかったことをベースに話してもらい、具体的にどういうことかを事例列挙。それをまとめたり具体化したりを行きつ戻りつしながら問題設定例へ。今の所、キーワードになりそうなのは「支援」?。
その後はいくつか事務処理しつつ、オープンキャンパスの書類作成。後は印刷準備とまとめ役お願いする学生との打ち合わせぐらいかな。
#長田研勉強会なるハッシュタグで勉強会告知等やってるらしい。どんなことやってるかはRSSの全体RSS眺めてみれば分かるかも。こういう情報はどしどし共有(探しやすく)すると良いんじゃないかと。勉強会に参加するだけじゃ意味無いけど、切っ掛けには良いし。