複雑研全体ゼミ、ネットワーク演習、gitlab勉強会
火曜日恒例複雑研全体ゼミは「統計的機械学習―生成モデルに基づくパターン認識」の「3章 識別関数の良さを測る基準」と「4章 最尤推定法」を終了。終了したのだけど、イマイチ数式解釈をスルーしがち(ゼロではないけど)なのがちょっと。表面をなぞるだけの読みでは「ふーん」で終わっちゃう。一方で参加者側も質問を遠慮しがちなのもちょっと悲しい。義務づけないとしないというのは、勉強する気が無いということだよなぁ。それでも良いからと強制しても良いんだけど、それは私の主義に反する。主義に拘っても意味無いのだけど。
3章の概要は、最大事後確率則(入力パターンが属する可能性が最も高いカテゴリを選ぶ)、最小誤識別率則(パターンが誤って分類される確率を細小にするように決定する)、ベイズ決定則(誤って識別したときの損失を最小にするように識別する)を数式展開していき、本質的には「最大事後確率則=最小誤識別率則」となること、またベイズ決定則も損失が一定なら一致。その上で計算が複雑になることを避けるために最大事後確率則をチョイスし、p(x|y)をシンプルにするため条件付きでない確率密度関数p(x)を訓練標本から推定する問題として4章以降を進めるよというお話。
4章は最尤推定法の定義と特徴を示しつつ、マハラノビス距離(wkipedia、slideshare)の紹介。ガウスモデルのシンプルな形(カテゴリ毎の分散共分散行列Σが等しいと仮定するとフィッシャーの線形判別分析(slideshare)を「訓練標本をガウスモデルで近似することで最尤推定量(μとΣ)を算出し、それから超平面を構成する傾きと切片を算出できるというお話。
良い演習が用意されているのでそれを宿題にしつつ「発表担当者以外も事前学習しよう」と突っ込み入れて終了。
午後は実験1の情報ネットワーク演習1の火曜日組み2週目、動的経路制御と実技テストを終了。ネットワーク演習するようになってから7,8年目?ぐらいですが、(先週)授業終わった直後に再確認したいからといって復習し始めたグループがいたのも、(今週)授業が始まる前に来て復習してたグループがいたのも初めてかも。実技テスト前の動的経路制御な演習や、先週も含めて「いきなり全体を構築するんじゃなくて、小さく設定して動作確認しながら進めよう」と何度も口酸っぱく言ってるつもりなんですが、どうしてもゼロにはならない。教育というのはそういうものなんですけどね。でも、こういう「細かくチェックする」という癖を早めに身につけておかないと、(その人にとって理解の範疇を越える)複雑なシステムに直面すると太刀打ちできないだろうという意味で、これからも言い続けます。
5時限目は、名嘉村研の嘉数先輩によるgitlab (git/github/gitlab) 講座。gitlab を研究室で使い始めてるところが出て来ているらしく、どういう使い方してるのか聞いてみたいということと、1年次の学生から講座開いて欲しいという話を耳にしていたこともあって調整した結果、今日開催してもらえることに。いや、最初は「話を聞く」だけだったんですが、偉大なる嘉数先輩は資料まで準備してくれて話をしてくれました。ありがたいことです。ちなみに長田研での勉強会もあったらしい。こういうのを学科atndか google calender か何かで共有すると良さそうなんだけど、自分から用意するほどでもなく。学生が自主的にやってくれれば良いと思ってるし。でもあった方が良いのだろうなとは思う(シツコイ)。
話を聞いた限りでは、一番のネックは検索性だということが分かった。自前で clone & grep しても良いのだろうけど、それだとリポジトリ横断検索しづらいし。自分でそういうツール作れば良いという話でもあるけど、一方でカスタマイズしすぎると「gitlabのバージョンアップに追従し続けるコスト」もあったりで悩ましい所。そういうのを避けたいというのが一つの理由で、gitlabはどうなんだろうという気持ちで聞いてみたかった訳だし。あと、研究室用途という点では「プロジェクトとは切り離したトップページとしてのwiki機能」も欲しいのだけど、現状では別途pukiwikiなりを用意するか、wiki専用のリポジトリを作ってそれで運用するかみたいな対応になるらしい。gitlab上だと検索できないのでpukiwikiか何かしらのwikiクローンを用意することになりそう。適材適所で使い分ければ良いという話でもあるか。3つ目のネックは通知機能で、「プロジェクトはクローズドだけどcommit log程度の情報をRSS feedで受け取りたい」という微妙なもの。いちいち自分でpullするのは嫌だし、かといって Mail/Twitter なりでいちいち「pushしました」と言われるのも嫌な状況での利用なんですが。具体的には論文指導する時だな。
河野研ではtexというか論文指導もmercurial経由でやってるっぽいのだけど、指導コメントは特に何も考えずpushするだけなんだろうか。diffで見れれば十分という話ではありそうだけど、何か工夫の余地がありそうでもある。
晩ご飯はヘチマたっぷりの味噌汁。適当に白葱加えたのは失敗でした。汁飲む分/香り具合には構わないけど、ネギ自体の味は邪魔だな。ヘチマさんが死んでしまう。