データマイニング班3回目は半分英語指導に

Share on:

m_2013042511520851789a58dd6b3

データマイニング班の3回目が終了しました。無線LANの調子は相変わらずで、ハブの用意が欠かせません。準備してもらっているので大丈夫ではあるんですが、事務室に置いてある2台のうち1台は使用された形跡自体がありません。というのは、LAN接続不要だからなのか別の場所では問題になっていないのかが気になったり。

3回目の中身は事例紹介がメインで、オプションでscikit-learnのチュートリアル。

事例紹介は一般物体認識での局所特徴量+共起した事例と、Twitter議論構造可視化のための品詞や時間情報を利用した事例の2つ。最初から一事例としての概要を見せるぐらいだったので、予定通り数十分ぐらいで終了。

予定外だったのはscikit-learnのチュートリアルで、「そもそも機械学習って何ぞ?」という所からの説明ではあったんですが、1.1節を読んで説明してもらうだけで1時間かかってたんじゃないかな。1.2節以降の実際の演習は全体で30分かかってないとは思う。英語ドキュメントぐらいしか無いのも「これを使おう」と決めた理由の一つなんですが、やっぱり「読まざるを得ない環境」を用意するのは効果があるなという印象。学生自身ががどう感じているか&本当に実になりそうかは別問題なんですがw、単にPythonチュートリアルするばかりだとつまらないだろうし。

ということで機械学習概説と、scikit-learnでテストデータ使ったSVMで分類器構築して予測させてみるまで、を終了。復習や理解を深めるために宿題としてLevel 1: 分類問題についての検討(PDF)をやってもらうことに。来週は何やろうかな〜。