新しいことを学ぶには浸かることが必要

Share on:

週末は実家に帰っていたこともあって(家族内の)いろんなイベントが盛りだくさんでした。衝撃の事実もあったか。いくつか提案もしてみたけど、月イチぐらいで帰って緩衝材ぐらいになった方が良さげかなー。

午前中はデザインスクールタスクで、大学会館の下見。具体的には一番気になってた電源の位置や数のチェックで、延長ケーブル準備するだけでなんとかなりそうで良かった。去年のFANシンポジウムで借りたてだこホールでは、PCルーム以外は部屋自体の電源容量的に低い部屋ばかりでキツかったんだよな。(本当は電源タップ用意しまくってたんだけど、危険だったから設置数は減らした)

当日の車両搬入用に2カ所お願いする必要があるとのこと。1カ所は終わって、明日残り一カ所お願いしたら終わりか。大学会館での無線LAN利用については、総合情報処理センターの大川さん経由でどうにかなりそうな雰囲気。具体的な様式は無いけど依頼文として文書準備して欲しいということで準備して提出。後気になるのはホワイトボードぐらい?(遠藤先生の話では総合情報処理センターにあるとかいう話だけど実数は良く分からない)

午後のデータマイニング班は、11月とは思えないぐらいに夏日。夕方の日光が直接当たる部屋だからかもしれないけど、あれは空調入れたかった。。

m_201311051839135278bcc10153c

自炊の方は、初お好み焼きにチャレンジ。といっても買って来た専用の粉を水・卵で解いて具材入れただけですが。美味しかったけど、ちょっと焼きが甘かったかなー。粉ものは気を付けないと。キャベツを美味しく大量に消費できることは把握できた。


データマイニング班の5回目は以下のような中身でした。
  • 振り返り: classification / machine-learning / scikit-learn
  • Level 2 確認(分類問題の問題設計、評価方法
  • 記事紹介
  • 振り返り: classification (scikit-learn)
  • 機械学習外観: scikit-learn
  • 課題: Level 3: digits データセットに対し3分割交差検定してみよう

    データセット digits において svm.SVC で分類器を構築したい。その際、構築した分類器はパラメータやデータセットに依存して結果が異なるはずだが、ここではパラメータは固定し、データセットのみを学習・テストデータを複数回入れ替えて試すことで分類器がうまく構築できたかを評価したい。そこで、ここでは3分割交差検定を用いることにしよう。つまり、ここでは、
     ・データセットの並び順をランダムに入れ替え、
     ・3分割交差検定により推定結果を平均化する。
    という手順で分類器を評価するものとする。また、学習は以下のように用意した分類器を用いるものとする。

    from sklearn import svm
    clf = svm.SVC(gamma=0.001, C=100.)
    

    上記を踏まえて、以下の手順でプログラムを作成せよ。

    • (1) データセットの並び順を np.random.permutation により入れ替える際、シード値を「各自のアカウントから英字を除いた6桁数字」で初期化したインデックスを生成せよ。なお、作成したインデックスには重複や過不足がないことを doctest を使って確認すること。
    • (2) docstring 形式でコメントを書くこと。
    • 提出先: 各自のリポジトリ
  • 次週予定: 機械学習外観(スコア/パラメータ調整/線形回帰), パラメータ調整, グラフ描画

機械学習用語や問題設定種別の復習、宿題確認(どう特徴を抽出すべきかの討論含む)、scikit-learnでの分類学習のコード例振り返り、モデルの評価方法&交差検定の紹介、線形回帰の例、という4項目をやったぐらいですが、先週から新しいことだらけなので戸惑ってる学生も少なくなさそうな雰囲気。ま、新しいことは回数こなして慣れるしかない(というのは言い過ぎだけど)ので頑張ってください。

私自身の説明だけだと不足or偏りがあるということで、英文読むことだけじゃなくて複数の視点(記述)から説明するという形を取っています。具体的にはscikit-learnの各種ドキュメントと、毎回紹介している記事紹介ですね。今回紹介した記事は機械学習 はじめようで、読みやすいのでオススメ。先週の神嶌敏弘先生のデータマイニング講義資料もその一貫です。逆にあれこれ資料があり過ぎて混乱してしまう可能性もありますが、これは割と意図的に「いろんな文書や表現、視点に触れることでコアを見つける」ことを体験してもらいたいからこうしています。