データマイニング班4回目は線形回帰モデルの実装を通したnumpy, matplotlib tips
授業も4週目に突入ということでそろそろ前半戦修了な季節らしいです。予定では半分前の6週目までにやっておきたいことを終わり、7〜8週目に実際にやりたいテーマ設計、9週目からそのテーマに則した開発&実験(=1ヶ月ちょいで1回実験回すのが目標)、というストーリーを想定しているのですが、その通りに進められるかはまだ怪しいな。取りあえず過学習・正則化、scikit-learnのツールとしての使い方、ぐらいは少なくともやる予定です。
データマイニング班4週目はこんな感じで、毎週やってる事例紹介を除くと、4週目のメインは「線形回帰モデル(最小二乗法)の実装演習」で、最小二乗法ベースでパラメータ推定する線形回帰モデルを実装してみよう(numpy)、実際に推定したパラメータと実測値をグラフ描画してみよう(matplotlib)というもの。その周辺知識としてNumpyやPythonのTips、例えばモジュールとして読み込むための方法とかも入ってるので、一通りPython演習にもなっているかと。コードは github に上げても良いんですが、hg2gitみたいなの無いのかなと探しつつ、いくつか試した限りではうまくいかないので放置してます。学科のhgに上げると言う手もあるんだけど。
P.S.
デザインスクールの方は、いくつか協力依頼に進展が見られて来たので、その報告を兼ねて近況報告を出してみました。興味ある人はお早めに!