データマイニング班7回目はパラメータ調整の演習

Share on:

m_20130523113556519d808cb0015 m_20130523194218519df28a50b8e

明日は人間ドックのためお休みです! 20時を越えた今!食事間食NGどころか水以外飲めない訳で!お茶すら飲めないことによるストレスはどう発散したら!とか言いつつ、実際にはお茶珈琲とか普段飲んでても飽きる人なので、この日に備えてあまり水飲まないようにしてたのでお水ウマー!これぞまさに計画通り!!(AA略

それにしても初人間ドックなのでちょっと楽しみ。バリウムは飲めないらしいのが心残りだけど、また機会はあるだろうし。

ちなみに明日はAgile Japan 2013 サテライト リーン x アジャイルなんてイベントが予定されているらしい。


データマイニング班の7回目は以下のような中身でした。

メインは宿題チェックを通した「データセットの準備の仕方」についてのコメントとパラメータ調整演習ですが、それにしても他がお座なりすぎたかなぁ。scikit-learnチュートリアルは「次元の呪い(curse of dimensionality)、疎なデータ(sparsity)、過学習(over-fitting)正則化(regularization)」あたりの話がざっくばらんと紹介されてるのですが、そもそも各モデルについての具体的な知識も無いままだと意味不明ということもあってかいつまんで紹介するに留めたのですが、今回ぐらいの紹介だったらざっくりと省略した方が良かったかもしれない。やるなら正則化に限らず、何かしら具体的なモデルを一つ取り上げて勉強するぐらいは準備した方が良さげかなぁ。

後で何かしら補足してみようかしら。今以上に混乱招く可能性が高いんだけどw