データマイニング班5回目は具体的な評価の例

Share on:

m_20130509123624518b19b913155

献血16回目記念?だかでタンブラーを貰えました。何となく欲しい気がしつつ自分で買うまででもないなという状況だったのでちょっと嬉しいです。使うかどうかは謎なんですが。


データマイニング班の5回目は以下のような中身でした。

詰め込み過ぎの気もしますが、時間的には予定通り早めに終われました。

宿題報告についてはコードを皆で眺めながら「マジックナンバー使うな」「リスト初期化しよう」「コメント書こう」とか補足。で、リスト内包表記についても補足する予定だったんですが、忘れてたのでメールでの補足をしておくことに。

開発的には「ドキュメンテーション(docstring)+ユニットテスト(doctest)+交差検定(のためのランダムなインデックス生成を通した分割と、平均スコア算出)」ぐらいの内容ですね。

来週はscikit-learnのチュートリアル続きを予定していますが、一つずつ丁寧に進めていくか、かいつまんでclassification/regression/clusteringの例を触ってイメージを掴むことを目標にするかぐらいで悩んでます。細かいこと気にせずにとっとと「やりたい具体例」について取り組んでもらう方向もありなんですが。何かしらデータセット構築して、分類学習させてから特徴抽出方法を見直すとか。