データマイニング班1回目が終了

Share on:

データマイニング班の1回目が終了しました。無線LANの調子が悪くてぶちぶち切断される学生が少なくなく、1台有線LANにしてそこからWi-Fi共有接続とかして凌ぐことに。急場を凌ぐという意味では良いんですが、これが通常実験日で毎回やら無くちゃいけないとなると流石に悲しい。ということで、来週からはスイッチを用意することに。それも「ちょっと違うんじゃ」と思わなくはないですが。

肝心の中身はというと、サーバ環境の情報共有、Mercurial演習(PDF)事例紹介その1(電子マネー顧客分類)までやって終了。電子マネーの事例は、複数店舗でのEdy購買履歴を生データとして、広告配信(=意思決定)を支援するために、ユーザをセグメント分類して特徴抽出したという話。2005年度に産学官共同研究したやつです。協調フィルタリングを欠損値推定代わりに使ってみたら割と面白いクラスタ抽出できたとか、個々の理論を詳細に説明するというよりは「データマイニングの流れ」を意識して紹介したつもり。

学部3年生対象でもあるので、「こういうツール(scikit-learnを予定)が用意された時に、どういうデータをどう処理してどう活かすか」という部分を思考/試行実験できるようになるのがイメージしやすい達成目標かな。データをどう前処理するかについてはそもそも理論が分かってないとという話もあると思うけど、まずは用意された機械学習パッケージを使ってみようぐらいで。

LAN接続が悪すぎたので環境構築Pythonチュートリアルは宿題ということに。

来週は、事例紹介を冒頭で少しやった後、オプション(emacsユーザが多いのでauto-complete.elで補完ぐらいは付けようかと)を先にやってからPythonチュートリアルの続きをやってもらう予定です。