データマイニング論の輪読1冊目が終了

Share on:

データマイニング論では教科書を読むパート1と、論文を読むパート2の2つで構成しているつもりです。一方で学生にもリクエストを聞いてみようということで「教科書2種類(Data MiningMachine Learning)のうちどちらが良い?それとも両方共読む?」と選択肢を用意したら予想以上に両方読みたがる学生が多くて。前者(の途中まで)だけだと手を動かす部分がゼロだし、一方で後者だけだと体系的な知識が薄いかなということでこれも良いか。ということで両方読んでもらうことにしました。

Data Mining: Practical Machine Learning Tools and Techniquesの5章までで「データマイニングの考え方と機械学習の立ち位置、入出力や前処理を含めたデータセット構築、代表的なアルゴリズム、モデルの評価といった一通りのプロセスを学んでもらいました。が、どこまでしっくり来てるかは謎だな。来週から始まる2冊めの方で体験知として獲得してもらえると良いな。


機械学習について参考になるサイトをピックアップ。特定のモデルというよりは、「そもそも機械学習って何?」というところから勉強したい人向け。

(1) 機械学習チュートリアル@Jubatus Casual
スライドベースで、機械学習の目的〜イメージを紹介してます。

(2) 連載: 機械学習 はじめよう
全21回かけて、色んな所にある「前提・仮定」等を交えつつ機械学習の立場や具体的な処理方法を解説してます。

(3) Machine Learning by Andrew Ng (Coursera)
英語ですが、概念だけではなくOctaveの使い方含めて実装まで解説してます。

ぱっと思いつくのはこんな所。実際にはあれこれ大量にあるので、後で整理しておこう。