データマイニングのシラバス検討

Share on:

2019年度後期から開講予定の「データマイニング」の授業検討な話。「データマイニング シラバス」ぐらいでググると色んな大学の現状を俯瞰できます。

ざっくり上位に出てくるものを列挙するとこんな感じ。こうして眺めると、基本的には「統計学なり機械学習なりを道具として使って、有益な情報を抽出する」というのが大筋になってますね。コロンビア大学のやつは幅広くなってて、データをどう蓄積するかみたいなところも含むらしい。今風だとBigQueryとかも含むのかも。

知能情報コースとしては、統計ベースの話はデータサイエンス基礎(2年次前記)でやってて、機械学習ベースの話は3年次前期に「機械学習」としてやるんじゃないかと。これらの2科目では基礎に留まってるかもしれませんが、少しは応用もしているはず(多分)。それを踏まえてなるべく差別化をしようとすると、(a)応用編、(b)前処理テクニック、(d)自然言語処理編、(c)実践編あたりに分かれるのかな。

(a)の応用編は、文字通り統計・機械学習を道具として「どう使うか」をメインに。(これに最も近いのが前述のシラバス群)
(b)の前処理は、「生データを目的に合う形に処理」をメインに。
(c)の自然言語処理は、応用編の一つとしてテキストの扱い方をメインに。
(d)の実践編は、DB+{Webサービス,アプリ}とかの実装的な話や、具体的にビジネス活用するときの話をメインに。

道具という点から切り分けるとこれぐらいに分かれるのかなと。前処理は面白そうなんですが、体系的な話ができるかと言われると難しくて。(a)+(c)をメインにしつつ、前処理挟むぐらいの方がベターかも。実践編はうまいこと教材作れるかが一番のネック。私自身が知らない点ばかりですが、面白そうではある。ただそれ以外にも、必要な前提知識が膨大な点も大きい。知能情報コースでも難しくて、他コースからはまず無理だろうな。

個人的にはNUMB3RS ナンバーズ 天才数学者の事件ファイルの解説本「数学で犯罪を解決する」あたりを使って輪読的にやるのが面白そうだったりしますが、学部の授業でそういうのはありなんだろうかw