データマイニング
データ・マイニング
導入
1. データマイニング概観
2. 前提
3. Python仮想環境の利用方法について
機械学習入門
4. 機械学習外観
5. コード例(線形回帰)
6. コード例(ダウンロードしたデータセットに機械学習を適用する流れ)
7. numpy入門
8. matplotlib入門
9. pandas入門+推薦システムの例
10. 機械学習の中身を覗いてみよう
11. 1次元データセットを通した勾配法の理解
特徴量エンジニアリング
12. 特徴ベクトルと数値データ
13. 数値データに対する前処理コード例
14. カテゴリデータ
15. カテゴリデータに対する前処理コード例
特徴量エンジニアリング(テキストデータ)
16. 特徴量設計1:シソーラス、カウントと推論に基づいた設計
17. 特徴量設計1のコード例(動作確認用)
18. Spacyの基本的な使い方
19. テキストのベクトル化(spacy + α)
20. 係り受けを用いた目的語抽出+ネットワーク描画の例
21. 極性推定(ネガポジ推定)の例
22. トピックモデルによるクラスタリング
23. 特徴的な単語の抽出
24. 特徴量設計2:word2vecによる分散表現
25. 分散表現の発展
26. 広義のファインチューニング例(gemsim版)
27. 広義のファインチューニング例(spacy版)
28. Transformersを用いたファインチューニング例
タスクとマイニングアルゴリズムの例
29. グラフマイニング
30. グラフマイニングの例
31. 頻出パターン・マイニング
32. アソシエーション分析の例
33. 推薦システム
34. 推薦システムのコード例
課題
35. 課題3:自然言語処理してみよう
36. 課題4:機械学習やデータマイニングにおけるFaireness(公平性)について論じよ。
リポジトリ
Index