penalization term against overfitting
データマイニング論は留学生いるので英語で輪読。私自身の英語練習になるのも悪くないですが、学生の演習として使って欲しいし、どこで躓くかは人それぞれなので質問して欲しい。ということで強制的に質問させてみてます。
先週は「授業終了後に質問した人をチェック」したこともあって、今週からは質問がそれなりに出てて、いい感じぽい。実際、発表資料では説明飛ばされてる箇所だったり、もしくは教科書でも省略している箇所についての質問が出たりしてて、面白いです。「何でここで log 導入するの?」とか。素朴な疑問から得られる学びは大きいので、どしどしやってください。
過学習の話についてはUnderfitting vs. Overfittingが掴みやすいはず。一つの解決策としてペナルティ項の導入という話については、Plot Ridge coefficients as a function of the regularizationか、Overfitting in Machine Learning: What It Is and How to Prevent It辺りが分かりやすいかな。