みんな大好き特異値分解(第1回ビッグデータ分析コンテスト)
今年最後の第1回ビッグデータ分析コンテスト記事です!良いお年を!(忘れる前に書く人)
年の瀬だしということで試すこと自体は簡単な特異値分解を使った次元圧縮をやってみました。気持ち的には「ノイズ除去」ぐらいのつもりです。適用したのは今の所一番良かったモデルをベースに、
元入力:宿泊数過去90日分(90次元)
->SVDで10, 20, 40, 60, 80次元に圧縮。
出力:翌日の宿泊数(総数、訪日外国人宿泊者数) *元のまま
としてみました。結果的には上記の中では60次元がベストで、スコア1.8台勢力の中ではトップになりました。(サイト上では2番目になってるけど、1日5回までしか提出できなかったのでベストではないスコアが残ってます)
それにしても1回目のスコア提出でかなり高いスコア出してる人がちらほらいるのだけど、何をどうやってるんだぜ?
[ 過去ログ ]
- 12/24時点: ベースライン狙いのつもりだった(スコア: 2.11849)
- 12/28時点: ほんのり誤差程度の改善(スコア: 2.116117762457610)
- 12/30時点: 闇雲に属性を増やすことの限界(スコア: 1.847609627462350)
- 12/31時点(この記事): スコア: 1.836236251800440