下ろし立ての靴で歩いて靴擦れ
外履きも内履きもぼろぼろになってきたので両方とも新調したのが昨日で、早速靴擦れ気味。やっぱり出張後のタイミングにして良かった。
木曜金曜にある実験2の課題設定をどう調理しようか悩みつつ、関連書籍や論文を眺めてるんだけどいまいち調理しきれてません。何かしらのデータセットに触れてあれこれする、ぐらいの縛りで考えてみようかと幅広く見てるんですが、例えば以下のようなもの。
- Spam ArchivesやEnron Email Datasetみたいなものを使ってどうフィルタリングするかを考えさせる?
- MovieLensで映画推薦に因んだタスク設計する?
- 楽天データは今の時点でやるのは契約の都合上無理っぽいし、そもそも授業で使えるかは良く分からない(申請書見る限りではNGではないけど、研究室レベルでの申請(利用)を想定してるっぽい。普通はそうだよね)
- Yahoo! 知恵袋データは利用目的が研究に限ると明言されてるのか。
- Textual Entailment 評価データは学生実験として眺める分には扱いやすい例題かもしれない。(課題設定次第では使えそう)
- 単語感情極性対応表の有無でどう変わるかというタスクを作る?
- 【CodeIQ】Rで解くデータサイエンティスト問題の解説(R Advent Calendar2012)
ここから何をどう課題にするかなんだよな。うーん。素直にそっち方面は実験3,4でやることにして、実験1,2では現状維持?