英語ドキュメントしかないツールを使うことで必然的に英語を読まざるを得ない状況を作る

Share on:

m_20131029092202526effaa1d8de m_20131029115737526f24214ddf8

午前中は個別ゼミで、久しぶりに堀川くんの出番。夏休み中ぐらいから続いているデータセットの準備、教師データの作成、スコア化方法、アンケート、あたりについて一通り確認&討論しながら今後の流れについておさらい。これでもう少し進捗が早まると良いのだけれど、アンケートをずるずる先送りにしちゃってるのが一番怖い。アンケート無しで相手を納得させる理論武装できるならそれでも良いんだけど、話聞く限りではそうでもないからなぁ。

データマイニング班の準備を終えてから明日のデザインスクール説明会+事前討論会の準備。

討論会は30分ぐらいしか時間取れそうにないことを考えると、具体的に討論して欲しい項目やアウトプットの形まで指定した方が良さそうなんだけど、その辺りは遠藤先生的には気にしてないらしい。多分。

m_20131029183332526f80ecb0d5e

自炊の方は、残り物の肉じゃがをみそ汁風とうか味噌を少し和えてより具沢山にしたのと、もう一品欲しい時の豆腐ハンバーグさんにご登場願いました。やっぱりこれ常備しときたい。先週末にスーパー行った時には見かけなかったので、もう冷蔵庫には在庫切れ状態なんですが。豆腐買ってきて作る?(手作りしたのを冷凍保存してどのぐらい持つかが怪しいのだけど)


データマイニング班(サーバ調整中のため暫く見えないかも。一時的な退避ページはこちら。一時的なページなので後で消しますが。)の4回目は以下のような中身でした。
  • 事例紹介
  • (続): Python演習: [ 公式チュートリアル | 補足 ]
  • 機械学習外観: scikit-learn
  • 課題: Level 2: 分類問題についての検討
    • 機械学習の代表的な使い道の一つである「分類問題」とは、データ(サンプル)をカテゴリ(クラス/ラベル)に分類する問題(個々の事例を適切なカテゴリに割り当てる問題)です。教師あり機械学習では、用意されたデータとカテゴリを基に、「このカテゴリに属するデータはどのようなものか」というパターン(分類規則)を学習します。
    • 学習した結果(モデル)は「分類器」と呼ばれることが多いですが、その分類器が適切なパターン(分類規則)を得ることができていれば、未知データに対しても適切なカテゴリに割り当てることができるでしょう。
    • 上記を踏まえて、「分類問題」について以下の点について検討し、報告せよ。なお、参照した文献/Webサイト等があれば参考文献として示すこと。
      • (1) (自分が分類したい)具体的な分類問題について述べよ。

        自分が望んだ分類器を構築するためには、どのようなデータとカテゴリを用意したら良いだろうか。ここでは分類器への入出力だけを問うものとする。

      • (2) チュートリアルで用いたSVMなり、何らかの機械学習を用いて分類器を構築したとする。その分類器の質はどのように評価したら良いだろうか。
      • 提出先: データマイニング班学生公開用Wiki
  • 次週予定: 機械学習外観(スコア/パラメータ調整/線形回帰)

例によって前期同様に、みんな大好きな英語の勉強兼ねてscikit-learnのチュートリアルを使って機械学習の各種用語や流れ、問題種別、例題を通したscikit-learnでの使い方、あたりをやってました。機械学習用語や全体像については直前の事例紹介でもやってたので、それを英語ドキュメント読みながら振り返りぐらいのイメージ。だったんですが、例によってチュートリアルやるだけで1.5時間ぐらいかかったかも。ま、初めての用語や概念だらけということもあるので丁寧にやらざるを得ないんだけど。といいつつ前期は「チュートリアルやれば良いか」であまり準備しなかった気もする。それ以上にPython勉強は丸投げだったんですが、今回は逆に力入れ過ぎて4週目冒頭まで引きずってしまったか。「ここまでは一通り通したい」というのもあって、調整が難しいな。