Archive for the ‘講義/実験’ Category

例年より早いペースでグループ開発に突入

火曜日, 12月 1st, 2015

データマイニング班7周目は、グループに分かれてのテーマ検討です。検討するにあたり、例題を使った補足説明をしたぐらいで他は進捗報告を聞きながらのアドバイスをした&TAにもやってもらったぐらいで、殆どは討論時間です。残りの週は少しずつTips紹介するだけで、具体的な実習がメインになります。

例年だとこのテーマ検討だけで2,3週間かけて「テーマ確定->他グループに依頼」しているところが、今年は(先週後半からやってるということで)1.5週間でテーマ確定、発注依頼&開発受諾するところまで辿り着きました。これからが本番ではあるので「なるべく手を動かす時間に余裕を持たせたい」という点で全員の意思が固まってたらしい。モデリングと設計でやってるスクラムのように、アジャイル的に取り組むというところが意識付けられてきてるのかしら。

(データマイニング班) 前半ステージが終わりテーマ検討に

火曜日, 11月 24th, 2015

3年次向け実験データマイニング班での目的の一つは、

怪奇!! 次元の呪い – 識別問題、パターン認識、データマイニングの初心者のために
[ 前編 | 後編 ]

の記事を読んで理解できる、イメージできるようになることです。それに向けて第1回〜5回までの内容を組み上げてみています。ちゃんと読めるようになってるかは「?」なところもありますが、少なからずイメージできているのではないかなと期待しています。

ということで、6回目となる今日は総復習編という位置付けで真新しい内容はほぼゼロの、復習祭りでした。

来週以降は進捗確認しながらコメントするという形になります!

(データマイニング班) 5周目は多項式モデルへの拡張

火曜日, 11月 17th, 2015

デザインスクールの追い込み時期にも差し掛かってそろそろ倒れたいです(違)

データマイニング班5周目が終わりました。内容としては先週実装した線形回帰モデルにおける「線形って何?」とか「入出力の対応関係における線形・非線形」の話をしたり、線形モデルを多項式モデルに拡張した実装例を示したり、その過程でモデルの自由度と過学習の話をしたり、それを防ぐための例としてペナルティ項・テストを導入しようといった話をコード示しつつやってました。やや詰め込み過ぎ感ありますが、振り返る前提なのでこんなものかなーと楽観視してますw

(データマイニング班) やっとこさの4週目は線形回帰モデルの実装を通した演習

火曜日, 11月 10th, 2015

大学スケジュールのおかげでちょくちょく休みが入ってるのでなかなか進まず、やっとこさ4週目です。単に4回目をこなすというだけではなくて、復習の復習の復習、、、と、忘れてしまってることを前提に振り返り時間をそこそこ長めに取ってやってます。その方が繰り返しにもなることはなるけど、ここまで間が空いた繰り返しの効果は「ほぼ毎回初出でやってる場合」と大差ないのだろうなとも思われ。ちょっと悲しい。。

そんなこんなで4週目はこんな内容でした。最小二乗法ベースでの実装演習ということで、クラス設計したり細かく動作確認してcommit&pushしたり。そろそろ前半戦(機械学習概観)に一区切りかなー。

  • 事例紹介: 分類・クラスタリングの例数件。ツイートのジャンル分類に基づくプロファイリング。画像データの特徴量クラスタリングによる代表特徴生成。
  • 振り返り1: 機械学習概観、教師あり/なし学習、分類問題、回帰問題、クラスタリング問題
  • 検討演習: 回帰問題
  • 振り返り2: モデル、線形回帰モデル、仮説、損失関数、目的関数、最小二乗法
  • 実験テキストPDF: 最小二乗法、解法例、線形回帰モデルのクラスデザイン、Numpy+Pythonチュートリアル、グラフ描画
  • Python演習3週目
  • 課題: 「機械学習 はじめよう」の第8回第9回第11回(最低1記事読もう)

(データマイニング班) 3回目が終わったと思ったらまた次回は休みらしい

火曜日, 10月 27th, 2015

IMG_0138

ようやく3回目突入かと思いきや、また来週はお休みらしいです。うーにゅ。

今回の中身はこんな感じ。モデルやアルゴリズムの具体例を眺めつつ終了。次回は実際に実装してみるという所に入る予定です。

  • Python演習
  • 事例紹介: 位置情報にまつわるデータ補間技術 #TokyoWebmining
  • 実験テキスト: PDF(復習、scikit-learn入門、モデル、線形回帰モデル、仮説、損失関数、目的関数、最小二乗法、最急降下法)

P.S.
文句を言っても仕方ないのですが、火曜日の授業が、
 ・1週目: 10/6, 1回目
 ・2週目: 10/13 *月曜日振替え。
 ・3週目: 10/20, 2回目
 ・4週目: 10/27, 3回目
 ・5週目: 11/3 *祝日
 ・6週目: 11/10, 4回目
という流れで前半6週目までに2回お休みが入ってて、ちょっと辛い。今の2学期制(通常授業1週間に1回)だと1回休みの影響が大きすぎる(間が空くと忘れる学生が多いのは仕方ないというかシステムの問題)ので、3学期制or4学期制にした方が良いんじゃないのかなー。

データマイニング班の実験テキストは英語ドキュメントがメイン

火曜日, 10月 20th, 2015

先週は月曜日振替え授業だったので2週間ぶりの学生実験です。例によって質問しまくりな形式ですが、それに加えて今後の実験テキストはほぼ英語で用意。専門用語や専門的な定義は読めなくても良いですが、そうでもない所は比較的平易な英語だし。

毎週の中身はこんな感じで、毎週何かしら事例紹介を交えつつ、本題を少しずつ進めるようにしてみてます。2週目の中身はこんな感じです。

Python演習を大量に列挙してますが、どれでも良いから基本的な部分は抑えて「調べながらコード書けるようになろう」という方針で勉強してもらってます。初めてプログラミングする訳じゃないので独学メインで。

英語テキストは(専門的すぎる部分を除けば)比較的読みやすいのが多いと思うのですが、シンプルな単語&構文でもなかなか読めない学生が多くて。例年の話ですが、やっぱり実際に読ませないと駄目ですね。

Mercurial忘れてる学生多いので、宿題で衝突解消までやるように指示して終了〜。

データマイニング班1回目が終了

火曜日, 10月 6th, 2015

今日から後期授業が開始で、1回目の実験4・データマイニング班が終わりました。やっぱり2コマ連続はなかなかにハードだなぁ。体力付けろという話ではある。

データマイニング班1回目の中身はこんな感じでした。シラバスというか達成目標等の説明をしつつ、1週目の主題「UNIX哲学、実験で使う環境、アジャイル」へ。質問当てまくり。前半4〜5週間は座学に近い部分も多いので、ただ聞いてるだけだとつまらないし、言ってることがどう理解されてるかも分からないしということで質問しまくるスタイルです。

「意思決定ってどういう意味? どういう時にやる?」「自然言語って何?」「構造化データとは?」「完成度を高めるって言葉で言うのは簡単だけど、完成度って何?」

「正解とか間違いとか気にしなくていいからどう捉えているか話してみて」
「何故そう考えた?」

受講生12名で3巡ぐらいしたと思うので30回程度質問したらしい。こんなものです。

来週火曜日は月曜日振替えということでいきなりのお休み。1週間空くので、余裕があれば言語処理100本ノック 2015PythonチュートリアルでPython勉強してきてね〜。

2015年度プロジェクトデザインI, II 最終発表が終了

金曜日, 8月 14th, 2015

あれこれ多くのことを名嘉さん&翁長さんに丸投げしての発表会が無事に終了しました。受講生の皆さんもですが、サポートしてくれた院生PMの皆さんもおつかれさまでした。

1年次のPD1ではテーマ自由(新規性・有効性・社会性のあるデザイン)をグループで企画提案せよという課題が。2年次のPD2では情報工学科のCMをグループで企画提案せよという課題が各々与えられていて、それをプロジェクトと看做した上で院生がマネージャとしてサポートに入ってもらっています。

PMのお陰もあってか、年々「ただのウケ狙い」というのが減ってるな。ネタを昇華してる。まだ突っ込みたいところ(サーベイ不足、シミュレーション不足、etc.)はあるが、それ含めて演習だし。という意味でもう少し細かくフィードバックしたいよなとは思うが難しいんだよな。また、前日あたりに発表練習するというグループも増えてて、PMに添削指導して貰えたところもあったようです。添削してもらえたことは次に活かそう(同じ失敗をしないように要因分析するなり対策検討するなり反芻・咀嚼しよう)。

PD1について例年気になってる点としては、新しいモノを考える・生み出すのは大切なことなんだけど、その過程を通して「調査研究」の大切さに気づかせる側面がまだ足りてないという印象があります。他と比較できないと「新規性/社会性/有効性」とかを主張できないはず(=企画に説得力を持たせ難いはず)なんだけどね。仕方ないのかもしれないけど、そういうことを1,2年次の頃にやってないから3,4年次になって苦労してるようにも見えるし。何か上手いやり方ないかしら。

一方で特に指示無いにも関わらず自主的にやってる良い面もあって、想像でターゲットの考えをでっち上げるのではなく100人にアンケートしてみたとか、学科外・学部外の人にどう思われてるか聞いてみたとか足で稼いでるグループがあったり。どこかが実施した調査結果を引用してるグループもあったか。そういう調査結果は便利ではあるけど、誰がどういう方法で実施したのか、回答者に偏りが無かったのか、設問文や選択肢等に恣意性が無かったか、回答当時と今とで同じなのか等々、様々な要因で「本来とは違う結果に引きずられる」こともあるので、単に結果を鵜呑みにするのは危険なんだよね。その意味で「自分たちの足で稼ぐ(アンケート実施する)」というのは、どういう偏りがあったのかとかも含めて話を進められる分、良い面もあります。

PD2について気になった点としては、「CM完成にこぎ着けなくても良い、その代わりちゃんと企画した内容を説明してくれ」ということは伝えているのだけど、「時間の都合上動画作成が簡単な案を選択した(ように見える)」ケースが去年も今年もあったこと。本来の趣旨はCMを作ることが目的ではなくて、CM作製のための企画立案を通してシラバスの達成目標をクリアできる力を磨くこと。なんだけど、多分去年もそうでしたが「他のグループちゃんと動画作ってるっぽいよ?」という状況になってたら、「うちも作らないとマズいのでは?」という気持ちになるのだろうなというのは理解できます。この辺りはどうしたものかなぁ。

スプラトゥーン健康法

金曜日, 6月 12th, 2015

意図的にやってたことですが、見学するときもプレイするときも立つと、程よく疲れて自然とブレーキにもなります。スプラトゥーン。ご利用は計画的に。

チュートリアル以降やっとこさやれました。スコアが異常に低かった時の中の人はnaltoma本人です()


長田先生と一緒に担当してる実験1の情報ネットワーク演習が今週から始まりました。内容は至ってシンプルで、LANケーブル1本でルータとPCを疎通できるようにLAN構築するのと、ルータ2台を介して離れたLANをスタティックルーティングで疎通できるようにするといったところ(動的ルーティングは次回)。ネットワークの基本的な部分(アドレッシングとか)は既に必修講義でやってるはずですが、質問しても答えてくれる学生いなくて。長田先生泣いちゃうぞー。

どんな教科書使ってるのか、どんな教え方してるのかは分かりませんが、構築したいネットワーク構成を見せつつ読み方を説明しても「?」な学生もいて。100%理解しろというのが言い過ぎなのは分かるけどね。でも、このあたりの知識ぐらいは独学でクリアして欲しいなとは思います。ネットワークに興味なくてもね。それぐらいの基本だからこそ必修科目な訳で。ということで、(今はまだ戸惑ってても)実験終わる頃には楽勝に構築できることを期待します。

多数の人が集まってる場だからこそできること

木曜日, 4月 23rd, 2015

m_201504230951295538c0a13cae6 m_201504231059385538d09a9e62b

PD2の2週目は山田先生が出張ということもあって、代理担当することに。授業計画し始めた頃から「なるべく演習を中心にしたい」「効果的なフィードバックをしたい」という思いがあったのですが、事前学習させるだけの何かを用意しているわけではない(今年は2度目なのでやろうと思えばできたはずなんだけど)ので、講義中の講話/解説な時間も結構あって、勿体無いなと。ついでに昨年度の1回目には「説明だけしてて演習すらしてない題材」というのもあったので、今回はなるべく解説を最小限にすることと演習へのテコ入れをした上で実施してみました。内容的には「ロジカル・シンキング→ロジカル・コミュニケーション→ルーブリックによる相互評価」の3点セットですが、何かしら得るものがあったら幸いです。

演習するだけが講義という訳ではないですが、複数人居るからこそやれるor効果的にやれる題材があるならそれは授業中にやりたいな、と。授業外でもやって欲しいですが、一度はやる機会を与えた方が「どこでつまづきやすいか」を体感しやすいだろうし。「相手に伝える」ならやっぱり相手に聞いてもらった上で評価してもらった方が気づきを得られるだろうし。

という具体に、スピーチした直後の評価(記憶に強く残ってるうちのフィードバック)は既に渡しています。これに加えて、

「1. 事前に用意していた抽象的なルーブリック」よりは具体的で、
「2. 1評価者が与えた主観性の強い評価」よりは抽象化された、
「3. 双方を補うための評価」を、
学生全員が記入した評価シートから抽出構築してみる予定です。
(これ、自動化したいよなー)

これらの3点セットがあると、より効果的なフィードバックになるんじゃないかと期待しています。(なると良いなw)

リアルタイムなフィードバックではありませんが、これも「多数の人が集まってる場」でやったログがあるからこそできること、の一つですね。