Archive for the ‘講義/実験’ Category

実験をする際には目的と確認方法(実験計画)を考えてから取り組む

月曜日, 12月 15th, 2014

2クラスあるうちの片方だけですが、実験1/探索アルゴリズム1が終了しました。主題は「最急降下法の動作を観察して考察」なんですが、それだけじゃつまらないかなということで前後に関連話題を付け合わせたオードブル形式に(?)。

上手く繋がってない気もするのだけど、課題にテコ入れするぐらいでこの方式は続けています。最適性とは何か、効率性とは何か、そもそも何に対して最適/効率と言ってるのかといったことに疑問を持って欲しいというのが裏目的です。なので「解説→グループ活動→報告会」という形で課題毎に報告してもらい、そこへのフィードバックをしながら「意図」を伝えたり、どういう解釈・視点が考えられるかの幅をあれこれ伝えるようにしています。うまくいってるかは「?」ですが、面白いと感じてくれる学生が1割いたら御の字かなーぐらいの気持ちです。

より一般的な目的としては実験計画を考えて、目的に則した実験を行い、結果を観察し、考察するという一連の計算機実験に慣れて欲しいという意図が含まれてます。が、なかなか伝わってないかも。一応今回は「何をどう観察したいのか観察意図と方法(実験計画)を示せ」というのも加えてみました。これで少しは考える切っ掛けになるんじゃないかと期待してます。

P.S.
大分ズレるかもしれないけど実験計画法みたいな講義があると良いのかしら。

データマイニング班10回目が終了

火曜日, 12月 9th, 2014

先週からグループに分かれての活動に入っているので、基本的には進捗確認してからグループ単位での作業レビューするという流れ。クラスタリングの考え方に躓いてる or クラスタリングだけであれこれ解決しようとして妙な道に紛れ込んでるグループがいます。ま、それも含めて「実験」。とはいえ的外れなことばかりやっててもあれなので、来週はクラスタリングについての補足説明をする予定。今回は線形回帰だけを時間取ってやってて、分類はともかく、クラスタリングは上辺だけの説明で終わってたし。

m_201412090953035486c67f2a4e4 m_201412090957315486c78c00c8f m_201412091014465486cb9689064 m_201412091037315486d0ebcfbcc

本当は今日の最後の時間に補足するつもりだったんだけど、別タスク(工業連合会+JIS協会忘年会)が学外であるのを忘れてたのでした。ごめんなさい〜。

データマイニング班9回目からはグループ間での開発委託された内容に取り組む週間に

火曜日, 12月 2nd, 2014

2014年度のデータマイニング班(やその前にやってた進化計算班)では、グループ毎に作りたいアプリケーションを「互いに開発委託し合う(自分たちで開発するのは他グループから委託されたもの)」という形式で取り組んでもらっています。意図は「思い描いているものを相手に伝わるレベルでアウトプットする」ことと、「アウトプット不足な相手からうまく引き出す」の練習になるんじゃないかと思ってのことですが、これが本当にそういう役割を担っているかは良く分からず。でも、グループ内で閉じてしまうのは他でもできることだし。ということで自己正当化してます。

あと、去年までは一つの実験班人数が4〜8人だったこともあり比較的個別に時間をって指導しやすかった(過去形)のですが、今年からは10名強(データマイニング班は11名)来ることになり、個別に見る時間がその分短くなりました。これに伴い、去年は最初の週からコードレビューを兼ねた作業レビューをやってた所を、今年は後半戦の今日から実施することに。具体的にはグループ毎に1名がプロジェクタ(代わりのでかいモニタ)に繋いで話しながら作業してもらうというのを20〜30分やってもらってみました。一種のペア・プログラミングに近いのかな。コード書いてる最中にいちいちエディタを終了するな、とか。そういうことってその場で言わないと意図を理解し難いし。

既にコード書き始めてるグループもあって「mecab.parseToNode() する前に mecab.parse() してなくて結果がおかしい」というあるある事例が。あるあるだけど後で思い出すんだよな(気付くのに結構時間がかかった)。

データマイニング班8回目は自然言語処理入門(英語編)とグループ討論2回目

火曜日, 11月 25th, 2014

3連休を探す旅に出たいのですが学生実験の日です。明日は指定された会議があって出ざるを得ず。木曜日は週ゼミ。12月に入ったら実験2が4週連続であるのでまともに休みを取れるのが今週金曜日ぐらいしかないという悲しい状況に。しくしく。ま、それでもデザインスクールのアンケート眺める限りでは好評だったようで良かったか。

データマイニング班8回目はNLTKの簡単な使い方紹介したぐらいで、残りはテーマ検討の討論。今週でテーマを決めることができたので、開発委託と受託を互いにしながら相手の考えてるテーマが何なのか、こちらが意図しているテーマが何なのかをやり取りするという久しぶりの光景に。

来週からは、

  • 実験開始時に「今日のToDo」を確認。
  • 3時間弱で演習(グループワーク)。
  • 最後に報告(のつもりだけど、アドバイスすることを考えると翌週冒頭に回す可能性があるか)

という流れで毎週少しずつやってもらうことを想定して「基本的には実験2コマの時間中にやる方向で」という話をしたのですが、それに対する不満っぽいニュアンスを受けたので「やりたい人はどうぞ」に変更。限られた時間で最大限のことをやるというのも一つの勉強ではあるのだけど、時間かけてやれるだけやりたいのならそれはそれで止めません。やりたがってるのを止める理由はないし。

温泉旅行したい。

データマイニング班7回目は自然言語処理入門とグループ討論

火曜日, 11月 18th, 2014

データマイニング班は今週から2週間ぐらいの予定でテーマ検討な週間です。その合間というか、余った時間を使って自然言語処理入門編をコードと共に示し、

ぐらいのざっくりとした紹介。来週は英語編を示す予定ですが、デザインスクール終わった翌日になるので準備できてない可能性もあるな。ま、自然言語処理を使えという制約はなくて、ただの紹介だから後回しになっても問題無いだろうという判断ではあるのですが。

あと、テーマ検討をしやすくする目的で「目的/目標/アプローチ/特徴ベクトルの作り方/データセット準備/学習の進め方/実験計画」をどう考えたら良いかの例題として去年作成した資料を紹介したり。逆効果になってる可能性がなきにしもあらずですが、ま、無いよりは良いよねぐらいの気持ちで。

昨日書いたネタ出しも含めて頑張ってみてください。今日休んだ学生も(ニッコリ

データマイニング班5回目は線形回帰モデルの拡張例に、過適合とその対策話

火曜日, 11月 4th, 2014

駆け足気味ですが、データマイニング班5回目で「線形回帰モデルの多項式拡張、過学習とその回避」について大凡終わりました。流れとしては、先週のregression.LinearRegression()をベースに、

  • 入出力における線形性と非線形性と、モデルにおける線形性と非線形性
  • シンプルな線形回帰モデル(Σθx)への多項式モデルの導入(実際にはモデル変更はせずに、事前にデータ拡張してからモデルへ渡す形で実装)
  • モデルの表現力を高める(ここでは多項式の次数を上げる)ことのメリットとデメリット確認
  • 過学習が起こる要因
  • 代表的な回避策
  • ペナルティ項の導入
  • 交差確認によるパラメータ調整

という流れを、コードと結果を例示しながら進めてみました。多分、消化不量多し。ま、それでもこの流れは一通りやりたかったので。

去年は「scikit-learnをツールとして使おう」だけで終わっていたのを、今年は「機械学習が学習するってどういう意味?」「パラメータを推定するってどういうこと?」「どういう問題、工夫があるの?」という事柄について一例は示すぐらいを目指してみました。これで機械学習内部についてやっておきたかった部分は終われたか、な。講義ではなくて学生実験なので、これ以上は深入りしない予定です。ただ、後1,2回ぐらいはscikit-learnの使い方と、データマイニングについての補足は必要か。1回で終われるなら、7週目からアプリケーション検討に入れるか。去年は11/17からアプリケーション検討してたようなので、流れを大きく変えてはいるけど同じぐらいのペースで進んでいるらしい。

デザインスクールのポスター作りに、データマイニング班1回目

火曜日, 10月 7th, 2014

昨晩からの続きで、午前中はデザインスクールの広報用資料その1ポスター案をいくつか作成。まだ叩き台なので見た目だけじゃなくて内容含めて変更する可能性ありますが、現時点での案は例えばこんな(下記画像にPDFリンクを埋め込んでます)感じ。裏面に「概要、応募資格・募集人数目安、応募〆切・諸費用、プログラム案、保険、見学等その他」等の情報を掲載してあります。興味ある人は是非参加を検討ください。

実施日が11月22日〜24日の3日間、実施場所が大学会館、大きなテーマが「雇用」と「健康」なのは確定です。公式サイトでの告知はもう少し確定度合いが高まってから順次情報を出していく予定です。

受講生は総数60名(10グループ*6名)の予定。現時点で「京大学生13名、教員6名。琉大情報教職員3名。小計22名確定(残り枠38名を募集)」になりそうです。運営側の希望としては、各グループに高校生1名、情報1〜2名を入れたいので、この時点で高校生10名、情報工15名程度。残り13名は他大学/他学部/他学科からの募集かな、というところ。勿論情報工の学生がもっと増えても良いし、運営であれこれコスト支払ってる分その方が嬉しいのですが、情報工だらけになってもつまらないよなという側面があるのであまり強く募集するのもあれかなーとは思ってます。ので、ここで早めに出してるのは當間が個人的に勝手にやってるだけのプレ告知。(正式告知前ですが、希望あるなら當間宛連絡貰えれば人数にカウントしておきます)


データマイニング班が今日から開始です。1回目ということもあってイントロダクションとして全15回(発表会含めると16回)の流れ、授業の内容と方法、達成目標、進め方を説明。1週目の具体的な中身は以下の通り。

想定通りだけど、環境構築はいる前までで既に残り10数分という状態でした。なので今回の課題というか宿題は環境構築やってきてということに。多くの学生は居残りでやってて(その方がやりやすいだろうなとは思う)、pyenvとの依存関係や、何故かpythonが参照してるsslライブラリが2006年モノだったりとかで手こずり、実験3時間終了後に延長2時間で合計5時間に。そりゃお腹空きますよ。

m_201410071115305433cb52f20f3 m_201410071151295433d3c114a94

P.S.
某遠征には「光を捧げる」という意味合いがあることが分かりました。今後も慎重に調査を進めていきたい(?)と思います。

規模に応じてやれること・やりやすいことは異なる

火曜日, 9月 30th, 2014

学生実験の実験班分けが確定しました。今年からは「前期/後期6テーマずつ、平均60名受講するので1テーマあたり10名程度」になります。去年は過渡期でそこまで厳しくしてなかったので「ある実験班は3名」とかも普通にあったのだけど。

個人的には「(週1回の学生実験では)個別にコード・レビューやるなら10名は多すぎる(できれば6名、多くて8名上限)」とかあれこれかなり強めに主張したのだけど、少数派ということで押し切られました。個人的には、1〜2年次で実装寄りの部分に苦手意識を持ってる人をあぶり出して、個別に指導できることが少人数でやることの大きなメリット(かつ、他の授業には無い形式)だと思ってたのに、そこを削っちゃうか、という感じ。必ずしもコード・レビューに限らず、例えばプロジェクタ投影した状態でコード書いたりターミナル操作してもらうのを見ると「いちいちエディタ終了しない」「カーソルキーのショートカットほげほげ」「そこをデバッグするにはー」とかあれこれ細かいけども実利的な話ができるわけで。そういうのがしづらくなるのはどうしたものかなー。研究室配属後に持ち越し?。それもちょっとなー。今期は11名での実施になるので、早めに3〜4グループに分けた上でなるべく個別対応必要そうな学生を見つけやすくする or グループ側で互いに教え合う、という形に持っていけると良いなと思うけど、どうなることやら。

今回のデータマイニング班の進め方は、前回とは少し方針を変更して、(a) 機械学習(≒統計的近似)のコアを実装できるレベルで理解、(b) その実装を通してUnix 思想なアプローチを体験しながら開発、(c) 最後はscikit-learnを使って具体的なアプリケーション作成、という3段階を想定しています。まだテキスト(webpage)準備していませんが、どうなることやら。。

m_20140930032016542a21707cb44 m_20140930032902542a237e86a9e m_20140930034227542a26a399281

お昼は久しぶりにケレベッキ。あまりにも久しぶりすぎて店員さんに体調心配されてしまった。前は最低でも月イチぐらいでは通ってたし。なかなか行けずにごめんなさい。いつかベリーダンスに合わせて行こうと思ってるけどまだいけてないなー。

PD2の成績付け、修了生襲来、玄米

火曜日, 8月 19th, 2014

昨日は入試業務な一日でした(日記漏れリカバリ)。今日はほとんどPD2の成績付けるためのチェックしまくってて時間が過ぎてしまいました。一部を除いて一応目処はついたか。

m_2014081905351453f2e2128ca7a

昼過ぎに修了生の名嘉くんが来訪してくれて、お兄様と一緒にご歓談。珈琲飲みながらお茶菓子美味しいです。学生に対して教えておいた方が良いこととしては「Hadoopはもう古い、これからはStormslideshare)だ!(だけど時間が無い!!)」みたいな話らしい。ありがち。


今日はPD2の成績付けで、これまでのレポート提出状況確認、redmineのアクティビティ確認、ルーブリック評価確認、山田先生&當間による最終課題への評価確認して総合評価へ。シラバスに書いてあるし最初にも説明したからどうしようもないのだけど、

評価基準と評価方法

日々の報告書、相互レビュー、発表会、最終報告書による100%に加え、講義へのコミットによ る加点+10%を加えた合計110%として評価を行う

  • 個人ワーク、グループワーク時の各種報告書(25%)。*提出物諸々でチェック。
  • 相互レビューを通した評価(25%)。*主にルーブリック評価でチェック。
  • ミニ発表会、最終発表会(25%)。
  • 最終報告書(25%)。

上記の通りで、例えば「x日目の提出物出してない」とかで減点されてる学生が少なくなかったり。一つ一つは細かい点数だけど、それが積み重なると泣ける状態に。いや、素直に出してくれればお互いなく必要ないんだけど。ということで個人的には「最終課題に取り組んでた学生は(最悪追加課題なり課すことで)単位は出したい」と思ってはいます。どうなるかはまだ不明ですが。

ちなみに、授業評価アンケートでの「院生によっては厳しく評価をする人,甘く評価をする人,標準的な評価の目がないのは困ります」についてはルーブリック評価のことかな? そうだと仮定すると、PMによるルーブリック評価の違いも成績に反映していますが、その差は小さいです。趣旨は点数化することじゃなくて他人からどう見られてるかを可視化して、行動を振り返りやすくすることなので。(授業評価アンケートで書いたのはそういう意図じゃないなら、編集or直接メール貰えると助かります。)


今月ぐらいから玄米に挑戦してます。今回で鍋炊き3回目ですが、やっぱり玄米は炊くのが簡単だな。白米(精米)と比べてねっとりしないし、焦げ付き難い。水の量が白米と比べて少なめにするのを忘れると残念なことになるけど、注意点はそれぐらいか。事前に水に浸しておくのもあまり長時間でなくても良さげ(今日は30分浸けただけだけど、美味しくし上がった。硬めの触感が好みだから、というのはあるかもしれない)。

B1->B2への成長が見られた2014年度プロジェクトデザインI, II 最終発が終了。

金曜日, 8月 15th, 2014

情報工学科内部でやるイベントとしては卒業研究最終発表会の次ぐらいには大きいイベント、PD1PD2の合同最終発表会が終わりました。プログラム(要学科認証)はこんな感じ。朝から夕方まで丸一日かかってますが、1グループあたりの時間を短縮していることと、比較的時間厳守が守られてたのとでスムーズに終わりました。発表者も司会者も会場・Ustream等準備者の皆さんも、諸々おつかれさまでした。

PD1の発表は、良くも悪くも練り具合的には例年並みといったところ。高校卒業して半年たったばかりなので、急に成長している訳も無く。(提案だけじゃなくiOSアプリ作って来たグループもあったけど)。ただし、一つのプロジェクトとしてグループワークで取り組むことを通して得られた何かはあるはず。そして、PD2の発表はどのグループもPD1に比べると「テーマに対してどう取り組んできたか/その結果どうだったか/どこで苦しんだか」等を示しつつ、企画としての面白さを伝えるようなプレゼンテーションが多く、1年次の頃と比べてちゃんと練り具合が深まっているなという印象を強く感じました。初めての授業ということ、年次指導教員でもあることと相まってちょっと涙ぐみそうになった。しくしく(嬉しい方の涙)。

発表の仕方はPD1,2問わず、ただ喋るだけじゃなくて、蘊蓄喋りだす要員が待機してたり、掛け合い要員がいたり、寸劇したりと、印象に残る工夫をしているグループが多かったかも。凄い。

このまま少しずつ専門度を高める(深堀りしていく)過程を通りながら、民間でも通用するレベルでの「企画書」なり「報告書」なり「プレゼン」なりを目指して、個々人が一歩ずつ前進してもらえればと期待します。

個人的に感じている申し送り事項は以下の通り。

  • 「最終発表」であることの意義の説明。(大学生にもなって私語が多いのはちょっと。。。)
  • 企画に名前を付けさせるのを怠った。
  • 最終課題の採点割合が「全体の25%」というのは少なすぎるかもしれない。(そもそも広告としてのクオリティは求めていなかったのだけど、かなりの時間をかけて仕上げて来たグループが少なくないっぽい)
  • CM or 動画としての質を高く評価するべきか、広告効果としての質を評価するべきか、企画の質を評価するべきか、、、といった評価軸の曖昧さ。
  • (PD1向け)著作権や引用についての指導。
  • (一部向け)身内過ぎるネタに走ることの是非。*聴者の属性に合わせたプレゼンという意味では効果的なプレゼンではある。
  • 初回にやった0秒思考はずっと続けてやってもらうつもりだったのだけど、いつの間にかうやむやに。

P.S.
どうなるかまだ分かりませんが、学生成果物のCMは学科会議で検討後一般公開する予定です。最優秀賞だけではなく、全部。

P.S.2
「naltoma=丘の探求者」という扱いされてたけど、これはe13向けに進めている【「君の目指す丘は何だ?」と4年間問い続ける】プロジェクトのせいだな。元ネタはまおゆう。取材対応した時に「丘を見つけること自体が目標じゃなくて、丘の向こう側を見たいよね、そのために丘に登る力を付けよう」とかいう話もしたんですが、ネタ扱いされるぐらいでも広まりつつあるなら本望か。