Archive for the ‘データマイニング班’ Category

年内に面談を終えるのはほぼ無理な状況

火曜日, 12月 24th, 2013

ここ最近は1年次面談と2年次の実験レポート閉め切り対応しながら何か調べものして過ごすという日々です。気持ち的には年末モードか。個別ゼミも入れたかったんだけど、微妙に面談時間が細切れに入って来るのでなかなかまとまった時間を用意できず、悶々と。

面談状況は今日で40名が終わり、予約済みが16名、レスポンス無しが8名。ここまでやってまだレスポンス無しがいるというのも悲しいですが、これが現実。年内に終わらしたかったんだけどなー。

図書館からいらなくなった図書を無償でお譲りしますというお知らせが。基本的には古くなったものばかりだろうとは思うけど、期間内に一度眺めに行くか。

TLでHDD購入云々の話がでてましたが、バックアップが主目的ならRAIDよりもrsync系導入する方が個人的には好み。HDDへのアクセス・パターンが変わるから壊れるタイミングもずれやすい(同時に壊れ難い)だろうぐらいの気持ち込みで。お祈りともいう。


今年最後のデータマイニング班、11回目は以下のような内容でした。

具体的な開発が増えて来たこともあって、デバッガの使い方をやることに。実は実験前半でやるのを忘れていただけなんですが、タイミング的には恐らくここら辺が良さそう。進捗確認時にコードレビューしながらデバッグ修正できた学生もいたし。一人デバッガ経由でライブラリの import に失敗してるケースが良く分からなかったのだけど、あれは何だったんだろう。。pdb をロードしたらパスが変わるとかいう訳でもあるまいし。あ、vim側から実行してたPythonと、ターミナルから実行してたPythonとが違うという可能性はあったか。

コードレビューが始まったのでお決まりの「hg logして」。バージョン管理してない学生や、管理してるけど開発時はリポジトリ使ってない学生とか、他の人がどうやってるのかをいろいろ見れるのも楽しいし、「そうじゃなくて」と伝えられるのも良い。

実験終了後にテーマ設計についての個別相談で時間かけちゃったけど、楽しんで取り組んでもらえているなら何より

火曜日, 12月 17th, 2013

今日は合間に個人面談挟みながら個別ゼミ&データマイニング班。

個別ゼミは平良くんの番。先輩(山内くん)からのアドバイスで

デザインスクール参加時に、テーマについての専門家である他学部にインタビューしてとてもためになったから)
テーマに関係する専門家が他学部他学科にいるなら意見を聞きに行ってはどうか

というアドバイスを受けて具体的に行動に移してみたらしく、実のある相談ができたようです。ぐっじょぶ。そして対応頂いた法文・遠藤先生(視覚の認知心理学的研究)、どうもありがとうございます。インタビュー自体は先輩に付き添ってもらったようですが、それで問題無いです。次は自分自身にも活かしつつ、後輩のためにも動こう。具体的にどうだったかは週ゼミで聞くか。個別ゼミではいくつかの話をベースに今後のストーリーを立てて、具体的な実験に向けたアンケート調査方法を検討。次のアンケートで平均的な傾向が出せそうなら、データセット構築と計算機実験に向けた準備に取りかかれそう。

m_2013121719361352b0291dba8f6

自炊は久しぶりのシチューで、今回は具材をシンプルに白菜メイン。あれこれ野菜沢山いれるのも悪くないんだけど、一つの食材の味を楽しむという意味では最初はシンプルに作っといて、残り物にあれこれ追加していく方が良さげか。染み込んでた方が良い&翌日以降は温めるだけにしたいと思って最初からあれこれ入れてたんだけど、白菜シチュー旨し。


データマイニング班10回目は以下の通り。

テーマ設計そのものについての討論は今日が最終日で、来週からは実装やらデータセット構築やらといった計算機実験に向けての取り組みがメインになります。自然言語処理周りについてのTipsも今回で基本的には終わりで、次回はデータ問わず一般的なTipsをやる予定。残り5週間で簡易実験ぐらいまでは進めたい所ですが、どうなるかしら。

完成度の高い野菜炒めを高い精度で再現するためには訓練が必要

火曜日, 12月 10th, 2013

今日はデータマイニング班と個別ゼミな一日。

個別ゼミは堀川くん。先週の個別ゼミ&週ゼミでの討論を踏まえた個別ゼミということもあって、より具体的なストーリー構築&実験計画の設計について検討できたか。これでデータセット2つ目の方で実験を数回、データセット1つ目の方で実験1回やってストーリー立てた考察するための結果を出せるんじゃないかと期待。

m_2013121018392752a6e14fde5c7

自炊の方はここ2ヶ月弱の自炊生活で一番完成度が高かった気がする。野菜炒めskill++したのか、ご飯炊きskill++したのか、材料の問題なのか良く分からないけど。汁物は差し入れで、豆腐ハンバーグも温めただけなので除外するけど、ご飯と野菜炒めだけでもかなり旨かった。


データマイニング班9回目の内容は以下の通り。

  • 振り返り: supervised learning / unsupervised learning / semi-supervised learning
  • 記事紹介
  • Level 5 確認

    来週以降は進捗確認がメイン。問題設計は来週までが目安。ストーリーをつくれたら実装に入ろう。必ずしも全てを実装しきる必要はないですが、残り5週間程度で簡易実験をやれるところまで(何かしらのアウトプットを出すところまで)頑張ろう。

    • テーマ設計例: Twitter上のテキスト文を対象とした2値分類学習に基づく未知語自動収集
    • その他の例: HG/tnal/problem-design-examples.mm

      テーマ設計例やMindmapを参考に、目的/目標/アプローチ/特徴ベクトルの作り方/データセット準備/学習の進め方/実験計画等について検討&取り組んでください。(可能な範囲でok)

    • 必ずしもテキスト処理を前提にする必要はありません。
  • 自然言語処理入門: タームを素性とする特徴ベクトル生成の例 [ 英語編 | 日本語編 ] (文分割 + トークン化 + ステミング + ストップワード除去)
  • (続)課題: Level 5 (テーマ検討継続) *来週には全員テーマ決定予定
  • (早い人) 課題: Level 6 (課題取り組み/進捗確認)

実験では前回から代表的なテキスト文書の処理方法を紹介していますが、実際にそれらを使うかどうかはお任せ。自然言語に限らず画像/動画/音声等の情報源にしても良いし、何かしら数値化されたデータでもok。結果的にはテキスト文を選択する人が多いのだけど、データセットを用意していることとコード例を示していることが大きいのかな。データセットについては「お試し」なら数十件分作るところからやれば良いだけなので、あまり関係無さそうではあるのだけど。

自然言語処理入門の2回目は、単語単位で特徴抽出する事例の紹介。英語と日本語版のコードを用意してますが、どちらも基本的には「文書を単文に分割、文を単語に分割、単語の活用形を基本形に直す、不要な語を除外してコードブックを作成」という流れ。Twitter/Timelineだと@含めたユーザ名の扱いや、URLの処理とかあれこれもっと追加したくなりそうですが、一般的な処理に留めています。

後学期後半戦(8週目)に突入

火曜日, 11月 26th, 2013

研究室配属関連のための下調べ期間が今週一杯とかいう話で、話を聞いてみたいというアポが届いたので明日も普段通り出勤します。とはいえ思ってたほど精神病んでないというかむしろデザインスクールに参加した学生らが身になる(他で得難い)体験ができてたようなので、割と充実してます。

m_2013112618465352946e0dc7a98

それでも精神と実体とは一致してないらしく、今日はちょっと面白い体験を。夕方にうどんを湯で終えた時のこと。その茹で汁を捨てようと鍋を傾け始める前から「蛇口邪魔」「あ、これ指にかかるな」という確信があったのだけど、それにも関わらず脳内ではあれこれ考えつつも茹で汁の捨てる動作自体には無頓着でそのままザルに向けて投下。指にかかって暫くも「やっぱりかかるよな」「湯気で見難い」と第三者っぽく観察してて暫くは熱さを体感できずに眺め、赤く変色し始めてからようやく「あちち」。いや、その頃には「あちゃー!!」か。実時間でどれだけだったのか分からないけど時の壁をぶち破ったかもしれない(違)。

ということで水曜日は一応出勤するけど、デザインスクールの報告書作成するぐらいでだらだらしたい所。木曜はアポ入らなければ休むぞっと。住民票取りに行かないといけないし。デザインスクール関連の記事をいくつか書きたいところだけど、これは少しずつ書くことになるのかなー。


データマイニング班8週目は以下の通り。

後2回ぐらい自然言語処理入門をやりながら、テーマ設定を練りを続けて行く予定です。早い人はほぼ固まりつつあって、後は実際に手を動かしながら考えていく所か。大雑把な見積もりで進めている部分も少なくないですが「やってみて気づく裏側」を体験して欲しいからそのままざっくり進めていきます。

東ロボくんな記事がでてますが、少しずつ問題提供/問題分割/統合/API提供みたいな環境構築が進んでいるのは確からしい。

寝間着として長袖を出してみた日

火曜日, 11月 19th, 2013

m_20131119172345528b20110fa4c

日中はまだ暑くて長袖腕まくりしてるんですが、日が落ちるとそれなりに肌寒くはなってきたか。とはいえ歩きまくってると(風が強くなければ)あまり気にならないレベルなんですが。

今日の固定タスクは学生実験ぐらいで、午前中はその準備。空き時間でデザインスクールの最終名簿調製してたぐらいの一日。というはずが、学生からのタスクでアンケート回答し忘れてたのを昼過ぎに思い出してあれこれこなすなど。一応〆切日は守ったんだからネ!

デザインスクール参加者の方は結果的に当初想定通りの人数に収まったというところ。途中で少なすぎたり増え過ぎたりしそうな雰囲気があったんですが、どうやら1グループ6名*6になるらしい。当日の増減もあるでしょうけど、グループ数レベルでの増減は恐らく無いでしょう。といいつつあると怖いので、予備分の机やホワイトボードも準備しますが。他にも社会人枠の人数は当初より増えそうなんだけど、ファシリテーターが固定じゃ無さげとかいろいろ当日は良くも悪くも楽しくなりそうです。そこの運営をうまく回すのがお仕事。

m_20131119181220528b2b74eca2b
自炊の方は残り物の塩焼きそばに野菜&焼き鳥追加してやや味加減を調整したのと、残り物の豆腐でみそ汁。残り物があると手早く終わって(味が染み込んでるからか)美味しくていいなー。ということで残り物が切れた場合には作り過ぎてしまうのも気にしなくなりました。

卒業研究中間発表は、明日がコメント〆切日ということで学生の皆さんが慌ただしくなってきてるらしい。前日21時時点で眺める限りでは10名前後ぐらいが返答してるってところか。気になる回答については突っつき返してますので注意してください。


データマイニング班7週目は以下の通り。

ETロボコンで欠席している学生2名がいたこともあり、機械学習周りの外観説明追加と振り返りを兼ねた事例紹介がメイン。来週からは具体的に実装したい問題設定についての討論がメインになる予定です。

少し冷えてきた気もするけど日中はまだまだ半袖で十分

火曜日, 11月 12th, 2013

m_20131111131220528059245bbcb m_201311111233535280502166da9

昨日は年休を利用して後回しにしてた住所変更やらの手続き。それにしても朝早く(9時過ぎ)から出かけた割には戻ったのは5時だったりしたので、もうちょっと休暇を有意義に過ごしたかった。。那覇市役所で転出届け、警察署で免許書記載変更、郵便局で税金等の振り込み、島バナナ&ゴーヤーなアイス食べてから宜野湾に戻って転入届。各々待ち時間もあったし、徒歩で結構時間かかってたのもあって休みらしい休みじゃなかったな。長田交差点から宜野湾市役所へも徒歩だと結構な距離なのね。

s_2013111210001652817da013b20

今日は午前中に太郎さん爆撃、午後は学生実験があったのと、終了後にデザインスクールの打ち合わせ。明日、京大側とビデオ会議があってそこで諸々最終調整をする予定です。個人的に一番クリティカルに感じている問題はファシリテーターの人数ですが、ちゃんと用意できるんだろうか。(当初の話では京大側学生自身がファシリテーターとして準備してくるという話だったんだけど、グループ数目安を伝えてからはレスポンスが貰えていない)

卒業研究中間発表の方は、宮城・姜研、宮里研、山田研、岡崎研、河野研まで終了。そろそろ1週間で折り返し地点になりますが、一応今のペースで全員分チェックできそうか。

s_201311121955265282091e489ba

自炊の方は先日ロールキャベツに使った際の残り物ハンバーグと、具沢山みそ汁。炊飯器無しの生活で炊いたご飯を温めるのがちょっと面倒だったんだけど、ここ最近は汁物作るときは汁を多めに作って雑炊風にするということを覚えてからはやっぱり炊飯器なくても良いなと再認識しつつある。


データマイニング班6回目が終了。
  • 振り返り: classification / regression / clustring
  • (続) Level 2 確認 (2名)
  • Level 3 確認
  • 記事紹介
    • 怪奇!! 次元の呪い – 識別問題、パターン認識、データマイニングの初心者のために [ 前編 | 後編 ]
  • Model selection and evaluation
  • モデルのパラメータ調整の演習
  • Clustering
  • クラスタリング、3次元グラフ
  • 課題: Level 4: クラスタリングについての検討。
    • 機械学習の代表的な使い道の一つである「クラスタリング」では、「サンプル(N次元の特徴ベクトル)集合」として用意されたデータセットにおいて、似たようなサンプル同士を「同じクラスタ」に分類することでサンプル全体をいずれかのクラスタに分類することを目的としている。
    • 手法の特徴としてはK-meansに代表されるトップダウンな手法、ウォード法に代表されるボトムアップ的手法に大別することが多い。どの手法も一般的には、「サンプル間の距離をどのように計測するか」、「初期値をどのように設定するか」等によってクラスタリング結果が大きく異なることも珍しくない。そのため、適切なクラスタを得るために、「適切なクラスタ ≒ 良く見られる(現れる)クラスタ ≒ 意味がありそうなクラスタ」と考え、複数回試行した結果を俯瞰して観察することも少なくない。
    • 上記のような特性を踏まえた上で、クラスタリングについて以下の点について検討し、報告せよ。
    • (1) (適用してみたい)具体的なクラスタリング問題について述べよ。

      どのようなデータセットにクラスタリングを適用したい? 各サンプルの特徴ベクトルは2次元以上とする。可能な範囲でサンプルを具体的な特徴ベクトルで複数事例表現してみよう。またそのデータセットにクラスタリングを適用する意図は何だろうか?

    • (2) クラスタリング結果の評価について。

      一般的にクラスタリングには教師データが無いことが多い。もしくは教師データがあったとしても、教師あり学習では得られない結果を求めているからこそ教師無し学習を実行することが多い。クラスタリング結果の妥当性や適切さについて、どのように評価したら良いだろうか?

    • 提出先: データマイニング班学生公開用Wiki
  • 次週予定: 自然言語処理外観?

来週の課題チェックがまだ残っていますが、機械学習外観としては一応目処が付きました。去年は4週目から9週目までやってたらしい(Python演習や自然言語処理演習も部分的に入ってるので実際には5〜8週ぐらいじゃないかと)のと比べると、今回はPython演習3週、機械学習外観3週の6週間で終わってるので大分ペースが早いか。後で追加したいなというのも残ってはいるんですが、それをいつやるか/本当にやるかは未定。「ツールとして使うなら」という前提で不要に感じた所を削っていってるのでこんなものかも。やり方次第ではPython演習+機械学習勉強を兼ねて1つ具体的なアルゴリズムを実装してみるという時間も取れそうか。

来週からは自然言語処理ツールを使った特徴抽出演習やりつつ、具体的に自分で実装していきたい(データ)マイニングの問題設計に取り組むのがメインになる予定です。

新しいことを学ぶには浸かることが必要

火曜日, 11月 5th, 2013

週末は実家に帰っていたこともあって(家族内の)いろんなイベントが盛りだくさんでした。衝撃の事実もあったか。いくつか提案もしてみたけど、月イチぐらいで帰って緩衝材ぐらいになった方が良さげかなー。

午前中はデザインスクールタスクで、大学会館の下見。具体的には一番気になってた電源の位置や数のチェックで、延長ケーブル準備するだけでなんとかなりそうで良かった。去年のFANシンポジウムで借りたてだこホールでは、PCルーム以外は部屋自体の電源容量的に低い部屋ばかりでキツかったんだよな。(本当は電源タップ用意しまくってたんだけど、危険だったから設置数は減らした)

当日の車両搬入用に2カ所お願いする必要があるとのこと。1カ所は終わって、明日残り一カ所お願いしたら終わりか。大学会館での無線LAN利用については、総合情報処理センターの大川さん経由でどうにかなりそうな雰囲気。具体的な様式は無いけど依頼文として文書準備して欲しいということで準備して提出。後気になるのはホワイトボードぐらい?(遠藤先生の話では総合情報処理センターにあるとかいう話だけど実数は良く分からない)

午後のデータマイニング班は、11月とは思えないぐらいに夏日。夕方の日光が直接当たる部屋だからかもしれないけど、あれは空調入れたかった。。

m_201311051839135278bcc10153c

自炊の方は、初お好み焼きにチャレンジ。といっても買って来た専用の粉を水・卵で解いて具材入れただけですが。美味しかったけど、ちょっと焼きが甘かったかなー。粉ものは気を付けないと。キャベツを美味しく大量に消費できることは把握できた。


データマイニング班の5回目は以下のような中身でした。
  • 振り返り: classification / machine-learning / scikit-learn
  • Level 2 確認(分類問題の問題設計、評価方法
  • 記事紹介
  • 振り返り: classification (scikit-learn)
  • 機械学習外観: scikit-learn
  • 課題: Level 3: digits データセットに対し3分割交差検定してみよう

    データセット digits において svm.SVC で分類器を構築したい。その際、構築した分類器はパラメータやデータセットに依存して結果が異なるはずだが、ここではパラメータは固定し、データセットのみを学習・テストデータを複数回入れ替えて試すことで分類器がうまく構築できたかを評価したい。そこで、ここでは3分割交差検定を用いることにしよう。つまり、ここでは、
     ・データセットの並び順をランダムに入れ替え、
     ・3分割交差検定により推定結果を平均化する。
    という手順で分類器を評価するものとする。また、学習は以下のように用意した分類器を用いるものとする。

    from sklearn import svm
    clf = svm.SVC(gamma=0.001, C=100.)
    

    上記を踏まえて、以下の手順でプログラムを作成せよ。

    • (1) データセットの並び順を np.random.permutation により入れ替える際、シード値を「各自のアカウントから英字を除いた6桁数字」で初期化したインデックスを生成せよ。なお、作成したインデックスには重複や過不足がないことを doctest を使って確認すること。
    • (2) docstring 形式でコメントを書くこと。
    • 提出先: 各自のリポジトリ
  • 次週予定: 機械学習外観(スコア/パラメータ調整/線形回帰), パラメータ調整, グラフ描画

機械学習用語や問題設定種別の復習、宿題確認(どう特徴を抽出すべきかの討論含む)、scikit-learnでの分類学習のコード例振り返り、モデルの評価方法&交差検定の紹介、線形回帰の例、という4項目をやったぐらいですが、先週から新しいことだらけなので戸惑ってる学生も少なくなさそうな雰囲気。ま、新しいことは回数こなして慣れるしかない(というのは言い過ぎだけど)ので頑張ってください。

私自身の説明だけだと不足or偏りがあるということで、英文読むことだけじゃなくて複数の視点(記述)から説明するという形を取っています。具体的にはscikit-learnの各種ドキュメントと、毎回紹介している記事紹介ですね。今回紹介した記事は機械学習 はじめようで、読みやすいのでオススメ。先週の神嶌敏弘先生のデータマイニング講義資料もその一貫です。逆にあれこれ資料があり過ぎて混乱してしまう可能性もありますが、これは割と意図的に「いろんな文書や表現、視点に触れることでコアを見つける」ことを体験してもらいたいからこうしています。

英語ドキュメントしかないツールを使うことで必然的に英語を読まざるを得ない状況を作る

火曜日, 10月 29th, 2013

m_20131029092202526effaa1d8de m_20131029115737526f24214ddf8

午前中は個別ゼミで、久しぶりに堀川くんの出番。夏休み中ぐらいから続いているデータセットの準備、教師データの作成、スコア化方法、アンケート、あたりについて一通り確認&討論しながら今後の流れについておさらい。これでもう少し進捗が早まると良いのだけれど、アンケートをずるずる先送りにしちゃってるのが一番怖い。アンケート無しで相手を納得させる理論武装できるならそれでも良いんだけど、話聞く限りではそうでもないからなぁ。

データマイニング班の準備を終えてから明日のデザインスクール説明会+事前討論会の準備。

討論会は30分ぐらいしか時間取れそうにないことを考えると、具体的に討論して欲しい項目やアウトプットの形まで指定した方が良さそうなんだけど、その辺りは遠藤先生的には気にしてないらしい。多分。

m_20131029183332526f80ecb0d5e

自炊の方は、残り物の肉じゃがをみそ汁風とうか味噌を少し和えてより具沢山にしたのと、もう一品欲しい時の豆腐ハンバーグさんにご登場願いました。やっぱりこれ常備しときたい。先週末にスーパー行った時には見かけなかったので、もう冷蔵庫には在庫切れ状態なんですが。豆腐買ってきて作る?(手作りしたのを冷凍保存してどのぐらい持つかが怪しいのだけど)


データマイニング班(サーバ調整中のため暫く見えないかも。一時的な退避ページはこちら。一時的なページなので後で消しますが。)の4回目は以下のような中身でした。
  • 事例紹介
  • (続): Python演習: [ 公式チュートリアル | 補足 ]
  • 機械学習外観: scikit-learn
  • 課題: Level 2: 分類問題についての検討
    • 機械学習の代表的な使い道の一つである「分類問題」とは、データ(サンプル)をカテゴリ(クラス/ラベル)に分類する問題(個々の事例を適切なカテゴリに割り当てる問題)です。教師あり機械学習では、用意されたデータとカテゴリを基に、「このカテゴリに属するデータはどのようなものか」というパターン(分類規則)を学習します。
    • 学習した結果(モデル)は「分類器」と呼ばれることが多いですが、その分類器が適切なパターン(分類規則)を得ることができていれば、未知データに対しても適切なカテゴリに割り当てることができるでしょう。
    • 上記を踏まえて、「分類問題」について以下の点について検討し、報告せよ。なお、参照した文献/Webサイト等があれば参考文献として示すこと。
      • (1) (自分が分類したい)具体的な分類問題について述べよ。

        自分が望んだ分類器を構築するためには、どのようなデータとカテゴリを用意したら良いだろうか。ここでは分類器への入出力だけを問うものとする。

      • (2) チュートリアルで用いたSVMなり、何らかの機械学習を用いて分類器を構築したとする。その分類器の質はどのように評価したら良いだろうか。
      • 提出先: データマイニング班学生公開用Wiki
  • 次週予定: 機械学習外観(スコア/パラメータ調整/線形回帰)

例によって前期同様に、みんな大好きな英語の勉強兼ねてscikit-learnのチュートリアルを使って機械学習の各種用語や流れ、問題種別、例題を通したscikit-learnでの使い方、あたりをやってました。機械学習用語や全体像については直前の事例紹介でもやってたので、それを英語ドキュメント読みながら振り返りぐらいのイメージ。だったんですが、例によってチュートリアルやるだけで1.5時間ぐらいかかったかも。ま、初めての用語や概念だらけということもあるので丁寧にやらざるを得ないんだけど。といいつつ前期は「チュートリアルやれば良いか」であまり準備しなかった気もする。それ以上にPython勉強は丸投げだったんですが、今回は逆に力入れ過ぎて4週目冒頭まで引きずってしまったか。「ここまでは一通り通したい」というのもあって、調整が難しいな。

研究室配属の調整は深夜に及んだ一期生

火曜日, 10月 22nd, 2013

m_201310221222015265ef596454a m_201310221235395265f28b0e122

お昼は久しぶりに姜先生とデートで、初めてHanta Baruのランチ。特別イベントで夕方にきたことはあるんですが、昼の内容知りませんでした。想像通りややお高めな値段設定で、平日の割には賑わってるあたり、すごい。

午前中は後期初の個別ゼミで、今日は山内くん。先日開催されたKES2013で発表してきた論文がセレクト掲載されたことも手伝って、別のやりたかったテーマにシフト中。キーワード的には良くあるpersonalizationされた情報推薦を狙っているわけですが、具体的なゴールやアプローチについて具体化する作業をここ最近は調べながら差別化をしているというところ。

学生実験終わった後はインターンシップ報告会に顔出しながら内職。比較的「最初は乗り気じゃなかったけど言ってみたら面白かった」という話が多かったか。一般的なインターンシップというかお客様扱いされるだけのものでもやらないよりはやった方がモニタリング範囲が増えるので、やっぱりやってみるべきでしょう。やってみる前から批判してても始まらないから、まずは浸かってみよう

インターンシップ報告会が終わった時点で6時過ぎてたんですが、そこから3年次の年次懇談会だったらしい。TL眺める限りでは研究室配属についての話題が中心らしい。一期生(私や長田先生)の研究室配属では「教員に拒否権的なもの」があって、実際私は一度拒否られましたw(でも、正しい判断だとは思っている)。当時はどう調整するか自体を学生中心に相談し、指導教員の名嘉村先生だけじゃなく、学科外という意味で中間的な立ち位置にいる谷口先生を仲介役として希望する先生と調整してたのだったかな。GPAが導入される前は「どういう風に成績をスコア化するのか/共通を含めるのか/専門科目だけで良いのか/優先度調整するのか」とか突っ込みどころ満載だったので、最終的に調整が終わったのは深夜になってたはず。その後は拒否権的なものは一度も無く、指導教員毎にスコア化の式が調整されるぐらいで終わってたはず。こういう歴史を踏まえて指名制だか拒否権だかみたいな話が復活しているようですが、その理由を想像するに「成績の良し悪しではなく内容への興味で選んで欲しい」あたりかなと(多分)。そう考える極端な例を挙げると「何でこういうことやってるの?」と問われた時に「先生に言われたから」としか答えられない学生がいたりします。参考までに卒業研究のシラバスから達成目標を引用すると以下の通りです。この目標を達成する気が無い(ように見える)学生は、個人的には成績の有無に関わらず敬遠したくなります。教育的指導という意味でそうなるよう仕向ける努力は必要なんだろうけど。

○自ら積極的に考え自ら意欲的に行動することができる(積極性)
○学習研究内容と社会との関係を理解できる(社会性)
○研究内容の紹介や質疑応答における十分なコミュニケーション応力がある(コミュニケーション能力)
○数学等を応用して論理的に思考することができる(論理性)
○柔軟な思考力を有し,情報技術革新に対処できる(柔軟性)
○情報利用技術を自在に使いこなすことができる(実践性)
○現在の技術の限界を理解し,より有効な新しい技術を提案しようとする姿勢がある(創造性)
○専門分野の技術をよく理解し,その適用範囲と有効性を説明することができる(専門性)


データマイニング班の3回目は以下のような中身でした。

事例紹介もやってはいますが、今週までは Python 演習が中心で学生にライブ・コーディングしてもらいながらの指導で、そろそろ一段落ついたという所。まだまだ細かい部分はあるけど、次回からはscikit-learnの演習を通した機械学習へのイントロダクションな予定です。

データマイニング班2週目はライブ・コーディング

火曜日, 10月 15th, 2013

m_20131015191109525d14bd7261a

沖縄は強風域に軽く入るぐらいだったと思うのだけど、一日中もの凄い風で室外は勿論、室内でも場所によっては窓を直撃する風の音でとてもとてもうるさい。本土は大丈夫なんだろうか。

授業登録調整は明日が最終日で、1年次は現時点で42名が終了、25名がまだ。先週の月曜日が台風休講で、今週月曜日休み、水曜日に月曜振替えがあるぐらいという点では確かに月曜日の講義登録調整で遅れやすいスケジュールになっちゃってるんだよな。大丈夫かしら。

日曜日に新居へ引っ越し一段落し、新居からの通勤は今日が初めて。やはり通勤に片道徒歩20分圏内というのは立地条件的に素晴らしすぎる。スーパー大好き人間でもあって料理も楽しいし、自分の都合であれこれやりくりできるのはやっぱり楽ね。歩く量が増えていること+食べる量を調整しやすいこと(実家だと確実に食べ過ぎ)とでまだ3日目にして既に体重が落ちてきてます。安定するかはしらないけど。

今日の晩ご飯は昨日作った残り物のカレー。そのままじゃ味気ないということでゴーヤーを多めに投入。タッパーで保存してたのはともかく、お試しとして意図的に電子レンジを導入していないので温めるだけでご飯&カレー&ゴーヤー炒めでお鍋2つも使うことに。ま、もう暫く様子見。慣れるかもしれないし。

「少しずつあれこれ加える」というのをあれこれやりたいのだけど、生野菜だと一人暮らしには向きにくいか。冷凍保存効くのもあるんだろうけど。今回のゴーヤーは親からの差し入れで切った状態で冷凍できるからということで、お試し中。ホウレンソウなんかは湯がいた後で冷凍するのもありありか。他の葉野菜も似たり寄ったりなのかな。ということでストレス発散に丁度良いです。


データマイニング班の2回目は以下のような中身でした。

学生にとっては新しい言語(Python)に触れるということもあって、設定した課題を通してライブコーディングして貰いながら「Tabキーで補完」「help()でオブジェクトへのアクセス方法眺めよう」「ルーブ部ではインデントを揃える」「Linux系サーバ上にあるファイルを取ってくるには?」「エラー文の意味は?」とかあれこれ突っ込みながらの進捗。予定では後1,2回で目標レベル(自前でググりながら書けるレベル)にはなるんじゃないかと。前期は「チュートリアルやって」で済ましてたんだよな。