Archive for the ‘日記’ Category

AO合格者事前ガイダンス1回目を終了

土曜日, 11月 3rd, 2012

中間予稿は名嘉村研4名をコメント。これで4研究室15名分。まだまだ先は長いな。

AO合格者向けの事前ガイダンス1回目が終わりました。事前ガイダンスと言いつつ数学スキルチェックをしてからガイダンスの意義を振り返るという流れ。

大学新入生のための微分積分入門」から例題を集めて作ったテスト(PDF)で分野的には幅広く「数と式の計算/関数とグラフ/三角関数/指数関数/対数関数/関数の極限/微分/積分」から出題。合計47問を1時間程度で解くのはちょっとキツいかなと思ってましたが、理解してる箇所についてはちゃっちゃと解けるようで40分あたりで鉛筆音がほぼ無くなったかな。

採点結果的には、今まで通りのペース(高校授業)だけで問題無さそうなのは2名。残りはこのままだと入学後に苦労するのが目に見えます。ということで、予定通り月一集合して進捗チェックだか何かしらテコ入れをする事に。毎回テストするのも面白くないので、テスト自体は2ヶ月に1回のペース(次のテストは1月と3月)にしておいて、その間の月は一人一人が先生役としてその場で問題の解き方を解説して貰おうかと画策。ペアプロみたいにペア作って互いに説明しながら解き合うみたいな方法もありかもしれない。

ガイダンスはこんな感じ(PDF)で「入学後の大学講義にスムーズに」するために「学習週間を定着」させようという話で、余力があるなら英語も毎日積み重ねよう。後は Mac OS X なPCを購入して欲しいのでという話ぐらい。

テスト&ガイダンス後はお茶会しながら互いに自己紹介したり、夢や興味のあることについて雑談タイム。あれこれ聞いてくるタイプと、質問に突っ込むタイプとやっぱりあれこれ違いますね。既に在学生のTwitterアカウントフォローしている人もいて、「夏休みに東京に行ってる人多いんですか?」とか聞かれました。「え、授業中にツイートして良いんですか!?」とか。やりたいことあるならそれに向けて突っ走ろう、と無理矢理まとめてみましたが。

一人欠席でしたが、たまたま同じ高校出身者がいたので資料渡すことを頼めました。後で電話確認はしてみますが、大丈夫でしょう。

月1ミーティグということで、次回は12/1(土)の予定です。

明日から4連休〜。水曜日は仕事が入ってるけど。

「うない研究者支援センター」主催のスキルアップセミナーに参加

金曜日, 11月 2nd, 2012

写真はゼミ後のお茶会でのケーキ。ベーカリーキャッスルの紅芋モンブラン(?)っぽいタルトでした。うまうま。

午前中は中間予稿読みで、和田研6人+吉田研2人へのコメントを終了。毎日6名前後ぐらいずつコメントして行けば来週中には終わるはず。といいつつここ最近休めてなかったので来週月曜から水曜まで休みを取っちゃいましたが。でも読みはするはず。というか休むのがヘタな方なのでちゃんと休まんとなー。そろそろ旅行にでも行きたい。

午後は「うない研究者支援センター」が主催するスキルアップセミナー「英語論文の書き方セミナー」に参加してきました。「うない研究者支援センター」は職員公募情報を見る限りでは「女性研究者の在職比率を上げるために、男女共同参画室に新規に設置」したセンターらしい。アンケートで「セミナーして欲しいもの」を尋ねていたのですが、何か予算が通って設置しているセンターらしいので、今ならリクエストしたら適う可能性高いかも。

対象が研究者&院生。試しに卒研生も可能か確認してみたんですが「最終的に空きがあればOK」とはなったものの、昨日の時点で席が埋まったとの連絡が届きました。ということで私を含めてNAL研院生が参加。一人は集中的にクイズを振られたのがある意味印象的。

内容は比較的一般的なものだとは思います。それだけにどういう点に意識してコメントするかという点で、参加して良かったです。講師曰く、「最も重要なのはOrganizationでそこについて編集手伝いをしたいのが本音だが、Nativeでは絶対にやらないケアレスミスが目についてそこに辿り着くまででお互い時間を浪費してしまう。有意義に時間を使うためにも最低限の過ちはしないようにしよう」という主張で、あれこれ話されてました。例えば以下のようなもの。一言要約するなら「Position has meaning.」です。試しに「ある論文でのケアレスミス」を数えてみたら、6〜7項目ぐらいでチェックした総数が650件だったらしい。そりゃ「まだ本題に入ってないのに、こんなことに時間費やしていたくない」よね。

  • 最優先項目はOrganization。そもそも全体の構成(特にTitle, Thesis Statement, Conclusion)の整合性が取れてないと読めない。論文はparagraphの塊。paragraphはsentenceの塊。それぞれ大切な情報を前方に書こう。Position has meaning.
  • 次に重要なのはStyle & Formatting。基本的には「指示通りにやる」だけなのでコスト自体は少ないが、そこのやり取りから相手にお願いすると互いに時間を浪費する事になる。一般的な掲載する雑誌毎の指定があるはずなのでそれに従おう。ただし、指定の有無とは無関係にEditor側でどのぐらい編集するかは雑誌毎に大きな差がある。論文毎の差異が大きい雑誌はそこへのコストをかけないというスタイルだが、逆に言えば全責任を著者が追う必要があるので注意。
  • Grammarはどちらかというと優先度は低い。100%正しいGrammerで書けてても「何を言ってるのか分からない = English is poor.」となる文章は、positioning and/or identification に問題がある。statement間にリンクを張り、重要語は見やすくpositioningしよう。

ちなみに「Nativeでは絶対にやらないケアレスミス」についてのクイズが8問用意されてたのですが、スペース区切りについてそこまで気にしてるんだというのは意外でした。

明日はAO合格者が来学予定〜。

進化計算班5回目終了

木曜日, 11月 1st, 2012

中間発表の予稿が揃ったようなので、ちらほらチェックし始めています。基本的に全員分に目を通すようにしてるので、漏れがないように研究室へのリンク順に眺めています。こうすると、私の興味からは離れている研究室が連続してたりするのでなかなかモチベーションが続きにくいんですが、逆にこれを終盤に持ってくると投げ出しちゃいそうなのでこうしてます。ということで取りあえずアシャリフ研分は終わりました。毎日少しずつコメント書き始めるはず。

進化計算班は5回目を終了。今回のメインタスクはグループ毎に適用したい問題を1つに絞り、適用方法(コーディング、適応度評価、交叉、後処理など)についての確認と、開発を依頼するスタイルなのでその調整。早めに終わって20分ぐらいグループ間討論の時間を取ったぐらいで、残り時間はずっとプログラミング演習してました。

プログラミング演習(C言語)では、前回書いたマインスイーパなコード(全てをmain()に書き連ねただけの状態)をベースに、

  • 変数を介さずに直接値を書き込んでいた箇所を変数に置き換え。(そうしないと同じ意味で使ってる箇所を一度に変更することができない)
  • 配列使ってた所をポインタ+動的メモリ確保するように変更。(そうしないとフィールドサイズを変更できない)
  • グローバル変数はデフォルトで禁止。(そうしないとシステム規模が大きくなればなるほどデバッグで泣くことになる)
  • 機能単位で関数化。(そうしないとプログラム全体の見通しが悪い)
  • 一部の関数を別ファイルに分割+Makefile修正。(そうしないとシステム規模が大きくなった時に見通しが悪くなったり、コンパイル時に時間かかり過ぎて泣きたくなったり)
  • 動作確認用のコード(テスト)を書いて、プリプロセッサ対応。(ウマく使うとプログラム変更時の動作確認しやすくなったり、見通しを良くできたり)

みたいな一般的なリファクタリングをして、main()関数の全体像を眺めやすく&再利用する形にしてみました。いや、してみたというよりは、学生に「こうしてみて〜」という指示をしながら実際に手を動かさせていたという形ですが。それをプロジェクタで投影しながら皆で眺めつつ「そこはこうしたら」「そうじゃなくて」とか助け舟出しながら進めるというスタイル。

プリプロセッサとか今更知る必要があるのかと言われたら微妙な気がしなくもないですが、ま、一応。

再来週ぐらいからは実際の開発に入る予定なので、後1,2回は今のスタイルで進めて「開発前の準備」としてやっています。簡易設計→ユースケース記述→試し実装→リファクタリング、という流れ。次回は細かいリファクタリングするか、Testingか、デバッグあたりを想像していますが、どうしようかな。

卒業研究中間発表Web投稿〆切日、Project311メモ

水曜日, 10月 31st, 2012

というわけで、今日は卒研中間発表の原稿〆切日です。そろそろ全員出したかな? うちの学生もどうにか仕上げて出せましたが、どういうコメント貰えるのか&それを踏まえてどう歩んで行くのかが見所です。

上記リンク先にある通り「中間発表」にはいくつかバリエーションがあって、全員必須なのは一般的な予稿2ページの作成&Web提出+質疑応答3件以上。希望者や研究室の方針次第で口頭発表。質疑応答3件になかなか満たない学生は、自分たちでかけずり回って「質問お願いします!」と学生自身がかけずり回るというのが恒例行事です。恒例行事といえば例年全員の原稿眺めてコメントするのが私の恒例行事なので、明日から少しずつやるか。1日10件ぐらいでやれば1週間かからないペース。

昨日リンクだけ紹介したProject311の発表資料を眺めてみました。プレゼン形式とポスター形式の2通り(?)あるっぽいのですが、取りあえず今日眺めたのはプレゼン形式の方。以下、気になった事例のメモです。

茨城県つくば市における地域情報発信の様子を振り返る試み」の「ツイッターが役立つのは、典型的にはつくば市のような中間的な被災地ではないか(要検証)」という観点は面白い。確かにクリティカルな場所へのアクセスとかいろんな意味で「中間的な被災地」が果たす役割を効果的に行えると良さそうに思う。

道路・交通関連情報の読み解きの一考察」の「メッシュ化してわざと粗くすることで状況を面的に把握する」というのは確かに。

Twitterからの被災時の行動経路の自動抽出およびその信憑性の検証」ではツイートされたテキストデータから「出発地/目的地/移動手段」を抽出してみたらしい。

大震災の解釈に際する地域差異と時系列変化-TWITTERデータの社会心理学的分析-」はツイート(テキスト)に現れる言語の抽象度具合からニュアンスを特定するために「言語カテゴリーモデル(LCM, Semin &Fiedler 1988)」という考え方でアプローチしてみているらしい。

Twitter emotion analysis in Tohoku earthquake crisis」は、ツイートを感情6カテゴリに自動分類して震災直後〜数日間の推移を見たという話。データの傾向を眺めるという点ではこういうやり方もあるか。

震災時のハッシュタグ活用について」は、ハッシュタグ付きツイートの内容分類したという話。主成分分析でカテゴリー設定し、RT上位5位を人で分類したらしい。高精度に自動分類できるなら、ハッシュタグを自動付与するとか把握するというような「ハッシュタグを使った情報交換」を前提にするのではなく、ハッシュタグ無しやりとりを検討しても良さそう。

Falconseedを使った分析プロジェクト」のFalconseedというのが何だろうと思ったら、膨大なCSVに対してgrep/sed/sort等をGUIベースでやるためのツールっぽい。確かにこういうのがあると助かる人は大勢いますね。

あと、東日本大震災ビッグデータワークショップ Project 311に「野良分析チーム」として参加したという参加者ブログも面白い。「人はいかにして帰宅を決断したか、Twitterによる首都圏の避難場所情報は有用だったか?」という視点からあれこれ試行錯誤し、ボツになったネタも並べてたり。こういうのを眺める機会ってあんまりないし。

たまには時間の使い方を振り返ってみよう

火曜日, 10月 30th, 2012

今日は比較的時間が空いてるので、気分転換を兼ねてカフェde作業。

今週末に予定してるAO合格者向けガイダンスで使う資料準備。メインタスクは事前学習として数学やりましょう〜という号令で例の「大学新入生のための微分積分入門」を配布。簡易テストで現時点でのレベルをチェックしてみること、後は連絡網確認して次回集合日を調整するぐらいかな。「余力があれば英語も」と言いつつ、できればTEDとかNHK語学番組とかオンラインテキストあれこれあるので「1日10分シャドーイング」ぐらいをデフォルト日課として組み込めないかなと妄想したり。物理は入学後のカリキュラムでは2年次必修なので、1年次の間にやるのが良いんじゃないかと。

ぶっちゃけどんな方法でも良いから「毎日続ける」ことができるかどうかが大切。在学生でもTwitter/Skypeに注意を取られて授業に集中できていないんじゃないかと思われる学生がちらほらいるように見えます。目的もってやらないと時間だけがずるずる過ぎちゃうのはMMORPGにどっぷりハマった人と同じなので、集中したい時にはツールとして効果的に使う(or使わないという選択をする)ことを意識してみよう。遊び/休憩の時間なら気にする必要ないし、授業やその予習復習とか集中してる時に質問とか関連づけて効果的に使うなら問題無いです。集中したい時にもTimeline眺めてしまう人は要注意。

AO事前学習に話を戻すと、教材渡して「やっといてね」だけでは多くの場合無理だろうから月一ぐらいで定期チェックと称して集まる機会を設ける予定。これで数学については何とかなると期待(したい)。英語の方は「自室の扉に一日の目標を張り出そう」ぐらいしないと無理かなぁ。

大学戻ってからはミニゼミx2しつつ、中間発表の予稿チェック。一人はほぼ終了。もう一人はどうなるかなー。

話変わって東日本大震災関連の話。震災時の関連データを共有し、次の災害に備えるためにどんな準備したら良いかという「東日本大震災ビッグデータワークショップ Project 311」なるものがあり、その報告会がオンライン公開されているらしい。後で眺めてみよう。プレゼンも録画公開されてるようなんですが、ちょっと画質的に見づらいのは悲しい。

科研費申請書β版にはなったかな

月曜日, 10月 29th, 2012

科研費申請の最終〆切が11月7日ということで、そろそろ残り10日間となりました。科研絡みのリアルな状況は例によってツイート検索するとあれこれ見れますね。Twitterが無かった頃には得られなかった一体感だよなw

α版ができてから23日経って、ようやくβ版とよべるぐらいにはなりました。具体的な更新作業は昨日と今日だけだったりしますが。その間の20日間ぐらいは振り返り記事として書いていた認知科学的視点とか、過去のイベント体験&サマリを踏まえたストーリー構成を練り直すのに時間がかかってました。まだ全部を繋げきれてないのがアレでソレだけど、後は細かい修正ぐらいで終わりそうな予感。うーん。

〆切繋がりで卒研中間発表が今日を含めて残り3日間。うちの学生は昨日今日で初校(一人はもう第2版出してきたな)を出してきたので既にコメント返し済み。先輩らも気になる点をコメントしたり相談載ったりしてくれてますね。〆切までにどこまでブラッシュアップできるかなー。

今から参照してるようだと遅いですが、卒業論文本体を書く際には「やればできる 卒業論文の書き方」が参考になると思います。そもそも研究の進め方自体が良く分かってないという人は、前に選書した「大学生のためのリサーチリテラシー入門 研究のための8つの力」を読んでみると良いかと。既に残り3ヶ月ぐらいしかありませんが、今からでもやれなくはないです。一歩一歩歩むしか無いので、頑張ってください。

ちなみに、卒論/修論/博論について河野先生的な目安としてはこんな感じらしいです。

10月最後の金曜日が終了

金曜日, 10月 26th, 2012

ということで10月も残り五日間となったようです。10月末は4年次の中間発表〆切日な訳ですが、他の研究室はどんな感じなんだろう。うちの学生らはまだ初版できてません。しくしく。と泣きつつ、初めて学生を受け持った時の事を思い出すと、年々少しずつ良くなってはいたりする事実。基本的に〆切日にはうるさい人(守るのが当然だと思っている人)なので、注意しよう(?)。

ゼミは、先週に引き続き仮配属対象ら数人が聴講参加。初めて聞く人がいる場合には「3分で何やってるかを紹介して、今日やってることがどう繋がっているのかを説明してから報告してね」というスタイルでやってます。学生自身に研究目標を再確認することや、端的に説明すること、ストーリーを意識することを兼ねて。

終了時間が延びて終わる頃には6時過ぎだったかな。ということでお茶会はキャンセルしてうかじそばに突撃。突撃したは良いけど駐車場についてから財布を忘れたことに気づき、慌てて学生の残金チェックしてから食べる羽目に。なんかごめんなさい。見たい/聞きたい/感じたいことを体験してもらえてたら良いのだけど。

AO事前学習で使う教材「大学新入生のための微分積分入門」がようやく届きました。11月1週目の週末になる来週末から実施する予定です。取りあえずどんな感じかを掴むために簡易テスト用意しようかな。

進化計算班4回目終了

木曜日, 10月 25th, 2012

微妙に体調が低空飛行気味なので、カツを入れるためにミカン買って食べたり。どこら辺でカツが入るのかは分からないのでここ最近やってないことをやってみたというだけですが、それでも午後は割と集中できてたかな。

進化計算班は4回目が終了。今週と来週の2週間ぐらいで「GAを何に適用するか(何を探索させるか/最適化するか)」を考え、クライアントとしての簡易的な要求仕様の作成を目指しています。テーマ提案の1週目では、グループ毎に2テーマ以上考えてきてもらって、各テーマについて「どうコーディングするのか」「どう点数化するのか」「致死遺伝子対策どうするか」といったあたりのことを討論検討。

テーマ検討だけで結構な時間がかかったので、オプションは前回粗く設計したマインスイーパもどきの実装として、最初の機能の途中までを書いてもらったぐらいかな。来週はリファクタリングに入るはず。多分。

話変わって言語処理で「似たような文」とか「似たような文書(複数文集合)」といったことをする場合、まずはその対象となる「文or文書」を何らかの「特徴空間」に写像し、その空間内で何とかして「距離」を測り、距離の長短を「類似度合い(距離が近いほど似通っている)」という尺度として利用する事で最初の目的達成を目指す事が多い。「文」をどう写像するかが一つの腕の見せ所になる訳ですが、そういうことにも使えそうな「記述要素辞書」なるものを久保先生らが手動構築したらしい。

出典: 久保木武承, 山本和英: “クエリと説明文の関係を表す記述要素辞書の構築”, 信学技報, vol. 112, no. 196, NLC2012-22, pp. 67-72, 2012年8月

我々は以前「ある話題語について検索したとき、得られた文章が話題語についてのどのような内容を説明しているかを推定する」という問題を設定した。例えば「ローパスフィルタ」ならば「機能」「副作用」「設計方法」などの語があり得る。これらの語を記述要素と呼ぶ。

具体例やもう少し詳しい話が研究室のサイトで公開されてますが、どうやら辞書データ自体も話次第(というか多分文字通りどのぐらい使われているかを確認するためにワンクッションおいてるだけと想像)で提供しているらしい。Wikipediaとかで大雑把な辞書代わりに使えなくはないけども、こういうデータがあるなら頼んでみようかしら。具体的にどう使うかというよりは、まずは眺めてあれこれ触ってみたいというのが趣旨なんだけど。

こういうコストかけてデータセットを作り上げていくというのもほんと大切な仕事だよなぁ。

個別ゼミ3週目終了

水曜日, 10月 24th, 2012

個別ゼミは先週まででB4の二人は終わって、今週から院生の出番。特に今回出番の学生は毎回ゼミ時に綺麗に報告書を作ってくるタイプで、それを踏襲して個別ゼミでも同じように準備してきてました。流石。夏休み〜先週まででデータセット増強してて、そのデータで同じアプローチで学習&テスト。交叉検定した結果こんな感じで、これまでのデータセットを比較するとあーだこーだ、という流れが整っててとても分かりやすいです。データセットは詳細度に応じて2段階あるのでまだ泥臭い作業が残ってますが、今後アプローチを改善するための指標としては十分整ってきたかな。(こういう流れだと実名出して良いんじゃないかと思いつつ微妙に悩むな。内容ももっと具体的に書いた方が読む方も面白いんじゃないかと思いつつ、具体的な内容は学生が卒研ノートに書いた方がとも思ってるからあれでこれ)

認知学会が出版してる学会誌「認知科学」の2012年9月号では「ヒューマン・ロボット・ラーニング」を特集していました。写真の通り「誌上討論」になっていて、石黒先生による主張を通して徳永先生が突っ込み、それを受けてさらに石黒先生が回答するという「討論」形式になっているのは面白い。ちなみに2011年度までの過去ログ(雑誌内容)は公開されてるようなので、タイトル眺めるなりキーワード検索するなりここ1,2年分眺めてみたりすると面白いかも。他学会でも勿論OK。>学生の皆さん

個人的に予想できなかった話題としては、三宅先生による「建設的相互作用」という観点でロボットを用いた学習研究への取り組み。一部抜粋すると以下のようになります。

出典: 三宅なほみ, “人ロボット共生学:実践的な学習研究にロボットを導入して、何ができるか”, Cognitive Studies, 19(3), 292-301. (Sep. 2012)

建設的相互作用は、簡単に言えば、二人が同じ問題を解く時、解き方を提供する「課題遂行者」と、それを俯瞰する「モニター」とにやくわりがわかれてやり取りする時に起きる。課題遂行者は、相手が即納得するものではないので自分の考えを見直すことになり、モニターは相手の提案を自分の考えを見直すことになり、モニターは相手の提案と自分の考えを結びつけなくてはならないので視野の拡張を迫られる。この考えの見直しと視野の拡張を各参加者が交互に経験しつつ、それぞれの「考え」を言語によって表現することによって、参加者それぞれの考えは、相互作用の前後で変わる。この変化は大抵の場合、適用範囲が広くなったり、説明が精緻化したり、表現されるものごとの関係が緻密になったりする形で現れる。

これ、まんまペアプロだと思いますが、「建設的相互作用」はいつでも効果的に行える訳ではない。そこでロボットを通して協調的な学びの生成過程を検討し、建設的相互作用がうまく起きる条件を洗い出していってるらしい。経験則的な側面が強いと思いますが、こういうところを一つずつ仮説立てて検証していってるのは凄いな。

教員による研究室紹介終了(NAL研紹介サマリ)

火曜日, 10月 23rd, 2012

研究室紹介は20時過ぎで終了。関係者各位お疲れさまでした。

今日は4年次の中間発表〆切に向けてのミニゼミ2件をして、残りは研究室紹介用の資料整理をほげほげしてた一日。昼過ぎには終わるだろうとたかをくくった割には16時頃までやってました。一旦資料作り始めるとあれこれ紹介したくなるからなぁ。実際には説明省略しまくりでしたが、興味ある人はゆっくり眺めてみてねってこともできるし。

ということで、NAL研紹介で使った資料をアップロードしたので資料リンク紹介と、話し忘れた事項の追加です。基本的には全て資料中にリンクを掲載していますが、特に説明中に紹介した関連事例リンクも抜粋しています。

紹介し忘れてたのは後半2件。

選書2012は、関係のある専門分野へのイントロダクションも紹介してますので、参考になるかなと。

未踏ユース/スーパークリエータにまつわる座談会は、IPAの未踏ユースと呼ばれるプロジェクトの話です。詳細はその座談会記事を読んでもらうとして、端的に紹介すると「前人未踏なIT技術を組み込んだアイデアに対して開発費(上限180万ぐらいらしい)とスペシャルなPMを用意して開発支援するよ!」という人材発掘を兼ねた育成事業です。その応募にNAL研の与儀さんが採択されただけでなく、スーパークリエータ認定されました。ぱちぱち。という紹介ではなくて、進学するからといって「研究室内/大学内/学術交流内」に制限した活動をするのは勿体無いよ。未踏に限らずもっと外を見よう。外に出て活動しよう。という話をし忘れました。

勉強会に限らずいろんな所で多種多様な支援なりプロジェクトなりコンテストなりが開催されてたりしますので、そういう情報探して応募するも良し。気にせずGitHubとかでオープンソースとして公開しながら自分のプロジェクト進めるも良し。研究活動100%集中で学外発表しまくるも良し。何らかの方法で学外活動しないと、外からは「あなた」を見つけることができないですよ。というお話。前に新入生向けLTで話したことでもあります。