Archive for the ‘日記’ Category

ゼミ後にKJ法(グルーピング)

火曜日, 4月 23rd, 2013

m_20130423181415517650e7f07ad KJ-平良step2-photos

一ヶ月以上前にやったKJ法チックというかBSチックな討論の続きで、ステップ2のグルーピングをやりました。

既に忘れかけてたので思い出すためにカード全体を個別に振り返るところから始まって、2時間ほど経過した所で一先ず終了。といっても平良くんの分が終わっただけですが。最終的には卒研テーマを決める所までやることもありますが、今回は「列挙したアイディア」にはどういう視点が含まれているかについて討論することなので、一応これで一段落です。討論することで参加者間に共通の言葉や土台が生まれることもサブ目的ですが、いずれにせよこれ以上の深堀りをKJ法的に進める予定はありません。後は通常のゼミや個別相談しながら。

ここまで一人あたりステップ1(カード化)で2時間、ステップ2(グルーピング)で2時間、合計4時間はかかってます。実際には事前準備とかもあるのでもっとですね。もう一人松田くんについては、来週はタイミングが合わずにやれないので5月実施になるらしい。

M1の二人が微妙にテーマ変更を視野に入れつつ、既に4月末になる時点でまだ決定しきれていないのは大分時間的に損しているのですが、B4からの続きにせよネタ替えにせよ今月中に決まるかなぁ。

[複雑研全体ゼミ補足記事] 4/22, ストリートビュー利用した歩道認識、Twitter絡みの推薦

月曜日, 4月 22nd, 2013

m_201304221224455174ad7dbf10c

学内で離れた所に移動する際には番傘を愛用しているのですが、4月になって新入生が増えたからか久しぶりに大勢の視線を感じました。既に1年間強使ってることもあって恥ずかしい気持ちはナッシング。ieな1年生から格好良いとか言われましたが、欲しければ自分で買おう。私は辻倉で買いました。

プロジェクト・デザイン1での調べ学習「琉球大学概況調査」なるものが始まってるようです。インタビュー形式で調査するグループもあるようですが、例えばこことか何かしら有意義にインタビューできるように準備するよう心がけてみよう。100点満点目指す必要はないけど、現状より向上する努力はしよう。

以下は複雑研全体ゼミを終えての補足記事です。


今日の全体ゼミ討論中に出てきたキーワード
 ・大城祐二: [1] 物体認識としてのストリートビュー利用した歩道認識
 ・新里華生: [2] Twitter絡みの推薦
での関連話を補足します。

[1] 距離センサーと画像処理による移動体認識, 情報処理学会 第75回全国大会, 2013, 3U-9
[2] Twitterにおける会話しやすいユーザの推薦手法, 情報処理学会 第75回全国大会, 2013, 5N-1


>ストリートビュー利用した歩道認識

紹介した論文[1]自体では Kinect の距離センサーを利用した「ある距離内にある物体を切り出す」というものでしたが、ストリートビュー画像からはそれは使えません。特に先輩の研究結果では看板がノイズとして邪魔だという話でしたが、その関連事例を紹介します。

[3]では、広告看板や道路標識認識を例に(正規化LoG関数近似に基づいた)局所不変特徴量を提案しているようです。また、[4]では道路標識が対象になっていますが「看板や紅葉など類似した色の背景物体」がある場合でも標識を追跡しようという事例らしく、参考になる情報があるかもしれません。

同じアプローチを直接利用することは難しいかもしれませんが、[5]では屋外での自立走行のため測域センサを用いた歩道両端点検出[6]をしているようです。

[3] 正規化LoG関数の近似に基づく局所不変特徴量の抽出, 電子情報通信学会技術研究報告. PRMU, 2008, http://ci.nii.ac.jp/naid/110006937629/
[4] 動的色境界の提案と道路標識追跡・認識への応用, 情報処理学会研究報告. CVIM, 2008, http://ci.nii.ac.jp/naid/110006820243/
[5] 筑波大学ループ道路歩道3.5kmにおける移動ロボットの屋外長距離自律走行の試み, 日本機械学会論文集C編, 2011, https://www.jstage.jst.go.jp/article/kikaic/77/779/77_779_2782/_article
[6] 測域センサを用いた歩道認識による移動ロボットの屋外長距離自律走行, ロボティクス・メカトロニクス講演会講演概要集, 2009, http://ci.nii.ac.jp/naid/110008698324


>Twitter絡みの推薦

紹介した論文[2]自体では「興味のある話題をツイートしているユーザの中でも会話しやすいユーザ」を独自基準でスコア化して推薦しようという話でしたが、新里くん自身は特定の目標を持っている訳ではないようなので、この間話した例も含めて推薦の例を紹介します。

[7]は、buzztter をベースに関連論文を推薦するというbotです。[8]は、Twitter/Facebook/はてなアカウントでのアクティビティからそのユーザをプロファイリングし、興味にあったニュースや記事を推薦するというサービスです。

それらを例えばどう実現するかという事例としては、[9]ではブックマークに含まれる「タグの共起関係」から興味語を抽出し、類似したユーザを捜すというアプローチを取っているようです。[10]では、発言に対する言語処理に加え、先日の全体ゼミでも出た「ユーザにも重要度」を割り振り、双方からの特徴量を合算することで「興味・関心のある記事」を推薦しようと試みているようです。

[7] 空気を読んで論文を紹介するtwitter-bot 「論文ったー」つくってみた。 http://d.hatena.ne.jp/YamadaToshiyuki/20091012/1255347730
[8] gunosy http://gunosy.com
[9] ソーシャルブックマークを基にしたTwitterユーザの興味語抽出・推薦手法の提案と評価, 情報処理学会研究報告. DD, 2011, http://ci.nii.ac.jp/naid/110008583752/
[10] Twitterを利用したソーシャルニュース記事推薦システム, 情報処理学会研究報告. データベース・システム研究会報告, 2011, http://ci.nii.ac.jp/naid/110008682624/

P.S.
読みたいけどWeb上でソースが見つけられない場合には、図書館で複写依頼するなり、先生に相談するなりしてみてください。

査読してコラム記事を通した切っ掛け作り

土曜日, 4月 20th, 2013

m_201304201207255172066d92d4d m_201304201216295172088d76897 m_2013042012281951720b53b5995

査読に目処をつけておきたかったので、例によって週末の「大学向かいながらランチ寄り道」ではバンボ ルーガでお食事。久しぶり。前は野菜しか無かった(それで良かった)んだけど、肉/魚を選べるようになったのね。週末メニューかもしれないですが。魚のトマトソースを選んでみましたが、十分美味しかったです。甘さ控えめのデザートもばっちり。

ということで査読を終わって帰宅してからコラム記事なるものを初めて見ることに。

新入生向けに伝えたい言葉を、年次懇談会や(5月に予定している)個人面談とか何らかのオフィシャルな場で伝えている*つもり*ですが、その時々で何がどのぐらい伝わるかは左右されます。TPOに応じていろんな手段があるだろいうということで、考え方/歩き方/学外の話題/etc.何かしらをコラム記事という媒体/手段で伝えてみる試みを初めてみることに。

クローズドにやるつもりでしたが、別に隠す必要は無いかということでここのブログで書いていきます。新入生向けにはML送信するつもりですが、邪魔になりそうならRSS購読を伝えて(ML送信は)終了する予定。

どのぐらいの頻度でいつまで続くか分かりませんが、気長にやってみましょう〜。高校生までのホームルームみたいに、ある程度定期的にテコ入れするような位置づけになるのかな。「丘の向こう」に辿り着くためには何かしら行動しないと。


コラム記事一覧
  1. 気がつけば時間が無い?
  2. 学び方を学ぶことが他のことへ応用する力の源泉になる
  3. 動機が薄いままだと長くは続かない
  4. やって欲しいことを噛み砕いて伝える / プログラミング1
  5. 「情報」って何だろう?
  6. 興味のあることはどしどしやろう
  7. 何をやるにしても体が資本
  8. アドレスの意味と、C言語でありがちなミスを観察してみる例題 / プログラミング1
  9. 高い学費を払って受けたい指導は他にあるはず(タスク放置し続けるのは辞めよう編)
  10. 帰宅するまでが研修
  11. 学外イベントに参加して今後の検討材料にしよう
  12. レポートに限らず、相手に伝えるためには相手が理解しやすい形でアウトプットしよう(言い換えると相手の解釈コストを下げるように努力しよう)
  13. 失敗しても構わないから体験し、次に活かそう
  14. 人工知能学会と日本SF作家クラブのコラボ
  15. 読みやすそうなものから手をつけてみる
  16. 機械学習 #ieryukyu_readings
  17. プログラミング #ieryukyu_readings

興味のあるキーワードで見かけた関連事例を意訳紹介してみる

金曜日, 4月 19th, 2013

m_201304191244355170bda39b0ea m_20130419195116517121a416775

実験1/スクリプトプログラミング金曜日のレポート提出を確認しつつ、1年次の登録確認表への押印したり、火曜日のゼミやお茶会で話題について補足してた一日でした。

レポート提出について何かしら応答があったのは現時点で30名。アップロードミスしてる人には折り返し催促してるので、再提出ヨロシク。rsyncコマンド実行時にエラー出てるだろうにと思ったりしますが、引数の書き方によっては「正常に別の所に複製する」のでエラーがでないこともあるか。

ゼミ/卒研では、新4年次の卒業研究テーマを決めるために予稿集/論文集を探させたり、何かしら興味のあるキーワードについて事例調査させたりしています。その中で出てきたキーワードについて例えばこういう事例があるよというのを具体的な調べ方の参考も兼ねて、俯瞰しやすさを意識して意訳してみた実例を示してみています。事例ばかりだけだと悪い意味でのハウツーになりかねないですが、私自身を含めた「いろんな視点/まとめ方」の一例を示すことで背中を見せるみたいなことを意識しています。

例えば、お茶会では新M1のテーマについても話してたのですが、キーワードとしてはIPSJ75(0日目/1日目 /2日目/3日目)やNLP2013(チュートリアル/1日目/2日目/3日目)でのキーワードを交えつつ「オートエンコーダ/要約バリエーション/強化学習状態空間/ベイジアンネット」について意訳紹介(PDF)してみたり。

ゼミ補足としては平良くんがキーワードに挙げた「漫画」事例についての意訳紹介(PDF)と、松田くんがキーワードに挙げた「発言意図」事例についての意訳紹介をしてみたり。

毎回やってる訳ではないですが、比較的前期の間は意訳紹介に限らず何かしら一例を示してみてます。自分自身のその時々のアウトプットを兼ねてw

データマイニング班2回目が終了

木曜日, 4月 18th, 2013

データマイニング班の2回目が終了しました。やっぱり無線LANの調子がよろしくないので、用意してもらったスイッチングハブを使いました。ちょっと悲しいけど、この調子だとデフォルトで用意した方が良さそう。

2回目の中身は、追加の環境設定(emacs使うならauto-complete.elぐらいは入れよう)と、事例紹介を2つした後はひたすらPythonチュートリアル。進捗具合的には来週もチュートリアルがメインですが、中だるみになりそうなので何かオプションを検討中。emacs推奨してるように見られてるっぽいですが、別にそんなことはなくてエディタでプログラミングするなら「インデント&自動補完ぐらいは必要だろう」ということで紹介してます。Aptana Studioとか統合環境使っても良いし。

事例紹介した一つ目はオントロジー辞書を使った興味抽出。Wikipediaから基礎情報+αを収集して、人手で修正するOntolopediaを使って辞書データを構築し、それを使って「通堂」好きな人は部分材料の「もやし」に反応するとか、「どういう関係性に興味を持ちやすいか」を検証してみたという話。

2つ目は、共起情報を使った情報検索への応用。一つの文の中に同時に出現する(=共起する)語を収集して傾向分析することで、直接は書かれていないが関連している語を自動補完して検索に役立てようという話。例えば大学というキーワードで検索すると、関連語として「ゼミ/科目/学科、、、」が得られ、直接大学というキーワードが含まれてない記事も検索できるというもの。

環境構築では、テキストではMacPortsを想定しているのですが、学生らの間ではhomebrewな人も多い用で、「片方で途中まで試した状態のまま別パッケージ管理ツールで試す」みたいなことをやりまくり、/usr/local/lib/, /opt/local/lib/ 等が混乱してて結果的に正常動作しないケースがあったっぽい。ま、頑張ってください。

急遽教室変更した1年次懇談会

水曜日, 4月 17th, 2013

m_20130417225219516ea913564a1

午前中土砂降りの影響もあってもの凄く湿度が高い一日。空調でドライモード付けた方が良かったかというのは帰り間際に思いついたので結局そのまま過ごしてたんですが、帰った後もずっと蒸し暑いままだなぁ。

水曜日の午後は講義が無いことが多く、何も考えずに321室で年次懇談会招集かけた結果見事にブッキング。ごめんなさい。隣の部屋は予想通り他学科も含めて予定が入っていなかったため322室に民族大移動してから開始。

懇談会の具体的な内容はこんな感じ(要認証)。列挙してみると以下のような話題を話して、友人作りの一貫も兼ねて近況報告。

  • 年次長ズの調整
  • 4年間言い続けると宣言した「君の目指す丘」をどう探すかという一例紹介としてネタ出しのススメ(論理的思考の一例紹介)
  • エントリーシート等で要求される質問例紹介
  • 教科書は自分で予習復習に使うもので分からない部分はどしどし質問しようという話
  • 大学への要望・意見確認
  • 学生個々人の近況報告

学生からの近況報告では、「本に書いてる文字は読めるし単語も分かるけど【だから何?】というのが分からない」「微分積分学STが既に何やってるか分からない」とか率直に話してくれたのは嬉しいかな。次はそこを質問するよう行動しよう/何が分からないかを分からないならそこから相談しようとか何かしら「歩き方」を話せるし。自分から行動しよう。

実験1は人数が片方に寄り過ぎているので、金曜日に移動する人を募集中。今の所ゼロですが、誰も移動できないかなぁ。

実験1の1週目が終了し、今学期のNAL研ゼミが開始

火曜日, 4月 16th, 2013

m_20130416183833516d1c19a3a1c

スクリプトプログラミングが2クラスとも終了しました。後はレポートが提出された後の採点ぐらいになります。

実験の進め方自体は「項目毎に解説->演習」を繰り返し、気になる点がないかを細かく確認しているつもりです。が、その場で実際に質問をして来る学生はあまりおらず、実際にはいろんな所でつまづいているものの「質問できない」という学生が少なくないっぽい。「っぽい」というのは個別に確認している訳ではないからなのと、適当なタイミングでTAに質問することはできている学生がいるから。質問せずにそのまま流していると、今後いろんな所で同じつま付きをしてしまうだけなので、もしそういう学生がいたら「自分から質問するように」頑張ろう。何が分からないか分からないならそう質問してください。まずは自分から行動しよう。能動的に動こうとしないのなら、正直大学は向いていないと思う。自分で勉強することをサポートするのが大学なので。目標となる人の真似をするとか、何かしら自分から動いてみよう。言われたことをするだけなら高卒で十分です。

内容的には外れるのですが、演習中に学生のターミナルやエディタでの操作を眺めていると、

  • 「カーソルキーで移動する(ぐらいならCtrl-aやCtrl-eで移動した方が早いのに)」
  • 「ディレクトリやファイル名を統べてて入力する(ぐらいならTabで補完した方が)」
  • 「ほぼ同じ行を手入力/マウス選択してコピペする(ぐらいならヒストリ使ったり、ショートカット使った方が)」

とかあれこれ言いたくなったり、というか言ったりするのは、実際に眺めてみないと分からないことではあるので、少しは演習する意味があるのかな。

2013年度1回目のNAL研ゼミでは、学部生はIR本DM本の輪読をメインとしつつ、テーマ探しを兼ねて興味のある論文収集&論文読み。昨年度は英語本の輪読が「いつの間にか無くなっていた」のですが、今年は(3月から続けているという意味で)ちゃんと続いているらしい。修士はテーマがまだかっちり決まっていない人はその調整してもらいつつ、年度単位での研究計画にブレイクダウンしてもらってます。

[複雑研全体ゼミ補足記事] 4/15, 話題抽出と信頼性推測, 指文字/手話の文字変換

月曜日, 4月 15th, 2013

今年度も複雑研全体ゼミが始まったので、その紹介兼ねてのポストです。基本的には輪読ですが、(a)論文の読み方、(b)下手な発表・分からない発表を聞いて自分の力にするヒント、(c)プレゼンテーション・パターンとあれこれ盛り込み過ぎかなと思いつつ、ゴールは全てを身につけることではなく「内容とプレゼンの2視点について互いに指摘し合えること」を目指してやってみてます。

年度毎に少しずつテコ入れしていますが、今回はプレゼン・ハックを最初から念頭に入れている点、事前に先に挙げた「論文の読み方」を示している点、出展の明示+自分の文章で事前に概要紹介を示せ、という3点を強調してみています。具体的にはこういう指示(PDF)を与えています。

以下は今日の全体ゼミを終えての補足記事です。


今日の全体ゼミ
 ・伊集竜之: 話題抽出と信頼性推測 [1]
 ・新垣健史: 指文字/手話の文字変換 [2]
での関連話を補足します。

[1] Twitterからの話題抽出と元記事の多種性からの信頼性の推測について, 情報処理学会 第75回全国大会, 2013, 4Q-3
[2] Kinectを用いた, 障害者支援を目的とした指文字, 手話の文字変換, 情報処理学会 第75回全国大会, 2013, 1ZB-2


>話題抽出と信頼性推測

Twitterで流れてくるURL(≒ソース)付きツイートに関する信頼性を推定するため、ソースの多種性に着目して試みているという話だったかと思います。

質疑応答時に突っ込んだ「信頼性って高い/低いというだけで示されるものなの?」という点については、[3] を眺めると参考になると思います。信頼性をどのような視点から評価するかについての別例としては [4,5] の「訂正情報」に着目するものがあるようです。

[3] 【Credibility for the 21st Century】1. イントロダクション / 「情報信憑性」研究者やまもとのウェブサイト, http://hontolab.org/research/credibility-for-the-21st-century-1/
 2. ウェブ情報の特徴, http://hontolab.org/research/credibility-for-the-21st-century-2/
 3. 信憑性研究の歴史, http://hontolab.org/research/credibility-for-the-21st-century-3/
 4. 情報ソースの信憑性, http://hontolab.org/research/credibility-for-the-21st-century-4/
 5. 情報ソースの信憑性に係る様々な要素, http://hontolab.org/research/credibility-for-the-21st-century-5/
 6. 「情報ソース = 組織」である場合, http://hontolab.org/research/credibility-for-the-21st-century-6/
[4] 流言情報クラウド:人間の発信した訂正情報の抽出による流言収集, 言語処理学会 第18回年次大会, 2012, A4-2, http://luululu.com/paper/2012/A4-2.pdf
[5] Twitterからの多様な流言訂正情報獲得のための分類器の構築, 言語処理学会 第19回年次大会, 2013, Y2-2, http://www.anlp.jp/proceedings/annual_meeting/2013/pdf_dir/Y2-2.pdf


>指文字/手話の文字変換

元々の出発点は楽器演奏時の手指動作を支援したいというところにあり、その一例としてKinectで指文字/手話認識している事例を読んでみたという話だったかと思います。画像認識的には赤嶺先生、ロボットビジョン的には山田先生の方が詳しいかと思いますが、それを踏まえて私の方では以下のものが見つかりました。

[6] は、「指を曲げることで指先が頻繁に隠れる手の甲側からの推定」を目指しているらしく、楽器演奏時とも問題設定が近いかもしれません。[7] は、古い事例ですが、実時間での3次元手形状推定のために、関節角の可動範囲や依存関係等の制約知識を利用しているようです。[8] は、高速カメラ2台を導入した2次元画像からの3次元形状復元を試みた事例のようです。

[6] 手の甲の特徴点による手指の形状推定モデルの検討, 情報処理学会 第75回全国大会, 2013, 5ZA-2
[7] 手の制約知識を用いた逆運動学解法による実時間三次元手形状推定, 画像の認識・理解シンポジウム, 2005, https://qir.kyushu-u.ac.jp/dspace/handle/2324/5911
[8] 2次元映像からの手指3次元形状復元, 電子情報通信学会技術研究報告. HIP, ヒューマン情報処理, 2012, http://ci.nii.ac.jp/naid/110009482260/

実験1/スクリプトプログラミングを終えて高良研との交流食事会

金曜日, 4月 12th, 2013

m_201304121916185167def27dfa7

実験1全体の説明と、スクリプトプログラミングの金曜クラスが終了しました。昔は必要最小限の文法解説+各自でスクリプト組むスタイルでやってたんですが、ここ数年は幅広く解説+スクリプト読めるようになることを目標とするようにシフトしてます。学生的にどっちが楽しいかは良く分からないけど、もっと/etc/init.d/とか読む方向にシフトしてみようかなぁ。

シェルスクリプトに拘らずにepkg本体読ますというのも面白そうなんだけど、個人的趣味の問題で「オプション課題の例」として紹介するに留めています。portコマンドはbashで書かれてるのね。関数化されてるとはいえ、2年次に4千行強を読ますのは流石に忍びないがw

夕方は、712室での顔合わせ会をしようという高良先生の提案で、高良研+玉城研+NAL研の交流会をすることに。ただ玉城研は都合あえば参加〜というぐらいで結局来れなかったらしい。くぅ〜なる居酒屋だったんですが、一押しは手羽先らしく、これだけで5種類ぐらいの味付けが。とはいえ味付け違うだけじゃやっぱり同じに感じてしまって私自身は3つぐらいでギブアップ。予想以上にJoくんの胃袋が底なしだというのを発見したり。

そんなこんなで食べ過ぎたお腹を引きずって帰ったものの、これ暫くは風呂入るのも寝るのもキツいな。。

ということを書いてたらNLP論文ネタ一覧なるものがRTされてきました。ちらっと眺めただけだけど、出発点としては使えそう?

データマイニング班1回目が終了

木曜日, 4月 11th, 2013

データマイニング班の1回目が終了しました。無線LANの調子が悪くてぶちぶち切断される学生が少なくなく、1台有線LANにしてそこからWi-Fi共有接続とかして凌ぐことに。急場を凌ぐという意味では良いんですが、これが通常実験日で毎回やら無くちゃいけないとなると流石に悲しい。ということで、来週からはスイッチを用意することに。それも「ちょっと違うんじゃ」と思わなくはないですが。

肝心の中身はというと、サーバ環境の情報共有、Mercurial演習(PDF)事例紹介その1(電子マネー顧客分類)までやって終了。電子マネーの事例は、複数店舗でのEdy購買履歴を生データとして、広告配信(=意思決定)を支援するために、ユーザをセグメント分類して特徴抽出したという話。2005年度に産学官共同研究したやつです。協調フィルタリングを欠損値推定代わりに使ってみたら割と面白いクラスタ抽出できたとか、個々の理論を詳細に説明するというよりは「データマイニングの流れ」を意識して紹介したつもり。

学部3年生対象でもあるので、「こういうツール(scikit-learnを予定)が用意された時に、どういうデータをどう処理してどう活かすか」という部分を思考/試行実験できるようになるのがイメージしやすい達成目標かな。データをどう前処理するかについてはそもそも理論が分かってないとという話もあると思うけど、まずは用意された機械学習パッケージを使ってみようぐらいで。

LAN接続が悪すぎたので環境構築Pythonチュートリアルは宿題ということに。

来週は、事例紹介を冒頭で少しやった後、オプション(emacsユーザが多いのでauto-complete.elで補完ぐらいは付けようかと)を先にやってからPythonチュートリアルの続きをやってもらう予定です。