Archive for the ‘研究’ Category

琉球大学・沖縄高専第2回交流研究会を終えて

土曜日, 1月 7th, 2012

琉球大学・沖縄高専第2回交流研究会の参加記録というか実施記録です。第1回の記録はこちら

座長してくれたM1の皆さん、発表者聴講者の皆さんお疲れさまでした!

今回は発表件数も多く、午前と午後に分けた丸一日構成を想定していたのですが、詰め込むことで13:00-18:30の長丁場でしたが午後だけでの実施となりました。体調不良による発表キャンセルも2件あったのですが、質疑応答が長くなりがちだったので結果的にはちょうど良いぐらいの分量だったんじゃないかと。聴講者もちょっと増えて、前回30名弱のところ今回は35名。もっと発表者増やそうとかって話も出てたのですが、(議論深めるなら)個人的には今ぐらいが上限かなとも思ったり。予稿とか参照できる資料があるともう少し増えてもいけそうですが。

終了後に高専&琉大側の先生らで「次回以降」についてちらほら話していたのですが、もうちょっと学生間の交流を増やしたいということと、それが研究の質にも寄与するような形でのイベントとして企画できないかという方向で進みそうです。多分。備忘録として出た意見を列挙してみます。

  • 中間と最終に向けたという意味で今年度と同じぐらいの時期(9月&1月)の実施は多分デフォルト。
  • テーマがまだ固まる前の時点、例えば5月とかに「プレゼン」とか改まった形式ではなくアイデア出しや討論自体を主体とした形での実施はできないか。
  • BBQとかもっと遊び要素入れても良いし。情報倫理でやってるようなグループワークで討論させ、まとめて発表させる形もありかも。(例えばマスターにも参加してもらい)グループ討論で学生間で議論を深めることで「何故こういうテーマをやろうとしているのか」「実現すると何が嬉しい/面白いのか」とかいろんな視点から考え切っ掛けにもなるのでは。
  • 一般的な「研究会」として質を高めるという点も考慮したい。その出発点として、あまり負荷がかからないように予稿的な意味でのプレゼン資料そのもののPDF配布とか。
  • 工学部主催での交流も始まったので、こちらの名前をもう少し工夫して、ある程度スコープを絞った研究会であることが分かるような呼称を考えようか。ゆくゆくはどこかの学会の部会的にオフィシャル化しても良いだろう。でも形式的にやるのではなく中身が大事だよね。

ということで、次年度は多少変わったイベントとしての実施もあり得るかもしれません。
学生からも提案があれば私なり指導教員なりにリクエストください!

P.S.
まだなんらかの結果を出せてない人は気合い入れ直しましょう!

「ロボットは東大に入れるか」キックオフシンポジウム参加記録その2

木曜日, 12月 15th, 2011

昨日の記事では第1部にしか触れることできなかったので、忘れる前に第2部についてのレポートです。

人工知能やロボットといったテーマについて研究者らをインタビューしていたらこんなことになったという、小説家の瀬名さんによる軽快な司会裁きでの進行となりました。いろんな種から膨らませつつ種同士の絡み合う様子まで含めてとても面白かったのですが、もう少しテーマ絞って時間くぎって討論的に深められるとベターだったかなという上から目線での感想になったり(ぉぃ


>瀬名さんからの最初のお題
(1)これまでの題材と異なる、東大入試ならではの面白さは何か。
(2)東大入試に取り組むことでどういうブレイクスルーが起き、それがどのような変化をもたらすか。
(3)ロボットで解けるとした時、教育はどうあるべきか。

これらの題材を出発点として様々な主張/期待といった話が膨らんでいったのですが、kosuke64さんによる記録に詳しいので、ここでは個人的に興味深かった点について整理する形でメモを残しておきたいと思います。

メモの都合上、それらしいことを話されていた先生方の名前を付けていますが、私の解釈なので間違ってたらごめんなさい。

ここでは2つのトピック、
 ・論点1:必要な表象を全て記述できるのか?
 ・論点2:情報爆発への対峙の仕方に「常識」で絞り込む?
について整理してみました。
どちらも問題提示として重要な issue があるんだという意味での紹介であって、それらをどう解決するのかについては「やってみないと分からない」という立場での紹介です。こういう問題に私自身立ち向かおうという意思表明を兼ねて。



>論点1:必要な表象を全て記述できるのか?

松原先生:  チェスも最初はとても人間らしさを強く含んだ問題だと思っていた。今でも  そういう部分はあると感じているが、一度「盤面評価」等の形で記述できて  しまうと後は計算機パワーの問題が主要因になるようになってしまった。高  速化/効率化等まだまだ議論の余地は多くあるが、計算機パワーでなんとか  なってしまいそうな状況。それに対し、東大入試で求められる多様な常識は、  それをどう記述すれば良いのかすら分からない段階。 新井先生:  細分化されたことで意識にも登らなくなっている観点やタスクが数多く見逃  されているはず。それを効果的に見える化できるように、適度な粒度・サイ  ズに分割しやすい題材として東大入試を選んだ。これをオープンな開発基盤  として提供する事でオールジャパンのアンブレラとして他分野の融合を図り  たい。センター入試に5年、東大入試に10年と区切りを付けて遮二無二取り  組むことで shake に繋がると思う。 安西先生:  確かにやってみないと分からないことはあるので、これまでになかった新た  なアイデアがでてくることもあるとは思う。いずれ。でも、これまでも様々  な表象を記述する議論であったり、データベースとして格納するといった議  論はずーーーっと昔から数多くやられているが一向に解決する様子が見えな  い。ロジックだと記述論理等があるがそれで本当に全て記述できるのか。(  経験から学ぶ)フィードバック系だと様々な系をくっ付けることは可能だが  それをどう接続するのが適切なのか。ここまで死屍累々な状況を鑑みると、  オールジャパンで取り組んでも全部が全部ダメでしたで終わってしまったり  しないか。 新井先生:  そこまで正面から対峙する必要(全ての表象を記述する必要)があるのかと  いう観点もある。例えば、学生を見ていると「経験から学び、抽象化してそ  れを次に活かしているとは*思えない*事例」も少なくない。

>論点2:情報爆発への対峙の仕方に「常識」で絞り込む?

安西先生:  初めて対峙する際、例えば初めてある問題について学ぶという時点では丁寧  に文章を噛み砕いていくしかない。それこそ自然言語処理のように。だけど  慣れてくるにつれてキーを簡単に見つけ出せるようになる。要約みたいなも  のかもしれない。そこに研究テーマはあるのか。 新井先生:  昨今どこにでも情報爆発は見られてて、それに対する解決策は「気の聞いた  ように処理してあげる」しかないように思う。今の若い世代の人らは体感的  にそういう問題意識を持っていて、これを解決しない事にはこれ以上の進展  が無いだろうという直感がある。身体性が持つある種の感性や感覚が渾然一  体となっている常識を解決すること自体が求められている。 安西先生:  研究としてやるとすると、コンテキスチュアルからキーを見つけるなりして、  そこから検索に繋げるような感じかもしれないが、それはどう実現するのか。

「ロボットは東大に入れるか」キックオフシンポジウムへの参加記録

木曜日, 12月 15th, 2011

ロボットは東大に入れるかのキックオフシンポジウム(公開講演会)に参加してきました。備忘録としてのメモや考えさせられたことのメモです。

参加するにあたって個人的に考えていたこととしては、(1)用紙上の領域認識(どこが問題文で、図表があるならどういう区切りになっててどう対応しているかの識別等)、(2)領域毎の解釈(問題理解、問うてる対象推定、図表の言い表している内容理解等)、(3)手持ち材料を用いた戦略立案(どのように解くかを検討・推定等)、(4)最適戦略に基づいたor各種戦略に基づいた回答毎に妥当性判断、といったサブ問題に分割されるのかなと想像しての参加でした。

シンポジウムで得た情報から判断する限りでは、ある程度問題の分割方法を想定している部分はある(最終的には評価用プラットフォームとしてオープンなAPIを提供するっぽい)ようで、個別に詳細細分化して研究されている事柄を融合して総合的に取り組むことを促進しやすい触媒としての場を目指すというような趣旨と理解しました。実際、NTCIR RITEのような形でコーパスと開発用API(?)を公開しつつあるようですし。そういう意味では参加する前に想像してたことと大差がありませんでした。

一方参加して気づかされた点もあり、「東大入試」を選択しているのはただの事例だと思っていたのですが、他大学ではダメという主張らしい。選択した理由は、(a)他大学のようにひねくれた問題が少なく、比較的素直な問題であること。(b)一般的な常識があれば誤読することがないようにコントロールされた日本語で記述されていること。といったことで、東大入試を選択したらしい。この「細分化されまくってる多分野の融合」と「一般的な常識の実現」というトピックが一つの主題になるらしい。問題細分化については、取り組みやすくなるという一方で見逃してしまう現象/知見なりが多々あると思うので、積極的に融合できるように「そのための適度なサイズのタスク」というのをうまく設計しようというのは良い試みだと思います。

飛び火した話題としては、入試を含めた教育の在り方なんて話題もありましたが、そこら辺は個人的にはあまり興味ないかな。「人間らしさ」という点では興味はありますが、コンピュータが実現できたら人間らしさが危うくなるとかいう訳じゃないし。

あと、前々から思ってたことなんですが、いわゆる記号論なりで事象を表記するというアプローチ自体が妥当なのかというニュアンスの話題も出てきてたのが嬉しかったです。記述できないことは実装できない、という主張自体に個人的には疑いを持っているので、何かしら新しい観点を主張できるようになりたいものです。

以下はプログラム毎の備忘録用にメモった内容です。
第2部はバッテリー切れのため手書きしてたのですが、後でサマリする予定です。
誤解も多分に含まれると思うので、ご注意ください。
→別記事として書きました。


目次
主催者挨拶 (坂内正夫・NII 所長)
 <第一部> 講演会
基調講演 (松原仁・公立はこだて未来大学) 人工知能のグランドチャレンジ -チェス、サッカー、クイズから東大入試へ-
「ロボットは東大に入れるか」プロジェクト概要説明(新井紀子・NII)
「人工知能にとってなぜ大学入試はチャレンジングか」(稲邑哲也・NII)
「知識を問う問題にコンピュータはどれだけ答えられるか」(宮尾祐介・NII)
 <第二部> パネルディスカッション
・「知性と知識のはざまで」司会 瀬名秀明(作家)(後でサマリ予定)
他の参加記事


主催者挨拶 (坂内正夫・NII 所長)

情報に関わる問題はもう既に解決し尽くした?
GoogleやYahoo!に任せれば解決できるのか?
ブレイクスルーを起こす難問として何があるか。
研究戦略室:「ロボットは東大に入れるか」
 Watsonの2番煎じ?
 どうブレイクダウンするか。どのような難問で構成されているのか。
  面白い切り口(ブレイクスルーに繋がる種を含んでいる)という触感。
  プレ実験的には最高で58点程度取れたグループもある。

物議を醸すようならむしろ醸したい。
 コンピュータでできること/人間の知性に近づくこと/得意不得意
  e.g., もし、東大はいれるようになるなら、
  そういう入試問題で選抜して良いのか。人間にしかできない問題?

情報学研究所
 オープンプラットフォームとしての役割
  大学/企業/etc.の垣根を越えて団結して取り組むためのアクション。
  アイデアを出すことも大切だが、目標を定め若い/若々しい人材を引きつける。
  共通の問題をアカデミアが掲げ、企業らも巻き込んでその問題に取り組む。


<第一部> 講演会

基調講演 (松原仁・公立はこだて未来大学) 人工知能のグランドチャレンジ -チェス、サッカー、クイズから東大入試へ-

AI
 人工物に人間のような知能を持たせる(e.g., 鉄腕アトムの実現)
グランドチャレンジ
 それ自体は直接役に立たなくても、象徴的な目標。
 その達成を目指すことで大きな技術的進歩が期待されるもの。
  e.g., アポロ計画

複数のグランドチャレンジが並行して進んでいる中での「東大入試」の位置付け
チェス(マッカーシー「人工知能のショウジョウバエ」)
 AIで最初のグランドチャレンジ
  →シャノン、チューリング、、、探索手法の技術進展に大きく寄与
  1950,60年代:最初は「人間の真似(見込みの高い少数の手だけを読む)」方式
   将棋の羽生さん等専門家は「直感で数手が思い浮かび、それを検討する」
  1970年代:「力任せ」方式(ルール上指せる手は原則全部読む)
  1980年代:スーパーコンピュータ:チェス専用コンピュータ
  1986年:CMU Deep Thought 1秒間に70万手読む→プロレベルに
  1989年:IBMプロジェクト開始
  1990年:世界チャンピオンのカスパロフと2戦2敗(大差)。
  1997年:6戦2勝1敗3分け(1秒間に2億手読む。スパコン+専用コンピュータ約500台)
  現在はPCでもコンピュータの方が強い。もうすぐスマートフォンレベルでも?

他のゲーム
 チェッカー:2007年解明(理論的に引き分け)
 オセロ:1997年世界チャンピオンを破る
 将棋:2010年女流プロを破る。世界チャンピオンまで後一歩(数年)。
 囲碁:世界チャンピオンまであと十数年?
  モンテカルロ法でアマ4段程度

サッカー
 チェスに変わるグランドチャレンジとして1990年前後に模索。
  北野編「グランドチャレンジー人工知能の大いなる挑戦ー」。
  この時点ではまだサッカーは出ていなかった。
 1993年頃:サッカーに絞り込む(ロボットJリーグ)
  国際化を指向して「ロボカップ」
 1995年:世界的に構想発表

何故サッカーか
 団体スポーツであること。
 時々刻々と状況が変化すること。
 必ずしも思った通りには進まないこと。
 わからない情報を補う必要があること。
 (難しいながらも)なんとかロボットにチャレンジできそうなこと。
 世界で一番人気のあるスポーツであること。

ロボカップ/レスキュー/アットホーム

クイズ ジョパディ!
 アメリカで数十年続く人気クイズ番組。
  基本的には知識を問う問題(自然言語)。
 回答は単語(東大入試よりやさしそう)
 強いチャンピオンは英雄扱いされている
 IBMはディープブルーに続くグランドチャレンジとしてジョパディ!制覇を目指した。
 自然言語処理、自動検索、ゲーム理論

ロボットは東大に入れるか
 東大入試で合格点を取ることを目指す。
 「人工頭脳」プロジェクトと称している。
 自然言語処理、物理モデル、推論など。
  知識を問う問題よりも推論を問う問題が多い?
 クイズよりはかなり難しい。
 東大問題は比較的素直なのでコンピュータ向きかもしれない。(京大は癖があるのでその次?)
 いつか本当のロボットが人間と一緒に受験して欲しい。
  妄想:HB鉛筆を折らずに書けるか/落とした時に手を挙げて,,,
 成功すると
  (1)人工知能の進歩が目に見えて分かる
  (2)事務のある程度がコンピュータで代行できる
  (3)入試問題の難しさの基準ができる
  (4)東大入試の幻想が無くなる?


「ロボットは東大に入れるか」プロジェクト概要説明(新井紀子・NII)

目標
 実際のテスト用紙→データ化(アノテーション付き)→ロボットへの入力
目的
 「東大に入ること=究極の知能」*ではない*。
 素材として興味深い。
 口頭試問ではなく、テキスト、画像、音声によって提示される。
 人とのインタラクションは無い。
 試験問題はなるべく誤読が生じないように、コントロールされた日本語で記述されている。
  Web上のテキスト等とは異なる性質。
 試験問題には必ず正解がある。
  数学理科だけでなく倫理社会国語でも正解がある。
   e.g., 心の葛藤を問う問題でも「合意できる正解」がある。
 健全な常識と論理を持つ18歳であれば、
 コントロールされた日本語で書かれれば解けることが期待されている。
  *比較するための材料として使われる要因。

特性/特質
 膨大なデータがあれば(投入できれば)解決できる問題でもない。
 (問題を解く)系があれば十分というタイプの問題でもない。
 現状:人間の平均点にも遠く及ばない。
 何が難しいのか。
  知識/常識/演繹の中でも「常識」が厄介。
  記憶に格納されてる知識や演繹だけでは不十分。
  【身体性が持つある種の感性や感覚、それが醸し出す常識が渾然一体となっている】

科学に提供されている言語:数学の言語(解析、代数、確率統計、論理、確率統計、、)
 この言語で書けるならコンピュータに搭載できる。
 逆に書けないなら、搭載できない。
 常識や身体性から来る感覚をうまく記述する方法を見つける必要がある。
 科目:分割可能性
  国語:論説文読解/小節読解/詩歌/古文/etc.

問題の例
 英語
  ある一家の一日。父と娘に関する語りを説明。それに相応しいイラストを選択する問題。
  何故「イラストによって表象され、それを理解できる」のか。

従来のアプローチ:ターゲットを絞り込む
 分野を細分化して行くことに繋がったが、そろそろ融合する必要が無いか。
 融合に必要なのは「しましょう」というかけ声ではなく、
 適切な問題設定が提供されること。
 「東大入試」には適切なサイズの問題が渾然一体となった形で提供されている。

問題の一部は解けてきている部分もある。
 口述を聞き取る能力等。
 また、適切な論理記述に変換さえできれば多くの問題が解けると言われている。
 ただし、普通の日本語で書かれた文章をどうやって変換するかはまだ分からない。

問い:「優秀さ」はプログラミング可能か?
「東大入試に迫るコンピュータから見えてくるもの」


「人工知能にとってなぜ大学入試はチャレンジングか」(稲邑哲也・NII)

自己紹介:Human Robotインタラクション。
人工知能?ロボット?
GOFAI: Good Old Fashioned AI
 閉じた世界でしか通用しない知能。
 反省点
  シンボルの情報処理だけでは実現不可能。
  曖昧であるシンボルの意味・解釈を解決せねばならない。
 新しい潮流
  身体性に根付いた情報処理を!

現状のロボット研究はどこまで成功しているか?
 部分的なタスクに限定すれば成功。
 GOFAIが目標としていた問題には到達できていない。
  曖昧な実世界情報の解釈はある程度可能に。
  高次レベルの知能の層と、身体(センサ/アクチュエータ)の情報処理層との結ぶ橋が無い。
 抽象度の高低と橋渡し
  GOFAI> ??? > Enbodied Robotics
  細分化していく一方。

二つの流れが合流して初めて解ける問題の例
 国際数学・理科教育動向調査(TIMSS)
  定規にバターで固定した豆を用意。片方から温めるとどの順番で豆が落ちるか。
  小学4年理科:正解率日本92%、世界57%
   温めるとバターが溶ける/温められる場所から/etc.

実体験に基づく論理的思考が必要な問題の例
 自転車で転び、袋に入れた食塩をこぼしてしまった。
 集めてビニール袋に戻したが砂や落ち葉も混ざった。
 食塩だけを取り出す方法を順番に書き、その理由も書きなさい。
  教科書に書かれていることの理解には「実体験との接続」が重要。
  「大学入試」への第一歩(?)

単に高得点を取るだけで良いなら
 暗記科目タイプをチョイス。
 が、得点を取る機能ではなく、実世界を理解する知性への挑戦。
  主に物理・地学に集中する方針。

骨太のテーマ
 画像理解と自然言語処理の統合。
  曖昧性解消のための画像理解と自然言語理解の相補的な統合<。
  図と文章からの物理モデルの再構成。
   相補的に統合して考える力。
    画像から得られる意味のグラフ化。
    自然言語から得られる意味のグラフ化。
    双方のグラフ構造が整合性の取れるように解釈を調整。
   古典:SHRDLU(課題点:曖昧な実世界情報の取り扱い/etc.)
 物理現象のモデル化と予測。
  3次元モデルの構築と物理シミュレーションによる将来予測。
   数秒後/数時間後/数年後を予測

非常に難しい問題(あきらめる?)
 記号化されていない情報を用いて論理的な推論を必要とする問題
  月面クレーターの写真、影の大きさ、、、からの推論

実世界の経験に根付いた問題
 「東大入試」からのスタートは、発達順序とは異なるが、こちらからのスタートも必要。


「知識を問う問題にコンピュータはどれだけ答えられるか」(宮尾祐介・NII)

自然言語処理:検索、自動翻訳、対話システム、、
 人間の言葉を理解するコンピュータを作ることを目指す学問。
 入力(言語)と出力(言語)の間にどのような「計算」が行われているのかを明らかにしたい。
 それが「知能」ではないか。
  全ての科目は基本的に自然言語で出題される。

東大入試
 知識を問う問題=教科書や参考書を見れば答えられる問題。
  解説文を読み「最も適当なものを、次のうちから一つ選べ」
  一般的な常識を持っている人なら教科書/参考書を見れば答えられる。
  とはいえ、コンピュータには答えられない。
  得意なのは「丸暗記」であって「記憶」ではない。
   人間に取って意味のある「記憶」とは?
    言葉そのものではなく、言葉が表す内容(=意味、知識)。

言葉から意味、知識へ
 例
  1)犬に風邪薬を飲ませると貧血状態になる
  2)ビーグルが風邪薬を食べたら病気になる
  言葉として一致しているのは「風邪薬」のみ。
  対応関係から「意味が同じ」と考えられるのは何故か。

知識を問う問題とは?
 記憶していることと問われていることが「意味的に一致しているかどうか」を認識する。
 人間は無意識のうちに認識している。
  コンピュータにとっての「知識を問う問題」
   記憶との一致ではなく、意味が一致しているかを問うところがチャレンジング。

含意関係認識
 2つの文の間に含意関係が成り立つかどうかを判定。
 含意関係:ある文が正しいとした時、もう一方の文が正しいと言える。
  自然言語処理での最近のホットトピック。

NTCIR:国立情報学研究所が主催している国際ワークショップ
 検索/翻訳などの情報アクセス技術の評価のための共有データを提供。
 毎回、複数のタスクを設定。
 NTCIR RITE:新聞から抽出した二文について含意関係が成り立つかを判定。
 大学入試にチャレンジ
  IBM東京基礎研究所/CMU/京都大学/東北大学/北陸先端大学院大学/JUCS

データの作り方
 センター試験から問題抽出→選択肢抽出→Wikipedia検索→同単語を含む文を選択
 現状での精度
  IBM-1で精度72.2%、F値62.6%
  平均精度60~70%
   試験の正答率は、20~60%(精度と正答率には高い相関が見られた)
   鉛筆転がし(25%)よりは大分良い

含意関係でできることはごく一部
まだ解けない問題
 倫理の例
  自我同一性を見失っている心理状態についての語り文。
 東大入試問題
  **について2行で説明しなさい。
   マークシート式か記述式かの違いは本質的ではない。
  **について役割や意義を時期区分しながら説明しなさい。
   関連知識の検索。
   出題意図の認識。
   回答方式の指定の認識。
   →関連する知識を統合して回答を作りだす。

「知識を問う問題」の先へ
 自然言語→意味・知識
 出題意図/含意関係/知識検索
 シミュレーション/数式処理・理解/知識統合/時間・空間の推論/常識/因果関係の認識・推論/etc.
  その先には何があるのか。


<第二部> パネルディスカッション

「知性と知識のはざまで」司会 瀬名秀明(作家), 安西祐一郎(日本学術振興会)、喜連川優(東京大学)、松原仁、新井紀子

(後でサマリ予定)


他の参加記事

「ロボットは東大に入れるか。」シンポジウムに行ってきました。 by ロボコンマガジン
シンポジウム「ロボットは東大に入れるか」参加記録 by Uehara-monologue
「ロボットは東大に入れるか」 by ガジェット通信
「ロボットは東大には入れるか」の最初のシンポジウムに行ってきた。 by IHARA Takehiro
「ロボットは東大に入れるか」 by ニコニコニュース
「ロボットは東大に入れるか?」ロボットが東大合格を目指すプロジェクトが発足(国立情報学研究所) by ガラパイア
「目標は東大合格」国立情報学研が人工知能プロジェクト by 朝日新聞社
ロボットは東大に入れるか – 国際的な人工頭脳研究プロジェクトが開始 by マイナビニュース
NII、「人工頭脳プロジェクト」キックオフシンポジウムレポート ~ロボットは東大に入れるか by 森山和道の「ヒトと機械の境界面」
2021年に東京大学“合格”を目指す:チェス、オセロ、クイズの次は「東大」だ!! ――NII「人工頭脳プロジェクト」始動 by @IT MONOist

[upload] 研究室紹介用スライド

水曜日, 11月 16th, 2011

研究室紹介時に用いたメインスライドを「仮配属希望者へ」にて公開しました。
その他の関連情報(私がどういうことを考えているのか)としては、

NAL研日誌の一覧

も参考になるでしょう。何かあればいつでも来てください。

Installing libsvm-3.1 for Python on Mac OS X 10.6

木曜日, 11月 3rd, 2011

libsvmをコンパイルして「その場で動かす」だけなら README に書いてある手順で進められますが、実用的には好きな場所で実行できるようにしたい。ということでその手順です。

【蛇足コラム】
svm-trainとかの場所をos.path.exists()で確認するようなスクリプトになっているので絶対パスで指定せざるを得ないのだけど、cdll.LoadLibrary()のように環境変数か何かで指定されたPATHを参照して対象ファイルが存在するかを判断するようなライブラリって無いんだろうか。
ConfigParserあたりで変更箇所を一括管理する形で書くのも良いかもしれないけど。

環境構築手順

  1. libsvm本家サイトからソースをダウンロード。
  2. コンパイル。
  3. > tar xvfz libsvm-3.1.tar.gz
    > cd libsvm-3.1
    > make
    
  4. 実行ファイルを ~/bin/libsvm/ に、ツールを ~/bin/libsvm/tools/ にコピー。(要PATH設定)
  5. > mkdir -p ~/bin/libsvm/tools
    > cp svm-predict svm-scale svm-train ~/bin/libsvm/
    > cp tools/*.py ~/bin/libsvm/tools/
    
  6. スクリプトのパスを修正。
  7. > emacs ~/bin/libsvm/tools/easy.py
    is_win32でWindowsか否かに分けてパスをしている箇所で、
    svmscale_exe 等のパスを絶対パスで指定。下記は記入例。
    =====begin(easy.py)=====
    svmscale_exe = "/Users/tnal/bin/libsvm/svm-scale"
    svmtrain_exe = "/Users/tnal/bin/libsvm/svm-train"
    svmpredict_exe = "/Users/tnal/bin/libsvm/svm-predict"
    grid_py = "/Users/tnal/bin/libsvm/tools/grid.py"
    gnuplot_exe = "/usr/local/bin/gnuplot"
    =====end=====
    
  8. バイナリの動作確認
  9. > svm-train
    等と引数無しで実行した時にエラーが出なければ
    (使い方が出力されるだけなら)OK。
    
  10. Python用 shared libraryのインストール
  11. > cd python
    > make     #../libsvm.so.2 が作成される
    > sudo cp ../libsvm.so.2 /usr/local/lib/
    
  12. Python用ライブラリ(スクリプト)の編集
  13. # ライブラリをインストールする場所の確認。
    > python -c "from distutils.sysconfig import get_python_lib; print get_python_lib()"
    # 以下は「/Library/Python/2.6/site-packages」と出力された場合の例。
    > emacs svm.py
    「if sys.platform == 'win32':」後でパスを指定している箇所にて、
    以下のように変更。元のインデントを保つように注意。
    =====begin(svm.py)=====
    #libsvm = CDLL(os.path.join(os.path.dirname(__file__),\
    #                '../libsvm.so.2'))
    cdll.LoadLibrary("libsvm.so.2")
    libsvm = CDLL("libsvm.so.2")
    =====end=====
    
  14. Python用ライブラリ(スクリプト)のインストール。
  15. > mkdir /Library/Python/2.6/site-packages/libsvm
    > cp svm.py svmutil.py /Library/Python/2.6/site-packages/libsvm/
    > touch  /Library/Python/2.6/site-packages/libsvm/__init__.py
    
  16. Python用ライブラリの動作確認。
  17. > python
    >> from libsvm import svm
    でエラーが出なければOK。
    

参考サイト: Installing libsvm-3.0 for Python on OSX 10.6

琉球大学・沖縄高専第1回交流研究会を終えて

水曜日, 9月 21st, 2011

琉球大学・沖縄高専第1回交流研究会の参加記録というか実施記録です。

皆さんからの協力を頂けたことで無事に終了することができました。ありがとうございました!

もともとの切っ掛けは、山田先生と高専側の玉城先生らが「琉大工学部」と「沖縄高専」間での連携した研究協力なりを目指して活動しましょうという連携委員になったのがフラグで、互いに複雑系(工学)という近い分野での研究していることもありまずは合同ゼミとかやってみませんかという話でした。そこからなかなか話が進んでいなかったのですが、先日の「複雑系科学と応用哲学」沖縄研究会第1回大会(1日目2日目3日目)でお会いした際に「今度卒研生らの中間発表やりませんか!」という話になり、日程調整や趣旨の調整、プログラム検討が始まり、今回の交流研究会という形での実施となりました。

結果としては、予定していた発表人数より減ったこともあって全体を圧縮して午後のみのプログラムでの実施で、各研究室関係者だけでなく「ちょっと興味あるから」という理由での参加もあり、合計30名弱?が集まりました。発表時間の設定も合計15分という割には討論長めの設定(発表7分、質疑8分)で、加えて最終セッション終了後のフリーディスカッションでも討論が絶えないぐらいに盛り上がりました。これぐらいならもう少し余裕持たせて午前中からやっても良かったかもしれない。一方、長すぎるとだれてしまう側面もあるので物足りない感があるぐらいで終われたのでちょうど良かったかもしれない。懇親会にも当初確定していた人数を大幅に超える学生が参加してくれたので、反省も含めてとても良い機会になったのではと思います。個人的には大成功ですね。

個人的に感じる反省点としては「琉大組の時間的ルーズさ(申込み〆切大幅に越えるとか、当日ぎりぎりまで来ないとか)」と、「発表練習不足(時間大幅に越えるとか、ストーリーの練り具合が不足していて主題が分かり難いとか)」といった所です。個々人で感じた点も少なくないと思いますので、今後に活かしましょう。

以下、発表時のメモ+質疑応答一覧です。
青字は當間が個人的に疑問に思った内容、赤字は実際に行われた質疑応答のサマリです。
私の解釈違いやメモれなかったのもあるので注意ください。


<目次>
セッション1: 座長: 与儀涼子(琉大修士2年)

セッション2: 座長: 名嘉真之介(琉大修士1年)

セッション3: 座長: 下地竜雄馬(琉大修士2年)


セッション1: 座長: 与儀涼子(琉大修士2年)

運転者特性を考慮した自動車専用道路速度モデルの構築、安里順貴(沖縄高専本科5年・玉城研)

高速道路無料化社会実験
 実施前:交通量増加による渋滞が懸念
 実施後:沖縄自動車道:宜野座〜金武、50%程度増加
  運転の苦手な人が合流した時に明らかに交通の流れが悪くなる

目的:運転者特性を考慮した交通流シミュレーション→交通流への影響
 交通量調査
 調査データ→解析モデルに組み込む
 運転者特性要因を組み込んだ場合の変化、無料化終了後の状態との比較
ビデオカメラによる撮影
映像から車両速度と車頭間隔のデータを取得


・運転者特性はどのように調査する?
・運転者特性として挙げられる項目は何?
・取得したグラフの見方は?



Q: 交通流には様々なモデルがあると思うが、セルオートマトンを選択した理由は?
A: 引用文献の中でも採用されているため。
Q: 他にどんなモデルがあるかは調査している?
A: OBモデル。最適速度モデル。車両速度から前方車両との適切な車両間隔を
 導くモデルがあるが、2車線以上では車線変更の概念考慮が困難。
 CAは車両変更等のルールを組み込むのが容易。

Q: 運転者特性がどういう影響を及ぼすのかという研究?
 影響を抽出できたとしてどう活かすのか。
A: 勉強不足で具体的な応用例はまだ考えていない。これまでは単に
 平均的なデータから交通流の解析が行われているが、運転者特性を
 考慮することでより具体的な結果を得られると考えている。


格子ボルツマン法を用いた自動車排ガス遷移解析、稲福智秀(沖縄高専本科5年・玉城研)

自動車排ガスによる大気汚染問題
排気ガスがどのような過程で拡散するのか
 これまでは発電所からの排出といった固定発生源を対象とした解析
 →車両の動きに合わせて発生源を移動させながら解析
  目的:最適な道路形状設計。最適な拡散を導く設計。

格子ボルツマン法による排気ガス拡散モデル+CAによる交通流モデル


・個別に移動体を考慮することのメリットは?
・どのような道路を設計したいから「個別に移動体を考慮」する必要性がある?



Q: どのぐらいのスケールのシミュレーションを想定しているのか?
A: まだ考えていない。これから検討する。
Q: 格子ボルツマン法は局所的なシミュレーションには向いていると思うが、
 沢山の移動体を考慮したシミュレーションなら
A: 局所的に行いたいと考えている。例えば高架橋が存在する道路中で、
 その近辺でどのような排気ガス拡散が行われているかを考えている。
 必要な格子数についてはこれから検討。

Q: 前実験で数千ステップとかでてたけど、あれを終了するまでに
 どのぐらい時間がかかる? 使った格子数とかは?
A: ノートPCで5〜10秒程度。約900個の格子点数。
Q: リアルな世界ではどのぐらいのスケールをシミュレーションしていることになる?
A: 現実でどのぐらいの量を解析しているのかも含めてまだ検討中。
Q: 他の研究でこのぐらいのスケールでやってるとか何かしら知見があれば、
 それをベースにどのぐらいまで現実的な時間で処理できる基準があると良さそう。
A: ありがとうございます。

Q: 研究目標に車両拡散ガスの拡散過程を評価した上で最適な道路形状を
 設計するとあったが、より拡散しやすいように設計する?
 どう設計するのが目的?
A: 現段階ではまだ未検討。

Q: 局所的なシミュレーションをすることのメリットは?
A: 交差点や100mぐらいの空間を考えている。ボルツマン法で計算量を
 考慮した現実的な規模がそのスケールに足りない場合は、
 何らかの方法で拡張することを検討する必要がある。


GPGPUによる爆轟衝撃波解析モデルの並列化、清末尊(沖縄高専本科5年・玉城研)

物体に衝撃波を与えた時の物体内部における衝撃波伝播の解析
 粒子法は計算コストが高い
  PSH法をGPGPUで並列化

ベクトル加算による並列化計測
 要素数1万超あたりからCUDAがベター


・ベクトルの要素は固定? だとすると何らかのキャッシュが起きてたりしない?
・どう並列化する? 並列化で必要になる演算パターンでの検証は?



Q: 衝撃波伝播の影響についての研究のようだが、具体的な対象は?
 これは何に役立つ?
A: 先行研究ではガラスの破砕が対象。そこで挙げられていたそれ以外の対象に
 ついて明らかにしていく必要があると思う。
Q: 爆破レンジって具体的にどのぐらい?
A: 語弊があるかもしれないが、先行研究では水の中においた瓶に衝撃波を
 与えた際の破砕が対象。

Q: 粒子の一つ一つに影響範囲があり、その範囲内に爆風なりが当った際の
 影響をシミュレーションする?
A: はい。
Q: 粒子1個1個の範囲を並列に処理する? 並列化の手法はどうやる?
A: 先行研究を調査中で具体的にはまだ決まっていない。
Q: 爆破は複数の粒子が同時に動く? 一つの粒子が動いて他が影響を受けていく?
A: 外からの衝撃波なので、後者の方が近いと思う。

Q: 中の粒子がどう運動するのかが現時点で分からないからやるということ
 だと思うが、中で何が起きてるか分かると何が嬉しい?
 爆破レンジ(箱の中に入れたリンゴ。形は保たれているが中は崩れている
 状態。破壊具合の解析の一端)が念頭にあると思うが、何が嬉しい?
 そういうことまで考えるようにしよう。


注視特性を考慮した構内広告評価モデルの構築、濱元秀人(沖縄高専本科5年・玉城研)

広告をより効果的に見せる方法はないか
 CAで広告認識度を評価する事例
 歩行者の視界はあまり考慮されていない
 →歩行者の行動モデルを組み込んだ評価モデルの構築
  CA+心理的ストレス

心理的ストレス
 目的紙ストレス:目的地との距離(線形)
 存在ストレス:他歩行者等との距離(円形)

歩行者特性:電子機器使用制約を持たせる


・広告評価モデルとは、広告を見たか否かを判断するモデル?



Q: CAでの移動速度係数を加えるのと、電子機器使用導入とはどのような差がある?
A: 電子機器使用により視界が狭まる。狭まる人を導入することでの影響が一つ。
 加えて広告に3種類を考えていて、上にあるのは見られない、
 下にあるのは見やすい、ということを考えている。

Q: 評価の際に、絶対的な評価なのか相対的な評価なのか。何人の人が着目する
 のかといったカウンターなのか、広告価値としていくらなのか。どちらなのか。
A: 絶対評価の方。
Q: 絶対評価だと確かに様々な要因を考慮することに意味があると思う。
 相対的な方であればあまりそこは考えなくても良さそうに思った。

Q: 先行研究で作られてるモデルの評価はされている?
 心理的ストレスを考慮したモデルが現実世界でどのぐらい妥当?
A: そこの評価はされていない。
A: 定量的な評価は行えていないが、定性的な評価は終わっており、
 妥当性は十分あると考えている。

Q: 研究目的で「手元を見ている」という状況を想定されているが、
 視野角が下方向に向いている確率が高いという状況を考え、
 広告位置を上中下で評価モデルを構築する。それで何を評価したことになる?
 カウンターは分かるが、シミュレーションする前から自明ではないか?
 これで何を明らかにしたい?
A: 交通流に変化が現れるということ、下にある広告の評価が増えることも
 予測している。交通流に変化が現れるなら、単純に下方向だけが増える
 だけではなく、上と横方向についても変化がある。
 どこが注目されるかが変わってくる。


環境の違いによる仮想生物の形態・行動共進化への影響、仲宗根翔子(沖縄高専本科5年・佐藤研)

生物の進化=自然選択+突然変異
 環境の与える影響の強さはどのぐらい?
  重力と摩擦の影響によって仮想生物の振る舞いや形態が
  どのように複雑化・多様化するか


・環境の影響を調べるというのは何を調べる? 重力と摩擦は環境要因の一つ
 ではあるが、適応度等のGAオペレータも環境ではない?
・交叉での不足分を0で補うことの影響は?
・移動距離を適応度とすることの影響は?
・重力と摩擦の組み合わせを考えて傾向観察するのは良いが、
 これは環境の与える影響を考察することになるのか?



Q: 移動距離で評価しているが、足の動かし方は?
A: まだ決めていないが、稼働域や力は遺伝子に組み込むことを考えている。
Q: 似たような事例は良くあると思うが、足の数や長さに着目したのは何故?
A: 着目している訳ではなく、今決まっているのが個数という話。
Q: 他の研究とは違うと主張したい部分は?
A: 重力と摩擦の両方を変更するのがポイント。
 より現実的な環境に近づけるのかなと考えている。

Q: ハル・クレメントの「重力の使命」ロバート L.フォワードの「竜の卵」。
 サイエンスフィクションだけど、読んだ方が良い。
 小重力の中でどういう生物が生きているかという話。
Q: 仮想の話とは別に、今回の結果をどこに繋げるのか?
 そこを考えておかないと昔の研究と一緒だねという話になりそう。
A: ありがとうございます。

Q: 先行研究でも適応度は移動距離を使っている?
A: Karl Simsでは泳ぎの旨さ、AnLifeは単純な移動距離ではなく餌を上手く
 取得するために移動が評価に繋がっている。
Q: Karl Sims も水中でのシミュレーションやってる。


衝突回避ゲームにおける行動学習に基づくコミュニケーションの創発、白﨑史子(沖縄高専専攻科1年・佐藤研)

コミュニケーションの起源:コーバリスの仮説、ジェスチャー
 発生:本能的・反射的なもの
 ジェスチャー:意図的なもの
仮説:目的を持った「動作」にコミュニケーション上の「意味」が無鮪付き、
「意味」の伝達のために「動作」が利用されるようになる
 高野・有田(2006)モデルを参考としたマルチエージェントシステム
 (進化ではなく)学習による獲得
 Q学習+エルマンネットのハイブリットモデル
 行動の学習を通して、
 どのような条件下でどのようにコミュニケーションが創発されるか。


・結果的にコミュニケーションを獲得したという事例としてはアリの
 フェロモン等いくつかありそうだが、今回の高野・有田モデルを
 ベースにしていることで明らかになるのは何?
・ジェスチャーを学習するというのは、評価を得られる環境の用意と、
 その環境下で許されている機能が揃っていると、
 自然に獲得しそうにも思うが、そうではない?



Q: 進化ではなく学習だという話があったが、学習と進化について違いは
 何だと考えている?
A: 進化の場合は生まれ持った能力を保ち続ける。学習だと最初は知識を
 持ってなく、知識を積み重ねて行動することを考える。

Q: コミュニケーションをとるときの行動、ジェスチャーはどれぐらいの数を考えている?
A: 特に与えている訳ではない。機械としての物理的な制約があるだけ。
Q: ジェスチャーの意味はどのように評価する?
A: 見た目による判断になる。

Q: 評価として人間らしいコミュニケーションができているか否かという話だが、
 回避行動に対しては報酬無しでも見られたとあったが、最終的な報酬はある?
A: ゴールに辿り着いたという報酬はある。回避行動に対する直接的な報酬ではない。

Q: 避けることでの報酬は無いということだが、それは何の意味も無いが
 避けるようになった? 避けることでプラスは無いがマイナスを省く
 ということを学習した?
A: その通り。

Q: コミュニケーションが発生するという所については学習よりも進化の方が
 相応しいようにも思う。学習できないような霊長類以下の生物が学習する?
A: 考えてみます。ジェスチャーも生まれた時からできる訳ではない。
 親とインタラクションすることによってできるようになると考えている。
A: 言語の起源と獲得では進化の問題と切って考える。起こすために必要な
 能力だったり機能だったり、それが進化でどう獲得されるかということを
 問題にする。学習だと、それをどう使えるようにできるか。


セッション2: 座長: 名嘉真之介(琉大修士1年)

合議アルゴリズムにおける合議リーダー決定法の検討、當間啓介(琉大工学部4年・遠藤研)

合議システム「あから2010」
 文殊:相応実力持つプログラムらによる単純多数決
 個体正解率が0.5以上の時に合議正解率が有効
 思考ルーチンを多様に+個体を多く+リーダーをうまく決定

合議リーダー
 意見が割れた場合、優先的に意見が採用されるリーダーは必要か?
  リーダーを決めた方が勝率は向上
  過去数手分の履歴からリーダーを選出


・履歴に基づき適切な合議リーダーを選出する(状況に応じて信頼度を調整する)
 という考え方は直感的には適切だと思うが、「対ボナンザ」のような
 特化型アルゴリズムが対抗馬として出てくる事は無いか?
 (例えば、汎用性のある合議アルゴリズムを想定しているなら、
  真の最適解が分からない状況下において最適な1手を求める
  というアプローチ自体に問題は無いか)



Q: 合議でリーダーを決めるような研究って他にもある? 定石とか。
A: 意外だが見当たらない。
Q: リーダーを決めていない場合意見が割れたらどうする?
A: ランダムで選ぶ。
Q: ランダム以外の方法を試行錯誤して勝率向上に向ける?
A: はい。将棋に限らず汎用性は高いと思う。

Q: リーダーを決めるというのは、システムの信頼度の重みと考えて良い?
A: はい、途中で重みを履歴に応じて変更する。

Q: シミュレーションは将棋? 過去の履歴残して最良ケースを使うと思うが、
 最良ケースってどうやって決める?
A: 思考ルーチン毎に評価値があり、その評価値が高い個体をリーダーにする
 ことを想定。実際にその評価値が適切かどうかは別の問題。
Q: 同じ手でもルーチン毎に評価が異なる?
A: 違うことも同じこともある。それを合議により適切な値で同じにしたい。

Q: 将棋以外に具体的な問題は?
A: 気象庁でシミュレーション多数から合議的にやるというのがあるらしい。
 ゲームで良ければ囲碁も。


交通シミュレータの現況再現性向上の基礎研究、仲本康倫(琉大工学部4年・遠藤研)

交通手段間のモーダルシフト効果等需要変動を考慮した交通シミュレータ
 経路配分と交通手段選択を統合した利用者均衡配分
 確率的利用者均衡配分

問題点
 路線バスの需要予測の精度が他と比べて低い


・現状再現性とは?
・先行研究をベースに、何をどうするのが目的?



Q: 車モデルだけがミクロモデル?
A: 全てミクロモデル。
Q: モノレールをミクロシミュレーションする必要は殆どないのでは?
A: 人のモデルがある。モノレールに乗り換えることも可能で、
 同一シミュレータである必要がある。
Q: グラフがあったのでマクロなモデルにも見える。ノード間のリンクさえ
 見えたら細かいことはやる必要が無いのでは?
A: モノレールについてはミクロシミュレーションはやっていない。
 自家用車についてのミクロシミュレーションは実装しているが、
 まだ評価が十分でない。

Q: 現況再現度の評価とあったが何を評価した? 何を比べて相関が高かったのか?
A: 実データでの配分具合。
Q: 実データとは? 録画とかから算出したデータ?
A: 実データはパーソントリップ調査等の集計データ。
Q: それは何ですか?
A: 沖縄県がアンケート調査集計したもので、出発地と目的地だけから
 どのように経由するのかをシミュレーションしている。


マイクロブログからの議論の自動抽出、堀川敦弘(琉大工学部4年・當間研)

Twitterにおける議論
 ハッシュタグのケース
 ハッシュタグ無しの議論も
  人手でまとめている: togetter

自動抽出の問題点
 議論の始まりと終わりの判別
 1ツイートの情報が少ない
 スラング(未知語)や主語抜き言葉が大量に存在
 ツイートにタグやジャンル等の情報は全く付与されていない
 わざと意図を隠して投稿される発言がある

解決したいこと
 1ツイートの情報の少なさ、表記揺れ
 未知語の取り扱い

アプローチ
 シードになるツイート
 形態素解析、Google Suggest API、Wikipedia


・「議論の自動抽出」というのは何を抽出したら「議論」を抽出したことになるのか。



Q: Suggest APIに投げる単語はどうする?
A: 全部投げて、その結果から調整する予定。

Q: N-gramでやるという話だが、Wikipediaの辞書は使えない?
A: 名詞として認定できない(取り出せない)ケースを取り扱いたい。
 Wikipediaに存在するなら良いが、Twitterならではのスラングも解決したい。

Q: 映画のタイトルとか注目しているテーマについて集められる?
A: テーマに関する話題を集めたい。
Q: あるテーマに関する議論というのはいろんなバリエーションがあると思うが、
 ここでいう議論というのは何? 何を示すこととが議論を示したことになる?
A: ローカルな関係の中での話し合いを出したい。シードを投げたらシードを
 見ている人が母集団になる。そこから共起する発言がないかを探し出すことで
 関係のあるツイートを収集する。その結果こういう流れというのが提示できる。
Q: 「こういう流れ」というのは何?
A: YES/NOの2値で判断した上で、タイムラインで並べる。
Q: 時系列的に賛成反対意見といったことを見せるというイメージ?
A: まとめるだけでも良いかなと考えている。
Q: まとめるだけとは?
A: WISDOM的なこともやっていいかなと思うが、
 togetterのように一まとまりにすること。
Q: togetter は人手でやってる分まとめ方のうまさとかもあると思うが。
A: 広がり方の係数とかもあると思う。


serendipityに着目した情報推薦システム手法の検討、山内一騎(琉大工学部4年・當間研)

情報過多、有益な情報を精度良く、Serendipityさ
意外性のある情報
 既存手法で推薦されない&評価値が一定以上のもの
 平均化された類似度ユーザに沿った類似度の取り方
 ユーザにより見方が異なる
  見方に応じて類似度を測る


・「既存手法で推薦されない&評価値が一定以上のもの」がどのぐらいあるのか。
 それらと「既存手法で推薦されるリスト」とに何らかの関係/共通項が見られるのか。



Q: Serendipityをどう図るかが肝になると思うが、第一位のタグで見た時の順位、
 第二位のタグで見た時の順位、といったことを見た時に、それらの商品群から
 出すということでもSerendipityを考慮していることになると思う。
 色々あり得そうだが、どう決めるべきだろうか。
A: ユーザにどれほどSerendipityの情報が欲しいかを決めてもらう。
 ちょっとだけ意外性のあるものが欲しいとき、意外性の強いものが欲しいとき
 といったことを選択できるようにすることを想定。
Q: 評価はどうしたい? Serendipityがあると面白いかもしれないというのは
 分かるが、その人への効用を考えると、どういう提供の方が効用を高めること
 に繋がるかということも考えられる。ランダムに適当に決めるというのも
 それなりに効果がありそう。どう効くかというのを示せるとすっきりするが、
 何を作りたいのか。
A: 既存手法よりSerendipityのあるコンテンツを出すのが一番の目標。
Q: その条件内でランダムに、というのもあり得ると思う。何を推薦するか、
 それがどういう効果を生むか。何か考えている?
A: タグに着目する理由は何か、というのと同じ質問?
Q: Serendipityの定義。そのぐらいの定義なら、履歴を使うとして
 ランダムベースなアプローチで十分できそうだなというイメージ。
A: 想像になるが、ランダムだと評価知的に順位的に下がってしまう可能性が
 高いと思う。評価値をキープしつつSerendipityを提供したい。


セッション3: 座長: 下地竜雄馬(琉大修士2年)

スマートフォンへの実装に向けたクラウド型拡張現実システムに関する基礎研究、佐藤公洋(琉大工学部4年・赤嶺研)

ビジョンベース/センサベースAR
目的:観光案内ARアプリケーション
 詳細トラッキング:ビジョンベース、マーカレス
 ビジョンベースARのクラウド化


・バッテリー問題:通信電力<クラウド?
・クラウドを考慮したタスク分割/負荷分散のために考慮すべき負荷は?
・タスク分割をスケジューリングするのはクライアント?サーバ?



Q: カメラ位置姿勢につかうアルゴリズムは?
A: PTAMを予定。
Q: 最終的な目標は?
A: 屋外で使用できる観光案内AR。建物の表示とか。
Q: 観光案内では正確な位置が必要? 建物だと正確な位置が必要とは思う。

Q: タスク分配の例があるが、これ以外の分配例は想定しているか。
A: クライアント毎にスペックが異なるため、異なる最適分配があると思う。
Q: バッテリーと容量の問題は、マーカレスビジョンベースにする必要がある?
 ある程度の情報さえ分かれば、文字情報だけサーバから送るとか。
 精度に拘った理由は? 使用用途としてどういうのを想定している?
A: 観光案内するARアプリ。センサベースだと建物が密になっている場所で困難。
 10m程度の誤差が出る。観光案内としてはビジョンベースが向いている。
Q: 大雑把に数十メートルにタグ付けするとかではなく、込み入ってる箇所で精度が必要?
A: はい。


並列処理を用いた強化学習による人型ロボットの制御、浜田晃向(琉大工学部4年・山田研)

多種多様なロボット。ロボット制御→強化学習。並列処理。
 目標:人型ロボットを例に、並列化強化学習

強化学習の制御
 安定した学習動作/高次元の問題空間
 ZMPと基準点との差
 重心が左右へ移動する量を学習


・ただでさえ高次元という話なので困難かもしれないが、
 ZMP以外のパラメータも考慮して同時に複数の最適パラメータを
 学習するようなことはできないか。



Q: 教科学習の回数と移動距離のグラフがあったが、7千回以降で伸びないのは何故?
A: 先行研究での結果なので分からないが、最終的に伸び悩んでいるなら
 別アルゴリズムも考えられると思う。今回は人型ロボットに適用した結果から
 検討を行いたい。

Q: エージェント数20とあるが、何をやっている?個別に学習している?
A: 各々が独立して学習し、あるタイミングで合成→配布ということを繰り返している。
Q: エージェント数20という数字は最も良かった数値?
A: いくつか試行した中での良かった例。
Q: 結果として良くなってるのは見て取れるが、何で良くなると考えられる?
A: 価値関数を更新する際に他エージェントの価値関数をひっくるめて合成する。
 各々が良い学習を行えている。
Q: 理屈としては、Qテーブルの空間が広いとか考えた時に、一般的にQ学種とか
 sarsaで考えたらやってればいい結果になる。GAとかで考えると多点探索とか
 やって各エージェントがやったのを合成するから良くなる。
 というような理解で合ってる?
 1個体だけで考えると「やったのを評価されることで学習」する。
 多点でやらるから良くなる?
A: はい。


モバイル端末を用いたロボットインターフェース、照屋唯智郎(琉大修士1年・山田研)

モバイル端末を用いたロボット制御
 モバイル端末のセンサーからの教示
 倒立振子シミュレーション


・モバイル端末をロボットから人間へのインタフェースとして利用するという
 話のようだが、どのような応用を想定しているのか。



Q: 倒立振子のプログラム作成して、何かしら社会に応用できるのか。
A: 最終的にはロボットに人の動きを真似させたい。人の動きを教示する。
Q: 今後何か具体的に考えているものは?
A: 倒立振子の話になるが、ファジィルールの獲得を考えている。

Q: ロボットに人間の行う動作を教示したいというのが目標のようだが、
 それが目的であれば今までの先行研究では「カメラで撮って動き検出を
 覚えさせる」とか「教示者が動かしてあげてサーボから受け取る情報で覚える」
 とか思いつく。それができないような大きいロボットを想定している?
 マーカを付けて検出するより安価かもしれないが、例えば人型のように
 複雑になってくると、擬似的な3Dの中で複雑な動きをどうやって教示するのか。
A: モバイル端末でやっていきたいが、
Q: 例えば人型ロボットを歩かせるとかバク転させるとか。この動きだけで表現できるか。
A: 加速度センサーだけでなくタッチパネルも使えるし、
 他のセンサーが乗った端末でも良い。モバイルに拘りがある。
Q: 何でファジィルールを設定している? NN使うならそれで全部できない?
A: 当初ファジィルールで考えているが、最終的にはNNだけでやろうと思っている。
Q: 普通のフィードフォワードNNを選んだ理由は?
A: 加速度抽出した際に明らかに異なる行動が混在していることが見られた。
 時系列を考慮する必要が無い。

FIT2011, day3

金曜日, 9月 9th, 2011


FIT2011の最終日が終わりました。

3日目のプログラムはこちら

午前中は一般セッション「数理モデル化と問題解決(2)」で座長として参加。
午後は一般セッション「分類」に参加してきました。

全日程に参加しての印象は、イベント企画の面白さと、一般セッション間での差の大きさ。座長や参加者の頑張り具合で何とかなるケースもありますが、アブストand/or予稿で多少は落とすことを考えても良いんじゃないかな。それなりの落とす理由を付して返却するコストは増えるけど、残念な発表もあるし。発表練習みたいな場所があっても良いと思うけど、それがFITでサポートする部分なのかはちがうんじゃないかな(個人的な考え)。

ちなみに、FITの創設経緯によると「従来の大会の形式にとらわれずに、新しい発表形式を導入し、タイムリーな情報発信、議論・討論の活性化、他領域研究者との交流等の実現」ということで特定領域に拘らず幅広いセッションがあるのは良いのですが、交流という観点では質疑応答と懇親会ぐらい?

勿論自分から動けば良いだけの話なんですが、「多種多様なデータが必然的にクロスするドメインがこれから解決すべき領域」というような話が講演会で出るぐらいなので、もう少し積極的にクロスする(せざるを得ない)ような仕組みがあっても良いんじゃないかなと思います。一部の学会では「学会開催中の盛り上げ方」自体を研究テーマにして実際に試行運用してるケース(下記例参照)もあることだし、情報処理学会でその方向に動けないのはちょっと残念。実施コスト高いので手を挙げる人がいないとやれないというのは分かりますけどね。

 ・例1: WISS2010改革内容のまとめ
 ・例2: 人工知能学会全国大会、インタラクティブセッション特別企画、メンタリングセッション内企画
 ・例3: 自然言語処理学会年次大会、自然言語処理における企業と大学と学生の関係

ということで、以下、参加してきたセッションのまとめです。
青字は質疑応答時のやりとりですが、ニュアンス自体が大分違ってる可能性が高いです。


目次
・一般セッション: 数理モデル化と問題解決(2)
・一般セッション: 分類


数理モデル化と問題解決(2)

座長として参加してたので実際の質疑応答をまとめる時間は殆ど取れず、大まかな発表のメモと事前に予稿を読んで私が感じた点のメモや疑問点になります。いくつかの発表を除いて活発な質疑があったので殆ど質問できなかったけど、量子ビット表現したGAの方はセッション終了後に話を伺うことができました。

問題意識:モンテカルロ碁に対し枝刈りによる計算量削減

 Q: 他手法との比較は?
 Q: ポテンシャルモデルと他物理モデルとの違いは?
 Q: ポテンシャル値の与え方は同一で問題ない?
 Q: 枝刈りにより棋力が上がるのは何故か?
  →誤った手を打つ可能性を除外できた可能性
 Q: 9x9の小さな盤面での評価を行っているが、
  これは19x19でも同様の傾向を示すのか?
  →今後の課題

<事前疑問点>
Q. モンテカルロ碁の計算量削減について他の枝狩り方法等があるようだが、
 それらとの比較考察はしたのか。

Q. モンテカルロ碁の特性そのものを解析したり、近似することが目的?
 (近似が目的なら、どのぐらい計算量落とせた上でどのぐらい近似したか
 を示す際に勝率(棋力)だけでは不十分に思うが、他に特性がうまく近似
 出来ているかを検証する方法は無いだろうか) それとも近似した上でより
 強いモデルの構築等に繋げることが目的?(今後の方向性は?)

Q. 特性の近似具合を図る指標として一致率や含有率を採用しているが、
 これらの指標では「実際には採用しない」部分が多く含まれるが問題無いのか。
 言い換えると、ノーマルのモンテカルロ碁により得られる勝率分布全体を
 近似することが目的なのか、勝率分布を利用して手を選択する部分を
 近似したいのか、どちらなのか。
 例えば、勝率分布としての近似を見る場合、両者とも「合法手」を基準にした
 指標になっているが、その逆は考慮する必要が無いのか。すなわち、
 モンテカルロ碁により合法ではないと判断した所の一致率は見る必要が無いか。

Q. モンテカルロ碁との一致率や含有率の観点からは、その性質上基本的には
 ランダムが最も良く近似できそうに思える。棋力も考慮すると序盤をランダム、
 中盤は後半から別フィルタとの組み合わせが直感的には良さそうだが
 検証してみたか。

Q. 各フィルタの特性や棋力は、ポテンシャルの与え方の性質上、
 碁盤のサイズによっても変化がありそうだが問題にならないか。

  • 配属人数下限付き研究室配属問題
  • 問題意識:多対一マッチングにおいて下限導入
     下限導入でも動くようにアルゴリズム拡張
     例:研修医配属問題、タスク割り当て、震災地ボランティア
    選好を考慮する→Multi-Stage導入
    
    
    Q: 下限制約が求められる問題例にといて、完全で厳密な選好を持つという
     前提は問題にならないか?半順序に拡張することは可能か?
    Q: 戦略的操作不可能(偽の選好を表明しても特にならない)+全順序選好リスト
     必須という前提は本当に望まれているのか?
     →選好仮定の緩和、不完全や同順を許した選好
    
    <事前疑問点>
    Q. 定義1の条件2の意図が良く分からない。
     学生iは「|M(lj)|<qj」の時点で学生i'とは無関係にljに配属すべきにも思うが、
     どういう状況を表しているのか。
    
    Q. 学生や研究室の選好リストが全順序であるというのは困難な前提に思えるが、
     問題にならないのか。
    
    Q. 選好リストに駆け引きが含まれている場合、その影響を加味したより簡易な
     解法は考えられないのか。例えば、戦略的操作不能では「自身の真の選好
     リストを申告した際の効用最大化」を意味するようだが、偽の選好リストを
     申告することで効用最大化を図ることは考えられないか。(実際問題として
     そのようなことが行われていないのか)
    
    Q. 似たような質問になるが、ブロッキングペアに含まれた学生は、
     本当にブロッキングペアだったのか。また、ブロッキングペアではないと
     判断された学生は本当にそうだったのか、についての調査結果はあるのか。
    
    Q. 実際の「正当と認められる不満」は、定義1や2で必要十分に記述出来ているのか。
    
    Q. 3タイプのブロッキングペア数を指標として用いた安定マッチングを
     導いていると思われるが、導いたマッチングに関して何らかの批判は
     出ていないのか。
    
    Q. 本質的な話とはズレてしまうかもしれないが、ブロッキングペア数だけを
     最小化することが目的で良いのか。例えば、ブロッキングペア数自体は
     最小だが、ある学生は極端に選好順の低い研究室に配属されているといった、
     学生毎もしくは研究室毎の選好満足度のバラツキが極端に低いマッチングが
     与えられていたとしても問題ないのか。
    
    
    
  • ノード配置問題に対するアント最適化法
  • 問題意識:BMSNの最適ノード配置による伝送効率化
    
    
    Q: 高負荷トラフィックが生じるノードは時々刻々と変化しそうだが、
     その都度最適配置を求める必要があるのか。
    
    Q: アントサーチでアントのいる行と列全ノードを再配置対象にしているが、
     このように設定した理由は何故か。
    
    Q: イータによる問題領域固有情報の効果が高そうに思うが、
     ACO以外の他の手法でも同様の設計を導入することで改善できたりしないか。
    
    Q: IKLSより平均的にすぐれているとのことだが、最悪時等での差はどうだったか。
    
    <事前疑問点>
    Q. アントサーチの際に、未割り当てノード集合N^kが、同じ行と列方向
     全てのノードとなっているが、この設定はどのようにして決められるのか。
     ノード距離でいうなら同距離に位置する斜め方向も必要だと思うが、
     特に考慮する必要はないのか。ネットワークのサイズに依存してどこまで
     考慮するのか(全ての行や全ての列で問題無いのか)も調整が必要に思う。
    
    Q. アントサーチと切り離して考えるのは困難かもしれないが、問題領域固有情報の
     与え方自体の効果が高いように思える。同様の与え方を他の解法に組み込むこと
     はできないのか。言い換えると、ACOが解法としてすぐれているのではなく、
     制約の与え方がすぐれている可能性はないか。
    
    Q. 高負荷トラヒック間のホップ数が1であることが最良のノード配置とのことだが、
     トラフィックには入力と出力があり、それらの対のホップ数が1であることが
     最良ではないのか。また低負荷トラフィックは無視して問題無いのか。
    
    Q. 実用上の制約は全て含まれているのか。計算リソース上の制約や、時間の制約等。
    
    
  • 移動体の通過順序付けにおける最適化手法の比較評価
  • 問題意識:船のような複数移動体が同一領域共有通過
    
    
    Q: 入域点、出域点を増やしても適応可能か。
     →今後の課題
    Q: 入域点のある問題設定が良く分からないが、何のためにあるのか? 具体的な例は?
    Q: 買い物のレジと違う点は?
     →移動体間隔制限が違うと思うが、未調査
    Q: 全体遅延を最小化することで個別のユーザに必要以上の遅延を強いることに
     なると思うが、そこについて何かしら下限なりを設けることはできるか。
     →調整可能
    Q: 「公平性の損失」で順序しか考慮されていない(時間が加味されていない)が
     問題無いか。
    Q: 移動体の種類が3種以上に増えても問題無いか。
    
    <事前疑問点>
    Q. タブーサーチのようだが、タブーはどこでどのように設定している?
    
    Q. そもそも求めたいものは何? 問題設定が良く分からない。
     移動体は三種類以上に増えても適応可能?ユーザはどれでも自由に乗れる?
     移動体のコストは?
    
    Q. そもそもGAのような大域的手法が向いていない問題設定に見えるが、
     セービング法等の局所探索手法との比較は?
    
    Q. 今回の手法は移動体が3種以上であっても適応可能か。
    
    
    
  • 整数ナップザック問題を対象としたQuantum-Inspired Evolutionary Algorithmの基礎検討
  • 量子力学的原理+GA
     量子ビット表現、量子重ね合わせ状態を模倣
     問題意識:整数型の遺伝子表現を可能とする表現法
     移住処理→対交換処理に置き換えることでパラメータ数減少
    
    Q: 観測結果は毎回異なる?
     →世代毎に一度ずつ観測
    
    Q: GAと比較してどのていど計算量が増えるのか。
     →ほぼ同等
    
    Q: 収束状況や適応度変遷具合から決定したようだが、
     回転角度は変動させることはできないか?
     →SAのようなやり方も可能だと思うが、
      島GA的な操作が内部に含まれるため殆ど必要ないと考えている。
    
    Q: 実験2の結果で、適応度は最適に近いところまで獲得できた? 局所解に収束?
    
    事前疑問点
    Q. QEAにおける「量子ビット表現」とは? ユニタリ変換とは?
     一般的なGAとの違いはコーディングのみ?
    
    Q. QEAも知らないのでご教示頂けると嬉しいのですが、QEAやQEAPSは
     一般的なGAと比べて計算リソースも少なく、計算時間も短くて済み、
     得られる解の質も高いという傾向があるのだろうか。
    
    Q. GAは、島GA等の並列処理しやすいアルゴリズムだと思うが、
     QEAやQEAPSも同じような並列化は可能か。(観測とかユニタリ変換とか
     分からないので、並列化に不向きな点があれば教えて欲しい)
    
    Q. QEAPSでの探索性能の差が僅差であることについて、
     一般的なGAでいうところの局所解に陥りやすい枠組みになっているという
     ことは考えられないか。図3で示されているのが十分最適解に近い適応度に
     達しているなら、より大規模/複雑な問題でも検証してみるべきではないか。
    
    Q. 一般的なGAと比較して、QEAPSでもまだパラメータ数が多いように感じるが、
     これらのパラメータの中で省略もしくは自動調整するようなことが
     考えられそうなパラメータはあるのか。
    
    
  • ネットワークの隔たり数とエントロピー
  • ミルグラムの実験、6次の隔たり
     閉路が存在する場合の重複を考慮したい
     スモールネットワーク/スケールフリーネットワーク
      閉路の数で情報伝達のしやすさが真逆
    
    中間的ネットワークモデル2種類考察、
    次数分布エントロピーの情報伝達に及ぼす影響⇄閉路の影響
p次一般化クラスタリング係数C(p): ネットワーク内の多角形構造量を表す一指標
    ミルグラム条件Mn: n次の隔たりが成立する条件
     スモールワールドネットワーク:C(p)が大きくなると情報が伝わり難くなる
      閉路が情報伝達を阻害
     スケールフリーネットワーク: Xn,C(p)が増加するとMnが大きくなり、n次の隔たりが満たしやすい=情報が伝わりやすい
      閉路の数の増加が情報伝達を促進
    中間的ネットワーク
     スケールフリー(sk)→スモールワールド(sm)
      (sm)張り替え率Pの増加と共に、局所クラスタリング係数Cと最短平均パス長(≒Mn)が増加=伝達し難い
      Pの増加=ランダムネットワークに近づける?
     スモールワールド(sm)→スケールフリー(sk)
      (sm)
     →閉路数ではなく次数分布エントロピーが情報伝達に影響
    
    
    Q: ミルグラムの実験で閉路の影響で遠回りするという話があったように思うが、
     閉路はカウントしていないのでは?
    
    Q: 中間的ネットワークの作成方法が影響していないか。
     →傾向確認済みで問題無い
    
    Q: ミルグラム条件Mnと最短平均パス長Lに良い相関が見られるということを
     利用しているが、ネットワークの作成方法は影響しないのか。(中間的ネット
     ワークにもいろいろ考えられ、今回想定した中間的ネットワークではこういう
     傾向だったというだけ?)
    
    <事前疑問点>
    Q. XnやC(p) は閉路と等価な、もしくは近似された指標? XnやC(p)は多角形構造
     を用いた指標になっているが、多角形構造を閉路と言い換えているのは
     何か理由があるのか。
    Q. ミルグラム条件Mnと最短平均パス長Lに良い相関が得られていることが
     示されているようだが、先行研究でも中間的ネットワークのような操作を
     行ったネットワークに対しての調査も行われているのか。(言い換えると、
     ネットワーク生成法が与える影響は十分無視できるのか)
    
    Q. スモールワールドにおいて、張り替え率Pを上げることがランダムネットワーク
     に近づけることと解釈しているようだが、その解釈は正しいのか?
     (例えば張り替え操作は、ハブと連結しているノード間に枝を張り、
      代わりにハブから出ている枝を削除するという2つの操作がセットに
      なっているが、この1セットが処理されることにより何らかの偏りが
      生じる事はないのか)
    
    
  • 経済性を考慮した電力自給のための生活スケジュールの提示
  • 仮想スマートグリッド環境、マーケットプライス
    問題意識1:電力コスト高い時に買ってしまう恐れがある
     高コスト→電力使用を避ける
      生活スケジュールの推薦
    問題意識2:スケジュール推薦の上での目的
     電力会社からできるだけ買わないように
     安いマーケットプライスを望む
      スケジュール最適化(次の日の生活スケジュール)
      生活行動毎に時間、期間、分割、並行、代替条件を設定
    
    
    Q: 需要と供給の関係からマーケットプライスの変動が設定されているようだが、
     2つの組み合わせしかなかった。それ以外の状態ではどうなる?
    
    Q: 目的1と2を合算して考慮しない理由は?
    
    <事前疑問点>
    Q: 推薦されたスケジュールに合わせた生活は可能か?
     例えばTV。録画はどうする?
    
    


    一般セッション:(言語処理の)分類

    座長さんも聴講者も予稿までちゃんと目を通した上での質問が多く、質疑時間5分の割には濃厚な時間になってました。凄い。

    問題意識:学習カルテ提供による自己分析/引き継ぎ資料作成コスト削減
    
    
    Q: TFIDF正規化/非正規化でノイズワードは正規化した方が多くなったが、
     最終的なF値ではどちらが良い?
    A: F値では差が見られなかった。
    Q: 普通に考えると正規化した方が良さそうに思うが、何故差がでなかったのか。
     例えば「こういう例があった」というものが無いか。
     何故ノイズワードが増えるのか。
    A: 設問において文字数が多くないので正規化/非正規化で何か差が出ると
     思ったが、あまり見られなかった。
    Q: その辺りも考察してみると良さそう。
    
    Q: そもそも非正規化よりも正規化がうまく表しているという根拠が
     ノイズワードだけにみえるが、何故それを根拠にしたのか。
    A: 以前の実験で、TFベクトルとTFIDFベクトルで行った際にはノイズワード数の
     大小で比較できた。
    Q: ノイズワード以外に現れている語に重なりもあるが、違う語も出てきている。
     どちらの語がより設問の特徴を表しているかについては検討したか。
    A: 今回は考えていなかったが、今後考えていく予定。教科書にある太字単語等を
     重要度にして指標として使うことを考えている。
    
    Q: 試験全体において設問を特徴付けるような語はそもそもあるのか。
     データを眺めていて気づいたものがあれば。
    A: 教科書の太字単語は良く出てくる。
    Q: それなら太字を使えば良いのでは。
    
    
    
  • ニュース記事の国別クラスタの作成と多国間対応の実験評価
  • 問題意識:報道姿勢や内容には各国の思想や文化等による違いが表れる
     ユーザが各国の価値観の違いを比較できるシステム
      各国がどのような話題に注目しているか
      ある話題に対する各国の注目度の差の比較
     Q: 話題の定義は?
     Q: タイトルや本文をどうベクトル化する?
     Q: 国別クラスタリングはどうやる?
     Q: 国別クラスタ間のマッピングは1対1対応とは限らないのでは?
    
    
    Q: クラスタリングして対応付けるということだが、
     クラスタ数はどれぐらいになった?
    A: 1記事でクラスタになることが殆ど。日本記事数1655で
     クラスタ数600~700程度。
    Q: どれか1国を決めて基準になるクラスタを決めて対応付ける方が良いのでは?
    A: 国別のクラスタリング結果F値が大きく異なるため、
     基準を設けるのは難しそうな印象。
    
    Q: 各国の注目度の差を見たいということに対して、今回のタスクは同じ記事か
     どうかを推測するタスクになってるように見えるが、今回のタスクはどういう
     位置付けなのか。類似度の高く無い意味とか。
    A: 報道の方向性が似通ってるなら全体的に類似度が高くなるが、
     違ってる場合には重要後のみが共通しているという状況が出てくると思う。
     そういうところからアプローチしたい。
    
    
    
  • Wikipedia記事に対する類似記事群の出典傾向の提示方式
  • 問題意識:記事への出典付与コスト緩和
     Q: 信頼性を高める際に出典付与の有無だけで判断して良いのか。
     記事毎に出典傾向が異なる
     出典のつけられていない記事に対して出典を探すべき媒体を提示
      一つの記事が複数カテゴリに所属
      カテゴリ毎の社会的認知度に差がある
      →より狭い範囲でのカテゴリ毎に平均した傾向を取る
     Q: 記事単位ではなく、文章単位とかより細かい単位での出典傾向、もしくは出典が求められるといったことを提示できないか。
    
    
    Q: 存命/非存命で分けるという観点は面白いが、急に無くなられたからといって
     傾向が急に変わるという訳ではないと思う。
    A: そういった例もあるが、将来的には生まれた年によるグルーピングも考えている。
    Q: そういうパターンがカテゴリ毎にも変わるんじゃないか。
    A: 検討したい。
    
    Q: 根本的な所は出典傾向が似ていれば一つのグループにまとめられるのでは
     ないかということ?
    A: 出典傾向がまとまっているグループを見つけるためにグルーピングしたり
     出典付与具合で確認している。
    Q: Wikipediaで出典を出す場合に参考にするということのようだが、
     出典傾向からグループを作成することもできるのでは。
    A: 検討したい。
    
    Q: 出典傾向については納得したが、編集者にとって出典を探すための支援に
     これがどのぐらいになるのかが見え難い。出典支援を考えたら出典は記事の
     まとまりや一文毎につけたりすることもある。どのぐらい有効になるのか。
    A: 何も情報がないよりは傾向を出しておけばマシだと思う。Wikipediaは
     仮出典つけるとしても編集者によって消されることもある。
    Q: 調査結果は面白いので、もう少し別の方向に活かすことも検討してみてはどうか。
    
    
  • 同一事象に対する異新聞社記事間の相違点検出のための文間対応とその評価
  • 問題意識:事象の扱われ方の違いを検出
    問題意識:新聞社毎の見解や意見の違いを検出
     クラスタリング→文間の対応付け
     形態素一致率
      Q: 単位は「文」で問題ない?
    
    
    Q: 文間対応はクラスタリング結果が影響していないというようなことを
     述べられていたが、文間対応の結果も良いかイマイチか言いづらい結果に見える。
    A: 再現率に関しては影響が無い。
     取るべく対応のものは同一クラスタに存在することを確認済み。
    
    Q: 文間マッチングする際の文の選択はどうやる?
    A: 1〜3文単位での総当たり。
    Q: 「ある出来事」というのは時間的推移がある。DPマッチング的な遷移を
     含めた応用は考えられないか。
    A: 記事の日時は取っているが、まだやっていない。
    Q: もう少し緩く対応を取るとかしたくなる時に使えないかと感じた。
    
    Q: 最初の質問について、今回の実験では問題無かっただけで、
     今後のデータ次第では問題になることも考えられる?
    A: 可能性はある。
    Q: クラスタリングを使わない手は考えられない?
    A: 総当たりのため、計算量削減のためには必要。時間的推移的な類似度の
     利用等で代替も可能かもしれない。
    
    Q: ある新聞社はある評価をしつつ、別は評価をしていないこともありえる。
     そこはどうやって扱っていこうと考えているのか。
    A: クラスタリングで考えている。
    
    
    
  • Web検索結果のラベリングにおける閾値の利用について
  • 検索結果をクラスタリング提示
    クラスタへのラベリング:重要な単語TFIDF
     問題意識:TFIDFだけでラベル決定できない
      一致率の採用
       Q: TFIDFとの比較結果は?
    
    
    Q: 既存ロボット型問題点としてユーザがキーワード思いつかないケースを
     上げられたが、システムにおいて検索結果を取得するのは誰が行う?
    A: ユーザが行う。
    Q: キーワード思いつかないケースに対してそれは適切なのか?
    A: 思いつくのが難しい場合、より曖昧なキーワードを入力すると思う。
     曖昧なキーワードを入力した上で検索結果から得られる下位概念を提示する
     ことで対応している。
    
    Q: 正解ラベルを生成するのは実験者がやっているようだが、その判断基準は?
     迷ったりすることはなかったか。
    A: 迷うことはあった。ラベル一つしかつけてないがラベルにも複数の意味がある。
     同じ内容を表していても違う単語のケースとかも。
     厳密にしていく必要性は感じている。
    Q: そこが基盤になっているので複数人に評価してもらっているのは良いと思うが、
     人によってWebページの捉え方が異なると思う。処理は難しくなるかも
     しれない。大量の正解ラベルを付与しておいてそこから絞り込むような流れの
     方が良いように思う。今回のように1ラベルで解決しようと下理由は。
    A: 実験前の段階ではそのような差異がないと考えていた。
     しかし実験するにあたり複数ラベルの必要性を感じた。付けてる傾向はある。
    
    Q: ラベルを名詞や複合名詞一語で表すことはそもそも可能なのか。
     WISDOMだと極性とかも考慮されている。ラベル1語というアプローチは、
     本来目的とされている「利用者が探しやすい」という要求を満たすようなものなのか。
    A: そのような評価はまだやれていないが、確かにラベル1語ではなく複数語を
     検討する必要性は感じている。
    Q: 次元数削減はクラスタリングで削減?
    A: クラスタリング前に削減した上で、クラスタリング。
    Q: ラベルの次元数を削減するということとラベルを選ぶことの次元数を削減する
     というのは同値? 「次元数が多いトラベル候補が増加」というのはどういう
     意味? クラスタリングの次元数を減らすかどうかは別問題?同じ問題?
    A: 両方を対象としている。クラスタリングする際にも素性が多すぎると問題が
     起きるので、良好な素性のみを使ったクラスタリングを行いたい。
    
    

    FIT2011, day2

    木曜日, 9月 8th, 2011

    FIT2011の中日が終わりました。これで2/3のスケジュールが終了したことになります。

    2日目のプログラムはこちら

    午前中はイベント企画サイバーフィジカル情報革命 ~情報爆発から価値創造へ:米国NSFの最新動向~
    蛇足ですが、イベント会場1,2共に人数は結構入るのですが、スクリーン自体のサイズがやや小さかったり、プロジェクタ投影サイズと合ってなかったり、位置が見づらかったりしたのがやや残念。

    午後は一般講演「言語資源」に参加してきました。

    青字は質疑応答時のやりとりですが、ニュアンス自体が大分違ってる可能性が高いです。


    目次
    イベント企画: サイバーフィジカル情報革命 ~情報爆発から価値創造へ:米国NSFの最新動向~
     ・Big Dataとサイバーフィジカル
     ・統合情報基盤としてのサイバー・フィジカル・システムにおけるオープン・スマート・フェデレーション
     ・ポストペタスケール時代の情報分析技術
    一般講演: 言語資源



    イベント企画: サイバーフィジカル情報革命 ~情報爆発から価値創造へ:米国NSFの最新動向~

    Big Dataとサイバーフィジカル

    本題に入る前に
     震災にどれほど役立つことができたのか
      何ができるのか、対応のトレーニングが重要かもしれない
      ヤシマ作戦:Blog, Twitterの比較
       情報伝搬(避難口情報広がり方)の可視化
        ヤシマ作戦に見る草の根的な Diffusion Pattern (拡散パタン)
        インフルエンサーによる拡散パタン: e.g., 有名歌手による募金
       人の呟きがセンサ
        Twitter Sentiment, psyng.com
       スパイク(瞬間的な発火)を見るのではなく Diffusion Pattern を見る時代へ
       多様なITメディアのリアルタイム解析
    
    NSFの最新の動き
     CPS PI meeting in Washington
     The Growing Imperative and Transformative Impact of Cyber-Physical
     Digital Future
      explosive growth of scientific and social data
       melding of the cyber world with the physical world
    
人のつぶやきは大したことは無い。モノ(センサ)がしゃべる時代へ
     The Age of Observation
     CPSプログラム自体は数年前から始まっててるもので、新しいモノではない
      フィジカルワールドにくっついてきていることを真摯に受け止めようという流れ
     表現は違うがだいたい同じ方向感
      CPS, 情報爆発、情報大航海、Smarter Planet, IOT, M2M, Big Data, etc.
     CPS Research Gaps
    
    基本アーキテクチャ
     Cyber World  Physical World
      センサを通したフィードバックのある世界
    
    事例
     船の運航(省エネ運行)
     ウェザールーティングによる最適計画
     物流 by NEC
      SeeT-navi
     人の健康
      情報薬:適切なタイミングで提供される情報
      保健指導の大幅な効率化
       問題点:個々の多様性が大きい
        transfer learning
     個々のサイバーデータ活用事例はそこそこある
    
    Big Data
    Personal Data: The Emergence of a New Asset Class
    
    
    Q: CPSの応用例に米国・海外のものが上げられたが、
     日本が独自にやらなくてはならないものがあるか。
    A: アプリケーションドメインの幅は広がる一方で、今回書介したのはほんの一例。
     例えば空港の価値が諸外国に負けているということを情報集約の観点から解析したり。
     いろんな所に挑戦していくべき。
     ポイントは、複数のステークスホルダーが跨がっている所が面白い。
    
    


    統合情報基盤としてのサイバー・フィジカル・システムにおけるオープン・スマート・フェデレーション

    Improvisational Federation
     即応的な対応が重要。適応に至る一歩手前。
      大規模かつ多様なデータ、開放されたもの。シナリオは計画されていない。
     Lower/Middle/Application layer
      Cyber/Physical cloud
      Open library: cyber-physical knowledge-processing
    
    Open smart federation architecture
     Generic Wrapping of Resources
     Integrated Data and Knowledge Presentation
     Virtual Reification Framework
      視覚化フレームワークではなく、
      相互作用的に機能するオブジェクトとしてのフレームワーク(?)
    
    Meme Media & Meme Pool
    The Memetic Web
    PadSpace for Knowledge Federation
    Cyber data mining (ill-formed)
     interactive visualization
     improvisational combination of tools and application to CPS data
    
    Reexamination of Disaster Response System in U.S.
     Before: NIMS
     After
      Balancing between Agility and Discipline
      Technology-Mediated Support for Public Participation & Assistance
    
    
    Q: 大震災例だとその場に専門家がいる訳ではないことがある。(殆ど聞き取れず)
    A: いろんなスキルレベルの人が関与する中で、
     各々のスキルに応じて適切なツールを提供する事は大切だと思う。
    
    


    ポストペタスケール時代の情報分析技術

    データ構造といったことだけではなくハードも含めた新たなパラダイムの必要性
    「データはめしのたね」
     処理や通信といったスペック向上だけではNG
      PCはどんどんほぼゼロコストに
      電力、スペースは高いまま
     付加価値
      情報爆発→どんどん探し難く→データの目的に踏み込む必要性
     東北大震災の1年前から話が出ていた: e.g., オーストラリアの山火事
     世界的に必要性が高まってきている
    
    スマート・プラネット
     単にデータを蓄えるだけではなく具体的に何をしたいのか。
     クロスドメイン、多種多様なデータ、性質も異なる。
      種類や時間軸の異なるデータの合成や複合的な分析により情報価値を高める。
     蓄積→分析→推薦→アクションにまで繋げる
    
    事例
     港湾・河川のリアルタイム監視
     世界の個人のDNA解析による人類の起源の調査
     電力需要と気象の監視・予測→発電量の最適化
     センサを増やすだけでは足りず、分析技術が必須
      より多くの事象をモニターし、より迅速な意思決定の必要性
       Q: 意思決定にもバリエーションが多々あるが、汎用的に提供可能か?
      Big Data + Learning Systems
    
    Big Data: Deep Analytics and Reactive Analytics
     蓄積しているデータ+流動するデータ
      少ないデータで即時に反応する必要のあるケース
      大量のデータに時間をかけて反応する必要のあるケース
      迅速な処理系とディープ解析を統合
       リアルタイムにフィードバック得ながら洞察可能に
     データが沢山あっても全部見れる訳じゃない。
     見えない部分(間)を補完/推測する必要がある。
    
    Learning Systems
     従来:システム毎の出力は同一
     学習システム:持ってる知見から出力(異なる可能性、むしろ異なって然るべきかもしれない)
     進化する学習システムと人間の関与
      仮説/学習/検証エンジンの導入
    
    
    Q: 仮説/学習/検証といったこれまで人間がやってきた部分をやりたい
     ということだが、どこまでできているのか。
    A: 非構造化データにアクセスするという点と、仮説を持ち、検証する所は
     ある程度可能になった。ポリシーエンジンについても。
     完成はしていないが、Watsonとして意思決定を下せるレベルにはなった。
     一方、対話しながら混乱するケース(人ごとに異なることを主張されるとか)、
     DB内の矛盾等についての学習等、いくつか解決すべき問題も見えてきた。
    
    


    一般講演: 言語資源

    • 名詞と動詞の共起に着目した状況認識
    問題意識:会話の状況や文脈といった内容の推定
     単語の共起データの活用
      EDR電子化辞書:膨大、動詞を基準とした特殊な記述なので扱いづらい
       親密度を用いることであまり一般的でない単語の削除
        Q: 親密度はドメイン毎に異ならないか?
      インターネット上のコーパス
       検索エンジン:動詞→名刺/助詞パターン
     寄席文(三題噺)生成
      Q: 何を評価している/評価することになるのか?
    
    
    Q: 共起を利用して文を生成したものを評価するということは、
     何を評価していることになるのか。
    A: 連想的な意味での内容をうまく表現出来ているという評価になると考えている。
    Q: 共起を用いている時点でそれなりの自然らしさは実現出来ていると思うが、
     問題になるのは素朴に共起を用いることででてくる例外をどう取り除くかだと
     思う。何かしら検討しているのか。
    A: 今の所まだ未検討。
    
    Q: EDR格フレームを選択した理由は?
    A: 研究室で扱いやすい環境だったのが大きな理由。
    Q: フレームネットもあるので、それとの比較やサーベイ等はあるか。
    A: 他データとの比較は行っていないので検討したい。
    
    Q: コメントになるが、
     動詞だけにすると「頭に来る」とか意味が変わってくるので、
     動詞だけというのはやめた方が良い。
    A: ありがとうございます。
    
    
    
  • オントロジーを用いた民具研究者支援システム
  • 対象:民具(現役引退した地域の語り部になる道具、古い道具)
     民具カード:制作者毎に書式が異なる
     経緯:使用目的で検索し難い点を改善
      意味オントロジーの導入
       検索単語を含まなくても検索単語に近い内容を含む検索
       「穴をあける」といった共通項を利用した検索
     目的
      民具分類方法(文化庁分類)の抱える問題:1民具1分類
       Q: 図書の分類でも1図書1分類だと思うが、分類自体を詳細に検討
        することで解決できないのか。何が問題なのか。
      →機能分類に沿った振り分け
    
    
    Q: オントロジーを作られたということだが、どう作ったのか。
     参考にしたオントロジー体系はあるか。
    A: 先輩が作成したカクテルオントロジーを参考に。
    Q: それはアルコールというモノの種類のようだが、動作的なモノは?
    A: 動作に関しては無い。データを見ながら構築した。
    Q: 折角作ったオントロジーなので、既にあるものとの親和性について
     検証してはどうか。
    
    Q: is-a, instance-ofが出てきたが、どう使い分けているのか。
     例を見る限りではis-aにしか見えない。
    A: 「害虫is-a昆虫」ではどちらでも可能だが、
    Q: どちらでも良いのなら分ける必要性が無いのでは。
    A: 大雑把すぎるので分けた方が良いと考えている。
    Q: instance-ofはより具体的な、this とかつくようなケースだと思う。
    
    
    
  • 多対多の関係性を持つ多言語用例対訳のデータ構造の提案と評価
  • 問題意識:一意に変換できない用例(多対多)の存在
     メタノードを用いて一意に変換可能にする手法を提案
     用例対訳:一意に変換可能
      医療分野の用例対訳収集システム:TackPad
      用例間の意味の確認
       用例間リンク
    メタノードの自動生成
     部分的に完全グラフとなっているものをメタノードに結合
      メタノードの選択に問題が残る
       メタノードへの意味の付与
        フォーマル/インフォーマルを人手付与
         Q: 選択できるのは人間だけ?
         Q: 他にどういう種類がある?→病名、症状
    
    
    Q: 医療現場で試してみる?
    A: NPOと協力して病院関係通訳者らと話合って出てきたので取り組んでいる。
    Q: 実際に使ってもらった?
    A: まだ使用する段階になっていない。複雑になっているのでなんとかしたいと考えて今回の手法になっている。
    Q: 用例はかなり作成コストの負荷が高いように思うが。
    A: 今回とは別の例になるが、工夫も試している。
     花粉症に関する言葉を集めてみるとか。分野を限定するとか。
    
    Q: 完全リンクを求めてメタノードを付与するようだが、その時に完全グラフを
     構成しているノードの数の多さと重要度との関連性はありそうか。
     例えばメタノード数の大小で用途が変わるとか。
    A: 結合ノード数自体が重要になる場面は少ないかも。ただし、提供する場合に、
     2〜4では足切りした方が良いケースが多いという傾向はありそう。
    
    Q: メタノードを使うことによる本質的な利点は何?
    A: 4言語を扱ってる状況を想定して欲しい。例えばタッチパネルで組み合わせて
     使うことが多いが、言語を切り替えながら使うとなる状況でどれに変換すべきか
     が悩ましいことが起きる。
    
    
    
  • コーパスを利用した自然言語研究・学習・教育支援システムの開発に向けたRDBMSの評価
  • 英語コーパスを用いた教育者の活動を支援するシステム開発
     問題意識:コーパスを統合し、一括して解析できるシステム
      データ蓄積部分+解析部分
      統計解析・検索ツール/学習支援ツール/教育支援ツール
      ARE(Allocation of Remarked Elements)による構造表現、属性情報付与
    
    
    Q: 背景で、様々な用途を統合するという話があったと思うが、RDBではスキーマを決めてしまう必要性があると思うが、決め方や拡張性に問題は無いか?
    A: 属性付与については問題無い。
    Q: 属性情報を追加したいとなっても対応できる?
    A: テーブル増やすことで対応可能。
    
    Q: RDBを使う目的や意図は?
    A: 文の構造を管理するだけでなく、構造に対する属性情報を管理できること。
    Q: XMLのままで何故いけないのか?
    A: 解析対象が複数ある時に、様々なフォーマットがある。
    Q: 一つのコーパスに対して複数スキーマで同時に対応する?
     XML化してしまうとタグ振ることで解決できるが、
     他フォーマットでも同様のことをしたい?
    A: はい。
    
    
    
  • 自動生成された常識的知識を表現する文の自然性判定
  • 常識を利用した研究が日本語ではあまり盛んではない
     問題意識:常識データベースが公開されていない
      日本語WordNet、ConceptNet→常識的知識を表現する文の生成
       Q: 「常識的知識」を文で表現しようと考えた理由は?
       Q: 用例とは何が違う?
     同意名詞の獲得
      大量文生成
      判定(スニペット共起回数/完全一致割合/活用検索割合)
       Q: 検索エンジンの結果に依存して問題は無いか?
    
    
    Q: 常識をどのように考えているか。例えば「外に出てみたら道路に出ていた
     →雨が降っていた」というような推論? 単なる共起性の判定?
    A: 常識的知識として、常識・文化的知識・専門的知識を含む知識で、
     推論を含まない単純な知識。
    Q: 文法的にも意味的にも満たしているのは全て含む?
    A: その通り。
    Q: 共起性判定との違いは?
    A: 共起するものを閾値として利用しているが、最終的に実際にWeb中にあるもので、単純に共起しているものではないものも扱っていきたい。
    
    Q: 常識的知識を文章として表現しているが、用例とは違うのか。
     用例コーパスは大量にありそうだが。
    A: もっと大量に作りたい。まずはConceptNetのコーパス拡張。
     最終的にはパターンのような形で常識を生成できると思う。
    
    Q: 普通常識だとスニペットに出て来ない気もするが。
    A: 全く出て来ないものというのはあまり無いと考えている。件数だけだと
     除外されてしまうケースでも、割合を考慮することで救済できると思う。
    Q: 否定についてはどう扱う?
    A: 今回は処理していないが、否定文を否定として扱うこと等も考えている。
    Q: 「夏は寒くない」という文章なら沢山ありそうなので、そこから常識を
     抽出しようとした方が沢山取れそうな印象。
    
    Q: チャレンジングな課題に思うので頑張ってください。
    
    
    
  • 日中機械翻訳のためのスーパー関数抽出における対訳辞書自動構築
  • スーパー関数
     変数と定数からなる。任意一部分を変数とし、残りを定数と定義。
     変数を入れ替えることで別事象を表現。
      対訳コーパスさえあれば、スーパー関数抽出が可能→翻訳可能
    問題意識:名詞だけを変数と定義してるため、資源浪費。
     ほぼ同じ文でも異なるスーパー関数が必要になる。
      助詞と助動詞のみを定数、それ以外を変数と定義→関数整理。
      ただし、訳語の選択問題が残る
       対訳辞書の自動構築で解決したい
        主語と動詞の共起を考慮
     中国語形態素解析精度の問題
    
    
    Q: 正解率86%となっているが、この結果はどう考えられるか。
    A: 3つ以上の要素が含まれるスーパー関数が使われる文を生成したが、
     多重訳を持つ文を判定するつもりだった。その場合には誤ったケースが見られた。
    
    
    

    FIT2011, day1

    水曜日, 9月 7th, 2011


    FIT2011の初日が始まりました。

    1日目のプログラムはこちら

    FITに参加し始めたのは去年からなんですが、年々全国大会並に参加者が増えてるんじゃなかろうか。一日の構成は「午前中に1セッション、午後に特別講演と1セッション。これらと並行してイベント企画や展示会」となっているのですが、この1セッションあたりの並列度が21個もあって、全体の1割見るのすら無理になってたりします。予稿自体は見れるから良いというのもあるけど、ちょっと広く薄くなり過ぎてないかなー。狭く濃くやるなら研究会に行けよという話ではあるので、そっちにも参加する予定ではありますが。

    という訳で、あくまでの私自身が参加したプログラムに関する備忘録になります。

    午前中はイベント企画機械学習の最前線
    参加してから気づいたんですが、IBISML(情報論的学習理論と機械学習)研究会(Web URL、Twitter: @ibisml)主催のチュートリアル企画でした。興味があってMLにはROM参加しているのですが、どおりで興味のあるテーマが揃ってるチュートリアルな訳だ。プログラムにもそう書いててくれれば迷わなかったのにー。

    午後は特別講演と下地くん発表の一般物体認識セッションに参加してきました。

    青字は質疑応答時のやりとりですが、ニュアンス自体が大分違ってる可能性が高いです。

    食事の様子はこちら


    目次
    イベント企画: やさしく分かる機械学習の最前線 ~データから意味を読み取る~
     ・隠れた構造をあぶりだす ~トピックモデルを用いた潜在意味解析~
     ・こんなに使える最適化手法
     ・自然画像の事前確率分布を応用した画質改善

    特別講演: 粘菌の行動知 ~原始生命システムの自律分散情報処理~

    一般セッション: 一般物体認識



    イベント企画: やさしく分かる機械学習の最前線 ~データから意味を読み取る~

    隠れた構造をあぶりだす ~トピックモデルを用いた潜在意味解析~

    文書
     同じ文書で現れやすい単語のまとまり(トピック)
     各文書は少数のトピックを持つ
      Q: ツイート等の短文ではそもそも表出するシンボル数が少ないが、問題にならないか?
    画像
     同時に共起しやすい(写り込みやすい)対象
    
    トピックモデル=隠れた構造(トピック)を抽出するための確率モデル
     教師無し学習
     拡張容易
  トピックに相関を持たせたり、トピック間に階層構造持たせたり、
      観測データを増やしたり、etc.
     文書に限らず様々な離散データに対して有効性が示されてきている
    
    入力: bag-of-words
     単語集合表現、順序無し
     シンプルな多項分布:全文書の単語が同一分布であると仮定
     混合多項分布:複数の単語分布があると仮定(1文書は1トピックを選択)
     トピックモデル:1文書の単語が複数の分布から生成されると仮定(単語毎にトピックを選択)
      複数トピックを持つ文書も表現可能
    
    PLSAとLDA:代表的トピックモデル
     基本的には一緒で、ディリクレ事前分布を仮定しているのがLDA。ベイズ的。
     ディリクレ事前分布:多項分布のパラメータを生成するための分布
     性能的にはトピック数等実験設定にもよるが
      多項分布<PLSA<混合多項分布<LDA
    
グラフィカルモデル
     変数間の依存関係を図示したもの
    
    学習(Collapsed Gibbs サンプリング)
     θとφを積分消去:共役事前分布を用いているため可能
     入力:文書データ、トピック数K、ハイパーパラメータα・β
     未知変数:
    
    応用例
     時間変化するトピックの解析
      多重スケール時間(複数の時間スケール)でのトピック発展を解析するためのモデル
     内容と関連するタグの抽出
      ソーシャルアノテーション:SBM、写真共有等
      内容と関連しないタグ:後で読む/これは凄い(主観評価)/etc.
     ファッション推薦
      写真からコーディネートを学習、上衣から下衣を推薦
      上衣と下衣に分けて特徴量学習
    
    
    質疑応答
    Q: スーパーパラメータの推定の仕方は?
    A: MCMC+サンプリングからの導出など、事例データからの推定方法がいくつかある。
    
    Q: ファッション推薦の評価の仕方は?
    A: 雑誌写真で片方を隠した状態で評価。実際にユーザによる評価もすべきだと思う。
    
    Q: 内容に関連しないタグを抽出すると何に使える?
    A: その後の学習等の際に除外することで精度向上等につながる。
    
    


    こんなに使える最適化手法

    計算機性能向上+アルゴリズム進歩に伴い現実問題に対しても有効な手段に
     PCクラスタ利用した例だとスウェーデン全都市TSPでも最適解求まる段階に。
    
    最適化分野の概要
     意思決定・問題解決のための一手段
     定式化+最適解の計算+最適解の検証・分析
     制約条件を満たす解の中で目的関数を最小(最大)にする解を求める問題
      線形計画問題
       数千〜数万パラメータぐらいでも一般的なPCでサクサク解ける
      MIPもほぼ現実的なサイズで解けるようになってきたので、
      研究対象としては非線形なMIP等がトレンドになりつつある
    
    計算困難な組み合わせ最適化問題
     易しい問題
      多項式時間で最適解を求めるアルゴリズムが存在する問題
      割り当て問題→ハンガリー法、最短経路問題→ダイクストラ法等
     難しい問題
      厳密な最適解を求めるのに最悪の場合に入力サイズに対して指数時間を要すると
      臣事されている問題、NP困難問題
    
    現実問題に対するアプローチ
     厳密解法と近似解法
     汎用解法と専用解法
     既存ソルバーの利用
      かっちりとハマる専用ソルバーが見つかる事は稀
      汎用解法のソルバーもいろいろ揃ってきている
     自分でソルバーを開発
      試行錯誤に十分な開発期間があれば良い選択肢。
      ランダムウォークの方が効率良いことも。
    
    事例
     集合住宅における電気自動車の充電計画
     事業所における電気自動車の充放電計画
  時空間ネットワーク(time-expanded network)
     統計的機械翻訳におけるフレーズ対応
     基盤検査におけるプローブ経路計画
     多角形詰め込み問題
    
    
    Q: 整数計画問題→線形計画問題にして解き、後で丸めてしまうのが楽という話が
     あったが、0,1しかでてこないケースでも良いのか。
    A: 問題によりけりだが、0,1のケースでは丸めるのは難しい。
    Q: 0,1変数しかない場合で解き難いケースでは、メタヒューリスティックに行くのが良い?
    A: 0,1変数でも分枝限定法なりで解けるケースもある。
     必ずしもメタヒューリスティックが良いという訳ではない。
    
    


    自然画像の事前確率分布を応用した画質改善

    事前確率分布
     函館といえばイカ刺しが美味しいはず!
    尤度分布
     ひょっとしたら今朝のホテルのイカ刺しは
     東京で食べるイカ刺しと同じ味かもしれない?!
    事後確率分布
     しかし「事前確率分布」の思い込みの分だけ、
     実際にイカ刺しは美味しく感じます!
    
    事後確率最大化法(MAP法)を応用した画像処理紹介
     超解像処理、ぶれ回復処理、デノイジング処理、、
     逆問題として定式化:不良設定問題
      y=Ax+n, E(x)=||y-Ax||^2_2
      事前確率分布を設定することで一つに特定しやすくなる
    
    事前確率分布(思い込み)が大事
     観測する前から分かっている情報(思い込み)を数学的に表現し学習するのが難しい
     適応的事前確率分布モデル
     事前確率の更新(繰り返し処理)
    
    事前確率分布を使わない方法:ML法
     ML法:最尤法(尤度最大化)
     MAP法:事後確率最大化(事前確率分布を利用)
    
    
    Q: 事前情報のアップデートはずっと続けるとoverfittingになるのか?
    A: はい。
    Q: どうしたらよいか?
    A: 経験的にやることになるが、PSNRを示せる真値のあるデータで
     やってみるのも一つの方法。
    
    Q: 事前分布を構成する部分についてMAP推定しているが、
     ベイズ使うなら1点を求めるのではなく分布を求めるのが自然に思う。
    A: その通りで、最良推定に近くなっていると思う。分布を求めることも可能。
    
    Q: 画質改善の場合、見栄えを良くする場合と真値にすること自体が目的の場合とで
     分けて考えるべき?
    A: その通りで、犯罪捜査のようなケースだと真値が重要。見栄えの場合は、
     方法論としてTV対応等の場合にリアルタイム処理といったことが必要。
    Q: 提案手法のスケーラビリティは?
    A: 100枚でも1万枚でも問題内容な方法を提案。ただし位置合わせ的な前処理は必要。
    
    


    特別講演: 粘菌の行動知 ~原始生命システムの自律分散情報処理~

    迷路等の幾何学的なパズルを解くという事実
    時間的な記憶とでも呼べるような、周期的な環境変動を学習して思い出す
    個性や逡巡と思える行動
    
    粘菌紹介
    ビデオ:Like Nothing On Earth
     多核の単細胞生物:脈打ちながら周囲を覆い尽くす様
      複数の個体がぶつかり合うと1つの変形体に合体
      切っても1個体として生存
      Q: 1個体として繋がり合おうとする欲求or利点がある?
    
    パズル解き
     迷路中にバラバラに配置→合体
     入り口出口にオートミール設置→最短路へ
      生理的要請
       体が繋がっていて、十分情報交換できること
       なるべく早く大量の養分を吸収すること
    
    流れに応じて太さが変わる管(管の適応性)
     管の流れが多いと管は太くなり、少ないと細くなるという性質を持つ
     管を水道管ネットワークとしてモデル化
      管:長さと太さで記述
      えさ場:流入、流出(流量は固定)
      さらに適応ダイナミクス(強化と減衰のバランス)を導入
       保存量を介した相互作用
       個々の管が独立してバランスを保持するように固定流量に沿うように行動
       →シミュレーションで再現
    
    場所の違い:危険度最小化問題(部分的障害光照射エリアを避ける)
     光が当たっている箇所への縮小項のパラメータを拡張
     数学的に同等な問題:光の屈折(砂浜+海)
    
    どこが情報処理?
     ビット列でない「情報」表現
     物理運動が処理過程
     管同士で流れを取り合うと自ずと最短経路が求まる
      脳のような司令官が無くても賢く振る舞う仕組み?
      集団運動の自己組織化/自律分散処理
    
    カーナビへの応用
     概して悪い経路から消滅、時々刻々かわる渋滞に適応
     現行のダイクストラ法にない利点
    
    沢山のえさ場を繋ぐ
     3つの異なる性質を「ほどほど」に満足
      全長の長さが短くなるように(コスト)
      耐故障性:断線に対する連結補償性 *何でこれが必要?
      連絡距離:効率
     社会インフラのネットワークが持つべき性質
      鉄道網の粘菌式デザイン
       モデルではパラメータで耐故障性/コストをチューニング
    
    時間記憶?
     刺激タイミングの予測+思い出し
     モデルの仮定
      粘菌自体が何らかのリズム現象(拡大/縮小/動くためのリズム)がある
      そのリズムは多重である
      リズム(振動子)は位相のみ、振幅は無視
      同じリズムを持つ振動子が多数
      全振動子の平均的挙動(秩序パラメータ)が移動速度
     モデルの振る舞い
      自然刺激に近い振動数を持つ振動子群がクラスタ群(スーパークラスタ)を形成
       すぐには壊れず、予測的な動作に繋がる
       暫く刺激が無いと壊れる(重心を見るとないように見える)
    
    迷い・個性?
     弱い毒キニーネに遭遇→立ち止まる→通過/分裂/引き返し
      Q: 弱い毒で分裂が起こるなら、耐故障性との兼ね合いは?
      Q: 個性?どの個体でもいずれかを選択しうる可能性があり、
       スーパークラスタとの兼ね合いで決定される?
     暑い先端部が消えたり現れたり
      モデルのアウトライン
       ゾル、ゲルの2相流体
       ゲルの張力発生によるゾル流
       早い線形弾性と遅い塑性
      2つのサドルが近接した解起動が振り分ける
     類似のモデル
      導火線のアナロジー
       粘菌の先端らしさの活動性(燃え尽きたマッチの再生を考慮)
    
    書籍:粘菌 その驚くべき知性
    
    
    Q: 数学系の研究者らとの共同研究になっているケースが増えているようだが、
     生命とは何かということについて何か思うところはあるか。
    A: 手短に述べることはできない。ある米国研究者の議論によると「何でも
     定義できると思ってはいけない」ぐらいの定義しか出て来ないらしい。
     どれもまずは物理現象だと思おう。それでいろんなことが、生き物の
     生き物らしいことも理解できるんじゃないかと思ったのが15年ぐらい前。
     根は生物学者だが、ロジックは物理や数学。思いもよらないロジックを
     うまく使えばいろんな生命現象が説明できるのかなという期待を持っている。
    
    Q: 情報処理という分野はコンピュータの性能を良くしてどんどん早くする
     という方向に進む。スローライフではないが、それに則した情報処理技術を
     探すべきかなという観点もある。粘菌はどんな情報処理要素でどう処理して
     いるのか。そのモデルをうまく使えれば良さそうに思うが、何かないか。
     生物にならえという感覚について。
    A: そういうことを考えていきたいと本当に思う。早くなることは良いことだと
     思うが、解き方。力づくでやるのではなく、批判している訳ではないが、
     何か違う解き方が沢山ある。人間の顔認識でもそうだし、何か機会に
     やらせようとすると難しい所があるが、人間は簡単にやっているというような
     ケースがある。例えば野球でのフライの取り方。弾道計算とかはしてない。
     明示的にいうことができないことについて一つずつ掘り起こしていったら
     面白いのではないか。
    
    


    一般セッション: 一般物体認識

    • A Semi-Supervised MarginBoost Algorithm Applicable for Dissimilarity-Based Classifications
    • マルチモーダル入力に対応した重み付き多数決による識別器
    • PatchMatchを用いた類似パッチの高速KNN探索法
    • ここまで立ち見でメモできず

    • SIFT特徴量の共起を用いた一般物体認識手法に関する基礎研究
    
    Q: 一般物体認識で領域を分けるという話があったが、
     PASCALデータセットからの領域切り出しはどうやっているのか。
    A: データセット内にマスクが含まれており、これを利用した。
    
    Q: モデル1と2の違いが良く分からなかったが、
     SVMで学習するための特徴ベクトルの作り方が異なるのか。
    A: SVMでの学習は行わず、ヒストグラムでの尤度判定、
     多数決程度の処理で判別させている。尤度なりを学習させていくことは検討中。
    
    Q: 領域毎にSVM、もしくはヒストグラム化したのをSVMでそのまま学習
     させるとどうなのか。
    A: 試行実験では認識率が低かった。学習時に領域切り出しはできても、
     認識時には画像全体で特徴量を構築する必要があり、
     そのミスマッチが大きく影響していると考えられる。
    
    
  • 3次元特徴量を用いた構造表現による一般物体認識
  • 問題意識:SIFT+BoFでは位置情報や関係性が失われてしまう
     デプス情報を用いた3次元グラフ構造表現
     D-SIFT→グラフ化→グラフ編集距離→識別器
      濃淡画像をモノクロ変換してSIFT
      3次元グラフ構造表現
       近接グラフ、疑似階層グラフ
      グラフ編集距離
       Q: 各編集コストはどう調整する?
    
    
    Q: どのぐらい時間がかかるのか? 例えばリアルタイム処理可能か?
    A: 普通のPCで半日程度。
    
    Q: 最初の発表におけるDissimilarityを使うということに近いように思うが。
    A: リンゴと桃、オレンジのように形上はほぼ違いが無い。
     それを区別できるように導入してみた。
    
    Q: 距離が合っていれば形状が正しいと考えて良いか。
    A: 必ずしも正しいとは限らない。
    
    Q: グラフ編集距離の求め方は?
    A: D-SIFT上で一定値を設けて近さを求めている。エッジの計算に時間がかかる。
    
    Q: D-SIFTはダメだという話なのか、物体の形状依存なのか。
     SIFT等と組み合わせて使うと良いとかありそうか。
    A: SIFTでは取れる(区別できる)ケースでも、D-SIFTではうまくいかない
     ケースがある。デプス情報からSIFTを取ること自体がおかしい可能性がある。
    
    
  • 移動ステレオカメラ画像中からの移動物体抽出と三次元データのセグメンテーションの検討 -SIFT特徴点を元にした前景・背景のエネルギー関数を組み込んだ手法の提案-
  • 問題意識:より頑健な(様々な状況に対応できるorより制約の少ない)移動物体抽出の必要性
     セグメンテーションの精度向上
      TMRによる動物体領域抽出
      複雑な物体:アフィン変換→Feature-Cut
    
    
    Q: 従来失敗していた原因と、それが成功したのは何が効いていたのか。
    A: Feature-Cutによる
    
    Q: 動画の背景が白く、セグメンテーションとしては簡単にやれそうな実験。
     従来法は、何故グラフカットに失敗しているのか。背景全体をシードにするのではなく、
     forground の外側をシードにするとやれるのでは。
    A: 考えてはいるが、形状にも依存してしまうため難しそう。
    
    Q: 今回の実験ではアフィン変換でも良さそうだが、ダメなのか。
     またより複雑な、実際アフィン変換では難しそうなケースではどうなるのか。
    A: 試していないので分からないが、Feature-Cutが高精度なのでこちらを中心に進めている。
    
    
  • 局所的色彩モーメント不変量で構成したベイジアンネットワークによる画像照合
  • 問題意識:似た特徴を持つ画像検索では特徴の選び方が重要
    局所的色分布特徴量
     RGB、色相関など
     色相関距離
     符号化
      Q: 単純な2値化の仕方としては面白いが、実際には統一ルールでは難しくない?
    照合エンジン(ベイジアンネットワーク)
     Q: ナイーブベイズと差が出てないのはどう解釈したら良い?
    
    
    Q: 部分画像集合の特徴値分布を使う考え方はうまくいきそうに思えるが、どうやっているのか。
    A: (再説明)
    
    Q: 特徴量の分布状態を評価していることに相当する?
    A: 計算した統計量から特徴値を2値に評価しているだけ。
    
    Q: 問題設定について。全く同じ写真を探したいのか、同じ被写体を探したいのか、同じ種類を探したいのか。
    A: 同じ種類のものを探したい。
    
    
  • 画像を用いた物体の詳細情報認識手法
  • 問題意識:物体とその物体の詳細を認識させたい。e.g., TV+電源ボタン
     詳細部分:人間が直接操作を行う部分
    
    
    Q: 位置情報を用いて補正する場合の基準となる減点は、特定の一点を使っている?
    A: 既に特定された部分で、かつ、一番近い場所を捜査して推測する。
    
    Q: 例えばキーボードの場合は多くのキーがある。文字認識が間違ってるやつもあるが、それもそのまま採用してしまう? 正しく認識できたものだけ利用するとかなり精度向上すると思うが。
    A: 今は採用してしまうが、検討中。
    
    Q: 無料OCRでGoogleのものがあるが、今回商用を採用したのは精度の問題?
    A: Googleは比較はしていないが、比較した中で精度の高かった最新版を採用した。
    
    Q: OCRソフトは想定している利用状況にも依存しそうだが。キーボードやるならキーボードの辞書使うとか。
    A: 文書対象なので文書だと前後の文字から補正することも可能だが、今回はそういった補正が効かない。そういった方向も考えてみたい。
    
    Q: リモコンの場合でもキー番号が独立して配置されているが、文字と文字の間に意味があるケースだとOCRの精度が高くなるのか。
    A: 高くなると考えている。
    
    Q: 文字を基にマッチングを行っていて、SIFT特徴量等で使われている幾何的な情報が使われていないが、そういった情報を使ってみても補正しやすくなるのでは。
    A: 試作中だがまだ検討段階。
    
    

    「複雑系科学と応用哲学」沖縄研究会第1回大会, day3

    水曜日, 8月 31st, 2011

    「複雑系科学と応用哲学」沖縄研究会第1回大会、最終日3日目のメモです。

    古典論理〜関連論理周りの話については殆どついていけてなかったのですが、可能世界における矛盾やギャップを埋め合わせるために指標やスターを導入している人らがいる一方で、それらを関連性’→’のみで説明できる(=記述できる)ようにしようとしている人らがいるということは分かりました。

    言語進化学の方は、関連学会がとても面白そう。最近は実験検証が増えてきているようですが、それ以上に結果をどう解釈するのが妥当かについての討論が大変そうな印象。獲得できた言語にcompositionalな性質があるからといって、それが自然界にあるものを模写したに過ぎないという観点は目から鱗。環境要因重要だ。


    目次


    「関連論理の可能性を探る」, 吉満昭宏(琉球大学)

    関連論理から見た古典論理のアノマリー
     C.I.ルイス
     CL:古典論理→数学等
      リッチ過ぎて都合が悪いケースが。
      CLからリッチな部分を除いて構成したものがRL(関連論理)。
      他にもRL(R), RL(B) 等いろいろある。
      Rは最も強い構成、Bが中間?、Sが最も弱い構成。
    
    アノマリー
     古典論理(?)では上手く説明できないもの。
     関連論理から見ると妙に見える古典論理。
      含意、否定、連言を使った例題5ケース(式)
       *含意と条件の区別が必要で、文字通りの「含意」ではない
      a. ~p⊃(p⊃q): 偽な命題は任意の命題を含意する
      古典論理では形式的真理であるが、
      どの式も「命題p,qの間にある演繹的な関連性を無視している」ように見える。
     様相論理
      〜ねばならない(必然性)
       □(1+1=2)
       必然性オペレータの導入→可能性を考慮せざるを得なくなった
       様相論理のように単純にオペレータを導入するのではなく、
       導入することで何が起きるかを、オペレータが何を意味するのかを考える必要がある。
      〜はできる(可能性)
       ◇(1+1=2)

    意味論
     ラウトリー=マイヤー・パラダイム:純粋意味論
     「p→q」への意味を与えた。
      様相論理と比較して、人工的過ぎて本質的な意味が分からないという批判。
      →応用意味論
       自然な解釈まで得られている意味論
       例「全てのwでpが真」。wに解釈を加える。
    
    関連論理へ意味論の付与
     Copeland: 自然な解釈を与えたが、複雑。
     真理値が公理に則して演算できるように演算子を導入しただけ。
    
    実は二種類あったアノマリー
     古典→関連
      含意/演繹的関連: '⊃' → '→' *Aアノマリー(式a,b,c)
      否定: '〜' → '¬'    *Bアノマリー(式d,e)
     関連論理はAアノマリーだけで説明するんじゃないのか?
     Bアノマリーがあっても良いが、Aアノマリーとの関係性はある(説明できる)のか?
     2本立てで説明するならそこにも関係性があるべきでは?
    
    意味論のアプローチまとめ
     A~Cは応用意味論、Dは全く異なる方針。
     A. 簡潔化された意味論: G.プリースト、R.シルヴァン
      殆ど説明できてないし、スターはそもそも無理。
     B. 状況意味論: E.D.メアズ、G.レストール
      状況と状況から新しい状況を生成して説明。
     C. 内容意味論: R.T.ブレイディ
     D. 非形式論理への転換: コープランド, R.L.イプステイン
      '→'関連性のみで説明できるようになるだろう。
      でも、それだと形式論理ではない。
    
    
    可能世界 vs 状況
     '可能世界'では完全性がある。必ず真偽がある。
      矛盾やギャップを含めて説明しようとすると指標やスターが必要になる。
      でも矛盾が存在する世界を可能世界と呼んで良いのか?
       pure semantics 込みだと矛盾がある世界はどうなの?
     '状況'では良い(え、何で?)
      矛盾した信念を持ってても良い。
      信念分析の場合にwを使うのは宜しくない(?)
       別の指標が望ましい(?)
      →矛盾が存在するからといって何でも真になる世界ではない。
       古典論理だと何でも真になってしまう。
    
    applied semantics
    situation / state / event
    
    


    討論3「複雑系科学と応用哲学のコラボレートの可能性」

    キャンセル
    


    「言語とコミュニケーションの進化~実験アプローチの展開」, 橋本敬(JAIST)

    アウトライン
     自己紹介
      JAIST知識科学研究科
       人文社会系の知と理工系の知の融合
       知識の想像・共有・活用を科学する
        言語と社会制度から生まれる知識というフレームワークについて
        複雑系科学でアプローチ
      伝達創成機構
       ヘテロ複雑システムによるコミュニケーション理解のための神経機構の解明
       コミュニケーション神経情報学
       コミュニケーションとダイナミクスの次元の関係
        非線形ダイナミクスとしてできるだけ力学系として捉える(イメージ)
        理解(意味の共有):N+N2N
        協調・共感:N+N=N
         N=ダイナミクスの次元
      EVOLANG IX(国際会議)
       言語学/生物学/進化学/工学等々が集合
    
    言語進化の紹介
    進化言語学の問題設定
    言語の起源と進化
     言語起源
      言語を用いる能力の生物進化過程
     言語進化
      (言語を用いる能力による)言語の複雑化・構造化の文化進化過程

    比較認知科学
     鳥との比較が多い
      鳥は低レベルのセマンティック(?)があり、それとの比較。
      言語としての比較ではなく、言語を構成する要素/機能/程度等で比較。
    
    前適応
     別の機能を発揮することでセレクションされた能力が言語能力にも使えた。
     分解された能力の「元」は何なのか。
      例:ミラーニューロン
    
    進化という観点から、人間の本性としての言語、人間そのものを理解する。
     数理モデル、シミュレーション
    
    Chomskyらの仮説
     広義言語能力(FLB)
     狭義言語能力(FLN)
      再帰操作。
       計算システム→再帰→内部表現+有限要素→無限の表現
       音韻システム:知覚・運動システム
       意味システム:概念・志向システム
     あくまでも候補であって、これ以外を持っていても良いという立場。
     生成文法学者が支持。
      認知言語学者は誤りという立場。
    
    言語の定義
     チョムスキー一派は明確に与える
     認知言語学派はあやふや
      進化言語学として科学的に捉えやすくなってきてはいる。
    
    自己組織化
    言語進化の実験アプローチ
     合成性:単語や文の意味が、その部分と組み合わせ方の何らかの関数になっている
      赤い丸/walk+ed=walked
     構造により意味が異なる:taro watched a girl with telescope.
     繰り返し学習を実験室で実現
      Cumulative cultural evolution in the laboratory: An experimental approach to the origins of structure in human language, Kirby, S., Comish, H., & Smith, K., 2008
     シミュレーションでも実験でも自己組織化された
      言語は言語能力が獲得しやすいように進化するし、
      言語獲得能力はより複雑な言語を獲得しやすいように進化する共進化。
     inductive bias がある。
     ベイズ繰り返し学習, Kalish, Griffiths & Lewandowsky, 2007
      汎化学習されやすいように言語が構造化(文化進化)
      その結果として、合成的言語ができる
      Kirby, 2002; Brighton, 2002; Smith 2003; Griffiths & Kalish, 2005
      情報伝達システムの法則。言語はその一事例。
    
    合成性/compositionalな構造
     言語がcompositionalな構成を獲得したのではなく、
     最初から自然/世界にはcompositionalな情報があり、
     言語はそれを写し取ったに過ぎない。
      世界を分節して認知する力?
      人間だけが何でこうなった?
      情報伝達システム全般でそうならないのは何故?
       人間固有の能力に関して論じるには不十分な実験
       メタファー
    
    機能語/内容語:認知意味論
     人間特有:機能語がある
     機能語は内容語から意味変化して生成。
      行く→未来
     一方向性がある意味変化。逆方向は殆どない。抽象度の上がる方向へ。
     内容語→機能語の中に抽象度が上がる方向への意味変化。
      何故一方向性が生じるのか?
       人間特有の現象なのでこれを明かすことで特有の言語認知能力についての説明を。
      「抽象」が元々無いからでは?
      一方向性が実現する認知的なバイアス?
    
    言語の働き
     新しい概念を生み出す
    
    構成論的手法の弱み
     シミュレーション結果の解釈
    
    コミュニケーション
     動物のコミュニケーション
      平均すれば送り手が受け手の反応によって利益を得るような、
      ある動物から他の動物への信号の伝達(Slater, 1983)
       あざむき
        動物:刺激反射系でも結構複雑なことを学習できる
        心の理論/刺激反射
     ことばによるコミュニケーション
     記号コミュニケーション