琉球大学・沖縄高専第1回交流研究会を終えて
<p align="center"><a href="https://ie.u-ryukyu.ac.jp/tnal/files/2011/09/DSC01113.jpg"><img src="https://ie.u-ryukyu.ac.jp/tnal/files/2011/09/DSC01113-150x150.jpg" alt="" width="150" height="150" class="alignnone size-thumbnail wp-image-1830"></a></p>
琉球大学・沖縄高専第1回交流研究会の参加記録というか実施記録です。
皆さんからの協力を頂けたことで無事に終了することができました。ありがとうございました!
もともとの切っ掛けは、山田先生と高専側の玉城先生らが「琉大工学部」と「沖縄高専」間での連携した研究協力なりを目指して活動しましょうという連携委員になったのがフラグで、互いに複雑系(工学)という近い分野での研究していることもありまずは合同ゼミとかやってみませんかという話でした。そこからなかなか話が進んでいなかったのですが、先日の「複雑系科学と応用哲学」沖縄研究会第1回大会(1日目、2日目、3日目)でお会いした際に「今度卒研生らの中間発表やりませんか!」という話になり、日程調整や趣旨の調整、プログラム検討が始まり、今回の交流研究会という形での実施となりました。
結果としては、予定していた発表人数より減ったこともあって全体を圧縮して午後のみのプログラムでの実施で、各研究室関係者だけでなく「ちょっと興味あるから」という理由での参加もあり、合計30名弱?が集まりました。発表時間の設定も合計15分という割には討論長めの設定(発表7分、質疑8分)で、加えて最終セッション終了後のフリーディスカッションでも討論が絶えないぐらいに盛り上がりました。これぐらいならもう少し余裕持たせて午前中からやっても良かったかもしれない。一方、長すぎるとだれてしまう側面もあるので物足りない感があるぐらいで終われたのでちょうど良かったかもしれない。懇親会にも当初確定していた人数を大幅に超える学生が参加してくれたので、反省も含めてとても良い機会になったのではと思います。個人的には大成功ですね。
個人的に感じる反省点としては「琉大組の時間的ルーズさ(申込み〆切大幅に越えるとか、当日ぎりぎりまで来ないとか)」と、「発表練習不足(時間大幅に越えるとか、ストーリーの練り具合が不足していて主題が分かり難いとか)」といった所です。個々人で感じた点も少なくないと思いますので、今後に活かしましょう。
以下、発表時のメモ+質疑応答一覧です。
青字は當間が個人的に疑問に思った内容、赤字は実際に行われた質疑応答のサマリです。
私の解釈違いやメモれなかったのもあるので注意ください。
<目次>
セッション1: 座長: 与儀涼子(琉大修士2年)
- 運転者特性を考慮した自動車専用道路速度モデルの構築、安里順貴(沖縄高専本科5年・玉城研)
- 格子ボルツマン法を用いた自動車排ガス遷移解析、稲福智秀(沖縄高専本科5年・玉城研)
- GPGPUによる爆轟衝撃波解析モデルの並列化、清末尊(沖縄高専本科5年・玉城研)
- 注視特性を考慮した構内広告評価モデルの構築、濱元秀人(沖縄高専本科5年・玉城研)
- 環境の違いによる仮想生物の形態・行動共進化への影響、仲宗根翔子(沖縄高専本科5年・佐藤研)
- 衝突回避ゲームにおける行動学習に基づくコミュニケーションの創発、白﨑史子(沖縄高専専攻科1年・佐藤研)
セッション2: 座長: 名嘉真之介(琉大修士1年)
- 合議アルゴリズムにおける合議リーダー決定法の検討、當間啓介(琉大工学部4年・遠藤研)
- 交通シミュレータの現況再現性向上の基礎研究、仲本康倫(琉大工学部4年・遠藤研)
- マイクロブログからの議論の自動抽出、堀川敦弘(琉大工学部4年・當間研)
- serendipityに着目した情報推薦システム手法の検討、山内一騎(琉大工学部4年・當間研)
セッション3: 座長: 下地竜雄馬(琉大修士2年)
- スマートフォンへの実装に向けたクラウド型拡張現実システムに関する基礎研究、佐藤公洋(琉大工学部4年・赤嶺研)
- 並列処理を用いた強化学習による人型ロボットの制御、浜田晃向(琉大工学部4年・山田研)
- モバイル端末を用いたロボットインターフェース、照屋唯智郎(琉大修士1年・山田研)
セッション1: 座長: 与儀涼子(琉大修士2年)
運転者特性を考慮した自動車専用道路速度モデルの構築、安里順貴(沖縄高専本科5年・玉城研)
高速道路無料化社会実験 実施前:交通量増加による渋滞が懸念 実施後:沖縄自動車道:宜野座〜金武、50%程度増加 運転の苦手な人が合流した時に明らかに交通の流れが悪くなる目的:運転者特性を考慮した交通流シミュレーション→交通流への影響 交通量調査 調査データ→解析モデルに組み込む 運転者特性要因を組み込んだ場合の変化、無料化終了後の状態との比較 ビデオカメラによる撮影 映像から車両速度と車頭間隔のデータを取得
・運転者特性はどのように調査する? ・運転者特性として挙げられる項目は何? ・取得したグラフの見方は? Q: 交通流には様々なモデルがあると思うが、セルオートマトンを選択した理由は? A: 引用文献の中でも採用されているため。 Q: 他にどんなモデルがあるかは調査している? A: OBモデル。最適速度モデル。車両速度から前方車両との適切な車両間隔を 導くモデルがあるが、2車線以上では車線変更の概念考慮が困難。 CAは車両変更等のルールを組み込むのが容易。Q: 運転者特性がどういう影響を及ぼすのかという研究? 影響を抽出できたとしてどう活かすのか。 A: 勉強不足で具体的な応用例はまだ考えていない。これまでは単に 平均的なデータから交通流の解析が行われているが、運転者特性を 考慮することでより具体的な結果を得られると考えている。
格子ボルツマン法を用いた自動車排ガス遷移解析、稲福智秀(沖縄高専本科5年・玉城研)
自動車排ガスによる大気汚染問題 排気ガスがどのような過程で拡散するのか これまでは発電所からの排出といった固定発生源を対象とした解析 →車両の動きに合わせて発生源を移動させながら解析 目的:最適な道路形状設計。最適な拡散を導く設計。格子ボルツマン法による排気ガス拡散モデル+CAによる交通流モデル
・個別に移動体を考慮することのメリットは? ・どのような道路を設計したいから「個別に移動体を考慮」する必要性がある? Q: どのぐらいのスケールのシミュレーションを想定しているのか? A: まだ考えていない。これから検討する。 Q: 格子ボルツマン法は局所的なシミュレーションには向いていると思うが、 沢山の移動体を考慮したシミュレーションなら A: 局所的に行いたいと考えている。例えば高架橋が存在する道路中で、 その近辺でどのような排気ガス拡散が行われているかを考えている。 必要な格子数についてはこれから検討。Q: 前実験で数千ステップとかでてたけど、あれを終了するまでに どのぐらい時間がかかる? 使った格子数とかは? A: ノートPCで5〜10秒程度。約900個の格子点数。 Q: リアルな世界ではどのぐらいのスケールをシミュレーションしていることになる? A: 現実でどのぐらいの量を解析しているのかも含めてまだ検討中。 Q: 他の研究でこのぐらいのスケールでやってるとか何かしら知見があれば、 それをベースにどのぐらいまで現実的な時間で処理できる基準があると良さそう。 A: ありがとうございます。
Q: 研究目標に車両拡散ガスの拡散過程を評価した上で最適な道路形状を 設計するとあったが、より拡散しやすいように設計する? どう設計するのが目的? A: 現段階ではまだ未検討。
Q: 局所的なシミュレーションをすることのメリットは? A: 交差点や100mぐらいの空間を考えている。ボルツマン法で計算量を 考慮した現実的な規模がそのスケールに足りない場合は、 何らかの方法で拡張することを検討する必要がある。
GPGPUによる爆轟衝撃波解析モデルの並列化、清末尊(沖縄高専本科5年・玉城研)
物体に衝撃波を与えた時の物体内部における衝撃波伝播の解析 粒子法は計算コストが高い PSH法をGPGPUで並列化ベクトル加算による並列化計測 要素数1万超あたりからCUDAがベター
・ベクトルの要素は固定? だとすると何らかのキャッシュが起きてたりしない? ・どう並列化する? 並列化で必要になる演算パターンでの検証は? Q: 衝撃波伝播の影響についての研究のようだが、具体的な対象は? これは何に役立つ? A: 先行研究ではガラスの破砕が対象。そこで挙げられていたそれ以外の対象に ついて明らかにしていく必要があると思う。 Q: 爆破レンジって具体的にどのぐらい? A: 語弊があるかもしれないが、先行研究では水の中においた瓶に衝撃波を 与えた際の破砕が対象。Q: 粒子の一つ一つに影響範囲があり、その範囲内に爆風なりが当った際の 影響をシミュレーションする? A: はい。 Q: 粒子1個1個の範囲を並列に処理する? 並列化の手法はどうやる? A: 先行研究を調査中で具体的にはまだ決まっていない。 Q: 爆破は複数の粒子が同時に動く? 一つの粒子が動いて他が影響を受けていく? A: 外からの衝撃波なので、後者の方が近いと思う。
Q: 中の粒子がどう運動するのかが現時点で分からないからやるということ だと思うが、中で何が起きてるか分かると何が嬉しい? 爆破レンジ(箱の中に入れたリンゴ。形は保たれているが中は崩れている 状態。破壊具合の解析の一端)が念頭にあると思うが、何が嬉しい? そういうことまで考えるようにしよう。
注視特性を考慮した構内広告評価モデルの構築、濱元秀人(沖縄高専本科5年・玉城研)
広告をより効果的に見せる方法はないか CAで広告認識度を評価する事例 歩行者の視界はあまり考慮されていない →歩行者の行動モデルを組み込んだ評価モデルの構築 CA+心理的ストレス心理的ストレス 目的紙ストレス:目的地との距離(線形) 存在ストレス:他歩行者等との距離(円形)
歩行者特性:電子機器使用制約を持たせる
・広告評価モデルとは、広告を見たか否かを判断するモデル? Q: CAでの移動速度係数を加えるのと、電子機器使用導入とはどのような差がある? A: 電子機器使用により視界が狭まる。狭まる人を導入することでの影響が一つ。 加えて広告に3種類を考えていて、上にあるのは見られない、 下にあるのは見やすい、ということを考えている。Q: 評価の際に、絶対的な評価なのか相対的な評価なのか。何人の人が着目する のかといったカウンターなのか、広告価値としていくらなのか。どちらなのか。 A: 絶対評価の方。 Q: 絶対評価だと確かに様々な要因を考慮することに意味があると思う。 相対的な方であればあまりそこは考えなくても良さそうに思った。
Q: 先行研究で作られてるモデルの評価はされている? 心理的ストレスを考慮したモデルが現実世界でどのぐらい妥当? A: そこの評価はされていない。 A: 定量的な評価は行えていないが、定性的な評価は終わっており、 妥当性は十分あると考えている。
Q: 研究目的で「手元を見ている」という状況を想定されているが、 視野角が下方向に向いている確率が高いという状況を考え、 広告位置を上中下で評価モデルを構築する。それで何を評価したことになる? カウンターは分かるが、シミュレーションする前から自明ではないか? これで何を明らかにしたい? A: 交通流に変化が現れるということ、下にある広告の評価が増えることも 予測している。交通流に変化が現れるなら、単純に下方向だけが増える だけではなく、上と横方向についても変化がある。 どこが注目されるかが変わってくる。
環境の違いによる仮想生物の形態・行動共進化への影響、仲宗根翔子(沖縄高専本科5年・佐藤研)
生物の進化=自然選択+突然変異 環境の与える影響の強さはどのぐらい? 重力と摩擦の影響によって仮想生物の振る舞いや形態が どのように複雑化・多様化するか ・環境の影響を調べるというのは何を調べる? 重力と摩擦は環境要因の一つ ではあるが、適応度等のGAオペレータも環境ではない? ・交叉での不足分を0で補うことの影響は? ・移動距離を適応度とすることの影響は? ・重力と摩擦の組み合わせを考えて傾向観察するのは良いが、 これは環境の与える影響を考察することになるのか? Q: 移動距離で評価しているが、足の動かし方は? A: まだ決めていないが、稼働域や力は遺伝子に組み込むことを考えている。 Q: 似たような事例は良くあると思うが、足の数や長さに着目したのは何故? A: 着目している訳ではなく、今決まっているのが個数という話。 Q: 他の研究とは違うと主張したい部分は? A: 重力と摩擦の両方を変更するのがポイント。 より現実的な環境に近づけるのかなと考えている。Q: ハル・クレメントの「重力の使命」。ロバート L.フォワードの「竜の卵」。 サイエンスフィクションだけど、読んだ方が良い。 小重力の中でどういう生物が生きているかという話。 Q: 仮想の話とは別に、今回の結果をどこに繋げるのか? そこを考えておかないと昔の研究と一緒だねという話になりそう。 A: ありがとうございます。
Q: 先行研究でも適応度は移動距離を使っている? A: Karl Simsでは泳ぎの旨さ、AnLifeは単純な移動距離ではなく餌を上手く 取得するために移動が評価に繋がっている。 Q: Karl Sims も水中でのシミュレーションやってる。
衝突回避ゲームにおける行動学習に基づくコミュニケーションの創発、白﨑史子(沖縄高専専攻科1年・佐藤研)
コミュニケーションの起源:コーバリスの仮説、ジェスチャー 発生:本能的・反射的なもの ジェスチャー:意図的なもの 仮説:目的を持った「動作」にコミュニケーション上の「意味」が無鮪付き、 「意味」の伝達のために「動作」が利用されるようになる 高野・有田(2006)モデルを参考としたマルチエージェントシステム (進化ではなく)学習による獲得 Q学習+エルマンネットのハイブリットモデル 行動の学習を通して、 どのような条件下でどのようにコミュニケーションが創発されるか。 ・結果的にコミュニケーションを獲得したという事例としてはアリの フェロモン等いくつかありそうだが、今回の高野・有田モデルを ベースにしていることで明らかになるのは何? ・ジェスチャーを学習するというのは、評価を得られる環境の用意と、 その環境下で許されている機能が揃っていると、 自然に獲得しそうにも思うが、そうではない? Q: 進化ではなく学習だという話があったが、学習と進化について違いは 何だと考えている? A: 進化の場合は生まれ持った能力を保ち続ける。学習だと最初は知識を 持ってなく、知識を積み重ねて行動することを考える。Q: コミュニケーションをとるときの行動、ジェスチャーはどれぐらいの数を考えている? A: 特に与えている訳ではない。機械としての物理的な制約があるだけ。 Q: ジェスチャーの意味はどのように評価する? A: 見た目による判断になる。
Q: 評価として人間らしいコミュニケーションができているか否かという話だが、 回避行動に対しては報酬無しでも見られたとあったが、最終的な報酬はある? A: ゴールに辿り着いたという報酬はある。回避行動に対する直接的な報酬ではない。
Q: 避けることでの報酬は無いということだが、それは何の意味も無いが 避けるようになった? 避けることでプラスは無いがマイナスを省く ということを学習した? A: その通り。
Q: コミュニケーションが発生するという所については学習よりも進化の方が 相応しいようにも思う。学習できないような霊長類以下の生物が学習する? A: 考えてみます。ジェスチャーも生まれた時からできる訳ではない。 親とインタラクションすることによってできるようになると考えている。 A: 言語の起源と獲得では進化の問題と切って考える。起こすために必要な 能力だったり機能だったり、それが進化でどう獲得されるかということを 問題にする。学習だと、それをどう使えるようにできるか。
セッション2: 座長: 名嘉真之介(琉大修士1年)
合議アルゴリズムにおける合議リーダー決定法の検討、當間啓介(琉大工学部4年・遠藤研)
合議システム「あから2010」 文殊:相応実力持つプログラムらによる単純多数決 個体正解率が0.5以上の時に合議正解率が有効 思考ルーチンを多様に+個体を多く+リーダーをうまく決定合議リーダー 意見が割れた場合、優先的に意見が採用されるリーダーは必要か? リーダーを決めた方が勝率は向上 過去数手分の履歴からリーダーを選出
・履歴に基づき適切な合議リーダーを選出する(状況に応じて信頼度を調整する) という考え方は直感的には適切だと思うが、「対ボナンザ」のような 特化型アルゴリズムが対抗馬として出てくる事は無いか? (例えば、汎用性のある合議アルゴリズムを想定しているなら、 真の最適解が分からない状況下において最適な1手を求める というアプローチ自体に問題は無いか) Q: 合議でリーダーを決めるような研究って他にもある? 定石とか。 A: 意外だが見当たらない。 Q: リーダーを決めていない場合意見が割れたらどうする? A: ランダムで選ぶ。 Q: ランダム以外の方法を試行錯誤して勝率向上に向ける? A: はい。将棋に限らず汎用性は高いと思う。Q: リーダーを決めるというのは、システムの信頼度の重みと考えて良い? A: はい、途中で重みを履歴に応じて変更する。
Q: シミュレーションは将棋? 過去の履歴残して最良ケースを使うと思うが、 最良ケースってどうやって決める? A: 思考ルーチン毎に評価値があり、その評価値が高い個体をリーダーにする ことを想定。実際にその評価値が適切かどうかは別の問題。 Q: 同じ手でもルーチン毎に評価が異なる? A: 違うことも同じこともある。それを合議により適切な値で同じにしたい。
Q: 将棋以外に具体的な問題は? A: 気象庁でシミュレーション多数から合議的にやるというのがあるらしい。 ゲームで良ければ囲碁も。
交通シミュレータの現況再現性向上の基礎研究、仲本康倫(琉大工学部4年・遠藤研)
交通手段間のモーダルシフト効果等需要変動を考慮した交通シミュレータ 経路配分と交通手段選択を統合した利用者均衡配分 確率的利用者均衡配分問題点 路線バスの需要予測の精度が他と比べて低い
・現状再現性とは? ・先行研究をベースに、何をどうするのが目的? Q: 車モデルだけがミクロモデル? A: 全てミクロモデル。 Q: モノレールをミクロシミュレーションする必要は殆どないのでは? A: 人のモデルがある。モノレールに乗り換えることも可能で、 同一シミュレータである必要がある。 Q: グラフがあったのでマクロなモデルにも見える。ノード間のリンクさえ 見えたら細かいことはやる必要が無いのでは? A: モノレールについてはミクロシミュレーションはやっていない。 自家用車についてのミクロシミュレーションは実装しているが、 まだ評価が十分でない。Q: 現況再現度の評価とあったが何を評価した? 何を比べて相関が高かったのか? A: 実データでの配分具合。 Q: 実データとは? 録画とかから算出したデータ? A: 実データはパーソントリップ調査等の集計データ。 Q: それは何ですか? A: 沖縄県がアンケート調査集計したもので、出発地と目的地だけから どのように経由するのかをシミュレーションしている。
マイクロブログからの議論の自動抽出、堀川敦弘(琉大工学部4年・當間研)
Twitterにおける議論 ハッシュタグのケース ハッシュタグ無しの議論も 人手でまとめている: togetter自動抽出の問題点 議論の始まりと終わりの判別 1ツイートの情報が少ない スラング(未知語)や主語抜き言葉が大量に存在 ツイートにタグやジャンル等の情報は全く付与されていない わざと意図を隠して投稿される発言がある 解決したいこと 1ツイートの情報の少なさ、表記揺れ 未知語の取り扱い
アプローチ シードになるツイート 形態素解析、Google Suggest API、Wikipedia
・「議論の自動抽出」というのは何を抽出したら「議論」を抽出したことになるのか。 Q: Suggest APIに投げる単語はどうする? A: 全部投げて、その結果から調整する予定。Q: N-gramでやるという話だが、Wikipediaの辞書は使えない? A: 名詞として認定できない(取り出せない)ケースを取り扱いたい。 Wikipediaに存在するなら良いが、Twitterならではのスラングも解決したい。
Q: 映画のタイトルとか注目しているテーマについて集められる? A: テーマに関する話題を集めたい。 Q: あるテーマに関する議論というのはいろんなバリエーションがあると思うが、 ここでいう議論というのは何? 何を示すこととが議論を示したことになる? A: ローカルな関係の中での話し合いを出したい。シードを投げたらシードを 見ている人が母集団になる。そこから共起する発言がないかを探し出すことで 関係のあるツイートを収集する。その結果こういう流れというのが提示できる。 Q: 「こういう流れ」というのは何? A: YES/NOの2値で判断した上で、タイムラインで並べる。 Q: 時系列的に賛成反対意見といったことを見せるというイメージ? A: まとめるだけでも良いかなと考えている。 Q: まとめるだけとは? A: WISDOM的なこともやっていいかなと思うが、 togetterのように一まとまりにすること。 Q: togetter は人手でやってる分まとめ方のうまさとかもあると思うが。 A: 広がり方の係数とかもあると思う。
serendipityに着目した情報推薦システム手法の検討、山内一騎(琉大工学部4年・當間研)
情報過多、有益な情報を精度良く、Serendipityさ 意外性のある情報 既存手法で推薦されない&評価値が一定以上のもの 平均化された類似度ユーザに沿った類似度の取り方 ユーザにより見方が異なる 見方に応じて類似度を測る ・「既存手法で推薦されない&評価値が一定以上のもの」がどのぐらいあるのか。 それらと「既存手法で推薦されるリスト」とに何らかの関係/共通項が見られるのか。 Q: Serendipityをどう図るかが肝になると思うが、第一位のタグで見た時の順位、 第二位のタグで見た時の順位、といったことを見た時に、それらの商品群から 出すということでもSerendipityを考慮していることになると思う。 色々あり得そうだが、どう決めるべきだろうか。 A: ユーザにどれほどSerendipityの情報が欲しいかを決めてもらう。 ちょっとだけ意外性のあるものが欲しいとき、意外性の強いものが欲しいとき といったことを選択できるようにすることを想定。 Q: 評価はどうしたい? Serendipityがあると面白いかもしれないというのは 分かるが、その人への効用を考えると、どういう提供の方が効用を高めること に繋がるかということも考えられる。ランダムに適当に決めるというのも それなりに効果がありそう。どう効くかというのを示せるとすっきりするが、 何を作りたいのか。 A: 既存手法よりSerendipityのあるコンテンツを出すのが一番の目標。 Q: その条件内でランダムに、というのもあり得ると思う。何を推薦するか、 それがどういう効果を生むか。何か考えている? A: タグに着目する理由は何か、というのと同じ質問? Q: Serendipityの定義。そのぐらいの定義なら、履歴を使うとして ランダムベースなアプローチで十分できそうだなというイメージ。 A: 想像になるが、ランダムだと評価知的に順位的に下がってしまう可能性が 高いと思う。評価値をキープしつつSerendipityを提供したい。
セッション3: 座長: 下地竜雄馬(琉大修士2年)
スマートフォンへの実装に向けたクラウド型拡張現実システムに関する基礎研究、佐藤公洋(琉大工学部4年・赤嶺研)
ビジョンベース/センサベースAR 目的:観光案内ARアプリケーション 詳細トラッキング:ビジョンベース、マーカレス ビジョンベースARのクラウド化 ・バッテリー問題:通信電力<クラウド? ・クラウドを考慮したタスク分割/負荷分散のために考慮すべき負荷は? ・タスク分割をスケジューリングするのはクライアント?サーバ? Q: カメラ位置姿勢につかうアルゴリズムは? A: PTAMを予定。 Q: 最終的な目標は? A: 屋外で使用できる観光案内AR。建物の表示とか。 Q: 観光案内では正確な位置が必要? 建物だと正確な位置が必要とは思う。Q: タスク分配の例があるが、これ以外の分配例は想定しているか。 A: クライアント毎にスペックが異なるため、異なる最適分配があると思う。 Q: バッテリーと容量の問題は、マーカレスビジョンベースにする必要がある? ある程度の情報さえ分かれば、文字情報だけサーバから送るとか。 精度に拘った理由は? 使用用途としてどういうのを想定している? A: 観光案内するARアプリ。センサベースだと建物が密になっている場所で困難。 10m程度の誤差が出る。観光案内としてはビジョンベースが向いている。 Q: 大雑把に数十メートルにタグ付けするとかではなく、込み入ってる箇所で精度が必要? A: はい。
並列処理を用いた強化学習による人型ロボットの制御、浜田晃向(琉大工学部4年・山田研)
多種多様なロボット。ロボット制御→強化学習。並列処理。 目標:人型ロボットを例に、並列化強化学習強化学習の制御 安定した学習動作/高次元の問題空間 ZMPと基準点との差 重心が左右へ移動する量を学習
・ただでさえ高次元という話なので困難かもしれないが、 ZMP以外のパラメータも考慮して同時に複数の最適パラメータを 学習するようなことはできないか。 Q: 教科学習の回数と移動距離のグラフがあったが、7千回以降で伸びないのは何故? A: 先行研究での結果なので分からないが、最終的に伸び悩んでいるなら 別アルゴリズムも考えられると思う。今回は人型ロボットに適用した結果から 検討を行いたい。Q: エージェント数20とあるが、何をやっている?個別に学習している? A: 各々が独立して学習し、あるタイミングで合成→配布ということを繰り返している。 Q: エージェント数20という数字は最も良かった数値? A: いくつか試行した中での良かった例。 Q: 結果として良くなってるのは見て取れるが、何で良くなると考えられる? A: 価値関数を更新する際に他エージェントの価値関数をひっくるめて合成する。 各々が良い学習を行えている。 Q: 理屈としては、Qテーブルの空間が広いとか考えた時に、一般的にQ学種とか sarsaで考えたらやってればいい結果になる。GAとかで考えると多点探索とか やって各エージェントがやったのを合成するから良くなる。 というような理解で合ってる? 1個体だけで考えると「やったのを評価されることで学習」する。 多点でやらるから良くなる? A: はい。
モバイル端末を用いたロボットインターフェース、照屋唯智郎(琉大修士1年・山田研)
モバイル端末を用いたロボット制御 モバイル端末のセンサーからの教示 倒立振子シミュレーション ・モバイル端末をロボットから人間へのインタフェースとして利用するという 話のようだが、どのような応用を想定しているのか。 Q: 倒立振子のプログラム作成して、何かしら社会に応用できるのか。 A: 最終的にはロボットに人の動きを真似させたい。人の動きを教示する。 Q: 今後何か具体的に考えているものは? A: 倒立振子の話になるが、ファジィルールの獲得を考えている。Q: ロボットに人間の行う動作を教示したいというのが目標のようだが、 それが目的であれば今までの先行研究では「カメラで撮って動き検出を 覚えさせる」とか「教示者が動かしてあげてサーボから受け取る情報で覚える」 とか思いつく。それができないような大きいロボットを想定している? マーカを付けて検出するより安価かもしれないが、例えば人型のように 複雑になってくると、擬似的な3Dの中で複雑な動きをどうやって教示するのか。 A: モバイル端末でやっていきたいが、 Q: 例えば人型ロボットを歩かせるとかバク転させるとか。この動きだけで表現できるか。 A: 加速度センサーだけでなくタッチパネルも使えるし、 他のセンサーが乗った端末でも良い。モバイルに拘りがある。 Q: 何でファジィルールを設定している? NN使うならそれで全部できない? A: 当初ファジィルールで考えているが、最終的にはNNだけでやろうと思っている。 Q: 普通のフィードフォワードNNを選んだ理由は? A: 加速度抽出した際に明らかに異なる行動が混在していることが見られた。 時系列を考慮する必要が無い。