FIT2011, day3
FIT2011の最終日が終わりました。
午前中は一般セッション「数理モデル化と問題解決(2)」で座長として参加。
午後は一般セッション「分類」に参加してきました。
全日程に参加しての印象は、イベント企画の面白さと、一般セッション間での差の大きさ。座長や参加者の頑張り具合で何とかなるケースもありますが、アブストand/or予稿で多少は落とすことを考えても良いんじゃないかな。それなりの落とす理由を付して返却するコストは増えるけど、残念な発表もあるし。発表練習みたいな場所があっても良いと思うけど、それがFITでサポートする部分なのかはちがうんじゃないかな(個人的な考え)。
ちなみに、FITの創設経緯によると「従来の大会の形式にとらわれずに、新しい発表形式を導入し、タイムリーな情報発信、議論・討論の活性化、他領域研究者との交流等の実現」ということで特定領域に拘らず幅広いセッションがあるのは良いのですが、交流という観点では質疑応答と懇親会ぐらい?
勿論自分から動けば良いだけの話なんですが、「多種多様なデータが必然的にクロスするドメインがこれから解決すべき領域」というような話が講演会で出るぐらいなので、もう少し積極的にクロスする(せざるを得ない)ような仕組みがあっても良いんじゃないかなと思います。一部の学会では「学会開催中の盛り上げ方」自体を研究テーマにして実際に試行運用してるケース(下記例参照)もあることだし、情報処理学会でその方向に動けないのはちょっと残念。実施コスト高いので手を挙げる人がいないとやれないというのは分かりますけどね。
・例1: WISS2010改革内容のまとめ
・例2: 人工知能学会全国大会、インタラクティブセッション特別企画、メンタリングセッション内企画
・例3: 自然言語処理学会年次大会、自然言語処理における企業と大学と学生の関係
ということで、以下、参加してきたセッションのまとめです。
青字は質疑応答時のやりとりですが、ニュアンス自体が大分違ってる可能性が高いです。
目次
・一般セッション: 数理モデル化と問題解決(2)
・一般セッション: 分類
数理モデル化と問題解決(2)
座長として参加してたので実際の質疑応答をまとめる時間は殆ど取れず、大まかな発表のメモと事前に予稿を読んで私が感じた点のメモや疑問点になります。いくつかの発表を除いて活発な質疑があったので殆ど質問できなかったけど、量子ビット表現したGAの方はセッション終了後に話を伺うことができました。
問題意識:モンテカルロ碁に対し枝刈りによる計算量削減
Q: 他手法との比較は?
Q: ポテンシャルモデルと他物理モデルとの違いは?
Q: ポテンシャル値の与え方は同一で問題ない?
Q: 枝刈りにより棋力が上がるのは何故か?
→誤った手を打つ可能性を除外できた可能性
Q: 9x9の小さな盤面での評価を行っているが、
これは19x19でも同様の傾向を示すのか?
→今後の課題
<事前疑問点>
Q. モンテカルロ碁の計算量削減について他の枝狩り方法等があるようだが、
それらとの比較考察はしたのか。
Q. モンテカルロ碁の特性そのものを解析したり、近似することが目的?
(近似が目的なら、どのぐらい計算量落とせた上でどのぐらい近似したか
を示す際に勝率(棋力)だけでは不十分に思うが、他に特性がうまく近似
出来ているかを検証する方法は無いだろうか) それとも近似した上でより
強いモデルの構築等に繋げることが目的?(今後の方向性は?)
Q. 特性の近似具合を図る指標として一致率や含有率を採用しているが、
これらの指標では「実際には採用しない」部分が多く含まれるが問題無いのか。
言い換えると、ノーマルのモンテカルロ碁により得られる勝率分布全体を
近似することが目的なのか、勝率分布を利用して手を選択する部分を
近似したいのか、どちらなのか。
例えば、勝率分布としての近似を見る場合、両者とも「合法手」を基準にした
指標になっているが、その逆は考慮する必要が無いのか。すなわち、
モンテカルロ碁により合法ではないと判断した所の一致率は見る必要が無いか。
Q. モンテカルロ碁との一致率や含有率の観点からは、その性質上基本的には
ランダムが最も良く近似できそうに思える。棋力も考慮すると序盤をランダム、
中盤は後半から別フィルタとの組み合わせが直感的には良さそうだが
検証してみたか。
Q. 各フィルタの特性や棋力は、ポテンシャルの与え方の性質上、
碁盤のサイズによっても変化がありそうだが問題にならないか。
問題意識:多対一マッチングにおいて下限導入
下限導入でも動くようにアルゴリズム拡張
例:研修医配属問題、タスク割り当て、震災地ボランティア
選好を考慮する→Multi-Stage導入
Q: 下限制約が求められる問題例にといて、完全で厳密な選好を持つという
前提は問題にならないか?半順序に拡張することは可能か?
Q: 戦略的操作不可能(偽の選好を表明しても特にならない)+全順序選好リスト
必須という前提は本当に望まれているのか?
→選好仮定の緩和、不完全や同順を許した選好
<事前疑問点>
Q. 定義1の条件2の意図が良く分からない。
学生iは「|M(lj)|<qj」の時点で学生i'とは無関係にljに配属すべきにも思うが、
どういう状況を表しているのか。
Q. 学生や研究室の選好リストが全順序であるというのは困難な前提に思えるが、
問題にならないのか。
Q. 選好リストに駆け引きが含まれている場合、その影響を加味したより簡易な
解法は考えられないのか。例えば、戦略的操作不能では「自身の真の選好
リストを申告した際の効用最大化」を意味するようだが、偽の選好リストを
申告することで効用最大化を図ることは考えられないか。(実際問題として
そのようなことが行われていないのか)
Q. 似たような質問になるが、ブロッキングペアに含まれた学生は、
本当にブロッキングペアだったのか。また、ブロッキングペアではないと
判断された学生は本当にそうだったのか、についての調査結果はあるのか。
Q. 実際の「正当と認められる不満」は、定義1や2で必要十分に記述出来ているのか。
Q. 3タイプのブロッキングペア数を指標として用いた安定マッチングを
導いていると思われるが、導いたマッチングに関して何らかの批判は
出ていないのか。
Q. 本質的な話とはズレてしまうかもしれないが、ブロッキングペア数だけを
最小化することが目的で良いのか。例えば、ブロッキングペア数自体は
最小だが、ある学生は極端に選好順の低い研究室に配属されているといった、
学生毎もしくは研究室毎の選好満足度のバラツキが極端に低いマッチングが
与えられていたとしても問題ないのか。
問題意識:BMSNの最適ノード配置による伝送効率化
Q: 高負荷トラフィックが生じるノードは時々刻々と変化しそうだが、
その都度最適配置を求める必要があるのか。
Q: アントサーチでアントのいる行と列全ノードを再配置対象にしているが、
このように設定した理由は何故か。
Q: イータによる問題領域固有情報の効果が高そうに思うが、
ACO以外の他の手法でも同様の設計を導入することで改善できたりしないか。
Q: IKLSより平均的にすぐれているとのことだが、最悪時等での差はどうだったか。
<事前疑問点>
Q. アントサーチの際に、未割り当てノード集合N^kが、同じ行と列方向
全てのノードとなっているが、この設定はどのようにして決められるのか。
ノード距離でいうなら同距離に位置する斜め方向も必要だと思うが、
特に考慮する必要はないのか。ネットワークのサイズに依存してどこまで
考慮するのか(全ての行や全ての列で問題無いのか)も調整が必要に思う。
Q. アントサーチと切り離して考えるのは困難かもしれないが、問題領域固有情報の
与え方自体の効果が高いように思える。同様の与え方を他の解法に組み込むこと
はできないのか。言い換えると、ACOが解法としてすぐれているのではなく、
制約の与え方がすぐれている可能性はないか。
Q. 高負荷トラヒック間のホップ数が1であることが最良のノード配置とのことだが、
トラフィックには入力と出力があり、それらの対のホップ数が1であることが
最良ではないのか。また低負荷トラフィックは無視して問題無いのか。
Q. 実用上の制約は全て含まれているのか。計算リソース上の制約や、時間の制約等。
問題意識:船のような複数移動体が同一領域共有通過
Q: 入域点、出域点を増やしても適応可能か。
→今後の課題
Q: 入域点のある問題設定が良く分からないが、何のためにあるのか? 具体的な例は?
Q: 買い物のレジと違う点は?
→移動体間隔制限が違うと思うが、未調査
Q: 全体遅延を最小化することで個別のユーザに必要以上の遅延を強いることに
なると思うが、そこについて何かしら下限なりを設けることはできるか。
→調整可能
Q: 「公平性の損失」で順序しか考慮されていない(時間が加味されていない)が
問題無いか。
Q: 移動体の種類が3種以上に増えても問題無いか。
<事前疑問点>
Q. タブーサーチのようだが、タブーはどこでどのように設定している?
Q. そもそも求めたいものは何? 問題設定が良く分からない。
移動体は三種類以上に増えても適応可能?ユーザはどれでも自由に乗れる?
移動体のコストは?
Q. そもそもGAのような大域的手法が向いていない問題設定に見えるが、
セービング法等の局所探索手法との比較は?
Q. 今回の手法は移動体が3種以上であっても適応可能か。
量子力学的原理+GA
量子ビット表現、量子重ね合わせ状態を模倣
問題意識:整数型の遺伝子表現を可能とする表現法
移住処理→対交換処理に置き換えることでパラメータ数減少
Q: 観測結果は毎回異なる?
→世代毎に一度ずつ観測
Q: GAと比較してどのていど計算量が増えるのか。
→ほぼ同等
Q: 収束状況や適応度変遷具合から決定したようだが、
回転角度は変動させることはできないか?
→SAのようなやり方も可能だと思うが、
島GA的な操作が内部に含まれるため殆ど必要ないと考えている。
Q: 実験2の結果で、適応度は最適に近いところまで獲得できた? 局所解に収束?
事前疑問点
Q. QEAにおける「量子ビット表現」とは? ユニタリ変換とは?
一般的なGAとの違いはコーディングのみ?
Q. QEAも知らないのでご教示頂けると嬉しいのですが、QEAやQEAPSは
一般的なGAと比べて計算リソースも少なく、計算時間も短くて済み、
得られる解の質も高いという傾向があるのだろうか。
Q. GAは、島GA等の並列処理しやすいアルゴリズムだと思うが、
QEAやQEAPSも同じような並列化は可能か。(観測とかユニタリ変換とか
分からないので、並列化に不向きな点があれば教えて欲しい)
Q. QEAPSでの探索性能の差が僅差であることについて、
一般的なGAでいうところの局所解に陥りやすい枠組みになっているという
ことは考えられないか。図3で示されているのが十分最適解に近い適応度に
達しているなら、より大規模/複雑な問題でも検証してみるべきではないか。
Q. 一般的なGAと比較して、QEAPSでもまだパラメータ数が多いように感じるが、
これらのパラメータの中で省略もしくは自動調整するようなことが
考えられそうなパラメータはあるのか。
ミルグラムの実験、6次の隔たり
閉路が存在する場合の重複を考慮したい
スモールネットワーク/スケールフリーネットワーク
閉路の数で情報伝達のしやすさが真逆
中間的ネットワークモデル2種類考察、
次数分布エントロピーの情報伝達に及ぼす影響⇄閉路の影響
p次一般化クラスタリング係数C(p): ネットワーク内の多角形構造量を表す一指標
ミルグラム条件Mn: n次の隔たりが成立する条件
スモールワールドネットワーク:C(p)が大きくなると情報が伝わり難くなる
閉路が情報伝達を阻害
スケールフリーネットワーク: Xn,C(p)が増加するとMnが大きくなり、n次の隔たりが満たしやすい=情報が伝わりやすい
閉路の数の増加が情報伝達を促進
中間的ネットワーク
スケールフリー(sk)→スモールワールド(sm)
(sm)張り替え率Pの増加と共に、局所クラスタリング係数Cと最短平均パス長(≒Mn)が増加=伝達し難い
Pの増加=ランダムネットワークに近づける?
スモールワールド(sm)→スケールフリー(sk)
(sm)
→閉路数ではなく次数分布エントロピーが情報伝達に影響
Q: ミルグラムの実験で閉路の影響で遠回りするという話があったように思うが、
閉路はカウントしていないのでは?
Q: 中間的ネットワークの作成方法が影響していないか。
→傾向確認済みで問題無い
Q: ミルグラム条件Mnと最短平均パス長Lに良い相関が見られるということを
利用しているが、ネットワークの作成方法は影響しないのか。(中間的ネット
ワークにもいろいろ考えられ、今回想定した中間的ネットワークではこういう
傾向だったというだけ?)
<事前疑問点>
Q. XnやC(p) は閉路と等価な、もしくは近似された指標? XnやC(p)は多角形構造
を用いた指標になっているが、多角形構造を閉路と言い換えているのは
何か理由があるのか。
Q. ミルグラム条件Mnと最短平均パス長Lに良い相関が得られていることが
示されているようだが、先行研究でも中間的ネットワークのような操作を
行ったネットワークに対しての調査も行われているのか。(言い換えると、
ネットワーク生成法が与える影響は十分無視できるのか)
Q. スモールワールドにおいて、張り替え率Pを上げることがランダムネットワーク
に近づけることと解釈しているようだが、その解釈は正しいのか?
(例えば張り替え操作は、ハブと連結しているノード間に枝を張り、
代わりにハブから出ている枝を削除するという2つの操作がセットに
なっているが、この1セットが処理されることにより何らかの偏りが
生じる事はないのか)
仮想スマートグリッド環境、マーケットプライス
問題意識1:電力コスト高い時に買ってしまう恐れがある
高コスト→電力使用を避ける
生活スケジュールの推薦
問題意識2:スケジュール推薦の上での目的
電力会社からできるだけ買わないように
安いマーケットプライスを望む
スケジュール最適化(次の日の生活スケジュール)
生活行動毎に時間、期間、分割、並行、代替条件を設定
Q: 需要と供給の関係からマーケットプライスの変動が設定されているようだが、
2つの組み合わせしかなかった。それ以外の状態ではどうなる?
Q: 目的1と2を合算して考慮しない理由は?
<事前疑問点>
Q: 推薦されたスケジュールに合わせた生活は可能か?
例えばTV。録画はどうする?
一般セッション:(言語処理の)分類
座長さんも聴講者も予稿までちゃんと目を通した上での質問が多く、質疑時間5分の割には濃厚な時間になってました。凄い。
問題意識:学習カルテ提供による自己分析/引き継ぎ資料作成コスト削減
Q: TFIDF正規化/非正規化でノイズワードは正規化した方が多くなったが、
最終的なF値ではどちらが良い?
A: F値では差が見られなかった。
Q: 普通に考えると正規化した方が良さそうに思うが、何故差がでなかったのか。
例えば「こういう例があった」というものが無いか。
何故ノイズワードが増えるのか。
A: 設問において文字数が多くないので正規化/非正規化で何か差が出ると
思ったが、あまり見られなかった。
Q: その辺りも考察してみると良さそう。
Q: そもそも非正規化よりも正規化がうまく表しているという根拠が
ノイズワードだけにみえるが、何故それを根拠にしたのか。
A: 以前の実験で、TFベクトルとTFIDFベクトルで行った際にはノイズワード数の
大小で比較できた。
Q: ノイズワード以外に現れている語に重なりもあるが、違う語も出てきている。
どちらの語がより設問の特徴を表しているかについては検討したか。
A: 今回は考えていなかったが、今後考えていく予定。教科書にある太字単語等を
重要度にして指標として使うことを考えている。
Q: 試験全体において設問を特徴付けるような語はそもそもあるのか。
データを眺めていて気づいたものがあれば。
A: 教科書の太字単語は良く出てくる。
Q: それなら太字を使えば良いのでは。
問題意識:報道姿勢や内容には各国の思想や文化等による違いが表れる
ユーザが各国の価値観の違いを比較できるシステム
各国がどのような話題に注目しているか
ある話題に対する各国の注目度の差の比較
Q: 話題の定義は?
Q: タイトルや本文をどうベクトル化する?
Q: 国別クラスタリングはどうやる?
Q: 国別クラスタ間のマッピングは1対1対応とは限らないのでは?
Q: クラスタリングして対応付けるということだが、
クラスタ数はどれぐらいになった?
A: 1記事でクラスタになることが殆ど。日本記事数1655で
クラスタ数600~700程度。
Q: どれか1国を決めて基準になるクラスタを決めて対応付ける方が良いのでは?
A: 国別のクラスタリング結果F値が大きく異なるため、
基準を設けるのは難しそうな印象。
Q: 各国の注目度の差を見たいということに対して、今回のタスクは同じ記事か
どうかを推測するタスクになってるように見えるが、今回のタスクはどういう
位置付けなのか。類似度の高く無い意味とか。
A: 報道の方向性が似通ってるなら全体的に類似度が高くなるが、
違ってる場合には重要後のみが共通しているという状況が出てくると思う。
そういうところからアプローチしたい。
問題意識:記事への出典付与コスト緩和
Q: 信頼性を高める際に出典付与の有無だけで判断して良いのか。
記事毎に出典傾向が異なる
出典のつけられていない記事に対して出典を探すべき媒体を提示
一つの記事が複数カテゴリに所属
カテゴリ毎の社会的認知度に差がある
→より狭い範囲でのカテゴリ毎に平均した傾向を取る
Q: 記事単位ではなく、文章単位とかより細かい単位での出典傾向、もしくは出典が求められるといったことを提示できないか。
Q: 存命/非存命で分けるという観点は面白いが、急に無くなられたからといって
傾向が急に変わるという訳ではないと思う。
A: そういった例もあるが、将来的には生まれた年によるグルーピングも考えている。
Q: そういうパターンがカテゴリ毎にも変わるんじゃないか。
A: 検討したい。
Q: 根本的な所は出典傾向が似ていれば一つのグループにまとめられるのでは
ないかということ?
A: 出典傾向がまとまっているグループを見つけるためにグルーピングしたり
出典付与具合で確認している。
Q: Wikipediaで出典を出す場合に参考にするということのようだが、
出典傾向からグループを作成することもできるのでは。
A: 検討したい。
Q: 出典傾向については納得したが、編集者にとって出典を探すための支援に
これがどのぐらいになるのかが見え難い。出典支援を考えたら出典は記事の
まとまりや一文毎につけたりすることもある。どのぐらい有効になるのか。
A: 何も情報がないよりは傾向を出しておけばマシだと思う。Wikipediaは
仮出典つけるとしても編集者によって消されることもある。
Q: 調査結果は面白いので、もう少し別の方向に活かすことも検討してみてはどうか。
問題意識:事象の扱われ方の違いを検出
問題意識:新聞社毎の見解や意見の違いを検出
クラスタリング→文間の対応付け
形態素一致率
Q: 単位は「文」で問題ない?
Q: 文間対応はクラスタリング結果が影響していないというようなことを
述べられていたが、文間対応の結果も良いかイマイチか言いづらい結果に見える。
A: 再現率に関しては影響が無い。
取るべく対応のものは同一クラスタに存在することを確認済み。
Q: 文間マッチングする際の文の選択はどうやる?
A: 1〜3文単位での総当たり。
Q: 「ある出来事」というのは時間的推移がある。DPマッチング的な遷移を
含めた応用は考えられないか。
A: 記事の日時は取っているが、まだやっていない。
Q: もう少し緩く対応を取るとかしたくなる時に使えないかと感じた。
Q: 最初の質問について、今回の実験では問題無かっただけで、
今後のデータ次第では問題になることも考えられる?
A: 可能性はある。
Q: クラスタリングを使わない手は考えられない?
A: 総当たりのため、計算量削減のためには必要。時間的推移的な類似度の
利用等で代替も可能かもしれない。
Q: ある新聞社はある評価をしつつ、別は評価をしていないこともありえる。
そこはどうやって扱っていこうと考えているのか。
A: クラスタリングで考えている。
検索結果をクラスタリング提示
クラスタへのラベリング:重要な単語TFIDF
問題意識:TFIDFだけでラベル決定できない
一致率の採用
Q: TFIDFとの比較結果は?
Q: 既存ロボット型問題点としてユーザがキーワード思いつかないケースを
上げられたが、システムにおいて検索結果を取得するのは誰が行う?
A: ユーザが行う。
Q: キーワード思いつかないケースに対してそれは適切なのか?
A: 思いつくのが難しい場合、より曖昧なキーワードを入力すると思う。
曖昧なキーワードを入力した上で検索結果から得られる下位概念を提示する
ことで対応している。
Q: 正解ラベルを生成するのは実験者がやっているようだが、その判断基準は?
迷ったりすることはなかったか。
A: 迷うことはあった。ラベル一つしかつけてないがラベルにも複数の意味がある。
同じ内容を表していても違う単語のケースとかも。
厳密にしていく必要性は感じている。
Q: そこが基盤になっているので複数人に評価してもらっているのは良いと思うが、
人によってWebページの捉え方が異なると思う。処理は難しくなるかも
しれない。大量の正解ラベルを付与しておいてそこから絞り込むような流れの
方が良いように思う。今回のように1ラベルで解決しようと下理由は。
A: 実験前の段階ではそのような差異がないと考えていた。
しかし実験するにあたり複数ラベルの必要性を感じた。付けてる傾向はある。
Q: ラベルを名詞や複合名詞一語で表すことはそもそも可能なのか。
WISDOMだと極性とかも考慮されている。ラベル1語というアプローチは、
本来目的とされている「利用者が探しやすい」という要求を満たすようなものなのか。
A: そのような評価はまだやれていないが、確かにラベル1語ではなく複数語を
検討する必要性は感じている。
Q: 次元数削減はクラスタリングで削減?
A: クラスタリング前に削減した上で、クラスタリング。
Q: ラベルの次元数を削減するということとラベルを選ぶことの次元数を削減する
というのは同値? 「次元数が多いトラベル候補が増加」というのはどういう
意味? クラスタリングの次元数を減らすかどうかは別問題?同じ問題?
A: 両方を対象としている。クラスタリングする際にも素性が多すぎると問題が
起きるので、良好な素性のみを使ったクラスタリングを行いたい。