曖昧にすることで扱いやすくなることもあれば扱いにくくなることもある / KES2013, day3
KES2013の3日目、最終日が終了しました。プログラム的にはキーノートx1件と口頭発表セッションx2件という流れ。
3日間全体の時間的には大分バッファが多く取られていて2日間で詰めて実施した方が金銭的に嬉しかったなと思ったり。例えばセッション間の休憩時間全て30分あるし、朝の開始時間遅めで終わり時間早めだし、人数少ないセッションもあったし。一方で、予稿集は該当論文を探しづらい(悪い意味でのてーげーどころじゃないレベルで酷い)どころか、ヘタするとそもそも掲載されてない論文があるっぽい。探し方が悪いだけかもしれないけど、見つからない。「これは酷い」状態だったりしないかしら。。
Keynote5: Intelligence in Microfluidics, Prof. Danny van Noort
マイクロスケールでチューブ&バルブを操作して液体の流れを制御するMicrofluidicsで論理ゲートを実現するという話。方向性としてはDNAコンピューティングよりは簡易に扱える超並列な計算機を目指しているのかな。空気で流れを制御したり、FPGAみたいにゲート自体を自動構築できるようにしていきたいとのこと。DNAコンピューティングと比較すると並列度がかなり落ちそうな気がするのだけど、many cores な時代になってきてる中でどういうところに落としどころがあるのだろう。消費電力/リソースとか?
Intelligent Design and Operation for Sustainable Process Systems and Chemical Plants
午前のセッションは畑違いだとは思いつつchemical plantsは置いといて「Intelligent Design」やいくつかのキーワードに惹かれて聴講してみました。
1番目の発表“Adaptive soft sensor model using online support vector regression with time variable and discussion of appropriate parameter settings”は、「計測しづらい変数(?)を推定するために使われているsoft sensorsがあるけど、gradient changes か rapid changes に対して精度が悪いから、time-varying(時変)を考慮して推定しよう」というような話らしい。理屈は分かるのだけど、実験でデータセットが少なかった(100件)ので具体的に想定している状況の難しさが良く分からず。データ件数がそれだけ少ないならonline学習させずに全体をバッチ学習させれば良いじゃんとか考えてしまうんだけど、そういう問題ではないのかしら。
4番目の発表“Application Methods for Genetic Algorithms for the Search of Feed Positions in the Design of a Reactive Distillation Process”は、多様性を維持するように拡張されたNiche GAでもまだ収束しがちなので、より多様性を維持しつつ探索能力を向上させるためにmulti-niche crowding GA (MNC-GA) を提案するという話。ポイントは選択操作にあって、一度ランダムに複数個体を抽出し、そこから「最も似た個体をセレクトする」が胆らしい。実験でもそれなりに良くなってるのは分かるのだけど、そもそもGA自体の拡張が大量にある世の中なのでこれがどのぐらい効いているのかは良く分からず。
5番目の発表“Generating Alternative Modules for Plant Alarm System Based on First-Out Alarm Alternative Signals”は、タイトル的に「代替モジュールを自動生成する」話かと思ってたのですが、単にGAで解探索するというような話。期待してたのに〜。
別セッションで少しだけ覗いた“Floating Point Arithmetic Protocols for Constructing Secure Data Analysis Application”は、浮動小数点な演算精度をより高めるためのプロトコル(?)を話していたらしい。最後のconclusionと座長さんが褒めてる所だけ見かけました。(その次の発表”Feature Based Summarization of Customers’ Reviews for Online Products”を見たかったのだけど、キャンセルで見れなかった)
お昼はリーガロイヤルホテル小倉でやってたバイキング。個人的には昨日のレストランが美味しかったかな。ただ、胃袋が尋常でないマッスルメンたちに囲まれてたので、ここで良かったんだろうとは思う。(彼らは1,500kcalぐらい食べてたんじゃなかろうか。。)
Collective Intelligence and Intelligent Data Analysis
最後は集合知とデータ分析関連のセッションに突撃。AHPな話が多かったか。
1つ目の“Dual Exclusive Partition in Fuzzy CoDoK and SCAD-based Fuzzy Co-clustering”は、共起を使ったクラスタリングで「アイテムは1つのクラスタにのみ属する」という制約が付けられてることが多く、この制約が強すぎて「あるアイテムはクラスタ1にもクラスタ2にも属する」というようなクラスタリング結果を得ることができないので、その制約を単に外すだけじゃなくて緩い制約を導入したクラスタリング(Fuzzy co-clustring)を提案するという話。
2つ目の“A Greedy Algorithm for k-Member Co-clustering and Its Applicability to Collaborative Filtering”は、プライバシー保護のために、Anonymity Level(秘匿度レベル?)が高いデータを想定しつつ、高い精度でクラスタリングしたいという話なのかな。クラスタ数ではなくてクラスタに含まれるアイテム数kを決めてやるk-Member Clusteringをベースとして、クラスタリング時に共起を考慮するとのこと。
3つ目の“Introduction of Majority Vote of Neighborhood Conditions for Sneak Form Reinforcement Learning”は、強化学習におけるメモリ食い過ぎ問題を改善しようという話。シンプルに「使わない(状態s, 行動a)のペアを削除する」というChine Form RLだと頑健性が無さ過ぎなので、どのペアを残すかを多数決で決めよう(Majority Vote of Neighborhood Conditions)という主張。実験結果でもメモリが少なく&性能良くなってたりするんですが、これってtoy problemsだからそうなってるだけな気がするのは気のせいなんだろうか。
4つ目の“Intergration of Information Based on the Similarity in AHP”と、5つ目の“Encouragement of Group Decision beyond Sum of Individuals based on Possible Estimations”はどちらもInterval AHPを拡張する話。細かい点は置いといて、AHPだとやっぱり「1対比較」させちゃうコストが高いのがネックに感じます。あと、個人的な解釈では「何となく納得できる(し、説明もできる)」レベルでの意思決定に使うのだろうと想像しているので、細かい(ように見える)拡張にどういう意味があるのかが良く分からない。最適化したいとかじゃないんだよね?(多分)
小倉最後の晩餐は八くらにて串焼きを堪能。個人的にはしいたけ&山芋が美味しかった!