Archive for the ‘学会’ Category

京都出張4日目(情報処理学会第77回全国大会 3日目)

木曜日, 3月 19th, 2015

今日も雨模様でやんわり冷えてます。雨自体は昨晩から強くなってきてて、今朝も強いまま。しくしく。

IMGP0731-1 IMGP0731-2 IMGP0812

総合受付や第1イベント会場等は100周年記念な時計台にあります。ホールとかラウンジに飲食物持ち込み禁止なのは別に良いんですが、ラウンジで専属のバーテンダー(?)がいたりして驚く。あちこちにモノだけじゃなくヒトに費用かけてるよな。正門に受付いるし、中入ってすぐに(交通量が多いわけじゃないけど)交通整理する人いるし。一般道に面した建物が多いこともあって、そういう所にはさりげない広報もされてたりして面白いです。琉大だと「そもそも歩いて通る人少ないし」とか言いそうだよな。事実その通りでもあるし。その一方でイベントとしての会場案内(掲示)については個人的に参加してきたなかではかなりレベルが低いという、謎のギャップが。開催してる建物の入り口まで辿り着いても掲示が無いとかざらだったし。


<目次>

オリンピックに見る日本のICT技術

1件目はどちらかというと収録+即時フィードバックのためのインフラを中心とした話(分析もしてるようだけど、発表ではほぼ割愛)。2件目はトップアスリートの分析に耐えうる高精度な分析しようとするとモニタリングだけで高コストすぎるのを、YouTube動画でどうにかしようという話。3件目は両方に跨がった事例紹介かな?(途中で抜けてしまった)。オリンピックに直結したプロジェクトも多い中、メイン会場で開催してる割には聴講者ガラガラでした。2件目保原先生の話が面白い。


講演(1) 選手,コーチをサポートするICT技術(映像システム編), 三浦 智和 (独立行政法人日本スポーツ振興センター 国立スポーツ科学センター スポーツ科学研究部 専門職)

IMGP0700 IMGP0702

後半しか聞けてないですが、トップアスリート支援で必要な高精細録画を「現場」で収録&即時フィードバックするための環境整備自体のコストがまだ高くつくという話。なるべく機材は小さく&軽くしたいとか、iPadとかとの連携も不可欠とか、アスリートが事細かに覚えていられるのは30秒ぐらい(?)で、現時点では収録したのを送信するのに40秒ぐらいかかるとかとか。

スキージャンプ
 今後の課題: インフラ、機器
ウェイトリフティング
 スーパスポレコ: フルハイビジョン対応の映像遅延再生システム
  フォーム即座に繰り返しチェックできる
競技現場にマッチするシステムとは?
 ニーズを実現するという大前提に加え、普段のトレーニングで活用できるシステム
 現場だけで活用できるシステム(機材チーム不要)
 映像+情報も合わせて即時にフィードバック
  ウェアラブルもあるがトップアスリートには精度の問題も


講演(2) スポーツ用義足の研究開発とアスリート支援, 保原 浩明 (独立行政法人産業技術総合研究所 デジタルヒューマン工学研究センター 研究員)

IMGP0708 IMGP0709 IMGP0710 IMGP0711 IMGP0712 IMGP0715 IMGP0717 IMGP0718 IMGP0719 IMGP0720 IMGP0721 IMGP0722 IMGP0724 IMGP0726

専用機器なりで高精度な情報収集して分析することは可能だけどあまりにもコストが高い。例えば100m走では機器1台100万、競技者毎に1台+1人モニタリング技術者が必要、それを8人分揃えるとか旅費とか考えたら死ぬし、そもそも実現場では収録できない状況もある。それに対し、(ある条件を満足している)YouTubeに投稿されてる動画からの分析であれば、分析コストのみでデータに基づいた支援が可能。実際にあれこれやってみてる、という話。

スポーツ用義足の機能
 売った人も/利用者も/コーチもどの義足が良いのか分かっていない
  ベストな組み合わせを見つけた選手が記録を打ち出している
  ただし、両脚とも義足の方が良い
研究の現状
 バイオメカニクスによる支援
  ある条件下での基礎研究にはベスト
  トップ選手の実験はほぼ不可能
  本当に凄い選手は謎が多い(調べても無駄?)
   言語化すること自体が困難?
  モニタリングコスト(機器/人等)が高すぎる
   代わりにYouTube動画からスピード曲線を描く(動画を眺めるだけではなく、データを抽出する)
    欠点もあるが、本気モードを分析できる等のメリットも
  欠点の発見だけに留まらない要注意
   e.g., 国籍性別等どうしようもない違いを指摘してもどうしようもない


講演(3) 選手を育てるICT技術(陸上競技 競歩編), 今村 文男 (富士通株式会社 インテグレーションサービス部門 ビジネスマネジメント本部 インテグレーションサービス人事部 担当:陸上スタッフ)

IMGP0728 IMGP0729 IMGP0730


特別講演 2: 官民が協働で推進する新しい海外留学支援制度について~「トビタテ!留学JAPAN」日本代表プログラム~

IMGP0736 IMGP0737 IMGP0738 IMGP0739 IMGP0740 IMGP0742 IMGP0743 IMGP0744 IMGP0745 IMGP0746 IMGP0748

トビダテ!留学JAPANというプロジェクトの紹介。貸与型奨学金で、自由度もかなり高いのでどしどしチャレンジして欲しいとのこと。直近のやつはそろそろ〆切だけど、今後も1年に2度の公募で継続するらしい。


招待講演(5)情報処理技術を用いた脳の情報の解読と制御, 川人 光男(株式会社国際電気通信基礎技術研究所 脳情報通信総合研究所 所長)

これまでのBMI(ブレイン・マシン・インタフェース)では相関を利用するぐらいの研究に終始していたが、デコーディング+フィードバックで因果関係解明も目指したい、という話。

IMGP0775 IMGP0777 IMGP0778 IMGP0779 IMGP0780 IMGP0781 IMGP0783 IMGP0785 IMGP0786 IMGP0787 IMGP0789 IMGP0790 IMGP0791 IMGP0793 IMGP0794 IMGP0796 IMGP0797 IMGP0799 IMGP0800 IMGP0801

豊富なセンサ+強力な演算能力+実応用
ブレイン・マシン・インタフェース
 脳の感覚・中枢・運動機能を電気的人工回路でサポート
  日本人向けには脳に直接電極を差すタイプは向かない?
 脳/心の解読(デコーディング)
  classification or clustering or regression
   モジュール性/階層性/スパース性、、、

BMI3つの役割
 活動モニタリング&分析
 実時間でユーザに戻す
 脳の活動そのものが変わる(回路が変わる): ニューロ・フィードバック
  デフォールトモードネットワークの発見(15年前ぐらい前)
  遅い(~0.03Hz)BOLD信号の振動の動機(相関)
  得られた状態から診断等への応用/フィードバック
   fMRI実時間ニューロフィードバック(脳の特定の場所を活動させたりするための強化学習支援)
 従来の相関に終始していた分析から、フィードバックすることで因果関係の解明へ(目標)
  DecNef: モデル無しで機械学習+強化学習


学生セッション[6M会場] 情報推薦 座長 平手 勇宇(楽天)

IMGP0802

嗜好抽出を目的とした電子書籍へのアノテーションの分析は、自由にアノテーション(start-endマーキングだけ)付けてもらった結果から嗜好抽出できるか、という話。できるだろうけど、表層的な情報しか使ってないのが物足りないかも(似たようなのあちこちにありそうなので)。

平良くんの感情推定に基づく小説推薦システムのための認知的評価質問セットを用いたシミュレーションは、後で質問コメントを整理してくれるでしょう。

参加者の嗜好を考慮した飲食店推薦システムの開発は、店舗毎にレーダーチャート的に用意した評価軸毎に評価してもらったログを用意し、嗜好を考慮して推薦したいという話。気持ちは分かるけど、類似事例との違いが良く分からず。


学生セッション[6P会場] 対話システム 座長 篠田 浩一(東工大)

IMGP0804 IMGP0805 IMGP0807 IMGP0808

対話を通じた情報獲得のための質問選択とその実験的評価は、情報不足で答えられない時には対話でユーザから情報取得しよう、ただしそれをなるべくユーザに負担なく、かつ、効率良くしたいという話。

SVMとCRFを用いたロボットによるロバストな命令理解ロボットの行動命令発話理解における不足情報の処理は同じチームの発表で、RoboCup@HomeのGPSRタスクを例に、よりロバストなシステムを作ろうという話。基本的には「命令」なので、「どういう種別の命令かを判別するタスク」+「どんな名詞が含まれているかを抽出するタスク」を各々高精度にすることで質を高めることができるということで、そこに機械学習導入してみたとのこと。

多様な形態の相槌をうつ音声対話システムのための傾聴対話の分析は、相づちの形態(「うん」「うんうん」とか)を判別するために視線(ここでは顔の向き、ぐらいの意味)を利用してみたという話。

スマートポスターボードにおける視線情報を用いた話者区間検出及び相槌の同定は、話者区間(だれがいつ話しているか)+相づち判定(誰が聞き手か)をするために、10マイクロフォン+Kinect使って処理したという話。従来に比べ視線(顔の向き)を利用することでかなり精度改善に寄与したとのこと。


お食事

ますたに 京都拉麺小路店

IMGP0809 IMGP0811

当初予定していた豆腐料理屋さんは既に待ち行列になってたため、その途中で見かけた拉麺小路店にあったますたにへ突撃。背脂使いつつサッパリという謎の表現してましたが、確かに一般的なこってり押しのやつと比べると相対的にはサッパリしてるか。

京都出張3日目(情報処理学会第77回全国大会 2日目)

水曜日, 3月 18th, 2015

IMGP0620 IMGP0622 IMGP0624 IMGP0625 IMGP0626 IMGP0627

今日も暑い一日でしたが、夕方には雨が降ってて気温もそれなりに冷えて気持ちいいぐらいに。今日発表した慶留間くんはなんと学生奨励賞(座長さんの一存で決める賞)を受賞。目出度い!(が、私自身は別の会場にいた&時間に合わせて移動したのだけど既に終わってたので見れてない&撮影できずorz)

京大は京大内部の人しか無線LANを利用できない。というのは琉大でも同じなのだけど、外に出ると京都市が提供してるAP「京都どこでもインターネット」があって便利でした。クローズドにするのって管理者側の手間からすると簡単だし言い訳しやすいというのも分かるし、オープンにしたことで手間が増えるのも事実なのも分かるのだけど、もう少し柔軟な対応はできないものかしら。


<目次>

ソーシャル・ビッグデータが切り拓く新しい社会 −ビッグデータの可能性と課題−

全体としては「データを管理&処理する環境」、その環境を利用してるかどうかは不明だけど「対話的に可視化しながら分析する技術」、「医療支援のためのライフログ利活用を例にした事例紹介」、「プライバシーの問題」といった話題が詰め込まれた企画でした。これらの事例とパネル討論を通して「ビッグデータの可能性と課題」を問う、というのが趣旨だったのでしょう。豊田先生の話は論文漁ってみようかな。


講演(1) ソーシャルビッグデータの利活用・基盤技術のためのオープンテストベッドJOSE, 寺西 裕一 (独立行政法人情報通信研究機構 研究マネージャー)

IMGP0580

JOSE (Japan-wide Orchestrated Smart/Sensor Environment)なるリソースを用意したので皆で一緒にやろうよ、という話。単なる計算機リソースというだけではなく、各地に用意されたモニタから収集蓄積されたデータも利用できるorそういうセンサ機器の貸出しや、カスタマイズも可能、とかある程度汎用性を持たせているっぽい。

ソーシャル・ビッグデータ:=公共に役立つデータ
 JOSE: 大規模オープンテストベッド
  研究開発実証実験のスパイラルを含む、実用・商用に向けた実験環境
  大規模分散SDI、柔軟なネットワーク構成、実環境のセンサーデータ


講演(2) 交通ビッグデータ利活用基盤技術, 豊田 正史 (東京大学 生産技術研究所 准教授)

IMGP0580 IMGP0584 IMGP0587 IMGP0588 IMGP0589 IMGP0591

多くの分析技術はバッチ処理で結果が出るまで待たないと何もできない。その一方でリアルタイムに対話的に視覚化されたモノを見ながら分析したいという要求が、一般ユーザからも専門家からもある。その一例としてドライブレコーダから「ヒアリング等の調査に基づいた分析ではなく、客観的な記録のみに基づき、時空間上のヒヤリハット地図作成し、それをインタラクティブに可視化分析してみている」するという話。

大規模データ解析と可視化、対話的な可視化
 e.g., ツイッターのデマ拡散: 時系列にどう拡散されるか
  どういう内容がどう拡散されるかをリアルタイムに解析
 e.g., 移動体オブジェクトの解析&可視化

ドライブレコーダデータ
 まだ利活用は十分には進んでいない
 交通ビッグデータに基づく運転者指向サービス
 運送会社のデータ
  3次元空間可視化を用いたドライブレコーダデータからの要注意領域探索
   インタラクティブ時空間にヒヤリハット地図作成
   記憶に頼るのではなく、実データから要注意時空間を探索抽出
   実際の自己発生箇所との比較、自治体作成地図との比較
   要注意領域の詳細: カーブ後の急ブレーキ
  ドライブレコーダと安全運転
   日々の運転の振り返り
   運転経歴と安全運転との相関は?個々人の特性・癖があるのか?
   事故前後の違いを見ているわけではないことに注意して分析考察が必要(これから)
 個人に適合したサービス

ビッグデータ処理・分析の基盤技術
 解析・可視化をバッチ処理するのではなく、インタラクションしながらやる枠組み
 高頻度解析に耐える対話型


講演(3) 認知行動療法支援基盤とライフログ情報の活用, 長谷川 晃朗 (株式会社国際電気通信基礎技術研究所 適応コミュニケーション研究所 室長)

IMGP0593 IMGP0596 IMGP0600

認知行動療法を支援するサービス例であるスマートフォンアプリにすることのメリットとして、そのアプリに閉じた機能だけではなく、ログをサーバにアップロードすることでより実態にあったモニタリングができる等。ライフログを負担なくどう収集し、どう活用するかを検討してみてるという話。

広く様々なデータを収集蓄積して利用: ここでは医療分野
 認知行動療法: 心理教育、セルフモニタリング、行動を変える/考えを変える
  カウンセリング(週1*16回程度)、
   カウンセリングは週1のみ。課題を与えて、それを毎週観察。
  スマートフォンを活用した支援基盤の構築
   ホームワークの一部をアプリ化し、いつでもどこでも実践可能に
   アプリに閉じるだけではなくログをサーバにアップロードすることでモニタリング可能
  うつ病
   蓄積されたらイブログから行動の推定、気持ちの推定

ライフログ情報の医療への活用
 例: ホルター心電図
 技術的なハードル: デバイス、ログ品質、電池、ウェアラブル、スマートフォン、、
 運用面でのハードル: きっかけ、期間、プライバシー


講演(4) ビッグデータ活用とプライバシー保護, 美馬 正司 (株式会社日立コンサルティング 公共本部 シニアマネージャー)

IMGP0604 IMGP0605

プライバシーとプライバシー保護は必ずしも同一のものを対象としているのではなく、広い意味でのプライバシーには感情が含まれる。どうやればより良い未来を描けるかについて、事例を交えて紹介するというお話。

個人情報保護法の改正
プライバシー補語について「顧客任せ」ではなく、適切にやる用一緒に話し合い進める


パネル討論 ビッグデータの可能性と課題

IMGP0611 IMGP0613 IMGP0616

キーワード: ビッグデータ、CPS、M2M
 ビッグデータ: ビジネス/生活/自然
  ビッグデータ+ソーシャルメディアデータ->実社会への貢献(価値創造)

議論の種
 取得管理
  データはどこにある?
  リアルタイムに取得できるのか?
  どうやって管理するのか?
 分析
  社会を変革する情報をみつけるには?
  プライバシ性の高い情報における研究課題とは?
 利活用
  実社会の利益にするために必要なこととは?
 複数分野と連携する際に直面した問題例
  語彙の違い
   e.g., 同じ語でもドメイン毎に意味が違うと、同じ文書なりで提供しても違う解釈をされる。
    Q: 定義するという話があったけど、そういう問題なのだろうか?
  ビッグデータ=どんなデータからでも好きなことを抽出できると勘違いされる


CREST・さきがけ「ビッグデータ」2領域 成果報告会

CREST・さきがけがどういう意図でどういうテーマについて募集しているのか、また採択されたテーマの進捗がどうなってるかという報告会。CRESTでは「国が定める戦略目標の達成」という話が出てくるし、さきがけでは「戦略目標に基づいて未来のイノベーションの目を育む個人型研究という話が。各々について具体的な所まで聞けるのかなと思ってたのですが、プロジェクト自体が比較的大きいこともあって概略紹介に近く、ちょっと物足りないか。それでも山西先生らのディープ・ナレッジあたりは論文集めて読みたいとかの切っ掛けになったので良かったか。


講演(1) 「ビッグデータ基盤」研究領域紹介, 喜連川 優 (国立情報学研究所 所長)

IMGP0635 IMGP0636 IMGP0638

ビッグデータ周りの研究開発を大別して「基盤(コア)」と「応用(アプリケーション)」に分けて考えていて、ここでは基盤で採択された人はこういう人で〜〜〜というお話。喜連川先生の話は大抵そうなんだけど、1秒1スライドぐらいのペースで飛ばしながら概要紹介することが多いね。勿論強調する所はしてるのだけど。今回のポイントは「ビッグデータはデータが命なんだから、シェアしよう。ただし何をオープンにして、何をクローズドにするのかについての議論が無いためになかなかシェアできない」ということらしい。

インフラ/処理・解析/結果/現行法
データが命なので、データをシェアすることでより新しい知見発見を加速させる
 どこをオープンにしてどこをクローズドにしてどうシェアするか


講演(2) 「ビッグデータ応用」研究領域紹介, 田中 譲 (北海道大学 大学院情報科学研究科 情報理工学専攻 特任教授)

IMGP0641 IMGP0642 IMGP0643 IMGP0645 IMGP0646

応用編では、技術と実応用との間に大きなギャップがある。例えば実社会への価値貢献が大切だがコア技術をどう組み合わしたら良いのかといったノウハウが不十分だから、そこら辺をうまく体系化したいよね、という話。あと「国の重要課題分野をバランス良く含んだポートフォリオ」を意識して採択してる(テーマ設定してる)という話も。ここでのQ&Aだったか別会場だったか忘れたけど、良くも悪くも米国は「国一丸となって取り組む」のに対して日本は「個々人が独立して取り組んでる」ことが多いという話もあったか。戦略的には米国がうまくいきやすいというのはそうだろうなとは思うが、同じ戦術で対抗しても楽しくないし、協力/共同する方法はいろいろありえるし。(笑い男じゃないけど)

基盤と応用の間にあるギャップをどうにかしたい
 個々の分析技術は良いが、
  課題と関連データを与えられた時に、
  どう組み合わせて解決したら良いかというシナリオは不明だし、支援も無い。
 mission driven -> data driven へのパラダイムシフト
 分野や組織を越えた統合
 再利用可能なノウハウの知識化

国の重要課題分野をバランス良く含んだポートフォリオ


講演(3) 複雑データからのディープナレッジの発見と価値化, 山西 健司 (東京大学 大学院情報理工学系研究科 創造情報学専攻 教授)

IMGP0648 IMGP0649 IMGP0650 IMGP0652 IMGP0653 IMGP0654 IMGP0655 IMGP0656 IMGP0657 IMGP0658 IMGP0659 IMGP0660 IMGP0661 IMGP0662 IMGP0664 IMGP0665 IMGP0666 IMGP0667 IMGP0668 IMGP0669 IMGP0671 IMGP0672

ビッグデータは単にデータの量が多いという話ではなく、varietyに飛んだデータが、時々刻々と潜在的な状態が変化しながら蓄積されるといった「質的に似たようなものが蓄積された巨大なデータ」ではないから、それに見合った分析モデルが必要だという話。

ビッグデータの5V
 Volume: 大量性、大次元
 Variety: 多様性、複雑性(潜在性)
 Velocity: 動的、非定常、変化
 Value: 付加価値
 Veracity: 真実性

Deep Knowledge: 潜在的関連、因果関係、、そのものや、それらの変化
 潜在的ダイナミクス: 動的 Velocity
  データの表層的な変化ではなく、背後にある構造的な変化が対象->本質的な変化
 関係データ統合予測: ヘテロ Variety
  他データを活用(転移学習の一般化)

教育データマイニング
 大量のテスト採点結果 -> 潜在変数スキルの導入
  スキルは時々刻々変化

緑内障進行予測
 RBMに基づくデータ統合=共編量を基に潜在変数モデルを用いて欠損値を予測
  尤度を直接計算するのではなく、下界を設定して推定
 視野の欠損が時間と共に拡大
  個々人は数少ないデータ->似ているユーザのデータを利用
   マルチタスク学習に基づく予測
    患者間相関/視野間相関/時間発展の特徴


講演(4) 自己情報コントロール機構を持つプライバシ保護データ収集・解析基盤の構築と個別化医療・ゲノム疫学への展開, 佐久間 淳 (筑波大学 大学院システム情報工学研究科 准教授)

IMGP0673 IMGP0675 IMGP0676 IMGP0677 IMGP0678 IMGP0679 IMGP0680

100%漏れないようにというのは非現実なので、漏れても大丈夫なアプローチ(秘密計算)しましょうという話。生活習慣病への応用については既に協力実施できてるらしい。(ゲノム疫学の方は「病院->外」方向へのデータ提供がありえないとのことで、現時点ではまだ不透明っぽい)

ゲノムの利活用
 ゲノム疫学
  どのゲノムがどの病気の要因に関わっているか、特に生活習慣病
 体質に応じた薬剤選択、投与量決定、特に抗がん剤
 リスク
  意図せぬ本人/血縁推定、将来的に知能/能力等を知られてしまう可能性
  ゲノム差別
  -> 漏洩しても困らないようにすることを目指す
   暗号化+他人に見せずに解析(暗号化されたデータをクラウド上で処理)
    情報を見れる見れないと処理するとを区別
 課題: ゲノム探索、コスト低廉化、プライバシ保護

生活習慣病の罹患リスク
 ゲノムだけでは決定せず、後天的要因も大きく影響


講演(5) ビッグデータからの知識創出基盤の確立 - 創薬から製品製造までを例として -, 船津 公人 (東京大学 工学系研究科 化学システム工学専攻 教授)

IMGP0681 IMGP0683 IMGP0685 IMGP0686 IMGP0687

創薬〜製薬までの各ステージにおいて種々の問題があり、それらを全体として最適化する必要がある(そうしないと割にあわない時代になってきた)という話。米国だと組織を越えてデータをシェアすることにも取り組みつつあるが、日本ではそういうことしてる暇があるなら研究しろという風潮。そのために利用できないデータが眠ってるという話もあるらしい。(情報系でもまだまだあるよね)

創薬から製造までがターゲット
 副作用・毒性などの事前知識を踏まえた探索最適化が成否の鍵
  合成法は未知
  効率かつ安定的な製造
  観測が容易な変数、困難な物性・濃度などを踏まえたソフトセンサ
  予測モデルの劣化、、、


学生セッション[4Q会場] 3/18(水), 機械翻訳と文書分類 座長 須藤 克仁(NTT)

IMGP00 IMGP01

慶留間くんの可変長N-gramに基づいたトピックへのラベル選択の検証が学生奨励賞受賞!


お食事

IMGP0688 IMGP0689 IMGP0692

雨降ってたのと1台のタクシーに乗れる人数だったのとでタクシーで移動。ついでに美味しい所聞き出す等。そう簡単には外れないだろうし。とはいえ「沖縄から来たんですけど駅付近で美味しい所無いですか」ぐらいのアバウトな質問だったのでわりと悩んでましたw その結果、飲むなら酔心、そうじゃないならチェーンで美味しいがんこ寿司という2択をゲット。がんこ寿司イイネ!

京都出張2日目(情報処理学会第77回全国大会 1日目)

火曜日, 3月 17th, 2015

暑い。素で暑いよ〜。室内にいる間はコート(薄手)を脱いだけどそれでも暑い。暖房不要だろこれ〜。と思ってたら途中から暖房ではなく換気になってるところも。ですよねー。それでも一部の部屋(特にポスターセッション会場)は熱気が凄かった。冷房必要でしょあれ。

IMGP0526 IMGP0527 IMGP0528 IMGP0529 IMGP0530

大学近辺にはあちこちにサークル勧誘のポスター/掲示物が。そういう時期だよね。でも3年はないよな(そっちか)。

情報処理学会の全国大会は30ぐらいの通常口頭セッションが走りつつ、他にもイベント企画が用意されてたりするという恐ろしい並列度で動いている(=参加人数ももの凄いことになる)学術会議の一つ。メインイベント時には口頭セッション被らないように工夫するとかもあるけど、今回は「言語処理学会も同時開催」、「京大独自イベント(?)も同時開催」状況になってて、どうしようもない集中具合に。加えて観光客も多数いるわで路線バスが激混み。10分間隔ぐらいで着まくるからそれでも捌けるんだろうけど、清水近辺とかのバス停待ち行列がほぼ減らないという状況。学会参加の点では言語処理学会も覗きに行きたいのだけど、スケジュールがタイト過ぎ。ピンポイントで何かを見に行くぐらいはやれるかもしれないけど、現時点での予定では情報処理学会だけかなぁ。

今日はシンポジウム(講演3件)、うちの学生発表セッション2件、京大のポスターセッション(京都大学第9回ICTイノベーション)を覗いてきました。IPSJ-ONEとかいう「多様な研究分野を垣根なく俯瞰し,すぐれた研究を自らの言葉で語れるプレゼン力の高い,若手を中心とした研究者を,希望する研究会が主体的に推薦する形式で募集」なイベントも面白そうだったんだけど、タイミング合わず。togetterまとめもあるらしいが、映像もあとで公開されるのかしら。と思ったらアーカイブ化も検討中なのね。期待しておこう。


<目次>

情報学シンポジウム「ビッグデータとヒューマンサイエンス」

講演(1) 脳から心を読む技術:脳情報デコーディング, 神谷 之康 (ATR脳情報研究所 神経情報学研究室・室長)

IMGP0531 IMGP0533 IMGP0537

[サマリ的な何か] 脳波を直接眺めても良く分からないが、差異があることは確か。様々なレベルでノイズが混入する中で、どうデータを収集し、どう分析するか。2005年当時はまだ殆ど機械学習を適用する事例がなかったが、問題設定によっては割とうまくいくらしい。

brain decoding
 コーディング: 心->脳波
 デコーディング 脳波->心を読み取る
  見ても分からない
  機械学習によるデコーディング(2005年頃までは殆どやられていなかった)
   脳活動を計測し「ラベル」をつける
   脳活動からラベルを予測する「デコーダ」を構築する
   そのモデルが新たに与えられる脳活動のラベルを正確に予測できるかを評価する
    Q: ノイズだらけな気がするが、どうモデル化する? 粗く見ることで軽減できる?

2005年当時は3mm角でしか見れなかったが、それでも各マス分布には差異があった
 ->機械学習

classification -> 多様な状態: e.g., 見ているものを画像として取り出すには?
 モジュラー・デコーディング(要素の分解、それらの組み合わせとして表現)
  視覚像再構成
  Q: 情報工学的にはモジュラー・デコーディングで表現できない状態/状況は?
  Q: 生態学(?)的には、人間がそういう風に捉えているかどうかはどう検証?
   (視覚ならそれで分かっている部分が多いかもしれないが)

エンコード vs. デコード・モデル
e.g., 生成モデル vs. DBモデル
物体認識のための階層的視覚特徴抽出, CNN

夢の再構成
 数分置きに起こして確認寝る
 実験自体は比較的簡単だが、画像再構成は困難(視点のずれ?より抽象的な情報?)
言語データベースを用いた意味情報の抽出
 夢の意味ラベル
夢の中の「動き」のデコーディング
脳コードコンバータ: 同じ画像見せても脳活動は被験者毎に異なる


講演(2) 情報通信技術は医療をどう変えようとしているのか?, 黒田 知宏 (京都大学医学部附属病院 教授)

IMGP0540 IMGP0541

[サマリ的な何か] 立地制約上でITCを活用しないと病院内での情報共有すらコストが大きかったこともあり、「単に通信するだけではなく、医療ならではの支援はどうあるべきか」から考え、やれることをやってきている。例えばカルテを電子化するという話もあるが、そもそもカルテに書かれている内容は何なのか。データを蓄積するという側面は大切だが、使えるデータとして整理する必要がある。他の分野に学べる所は学び、実現場に導入するためにはどうしたら良いかを実例を含めて紹介してました。

医療現場の情報化はどこまで進んだか?
 京大病院の悪夢(立地条件上建物高さ制限->縦横に長い建造)
 KING5: どこでも電子カルテ
  ユビキタスセンサネットワーク
   Context-Aware IT System: 病院では「場所=コンテキスト」
   さりげない情報支援

医療情報はビッグデータ?
 そもそもカルテに書かれていること
  POMR (Problem Oriented Medical Record)
   主観的情報/客観的情報、病名、評価、分析、検査や治療指針等の計画
   *必ずしもそうなっていない。
    保健医療機関及び保健医療担当規則第8条(->保険請求の証拠になる情報)
 電子カルテになって
  自動的にカルテに記載されるもの: コピペして追記+スキャナ文書
   あらゆる情報を未整理に記載: ゴミ箱?
   カルテをゴミ箱でなくすためには?
    情報を整理する術: e.g., 先例: 飛行機のフライトレコーダー
     主観的記録+客観的記録: データと認識を分離
     Ubicomp の記録=客観的な記録
      4W, 誰がいつ何処で何を)は自動で。
      患者とスタッフのライフログ。
    標本化定理(とはいえ十分な通院は不可能)->過程に医療機器を。
     PHR (Personal Health Record) + PCEHR
 カルテは「使えるビッグデータ」ではない
  使えるカルテにするために情報の整理
  サンプリング周波数を増やす

「ソフトウェア薬事」後の医療機器: モジュール化
 ゲノムレベルになると人間では対応不可能->コンピュータ化
 これからの医者の役割: センサ/翻訳者/医療行為


講演(3) 機械学習技術によるビッグデータチャレンジ, 上田 修功 (NTTコミュニケーション科学基礎研究所 上席特別研究員)

IMGP0543 IMGP0546 IMGP0550 IMGP0551

[サマリ的な何か] データがあること自体の優位性はまだあるが、期待されていることは技術ではなく、そのデータに基づいた価値創造であり、例えば新たな事業創造等どのような貢献ができるかが重要。従来の列挙モデルに比べ、統計モデルで仮説を立てる手法が盛り上がり、更にはノンパラメトリックなDNNが2010年頃から流行。これからの対象としては時空間統計解析が重要ではないか、とのお話。

機械学習・データ科学センタ(MLC)
 NTT新中期: ビッグデータ解析による新価値創造->変革のenablerとして貢献
 IoT, ビッグデータ
  技術そのものへの期待ではなく、データに基づいた価値創造: e.g., 新たな事業創造

機械学習
 記憶するのではなく、汎化して新たなパターンへも対応する
 列挙 vs. 統計モデル
 列挙例: POS分析、相関ルール、アプリオリアルゴリズム、協調フィルタリング
  確率モデル: 生成モデル(仮説)、潜在変数(隠れ変数)、パラメータ(ベイズでは確率変数)
  相関ぐらいしか使わないモデルから確率モデルへの以降
 関係データ解析: 共クラスタリング
  確率モデルアプローチ: e.g., 観測データがどう生成されるかをモデル化

予測と補完
 重回帰分析: 変数選択が分析者の腕
  非負値行列因子分解を応用
 多次元データ解析: 複合非負値行列因子分解、非負値テンソル分析
 DNNによる音響モデル

予測・制御
 時空間統計解析: 時空間多次元集合データ解析
  時空間回帰:人流予測・制御
   先行予測し、どう誘導したら混雑しないかをガイドする


学生セッション2Q: 言語生成とユーザ支援

URL: タイトル&アブスト一覧

IMGP0557

うちの学生が同じ時間帯に2カ所に分かれての発表となってたため、こちらには前半2件だけの参加。

日本語の語彙平易化システムの構築は、義務教育レベルへの表現/語彙に言い換える(検出&変換)という話。あれこれ公開されてる先行研究を組み合わせつつ、用意したデータセットで検証する限りでは7割強の精度で動いているらしい。デモがここで公開されてます。

神谷さんの小説検索システムのためのプロット作成に関する基礎研究へは、名大学生らからの質問・コメントがどしどし。後で卒研ノートの方に整理してくれるはず。


学生セッション2D: 認識・学習・最適化

URL: タイトル&アブスト一覧

IMGP0559

バナー広告に対する閲覧者の印象分類と自動印象推定に関する一検討は、広告内のテキストに対する印象を推定できれば広告作成者にとって嬉しいよねという話。ただ色んな影響が混ざり合っての広告だと思うので、テキストを独立して扱う(後で組み合わせる)というアプローチが良いのかは良く分からないかも。

玉城くんのDeep Learning におけるコストを考慮した Dropout率制御に関する検証も、後で卒研ノートに整理してくれるでしょう。

エントロピーとDP Matchingを用いたファイル類似度評価システムに関する考察は「バイナリの類似度を適切に計測できるようにしたい」というところから始めてるらしく、例えばハッシュ値を全バージョンで適切に管理するのは非現実なので「似たようなバージョンならバイナリで判別できた方がいいじゃん」とか。面白そうなんですが、具体的な応用イメージとして偽アプリ検出みたいなところを想定してるのはちょっと違うかなという気も。質疑で出てたLSAとの違いは?というのはその通りだよな。

人間活動と室内環境変化に対応した掃引システムの提案は、原則として環境にマーキングとかせずに、センサ情報だけで人活動を含めた環境変化に対応させたいという話。気持ちは分かるけど、実現するだけなら(完全自動化を目指すのではなく)もうちょっとインタラクション考えた方が良いのじゃないかなという印象。


京都大学第9回ICTイノベーション

IMGP0560

URL: 京都大学第9回ICTイノベーション

タイトル見直すとてんかん発作兆候監視なんてのもやってたのか、見たかったor被験者申請したかったなw

並列言語Tascellによるグラフマイニングの並列化は、many cores上での並列化という話で、それなりに早くはなってるのだけどやっぱりグラフ展開上の都合というか作業分けしてる時点でのコスト差が大きいままタスクを分けちゃってるので、線形スケールにはまだまだという感じ。いや、十分早いのかもしれないが。

スマートポスターボード ―聴衆の反応のセンシング―は、Kinectと19-ch. Microphone Arrayぐらいのセンシング情報から「ポスター説明者+それらの聴者らの視線と相づちをリアルタイムで検出」し、それをベースに「興味や理解の度合い」を推定したいらしい。検出の方は割と精度高く実現できてるとのこと。Kinectデフォルトのモデルだとキャリブレーション必要なのに加え、差異が大きいとNGだったりするので、そうではなくてリアルタイムにそのユーザの3Dモデルを構築し、顔の向きを推定してるとのこと。キャリブレーションも不要だし、一度構築できれば真横向いても問題無いという。おおー。ただしリアルタイム処理するなら、1ユーザあたり「5~6万ぐらいのGPU1個」ぐらいが必要らしい。会場でも廃熱追いつかないのでPCのカバー開けてましたw

認知構造のビジュアル分析システムE-Gridは、多人数へのインタビュー結果における「重要な部分」をうまく可視化したいという話。テキスト等の処理はユーザ側がする必要があるらしいが、可視化の例として面白そう。E-Gridとして公開されてるらしい。

デザインスクールの展示(コンソーシアムサマースクール)もあったようですが、途中からの参加だったこともあって時間内に見れず、残念。

IMGP0562 IMGP0565


お食事

IMGP0569 IMGP0570 IMGP0575

例によってというか昨日の時点で良さげな候補がまだあったのでポルタ地下街だし茶漬け えんへ。店内にsoup stockな文字があったけどその系列?あっちが大好きなお店だけあってお茶漬けも旨し。すぐお腹減るだろうということで持ち帰りでおにぎりをゲット。

情報処理学会第76回全国大会3日目

木曜日, 3月 13th, 2014

三日間のスケジュールが一通り終わりました。今日は午後のセッションにうちの学生3名の発表が2セッションにブッキングしてたので回りながらの参加。結果的にはイベント企画1件+基調講演+学生セッション1件+一般セッション1件に参加。セッションは部分的にしか参加してませんが。

m_201403132006345321913a25802 m_20140313200737532191794f9aa m_20140313200612532191242df75 m_2014031320070253219156bde60 m_20140313200528532190f834a3b

天候的には昨日より温度が少し下がったけど、雨降ったことの方が影響強いか。特に夕方頃から雨脚が強くて混雑してる場所での移動は辟易。やっぱり東京では生きていけないな。。晩ご飯は学生リクエストで再び肉モードということで、あれこれグーグル先生に尋ねた結果千住ホルモンに向かい、打ち上げ&反省会。というつもりだったんですが、結構脂のノリがすごかったようでしょっちゅう火が出て暫くはそれどころじゃなかったな。美味しかったから良いけど。貰えた質問&アドバイスは近いうちに研究ノートに書いてくれるでしょう。

明日は昼前後にどこか軽く散策するぐらいの時間はあるけど、どうしようかな。

<目次>


イベント企画: 知のコンピューティング― 知の創造促進と科学的発見・社会適用加速―

講演(1)「知のコンピューティングのねらい」 岩野 和生(独)科学技術振興機構 研究開発戦略センター 上席フェロー)

研究開発戦略センター CRDS の役割
 新しい研究領域を作る
  コミュニティ形成
  ビジョン・夢・インパクトの共有
  研究アジェンダの明確化等

対象
 森羅万象になりつつある:Internet of things, Big Data
 Fourth PARADIGM
  医学の発見から臨床までのスピード: リニアに落ちてる
   このギャップをどう埋めるか
 知の集積、社会的還元、情報の消費スピードと使用者(情報の半減期)、、、
  簡単にビッグデータ/集合知で「データ→文化形成」をやれる??

   Galaxy Zoo: Classifying
   機械との競争: Digital technologies change rapidly, but organizations …
   従業員(業種)がコンピュータに取って代わられる確率
 サービスの進化
  サイバーと物理的世界の融合が世界をより複雑にする
  人がサービスのエコシステムに入ることによる予測不可能性の拡大
 ビジネスのクリティカルインフラとしてのIT
  →社会のクリティカルインフラとしてのIT

知のコンピューティングの背景
 知の創造を促進し、科学的発見や社会への適用を加速する
  知は人間(複数)が賢く生きるための力
   WISDOM COMPUTING=発見、創造、集積、伝搬、探索、影響を実現し、加速すること

戦略目標への道とこれから
 Standalone → collaborative / collective (開かれた系)
  何を実現しているか把握する技術
  影響を与える技術
  先月、文科省の戦略目標へ
   「人間と機械の創造的共同を実現する知的情報処理技術の開発」
   naltoma: 対話を通して納得させるという点でも理由説明技術が必要か。
   naltoma: 機械的に「納得する」という側面は不要?

講演(2)「Wisdom Computing Summit 2013 のねらいと報告」 徳田 英幸(慶應義塾大学 環境情報学部 教授)

Wisdom Computing Summit 2013 のねらいと報告
 新しいICT進化の流れ:物理空間と情報空間は融合へ
 コミュニティ醸成、ゴール・方向性・研究課題の抽出、ムーブメントの創出が狙い
  「何がWisdomか、何がWisdom Computingか」だけで討論が終わってしまう恐れ
  事前にpositioning statementを送ってもらった
   全体セッション+分科会セッション(分科会8セグメント)
   →積み残しが多く残ったため、続きはワークショップへ
 メタの議論:研究開発プロジェクトの企画・立案方法
  サミット方式のメリット・デメリット
  真理追究型 vs. 課題解決型 vs. ハイブリッド型
  タイムフレーム(5年後、10年後、、、)
 視点
  プロジェクトの社会的インパクトと名称
  ビッグデータを越える視点(何が違う?)
  日本オリジナルなR&Dの視点
  破壊的イノベーションの視点
  国際競争力・協調の視点
 達成までの大まかなロードマップの形成
  人間と機械の共創を目指したコンピューティング
  人をエンパワーするためのパラダイム
  議論の可視化や参加者の価値観推定などからの新たな発見促進
  人の賢いデシジョンをサポートする知のコンピューティング
  デシジョンや創造性を代替する知のコンピューティング
 新聞の見出しになるようにまとめてもらったためSFチックなものも
  Wisdom Computing Summit 2013 ワークショップ資料

知のコンピューティングワークショップ
知のプラットフォームワークショップのねらいと報告
 サミットで起こしたムーブメントをよりサイエンティフィックへ
 課題別ミニワークショップの開催
  知のメディアワークショップ
  知のプラットフォームワークショップ
 グループワーク
  例: グループA
   狙いを「価値の創造」に設定、高齢者のQOL向上。
   課題:生き甲斐の定義や感情表現モデル、生き甲斐を表すデータの抽出、対話技術など。

講演(3)「知のメディアワークショップの狙いと報告」 山口 高平(慶應義塾大学 理工学部 教授)

知のコンピューティングミニワークショップ「知のメディア」
 よりスペシフィックな課題へ
  取り組むべき研究課題の深掘りと2020年を狙った具体的な応用目標を討議
  要素技術の追求は大切だが、本当に役立つものを作ることも重要
 knowingのダイナミックなプロセスを実現
  独立ではなく恊働・インタラクションの枠組み
  多様なインタラクションレベル(音声対話/動作/ジェスチャー/知識レベル、、)。
  knowledgeからknowing(より深い意味を知る。更新する。発見する。、、)への転換。
  knowingを通して実践知(社会貢献)で支援可能なシステムを目指す。

IBM Watson, 東ロボくん
 今後の課題
  人工無能+人工知能でどこまでできるか?:文字数カウントは人間はやらない
  入試問題理解(アノテーション等前処理は必須?)
  文字列照合の限界
  構造化知識(教科書知識、*文脈知識*)の必要性
  含意関係認識(推論は不要?)
  表記揺れなどの問題(データインテンシブ採用は?)
  問題文から方程式・論理式への変換
  文章理解と画像理解の統合

knowingの目指すもの
 自立独立型(恊働・インタラクション)
  e.g., 野中先生SECIモデルでは「人と人がつばを飛ばしあって議論するようなことがコンピュータとできないか」という話も。
 形式知(staticな知識)
 学校知(知識創造)
 現Watsonでの限界
  病状に則した最新医療を答えてくれるかもしれないが、
  患者の病歴、各立場からのコメント等を踏まえた提案はしない
 形式知より暗黙知/自動処理よりインタラクション/要素技術だけではなく統合技術

講演(4)「知のコミュニティワークショップのねらいと報告」 横尾 真(九州大学 革新的マーケットデザイン研究センター 教授)

知のコミュニティ
 様々な立場の人々が機械と協調して、知の発見、創造、集積、、、等の価値を生み出すコミュニティ
  一億総データサイエンティスト計画
   クラウドソーシングで挑むビッグデータ解析 by 鹿島先生
  こころを支える情報学
   こころを表出することが困難な人々に対する「笑顔検出」等の支援 by 鈴木先生
  知のコミュニティと会話情報学
   会話現象の理解を通し、AI等で拡張、会話に満ちた空間の実現 by 西田先生
  知のコミュニティと社会の観測
   コミュニティ間の情報伝達によって先のトレンドが見える可能性 by 松尾先生
  知の?(はてな)
   何が行為を決定するかは構造(ネットワーク)が決める by 安田先生
  知のコミュニティとマーケットデザイン
   複数立場の参加する社会的意思決定のルール作り=新しい最適化 by 横尾先生
  デザインのためのインタフェース
   手書きスケッチでぬいぐるみをデザイン by 五十嵐先生
  強いAIとしての社会シミュレーション
   何故社会がこうなっているのか、どこを変えたらどうなるのかを明らかに by 野田先生

グループワークまとめ
 東京オリンピックを想定したクラウドソーシングによるサービス提供
  MOOCへの資格導入によるワーカの質保証
  ICTとの融合によるものづくりPDCAサイクルの高速化
  共創を支える知財の仕組み、創造的活動を妨げない法整備
 人がコミュニティの中で楽しみながら効率良く学習することを機械(デジタルプロフェッサー)が支援
  教材作成のための主観的な知の外在化、知の見える化技術
  失敗も含んだ学習プロセス、疑問共有
  生徒の貢献も認定して報酬を出す仕組みと理論
 コミュニティコンピューティングによる特許や知の創成
  知の集積・流通・利用のためのインセンティブメカニズム設計、、
 社会的リスク・コストをなくすゼロ社会の実現
  災害死ゼロ、孤独死ゼロ、、
  データ同化型シミュレーション

パネル討論「知のコンピューティングの可能性とインパクト」

ポジションステートメント

藤山先生ポジションステートメント
 知を使うのにも知恵がいる(使い方を間違えると傷つく)
 グローバリズムの揺らぎ:市場主義、資本主義、民主主義、個人人権、科学技術への信頼
  一方で中国/インド等が取って代わるとは思えない
  日本は非白人の中では真っ先にグローバリズムを理解しつつ、独自文化も残している
   →新たなグローバリズムの構築は日本??
 WISDOMは決定するためのモノ
  サミットを通してグローバリズム修正に向けた流れになりつつあるようにも見える

知識型AIからknowingへ
 人と機械の競争から共創へ(形式知だけではなく実践知が必要)
 IQ→マルチプルインテリジェンス:技術的知能+人格的知能+芸術的知能

AIから集団知能へ、高度な知の発見・創造、、、
 デジタルプロフェッサー/知の民主化
 大規模シミュレーション技術による社会的リスク・コストの解消

Q: 専門家への投資をどう社会に還元するか? 飛躍するが例えば、新聞見出しとして11項目挙げてたが、市民レベルで見てどのぐらい理解できるだろうか?
A: ビッグデータでも何でもそうだが、ある価値を見言い出した時にそのトレーサビリティ、責任問うの仕組みはIT的・アーキテクチャ的なプラットフォームが必要。社会的納得性が無いとサポートされないので、社会的制度が必要だと考えている。
A: 食事終わった夜セッションで出したもの。機械に侵略されてるように感じるか、エンパワーメントに感じるか等は読み取れないと思う。どんなシステムでもそうだが、社会に受け入れられる時のスムーズさについては、共創というポジティブな視点で見ている人が参加している。
Comment: 例えば「マインドメディエータ」が分かるかと言われたらわからない。そういう所のインタラクションもやって欲しい。
Q: サミットという形で恊働するというのは大事だと思う。サミットの場にユーザとなる一般の方を巻き込んで話を進めていく方法もあるのでは。ソフトウェア工学でのアジャイルとか。そういう方法は今後検討する?
A: 今回は公募してたこともあり、何名かは自治体/病院とかも数名参加してもらっていた。ただし幅広く受け入れられるものでもなかったため、少なかった。
A: まず議論してコミュニティを作りたいという第一歩だった。ユーザイメージも出来てきたので、次の一歩として他の人も巻き込んでいくことになると思う。
A: プロジェクトが走ればファンディングサポートが大きくなるので、大規模にやれると思う。
Q: JST試案のネットワーク連携型自律分散知能協奏システムは、受け入れられそうか?
A: 諸々を加味して置き換えるのか、オプション提示型として使うのか、どう使うか次第ではないか。
Q: 試案を見る限りでは下は機械メイン、上が人間メイン。人間とのインタラクションを考えると、サポートする側のセンシングとアクチュエーションという点で「人間が見えてるような形での下側(機械側)の見え方」があるのでは? input/outputは「人間が見えるような形」があって、その先に機会があるというイメージ。コメント。
Q: 受け入れるユーザ側について。情報教育が蔑ろになってるようみ思えるが、受け入れる態勢作りのためには重要ではないか。
A: 同感。異なる分野だが、アメリカ事例でNPOが同じファンドからの援助で教科書作りをやっていた。技術を作る側と利用する側の双方向が大切。
Comment: MOOCのような形でAI研究者は真剣に取り組んでるケースが多い。将来は「コンテンツがあるのでそこへの興味を育む」という取り組みが重要では。

基調講演「ビッグデータの今」 喜連川先生

情報処理学会

合い言葉
 No more Visions!! Let’s move!
会員数は綺麗に純減
 会員数増に繋がるアクションのみをやる
若手枠&長期戦略枠
IT教育、教員育成
学会2万人のスケールを「利用」してください
 面白いアイディアの実験: ice land?? for facebook
 そこそこのサイズの social net / crowd source
  どうやって2万人をコネクトするか
   ポイント制の導入?

第1章 ビッグデータの誤利益は?

ビッグデータ: Data is the new oil
第1章 ビッグデータの誤利益は?
 MOOC
  神秘なる教育学習プロセスを解析するデータが手中に!
   宿題のためにはビデオを見直すが、テストのためには教科書を使うということの定量的効果測定
   何千人もが「見直すタイミング」で分かり難いシーンの抽出
   e-portfolio: 学習のあらゆるプロセスの補足
    データの取り扱い
  やる気があえれば落ちこぼれが無い時代に!
 交通渋滞
  ストックのメリット
   ここ数年は渋滞要因を追跡しやすくなって来た
    蓄積することで予測に(ある要因xならy時間で緩和するとか)
 開発途上国におけるランドデザイン

第2章 ビッグデータ米国事情

 技術は煩悩から生まれる
 The age of data: from data to knowledge to action
  知識も重要だが、国家としてどう動くべきか。actionable information.
  学会はどう動けば良いか。そんなプロジェクトを作りたい。

第3章 データ処理基盤

 ビッグデータを超高速に処理したい
 最先端研究開発支援プログラム:情報融合路(情報エネルギー生成基盤)

質疑応答

Q: データセントリック/システムせんトリック/ヒューマンセントリック様々な見方があるだろう。データセントリック/データサイエンティストな人が陥りやすい見方へのアドバイスを。

A: これまではコミュニティとコミュニティが会話するということがしんどかった。それがようやく出来るようになった。一つのチャネルがデータ。これまでは一緒にやろうよということを言いあって来たが、それではなかなか通じない。それが「データをあげるからやってくれ」でやりあえるようになった。ヒューマン思考/システム思考に持っていくかは全ての人がこの分野に入ってくる必要がある。(他分野の)人材育成している暇があるのか。例えば医療もITも分かる人を作れる? IT屋は時価にアプリケーションの人と付き合う。必要であればその中にヒューマンも呼ぶ、システムも呼ぶ。そういう時代では。


学生セッション[6P 会場](3 月 13 日(木)14:30 〜 16:30) 言い換え・関係抽出 座長 飯田 龍(東工大)

6P-1 文章からの人物関係抽出 ○高本恵利花,浦谷則好(東京工芸大)
小説を対象として、登場人物のデモグラフィック抽出+関係抽出という内容。今回は研究走り出しなのか、基本的には手がかり語など思いつくシンプルな方法(機械学習等は一切無し)で取り組んでみた結果を紹介してたという話で終わってました。
6P-2 因果関係ネットワークに基づく最大の動機・目的推定のためのアンケート調査 ○松田昇悟,當間愛晃(琉球大)
うちの松田くんの発表。喋りが早さが過去最高レベルだったので、初めて聞く人は辛かったかも。詰まったりしてなくて一つ一つ話してるテキストは適切な内容にはなってたのだけど。質疑応答では真っ当なものを頂けてたので一応大丈夫ではあったのか。関連事例を教えてもらえてたようで何より。ありがとうございます。

一般セッション[6C 会場](3 月 13 日(木)14:30 〜 16:30) 自然言語処理(基礎) 座長 山田 一郎(NHK)

6C-3 危険性の視点からの評判分析 ○山本智也,徳久雅人,村田真樹(鳥取大)
危険性を表す表現の自動抽出が目的らしく、ゴールとしてはネガティブ/ポジティブな極性表現と似ている気がするのですが、ドメイン毎に異なる表現があるだろうという話っぽい。多分。ただし、手法にドメイン毎の差を意識した部分がないため、結果でも大きな性能差がでているという状況。個人的にはSQ-scoreの前にやってるフィルタリングの方が気になったけど、予稿には何か書いてるのかな。
6C-4 トピックモデルで生成したトピックへ付与するラベルの自動生成 ○慶留間諒大,當間愛晃,赤嶺有平,山田孝治,遠藤聡志(琉球大)
うちの発表その1で、前日夜まで実験しまくってた割に最後は良くまとめて発表してました。ただ質疑応答で相手の意図を汲み取った回答が出来てなくて、セッション終了後に時間かけて話してました。それはそれでGJ。LDAなトピックにラベル生成するという問題設定自体がやっぱり難しそうだなぁ。
6C-5 文脈木重み付け法を用いた半教師付き学習による文書分類の検討 ○小畑智広,小林 学,渡邉重佳(湘南工科大)
私が聞き逃したのか、文脈木重み付け法とサブカテゴリとの関係が良く分からないまま話が進んでしまったので「??」でした。カテゴリ分類する際に、カテゴリ内にサブカテゴリ使って半教師あり学習するという話なのは分かったけど、「サブカテゴリの有効性」って何のことだろう。サブカテゴリ=文脈木重み付け法なんだろうか。
6C-6 マルチモーダル・データセットを対象とした深層学習の性能評価に関する基礎研究 ○玉城 翔,當間愛晃,赤嶺有平,山田孝治,遠藤聡志(琉球大)
うちの発表その2。タイトルも予稿も変わってごめんなさいしてからの発表。修正版配布したのでそれで許してください。発表自体は基本的には良くできてましたが、結果の最後は分かり難い説明のままでした。でもそれ以上に質疑応答で相手の意図を汲み取れてなかったのが問題。質問者の聞き方も最初は誤解しやすかったかもしれないけど後で言い直してたので、そこで意図に気づこう。

情報処理学会第76回全国大会2日目

水曜日, 3月 12th, 2014

ホテルに帰って慶留間くんのチェックが終了。ということで中日が終わりました。今日は気温も高めで昼は10度越え。歩くには程よい時期なんですが、明日の予報は午後から雨らしい。いや、雨の中歩くのも嫌いじゃないけど、出張(仕事)だと雨降らないに越したことはないし。

m_20140312140553531feb319784e

2日目はイベント企画*2件、学生セッション*1件(平良くん発表のみ)に参加しつつ企業展示を眺めてました。招待講演も眺める予定だったんですが、展示眺めてたら満席に。しくしく。同じくタイミング悪く会場に入れなかった遠藤先生を発見し、空き時間にお茶しながら情報交換待機してました。

m_20140312181959532026bf2a950 m_20140312182041532026e9cf1ae m_2014031218475753202d4d6ebc3 m_2014031218514153202e2d57764 m_201403121812435320250b4750f m_201403121817355320262f2b133 m_201403121818385320266eeb4d1 m_201403121822225320274e53df1

晩ご飯は「肉が食べたい」というリクエストから紅虎餃子房に辿り着いたのですが、メニュー眺めてたら餃子以外にも目移りしてしまい結果的には「普通の餃子」を頼み忘れてしまうという大失態に。お腹具合的にはまだ入るということで2回目の注文に入りましたが、外れが無くて良いお店だ。長考厳選して注文したのでまだ頼みきれてないメニューが盛りだくさんという点では、明日もまた行くという可能性が否定できない。。(他の中華屋さんと比べて美味しいのかは良く分からないけど、十分旨かった)

以下、2日目の参加メモです。

<目次>


イベント企画: 「学会へ行こう!若者の夢を実現できる場所」-学会が若者にできること、若者が学会にできること-

m_20140312093305531fab41cb9b2

オープニング by 黒橋先生
若手って?
 「今日は」自分が若いと思っている人ではない
 日本学術会議若手科学者定義:30〜45歳(若手)
 大学院生〜ポスドク研究員:20〜30歳程度(本当の若手)

若手研究者の抱える問題・立場
 キャリアトラックの不透明性
  大学教員の任期付き雇用の増加
  男女共同参画・共働き環境を前提とした新たなワークライフバランス
 個人主義的→社会に対する活動
 分野依存→科学者コミュニティ全体
  産業界、行政、NPOなどとの交流

情報処理学会 若手研究者の会のミッション
 研究会の分野を越えた若手研究者の運営強化(動画配信・アーカイブ化の強化)
 新たな研究分野や新たな研究会の運営などの提案(学生運営委員制度の導入)
 内外の求めに応じた若手研究者の意見の集約
 若手研究者の活動向上に向けた取り組みの検討・提案
 その他、学会理事会、委員会等との連携など

講演(1)「学生時代の研究からナビタイムの事業化」 大西 啓介(株)ナビタイムジャパン 代表取締役社長)
当時の学会発表を振り返って
 論文で書いたことは将来の起業に役立つ
 プレゼンテーション自体は様々な場面で役立つ
講演(2)「学会とは誰のためのものか?」 中島 秀之(公立はこだて未来大学 学長)
インターネット発達により学会の在り様が変わりつつ在る
 どう変われば良いかはあまり自明でない
  naltoma: いろんな物が金銭的には低コストでやれるようになってきたので、金銭集めてやるものに専念すべき?
  naltoma: 公開先がバラバラになっているものを収集・整理・提供?
  naltoma: Google Scholar より洗練したもの?プロフェッショナルな情報編纂集団?
  naltoma: ある種のマッチング・調整?(産学官/大学間協定/インターン等より気軽で、双方の希望にあうようなマッチング実現)

昔の学会の機能
 論文発表:査読機能(質保証)、一方で商業誌(Nature/Sience等)に負けていないか?
  査読は無料じゃない
   投稿者に払ってもらうのも一案だが、個人的には好みではない。
   将来はマイクロペイメント?
 情報提供:解説/全国大会/セミナー
  編集諸々の作業はボランティア
  別の側面
   個人的に言っても相手にして貰えなくても、学会を通すとOKな場合も
 研究会運営
  最早「学会の下に研究会がある」という位置付けは機能しない。逆の方向。
 IFIP(加盟学会は各国に1つだけ)

医師会
 医者の同業者組合(会員でないと開業できない)
 歯医者さんでも年次総会に出ている
 →このモデルを参考にする?

現在の情報処理学会
 楕円の二焦点モデル
  研究・教育
  実務
 電子出版化
  来年度から学会誌のみ紙として残る
 情報教育
  J07
  大学入試試験「情報」(計画中)
 資格(ライセンス)
  高度IT人材資格「認定情報技術者」(計画中)
  CI: 情報処理技術者試験(IPA)
 オピニオンリーダー

今後の学会
 ビジネスモデル(どう集金するか)
  学会員のメリットは何か?
  研究成果のオープン化と(オンライン化した)論文誌の関係
 論文査読制度
 出版
  プロフェッショナル編集者
 研究会
  (中島の)上下反転モデル(研究会が中心で各学会がそれを助ける)
 ライセンス(同業者組合化)
  床屋でも国家資格が必要なのに、銀行システムや交通関係システムのコーディングは無資格で良い(のはおかしい)
 国際化
 広報(e.g., オピニオンリーダー)

「学会へ行こう!若者の夢を実現できる場所」: パネル討論

若手へのメッセージ
大学での研究だけで終わらせず、世の中に役立つように。
手作りで国際会議も開催できる時代。自由な発想でやるのが良いのでは。
IPSJに限らずIEEE CSも会員減少問題があるらしい。
 ICTは世界的に成長しているが、中心学会は会員数を増やせていない(国毎に事情は異なる)。
  e.g., inpact factorが高くない学会には参加しない。
 伝統的な自然科学との発表形式の違い
  計算機科学では査読付き論文は終わった成果であって、カンファレンス等での活動が重要視。
  必ずしも学会に参加しなくても問題無いという状況。
 学会という組織に人を留めるという考え方から離れて、人の流動的なダイナミクスを認識して考えるべき。
学会/会議様々だが何でも利用できるものは利用しよう。
 若手はこれからどんどんマイノリティに
  マイノリティでいる怖さ:マジョリティが評価されてくれる所に合わせないと上がれないという思い
数年後の学会の在り方について危惧している。
 本当の若手の人からすると自分のことで手一杯でそんなこと考えていられない。
 マジョリティ/マイノリティもそうだが、どこに帰属してるか、どの立場に立っているか。
  e.g., どこで論文発表するのか、どこで仕事をしているのか
少子高齢化はあるにしても若手が少ないのでは。
 熱気や権威に対する挑戦とかが学会から消えてしまうと魅力が失われる。
 学生をどうやればより盛り上げることができるか。
  naltoma: 別部屋で開催中のハッカソン未踏と様々な攻めのプロジェクトがある中で、目標/やり方の異なるイベントを企画できるか次第では?(学会としてはそれらを金銭面的に後押しするだけでも良いのでは)
会場アンケートより: 学者集団、固い、閾が高い、若者にとってはハードルが高い
 A1: 若い時は「学会に認めてもらう」というような意識があるかもしれないが、個人的には学会は「使うため」の場所だった。学生会員と呼ばれる数自体はそれほど減ってない。情報処理学会で減ってるのは「企業会員の中の若手の研究者(?)」。20代後半〜30代が国際的な所で活動するというのが第一にあり、表に立って一人で戦うのは大変なので同じ問題に対して取り組むためのコミュニティとしての場所として使う。
  naltoma: 詳細化・細分化していくテーマでどうコミュニティを担保する?
 A2: 学会活動は個人のモノなのか企業のモノなのか。殆どの組織が個人のモノだと思っている。企業では自費で有給休暇取って、ということもある。学会投稿料を個人で払ってるとか。一方で組織の評価では論文数が出てくる。それならば公的なモノ、社会のためのモノという認識を広めていくべき。
 A3: 企業会員数が減ってるようだが、学生も卒業後に辞めるケースが少なくないらしい。卒業したての研究者が一般会員になろうという魅力が無いと状況は改善できない。何も分からないまま幹事を努めて得られた経験等、学会活動に関わることで得られる経験を伝えられると少しは改善できる?
 A4: 若い人にとって学会の使い方、楽しみ方があるんじゃないか。閾が高いという気持ちは良く分かる。知らない人だらけで、厳しいコメントを貰う。同じ研究をしている人がいる。最終的には学会で知り合うということが個人にとって重要な価値になると感じる時期があるのでは。アカデミックな人たちは坊主捲りの坊主のような存在。普段話も出来ないような人と話が出来たり酒を飲めたりする、アカデミックという免罪符を通して経験できることがある。敷居が高いというのは正しくて、そこを上手く使うことについてアドバイスできると良いのでは。
 A5: 学生を終えた人への学会としてのメリットについて。宿泊合宿形式のワークショップがかなり上手くいっている。若手の発表ばかり。メンタリングサービス。厳しいコメントサービス。論文の書き方。CS領域の情報処理学会研究会でも似たようなことをやってる所はある。ただし実施コストは高い。
 A6: 企業に入って辞めてしまうのは今の世の中仕方が無いかもしれない。生活費とか削っていく世の中、特別のメリットが無い限り辞めてしまう。企業側の立場としては明確な理由が無いと学会には入れたくない。発表のための発表で終わっては駄目で、他の人に分かりやすい説明になるなり学会お墨付きになるなり何かしらの成果が必要。多くの人にメリットを感じられるようなことを提供できると良いと思うが、プログラム眺める限りではアカデミックにより過ぎていると感じる。企業側が参加しても良いと感じるようなセッションなりが増えてくると良いのでは
 A7: 企業の研究者だけではなく、実務者も沢山居る。研究発表ではないが実務に基づいた課題が多々ある。産学両方の立場から議論できることは面白い。しかし産(実務者?)はいまさら来るというモチベーションはそれほどでもない。研究者の数はそれほど減っていないのではないか。
  高度IT人材育成制度が来年度から始まる。それは実務者向けへの一つの道になると思う。
 A8: 研究していることを企業に入ってそのまま仕事にできないことについて。学生の頃はやったことをそのまま発表できること自体が面白い。企業側があまりメリットを見つけないからお金を出してくれないというのは、新卒会員とか金銭的サービスがあると良いのでは。
  そういう誘導は大切だと思うが、学会はそういうことをしなさすぎ。
会場アンケートより: 研究会が多すぎて分野横断型研究だと会費だけで大変
 A1: 研究会が主になるという方向なら、非常に活発で交流も強いのでそこを上手く活かす活動ができると良いだろう。一部にはポスドク後も5年間は学生会員費でOKということもあり、大変助かった。
 A2: 表の話、研究発表とか昼間の活動についての話が多い。裏っかわ、夜の話とかがもう少し表に来ても良いのでは。研究ダイレクトじゃない部分。海外カンファレンスに行く時、発表の有無で金銭補助が変わるケースもあるが、カンファレンスでは友達作りがメイン。発表より前の話。
 A3: 若い人に話を聞いて見ると、これから発表の人はそれでいっぱいいっぱい。終わった人は遊びにいっちゃう。海外カンファレンスだとドーナツとコーヒーや、ランチタイムが用意されていて、ちょっと覗いてみようとするとか。今回のイベント企画はドーナツとか準備しながらランチタイムにやるとか柔軟にやってみてはどうか。
 A4: 公式にはホゲホゲしてるという中でもっと面白いことをやってることも色々あるのでは。
組織として
世の中お金がつくかどうかは重要
 平たく言えば取り込んでもらう/取り込まれる
 個人だけではなくコミュニティをどう作るか、維持するか
学会を使えばできるよね、ということがある
 どこそこの社長に一個人として声かけるよりも学会として声かけるとか
学会は広報をもっとすべき
e.g., いろいろアワード出してることを知らなかった
 賞罰にも書けるというインセンティブ
囲碁では時々新聞に問題が出されてて「解けると*段相当」とか。
 発表する時は誰か一人が会員だったら良いとか、受賞するときに会員であれば良いとか。
 アメリカでの科学雑誌みたいな位置付けで、オモシロおかしく紹介するとかで国レベル向上とか。
個人ではなく組織に埋もれてしまう名前
成果に対するセキュリティ:組織外に出ても使えることを意識
 学会活動/研究発表を通して表に知らせておくことの大切さを、入った時に伝えるべき。

4P: 評判・感情・意味解析

4P-1 感情推定に基づくコンテンツ推薦システムに向けた小説文感情調査 ○平良浩嗣,當間愛晃(琉球大)
予稿の都合上、卒論前までの内容での発表。座長さんからの質問(何故先行研究の10感情を選択したのか)にはゼミでも突っ込んでたんですが、質問の意図を誤解してたのかうまく答えられてなかったな。

イベント企画: 企業で活用される自然言語処理技術

m_2014031216230853200b5c675ae

講演(1)「ソーシャルメディアを活用するための言語処理技術」 平野 徹(日本電信電話(株) NTT メディアインテリジェンス研究所 研究主任)
(ブッキングで聞けず)
講演(2)「富士ゼロックスにおける自然言語処理技術の取り組み」 大熊 智子(富士ゼロックス(株) 研究技術開発本部コミュニケーション技術研究所 研究主査)
日報からの課題抽出
 必ずしも正解のある問題設定ではない
 「課題」を「望ましくない状況」と「望ましい状況」と設定。
  課題ならではの特徴的表現が利用できるケースも
   今回の例では社内用語も素性として利用
  naltoma: 抽出した理由を提供する技術が求められている?
講演(3)「ソーシャルメディアにおける自然言語処理の活用と課題」 橋本 泰一(グリー(株) WebGame 事業本部 エンジニア)
パトロール業務
 今後の予定
  文脈情報として発言場面や雰囲気、親密度も推定が必要では
  完全機械化するなら、人間の対応力への適応する力が必要

完全機械化されると例えば「書き込みが消された時の納得感」が無い
 naltoma: やっぱり理由提供?

講演(4)「ヤフーで活用されている自然言語処理技術」 山下 達雄(ヤフー(株) 事業戦略統括本部 Yahoo!JAPAN 研究所 上席研究員)
クラウドソーシング
 悪さするユーザへの対応
  代表的なプラクティスが整いつつある状況
   同じタスクを複数ユーザに割り振って平均取る
   bot対策タスクをランダムで混ぜる, etc.
講演(5)「言語処理に基づく商品情報の構造化」 新里 圭司(楽天(株) 楽天技術研究所 シニアサイエンティスト)
テキストデータからの構造化情報の自動化(研究レベル)
 教師なし学習でカテゴリも属性値も自動抽出を目指して研究中
  実サービス入りするにはどこかの時点で人手が入らざるを得ないとは考えている

企業で活用される自然言語処理技術: パネル討論

Q: NLPをより広く使ってもらうためには何が必要?
A1: 同じ組織内では同じ解析器を使って欲しい。
 設定ファイルを変更するだけで解析器を切り替えたりできるようなプラットフォームとしての用意。
A2: NLPだけでは解析困難なマイニング。
 例えばデータマイニング、ライフログ、音声とかを組み合わせた処理。
A3: ツールが古くなって来ている。
 古いものに固執するのではなく、皆で日々新しいモノを使ってシェアする。
A4: 御用聞きしている範囲ではPositive/Negative判定、デモグラフィック分析。
A5: ツールとしての公開はできないが、
 ツールを用いた解析結果としてのデータ提供という形で公開していきたい。
Q: 良く「100%の結果じゃないと駄目」と言われる。これにどう対応したら良いか?
A1: 人と競わせる。
A2: どの場面でどう使うか次第。精度の範疇で実現できそうなサービスを提案するとか。
 間違った結果を提示した際にそれを取り返すことを含めたトータルコストが重要。
A3: 開発が始まる前のハードルを下げる。
 最初からざっくばらんに話をする。
A4: 精度&再現率が重要なのではなく、
 その値が10%向上した際に何が出来るようになるのかまで落とし込んで考えること。
Q: NLPのデモは地味になりがちだが、どうしたら良い?
A1: UI研究者とかとコラボ。
A2: データ数万件とかでは既にビッグデータではなく、GB〜TBな時代。
 そのぐらいのスケール感を持って取り組まないと時代に取り残される危険性。
A3: NLP単体ではなく動画分析等、複数データを結びつける。
A4: 案外中身で難しいことをやってるんだということを見せることが受けることも。
Q: NLPの近未来(?)に実現できそうなサービスと言えば?
A1: 要約。日本語でも。
A2: Agentのような機能。音声や個人情報を含めた処理。
A3: テキスト以外の情報、個人情報を含めた処理。Hadoop等での分散処理フレームワーク。
A4: ライフログ。音声ログ検索。
A5: 情報抽出の高度化。
A6: 第2次マルチメディアブーム。

情報処理学会第76回全国大会1日目

火曜日, 3月 11th, 2014

m_20140311085132531e5004293f0 m_20140311131000531e8c98d8a8c

数千人が参加してるだろうと思われる規模(単純計算で「30セッション*10件*5回=1500件」の発表)ですが、受付はスムーズに1分で終了。領収書は後日郵送になるらしい。それはちょっと困る(事務処理的に)。電子掲示板で流れてましたが、iOS/Androidな専用アプリも配布しているらしく「IPSJ76」あたりで検索すると予稿を見れるっぽいです(期間中限定かな?)。

東京電機大学に来るのは恐らく初めて。複数のビルが密集してて渡り廊下で入り組む形で並んでますが、どのビルもうまくガラス張りを利用して開放感があるので思ったほど息が詰まるような感じではないです。琉大工学部隣に立ててる最中のビルはどうなることやら。

学会予稿集はDVDでの配布。良くある光景ですが、今回から持ち込んでるPCがRetina(光学ドライブ無し)なのを失念してて会場で読めず。事前にダウンロードしてたプログラムPDFだけしか見れないな。しくしく。学会によってはUSBメモリで準備してくれることもあるんですが、今回は無いらしい。一方で情報処理学会の場合は、会場で配るなりするための予稿印刷物が用意されてるんだけど、これがいい加減なくならないのは謎。

「Twitter」を含むタイトルが21件。「ツイート」を含むタイトル9件。「マイクロブログ」を含むタイトル3件(内1件はセッション名で、9件の発表で構成)。ということで少なくともタイトル+セッション名だけで眺めてもTwitter関連を対象とした研究発表が40件弱あるらしい。初めて学会参加する人は、こういう興味のあるキーワードで見つけたタイトルを並べて眺めるだけでも面白いんじゃないかと。勿論一つの学会に限定せずより広範囲で調べてより高い視点で鳥瞰するも良し。逆に一つの事例を掘り下げて理解度を高めるも良し。情報処理学会全国大会時の注意点としては、予稿自体は2ページしか無いので単体では詳細が不明という点。詳細知りたいなら直接コンタクト取る/前後で長文の論文出してないかチェックする等のフォローが必要。

午前中は堀川くんが発表する1P 情報抽出なセッションへ。午後は食事で遠出したこともあるけど招待講演が面白く成さそうだったのでスルーしてイベント企画人間を超えたコンピュータ将棋はどこへ向かうかへ参加。

m_20140311131901531e8eb52888f m_20140311135112531e964016b30

お昼は久島くんに連れられて土手の伊勢屋へ。久しぶりに美味しい天ぷら食べれてご満悦。隣の人とあれこれ話が盛り上がったのだけど「これが下町」らしい。帰り際に吉原情報を伝授してたのが一番笑えました。

m_20140311184800531edbd0def36 m_20140311185931531ede83101b8 m_20140311190741531ee06d62a4f

晩ご飯はカレー・バー(Curry Bar GAKU)へ。学生がパンフレット見た時点ではカレー屋さんだと思ってたんですが、バーらしい。カレーは飲み物なのを地でいってる店があるとは(いや、普通にアルコールメインっぽかったけど)。

以下、参加メモ。

<目次>


1P: 情報抽出

1P-2 文書内に潜在する事象の関係抽出に基づく俯瞰分析への取り組み ○澤村 瞳,小林一郎(お茶の水女子大)
HDP-LDAで構築した文書トピックを俯瞰しやすくたいという話で、ラベル生成/説明文生成みたいな話に近い。タイトル的には「事象の関係抽出」に的を絞ろうとしているのだけど、発表を聴く限りではそのあたりは良く分からず。LDAベースのトピックを説明するという問題設定自体がおかしい気がしなくもない(文書要約と本質的な違いは何だろう?)。
1P-3 文章からの存在物と存在場所の抽出 ○菊池春香,徳久雅人,村田真樹,村上仁一(鳥取大)
SVMで固有表現抽出しようとしているのは分かるんですが、ドメイン特化し過ぎの割にはそこに特化したメリットが出せてないように見える点が気がかり。汎用性を追求したいのか特化手法を目指してるのかが良く分からない。
1P-4 Twitter からの談話同定のための身内的表現の抽出方法の検討 ○堀川敦弘,當間愛晃,赤嶺有平,山田孝治,遠藤聡志(琉球大)
うちの堀川くんの発表で、学外発表3回目&修論としてまとめ終えた後だけあって論点もストーリーも明確。質問コメントも適切な(予想できる範疇の)フィードバックを貰えてました。一度査読付き論文としてまとめても良いかもしれないけど、それにしては中途半端なんだよな。
1P-5 自然言語テキストから効率よく注視語を抽出するための注視関数の提案 ○齋木貴博,鈴木 寿(中大)
一般的な機械学習だと事例/適切に作られたコーパスが大量に必要なのでそこを楽したいよね、というスタンスで「注視関数」を提案しているらしい。そこは理解できるのだけど、注視語が何なのか最後まで良く分からず。
1P-6 時系列テキストデータからの議論構造の可視化 ○平岡美那子,大澤幸生(東大)
時系列議論構造の可視化ということで面白そうだったんですが、個人的には期待はずれ。時計秒針のように360度で時系列を表現するのは良いけど、これだけだと議論構造はさっぱり分からない。一方で今回の可視化にもメリットはありそうなんだけどそこはまだ詰め切れてないか。
1P-7 シリーズ型質問に回答する質問応答システム Metis ○濱田大和,太田雄介,松村冬子,原田 実(青学大)
「日本の首都は何処ですか?」「東京」「そこに済む人口はどのぐらいですか?」のように前の質問から続いている質問を想定したタスク(NTCIRのどれかっぽい)を想定したアップデート話。
1P-9 新聞記事からの発言・行動履歴情報の抽出とその閲覧 ○南雲旭人,山田剛一,絹川博之(電機大)
「ある政治家がどういう政治家をしているか」みちあなものを簡単に閲覧できるシステムを想定しているようだけど、目新しさが良く分からず。中途半端に発言や行動だけを抽出している分、かえって分かり難いサマリになってるような気がする。
1P-10 時系列的話題追跡のためのツイートの特徴語を用いた探索的閲覧支援 システムの開発 ○糸川翔太,白松 俊,大囿忠親,新谷虎松(名工大)
daily, weekly, monthly といったいくつかの期間毎の話題誤検出をまとめただけ?っぽいのだけど、何か変わってることやってたのかな。

イベント企画: 人間を超えたコンピュータ将棋はどこへ向かうか

m_20140311151728531eaa789d2a1 m_20140311165506531ec15accb76

企画説明 by 松原先生
実力はプロ棋士のトップレベル相当。
コンピュータが新しい手を創造できるようになっている(GPS新手、ポナンザ新手)。
対決から協調へ。
この場で対戦してもらうのも良かったが、今回は時間の都合上事前に勝負してもらった。
講演(1)「アドバンスド将棋の実戦棋譜と人間の思考過程」 伊藤 毅志(電気通信大学 情報理工学研究科 助教)
普通のチェスではなく、コンピュータの利用も認めるアドバンスドチェスや、フリースタイルも生まれて来た。
将棋も近い将来トッププロを越えることはほぼ確実。
新しい手を生み出すレベルになっている。
将棋で、コンピュータは全ての面で人間を上回れるのか? 人間が得意とする側面はまだあるのか? 言い換えると、コンピュータだけでも人間だけでも到達し得ないより高いレベルというのは存在するか? その「より高いレベル」へは双方の協力で近づけるのか?
もしコンピュータが人間を完全に凌駕するなら、その先には何がある?
講演(2)「対コンピュータ戦における人間の心理」 古作 登(大阪商業大学 アミューズメント産業研究所 主任研究員)
最強コンピュータ将棋と人間が戦うイメージ
 コンピュータ感情を持たず目的に向かって淡々と行動
 「対コンピュータ戦略」はもはや必須
  矢倉単純棒銀
  入玉データが薄いのを狙う
  引き分け狙い(コンピュータにはそういう発想は無い)
  前例の全くない序盤戦略
講演(3)「コンピュータとプロ棋士」 飯田 弘之(北陸先端科学技術大学院大学 情報科学研究科 教授)
コンピュータ vs プロ棋士
 Q1: Possible to build a strong computer? If so, how?
 A: Search + Scoring + HPC + Modeling
 Q2: Are there any computer’s weak points?
 A: Maybe yes. But, it is hard to anticipate.
 Q3: How can we realize a seesaw game between Man vs Machine?
 A: Maybe yes. Choose appropriate spec, forexample.
 Q4: Can computer measure human strength?
 A: Yes, definitely.

公式
 (1) SHOGI – CHESS = DO
  チェスはスポーツ、買ったか負けたかで終わる。
  将棋は道。スポーツの側面もあるが、道としての側面もある。
   コンピュータがどういう時に負けるか、投了するか。
 (2) MAN – MACHINE = OM
  DeepBlueは強いけど対戦してもあまり面白くない。
  対人間の場合は結構面白い。
  これは心理的な面をモデリングできていない、緊迫感がでて来ない。
  情動/エンターテイメント

パネル討論&会場質問: 「これからの将棋とコンピュータについて考える」

これからの将棋
例えば:アドバンスド将棋, 接待将棋, 将棋の指導と普及。
本気で勝負するなら: 7番勝負全体で勝ち越せば良いというプランニング。
X Day
 オセロの悲劇
接待将棋
相手モデルの研究
 相手に気がつかれない程度のミスを測定する/モデリングする技術
 ゲームAI
 まだまだ十分に相手モデルを理解してプレイ出来ているとは思えない
  人間とコンピュータとのコミュニケーションで何が欠けているのか
   コンピュータは人間のことを理解してくれていない
   人間同士は共通体験/共通モデルのお陰で会話が成り立つ(身体性の問題?)
相手の良さを引き出す
 どういう形でやったら相手が気持ち良く打てるか、どう勝って/成長してもらうか
 目標がないと指導方法がなかなかでて来ない
将棋の指導と普及
奨励会に入れるぐらい強いのに実際に並べたことが無い
 麻雀で点数計算できないとか積めないけど強いとか
人間がコンピュータをセコンドとして採用してパフォーマンソを高める
 事例:コンピュータ2台+人間1名。2手から1手を人間が選択するだけで強くなる。
  チェス世界ではどのぐらい強くなるかの公式がもう出来ている。
 2800点ぐらいのレーティングが3000点は有意に越えてる実感がある。
  使い方次第ではあるかもしれないが保険的/指導的な使い方として使っても7割以上
  一時的に勝率が上がるなら、教育的効果も期待できるのでは。
Q: 将棋のルールについて。より人間が長持ちするルールの改変はあり得るか。あるとしたらどういう改変か。
A: 思考の世界の物理として加速度、情報加速度が重要。2階微分した値の大きさが大きければ良いという訳ではなく、特定の範囲(0.07~0.08)に収まるゲームが千年以上長続きしている。高度になると手数が延びる=均衡状態が続く。そうなると刺激を求めだす。将棋の場合は持ち駒を使うということでDの値をその範疇に収めることに成功している。
Comment: チェスの世界はコンピュータが勝っても業界としてはそのまま。コンピュータチェスの業界は減っている。チェスからゲーム(ICGA)に変遷。
Q: X Dayが終わったらどうなる?
A: 認知科学。コンピュータ将棋の研究だけではレーティングみたいなもので棋力を測っていて、人間界棋力をベースにせざるを得ない。トップが3500だとすると、そこに達するのが目標でそこを越えた後はこれ以外の所にモチベーションが求められる。
A: 歴史的な側面。研究としては囲碁とか。
A: ボードゲームでプロが存在するゲームは少ない。公平性を満たす/人の知的満足度を満たすとかは将棋/囲碁で終わり。AI技術を伸ばすためのターゲットとしては、ルールをトーナメント直前に与える。そこから学習を始める/目標を設定するとかして競う。MarioAIもその流れではある。無限にターゲットがあり、終わらない。

情報処理学会前日は初参加組みへのアドバイス

月曜日, 3月 10th, 2014

情報処理学会第76回全国大会が明日から始まるというこで、今日から金曜日まで東京にいます。天候的には木曜日から雨になりそうか。

うちの学生が発表するセッションは優先参加するので、調整しやすいのはそれ以外の時間帯。といいつつ同じ時間帯でブッキングしてる発表もあるので全学生分を見れるかは怪しい。面白そうなのが見つからなければ展示眺めに行っても良いし(学会会場で割引販売とかは良くある風景。電子版の割引コードくれとか思わなくもないな)。とはいえ大量の発表(30セッション並列+1〜3イベント企画同時開催)があるので、正直見たくても見れないというのが多い学会でもある。お祭りですな。

取りあえずイベント企画を斜め読みした限りでは以下のような日程になりそう。途中で気が変わって一般セッションに行くかもしれませんが。

[1日目の予定]

[2日目の予定]

[3日目の予定]

m_20140310190303531d8dd7e7ab0 m_20140310193101531d9465d05f5

晩ご飯は会場(東京電機大学 東京千住キャンパス)への移動方法確認を兼ねて北千住に集合。オムライスの卵と私に突撃してみたのですが、旨いけど期待してたほどではないか。これならダブルデッカーの方が。あ、カボチャプリンは大変宜しかったです。

晩ご飯食べながら初めて学会参加する学生へコメントあれこれ。先輩からは「外部からのコメントを貰える機会なのでそれを意識して欲しい」という有難いお言葉。私からも似たような話ですが、セッション開始前に座長さんに挨拶しておいてコメント貰いやすくしとこう/コメント貰ったらセッション終了後にお礼良いに行くとその時に貰えなかった詳細コメント貰えることも/企業さんもあちこちにいるので接点持ってみるのも手/展示ブースとかではあれこれ貰えることも/専門書割引販売してることも良くある、とか。

曖昧にすることで扱いやすくなることもあれば扱いにくくなることもある / KES2013, day3

水曜日, 9月 11th, 2013

KES2013の3日目、最終日が終了しました。プログラム的にはキーノートx1件と口頭発表セッションx2件という流れ。

3日間全体の時間的には大分バッファが多く取られていて2日間で詰めて実施した方が金銭的に嬉しかったなと思ったり。例えばセッション間の休憩時間全て30分あるし、朝の開始時間遅めで終わり時間早めだし、人数少ないセッションもあったし。一方で、予稿集は該当論文を探しづらい(悪い意味でのてーげーどころじゃないレベルで酷い)どころか、ヘタするとそもそも掲載されてない論文があるっぽい。探し方が悪いだけかもしれないけど、見つからない。「これは酷い」状態だったりしないかしら。。


Keynote5: Intelligence in Microfluidics, Prof. Danny van Noort

m_20130911091308522fb59442029

マイクロスケールでチューブ&バルブを操作して液体の流れを制御するMicrofluidicsで論理ゲートを実現するという話。方向性としてはDNAコンピューティングよりは簡易に扱える超並列な計算機を目指しているのかな。空気で流れを制御したり、FPGAみたいにゲート自体を自動構築できるようにしていきたいとのこと。DNAコンピューティングと比較すると並列度がかなり落ちそうな気がするのだけど、many cores な時代になってきてる中でどういうところに落としどころがあるのだろう。消費電力/リソースとか?


Intelligent Design and Operation for Sustainable Process Systems and Chemical Plants

午前のセッションは畑違いだとは思いつつchemical plantsは置いといて「Intelligent Design」やいくつかのキーワードに惹かれて聴講してみました。

1番目の発表“Adaptive soft sensor model using online support vector regression with time variable and discussion of appropriate parameter settings”は、「計測しづらい変数(?)を推定するために使われているsoft sensorsがあるけど、gradient changes か rapid changes に対して精度が悪いから、time-varying(時変)を考慮して推定しよう」というような話らしい。理屈は分かるのだけど、実験でデータセットが少なかった(100件)ので具体的に想定している状況の難しさが良く分からず。データ件数がそれだけ少ないならonline学習させずに全体をバッチ学習させれば良いじゃんとか考えてしまうんだけど、そういう問題ではないのかしら。

4番目の発表“Application Methods for Genetic Algorithms for the Search of Feed Positions in the Design of a Reactive Distillation Process”は、多様性を維持するように拡張されたNiche GAでもまだ収束しがちなので、より多様性を維持しつつ探索能力を向上させるためにmulti-niche crowding GA (MNC-GA) を提案するという話。ポイントは選択操作にあって、一度ランダムに複数個体を抽出し、そこから「最も似た個体をセレクトする」が胆らしい。実験でもそれなりに良くなってるのは分かるのだけど、そもそもGA自体の拡張が大量にある世の中なのでこれがどのぐらい効いているのかは良く分からず。

5番目の発表“Generating Alternative Modules for Plant Alarm System Based on First-Out Alarm Alternative Signals”は、タイトル的に「代替モジュールを自動生成する」話かと思ってたのですが、単にGAで解探索するというような話。期待してたのに〜。

別セッションで少しだけ覗いた“Floating Point Arithmetic Protocols for Constructing Secure Data Analysis Application”は、浮動小数点な演算精度をより高めるためのプロトコル(?)を話していたらしい。最後のconclusionと座長さんが褒めてる所だけ見かけました。(その次の発表”Feature Based Summarization of Customers’ Reviews for Online Products”を見たかったのだけど、キャンセルで見れなかった)


m_20130911124716522fe7c43eea4 m_20130911130846522feccec31df

お昼はリーガロイヤルホテル小倉でやってたバイキング。個人的には昨日のレストランが美味しかったかな。ただ、胃袋が尋常でないマッスルメンたちに囲まれてたので、ここで良かったんだろうとは思う。(彼らは1,500kcalぐらい食べてたんじゃなかろうか。。)


Collective Intelligence and Intelligent Data Analysis

最後は集合知とデータ分析関連のセッションに突撃。AHPな話が多かったか。

1つ目の“Dual Exclusive Partition in Fuzzy CoDoK and SCAD-based Fuzzy Co-clustering”は、共起を使ったクラスタリングで「アイテムは1つのクラスタにのみ属する」という制約が付けられてることが多く、この制約が強すぎて「あるアイテムはクラスタ1にもクラスタ2にも属する」というようなクラスタリング結果を得ることができないので、その制約を単に外すだけじゃなくて緩い制約を導入したクラスタリング(Fuzzy co-clustring)を提案するという話。

2つ目の“A Greedy Algorithm for k-Member Co-clustering and Its Applicability to Collaborative Filtering”は、プライバシー保護のために、Anonymity Level(秘匿度レベル?)が高いデータを想定しつつ、高い精度でクラスタリングしたいという話なのかな。クラスタ数ではなくてクラスタに含まれるアイテム数kを決めてやるk-Member Clusteringをベースとして、クラスタリング時に共起を考慮するとのこと。

3つ目の“Introduction of Majority Vote of Neighborhood Conditions for Sneak Form Reinforcement Learning”は、強化学習におけるメモリ食い過ぎ問題を改善しようという話。シンプルに「使わない(状態s, 行動a)のペアを削除する」というChine Form RLだと頑健性が無さ過ぎなので、どのペアを残すかを多数決で決めよう(Majority Vote of Neighborhood Conditions)という主張。実験結果でもメモリが少なく&性能良くなってたりするんですが、これってtoy problemsだからそうなってるだけな気がするのは気のせいなんだろうか。

4つ目の“Intergration of Information Based on the Similarity in AHP”と、5つ目の“Encouragement of Group Decision beyond Sum of Individuals based on Possible Estimations”はどちらもInterval AHPを拡張する話。細かい点は置いといて、AHPだとやっぱり「1対比較」させちゃうコストが高いのがネックに感じます。あと、個人的な解釈では「何となく納得できる(し、説明もできる)」レベルでの意思決定に使うのだろうと想像しているので、細かい(ように見える)拡張にどういう意味があるのかが良く分からない。最適化したいとかじゃないんだよね?(多分)


m_20130911182056523035f806ebc m_20130911191213523041fd1362d m_2013091118382552303a11ccd92 m_2013091118231252303680aeb81 m_2013091118340852303910bc696

小倉最後の晩餐は八くらにて串焼きを堪能。個人的にはしいたけ&山芋が美味しかった!

一番期待してたウェブインテリジェンス&マイニング&情報検索なセッションのある日 / KES2013, day2

火曜日, 9月 10th, 2013

m_20130910084701522e5df580909

KES2013中日にあたる2日目が終了。今日はキーノート1件、口頭発表セッション1件だけで、午後過ぎには終了。あとはショートツアー(観光)してからバンケットらしい。観光も面白いかもしれないけど、事前情報ゼロなのとバンケット会場が先日攻めて来た門司港付近らしいので、ホテルに戻って作業することにして後で直接会場に向かうことにしました。


Keynote3: Fuzzy Rule-Based Classifier Design: Accuracy Maximization and Complexity Minimization, Prof. Hisao Ishibuchi

m_20130910090459522e622b0a88a

ファジィ理論の歴史と、進化計算を組み合わせた多目的最適化で精度(accuracy maximaization / error minization)と使いやすさ(interpretability/complexity)を両立するような解を多数見つけて、その中からユーザが求めているものを探そうというような話。GAやその応用例の話はカットかもっと切り詰めて、最後の組み合わせ方やその後の話がもっと聞きたかった。機能もtype2なファジィの話が出てましたが、どうやら「メンバーシップ自体にもファジィらしさを導入」ものをそう呼んでいるらしい。

ファジィルール集合をそのまま扱うのは、データの質&量の増大に伴って処理がめんどくさくなりそう(≒処理が重そう)なんだけど、アプリケーションの段階では適宜適用対象を絞り込むことで対応するみたいな方針なのかな。講演ではシンプルに並列処理させるとかだけでなく、ルール集合全体を使うのではなく部分的に使うみたいな話も。Dropoutに近い考え方?かも。多分。あと、多数の解(というか解候補)から本当に必要な解を選択するための支援が必要な気がする。解と解の関係性を何らかの形で説明するとか?


Web Intelligence, Text and Multimedia Mining and Retrieval

口頭発表セッションはウェブインテリジェンス+マイニング+検索な会場を選択。自分の興味はこれに言語処理+対話型AIを加えたようなところにあるのだけど、期待してたほど目新しい話はなかったかな。

気になったものをピックアップすると、1つ目の”Unsupervised Emotional Scene Detection for Lifelog Video Retrieval Based on Gaussian Mixture Model”では、顔が映り込んでるシーンの感情推定を「教師無し学習でやろう」という話なのだけど、何故教師無し学習でうまくいくのかは「?」のままでした。静止画の顔写真(表情)から感情推定する話との本質的な違いも良く分からず。シーンとして時系列情報使って多少のノイズを除外しているのは分かるけど、それならそれだけの話だし。

2つ目”Exploitation of Query Sentences using Specific Weighting in Support-Sentence Retrieval”と3つ目”Combining Lexical and Semantic Features for Short Text Classification”はどちらもショートテキストを対象にした検索・分類に関する話。どちらも良く聞くアプローチがベースになっていて、クエリの重み付けをどう調整するか、語彙的スコア(lexical score)や構文的スコア(syntactic score)を使おうとか、LDAのように潜在的なトピック抽出した上で特徴表現しなおそうという話。どちらもその辺りの代表的な事例を示しながらアップデートしてるので、参考になる情報が整理されているという点でも良かったか。


ランチ

m_20130910123530522e9382bccb7 m_20130910125104522e97281ca3c m_20130910124316522e9554df9fa m_20130910130253522e99eda5255

例によってお昼はただ飯で、会場隣接のレストランRistorante Passo del mareにてお食事。昨日のお昼、今日のお昼、バンケットの3カ所で比較すると一番ここが美味しかったな。是非ともバンケットもここでやって欲しかった。人数的に入りきれなかったんだろうとは思います。


Keynote4: Noniidness Learning and Pattern Relation Learning Prof. Longbing Cao

途中から参加したこともあって何度も出てきた”IID”という謎の言葉の意味が分からなかったのですが、ググった限りでは

IIDness, which assumes the independence and identical distribution of underlying objects, attributes and/or values.

(Non-IIDness Learning in Behavioral and Social Dataより抜粋)

というものらしい。これからはcoupringが重要だとかいってたのは、independence で identical distribution になってるデータを組み合わせることか。具体的な事例は上記論文なりを読むと良いのだろうな。


懇親会

m_20130910184225522ee981dff5c m_20130910185248522eebf0ce80b m_20130910193314522ef56ad5363

お昼が想像以上に美味しかったので「ひょっとしてこれ以上美味しいのを用意しているのでは」と期待してたのですが、一般的なバンケット同様会場費が高く付いてるっぽい。普通に美味しかったし、あれこれ食べれたので満足ではありますが、やっぱり質だけでいうなら「同じ値段出せばもっと美味しいの食べれるだろうに」と思ってしまう人なので、バンケットは別料金にして欲しい。。

Granular computing な一日 / KES2013, day1

月曜日, 9月 9th, 2013

m_20130909090737522d1149664ad

KES2013の1日目が始まりました。今日はキーノート2件、口頭発表セッション2件という流れ。鞄とラミネートされた参加証も貰いましたが、これが必要になる状況というのは良く分からない。といいつつ、学生の頃に貰った鞄が使いやすくて今もずっと使ってたりしますが。USBメモリで論文集配布するのは持ち歩きの面でも探しやすさの面でも楽で嬉しい。けど、これも一人一つ配布するというのはあまり必要性を感じないな。ということで参加費はもう少し削る工夫をして欲しいなー。

国際会議というと他国からも大勢来るのでガイドによる誘導等がしっかりされているという印象が強かったのですが、今回は比較的そうでもなかったです。迷いにくい場所ではあるんですが、プログラムにミスがあったり、論文電子化されてるのは良いけど欠落や逆にキャンセルされたものも掲載されてたり、ブックレットと電子媒体とのマッチングが謎で探せない(結局キーワード検索することにした)とか、ちょっとしたケアレスミスがここまで目につく会議も珍しい。

参加者は受付の様子を眺める限りでは100人もいないのかも。人数多ければ良いというものでもないけど、座長さんが声かけて来ないと「発表者しかいないセッション」が少なくないっぽいのは悲しい。個人的には無理してinvitedしないと集まらないならそれは需要が無いということで見送った方が良いんじゃないかと思う人です。あちこちで学会乱立しても仕方ないし。研究会みたいにその道の専門からが集中的に討論できる環境の重要性は分かるのだけれども。


Keynote1,2

m_20130909093838522d188e9f629 m_20130909143503522d5e07650d3

  • Keynote1: From Data to Knowledge Networks and Their Granular Hierarchies,
    Prof. Witold Pedrycz, University of Alberta
  • Keynote2: Risk management in interactive intelligent systems Prof Andrzej Skowron, Warsaw University

Keynoteは2件ともGranular computingに関連した話。実世界の複雑な現象は本質的に階層的で分散処理されているのだからそれに見合ったモデルが必要だという話で、ファジィ集合type-2やら、ラフ集合とかそれの拡張したものらを部品として使いつつ、階層型に組み合わせたモデルでより抽象的なデータやパターン(=知識)を表現出来るだろうというような主張なのかな。表現を変えると、より複雑な表現を行えるニューロンを使った階層型ネットワーク、に見えます。という意味では、granular computingでどう処理/学習していくのかが気になるのだけど、何かしら一般的な話はあるのだろうか。


Invited Session: Recent Advances in Knowledge Engineering and Soft Data Paradigms

m_20130909111001522d2df98dae4

午前の口頭発表はinvited sessionで、1番手は”An Introduction of Tag Ratio Model and the Classification Examination for Recommender systems”というタイトルで山内くんの発表。は、見事なまでに質疑応答で沈没。最初のシンプルな質問にちゃんと答えられなかったのが致命的で、そこから脱線というか遡った質問に繋がってしまって本当にしたかった討論はやれなかったのはちょっと残念。研究室での対策不足ということですな。

2番目の”Computational Techniques for Characterizing Cognition using EEG Data – New Approaches”は、EEGの時系列データからグラフ構築して、とある認知タスクに対して関係性の高い(強く発火しやすい)部分をマイニングしたというような話。珍しい話ではないと思うのだけど、こういう話を聞くと「そこから知能の分析/解析にどう結びつけるのだろう?」という疑問がわきます。計測出来てるのはごく一部分であって他がどれぐらい関与しているかはよくわからないし、発火した=関与しているとも、発火していない=関与していないとも断定しにくいものだとも思うし。認知的な意味では前にまとめたやつが疑問のままで残ってるな。

m_20130909133228522d4f5c7f4bb m_20130909135223522d54078b4a6

お昼はフラミンゴカフェでただ飯(学会参加費に含まれてる)しながら反省会。質問自体は理解してたけど、どう回答すべきかで悩んでしまったらしい。


Chance Discovery and its Innovation

午後は通常セッションに潜入。

予想外に面白かったのは1番目の”Data Jackets for Synthesizing Values in the Market of Data”の「jacket」という問題点の考え方。DVDとかで「ジャケ買い」という言葉がありますが、基本的には中身が見れない状態でパッケージ(ジャケット)を眺めて吟味するしかないという状況においてそのDVDがどれぐらい良さそうかどう判断すべきか。ということを「Data」について同様にJacketsとして看做して「データセットの中身は見れないが、部分的に説明なりが用意されたジャケットからデータセットの良さをどう評価したら良いか」というような問題意識から取り組んでる話らしい。けど、その後のブレインストーミング/イノベーターあたりの話との関係は良く分からず。

2番目の”A Long-term Data Collection System for Life Pattern Sensor”はライフログ的な意味で気にしてたのですが、電気使用量から生活パターンを予測できそう->ライフサポートが行えるんじゃないかというような話。ちょっと想像してたのとは違ったな。

4番目の”Interactive Visualization for Monitoring Support of Multiple BBS Threads”は、2chのような多数スレッドが膨大&streamに流れ続ける状況において、「欲しいデータを探すというような最優先タスク*ではなく*」、「あるキーワードに関連する話題をモニタリングしたい」というような副次的タスクをどう支援するかという話で、タスク設定してお試し検証してみたらしい。

m_20130909190426522d9d2a0c63c m_20130909191854522da08eb76e3 m_20130909192031522da0efc87c7 m_20130909195956522daa2c0afb1

晩ご飯は山内くんメインタスクが終了ということで景屋にて打ち上げ。関門海峡での穫れたてがあるとのことで今日は秋刀魚の刺身、サンマの塩焼き、どぐろの塩焼き、生タコ、焼うどんを頂きました。タコ美味しいよタコ!