Archive for the ‘イベントレポート’ Category

Azureを使ったIoTハンズオンセミナー

金曜日, 10月 23rd, 2015

CR9quuUUYAAbFAI.jpg-large msiot-1

IoT 初めの一歩~まずは試してみよう ‼ モノの接続からデータ分析まで」なるイベントに参加してきました。ieな人ならWindows OSのインストールからやる必要がありますが、学科でサイトライセンスあるからうちの学生なら(MicroUSBケーブルとか物理的なものを除けば)一通り無料で揃いますね。環境構築上の注意点はこの間書いた通り。ここでは参加して良くも悪くも気になった点を列挙してみます。

ちなみに、今回の資料に限らずIoT普及の一貫として、関連情報を一通りブログとかで公開してるとのこと。

ワークショップに限らず何か一緒にやれることあればいつでも声かけてくれ状態らしい。


<良かった点>

  • 1ヶ月限定(かな?)だけど、Azureはお試し無料で触れます。これは今回のワークショップに参加しなくても良いので独立した話ですが。
  • クラウドAzureで、ストリーミングデータ(今回はここがIoT)を投げつつ、そのデータを対象とした分析(グラフ化)、機械学習をする流れが掴めた。
  • IoTなストリーミングデータの管理を丸投げして問題無さげ。例えばキューに溜まってても7日間はそこにデータ貯めておけるのでロストすることが無い(ように設定できる)とか、DB周りの管理コストを一任できるという点ではメリット大きそう。(やれば分かるけど、データを24時間365日管理し続けるってそれなりにコストかかるのよ)。データ周りを丸投げできる分処理に注力できるというのも大きなメリット。
  • (私はどちらかというと邪魔に感じるけど)GUIらゔな人は、ブラウザでドラッグしてポチポチするだけでデータを処理できるというのは嬉しそう。
  • ボード(GR-PEACH+温度・加速度センサー付きドーターボード)貰えました(何)

<悪かった点>

  • マイコンにありがちだと思いますが、ボード認識自体に手こずる。OSレベルでは認識してるのにVisual Studioから認識できないってなんだよおい、という。数十回トライしなおしましたが結局開発環境からは見れず、今回はシミュレータだけでのトライになりました。ちなみにFusionで仮想OSだからという訳でもなく、WindowsPCでもそうなってる人はいました。ビルドすらできないってのは開発環境としては致命的すぎるような。(これならVisual Studio使わずに別ライブラリで開発した方が良さそう。この場合、Azureとの連携に苦しむことになるのだろうけど)
  • Azureに丸投げするために避けられないのだけど、初めてやる時には1,2回どころじゃ済まない回数の「登録作業」が必須。もう少しお手軽にならないものか。回数はともかくとして「さっき登録したアレに接続」したい時の「アレ」を手軽に紐付けして欲しいのだけど、手入力求められるケースが少なくない。
  • お試しでIoTなストリーミングデータをあれこれする、というだけなら別のフレームワーク使った方が早そう。サービス登録とか面倒なだけだし。多分、これを学生実験としてやると本題になかなか入れない&何と何がどう繋がってるか把握しきれずに「で?」で終わりそう。
  • 複数サービスをあれこれ組み合わせてるので仕方ないのだろうけど、やりたいことがどのファイルに書かれているかを覚えるのが大変そう。設定ファイルうまくまとめられたら良さそうなんだけど。
  • クラウド特有の問題というよりUIが熟れてないというのが影響していそうだけど「何故かうまくいかない->変更してないけど何度かトライすると上手くいった」というケースが随所に出てくる。これは開発に集中しづらい。
  • (これは会場のネット環境の問題である可能性が高いけど)Azure操作する度に固まりまくり。ブラウザ起動し直して接続すると良いとかなにそれ。

仙台出張2日目(FAN2015, day 2)

金曜日, 9月 25th, 2015

m_201509250331585604c02ea2e39 m_201509250645535604eda127685

FANシンポジウム終了。東北大学広い割にアクセスも良い(仙台駅から徒歩15分程度)所にあってイイネ。ちなみに上記食事はミールカードも使えるレストラン。うちにも少しお高め(大学生協の2~3倍)ぐらいで美味しいお店くれくれ。

情報処理学会全国大会だと「同時に20〜30会場で並行してプログラムが動いてる」規模ですが、今回のFAN2015は2並列(で済む規模)でした。やっぱり時期が悪かったんじゃないか説。1日目に間に合うように前日入りしようとすると連休に被っちゃってたからなぁ。あと、普段よりも教員・企業さんが発表してる件数多かったかも。見てたセッションがたまたまそうだったという可能性もありますが。

今回の発表で面白かったのは九工大・古川先生の「テンソルSOMによる企業内チーム分析」。背景は「あれこれアンケート書かせること多いけど回答者別・所属別・設問別とか分析しようとすると無駄にグラフ爆発起こしてみてられないよね」に出発点があって、その解決手段として「複数のSOMマップを紐付けて分析できると嬉しいよね」というお話。具体的にあれこれ分析することで手法の良し悪し見てるところらしく、近々論文出る目星があるとか。面白いのだけど、これはこれで実際に分析する段階では爆発してる気がしなくもない。いや、素のSOMとか個別に分析するよりは遥かに楽なんだけど。

次に面白かったというか興味があるのは大阪大学・畠中先生の「データに基づく学生の修学状態のモデル化」。「なんとなく特別な理由無しに消えて(退学?)してしまう学生を早い段階で見つけられないか」という趣旨で識別問題(≒例外検出)として取り組んでいる話。データのセンシティブさ、データの質と量、そもそも明確に取りやすいデータ群を集めたからと言ってそこから見えてくるものなのかが不明等々、難しい側面があちこちにあるな。家庭環境とかどこまで考慮するかにもよるし、そもそも考慮できるのかとか。勝手に妄想すると、案外「学費を遅延無しに振り込めてるか」とか目に見える間接的なデータから推定できるかもしれないけど、そういう風にデータ使って良いの?とか。

3つ目は大阪府立大・斉藤さんの「Q学習におけるUCB行動選択手法の性能に関する調査」。パラメータ設定にやや疑問が残るけど、Q学習にUCBベースのアルゴリズムを組み込んでベンチマークしたというのは分かり易いストーリー。ただ、できればシンプルなQ学習ではなく、(toy problemではないという意味で)DQNとか現実的な実装での検証して欲しいかな。そもそもどう実装するんだという話もあると思うが(既にありそうでもある)。

4つ目は東北大学・羽鳥先生の「頭部方向情報に基づく大画面観察時の視線予測」。これもストーリーが分かり易いのだけど、動画像を観察する際の注視位置を予測するには頭部方向を含んだモデルが有効(ただし比較的近距離での話で、ある程度距離が離れると不要)という話。バイアスに指向性があるなら利用したら良いじゃない、と。

番外編として慶應義塾大学・金政さんの「同期型Firefly Algorithmの提案と遺伝的プログラミングを用いた調整則設計」。やりたいことは「Firefly Algorithmを拡張した提案手法のパラメータを自動調整したい」という風に聞こえるのだけど、今回のGP実装でどのぐらいうまくいくのかがサッパリ分からない。グリーディ探索みたいなやり方ではない所に興味を持つのだけど、今回のやり方で汎用的な探索モデルが得られるかは謎。オリジナルはそこだと思うのだけどそこを殆ど話してなかった(既存研究解説がメインだった)のも残念。


m_201509250756585604fe4ac0cfc m_20150925084313560509213f6fc

晩ご飯まで大分時間があるのでお茶でもするかと散策したらnana’s green teaを発見。イオン系列にも入ってるのね。お茶は美味しかった!けどお高めだったケーキは普通だったな。


m_201509250935225605155a8720d m_201509250936315605159fe62cf

昨日は海鮮物攻略したということで今晩は肉攻めに。昨日に続いて仙台駅構内にある牛たん通りにて塾考の末、ハーフ&ハーフとか少しずつあれこれ楽しめる牛たん炭焼 利久に決定。牛タン生、焼き牛タン(ノーマル&極)、トマト煮、テールスープと牛タン尽くし。食べ過ぎじゃ〜。

P.S.
朝食に牛タンカレー食べました(何)

仙台出張1日目(FAN2015)

木曜日, 9月 24th, 2015

m_201509241033435603d187c11fb m_201509241034285603d1b4bb52c m_201509241102325603d8484b948 m_201509241124575603dd897cce8

今日からFANシンポジウムのために仙台に来てます。シンポジウム自体は今日から開催なので本当は前日入りしたかったのだけど、前日が連休最終日に被ってていいタイミングの便が取れず、暫くキャンセル待ちもしてみたのだけど無理だったので1日目は見送る形での参加です。1日目に面白そうなオーガナイズド・セッションがあっただけにちょっと残念。ま、後で論文読もう。

ということで1日目は移動だけで終了。取りあえず海の幸(主に秋刀魚)と山の幸(というかずんだ)をゲット。もう満足です(違)。前に来たときもそうだったのだけど、仙台駅構内にあるすし通り、やっぱり美味しいな。。

渡嘉敷@1,3研修

火曜日, 9月 15th, 2015

一部トラブルもありましたが、基本的には年次長ズを中心とした面々のお陰で滞りなく終えることができました。事前準備から当日に至るまでお疲れ様でした! 打ち上げと称して今度美味しい物食べに行きましょう!!

以下、箇条書きで振り返ってみます。写真は人物入ってるのが多いので意図的に掲載しません。1,3年生向けには後日お送りします。

  • 年次長が遅刻。*2年前に1年次として参加した時もそうだったなぁ(遠い目)。
  • 集金・人数チェック等諸々が1年次が先に終わる。(オワタダ先輩流石です)
  • 1日目がフェリーに一人乗り遅れ(見知らぬ人)、一人ゲロ(赤ちゃん)から開始。
  • 到着して部屋割りからの昼食。謎の赤い物体が散らばってると思ったらカレーだった。(並んでる順序おかしい)
  • 昼食終わって一番暑いであろう時間帯にビーチへ出発。途中自転車移動してる人いたけどこのアップダウンはキツいよね。
  • ビーチ到着してまずはオリエンテーション。が、先に着替える人やら待つ人やらばらばらでなかなか始められず。
  • オリエンテーション後、ルール大臣によるドッジボールのルール説明、チーム分けをして試合開始。白い砂浜青い海を見せられつつ初戦に割り当って泳げないと喚く人多数。
  • その間に山田先生+一部の学生が先に海へ突撃。思ったより冷たい(気持ちいい)
  • 1試合目は元気だった人も2試合目では既に動きが鈍る学生多数。なおちいだ先生の特殊技能を駆使した回避スキルと、あざー先生の実況しながらプレイスキルは最終的に沈められた模様。
  • 待ちチームは泳いだり芸術的(?)な砂場アートを作ったり穴掘ったりカヌーしたりトス回ししたり埋めたがったり。
  • 後片付け掃除してビーチを後に。
  • 施設に戻って夕食までの時間は自由時間。テニスしたりバスケしたり筋トレしたり卓球したり(皆元気やのう)
  • 1500円もするBBQッテ期待して良いよね?と期待したものの、質より量で攻めるタイプ。いや、マズいわけじゃないけど、20代前後の若者だらけですら食べきれない量出すのはおかしいだろう、というぐらいの意味で。
  • BBQ後自由時間。もう終わる頃には日没しかけ。なお寝室の空調は9時だったか10時からしか動かない中央制御仕様。しくしく。
  • 22時〜23時30分頃まで山田先生&吉田先生等とだべる。(眠かったんだけど)
  • 2日目6時起床し、始まらないラジオ体操から開始。
  • 待ちくたびれたので琉大だけでラジオ体操開始。終わる頃(7時前)に施設の人来て「あれ、琉大さん事前チェックしてたんですか?」からのラジオ体操2回目突入。なおラジオ体操中にゾンビの如き呻きが木霊した模様。
  • 2日目は完全に自由行動だったため比較的涼しい場所を陣取って読書。学生らは寝直したりスポーツしたり(元気やのう)。なお一人は交渉で施設のおじさんからバイク借りて近場を散策したらしい。借りる方も貸す方も凄い。
  • 昼食後、部屋の掃除&荷物追い出して退寮準備しつつ、バスが来るまでの時間は自由時間。一部のメンバは空調の効くマルチ棟にてカードゲーム。UNO1プレイ中に3,4回ぐらい言い忘れがあったり、そこに気づかずに突っ込まなかったり、「ねぇ、私何か悪いことした?」「殺す」とかナニコレコワイ
  • 港に着いてから待ち時間の間にお土産やら物色。個人的なアタリは「野苺のサーターアンダギー」、1個80円なり。野いちごのプツプツした触感も良いし、サーターアンダギー自体のレベルも高い。なお、あまりにも気に入ったので他の先生・学生らに売り込みまでした模様。
  • 泊港に戻って集合写真して解散。お疲れ様でした。

工学部後援会

水曜日, 8月 19th, 2015

m_2015081903121855d3f4126a552 m_2015081905515255d41978e756f IMGP0006 IMGP0162

工学部後援会なる「後援会」の理事なんてのになってる(去年知らずになってた)ようなのですが、それ含めると今年度で2年目。去年あった関連イベントを通して目的が理解できたのであれこれサポートしやすくなってるかなという一方で、もっとうまくやれるはずという思いも。

後援会の学内理事的な一番の問題は「就職説明会への学生参加者集め」。うまく集まるときとそうでない時の落差が激しくて、折角足を運んでもらってる企業が多数いるにも関わらず「全体で10名ぐらいしか来なかった」とかなると涙目。で、これって求められていない(学生のニーズに合っていない)のでは、ということで去年あれこれ会議の場で発言してみたのだけど、あまり受け入れてもらえず。仕方ないかと思いつつ、懇親会の場を借りて雑談的にいくつかの事例を話してみたり。情報系だと就職活動ではなく、間接的に企業との接点がある勉強会の類いが比較的活発で企業という枠自体も取っ払って緩く繋がるのもありますよ、と。

工学部全体でもなく、琉大全体とか大学跨がったやり方とか含めて、今の時代「学生が求めているもの or 面白そうだと興味を持ってもらえるもの」をデザインしないと。

2015年度プロジェクトデザインI, II 最終発表が終了

金曜日, 8月 14th, 2015

あれこれ多くのことを名嘉さん&翁長さんに丸投げしての発表会が無事に終了しました。受講生の皆さんもですが、サポートしてくれた院生PMの皆さんもおつかれさまでした。

1年次のPD1ではテーマ自由(新規性・有効性・社会性のあるデザイン)をグループで企画提案せよという課題が。2年次のPD2では情報工学科のCMをグループで企画提案せよという課題が各々与えられていて、それをプロジェクトと看做した上で院生がマネージャとしてサポートに入ってもらっています。

PMのお陰もあってか、年々「ただのウケ狙い」というのが減ってるな。ネタを昇華してる。まだ突っ込みたいところ(サーベイ不足、シミュレーション不足、etc.)はあるが、それ含めて演習だし。という意味でもう少し細かくフィードバックしたいよなとは思うが難しいんだよな。また、前日あたりに発表練習するというグループも増えてて、PMに添削指導して貰えたところもあったようです。添削してもらえたことは次に活かそう(同じ失敗をしないように要因分析するなり対策検討するなり反芻・咀嚼しよう)。

PD1について例年気になってる点としては、新しいモノを考える・生み出すのは大切なことなんだけど、その過程を通して「調査研究」の大切さに気づかせる側面がまだ足りてないという印象があります。他と比較できないと「新規性/社会性/有効性」とかを主張できないはず(=企画に説得力を持たせ難いはず)なんだけどね。仕方ないのかもしれないけど、そういうことを1,2年次の頃にやってないから3,4年次になって苦労してるようにも見えるし。何か上手いやり方ないかしら。

一方で特に指示無いにも関わらず自主的にやってる良い面もあって、想像でターゲットの考えをでっち上げるのではなく100人にアンケートしてみたとか、学科外・学部外の人にどう思われてるか聞いてみたとか足で稼いでるグループがあったり。どこかが実施した調査結果を引用してるグループもあったか。そういう調査結果は便利ではあるけど、誰がどういう方法で実施したのか、回答者に偏りが無かったのか、設問文や選択肢等に恣意性が無かったか、回答当時と今とで同じなのか等々、様々な要因で「本来とは違う結果に引きずられる」こともあるので、単に結果を鵜呑みにするのは危険なんだよね。その意味で「自分たちの足で稼ぐ(アンケート実施する)」というのは、どういう偏りがあったのかとかも含めて話を進められる分、良い面もあります。

PD2について気になった点としては、「CM完成にこぎ着けなくても良い、その代わりちゃんと企画した内容を説明してくれ」ということは伝えているのだけど、「時間の都合上動画作成が簡単な案を選択した(ように見える)」ケースが去年も今年もあったこと。本来の趣旨はCMを作ることが目的ではなくて、CM作製のための企画立案を通してシラバスの達成目標をクリアできる力を磨くこと。なんだけど、多分去年もそうでしたが「他のグループちゃんと動画作ってるっぽいよ?」という状況になってたら、「うちも作らないとマズいのでは?」という気持ちになるのだろうなというのは理解できます。この辺りはどうしたものかなぁ。

エンターテイメントを支援する

木曜日, 4月 9th, 2015

m_2015040909491355264b1911c6a

週ゼミはもうちょいじっくり話したかったけどゲームAIな講演会入れてたこともあって手短に終わり。思ってた以上に泥臭い所もちゃんとやってて面白かったのだけど、明日の実験準備もあって終了後に懇談会やれないとか、ちょっとあちこち消化不良か。

明日企業説明会をするらしく、今日はついでに事例紹介をということで来られてたのですが、企業説明会では全く出て来ないであろう話が豊富で楽しかったです。(作成する方の)ゲームクラスタとか人工知能に興味ある学生あたりが来るかなと思ってたんですが予想以上に少なく。AIに興味あるって言ってた新入生もちらほらいたんだけど、ちょっと残念。ま、告知タイミング&方法にも問題あったのは確かだし、仕方ないか。

発表資料や関連リンクは一通りここにあるのでそこを見ると良いでしょう。ざっくりいうとタイトル通り「GAを使ってパズル問題自動生成してるよ」なんですが、人間にとって良質の問題を作るための泥臭い努力が随所に見られました。交叉/突然変異時の例外処理とか、難易度の妥当性を確認するために手筋を体系化してチェックしてるだけじゃなく、実際に人間に解いてもらってどのぐらいスコアが適切かとか。GAでパズル作るというだけなら似た話はいくらでもあります。例えば昔の実験3/4で「GAで数独問題作成する」とかやってる学生もいました。ただここまで本気で取り組んでる例は少ないんじゃないかな。

一方で、「作成する人の支援」とか「解く人への支援」はそこまであまり手を入れてはいないっぽい(やってはいるけど、ぐらい)。勝手な個人的な考えですが、エンターテイメントは「どう人間を楽しませるか(e.g., どうやったら手筋に気付くか、どうやったら教えすぎずに済むか、どうやれば共に向上していけるか)」が一番面白い部分だろうと思ってます。ちなみにここで言うエンターテイメントは広義で使ってて、スポーツでもゲームでも読書でも勉強でも、楽しんでやろうとする物事全てを想定してます。いつかはAIが勝つならAIに楽しませてもらえば良いじゃない(言い過ぎ?)。

京都出張4日目(情報処理学会第77回全国大会 3日目)

木曜日, 3月 19th, 2015

今日も雨模様でやんわり冷えてます。雨自体は昨晩から強くなってきてて、今朝も強いまま。しくしく。

IMGP0731-1 IMGP0731-2 IMGP0812

総合受付や第1イベント会場等は100周年記念な時計台にあります。ホールとかラウンジに飲食物持ち込み禁止なのは別に良いんですが、ラウンジで専属のバーテンダー(?)がいたりして驚く。あちこちにモノだけじゃなくヒトに費用かけてるよな。正門に受付いるし、中入ってすぐに(交通量が多いわけじゃないけど)交通整理する人いるし。一般道に面した建物が多いこともあって、そういう所にはさりげない広報もされてたりして面白いです。琉大だと「そもそも歩いて通る人少ないし」とか言いそうだよな。事実その通りでもあるし。その一方でイベントとしての会場案内(掲示)については個人的に参加してきたなかではかなりレベルが低いという、謎のギャップが。開催してる建物の入り口まで辿り着いても掲示が無いとかざらだったし。


<目次>

オリンピックに見る日本のICT技術

1件目はどちらかというと収録+即時フィードバックのためのインフラを中心とした話(分析もしてるようだけど、発表ではほぼ割愛)。2件目はトップアスリートの分析に耐えうる高精度な分析しようとするとモニタリングだけで高コストすぎるのを、YouTube動画でどうにかしようという話。3件目は両方に跨がった事例紹介かな?(途中で抜けてしまった)。オリンピックに直結したプロジェクトも多い中、メイン会場で開催してる割には聴講者ガラガラでした。2件目保原先生の話が面白い。


講演(1) 選手,コーチをサポートするICT技術(映像システム編), 三浦 智和 (独立行政法人日本スポーツ振興センター 国立スポーツ科学センター スポーツ科学研究部 専門職)

IMGP0700 IMGP0702

後半しか聞けてないですが、トップアスリート支援で必要な高精細録画を「現場」で収録&即時フィードバックするための環境整備自体のコストがまだ高くつくという話。なるべく機材は小さく&軽くしたいとか、iPadとかとの連携も不可欠とか、アスリートが事細かに覚えていられるのは30秒ぐらい(?)で、現時点では収録したのを送信するのに40秒ぐらいかかるとかとか。

スキージャンプ
 今後の課題: インフラ、機器
ウェイトリフティング
 スーパスポレコ: フルハイビジョン対応の映像遅延再生システム
  フォーム即座に繰り返しチェックできる
競技現場にマッチするシステムとは?
 ニーズを実現するという大前提に加え、普段のトレーニングで活用できるシステム
 現場だけで活用できるシステム(機材チーム不要)
 映像+情報も合わせて即時にフィードバック
  ウェアラブルもあるがトップアスリートには精度の問題も


講演(2) スポーツ用義足の研究開発とアスリート支援, 保原 浩明 (独立行政法人産業技術総合研究所 デジタルヒューマン工学研究センター 研究員)

IMGP0708 IMGP0709 IMGP0710 IMGP0711 IMGP0712 IMGP0715 IMGP0717 IMGP0718 IMGP0719 IMGP0720 IMGP0721 IMGP0722 IMGP0724 IMGP0726

専用機器なりで高精度な情報収集して分析することは可能だけどあまりにもコストが高い。例えば100m走では機器1台100万、競技者毎に1台+1人モニタリング技術者が必要、それを8人分揃えるとか旅費とか考えたら死ぬし、そもそも実現場では収録できない状況もある。それに対し、(ある条件を満足している)YouTubeに投稿されてる動画からの分析であれば、分析コストのみでデータに基づいた支援が可能。実際にあれこれやってみてる、という話。

スポーツ用義足の機能
 売った人も/利用者も/コーチもどの義足が良いのか分かっていない
  ベストな組み合わせを見つけた選手が記録を打ち出している
  ただし、両脚とも義足の方が良い
研究の現状
 バイオメカニクスによる支援
  ある条件下での基礎研究にはベスト
  トップ選手の実験はほぼ不可能
  本当に凄い選手は謎が多い(調べても無駄?)
   言語化すること自体が困難?
  モニタリングコスト(機器/人等)が高すぎる
   代わりにYouTube動画からスピード曲線を描く(動画を眺めるだけではなく、データを抽出する)
    欠点もあるが、本気モードを分析できる等のメリットも
  欠点の発見だけに留まらない要注意
   e.g., 国籍性別等どうしようもない違いを指摘してもどうしようもない


講演(3) 選手を育てるICT技術(陸上競技 競歩編), 今村 文男 (富士通株式会社 インテグレーションサービス部門 ビジネスマネジメント本部 インテグレーションサービス人事部 担当:陸上スタッフ)

IMGP0728 IMGP0729 IMGP0730


特別講演 2: 官民が協働で推進する新しい海外留学支援制度について~「トビタテ!留学JAPAN」日本代表プログラム~

IMGP0736 IMGP0737 IMGP0738 IMGP0739 IMGP0740 IMGP0742 IMGP0743 IMGP0744 IMGP0745 IMGP0746 IMGP0748

トビダテ!留学JAPANというプロジェクトの紹介。貸与型奨学金で、自由度もかなり高いのでどしどしチャレンジして欲しいとのこと。直近のやつはそろそろ〆切だけど、今後も1年に2度の公募で継続するらしい。


招待講演(5)情報処理技術を用いた脳の情報の解読と制御, 川人 光男(株式会社国際電気通信基礎技術研究所 脳情報通信総合研究所 所長)

これまでのBMI(ブレイン・マシン・インタフェース)では相関を利用するぐらいの研究に終始していたが、デコーディング+フィードバックで因果関係解明も目指したい、という話。

IMGP0775 IMGP0777 IMGP0778 IMGP0779 IMGP0780 IMGP0781 IMGP0783 IMGP0785 IMGP0786 IMGP0787 IMGP0789 IMGP0790 IMGP0791 IMGP0793 IMGP0794 IMGP0796 IMGP0797 IMGP0799 IMGP0800 IMGP0801

豊富なセンサ+強力な演算能力+実応用
ブレイン・マシン・インタフェース
 脳の感覚・中枢・運動機能を電気的人工回路でサポート
  日本人向けには脳に直接電極を差すタイプは向かない?
 脳/心の解読(デコーディング)
  classification or clustering or regression
   モジュール性/階層性/スパース性、、、

BMI3つの役割
 活動モニタリング&分析
 実時間でユーザに戻す
 脳の活動そのものが変わる(回路が変わる): ニューロ・フィードバック
  デフォールトモードネットワークの発見(15年前ぐらい前)
  遅い(~0.03Hz)BOLD信号の振動の動機(相関)
  得られた状態から診断等への応用/フィードバック
   fMRI実時間ニューロフィードバック(脳の特定の場所を活動させたりするための強化学習支援)
 従来の相関に終始していた分析から、フィードバックすることで因果関係の解明へ(目標)
  DecNef: モデル無しで機械学習+強化学習


学生セッション[6M会場] 情報推薦 座長 平手 勇宇(楽天)

IMGP0802

嗜好抽出を目的とした電子書籍へのアノテーションの分析は、自由にアノテーション(start-endマーキングだけ)付けてもらった結果から嗜好抽出できるか、という話。できるだろうけど、表層的な情報しか使ってないのが物足りないかも(似たようなのあちこちにありそうなので)。

平良くんの感情推定に基づく小説推薦システムのための認知的評価質問セットを用いたシミュレーションは、後で質問コメントを整理してくれるでしょう。

参加者の嗜好を考慮した飲食店推薦システムの開発は、店舗毎にレーダーチャート的に用意した評価軸毎に評価してもらったログを用意し、嗜好を考慮して推薦したいという話。気持ちは分かるけど、類似事例との違いが良く分からず。


学生セッション[6P会場] 対話システム 座長 篠田 浩一(東工大)

IMGP0804 IMGP0805 IMGP0807 IMGP0808

対話を通じた情報獲得のための質問選択とその実験的評価は、情報不足で答えられない時には対話でユーザから情報取得しよう、ただしそれをなるべくユーザに負担なく、かつ、効率良くしたいという話。

SVMとCRFを用いたロボットによるロバストな命令理解ロボットの行動命令発話理解における不足情報の処理は同じチームの発表で、RoboCup@HomeのGPSRタスクを例に、よりロバストなシステムを作ろうという話。基本的には「命令」なので、「どういう種別の命令かを判別するタスク」+「どんな名詞が含まれているかを抽出するタスク」を各々高精度にすることで質を高めることができるということで、そこに機械学習導入してみたとのこと。

多様な形態の相槌をうつ音声対話システムのための傾聴対話の分析は、相づちの形態(「うん」「うんうん」とか)を判別するために視線(ここでは顔の向き、ぐらいの意味)を利用してみたという話。

スマートポスターボードにおける視線情報を用いた話者区間検出及び相槌の同定は、話者区間(だれがいつ話しているか)+相づち判定(誰が聞き手か)をするために、10マイクロフォン+Kinect使って処理したという話。従来に比べ視線(顔の向き)を利用することでかなり精度改善に寄与したとのこと。


お食事

ますたに 京都拉麺小路店

IMGP0809 IMGP0811

当初予定していた豆腐料理屋さんは既に待ち行列になってたため、その途中で見かけた拉麺小路店にあったますたにへ突撃。背脂使いつつサッパリという謎の表現してましたが、確かに一般的なこってり押しのやつと比べると相対的にはサッパリしてるか。

京都出張3日目(情報処理学会第77回全国大会 2日目)

水曜日, 3月 18th, 2015

IMGP0620 IMGP0622 IMGP0624 IMGP0625 IMGP0626 IMGP0627

今日も暑い一日でしたが、夕方には雨が降ってて気温もそれなりに冷えて気持ちいいぐらいに。今日発表した慶留間くんはなんと学生奨励賞(座長さんの一存で決める賞)を受賞。目出度い!(が、私自身は別の会場にいた&時間に合わせて移動したのだけど既に終わってたので見れてない&撮影できずorz)

京大は京大内部の人しか無線LANを利用できない。というのは琉大でも同じなのだけど、外に出ると京都市が提供してるAP「京都どこでもインターネット」があって便利でした。クローズドにするのって管理者側の手間からすると簡単だし言い訳しやすいというのも分かるし、オープンにしたことで手間が増えるのも事実なのも分かるのだけど、もう少し柔軟な対応はできないものかしら。


<目次>

ソーシャル・ビッグデータが切り拓く新しい社会 −ビッグデータの可能性と課題−

全体としては「データを管理&処理する環境」、その環境を利用してるかどうかは不明だけど「対話的に可視化しながら分析する技術」、「医療支援のためのライフログ利活用を例にした事例紹介」、「プライバシーの問題」といった話題が詰め込まれた企画でした。これらの事例とパネル討論を通して「ビッグデータの可能性と課題」を問う、というのが趣旨だったのでしょう。豊田先生の話は論文漁ってみようかな。


講演(1) ソーシャルビッグデータの利活用・基盤技術のためのオープンテストベッドJOSE, 寺西 裕一 (独立行政法人情報通信研究機構 研究マネージャー)

IMGP0580

JOSE (Japan-wide Orchestrated Smart/Sensor Environment)なるリソースを用意したので皆で一緒にやろうよ、という話。単なる計算機リソースというだけではなく、各地に用意されたモニタから収集蓄積されたデータも利用できるorそういうセンサ機器の貸出しや、カスタマイズも可能、とかある程度汎用性を持たせているっぽい。

ソーシャル・ビッグデータ:=公共に役立つデータ
 JOSE: 大規模オープンテストベッド
  研究開発実証実験のスパイラルを含む、実用・商用に向けた実験環境
  大規模分散SDI、柔軟なネットワーク構成、実環境のセンサーデータ


講演(2) 交通ビッグデータ利活用基盤技術, 豊田 正史 (東京大学 生産技術研究所 准教授)

IMGP0580 IMGP0584 IMGP0587 IMGP0588 IMGP0589 IMGP0591

多くの分析技術はバッチ処理で結果が出るまで待たないと何もできない。その一方でリアルタイムに対話的に視覚化されたモノを見ながら分析したいという要求が、一般ユーザからも専門家からもある。その一例としてドライブレコーダから「ヒアリング等の調査に基づいた分析ではなく、客観的な記録のみに基づき、時空間上のヒヤリハット地図作成し、それをインタラクティブに可視化分析してみている」するという話。

大規模データ解析と可視化、対話的な可視化
 e.g., ツイッターのデマ拡散: 時系列にどう拡散されるか
  どういう内容がどう拡散されるかをリアルタイムに解析
 e.g., 移動体オブジェクトの解析&可視化

ドライブレコーダデータ
 まだ利活用は十分には進んでいない
 交通ビッグデータに基づく運転者指向サービス
 運送会社のデータ
  3次元空間可視化を用いたドライブレコーダデータからの要注意領域探索
   インタラクティブ時空間にヒヤリハット地図作成
   記憶に頼るのではなく、実データから要注意時空間を探索抽出
   実際の自己発生箇所との比較、自治体作成地図との比較
   要注意領域の詳細: カーブ後の急ブレーキ
  ドライブレコーダと安全運転
   日々の運転の振り返り
   運転経歴と安全運転との相関は?個々人の特性・癖があるのか?
   事故前後の違いを見ているわけではないことに注意して分析考察が必要(これから)
 個人に適合したサービス

ビッグデータ処理・分析の基盤技術
 解析・可視化をバッチ処理するのではなく、インタラクションしながらやる枠組み
 高頻度解析に耐える対話型


講演(3) 認知行動療法支援基盤とライフログ情報の活用, 長谷川 晃朗 (株式会社国際電気通信基礎技術研究所 適応コミュニケーション研究所 室長)

IMGP0593 IMGP0596 IMGP0600

認知行動療法を支援するサービス例であるスマートフォンアプリにすることのメリットとして、そのアプリに閉じた機能だけではなく、ログをサーバにアップロードすることでより実態にあったモニタリングができる等。ライフログを負担なくどう収集し、どう活用するかを検討してみてるという話。

広く様々なデータを収集蓄積して利用: ここでは医療分野
 認知行動療法: 心理教育、セルフモニタリング、行動を変える/考えを変える
  カウンセリング(週1*16回程度)、
   カウンセリングは週1のみ。課題を与えて、それを毎週観察。
  スマートフォンを活用した支援基盤の構築
   ホームワークの一部をアプリ化し、いつでもどこでも実践可能に
   アプリに閉じるだけではなくログをサーバにアップロードすることでモニタリング可能
  うつ病
   蓄積されたらイブログから行動の推定、気持ちの推定

ライフログ情報の医療への活用
 例: ホルター心電図
 技術的なハードル: デバイス、ログ品質、電池、ウェアラブル、スマートフォン、、
 運用面でのハードル: きっかけ、期間、プライバシー


講演(4) ビッグデータ活用とプライバシー保護, 美馬 正司 (株式会社日立コンサルティング 公共本部 シニアマネージャー)

IMGP0604 IMGP0605

プライバシーとプライバシー保護は必ずしも同一のものを対象としているのではなく、広い意味でのプライバシーには感情が含まれる。どうやればより良い未来を描けるかについて、事例を交えて紹介するというお話。

個人情報保護法の改正
プライバシー補語について「顧客任せ」ではなく、適切にやる用一緒に話し合い進める


パネル討論 ビッグデータの可能性と課題

IMGP0611 IMGP0613 IMGP0616

キーワード: ビッグデータ、CPS、M2M
 ビッグデータ: ビジネス/生活/自然
  ビッグデータ+ソーシャルメディアデータ->実社会への貢献(価値創造)

議論の種
 取得管理
  データはどこにある?
  リアルタイムに取得できるのか?
  どうやって管理するのか?
 分析
  社会を変革する情報をみつけるには?
  プライバシ性の高い情報における研究課題とは?
 利活用
  実社会の利益にするために必要なこととは?
 複数分野と連携する際に直面した問題例
  語彙の違い
   e.g., 同じ語でもドメイン毎に意味が違うと、同じ文書なりで提供しても違う解釈をされる。
    Q: 定義するという話があったけど、そういう問題なのだろうか?
  ビッグデータ=どんなデータからでも好きなことを抽出できると勘違いされる


CREST・さきがけ「ビッグデータ」2領域 成果報告会

CREST・さきがけがどういう意図でどういうテーマについて募集しているのか、また採択されたテーマの進捗がどうなってるかという報告会。CRESTでは「国が定める戦略目標の達成」という話が出てくるし、さきがけでは「戦略目標に基づいて未来のイノベーションの目を育む個人型研究という話が。各々について具体的な所まで聞けるのかなと思ってたのですが、プロジェクト自体が比較的大きいこともあって概略紹介に近く、ちょっと物足りないか。それでも山西先生らのディープ・ナレッジあたりは論文集めて読みたいとかの切っ掛けになったので良かったか。


講演(1) 「ビッグデータ基盤」研究領域紹介, 喜連川 優 (国立情報学研究所 所長)

IMGP0635 IMGP0636 IMGP0638

ビッグデータ周りの研究開発を大別して「基盤(コア)」と「応用(アプリケーション)」に分けて考えていて、ここでは基盤で採択された人はこういう人で〜〜〜というお話。喜連川先生の話は大抵そうなんだけど、1秒1スライドぐらいのペースで飛ばしながら概要紹介することが多いね。勿論強調する所はしてるのだけど。今回のポイントは「ビッグデータはデータが命なんだから、シェアしよう。ただし何をオープンにして、何をクローズドにするのかについての議論が無いためになかなかシェアできない」ということらしい。

インフラ/処理・解析/結果/現行法
データが命なので、データをシェアすることでより新しい知見発見を加速させる
 どこをオープンにしてどこをクローズドにしてどうシェアするか


講演(2) 「ビッグデータ応用」研究領域紹介, 田中 譲 (北海道大学 大学院情報科学研究科 情報理工学専攻 特任教授)

IMGP0641 IMGP0642 IMGP0643 IMGP0645 IMGP0646

応用編では、技術と実応用との間に大きなギャップがある。例えば実社会への価値貢献が大切だがコア技術をどう組み合わしたら良いのかといったノウハウが不十分だから、そこら辺をうまく体系化したいよね、という話。あと「国の重要課題分野をバランス良く含んだポートフォリオ」を意識して採択してる(テーマ設定してる)という話も。ここでのQ&Aだったか別会場だったか忘れたけど、良くも悪くも米国は「国一丸となって取り組む」のに対して日本は「個々人が独立して取り組んでる」ことが多いという話もあったか。戦略的には米国がうまくいきやすいというのはそうだろうなとは思うが、同じ戦術で対抗しても楽しくないし、協力/共同する方法はいろいろありえるし。(笑い男じゃないけど)

基盤と応用の間にあるギャップをどうにかしたい
 個々の分析技術は良いが、
  課題と関連データを与えられた時に、
  どう組み合わせて解決したら良いかというシナリオは不明だし、支援も無い。
 mission driven -> data driven へのパラダイムシフト
 分野や組織を越えた統合
 再利用可能なノウハウの知識化

国の重要課題分野をバランス良く含んだポートフォリオ


講演(3) 複雑データからのディープナレッジの発見と価値化, 山西 健司 (東京大学 大学院情報理工学系研究科 創造情報学専攻 教授)

IMGP0648 IMGP0649 IMGP0650 IMGP0652 IMGP0653 IMGP0654 IMGP0655 IMGP0656 IMGP0657 IMGP0658 IMGP0659 IMGP0660 IMGP0661 IMGP0662 IMGP0664 IMGP0665 IMGP0666 IMGP0667 IMGP0668 IMGP0669 IMGP0671 IMGP0672

ビッグデータは単にデータの量が多いという話ではなく、varietyに飛んだデータが、時々刻々と潜在的な状態が変化しながら蓄積されるといった「質的に似たようなものが蓄積された巨大なデータ」ではないから、それに見合った分析モデルが必要だという話。

ビッグデータの5V
 Volume: 大量性、大次元
 Variety: 多様性、複雑性(潜在性)
 Velocity: 動的、非定常、変化
 Value: 付加価値
 Veracity: 真実性

Deep Knowledge: 潜在的関連、因果関係、、そのものや、それらの変化
 潜在的ダイナミクス: 動的 Velocity
  データの表層的な変化ではなく、背後にある構造的な変化が対象->本質的な変化
 関係データ統合予測: ヘテロ Variety
  他データを活用(転移学習の一般化)

教育データマイニング
 大量のテスト採点結果 -> 潜在変数スキルの導入
  スキルは時々刻々変化

緑内障進行予測
 RBMに基づくデータ統合=共編量を基に潜在変数モデルを用いて欠損値を予測
  尤度を直接計算するのではなく、下界を設定して推定
 視野の欠損が時間と共に拡大
  個々人は数少ないデータ->似ているユーザのデータを利用
   マルチタスク学習に基づく予測
    患者間相関/視野間相関/時間発展の特徴


講演(4) 自己情報コントロール機構を持つプライバシ保護データ収集・解析基盤の構築と個別化医療・ゲノム疫学への展開, 佐久間 淳 (筑波大学 大学院システム情報工学研究科 准教授)

IMGP0673 IMGP0675 IMGP0676 IMGP0677 IMGP0678 IMGP0679 IMGP0680

100%漏れないようにというのは非現実なので、漏れても大丈夫なアプローチ(秘密計算)しましょうという話。生活習慣病への応用については既に協力実施できてるらしい。(ゲノム疫学の方は「病院->外」方向へのデータ提供がありえないとのことで、現時点ではまだ不透明っぽい)

ゲノムの利活用
 ゲノム疫学
  どのゲノムがどの病気の要因に関わっているか、特に生活習慣病
 体質に応じた薬剤選択、投与量決定、特に抗がん剤
 リスク
  意図せぬ本人/血縁推定、将来的に知能/能力等を知られてしまう可能性
  ゲノム差別
  -> 漏洩しても困らないようにすることを目指す
   暗号化+他人に見せずに解析(暗号化されたデータをクラウド上で処理)
    情報を見れる見れないと処理するとを区別
 課題: ゲノム探索、コスト低廉化、プライバシ保護

生活習慣病の罹患リスク
 ゲノムだけでは決定せず、後天的要因も大きく影響


講演(5) ビッグデータからの知識創出基盤の確立 - 創薬から製品製造までを例として -, 船津 公人 (東京大学 工学系研究科 化学システム工学専攻 教授)

IMGP0681 IMGP0683 IMGP0685 IMGP0686 IMGP0687

創薬〜製薬までの各ステージにおいて種々の問題があり、それらを全体として最適化する必要がある(そうしないと割にあわない時代になってきた)という話。米国だと組織を越えてデータをシェアすることにも取り組みつつあるが、日本ではそういうことしてる暇があるなら研究しろという風潮。そのために利用できないデータが眠ってるという話もあるらしい。(情報系でもまだまだあるよね)

創薬から製造までがターゲット
 副作用・毒性などの事前知識を踏まえた探索最適化が成否の鍵
  合成法は未知
  効率かつ安定的な製造
  観測が容易な変数、困難な物性・濃度などを踏まえたソフトセンサ
  予測モデルの劣化、、、


学生セッション[4Q会場] 3/18(水), 機械翻訳と文書分類 座長 須藤 克仁(NTT)

IMGP00 IMGP01

慶留間くんの可変長N-gramに基づいたトピックへのラベル選択の検証が学生奨励賞受賞!


お食事

IMGP0688 IMGP0689 IMGP0692

雨降ってたのと1台のタクシーに乗れる人数だったのとでタクシーで移動。ついでに美味しい所聞き出す等。そう簡単には外れないだろうし。とはいえ「沖縄から来たんですけど駅付近で美味しい所無いですか」ぐらいのアバウトな質問だったのでわりと悩んでましたw その結果、飲むなら酔心、そうじゃないならチェーンで美味しいがんこ寿司という2択をゲット。がんこ寿司イイネ!

京都出張2日目(情報処理学会第77回全国大会 1日目)

火曜日, 3月 17th, 2015

暑い。素で暑いよ〜。室内にいる間はコート(薄手)を脱いだけどそれでも暑い。暖房不要だろこれ〜。と思ってたら途中から暖房ではなく換気になってるところも。ですよねー。それでも一部の部屋(特にポスターセッション会場)は熱気が凄かった。冷房必要でしょあれ。

IMGP0526 IMGP0527 IMGP0528 IMGP0529 IMGP0530

大学近辺にはあちこちにサークル勧誘のポスター/掲示物が。そういう時期だよね。でも3年はないよな(そっちか)。

情報処理学会の全国大会は30ぐらいの通常口頭セッションが走りつつ、他にもイベント企画が用意されてたりするという恐ろしい並列度で動いている(=参加人数ももの凄いことになる)学術会議の一つ。メインイベント時には口頭セッション被らないように工夫するとかもあるけど、今回は「言語処理学会も同時開催」、「京大独自イベント(?)も同時開催」状況になってて、どうしようもない集中具合に。加えて観光客も多数いるわで路線バスが激混み。10分間隔ぐらいで着まくるからそれでも捌けるんだろうけど、清水近辺とかのバス停待ち行列がほぼ減らないという状況。学会参加の点では言語処理学会も覗きに行きたいのだけど、スケジュールがタイト過ぎ。ピンポイントで何かを見に行くぐらいはやれるかもしれないけど、現時点での予定では情報処理学会だけかなぁ。

今日はシンポジウム(講演3件)、うちの学生発表セッション2件、京大のポスターセッション(京都大学第9回ICTイノベーション)を覗いてきました。IPSJ-ONEとかいう「多様な研究分野を垣根なく俯瞰し,すぐれた研究を自らの言葉で語れるプレゼン力の高い,若手を中心とした研究者を,希望する研究会が主体的に推薦する形式で募集」なイベントも面白そうだったんだけど、タイミング合わず。togetterまとめもあるらしいが、映像もあとで公開されるのかしら。と思ったらアーカイブ化も検討中なのね。期待しておこう。


<目次>

情報学シンポジウム「ビッグデータとヒューマンサイエンス」

講演(1) 脳から心を読む技術:脳情報デコーディング, 神谷 之康 (ATR脳情報研究所 神経情報学研究室・室長)

IMGP0531 IMGP0533 IMGP0537

[サマリ的な何か] 脳波を直接眺めても良く分からないが、差異があることは確か。様々なレベルでノイズが混入する中で、どうデータを収集し、どう分析するか。2005年当時はまだ殆ど機械学習を適用する事例がなかったが、問題設定によっては割とうまくいくらしい。

brain decoding
 コーディング: 心->脳波
 デコーディング 脳波->心を読み取る
  見ても分からない
  機械学習によるデコーディング(2005年頃までは殆どやられていなかった)
   脳活動を計測し「ラベル」をつける
   脳活動からラベルを予測する「デコーダ」を構築する
   そのモデルが新たに与えられる脳活動のラベルを正確に予測できるかを評価する
    Q: ノイズだらけな気がするが、どうモデル化する? 粗く見ることで軽減できる?

2005年当時は3mm角でしか見れなかったが、それでも各マス分布には差異があった
 ->機械学習

classification -> 多様な状態: e.g., 見ているものを画像として取り出すには?
 モジュラー・デコーディング(要素の分解、それらの組み合わせとして表現)
  視覚像再構成
  Q: 情報工学的にはモジュラー・デコーディングで表現できない状態/状況は?
  Q: 生態学(?)的には、人間がそういう風に捉えているかどうかはどう検証?
   (視覚ならそれで分かっている部分が多いかもしれないが)

エンコード vs. デコード・モデル
e.g., 生成モデル vs. DBモデル
物体認識のための階層的視覚特徴抽出, CNN

夢の再構成
 数分置きに起こして確認寝る
 実験自体は比較的簡単だが、画像再構成は困難(視点のずれ?より抽象的な情報?)
言語データベースを用いた意味情報の抽出
 夢の意味ラベル
夢の中の「動き」のデコーディング
脳コードコンバータ: 同じ画像見せても脳活動は被験者毎に異なる


講演(2) 情報通信技術は医療をどう変えようとしているのか?, 黒田 知宏 (京都大学医学部附属病院 教授)

IMGP0540 IMGP0541

[サマリ的な何か] 立地制約上でITCを活用しないと病院内での情報共有すらコストが大きかったこともあり、「単に通信するだけではなく、医療ならではの支援はどうあるべきか」から考え、やれることをやってきている。例えばカルテを電子化するという話もあるが、そもそもカルテに書かれている内容は何なのか。データを蓄積するという側面は大切だが、使えるデータとして整理する必要がある。他の分野に学べる所は学び、実現場に導入するためにはどうしたら良いかを実例を含めて紹介してました。

医療現場の情報化はどこまで進んだか?
 京大病院の悪夢(立地条件上建物高さ制限->縦横に長い建造)
 KING5: どこでも電子カルテ
  ユビキタスセンサネットワーク
   Context-Aware IT System: 病院では「場所=コンテキスト」
   さりげない情報支援

医療情報はビッグデータ?
 そもそもカルテに書かれていること
  POMR (Problem Oriented Medical Record)
   主観的情報/客観的情報、病名、評価、分析、検査や治療指針等の計画
   *必ずしもそうなっていない。
    保健医療機関及び保健医療担当規則第8条(->保険請求の証拠になる情報)
 電子カルテになって
  自動的にカルテに記載されるもの: コピペして追記+スキャナ文書
   あらゆる情報を未整理に記載: ゴミ箱?
   カルテをゴミ箱でなくすためには?
    情報を整理する術: e.g., 先例: 飛行機のフライトレコーダー
     主観的記録+客観的記録: データと認識を分離
     Ubicomp の記録=客観的な記録
      4W, 誰がいつ何処で何を)は自動で。
      患者とスタッフのライフログ。
    標本化定理(とはいえ十分な通院は不可能)->過程に医療機器を。
     PHR (Personal Health Record) + PCEHR
 カルテは「使えるビッグデータ」ではない
  使えるカルテにするために情報の整理
  サンプリング周波数を増やす

「ソフトウェア薬事」後の医療機器: モジュール化
 ゲノムレベルになると人間では対応不可能->コンピュータ化
 これからの医者の役割: センサ/翻訳者/医療行為


講演(3) 機械学習技術によるビッグデータチャレンジ, 上田 修功 (NTTコミュニケーション科学基礎研究所 上席特別研究員)

IMGP0543 IMGP0546 IMGP0550 IMGP0551

[サマリ的な何か] データがあること自体の優位性はまだあるが、期待されていることは技術ではなく、そのデータに基づいた価値創造であり、例えば新たな事業創造等どのような貢献ができるかが重要。従来の列挙モデルに比べ、統計モデルで仮説を立てる手法が盛り上がり、更にはノンパラメトリックなDNNが2010年頃から流行。これからの対象としては時空間統計解析が重要ではないか、とのお話。

機械学習・データ科学センタ(MLC)
 NTT新中期: ビッグデータ解析による新価値創造->変革のenablerとして貢献
 IoT, ビッグデータ
  技術そのものへの期待ではなく、データに基づいた価値創造: e.g., 新たな事業創造

機械学習
 記憶するのではなく、汎化して新たなパターンへも対応する
 列挙 vs. 統計モデル
 列挙例: POS分析、相関ルール、アプリオリアルゴリズム、協調フィルタリング
  確率モデル: 生成モデル(仮説)、潜在変数(隠れ変数)、パラメータ(ベイズでは確率変数)
  相関ぐらいしか使わないモデルから確率モデルへの以降
 関係データ解析: 共クラスタリング
  確率モデルアプローチ: e.g., 観測データがどう生成されるかをモデル化

予測と補完
 重回帰分析: 変数選択が分析者の腕
  非負値行列因子分解を応用
 多次元データ解析: 複合非負値行列因子分解、非負値テンソル分析
 DNNによる音響モデル

予測・制御
 時空間統計解析: 時空間多次元集合データ解析
  時空間回帰:人流予測・制御
   先行予測し、どう誘導したら混雑しないかをガイドする


学生セッション2Q: 言語生成とユーザ支援

URL: タイトル&アブスト一覧

IMGP0557

うちの学生が同じ時間帯に2カ所に分かれての発表となってたため、こちらには前半2件だけの参加。

日本語の語彙平易化システムの構築は、義務教育レベルへの表現/語彙に言い換える(検出&変換)という話。あれこれ公開されてる先行研究を組み合わせつつ、用意したデータセットで検証する限りでは7割強の精度で動いているらしい。デモがここで公開されてます。

神谷さんの小説検索システムのためのプロット作成に関する基礎研究へは、名大学生らからの質問・コメントがどしどし。後で卒研ノートの方に整理してくれるはず。


学生セッション2D: 認識・学習・最適化

URL: タイトル&アブスト一覧

IMGP0559

バナー広告に対する閲覧者の印象分類と自動印象推定に関する一検討は、広告内のテキストに対する印象を推定できれば広告作成者にとって嬉しいよねという話。ただ色んな影響が混ざり合っての広告だと思うので、テキストを独立して扱う(後で組み合わせる)というアプローチが良いのかは良く分からないかも。

玉城くんのDeep Learning におけるコストを考慮した Dropout率制御に関する検証も、後で卒研ノートに整理してくれるでしょう。

エントロピーとDP Matchingを用いたファイル類似度評価システムに関する考察は「バイナリの類似度を適切に計測できるようにしたい」というところから始めてるらしく、例えばハッシュ値を全バージョンで適切に管理するのは非現実なので「似たようなバージョンならバイナリで判別できた方がいいじゃん」とか。面白そうなんですが、具体的な応用イメージとして偽アプリ検出みたいなところを想定してるのはちょっと違うかなという気も。質疑で出てたLSAとの違いは?というのはその通りだよな。

人間活動と室内環境変化に対応した掃引システムの提案は、原則として環境にマーキングとかせずに、センサ情報だけで人活動を含めた環境変化に対応させたいという話。気持ちは分かるけど、実現するだけなら(完全自動化を目指すのではなく)もうちょっとインタラクション考えた方が良いのじゃないかなという印象。


京都大学第9回ICTイノベーション

IMGP0560

URL: 京都大学第9回ICTイノベーション

タイトル見直すとてんかん発作兆候監視なんてのもやってたのか、見たかったor被験者申請したかったなw

並列言語Tascellによるグラフマイニングの並列化は、many cores上での並列化という話で、それなりに早くはなってるのだけどやっぱりグラフ展開上の都合というか作業分けしてる時点でのコスト差が大きいままタスクを分けちゃってるので、線形スケールにはまだまだという感じ。いや、十分早いのかもしれないが。

スマートポスターボード ―聴衆の反応のセンシング―は、Kinectと19-ch. Microphone Arrayぐらいのセンシング情報から「ポスター説明者+それらの聴者らの視線と相づちをリアルタイムで検出」し、それをベースに「興味や理解の度合い」を推定したいらしい。検出の方は割と精度高く実現できてるとのこと。Kinectデフォルトのモデルだとキャリブレーション必要なのに加え、差異が大きいとNGだったりするので、そうではなくてリアルタイムにそのユーザの3Dモデルを構築し、顔の向きを推定してるとのこと。キャリブレーションも不要だし、一度構築できれば真横向いても問題無いという。おおー。ただしリアルタイム処理するなら、1ユーザあたり「5~6万ぐらいのGPU1個」ぐらいが必要らしい。会場でも廃熱追いつかないのでPCのカバー開けてましたw

認知構造のビジュアル分析システムE-Gridは、多人数へのインタビュー結果における「重要な部分」をうまく可視化したいという話。テキスト等の処理はユーザ側がする必要があるらしいが、可視化の例として面白そう。E-Gridとして公開されてるらしい。

デザインスクールの展示(コンソーシアムサマースクール)もあったようですが、途中からの参加だったこともあって時間内に見れず、残念。

IMGP0562 IMGP0565


お食事

IMGP0569 IMGP0570 IMGP0575

例によってというか昨日の時点で良さげな候補がまだあったのでポルタ地下街だし茶漬け えんへ。店内にsoup stockな文字があったけどその系列?あっちが大好きなお店だけあってお茶漬けも旨し。すぐお腹減るだろうということで持ち帰りでおにぎりをゲット。