Archive for the ‘日記’ Category

中村先生/玉城先生らとの打ち合わせ始め

木曜日, 4月 2nd, 2015

m_20150402111823551d257f95669

玉城先生経由で「HCIに興味ある先生いませんか?」という話が届き、その一回目の打ち合わせが今日から始まりました。1回目ということでまずは明治大学の中村先生から具体的にやってみてる/やってみたい事例紹介して貰い、そこからの自由討論という形だけで終わりましたが、何かしら一緒に共同研究してみたいですね。今の所個人的には「ライフログ周りの検索」や「環境要因+文化要因+人間系を絡めたBADUI」に興味があります。そちらに絡めなくて良いのであればインタラクションの方にどうにかして繋げたい気もしますが。取りあえず5月にももう一度話合おうということになったので、それに向けて献本頂いた(ありがとうございます!!)失敗から学ぶユーザインタフェース 世界はBADUIであふれているで勉強してみよう!


m_20150402110545551d2289d357b CA3E5665

ゼミの方は、平良くんのアンケート周りのテコ入れが気になる所か。4年次へはちょっとした研究活動Tipsを毎週やってみてますが、どうなるかなー。今日は「サーベイor勉強する時は読んで理解するだけじゃなく、目的に応じて読み方がある」とか「論文だと少なくともこういう項目がある、そこだけを読むなら読む場所は少ない」とか「書いてあることを表面的に見るだけじゃなくて、それを抽象化するとどうなるか、もしくはより具体化するとどうなるかを考えてみよう」とかとか。読む際に+αを考えてみようという話をしてみました。

3年次編入は良くも悪くも一つのツール

水曜日, 4月 1st, 2015

昼過ぎまでは調べもの。新年度始まるしということで編入生関連タスクでもやるかと手をつけてみたものの、予想以上に大変だなこりゃ。具体的には「編入学=途中の学年として入学」してくるので、入学前の実績(多くは高専での単位取得状況)を確認しながら、適切な内容&範囲内で単位を認めるという作業が発生してます。過去に実績ある場所からの編入なら一人長くて30分ぐらいかなーと思ってたんですが、資料作成自体の手間が。Excel職人するのなんとかしてくれ。。。

基本的にはシラバス確認しつつ琉大でどの科目に該当するかを確認するという流れをとるので、これまでに編入できたことがない場所からの入学者だとやっぱり大変。だからといって3年次編入だと「ストレートなら残り2年で卒業」できるぐらいには単位認定できないと、ほぼ自動的に3〜4年コースになっちゃうのだよな。実際問題としてほぼ認定できない所(専門学校とか)から来る人には面接時にそこも含めて確認してるのだけど、面接時には「それでも頑張ります」と言っちゃうのであまり効果が無い気もするが。

うまく機能してる(入学後ちゃんと頑張る学生もいる)ので良い制度だとは思います。問題はつまづいちゃう学生へのケアをどうするかというところですね。その問題自体は編入に限った話ではないのですが。

(不定期コラム) 地図が無ければ描けば良いじゃない(サーベイ)

火曜日, 3月 31st, 2015

久しぶりのコラム記事

ここ数日は新配属生らの興味キーワード関連の事例集をピックアップ紹介する記事作成してます。これ全部読め〜という訳ではなく、あくまでもアドバイス。「取りあえずやってみて」で丸投げするのも一つの方法で実際やってる部分もあるんですが、それとは別に「例えばこういうのがあるよ」と具体的な調べ方or実際の情報源を提示することで出発点や視点を増やす意味合いでやってます。例えば(不定期コラム) 機械学習 #ieryukyu_readingsみたいなやつですね。

あれこれ目を通して欲しいという気持ちもあるし、掘り下げて欲しいというのもあるし。新しい世界を歩むには何らかの方法で世界地図を作り上げて行く必要があるけれども、その方法は必ずしも自明でもなく。実社会に根ざしている話でもあるように月日と共に地図が書き換えられてるこっともあれば、自身の変化に伴って見えてくる側面が増えてきて色鮮やかになったり。調べ終えたはずのことが月日と共に結果が変わることもあるし、ただのヒューマンエラーで実は違ってたということが改めて浮き彫りになることもあるし。手足を動かして追体験してみることもあれば、又聞きという形で情報収集することもあるし。「地図を描く」ためには多くの資料を読み進める必要があるわけで、一般的にはこれらの作業を調査研究とかサーベイと呼びます。いや、調査研究というとこっちのような一段上の意味合いで捉えることの方が多い?かも。ということでここではサーベイと呼んでおきますが、読むだけじゃなくてそれらを自分なりに咀嚼し直す(何らかの形でアウトプットする)のが大切。イメージしやすいように「地図」と表現してますが、目的に応じて地図が多種多様あるように、自分の目的に応じて作り上げて行くことになります。目的自体が分からないなら「手探りで進む」ことになるのでしょう。その試行錯誤を通して少しずつ「使いやすい地図」が形作られていくはずですし、その具体例としては「サーベイ論文」や、「個々論文の関連事例との兼ね合い」を複数見ていくことでイメージしやすくなると想像します。

web上にも「サーベイ 方法」ぐらいでググると一杯引っ掛かりますね。

あたりも参考になるんじゃないかと。

「Proc.って何ですか?」と質問してた日が懐かしい〜。

自習室交代の時期/新ビルをどう使うか

月曜日, 3月 30th, 2015

情報工学科には年次毎に自習室があって、その引き渡しが大凡終了したらしい。こんな時期まで延びてしまってすまなんだ(新B4が研究室に、新B3が3年次自習室に移らないと、新B2は2年次自習室に移れない)。例年遅くなりがちな気がしますが、特に今回は新ビルとの兼ね合いがあって「山田研->実験室」への移動があった分諸々が遅れてしまったという感じか。

新ビルで情報工が専有して使える部屋は、細かく分けると5部屋あるらしい。

・501演習室1、502演習室2。
それぞれ16〜32名。移動可能なセパレータで分けてるだけなので合わせての利用も可能。

・506実験準備室(名嘉居室)、507備品管理室(機材倉庫)。

・508実験研究室。
比較的大きな机。1卓4人座るなら16卓*4=64人ぐらいに。実験1〜4はこちらがメインで、501/502演習室も使う形になると想像します。PD2でも使ってみようという話をしているところ。1階のオープンにもクローズドにも使える広場(机&椅子十分あり、懸念事項は電源ぐらい?)も使い勝手良さそうです。

みんな綺麗に使おうね!!!

ご飯食べながらゲーム話に花が咲く

木曜日, 3月 26th, 2015

ゲームが楽しいとか攻略とかそういう話ではなくて、研究対象としてのお話。名嘉さんが実体験豊富な上に研究事例含めて詳しいのであれこれ相談してました。実際にターゲットとして設定するかは先の話なんですが、想定外の側面もあれこれ掘り下げて突っ込んでもらえて助かります。

m_201503260904075513cb87d79c2

ゼミは卒業生/修了生がいなくなった分、心機一転な雰囲気が漂ってるかな。興味ある内容について掘り下げて考える方法、広げて考える方法を事例動画紹介したり、実際に思いつきであれこれ関連事例に結びつけながら討論したり。お茶会で┌(┌ ^o^)┐な話が250%増加(当社比)なのは仕方ないか。相乗効果恐るべし。

IDEでプロジェクタ投影すると全体のフォントサイズが小さすぎることが多い(はず)

水曜日, 3月 25th, 2015

2015年度ではなくて2016年度からのプログラミング1(Pythonで誰も反対しないからもう確定しちゃって良いんだろうな)について、今から「中身の被りや質・量問わずに週1つはサンプルコード/課題、もしくは課題検討するための教育目的を作ろう」かと。ここでいう「教育目的」はシラバスより粒度が細かいものになることもあれば、シラバス案程度のままのこともあるかも。全部使えるかどうかはともかく、目的に応じて洗練させる際にも参考になるだろうし、体系化するためのサンプルがあると良いかなと。コード例/Cookbook/タスク例(CodeIQとか言語処理100本ノック 2015とか)も参考になるもの多々あるので、それらも参考にしたいですね。シラバス作する際にあれこれ参考にしながら整理した分もあるけど、具体的な課題には落とし込めていないし。

取りあえずPyCharmが4.0.5にアップデートされてたので更新。差分アップデートするとか、自動更新する訳ではなくて「新しいdmgダウンロードして自分で差し替えろ」なのね。ま、いいか。統合環境を最初からor1年前期中に使うかどうかはまだ決めていない(少なくとも後期では使う)のだけど、サンプルコード作るついでに自分自身が慣れるためにも好き嫌いせずに触ろうかと。

教材的側面からは「全体の文字サイズを簡単に調整したい」のだけど、設定を眺める限りではコード・ビュー側のウィンドウだけは

Editor->General->Change font size (Zoom) with Command+Mouse Wheel

をONにすることで簡単に大小変更できるらしい。プロジェクト・ツリーとかメニューは変更できないっぽい? これならOS X標準のズーム機能使った方が良さげかしら。IDE使わない場合はズーム機能+いくつかのアプリで対応してる「Command+Shift++」で対応してるんだよな。

他大学との情報交換をしやすい時期 / 社会人学び直し、PBL

火曜日, 3月 24th, 2015

授業が無い時期ということで学会出張し易い時期でもあるので先週は情報処理学会全国大会に行ってきましたが。前期授業や新カリキュラムの準備もあることはあるな(遠い目)。とか書いてると、別件で企業さんから謎のリクエストが届いてたり。現時点で意図が理解できていないのでまずはそこの擦り合わせからか。

昨日の話で、産業技術大学院大学から社会人向けの学習支援の話と、大阪大学超域イノベーション博士課程プログラムからPBL型授業についての情報交換とがありました。

産技大の方はenPiTの続きで社会人学び直しとかいう話だったようなのですが、話聞く限りではあまり社会人関係無いかなーとか。学びやすいシステムは学生にとっても便利だし、という意味で。入学前に科目履修で受講した分の授業料は減るとか、授業ビデオ(ストリーミング?)あるので1コマ週2回(4学期制)のうち最低1回来たら良い(その分レポート等はしっかりチェック)とか。一緒にやれそうなこと、具体的にはITではなくそれを他の分野に応用するという側面で何かやれないかという話でした。その場での雰囲気では玉城先生があれこれやられてる農業関連が面白そうだという話に。

阪大の方は去年?ぐらいから副専攻として初めている、D1の学生が総合演習として実施する1年かけてやるPBLが1回目を終えて、そこで生じた点について改善すべくあれこれ事例調査をしているという話。ブータンでフィールド・スタディとか、あれこれ面白そうなことやってるのだけど、1年かけてやるからか中だるみが出やすいとか、思ってた以上に学生ベースで計画立案やスケジュールチェック等がうまくいかないとか。情報工でのPD1,2とPM演習、モデリングと設計を例に紹介してみた感じでは、PMのように「一度体験した先輩がマネジメントする」形に興味を持ったらしい。

IPSJ ONE(研究人生を変えるステージ)が期間限定でアーカイブ公開

月曜日, 3月 23rd, 2015

先日終了した情報処理学会全国大会における企画「IPSJ ONE」では「分野を超えたインパクトを有する19名の気鋭の研究者を招待し,各5分の持ち時間で弾丸トークを行うイベント」が開催されてました。私は残念ながら聴講できなかったのですが、期間限定でアーカイブ公開されています! 専門的な話というよりは最先端事例の一般向け紹介なので、TEDをイメージすると近いかも。この機会にみんな見よう。アーカイブ自体は情報処理学会 第77回全国大会 1日目 生中継にまとめられていて、IPSJ ONEなら3:28:00頃から始まります。

IPSJ ONEのサイトにタイトルも各種リンクもありますが、タイトル一覧ぐらいはコピーしておこう。

– オープニングトーク
– 人間の歌い方を真似る歌声合成システムVocaListenerと歌手の声質分析技術, 中野 倫靖
– 「関係」の科学と知的なコンピュータシステム, 秋葉 拓哉
– 「24時間飛行ドローン」と「センサ情報・映像統合配信技術」で都市を守り,未来へ導く, 米澤 拓郎
– 時系列ビッグデータのための非線形解析とその応用, 松原 靖子
– 技術的特異点(シンギュラリティ)より向こうの世界, 柏崎 礼生
– IPv4/IPv6ネットワーク上のシームレス通信, 内藤 克浩
– 3Dプリンタの次: 4DプリンタとIoTファブリケータの未来, 田中 浩也
– マッチング問題と離散最適化, 神山 直之
– 歴史学の情報?, 山田 太造
– もしもピアノが弾けたなら~理想のピアノ学習支援システムを目指して~, 竹川 佳成
– 大丈夫.暗号は敵じゃない., 金岡 晃
– 深層学習で自然言語処理を変える, Kevin Duh
– ハコスコってなに?, 藤井 直敬
– Bikeinformatics: 情報科学的二輪車研究, 木谷 友哉
– 音声対話システムの現在と未来, 吉野 幸一郎
– 解析するデータを沢山にすると,なぜか発見が減るジレンマを乗り越える〜生命情報解析を例に, 瀬々 潤
– ゲーム発リアルタイム技術の今と未来, 橋本 善久
– 超低遅延HPCネットワークのためのランダムトポロジ, 鯉渕 道紘
– 身体ハッキング, 遠藤 謙
– エンドトーク

京都出張4日目(情報処理学会第77回全国大会 3日目)

木曜日, 3月 19th, 2015

今日も雨模様でやんわり冷えてます。雨自体は昨晩から強くなってきてて、今朝も強いまま。しくしく。

IMGP0731-1 IMGP0731-2 IMGP0812

総合受付や第1イベント会場等は100周年記念な時計台にあります。ホールとかラウンジに飲食物持ち込み禁止なのは別に良いんですが、ラウンジで専属のバーテンダー(?)がいたりして驚く。あちこちにモノだけじゃなくヒトに費用かけてるよな。正門に受付いるし、中入ってすぐに(交通量が多いわけじゃないけど)交通整理する人いるし。一般道に面した建物が多いこともあって、そういう所にはさりげない広報もされてたりして面白いです。琉大だと「そもそも歩いて通る人少ないし」とか言いそうだよな。事実その通りでもあるし。その一方でイベントとしての会場案内(掲示)については個人的に参加してきたなかではかなりレベルが低いという、謎のギャップが。開催してる建物の入り口まで辿り着いても掲示が無いとかざらだったし。


<目次>

オリンピックに見る日本のICT技術

1件目はどちらかというと収録+即時フィードバックのためのインフラを中心とした話(分析もしてるようだけど、発表ではほぼ割愛)。2件目はトップアスリートの分析に耐えうる高精度な分析しようとするとモニタリングだけで高コストすぎるのを、YouTube動画でどうにかしようという話。3件目は両方に跨がった事例紹介かな?(途中で抜けてしまった)。オリンピックに直結したプロジェクトも多い中、メイン会場で開催してる割には聴講者ガラガラでした。2件目保原先生の話が面白い。


講演(1) 選手,コーチをサポートするICT技術(映像システム編), 三浦 智和 (独立行政法人日本スポーツ振興センター 国立スポーツ科学センター スポーツ科学研究部 専門職)

IMGP0700 IMGP0702

後半しか聞けてないですが、トップアスリート支援で必要な高精細録画を「現場」で収録&即時フィードバックするための環境整備自体のコストがまだ高くつくという話。なるべく機材は小さく&軽くしたいとか、iPadとかとの連携も不可欠とか、アスリートが事細かに覚えていられるのは30秒ぐらい(?)で、現時点では収録したのを送信するのに40秒ぐらいかかるとかとか。

スキージャンプ
 今後の課題: インフラ、機器
ウェイトリフティング
 スーパスポレコ: フルハイビジョン対応の映像遅延再生システム
  フォーム即座に繰り返しチェックできる
競技現場にマッチするシステムとは?
 ニーズを実現するという大前提に加え、普段のトレーニングで活用できるシステム
 現場だけで活用できるシステム(機材チーム不要)
 映像+情報も合わせて即時にフィードバック
  ウェアラブルもあるがトップアスリートには精度の問題も


講演(2) スポーツ用義足の研究開発とアスリート支援, 保原 浩明 (独立行政法人産業技術総合研究所 デジタルヒューマン工学研究センター 研究員)

IMGP0708 IMGP0709 IMGP0710 IMGP0711 IMGP0712 IMGP0715 IMGP0717 IMGP0718 IMGP0719 IMGP0720 IMGP0721 IMGP0722 IMGP0724 IMGP0726

専用機器なりで高精度な情報収集して分析することは可能だけどあまりにもコストが高い。例えば100m走では機器1台100万、競技者毎に1台+1人モニタリング技術者が必要、それを8人分揃えるとか旅費とか考えたら死ぬし、そもそも実現場では収録できない状況もある。それに対し、(ある条件を満足している)YouTubeに投稿されてる動画からの分析であれば、分析コストのみでデータに基づいた支援が可能。実際にあれこれやってみてる、という話。

スポーツ用義足の機能
 売った人も/利用者も/コーチもどの義足が良いのか分かっていない
  ベストな組み合わせを見つけた選手が記録を打ち出している
  ただし、両脚とも義足の方が良い
研究の現状
 バイオメカニクスによる支援
  ある条件下での基礎研究にはベスト
  トップ選手の実験はほぼ不可能
  本当に凄い選手は謎が多い(調べても無駄?)
   言語化すること自体が困難?
  モニタリングコスト(機器/人等)が高すぎる
   代わりにYouTube動画からスピード曲線を描く(動画を眺めるだけではなく、データを抽出する)
    欠点もあるが、本気モードを分析できる等のメリットも
  欠点の発見だけに留まらない要注意
   e.g., 国籍性別等どうしようもない違いを指摘してもどうしようもない


講演(3) 選手を育てるICT技術(陸上競技 競歩編), 今村 文男 (富士通株式会社 インテグレーションサービス部門 ビジネスマネジメント本部 インテグレーションサービス人事部 担当:陸上スタッフ)

IMGP0728 IMGP0729 IMGP0730


特別講演 2: 官民が協働で推進する新しい海外留学支援制度について~「トビタテ!留学JAPAN」日本代表プログラム~

IMGP0736 IMGP0737 IMGP0738 IMGP0739 IMGP0740 IMGP0742 IMGP0743 IMGP0744 IMGP0745 IMGP0746 IMGP0748

トビダテ!留学JAPANというプロジェクトの紹介。貸与型奨学金で、自由度もかなり高いのでどしどしチャレンジして欲しいとのこと。直近のやつはそろそろ〆切だけど、今後も1年に2度の公募で継続するらしい。


招待講演(5)情報処理技術を用いた脳の情報の解読と制御, 川人 光男(株式会社国際電気通信基礎技術研究所 脳情報通信総合研究所 所長)

これまでのBMI(ブレイン・マシン・インタフェース)では相関を利用するぐらいの研究に終始していたが、デコーディング+フィードバックで因果関係解明も目指したい、という話。

IMGP0775 IMGP0777 IMGP0778 IMGP0779 IMGP0780 IMGP0781 IMGP0783 IMGP0785 IMGP0786 IMGP0787 IMGP0789 IMGP0790 IMGP0791 IMGP0793 IMGP0794 IMGP0796 IMGP0797 IMGP0799 IMGP0800 IMGP0801

豊富なセンサ+強力な演算能力+実応用
ブレイン・マシン・インタフェース
 脳の感覚・中枢・運動機能を電気的人工回路でサポート
  日本人向けには脳に直接電極を差すタイプは向かない?
 脳/心の解読(デコーディング)
  classification or clustering or regression
   モジュール性/階層性/スパース性、、、

BMI3つの役割
 活動モニタリング&分析
 実時間でユーザに戻す
 脳の活動そのものが変わる(回路が変わる): ニューロ・フィードバック
  デフォールトモードネットワークの発見(15年前ぐらい前)
  遅い(~0.03Hz)BOLD信号の振動の動機(相関)
  得られた状態から診断等への応用/フィードバック
   fMRI実時間ニューロフィードバック(脳の特定の場所を活動させたりするための強化学習支援)
 従来の相関に終始していた分析から、フィードバックすることで因果関係の解明へ(目標)
  DecNef: モデル無しで機械学習+強化学習


学生セッション[6M会場] 情報推薦 座長 平手 勇宇(楽天)

IMGP0802

嗜好抽出を目的とした電子書籍へのアノテーションの分析は、自由にアノテーション(start-endマーキングだけ)付けてもらった結果から嗜好抽出できるか、という話。できるだろうけど、表層的な情報しか使ってないのが物足りないかも(似たようなのあちこちにありそうなので)。

平良くんの感情推定に基づく小説推薦システムのための認知的評価質問セットを用いたシミュレーションは、後で質問コメントを整理してくれるでしょう。

参加者の嗜好を考慮した飲食店推薦システムの開発は、店舗毎にレーダーチャート的に用意した評価軸毎に評価してもらったログを用意し、嗜好を考慮して推薦したいという話。気持ちは分かるけど、類似事例との違いが良く分からず。


学生セッション[6P会場] 対話システム 座長 篠田 浩一(東工大)

IMGP0804 IMGP0805 IMGP0807 IMGP0808

対話を通じた情報獲得のための質問選択とその実験的評価は、情報不足で答えられない時には対話でユーザから情報取得しよう、ただしそれをなるべくユーザに負担なく、かつ、効率良くしたいという話。

SVMとCRFを用いたロボットによるロバストな命令理解ロボットの行動命令発話理解における不足情報の処理は同じチームの発表で、RoboCup@HomeのGPSRタスクを例に、よりロバストなシステムを作ろうという話。基本的には「命令」なので、「どういう種別の命令かを判別するタスク」+「どんな名詞が含まれているかを抽出するタスク」を各々高精度にすることで質を高めることができるということで、そこに機械学習導入してみたとのこと。

多様な形態の相槌をうつ音声対話システムのための傾聴対話の分析は、相づちの形態(「うん」「うんうん」とか)を判別するために視線(ここでは顔の向き、ぐらいの意味)を利用してみたという話。

スマートポスターボードにおける視線情報を用いた話者区間検出及び相槌の同定は、話者区間(だれがいつ話しているか)+相づち判定(誰が聞き手か)をするために、10マイクロフォン+Kinect使って処理したという話。従来に比べ視線(顔の向き)を利用することでかなり精度改善に寄与したとのこと。


お食事

ますたに 京都拉麺小路店

IMGP0809 IMGP0811

当初予定していた豆腐料理屋さんは既に待ち行列になってたため、その途中で見かけた拉麺小路店にあったますたにへ突撃。背脂使いつつサッパリという謎の表現してましたが、確かに一般的なこってり押しのやつと比べると相対的にはサッパリしてるか。

京都出張3日目(情報処理学会第77回全国大会 2日目)

水曜日, 3月 18th, 2015

IMGP0620 IMGP0622 IMGP0624 IMGP0625 IMGP0626 IMGP0627

今日も暑い一日でしたが、夕方には雨が降ってて気温もそれなりに冷えて気持ちいいぐらいに。今日発表した慶留間くんはなんと学生奨励賞(座長さんの一存で決める賞)を受賞。目出度い!(が、私自身は別の会場にいた&時間に合わせて移動したのだけど既に終わってたので見れてない&撮影できずorz)

京大は京大内部の人しか無線LANを利用できない。というのは琉大でも同じなのだけど、外に出ると京都市が提供してるAP「京都どこでもインターネット」があって便利でした。クローズドにするのって管理者側の手間からすると簡単だし言い訳しやすいというのも分かるし、オープンにしたことで手間が増えるのも事実なのも分かるのだけど、もう少し柔軟な対応はできないものかしら。


<目次>

ソーシャル・ビッグデータが切り拓く新しい社会 −ビッグデータの可能性と課題−

全体としては「データを管理&処理する環境」、その環境を利用してるかどうかは不明だけど「対話的に可視化しながら分析する技術」、「医療支援のためのライフログ利活用を例にした事例紹介」、「プライバシーの問題」といった話題が詰め込まれた企画でした。これらの事例とパネル討論を通して「ビッグデータの可能性と課題」を問う、というのが趣旨だったのでしょう。豊田先生の話は論文漁ってみようかな。


講演(1) ソーシャルビッグデータの利活用・基盤技術のためのオープンテストベッドJOSE, 寺西 裕一 (独立行政法人情報通信研究機構 研究マネージャー)

IMGP0580

JOSE (Japan-wide Orchestrated Smart/Sensor Environment)なるリソースを用意したので皆で一緒にやろうよ、という話。単なる計算機リソースというだけではなく、各地に用意されたモニタから収集蓄積されたデータも利用できるorそういうセンサ機器の貸出しや、カスタマイズも可能、とかある程度汎用性を持たせているっぽい。

ソーシャル・ビッグデータ:=公共に役立つデータ
 JOSE: 大規模オープンテストベッド
  研究開発実証実験のスパイラルを含む、実用・商用に向けた実験環境
  大規模分散SDI、柔軟なネットワーク構成、実環境のセンサーデータ


講演(2) 交通ビッグデータ利活用基盤技術, 豊田 正史 (東京大学 生産技術研究所 准教授)

IMGP0580 IMGP0584 IMGP0587 IMGP0588 IMGP0589 IMGP0591

多くの分析技術はバッチ処理で結果が出るまで待たないと何もできない。その一方でリアルタイムに対話的に視覚化されたモノを見ながら分析したいという要求が、一般ユーザからも専門家からもある。その一例としてドライブレコーダから「ヒアリング等の調査に基づいた分析ではなく、客観的な記録のみに基づき、時空間上のヒヤリハット地図作成し、それをインタラクティブに可視化分析してみている」するという話。

大規模データ解析と可視化、対話的な可視化
 e.g., ツイッターのデマ拡散: 時系列にどう拡散されるか
  どういう内容がどう拡散されるかをリアルタイムに解析
 e.g., 移動体オブジェクトの解析&可視化

ドライブレコーダデータ
 まだ利活用は十分には進んでいない
 交通ビッグデータに基づく運転者指向サービス
 運送会社のデータ
  3次元空間可視化を用いたドライブレコーダデータからの要注意領域探索
   インタラクティブ時空間にヒヤリハット地図作成
   記憶に頼るのではなく、実データから要注意時空間を探索抽出
   実際の自己発生箇所との比較、自治体作成地図との比較
   要注意領域の詳細: カーブ後の急ブレーキ
  ドライブレコーダと安全運転
   日々の運転の振り返り
   運転経歴と安全運転との相関は?個々人の特性・癖があるのか?
   事故前後の違いを見ているわけではないことに注意して分析考察が必要(これから)
 個人に適合したサービス

ビッグデータ処理・分析の基盤技術
 解析・可視化をバッチ処理するのではなく、インタラクションしながらやる枠組み
 高頻度解析に耐える対話型


講演(3) 認知行動療法支援基盤とライフログ情報の活用, 長谷川 晃朗 (株式会社国際電気通信基礎技術研究所 適応コミュニケーション研究所 室長)

IMGP0593 IMGP0596 IMGP0600

認知行動療法を支援するサービス例であるスマートフォンアプリにすることのメリットとして、そのアプリに閉じた機能だけではなく、ログをサーバにアップロードすることでより実態にあったモニタリングができる等。ライフログを負担なくどう収集し、どう活用するかを検討してみてるという話。

広く様々なデータを収集蓄積して利用: ここでは医療分野
 認知行動療法: 心理教育、セルフモニタリング、行動を変える/考えを変える
  カウンセリング(週1*16回程度)、
   カウンセリングは週1のみ。課題を与えて、それを毎週観察。
  スマートフォンを活用した支援基盤の構築
   ホームワークの一部をアプリ化し、いつでもどこでも実践可能に
   アプリに閉じるだけではなくログをサーバにアップロードすることでモニタリング可能
  うつ病
   蓄積されたらイブログから行動の推定、気持ちの推定

ライフログ情報の医療への活用
 例: ホルター心電図
 技術的なハードル: デバイス、ログ品質、電池、ウェアラブル、スマートフォン、、
 運用面でのハードル: きっかけ、期間、プライバシー


講演(4) ビッグデータ活用とプライバシー保護, 美馬 正司 (株式会社日立コンサルティング 公共本部 シニアマネージャー)

IMGP0604 IMGP0605

プライバシーとプライバシー保護は必ずしも同一のものを対象としているのではなく、広い意味でのプライバシーには感情が含まれる。どうやればより良い未来を描けるかについて、事例を交えて紹介するというお話。

個人情報保護法の改正
プライバシー補語について「顧客任せ」ではなく、適切にやる用一緒に話し合い進める


パネル討論 ビッグデータの可能性と課題

IMGP0611 IMGP0613 IMGP0616

キーワード: ビッグデータ、CPS、M2M
 ビッグデータ: ビジネス/生活/自然
  ビッグデータ+ソーシャルメディアデータ->実社会への貢献(価値創造)

議論の種
 取得管理
  データはどこにある?
  リアルタイムに取得できるのか?
  どうやって管理するのか?
 分析
  社会を変革する情報をみつけるには?
  プライバシ性の高い情報における研究課題とは?
 利活用
  実社会の利益にするために必要なこととは?
 複数分野と連携する際に直面した問題例
  語彙の違い
   e.g., 同じ語でもドメイン毎に意味が違うと、同じ文書なりで提供しても違う解釈をされる。
    Q: 定義するという話があったけど、そういう問題なのだろうか?
  ビッグデータ=どんなデータからでも好きなことを抽出できると勘違いされる


CREST・さきがけ「ビッグデータ」2領域 成果報告会

CREST・さきがけがどういう意図でどういうテーマについて募集しているのか、また採択されたテーマの進捗がどうなってるかという報告会。CRESTでは「国が定める戦略目標の達成」という話が出てくるし、さきがけでは「戦略目標に基づいて未来のイノベーションの目を育む個人型研究という話が。各々について具体的な所まで聞けるのかなと思ってたのですが、プロジェクト自体が比較的大きいこともあって概略紹介に近く、ちょっと物足りないか。それでも山西先生らのディープ・ナレッジあたりは論文集めて読みたいとかの切っ掛けになったので良かったか。


講演(1) 「ビッグデータ基盤」研究領域紹介, 喜連川 優 (国立情報学研究所 所長)

IMGP0635 IMGP0636 IMGP0638

ビッグデータ周りの研究開発を大別して「基盤(コア)」と「応用(アプリケーション)」に分けて考えていて、ここでは基盤で採択された人はこういう人で〜〜〜というお話。喜連川先生の話は大抵そうなんだけど、1秒1スライドぐらいのペースで飛ばしながら概要紹介することが多いね。勿論強調する所はしてるのだけど。今回のポイントは「ビッグデータはデータが命なんだから、シェアしよう。ただし何をオープンにして、何をクローズドにするのかについての議論が無いためになかなかシェアできない」ということらしい。

インフラ/処理・解析/結果/現行法
データが命なので、データをシェアすることでより新しい知見発見を加速させる
 どこをオープンにしてどこをクローズドにしてどうシェアするか


講演(2) 「ビッグデータ応用」研究領域紹介, 田中 譲 (北海道大学 大学院情報科学研究科 情報理工学専攻 特任教授)

IMGP0641 IMGP0642 IMGP0643 IMGP0645 IMGP0646

応用編では、技術と実応用との間に大きなギャップがある。例えば実社会への価値貢献が大切だがコア技術をどう組み合わしたら良いのかといったノウハウが不十分だから、そこら辺をうまく体系化したいよね、という話。あと「国の重要課題分野をバランス良く含んだポートフォリオ」を意識して採択してる(テーマ設定してる)という話も。ここでのQ&Aだったか別会場だったか忘れたけど、良くも悪くも米国は「国一丸となって取り組む」のに対して日本は「個々人が独立して取り組んでる」ことが多いという話もあったか。戦略的には米国がうまくいきやすいというのはそうだろうなとは思うが、同じ戦術で対抗しても楽しくないし、協力/共同する方法はいろいろありえるし。(笑い男じゃないけど)

基盤と応用の間にあるギャップをどうにかしたい
 個々の分析技術は良いが、
  課題と関連データを与えられた時に、
  どう組み合わせて解決したら良いかというシナリオは不明だし、支援も無い。
 mission driven -> data driven へのパラダイムシフト
 分野や組織を越えた統合
 再利用可能なノウハウの知識化

国の重要課題分野をバランス良く含んだポートフォリオ


講演(3) 複雑データからのディープナレッジの発見と価値化, 山西 健司 (東京大学 大学院情報理工学系研究科 創造情報学専攻 教授)

IMGP0648 IMGP0649 IMGP0650 IMGP0652 IMGP0653 IMGP0654 IMGP0655 IMGP0656 IMGP0657 IMGP0658 IMGP0659 IMGP0660 IMGP0661 IMGP0662 IMGP0664 IMGP0665 IMGP0666 IMGP0667 IMGP0668 IMGP0669 IMGP0671 IMGP0672

ビッグデータは単にデータの量が多いという話ではなく、varietyに飛んだデータが、時々刻々と潜在的な状態が変化しながら蓄積されるといった「質的に似たようなものが蓄積された巨大なデータ」ではないから、それに見合った分析モデルが必要だという話。

ビッグデータの5V
 Volume: 大量性、大次元
 Variety: 多様性、複雑性(潜在性)
 Velocity: 動的、非定常、変化
 Value: 付加価値
 Veracity: 真実性

Deep Knowledge: 潜在的関連、因果関係、、そのものや、それらの変化
 潜在的ダイナミクス: 動的 Velocity
  データの表層的な変化ではなく、背後にある構造的な変化が対象->本質的な変化
 関係データ統合予測: ヘテロ Variety
  他データを活用(転移学習の一般化)

教育データマイニング
 大量のテスト採点結果 -> 潜在変数スキルの導入
  スキルは時々刻々変化

緑内障進行予測
 RBMに基づくデータ統合=共編量を基に潜在変数モデルを用いて欠損値を予測
  尤度を直接計算するのではなく、下界を設定して推定
 視野の欠損が時間と共に拡大
  個々人は数少ないデータ->似ているユーザのデータを利用
   マルチタスク学習に基づく予測
    患者間相関/視野間相関/時間発展の特徴


講演(4) 自己情報コントロール機構を持つプライバシ保護データ収集・解析基盤の構築と個別化医療・ゲノム疫学への展開, 佐久間 淳 (筑波大学 大学院システム情報工学研究科 准教授)

IMGP0673 IMGP0675 IMGP0676 IMGP0677 IMGP0678 IMGP0679 IMGP0680

100%漏れないようにというのは非現実なので、漏れても大丈夫なアプローチ(秘密計算)しましょうという話。生活習慣病への応用については既に協力実施できてるらしい。(ゲノム疫学の方は「病院->外」方向へのデータ提供がありえないとのことで、現時点ではまだ不透明っぽい)

ゲノムの利活用
 ゲノム疫学
  どのゲノムがどの病気の要因に関わっているか、特に生活習慣病
 体質に応じた薬剤選択、投与量決定、特に抗がん剤
 リスク
  意図せぬ本人/血縁推定、将来的に知能/能力等を知られてしまう可能性
  ゲノム差別
  -> 漏洩しても困らないようにすることを目指す
   暗号化+他人に見せずに解析(暗号化されたデータをクラウド上で処理)
    情報を見れる見れないと処理するとを区別
 課題: ゲノム探索、コスト低廉化、プライバシ保護

生活習慣病の罹患リスク
 ゲノムだけでは決定せず、後天的要因も大きく影響


講演(5) ビッグデータからの知識創出基盤の確立 - 創薬から製品製造までを例として -, 船津 公人 (東京大学 工学系研究科 化学システム工学専攻 教授)

IMGP0681 IMGP0683 IMGP0685 IMGP0686 IMGP0687

創薬〜製薬までの各ステージにおいて種々の問題があり、それらを全体として最適化する必要がある(そうしないと割にあわない時代になってきた)という話。米国だと組織を越えてデータをシェアすることにも取り組みつつあるが、日本ではそういうことしてる暇があるなら研究しろという風潮。そのために利用できないデータが眠ってるという話もあるらしい。(情報系でもまだまだあるよね)

創薬から製造までがターゲット
 副作用・毒性などの事前知識を踏まえた探索最適化が成否の鍵
  合成法は未知
  効率かつ安定的な製造
  観測が容易な変数、困難な物性・濃度などを踏まえたソフトセンサ
  予測モデルの劣化、、、


学生セッション[4Q会場] 3/18(水), 機械翻訳と文書分類 座長 須藤 克仁(NTT)

IMGP00 IMGP01

慶留間くんの可変長N-gramに基づいたトピックへのラベル選択の検証が学生奨励賞受賞!


お食事

IMGP0688 IMGP0689 IMGP0692

雨降ってたのと1台のタクシーに乗れる人数だったのとでタクシーで移動。ついでに美味しい所聞き出す等。そう簡単には外れないだろうし。とはいえ「沖縄から来たんですけど駅付近で美味しい所無いですか」ぐらいのアバウトな質問だったのでわりと悩んでましたw その結果、飲むなら酔心、そうじゃないならチェーンで美味しいがんこ寿司という2択をゲット。がんこ寿司イイネ!