IPSJ78, day1

Mar 10, 2016 イベントレポート学会日記

			<blockquote class="twitter-tweet">

会場 pic.twitter.com/N2BKGcY596

— Naruaki TOMA (@naltoma) March 9, 2016

くねくね曲がってキャンパス移動 pic.twitter.com/gX5HQ9gGVm

— Naruaki TOMA (@naltoma) March 9, 2016

結構な下り坂 pic.twitter.com/27yrrO6DIr

— Naruaki TOMA (@naltoma) March 9, 2016

登り降りしてやっと着いた pic.twitter.com/qFzvLkqu1M

— Naruaki TOMA (@naltoma) March 9, 2016

今日も昨日並みに冷えてたはずですが、雨が晴れてたことと高低差が激しい道のりを移動してたこともあって体ぽかぽか。これは健康になるな。でも室内暖房キツく、そのギャップで健康だめになりそうな感も少なくなく。暫く座ってたら良いぐらいにはなるんですが、暖房つけっぱなしの室内ってあまり気持ちいいものじゃないし。

初日は神谷さん＆伊藤くんの発表で、学生セッション1R「自然言語処理(1)」と学生セッション2R「自然言語処理(2)」へ。二人とも真っ当なコメントを貰えてたという意味で、発表は成功したんじゃないかと。今後に活かそう。

ちなみに学生セッションでは座長裁量で学生奨励賞なるものを実施しているのですが、1R「自然言語処理(1)」ではファシリテーション分析がその将来性を買って、2R「自然言語処理(2)」では脳活動理解のための言語化というチャレンジングな課題への取り組みということでそれぞれ学生奨励賞を貰ってました。確かにこれらは一つ頭抜けた発表だったなと思います。

一般セッション終了後は招待講演のVisual Search by CDVSを聞いてきました。タイトルに惹かれて参加したのだけど、技術的には殆ど踏み込んだ話がなくて「モバイル端末で写真・動画上での検索・認識・同定といった処理のための軽量で精度の良いdescriptor（特徴）が欲しい。これがCDVSだ。詳しくは今年出した論文読んでね」ぐらいの話を30分ぐらいかけて話してて、残り10分は大学紹介でした。うーみゅ。

お昼食べる時間取れるか怪しかったので事前にパン買って持っていたんだけど、食べてから気づいたけど朝も昼もパンだと美味しいパンでも気持ち的においしくないな。明日はどうしよう。

頂きます！ pic.twitter.com/piEpHJtMYq

— Naruaki TOMA (@naltoma) March 10, 2016

おやつ！ pic.twitter.com/xOMH5KLc22

— Naruaki TOMA (@naltoma) March 10, 2016

晩ごはんは学生と一緒に来てる学会にしては珍しく一人ご飯。お財布に優しいw

以下、参加したセッション＆招待講演メモ。

学生セッション1R「自然言語処理(1)」

1R-01議事録からの課題抽出と能動学習による精度向上

議事録データから機械的に「課題発言」を抽出したい
　導入発言・課題発言・継続発言
　　課題発言＝実施すべきor検討すべきor実施されていない
能動学習
　サンプリング基準の検討: 曖昧なデータではなく、最も確率値の高いデータを選ぶ
　初期モデルで予めある程度の量のデータ
　　->能動学習において、初期サンプリングは、USより提案サンプリングの方が効果は高そう。

Q: 能動学習するのは良いとして、特徴は？

1R-03雑談対話における未知語や属性の獲得のための質問生成

大目標：おうむ返しの応答をしない雑談対話システム
課題：ユーザ発話に未知語が現れた場合の対応
　->オントロジー内の所属クラス同定問題
テンプレ確認->暗黙的確認を利用した未知語獲得 
会場Q: 対話に冗長性があると対話継続の点で良いという研究事例あり。
　つまり、おうむ返しは良いという主張。
　->おうむ返しが一切いらないというスタンスではなく、バランスの問題。

Q: 気持ちはわかるけど、中途半端に暗黙的確認されると逆に苛々しそうな気が？（想像）
　心理面での良し悪しは何かしら評価できる？
Q: 個々人毎の傾向は利用しない？

1R-04心に響く励まし文の自動生成->名言の特徴分析及び心に響く励まし文の自動生成

状況に合った心に響く励ましの言葉を発話させたい
　名言集週＋頻度分析＋構文パターン分析
　->入力解析、状況に合わせて提示

会場Q: 前提語は？
　->対義語からクエリ作成。
　　「試験に落ちた」->「試験に受かる」＋「ため」
　　Google Ngramでクエリの後ろに最も多く共起する単語取得->「勉強」

Q: 名言そのものの分析だけではなく、どういう文脈での発言だから名言なのかの分析が必要なのでは？
Q: いきなり名言応答するというのは談話的には流れが悪く無い？

1R-05小説検索システムのための登場人物間関係推定に関する基礎研究

会場Q: 実験1で「する、しまう」が動詞として挙げられ、実験2では「降参」。
　「する、しまう」は名詞句につくことが多そうだが、
　名詞は全て取り出して使ったのか、何かしら限定をしたのか？
　実験2で「する、しまう」がなくなったのはどういう理由？

会場Q: 関係を増やすことと、ジャンルを増やすこととではどちらを優先？
　文書のジャンルで手がかりが大きく変わりそう。
　weblioとか使ってるがそれで童話に対応できるのか。明確にすると良いのでは。

1R-06Web議論システムにおけるファシリテータ発言の分析のための文脈特徴の検討[奨励賞]

ファシリテータが議論円滑化のためにどのような発言をしているか
将来的には自動ファシリテーション
発言要素
　発言意図、o意味内容、o言語表現、o発言タイミング、発言相手
　特徴表現抽出->類型化

会場Q: 否定表現や停滞を分析した理由、他には分析必要ないのか？
　->議論停滞するならファシリテータが発言するだろうとか、
　　いくつか書籍を読んだ結果からセレクト。

会場Q: どういう役割が必要かについては意見収集できてる？
　議論を把握して、整理・分析しながら発言するとか？

会場Q: 今のやり方だと「問いかけだけしてたら良い」という結論になりそう。
　内容や状況といった文脈をより踏まえた分析が必要では。

Q: テーマやステークホルダーの属性はどのぐらい影響しそうか？
Q: ファシリテータの個性というのはどのぐらい影響しそうか？
Q: ファシリテーションに正解はあるか？良し悪しは？

1R-07Zero-Shot言語横断文書検索のための画像媒介学習

言語横断文書検索
　翻訳はコスト高い->「イメージ+テキスト」->画像媒介型学習
　仮説：文書に含まれる画像が似てるなら、テキスト内容も似ているのでは。

会場Q: データを増やしているはずだが、zero-shot, few-shotでは良くても、
　データを増やしていくとベースラインに負けてしまうというのは何故か？
　->3者のマッチングを線形でやっているため、現モデルの限界だと想像。
　　非線形に拡張することで対応できると想定。

Q: 失敗事例についての分析結果はある？傾向は？

1R-09音声対話ロボットによる参照表現生成に向けた3次元シミュレータの構築

人と役割分担や協力を行ってタスク達成するロボットの構築
　周囲環境に対応した音声対話機能の実現
　　動的に変化する環境での参照表現の生成->どう評価するか

会場Q: 参照表現以外の要素についての評価が多く含む形になってないか？
　->状況を固定したうえでの参照表現良し悪しを評価するためのシステム。

会場Q: 指示表現とかは含まれているか？
　->今後実装予定

Q: 動的に変化する環境になってる？
Q: 仮想空間になってる時点で人間側への実環境と異なる負担がないか？

学生セッション2R「自然言語処理(2)」

2R-01構成要素に着目した顔文字の意味分析

既存手法
　予め人で分類しておく必要性：（そんなにコスト高い？）

会場Q: 大文字のTが泣き顔という話があったが、単語のTが出た場合は？
　->分割行う際に顔文字か否かは判定済み。

会場Q: 顔文字の意味は一意か？

会場Q: word2vecで足し合わせる理由は？
　->複合語ではない、という解釈。

（学生実験で教師データ作って学習する方法でやってる方が精度高いような。上記発表では教師データ作るのはコスト高いよねとかいう話だったんだけど）

2R-02CSR企業総覧を用いたテキストマイニング技術による収益の増減予測

CSR=企業の社会的責任、社会貢献、労働慣行、社会問題
　先行研究：CSR活動に対する認識が企業や研究によって異なる
　本研究：東洋経済新報社「CSR企業総覧」
　　->企業の財務状況に影響を与えるCSR活動を明らかにし、今後企業が行うべき行動を示す

会場Q: 業績が良いからCSR活動が良いのか、その逆なのか。因果関係はどちらか？
会場Q: 相関があることはいえる。因果関係があるかは飛躍。別の研究が必要。

Q: 財務状況は様々な要因が噛み合わさった値だが、どう抽出する？
Q: 「特徴＝CSRデータ」だと他の要因を見れないけど良いの？
Q: 無回答＝0とかはカテゴリカルな値？連続値？（連続値っぽい）
Q: 今回構築したモデルは時節・流行は含まれない？

2R-03統計翻訳に基づく特許文翻訳の精度向上

統計翻訳：対訳コーパスから得られる統計量にもとづき翻訳
　問題点：未知語の存在、対訳コーパスの性格的不一致、長い文章->e.g., 特許文

2R-04うつ病患者の周辺看護者に向けた構造化検索結果の可視化

周辺看護者のストレス->トラブル対処、予測のための情報検索
　「自分と似たような境遇や状況の他者がどのように悩みに対処している/してきたのか」
　->周辺看護者のための視点・状況・志向文脈検索システムの設計

会場Q: 今の精度では検索できないのでは？
　->網羅性を大切にしたい。

Q: データ数少ない？
Q: 実際に検索するときにはどういう利用方法（入力）を想定している？

2R-05関連語を用いた感性語の意味のモデル化

感性語との関連度を用いてモデル化
　Google n-gram (n=3)
　因果関係は助詞で判断（で、て）：e.g., ワイルドでかっこいい
　　下位概念である度合い: WeedsPrec [Lili Koterman et at al. 2010]
　　->今回の結果では balPrec が適切

2R-06ユーザの興味に応じた記事タイトル自動生成に関する基礎研究

会場Q: パターンベースだとカバレッジ向上が難しそうだが、どうアプローチしていくのか？
　例えばどのパターンも使えない場合。

2R-07利用規約等における重要文の抽出手法の検討

規約文を読まないことによるトラブル

会場Q: どう使うことを想定しているのか？
会場Q: ハイライトするなら文単位よりは細かい単位のほうが良さそう。

Q: ハイライトで対応できるのか？

2R-08深層学習を用いた画像を説明する文生成手法の一考察（脳活動データへの適用）[奨励賞]

背景：脳活動の言語化（現状単語レベル）
　->自然言語文へ
　Encoder-Decoder Network + Attention Mechanism
脳活動の理解が趣旨

2R-09英文和訳評価における類義語変換を組み入れた評価値算出方式

学習者の英語和訳の採点: RIBES（語順相関ベース）はまだ人間翻訳とは相関が低い

Visual Search by CDVS

Visual Search
scenario 1: mobile phone search
fast image retrieval, matching, localization towards augmented reality

motivation
search by unstructured data, how to send a query from a mobile phone/device to the remote server?
descriptor shall be compact, discriminative, and meanwhile efficient in extraction to reduce the query latency.
goal: using the compact feature with 90%
feature selection
invariant: scale, translation, rotation, affine transformations, illumination,,, e.g., SIFT
detecting interest points, extracting descriptors

CDVS: compact descriptors for visual search
MPEG-CDVS Standard: ~400MB -> ~1MB
block-wise

Next
inter-frame compression