Archive for the ‘学会’ Category

NLP2011, チュートリアル終了

月曜日, 3月 7th, 2011

NLP2011の一日目(チュートリアル)が終了しました。

チュートリアルというだけあって分かりやすい言葉で話されてるケースも多いのですが、濃い話が長時間に渡って続いたので途中から自分で咀嚼することができなくなってる部分が多数。頂いた資料には参考文献も多数示されているので、適宜参照しないと。

今日一日の感想としては、NLP(自然言語処理)というキーワードで括っていても研究対象やアプローチが多種多様なのを体感でき、自分がやろうと思ってることも、よりブレイクダウンして考えないと前進することが困難だということ。前進できたとしても討論の場に持ち上げることができず、「試してみました」だけな話になってしまいそうなこと。一方で、その討論のために評価を厳密にやることが困難なテーマも多数ごろごろしてることが良く分かりました。評価困難だとしても、取りあえず第三者が使えるようにツールを公開してしまうことでリアクション得られてより進みやすくなるというのも、その通りだよなと再確認。やること一杯あって、ある意味幸せですね。

以下に、今日のチュートリアルに関するメモと、質疑応答関連のサマリを残しておきます。

青字で冒頭に「*」や「Q:」が付いてる箇所は個人的な疑問やコメント。
赤字は会場内での私が意味を汲み取れた質疑応答。

目次



(T-a) 3月7日(月) 11:00〜12:30 司会:高村大也(東工大)
「強化学習の基礎と言語処理への応用」伊藤秀昭 氏(佐賀大学)
試行錯誤により報酬を最大化する行動を学習する。 教師あり学習と異なり、明示的にどの行動が最適化は与えられない。 >一段の決定問題(bandit problemの例) ここでは観測は無し。 強いて言うなら2台のスロットマシーンがあるということを観測する。 *報酬自体も観測の一部だと思ってたけど、独立して考えるのね。 最初から期待値が求められるなら計算したら良いが、ある行動を選択した 際に得られる報酬がどの程度見積もれるか分からないときに、最適な行動 を学習したい。 →行動価値の推定 ・exploitation vs. exploration 回数が少ないうちはQ(a)はあまり信頼できない。  arg max(Q(a)) を選ぶべきか(greedy action)  それ以外の行動を選んでQ(a)をより正確にするべきか(exploratory action)  →厳密な解決(様々な要因により異なる)は困難。近似解を考える。   ε-greedy法   softmax法 Q: 報酬が変動するような場合にはどうなる?  ・短期的変動/中長期的変動とかケースバイケース?  ・多段決定問題と等価?   ・割引率の推定/調整問題? >多段の決定問題(三目並べの例) ・1段決定問題との違い 環境:agentの行動により影響を受けるもの+agentに観測と報酬を与えるもの。 報酬:行動の評価はすぐに得られるとは限らない。 →1回のplayでどのぐらい報酬が得られるかを推定。 ・遷移グラフで全局面を網羅生成 ○と□で表現された経路には、観測と行動の履歴を対応付けることができる。 各履歴の生起確率は、各行動and各観測がどの確率で得られるかに依存。 ある履歴o1において行動a1を選ぶ関数π((o1),a1)を政策と呼ぶ。 最適なπ()を学習するのが目標。 ・観測関数 ある行動を選択した結果、どの観測に遷移するか(相手がどの手を選ぶか)を観測関数と呼ぶ。 政策と観測関数から、履歴の生起確率が求められる。 ・エピソード 履歴の中で終端まで到達したもの。 ・報酬関数 ある履歴において行動aを選択したとき、直後の報酬がある確率分布に従って得られるとしたもの。  報酬の割引率(遅く勝つより、早く勝つ方が良い)  割引率を加味して、各エピソードの報酬和を評価。 Q: 単純に割り引くことでデメリットは無いか?  ・例えば一時的に負けるが最終的に勝てるような行動履歴は得られる? ・期待報酬と最適policy  報酬関数と履歴の生起確率から期待報酬を求めることができる。  ランダムpolicy→常勝policyへ。   環境<A,O,o(1),θ,R,γ>:固定   V^π=E{R_e|π} を最適化   →いろんな解法がある。 >解法1: direct policy search policy π(h,a)は履歴hと行動aから確率への関数だが、膨大なので近似が必要。 近似の仕方は工夫のしどころ。NNやlog-linearモデル等。 →πがθでパラメトライズされた近似 policyを、π(h,a:θ) や単純にπ(θ)と書く。  勾配法:このままでも計算量多いので更に近似→確率的勾配法。 >言語処理への応用 [Branavan 09] Windowsのヘルプ文章→文書の指示通りにWindowsを操作。 その文章から操作への写像を学習。 観測:文書のみ処理部分の一部+PC画面の情報 行動:PCへのコマンドと、文書のどの部分を処理したかの情報 報酬:操作の正しさをチェックするのは困難なので、工夫。  負の報酬   アイテムに対応していない状況に陥った場合、それ以上操作を続けられない。   行動数。  正の報酬   多くの単語を処理できた場合。 Q: (パッと見だけど)文書を処理する順番は考慮していない? 会場Q: どのぐらい学習を繰り返せば良いのか。仮定をおくことで理論的な終了  タイミングは分かるのか。 A: 最適値が観測できる場合には分かるが、一般的には観測できないので、分からない。 会場Q: 強化学習ではロボットでインタラクションがある時に良く使われているが、  そういうインタラクションが無い場面ではどういう用途に使われている? A: 資料最後にある対話システム [Young 10] が一つの例。バーチャルな世界にモノ  を作っている。バーチャルな世界でも複雑になってくると計算困難なので、擬似  的に最適値を学習させたい。 会場Q: ユーザの反応を取り込んでいる? A: この例では Simulated User を作ってやっている。 会場Q: 言語処理における強化学習の応用として、どの辺りに可能性がありそうか? A: 対話処理では結構使われている。それ以外にも人間が関わるいろんな所に使える  のではないかと、漠然と考えている。 会場Q: 集団での対話は、1対1の対話からやる強化学習とは少し異なるように思うが、  そこは余りやられていないように思う。これはやるべきなのか、やらない方が良いのか。 A: 全てをRLでやろうとするのは大変。表面を見るといろんな情報が入り込んで複雑  に見えるが、うまく抽象化ができれば、例えば質問するとか挨拶するとか、そうい  う単純な形で書けるならRLしやすい。それ以外のケースではRL以外も検討し、  上手く使い分けすることが良いのでは。
(T-b) 3月7日(月) 13:30〜15:00 司会:宮尾祐介(NII)
「形式意味論の考え方とその変遷」戸次大介 氏(お茶の水女子大学)
>背景と形式意味論 自然言語の「意味」は多様な側面があり、直接研究対象とするのは困難。 2文の間に演繹関係があるか。 1文目(包含する方)が真ならば、演繹関係がある副文も真。 これを論理的演繹として定義することが形式意味論の第一ステップ。 形式意味論とは、含意関係を予測・説明する理論。  ・意味的含意  ・会話の含意 >モンタギュー文法(PTQ)[Montague 1973] PTQは形式意味論ではない。→形式意味論である。by @kaleidotheaterさん モンタギューを否定しながらも、PTQのアプローチを参考にしながら厳密な形式意味論をやる。 PTQ:シンタックス+セマンティクス(IL) IL:一階述語論理+様相論理+型付きラムダ計算 *前半20分ぐらいから既についていけてない。。(涙) →ひたすらPTQの気持ち悪さを感じて欲しいというのが趣旨だったらしい。orz PTQ自体は不完全なものだが、 スコープ分析の仕方は面白く未だに似たようなアプローチが多い。 また、これを「de re読み」と「de dicto読み」に応用した点がエライ。 らしい。 初の「構成的意味論」(compositional semantics) を提示することで、 意味論が反証可能になった。 それまではある文→論理式への写像があやふやだったが、 初めて単語レベルからの写像を提示した。 「論理では自然言語が扱えない」という議論に対し、 恐らく初めて提示した論文。 PTQは沢山問題があるが、 反証&修正という歯車が回り始めることで現在の発展につながっている。 "Generalized Conjunction", "Type Raising", etc. 会場Q: センテンス→文章の意味、文と文の意味を扱うことについてどうやったのか。 A: 今回の話は80年代だった。文と文を繋いでしまって一まとまりとして扱うのも  やられているし、どう切り分けるかについても様々なアプローチがある。DRP(?)。  Compositional なDRPが無いかということについては90年代以降やられている。 会場Q: (1)使う立場からすると「分からない」のが大問題で、難し過ぎて使えない。  力学だと古典力学/ニュートン力学・・・と進んでいるが、多くの場合は古典力学  で十分。形式意味論についても、ある程度小さいものならこれぐらいの複雑さでOK  というものがあると助かる。  (2)スコープについて、人間が読んでも良く分からないものもある。自然/不自然言  語処理。良く読むとこういうことかもしれないというものについて、  何かしら考えがあるか。 A: (1)難しいからではなくて、完成していないからだと思う。量子力学やればできる  というような統一された世界が無い。計算的側面も欠けている。全部の現象を考え  ていないから、ブレイクスルーが起きていないのだと思う。統一した瞬間簡単な  ものになると考えているので、そこを目指している。  (2)はっきりとした理論ができた後の話かもしれない。 会場Q: 一般全ての文例を説明することへのチャレンジはとても大切なことだと思う。  その手続きの詳細を理解できる人は少ないかもしれないが、パッケージして使える  ようになれば利用者も増え、発展しやすくなるのでは。 A: 形式意味論で扱っているというのは、分野に限らず全部についてやっている  というより、言語を扱う以上そこを避けて通ることができないのだと思う。  まず「意味」が良く分かっていないから、こういう風にやっている。  そもそも「意味」をどう書くか、どういう振る舞いを持つ演算として書けるか。
(T-c) 3月7日(月) 15:15〜16:45 司会:高村大也(東工大)
「Understanding sentences in Japanese」Edson T. Miyamoto 氏(筑波大学)
どのように文を理解するか。 眼球運動(大人)の場合  単純な環境(pick up the candy)似たオブジェクトcandle  →似た単語のオブジェクトがあると230ms 子供(赤ちゃん)の場合  何度、どのぐらいintensionを持って見るか。  遮るものがあると隠れるという知識の有無。  驚く飽きる Neurolinguistics  brain lesions/fMRI/PET/MEG/EEG Reading times  silent reading -> eye movements not smooth: fixations, saccades  仮説:longer reading times=more difficulty  →Self-paced reading   eye tracking とボタン押した回数とを、文節毎に比較 Human parser  (1) cognitive resources  (2) knowledge bases (grammar, social conventions, world knowledge)  仮説:言語の違いは(2)のみに依存→(2)のみを学習すれば良い。   英語の例   日本語の例   →alternative rules I (head is crucial), II(processing is incremental)    客を(ヲ格)/客に(二格)で他単語を見る頻度(≒他に着目する頻度)が異なる。 How soon is the parent node A built?  英語/日本語といった言語の違いはあるが、  「どのぐらい読み違えるか」は似ている(?)。 Q: え、そうなの? Memory resources  Long-term memory  Working memory Hyakurakan test  cause? consequence? Heavy NP Shift  English: heavy stuff to the end  Japanese: heavy stuff to the begin Metrics: how do you measure distance?  number of words  number of new discourse entities  similarity of the constituents  time elapsed  etc. 青字で書かれたred 会場Q: コンピュータはワーキングメモリが一杯ある。アルゴリズムはみんな一緒  でグラマーが違うという話があったと思うが。 A: ワーキングメモリが多いケースは分からないが、少ないケースは患者さんで多  くいる。文章を作ることは普通にできる。ワーキングメモリが必要なのは読む  ときで、多い人は読むのに苦労しないが、少ない人は読むのに時間がかかる。  読む時間は遅くならないが、正答率が遅いというケースや、正答率は高いが読  み時間をかなり要するというケースもある。 会場Q: 時間がかかるというのはアルゴリズムが違うと考えて良いのか。 A: ある意味で違うと考えても良いと思う。ある範囲で頑張る人も要れば、諦める  人もいる。 会場Q: 英語と対比すると日本語は省略が多いと言われる。言語的に依存している  けれども、世界知識的な所で差が出ているのか、グラマーでは違いが無いけれ  ども、どこでその差が現れていると考えられるのか。 A: 全てを統一的に語ることはできないが、日本語の場合は動詞が最後にくる。  だから省略する方が理解しやすいというのはあるかもしれない。
(T-d) 3月7日(月) 17:00〜18:30 司会:藤田篤(未来大)
「言語生成研究の動向」徳永健伸 氏(東京工業大学)
対話システムの応答をどう作るか。 株価/気象データといった(非)言語情報から生成。 テキストからテキスト生成するのも良い。 評価問題:正解がそもそも用意できない 言語生成のサブタスク  テキスト・プランニング:what to say   内容の決定、構造化  マイクロ・プランニング+表層化:how to say   語選択、集約、参照表現の生成   ad-hocになりがち。   参照表現は比較的問題が定式化しやすい。GRE等。 内容の構造化  一般的な形式化は困難  メッセージ集合を談話関係で構造化: e.g, 修辞構造理論RST→テキストプラン  プランニングに基づく構造化 参照表現の良さ  Incremental Algorithm  冗長すぎない方が良さそうだが、心理言語学的観点から見ると   ・「以外と冗長」 [Deutsch 1982]   ・文脈集合すべてを見ているわけではない [Pechmann 1989]   ・漸進的に作られる 評価  内生的評価/外生的評価  MTに近い側面もあるが、そもそも元の文自体が無い。  入力/出力/尺度/文脈/ベースラインは? 会場Q: 参照表現で、日本語に限って言えば、如何に単語を省略するかということ  があると思うが、そういうことはやられているのか。 A: 日本語で生成やってる人が殆どいないこともあって、殆どやられていない。 会場Q: 内生的評価/外生的評価にあまり相関が無いということが指摘されていたが、  割とくらい気持ちにもなるがどう捉えるべきか。どうすべきか。 A: 外生的評価をやるべき。ただし、コストが高い。 会場Q: 内生的評価のコストが低いなら、そこで頑張る方法もあるのか。 A: 理想としてはそうだが、解析やろうとしてる時点でだいたい「これが欲しい」  という目処が立っていることが多い。決めてしまえば他は見ないというやり方  もあり得る。ただし、それ以外が×かというと、フェアな評価とは言えない。  ちゃんとした使う環境で評価することが大切。 会場Q: CGだと生成も解析もどちらも大切なタスクとしてやられているが、  言語ではなぜそこまでやられていないのか。 A: 見栄えの問題が大きい。学生から見ても地味。視覚よりも更に違いが分かり  難いという側面もある。 会場Q: 意味表現が難しいとかそういうことも影響している? A: それも当然ある。対話と密接な関係があり、インタラクションしている中で  それをどう表現するのか等様々なタスクがあり、その先に何があるのか見え  難く、手を付け難いという敷居の高さがあると思う。
更新ログ

NLP2011で気になる発表タイトルをピックアップ→絞り込み失敗

火曜日, 3月 1st, 2011

言語処理学会第17回年次大会(NLP2011)で気になる発表をメモ。

NLP年次大会への参加自体が初めてなんですが、当初予想してたより遥かに規模が大きい。ちょっとした研究会レベル(並列セッションあっても2,3で、1-2日終了するぐらい)を想像してたのですが、6並列*3日間+チュートリアル1日+併設ワークショップ1日とやらで合計5日間ぎっしり詰まる規模らしい。大きすぎるよw

ということで、実際に話を聞くセッションを絞るために取りあえずリストアップしてみました。

リストアップした結果、適当なセッションに突撃しても大抵興味がある話が聞けそうな雰囲気。こっち方面に足を踏み出したばかりだから興味が絞りきれてない気もしますが、ある一つの課題なりに絞ったとしてもそれを実現するためにあれもこれもと複合的に課題が山積みになりやすいテーマなだけかも。という気もします。

全日程参加の方向なのは良いとして、どのセッションに参加するか悩むな。


>3/7(月), チュートリアル
(T-a) 3月7日(月) 11:00〜12:30 司会:高村大也(東工大)
「強化学習の基礎と言語処理への応用」伊藤秀昭 氏(佐賀大学)

(T-c) 3月7日(月) 15:15〜16:45 司会:高村大也(東工大)
「Understanding sentences in Japanese」Edson T. Miyamoto 氏(筑波大学)

(T-d) 3月7日(月) 17:00〜18:30 司会:藤田篤(未来大)
「言語生成研究の動向」徳永健伸 氏(東京工業大学)

(協賛ワークショップ)第5回音声ドキュメント処理ワークショップ
13:00-14:00 特別講演 †
「映像内容解析ならびに検索技術の最近の動向 -TRECVIDを中心として-」佐藤真一教授(国立情報学研究所)


>3/8(火), 本会議第1日
A1:知識獲得   3月8日(火) 09:30-12:10 A1-101教室  座長: 岡崎直観 (東大)
A1-1 専門語彙を手がかりとした知識構成の展開ー生命科学分野を例にー
○浅石卓真, 影浦峡 (東大)
A1-3 Wikipediaの編集履歴を用いた書き換えパターンの抽出
○金山博, 荻野紫穂 (日本IBM)
A1-4 数式の網羅的な生成による新たな類似尺度の発見と評価
○皆川歩, 岡部正幸, 梅村恭司 (豊橋技科大)
A1-6 意味的類似度を用いたWeb文書からの集合拡張
○萩原正人, 関根聡 (楽天)

B1:Web応用   3月8日(火) 09:30-12:10 A2-101教室  座長: 吉岡真治 (北大)
B1-3 大規模Web情報分析のための分析対象ページの段階的選択
○赤峯享 (NICT/NAIST), 加藤義清, 川田拓也, レオン末松豊インティ (NICT), 河原大輔 (京大/NICT), 乾健太郎 (東北大/NICT), 黒橋禎夫 (京大/NICT)
B1-4 情報分析システムWISDOMのユーザ評価とその分析
○川田拓也 (NICT), 赤峯享 (NICT/NAIST), 河原大輔 (京大/NICT), 加藤義清 (NICT), 乾健太郎 (東北大/NICT), 黒橋禎夫 (京大/NICT), 木俵豊 (NICT)
B1-6 Web文書の時間・論理関係分析に基づく情報信頼性判断支援システムの開発と実証実験
○岡嶋穣, 河合剛巨, 中澤聡 (NEC), 村上浩司 (楽天), 松吉俊, 水野淳太 (NAIST), エリック・ニコルズ, 渡邉陽太郎, 乾健太郎 (東北大), 渋木英潔, 中野正寛, 宮崎林太郎, 石下円香, 森辰則 (横浜国大)

C1:テキスト・データマイニング   3月8日(火) 09:30-12:10 A1-201教室  座長: 新里圭司 (京大)
C1-2 全部分文字列のクラスタリングとその応用
○岡野原大輔 (PFI)
C1-3 類似論文からの関連用語抽出による論文検索支援システムの提案
○南浦佑介, 新美礼彦 (未来大)

D1:音声言語処理   3月8日(火) 09:30-12:10 A2-201教室  座長: 秋葉友良 (豊橋技科大)
D1-3 質問応答対の増加による精度低下及び速度低下を軽減する選択手法
○井上僚介, 黒澤義明, 目良和也, 竹澤寿幸 (広島市立大)

E1:評判・感情解析   3月8日(火) 09:30-12:10 A1-301教室  座長: 木村俊也 (mixi)
E1-3 評価文書分類における異言語翻訳データの利用法
○乾孝司, 山本幹雄 (筑波大)
E1-6 Web上の誹謗中傷を表す文の自動検出
○石坂達也, 山本和英 (長岡技科大)

F1:テーマセッション1: 複合辞とモダリティ:理論から応用まで   3月8日(火) 09:30-12:10 A2-301教室  座長: 泉朋子 (NTT)
F1-2 伝聞のモダリティと文法化
○金城由美子 (長崎純心大)
F1-6 代表・派生関係および用例を利用した日本語機能表現の解析
○鈴木敬文, 宇津呂武仁 (筑波大), 松吉俊 (NAIST), 土屋雅稔 (豊橋技科大)

P1:ポスター(1)   3月8日(火) 14:30-16:00 A棟ホール
P1-8 「本との出会い」を支援するシステム
○館野紅理奈, 浦谷則好 (工芸大)
P1-11 Blenderを用いた自然言語による3次元コンピュータグラフィックス
○中畑敦夫, 伊藤秀昭, 福本尚生, 和久屋寛, 古川達也 (佐賀大)
P1-12 意見の重要度と客観的補足情報を考慮したレビュー要約
○唯野良介, 嶋田和孝, 遠藤勉 (九工大)
P1-13 直接調停要約自動生成システムHERMeSの言論マップとの連携
○石下円香, 渋木英潔, 中野正寛, 宮崎林太郎, 永井隆広, 森辰則 (横浜国大)
P1-14 直接調停要約自動生成システムHERMeSの対比表現を用いた精度向上
○永井隆広, 渋木英潔, 中野正寛, 石下円香, 宮崎林太郎, 森辰則 (横浜国大)
P1-15 文外照応を含む文の検出による抽出型要約の品質向上
○西川仁, 長谷川隆明, 松尾義博, 菊井玄一郎 (NTT)
P1-16 テキストの内容を表す記述要素の自動生成手法の検討
○久保木武承, 山本和英 (長岡技科大)
P1-17 検索要求顕在化のための「喩え」の利用
○久保真哉, 桝井文人 (北見工大), 福本淳一 (立命館大)
P1-18 QAサイトにおける専門用語を用いた最適な回答者提示
○堀江将隆, 山本和英 (長岡技科大)
P1-20 研究者および研究分野の変遷の自動推定
○堀さな子, 村田真樹, 徳久雅人 (鳥取大), 馬青 (龍谷大)
P1-21 不具合事例からの因果関係抽出に向けた実体性のある名詞の抽出手法の検討
○大森信行, 森辰則 (横浜国大)
P1-23 修辞ユニット分析からみたQ&Aサイトの言語的特徴
○田中弥生, 佐野大樹 (国語研)
P1-24 回答の根拠を提示する意思決定支援型の質問応答システム
○佐々木智 (筑波大), 藤井敦 (東工大)
P1-25 Q&Aサイトの回答から取り出した質問に書くべき情報の特殊さの推定
○谷口祐亮, 小島正裕, 西村涼, 渡辺靖彦, 岡田至弘 (龍谷大)
P1-27 Web文書の時系列分析に基づく意見変化イベントの抽出
○河合剛巨, 岡嶋穣, 中澤聡 (NEC)
1-31 マイクロブログにおけるユーザのクラスタリングとそのクラスタの特徴語抽出
○畑本典宣, 黒澤義明, 目良和也, 竹澤寿幸 (広島市立大)

P2:ポスター(2)   3月8日(火) 16:30-18:00 A棟ホール
P2-3 機械学習を用いた表記選択の難易度推定
○小島正裕 (龍谷大), 村田真樹 (鳥取大), 南口卓哉, 渡辺靖彦 (龍谷大)
P2-7 日本語格解析において問題となり得る諸現象の定量的分析
○花岡洋輝, 松崎拓也 (東大), 宮尾祐介 (NII), 辻井潤一 (東大)
P2-23 公的文書に対する「やさしい日本語」換言辞書作成のための調査
○杢真奈見, 山本和英 (長岡技科大)


>3/9(水), 本会議第2日
A2:言語学(1)   3月9日(水) 09:00-11:50 A1-101教室  座長: 黒田航 (京工芸繊大/早大)
A2-6 語を構成単位としない統語論に向けて: パターン束モデルを用いた文構造記述の理論と応用
○吉川正人 (慶大/学振)

B2:テーマセッション4: Twitterと言語処理   3月9日(水) 09:00-11:50 A2-101教室  座長: 東中竜一郎 (NTT)
B2-2 マイクロブログの分析に基づくユーザの嗜好とタイミングを考慮した情報推薦手法の提案
○向井友宏, 黒澤義明, 目良和也, 竹澤寿幸 (広島市立大)
B2-3 Twitterからの個人の行動に起因するトラブル予測システムの試作
○隅田飛鳥, 服部元, 小野智弘 (KDDI)
B2-4 マイクロブログサービスの返信行動に着目した投稿及びユーザの分類
○黒澤義明, 竹澤寿幸 (広島市立大)
B2-6 Twitterにおけるつぶやきの関連性を考慮した改良相関ルール抽出による話題抽出
○鈴木啓太, 新美礼彦 (未来大)
パネル討論: Twitter情報を活用したサービスの現状と課題
パネリスト 大角知孝 (NTTコミュニケーションズ) ,岡野原大輔 (PFI),榊剛史(東大),辻村浩(沖電気),横田真俊(Twitter解説書著者),西谷智広(Twitter研究会)

C2:文書分類・要約   3月9日(水) 09:00-11:50 A1-201教室  座長: 高村大也 (東工大)
C2-2 WEB上の言語資源に基づく国会議員の分類
○東宏一, 橋本悠, 掛谷英紀 (筑波大)
C2-6 文書内の事象を対象にした潜在的トピック抽出手法の提案とその応用
○北島理沙, 小林一郎 (お茶大)
C2-7 直接調停要約自動生成システムHERMeSの実装と性能評価
○中野正寛, 渋木英潔, 宮崎林太郎, 石下円香, 永井隆広, 森辰則 (横浜国大)
C2-8 ラベル伝播による他言語資源の利用と転移学習を用いた重要文抽出システム
○天野禎章, 横山晶一 (山形大)

D2:情報抽出(1)   3月9日(水) 09:00-11:50 A2-201教室  座長: 関洋平 (筑波大)
D2-1 自動獲得した上位下位関係の詳細化
○山田一郎, 橋本力, 呉鍾勲, 鳥澤健太郎 (NICT), 黒田航 (京工繊大/早大), De Saeger Stijn, 土田正明, 風間淳一 (NICT)
D2-2 共起語グラフのクラスタリングによる単語の多義性抽出
○鏑木雄太, 古宮嘉那子, 小谷善行 (東京農工大)
D2-3 レビューからの商品比較表の自動生成
○相川直視 (早大), 山名早人 (早大/NII)
D2-4 複数文にまたがる関係抽出における構文情報の効果
○三浦康秀, 外池昌嗣, 大熊智子, 増市博 (富士ゼロックス), 篠原(山田)恵美子, 荒牧英治, 大江和彦 (東大)
D2-5 地方自治体の例規比較に用いる条文対応表の自動生成
○竹中要一 (阪大), 若尾岳志 (独協大)
D2-6 数式検索のための数式周辺テキストの言語解析手法
○横井啓介 (東大), Nghiem Minh (総研大), 松林優一郎 (NII), 相澤彰子 (東大)

E2:意味解析   3月9日(水) 09:00-11:50 A1-301教室  座長: 乾健太郎 (東北大)
E2-2 動詞と名詞の連想に基づいた換喩解析法の提案
○寺岡丈博, 岡本潤, 石崎俊 (慶大)
E2-4 段階的文脈拡張による多義性解消
○黒川勇輝, 新里圭司, 黒橋禎夫 (京大)

P3:ポスター(3)   3月9日(水) 16:30-18:00 A棟ホール
P3-4 語の共起を効率的に検索できる日本語作文支援システム「なつめ」の紹介
○阿辺川武 (NII), ホドシチェク・ボル, 仁科喜久子 (東工大)
P3-6 作文授業における引用技術習得を支援する手法の提案
○山口昌也 (国語研), 北村雅則 (名古屋学院大)
P3-7 作文支援システムを使った「引用」学習課題の導入と展開
○北村雅則 (名古屋学院大), 山口昌也 (国語研)
P3-8 短答式記述答案の採点支援ツールの開発と評価
○中島功滋 (ベネッセ/CRET)
P3-9 ホームページの多言語化に向けた機械翻訳とコミュニティによる後編集の活用
○相川孝子 (MSR), 井佐原均 (豊橋技科大)
P3-10 汎用アノテーションツールSlate
○Dain Kaplan, 飯田龍, 徳永健伸 (東工大)
P3-13 物語生成システムにおける物語言説機構の開発と評価
○秋元泰介, 小方孝 (岩手県立大)
P3-31 議論熟練者による話し合いの評価に影響を与える言語行動の分析
○水上悦雄 (NICT), 森本郁代 (関西学院大), 大塚裕子 (IBS), 鈴木佳奈 (広島国際大), 柏岡秀紀 (NICT)
P3-32 日本語フレームネットの全文テキストアノテーション: BCCWJへの意味フレーム名付与の試み
○小原京子 (慶大)


>3/10(木), 本会議第3日
A3:言語資源・コーパス   3月10日(木) 9:00-11:50 A1-101教室  座長: 河原大輔 (京大)
A3-2 語彙概念構造による意味役割の形式化と複数役割の割り当て
○松林優一郎, 宮尾祐介, 相澤彰子 (NII)

B3:生成・言い換え   3月10日(木) 9:00-11:50 A2-101教室  座長: 藤田篤 (未来大)
B3-2 発表スライドの構造的・言語的解釈に基づく発話生成
○荒井翔真, 柴田知秀, 黒橋禎夫 (京大)
B3-5 Web上の定義文からの言い換え知識獲得
○橋本力, 鳥澤健太郎, De Saeger, Stijn , 風間淳一 (NICT), 黒橋禎夫 (京大)

C3:情報抽出(2)   3月10日(木) 9:00-11:50 A1-201教室  座長: 風間淳一 (NICT)
C3-2 書評利用のレコメンデーションを目的とする書評検索システムのためのキーワード抽出
○越本和季, 酒井浩之, 増山繁 (豊橋技科大)
C3-8 L1正則化特徴選択に基づく大規模データ・特徴集合に適した半教師あり学習
○鈴木潤, 磯崎秀樹, 永田昌明 (NTT)

D3:機械翻訳(1)   3月10日(木) 9:00-11:50 A2-201教室  座長: 磯崎秀樹 (NTT)
D3-1 階層的モデルを用いた機械翻訳のためのフレーズアライメント
○Neubig, Graham (京大/NICT), 渡辺太郎, 隅田英一郎 (NICT), 森信介, 河原達也 (京大)
D3-4 A Term Translation System Using Hierarchical Phrases and Morphemes
○呉先超, 辻井潤一 (東大)
D3-8 文書文脈を用いた翻訳精度、速度の改善
○大西貴士, 内山将夫, 隅田英一郎 (NICT)

E3:テーマセッション2: 不自然言語処理 枠に収まらない言語表現の処理(1)   3月10日(木) 9:00-11:50 A1-301教室  座長: 村上浩司 (楽天)
E3-3 「不自然言語処理コンテスト」第1回開催報告
○萩原正人 (楽天), 大原一輝 (フリー), 水野貴明 (バイドゥ), 橋本泰一 (東工大), 荒牧英治 (東大), 竹迫良範 (サイボウズ)
E3-4 ウェブからの疾病情報の大規模かつ即時的な抽出手法
○荒牧英治 (東大), 森田瑞樹 (医薬基盤研究所), 篠原(山田)恵美子, 岡瑞起 (東大)
E3-5 データ圧縮率を用いるテキストアート抽出法におけるテキストの正規化手法
○鈴木徹也 (芝浦工大)
E3-6 感情推定における若者言葉の影響
○松本和幸, 任福継 (徳島大)
E3-7 教師付き外れ値検出による新語義の発見
○新納浩幸, 佐々木稔 (茨城大)
E3-8 定型から逸脱した言語表現の分析
○土屋智行 (京大/学振)

F3:情報検索   3月10日(木) 9:00-11:50 A2-301教室  座長: 鶴岡慶雅 (JAIST)
F3-3 特許の先行技術調査における集合知の循環
○橋田浩一 (産総研), 藤井敦, 岩山真, 橋本泰一 (東工大), 乾孝司 (筑波大), 難波英嗣 (広島市立大)
F3-7 Toward Evidence Search
○Nichols, Eric (東北大), Mizuno, Junta (NAIST), Watanabe, Yotaro, Inui, Kentaro (東北大)
F3-8 共著者ネットワークによる書誌検索の高度化
○野本忠司 (国文研)

A4:語彙・辞書   3月10日(木) 13:00-15:30 A1-101教室  座長: 影浦峡 (東大)
A4-5 オノマトペを言い換える表現の自動収集
○古武泰樹, 佐藤理史, 駒谷和範 (名大)
A4-6 Wikipediaからの大規模な汎用オントロジー構築
○柴木優美 (長岡技科大), 永田昌明 (NTT), 山本和英 (長岡技科大)

B4:対話・文脈処理   3月10日(木) 13:00-15:30 A2-101教室  座長: 駒谷和範 (名大)
B4-1 POMDPを用いた聞き役対話システムの対話制御
○目黒豊美, 東中竜一郎, 南泰浩, 堂坂浩二 (NTT)
B4-2 対話型e-Learningシステムの開発
○峯脇さやか (弓削商船高専), 嶋田和孝, 遠藤勉 (九工大)
B4-3 共通状態と連結学習を用いたHMMによるコールセンタ対話の要約
○東中竜一郎, 南泰浩, 西川仁, 堂坂浩二, 目黒豊美, 小橋川哲, 政瀧浩和, 吉岡理, 高橋敏, 菊井玄一郎 (NTT)
B4-4 コールメモを利用したコールセンタ向け音声対話要約方式の提案
○田村晃裕, 石川開 (NEC)
B4-5 Toward Plan Recognition in Discourse Using Large-Scale Lexical Resources
○Naoya Inoue (東北大/学振), Kentaro Inui (東北大)
B4-6 視線情報を利用した協調作業対話における参照解析
○安原正晃, 飯田龍, 徳永健伸 (東工大)
B4-7 直接照応解析における分野情報および文脈情報の有効性検証
○浜田伸一郎, 齋藤佳美 (東芝ソリューション)

C4:テーマセッション3: 日本語入力における言語処理(1)   3月10日(木) 13:00-15:30 A1-201教室  座長: 鈴木久美 (MSR)
C4-1 病理診断報告書作成のためのオントロジーを利用したテキスト入力支援
○橋本泰一 (東工大), Tam, Wailok (東大), 鷹合基行 (富士ゼロックス), 荒牧英治, 宇於崎宏 (東大), 橋田浩一 (産総研)
C4-5 大規模日本語ブログコーパスにおける言語モデルの構築と評価
○奥野陽, 颯々野学 (ヤフー)

D4:機械翻訳(2)   3月10日(木) 13:00-15:30 A2-201教室  座長: 隅田英一郎 (NICT)
D4-3 二部グラフ上のランダムウォークによる言語横断関連語の抽出手法
○ルディー・レイモンド, 坪井祐太 (日本IBM), 張耀中 (東大), 那須川哲哉 (日本IBM)
D4-4 構造を持った定型表現の自動獲得と機械翻訳での利用
○望月道章, 中澤敏明, 黒橋禎夫 (京大)

E4:テーマセッション2: 不自然言語処理 枠に収まらない言語表現の処理(2)   3月10日(木) 13:00-15:30 A1-301教室  座長: 荒牧英治 (東大)
E4-1 テキストに基づく違法有害記事の削除作業支援方式
○笠原要, 藤野昭典, 永田昌明 (NTT)
E4-4 Web上の多彩な言語表現バリエーションに対応した頑健な形態素解析
勝木健太 (京大), 笹野遼平 (東工大), ○河原大輔, 黒橋禎夫 (京大)
E4-5 大規模添削コーパスを用いた統計的機械翻訳手法による日本語誤り訂正
○水本智也, 小町守, 松本裕治 (NAIST)
E4-7 分布類似度判定における文脈の特徴量の比較と評価法に関する研究
○増山篤志, 梅村恭司, 岡部正幸 (豊橋技科大)

F4:言語学(2)   3月10日(木) 13:00-15:30 A2-301教室  座長: 小磯花絵 (国語研)
F4-4 比喩表現に属性が明示された場合の比喩性に与える影響とコンピュータモデルの検討
○田添丈博 (鈴鹿高専), 椎野努 (愛工大)

A5:教育応用   3月10日(木) 15:50-18:20 A1-101教室  座長: 田中久美子 (東大)
A5-1 学習指導要領に立脚した児童作文自動点検システムの実現
○藤田彬, 田村直良 (横浜国大)
A5-3 翻訳教育向け「みんなの翻訳」
○影浦峡 (東大), Thomas, Martin (Leeds大), 阿辺川武 (NII), 内山将夫, 隅田英一郎 (NICT), Hartley, Anthony (Leeds大)

B5:構文解析   3月10日(木) 15:50-18:20 A2-101教室  座長: 渡邉陽太郎 (東北大)
B5-4 木構造に基づく決定的係り受け解析
○北川浩太郎, 田中久美子 (東大)
B5-6 ベイズ学習による木接合文法獲得
○進藤裕之, 藤野昭典, 永田昌明 (NTT)

C5:テーマセッション3: 日本語入力における言語処理(2)   3月10日(木) 15:50-18:20 A1-201教室  座長: 工藤拓 (グーグル)
C5-4 頻出文脈に基づく分野依存入力支援
○海野裕也, 坪井祐太 (日本IBM)

E5:テーマセッション2: 不自然言語処理 枠に収まらない言語表現の処理(3)   3月10日(木) 15:50-18:20 A1-301教室  座長: 竹迫良範 (サイボウズ)
E5-1 並列疑似エラー補正法に基づく「破格」な言語表現の(疑似)解釈
○黒田航 (京工繊大/早大)
E5-2 誤字脱字や伏字を許容する近似辞書照合技術
○齋藤邦子, 今村賢治, 松尾義博, 菊井玄一郎 (NTT)
E5-3 評判情報の検索における隠語の生成と順位付け
○太田裕貴, 藤井敦 (東工大)


>3/11(金), 併設ワークショップ
ワークショップ: 「自然言語処理における企業と大学と学生の関係」
ホームページ: http://nlp.cs.nyu.edu/gengo2011ws

ウェブ学会シンポジウム@東京大学 本郷キャンパス 安田講堂

土曜日, 12月 19th, 2009

ウェブ学会シンポジウム

東大構内

ウェブ学会シンポジウム

ウェブ学会シンポジウムの様子は上記リンクを参照ください。
twitterふぁぼったーでハッシュタグ webgakkai で検索すると、その後の様子もちらほら見れますね。

一種のお祭り的なイベントでしたが、参加することで体感できたこともあり、大変有意義なシンポジウムでした!


マトンマサラカレー&ゴマナン@ネパール・インド料理ナマステ タンメン&焼き餃子@歓迎本店

ネパール・インド料理ナマステ(マトンマサラカレー&ゴマナン)
歓迎本店(タンメン&焼き餃子)

カレーは本郷駅近くの適当なお店に入ったのですが、旨い。
適当に歩いて美味しいカレー屋が見つかるのはうらやましい環境だよね。

餃子は、蒲田駅近くにある歓迎本店。
小龍包チックにスープが種に入っていて、グッド!

その他食べてきたものリスト:
(観光/お食事) カボチャほうとう@小作、信玄公巡り
(お食事) 甲州ワインビーフ@甲府湯村温泉郷・楽水園
(お食事) トマトラーメン@太陽のトマト麺

(FAN2009) day3: 塔のへつり、大内宿、鶴ヶ城、ベトナムフェスティバル

土曜日, 9月 19th, 2009

出張三日目。学会そのものは昨日で終わりです。

今日帰るつもりだったのですが、シルバーウィークとかいうものに気づかず、航空便を手配し始めた頃には復路便が既に埋まっていました。
時間をずらすと取れそうな便もあったのですが、値段設定が高かった(宿泊&食事費込みにしても)ので、丸一日ずらして明日帰ることに。

折角1日使える時間が増えたので、学会側で用意していた1日ツアーに行って来ました。
旅行代理店にお任せで用意してもらったようですが、それでも昼食代1500円しか取らずに6時間程で3カ所回るツアー用意するってすごい。
すごいけど、やっぱりこういう団体ツアーになるとゆっくりできないですね。


塔のへつり
塔のへつり

塔のへつり 栗入り揚げ饅頭

塔のへつり
http://www.ookawaso.co.jp/sightseeing/heturi.html

風化で変わった削られ方をした岸壁。川面に映り込む風景。めっさ大きい鮒?っぽい魚。
それ以上でもそれ以下でもないw
空気の良さは格別!
リンク先見ると、紅葉か雪のある時期に周りの景色見学も兼ねるのが良さそうですね。
薄皮の揚げ饅頭(栗入り)はそれなりに美味しかったです。


大内宿(おおうちじゅく)
大内宿

大内宿 大内宿 大内宿 大内宿

大内宿(おおうちじゅく)
http://www.fukutabi.net/fuku/oouti.html

味処みなとや(手打ち蕎麦)
http://oouchi-minatoya.com/

1/1スケールジオラマ。
近くで蕎麦の花畑も見れたのですが、タイミングが良ければここだけでしか見れないピンクの花も見れるらしい。
そんなに規模は大きく無いですが、見渡せる範囲ぐらいには広がっているし、それなりに良く出来てるんじゃないかと。

宿場町として栄えていた頃の料理を出してるお店もあるし、何よりお蕎麦が尋常じゃないぐらいウマかった(少なくとも私の中ではダントツで過去ベスト)ので、機会があるならぜひとも立ち寄りたい場所になりました。

竹串に刺さってる大きなつくねっぽいやつは「しんごろう」と呼ばれていて、硬めに炊いたご飯を半分潰し、胡麻風味?のするじゅうねん味噌を塗って炭火焼したもの。宿場町な頃に良く食べられてたらしい。香ばしさが素晴らしいです。

豆腐もおいしかったけど、豆が美味しいのか作り方がウマいのかは良くわからず。甘納豆なお土産があったから豆がうまいのかもしれないけど。
同じ味を味わえるとは思えないけど、折角なので生蕎麦をお土産に購入。
ついでにお茶も美味しかったのでゲット。

ガイドさんの話によると、国内では珍しく薬用人参の産地で重宝されてたとか、あまり有名じゃないけど実は皇室で喜ばれている身不知柿(みしらず柿)の産地だとか、いろいろ面白い場所のようです。


鶴ヶ城
鶴ヶ城

鏑矢on鶴ヶ城

鶴ヶ城
http://www.tsurugajo.com/turugajo/shiro-top.html

歴史に疎いので館内展示物も楽しみにしてたのですが、全然そんなの見てる時間無し。
仕方ないので天守閣まで登って適当に風景写真は撮りましたが。
短時間であれこれ巡ろうツアーだったから仕方が無い。
ちょっと変わってたのが、鏑矢っぽいのを屋根上から何本か射ってました。
天地人?だか一色ムードになってたので、それ関係なのかなー。


ベトナムフェスティバル@代々木公園

ベトナムフェスティバル

ベトナムフェスティバル ベトナムコーヒー@TRUNG NGUYEN チキンココナッツカレー サンプラザ中野onベトナムフェスティバル カネムクロック(ココナッツ饅頭ぽいもの)

ベトナムフェスティバル@代々木公園
http://www.vietnamfes.jp/

東京に戻って来て、夕食のためベトナムフェスに参戦。
ココナッツチキンカレー、カネムクロック(ココナッツ饅頭ぽいもの)、ベトナムコーヒーを堪能して満足!
サンプラザ中野さんが「去年参加させてもらった時にベトナム行くって行きましたけど、まだ行ってませーーん!ごめんなさーーい!」とか絶叫してましたw

(FAN2009) day2: 学会@会津大学、打ち上げ

金曜日, 9月 18th, 2009

キーノートスピーチ

学会二日目。FAN2009の最終日になります。


FAN2009(二日目)に聴講した中で面白げな発表

流石に昨日の夕方まっすぐにホテルまで戻れただけあって、今朝も迷わずに大学に付けました。
駅から30-40分ぐらいの距離なので、そこそこ良い運動になります。そんなことしてるからか、ジャケットは全く必要ありません。沖縄と同じ格好でも問題無いです。

  • [B4-2] 協調フィルタリングに基づく推薦システムにおける類似度の最適性に関する検証
  • ユーザ間類似度を適当な相関係数で見積もってそれで済ますことが多いが、それをPSO(Particle Swarm Optimization) で最適化すると類似度そのものの精度が改善。
    これは、(例えば)ピアソン相関係数使ってしまうと評価傾向が異なるユーザ同士であっても正の相関が高いと判定してしまうケースがあるから。

  • [B4-3] 創発特性を利用した自己位置推定
  • 時間的幾何的規則性を利用して位置推定。
    RoboCup での利用を想定しているが、従来法ではロボット数が増えるについれ計算量が増え過ぎたり精度が低くなったりする。これを計算量少なく&精度高く&ロボット数が増えても高精度を保って位置推定が可能。
    問題は、位置推定のために特定の行動に縛られてしまうことだが、適材適所に行動ルールを選択するなどである程度解決できるんじゃないか。

  • [B4-4] 待ち行列理論を用いた発言頻度の規則性からの電子フォーラムのコミュニティサイズ推定
  • Preferential Attachmentに基づくモデル化。
    待ち行列を用いた推定で、通常ROM数は管理者などしかカウントできないし、アクセスログには異なる要因のアクセスが多く含まれるようになって来たため単純には計測できない。
    だけど、ジップの法則をモデルに組み込むことでそれなりに推定できるよという話。実際には掲示板モデルを構築したりいろいろ工夫してあります。

  • [E5-1] 共起情報を用いたWeb ページを特徴付けるメタデータ生成方式の検討と検索への応用
  • 関連度の高いメタデータを自動生成することで、直接ページ内に記載されていない単語を使っても検索できるようにしたい。
    実応用に関連して役立つ指摘貰えて良かったね!

  • [E5-2] 感性表現の異なる舞踊動作を用いた注視情報の比較
  • 初心者(初学者)がどこを注視しがちなのかを解析することで、教示に役立てたい。

  • [E5-3] 強化学習の並列化を用いたモジュール型ロボットの制御
  • NNよりも高速で質の高い制御ルールを自動学習できるようになった。
    タイリングだったか、Q-learningでの状態Sの表現を工夫するヤツと比較してどうなのかにちょっと興味があります。

  • [E5-4] 物理モデリングを用いた映像コンテンツのための効果音生成ツールの開発
  • 実際に音をつくろうとするとコストが高いので、低コストで使える音を作りたい。
    だけど完全な物理シミュレーションをやろうとすると計算コストが高いし、モデルを作ることそのものも結構大変、パラメータチューニングも大変、といろいろ問題点も見えてきた。

  • [E6-1] 図案式簡易モーションキャプチャを用いた人間の上半身姿勢の取得に関する基礎研究
  • やりたいことは面白いと思うのだけど、トラッキングしない(できない?)理由が未だに良くわかっていません。

  • [E6-2] 画像認識によるリアルタイム生成画像を用いたデジタルサイネージの開発
  • 人とのインタラクションを加味した広告モデルを作りたい。
    いくつか仮定を導入することで低計算コストでリアルタイムな処理が可能。

  • [E6-3] マン・マシンインタフェースの応用を目的とした単眼カメラによる手指形状推定
  • シンプルな2D推定だと精度が低い。3D推定だと計算コストが高くて十分な処理速度を得られない。だから2D推定ベースで精度の高い推定を目指した。
    高次局所相関特徴を利用することで、高い精度でバリュー価格なノートPCでも十分な処理速度を実現。

  • [E6-4] 拡張現実感を用いた情報提示システムの開発
  • 失語症患者に対する言語療法にあると便利なシステムを実現したい。
    試作したデバイスは、ノートPCに2台カメラを付けて、1台は手元を撮影してジェスチャ認識。もう1台はヒントを得たい物体を撮影して物体認識。
    このデバイスにより、クライアント自身が能動的に物体を投影して段階的にヒントを得ながら単語を思い出すというリハビリを行えるようになるのではないか。


喜多方ラーメン@学食
喜多方ラーメン

会津大学内の学食にて塩ラーメンを食べました。
もちもちした触感の太麺で、美味しかった!
このあたりのラーメンだとそれが標準なんですかね。


打ち上げ@やるき茶屋
いもキノコ鍋

刺身盛り合わせ 鶴ヶ城天守閣再建50周年記念ビール サラダ 脂身の多い焼き鳥 オードブル ピザ 太巻き デザート

やるき茶屋
http://r.gnavi.co.jp/t271300/

学生ら&沖大の小渡先生(ごちそうさまでした!)と打ち上がりました!
飲み放題2時間込みの「9月限定!秋のいも煮コース!」とかいうやつです。
メインに掲げている「いもキノコ鍋」は予想外にあっさり風味で美味しい。
(揚げ物が多い)味の濃い/油っこい料理を食べ進めるための口休めとしても良かったです。
3500円のコースでしたが、ピザ&太巻き(エビのすり身を使った薄皮で巻いたものらしい)&焼き鳥(殆ど脂身)&日替わりデザートは要らなかったので、3000円のコースが良かったかも。オードブルも要らないけどw
料理別料金+2000円ぐらいで飲み放題付けられれば良さげなんだけど、なかなかそうもいかないらしい。

(FAN2009) day1: 学会@会津大学

木曜日, 9月 17th, 2009

会津大学

学会一日目。FAN2009の初日になります。


会津若松駅→会津大学(のつもり)
ココドコジャー

朝一のキーノートスピーチ(ユビキタス云々)は聞くつもり無かったので、会津若松駅(の近くにあるホテル)から会津大学まで徒歩で行くことに。

国道に出ればほぼ1本道で到着するという楽勝なコースだったんですが、肝心の大通りにいつまでたっても出会えず、30分以上彷徨ってました。
線路沿いに行けば交差するはずってことでなるべく線路を離れないように歩いていたのですが、気がつけば隣駅の七日町駅に到着。
目的地は180度反対ですよorz~
大きく間違わないように一度ナビウォークで会津大学の方向を確認していたのですが、何故か「会津大学」で検索した時に見つかってた場所が「会津大塩」になってました。お前(メタデータ設定ミス?)のせいか!(涙)


ソースカツ丼@月見亭
ソースカツ丼

ソースカツ丼 ソースカツ丼

月見亭
http://www.aizu-tv.com/tarouclub/2008/05/post-1172.html

学生情報によると、何やら会津はソースカツ丼にゆかりのある地らしい。
ググってみると、伝統会津ソースカツ丼の会(http://aizu-katudon.com/)なんてのもありました。
取りあえず大学近くの場所で見つかった月見亭で食べて来たんですが、普通に揚げたてのカツなのでウマかったw


愛のエビワンタンラーメン@喜多方ラーメン 来夢
愛のエビワンタンラーメン

愛のエビワンタンラーメン 愛のエビワンタンラーメン

喜多方ラーメン 来夢
http://www.umai-kitakata.co.jp/

喜多方駅周辺で食べようと思ってたお店は(朝の)7:30-15:00という奇天烈な営業時間だったため、諦めて学会近場で食べました。
太めの縮れ麺で、もちもちしててウマー!


FAN2009で聴講した中で面白げな発表
  • [F1-1] Applying Naive Bayes classifier to Document Clustering
  • 冒頭で教師信号を作るとか喋ってたのですが、実際には教師信号ありで、k-means よりも高速かつ精度の良いクラスタリング手法の提案、という話でした。

  • [F1-2] Using Rough Set Theorem and SVM Analysis to Enhance of Intrusion Detection System in MANET
  • IDSにおけるアタック特徴を学習するという話で、従来手法だと特徴量が多い割に精度がそれほど高く無い。ラフ集合論で特徴量削減すると共に制度が改善されたらしい。だけど、話聞いてる限りでは「問題設計をうまくやりすぎ」て、取り扱いやすいようにコンフィグレーションしてるように見えました。
    肝心のラフ集合の自動生成に付いては良くわからなかったのが残念。後で原稿なり別資料なりで勉強しよう。

  • [F1-3] A SOM based Approach for Learning from Imbalanced Data Sets
  • バランスの取れてないデータ集合で学習すると、特徴的なんだけどレアなデータというのが無視されがち。
    サンプリングを工夫するアプローチがいろいろ提案されてるが、今の所上手くいっていない(デメリットが大きい)。
    SOMするとなかなか良い結果が得られたそうな。
    って、適当なクラスタリングを一度噛ませば良いって話なんだろうか。

  • [A2-1] 対戦型ゲームのための階層型ファジィART学習システム
  • 学習度合いに応じて段階的に状態空間を構成するらしい。
    階層の深さの増やし方、幅の増やし方は工夫の余地がありありですが、似たような話はいろいろありそう。

  • [E3-1] 構造均衡化に基づく逐次ユーザ・アイテム近傍抽出による協調フィルタリング
  • バランスを評価基準に入れる事であれこれできるって話らしいのだけど、いまいち有り難みが良くわからなかった。
    応用先次第で面白くなりそう。

  • [E3-3] テキストデータからの認知均衡に基づいた概念グラフの生成
  • これもバランスの話なんだけど、ちょっと飛躍が多過ぎて良くわからなかった。

  • [E3-4] 区間効率値を用いた事業体の順序付け
  • 多入力多出力システムを持つ事業体(DMU: Decision Making Unit) のパフォーマンスを図る手法をDEA: Data Envelopment Analysis と呼ぶ。
    DEAは相対比較による評価だけど、そのままでは半順序のため全体としてどういう順番なのかが分かり難い。
    だから、max/min な評価を組み合わせて一つの全順序にしましょう、という話。