Archive for the ‘学会’ Category

情報処理学会 第81回全国大会 day3

土曜日, 3月 16th, 2019

今日が全国大会最終日。IPSJ-ONEは学生に譲って、情報システムと社会環境(2)レビューとプログラム解析・修正に参加してきました。


[ 6K-02 対話ボットをベースとした行政と市民の新たなコミュニケーションチャネルの構築 ]

 予め用意したFAQをベースに、チャットボット対応するという話。法整備に伴う変更とかでちょくちょくFAQの内容が変わるので、変更のしやすさも考慮してる(Excel対応、、)らしい。対応がうまくいってるかを人が確認しつつ、必要に応じて不足FAQ整備するとかしてるとのこと。
 個人的には「文書からFAQを自動生成する」「矛盾探し」「常識(出身地毎の常識等)の違い探しに基づいたFAQ生成」みたいなことに興味あるかな。


[ 7N-02 コードレビューにおいて検出可能なプログラム課題の分析 ]
 コードレビューするのは量が増えると大変、レビューを受けてコード修正する側も「求められている修正」が良くわからない場合には大変、それらのコストを削減したいという話。システマチックにやれるところ(パーサーとか)はやるとして、そこ以外を対象にしようとしているようなんだけど、まだまだ難しそう。


[ 7N-03 ソースコード修正履歴を用いた自動バグ修正手法の性能理解 ]
 テスト自体を自動生成するという話もあるし、用意されたテストに対して「テストを通すようなパッチを自動生成する」という話もあるのだけど、今回はその後者をやってて結果としては「パッチ生成がうまくいかないケースは、テスト自体の質が良くないことが多い」という話らしい。人工知能でいうところの常識とか文脈とかのメタ情報をうまく組み込むことができればよいのかしら。


[ 7N-06 イベント駆動型アプリケーション開発のためのAPI使用パターンに関する対話型検索を支援するグラフベース視覚化ツールの検討 ]
 今日一番面白かった発表。APIリファレンスはあるけどそれをどう使うか。大抵は「組み合わせ」が重要で、それはコード例(実コード)を見た方が良いことが多い。が、それを上手く探す方法がないということで、APIの頻度パターンマイニングから包含関係まで抽出して、実コード例まで辿れるようなツールを試作してみたという話。一般的には asset search とか asset navigation と呼ばれるタスクらしい。

情報処理学会 第81回全国大会 day2

金曜日, 3月 15th, 2019

2日目は画像編集/GAN学習支援システム(2)に参加してきました。


[ 4R-02 アニメ画像を対象にした複数のスタイル画像を用いる画風変換の検討 ]

 NAL研M1西山くん発表。前回よりも質問コメント多く貰えてたので、目の付け所は面白いのだろうと思います。主な質問は以下の通り。
 Q: 変換結果良さそうに見えるが、数値的な評価は?
 Q: before/afterが見たい。どれぐらいアウトプットが変わるのか。例えば空だけを入れた場合にどうなる?
 Q: 4パッチ作る時のスタイル画像の位置によってアウトプットのイメージが変わる?
 Q: 従来手法の枠組み内で解こうとしているが、中身に手を入れる方が良いのでは? 例えば1枚入れて変換して、良くない場所は再変換or別変換するとかカスケード処理にするとか。


[ 4R-04 Deep Learning向けData Augmentationの評価手法の提案-Fréchet Inception Distanceに基づく方法- ]

 個人的に今日一番面白かった発表。機械学習する際にデータ不足やバランスの悪さがネックで学習が上手くいかないことが多々あります。これに対する一つのアプローチが「データ拡張」なんですが、拡張方法が多数提案されていること自体はともかく、どういうタスクにおいてどういう手法が向いているかも「やってみないとわからない」。そこをなんとかしたいという切り口で、「学習する前に拡張方法の良し悪しを見積もれないか」ということでFréchet Inception Distanceに基づいた検証を行ってみたという話。
 今回やってみた範囲内では比較的良好(かなり相関が高い)な結果が得られてるらしいけど、そもそものサンプル数が少ないケースでは過学習しそうなアプローチなんだよな。でも考え方はとても好きです。


[ 4R-07 Pix2Pixを用いた古典籍くずし字画像の裏抜け除去 ]

 今日2番目に好きな発表。「文字の芸術的品質とは何か?」という疑問に対して「主観的でわからないなら機械学習したら良いじゃない」的な考え方で取り組んだという話。
 実際問題として、データの与え方やモデルに依存する部分はあるとしても、一定程度の「芸術的品質」を抽出することはできるのだと思います。一つ一つの作品だけでもなく、同年代他作品との比較や、古い作品との比較から「何に影響を受けているか」とかもある程度は見積もれるようになるじゃないかな。それを人間が理解できる形で説明して欲しいよね。


[ 5ZH-05 ゼミ議事録と研究成果物の蓄積と利用の支援システムの開発 ]
 同じことやりたいと思ってて聞いてみたのですが、記録、特にメタデータの部分は人手で作成しているらしい。そこ自動化したいんだけどな。ある程度蓄積した後で自動化目指せば良いというスタンスなのかもしれないし、そこは自動化すべきではない(その過程自体に学びなどの効果がある)というスタンスかもしれないですが。
 ゼミに限らず「小さなコミュニティ」でありがちですが、「その場で通じる略語等の特殊な単語」というのがかなりあって。その辺りはword2vecとかと相性悪そうなんですが、一度wikipediaなりで学習済みモデルをベース+固定にして、層追加学習するだけでもなんとかなるのかしら。

情報処理学会 第81回全国大会 day1

木曜日, 3月 14th, 2019

今日から3日間福岡大学で情報処理学会全国大会。寒い時期の本土は、場所によっては暖房効き過ぎや室内外での寒暖差で気持ち悪くなることあるのがネックだな。

学会発表に限らないけど、外部で自分の機器持ち込む場合には要接続チェック。自分の番になってからうまくいかずにオロオロしてる人多かったな。

1日目はラーニングアナリティクスラーニングアナリティクスの2セッションに参加。どちらも教育に絡めた何かしらのデータ分析をしてる研究。身体や脳活動の計測、誰と誰が向き合ってるか、どのぐらい発話してるかといった様々なセンサ情報を組み合わせてログ分析し、より効果的な学びや反省に活用するとか。そういう話。

個人的に面白かったのは以下の2件。

[ 1ZF-02 プログラミング思考過程に基づくプログラミング時の行動分析と傾向 ]
 ジグソー・コードというタスクがあるらしい。設問と共に「行順番がランダムに入れ替えた正解コード」を用意して、入れ替えだけで正解コードに辿り着くタスク。この際の操作順番や回数、時間等を記録しておき、分析することで「プログラミング思考過程」をしたいということらしい。
 個人的には思考過程とは別のパズル要素が入ってる点と、このパズルを解けることとプログラミングスキルとの間にどのぐらい相関あるのか(高そうだけど)と、抜け落ちてる部分がどこか、が気になるかな。逆に言えば一部の過程は見れているはずで、そういう問題に落とし込んでる点は面白い。

[ 2H-02 プログラミング授業のための可視化システムと初学者の学習分析 ]
 paiza/progateみたいに「サーバ実行環境」用意することで、「どういう風にコードを編集していったか、実行しようとしたか、エラーを出したか」を可視化しやすくするしたという話。授業中はダッシュボード的に全員のログ解析してるので、同じエラーが重複しまくってたら「あ、補足し忘れてた」と教員が気づきやすいとか。用意した課題のどの辺りまで進んでるか俯瞰しやすいとか。
 自動採点はユニットテスト/Jenkins的にやればとも思うのだけど、微妙な違いは吸収したいらしく、クラスタリングベースでやってみてるらしい。

IPSJ80, day3

木曜日, 3月 15th, 2018

最終日は一般セッションというか学生セッション(自然言語処理)に参加してました。IPSJ-ONEは学生に参加して欲しいので見送ることに。ちなみに日程的に丸かぶりなタイミングで言語処理学会の年次大会が開催されてるのですが、ブッキングしつつも情報処理学会側に一般セッション1件+学生セッション6件もあるってすごいな。


学生セッション 自然言語処理(4)

[ セッション概要 ]

神谷さん発表にも2名から真っ当な質問貰えたので、それなりに面白い&妥当なやり方になってるらしい。お疲れ様でした。

個人的に面白かったのは、、

辞書を用いたクラスタリングとその多重ラベル付け。データの一部を捨ててでも良いから「密度の高い部分をクラスタにする。密度が低い部分は捨てる」というスタンスの、DBSCANベースのクラスタリングをしてみたという話。それと、WordNetのsynsetで表現することで、語義曖昧性を解消するという話もありました。

確率的TF-IDFを用いた特徴語抽出と文書検索。SNSのように「文書サイズが小さく、更新頻度が高く、正確でない語彙もそれなりにある」ケースでの利用を想定しているとのことで、通常のTF-IDFだと、IDFが文書数増える度に計算し直す必要があるし、語彙が正確でないのでTFも計算しにくい。そこでTFをMAP推定し、それに基づいてIDFを推定してみたとのこと。TwitterみたいなケースでIDFが効果的かはおいといて、着眼点は面白い。

Wikipediaからの技術やサービス間の関係抽出。上位下位関係とか同義語を抽出したいのではなく、ある概念の使用例(Bag-of-Wordsが文書分類に使われるとか)や、その反対の関係を自動抽出したいという話。ざっくりと手動テンプレートで抽出した後、SVMでフィルタリング。まだまだノイズ多いし、多分抽出漏れも多数あるのだろうけど、ある程度抽出できてるらしい。一方で、instanceとsubclassとを区別したいのだったか、ちょっとそこは定義自体が曖昧じゃないのという部分もあり。

議論スキル向上のための発言の自動評価とその効果的なフィードバック。実際の討論中に「相手を評価する」というのはとてもコストが高い。そこで機械的に評価できる部分だけでも自動化しようぜという試み。また、評価に基づいた自動レビューというかフィードバック(どこそこが悪いのでここに気をつけようとか)も自動生成してて、出し方にも工夫してみたとのこと。


学生セッション 自然言語処理(6)

[ セッション概要 ]

個人的に面白かったのは、、、

ユーザモデルにもとづいて発言タイミングを決定するプレディクティブチャットボット。人間同士の対話では、実際には真面目に聞いてないけど相槌を打つ等、様々な状況下で「本当とは異なる発話」をしていることがある。それを推定したいという話。一種の嘘発見器みたいな話にも近そうだけど、やりたいことは推定できるようにした結果をチャットボットに活用したいらしい。

人物ベースの Seq2Seq モデルを用いた対話システム Deep EVE における小説中の登場人物らしい応答文の生成。「ホームズのように喋らせる」のように、ある物語に出てくる登場人物のように喋らせたいというのが目標。人物毎にコーパス用意してseq2seqで発話文生成してるらしいけど、単に文章入力するだけじゃなくて語義的な意味も活用することで未知語への対応も狙ってるらしい。ただ、コーパス5万文では全く足りてないらしい。ひー。

IPSJ80, day2

水曜日, 3月 14th, 2018

High Sierraになってからか、モニタの輝度自動調整がONになってて気持ち悪いのでOFFに。以前もそうしてたのがONに戻ったのか、OSアップグレード後の調子がよろしくないのかは思い出せず。

IPSJ2日目は、ビッグデータ解析実証実験(イベント企画)と一般セッションに参加してました。


実社会ビッグデータ利活用のためのデータ統合・解析技術の研究開発

[ セッション概要 ]

実社会データを統合・解析するというということで、実例6件の講演+パネル討論という流れ。統合・解析するプラットフォームがEclipse経由(?)でも提供されてるらしい。あちこちでビッグデータ解析やられてるけど、それらを横断した解析が重要だということで、そのためのオープンなプラットフォームが重要だという話。

個人的には、スマートシティ(スマートライフ)は、目的関数の設計どうしてるかが気になる。表情認識と組み合わせてsmart adsとか言われても、気持ちは理解できるけど、うーん。広告自体は良いけど、広告流すこと自体が主目的になってるというか「これは嫌だ」とわざわざ反応し続けてやっても対応する気がない某Twitter Japan広告とか考えると、何だかんだと顧客のことは二の次だというスタンスが抜けきれないのだよな。スキーやワイナリーやあれこれ具体事例交えて面白いのは分かります。

神奈川県藤沢市等いくつかの都市で実証実験してる事例(筑波大学、東京大学、慶應義塾大学、藤沢市)についても紹介がありました。

筑波大学の「データ連携のためのストリーム処理基盤」では、メタデータ推定や欠損データ推定という話。例えば、時系列情報解析(例えば車両のプローブデータ)はするけれども、非常時には車両が通れなくなる等様々な要因で欠損データが多い。そこをソーシャルデータで補完したいが、生データはノイズだらけだしそもそも時空間情報が付いていないことも多い。そこで「Twitter位置情報推定」「ソーシャルネットにおけるプロパティ推定」とかして補完した上で、実データへリンクしようという話。

東京大学の「ドライブレコーダデータからのヒヤリハット探索のための3次元可視化インタフェース」は、取扱に注意が必要なデリケートな問題でもある「交通事故」を減らすことを目標とし、ドライバーが蓄積した実体験に基づく印象(どこそこは注意とか)は重要だが、それをデータから発見・可視化したいという話。分析結果をバス運転手らへのヒアリングとマッチングすると、比較的上手く抽出できているようにみえるとのこと。なお、以外なことに、雨とかの天候情報は多くの関係者が主張していたが、結果的には影響がない(入れても入れなくても変わらない)らしい。ビッグデータは重要だが、分析パターンは大凡出尽くしたのでは? 次に情報処理学会が目指すべきはどこか?という問題意識は流石だよなぁ。

慶應義塾大学の「システム統合化基盤技術上の「シティアプリ」による社会課題解決」では、データを貯めるだけではなく、ライブで効果的に流すことが重要というポリシーで、その実例として「ゴミ廃棄量」を細かくリアルタイムで分析&結果配信したいという話。ゴミ減量G1グランプリ。ゴミ廃棄量は現時点では撮影動画をSDカード保存->後日オフライン処理してるけれども、それをライブ解析&配信したいと。ゴミ廃棄量はあくまでも一例であって、例えば何か蓄積したデータのどこかで不法等の何か問題があったとした場合、それが一ヶ月後とか相当後になってから発覚したとしても対応するのは困難。ライブで解析し、その結果を見れるようにすることが重要、とのこと。

自治体代表として参加していた藤沢市さんからは、担当者の経験に基づく「こうに違いない」を可視化できたのがとても重要。データ提供には相当苦労があるが、これからは必要な時代だと考え、いかにそうしやすくするかを考えることも求められているとのこと。

講演後の討論では、、、

  • 大学や研究室、自治体らとの密な連携が求められ、結果として価値観を混ぜ合わせたことで良いものになった。今回のプロジェクトを通して腹を割った話し合いができるようになったのも良い。
  • 大学としては学術論文を書くのも大切だが、実証実験も求められるということで幅が広くなった。それらが自然に繋げられると良いと思うが、そこのベストプラクティスはまだ無い。
  • 世界と日本は大きく違う。例えばヨーロッパは大都市圏に人が集中し、そこで持続する都市モデルを作ることが目標。日本は人口減少に向かっているし、地方都市活性を目指すのなら、スマートシティと言っても目標が異なる。今の状況を踏まえて、ITはどういう未来を描くべきか、根源として何を目指すかについての議論が足りていない。
  • 基礎・理論・応用何であろうと「こういうことに役立つ」ということが言えないと駄目。何年先でもいいからビジョンとミッションとそれを遂行するパッションが必要。
  • パーソナルに対してフィットするデータ提供が必要では。ただし、個々人を見据えると一律には言えず、個々人に応じた提案が求められる。
  • オープンなプラットフォームがあることで、組織毎に異なるプロトコルで好き勝手やるのではなく、それらを横断的に活用する土台作りにも繋がりやすくなる。

学生セッション[5Y 会場] アニメとアート表現

[ セッション概要 ]

一般セッション。客観的評価でも西山くんの発表良かった(発表者の中で、唯一座長以外の2名から真っ当な質問&コメント貰えた)のだけど、奨励賞受賞ならず。ま、仕方ないか。

個人的に良かった発表はCGによるレジン作品の制作支援かな。ただ、CGによる支援というよりは別アプローチが良さそうに思うのだけど、問題意識としては十分理解できるという意味で良かった。


そして打ち上げ

学会出張といえば美味しい料理!
事前に調べて狙い撃ちすることもあれば適当にぶらついて見かけたお店に入るのもまたいとをかし。まだ時間早いし特に希望はないということでぶらつき、結果的には生ハム(店名)に決定。どれも美味しかったですが、個人的にはレバーペーストが一押しだな。


遠藤研最速記録だった先生の最速論文発表記録を塗り替えてやりました(ドヤァということで、記録更新されたようです。何のことかというと、私自身が学生の頃は1997年(学部4年)の9月に学会発表デビューしたのですが、これが「3年次の3月に1回目発表」ということで大幅更新されたようです。スゴイ。初めての学外発表は今でも覚えてて、めっさ緊張してて何も見なくても話せる状態になるまで練習したのだよな。まだパワポもない時代で、OHPシート持ち込みですね(遠い目)。

この記録を塗り替えるのはそうそう無い気もしますが、学会に限定せず、学外発表という大枠でくくっちゃうと既に3年次の学生実験で優秀賞とかあるんだよな。これも私が学生の頃から考えるとスゴイ。いやはや頑張ってる人は頑張ってますね。おじさん今度ご飯奢っちゃおうかな。

IPSJ80, day1

火曜日, 3月 13th, 2018

情報処理学会 第80回全国大会に来てます。1日目は企画イベントに参加してて、結果的には全部プログラミング教育(プログラミング的思考教育)に関連する講演ばかりの一日でした。


子ども達に,いま必要なマナビ:プログラミング的思考や読解力の必要性と 教育のあり方は? 〜データなどの確かな根拠に裏付けされた実態と展望〜

[ セッション概要 ]

国策として小学生にプログラミング教育だかプログラミング的思考教育だかを目指すことになっているが、各講演者からの主張を交えた目標・達成方法についての討論を聞く形になってました。全体要約としては「新井先生無双」なセッション(誇張しすぎ)。

新井先生は、東ロボ〜RST周りの話から現状の義務教育問題への指摘。
柏市教育委員会の佐和副参事からは、国策として決定される前から実施している小中へのプログラミング教育事例。
日本STEM教育学会の後藤代表からは、より学びの効果が高くなるプログラミング教育について産官学で取り組んでる事例。
早稲田大学の齋藤先生からは、ツールが溢れているがどれがどのような学びに効果的なのか、統一的体系的な評価が乏しいことへの取り組み。

結論的な話(主に新井先生の主張)としては、、『現在の小学生はあれもこれもやれという中で更に追加でやるというのは無理筋。そもそも教科書を読めていない層が多く、偏差値との相関が高い。興味の有無や性差、スマホの利用時間等との相関はまったくない。読む力があるかどうかが重要。やることを削り、小学校では読解力(係り受け、同義文判定、推論、イメージ同定)の確立に注力すべきである。プログラミングに限らず何か特定の能力に欠けていたとしても、後日独学なり教育なりがスムーズに進む。』

ちなみに、プログラミング自体を否定している訳ではなく、プログラミング的思考(再現性のある手順書を書けるとか)を育成するために必ずしもハードとソフトは必要じゃないという立場とのこと。ハードとソフトがあることでより効果的に教育できるならやるべきだけど、それ以前の問題としてそもそも指示されてることを理解していないなら駄目だろう、と。個人的にも似たような考えを持ってますね。


新しい一般情報教育の知識体系

[ セッション概要 ]

こちらはどちらかというと大学における情報教育中心なのかな。GEBOKが前回作成から10年経過したことに伴う改定と、今後の小中高に盛り込まれる情報系教育を踏まえた上で今後をどう位置づけるかといった話。会場での結論としては「目標毎に異なるのだから、違う話を混ぜないように目標を明確にしよう」、「知識体系だけではなく、何をどのように教えるべきかといったシラバス・教材例も含めるべきでは」みたいなところなのかな(多分)。

GEBOK自体は知識の体系化が主目的であることと、全大学生が身につけるべきコアを設計しているらしい(?)。それなら取捨選択が出てくるのは妙な気もしますが、必修科目と選択科目ぐらいの位置づけなのかな。大学学部学科毎に目指す人材像が異なるので、コアといっても難しいだろうというのは理解できます。

個人的には、大学でOfficeの使い方やるのは意味がわかりません。既に高校、場合によってはそれ以前でもやってるよね。だけど国内全大学にアンケート調査する限りではまだまだそっちに時間取ってるところが多いらしい。どのぐらい時間かけてるか分かりませんが、琉大も共通科目としてはやってるよね。調べられない、(Officeレベルの)問題解決への道筋が描けないのなら問題で、そこを教えるなら分かります。そうじゃないなら分かりません。ちなみに、ある大学では学部問わず一律でOffice教えるのは辞めたけど、特に問題でなかったらしい。状況としては、できない学生はできないままだし、無料講習用意しても来ないし、大学生協で提供してる有料講座に参加してどうにかしてる、らしい。あはは(乾いた笑い)。


特別講演 小中高で育む情報活用能力

[ セッション概要 ]

基本的にはタイトル通りの「小中高で育む情報活用能力」の総まとめ。そこへの協力もあるけど、それと同じぐらい『2024年度には,新学習指導要領の内容で学んだ生徒が高校を卒業する.この生徒は,全員がプログラミングの経験を含む高い情報活用能力を持っている.これを受け入れる大学も社会も対応を迫られることになると予想される』ということで、それを踏まえた教育どうするの?という問題提起なセッションでした。ただ、時間不足でQ&Aとか討論は盛り上がらなかったのが残念。一応、明日続きがあるらしい。


こんな感じのオープンな自習室欲しいよね。写真撮ったのは学生いないですが、別の場所では普通に学生らが議論やらしてました。

FAN2017@岡山大学

水曜日, 11月 8th, 2017

進学すると学会出張に行けて旅先で美味しいもの食べれますよ!(過去の例
という研究室紹介を兼ねたレポート記事です。

今回は、事前にあきお先生情報で把握してた「ままかり」「きびだんご」、そしてはれんち先生情報の「牡蠣」、後は歩いて見かけた「黄ニラ」「デミカツ」あたりか。どれもこれも美味しくいただきました。


第27回 インテリジェント・システム・シンポジウム(FAN2017)に参加してきました。このシンポジウムは、情報処理学会とかの特定学会が開催しているものではなく、電気学会、電子情報通信学会、人工知能学会等の合同開催みたいなスタンスで動いてて、「今年度はどこそこが主催ね」と持ち回りで開催されてます。今年度は機械学会主催だったこともあり、予想以上にそっち寄りの発表が多かったです。制御とかソフトが絡む話が多いですが、8〜9割は機械絡みかも。例えば「車椅子でのトラブルはハードそのもののトラブルというよりは、ヒューマンエラー。これをKinectで環境情報取得し、段差認識することで操作支援に繋げたい。そのためにセンサをこの高さ&角度で取り付けることで環境情報取得しやすくなった」みたいに、何かしらハード運用を含むような話が多い。

情報工学寄りな話もちらほらあったのですが、複数セッションに混ぜ込む形で入ってたのでまとめて聞くのは難しかったか。個人的に気になった発表は以下の通り。


1A2-3, 進化計算による大規模シミュレーションにおける実験回数の削減
例としては災害時の避難でしたが、大規模シミュレーションではそれ自体の計算コストが大きいだけでなく、「道路Aが通れない場合はどうなるか」「橋Bが崩落した場合どうなるか」といった要因全てを網羅的にシミュレーションするのはスパコンでも無理。なるべく低コストで、重要要因を絞り込むことができれば嬉しい。それを進化計算(GA)でやってみた。という話。GAでパラメータを直接最適化するというのではなく、どの要因が重要度が高そうかというメタGAとして最適化する話でしたが、やはり評価関数の設計で苦労してる様子。面白そうなんだけど、解ける問題なのかが良くわからないのだよな。
1A2-4, 学習係数調整による構造適応型リカレントRestricted Boltzmann Machine の分類精度の向上について
深層学習では構造最適化すること自体が難しいので、RBMで自動的に層を増やしたり、ニューロンを追加・削除する「適応型モデル」を提案済み。今回はそれを拡張して、学習率も自動調整させる試みをやってみたという報告。そっちはまだ上手くいってなくて、既発表のAn Adaptive Learning Method of Restricted Boltzmann Machine by Neuron Generation and Annihilation Algorithmが面白そう。というかSMC2016は去年参加したので聞いた話だな。
1A2-6, ロープのマニピュレーションにおける位相幾何を用いた計画法に関する考察
ロープの状態を正確に把握するのは難しく、それを数理モデルとして表現し、操作計画策定等してるという話。静止状態ではまだしも、実際にマニピュレータで操作してて、その際の「腕でつまみ上げた際の変化」を把握するのが辛いらしい。
1A3-3, 事前特徴抽出による部分空間法の改良
クラスタリングの一種である部分空間法は、クラスタを後から追加しやすいメリットがあるが、クラスタ間の重なりに無頓着なのでそこをどうにかしたいという話。PCAして「主成分じゃない成分(固有値が極めて低い成分)」を使うらしいけど、その指標だけだと辛そう。
1A3-4, 標本特徴空間を用いたスパース最小自乗ツインサポートベクトルマシン
SVM拡張の一つ、最小自乗ツインサポートベクトルマシンは比較的高速だがスパースじゃないため、サポートベクトル数が多い。これをスパースにしたいという話。
2B1-1, 動作予測に基づくアシストウェア制御のためのウェーブレット分散特徴量の応用
腰裏に設置してるセンサーでリアルタイムに腰の動きをモニタリングできるが、「どのタイミングでアシストするか」は「実際に該当行動が生じる1秒前から機能して欲しい」ということが分かっており、1秒後の動作予測をしたいという話。モニタリング情報に必要な情報が含まれてるかは微妙に謎だけど、面白い話だ。
2B1-4, ランダムフォレストを用いたカスタマーレビューの半自動分類
分類機を構築する際に、高品質で大量のラベル付きりデータを用意するのは辛い。これを半自動学習でどうにかしたい。SVMやNNだと予測確信度に基いてラベル付与できるが、ランダムフォレストでは用意されていないので、多数決結果で代替するという話。
2B2-3, 成長型自己組織化マップによる強化学習
SOMで状態推定する話をベースに、状況に応じてそれまでの学習結果を壊さないようにニューロンを増やすという話。ただし、SOMだと2次元空間制約が厳しそうな予感&ほぼ同等の話が既にあるらしい。
2B2-6, Quantitative evaluation of collective intelligence expressed in rating evaluation of computer chess
集合知の質的評価に取り組むことを目的とし、「2〜3人協力型のチェス」で検証してみたという話。ユーザ間の協力方法は「協力相手に手を提示し、選ぶだけ。その手を何故選んだか等の情報は自身で解釈検討する必要がある。選んだ手が割れた場合にはランダムで決定」というもの。これだけでもそれなりにスコアが上がるとのこと。

IPSJ79, day3

土曜日, 3月 18th, 2017

情報処理学会最終日。
午前中は、伊藤くんの発表する自然言語処理(4)へ。
午後は、視野を広げるつもりで農業・牧畜支援システムに参加し、最後はIPSJ-ONEへ。

IPSJ-ONEは相変わらず凄い発表だらけでした。今回見れなかった人は、後で公開されるであろうアーカイブを期待してまとう。

中でも個人的にグッと来たのは本多先生のOntenna深澤先生のメンタル推定耒代先生の歴史学五十嵐先生の手芸設計支援、岩渕先生のリアルタイム大規模グラフ処理かな。


[ 自然言語処理(4) ]

6Q-1: 伊藤くん発表。
Q: 記事の中で不必要なものを削除しているようだが、ユーザに必要な興味キーワードはどう抽出している?
Q: 30文を使って規則を作成し、それがうまくいくかの評価。規則を作る際に見ていたデータでの検証は必要だが、未知のデータに対する検証は?
Q: カバレッジが大きい規則を実装したようだが、未知データのことも考えると今後規則は増えていく?

6Q-2: 論文タイトル生成における未知語処理。
Q: 論文タイトル固有の未知語とは?
Q: 初学者への支援という点では例示よりもアドバイスのようなアプローチは?

6Q-3: 発表スライド中の説明不足用語に対する質問生成。
Q: 発表スライドならではの特徴?->音声認識and/or画像認識含む?->XMLファイル利用
Q: その意味がわからない参加者が存在する用語??(ユーザ依存)
Q: 理由推定?(理解できない・初めて聞いた・失念・曖昧)
 -> 説明変数は?
Q: アノテーションの仕方によって正解データが変わりそうだけど?

6Q-4: 時系列データの動向概要を説明するテキスト生成。
時系列データの圧縮例: SAX法 #ref

6Q-5: 正文で多様な文を生成したい。
正文のための固いアプローチ。 #ref

6Q-6: 画像刺激時の脳活動データの説明文生成。
データ少数制約のために、一部を転移学習(画像->自然文出力モデルを利用)で医療。 #ref
C: いきなり説明文にいくのではなく、単語・極性等いくつかクッションあったほうが良いのでは?
Q: 失敗例ではそもそもどういう正解文を想定した実験?

6Q-7: 差分考慮したTL要約。
新しい形のdiff? #idea

6Q-8: ウェブ上の文書を要約表示。
Q: スニペットではダメなの?


最終日は聴講の末、つくしにて打ち上げ。ブリカマ旨し。。

IPSJ79, day1

金曜日, 3月 17th, 2017

IPSJ79の2日目。午前中はイベント企画の「「情報力」で街を変える 〜ビッグデータ利活用技術開発とその社会実装〜」へ。午後は嘉陽さん発表のある自然言語処理(2)と、セッション名に惹かれて会議・学習支援に参加してきました。


[ 「情報力」で街を変える 〜ビッグデータ利活用技術開発とその社会実装〜 ]
藤沢市と連携しながら社会実装という部分まで含めたプロジェクトのお話。(a)人間系を含むインフラとしてのセンシング部分、(b)データ蓄積+多様な関連データとのインタフェース部分、(c)分析部分、(d)可視化等レポート部分といった一通りのことをやりつつ、最終ゴールが社会実装というところが気になっての参加です。

  • 市役所職員は担当仕事に関してはプロフェッショナルだが、まだまだ縄張り意識があったり、文書化されていない暗黙知やそのままでは利活用できない形での蓄積に留まっていることも少なくない。効率化等についての意識が低かったりする職員もいる。勉強会などを含めて互いに歩み寄れる分かりやすい導入から入り、信頼関係構築を進めながらデータ活用に繋げていきたい。
  • IoTにしろAIにしろ、データがあれば嬉しいというだけでは足りない。アートやコックのような視点でより魅力的に映るゴール設計やロードマップ作成が重要だし、そういうことができる専門家人材育成も必要。
  • 大学から見ると、論文作成に繋がりにくい部分にかかるコストも少なくない。データの前処理やらそれ以前の問題やら。一方で地域貢献という側面や、ベンチャーなり民間企業が入ってきたくなるインフラ整備という側面もある。個々人の努力では無理で、多岐に渡る関係者らをどう巻き込むかという視点も必要。ヒトゴトからジブンゴトへ。
  • 人と人をつなげるエージェントというか、そのような仕事は誰がやるべきか。役所か大学かそれ以外か、何かしら必要という意識はあるが今のところ適当なところがない。産学官連携組織的な所がうまく機能しているところもあるかもしれないが、見え難い。

[ 自然言語処理(2) ]

カルテにICDコードを自動付与しようという話。
専門家(人間)でも割りと判断がずれるケースがあるらしい。例えば専門家3人で教師データ(ICDコード)を用意する場合、「3人が一致、2人以上が一致、1人以上が一致」の3ケースで検証するらしい。

Web検索結果クラスタリングの話。
設定してる課題例があまりヨロシクない気がした(辞書で調べるべき課題)けど、検索キーワードから関連ページを収集し、そこから辞書的なものを自動構築すると考えるべきではあるか。クラスタとして抽出するべきなのかな。

嘉陽さん発表。
Q: doc2vecでうまくいかなかったようだが、使いたかったのは何故? もう少し単元を広くしていくと有用になるという期待? 簡単な表現だけではうまくいかないという事例を見つけておくと、確認しやすくなるはず。
Q: 今後は数学以外もやる? 社会とかキーワードだけではやれないものが多そう。
Q: 今後の展望。確率の中でも組み合わせ単元があるという例があったが、実際に回答者がどう回答して、どこを間違ったのかというデータはある? コメントを解析する予定はない?

Web議論掲示板利用者の能力推定という話。
Q: 「能力」は高い低いだけ? -> Jooの定義 #ref


学生にうな重とひつまぶしの違いを教えてきたのが本日の成果です。お収め下さい。

IDS2017 (International Design Symposium in Kyoto 2017)

木曜日, 3月 16th, 2017

情報処理学会のために名古屋に来ている最中ですが、石田先生から声かけて頂けたこともあり、合間を縫って京大で開催中のIDS Kyoto 2017 (International Design Symposium)に参加してきました。基本的には「デザイン教育(京大の例)」に関する情報共有・討論を趣旨としたイベント。個人的には(1)そもそもデザイン教育におけるスキルマップorリスト的なものがあるのか、(2)それをどうカリキュラムに落とし込むのか、(3)どう評価するのか、あたりの問題意識を持って参加しましたが、割と近しい話が多かったかな。

1日目しか参加してませんが、大学毎の違いも見れて面白い。意外に感じた部分は、(a)「no credits (単位なし)」で実施してるところがちらほら目につくぐらいにはあったこと、(b)ドクターコースを想定しているケースが殆どのこと。特にドクターコース想定については、学部生では(達成させたい目標レベルからすると)辛く、修士でもまだ厳しい、修士レベルで一つの専門分野について身につけた後こそがデザイン教育学の本番だというスタンスらしい。既存のカリキュラムを刷新するのではなく、様々な形で埋め込みつつ、足りない分を新科目群として設置するような形でやれそうな気もするのですが、多分ネックになってるのは「評価」。一つ目のセッションが「Assessment of Learning Outcomes of Design Studies」と銘打っているぐらいには、評価問題が共通しがちらしい。

その他にも興味深かった話を列挙しておこう。

  • デザイン教育学が目指している「学生に身につけさせたい力」は、アンケートベースではあるけど一定のエビデンスを出せるぐらいには企業等が求めている力である。中でも「自らの専門領域を超えて協働できる突出した専門家(≒コラボできてリーダーシップのある専門家)」の育成が重要。
  • knowingだけではなくactingへ。general/domain theoriesを知るだけではなく、実際にアクションとして行動に移すことが重要。
  • 各分野における専門教育が先か、デザイン教育が先か。今は一つの柱としての専門教育が先であることを前提にしているが、一方で「異なる専門を学ぼうとしている人たちにおける共通話題」としてのコアを用意することでコラボが自然発生しやすくなる等の仕組みを強化できないだろうか。
  • 学生や地域社会が持つ知識・情報は切り離されたものではなく、各ドメインにおいて積み重ねられた歴史のあるモノ。差異があるのが当然で、それを踏まえてプログラムを設計する必要がある。
  • トラブル対応の側面もあるが、レビューや振り返り等様々なシーンを各専門家チームでサポートする環境が重要。現場に丸投げではダメだし、サポーターを一人に閉じてると広がりが狭まる。
  • 英語ネイティブでない環境でのワークも面白い。現地語だけで進めようとしがちだが、その中でどう現場を把握・仕切るかという体験はとても有意義ではないか。

直接的には関係ないのだけど、何かしらイベントがあると「学生にポスターセッションする場を並行して用意」する形で実施していることが多く、今回もデザインシンポジウムとは別にポスターセッションがありました。デザイン教育自体が「垣根を超えた協動」に重きをおいてるからということもあるかもしれませんが、門外漢でも話を聞こうとする人がとても多く、学生にとってもとても良い機会になってるように見えます。琉大x沖縄高専でのポスターもこんな風にやれると良さそう。