IPSJ79, day1
IPSJ79の2日目。午前中はイベント企画の「「情報力」で街を変える 〜ビッグデータ利活用技術開発とその社会実装〜」へ。午後は嘉陽さん発表のある自然言語処理(2)と、セッション名に惹かれて会議・学習支援に参加してきました。
[ 「情報力」で街を変える 〜ビッグデータ利活用技術開発とその社会実装〜 ]
藤沢市と連携しながら社会実装という部分まで含めたプロジェクトのお話。(a)人間系を含むインフラとしてのセンシング部分、(b)データ蓄積+多様な関連データとのインタフェース部分、(c)分析部分、(d)可視化等レポート部分といった一通りのことをやりつつ、最終ゴールが社会実装というところが気になっての参加です。
- 市役所職員は担当仕事に関してはプロフェッショナルだが、まだまだ縄張り意識があったり、文書化されていない暗黙知やそのままでは利活用できない形での蓄積に留まっていることも少なくない。効率化等についての意識が低かったりする職員もいる。勉強会などを含めて互いに歩み寄れる分かりやすい導入から入り、信頼関係構築を進めながらデータ活用に繋げていきたい。
- IoTにしろAIにしろ、データがあれば嬉しいというだけでは足りない。アートやコックのような視点でより魅力的に映るゴール設計やロードマップ作成が重要だし、そういうことができる専門家人材育成も必要。
- 大学から見ると、論文作成に繋がりにくい部分にかかるコストも少なくない。データの前処理やらそれ以前の問題やら。一方で地域貢献という側面や、ベンチャーなり民間企業が入ってきたくなるインフラ整備という側面もある。個々人の努力では無理で、多岐に渡る関係者らをどう巻き込むかという視点も必要。ヒトゴトからジブンゴトへ。
- 人と人をつなげるエージェントというか、そのような仕事は誰がやるべきか。役所か大学かそれ以外か、何かしら必要という意識はあるが今のところ適当なところがない。産学官連携組織的な所がうまく機能しているところもあるかもしれないが、見え難い。
[ 自然言語処理(2) ]
カルテにICDコードを自動付与しようという話。
専門家(人間)でも割りと判断がずれるケースがあるらしい。例えば専門家3人で教師データ(ICDコード)を用意する場合、「3人が一致、2人以上が一致、1人以上が一致」の3ケースで検証するらしい。
Web検索結果クラスタリングの話。
設定してる課題例があまりヨロシクない気がした(辞書で調べるべき課題)けど、検索キーワードから関連ページを収集し、そこから辞書的なものを自動構築すると考えるべきではあるか。クラスタとして抽出するべきなのかな。
嘉陽さん発表。
Q: doc2vecでうまくいかなかったようだが、使いたかったのは何故? もう少し単元を広くしていくと有用になるという期待? 簡単な表現だけではうまくいかないという事例を見つけておくと、確認しやすくなるはず。
Q: 今後は数学以外もやる? 社会とかキーワードだけではやれないものが多そう。
Q: 今後の展望。確率の中でも組み合わせ単元があるという例があったが、実際に回答者がどう回答して、どこを間違ったのかというデータはある? コメントを解析する予定はない?
Web議論掲示板利用者の能力推定という話。
Q: 「能力」は高い低いだけ? -> Jooの定義 #ref
学生にうな重とひつまぶしの違いを教えてきたのが本日の成果です。お収め下さい。