(Report) 第22回セマンティックウェブとオントロジー研究会 #sigswo
第22回セマンティックウェブとオントロジー研究会
第22回セマンティックウェブとオントロジー研究会に参加してきました。
予稿集がオンライン公開されてますので詳細はそちらを読んでもらうとして、ここでは個人的に気になった点のみを備忘録的にレポートします。
- SIG-SWO-A1001-01: キーノート講演 「セマンティックWebとオントロジー:現状と将来展望」
- SIG-SWO-A1001-02: 東京県民
- SIG-SWO-A1001-03: Summarizing microblog stream
- SIG-SWO-A1001-04: 文楽人形動作の意味解釈システムの構築
- SIG-SWO-A1001-05: 行為者の気づきに基づいた印象に関する知識表現
- SIG-SWO-A1001-06: アポトーシスに関するシグナル伝達オントロジーに基づく定性的シミュレーション
- SIG-SWO-A1001-07: サジェスト機能によるゆるやかなオントロジー構築を可能にするシステムの提案
- SIG-SWO-A1001-08: 「法造」におけるオントロジーの品質保証に関する一考察
関連リンク: slideshare
研究領域は大別して「オントロジー、Semantic Web、semantic web」に分かれている。
オントロジー: 論理や表現としてのオントロジー研究。
(大文字の)Semantic Web: Webにセマンティクスを持たせる研究。
(小文字の)semantic web: ブログやソーシャルタギング・集合知等といった必ずしもRDF(S)/OWLに依存しないセマンティクスに関する研究。個人的な主な興味は3番目の方。
オントロジーそのものをどう作るかとか、データを橋渡しするための記述とかをあまり考えたく無いというか。如何に効率良く/手軽にそれらを実現するかという話は面白いのですが、どうせなら機械に一任したい部分。逆に言うと、一任するための自動化という視点では前者2つにも興味がありますが、それなら3番目をやった方が早いんじゃないかな、と。
関連リンク: 東京県民プロジェクト
東京にやってきた他県民のSNSを介した地元&現地との繋がりをマイニングして、県民性を見てみるという話。
関西人のコミュニティでは「関西芸人」に反応が高いとか、愛地県民は「食文化最強」とかいろいろカオスってるとか、どこぞの地方の人は出身元を表に出さないとか、それっぽい【県民性】が抽出できてるっぽいとのこと。
質疑応答で出ていた
・海外に居ると「日本」という視点でモノを見るようになる。
・Facebookで国民性が抽出できないか。
といった観点も面白そう。
関連リンク: 東京工業大学 奥村研究室
Twitterの要約。
前提:あるトピックに関するTweets(マイクロブログストリーム)が入手可能。
重要と思われるイベントを選び出し、どんなイベントが、どの時刻に起こっているのかをまとめた要約を作りたい。
決められた個数のTweetを列挙して並べることで要約を作成。従来要約する際には「文章毎に共通する単語の割合」で包含具合を推定。これだと時間遅れ、異なるイベントを同一視してしまうといった問題があるので、推論方法を拡張。ツイートの時間差をペナルティとして与えるだけだと、長いツイートが選出されやすくなるので文長にもペナルティを与えた。
(包含されてるツイートを代表ツイートへ割り当てる)割り当てを自由にするのではなく、線形分割条件に。これでクロスしたり離れた所への割り当てはできなくなるが、高速近似アルゴリズムが適用可能。速度重視なのは、恐らくリアルタイムに処理したいから。
それは良いとして、線形分割問題に落とし込んでしまうと、物語のシチュエーション分割(IDMとか)と同等の問題になってたりしないのかな。(後で考える)
時間軸でパラレルに複数のイベントが走っているという点を捨ててしまっているのは少し勿体無い気がしました。質疑応答では「そもそもどういう要約を作りたいのか/作るべきなのか」という点でいろいろ盛り上がってました。実際いろんな要約がありえますしね。
「最初のツイートをトリガーとしたサマリ」という視点は面白い!
人形動作を観測点毎の変動データに変換し、それらのデータセットと「意味解釈」をどうにかして関連づけたいという話。
データセットが大きくなり過ぎなので効率良い解析方法を検討中とのこと。絶対値に意味が無いから一つ前の時刻との差分で「動作」という単位にしてるっぽいけど、実数値じゃなくてカテゴリカルな値(上がったか下がったか変わらないかとか)にするだけでも問題空間が大きく減りそう。というか減り過ぎて困るという可能性が出てくるが。。
感情とか感覚といったものをオントロジー記述したいという話っぽいです。
オントロジー設計そのものが大変だけど、感覚って定式化して描けるものなのだろうか。
オントロジーとして記述した知識に基づいた定性的な表現方法と、それに基づいたシミュレーションをしたという話。
生命現象は「生体のバラツキや、一般の物理現象と比較して複雑な要因に支配されてるため、定量的な記述に限界」があるため、定性的なシミュレーションが可能な記述について取り組んでいるらしい。それは死ねそうな話だ。。
関連リンク: 濱崎雅弘
大勢のユーザでオントロジー作りたい。
その場合、クラスとか予めスキーマを考えながら作り上げるのは非現実的なので、自由にインスタンスを作らせる環境を用意し、どんな属性を追加すべきかといった構築支援を含めたシステムを用意してみたという話。
ユーザは「ノード、属性、属性値」のトリプルを入力するだけで良く、大人数で編集し合うことで次第に合意形成するところまで踏み込みたいっぽい。オントロジーとして本当に使えるものになるかは良く分からないけど、議論アシストにはかなり向いてそう。大抵は分かりやすく「見える化」するだけで議論進むようなことを変に口論しちゃうことでなかなか前に進まないという状況が多そうだし。
どういう風にオントロジーを作るべきかという支援だけでなく、間接的に概念理解とかにも使えるのではってのはその通りだと思います。一種のコンサル的なこともできそう。
オントロジー研究者が作る環境はあるが、そうじゃない人が「そのオントロジーが適切か否か」を判断するのは困難。
だからそれを判断しやすくするためのビューワ(概念マップ)を作って、実際に触ってみてもらったとかいう話らしい。
実際、概念数がウン十あるだけでも、何がどういう関係で何処に繋がっているかを把握するのって、もの凄いコストがかかる作業だよねぇ。