情報処理学会 第75回全国大会1日目

Share on:

m_201303060836055136816525e71

情報処理学会全国大会1日目が終了しました。NAL研メンバは玉城くんが終了。良いコメントというか想定通りのコメント貰えたんじゃないかと。

昼過ぎには招待講演2件があったんですが、満席で座れず(立ち見があるぐらい盛況)、Ustreamもやってたっぽいんですが個別に見ざるを得ない状況だったので諦めちゃいました。

東北大学構内にはあちこち雪解け気味に残ってたり、仙台城付近の池が全面凍ってたりで思ってたよりも雪を楽しめましたw

個人的に参加したセッションは以下の通りです。午後のセッションは途中(4件目)まで2Mで、途中(5件目)から2Pに移動しました。個人的に気になってた発表は意図に基づくコンテキストアウェアサービス提供モデルの提案でしたが、思ってた以上に「理想空間上でのシミュレーション」という位置付けで気になる点は「できるものとする」前提になっちゃってたのが残念でした。難しいから仕方ないだろうとは思いますが。

晩ご飯は気仙沼食堂で、ホルモンやら焼きそばやらあれこれ堪能しました。食べ過ぎですw 写真多すぎるのでtwilog参照。

以下、セッション毎のメモです。


学生セッション[1ZE会場]教育効果の分析・調査・評価 座長 西田 知博(大阪学院大)


1ZE-1初等教育の算数科授業におけるICT機器活用が児童の話し合いに与える効果の多角的視点による検討, ○阿部 俊,後藤裕介,南野謙一,渡邊慶和(岩手県大)

キャンセル


1ZE-2課題提出を支援するリマインドシステムにおけるアドバイス機能の検討, ○谷村 祐,西田滉季,田中穏識,納富一宏(神奈川工科大)

対象;課題の存在を忘れる、スケジュール管理できない人
対象種別毎のアドバイスパターン
 1. 意欲はあるが能力が足りない学生、期限までの残り時間が短い場合
  ->課題内容に対するヒント
 2. スケジュール管理が得意でない学生
  -> 課題期限や取り組み方
 3. 意欲、能力共に高い学生
  -> 講義に関する専門的な情報
 4. 意欲、能力共に低い学生
  -> 講義に関する基礎的な情報
アドバイス提示タイミング
 a. 時間で自動的に提示
 b. ユーザの要求、反応で提示


naltoma: 余裕を持ってリマインドされたら行動するの?
naltoma: 受動的な学生に対してアドバイス等による積極的な関与によりある程度
 課題提出を支援できたとして、そのような学生は卒業後意欲を持って働くことが
 できるのだろうか?(場当たり的な支援になっていないか?)


Q: アドバイスの機能としていくつかあげられていたが、だれが用意する?
A: 現時点では教員負担。将来的には生成できるようにしたい。
Q: レポート提出期限で1週間とかあると、その間ほったらかしにできる期間というのはどういうこと?
 どういうレポートを想定している?
A: やらなくても良い時間というか、学生が受講している講義は複数あり、
 どの順番で取り組むかということを考えると期限が迫っていないのは優先度が低いとか。
 そこで後回しにした結果、忘れてしまうということがある。
Q: 緊急のものから対処しようというアプローチ?
A: その通り。課題の内容も考慮したいとは考えている。

Q: 何故Androidのポップアップにする? 汎用性としてはメールの方が高いのでは?
 端末限定をしてしまう。
A: メールの場合は自分でアクセスする必要がある。
 確認しない学生、メールが沢山来る学生は忘れてしまう。
 ポップアップでは閉じる作業するまでは表示し続けることが可能。

Q: どういう形で学生が出すべきか、〆切間際はもっと細かい区分けが必要だし、
 どういうアドバイスを用意するかにも関わってくるが、
 どのように支援するかを考えたシステムを検討すべきでは。


1ZE-3作問演習における作問者の出題意図と主観的な学習効果との関係性, ○井上裕之,佐々木淳,山田敬三,高木正則(岩手県大)

作文学習支援システム
 利用者が学習効果を得られることを保証したい
  主観的な学習効果に影響を与えている要因を抽出
出題意図
 自己学習/解答者の学習/作りやすさ


naltoma: 主観的には学習効果がなかったと答えた学生は、どういう学生だった?
 何が要因だった?


Q: 直感的には、得点が低い人に他人に役立つ問題作成するよう指示しているが、
 得点が高い人がやる話に思う。
 得点が低いから自分ができるように作るというのが自然ではないか。
 何故得点低い人と高い人とでタスクを分けたのか?
 両方とも混ぜて差を見るのが普通では?
A: 理解度が高い人が作りやすい問題を作る意図を持たせた方が良いと考えたから。
Q: その仮説が正しいか分からないので、十分な人数がいるなら両方のグループで
 両方のタスクをやらせるべき。


1ZE-4勉強スタイルによる個々の差異と実力の推移に関する調査, ○玉城 翔,當間愛晃(琉球大)


naltoma: 傾向(分類ルール)抽出するにしては属性が少なすぎるのはやっぱり気になる。
naltoma: 決定木は適宜見やすく編集しよう。
naltoma: 発表終了後のスライドは結論なり今後の課題なりを残したままにしよう。
naltoma: 勉強スタイルについての傾向や違いが見られたとして、何をどうしたい?


Q: 考えている「スタイル」というのはとても分類しにくい。
 クラス毎に決まった教科書があるとある程度定義できそうだが、
 いろんなユーザが混在していると定義しにくいのでは?
A: やってみないと分からないが、今回は英語に限定してみている。
 目的や有名な教材によってスタイルに共通性が見られることを想定している。

Q: 今回分かった3点について、見方によっては分析しなくても出るような結果になってて勿体無い。
 毎日やる人ほど点数上がりやすい、上の人ほど伸びにくい、レベル毎に適切な教材があるとか。
 うまく問題設定をすべきでは。
 いろんな人がいるところでやりたい気持ちは分かるが、
 ある一つのテキストに絞り込むとか、ユーザ層を絞り込むとかしてみた方が良いのでは。


1ZE-5クラスタ数の変化点検出を用いた授業アンケートの分析, ○天野恵理子,大枝真一(木更津高専)

病欠


1ZE-6ご当地検定における「面白い」・「役立つ」問題の分析, ○奥津翔太,菅原遼介,古舘昌伸,高木正則,山田敬三,佐々木淳(岩手県大)

地域に興味を持って欲しい
ご当地検定
 解答者が地域に興味を持ってもらえるような問題
 要望:解答後の面白い・役立つ度合いの観点から項目を検索したい


naltoma: 面白さは流行など時間軸にそって変化するものでは?
 プロフィールとしては何を想定している?
naltoma: 「知ってる単語や興味」はどう分析する?
naltoma: ある意味で、広告や推薦モデルに近い問題設定?


Q: プロフィールの感じ方とは?面白いかどうか?
A: 今回は面白いか、役立つか。

Q: 仮説と異なる結果が出たとのことだが、
 どちらかというと結果の方が尤もらしい仮説として採用しそうに思う。
 何故今回の仮説を立てた?
 ご当地検定にトライする人は既に興味があるのでは。

Q: 総数が10数名のようだが、これは別途やったもの?
A: 別途やってもらった。
 キーワード知ってるかの確認後に、解いてもらった。
 既に解いてた人も被っている。


1ZE-7ソフトウェア信頼性モデルを応用した大学等における原稿作成プロセスの定量的評価, ○土井 崇,奥田隆史,井手口哲夫,田 学軍(愛知県大)

問題意識:原稿作成プロセスの終了時間が個人差に強く左右される
原稿作成プロセス
 プログラムコードと捉え、作成原稿は学生の原稿作成・修正スキルに依存したエラーを含む。
 教員の推敲・修正間隔と学生の原稿修正スキルが完成時間に与える影響を
  ソフトウェア信頼性モデルを応用した確率モデルで検証。


naltoma: プログラムコードの場合、テストを用意できるはずだがこの違いは無視して問題ない?
naltoma: 平均75日??


Q: いろんなタイプが出てきたが、原稿作成指導、論文添削ということについて、
 グループ学習とか創造的活動というのはあまり使わない気がする。
A: 原稿作成を含めて研究を進める過程で行う。
Q: 多分想定が変わっていて、原稿作成するのはある程度研究に目処が付いた
 時点でのアウトプット。

Q: ソフトウェアでのモデルを導入するのは面白いが、
 このモデルが原稿パターンとして現れているかの意味付けをちゃんと見て欲しい。
 例えば logistic, gompertz は具体的にはどういうのを想定している?
A: 理解度が足りないケースで、ある程度理解度が高まってくることで修正スピードが高まるパターン。

Q: リニアが理想的というのはそう?
A: 75日前提では promotion, exponential が良いと考えている。
Q: モデルを立てるのは良いが、現実がどうなのかということとリンクさせて欲しい。

C: リニアでやってくれると、学生が沢山居る立場からは嬉しい。
 急激に良くなる人もいる。下がるが最後まで残ってしまう人もいる。
 論文書くのはそれ自体が創造的活動だと思う。


1ZE-8採用面接における非言語行動の印象改善方法の提案-話速改善による面接評価への影響調査と分析-, ○渡辺智美,中村亮太,上林憲行(東京工科大)

面接をコミュニケーションの場と捉える
相手に与える印象改善
 面接評価に与える影響を調査:声の大きさ/話速/言い淀み
  模擬面接実験
   客観的(モニタリング)評価と主観評価の相関をみる
   相関の高さからは:声の大きさ>話速>言い淀み


naltoma: 非言語行動の印象として今回検証した3項目を選んだ理由は?
 それ以外の項目が影響強いとは考えられない?
 何となく暗そうとか。
naltoma: 模擬と本番とでの違いは?(特に主観評価している面接官の視点から)


Q: 面接ではレスポンスが大事だと思うが、今回の実験ではどうだったか?
A: 面接は3つの設問で構成し、それに対して学生が答えるという流れ。
 自己紹介の時に計測した。
Q: 今後はレスポンスの測定もやる?
A: そこは想定していない。

Q: 話す内容よりも90%強が内容以外のことを聞いているとのことから始まっているが、
 50%強が姿勢や動作とかいろいろある。貧乏揺すりとか視線を合わすとか。
 話し方を変える事によって改善される?
A: 今回は話し方に着目しているが、見た目に着目している点では別の人が検証中。

Q: 面接者と学生の距離は?
A: 机を挟んで 2m 程度。
Q: 実際の面接ではまちまちだが、どう対応する?
A: 60dBであれば聞こえるという判断は可能。
 距離については変わってくると思うが、大丈夫だという想定。

Q: 話速は早ければ早いほど良いというモデルだったが、早すぎてもだめでは?
A: 分速500字以上でも高い評価が得られた。
Q: 面接官にもいろいろいると思うが。
A: 2名の面接官が面接後に話し終わって評価をしている。


1ZE-9化学実験安全教育システムにおけるメッセージ内容及び提示方法の検討, ○伊藤香織,田口宏明,藤波香織(農工大)

ビデオによる一斉教育:実際の操作とのギャップが事故に繋がる恐れ
先行例:A3(A-cube): ARを利用した化学実験安全支援
化学実験安全教育における質問提示の有効を検証したい


naltoma: 失敗件数上位を対象にするのは良いが、失敗のマズさは優先しなくて良い?


Q: どういう割合で何に気をつけるかというのは?
A: 共通して気をつけるべき部分が見えてきたので、それを示唆するようにしたい。
 手を動かしている最中が良いが、危険な操作に関しては動画学習が良いとも考えられる。

Q: デバイスによると思うが、眼鏡デバイスが出たら使えそう?
A: 使えると思う。現状ではプロジェクターを利用。
 ヘッドマウントディスプレイのようなものの方がより現実的だと思う。

Q: 実際に、専門にやっている学生が使ったとしたらどうだったかという調査はしている?
A: A-cubeは化学実験に習熟していない学生が対象。
Q: データはそれで良いと思うが、結果に対する分析について熟練者はどう感じる?
A: 良いことだと言うコメントを頂いている。
Q: 専門では専門で行き過ぎているので、中間程度のあまり習熟している学生に対して
 やれると良さそうに感じた。


1ZE-10学校向けUSBメモリ貸出システムにおける不用意な情報持ち出しへの対策強化, ○上枝俊太,納富一宏(神奈川工科大)


Q: USBメモリの貸出しは1日?
A: 基本的には1日。
Q: そうすると管理者側が煩雑では?
A: USBメモリの管理者という立場が複数人間で分担することで軽減することを想定。

Q: 現場で使ってもらった?
A: まだ。
Q: そこでのインタビューをして欲しい。
 責任者といっても情報管理者とかに集中する可能性が高い。
 もともと業務があるなかで更に別業務が集中すると大変。

Q: データ持出してはいけないデータというのは本当に難しい話。
 どう対策することを考えている?
A: データ重要度に応じて、高いものについては適宜アラート提示するとか。


学生セッション[2M会場], 要求・アーキテクチャ 座長 坂田 祐司(NTTデータ)


2M-1新規ビジネスモデル構築プロセスの提案, ○熊坂拓哉,大場みち子(はこだて未来大)

失敗要因の一つ:システムとニーズの不一致
リーンスタートアップ:ニーズ把握してから開発+ユーザフィードバック(Minimu Viable Product)
 欠点:他マーケットに利用することを想定していないことによるユーザ限定
 ニーズのある機能をリスト化とニーズの逐次見直し


naltoma: 機能リストは全てゼロイチであるという仮定をしているように見えるが、
 実用上それで問題無い?(同じ機能でも満足度が異なる実装は多々あるはずだが)
naltoma: 実際の現場では似たようなことがやられていない?(ニーズ把握+フィードバック調査)


Q: 設計手法がポイントなのか、ビジネスモデル自体がキーなのか?
A: 主にビジネスモデルに着目してアプローチを考えた。
Q: だとすると、今回はニーズもターゲットも決まっているように思えるが、
 もっと広範囲を意識する必要は無いか?
A: リーンスタートアップではまずニーズを把握してから開発する。
 そこを拡大したアプローチになっている。メリットを取り入れつつ、
 デメリットを解消したアプローチ。
Q: どちらかというとアジャイル開発に近いように思うが、同じ?違う?
A: リーンスタートアップはアジャイルに似ている所がある。
 はじめの段階で最小限の機能から作っていくという点では違うと思う。
Q: オリジナリティは?
A: マーケットの拡大というプロセスを付け加えた点。

Q: 機能リストと優先順位毎に作っていくとのことだったが、
 顧客ニーズに基づいて作るとコスト度外視になると思うが大丈夫なのか?
A: 今回はあまり想定していなかった。
 必要な機能を作っていくということで、いらない機能は除外するという流れ
 になっているため、費用は削減されていくと考えている。


2M-2形式的ソフトウェア合成手法における再利用部品群の決定, ○熊谷 恒,織田 健(電通大)

自動コード生成
 欠点:部品整備コスト、パターン自体に誤りが混入する可能性
形式手法
 欠点:開発時間の増加、適用領域が限定
MSSS手法:部品再利用&自動合成
 B Method による高信頼+自動合成による低コスト


naltoma: MSSSでの開発はどのように行う?


Q: まだ開発中とのことだが、実際のシステム作る所で使う予定は?
A: MSFC生成がまだ理論的に可能だろうという段階。
 後々実際の事例に適用してみたい。
Q: 後々で構わないが、どこら辺が有効?
A: B Method で記述できる範囲内なら適用可能。
 時相論理は使うことができない。時間が関わって来ると困難。


2M-3The Encapsulation of the quality, ○齋藤大輔,山浦恒央(東海大)

productivity and quality software reusing
reuse of quality (quality encapsulation)
 1. quality assurance
 2. evaluation of the quality
 3. reuse of quality


Q: ここで言う「品質」の定義は? レベル1,2,,の例を見ると、一般商用システムで考えると、
 レベル5まで普通にやっているので分けることの意味がよくわからない。
A: ここで言う品質は、バグがなかったりとかきちんと動くとかいろんなものが含まれる。
 今回のは一つの例であって、まだ深堀していない。


2M-4意図に基づくコンテキストアウェアサービス提供モデルの提案とカーナビゲーションシステムへの応用, ○牧 慶子,中道 上,青山幹雄(南山大)

ドライバの意図の変化に応じて適切な運転支援を行うコンテキストウェアなサービス提供
 コンテキストの影響による意図の変化の理解
 意図に応じてサービスを選択するサービス評価手法の構築
意図=ある時点におけるユーザの関心事
 ユーザに関与するコンテキストの属性値を意図とし、ベクトル空間モデル化
 意図ベクトルとサービスベクトルの近さで意図の達成度を評価


naltoma: 「ドライバの意図に影響を与えるコンテキスト」はどう推定/特定する?
naltoma: 意図とサービスのマッチングではなく、意図に対してどう支援すべきか
 の仮説とのマッチングになってない?
naltoma: 意図に影響を与えるコンテキストを特定可能とのことだが、
 そもそもモニタリングできる前提だからであって、それをどうするかが問題のままでは?


Q: サービスの特徴量は、システムにおいて固定?
 ユーザは変化しうるが、用意されたサービスが必ずしも適当とは限らないのでは?
A: サービスが持つコンテキストは固定で、ユーザ側のコンテキストは膨大。
 意図ベクトルとして同じ空間で評価。
Q: 「ラーメン食べたい」とかの意図はどう図る?
A: 食べたいものを1、食べたくないものを0。
 お店の例でも0か1。
Q: 01では実際には不足していると思うが、
 そういうのをユーザ毎に正確に測る研究は既にやられている?
A: まだ分からない。

Q: 意図ベクトル測り方としてデルタiとのことだが、一定間隔?
 一定間隔だとすると、そこに依存した結果にならないか?
A: 今回の例の10分、30分というようなスパンではなく、
 その間で意図が変化してしまう可能性という話だと思うが、
 今回は大きなイベントがあった際に意図が変化するというストーリーで行った。
Q: 感覚的には、間隔の取り方次第でベクトルの振れ方が大きく変わるので、
 そこを検討すべきでは。


学生セッション[2P会場]情報推薦 座長 土方 嘉徳(阪大)


2P-5携帯電話向けコミック検索サイトのログデータを用いたユーザの行動特性分析, ○林 育実(芝浦工大),神林芙沙恵,柴崎康裕(アクセルマーク),徳永幸生,米村俊一(芝浦工大)

コミック検索の行動パターン
 トップ->検索->検索結果->詳細->外部配信サイト
 トップ->詳細
 トップ->ランキング
 一連の行動をセッションと定義(間隔は15分)
 レコード要素:ユーザID、アクセス日時、遷移元URL、遷移先URL
容易に探し出せるサイト設計
 サイトの利用形態を明らかにしたい
 外部サイトへの遷移方法とユーザが要した手間について分析
  外部サイトへの遷移の内訳集計:割合確認
  セッションが外部サイトへ遷移する方法
  要した遷移回数


naltoma: 検索エンジンからのダイレクト訪問は無視?
naltoma: 誤った遷移はどう扱う?
naltoma: 遷移回数=手間とは限らないのでは?
naltoma: 「専門検索」みたいなものは混乱に繋がるのでは?
naltoma: 「専門検索」はディレクトリ(カテゴリ)導入のこと?


Q: リンクが圧倒的に多いということだったが、
 ランキングでは画像もでる?
A: 直リンクはでるが、画像は詳細ページのみでランキング上では出ない。
Q: 検索結果で画像が出るケースと、画像無しリンクとでどちらがベターかは比較していない?
A: 今回はしていない。

Q: カテゴリを5ずつ用意したとの事だが、誰が考えた?
A: 共同研究の別の方が。ダウンロード数も考慮して決めた。

Q: 今回分かった事はコミック検索サイトに特化したことなのか、より幅広い事なのか?
A: 今回は特化した結果のため、別のケースでは異なる傾向が出てくるとは思う。
 ただし、例えば音楽サイトとかでも同様に使える結果を含むと考えている。


2P-6スペクトラルクラスタリングを用いたアンケートデータ解析に関する一検討, ○稲垣和人,吉川大弘,古橋 武(名大)

個性の多様化:マジョリティよりもマイノリティ解析が求められている
分類:クラスター分析
相互関係の把握:多変量解析手法
k-means法:少数データは統合されてしまう
主成分分析:最大多数変量で見てしまう
局所的類似性をスペクトラルクラスタリングで捉える
 グラフカット
  クラスタ内の類似度を高く
  クラスタ間の類似度を低く


naltoma: 比較するなら決めうちするk-meansよりは階層型クラスタリングでは?
naltoma: 異常検知という意味ではARとの比較?


Q: クラスタのバラツキ度はどのように算出した?
A: 定量的な指標で比較した訳ではなく、解答者人数による定性的な評価。

Q: スペクトラルクラスタリングを用いたという点と、クラスタを2分割している点とで、
 後者の方が本質的(寄与していた)だったということは無いか?
A: 他の手法で2分割すると、k-meansでの場合では均等分割される結果になる。
 デンドログラムでも同様にデータ全体を均等分割するようになってしまう。
 ある一部分で密集したようなところを取るという点で本手法の利点。

Q: スペクトラルクラスタリングと最少カットとで比較すると、
 最少カットは気持ちとしては小さすぎないのを作らないために入っている。
 そちらを除外するとどうでは?
A: 単純にカットする枝のコストを小さくするというだけだと、
 一人だったり二人だったりした解答が抽出されていく可能性がある。
 小さすぎるクラスタはできないような機構を取り入れた評価指標になっている。
Q: 一人は確かに問題だが、二人はマイノリティではない?


2P-7ユーザの視点に基づくレビュー文書の比較手法の一考察, ○坂梨 優,小林一郎(お茶の水女子大)

膨大な意見
 潜在的トピック抽出により意見文を分類
 その後、ユーザが知りたい観点で商品を比較できるようにする
  多数派 vs 少数派(多数派示す方がベター?)


naltoma: どういうコンテキストで述べている意見かを考慮する必要はないか?
naltoma: 文単位で類似度判定することで語抽出/抽出漏れは問題にならない?
naltoma:


Q: 問題設定について。ある商品に対して複数レビューがあり、
 適切な文を何文か出すというタスク?
A: 分かりやすく比較する文の提示が目的。
 気になる文に対していろんな要素をいれる事で、
 それらの要素を含む同じような文章を持ってくる。
 入力は1文で、それに似たような文を持ってくるというタスク。

Q:
A: 潜在的な、文の表層情報では現れないものと組み合わせようと思って行っている。
 現時点では別々の手法をやっていて、まだ組み合わせてはいない。

Q: LDA-DFでトピック得た後の文の距離はどう測る?
A: トピックに分類された後で、トピック毎の確率が出る。
 そこから計測。


2P-8アイテム推薦のためのアソシエーションルールを用いた類似ユーザの抽出に関する基礎的検討, ○伊藤寛明,吉川大弘,古橋 武(名大)

推薦アイテムの意外性や説明性
CFではユーザxアイテムの評価値行列が大きくなる
 アソシエーション分析により価値のある組み合わせ(ルール)を見つけ出す
 アソシエーション分析によるユーザベース/コンテンツベースの比較検討


naltoma: 他の手法との比較ではどうなる?


Q: ユーザの評価の傾向は影響しないのか。厳しく評価するユーザとか。
 今後こういうしていきたいというのがあれば。
A: どちらも共通したユーザが行っている訳ではないので、その点の比較検討はできていない。
 コンテンツによって評価が異なるというのも、高く評価しやすいユーザとかもいると思うが、
 今後検討していきたい。

Q: アイテムベースの時に、アソシエーションルール作成時の条件部分はどうやって決める?
A: アイテム1にlikeしているので、それぞれのconfidenceを計算。
Q: 例えば100件評価しているユーザがいたらどうする?
A: 最後、時系列的に評価している最後の評価に基づいて算出。
Q: 単一条件でやるというポリシー?
A: その通り。


2P-9信頼度を考慮した協調フィルタリングに基づく書籍の推薦方式の提案, ○蒋 淵舒(電機大)

あるユーザXがユーザ1を信頼して、ユーザ2を信頼していない場合、その情報を加味した推薦が可能。
ただし、直接的に信頼度は評価されていない。
 推薦正確率から信頼度を計算する方法 Trust(a,b) = Correct(a,b)/Total(a,b)
 共通度の導入でより適切な信頼度となるように重み調整


naltoma: 評価の付け方自体が異なるユーザ間で、適切な信頼度が算出できる?
naltoma: 祖業列のためkを大きくしても近傍はほぼゼロというのはどういう意味?
naltoma:


Q: 新しい指標を入れてMAEは余り変化していないという結果だが、
 本のランキングの傾向は変わった?
 うまく推薦できなかった本が推薦できるようになったとか。
A: 個別に本のランキングはしていない。
 計算したのは近傍ユーザ。

Q: k-NNを使っているのはCFの中で使っている?
 自分から見て類似するユーザを捜して、その人の評価値を使って
 未評価のアイテムを評価するために k-NN を使っている?
Q: ゼロのデータと未評価のデータの扱いに困ったとの事だが、
 平均使うとか0としてそのまま使うとか、ケースバイケースだが、
 捨てるのは勿体無いと思う。


2P-10利用目的に応じたメタデータスキーマの作成支援 -メタデータ語彙の推薦と語彙セット評価手法の提案-, ○小早川遥,本間 維,永森光晴,杉本重雄(筑波大)

既存タームを組み合わせてメタデータスキーマを作成することで、新しく定義するタームの数を減らす
 再利用する事で再定義を減らす
どのタームが利用目的に合い、相互運用性が高いのか?


naltoma: タームも言語の一種という点では時代と共に意味が変わってこない?
naltoma: 利用目的への合致度合いや、相互運用性の高さはどう評価する?
naltoma: どのようなコンテキストでどのような使われ方をしているのか、という視点での類似度が分かれば良い?
naltoma: 検索結果が一般的に良く使われる順に出力されるということは、
 異なる目的でも使われてしまう事を強めてしまわないか?


Q: データ例にあった「比較的一意に決まりやすいもの」だと良いが、
 そうじゃないものでは見つからない、判断難しいとかがない?
A: そういうケースもあると思う。
 楽曲としての代表的なものを入力するという形であればうまくタームを見つけられる。
Q: 日付だけ入れても駄目だが、いれる方が考える必要がある?
A: はい。

Q: メタデータスキーマにあまり詳しくない人を支援するとすると、
 どこまでメタデータにしたら良いのかとか、
 どういうタームを付けるべきか分からない人が対象となると思うが、
 どういうタームを付けるかと、どこまでメタデータを付けるべきかは別問題ではないか?
A: タームセット評価として、一般的に使用されるデータスキーマがある。
 その中で良く使用される組み合わせを考慮して評価する事は考えている。