Posts Tagged ‘災害支援’

東北関東大震災とソーシャル・メディア(ショートバージョン)

月曜日, 3月 28th, 2011

学科システム落ちてる間にmixiに投稿済みの内容ですが、学生向けという意味でここでも紹介。

ほんの少ししか手伝いできていませんが、ANPI NLP というプロジェクトを通したボランティア活動をしました。某所への寄稿したものなので、ここでは圧縮してかいつまんで紹介してみます。いろんな支援の仕方があるよね、という意味を込めて。


 ほんの数年前までのソーシャル・ネットワークでは人間関係を構築する場といった側面が強調されていましたが、今回の震災を切っ掛けに、緊急を要するタスクとして認知し合った人らを中心として繋がり、互いに知識やデータを提供し合い、タスクを分割して協力するといった具体的な活動を行う場やその活動を支援する場(ソーシャル・メディア)としても有効に機能し始める時代へとなってきました。

 活動の一例として、Googleのパーソンファインダー(消息情報)。
(*1)Google Person Finder (消息情報): 2011 東日本大震災
 http://japan.person-finder.appspot.com/

 パーソンファインダーは、インターネットを介した人海戦術によるアプローチ。これ以外にも、専門知識を有する人らがプロジェクトとして協力し合う活動も現れました。

(*2)ANPI NLP (東日本大震災のためのデータマイニング・自然言語処理に関する情報のページ)
 http://trans-aid.jp/ANPI_NLP/
(*3)sinsai.info (東北沖地震 震災情報サイト)
 http://www.sinsai.info/
(*4)Twitter 上の大震災関連「救命・救助要請情報(#j_j_helpme・#311sppt 関連)」要約 & 通報支援サイト
 http://www.selab.cs.tut.ac.jp/~aida/
(*5)東北関東大震災 安否情報 横断サーチ
 http://trans-aid.jp/ANPI_IR/ja/

 (*2)のANPI NLPでは、楽天技術研究所(以下、楽天技研)の萩原さんの声かけにより主に自然言語処理やデータマイニングと呼ばれる分野で活躍している専門家が集い、「Twitterなどから得られる安否確認情報を照合、更新することでPerson Finderの情報を充実させること」を大きなタスクとして取り組まれています。

 そもそもの始まりは、楽天技研の萩原さんによるツイート「こういう緊急時にも自然言語処理が役に立てることはたくさんある。(中略)特に今必要性が高いのは名寄せ技術だと思う。被災者・安否不明者の表記揺れに困っている自治体とか多そう。」のようです(*6)。

(*6)言語処理屋さんが連携していく様子
 http://togetter.com/li/111529

 このツイートを切っ掛けに、
 ・Google日本語入力Mozcを開発されている工藤さんがデータ提供。
 ・地震を含むツイートを収集していた大阪大学の松村先生からデータ提供。
 ・京都大学のGraham Neubigさんから人名・地名モデルの提供。
といったアクションが高々数時間のうちに行われました。このスピード感で進む様子を受けての判断だったのだろうと想像しますが、翌日になる3月15日にハッシュタグ #anpi_nlpとしてTwitter上の情報集約が開始され、加えて情報通信研究機構の内山さんからの提供によりMedia Wiki上での整理が始まりました。切っ掛けとなる最初のツイートから僅か1日後のことでした。

 こうしてANPI NLPが始まり、前述の目的を達成するためのタスクが用意されました。ここで用意された当面のタスクとは、地震関連のツイートデータ約6万件が既にあり、これらのツイートが「安否情報を含んだツイートなのか(もしそうなら人名や地域名がどこに記述されているか)」「救助要請を含んだツイートなのか」「関係のないツイートなのか」といったことを人手で判断し、目印を付与するというものでした。この目印を付与するという作業は、直接的にはコンピュータで処理しやすくなる(パーソンファインダーの情報と照合しやすくなる)というのが利用目的になりますが、それだけではなく間接的な効果にも期待しての人海戦術でした。

 この間接的な効果の例として、分類器の構築があります。分類器とは、入力されたツイートを「安否情報を含んでいるツイートか/そうではないのか」といったYES/NO形式で分類したり、「生存を確認したツイートなのか/死亡を確認したツイートなのか/安否確認の情報を求めているツイートなのか/それ以外なのか」といった複数選択肢のどれに該当するかを自動で分類してくれるシステムのことです。もし、現時点でのツイートデータ6万件についてのみ処理したら全てが終了するというのであれば、全てを人手で処理することも考えられますが、実際には関連ツイートは日々収集され続けます。それら全てを人海戦術で判断するのは事実上不可能のため、少しでもその手間を和らげるために自動化しよう。その自動化をするための技術として、人手で付与した正解データ(分類結果)から「どのように分類するのが最も妥当か」を自動で学習する技術である分類器を使おう。こういった効果を狙っての試みでした。

 3月24日現在では、当初の目的であるパーソンファインダーへの寄与に関しては楽天技研を中心として続けられ、それ以外の災害支援タスク(安否情報ツイートと避難所を関連づけるタスクや、外国語に機械翻訳するといったタスク等)についても提案され、少しずつその結果が出始めているようです。日々更新されている状況ですので、詳細はANPI NLPのサイト上にてご確認頂ければと思います。

 以上、ソーシャル・メディアを通した活動例を紹介すると共に、自然言語処理屋の皆さんが構築されている成果物を利用している一人としてANPI NLPに賛同し、関わった活動内容の一部を紹介してみました。この活動が震災支援の一助となれば幸いです。