« 国際会議WWW2012論文感想その1 (QAサイトにおける過去の回答の提示) | トップページ | 速報:日本知能情報ファジィ学会・論文誌「WebインテリジェンスとインタラクションII」特集 »

国際会議WWW2012論文感想その2 (Flickrデータによる気象予測)

Haipeng Zhang, Mohammed Korayem, David J. Crandall, Gretchen LeBuhn: Mining photo-sharing websites to study ecological phenomena, Proc. of WWW'12, pp. 749-758, 2012.
 
Flickrの写真に付けられたタイムスタンプ,緯度経度情報,タグ,画像情報から,特定の日時に特定の場所で降雪があったかどうかを識別する研究.Ground truthには,衛星からの画像情報と地上に設置された観測モニターの情報の両方を利用している.これらのデータはいずれも一般にアクセス可能なもの.
 
やっていることは,ある時空間のbounding box(以下,box)で撮影された写真を収集する.その中にあるタグを収集する.boxを1つの事例とみなし,そこに衛星からの画像情報と地上に設置された観測モニターの情報から得られた,雪が降っているか否かの正解ラベルを付与する.boxを全時空間から収集し,boxを雪が降っているか否かに分類するための分類器を機械学習により学習する.
 
その後,未知のboxに対してその中の各写真を,上記分類器により雪が降っているか否かに分類する.未知のboxにおいて雪が降っているか否かを,この雪が降っているか否かの判定ラベル数の比にて判定する.(方法論の詳細については,元論文に曖昧な記述があり,正確でない可能性がある)
 
研究の工夫としては,上記を基本としてさらに画像情報を用いる,時間的コンテキストを利用する(前日に雪が降っていたら翌日も雪),人口密度の高い地域での実験と全米全体を対象とした実験,特徴量として使うタグの選択などを行っている.実験は,単純に雪に関連するタグを用いているユーザの数とその比率から推定する方法と比較している.その結果,提案手法が良い結果を示している.
 
この研究は,ソーシャルメディアでの投稿から,実世界で起きている現象(今回は自然現象)を推定し理解する研究群の一つである.そのパイオニア的な論文は,Takeshi Sakakiらによる下記の研究であろう.
 
Takeshi Sakaki, Makoto Okazaki, Yutaka Matsuo: Earthquake shakes Twitter users: real-time event detection by social sensors, Proc. of WWW'10, pp. 851-860, 2012.
 
同じ自然現象の理解というアプリケーションの観点からは,本論文に新規性はない.しかし,画像に対するタグを用いているという点,画像が自然を写していることが多いという事実,画像の特徴量も用いている点,さらに様々な技術的工夫を行っている点を総合的に考えると,新規性を有していると言える.
 
このような研究ができたのは,米国にはFlickrという強い画像共有サービスがあったからである.改めてインターネットサービスの有無が,ビジネス・文化・科学技術の発展に影響を及ぼすことを思い知らされるものである.サービスビジネス後進国の日本に強い危機感を抱かざるを得ない.

|

« 国際会議WWW2012論文感想その1 (QAサイトにおける過去の回答の提示) | トップページ | 速報:日本知能情報ファジィ学会・論文誌「WebインテリジェンスとインタラクションII」特集 »

Web研究」カテゴリの記事