« ACM SAC2012 Keynote addressの感想 | トップページ | ACM SAC2012 SWA 参加報告 »

ACM SAC2012 IAR参加報告

昨日は,ACM SAC2012のIAR(Information Access Retieval)というトラックに参加しておりました.主に,マルチメディア情報を含む情報検索に関するセッションです.WI2研究会で扱っている内容に近いと思います.
このトラック,結構面白い発表がありましたので報告します.

(IAR1-4)
A Pilot Study for Mood-based Classification of TV
Jana Eggink, et al. (BBC, UK)

Osgood 1957を参考に,番組データ(特にドラマ)を,Evaluation, Potency, Activityという感性軸で表現する.
具体的には,
Evaluation: sad-happy, dark-light
Potency: Serious-funny, masculine-feminine
Activity: relaxing exciting, calm dramatic
のように表す.

Iar141

Iar142

映像データを分析し,faces(顔があるか?)とか,Luminance(画面の明るさ?),motion(画面の動きの大きさ)などを自動抽出する.これらの特徴量を用いSVMで分類を行う.結構多くの映像特徴量を抽出しているが,これは既存の手法やライブラリを用いているとのこと.

Iar143

感性ベースのアプローチは,こういう感性軸に対する値を手動で付けている場合が多いが,ちゃんと自動抽出しているところがすばらしい.評価実験を行って,ICMEに通ったとのこと.

Iar144

(IAR2-2)
Investigations into User Rating Information and Predictive Accuracy in a Collaborative Filtering Domain
Josephine Griffith  (University of Ireland, Ireland)

協調フィルタリングにおいて,あるユーザの全てのrating情報から抽出した各種情報と,協調フィルタリングによって算出した予測値を説明変数として,実際のrating値(ground truth)を目的変数として,機械学習するというもの.

Iar221

ratingから抽出する情報とは,rating数,平均rating値,ratingしたアイテムのpopularityなど.
機械学習は回帰木を使用.

Iar222

評価は,movielens, Lastfm,Bookcrossingのデータセットを使用.通常の協調フィルタリングよりも,パフォーマンスが良くなったとのこと.

Iar223

非常に面白いアプローチであると言える.全てのrating情報から抽出した情報の何が,パフォーマンス向上につながるのか,深い分析をしてもらいたい.いずれトップカンファレンスに通る論文だと思う.

(IAR2-4)
Effective Web Video Clustring using Playlist Information
Mariko Kamie (University of Tsukuba, Japan)

Iar241

youtubeの映像データについているテキスト情報から得た類似度と,プレイリストを一種のユーザと見なしプレイリストから得た類似度を統合して,映像データ間の類似度を算出し,それでクラスタリングを行うという研究.

Iar242

ちょうど,推薦システムにおける,コンテンツに基づくフィルタリングと協調フィルタリングとのハイブリッド手法と同じ考え方を,Youtubeのプレイリストに導入したというものである.

クラスタリング手法はBisecting K-meansを使用.

プレイリストを一人のユーザと見なし,推薦システムにおけるハイブリッド的アプローチを映像データのクラスタリングに用いた点は興味深い.

個人的には,playlistを一人のユーザと見なすことが,通常の協調フィルタリングとどういう違いがあるのかや,playlist特有の困難さなどについて知りたい.

|

« ACM SAC2012 Keynote addressの感想 | トップページ | ACM SAC2012 SWA 参加報告 »

Web研究」カテゴリの記事