« 静的Webページは絶滅する? | トップページ | Beyond Webの展望 @FIT 2010 »

国際会議WWW2009論文感想その4

Shilad Sen, Jesse Vig, John Riedl: Tagommenders: connecting users to items through tags, Proc. of WWW 2009, pp.671-680, 2009.
キーワード:情報推薦,協調フィルタリング,タグ,タグを用いた推薦

GroupLens Researchの論文である.タグに対するユーザの嗜好の程度を推測し,さらにその結果をアイテムの推薦に利用している.タグを用いた情報推薦は非常に盛んになりつつあるが,多くの研究では,ユーザプロファイルを構成するタグを事前に登録しておいたり,タグをベクトル空間モデルとして扱ったりしているが,タグに対する興味の程度を推定することは行っていない.本研究は,タグに対する興味の程度を推定し,さらにアイテムの推薦を行っている点で,新規性がある.

データセットとしては,MovieLensを用いている.MovieLensでは,タグに対するユーザの興味の程度という情報は入っていないため,彼らは登録ユーザに個別にメールを送信し,タグに関するアンケートを取っている.具体的には,そのタグを用いて推薦された映画を見るか否かというデータを取っている.

データセットでは,アイテムへの5段階評価,アイテムの詳細情報へのクリック,アイテムへのタグ付,タグ検索(タグのテキスト検索もしくはタグのクリック),タグに付けた5段階評価を含んでいる.

タグの好みの推定のアルゴリズムをいくつか提案している.アルゴリズムは,タグに対するインタラクションを直接利用するもの(Inferring Preference uing Tag Signals)と,タグが付けられたアイテムに対するインタラクションを利用するもの(Inferrinf Preference using Item Signals)に分かれる.

・Inferring Preference using Tag Signals
以下の3種類のアルゴリズムを提案している.
Tag-applied: Movie-clicks: ユーザがそのタグを映画に付けたことがあれば,より高い評価を与える.
Tag-searched: ユーザがそのタグで検索したことがあれば,より高い評価を与える.
Tag-quality: タグの質によって評価を決める.全ユーザで共通の値となる.著者らの先行研究の結果を用いている.具体的には,タグをつけた人の数やタグで検索した人の数などを用いている.

・Inferring Preference using Item Signals
6つのアルゴリズムを使用している.
Movie-clicks: そのタグが付けられている映画を数多くクリックしていれば,高い評価を与える.
Movie-log-odds-clicks: Movie-clicksにタグの人気も考慮している.人気のあるタグをクリックしても,高い評価は得られないようにしている.
Movie-r-clicks: Movie-clicksがクリックを用いているのに対し,これは映画を評価付けしたかどうかを見ている.
Movie-log-odds-clicks:Movie-r-clicksにタグの人気も考慮している.
Movie-rating:ユーザのタグへの好みは,そのタグを持つ映画に対する評価の平均としている
Movie-bayes: ユーザが特定のタグがついている映画に対してどのように評価を与えているのかを確率分布にてモデル化している.

まず,各実験にて上記アルゴリズムのタグへの興味の推定のパフォーマンスを評価している.結果としてはアイテムに対するratingの情報を用いた方が良くなっている.

次にタグを用いた推薦方式を提案している.大きくは,アイテムへの評価データを用いないimplicitな方法とアイテムへの評価データを用いるexplicitな方法に分けている.

・implicitな方法
implicit-tag: 前節のアイテムへのratingを用いないすべての方法を用いて推測したタグへの興味度を用いてアイテムの興味度を推定している.
implicit-tag-pop: 前述の方法に,アイテムの全体での人気度を加えている.

・explicitな方法
前節のアイテムへのratingを用いる方法を用いて推測したタグへの興味度を用いてアイテムの興味度を推定している.
cosine-tag: ユーザの映画への評価は,その映画についているタグの評価重みの平均であると仮定している.
Linear-tag:映画に付けられた各タグごとにタグの好みの推測値と映画への評価値の最小二乗適合を推定する.
Regress-tag: linearタグでは,タグを独立に推定しているが,本手法は線形モデルで表現し,各係数を同時に推定している.

実験では,上記の方法と,従来の協調フィルタリングと比較している.

Top-5では,linear-tag, regress-tagなど,タグを使った手法が強調フィルタリングよりよくなっている.MAEでは,協調フィルタリングがよくなっている.

このような差が出た理由は考察されていない.この点が残念である.



|

« 静的Webページは絶滅する? | トップページ | Beyond Webの展望 @FIT 2010 »

Web研究」カテゴリの記事