« 国際会議WWW2010論文感想その1 | トップページ | IBM 人工知能「ワトソン」,クイズ王と対戦 »

異なるリスト間の順位相関係数

異なるリスト間の順位相関係数

2つのランキングリストの相関を測る指標としては,ケンドールの順位相関係数(Kendall tau rank correlation coefficient)が有名です.

Wikipediaの説明
http://ja.wikipedia.org/wiki/%E3%82%B1%E3%83%B3%E3%83%89%E3%83%BC%E3%83%AB%E3%81%AE%E9%A0%86%E4%BD%8D%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0

しかし,Kendallの順位相関係数は,2つのリストの構成要素が同じであることを前提としております.しかし,情報検索や情報推薦などの順位付けのでは,全てのアイテムを対象とするとリストが大きすぎて現実的でない場合があります.そこで,膨大な長さを持つリストから上位k個のみを使って相関を求める方法として,Faginら(IBM Almaden Research Center)による一般化された順位相関係数があります.

この方法では,二つのリストR1, R2から取り出した構成要素,r1, r2に対し,
(1) r1が1つのリストのみに存在し,r2が他方のリストのみに存在する
(2) r1が片方のリストにおいてr2より高い順位であるが,他方のリストではr2のみ存在する
(3) r1, r2が両方のリストに存在するが,順位の順序が逆である
という事象をランキングが異なるものとして扱うことで,上位k個で打ち切ることの一般化を試みています.

詳しくは,以下の論文をご参照ください.

Ronald Fagin, Ravi Kumar, D. Sivakumar: Comparing top k lists, Proceedings of the fourteenth annual ACM-SIAM symposium on Discrete algorithms, ISBN:0-89871-538-5, 2003.
http://portal.acm.org/citation.cfm?id=644113

|

« 国際会議WWW2010論文感想その1 | トップページ | IBM 人工知能「ワトソン」,クイズ王と対戦 »

Web研究」カテゴリの記事