« 2014年2月 | トップページ | 2015年3月 »

2014年3月

ACM RecSys2013論文感想 その2

Fabiano Belem, Rodrygo Santos, Jussara Almeida, Marcos Goncalves: Topic Dicversity in Tag Recommendation, Proc. of ACM RecSys 2013, pp. 141-148, 2013.
 
タグ推薦において,任意のアルゴリズムからの推薦リストに対してトピックの多様化を図る論文.
 
タグ推薦と言うアプリケーションを対象としているが,基本はZeigler[WWW 2005]と同じ概念の研究.推薦結果を多様化するベースラインのアルゴリズムは,最新のタグ推薦方法(と筆者らは言っている)の遺伝的プログラミングをベースにした手法と,Random forestの手法.
 
p.145のアルゴリズム1に示されているように,ベースラインのアルゴリズムで得た推薦リストCoに対して,それの1位をまず,多様化後の推薦リストCsに加える.その後,Coから,Csとの多様性が最も高いものを選んでCsに入れてということを,目標の個数分繰り返す.Zeigler[WWW 2005]と全く同じ.
 
実験では,提案手法により,推薦精度を維持しつつ,多様性の値が高くなっていることを示している.また,過去の研究では,嗜好に基づく推薦を行いつつ同時に多様化を図る手法(筆者らの研究)があった.それとも比較して,提案手法の方がよくなることを示している.
また,Random Forestを用いると最も精度と多様性の値が高くなることを示している.
 
遺伝的アルゴリズムやRandom Forestをベースラインとして,タグ推薦の多様化を行ったという事例研究という意味では評価できると思う.
 
しかし,情報推薦の分野では,遺伝的アルゴリズムやRandom Forestは,最も標準的な方法ではないため,なぜこのアルゴリズムを対象にしたのかという疑問が残る.また,タグ推薦と言うアプリケーションに対して行ったことは評価できるが,一般のアイテム推薦と何が異なるのかについての議論が全くないのも納得がいかない.Random Forestが最もよくなったという事実も評価できるが,なぜよくなったのかという考察がないのも欠点である.
 
総評として,あくまで事例研究としては評価できるが,結果の普遍性という意味では評価が落ちると言わざるを得ない.
 

|

ACM RecSys2013論文感想 その1

Amos Azaria, Avinatan Hassidim, Sarit Kraus, Adi Eshkol, Ofer Weintraub, Irit Netanely: Movie Recommender System for Profit Maximization, ACM RecSys2013, pp. 121-128
 
推薦システムを導入している企業の利益を最大化するためのアルゴリズムを提案している.この研究の良いところは,基本となる推薦アルゴリズムはブラックボックスとして扱っており,それが出力する順位だけを利用している点にある.
 
アルゴリズムは2つ提案している.1つは,ユーザに価格は示さない.月額制などの固定サービスにおいて,企業が見てもらいたいと思っているアイテム(企業がその映画を見てもらいたいと思っている度合いであるプロモーションバリューv(m)がついている)を選択してもらうことを最大化するものである.このアルゴリズムでは,ユーザがある順位においてそのアイテムを選択する確率を考慮する.この確率を算出する関数は,いくつかの単調減少関数(線形,指数,対数,累乗)から最適なものを実験で求めている(実際には線形が良いと報告している).
 
映画mの提示される順位をr(m)とすると,それが選択される確率は,
p(m|r(m)=α-β・r(m)
で表される.推薦アルゴリズムでは,この確率とv(m)を足して,推薦スコアとしている.
s(m)=p(m|r(m))・v(m)
 
もう一つのアルゴリズムは,ユーザに価格を示すものである.価格が高いほどユーザは選択しないことを想定している.そして,上記のアルゴリズムと同様に順位が低いほどユーザは選択しないことを想定している.この2つの傾向から,ユーザがある順位である価格で提示されているアイテムを選択する確率を求めている.
 
これを求めるのに,まずは順位r(m)からの確率と価格f(m)からの確率を個別に求めている.これらも先と同様にいくつかの単調減少関数からのフィッティングをはかり,いずれも対数関数が良いとしている.さきほどの線形関数より勾配が緩やかになるのだが,これは順位と価格の両方考慮することにより,それぞれの影響が小さくなったからだと思われる.
 
p(m|r(m))=α-β・ln(r(m))
p(m|f(m))=α-β・ln(f(m))
 これらを統合するのだが,その統合方法は理論的に妥当なのかも,理論的には問題があっても実用上問題がなければ良いのだが,実用上問題がないのかも不明.統合の基本アイディアは,ある順位で固定して考えた時に,その順位での選択確率に補正項を加えると,価格による選択確率に等しくなるというもので,その補正項を求める.
そして,p(m|r(m),f(m))を求めるのに,p(m|r(m))に計算した補正項を足して,任意の順位に適用している.しかし,順位と補正項の関係は,順位によらず固定ではないと思われるため,ここの理論はあっているかどうかはかなり微妙である.
 
前者のアルゴリズムの評価では,推薦してユーザが選択したアイテムの企業が販促したい度合いの平均がいくらかで行っている.元の推薦アルゴリズムに比べて,提案アルゴリズムはその値が高くなっていることを示している.
 
後者のアルゴリズムでは,売り上げが伸びるかどうかを調べている.元の推薦アルゴリズムに比べて,提案アルゴリズムの方が,ユーザの選択したアイテムの価格が高くなることを示している.
 

|

ACM CSCW 2014 参加報告2日目・第3ッションとLasting Impactセッション

Collaborative Search and Sharing
Chair: Ed Chi, Google, Inc., USA
 
Modeling Search Processes using Hidden States in
Collaborative Exploratory Web Search
Zhen Yue, University of Pittsburgh, USA
Shuguang Han, University of Pittsburgh, USA
Daqing He, University of Pittsburgh, USA
 
Img_6543
 
HMMを使って,複数のユーザによるサーチプロセスを解析する.
隠れ変数は,隠れたサーチtacticsやストラテジー
 
観測可能なアクションは,いくつかにカテゴリ化
一人の人間による検索と,協調検索では構築されたHMMのモデルが
違うことを示している.
 
 
Lasting Impact: Lasting Impact Award:
Jonathan Grudin
 
Why CSCW applications fail: problems in the design and evaluationof organizational interfaces
Proc. of CSCW '88, pp. 85-93
 
Jonathan Grudinの上記論文が,なぜインパクトを持っているかという分析をしているのだが,timing, luck, persistanceの3つを挙げていた.
timingは,論文が出た時期が良かったというもの.当時企業や大学にネットが入ってきた時期だった.
luckは,運が良かったというもの.CSCWの会議がちょうど大きくなりかけで,多くの論文を採録するようになたtようなことを言っていた.
persistanceは,その後,さらに研究してジャーナルにして,特集号などで解説してと,その後もこのテーマを続けていたとのこと.
 
persistanceのあり方はいろいろあるが,その後,論文のテーマややり方が,どんどん広まって行って,スタンダードになるというのが,重要なポイントだろう.
 
 
これにて,ACM CSCW 2014の参加報告を終了します.最後までご覧くださり,ありがとうございました.
 
 
ACM CSCW2014 公式HP

|

ACM CSCW 2014 参加報告2日目・第2セッション

Social Technologies and Well-Being
Chair: Michael Massimi, Microsoft Research, UK
 
Social Structure and Depression in TrevorSpace
Christopher M Homan, Rochester Institute of Technology, USA
Naiji Lu, University of Rochester, USA
Xin Tu, University of Rochester, USA
Megan C Lytle, University of Rochester, USA
Vincent MB Silenzio, University of Rochester, USA
 
Img_6498
 
LGBTQ(Lesibian, gay, bisexual, transgender, questioning)の若者のためのSNSサイトであるTrevorSpaceでの研究.
 
depressionnとヘルプを求める行動のサーベイで,TrevorSpaceでのグラフをマイニングしている.
 
PHQ9:精神的患者への質問項目 9つの質問で4段階評価 スコアが10以上になるとdepressionn(鬱)
 
グラフマイニングとしては,次数やクラスタ係数,クリーク数?(number of triangles)などを調べている.ネットワークの特徴と,PHQ9の値が9以上かどうかとの関係を調べている.その結果,クラスタ係数以外は,関連があったことを述べている.どうやらPHQ9の値が低い人(健康な人)は,SNSをよく使っているようだ.
 
 
Characterizing and Predicting Postpartum Depression
from Shared Facebook Data
Munmun De Choudhury, Microsoft Research, USA
Scott Counts, Microsoft Research, USA
Eric J Horvitz, Microsoft Research, USA
Aaron Hoff, Microsoft Research, USA
 
Img_6504
 
Postpartum Depression:分娩後の鬱とSNSの利用状況との関連を調べている.出産後9か月の母親を対象.PHQ-9の値とFacebookデータ(投稿状況)との関連を調べる.
 
行動の調査方法は,status updates, media itemsなどの数を調べている.また,投稿内容も見ていて,感情表現や質問表現,Linguistic style (articleの数など)も調べている.
 
回帰分析?をしている.実験結果がその係数の値だとすると,SNSでの投稿が多いほど,PHQ-9の値が低い(精神的健康状態にある)ことが分かった.これは,先ほどの研究と同じ結果であり,面白い. 
 
ACM CSCW2014 公式HP

|

« 2014年2月 | トップページ | 2015年3月 »