« 2012年11月 | トップページ | 2013年1月 »

2012年12月

国際会議WWW2012論文感想その1 (QAサイトにおける過去の回答の提示)

Anna Shtok, Gideon Dror, Yoelle Maarek, Idan Szpektor: Learning from the past: answering new questions with past answers, Proc. ACM WWW'12 (the 21st international conference on World Wide Web), pp. 759-768, 2012.
 
Yahoo! Answer (日本サービスはYahoo!知恵袋)などのQAサイトにおいて,新たな質問に対して類似質問を探し出し,そのベストアンサーを回答として提示する方式を提案している.
 
このような研究は過去にも多く行われている.例えば,過去質問-新規質問間の類似度や,新規質問-過去回答間の類似度を用いている.また,類似した回答同士(回答Aと回答B)は,その質問ペア(回答Aに対する質問Aと回答Bに対する質問B)も類似していることを示す研究がある.これが分かると,質問中に欠落した語彙を補完することができる.
 
この研究も,過去の回答との類似度を計算するが,その計算においていろいろ工夫している.この研究では最初に過去の質問と新たな質問のタイトルからベクトル空間モデルで類似度を計算し,類似度が閾値より大きいものを回答候補とする.
 
次にその回答候補から絞り込みを行う.次に示す95個の特徴量を使って,分類器にかける.分類器は,メジャーなものを試しており,Random Forest(複数の決定木のブースティング),ロジスティック回帰,SVM,Naive Bayesである.
 
特徴量は,表層的統計量(IDFや?マークの数など),タイトルや本文の類似度,LDAによるトピック分布の類似性,構文解析の結果(WHタイプ,名詞や動詞の数など),クエリの曖昧性(クエリに対する回答の多様性),クエリフィードバック(2つのクエリの類似性から得られた回答候補の共起性)を使っている.
 
オフラインの実験では,Amazon Mechanical Turkを使った正解データで評価.80%ほどの精度を出していることを示している.
 
なんといってもこの論文の売りはオンラインの実験.システムが自動抽出した回答を,実際にYahoo! Answerに投稿し,質問者の反応を見ている.すると,質問者のほとんどは,ロボットからの回答だとほとんど気づかなかったことを示している.また,システムからの回答は,第一回答者になっており,一般ユーザのベストアンサー率と比較すると,倍以上ロボットの回答をベストアンサーとする結果を出している.
 
オフラインの実験では,やや実験のやり方に疑問があったが,このオンラインの実験結果は,極めて価値の高いものである.IBMのWatsonと並び,人工知能が人間の質問への回答に使えるレベルに来ていることを示している.

|

IEEE/WIC/ACM WI'2012 参加メモ(2日目) Social Networks and Ubiquitous Intelligence

2012/12/4~12/7に参加してきたIEEE/WIC/ACM WI'2012の2日目一般セッションのメモです.
 
Session (WI-S5): Social Networks and Ubiquitous Intelligence (Room 2)
 
Wr206 Selective Behavior in Online Social Networks
Chunjing Xiao, Ling Su, Juan Bi, Yuxia Xue, Aleksandar Kuzmanovic
 
Img_2173  
dsseminator: 情報やコンテンツを発信する人.
audience:情報やコンテンツを消費する人.
として,
情報拡散には,地域性(同じ国),性別(同性),年齢(同年代)という条件が強く効いているという論文.また,disseminatorとして行動する人は,audienceとしては行動しないことも述べている.
 
性別の同質性を表す
Img_2179  
年齢の同質性を表す
Img_2180  
dsseminatorとaudienceの役割の違い
Img_2183  
Wr250 Tweets Beget Propinquity: Detecting Highly Interactive Communities on Twitter Using Tweeting
Links
Kwan Hui Lim, Amitava Datta
 
Img_2184  
有名人をフォローしている数に注目.
Img_2186  
有名人を見つけて,それを興味のカテゴリとみなす.同じ有名人をフォローしていれば,同じ興味をもつユーザとみなす.そのようなネットワークを作り,リンクを使ってコミュニティ抽出.
 
CPMに基づくコミュニティ抽出:つながりがあるk以上のクリークの塊をコミュニティとみなす.
Infomapに基づくコミュニティ抽出:ランダムウォーカーが滞在した時間の長いノード群.
 
Img_2195  
Img_2196
 
また,リンクには,
フォロー関係を抽出したtopological link (CICD)と,メンション関係を抽出したinteraction link (HICD)を比較している.
 
実験の結果,
InfomapはCPMに比べてコミュニティの抽出数が多いことを示している.また,CICDよりもHICDの方がコミュニティの抽出数が多いことを示している.
 
Img_2202

|

IEEE/WIC/ACM WI'2012 参加メモ 3日目 Intelligent Human-Web Interaction

WI'2012の3日目の一般セッションで面白い発表がありましたので,そのノートを公開します.
 
Session (WI-S8): Intelligent Human-Web Interaction
Wr348 Unsupervised Emotion Detection from Text Using Semantic and Syntactic Relations
Ameeta Agrawal, Aijun An
 
教師なし学習にて,文に感性のラベル(happibess, sadness, anger, fear, surprise, disgust)を付けるという研究.方法論としては,文から,名詞,動詞,形容詞,形容動詞を取り出し,これらをターゲット語とする.数個(5個ぐらい)各クラスに属する単語例を入力する.その単語例とターゲット語のWikipediaにおける共起回数(PMI: Pointwise Mutual Information)を調べる.これでターゲット語の感性ベクトルを算出する.この感性ベクトルを用い,文中の語の感性ベクトル値を総計することにより,文に感性のラベルを付与する.ただし,"She is not sad."のような否定形も考えられるので,文脈も考慮して,上記スコアを修正する.F値を評価指標としたところ,従来の教師なし学習での完成ラベルの付与より高い性能を示している.
 
Img_2312  
 
方法論の全体
Img_2320  
 
シード語
Img_2323  
 
PMIでシード語との関連度算出
Img_2325  
 
感性ベクトル作成
Img_2326  
 
コンテキストによる補正
Img_2329  
 
評価結果
Img_2334

|

IEEE/WIC/ACM WI'2012 参加メモ Turing Keynote

今日はWI'2012の二日目で本会議が始まりました.オープニングの後にあった,Turing Keynoteの報告です.
 
今年は,アラン・チューリング(Alan Mathison Turing)氏の生誕100周年を記念して,AIの歴史と展望,そして若手研究者へのメッセージからなる講演でした.
 
講演者は,スタンフォード大学教授のEdward Feigenbaum氏でした.
 
講演をするFeigenbaum氏.
Img_2057  
 
最初にAlan Turing氏とのチェス議論の思い出を話され,最新のAI技術の紹介がありました.
 
Googleの自動車の自動運転.
Img_2059  
 
IBMの質問応答システムWatson
Img_2061  
 
質問応答してくれる本Aura
Img_2060  
 
その後,AIの歴史の中で,AI技術の発展に貢献した代表的システムや方法論についての説明とその意義について話がありました.エキスパートシステムや,Webデータを用いた検索と知識獲得,アートの自動作成,チェス(Deep Blue)などです.Cycのような常識データベースの話もありました.
 
代表的なAI技術・システム
Img_2062  
 
人工知能画家「AARON」による作画
Img_2063  
 
AI技術はある種,相手より早く検索すれば勝ち.または,相手より多くを探索すれば勝ち.という話をされていました.
 
最後に,若手研究者へのメッセージがありました.
 
Perceptualな研究ではなくCognitiveな研究をすべき.
Perceptualなことは,みんなやっている.
 
Cognitiveとは,より深く考えないといけないこと.または,より決定に長い時間を要すること.
Perceptualとは,簡単に一瞬で識別できること.
 
我々は,CHIコミュニティ(Human-Computer Interaction)に貢献すべき.ただし,グラフィックとかでなく(Perceputualではなく),知識を扱うインタフェース.
 
という趣旨です.非常に含蓄のある言葉であり,感銘を受けました.

|

IEEE/WIC/ACM WI'2012 会場概要

マカオのFisherman's Wharfのコンベンションセンターで行われたIEEE/WIC/ACM WI'2012の会場の概要です.
 
会場のFisherman's Wharf.なんかディズニーランドのビッグサンダーマウンテンみたい.
 
Img_1973
 
 
会場の案内
 
Img_1974  
 
コンベンションセンターの玄関
 
Img_1975  
 
Fisherman's Wharfの全体.テーマパークぐらいの敷地がありそう.
 
Img_1976  
 
会議の受付
 
Img_2020  
 
セッション会場の前
 
Img_2019  
 
ワークショップの様子
 
Img_2021  
 
ランチビュッフェの内容
 
Img_2000  
 
コーヒーブレイクの様子
 
Img_2028  
 
コーヒーブレイクのお供になぜかカナッペ.甘いものが欲しい.
 
Img_2027  
 
コーヒーブレイクのお供になぜかシウマイ.でもうまい!
 
Img_2029  
会場の様子はとりあえず,こんな感じでした.

|

IEEE/WIC/ACM WI'2012 参加メモ(1日目)

2012/12/4~12/7に,マカオのFisherman's Wharfのコンベンションセンターで行われたIEEE/WIC/ACM WI'2012に参加してきました.本記事は,1日目の参加メモです.1日目は,International Workshop on Intelligent Web Interaction (IWI-2012)に出ました.

 
IWIの歴史
Img_1996  
 
オーガナイザの一人であるProfessor Yasufumi Takama
Img_1999  
 
S3204 User and Item Modeling Methods Using Customer Reviews towards Recommender System Based on Personal Values
Shunichi Hattori and Yasufumi Takama
 
kakaku.comでは商品レビューに,商品の特徴ごとに評価値を入力するようになっており,また総合評価も入力するようになっている.この論文では,商品の特徴の評価のpositive-negativeの方向性と,総合評価のpositive-negativeの方向性の一致不一致から,ユーザがどの特徴を重視して評価しているのかを発見している.この一致不一致をRMrate=#matched reviews/(#matched reviews+#unmatched reviews)という指標で測っている.
 
Img_1987  
下記写真のように,ユーザごとにどの属性を重視しているのかが分かるようになっている.
 
Img_1992  
また,高いRMrateを示すのは,限られた属性であることも示している.この情報を用いてどの程度の情報推薦ができるのか楽しみである.
 
Img_1995

|

« 2012年11月 | トップページ | 2013年1月 »