« WebDB Forum 2010 二日目のノート | トップページ | WebDB Forum 2010 写真集 »

第151回 データベースシステム研究発表会 メモ

DBS研で私の書いたメモです。

===========================================
第151回 データベースシステム研究発表会
11月12日(金)~13日(土)
http://www.ipsj.or.jp/09sig/kaikoku/2010/DBS151.html
http://www.ipsj-dbs.org/index.php?FrontPage

Pa0_0001_2

[16:20-17:35]■1A.検索・推薦   座長: 春本 要(大阪大学)
(1) レアクエリを対象とした非クリック分析によるクエリ推薦方式の提案
   ○宮原 伸二,片渕 典史,片岡 良治(NTTサイバーソリューション研究所)
・出現回数の少ないレアクエリを対象.クエリを推薦.
クリック情報だけではなく非クリック情報も利用.
・関連研究 Optimal Rare Query Suggestion With Implicit User Feedback
クリックグラフと何を選択しなかったというスキップグラフを利用
・提案手法
クリックグラフによるクエリ間の関連度を計算.
 ここの関連度の計算は,共起度とか使う方が自然なような気がする
検索順位を考慮した非クリックグラフによるクエリ間の関連度を計算.
 検索順位が高いほど,query-url間の重みを大きくする.
 またクリックされた時間が新しいほど重要なURLとする.
・評価
ベースラインはクリック履歴のみ用いた手法

[10:00-11:40]■2C.ソーシャルメディアⅠ   座長: 土方 嘉徳(大阪大学)

(19)ブックマーク類似度を用いたソーシャルブックマーク汚染対策手法の提案と評価
   ○畑中 貴弘,久松 潤之(大阪電気通信大学)
ソーシャルブックマーク汚染
多くの一般的なユーザには価値のないページが高く推薦されること
汚染を引き起こすユーザはあるタグがついたページのほぼすべてをブックマークしている.

ユーザ間u,vのブックマーク類似度を計算.ブックマーク類似度の高いユーザをブラックリストとして登録.vがすでにブラックリストに登録されていたら,uもブラックリストに登録.
ブラックリストに登録されているユーザのすべてのブックマークがオセンを導くわけではないので,
ブックマーク数を低減する(ちょっと理由が分からん)
(土方コメント)
やはりそうか,一般のユーザ間のブックマーク類似度は相当低いのか

(20)ソーシャルタグの上位下位関係に基づく散策的ブラウジング支援
   ○木村 清尭,湯本 高行,新居 学,高橋 豐(兵庫県立大学)
散策的ブラウジングの支援
良質なWebページ源としてソーシャルブックマークを利用(Pagerankではだめ?)
幅広い内容のWebページの取得を重視(Diveristyの向上やな) #dbs151
 汎化ページ,類似ページ,関連ページ
上下関係にあるタグのペアを取得
そのタグを使ってSBMに問い合わせ.
汎化は上の概念,類似は同じ概念,関連は兄弟タグを使うさらに下位概念が違う

(21)マイクロブログサービスの位置情報タグと発言コンテキスト解析を用いた行動推定システムの設計
   ○山田 和貴,斉藤 裕樹(東京電機大学)
Tweetmap -> http://tweetmap.info
ある地理位置における発言から利用者の次の行動を予測
予測される経路を基に適切なサービスの提供
GPS情報からは,なぜ通ったのかはわからない(近道?景色をみるため?)
 →つぶやき内容から判定
発言内容に基づ次の行動の予測をベイズ推定で
発言内容は一単語(「竜馬」)(任意の文章を対象とした任意の単語を対象にできるの?そんなにメッセージはあるの?)

(22)ミニブログにおける注目語抽出手法の提案と注目語を用いたメディア間での話題追跡
   ○加藤 慶一,秋岡 明香,村岡 洋一,山名 早人(早稲田大学)
複合語で構成される固有名詞をTwitterのログから抽出する
Twitterで番組のタイトルや作品のタイトルは放映日,公開日に集中することが多い.
急に出てきた語は固有名詞である可能性が高い.

出現回数が急上昇した名刺を注目.それから複合語を取得.
(バースト検出すれば良いのでは?)
Twitter  Sample Streem API使用

[13:00-14:15]■3A.検索・抽出   座長: 灘本 明代(甲南大学)

(23)デフォルメ地図検索のための地理的特徴抽出
   ○松尾 純輝,北山 大輔,李 龍,角谷 和俊(兵庫県立大学)
デフォルメ地図検索エンジン.ユーザの目的と合致する順にデフォルメ地図をランキングする.
ランキングに有用な特徴の抽出.26次元の地図的特徴+11次元の画像特徴.
二種類の目的に基づく特徴抽出実験
経路確認と位置確認(どんな観光地があるかどうかを知ること)
SVMで,経路選択に有用か,位置確認に有用かに分類.
実験では,ユーザに地図60枚を見せ,経路選択に有用か,位置確認に有用かを判定.
質問:地図は画像のはずだが,オブジェクトの数とかランドマークの数はどうやって抽出してるの?
質問:実験では,ランドマークを知っていたかどうかの調査はしているのか?
質問:なぜSVM?
(以下,コメント)
将来性のある面白いテーマだと思います.

(25)QAサイトにおけるS項目による回答検索システム   ◯見市 高一,川越 恭二(立命館大学)
情報量,参考サイトの有無,質問と回答との同じ語の数,お役立ち度,グレード
が読者の求める項目と仮定.どれを重視するかは読者によって異なると仮定?
予備実験から前者3つが重要であることを示している
さらに,抽象的な回答,丁寧語を用いていない回答,句読点の存在しない回答
が求めない回答を表すとして利用.
利用者は,これらのS項目に対して,0or1を選択することで,検索に反映できる.
質問:結局S項目とは何か?
質問:これらの項目はすでにいろいろな研究で扱われているのでは?
質問:文章の書き方に注目した手法のように見える.同じような文体の回答を求めるような検索に有効?
質問:S+とS-はひとまとめで評価?それぞれ別に評価はしてない?

[14:40-16:20]■4C.ソーシャルメディアⅡ   座長: 大塚 真吾(神奈川工科大学)

(40)ソーシャルブックマークにおける有用なユーザの発見
   ○田代 祐一,大石 哲也,越村 三幸,藤田 博,長谷川 隆三(九州大学)
   ソーシャルブックマークのユーザの中から,あるトピックに関して有用だと思われる
   ユーザを発見し,評価する
ブックマークネットワークにHITSを適用.
評価は,上記手法で上位にランクインしたユーザと,トピック内の情報をたくさんブックマークしているユーザの比較.
ランクインしたユーザ群がブックマークしているページとテスト用ユーザがブックマークしているページの適合度で比較
質問1:有用なユーザを探してどうしたいのか?
質問2:トピックもアルゴリズムに組み込んでは?
質問3:ネガティブなページも「それと認識するために」ブックマークしているユーザもいるのでは?

(41)ソーシャルメディア上での行動に基づく「意外な情報」の提供者になり得る人物の検索手法
   ○後藤 清豪,高田 秀志(立命館大学)
   ソーシャルメディア上でのユーザの行動を基に、「意外な情報」を発信する人物を検索
   可能にする
ソーシャルメディア上の人物間のつながりの強さ(類似度)を測る研究は結構やられている.
(詳細は参考文献参照)
普段意外な情報を提供すると思っている人が,頻繁に返答,引用,お気に入りをしている他のユーザを,新たな意外な情報を提供する人として推薦する
評価は,Follow Finder,Twitter公式おすすめ,提案システムと比較している.
精度がやや向上し,そのばらつきが減少している.

コメント1:意外な情報にこだわって欲しかった.情報をばらまいている人,それに飛びついている人を発見してしまう.
コメント2:実際どんな情報をつかまえたのかというのを見てみたら良いのでは?
コメント3:友達同士だから新しい気づきはないと言っているのに,周りの人の情報を使って推薦しているのはなぜ?

(42)User-Generated Contentにおける潜在情報抽出手法の提案
   ○内村 圭佑,灘本 明代(甲南大学)
   UGCに特有で且つ重要な情報を潜在情報と呼び,UGCと一般のWebを比較し潜在情報の
   抽出を行う
コミュニティ内に特有かつ重要な情報(潜在情報)を推薦
差分抽出手法と重要度計算手法の両方を用いて推薦.
差分抽出手法では,スレッドに特有な情報を持つコメントを取得
重要度計算手法はテーマに対して重要なコメントを抽出
差分抽出手法は,一般のHPで得られる情報とそのスレッドで得られる情報との差分を取得する.
差分は語単位で行う.
重要度は,テーマに対しての熟知度を計算(網羅性,特化性,専門性から判断)
 Wikipediaで使われている単語を使っていたら網羅度を上げる.
 特化性,Wikipediaページをセグメントに分割し,各セグメントに対してどれだけ詳しく述べているのかで判定.
 専門性,文書の理解容易性を測るために用いる単語.Yahoo!知恵袋で使われる単語を用いていれば上がる.
重要度は貢献度も利用.スレッドの呼応関係にあるものを上げる.
客観度は客観的な立場で書かれたコメントを上げる.形容詞が多いものはダメ.
被験者6名.スレッド,具体的な映画のスレッド
タスク:重要であると思ったコメントにチェック.

(43)SNSを利用した協調フィルタリングによる番組推薦手法
   ○澤井 里枝,有安 香子,藤沢 寛,金次 保明(NHK)
   SNSの書き込みを利用することで視聴プロファイルを作成し,番組推薦する手法の提案
   とその実装を行う

Twitter利用.フォローとハッシュタグを利用.
SNS上で関係のあるユーザ,代表的なユーザの発言を利用して番組推薦する.
番組名を表すキーワードは事前に与えておく
関連ユーザ集合を獲得.その関連ユーザの番組のEPG情報のテキストから構築したユーザプロファイルから,それらを統合したプロファイルを作成.推薦対象の番組から作成したコンテンツモデルと比較.
番組の希少性も利用.対象番組と同じ種類(EPG情報のジャンルを使用)の番組が少ないほど上げる.
質問:内容を用いない場合と推薦結果は変わる?内容を用いようと思った理由は?
質問:NHKの視聴者には高齢者が多いが彼らはSNSを使っているの?
質問:ハッシュタグは#NHKのみ使っているが,他の番組のハッシュタグを使った場合はどうなるの?

|

« WebDB Forum 2010 二日目のノート | トップページ | WebDB Forum 2010 写真集 »

Web研究」カテゴリの記事

学会」カテゴリの記事